Diff 242685

mlir/include/mlir/Dialect/VectorOps/VectorOps.td

Show First 20 Lines • Show All 365 Lines • ▼ Show 20 Lines	let extraClassDeclaration = [{
static StringRef getSizesAttrName() { return "sizes"; }		static StringRef getSizesAttrName() { return "sizes"; }
static StringRef getStridesAttrName() { return "strides"; }		static StringRef getStridesAttrName() { return "strides"; }
}];		}];
let assemblyFormat = [{		let assemblyFormat = [{
$vector `,` $sizes `,` $strides attr-dict `:` type($vector) `into`		$vector `,` $sizes `,` $strides attr-dict `:` type($vector) `into`
type(results)		type(results)
}];		}];
}		}

		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code +def Vector_FMAOp : + Op<Vector_Dialect, "fma", [NoSideEffect, + AllTypesMatch<["lhs", "rhs", "acc", "result"]>]>, + Arguments<(ins VectorOf<[F32, F64]>:$lhs, + VectorOf<[F32, F64]>:$rhs, + VectorOf<[F32, F64]>:$acc)>, + Results<(outs VectorOf<[F32, F64]>:$result)> { + let summary = "vector fused multiply-add"; + let description = [{ + Multiply-add expressions that operates on n-D f32 or f64 vectors and lower + to the llvm.fmuladd.* intrinsic. + + Example + + %3 = vector.fma %0, %1, %2: vector<8x16xf32> + }]; + // Fully specified by traits. + let verifier = ?; + let assemblyFormat = "$lhs `,` $rhs `,` $acc attr-dict `:` type($lhs)"; + let builders = [OpBuilder< + "Builder b, OperationState &result, Value lhs, Value rhs, Value acc", + "build(b, result, lhs.getType(), lhs, rhs, acc);">]; + let extraClassDeclaration = [{ + VectorType getVectorType() { return lhs().getType().cast<VectorType>(); } + }]; +} + Lint: Pre-merge checks:* clang-format: please reformat the code ``` +def Vector_FMAOp : + Op<Vector_Dialect, "fma"…
		def Vector_FMAOp :
		Op<Vector_Dialect, "fma", [NoSideEffect,
		AllTypesMatch<["lhs", "rhs", "acc", "result"]>]>,
		Arguments<(ins VectorOf<[F32, F64]>:$lhs,
		VectorOf<[F32, F64]>:$rhs,
		VectorOf<[F32, F64]>:$acc)>,
		Results<(outs VectorOf<[F32, F64]>:$result)> {
		let summary = "vector fused multiply-add";
		aartbikUnsubmitted Done Reply Inline Actions typo: that operate (plural) but more in general, can you describe the semantics in a bit more detail than this? In particular, the lowering part to llvm could be mentioned at one point as motivation to have this, but it seems a bit strange to mention that in the very first sentence already. aartbik: typo: that operate (plural) but more in general, can you describe the semantics in a bit more…
		nicolasvasilacheAuthorUnsubmitted Done Reply Inline Actions Made the description more general. There is a notion of guaranteed fmuladd in the LLVM case that I kept. nicolasvasilache: Made the description more general. There is a notion of guaranteed fmuladd in the LLVM case…
		let description = [{
		aartbikUnsubmitted Done Reply Inline Actions much better, and the mention of llvm later is fine of course I would still say something about that all shapes need to match exactly (rank and dimensions), it is implied by the syntax, and of course enforced by the traits, but why not be a bit more explicit in the doc :-) aartbik: much better, and the mention of llvm later is fine of course I would still say something about…
		Multiply-add expressions that operates on n-D f32 or f64 vectors and lower
		fhahnUnsubmitted Done Reply Inline Actions IIRC llvm.fmuladd does not specify the rounding behaviour (mul and add may or may not be fused). The way I read the description here it seems like fusion is ecpexted for vector.fma unless I am missing something. It might be worth clarifying the rounding behaviour fhahn: IIRC llvm.fmuladd does not specify the rounding behaviour (mul and add may or may not be fused).
		nicolasvasilacheAuthorUnsubmitted Done Reply Inline Actions Thanks @fhahn ! I overlooked the semantics section that clearly states to use fma. What I want is indeed fma, will adapt the revision accordingly. nicolasvasilache: Thanks @fhahn ! I overlooked the semantics section that clearly states to use fma. What I want…
		to the llvm.fmuladd.* intrinsic.

		Example

		%3 = vector.fma %0, %1, %2: vector<8x16xf32>
		}];
		// Fully specified by traits.
		let verifier = ?;
		let assemblyFormat = "$lhs `,` $rhs `,` $acc attr-dict `:` type($lhs)";
		let builders = [OpBuilder<
		"Builder *b, OperationState &result, Value lhs, Value rhs, Value acc",
		"build(b, result, lhs.getType(), lhs, rhs, acc);">];
		let extraClassDeclaration = [{
		VectorType getVectorType() { return lhs().getType().cast<VectorType>(); }
		}];
		}

def Vector_InsertElementOp :		def Vector_InsertElementOp :
Vector_Op<"insertelement", [NoSideEffect,		Vector_Op<"insertelement", [NoSideEffect,
PredOpTrait<"source operand and result have same element type",		PredOpTrait<"source operand and result have same element type",
TCresVTEtIsSameAsOpBase<0, 0>>,		TCresVTEtIsSameAsOpBase<0, 0>>,
PredOpTrait<"dest operand and result have same type",		PredOpTrait<"dest operand and result have same type",
TCresIsSameAsOpBase<0, 1>>]>,		TCresIsSameAsOpBase<0, 1>>]>,
Arguments<(ins AnyType:$source, AnyVector:$dest, AnyInteger:$position)>,		Arguments<(ins AnyType:$source, AnyVector:$dest, AnyInteger:$position)>,
Results<(outs AnyVector)> {		Results<(outs AnyVector)> {
▲ Show 20 Lines • Show All 796 Lines • Show Last 20 Lines

mlir/lib/Conversion/VectorToLLVM/ConvertVectorToLLVM.cpp

Show First 20 Lines • Show All 403 Lines • ▼ Show 20 Lines	matchAndRewrite(Operation *op, ArrayRef<Value> operands,
auto constant = rewriter.create<LLVM::ConstantOp>(loc, i64Type, position);		auto constant = rewriter.create<LLVM::ConstantOp>(loc, i64Type, position);
extracted =		extracted =
rewriter.create<LLVM::ExtractElementOp>(loc, extracted, constant);		rewriter.create<LLVM::ExtractElementOp>(loc, extracted, constant);
rewriter.replaceOp(op, extracted);		rewriter.replaceOp(op, extracted);

return matchSuccess();		return matchSuccess();
}		}
};		};

		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code +class VectorFMAOpConversion : public LLVMOpLowering { +public: + explicit VectorFMAOpConversion(MLIRContext context, + LLVMTypeConverter &typeConverter) + : LLVMOpLowering(vector::FMAOp::getOperationName(), context, + typeConverter) {} + + PatternMatchResult + matchAndRewrite(Operation op, ArrayRef<Value> operands, + ConversionPatternRewriter &rewriter) const override { + auto adaptor = vector::FMAOpOperandAdaptor(operands); + vector::FMAOp fmaOp = cast<vector::FMAOp>(op); + VectorType vType = fmaOp.getVectorType(); + if (vType.getRank() != 1) + return matchFailure(); + rewriter.replaceOpWithNewOp<LLVM::FMulAddOp>(op, adaptor.lhs(), + adaptor.rhs(), adaptor.acc()); + return matchSuccess(); + } +}; + Lint: Pre-merge checks: clang-format: please reformat the code ``` +class VectorFMAOpConversion : public LLVMOpLowering…
		class VectorFMAOpConversion : public LLVMOpLowering {
		dcaballeUnsubmitted Done Reply Inline Actions Adding doc about what this pattern is matching and what is not would be great dcaballe: Adding doc about what this pattern is matching and what is not would be great
		public:
		explicit VectorFMAOpConversion(MLIRContext *context,
		LLVMTypeConverter &typeConverter)
		: LLVMOpLowering(vector::FMAOp::getOperationName(), context,
		typeConverter) {}

		PatternMatchResult
		matchAndRewrite(Operation *op, ArrayRef<Value> operands,
		ConversionPatternRewriter &rewriter) const override {
		auto adaptor = vector::FMAOpOperandAdaptor(operands);
		vector::FMAOp fmaOp = cast<vector::FMAOp>(op);
		VectorType vType = fmaOp.getVectorType();
		if (vType.getRank() != 1)
		return matchFailure();
		rewriter.replaceOpWithNewOp<LLVM::FMulAddOp>(op, adaptor.lhs(),
		adaptor.rhs(), adaptor.acc());
		return matchSuccess();
		}
		};

class VectorInsertElementOpConversion : public LLVMOpLowering {		class VectorInsertElementOpConversion : public LLVMOpLowering {
public:		public:
explicit VectorInsertElementOpConversion(MLIRContext *context,		explicit VectorInsertElementOpConversion(MLIRContext *context,
LLVMTypeConverter &typeConverter)		LLVMTypeConverter &typeConverter)
: LLVMOpLowering(vector::InsertElementOp::getOperationName(), context,		: LLVMOpLowering(vector::InsertElementOp::getOperationName(), context,
typeConverter) {}		typeConverter) {}

PatternMatchResult		PatternMatchResult
▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines	matchAndRewrite(Operation *op, ArrayRef<Value> operands,
if (positionAttrs.size() > 1) {		if (positionAttrs.size() > 1) {
oneDVectorType = reducedVectorTypeBack(destVectorType);		oneDVectorType = reducedVectorTypeBack(destVectorType);
auto nMinusOnePositionAttrs =		auto nMinusOnePositionAttrs =
ArrayAttr::get(positionAttrs.drop_back(), context);		ArrayAttr::get(positionAttrs.drop_back(), context);
extracted = rewriter.create<LLVM::ExtractValueOp>(		extracted = rewriter.create<LLVM::ExtractValueOp>(
loc, lowering.convertType(oneDVectorType), extracted,		loc, lowering.convertType(oneDVectorType), extracted,
nMinusOnePositionAttrs);		nMinusOnePositionAttrs);
}		}

		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code +// Rank reducing rewrite for n-D FMA into (n-1)-D FMA where n > 1. +class VectorFMAOpRewritePattern : public OpRewritePattern<FMAOp> { +public: + using OpRewritePattern<FMAOp>::OpRewritePattern; + + PatternMatchResult matchAndRewrite(FMAOp op, + PatternRewriter &rewriter) const override { + auto vType = op.getVectorType(); + if (vType.getRank() < 2) + return matchFailure(); + + auto loc = op.getLoc(); + auto elemType = vType.getElementType(); + Value zero = rewriter.create<ConstantOp>(loc, elemType, + rewriter.getZeroAttr(elemType)); + Value desc = rewriter.create<SplatOp>(loc, vType, zero); + for (int64_t i = 0, e = vType.getShape().front(); i != e; ++i) { + Value extrLHS = rewriter.create<ExtractOp>(loc, op.lhs(), i); + Value extrRHS = rewriter.create<ExtractOp>(loc, op.rhs(), i); + Value extrACC = rewriter.create<ExtractOp>(loc, op.acc(), i); + Value fma = rewriter.create<FMAOp>(loc, extrLHS, extrRHS, extrACC); + desc = rewriter.create<InsertOp>(loc, fma, desc, i); + } + rewriter.replaceOp(op, desc); + return matchSuccess(); + } +}; + Lint: Pre-merge checks: clang-format: please reformat the code ``` +// Rank reducing rewrite for n-D FMA into (n-1)-D…
// Insertion of an element into a 1-D LLVM vector.		// Insertion of an element into a 1-D LLVM vector.
auto i64Type = LLVM::LLVMType::getInt64Ty(lowering.getDialect());		auto i64Type = LLVM::LLVMType::getInt64Ty(lowering.getDialect());
auto constant = rewriter.create<LLVM::ConstantOp>(loc, i64Type, position);		auto constant = rewriter.create<LLVM::ConstantOp>(loc, i64Type, position);
Value inserted = rewriter.create<LLVM::InsertElementOp>(		Value inserted = rewriter.create<LLVM::InsertElementOp>(
loc, lowering.convertType(oneDVectorType), extracted, adaptor.source(),		loc, lowering.convertType(oneDVectorType), extracted, adaptor.source(),
constant);		constant);

// Potential insertion of resulting 1-D vector into array.		// Potential insertion of resulting 1-D vector into array.
if (positionAttrs.size() > 1) {		if (positionAttrs.size() > 1) {
auto nMinusOnePositionAttrs =		auto nMinusOnePositionAttrs =
ArrayAttr::get(positionAttrs.drop_back(), context);		ArrayAttr::get(positionAttrs.drop_back(), context);
inserted = rewriter.create<LLVM::InsertValueOp>(loc, llvmResultType,		inserted = rewriter.create<LLVM::InsertValueOp>(loc, llvmResultType,
adaptor.dest(), inserted,		adaptor.dest(), inserted,
nMinusOnePositionAttrs);		nMinusOnePositionAttrs);
}		}

rewriter.replaceOp(op, inserted);		rewriter.replaceOp(op, inserted);
return matchSuccess();		return matchSuccess();
}		}
};		};

		// Rank reducing rewrite for n-D FMA into (n-1)-D FMA where n > 1.
		dcaballeUnsubmitted Done Reply Inline Actions I think adding a small example to the doc would help better understand what this patter is doing. dcaballe: I think adding a small example to the doc would help better understand what this patter is…
		class VectorFMAOpRewritePattern : public OpRewritePattern<FMAOp> {
		public:
		using OpRewritePattern<FMAOp>::OpRewritePattern;

		PatternMatchResult matchAndRewrite(FMAOp op,
		PatternRewriter &rewriter) const override {
		auto vType = op.getVectorType();
		if (vType.getRank() < 2)
		aartbikUnsubmitted Done Reply Inline Actions this is not a check pattern, so why not fill out the %a, %b, %c and ssa vars for readability? aartbik: this is not a check pattern, so why not fill out the %a, %b, %c and ssa vars for readability?
		return matchFailure();

		auto loc = op.getLoc();
		auto elemType = vType.getElementType();
		Value zero = rewriter.create<ConstantOp>(loc, elemType,
		rewriter.getZeroAttr(elemType));
		Value desc = rewriter.create<SplatOp>(loc, vType, zero);
		for (int64_t i = 0, e = vType.getShape().front(); i != e; ++i) {
		Value extrLHS = rewriter.create<ExtractOp>(loc, op.lhs(), i);
		Value extrRHS = rewriter.create<ExtractOp>(loc, op.rhs(), i);
		Value extrACC = rewriter.create<ExtractOp>(loc, op.acc(), i);
		Value fma = rewriter.create<FMAOp>(loc, extrLHS, extrRHS, extrACC);
		desc = rewriter.create<InsertOp>(loc, fma, desc, i);
		}
		rewriter.replaceOp(op, desc);
		return matchSuccess();
		}
		};

// When ranks are different, InsertStridedSlice needs to extract a properly		// When ranks are different, InsertStridedSlice needs to extract a properly
// ranked vector from the destination vector into which to insert. This pattern		// ranked vector from the destination vector into which to insert. This pattern
// only takes care of this part and forwards the rest of the conversion to		// only takes care of this part and forwards the rest of the conversion to
// another pattern that converts InsertStridedSlice for operands of the same		// another pattern that converts InsertStridedSlice for operands of the same
// rank.		// rank.
//		//
// RewritePattern for InsertStridedSliceOp where source and destination vectors		// RewritePattern for InsertStridedSliceOp where source and destination vectors
// have different ranks. In this case:		// have different ranks. In this case:
▲ Show 20 Lines • Show All 388 Lines • ▼ Show 20 Lines
/// 2. extract + optional strided_slice + insert for the n-D case.		/// 2. extract + optional strided_slice + insert for the n-D case.
class VectorStridedSliceOpConversion : public OpRewritePattern<StridedSliceOp> {		class VectorStridedSliceOpConversion : public OpRewritePattern<StridedSliceOp> {
public:		public:
using OpRewritePattern<StridedSliceOp>::OpRewritePattern;		using OpRewritePattern<StridedSliceOp>::OpRewritePattern;

PatternMatchResult matchAndRewrite(StridedSliceOp op,		PatternMatchResult matchAndRewrite(StridedSliceOp op,
PatternRewriter &rewriter) const override {		PatternRewriter &rewriter) const override {
auto dstType = op.getResult().getType().cast<VectorType>();		auto dstType = op.getResult().getType().cast<VectorType>();

		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - patterns.insert<VectorInsertStridedSliceOpDifferentRankRewritePattern, + patterns.insert<VectorFMAOpRewritePattern, + VectorInsertStridedSliceOpDifferentRankRewritePattern, Lint: Pre-merge checks: clang-format: please reformat the code ``` - patterns.
assert(!op.offsets().getValue().empty() && "Unexpected empty offsets");		assert(!op.offsets().getValue().empty() && "Unexpected empty offsets");

int64_t offset =		int64_t offset =
op.offsets().getValue().front().cast<IntegerAttr>().getInt();		op.offsets().getValue().front().cast<IntegerAttr>().getInt();
int64_t size = op.sizes().getValue().front().cast<IntegerAttr>().getInt();		int64_t size = op.sizes().getValue().front().cast<IntegerAttr>().getInt();
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code - VectorInsertElementOpConversion, VectorInsertOpConversion, - VectorOuterProductOpConversion, VectorTypeCastOpConversion, - VectorPrintOpConversion>(ctx, converter); + VectorFMAOpConversion, VectorInsertElementOpConversion, + VectorInsertOpConversion, VectorOuterProductOpConversion, + VectorTypeCastOpConversion, VectorPrintOpConversion>( + ctx, converter); Lint: Pre-merge checks: clang-format: please reformat the code ``` - VectorInsertElementOpConversion…
int64_t stride =		int64_t stride =
op.strides().getValue().front().cast<IntegerAttr>().getInt();		op.strides().getValue().front().cast<IntegerAttr>().getInt();

auto loc = op.getLoc();		auto loc = op.getLoc();
auto elemType = dstType.getElementType();		auto elemType = dstType.getElementType();
assert(elemType.isIntOrIndexOrFloat());		assert(elemType.isIntOrIndexOrFloat());
Value zero = rewriter.create<ConstantOp>(loc, elemType,		Value zero = rewriter.create<ConstantOp>(loc, elemType,
rewriter.getZeroAttr(elemType));		rewriter.getZeroAttr(elemType));
Show All 27 Lines
};		};

} // namespace		} // namespace

/// Populate the given list with patterns that convert from Vector to LLVM.		/// Populate the given list with patterns that convert from Vector to LLVM.
void mlir::populateVectorToLLVMConversionPatterns(		void mlir::populateVectorToLLVMConversionPatterns(
LLVMTypeConverter &converter, OwningRewritePatternList &patterns) {		LLVMTypeConverter &converter, OwningRewritePatternList &patterns) {
MLIRContext *ctx = converter.getDialect()->getContext();		MLIRContext *ctx = converter.getDialect()->getContext();
patterns.insert<VectorInsertStridedSliceOpDifferentRankRewritePattern,		patterns.insert<VectorFMAOpRewritePattern,
		VectorInsertStridedSliceOpDifferentRankRewritePattern,
VectorInsertStridedSliceOpSameRankRewritePattern,		VectorInsertStridedSliceOpSameRankRewritePattern,
VectorStridedSliceOpConversion>(ctx);		VectorStridedSliceOpConversion>(ctx);
patterns.insert<VectorBroadcastOpConversion, VectorShuffleOpConversion,		patterns.insert<VectorBroadcastOpConversion, VectorShuffleOpConversion,
VectorExtractElementOpConversion, VectorExtractOpConversion,		VectorExtractElementOpConversion, VectorExtractOpConversion,
VectorInsertElementOpConversion, VectorInsertOpConversion,		VectorFMAOpConversion, VectorInsertElementOpConversion,
VectorOuterProductOpConversion, VectorTypeCastOpConversion,		VectorInsertOpConversion, VectorOuterProductOpConversion,
VectorPrintOpConversion>(ctx, converter);		VectorTypeCastOpConversion, VectorPrintOpConversion>(
		ctx, converter);
		dcaballeUnsubmitted Done Reply Inline Actions Rename `VectorFMAOpRewritePattern` and `VectorFMAOpConversion` to be more aligned with what they match? You'll probably find something better but something along the lines of `SingleDimVectorFMAOpRewritePattern` and `MultiDimVectorFMAOpConversion` dcaballe: Rename `VectorFMAOpRewritePattern` and `VectorFMAOpConversion` to be more aligned with what…
}		}

namespace {		namespace {
struct LowerVectorToLLVMPass : public ModulePass<LowerVectorToLLVMPass> {		struct LowerVectorToLLVMPass : public ModulePass<LowerVectorToLLVMPass> {
void runOnModule() override;		void runOnModule() override;
};		};
} // namespace		} // namespace

Show All 32 Lines

mlir/test/Conversion/VectorToLLVM/vector-to-llvm.mlir

	// RUN: mlir-opt %s -convert-vector-to-llvm \| FileCheck %s			// RUN: mlir-opt %s -convert-vector-to-llvm \| FileCheck %s

	func @broadcast_vec1d_from_scalar(%arg0: f32) -> vector<2xf32> {			// CHECK-LABEL: llvm.func @vector_fma
				Lint: Pre-merge checks Inline Actions clang-format: please reformat the code -func @broadcast_vec1d_from_scalar(%arg0: f32) -> vector<2xf32> { - %0 = vector.broadcast %arg0 : f32 to vector<2xf32> - return %0 : vector<2xf32> +// CHECK-LABEL: llvm.func @vector_fma +func @vector_fma(%a: vector<8xf32>, %b: vector<2x4xf32>) + -> (vector<8xf32>, vector<2x4xf32>) +{ + // CHECK: llvm.intr.fmuladd{{.}}: (!llvm<"<8 x float>">, !llvm<"<8 x float>">, !llvm<"<8 x float>">) -> !llvm<"<8 x float>"> + %0 = vector.fma %a, %a, %a : vector<8xf32> + // CHECK-COUNT-3: llvm.extractvalue {{.}}[0] : !llvm<"[2 x <4 x float>]"> + // CHECK: llvm.intr.fmuladd{{.}} : (!llvm<"<4 x float>">, !llvm<"<4 x float>">, !llvm<"<4 x float>">) -> !llvm<"<4 x float>"> + // CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[2 x <4 x float>]"> + // CHECK-COUNT-3: llvm.extractvalue {{.}}[1] : !llvm<"[2 x <4 x float>]"> + // CHECK: llvm.intr.fmuladd{{.}} : (!llvm<"<4 x float>">, !llvm<"<4 x float>">, !llvm<"<4 x float>">) -> !llvm<"<4 x float>"> + // CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[2 x <4 x float>]"> + %1 = vector.fma %b, %b, %b : vector<2x4xf32> + return %0, %1: vector<8xf32>, vector<2x4xf32> Lint: Pre-merge checks:* clang-format: please reformat the code ``` -func @broadcast_vec1d_from_scalar(%arg0: f32) ->…
	%0 = vector.broadcast %arg0 : f32 to vector<2xf32>			func @vector_fma(%a: vector<8xf32>, %b: vector<2x4xf32>)
	return %0 : vector<2xf32>			-> (vector<8xf32>, vector<2x4xf32>)
				{
				// CHECK: llvm.intr.fmuladd{{.*}}: (!llvm<"<8 x float>">, !llvm<"<8 x float>">, !llvm<"<8 x float>">) -> !llvm<"<8 x float>">
				Lint: Pre-merge checks Inline Actions clang-format: please reformat the code -// CHECK-LABEL: llvm.func @broadcast_vec1d_from_scalar -// CHECK: llvm.mlir.undef : !llvm<"<2 x float>"> -// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: llvm.insertelement {{.}}, {{.}}[{{.}} : !llvm.i64] : !llvm<"<2 x float>"> -// CHECK: llvm.shufflevector {{.}}, {{.}}[0 : i32, 0 : i32] : !llvm<"<2 x float>">, !llvm<"<2 x float>"> -// CHECK: llvm.return {{.}} : !llvm<"<2 x float>"> Lint: Pre-merge checks: clang-format: please reformat the code ``` -// CHECK-LABEL: llvm.func…
				%0 = vector.fma %a, %a, %a : vector<8xf32>
				// CHECK-COUNT-3: llvm.extractvalue {{.*}}[0] : !llvm<"[2 x <4 x float>]">
				// CHECK: llvm.intr.fmuladd{{.*}} : (!llvm<"<4 x float>">, !llvm<"<4 x float>">, !llvm<"<4 x float>">) -> !llvm<"<4 x float>">
				// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[2 x <4 x float>]">
				// CHECK-COUNT-3: llvm.extractvalue {{.*}}[1] : !llvm<"[2 x <4 x float>]">
				// CHECK: llvm.intr.fmuladd{{.*}} : (!llvm<"<4 x float>">, !llvm<"<4 x float>">, !llvm<"<4 x float>">) -> !llvm<"<4 x float>">
				// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[2 x <4 x float>]">
				Lint: Pre-merge checks Inline Actions clang-format: please reformat the code -func @broadcast_vec2d_from_scalar(%arg0: f32) -> vector<2x3xf32> { - %0 = vector.broadcast %arg0 : f32 to vector<2x3xf32> - return %0 : vector<2x3xf32> -} -// CHECK-LABEL: llvm.func @broadcast_vec2d_from_scalar -// CHECK: llvm.mlir.undef : !llvm<"<3 x float>"> -// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: llvm.insertelement {{.}}, {{.}}[{{.}} : !llvm.i64] : !llvm<"<3 x float>"> -// CHECK: llvm.shufflevector {{.}}, {{.}}[0 : i32, 0 : i32, 0 : i32] : !llvm<"<3 x float>">, !llvm<"<3 x float>"> -// CHECK: llvm.mlir.undef : !llvm<"[2 x <3 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[2 x <3 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[2 x <3 x float>]"> -// CHECK: llvm.return {{.}} : !llvm<"[2 x <3 x float>]"> - -func @broadcast_vec3d_from_scalar(%arg0: f32) -> vector<2x3x4xf32> { - %0 = vector.broadcast %arg0 : f32 to vector<2x3x4xf32> - return %0 : vector<2x3x4xf32> -} -// CHECK-LABEL: llvm.func @broadcast_vec3d_from_scalar -// CHECK: llvm.mlir.undef : !llvm<"<4 x float>"> -// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: llvm.insertelement {{.}}, {{.}}[{{.}} : !llvm.i64] : !llvm<"<4 x float>"> -// CHECK: llvm.shufflevector {{.}}, {{.}} [0 : i32, 0 : i32, 0 : i32, 0 : i32] : !llvm<"<4 x float>">, !llvm<"<4 x float>"> -// CHECK: llvm.mlir.undef : !llvm<"[3 x <4 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[3 x <4 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[3 x <4 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[3 x <4 x float>]"> -// CHECK: llvm.mlir.undef : !llvm<"[2 x [3 x <4 x float>]]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[2 x [3 x <4 x float>]]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[2 x [3 x <4 x float>]]"> -// CHECK: llvm.return {{.}} : !llvm<"[2 x [3 x <4 x float>]]"> - -func @broadcast_vec1d_from_vec1d(%arg0: vector<2xf32>) -> vector<2xf32> { - %0 = vector.broadcast %arg0 : vector<2xf32> to vector<2xf32> - return %0 : vector<2xf32> -} -// CHECK-LABEL: llvm.func @broadcast_vec1d_from_vec1d -// CHECK: llvm.return {{.}} : !llvm<"<2 x float>"> - -func @broadcast_vec2d_from_vec1d(%arg0: vector<2xf32>) -> vector<3x2xf32> { - %0 = vector.broadcast %arg0 : vector<2xf32> to vector<3x2xf32> - return %0 : vector<3x2xf32> -} -// CHECK-LABEL: llvm.func @broadcast_vec2d_from_vec1d -// CHECK: llvm.mlir.undef : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.return {{.}} : !llvm<"[3 x <2 x float>]"> - -func @broadcast_vec3d_from_vec1d(%arg0: vector<2xf32>) -> vector<4x3x2xf32> { - %0 = vector.broadcast %arg0 : vector<2xf32> to vector<4x3x2xf32> - return %0 : vector<4x3x2xf32> -} -// CHECK-LABEL: llvm.func @broadcast_vec3d_from_vec1d -// CHECK: llvm.mlir.undef : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.mlir.undef : !llvm<"[4 x [3 x <2 x float>]]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[4 x [3 x <2 x float>]]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[4 x [3 x <2 x float>]]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[4 x [3 x <2 x float>]]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[3] : !llvm<"[4 x [3 x <2 x float>]]"> -// CHECK: llvm.return {{.}} : !llvm<"[4 x [3 x <2 x float>]]"> - -func @broadcast_vec3d_from_vec2d(%arg0: vector<3x2xf32>) -> vector<4x3x2xf32> { - %0 = vector.broadcast %arg0 : vector<3x2xf32> to vector<4x3x2xf32> - return %0 : vector<4x3x2xf32> -} -// CHECK-LABEL: llvm.func @broadcast_vec3d_from_vec2d -// CHECK: llvm.mlir.undef : !llvm<"[4 x [3 x <2 x float>]]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[4 x [3 x <2 x float>]]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[4 x [3 x <2 x float>]]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[4 x [3 x <2 x float>]]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[3] : !llvm<"[4 x [3 x <2 x float>]]"> -// CHECK: llvm.return {{.}} : !llvm<"[4 x [3 x <2 x float>]]"> - -func @broadcast_stretch(%arg0: vector<1xf32>) -> vector<4xf32> { - %0 = vector.broadcast %arg0 : vector<1xf32> to vector<4xf32> - return %0 : vector<4xf32> -} -// CHECK-LABEL: llvm.func @broadcast_stretch -// CHECK: llvm.mlir.undef : !llvm<"<4 x float>"> -// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<1 x float>"> -// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: llvm.insertelement {{.}}, {{.}}[{{.}} : !llvm.i64] : !llvm<"<4 x float>"> -// CHECK: llvm.shufflevector {{.}}, {{.}} [0 : i32, 0 : i32, 0 : i32, 0 : i32] : !llvm<"<4 x float>">, !llvm<"<4 x float>"> -// CHECK: llvm.return {{.}} : !llvm<"<4 x float>"> - -func @broadcast_stretch_at_start(%arg0: vector<1x4xf32>) -> vector<3x4xf32> { - %0 = vector.broadcast %arg0 : vector<1x4xf32> to vector<3x4xf32> - return %0 : vector<3x4xf32> -} -// CHECK-LABEL: llvm.func @broadcast_stretch_at_start -// CHECK: llvm.mlir.undef : !llvm<"[3 x <4 x float>]"> -// CHECK: llvm.extractvalue {{.}}[0] : !llvm<"[1 x <4 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[3 x <4 x float>]"> -// CHECK: llvm.extractvalue {{.}}[0] : !llvm<"[1 x <4 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[3 x <4 x float>]"> -// CHECK: llvm.extractvalue {{.}}[0] : !llvm<"[1 x <4 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[3 x <4 x float>]"> -// CHECK: llvm.return {{.}} : !llvm<"[3 x <4 x float>]"> - -func @broadcast_stretch_at_end(%arg0: vector<4x1xf32>) -> vector<4x3xf32> { - %0 = vector.broadcast %arg0 : vector<4x1xf32> to vector<4x3xf32> - return %0 : vector<4x3xf32> -} -// CHECK-LABEL: llvm.func @broadcast_stretch_at_end -// CHECK: llvm.mlir.undef : !llvm<"[4 x <3 x float>]"> -// CHECK: llvm.extractvalue {{.}}[0] : !llvm<"[4 x <1 x float>]"> -// CHECK: llvm.mlir.undef : !llvm<"<3 x float>"> -// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<1 x float>"> -// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: llvm.insertelement {{.}}, {{.}}[{{.}} : !llvm.i64] : !llvm<"<3 x float>"> -// CHECK: llvm.shufflevector {{.}}, {{.}} [0 : i32, 0 : i32, 0 : i32] : !llvm<"<3 x float>">, !llvm<"<3 x float>"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[4 x <3 x float>]"> -// CHECK: llvm.extractvalue {{.}}[1] : !llvm<"[4 x <1 x float>]"> -// CHECK: llvm.mlir.undef : !llvm<"<3 x float>"> -// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<1 x float>"> -// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: llvm.insertelement {{.}}, {{.}}[{{.}} : !llvm.i64] : !llvm<"<3 x float>"> -// CHECK: llvm.shufflevector {{.}}, {{.}} [0 : i32, 0 : i32, 0 : i32] : !llvm<"<3 x float>">, !llvm<"<3 x float>"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[4 x <3 x float>]"> -// CHECK: llvm.extractvalue {{.}}[2] : !llvm<"[4 x <1 x float>]"> -// CHECK: llvm.mlir.undef : !llvm<"<3 x float>"> -// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<1 x float>"> -// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: llvm.insertelement {{.}}, {{.}}[{{.}} : !llvm.i64] : !llvm<"<3 x float>"> -// CHECK: llvm.shufflevector {{.}}, {{.}} [0 : i32, 0 : i32, 0 : i32] : !llvm<"<3 x float>">, !llvm<"<3 x float>"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[4 x <3 x float>]"> -// CHECK: llvm.extractvalue {{.}}[3] : !llvm<"[4 x <1 x float>]"> -// CHECK: llvm.mlir.undef : !llvm<"<3 x float>"> -// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<1 x float>"> -// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: llvm.insertelement {{.}}, {{.}}[{{.}} : !llvm.i64] : !llvm<"<3 x float>"> -// CHECK: llvm.shufflevector {{.}}, {{.}} [0 : i32, 0 : i32, 0 : i32] : !llvm<"<3 x float>">, !llvm<"<3 x float>"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[3] : !llvm<"[4 x <3 x float>]"> -// CHECK: llvm.return {{.}} : !llvm<"[4 x <3 x float>]"> - -func @broadcast_stretch_in_middle(%arg0: vector<4x1x2xf32>) -> vector<4x3x2xf32> { - %0 = vector.broadcast %arg0 : vector<4x1x2xf32> to vector<4x3x2xf32> - return %0 : vector<4x3x2xf32> -} -// CHECK-LABEL: llvm.func @broadcast_stretch_in_middle -// CHECK: llvm.mlir.undef : !llvm<"[4 x [3 x <2 x float>]]"> -// CHECK: llvm.extractvalue {{.}}[0] : !llvm<"[4 x [1 x <2 x float>]]"> -// CHECK: llvm.mlir.undef : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.extractvalue {{.}}[0] : !llvm<"[1 x <2 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.extractvalue {{.}}[0] : !llvm<"[1 x <2 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.extractvalue {{.}}[0] : !llvm<"[1 x <2 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[4 x [3 x <2 x float>]]"> -// CHECK: llvm.extractvalue {{.}}[1] : !llvm<"[4 x [1 x <2 x float>]]"> -// CHECK: llvm.mlir.undef : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.extractvalue {{.}}[0] : !llvm<"[1 x <2 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.extractvalue {{.}}[0] : !llvm<"[1 x <2 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.extractvalue {{.}}[0] : !llvm<"[1 x <2 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[4 x [3 x <2 x float>]]"> -// CHECK: llvm.extractvalue {{.}}[2] : !llvm<"[4 x [1 x <2 x float>]]"> -// CHECK: llvm.mlir.undef : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.extractvalue {{.}}[0] : !llvm<"[1 x <2 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.extractvalue {{.}}[0] : !llvm<"[1 x <2 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.extractvalue {{.}}[0] : !llvm<"[1 x <2 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[4 x [3 x <2 x float>]]"> -// CHECK: llvm.extractvalue {{.}}[3] : !llvm<"[4 x [1 x <2 x float>]]"> -// CHECK: llvm.mlir.undef : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.extractvalue {{.}}[0] : !llvm<"[1 x <2 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.extractvalue {{.}}[0] : !llvm<"[1 x <2 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.extractvalue {{.}}[0] : !llvm<"[1 x <2 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[3 x <2 x float>]"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[3] : !llvm<"[4 x [3 x <2 x float>]]"> -// CHECK: llvm.return {{.}} : !llvm<"[4 x [3 x <2 x float>]]"> - -func @outerproduct(%arg0: vector<2xf32>, %arg1: vector<3xf32>) -> vector<2x3xf32> { - %2 = vector.outerproduct %arg0, %arg1 : vector<2xf32>, vector<3xf32> - return %2 : vector<2x3xf32> -} -// CHECK-LABEL: llvm.func @outerproduct -// CHECK: llvm.mlir.undef : !llvm<"[2 x <3 x float>]"> -// CHECK: llvm.shufflevector {{.}} [0 : i32, 0 : i32, 0 : i32] : !llvm<"<2 x float>">, !llvm<"<2 x float>"> -// CHECK: llvm.fmul {{.}}, {{.}} : !llvm<"<3 x float>"> -// CHECK: llvm.insertvalue {{.}}[0] : !llvm<"[2 x <3 x float>]"> -// CHECK: llvm.shufflevector {{.}} [1 : i32, 1 : i32, 1 : i32] : !llvm<"<2 x float>">, !llvm<"<2 x float>"> -// CHECK: llvm.fmul {{.}}, {{.}} : !llvm<"<3 x float>"> -// CHECK: llvm.insertvalue {{.}}[1] : !llvm<"[2 x <3 x float>]"> -// CHECK: llvm.return {{.}} : !llvm<"[2 x <3 x float>]"> - -func @outerproduct_add(%arg0: vector<2xf32>, %arg1: vector<3xf32>, %arg2: vector<2x3xf32>) -> vector<2x3xf32> { - %2 = vector.outerproduct %arg0, %arg1, %arg2 : vector<2xf32>, vector<3xf32> - return %2 : vector<2x3xf32> -} -// CHECK-LABEL: llvm.func @outerproduct_add -// CHECK: llvm.mlir.undef : !llvm<"[2 x <3 x float>]"> -// CHECK: llvm.shufflevector {{.}} [0 : i32, 0 : i32, 0 : i32] : !llvm<"<2 x float>">, !llvm<"<2 x float>"> -// CHECK: llvm.extractvalue {{.}}[0] : !llvm<"[2 x <3 x float>]"> -// CHECK: "llvm.intr.fmuladd"({{.}}) : (!llvm<"<3 x float>">, !llvm<"<3 x float>">, !llvm<"<3 x float>">) -> !llvm<"<3 x float>"> -// CHECK: llvm.insertvalue {{.}}[0] : !llvm<"[2 x <3 x float>]"> -// CHECK: llvm.shufflevector {{.}} [1 : i32, 1 : i32, 1 : i32] : !llvm<"<2 x float>">, !llvm<"<2 x float>"> -// CHECK: llvm.extractvalue {{.}}[1] : !llvm<"[2 x <3 x float>]"> -// CHECK: "llvm.intr.fmuladd"({{.}}) : (!llvm<"<3 x float>">, !llvm<"<3 x float>">, !llvm<"<3 x float>">) -> !llvm<"<3 x float>"> -// CHECK: llvm.insertvalue {{.}}[1] : !llvm<"[2 x <3 x float>]"> -// CHECK: llvm.return {{.}} : !llvm<"[2 x <3 x float>]"> - -func @shuffle_1D_direct(%arg0: vector<2xf32>, %arg1: vector<2xf32>) -> vector<2xf32> { - %1 = vector.shuffle %arg0, %arg1 [0, 1] : vector<2xf32>, vector<2xf32> - return %1 : vector<2xf32> -} -// CHECK-LABEL: llvm.func @shuffle_1D_direct -// CHECK-SAME: %[[A:arg[0-9]+]]: !llvm<"<2 x float>"> -// CHECK-SAME: %[[B:arg[0-9]+]]: !llvm<"<2 x float>"> -// CHECK: %[[s:.]] = llvm.shufflevector %[[A]], %[[B]] [0, 1] : !llvm<"<2 x float>">, !llvm<"<2 x float>"> -// CHECK: llvm.return %[[s]] : !llvm<"<2 x float>"> - -func @shuffle_1D(%arg0: vector<2xf32>, %arg1: vector<3xf32>) -> vector<5xf32> { - %1 = vector.shuffle %arg0, %arg1 [4, 3, 2, 1, 0] : vector<2xf32>, vector<3xf32> - return %1 : vector<5xf32> -} -// CHECK-LABEL: llvm.func @shuffle_1D -// CHECK-SAME: %[[A:arg[0-9]+]]: !llvm<"<2 x float>"> -// CHECK-SAME: %[[B:arg[0-9]+]]: !llvm<"<3 x float>"> -// CHECK: %[[u0:.]] = llvm.mlir.undef : !llvm<"<5 x float>"> -// CHECK: %[[c2:.]] = llvm.mlir.constant(2 : index) : !llvm.i64 -// CHECK: %[[e1:.]] = llvm.extractelement %[[B]][%[[c2]] : !llvm.i64] : !llvm<"<3 x float>"> -// CHECK: %[[c0:.]] = llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: %[[i1:.]] = llvm.insertelement %[[e1]], %[[u0]][%[[c0]] : !llvm.i64] : !llvm<"<5 x float>"> -// CHECK: %[[c1:.]] = llvm.mlir.constant(1 : index) : !llvm.i64 -// CHECK: %[[e2:.]] = llvm.extractelement %[[B]][%[[c1]] : !llvm.i64] : !llvm<"<3 x float>"> -// CHECK: %[[c1:.]] = llvm.mlir.constant(1 : index) : !llvm.i64 -// CHECK: %[[i2:.]] = llvm.insertelement %[[e2]], %[[i1]][%[[c1]] : !llvm.i64] : !llvm<"<5 x float>"> -// CHECK: %[[c0:.]] = llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: %[[e3:.]] = llvm.extractelement %[[B]][%[[c0]] : !llvm.i64] : !llvm<"<3 x float>"> -// CHECK: %[[c2:.]] = llvm.mlir.constant(2 : index) : !llvm.i64 -// CHECK: %[[i3:.]] = llvm.insertelement %[[e3]], %[[i2]][%[[c2]] : !llvm.i64] : !llvm<"<5 x float>"> -// CHECK: %[[c1:.]] = llvm.mlir.constant(1 : index) : !llvm.i64 -// CHECK: %[[e4:.]] = llvm.extractelement %[[A]][%[[c1]] : !llvm.i64] : !llvm<"<2 x float>"> -// CHECK: %[[c3:.]] = llvm.mlir.constant(3 : index) : !llvm.i64 -// CHECK: %[[i4:.]] = llvm.insertelement %[[e4]], %[[i3]][%[[c3]] : !llvm.i64] : !llvm<"<5 x float>"> -// CHECK: %[[c0:.]] = llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: %[[e5:.]] = llvm.extractelement %[[A]][%[[c0]] : !llvm.i64] : !llvm<"<2 x float>"> -// CHECK: %[[c4:.]] = llvm.mlir.constant(4 : index) : !llvm.i64 -// CHECK: %[[i5:.]] = llvm.insertelement %[[e5]], %[[i4]][%[[c4]] : !llvm.i64] : !llvm<"<5 x float>"> -// CHECK: llvm.return %[[i5]] : !llvm<"<5 x float>"> - -func @shuffle_2D(%a: vector<1x4xf32>, %b: vector<2x4xf32>) -> vector<3x4xf32> { - %1 = vector.shuffle %a, %b[1, 0, 2] : vector<1x4xf32>, vector<2x4xf32> - return %1 : vector<3x4xf32> -} -// CHECK-LABEL: llvm.func @shuffle_2D -// CHECK-SAME: %[[A:arg[0-9]+]]: !llvm<"[1 x <4 x float>]"> -// CHECK-SAME: %[[B:arg[0-9]+]]: !llvm<"[2 x <4 x float>]"> -// CHECK: %[[u0:.]] = llvm.mlir.undef : !llvm<"[3 x <4 x float>]"> -// CHECK: %[[e1:.]] = llvm.extractvalue %[[B]][0] : !llvm<"[2 x <4 x float>]"> -// CHECK: %[[i1:.]] = llvm.insertvalue %[[e1]], %[[u0]][0] : !llvm<"[3 x <4 x float>]"> -// CHECK: %[[e2:.]] = llvm.extractvalue %[[A]][0] : !llvm<"[1 x <4 x float>]"> -// CHECK: %[[i2:.]] = llvm.insertvalue %[[e2]], %[[i1]][1] : !llvm<"[3 x <4 x float>]"> -// CHECK: %[[e3:.]] = llvm.extractvalue %[[B]][1] : !llvm<"[2 x <4 x float>]"> -// CHECK: %[[i3:.]] = llvm.insertvalue %[[e3]], %[[i2]][2] : !llvm<"[3 x <4 x float>]"> -// CHECK: llvm.return %[[i3]] : !llvm<"[3 x <4 x float>]"> - -func @extract_element(%arg0: vector<16xf32>) -> f32 { - %0 = constant 15 : i32 - %1 = vector.extractelement %arg0[%0 : i32]: vector<16xf32> - return %1 : f32 -} -// CHECK-LABEL: llvm.func @extract_element -// CHECK-SAME: %[[A:arg[0-9]+]]: !llvm<"<16 x float>"> -// CHECK: %[[c:.]] = llvm.mlir.constant(15 : i32) : !llvm.i32 -// CHECK: %[[x:.]] = llvm.extractelement %[[A]][%[[c]] : !llvm.i32] : !llvm<"<16 x float>"> -// CHECK: llvm.return %[[x]] : !llvm.float - -func @extract_element_from_vec_1d(%arg0: vector<16xf32>) -> f32 { - %0 = vector.extract %arg0[15]: vector<16xf32> - return %0 : f32 -} -// CHECK-LABEL: llvm.func @extract_element_from_vec_1d -// CHECK: llvm.mlir.constant(15 : i64) : !llvm.i64 -// CHECK: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<16 x float>"> -// CHECK: llvm.return {{.}} : !llvm.float - -func @extract_vec_2d_from_vec_3d(%arg0: vector<4x3x16xf32>) -> vector<3x16xf32> { - %0 = vector.extract %arg0[0]: vector<4x3x16xf32> - return %0 : vector<3x16xf32> -} -// CHECK-LABEL: llvm.func @extract_vec_2d_from_vec_3d -// CHECK: llvm.extractvalue {{.}}[0] : !llvm<"[4 x [3 x <16 x float>]]"> -// CHECK: llvm.return {{.}} : !llvm<"[3 x <16 x float>]"> - -func @extract_vec_1d_from_vec_3d(%arg0: vector<4x3x16xf32>) -> vector<16xf32> { - %0 = vector.extract %arg0[0, 0]: vector<4x3x16xf32> - return %0 : vector<16xf32> -} -// CHECK-LABEL: llvm.func @extract_vec_1d_from_vec_3d -// CHECK: llvm.extractvalue {{.}}[0, 0] : !llvm<"[4 x [3 x <16 x float>]]"> -// CHECK: llvm.return {{.}} : !llvm<"<16 x float>"> - -func @extract_element_from_vec_3d(%arg0: vector<4x3x16xf32>) -> f32 { - %0 = vector.extract %arg0[0, 0, 0]: vector<4x3x16xf32> - return %0 : f32 -} -// CHECK-LABEL: llvm.func @extract_element_from_vec_3d -// CHECK: llvm.extractvalue {{.}}[0, 0] : !llvm<"[4 x [3 x <16 x float>]]"> -// CHECK: llvm.mlir.constant(0 : i64) : !llvm.i64 -// CHECK: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<16 x float>"> -// CHECK: llvm.return {{.}} : !llvm.float - -func @insert_element(%arg0: f32, %arg1: vector<4xf32>) -> vector<4xf32> { - %0 = constant 3 : i32 - %1 = vector.insertelement %arg0, %arg1[%0 : i32] : vector<4xf32> - return %1 : vector<4xf32> -} -// CHECK-LABEL: llvm.func @insert_element -// CHECK-SAME: %[[A:arg[0-9]+]]: !llvm.float -// CHECK-SAME: %[[B:arg[0-9]+]]: !llvm<"<4 x float>"> -// CHECK: %[[c:.]] = llvm.mlir.constant(3 : i32) : !llvm.i32 -// CHECK: %[[x:.]] = llvm.insertelement %[[A]], %[[B]][%[[c]] : !llvm.i32] : !llvm<"<4 x float>"> -// CHECK: llvm.return %[[x]] : !llvm<"<4 x float>"> - -func @insert_element_into_vec_1d(%arg0: f32, %arg1: vector<4xf32>) -> vector<4xf32> { - %0 = vector.insert %arg0, %arg1[3] : f32 into vector<4xf32> - return %0 : vector<4xf32> -} -// CHECK-LABEL: llvm.func @insert_element_into_vec_1d -// CHECK: llvm.mlir.constant(3 : i64) : !llvm.i64 -// CHECK: llvm.insertelement {{.}}, {{.}}[{{.}} : !llvm.i64] : !llvm<"<4 x float>"> -// CHECK: llvm.return {{.}} : !llvm<"<4 x float>"> - -func @insert_vec_2d_into_vec_3d(%arg0: vector<8x16xf32>, %arg1: vector<4x8x16xf32>) -> vector<4x8x16xf32> { - %0 = vector.insert %arg0, %arg1[3] : vector<8x16xf32> into vector<4x8x16xf32> - return %0 : vector<4x8x16xf32> -} -// CHECK-LABEL: llvm.func @insert_vec_2d_into_vec_3d -// CHECK: llvm.insertvalue {{.}}, {{.}}[3] : !llvm<"[4 x [8 x <16 x float>]]"> -// CHECK: llvm.return {{.}} : !llvm<"[4 x [8 x <16 x float>]]"> - -func @insert_vec_1d_into_vec_3d(%arg0: vector<16xf32>, %arg1: vector<4x8x16xf32>) -> vector<4x8x16xf32> { - %0 = vector.insert %arg0, %arg1[3, 7] : vector<16xf32> into vector<4x8x16xf32> - return %0 : vector<4x8x16xf32> -} -// CHECK-LABEL: llvm.func @insert_vec_1d_into_vec_3d -// CHECK: llvm.insertvalue {{.}}, {{.}}[3, 7] : !llvm<"[4 x [8 x <16 x float>]]"> -// CHECK: llvm.return {{.}} : !llvm<"[4 x [8 x <16 x float>]]"> - -func @insert_element_into_vec_3d(%arg0: f32, %arg1: vector<4x8x16xf32>) -> vector<4x8x16xf32> { - %0 = vector.insert %arg0, %arg1[3, 7, 15] : f32 into vector<4x8x16xf32> - return %0 : vector<4x8x16xf32> -} -// CHECK-LABEL: llvm.func @insert_element_into_vec_3d -// CHECK: llvm.extractvalue {{.}}[3, 7] : !llvm<"[4 x [8 x <16 x float>]]"> -// CHECK: llvm.mlir.constant(15 : i64) : !llvm.i64 -// CHECK: llvm.insertelement {{.}}, {{.}}[{{.}} : !llvm.i64] : !llvm<"<16 x float>"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[3, 7] : !llvm<"[4 x [8 x <16 x float>]]"> -// CHECK: llvm.return {{.}} : !llvm<"[4 x [8 x <16 x float>]]"> - -func @vector_type_cast(%arg0: memref<8x8x8xf32>) -> memref<vector<8x8x8xf32>> { - %0 = vector.type_cast %arg0: memref<8x8x8xf32> to memref<vector<8x8x8xf32>> - return %0 : memref<vector<8x8x8xf32>> -} -// CHECK-LABEL: llvm.func @vector_type_cast -// CHECK: llvm.mlir.undef : !llvm<"{ [8 x [8 x <8 x float>]], [8 x [8 x <8 x float>]], i64 }"> -// CHECK: %[[allocated:.]] = llvm.extractvalue {{.}}[0] : !llvm<"{ float, float, i64, [3 x i64], [3 x i64] }"> -// CHECK: %[[allocatedBit:.]] = llvm.bitcast %[[allocated]] : !llvm<"float"> to !llvm<"[8 x [8 x <8 x float>]]"> -// CHECK: llvm.insertvalue %[[allocatedBit]], {{.}}[0] : !llvm<"{ [8 x [8 x <8 x float>]], [8 x [8 x <8 x float>]], i64 }"> -// CHECK: %[[aligned:.]] = llvm.extractvalue {{.}}[1] : !llvm<"{ float, float, i64, [3 x i64], [3 x i64] }"> -// CHECK: %[[alignedBit:.]] = llvm.bitcast %[[aligned]] : !llvm<"float"> to !llvm<"[8 x [8 x <8 x float>]]"> -// CHECK: llvm.insertvalue %[[alignedBit]], {{.}}[1] : !llvm<"{ [8 x [8 x <8 x float>]], [8 x [8 x <8 x float>]], i64 }"> -// CHECK: llvm.mlir.constant(0 : index -// CHECK: llvm.insertvalue {{.}}[2] : !llvm<"{ [8 x [8 x <8 x float>]], [8 x [8 x <8 x float>]], i64 }"> - -func @vector_print_scalar(%arg0: f32) { - vector.print %arg0 : f32 - return -} -// CHECK-LABEL: llvm.func @vector_print_scalar -// CHECK-SAME: %[[A:arg[0-9]+]]: !llvm.float -// CHECK: llvm.call @print_f32(%[[A]]) : (!llvm.float) -> () -// CHECK: llvm.call @print_newline() : () -> () - -func @vector_print_vector(%arg0: vector<2x2xf32>) { - vector.print %arg0 : vector<2x2xf32> - return -} -// CHECK-LABEL: llvm.func @vector_print_vector -// CHECK-SAME: %[[A:arg[0-9]+]]: !llvm<"[2 x <2 x float>]"> -// CHECK: llvm.call @print_open() : () -> () -// CHECK: %[[x0:.]] = llvm.extractvalue %[[A]][0] : !llvm<"[2 x <2 x float>]"> -// CHECK: llvm.call @print_open() : () -> () -// CHECK: %[[x1:.]] = llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: %[[x2:.]] = llvm.extractelement %[[x0]][%[[x1]] : !llvm.i64] : !llvm<"<2 x float>"> -// CHECK: llvm.call @print_f32(%[[x2]]) : (!llvm.float) -> () -// CHECK: llvm.call @print_comma() : () -> () -// CHECK: %[[x3:.]] = llvm.mlir.constant(1 : index) : !llvm.i64 -// CHECK: %[[x4:.]] = llvm.extractelement %[[x0]][%[[x3]] : !llvm.i64] : !llvm<"<2 x float>"> -// CHECK: llvm.call @print_f32(%[[x4]]) : (!llvm.float) -> () -// CHECK: llvm.call @print_close() : () -> () -// CHECK: llvm.call @print_comma() : () -> () -// CHECK: %[[x5:.]] = llvm.extractvalue %[[A]][1] : !llvm<"[2 x <2 x float>]"> -// CHECK: llvm.call @print_open() : () -> () -// CHECK: %[[x6:.]] = llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: %[[x7:.]] = llvm.extractelement %[[x5]][%[[x6]] : !llvm.i64] : !llvm<"<2 x float>"> -// CHECK: llvm.call @print_f32(%[[x7]]) : (!llvm.float) -> () -// CHECK: llvm.call @print_comma() : () -> () -// CHECK: %[[x8:.]] = llvm.mlir.constant(1 : index) : !llvm.i64 -// CHECK: %[[x9:.]] = llvm.extractelement %[[x5]][%[[x8]] : !llvm.i64] : !llvm<"<2 x float>"> -// CHECK: llvm.call @print_f32(%[[x9]]) : (!llvm.float) -> () -// CHECK: llvm.call @print_close() : () -> () -// CHECK: llvm.call @print_close() : () -> () -// CHECK: llvm.call @print_newline() : () -> () - -func @strided_slice1(%arg0: vector<4xf32>) -> vector<2xf32> { - %0 = vector.strided_slice %arg0 {offsets = [2], sizes = [2], strides = [1]} : vector<4xf32> to vector<2xf32> - return %0 : vector<2xf32> -} -// CHECK-LABEL: llvm.func @strided_slice1 -// CHECK: llvm.mlir.constant(0.000000e+00 : f32) : !llvm.float -// CHECK: llvm.mlir.constant(dense<0.000000e+00> : vector<2xf32>) : !llvm<"<2 x float>"> -// CHECK: llvm.mlir.constant(2 : index) : !llvm.i64 -// CHECK: llvm.extractelement %{{.}}[%{{.}} : !llvm.i64] : !llvm<"<4 x float>"> -// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: llvm.insertelement %{{.}}, %{{.}}[%{{.}} : !llvm.i64] : !llvm<"<2 x float>"> -// CHECK: llvm.mlir.constant(3 : index) : !llvm.i64 -// CHECK: llvm.extractelement %{{.}}[%{{.}} : !llvm.i64] : !llvm<"<4 x float>"> -// CHECK: llvm.mlir.constant(1 : index) : !llvm.i64 -// CHECK: llvm.insertelement %{{.}}, %{{.}}[%{{.}} : !llvm.i64] : !llvm<"<2 x float>"> - -func @strided_slice2(%arg0: vector<4x8xf32>) -> vector<2x8xf32> { - %0 = vector.strided_slice %arg0 {offsets = [2], sizes = [2], strides = [1]} : vector<4x8xf32> to vector<2x8xf32> - return %0 : vector<2x8xf32> -} -// CHECK-LABEL: llvm.func @strided_slice2 -// CHECK: llvm.mlir.constant(0.000000e+00 : f32) : !llvm.float -// CHECK: llvm.mlir.constant(dense<0.000000e+00> : vector<2x8xf32>) : !llvm<"[2 x <8 x float>]"> -// CHECK: llvm.extractvalue %{{.}}[2] : !llvm<"[4 x <8 x float>]"> -// CHECK: llvm.insertvalue %{{.}}, %{{.}}[0] : !llvm<"[2 x <8 x float>]"> -// CHECK: llvm.extractvalue %{{.}}[3] : !llvm<"[4 x <8 x float>]"> -// CHECK: llvm.insertvalue %{{.}}, %{{.}}[1] : !llvm<"[2 x <8 x float>]"> - -func @strided_slice3(%arg0: vector<4x8xf32>) -> vector<2x2xf32> { - %0 = vector.strided_slice %arg0 {offsets = [2, 2], sizes = [2, 2], strides = [1, 1]} : vector<4x8xf32> to vector<2x2xf32> - return %0 : vector<2x2xf32> -} -// CHECK-LABEL: llvm.func @strided_slice3 -// CHECK: llvm.mlir.constant(0.000000e+00 : f32) : !llvm.float -// CHECK: llvm.mlir.constant(dense<0.000000e+00> : vector<2x2xf32>) : !llvm<"[2 x <2 x float>]"> -// -// Subvector vector<8xf32> @2 -// CHECK: llvm.extractvalue {{.}}[2] : !llvm<"[4 x <8 x float>]"> -// CHECK: llvm.mlir.constant(0.000000e+00 : f32) : !llvm.float -// CHECK: llvm.mlir.constant(dense<0.000000e+00> : vector<2xf32>) : !llvm<"<2 x float>"> -// CHECK: llvm.mlir.constant(2 : index) : !llvm.i64 -// CHECK: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<8 x float>"> -// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: llvm.insertelement {{.}}, {{.}}[{{.}} : !llvm.i64] : !llvm<"<2 x float>"> -// CHECK: llvm.mlir.constant(3 : index) : !llvm.i64 -// CHECK: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<8 x float>"> -// CHECK: llvm.mlir.constant(1 : index) : !llvm.i64 -// CHECK: llvm.insertelement {{.}}, {{.}}[{{.}} : !llvm.i64] : !llvm<"<2 x float>"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[2 x <2 x float>]"> -// -// Subvector vector<8xf32> @3 -// CHECK: llvm.extractvalue {{.}}[3] : !llvm<"[4 x <8 x float>]"> -// CHECK: llvm.mlir.constant(0.000000e+00 : f32) : !llvm.float -// CHECK: llvm.mlir.constant(dense<0.000000e+00> : vector<2xf32>) : !llvm<"<2 x float>"> -// CHECK: llvm.mlir.constant(2 : index) : !llvm.i64 -// CHECK: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<8 x float>"> -// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: llvm.insertelement {{.}}, {{.}}[{{.}} : !llvm.i64] : !llvm<"<2 x float>"> -// CHECK: llvm.mlir.constant(3 : index) : !llvm.i64 -// CHECK: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<8 x float>"> -// CHECK: llvm.mlir.constant(1 : index) : !llvm.i64 -// CHECK: llvm.insertelement {{.}}, {{.}}[{{.}} : !llvm.i64] : !llvm<"<2 x float>"> -// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[2 x <2 x float>]"> - -func @insert_strided_slice1(%b: vector<4x4xf32>, %c: vector<4x4x4xf32>) -> vector<4x4x4xf32> { - %0 = vector.insert_strided_slice %b, %c {offsets = [2, 0, 0], strides = [1, 1]} : vector<4x4xf32> into vector<4x4x4xf32> - return %0 : vector<4x4x4xf32> -} -// CHECK-LABEL: llvm.func @insert_strided_slice1 -// CHECK: llvm.extractvalue {{.}}[2] : !llvm<"[4 x [4 x <4 x float>]]"> -// CHECK-NEXT: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[4 x [4 x <4 x float>]]"> - -func @insert_strided_slice2(%a: vector<2x2xf32>, %b: vector<4x4xf32>) -> vector<4x4xf32> { - %0 = vector.insert_strided_slice %a, %b {offsets = [2, 2], strides = [1, 1]} : vector<2x2xf32> into vector<4x4xf32> - return %0 : vector<4x4xf32> -} -// CHECK-LABEL: llvm.func @insert_strided_slice2 -// -// Subvector vector<2xf32> @0 into vector<4xf32> @2 -// CHECK: llvm.extractvalue {{.}}[0] : !llvm<"[2 x <2 x float>]"> -// CHECK-NEXT: llvm.extractvalue {{.}}[2] : !llvm<"[4 x <4 x float>]"> -// Element @0 -> element @2 -// CHECK-NEXT: llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK-NEXT: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<2 x float>"> -// CHECK-NEXT: llvm.mlir.constant(2 : index) : !llvm.i64 -// CHECK-NEXT: llvm.insertelement {{.}}, {{.}}[{{.}} : !llvm.i64] : !llvm<"<4 x float>"> -// Element @1 -> element @3 -// CHECK-NEXT: llvm.mlir.constant(1 : index) : !llvm.i64 -// CHECK-NEXT: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<2 x float>"> -// CHECK-NEXT: llvm.mlir.constant(3 : index) : !llvm.i64 -// CHECK-NEXT: llvm.insertelement {{.}}, {{.}}[{{.}} : !llvm.i64] : !llvm<"<4 x float>"> -// CHECK-NEXT: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[4 x <4 x float>]"> -// -// Subvector vector<2xf32> @1 into vector<4xf32> @3 -// CHECK: llvm.extractvalue {{.}}[1] : !llvm<"[2 x <2 x float>]"> -// CHECK-NEXT: llvm.extractvalue {{.}}[3] : !llvm<"[4 x <4 x float>]"> -// Element @0 -> element @2 -// CHECK-NEXT: llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK-NEXT: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<2 x float>"> -// CHECK-NEXT: llvm.mlir.constant(2 : index) : !llvm.i64 -// CHECK-NEXT: llvm.insertelement {{.}}, {{.}}[{{.}} : !llvm.i64] : !llvm<"<4 x float>"> -// Element @1 -> element @3 -// CHECK-NEXT: llvm.mlir.constant(1 : index) : !llvm.i64 -// CHECK-NEXT: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<2 x float>"> -// CHECK-NEXT: llvm.mlir.constant(3 : index) : !llvm.i64 -// CHECK-NEXT: llvm.insertelement {{.}}, {{.}}[{{.}} : !llvm.i64] : !llvm<"<4 x float>"> -// CHECK-NEXT: llvm.insertvalue {{.}}, {{.}}[3] : !llvm<"[4 x <4 x float>]"> - -func @insert_strided_slice3(%arg0: vector<2x4xf32>, %arg1: vector<16x4x8xf32>) -> vector<16x4x8xf32> { - %0 = vector.insert_strided_slice %arg0, %arg1 {offsets = [0, 0, 2], strides = [1, 1]}: - vector<2x4xf32> into vector<16x4x8xf32> - return %0 : vector<16x4x8xf32> -} -// CHECK-LABEL: llvm.func @insert_strided_slice3 -// CHECK-SAME: %[[A:arg[0-9]+]]: !llvm<"[2 x <4 x float>]"> -// CHECK-SAME: %[[B:arg[0-9]+]]: !llvm<"[16 x [4 x <8 x float>]]"> -// CHECK: %[[s0:.]] = llvm.extractvalue %[[B]][0] : !llvm<"[16 x [4 x <8 x float>]]"> -// CHECK: %[[s1:.]] = llvm.extractvalue %[[A]][0] : !llvm<"[2 x <4 x float>]"> -// CHECK: %[[s2:.]] = llvm.extractvalue %[[s0]][0] : !llvm<"[4 x <8 x float>]"> -// CHECK: %[[s3:.]] = llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: %[[s4:.]] = llvm.extractelement %[[s1]][%[[s3]] : !llvm.i64] : !llvm<"<4 x float>"> -// CHECK: %[[s5:.]] = llvm.mlir.constant(2 : index) : !llvm.i64 -// CHECK: %[[s6:.]] = llvm.insertelement %[[s4]], %[[s2]][%[[s5]] : !llvm.i64] : !llvm<"<8 x float>"> -// CHECK: %[[s7:.]] = llvm.mlir.constant(1 : index) : !llvm.i64 -// CHECK: %[[s8:.]] = llvm.extractelement %[[s1]][%[[s7]] : !llvm.i64] : !llvm<"<4 x float>"> -// CHECK: %[[s9:.]] = llvm.mlir.constant(3 : index) : !llvm.i64 -// CHECK: %[[s10:.]] = llvm.insertelement %[[s8]], %[[s6]][%[[s9]] : !llvm.i64] : !llvm<"<8 x float>"> -// CHECK: %[[s11:.]] = llvm.mlir.constant(2 : index) : !llvm.i64 -// CHECK: %[[s12:.]] = llvm.extractelement %[[s1]][%[[s11]] : !llvm.i64] : !llvm<"<4 x float>"> -// CHECK: %[[s13:.]] = llvm.mlir.constant(4 : index) : !llvm.i64 -// CHECK: %[[s14:.]] = llvm.insertelement %[[s12]], %[[s10]][%[[s13]] : !llvm.i64] : !llvm<"<8 x float>"> -// CHECK: %[[s15:.]] = llvm.mlir.constant(3 : index) : !llvm.i64 -// CHECK: %[[s16:.]] = llvm.extractelement %[[s1]][%[[s15]] : !llvm.i64] : !llvm<"<4 x float>"> -// CHECK: %[[s17:.]] = llvm.mlir.constant(5 : index) : !llvm.i64 -// CHECK: %[[s18:.]] = llvm.insertelement %[[s16]], %[[s14]][%[[s17]] : !llvm.i64] : !llvm<"<8 x float>"> -// CHECK: %[[s19:.]] = llvm.insertvalue %[[s18]], %[[s0]][0] : !llvm<"[4 x <8 x float>]"> -// CHECK: %[[s20:.]] = llvm.extractvalue %[[A]][1] : !llvm<"[2 x <4 x float>]"> -// CHECK: %[[s21:.]] = llvm.extractvalue %[[s0]][1] : !llvm<"[4 x <8 x float>]"> -// CHECK: %[[s22:.]] = llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: %[[s23:.]] = llvm.extractelement %[[s20]][%[[s22]] : !llvm.i64] : !llvm<"<4 x float>"> -// CHECK: %[[s24:.]] = llvm.mlir.constant(2 : index) : !llvm.i64 -// CHECK: %[[s25:.]] = llvm.insertelement %[[s23]], %[[s21]][%[[s24]] : !llvm.i64] : !llvm<"<8 x float>"> -// CHECK: %[[s26:.]] = llvm.mlir.constant(1 : index) : !llvm.i64 -// CHECK: %[[s27:.]] = llvm.extractelement %[[s20]][%[[s26]] : !llvm.i64] : !llvm<"<4 x float>"> -// CHECK: %[[s28:.]] = llvm.mlir.constant(3 : index) : !llvm.i64 -// CHECK: %[[s29:.]] = llvm.insertelement %[[s27]], %[[s25]][%[[s28]] : !llvm.i64] : !llvm<"<8 x float>"> -// CHECK: %[[s30:.]] = llvm.mlir.constant(2 : index) : !llvm.i64 -// CHECK: %[[s31:.]] = llvm.extractelement %[[s20]][%[[s30]] : !llvm.i64] : !llvm<"<4 x float>"> -// CHECK: %[[s32:.]] = llvm.mlir.constant(4 : index) : !llvm.i64 -// CHECK: %[[s33:.]] = llvm.insertelement %[[s31]], %[[s29]][%[[s32]] : !llvm.i64] : !llvm<"<8 x float>"> -// CHECK: %[[s34:.]] = llvm.mlir.constant(3 : index) : !llvm.i64 -// CHECK: %[[s35:.]] = llvm.extractelement %[[s20]][%[[s34]] : !llvm.i64] : !llvm<"<4 x float>"> -// CHECK: %[[s36:.]] = llvm.mlir.constant(5 : index) : !llvm.i64 -// CHECK: %[[s37:.]] = llvm.insertelement %[[s35]], %[[s33]][%[[s36]] : !llvm.i64] : !llvm<"<8 x float>"> -// CHECK: %[[s38:.]] = llvm.insertvalue %[[s37]], %[[s19]][1] : !llvm<"[4 x <8 x float>]"> -// CHECK: %[[s39:.]] = llvm.insertvalue %[[s38]], %[[B]][0] : !llvm<"[16 x [4 x <8 x float>]]"> -// CHECK: llvm.return %[[s39]] : !llvm<"[16 x [4 x <8 x float>]]"> - -func @extract_strides(%arg0: vector<3x3xf32>) -> vector<1x1xf32> { - %0 = vector.extract_slices %arg0, [2, 2], [1, 1] - : vector<3x3xf32> into tuple<vector<2x2xf32>, vector<2x1xf32>, vector<1x2xf32>, vector<1x1xf32>> - %1 = vector.tuple_get %0, 3 : tuple<vector<2x2xf32>, vector<2x1xf32>, vector<1x2xf32>, vector<1x1xf32>> - return %1 : vector<1x1xf32> -} -// CHECK-LABEL: llvm.func @extract_strides -// CHECK-SAME: %[[A:arg[0-9]+]]: !llvm<"[3 x <3 x float>]"> -// CHECK: %[[s0:.]] = llvm.mlir.constant(dense<0.000000e+00> : vector<1x1xf32>) : !llvm<"[1 x <1 x float>]"> -// CHECK: %[[s1:.]] = llvm.extractvalue %[[A]][2] : !llvm<"[3 x <3 x float>]"> -// CHECK: %[[s3:.]] = llvm.mlir.constant(dense<0.000000e+00> : vector<1xf32>) : !llvm<"<1 x float>"> -// CHECK: %[[s4:.]] = llvm.mlir.constant(2 : index) : !llvm.i64 -// CHECK: %[[s5:.]] = llvm.extractelement %[[s1]][%[[s4]] : !llvm.i64] : !llvm<"<3 x float>"> -// CHECK: %[[s6:.]] = llvm.mlir.constant(0 : index) : !llvm.i64 -// CHECK: %[[s7:.]] = llvm.insertelement %[[s5]], %[[s3]][%[[s6]] : !llvm.i64] : !llvm<"<1 x float>"> -// CHECK: %[[s8:.]] = llvm.insertvalue %[[s7]], %[[s0]][0] : !llvm<"[1 x <1 x float>]"> -// CHECK: llvm.return %[[s8]] : !llvm<"[1 x <1 x float>]"> Lint: Pre-merge checks:* clang-format: please reformat the code ``` -func @broadcast_vec2d_from_scalar(%arg0: f32) ->…
				%1 = vector.fma %b, %b, %b : vector<2x4xf32>
				return %0, %1: vector<8xf32>, vector<2x4xf32>
	}			}
	// CHECK-LABEL: llvm.func @broadcast_vec1d_from_scalar
	// CHECK: llvm.mlir.undef : !llvm<"<2 x float>">
	// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: llvm.insertelement {{.}}, {{.}}[{{.*}} : !llvm.i64] : !llvm<"<2 x float>">
	// CHECK: llvm.shufflevector {{.}}, {{.}}[0 : i32, 0 : i32] : !llvm<"<2 x float>">, !llvm<"<2 x float>">
	// CHECK: llvm.return {{.*}} : !llvm<"<2 x float>">

				aartbikUnsubmitted Done Reply Inline Actions perhaps use the %[[s0:.]] = .... to capture the values and make sure they are used where expected? aartbik:* perhaps use the %[[s0:.*]] = .... to capture the values and make sure they are used where…
				aartbikUnsubmitted Done Reply Inline Actions note that something like // CHECK-SAME: %[[A:arg[0-9]+]]: can be used if you want to match the argument inputs as well, see e.g. insert_strided_slice3 (probably need to rename a/b into arg0/arg1 to be sure, although I think that renaming happens anyway) aartbik: note that something like // CHECK-SAME: %[[A:arg[0-9]+]]: can be used if you want to match…
				dcaballeUnsubmitted Done Reply Inline Actions +1 dcaballe: +1
				nicolasvasilacheAuthorUnsubmitted Done Reply Inline Actions I do not see this as necessary, there is a 1-1 mapping that is already captured by the type. nicolasvasilache: I do not see this as necessary, there is a 1-1 mapping that is already captured by the type.
				aartbikUnsubmitted Done Reply Inline Actions It was of course just a suggestion :-) Regardless, I find %[[arg0]] easier to parse by eye than {{.}} and it is the direction we are generally taking with new tests. But I won't insist. aartbik:* It was of course just a suggestion :-) Regardless, I find %[[arg0]] easier to parse by eye…
				nicolasvasilacheAuthorUnsubmitted Done Reply Inline Actions ok, I am sensitive to general simplicity, maybe erring on the side of terseness is counter-productive, I'll just update it :) nicolasvasilache: ok, I am sensitive to general simplicity, maybe erring on the side of terseness is counter…
	func @broadcast_vec2d_from_scalar(%arg0: f32) -> vector<2x3xf32> {
	%0 = vector.broadcast %arg0 : f32 to vector<2x3xf32>
	return %0 : vector<2x3xf32>
	}
	// CHECK-LABEL: llvm.func @broadcast_vec2d_from_scalar
	// CHECK: llvm.mlir.undef : !llvm<"<3 x float>">
	// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: llvm.insertelement {{.}}, {{.}}[{{.*}} : !llvm.i64] : !llvm<"<3 x float>">
	// CHECK: llvm.shufflevector {{.}}, {{.}}[0 : i32, 0 : i32, 0 : i32] : !llvm<"<3 x float>">, !llvm<"<3 x float>">
	// CHECK: llvm.mlir.undef : !llvm<"[2 x <3 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[2 x <3 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[2 x <3 x float>]">
	// CHECK: llvm.return {{.*}} : !llvm<"[2 x <3 x float>]">

	func @broadcast_vec3d_from_scalar(%arg0: f32) -> vector<2x3x4xf32> {
	%0 = vector.broadcast %arg0 : f32 to vector<2x3x4xf32>
	return %0 : vector<2x3x4xf32>
	}
	// CHECK-LABEL: llvm.func @broadcast_vec3d_from_scalar
	// CHECK: llvm.mlir.undef : !llvm<"<4 x float>">
	// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: llvm.insertelement {{.}}, {{.}}[{{.*}} : !llvm.i64] : !llvm<"<4 x float>">
	// CHECK: llvm.shufflevector {{.}}, {{.}} [0 : i32, 0 : i32, 0 : i32, 0 : i32] : !llvm<"<4 x float>">, !llvm<"<4 x float>">
	// CHECK: llvm.mlir.undef : !llvm<"[3 x <4 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[3 x <4 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[3 x <4 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[3 x <4 x float>]">
	// CHECK: llvm.mlir.undef : !llvm<"[2 x [3 x <4 x float>]]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[2 x [3 x <4 x float>]]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[2 x [3 x <4 x float>]]">
	// CHECK: llvm.return {{.*}} : !llvm<"[2 x [3 x <4 x float>]]">

	func @broadcast_vec1d_from_vec1d(%arg0: vector<2xf32>) -> vector<2xf32> {
	%0 = vector.broadcast %arg0 : vector<2xf32> to vector<2xf32>
	return %0 : vector<2xf32>
	}
	// CHECK-LABEL: llvm.func @broadcast_vec1d_from_vec1d
	// CHECK: llvm.return {{.*}} : !llvm<"<2 x float>">

	func @broadcast_vec2d_from_vec1d(%arg0: vector<2xf32>) -> vector<3x2xf32> {
	%0 = vector.broadcast %arg0 : vector<2xf32> to vector<3x2xf32>
	return %0 : vector<3x2xf32>
	}
	// CHECK-LABEL: llvm.func @broadcast_vec2d_from_vec1d
	// CHECK: llvm.mlir.undef : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.return {{.*}} : !llvm<"[3 x <2 x float>]">

	func @broadcast_vec3d_from_vec1d(%arg0: vector<2xf32>) -> vector<4x3x2xf32> {
	%0 = vector.broadcast %arg0 : vector<2xf32> to vector<4x3x2xf32>
	return %0 : vector<4x3x2xf32>
	}
	// CHECK-LABEL: llvm.func @broadcast_vec3d_from_vec1d
	// CHECK: llvm.mlir.undef : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.mlir.undef : !llvm<"[4 x [3 x <2 x float>]]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[4 x [3 x <2 x float>]]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[4 x [3 x <2 x float>]]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[4 x [3 x <2 x float>]]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[3] : !llvm<"[4 x [3 x <2 x float>]]">
	// CHECK: llvm.return {{.*}} : !llvm<"[4 x [3 x <2 x float>]]">

	func @broadcast_vec3d_from_vec2d(%arg0: vector<3x2xf32>) -> vector<4x3x2xf32> {
	%0 = vector.broadcast %arg0 : vector<3x2xf32> to vector<4x3x2xf32>
	return %0 : vector<4x3x2xf32>
	}
	// CHECK-LABEL: llvm.func @broadcast_vec3d_from_vec2d
	// CHECK: llvm.mlir.undef : !llvm<"[4 x [3 x <2 x float>]]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[4 x [3 x <2 x float>]]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[4 x [3 x <2 x float>]]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[4 x [3 x <2 x float>]]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[3] : !llvm<"[4 x [3 x <2 x float>]]">
	// CHECK: llvm.return {{.*}} : !llvm<"[4 x [3 x <2 x float>]]">

	func @broadcast_stretch(%arg0: vector<1xf32>) -> vector<4xf32> {
	%0 = vector.broadcast %arg0 : vector<1xf32> to vector<4xf32>
	return %0 : vector<4xf32>
	}
	// CHECK-LABEL: llvm.func @broadcast_stretch
	// CHECK: llvm.mlir.undef : !llvm<"<4 x float>">
	// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<1 x float>">
	// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: llvm.insertelement {{.}}, {{.}}[{{.*}} : !llvm.i64] : !llvm<"<4 x float>">
	// CHECK: llvm.shufflevector {{.}}, {{.}} [0 : i32, 0 : i32, 0 : i32, 0 : i32] : !llvm<"<4 x float>">, !llvm<"<4 x float>">
	// CHECK: llvm.return {{.*}} : !llvm<"<4 x float>">

	func @broadcast_stretch_at_start(%arg0: vector<1x4xf32>) -> vector<3x4xf32> {
	%0 = vector.broadcast %arg0 : vector<1x4xf32> to vector<3x4xf32>
	return %0 : vector<3x4xf32>
	}
	// CHECK-LABEL: llvm.func @broadcast_stretch_at_start
	// CHECK: llvm.mlir.undef : !llvm<"[3 x <4 x float>]">
	// CHECK: llvm.extractvalue {{.*}}[0] : !llvm<"[1 x <4 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[3 x <4 x float>]">
	// CHECK: llvm.extractvalue {{.*}}[0] : !llvm<"[1 x <4 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[3 x <4 x float>]">
	// CHECK: llvm.extractvalue {{.*}}[0] : !llvm<"[1 x <4 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[3 x <4 x float>]">
	// CHECK: llvm.return {{.*}} : !llvm<"[3 x <4 x float>]">

	func @broadcast_stretch_at_end(%arg0: vector<4x1xf32>) -> vector<4x3xf32> {
	%0 = vector.broadcast %arg0 : vector<4x1xf32> to vector<4x3xf32>
	return %0 : vector<4x3xf32>
	}
	// CHECK-LABEL: llvm.func @broadcast_stretch_at_end
	// CHECK: llvm.mlir.undef : !llvm<"[4 x <3 x float>]">
	// CHECK: llvm.extractvalue {{.*}}[0] : !llvm<"[4 x <1 x float>]">
	// CHECK: llvm.mlir.undef : !llvm<"<3 x float>">
	// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<1 x float>">
	// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: llvm.insertelement {{.}}, {{.}}[{{.*}} : !llvm.i64] : !llvm<"<3 x float>">
	// CHECK: llvm.shufflevector {{.}}, {{.}} [0 : i32, 0 : i32, 0 : i32] : !llvm<"<3 x float>">, !llvm<"<3 x float>">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[4 x <3 x float>]">
	// CHECK: llvm.extractvalue {{.*}}[1] : !llvm<"[4 x <1 x float>]">
	// CHECK: llvm.mlir.undef : !llvm<"<3 x float>">
	// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<1 x float>">
	// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: llvm.insertelement {{.}}, {{.}}[{{.*}} : !llvm.i64] : !llvm<"<3 x float>">
	// CHECK: llvm.shufflevector {{.}}, {{.}} [0 : i32, 0 : i32, 0 : i32] : !llvm<"<3 x float>">, !llvm<"<3 x float>">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[4 x <3 x float>]">
	// CHECK: llvm.extractvalue {{.*}}[2] : !llvm<"[4 x <1 x float>]">
	// CHECK: llvm.mlir.undef : !llvm<"<3 x float>">
	// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<1 x float>">
	// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: llvm.insertelement {{.}}, {{.}}[{{.*}} : !llvm.i64] : !llvm<"<3 x float>">
	// CHECK: llvm.shufflevector {{.}}, {{.}} [0 : i32, 0 : i32, 0 : i32] : !llvm<"<3 x float>">, !llvm<"<3 x float>">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[4 x <3 x float>]">
	// CHECK: llvm.extractvalue {{.*}}[3] : !llvm<"[4 x <1 x float>]">
	// CHECK: llvm.mlir.undef : !llvm<"<3 x float>">
	// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<1 x float>">
	// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: llvm.insertelement {{.}}, {{.}}[{{.*}} : !llvm.i64] : !llvm<"<3 x float>">
	// CHECK: llvm.shufflevector {{.}}, {{.}} [0 : i32, 0 : i32, 0 : i32] : !llvm<"<3 x float>">, !llvm<"<3 x float>">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[3] : !llvm<"[4 x <3 x float>]">
	// CHECK: llvm.return {{.*}} : !llvm<"[4 x <3 x float>]">

	func @broadcast_stretch_in_middle(%arg0: vector<4x1x2xf32>) -> vector<4x3x2xf32> {
	%0 = vector.broadcast %arg0 : vector<4x1x2xf32> to vector<4x3x2xf32>
	return %0 : vector<4x3x2xf32>
	}
	// CHECK-LABEL: llvm.func @broadcast_stretch_in_middle
	// CHECK: llvm.mlir.undef : !llvm<"[4 x [3 x <2 x float>]]">
	// CHECK: llvm.extractvalue {{.*}}[0] : !llvm<"[4 x [1 x <2 x float>]]">
	// CHECK: llvm.mlir.undef : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.extractvalue {{.*}}[0] : !llvm<"[1 x <2 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.extractvalue {{.*}}[0] : !llvm<"[1 x <2 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.extractvalue {{.*}}[0] : !llvm<"[1 x <2 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[4 x [3 x <2 x float>]]">
	// CHECK: llvm.extractvalue {{.*}}[1] : !llvm<"[4 x [1 x <2 x float>]]">
	// CHECK: llvm.mlir.undef : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.extractvalue {{.*}}[0] : !llvm<"[1 x <2 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.extractvalue {{.*}}[0] : !llvm<"[1 x <2 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.extractvalue {{.*}}[0] : !llvm<"[1 x <2 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[4 x [3 x <2 x float>]]">
	// CHECK: llvm.extractvalue {{.*}}[2] : !llvm<"[4 x [1 x <2 x float>]]">
	// CHECK: llvm.mlir.undef : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.extractvalue {{.*}}[0] : !llvm<"[1 x <2 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.extractvalue {{.*}}[0] : !llvm<"[1 x <2 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.extractvalue {{.*}}[0] : !llvm<"[1 x <2 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[4 x [3 x <2 x float>]]">
	// CHECK: llvm.extractvalue {{.*}}[3] : !llvm<"[4 x [1 x <2 x float>]]">
	// CHECK: llvm.mlir.undef : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.extractvalue {{.*}}[0] : !llvm<"[1 x <2 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.extractvalue {{.*}}[0] : !llvm<"[1 x <2 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.extractvalue {{.*}}[0] : !llvm<"[1 x <2 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[3 x <2 x float>]">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[3] : !llvm<"[4 x [3 x <2 x float>]]">
	// CHECK: llvm.return {{.*}} : !llvm<"[4 x [3 x <2 x float>]]">

	func @outerproduct(%arg0: vector<2xf32>, %arg1: vector<3xf32>) -> vector<2x3xf32> {
	%2 = vector.outerproduct %arg0, %arg1 : vector<2xf32>, vector<3xf32>
	return %2 : vector<2x3xf32>
	}
	// CHECK-LABEL: llvm.func @outerproduct
	// CHECK: llvm.mlir.undef : !llvm<"[2 x <3 x float>]">
	// CHECK: llvm.shufflevector {{.*}} [0 : i32, 0 : i32, 0 : i32] : !llvm<"<2 x float>">, !llvm<"<2 x float>">
	// CHECK: llvm.fmul {{.}}, {{.}} : !llvm<"<3 x float>">
	// CHECK: llvm.insertvalue {{.*}}[0] : !llvm<"[2 x <3 x float>]">
	// CHECK: llvm.shufflevector {{.*}} [1 : i32, 1 : i32, 1 : i32] : !llvm<"<2 x float>">, !llvm<"<2 x float>">
	// CHECK: llvm.fmul {{.}}, {{.}} : !llvm<"<3 x float>">
	// CHECK: llvm.insertvalue {{.*}}[1] : !llvm<"[2 x <3 x float>]">
	// CHECK: llvm.return {{.*}} : !llvm<"[2 x <3 x float>]">

	func @outerproduct_add(%arg0: vector<2xf32>, %arg1: vector<3xf32>, %arg2: vector<2x3xf32>) -> vector<2x3xf32> {
	%2 = vector.outerproduct %arg0, %arg1, %arg2 : vector<2xf32>, vector<3xf32>
	return %2 : vector<2x3xf32>
	}
	// CHECK-LABEL: llvm.func @outerproduct_add
	// CHECK: llvm.mlir.undef : !llvm<"[2 x <3 x float>]">
	// CHECK: llvm.shufflevector {{.*}} [0 : i32, 0 : i32, 0 : i32] : !llvm<"<2 x float>">, !llvm<"<2 x float>">
	// CHECK: llvm.extractvalue {{.*}}[0] : !llvm<"[2 x <3 x float>]">
	// CHECK: "llvm.intr.fmuladd"({{.*}}) : (!llvm<"<3 x float>">, !llvm<"<3 x float>">, !llvm<"<3 x float>">) -> !llvm<"<3 x float>">
	// CHECK: llvm.insertvalue {{.*}}[0] : !llvm<"[2 x <3 x float>]">
	// CHECK: llvm.shufflevector {{.*}} [1 : i32, 1 : i32, 1 : i32] : !llvm<"<2 x float>">, !llvm<"<2 x float>">
	// CHECK: llvm.extractvalue {{.*}}[1] : !llvm<"[2 x <3 x float>]">
	// CHECK: "llvm.intr.fmuladd"({{.*}}) : (!llvm<"<3 x float>">, !llvm<"<3 x float>">, !llvm<"<3 x float>">) -> !llvm<"<3 x float>">
	// CHECK: llvm.insertvalue {{.*}}[1] : !llvm<"[2 x <3 x float>]">
	// CHECK: llvm.return {{.*}} : !llvm<"[2 x <3 x float>]">

	func @shuffle_1D_direct(%arg0: vector<2xf32>, %arg1: vector<2xf32>) -> vector<2xf32> {
	%1 = vector.shuffle %arg0, %arg1 [0, 1] : vector<2xf32>, vector<2xf32>
	return %1 : vector<2xf32>
	}
	// CHECK-LABEL: llvm.func @shuffle_1D_direct
	// CHECK-SAME: %[[A:arg[0-9]+]]: !llvm<"<2 x float>">
	// CHECK-SAME: %[[B:arg[0-9]+]]: !llvm<"<2 x float>">
	// CHECK: %[[s:.*]] = llvm.shufflevector %[[A]], %[[B]] [0, 1] : !llvm<"<2 x float>">, !llvm<"<2 x float>">
	// CHECK: llvm.return %[[s]] : !llvm<"<2 x float>">

	func @shuffle_1D(%arg0: vector<2xf32>, %arg1: vector<3xf32>) -> vector<5xf32> {
	%1 = vector.shuffle %arg0, %arg1 [4, 3, 2, 1, 0] : vector<2xf32>, vector<3xf32>
	return %1 : vector<5xf32>
	}
	// CHECK-LABEL: llvm.func @shuffle_1D
	// CHECK-SAME: %[[A:arg[0-9]+]]: !llvm<"<2 x float>">
	// CHECK-SAME: %[[B:arg[0-9]+]]: !llvm<"<3 x float>">
	// CHECK: %[[u0:.*]] = llvm.mlir.undef : !llvm<"<5 x float>">
	// CHECK: %[[c2:.*]] = llvm.mlir.constant(2 : index) : !llvm.i64
	// CHECK: %[[e1:.*]] = llvm.extractelement %[[B]][%[[c2]] : !llvm.i64] : !llvm<"<3 x float>">
	// CHECK: %[[c0:.*]] = llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: %[[i1:.*]] = llvm.insertelement %[[e1]], %[[u0]][%[[c0]] : !llvm.i64] : !llvm<"<5 x float>">
	// CHECK: %[[c1:.*]] = llvm.mlir.constant(1 : index) : !llvm.i64
	// CHECK: %[[e2:.*]] = llvm.extractelement %[[B]][%[[c1]] : !llvm.i64] : !llvm<"<3 x float>">
	// CHECK: %[[c1:.*]] = llvm.mlir.constant(1 : index) : !llvm.i64
	// CHECK: %[[i2:.*]] = llvm.insertelement %[[e2]], %[[i1]][%[[c1]] : !llvm.i64] : !llvm<"<5 x float>">
	// CHECK: %[[c0:.*]] = llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: %[[e3:.*]] = llvm.extractelement %[[B]][%[[c0]] : !llvm.i64] : !llvm<"<3 x float>">
	// CHECK: %[[c2:.*]] = llvm.mlir.constant(2 : index) : !llvm.i64
	// CHECK: %[[i3:.*]] = llvm.insertelement %[[e3]], %[[i2]][%[[c2]] : !llvm.i64] : !llvm<"<5 x float>">
	// CHECK: %[[c1:.*]] = llvm.mlir.constant(1 : index) : !llvm.i64
	// CHECK: %[[e4:.*]] = llvm.extractelement %[[A]][%[[c1]] : !llvm.i64] : !llvm<"<2 x float>">
	// CHECK: %[[c3:.*]] = llvm.mlir.constant(3 : index) : !llvm.i64
	// CHECK: %[[i4:.*]] = llvm.insertelement %[[e4]], %[[i3]][%[[c3]] : !llvm.i64] : !llvm<"<5 x float>">
	// CHECK: %[[c0:.*]] = llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: %[[e5:.*]] = llvm.extractelement %[[A]][%[[c0]] : !llvm.i64] : !llvm<"<2 x float>">
	// CHECK: %[[c4:.*]] = llvm.mlir.constant(4 : index) : !llvm.i64
	// CHECK: %[[i5:.*]] = llvm.insertelement %[[e5]], %[[i4]][%[[c4]] : !llvm.i64] : !llvm<"<5 x float>">
	// CHECK: llvm.return %[[i5]] : !llvm<"<5 x float>">

	func @shuffle_2D(%a: vector<1x4xf32>, %b: vector<2x4xf32>) -> vector<3x4xf32> {
	%1 = vector.shuffle %a, %b[1, 0, 2] : vector<1x4xf32>, vector<2x4xf32>
	return %1 : vector<3x4xf32>
	}
	// CHECK-LABEL: llvm.func @shuffle_2D
	// CHECK-SAME: %[[A:arg[0-9]+]]: !llvm<"[1 x <4 x float>]">
	// CHECK-SAME: %[[B:arg[0-9]+]]: !llvm<"[2 x <4 x float>]">
	// CHECK: %[[u0:.*]] = llvm.mlir.undef : !llvm<"[3 x <4 x float>]">
	// CHECK: %[[e1:.*]] = llvm.extractvalue %[[B]][0] : !llvm<"[2 x <4 x float>]">
	// CHECK: %[[i1:.*]] = llvm.insertvalue %[[e1]], %[[u0]][0] : !llvm<"[3 x <4 x float>]">
	// CHECK: %[[e2:.*]] = llvm.extractvalue %[[A]][0] : !llvm<"[1 x <4 x float>]">
	// CHECK: %[[i2:.*]] = llvm.insertvalue %[[e2]], %[[i1]][1] : !llvm<"[3 x <4 x float>]">
	// CHECK: %[[e3:.*]] = llvm.extractvalue %[[B]][1] : !llvm<"[2 x <4 x float>]">
	// CHECK: %[[i3:.*]] = llvm.insertvalue %[[e3]], %[[i2]][2] : !llvm<"[3 x <4 x float>]">
	// CHECK: llvm.return %[[i3]] : !llvm<"[3 x <4 x float>]">

	func @extract_element(%arg0: vector<16xf32>) -> f32 {
	%0 = constant 15 : i32
	%1 = vector.extractelement %arg0[%0 : i32]: vector<16xf32>
	return %1 : f32
	}
	// CHECK-LABEL: llvm.func @extract_element
	// CHECK-SAME: %[[A:arg[0-9]+]]: !llvm<"<16 x float>">
	// CHECK: %[[c:.*]] = llvm.mlir.constant(15 : i32) : !llvm.i32
	// CHECK: %[[x:.*]] = llvm.extractelement %[[A]][%[[c]] : !llvm.i32] : !llvm<"<16 x float>">
	// CHECK: llvm.return %[[x]] : !llvm.float

	func @extract_element_from_vec_1d(%arg0: vector<16xf32>) -> f32 {
	%0 = vector.extract %arg0[15]: vector<16xf32>
	return %0 : f32
	}
	// CHECK-LABEL: llvm.func @extract_element_from_vec_1d
	// CHECK: llvm.mlir.constant(15 : i64) : !llvm.i64
	// CHECK: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<16 x float>">
	// CHECK: llvm.return {{.*}} : !llvm.float

	func @extract_vec_2d_from_vec_3d(%arg0: vector<4x3x16xf32>) -> vector<3x16xf32> {
	%0 = vector.extract %arg0[0]: vector<4x3x16xf32>
	return %0 : vector<3x16xf32>
	}
	// CHECK-LABEL: llvm.func @extract_vec_2d_from_vec_3d
	// CHECK: llvm.extractvalue {{.*}}[0] : !llvm<"[4 x [3 x <16 x float>]]">
	// CHECK: llvm.return {{.*}} : !llvm<"[3 x <16 x float>]">

	func @extract_vec_1d_from_vec_3d(%arg0: vector<4x3x16xf32>) -> vector<16xf32> {
	%0 = vector.extract %arg0[0, 0]: vector<4x3x16xf32>
	return %0 : vector<16xf32>
	}
	// CHECK-LABEL: llvm.func @extract_vec_1d_from_vec_3d
	// CHECK: llvm.extractvalue {{.*}}[0, 0] : !llvm<"[4 x [3 x <16 x float>]]">
	// CHECK: llvm.return {{.*}} : !llvm<"<16 x float>">

	func @extract_element_from_vec_3d(%arg0: vector<4x3x16xf32>) -> f32 {
	%0 = vector.extract %arg0[0, 0, 0]: vector<4x3x16xf32>
	return %0 : f32
	}
	// CHECK-LABEL: llvm.func @extract_element_from_vec_3d
	// CHECK: llvm.extractvalue {{.*}}[0, 0] : !llvm<"[4 x [3 x <16 x float>]]">
	// CHECK: llvm.mlir.constant(0 : i64) : !llvm.i64
	// CHECK: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<16 x float>">
	// CHECK: llvm.return {{.*}} : !llvm.float

	func @insert_element(%arg0: f32, %arg1: vector<4xf32>) -> vector<4xf32> {
	%0 = constant 3 : i32
	%1 = vector.insertelement %arg0, %arg1[%0 : i32] : vector<4xf32>
	return %1 : vector<4xf32>
	}
	// CHECK-LABEL: llvm.func @insert_element
	// CHECK-SAME: %[[A:arg[0-9]+]]: !llvm.float
	// CHECK-SAME: %[[B:arg[0-9]+]]: !llvm<"<4 x float>">
	// CHECK: %[[c:.*]] = llvm.mlir.constant(3 : i32) : !llvm.i32
	// CHECK: %[[x:.*]] = llvm.insertelement %[[A]], %[[B]][%[[c]] : !llvm.i32] : !llvm<"<4 x float>">
	// CHECK: llvm.return %[[x]] : !llvm<"<4 x float>">

	func @insert_element_into_vec_1d(%arg0: f32, %arg1: vector<4xf32>) -> vector<4xf32> {
	%0 = vector.insert %arg0, %arg1[3] : f32 into vector<4xf32>
	return %0 : vector<4xf32>
	}
	// CHECK-LABEL: llvm.func @insert_element_into_vec_1d
	// CHECK: llvm.mlir.constant(3 : i64) : !llvm.i64
	// CHECK: llvm.insertelement {{.}}, {{.}}[{{.*}} : !llvm.i64] : !llvm<"<4 x float>">
	// CHECK: llvm.return {{.*}} : !llvm<"<4 x float>">

	func @insert_vec_2d_into_vec_3d(%arg0: vector<8x16xf32>, %arg1: vector<4x8x16xf32>) -> vector<4x8x16xf32> {
	%0 = vector.insert %arg0, %arg1[3] : vector<8x16xf32> into vector<4x8x16xf32>
	return %0 : vector<4x8x16xf32>
	}
	// CHECK-LABEL: llvm.func @insert_vec_2d_into_vec_3d
	// CHECK: llvm.insertvalue {{.}}, {{.}}[3] : !llvm<"[4 x [8 x <16 x float>]]">
	// CHECK: llvm.return {{.*}} : !llvm<"[4 x [8 x <16 x float>]]">

	func @insert_vec_1d_into_vec_3d(%arg0: vector<16xf32>, %arg1: vector<4x8x16xf32>) -> vector<4x8x16xf32> {
	%0 = vector.insert %arg0, %arg1[3, 7] : vector<16xf32> into vector<4x8x16xf32>
	return %0 : vector<4x8x16xf32>
	}
	// CHECK-LABEL: llvm.func @insert_vec_1d_into_vec_3d
	// CHECK: llvm.insertvalue {{.}}, {{.}}[3, 7] : !llvm<"[4 x [8 x <16 x float>]]">
	// CHECK: llvm.return {{.*}} : !llvm<"[4 x [8 x <16 x float>]]">

	func @insert_element_into_vec_3d(%arg0: f32, %arg1: vector<4x8x16xf32>) -> vector<4x8x16xf32> {
	%0 = vector.insert %arg0, %arg1[3, 7, 15] : f32 into vector<4x8x16xf32>
	return %0 : vector<4x8x16xf32>
	}
	// CHECK-LABEL: llvm.func @insert_element_into_vec_3d
	// CHECK: llvm.extractvalue {{.*}}[3, 7] : !llvm<"[4 x [8 x <16 x float>]]">
	// CHECK: llvm.mlir.constant(15 : i64) : !llvm.i64
	// CHECK: llvm.insertelement {{.}}, {{.}}[{{.*}} : !llvm.i64] : !llvm<"<16 x float>">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[3, 7] : !llvm<"[4 x [8 x <16 x float>]]">
	// CHECK: llvm.return {{.*}} : !llvm<"[4 x [8 x <16 x float>]]">

	func @vector_type_cast(%arg0: memref<8x8x8xf32>) -> memref<vector<8x8x8xf32>> {
	%0 = vector.type_cast %arg0: memref<8x8x8xf32> to memref<vector<8x8x8xf32>>
	return %0 : memref<vector<8x8x8xf32>>
	}
	// CHECK-LABEL: llvm.func @vector_type_cast
	// CHECK: llvm.mlir.undef : !llvm<"{ [8 x [8 x <8 x float>]], [8 x [8 x <8 x float>]], i64 }">
	// CHECK: %[[allocated:.]] = llvm.extractvalue {{.}}[0] : !llvm<"{ float, float, i64, [3 x i64], [3 x i64] }">
	// CHECK: %[[allocatedBit:.]] = llvm.bitcast %[[allocated]] : !llvm<"float"> to !llvm<"[8 x [8 x <8 x float>]]*">
	// CHECK: llvm.insertvalue %[[allocatedBit]], {{.}}[0] : !llvm<"{ [8 x [8 x <8 x float>]], [8 x [8 x <8 x float>]]*, i64 }">
	// CHECK: %[[aligned:.]] = llvm.extractvalue {{.}}[1] : !llvm<"{ float, float, i64, [3 x i64], [3 x i64] }">
	// CHECK: %[[alignedBit:.]] = llvm.bitcast %[[aligned]] : !llvm<"float"> to !llvm<"[8 x [8 x <8 x float>]]*">
	// CHECK: llvm.insertvalue %[[alignedBit]], {{.}}[1] : !llvm<"{ [8 x [8 x <8 x float>]], [8 x [8 x <8 x float>]]*, i64 }">
	// CHECK: llvm.mlir.constant(0 : index
	// CHECK: llvm.insertvalue {{.}}[2] : !llvm<"{ [8 x [8 x <8 x float>]], [8 x [8 x <8 x float>]]*, i64 }">

	func @vector_print_scalar(%arg0: f32) {
	vector.print %arg0 : f32
	return
	}
	// CHECK-LABEL: llvm.func @vector_print_scalar
	// CHECK-SAME: %[[A:arg[0-9]+]]: !llvm.float
	// CHECK: llvm.call @print_f32(%[[A]]) : (!llvm.float) -> ()
	// CHECK: llvm.call @print_newline() : () -> ()

	func @vector_print_vector(%arg0: vector<2x2xf32>) {
	vector.print %arg0 : vector<2x2xf32>
	return
	}
	// CHECK-LABEL: llvm.func @vector_print_vector
	// CHECK-SAME: %[[A:arg[0-9]+]]: !llvm<"[2 x <2 x float>]">
	// CHECK: llvm.call @print_open() : () -> ()
	// CHECK: %[[x0:.*]] = llvm.extractvalue %[[A]][0] : !llvm<"[2 x <2 x float>]">
	// CHECK: llvm.call @print_open() : () -> ()
	// CHECK: %[[x1:.*]] = llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: %[[x2:.*]] = llvm.extractelement %[[x0]][%[[x1]] : !llvm.i64] : !llvm<"<2 x float>">
	// CHECK: llvm.call @print_f32(%[[x2]]) : (!llvm.float) -> ()
	// CHECK: llvm.call @print_comma() : () -> ()
	// CHECK: %[[x3:.*]] = llvm.mlir.constant(1 : index) : !llvm.i64
	// CHECK: %[[x4:.*]] = llvm.extractelement %[[x0]][%[[x3]] : !llvm.i64] : !llvm<"<2 x float>">
	// CHECK: llvm.call @print_f32(%[[x4]]) : (!llvm.float) -> ()
	// CHECK: llvm.call @print_close() : () -> ()
	// CHECK: llvm.call @print_comma() : () -> ()
	// CHECK: %[[x5:.*]] = llvm.extractvalue %[[A]][1] : !llvm<"[2 x <2 x float>]">
	// CHECK: llvm.call @print_open() : () -> ()
	// CHECK: %[[x6:.*]] = llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: %[[x7:.*]] = llvm.extractelement %[[x5]][%[[x6]] : !llvm.i64] : !llvm<"<2 x float>">
	// CHECK: llvm.call @print_f32(%[[x7]]) : (!llvm.float) -> ()
	// CHECK: llvm.call @print_comma() : () -> ()
	// CHECK: %[[x8:.*]] = llvm.mlir.constant(1 : index) : !llvm.i64
	// CHECK: %[[x9:.*]] = llvm.extractelement %[[x5]][%[[x8]] : !llvm.i64] : !llvm<"<2 x float>">
	// CHECK: llvm.call @print_f32(%[[x9]]) : (!llvm.float) -> ()
	// CHECK: llvm.call @print_close() : () -> ()
	// CHECK: llvm.call @print_close() : () -> ()
	// CHECK: llvm.call @print_newline() : () -> ()

	func @strided_slice1(%arg0: vector<4xf32>) -> vector<2xf32> {
	%0 = vector.strided_slice %arg0 {offsets = [2], sizes = [2], strides = [1]} : vector<4xf32> to vector<2xf32>
	return %0 : vector<2xf32>
	}
	// CHECK-LABEL: llvm.func @strided_slice1
	// CHECK: llvm.mlir.constant(0.000000e+00 : f32) : !llvm.float
	// CHECK: llvm.mlir.constant(dense<0.000000e+00> : vector<2xf32>) : !llvm<"<2 x float>">
	// CHECK: llvm.mlir.constant(2 : index) : !llvm.i64
	// CHECK: llvm.extractelement %{{.}}[%{{.}} : !llvm.i64] : !llvm<"<4 x float>">
	// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: llvm.insertelement %{{.}}, %{{.}}[%{{.*}} : !llvm.i64] : !llvm<"<2 x float>">
	// CHECK: llvm.mlir.constant(3 : index) : !llvm.i64
	// CHECK: llvm.extractelement %{{.}}[%{{.}} : !llvm.i64] : !llvm<"<4 x float>">
	// CHECK: llvm.mlir.constant(1 : index) : !llvm.i64
	// CHECK: llvm.insertelement %{{.}}, %{{.}}[%{{.*}} : !llvm.i64] : !llvm<"<2 x float>">

	func @strided_slice2(%arg0: vector<4x8xf32>) -> vector<2x8xf32> {
	%0 = vector.strided_slice %arg0 {offsets = [2], sizes = [2], strides = [1]} : vector<4x8xf32> to vector<2x8xf32>
	return %0 : vector<2x8xf32>
	}
	// CHECK-LABEL: llvm.func @strided_slice2
	// CHECK: llvm.mlir.constant(0.000000e+00 : f32) : !llvm.float
	// CHECK: llvm.mlir.constant(dense<0.000000e+00> : vector<2x8xf32>) : !llvm<"[2 x <8 x float>]">
	// CHECK: llvm.extractvalue %{{.*}}[2] : !llvm<"[4 x <8 x float>]">
	// CHECK: llvm.insertvalue %{{.}}, %{{.}}[0] : !llvm<"[2 x <8 x float>]">
	// CHECK: llvm.extractvalue %{{.*}}[3] : !llvm<"[4 x <8 x float>]">
	// CHECK: llvm.insertvalue %{{.}}, %{{.}}[1] : !llvm<"[2 x <8 x float>]">

	func @strided_slice3(%arg0: vector<4x8xf32>) -> vector<2x2xf32> {
	%0 = vector.strided_slice %arg0 {offsets = [2, 2], sizes = [2, 2], strides = [1, 1]} : vector<4x8xf32> to vector<2x2xf32>
	return %0 : vector<2x2xf32>
	}
	// CHECK-LABEL: llvm.func @strided_slice3
	// CHECK: llvm.mlir.constant(0.000000e+00 : f32) : !llvm.float
	// CHECK: llvm.mlir.constant(dense<0.000000e+00> : vector<2x2xf32>) : !llvm<"[2 x <2 x float>]">
	//
	// Subvector vector<8xf32> @2
	// CHECK: llvm.extractvalue {{.*}}[2] : !llvm<"[4 x <8 x float>]">
	// CHECK: llvm.mlir.constant(0.000000e+00 : f32) : !llvm.float
	// CHECK: llvm.mlir.constant(dense<0.000000e+00> : vector<2xf32>) : !llvm<"<2 x float>">
	// CHECK: llvm.mlir.constant(2 : index) : !llvm.i64
	// CHECK: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<8 x float>">
	// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: llvm.insertelement {{.}}, {{.}}[{{.*}} : !llvm.i64] : !llvm<"<2 x float>">
	// CHECK: llvm.mlir.constant(3 : index) : !llvm.i64
	// CHECK: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<8 x float>">
	// CHECK: llvm.mlir.constant(1 : index) : !llvm.i64
	// CHECK: llvm.insertelement {{.}}, {{.}}[{{.*}} : !llvm.i64] : !llvm<"<2 x float>">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[0] : !llvm<"[2 x <2 x float>]">
	//
	// Subvector vector<8xf32> @3
	// CHECK: llvm.extractvalue {{.*}}[3] : !llvm<"[4 x <8 x float>]">
	// CHECK: llvm.mlir.constant(0.000000e+00 : f32) : !llvm.float
	// CHECK: llvm.mlir.constant(dense<0.000000e+00> : vector<2xf32>) : !llvm<"<2 x float>">
	// CHECK: llvm.mlir.constant(2 : index) : !llvm.i64
	// CHECK: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<8 x float>">
	// CHECK: llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: llvm.insertelement {{.}}, {{.}}[{{.*}} : !llvm.i64] : !llvm<"<2 x float>">
	// CHECK: llvm.mlir.constant(3 : index) : !llvm.i64
	// CHECK: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<8 x float>">
	// CHECK: llvm.mlir.constant(1 : index) : !llvm.i64
	// CHECK: llvm.insertelement {{.}}, {{.}}[{{.*}} : !llvm.i64] : !llvm<"<2 x float>">
	// CHECK: llvm.insertvalue {{.}}, {{.}}[1] : !llvm<"[2 x <2 x float>]">

	func @insert_strided_slice1(%b: vector<4x4xf32>, %c: vector<4x4x4xf32>) -> vector<4x4x4xf32> {
	%0 = vector.insert_strided_slice %b, %c {offsets = [2, 0, 0], strides = [1, 1]} : vector<4x4xf32> into vector<4x4x4xf32>
	return %0 : vector<4x4x4xf32>
	}
	// CHECK-LABEL: llvm.func @insert_strided_slice1
	// CHECK: llvm.extractvalue {{.*}}[2] : !llvm<"[4 x [4 x <4 x float>]]">
	// CHECK-NEXT: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[4 x [4 x <4 x float>]]">

	func @insert_strided_slice2(%a: vector<2x2xf32>, %b: vector<4x4xf32>) -> vector<4x4xf32> {
	%0 = vector.insert_strided_slice %a, %b {offsets = [2, 2], strides = [1, 1]} : vector<2x2xf32> into vector<4x4xf32>
	return %0 : vector<4x4xf32>
	}
	// CHECK-LABEL: llvm.func @insert_strided_slice2
	//
	// Subvector vector<2xf32> @0 into vector<4xf32> @2
	// CHECK: llvm.extractvalue {{.*}}[0] : !llvm<"[2 x <2 x float>]">
	// CHECK-NEXT: llvm.extractvalue {{.*}}[2] : !llvm<"[4 x <4 x float>]">
	// Element @0 -> element @2
	// CHECK-NEXT: llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK-NEXT: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<2 x float>">
	// CHECK-NEXT: llvm.mlir.constant(2 : index) : !llvm.i64
	// CHECK-NEXT: llvm.insertelement {{.}}, {{.}}[{{.*}} : !llvm.i64] : !llvm<"<4 x float>">
	// Element @1 -> element @3
	// CHECK-NEXT: llvm.mlir.constant(1 : index) : !llvm.i64
	// CHECK-NEXT: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<2 x float>">
	// CHECK-NEXT: llvm.mlir.constant(3 : index) : !llvm.i64
	// CHECK-NEXT: llvm.insertelement {{.}}, {{.}}[{{.*}} : !llvm.i64] : !llvm<"<4 x float>">
	// CHECK-NEXT: llvm.insertvalue {{.}}, {{.}}[2] : !llvm<"[4 x <4 x float>]">
	//
	// Subvector vector<2xf32> @1 into vector<4xf32> @3
	// CHECK: llvm.extractvalue {{.*}}[1] : !llvm<"[2 x <2 x float>]">
	// CHECK-NEXT: llvm.extractvalue {{.*}}[3] : !llvm<"[4 x <4 x float>]">
	// Element @0 -> element @2
	// CHECK-NEXT: llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK-NEXT: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<2 x float>">
	// CHECK-NEXT: llvm.mlir.constant(2 : index) : !llvm.i64
	// CHECK-NEXT: llvm.insertelement {{.}}, {{.}}[{{.*}} : !llvm.i64] : !llvm<"<4 x float>">
	// Element @1 -> element @3
	// CHECK-NEXT: llvm.mlir.constant(1 : index) : !llvm.i64
	// CHECK-NEXT: llvm.extractelement {{.}}[{{.}} : !llvm.i64] : !llvm<"<2 x float>">
	// CHECK-NEXT: llvm.mlir.constant(3 : index) : !llvm.i64
	// CHECK-NEXT: llvm.insertelement {{.}}, {{.}}[{{.*}} : !llvm.i64] : !llvm<"<4 x float>">
	// CHECK-NEXT: llvm.insertvalue {{.}}, {{.}}[3] : !llvm<"[4 x <4 x float>]">

	func @insert_strided_slice3(%arg0: vector<2x4xf32>, %arg1: vector<16x4x8xf32>) -> vector<16x4x8xf32> {
	%0 = vector.insert_strided_slice %arg0, %arg1 {offsets = [0, 0, 2], strides = [1, 1]}:
	vector<2x4xf32> into vector<16x4x8xf32>
	return %0 : vector<16x4x8xf32>
	}
	// CHECK-LABEL: llvm.func @insert_strided_slice3
	// CHECK-SAME: %[[A:arg[0-9]+]]: !llvm<"[2 x <4 x float>]">
	// CHECK-SAME: %[[B:arg[0-9]+]]: !llvm<"[16 x [4 x <8 x float>]]">
	// CHECK: %[[s0:.*]] = llvm.extractvalue %[[B]][0] : !llvm<"[16 x [4 x <8 x float>]]">
	// CHECK: %[[s1:.*]] = llvm.extractvalue %[[A]][0] : !llvm<"[2 x <4 x float>]">
	// CHECK: %[[s2:.*]] = llvm.extractvalue %[[s0]][0] : !llvm<"[4 x <8 x float>]">
	// CHECK: %[[s3:.*]] = llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: %[[s4:.*]] = llvm.extractelement %[[s1]][%[[s3]] : !llvm.i64] : !llvm<"<4 x float>">
	// CHECK: %[[s5:.*]] = llvm.mlir.constant(2 : index) : !llvm.i64
	// CHECK: %[[s6:.*]] = llvm.insertelement %[[s4]], %[[s2]][%[[s5]] : !llvm.i64] : !llvm<"<8 x float>">
	// CHECK: %[[s7:.*]] = llvm.mlir.constant(1 : index) : !llvm.i64
	// CHECK: %[[s8:.*]] = llvm.extractelement %[[s1]][%[[s7]] : !llvm.i64] : !llvm<"<4 x float>">
	// CHECK: %[[s9:.*]] = llvm.mlir.constant(3 : index) : !llvm.i64
	// CHECK: %[[s10:.*]] = llvm.insertelement %[[s8]], %[[s6]][%[[s9]] : !llvm.i64] : !llvm<"<8 x float>">
	// CHECK: %[[s11:.*]] = llvm.mlir.constant(2 : index) : !llvm.i64
	// CHECK: %[[s12:.*]] = llvm.extractelement %[[s1]][%[[s11]] : !llvm.i64] : !llvm<"<4 x float>">
	// CHECK: %[[s13:.*]] = llvm.mlir.constant(4 : index) : !llvm.i64
	// CHECK: %[[s14:.*]] = llvm.insertelement %[[s12]], %[[s10]][%[[s13]] : !llvm.i64] : !llvm<"<8 x float>">
	// CHECK: %[[s15:.*]] = llvm.mlir.constant(3 : index) : !llvm.i64
	// CHECK: %[[s16:.*]] = llvm.extractelement %[[s1]][%[[s15]] : !llvm.i64] : !llvm<"<4 x float>">
	// CHECK: %[[s17:.*]] = llvm.mlir.constant(5 : index) : !llvm.i64
	// CHECK: %[[s18:.*]] = llvm.insertelement %[[s16]], %[[s14]][%[[s17]] : !llvm.i64] : !llvm<"<8 x float>">
	// CHECK: %[[s19:.*]] = llvm.insertvalue %[[s18]], %[[s0]][0] : !llvm<"[4 x <8 x float>]">
	// CHECK: %[[s20:.*]] = llvm.extractvalue %[[A]][1] : !llvm<"[2 x <4 x float>]">
	// CHECK: %[[s21:.*]] = llvm.extractvalue %[[s0]][1] : !llvm<"[4 x <8 x float>]">
	// CHECK: %[[s22:.*]] = llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: %[[s23:.*]] = llvm.extractelement %[[s20]][%[[s22]] : !llvm.i64] : !llvm<"<4 x float>">
	// CHECK: %[[s24:.*]] = llvm.mlir.constant(2 : index) : !llvm.i64
	// CHECK: %[[s25:.*]] = llvm.insertelement %[[s23]], %[[s21]][%[[s24]] : !llvm.i64] : !llvm<"<8 x float>">
	// CHECK: %[[s26:.*]] = llvm.mlir.constant(1 : index) : !llvm.i64
	// CHECK: %[[s27:.*]] = llvm.extractelement %[[s20]][%[[s26]] : !llvm.i64] : !llvm<"<4 x float>">
	// CHECK: %[[s28:.*]] = llvm.mlir.constant(3 : index) : !llvm.i64
	// CHECK: %[[s29:.*]] = llvm.insertelement %[[s27]], %[[s25]][%[[s28]] : !llvm.i64] : !llvm<"<8 x float>">
	// CHECK: %[[s30:.*]] = llvm.mlir.constant(2 : index) : !llvm.i64
	// CHECK: %[[s31:.*]] = llvm.extractelement %[[s20]][%[[s30]] : !llvm.i64] : !llvm<"<4 x float>">
	// CHECK: %[[s32:.*]] = llvm.mlir.constant(4 : index) : !llvm.i64
	// CHECK: %[[s33:.*]] = llvm.insertelement %[[s31]], %[[s29]][%[[s32]] : !llvm.i64] : !llvm<"<8 x float>">
	// CHECK: %[[s34:.*]] = llvm.mlir.constant(3 : index) : !llvm.i64
	// CHECK: %[[s35:.*]] = llvm.extractelement %[[s20]][%[[s34]] : !llvm.i64] : !llvm<"<4 x float>">
	// CHECK: %[[s36:.*]] = llvm.mlir.constant(5 : index) : !llvm.i64
	// CHECK: %[[s37:.*]] = llvm.insertelement %[[s35]], %[[s33]][%[[s36]] : !llvm.i64] : !llvm<"<8 x float>">
	// CHECK: %[[s38:.*]] = llvm.insertvalue %[[s37]], %[[s19]][1] : !llvm<"[4 x <8 x float>]">
	// CHECK: %[[s39:.*]] = llvm.insertvalue %[[s38]], %[[B]][0] : !llvm<"[16 x [4 x <8 x float>]]">
	// CHECK: llvm.return %[[s39]] : !llvm<"[16 x [4 x <8 x float>]]">

	func @extract_strides(%arg0: vector<3x3xf32>) -> vector<1x1xf32> {
	%0 = vector.extract_slices %arg0, [2, 2], [1, 1]
	: vector<3x3xf32> into tuple<vector<2x2xf32>, vector<2x1xf32>, vector<1x2xf32>, vector<1x1xf32>>
	%1 = vector.tuple_get %0, 3 : tuple<vector<2x2xf32>, vector<2x1xf32>, vector<1x2xf32>, vector<1x1xf32>>
	return %1 : vector<1x1xf32>
	}
	// CHECK-LABEL: llvm.func @extract_strides
	// CHECK-SAME: %[[A:arg[0-9]+]]: !llvm<"[3 x <3 x float>]">
	// CHECK: %[[s0:.*]] = llvm.mlir.constant(dense<0.000000e+00> : vector<1x1xf32>) : !llvm<"[1 x <1 x float>]">
	// CHECK: %[[s1:.*]] = llvm.extractvalue %[[A]][2] : !llvm<"[3 x <3 x float>]">
	// CHECK: %[[s3:.*]] = llvm.mlir.constant(dense<0.000000e+00> : vector<1xf32>) : !llvm<"<1 x float>">
	// CHECK: %[[s4:.*]] = llvm.mlir.constant(2 : index) : !llvm.i64
	// CHECK: %[[s5:.*]] = llvm.extractelement %[[s1]][%[[s4]] : !llvm.i64] : !llvm<"<3 x float>">
	// CHECK: %[[s6:.*]] = llvm.mlir.constant(0 : index) : !llvm.i64
	// CHECK: %[[s7:.*]] = llvm.insertelement %[[s5]], %[[s3]][%[[s6]] : !llvm.i64] : !llvm<"<1 x float>">
	// CHECK: %[[s8:.*]] = llvm.insertvalue %[[s7]], %[[s0]][0] : !llvm<"[1 x <1 x float>]">
	// CHECK: llvm.return %[[s8]] : !llvm<"[1 x <1 x float>]">

mlir/test/Dialect/VectorOps/ops.mlir

Show First 20 Lines • Show All 226 Lines • ▼ Show 20 Lines	func @reshape(%arg0 : vector<3x2x4xf32>) -> (vector<2x3x4xf32>) {
%c6 = constant 6 : index		%c6 = constant 6 : index
// CHECK: %[[C9:.*]] = constant 9 : index		// CHECK: %[[C9:.*]] = constant 9 : index
%c9 = constant 9 : index		%c9 = constant 9 : index
// CHECK: vector.reshape %{{.*}}, [%[[C3]], %[[C6]]], [%[[C2]], %[[C9]]], [4] : vector<3x2x4xf32> to vector<2x3x4xf32>		// CHECK: vector.reshape %{{.*}}, [%[[C3]], %[[C6]]], [%[[C2]], %[[C9]]], [4] : vector<3x2x4xf32> to vector<2x3x4xf32>
%1 = vector.reshape %arg0, [%c3, %c6], [%c2, %c9], [4]		%1 = vector.reshape %arg0, [%c3, %c6], [%c2, %c9], [4]
: vector<3x2x4xf32> to vector<2x3x4xf32>		: vector<3x2x4xf32> to vector<2x3x4xf32>

return %1 : vector<2x3x4xf32>		return %1 : vector<2x3x4xf32>
}		}
		Lint: Pre-merge checks Inline Actions clang-format: please reformat the code + +// CHECK-LABEL: @vector_fma +func @vector_fma(%a: vector<8xf32>, %b: vector<8x4xf32>) { + // CHECK: vector.fma %{{.}} : vector<8xf32> + vector.fma %a, %a, %a : vector<8xf32> + // CHECK: vector.fma %{{.}} : vector<8x4xf32> + vector.fma %b, %b, %b : vector<8x4xf32> + return +} Lint: Pre-merge checks: clang-format: please reformat the code ``` + +// CHECK-LABEL: @vector_fma +func @vector_fma(%a…

		// CHECK-LABEL: @vector_fma
		func @vector_fma(%a: vector<8xf32>, %b: vector<8x4xf32>) {
		// CHECK: vector.fma %{{.*}} : vector<8xf32>
		vector.fma %a, %a, %a : vector<8xf32>
		// CHECK: vector.fma %{{.*}} : vector<8x4xf32>
		vector.fma %b, %b, %b : vector<8x4xf32>
		return
		}

This is an archive of the discontinued LLVM Phabricator instance.

[mlir][VectorOps] Introduce a `vector.fma` op that works on n-D vectors and lowers to `llvm.intrin.fmuladd`
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 242685

mlir/include/mlir/Dialect/VectorOps/VectorOps.td

mlir/lib/Conversion/VectorToLLVM/ConvertVectorToLLVM.cpp

mlir/test/Conversion/VectorToLLVM/vector-to-llvm.mlir

mlir/test/Dialect/VectorOps/ops.mlir

This is an archive of the discontinued LLVM Phabricator instance.

[mlir][VectorOps] Introduce a `vector.fma` op that works on n-D vectors and lowers to `llvm.intrin.fmuladd`ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 242685

mlir/include/mlir/Dialect/VectorOps/VectorOps.td

mlir/lib/Conversion/VectorToLLVM/ConvertVectorToLLVM.cpp

mlir/test/Conversion/VectorToLLVM/vector-to-llvm.mlir

mlir/test/Dialect/VectorOps/ops.mlir

[mlir][VectorOps] Introduce a `vector.fma` op that works on n-D vectors and lowers to `llvm.intrin.fmuladd`
ClosedPublic