Diff 196166

include/llvm/IR/IntrinsicsX86.td

	Show First 20 Lines • Show All 4,828 Lines • ▼ Show 20 Lines

	//===----------------------------------------------------------------------===//			//===----------------------------------------------------------------------===//
	// INVPCID - Invalidate Process-Context Identifier			// INVPCID - Invalidate Process-Context Identifier

	let TargetPrefix = "x86" in {			let TargetPrefix = "x86" in {
	def int_x86_invpcid : GCCBuiltin<"__builtin_ia32_invpcid">,			def int_x86_invpcid : GCCBuiltin<"__builtin_ia32_invpcid">,
	Intrinsic<[], [llvm_i32_ty, llvm_ptr_ty], []>;			Intrinsic<[], [llvm_i32_ty, llvm_ptr_ty], []>;
	}			}

				let TargetPrefix = "x86" in {
				def int_x86_avx512bf16_cvtne2ps2bf16_128:
				GCCBuiltin<"__builtin_ia32_cvtne2ps2bf16_128">,
				Intrinsic<[llvm_v8i16_ty], [llvm_v4f32_ty, llvm_v4f32_ty],
				[IntrNoMem]>;
				def int_x86_avx512bf16_cvtne2ps2bf16_256:
				GCCBuiltin<"__builtin_ia32_cvtne2ps2bf16_256">,
				Intrinsic<[llvm_v16i16_ty], [llvm_v8f32_ty, llvm_v8f32_ty],
				[IntrNoMem]>;
				def int_x86_avx512bf16_cvtne2ps2bf16_512:
				GCCBuiltin<"__builtin_ia32_cvtne2ps2bf16_512">,
				Intrinsic<[llvm_v32i16_ty], [llvm_v16f32_ty, llvm_v16f32_ty],
				[IntrNoMem]>;
				// Intrinsic must be masked due to it producing less than 128 bits of results.
				RKSimonUnsubmitted Not Done Reply Inline Actions Is there no way around this - other conversions don't need this. RKSimon: Is there no way around this - other conversions don't need this.
				craig.topperUnsubmitted Not Done Reply Inline Actions I believe a lot of our masked conversion intrinsics never got their masking separated out to select in IR. So they haven't encountered this issue yet. I did put in MCVT* ISD opcodes for the older masked conversions to fix PR34877 a few months ago. I do wonder if in a future state with strict FP support if we should keep the masking as part of all the floating point intrinsics. craig.topper: I believe a lot of our masked conversion intrinsics never got their masking separated out to…
				def int_x86_avx512bf16_mask_cvtneps2bf16_128:
				Intrinsic<[llvm_v8i16_ty],
				[llvm_v4f32_ty, llvm_v8i16_ty, llvm_v4i1_ty],
				[IntrNoMem]>;
				def int_x86_avx512bf16_cvtneps2bf16_256:
				GCCBuiltin<"__builtin_ia32_cvtneps2bf16_256">,
				Intrinsic<[llvm_v8i16_ty], [llvm_v8f32_ty], [IntrNoMem]>;
				def int_x86_avx512bf16_cvtneps2bf16_512:
				GCCBuiltin<"__builtin_ia32_cvtneps2bf16_512">,
				Intrinsic<[llvm_v16i16_ty], [llvm_v16f32_ty], [IntrNoMem]>;
				def int_x86_avx512bf16_dpbf16ps_128:
				GCCBuiltin<"__builtin_ia32_dpbf16ps_128">,
				Intrinsic<[llvm_v4f32_ty],
				[llvm_v4f32_ty, llvm_v4i32_ty, llvm_v4i32_ty], [IntrNoMem]>;
				def int_x86_avx512bf16_dpbf16ps_256:
				GCCBuiltin<"__builtin_ia32_dpbf16ps_256">,
				Intrinsic<[llvm_v8f32_ty],
				[llvm_v8f32_ty, llvm_v8i32_ty, llvm_v8i32_ty], [IntrNoMem]>;
				def int_x86_avx512bf16_dpbf16ps_512:
				GCCBuiltin<"__builtin_ia32_dpbf16ps_512">,
				Intrinsic<[llvm_v16f32_ty],
				[llvm_v16f32_ty, llvm_v16i32_ty, llvm_v16i32_ty], [IntrNoMem]>;
				}

lib/Support/Host.cpp

Show First 20 Lines • Show All 1,369 Lines • ▼ Show 20 Lines	bool sys::getHostCPUFeatures(StringMap<bool> &Features) {
// bit of EDX), while the EAX=0x1b leaf returns information on the		// bit of EDX), while the EAX=0x1b leaf returns information on the
// availability of specific pconfig leafs.		// availability of specific pconfig leafs.
// The target feature here only refers to the the first of these two.		// The target feature here only refers to the the first of these two.
// Users might need to check for the availability of specific pconfig		// Users might need to check for the availability of specific pconfig
// leaves using cpuid, since that information is ignored while		// leaves using cpuid, since that information is ignored while
// detecting features using the "-march=native" flag.		// detecting features using the "-march=native" flag.
// For more info, see X86 ISA docs.		// For more info, see X86 ISA docs.
Features["pconfig"] = HasLeaf7 && ((EDX >> 18) & 1);		Features["pconfig"] = HasLeaf7 && ((EDX >> 18) & 1);
		bool HasLeaf7Subleaf1 =
		MaxLevel >= 7 && !getX86CpuIDAndInfoEx(0x7, 0x1, &EAX, &EBX, &ECX, &EDX);
		Features["avx512bf16"] = HasLeaf7Subleaf1 && ((EAX >> 5) & 1) && HasAVX512Save;

bool HasLeafD = MaxLevel >= 0xd &&		bool HasLeafD = MaxLevel >= 0xd &&
!getX86CpuIDAndInfoEx(0xd, 0x1, &EAX, &EBX, &ECX, &EDX);		!getX86CpuIDAndInfoEx(0xd, 0x1, &EAX, &EBX, &ECX, &EDX);

// Only enable XSAVE if OS has enabled support for saving YMM state.		// Only enable XSAVE if OS has enabled support for saving YMM state.
Features["xsaveopt"] = HasLeafD && ((EAX >> 0) & 1) && HasAVXSave;		Features["xsaveopt"] = HasLeafD && ((EAX >> 0) & 1) && HasAVXSave;
Features["xsavec"] = HasLeafD && ((EAX >> 1) & 1) && HasAVXSave;		Features["xsavec"] = HasLeafD && ((EAX >> 1) & 1) && HasAVXSave;
Features["xsaves"] = HasLeafD && ((EAX >> 3) & 1) && HasAVXSave;		Features["xsaves"] = HasLeafD && ((EAX >> 3) & 1) && HasAVXSave;
▲ Show 20 Lines • Show All 89 Lines • Show Last 20 Lines

lib/Target/X86/X86.td

	Show First 20 Lines • Show All 161 Lines • ▼ Show 20 Lines
	def FeatureIFMA : SubtargetFeature<"avx512ifma", "HasIFMA", "true",			def FeatureIFMA : SubtargetFeature<"avx512ifma", "HasIFMA", "true",
	"Enable AVX-512 Integer Fused Multiple-Add",			"Enable AVX-512 Integer Fused Multiple-Add",
	[FeatureAVX512]>;			[FeatureAVX512]>;
	def FeaturePKU : SubtargetFeature<"pku", "HasPKU", "true",			def FeaturePKU : SubtargetFeature<"pku", "HasPKU", "true",
	"Enable protection keys">;			"Enable protection keys">;
	def FeatureVNNI : SubtargetFeature<"avx512vnni", "HasVNNI", "true",			def FeatureVNNI : SubtargetFeature<"avx512vnni", "HasVNNI", "true",
	"Enable AVX-512 Vector Neural Network Instructions",			"Enable AVX-512 Vector Neural Network Instructions",
	[FeatureAVX512]>;			[FeatureAVX512]>;
				def FeatureBF16 : SubtargetFeature<"avx512bf16", "HasBF16", "true",
				"Support bfloat16 floating point",
				[FeatureBWI]>;
	def FeatureBITALG : SubtargetFeature<"avx512bitalg", "HasBITALG", "true",			def FeatureBITALG : SubtargetFeature<"avx512bitalg", "HasBITALG", "true",
	"Enable AVX-512 Bit Algorithms",			"Enable AVX-512 Bit Algorithms",
	[FeatureBWI]>;			[FeatureBWI]>;
	def FeaturePCLMUL : SubtargetFeature<"pclmul", "HasPCLMUL", "true",			def FeaturePCLMUL : SubtargetFeature<"pclmul", "HasPCLMUL", "true",
	"Enable packed carry-less multiplication instructions",			"Enable packed carry-less multiplication instructions",
	[FeatureSSE2]>;			[FeatureSSE2]>;
	def FeatureGFNI : SubtargetFeature<"gfni", "HasGFNI", "true",			def FeatureGFNI : SubtargetFeature<"gfni", "HasGFNI", "true",
	"Enable Galois Field Arithmetic Instructions",			"Enable Galois Field Arithmetic Instructions",
	▲ Show 20 Lines • Show All 1,040 Lines • Show Last 20 Lines

lib/Target/X86/X86ISelLowering.h

Show First 20 Lines • Show All 503 Lines • ▼ Show 20 Lines	enum NodeType : unsigned {
// Vector signed/unsigned integer to float/double.		// Vector signed/unsigned integer to float/double.
CVTSI2P, CVTUI2P,		CVTSI2P, CVTUI2P,

// Masked versions of above. Used for v2f64->v4f32.		// Masked versions of above. Used for v2f64->v4f32.
// SRC, PASSTHRU, MASK		// SRC, PASSTHRU, MASK
MCVTP2SI, MCVTP2UI, MCVTTP2SI, MCVTTP2UI,		MCVTP2SI, MCVTP2UI, MCVTTP2SI, MCVTTP2UI,
MCVTSI2P, MCVTUI2P,		MCVTSI2P, MCVTUI2P,

		// Vector float to bfloat16. Convert packed single data to packed BF16
		craig.topperUnsubmitted Not Done Reply Inline Actions Mention the difference between CVTNE2PS2BF16 and CVTNEPS2BF16. i.e. that CVTNE2PS2BF16 compresses two vectors to one. craig.topper: Mention the difference between CVTNE2PS2BF16 and CVTNEPS2BF16. i.e. that CVTNE2PS2BF16…
		// data, and dot product of BF16 pairs to single presision.
		RKSimonUnsubmitted Not Done Reply Inline Actions Bit more description would be good if possible - those enums look very similar at first glance! RKSimon: Bit more description would be good if possible - those enums look very similar at first glance!
		liutianleAuthorUnsubmitted Done Reply Inline Actions @RKSimon , I update it. Please review again. liutianle: @RKSimon , I update it. Please review again.
		craig.topperUnsubmitted Not Done Reply Inline Actions Separate DPBF16PS on to its own line with its own description below MCVTNEPS2BF16 craig.topper: Separate DPBF16PS on to its own line with its own description below MCVTNEPS2BF16
		craig.topperUnsubmitted Not Done Reply Inline Actions presision -> precision craig.topper: presision -> precision
		CVTNE2PS2BF16, CVTNEPS2BF16, DPBF16PS,

		craig.topperUnsubmitted Not Done Reply Inline Actions dingle->single craig.topper: dingle->single
		// Masked version of above.
		// SRC, PASSTHRU, MASK
		MCVTNEPS2BF16,

// Save xmm argument registers to the stack, according to %al. An operator		// Save xmm argument registers to the stack, according to %al. An operator
// is needed so that this can be expanded with control flow.		// is needed so that this can be expanded with control flow.
VASTART_SAVE_XMM_REGS,		VASTART_SAVE_XMM_REGS,

// Windows's _chkstk call to do stack probing.		// Windows's _chkstk call to do stack probing.
WIN_ALLOCA,		WIN_ALLOCA,

// For allocating variable amounts of stack space when using		// For allocating variable amounts of stack space when using
▲ Show 20 Lines • Show All 1,098 Lines • Show Last 20 Lines

lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 22,545 Lines • ▼ Show 20 Lines	case CVTPS2PH_MASK: {

MVT SrcVT = Src.getSimpleValueType();		MVT SrcVT = Src.getSimpleValueType();
MVT MaskVT = MVT::getVectorVT(MVT::i1, SrcVT.getVectorNumElements());		MVT MaskVT = MVT::getVectorVT(MVT::i1, SrcVT.getVectorNumElements());
Mask = getMaskNode(Mask, MaskVT, Subtarget, DAG, dl);		Mask = getMaskNode(Mask, MaskVT, Subtarget, DAG, dl);
return DAG.getNode(IntrData->Opc1, dl, Op.getValueType(), Src, Rnd,		return DAG.getNode(IntrData->Opc1, dl, Op.getValueType(), Src, Rnd,
PassThru, Mask);		PassThru, Mask);

}		}
		case CVTNEPS2BF16_MASK: {
		SDValue Src = Op.getOperand(1);
		SDValue PassThru = Op.getOperand(2);
		SDValue Mask = Op.getOperand(3);

		if (ISD::isBuildVectorAllOnes(Mask.getNode()))
		return DAG.getNode(IntrData->Opc0, dl, Op.getValueType(), Src);

		// Break false dependency.
		if (PassThru.isUndef())
		PassThru = DAG.getConstant(0, dl, PassThru.getValueType());

		return DAG.getNode(IntrData->Opc1, dl, Op.getValueType(), Src, PassThru,
		Mask);
		}
default:		default:
break;		break;
}		}
}		}

switch (IntNo) {		switch (IntNo) {
default: return SDValue(); // Don't custom lower most intrinsics.		default: return SDValue(); // Don't custom lower most intrinsics.

▲ Show 20 Lines • Show All 5,399 Lines • ▼ Show 20 Lines	const char *X86TargetLowering::getTargetNodeName(unsigned Opcode) const {
case X86ISD::MCVTP2SI: return "X86ISD::MCVTP2SI";		case X86ISD::MCVTP2SI: return "X86ISD::MCVTP2SI";
case X86ISD::MCVTP2UI: return "X86ISD::MCVTP2UI";		case X86ISD::MCVTP2UI: return "X86ISD::MCVTP2UI";
case X86ISD::CVTP2SI_RND: return "X86ISD::CVTP2SI_RND";		case X86ISD::CVTP2SI_RND: return "X86ISD::CVTP2SI_RND";
case X86ISD::CVTP2UI_RND: return "X86ISD::CVTP2UI_RND";		case X86ISD::CVTP2UI_RND: return "X86ISD::CVTP2UI_RND";
case X86ISD::CVTS2SI: return "X86ISD::CVTS2SI";		case X86ISD::CVTS2SI: return "X86ISD::CVTS2SI";
case X86ISD::CVTS2UI: return "X86ISD::CVTS2UI";		case X86ISD::CVTS2UI: return "X86ISD::CVTS2UI";
case X86ISD::CVTS2SI_RND: return "X86ISD::CVTS2SI_RND";		case X86ISD::CVTS2SI_RND: return "X86ISD::CVTS2SI_RND";
case X86ISD::CVTS2UI_RND: return "X86ISD::CVTS2UI_RND";		case X86ISD::CVTS2UI_RND: return "X86ISD::CVTS2UI_RND";
		case X86ISD::CVTNE2PS2BF16: return "X86ISD::CVTNE2PS2BF16";
		case X86ISD::CVTNEPS2BF16: return "X86ISD::CVTNEPS2BF16";
		case X86ISD::MCVTNEPS2BF16: return "X86ISD::MCVTNEPS2BF16";
		case X86ISD::DPBF16PS: return "X86ISD::DPBF16PS";
case X86ISD::LWPINS: return "X86ISD::LWPINS";		case X86ISD::LWPINS: return "X86ISD::LWPINS";
case X86ISD::MGATHER: return "X86ISD::MGATHER";		case X86ISD::MGATHER: return "X86ISD::MGATHER";
case X86ISD::MSCATTER: return "X86ISD::MSCATTER";		case X86ISD::MSCATTER: return "X86ISD::MSCATTER";
case X86ISD::VPDPBUSD: return "X86ISD::VPDPBUSD";		case X86ISD::VPDPBUSD: return "X86ISD::VPDPBUSD";
case X86ISD::VPDPBUSDS: return "X86ISD::VPDPBUSDS";		case X86ISD::VPDPBUSDS: return "X86ISD::VPDPBUSDS";
case X86ISD::VPDPWSSD: return "X86ISD::VPDPWSSD";		case X86ISD::VPDPWSSD: return "X86ISD::VPDPWSSD";
case X86ISD::VPDPWSSDS: return "X86ISD::VPDPWSSDS";		case X86ISD::VPDPWSSDS: return "X86ISD::VPDPWSSDS";
case X86ISD::VPSHUFBITQMB: return "X86ISD::VPSHUFBITQMB";		case X86ISD::VPSHUFBITQMB: return "X86ISD::VPSHUFBITQMB";
▲ Show 20 Lines • Show All 15,977 Lines • Show Last 20 Lines

lib/Target/X86/X86InstrAVX512.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 12,498 Lines • ▼ Show 20 Lines

	defm VP4DPWSSDSrm : AVX512_maskable_3src_in_asm<0x53, MRMSrcMem, v16i32_info,			defm VP4DPWSSDSrm : AVX512_maskable_3src_in_asm<0x53, MRMSrcMem, v16i32_info,
	(outs VR512:$dst), (ins VR512:$src2, f128mem:$src3),			(outs VR512:$dst), (ins VR512:$src2, f128mem:$src3),
	"vp4dpwssds", "$src3, $src2", "$src2, $src3",			"vp4dpwssds", "$src3, $src2", "$src2, $src3",
	[]>, EVEX_V512, EVEX_4V, T8XD, EVEX_CD8<32, CD8VQ>,			[]>, EVEX_V512, EVEX_4V, T8XD, EVEX_CD8<32, CD8VQ>,
	Sched<[SchedWriteFMA.ZMM.Folded]>;			Sched<[SchedWriteFMA.ZMM.Folded]>;
	}			}

				multiclass avx512_binop_all2<bits<8> opc, string OpcodeStr,
				X86SchedWriteWidths sched,
				AVX512VLVectorVTInfo _SrcVTInfo,
				AVX512VLVectorVTInfo _DstVTInfo,
				SDNode OpNode, Predicate prd,
				bit IsCommutable = 0> {
				let Predicates = [prd] in
				defm NAME#Z : avx512_binop_rm2<opc, OpcodeStr, sched.ZMM, OpNode,
				_SrcVTInfo.info512, _DstVTInfo.info512,
				_SrcVTInfo.info512, IsCommutable>,
				EVEX_V512, EVEX_CD8<32, CD8VF>;
				let Predicates = [HasVLX, prd] in {
				defm NAME#Z256 : avx512_binop_rm2<opc, OpcodeStr, sched.YMM, OpNode,
				_SrcVTInfo.info256, _DstVTInfo.info256,
				_SrcVTInfo.info256, IsCommutable>,
				EVEX_V256, EVEX_CD8<32, CD8VF>;
				defm NAME#Z128 : avx512_binop_rm2<opc, OpcodeStr, sched.XMM, OpNode,
				_SrcVTInfo.info128, _DstVTInfo.info128,
				_SrcVTInfo.info128, IsCommutable>,
				EVEX_V128, EVEX_CD8<32, CD8VF>;
				}
				}

				defm VCVTNE2PS2BF16 : avx512_binop_all2<0x72, "vcvtne2ps2bf16",
				SchedWriteVecALU,
				RKSimonUnsubmitted Not Done Reply Inline Actions Is SchedWriteVecALU a realistic scheduler class? Its typically used for vector integer add/sub/and/bitops RKSimon: Is SchedWriteVecALU a realistic scheduler class? Its typically used for vector integer…
				avx512vl_f32_info, avx512vl_i16_info,
				X86cvtne2ps2bf16, HasBF16, 0>, T8XD;

				// Truncate Float to BFloat16
				multiclass avx512_cvtps2bf16<bits<8> opc, string OpcodeStr,
				X86SchedWriteWidths sched> {
				let Predicates = [HasBF16] in {
				defm Z : avx512_vcvt_fp<opc, OpcodeStr, v16i16x_info, v16f32_info,
				X86cvtneps2bf16, sched.ZMM>, EVEX_V512;
				}
				let Predicates = [HasBF16, HasVLX] in {
				defm Z128 : avx512_vcvt_fp<opc, OpcodeStr, v8i16x_info, v4f32x_info,
				null_frag, sched.XMM, "{1to4}", "{x}", f128mem,
				VK4WM>, EVEX_V128;
				defm Z256 : avx512_vcvt_fp<opc, OpcodeStr, v8i16x_info, v8f32x_info,
				X86cvtneps2bf16,
				sched.YMM, "{1to8}", "{y}">, EVEX_V256;

				def : InstAlias<OpcodeStr##"x\t{$src, $dst\|$dst, $src}",
				(!cast<Instruction>(NAME # "Z128rr") VR128X:$dst,
				VR128X:$src), 0>;
				def : InstAlias<OpcodeStr##"x\t{$src, $dst\|$dst, $src}",
				(!cast<Instruction>(NAME # "Z128rm") VR128X:$dst,
				f128mem:$src), 0, "intel">;
				def : InstAlias<OpcodeStr##"y\t{$src, $dst\|$dst, $src}",
				(!cast<Instruction>(NAME # "Z256rr") VR128X:$dst,
				VR256X:$src), 0>;
				def : InstAlias<OpcodeStr##"y\t{$src, $dst\|$dst, $src}",
				(!cast<Instruction>(NAME # "Z256rm") VR128X:$dst,
				f256mem:$src), 0, "intel">;
				}
				}

				defm VCVTNEPS2BF16 : avx512_cvtps2bf16<0x72, "vcvtneps2bf16",
				SchedWriteCvtPD2PS>, T8XS,
				EVEX_CD8<32, CD8VF>;

				let Predicates = [HasBF16, HasVLX] in {
				// Special patterns to allow use of X86mcvtneps2bf16 for masking. Instruction
				// patterns have been disabled with null_frag.
				def : Pat<(v8i16 (X86cvtneps2bf16 (v4f32 VR128X:$src))),
				(VCVTNEPS2BF16Z128rr VR128X:$src)>;
				def : Pat<(X86mcvtneps2bf16 (v4f32 VR128X:$src), (v8i16 VR128X:$src0),
				VK4WM:$mask),
				(VCVTNEPS2BF16Z128rrk VR128X:$src0, VK4WM:$mask, VR128X:$src)>;
				def : Pat<(X86mcvtneps2bf16 (v4f32 VR128X:$src), v8i16x_info.ImmAllZerosV,
				VK4WM:$mask),
				(VCVTNEPS2BF16Z128rrkz VK4WM:$mask, VR128X:$src)>;

				def : Pat<(v8i16 (X86cvtneps2bf16 (loadv4f32 addr:$src))),
				(VCVTNEPS2BF16Z128rm addr:$src)>;
				def : Pat<(X86mcvtneps2bf16 (loadv4f32 addr:$src), (v8i16 VR128X:$src0),
				VK4WM:$mask),
				(VCVTNEPS2BF16Z128rmk VR128X:$src0, VK4WM:$mask, addr:$src)>;
				def : Pat<(X86mcvtneps2bf16 (loadv4f32 addr:$src), v8i16x_info.ImmAllZerosV,
				VK4WM:$mask),
				(VCVTNEPS2BF16Z128rmkz VK4WM:$mask, addr:$src)>;

				def : Pat<(v8i16 (X86cvtneps2bf16 (v4f32
				(X86VBroadcast (loadf32 addr:$src))))),
				(VCVTNEPS2BF16Z128rmb addr:$src)>;
				def : Pat<(X86mcvtneps2bf16 (v4f32 (X86VBroadcast (loadf32 addr:$src))),
				(v8i16 VR128X:$src0), VK4WM:$mask),
				(VCVTNEPS2BF16Z128rmbk VR128X:$src0, VK4WM:$mask, addr:$src)>;
				def : Pat<(X86mcvtneps2bf16 (v4f32 (X86VBroadcast (loadf32 addr:$src))),
				v8i16x_info.ImmAllZerosV, VK4WM:$mask),
				(VCVTNEPS2BF16Z128rmbkz VK4WM:$mask, addr:$src)>;
				}

				let Constraints = "$src1 = $dst" in {
				multiclass avx512_dpbf16ps_rm<bits<8> opc, string OpcodeStr, SDNode OpNode,
				X86VectorVTInfo _, X86VectorVTInfo src_v> {
				defm r: AVX512_maskable_3src<opc, MRMSrcReg, _, (outs _.RC:$dst),
				(ins _.RC:$src2, _.RC:$src3),
				OpcodeStr, "$src3, $src2", "$src2, $src3",
				(_.VT (OpNode _.RC:$src1, _.RC:$src2, _.RC:$src3))>,
				EVEX_4V;

				defm m: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),
				(ins _.RC:$src2, _.MemOp:$src3),
				OpcodeStr, "$src3, $src2", "$src2, $src3",
				(_.VT (OpNode _.RC:$src1, _.RC:$src2,
				(src_v.VT (bitconvert
				(src_v.LdFrag addr:$src3)))))>, EVEX_4V;

				defm mb: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),
				(ins _.RC:$src2, _.ScalarMemOp:$src3),
				OpcodeStr,
				!strconcat("${src3}", _.BroadcastStr,", $src2"),
				!strconcat("$src2, ${src3}", _.BroadcastStr),
				(_.VT (OpNode _.RC:$src1, _.RC:$src2,
				(src_v.VT (X86VBroadcast(src_v.ScalarLdFrag addr:$src3)))))>,
				EVEX_B, EVEX_4V;

				}
				} // Constraints = "$src1 = $dst"

				multiclass avx512_dpbf16ps_sizes<bits<8> opc, string OpcodeStr, SDNode OpNode,
				AVX512VLVectorVTInfo _,
				AVX512VLVectorVTInfo src_v, Predicate prd> {
				let Predicates = [prd] in {
				defm Z : avx512_dpbf16ps_rm<opc, OpcodeStr, OpNode, _.info512,
				src_v.info512>, EVEX_V512;
				}
				let Predicates = [HasVLX, prd] in {
				defm Z256 : avx512_dpbf16ps_rm<opc, OpcodeStr, OpNode, _.info256,
				src_v.info256>, EVEX_V256;
				defm Z128 : avx512_dpbf16ps_rm<opc, OpcodeStr, OpNode, _.info128,
				src_v.info128>, EVEX_V128;
				}
				}

				defm VDPBF16PS : avx512_dpbf16ps_sizes<0x52, "vdpbf16ps", X86dpbf16ps,
				avx512vl_f32_info, avx512vl_i32_info,
				HasBF16>, T8XS, EVEX_CD8<32, CD8VF>;

lib/Target/X86/X86InstrFragmentsSIMD.td

Show First 20 Lines • Show All 656 Lines • ▼ Show 20 Lines	def X86vfpextSAE : SDNode<"X86ISD::VFPEXT_SAE",
SDTCVecEltisVT<1, f32>,		SDTCVecEltisVT<1, f32>,
SDTCisOpSmallerThanOp<1, 0>]>>;		SDTCisOpSmallerThanOp<1, 0>]>>;
def X86vfproundRnd: SDNode<"X86ISD::VFPROUND_RND",		def X86vfproundRnd: SDNode<"X86ISD::VFPROUND_RND",
SDTypeProfile<1, 2, [SDTCVecEltisVT<0, f32>,		SDTypeProfile<1, 2, [SDTCVecEltisVT<0, f32>,
SDTCVecEltisVT<1, f64>,		SDTCVecEltisVT<1, f64>,
SDTCisOpSmallerThanOp<0, 1>,		SDTCisOpSmallerThanOp<0, 1>,
SDTCisVT<2, i32>]>>;		SDTCisVT<2, i32>]>>;

		// cvt fp to bfloat16
		def X86cvtne2ps2bf16 : SDNode<"X86ISD::CVTNE2PS2BF16",
		SDTypeProfile<1, 2, [SDTCisVec<0>, SDTCisVec<1>,
		SDTCisSameAs<1,2>]>>;
		def X86mcvtneps2bf16 : SDNode<"X86ISD::MCVTNEPS2BF16",
		SDTypeProfile<1, 3, [SDTCVecEltisVT<0, i16>,
		SDTCVecEltisVT<1, f32>,
		SDTCisSameAs<0, 2>,
		SDTCVecEltisVT<3, i1>,
		SDTCisSameNumEltsAs<1, 3>]>>;
		def X86cvtneps2bf16 : SDNode<"X86ISD::CVTNEPS2BF16",
		SDTypeProfile<1, 1, [SDTCVecEltisVT<0, i16>,
		SDTCVecEltisVT<1, f32>]>>;
		def X86dpbf16ps : SDNode<"X86ISD::DPBF16PS",
		SDTypeProfile<1, 3, [SDTCVecEltisVT<0, f32>,
		SDTCisSameAs<0,1>,
		SDTCVecEltisVT<2, i32>,
		SDTCisSameAs<2,3>]>>;

// galois field arithmetic		// galois field arithmetic
def X86GF2P8affineinvqb : SDNode<"X86ISD::GF2P8AFFINEINVQB", SDTBlend>;		def X86GF2P8affineinvqb : SDNode<"X86ISD::GF2P8AFFINEINVQB", SDTBlend>;
def X86GF2P8affineqb : SDNode<"X86ISD::GF2P8AFFINEQB", SDTBlend>;		def X86GF2P8affineqb : SDNode<"X86ISD::GF2P8AFFINEQB", SDTBlend>;
def X86GF2P8mulb : SDNode<"X86ISD::GF2P8MULB", SDTIntBinOp>;		def X86GF2P8mulb : SDNode<"X86ISD::GF2P8MULB", SDTIntBinOp>;

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// SSE Complex Patterns		// SSE Complex Patterns
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
▲ Show 20 Lines • Show All 458 Lines • Show Last 20 Lines

lib/Target/X86/X86InstrInfo.td

	Show First 20 Lines • Show All 829 Lines • ▼ Show 20 Lines
	def HasBWI : Predicate<"Subtarget->hasBWI()">;			def HasBWI : Predicate<"Subtarget->hasBWI()">;
	def NoBWI : Predicate<"!Subtarget->hasBWI()">;			def NoBWI : Predicate<"!Subtarget->hasBWI()">;
	def HasVLX : Predicate<"Subtarget->hasVLX()">;			def HasVLX : Predicate<"Subtarget->hasVLX()">;
	def NoVLX : Predicate<"!Subtarget->hasVLX()">;			def NoVLX : Predicate<"!Subtarget->hasVLX()">;
	def NoVLX_Or_NoBWI : Predicate<"!Subtarget->hasVLX() \|\| !Subtarget->hasBWI()">;			def NoVLX_Or_NoBWI : Predicate<"!Subtarget->hasVLX() \|\| !Subtarget->hasBWI()">;
	def NoVLX_Or_NoDQI : Predicate<"!Subtarget->hasVLX() \|\| !Subtarget->hasDQI()">;			def NoVLX_Or_NoDQI : Predicate<"!Subtarget->hasVLX() \|\| !Subtarget->hasDQI()">;
	def PKU : Predicate<"Subtarget->hasPKU()">;			def PKU : Predicate<"Subtarget->hasPKU()">;
	def HasVNNI : Predicate<"Subtarget->hasVNNI()">;			def HasVNNI : Predicate<"Subtarget->hasVNNI()">;
				def HasBF16 : Predicate<"Subtarget->hasBF16()">;

	def HasBITALG : Predicate<"Subtarget->hasBITALG()">;			def HasBITALG : Predicate<"Subtarget->hasBITALG()">;
	def HasPOPCNT : Predicate<"Subtarget->hasPOPCNT()">;			def HasPOPCNT : Predicate<"Subtarget->hasPOPCNT()">;
	def HasAES : Predicate<"Subtarget->hasAES()">;			def HasAES : Predicate<"Subtarget->hasAES()">;
	def HasVAES : Predicate<"Subtarget->hasVAES()">;			def HasVAES : Predicate<"Subtarget->hasVAES()">;
	def NoVLX_Or_NoVAES : Predicate<"!Subtarget->hasVLX() \|\| !Subtarget->hasVAES()">;			def NoVLX_Or_NoVAES : Predicate<"!Subtarget->hasVLX() \|\| !Subtarget->hasVAES()">;
	def HasFXSR : Predicate<"Subtarget->hasFXSR()">;			def HasFXSR : Predicate<"Subtarget->hasFXSR()">;
	def HasXSAVE : Predicate<"Subtarget->hasXSAVE()">;			def HasXSAVE : Predicate<"Subtarget->hasXSAVE()">;
	▲ Show 20 Lines • Show All 2,644 Lines • Show Last 20 Lines

lib/Target/X86/X86IntrinsicsInfo.h

Show All 13 Lines
#define LLVM_LIB_TARGET_X86_X86INTRINSICSINFO_H		#define LLVM_LIB_TARGET_X86_X86INTRINSICSINFO_H

#include "X86ISelLowering.h"		#include "X86ISelLowering.h"
#include "X86InstrInfo.h"		#include "X86InstrInfo.h"

namespace llvm {		namespace llvm {

enum IntrinsicType : uint16_t {		enum IntrinsicType : uint16_t {
		CVTNEPS2BF16_MASK,
GATHER, SCATTER, PREFETCH, RDSEED, RDRAND, RDPMC, RDTSC, XTEST, XGETBV, ADX, FPCLASSS,		GATHER, SCATTER, PREFETCH, RDSEED, RDRAND, RDPMC, RDTSC, XTEST, XGETBV, ADX, FPCLASSS,
INTR_TYPE_1OP, INTR_TYPE_2OP, INTR_TYPE_3OP, INTR_TYPE_4OP,		INTR_TYPE_1OP, INTR_TYPE_2OP, INTR_TYPE_3OP, INTR_TYPE_4OP,
INTR_TYPE_3OP_IMM8,		INTR_TYPE_3OP_IMM8,
CMP_MASK_CC,CMP_MASK_SCALAR_CC, VSHIFT, COMI, COMI_RM, BLENDV,		CMP_MASK_CC,CMP_MASK_SCALAR_CC, VSHIFT, COMI, COMI_RM, BLENDV,
CVTPD2PS_MASK,		CVTPD2PS_MASK,
INTR_TYPE_1OP_SAE, INTR_TYPE_2OP_SAE,		INTR_TYPE_1OP_SAE, INTR_TYPE_2OP_SAE,
INTR_TYPE_1OP_MASK_SAE, INTR_TYPE_2OP_MASK_SAE, INTR_TYPE_3OP_MASK_SAE,		INTR_TYPE_1OP_MASK_SAE, INTR_TYPE_2OP_MASK_SAE, INTR_TYPE_3OP_MASK_SAE,
INTR_TYPE_1OP_MASK, INTR_TYPE_2OP_MASK,		INTR_TYPE_1OP_MASK, INTR_TYPE_2OP_MASK,
▲ Show 20 Lines • Show All 946 Lines • ▼ Show 20 Lines	static const IntrinsicData IntrinsicsWithoutChain[] = {
X86_INTRINSIC_DATA(avx512_vpmadd52h_uq_256 , IFMA_OP, X86ISD::VPMADD52H, 0),		X86_INTRINSIC_DATA(avx512_vpmadd52h_uq_256 , IFMA_OP, X86ISD::VPMADD52H, 0),
X86_INTRINSIC_DATA(avx512_vpmadd52h_uq_512 , IFMA_OP, X86ISD::VPMADD52H, 0),		X86_INTRINSIC_DATA(avx512_vpmadd52h_uq_512 , IFMA_OP, X86ISD::VPMADD52H, 0),
X86_INTRINSIC_DATA(avx512_vpmadd52l_uq_128 , IFMA_OP, X86ISD::VPMADD52L, 0),		X86_INTRINSIC_DATA(avx512_vpmadd52l_uq_128 , IFMA_OP, X86ISD::VPMADD52L, 0),
X86_INTRINSIC_DATA(avx512_vpmadd52l_uq_256 , IFMA_OP, X86ISD::VPMADD52L, 0),		X86_INTRINSIC_DATA(avx512_vpmadd52l_uq_256 , IFMA_OP, X86ISD::VPMADD52L, 0),
X86_INTRINSIC_DATA(avx512_vpmadd52l_uq_512 , IFMA_OP, X86ISD::VPMADD52L, 0),		X86_INTRINSIC_DATA(avx512_vpmadd52l_uq_512 , IFMA_OP, X86ISD::VPMADD52L, 0),
X86_INTRINSIC_DATA(avx512_vpshufbitqmb_128, INTR_TYPE_2OP, X86ISD::VPSHUFBITQMB, 0),		X86_INTRINSIC_DATA(avx512_vpshufbitqmb_128, INTR_TYPE_2OP, X86ISD::VPSHUFBITQMB, 0),
X86_INTRINSIC_DATA(avx512_vpshufbitqmb_256, INTR_TYPE_2OP, X86ISD::VPSHUFBITQMB, 0),		X86_INTRINSIC_DATA(avx512_vpshufbitqmb_256, INTR_TYPE_2OP, X86ISD::VPSHUFBITQMB, 0),
X86_INTRINSIC_DATA(avx512_vpshufbitqmb_512, INTR_TYPE_2OP, X86ISD::VPSHUFBITQMB, 0),		X86_INTRINSIC_DATA(avx512_vpshufbitqmb_512, INTR_TYPE_2OP, X86ISD::VPSHUFBITQMB, 0),
		// bfloat16
		X86_INTRINSIC_DATA(avx512bf16_cvtne2ps2bf16_128, INTR_TYPE_2OP, X86ISD::CVTNE2PS2BF16, 0),
		X86_INTRINSIC_DATA(avx512bf16_cvtne2ps2bf16_256, INTR_TYPE_2OP, X86ISD::CVTNE2PS2BF16, 0),
		X86_INTRINSIC_DATA(avx512bf16_cvtne2ps2bf16_512, INTR_TYPE_2OP, X86ISD::CVTNE2PS2BF16, 0),
		X86_INTRINSIC_DATA(avx512bf16_cvtneps2bf16_256, INTR_TYPE_1OP, X86ISD::CVTNEPS2BF16, 0),
		X86_INTRINSIC_DATA(avx512bf16_cvtneps2bf16_512, INTR_TYPE_1OP, X86ISD::CVTNEPS2BF16, 0),
		X86_INTRINSIC_DATA(avx512bf16_dpbf16ps_128, INTR_TYPE_3OP, X86ISD::DPBF16PS, 0),
		X86_INTRINSIC_DATA(avx512bf16_dpbf16ps_256, INTR_TYPE_3OP, X86ISD::DPBF16PS, 0),
		X86_INTRINSIC_DATA(avx512bf16_dpbf16ps_512, INTR_TYPE_3OP, X86ISD::DPBF16PS, 0),
		X86_INTRINSIC_DATA(avx512bf16_mask_cvtneps2bf16_128, CVTNEPS2BF16_MASK, X86ISD::CVTNEPS2BF16, X86ISD::MCVTNEPS2BF16),
X86_INTRINSIC_DATA(bmi_bextr_32, INTR_TYPE_2OP, X86ISD::BEXTR, 0),		X86_INTRINSIC_DATA(bmi_bextr_32, INTR_TYPE_2OP, X86ISD::BEXTR, 0),
X86_INTRINSIC_DATA(bmi_bextr_64, INTR_TYPE_2OP, X86ISD::BEXTR, 0),		X86_INTRINSIC_DATA(bmi_bextr_64, INTR_TYPE_2OP, X86ISD::BEXTR, 0),
X86_INTRINSIC_DATA(bmi_bzhi_32, INTR_TYPE_2OP, X86ISD::BZHI, 0),		X86_INTRINSIC_DATA(bmi_bzhi_32, INTR_TYPE_2OP, X86ISD::BZHI, 0),
X86_INTRINSIC_DATA(bmi_bzhi_64, INTR_TYPE_2OP, X86ISD::BZHI, 0),		X86_INTRINSIC_DATA(bmi_bzhi_64, INTR_TYPE_2OP, X86ISD::BZHI, 0),
X86_INTRINSIC_DATA(sse_cmp_ps, INTR_TYPE_3OP, X86ISD::CMPP, 0),		X86_INTRINSIC_DATA(sse_cmp_ps, INTR_TYPE_3OP, X86ISD::CMPP, 0),
X86_INTRINSIC_DATA(sse_comieq_ss, COMI, X86ISD::COMI, ISD::SETEQ),		X86_INTRINSIC_DATA(sse_comieq_ss, COMI, X86ISD::COMI, ISD::SETEQ),
X86_INTRINSIC_DATA(sse_comige_ss, COMI, X86ISD::COMI, ISD::SETGE),		X86_INTRINSIC_DATA(sse_comige_ss, COMI, X86ISD::COMI, ISD::SETGE),
X86_INTRINSIC_DATA(sse_comigt_ss, COMI, X86ISD::COMI, ISD::SETGT),		X86_INTRINSIC_DATA(sse_comigt_ss, COMI, X86ISD::COMI, ISD::SETGT),
▲ Show 20 Lines • Show All 172 Lines • Show Last 20 Lines

lib/Target/X86/X86Subtarget.h

Show First 20 Lines • Show All 347 Lines • ▼ Show 20 Lines	protected:
bool HasVLX = false;		bool HasVLX = false;

/// Processor has PKU extenstions		/// Processor has PKU extenstions
bool HasPKU = false;		bool HasPKU = false;

/// Processor has AVX-512 Vector Neural Network Instructions		/// Processor has AVX-512 Vector Neural Network Instructions
bool HasVNNI = false;		bool HasVNNI = false;

		/// Processor has AVX-512 bfloat16 floating-point extenstions
		craig.topperUnsubmitted Not Done Reply Inline Actions extenstions->extensions craig.topper: extenstions->extensions
		bool HasBF16 = false;

/// Processor has AVX-512 Bit Algorithms instructions		/// Processor has AVX-512 Bit Algorithms instructions
bool HasBITALG = false;		bool HasBITALG = false;

/// Processor supports MPX - Memory Protection Extensions		/// Processor supports MPX - Memory Protection Extensions
bool HasMPX = false;		bool HasMPX = false;

/// Processor supports CET SHSTK - Control-Flow Enforcement Technology		/// Processor supports CET SHSTK - Control-Flow Enforcement Technology
/// using Shadow Stack		/// using Shadow Stack
▲ Show 20 Lines • Show All 295 Lines • ▼ Show 20 Lines	public:
bool hasVPOPCNTDQ() const { return HasVPOPCNTDQ; }		bool hasVPOPCNTDQ() const { return HasVPOPCNTDQ; }
bool hasPFI() const { return HasPFI; }		bool hasPFI() const { return HasPFI; }
bool hasERI() const { return HasERI; }		bool hasERI() const { return HasERI; }
bool hasDQI() const { return HasDQI; }		bool hasDQI() const { return HasDQI; }
bool hasBWI() const { return HasBWI; }		bool hasBWI() const { return HasBWI; }
bool hasVLX() const { return HasVLX; }		bool hasVLX() const { return HasVLX; }
bool hasPKU() const { return HasPKU; }		bool hasPKU() const { return HasPKU; }
bool hasVNNI() const { return HasVNNI; }		bool hasVNNI() const { return HasVNNI; }
		bool hasBF16() const { return HasBF16; }
bool hasBITALG() const { return HasBITALG; }		bool hasBITALG() const { return HasBITALG; }
bool hasMPX() const { return HasMPX; }		bool hasMPX() const { return HasMPX; }
bool hasSHSTK() const { return HasSHSTK; }		bool hasSHSTK() const { return HasSHSTK; }
bool hasCLFLUSHOPT() const { return HasCLFLUSHOPT; }		bool hasCLFLUSHOPT() const { return HasCLFLUSHOPT; }
bool hasCLWB() const { return HasCLWB; }		bool hasCLWB() const { return HasCLWB; }
bool hasWBNOINVD() const { return HasWBNOINVD; }		bool hasWBNOINVD() const { return HasWBNOINVD; }
bool hasRDPID() const { return HasRDPID; }		bool hasRDPID() const { return HasRDPID; }
bool hasWAITPKG() const { return HasWAITPKG; }		bool hasWAITPKG() const { return HasWAITPKG; }
▲ Show 20 Lines • Show All 184 Lines • Show Last 20 Lines

test/CodeGen/X86/avx512bf16-intrinsics.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=+avx512bf16 --show-mc-encoding \| FileCheck %s --check-prefixes=CHECK,X86
				; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bf16 --show-mc-encoding \| FileCheck %s --check-prefixes=CHECK,X64

				declare <32 x i16> @llvm.x86.avx512bf16.cvtne2ps2bf16.512(<16 x float>, <16 x float>) #3

				define <8 x i64> @test_mm512_cvtne2ps2bf16_512(<16 x float> %A, <16 x float> %B) local_unnamed_addr #2 {
				; CHECK-LABEL: test_mm512_cvtne2ps2bf16_512:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vcvtne2ps2bf16 %zmm1, %zmm0, %zmm0 # encoding: [0x62,0xf2,0x7f,0x48,0x72,0xc1]
				; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
				entry:
				%0 = tail call <32 x i16> @llvm.x86.avx512bf16.cvtne2ps2bf16.512(<16 x float> %A, <16 x float> %B) #4
				%1 = bitcast <32 x i16> %0 to <8 x i64>
				ret <8 x i64> %1
				}

				define <8 x i64> @test_mm512_maskz_cvtne2ps2bf16_512(<16 x float> %A, <16 x float> %B, i32 %U) local_unnamed_addr #2 {
				; X86-LABEL: test_mm512_maskz_cvtne2ps2bf16_512:
				; X86: # %bb.0: # %entry
				; X86-NEXT: kmovd {{[0-9]+}}(%esp), %k1 # encoding: [0xc4,0xe1,0xf9,0x90,0x4c,0x24,0x04]
				; X86-NEXT: vcvtne2ps2bf16 %zmm1, %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf2,0x7f,0xc9,0x72,0xc1]
				; X86-NEXT: retl # encoding: [0xc3]
				;
				; X64-LABEL: test_mm512_maskz_cvtne2ps2bf16_512:
				; X64: # %bb.0: # %entry
				; X64-NEXT: kmovd %edi, %k1 # encoding: [0xc5,0xfb,0x92,0xcf]
				; X64-NEXT: vcvtne2ps2bf16 %zmm1, %zmm0, %zmm0 {%k1} {z} # encoding: [0x62,0xf2,0x7f,0xc9,0x72,0xc1]
				; X64-NEXT: retq # encoding: [0xc3]
				entry:
				%0 = tail call <32 x i16> @llvm.x86.avx512bf16.cvtne2ps2bf16.512(<16 x float> %A, <16 x float> %B) #4
				%1 = bitcast i32 %U to <32 x i1>
				%2 = select <32 x i1> %1, <32 x i16> %0, <32 x i16> zeroinitializer
				%3 = bitcast <32 x i16> %2 to <8 x i64>
				ret <8 x i64> %3
				}

				define <8 x i64> @test_mm512_mask_cvtne2ps2bf16_512(<8 x i64> %C, i32 %U, <16 x float> %A, <16 x float> %B) local_unnamed_addr #2 {
				; X86-LABEL: test_mm512_mask_cvtne2ps2bf16_512:
				; X86: # %bb.0: # %entry
				; X86-NEXT: kmovd {{[0-9]+}}(%esp), %k1 # encoding: [0xc4,0xe1,0xf9,0x90,0x4c,0x24,0x04]
				; X86-NEXT: vcvtne2ps2bf16 %zmm2, %zmm1, %zmm0 {%k1} # encoding: [0x62,0xf2,0x77,0x49,0x72,0xc2]
				; X86-NEXT: retl # encoding: [0xc3]
				;
				; X64-LABEL: test_mm512_mask_cvtne2ps2bf16_512:
				; X64: # %bb.0: # %entry
				; X64-NEXT: kmovd %edi, %k1 # encoding: [0xc5,0xfb,0x92,0xcf]
				; X64-NEXT: vcvtne2ps2bf16 %zmm2, %zmm1, %zmm0 {%k1} # encoding: [0x62,0xf2,0x77,0x49,0x72,0xc2]
				; X64-NEXT: retq # encoding: [0xc3]
				entry:
				%0 = tail call <32 x i16> @llvm.x86.avx512bf16.cvtne2ps2bf16.512(<16 x float> %A, <16 x float> %B) #4
				%1 = bitcast <8 x i64> %C to <32 x i16>
				%2 = bitcast i32 %U to <32 x i1>
				%3 = select <32 x i1> %2, <32 x i16> %0, <32 x i16> %1
				%4 = bitcast <32 x i16> %3 to <8 x i64>
				ret <8 x i64> %4
				}

				declare <16 x i16> @llvm.x86.avx512bf16.cvtneps2bf16.512(<16 x float>) #3

				define <4 x i64> @test_mm512_cvtneps2bf16_512(<16 x float> %A) local_unnamed_addr #2 {
				; CHECK-LABEL: test_mm512_cvtneps2bf16_512:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vcvtneps2bf16 %zmm0, %ymm0 # encoding: [0x62,0xf2,0x7e,0x48,0x72,0xc0]
				; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
				entry:
				%0 = tail call <16 x i16> @llvm.x86.avx512bf16.cvtneps2bf16.512(<16 x float> %A) #4
				%1 = bitcast <16 x i16> %0 to <4 x i64>
				ret <4 x i64> %1
				}

				define <4 x i64> @test_mm512_maskz_cvtneps2bf16_512(<16 x float> %A, i16 %U) local_unnamed_addr #2 {
				; X86-LABEL: test_mm512_maskz_cvtneps2bf16_512:
				; X86: # %bb.0: # %entry
				; X86-NEXT: kmovw 4(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x04]
				; X86-NEXT: vcvtneps2bf16 %zmm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf2,0x7e,0xc9,0x72,0xc0]
				; X86-NEXT: retl # encoding: [0xc3]
				;
				; X64-LABEL: test_mm512_maskz_cvtneps2bf16_512:
				; X64: # %bb.0: # %entry
				; X64-NEXT: kmovd %edi, %k1 # encoding: [0xc5,0xfb,0x92,0xcf]
				; X64-NEXT: vcvtneps2bf16 %zmm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf2,0x7e,0xc9,0x72,0xc0]
				; X64-NEXT: retq # encoding: [0xc3]
				entry:
				%0 = tail call <16 x i16> @llvm.x86.avx512bf16.cvtneps2bf16.512(<16 x float> %A) #4
				%1 = bitcast i16 %U to <16 x i1>
				%2 = select <16 x i1> %1, <16 x i16> %0, <16 x i16> zeroinitializer
				%3 = bitcast <16 x i16> %2 to <4 x i64>
				ret <4 x i64> %3
				}

				define <4 x i64> @test_mm512_mask_cvtneps2bf16_512(<4 x i64> %C, i16 %U, <16 x float> %A) local_unnamed_addr #2 {
				; X86-LABEL: test_mm512_mask_cvtneps2bf16_512:
				; X86: # %bb.0: # %entry
				; X86-NEXT: kmovw 4(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x04]
				; X86-NEXT: vcvtneps2bf16 %zmm1, %ymm0 {%k1} # encoding: [0x62,0xf2,0x7e,0x49,0x72,0xc1]
				; X86-NEXT: retl # encoding: [0xc3]
				;
				; X64-LABEL: test_mm512_mask_cvtneps2bf16_512:
				; X64: # %bb.0: # %entry
				; X64-NEXT: kmovd %edi, %k1 # encoding: [0xc5,0xfb,0x92,0xcf]
				; X64-NEXT: vcvtneps2bf16 %zmm1, %ymm0 {%k1} # encoding: [0x62,0xf2,0x7e,0x49,0x72,0xc1]
				; X64-NEXT: retq # encoding: [0xc3]
				entry:
				%0 = tail call <16 x i16> @llvm.x86.avx512bf16.cvtneps2bf16.512(<16 x float> %A) #4
				%1 = bitcast <4 x i64> %C to <16 x i16>
				%2 = bitcast i16 %U to <16 x i1>
				%3 = select <16 x i1> %2, <16 x i16> %0, <16 x i16> %1
				%4 = bitcast <16 x i16> %3 to <4 x i64>
				ret <4 x i64> %4
				}

				declare <16 x float> @llvm.x86.avx512bf16.dpbf16ps.512(<16 x float>, <16 x i32>, <16 x i32>) #3

				define <16 x float> @test_mm512_dpbf16ps_512(<16 x float> %E, <16 x i32> %A, <16 x i32> %B) local_unnamed_addr #2 {
				; CHECK-LABEL: test_mm512_dpbf16ps_512:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vdpbf16ps %zmm2, %zmm1, %zmm0 # encoding: [0x62,0xf2,0x76,0x48,0x52,0xc2]
				; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
				entry:
				%0 = tail call <16 x float> @llvm.x86.avx512bf16.dpbf16ps.512(<16 x float> %E, <16 x i32> %A, <16 x i32> %B) #4
				ret <16 x float> %0
				}

				define <16 x float> @test_mm512_maskz_dpbf16ps_512(<16 x float> %E, <16 x i32> %A, <16 x i32> %B, i16 zeroext %U) local_unnamed_addr #2 {
				; X86-LABEL: test_mm512_maskz_dpbf16ps_512:
				; X86: # %bb.0: # %entry
				; X86-NEXT: kmovw 4(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x04]
				; X86-NEXT: vdpbf16ps %zmm2, %zmm1, %zmm0 {%k1} {z} # encoding: [0x62,0xf2,0x76,0xc9,0x52,0xc2]
				; X86-NEXT: retl # encoding: [0xc3]
				;
				; X64-LABEL: test_mm512_maskz_dpbf16ps_512:
				; X64: # %bb.0: # %entry
				; X64-NEXT: kmovd %edi, %k1 # encoding: [0xc5,0xfb,0x92,0xcf]
				; X64-NEXT: vdpbf16ps %zmm2, %zmm1, %zmm0 {%k1} {z} # encoding: [0x62,0xf2,0x76,0xc9,0x52,0xc2]
				; X64-NEXT: retq # encoding: [0xc3]
				entry:
				%0 = tail call <16 x float> @llvm.x86.avx512bf16.dpbf16ps.512(<16 x float> %E, <16 x i32> %A, <16 x i32> %B) #4
				%1 = bitcast i16 %U to <16 x i1>
				%2 = select <16 x i1> %1, <16 x float> %0, <16 x float> zeroinitializer
				ret <16 x float> %2
				}
				define <16 x float> @test_mm512_mask_dpbf16ps_512(i16 zeroext %U, <16 x float> %E, <16 x i32> %A, <16 x i32> %B) local_unnamed_addr #2 {
				; X86-LABEL: test_mm512_mask_dpbf16ps_512:
				; X86: # %bb.0: # %entry
				; X86-NEXT: kmovw 4(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x04]
				; X86-NEXT: vdpbf16ps %zmm2, %zmm1, %zmm0 {%k1} # encoding: [0x62,0xf2,0x76,0x49,0x52,0xc2]
				; X86-NEXT: retl # encoding: [0xc3]
				;
				; X64-LABEL: test_mm512_mask_dpbf16ps_512:
				; X64: # %bb.0: # %entry
				; X64-NEXT: kmovd %edi, %k1 # encoding: [0xc5,0xfb,0x92,0xcf]
				; X64-NEXT: vdpbf16ps %zmm2, %zmm1, %zmm0 {%k1} # encoding: [0x62,0xf2,0x76,0x49,0x52,0xc2]
				; X64-NEXT: retq # encoding: [0xc3]
				entry:
				%0 = tail call <16 x float> @llvm.x86.avx512bf16.dpbf16ps.512(<16 x float> %E, <16 x i32> %A, <16 x i32> %B) #4
				%1 = bitcast i16 %U to <16 x i1>
				%2 = select <16 x i1> %1, <16 x float> %0, <16 x float> %E
				ret <16 x float> %2
				}

test/CodeGen/X86/avx512bf16-vl-intrinsics.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=+avx512bf16 -mattr=+avx512vl --show-mc-encoding \| FileCheck %s --check-prefixes=CHECK,X86
				; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bf16 -mattr=+avx512vl --show-mc-encoding \| FileCheck %s --check-prefixes=CHECK,X64

				declare <8 x i16> @llvm.x86.avx512bf16.cvtne2ps2bf16.128(<4 x float>, <4 x float>) #1

				define <2 x i64> @test_mm_cvtne2ps2bf16_128(<4 x float> %A, <4 x float> %B) local_unnamed_addr #0 {
				; CHECK-LABEL: test_mm_cvtne2ps2bf16_128:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vcvtne2ps2bf16 %xmm1, %xmm0, %xmm0 # encoding: [0x62,0xf2,0x7f,0x08,0x72,0xc1]
				; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
				entry:
				%0 = tail call <8 x i16> @llvm.x86.avx512bf16.cvtne2ps2bf16.128(<4 x float> %A, <4 x float> %B) #2
				%1 = bitcast <8 x i16> %0 to <2 x i64>
				ret <2 x i64> %1
				}

				define <2 x i64> @test_mm_maskz_cvtne2ps2bf16_128(<4 x float> %A, <4 x float> %B, i8 zeroext %U) local_unnamed_addr #0 {
				; X86-LABEL: test_mm_maskz_cvtne2ps2bf16_128:
				; X86: # %bb.0: # %entry
				; X86-NEXT: movzbl {{[0-9]+}}(%esp), %eax # encoding: [0x0f,0xb6,0x44,0x24,0x04]
				; X86-NEXT: kmovd %eax, %k1 # encoding: [0xc5,0xfb,0x92,0xc8]
				; X86-NEXT: vcvtne2ps2bf16 %xmm1, %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf2,0x7f,0x89,0x72,0xc1]
				; X86-NEXT: retl # encoding: [0xc3]
				;
				; X64-LABEL: test_mm_maskz_cvtne2ps2bf16_128:
				; X64: # %bb.0: # %entry
				; X64-NEXT: kmovd %edi, %k1 # encoding: [0xc5,0xfb,0x92,0xcf]
				; X64-NEXT: vcvtne2ps2bf16 %xmm1, %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf2,0x7f,0x89,0x72,0xc1]
				; X64-NEXT: retq # encoding: [0xc3]
				entry:
				%0 = tail call <8 x i16> @llvm.x86.avx512bf16.cvtne2ps2bf16.128(<4 x float> %A, <4 x float> %B) #2
				%1 = bitcast i8 %U to <8 x i1>
				%2 = select <8 x i1> %1, <8 x i16> %0, <8 x i16> zeroinitializer
				%3 = bitcast <8 x i16> %2 to <2 x i64>
				ret <2 x i64> %3
				}

				define <2 x i64> @test_mm_mask_cvtne2ps2bf16_128(<2 x i64> %C, i8 zeroext %U, <4 x float> %A, <4 x float> %B) local_unnamed_addr #0 {
				; X86-LABEL: test_mm_mask_cvtne2ps2bf16_128:
				; X86: # %bb.0: # %entry
				; X86-NEXT: movzbl {{[0-9]+}}(%esp), %eax # encoding: [0x0f,0xb6,0x44,0x24,0x04]
				; X86-NEXT: kmovd %eax, %k1 # encoding: [0xc5,0xfb,0x92,0xc8]
				; X86-NEXT: vcvtne2ps2bf16 %xmm2, %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x77,0x09,0x72,0xc2]
				; X86-NEXT: retl # encoding: [0xc3]
				;
				; X64-LABEL: test_mm_mask_cvtne2ps2bf16_128:
				; X64: # %bb.0: # %entry
				; X64-NEXT: kmovd %edi, %k1 # encoding: [0xc5,0xfb,0x92,0xcf]
				; X64-NEXT: vcvtne2ps2bf16 %xmm2, %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x77,0x09,0x72,0xc2]
				; X64-NEXT: retq # encoding: [0xc3]
				entry:
				%0 = tail call <8 x i16> @llvm.x86.avx512bf16.cvtne2ps2bf16.128(<4 x float> %A, <4 x float> %B) #2
				%1 = bitcast <2 x i64> %C to <8 x i16>
				%2 = bitcast i8 %U to <8 x i1>
				%3 = select <8 x i1> %2, <8 x i16> %0, <8 x i16> %1
				%4 = bitcast <8 x i16> %3 to <2 x i64>
				ret <2 x i64> %4
				}

				declare <16 x i16> @llvm.x86.avx512bf16.cvtne2ps2bf16.256(<8 x float>, <8 x float>) #3

				define <4 x i64> @test_mm256_cvtne2ps2bf16_256(<8 x float> %A, <8 x float> %B) local_unnamed_addr #1 {
				; CHECK-LABEL: test_mm256_cvtne2ps2bf16_256:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vcvtne2ps2bf16 %ymm1, %ymm0, %ymm0 # encoding: [0x62,0xf2,0x7f,0x28,0x72,0xc1]
				; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
				entry:
				%0 = tail call <16 x i16> @llvm.x86.avx512bf16.cvtne2ps2bf16.256(<8 x float> %A, <8 x float> %B) #4
				%1 = bitcast <16 x i16> %0 to <4 x i64>
				ret <4 x i64> %1
				}

				define <4 x i64> @test_mm256_maskz_cvtne2ps2bf16_256(<8 x float> %A, <8 x float> %B, i16 zeroext %U) local_unnamed_addr #1 {
				; X86-LABEL: test_mm256_maskz_cvtne2ps2bf16_256:
				; X86: # %bb.0: # %entry
				; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x04]
				; X86-NEXT: vcvtne2ps2bf16 %ymm1, %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf2,0x7f,0xa9,0x72,0xc1]
				; X86-NEXT: retl # encoding: [0xc3]
				;
				; X64-LABEL: test_mm256_maskz_cvtne2ps2bf16_256:
				; X64: # %bb.0: # %entry
				; X64-NEXT: kmovd %edi, %k1 # encoding: [0xc5,0xfb,0x92,0xcf]
				; X64-NEXT: vcvtne2ps2bf16 %ymm1, %ymm0, %ymm0 {%k1} {z} # encoding: [0x62,0xf2,0x7f,0xa9,0x72,0xc1]
				; X64-NEXT: retq # encoding: [0xc3]
				entry:
				%0 = tail call <16 x i16> @llvm.x86.avx512bf16.cvtne2ps2bf16.256(<8 x float> %A, <8 x float> %B) #4
				%1 = bitcast i16 %U to <16 x i1>
				%2 = select <16 x i1> %1, <16 x i16> %0, <16 x i16> zeroinitializer
				%3 = bitcast <16 x i16> %2 to <4 x i64>
				ret <4 x i64> %3
				}

				define <4 x i64> @test_mm256_mask_cvtne2ps2bf16_256(<4 x i64> %C, i16 zeroext %U, <8 x float> %A, <8 x float> %B) local_unnamed_addr #1 {
				; X86-LABEL: test_mm256_mask_cvtne2ps2bf16_256:
				; X86: # %bb.0: # %entry
				; X86-NEXT: kmovw {{[0-9]+}}(%esp), %k1 # encoding: [0xc5,0xf8,0x90,0x4c,0x24,0x04]
				; X86-NEXT: vcvtne2ps2bf16 %ymm2, %ymm1, %ymm0 {%k1} # encoding: [0x62,0xf2,0x77,0x29,0x72,0xc2]
				; X86-NEXT: retl # encoding: [0xc3]
				;
				; X64-LABEL: test_mm256_mask_cvtne2ps2bf16_256:
				; X64: # %bb.0: # %entry
				; X64-NEXT: kmovd %edi, %k1 # encoding: [0xc5,0xfb,0x92,0xcf]
				; X64-NEXT: vcvtne2ps2bf16 %ymm2, %ymm1, %ymm0 {%k1} # encoding: [0x62,0xf2,0x77,0x29,0x72,0xc2]
				; X64-NEXT: retq # encoding: [0xc3]
				entry:
				%0 = tail call <16 x i16> @llvm.x86.avx512bf16.cvtne2ps2bf16.256(<8 x float> %A, <8 x float> %B) #4
				%1 = bitcast <4 x i64> %C to <16 x i16>
				%2 = bitcast i16 %U to <16 x i1>
				%3 = select <16 x i1> %2, <16 x i16> %0, <16 x i16> %1
				%4 = bitcast <16 x i16> %3 to <4 x i64>
				ret <4 x i64> %4
				}

				declare <8 x i16> @llvm.x86.avx512bf16.cvtneps2bf16.256(<8 x float>) #3

				define <2 x i64> @test_mm256_cvtneps2bf16_256(<8 x float> %A) local_unnamed_addr #2 {
				; CHECK-LABEL: test_mm256_cvtneps2bf16_256:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vcvtneps2bf16 %ymm0, %xmm0 # encoding: [0x62,0xf2,0x7e,0x28,0x72,0xc0]
				; CHECK-NEXT: vzeroupper # encoding: [0xc5,0xf8,0x77]
				; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
				entry:
				%0 = tail call <8 x i16> @llvm.x86.avx512bf16.cvtneps2bf16.256(<8 x float> %A) #4
				%1 = bitcast <8 x i16> %0 to <2 x i64>
				ret <2 x i64> %1
				}

				define <2 x i64> @test_mm256_maskz_cvtneps2bf16_256(<8 x float> %A, i8 zeroext %U) local_unnamed_addr #2 {
				; X86-LABEL: test_mm256_maskz_cvtneps2bf16_256:
				; X86: # %bb.0: # %entry
				; X86-NEXT: movzbl {{[0-9]+}}(%esp), %eax # encoding: [0x0f,0xb6,0x44,0x24,0x04]
				; X86-NEXT: kmovd %eax, %k1 # encoding: [0xc5,0xfb,0x92,0xc8]
				; X86-NEXT: vcvtneps2bf16 %ymm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf2,0x7e,0xa9,0x72,0xc0]
				; X86-NEXT: vzeroupper # encoding: [0xc5,0xf8,0x77]
				; X86-NEXT: retl # encoding: [0xc3]
				;
				; X64-LABEL: test_mm256_maskz_cvtneps2bf16_256:
				; X64: # %bb.0: # %entry
				; X64-NEXT: kmovd %edi, %k1 # encoding: [0xc5,0xfb,0x92,0xcf]
				; X64-NEXT: vcvtneps2bf16 %ymm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf2,0x7e,0xa9,0x72,0xc0]
				; X64-NEXT: vzeroupper # encoding: [0xc5,0xf8,0x77]
				; X64-NEXT: retq # encoding: [0xc3]
				entry:
				%0 = tail call <8 x i16> @llvm.x86.avx512bf16.cvtneps2bf16.256(<8 x float> %A) #4
				%1 = bitcast i8 %U to <8 x i1>
				%2 = select <8 x i1> %1, <8 x i16> %0, <8 x i16> zeroinitializer
				%3 = bitcast <8 x i16> %2 to <2 x i64>
				ret <2 x i64> %3
				}

				define <2 x i64> @test_mm256_mask_cvtneps2bf16_256(<2 x i64> %C, i8 zeroext %U, <8 x float> %A) local_unnamed_addr #2 {
				; X86-LABEL: test_mm256_mask_cvtneps2bf16_256:
				; X86: # %bb.0: # %entry
				; X86-NEXT: movzbl {{[0-9]+}}(%esp), %eax # encoding: [0x0f,0xb6,0x44,0x24,0x04]
				; X86-NEXT: kmovd %eax, %k1 # encoding: [0xc5,0xfb,0x92,0xc8]
				; X86-NEXT: vcvtneps2bf16 %ymm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x7e,0x29,0x72,0xc1]
				; X86-NEXT: vzeroupper # encoding: [0xc5,0xf8,0x77]
				; X86-NEXT: retl # encoding: [0xc3]
				;
				; X64-LABEL: test_mm256_mask_cvtneps2bf16_256:
				; X64: # %bb.0: # %entry
				; X64-NEXT: kmovd %edi, %k1 # encoding: [0xc5,0xfb,0x92,0xcf]
				; X64-NEXT: vcvtneps2bf16 %ymm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x7e,0x29,0x72,0xc1]
				; X64-NEXT: vzeroupper # encoding: [0xc5,0xf8,0x77]
				; X64-NEXT: retq # encoding: [0xc3]
				entry:
				%0 = tail call <8 x i16> @llvm.x86.avx512bf16.cvtneps2bf16.256(<8 x float> %A) #4
				%1 = bitcast <2 x i64> %C to <8 x i16>
				%2 = bitcast i8 %U to <8 x i1>
				%3 = select <8 x i1> %2, <8 x i16> %0, <8 x i16> %1
				%4 = bitcast <8 x i16> %3 to <2 x i64>
				ret <2 x i64> %4
				}

				declare <8 x i16> @llvm.x86.avx512bf16.mask.cvtneps2bf16.128(<4 x float>, <8 x i16>, <4 x i1>) #3

				define <2 x i64> @test_mm128_cvtneps2bf16_128(<4 x float> %A) local_unnamed_addr #2 {
				; CHECK-LABEL: test_mm128_cvtneps2bf16_128:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vcvtneps2bf16 %xmm0, %xmm0 # encoding: [0x62,0xf2,0x7e,0x08,0x72,0xc0]
				; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
				entry:
				%0 = tail call <8 x i16> @llvm.x86.avx512bf16.mask.cvtneps2bf16.128(<4 x float> %A, <8 x i16> undef, <4 x i1> <i1 true, i1 true, i1 true, i1 true>) #4
				%1 = bitcast <8 x i16> %0 to <2 x i64>
				ret <2 x i64> %1
				}

				define <2 x i64> @test_mm128_maskz_cvtneps2bf16_128(<4 x float> %A, i8 zeroext %U) local_unnamed_addr #2 {
				; X86-LABEL: test_mm128_maskz_cvtneps2bf16_128:
				; X86: # %bb.0: # %entry
				; X86-NEXT: movzbl {{[0-9]+}}(%esp), %eax # encoding: [0x0f,0xb6,0x44,0x24,0x04]
				; X86-NEXT: kmovd %eax, %k1 # encoding: [0xc5,0xfb,0x92,0xc8]
				; X86-NEXT: vcvtneps2bf16 %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf2,0x7e,0x89,0x72,0xc0]
				; X86-NEXT: retl # encoding: [0xc3]
				;
				; X64-LABEL: test_mm128_maskz_cvtneps2bf16_128:
				; X64: # %bb.0: # %entry
				; X64-NEXT: kmovd %edi, %k1 # encoding: [0xc5,0xfb,0x92,0xcf]
				; X64-NEXT: vcvtneps2bf16 %xmm0, %xmm0 {%k1} {z} # encoding: [0x62,0xf2,0x7e,0x89,0x72,0xc0]
				; X64-NEXT: retq # encoding: [0xc3]
				entry:
				%0 = bitcast i8 %U to <8 x i1>
				%1 = shufflevector <8 x i1> %0, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
				%2 = tail call <8 x i16> @llvm.x86.avx512bf16.mask.cvtneps2bf16.128(<4 x float> %A, <8 x i16> zeroinitializer, <4 x i1> %1) #4
				%3 = bitcast <8 x i16> %2 to <2 x i64>
				ret <2 x i64> %3
				}

				define <2 x i64> @test_mm128_mask_cvtneps2bf16_128(<2 x i64> %C, i8 zeroext %U, <4 x float> %A) local_unnamed_addr #2 {
				; X86-LABEL: test_mm128_mask_cvtneps2bf16_128:
				; X86: # %bb.0: # %entry
				; X86-NEXT: movzbl {{[0-9]+}}(%esp), %eax # encoding: [0x0f,0xb6,0x44,0x24,0x04]
				; X86-NEXT: kmovd %eax, %k1 # encoding: [0xc5,0xfb,0x92,0xc8]
				; X86-NEXT: vcvtneps2bf16 %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x7e,0x09,0x72,0xc1]
				; X86-NEXT: retl # encoding: [0xc3]
				;
				; X64-LABEL: test_mm128_mask_cvtneps2bf16_128:
				; X64: # %bb.0: # %entry
				; X64-NEXT: kmovd %edi, %k1 # encoding: [0xc5,0xfb,0x92,0xcf]
				; X64-NEXT: vcvtneps2bf16 %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x7e,0x09,0x72,0xc1]
				; X64-NEXT: retq # encoding: [0xc3]
				entry:
				%0 = bitcast i8 %U to <8 x i1>
				%1 = shufflevector <8 x i1> %0, <8 x i1> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
				%2 = bitcast <2 x i64> %C to <8 x i16>
				%3 = tail call <8 x i16> @llvm.x86.avx512bf16.mask.cvtneps2bf16.128(<4 x float> %A, <8 x i16> %2, <4 x i1> %1) #4
				%4 = bitcast <8 x i16> %3 to <2 x i64>
				ret <2 x i64> %4
				}

				; Make sure we don't fold a select into the 128 bit form of cvtneps2bf16. It
				; always writes zeros to bits 127:64 regardless of mask.
				define <2 x i64> @test_mm128_cvtneps2bf16_128_select(<2 x i64> %C, i8 zeroext %U, <4 x float> %A) local_unnamed_addr #2 {
				; X86-LABEL: test_mm128_cvtneps2bf16_128_select:
				; X86: # %bb.0: # %entry
				; X86-NEXT: movzbl {{[0-9]+}}(%esp), %eax # encoding: [0x0f,0xb6,0x44,0x24,0x04]
				; X86-NEXT: kmovd %eax, %k1 # encoding: [0xc5,0xfb,0x92,0xc8]
				; X86-NEXT: vcvtneps2bf16 %xmm1, %xmm1 # encoding: [0x62,0xf2,0x7e,0x08,0x72,0xc9]
				; X86-NEXT: vmovdqu16 %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf1,0xff,0x09,0x6f,0xc1]
				; X86-NEXT: retl # encoding: [0xc3]
				;
				; X64-LABEL: test_mm128_cvtneps2bf16_128_select:
				; X64: # %bb.0: # %entry
				; X64-NEXT: kmovd %edi, %k1 # encoding: [0xc5,0xfb,0x92,0xcf]
				; X64-NEXT: vcvtneps2bf16 %xmm1, %xmm1 # encoding: [0x62,0xf2,0x7e,0x08,0x72,0xc9]
				; X64-NEXT: vmovdqu16 %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf1,0xff,0x09,0x6f,0xc1]
				; X64-NEXT: retq # encoding: [0xc3]
				entry:
				%0 = bitcast i8 %U to <8 x i1>
				%1 = bitcast <2 x i64> %C to <8 x i16>
				%2 = tail call <8 x i16> @llvm.x86.avx512bf16.mask.cvtneps2bf16.128(<4 x float> %A, <8 x i16> undef, <4 x i1> <i1 true, i1 true, i1 true, i1 true>) #4
				%3 = select <8 x i1> %0, <8 x i16> %2, <8 x i16> %1
				%4 = bitcast <8 x i16> %3 to <2 x i64>
				ret <2 x i64> %4
				}

				declare <8 x float> @llvm.x86.avx512bf16.dpbf16ps.256(<8 x float>, <8 x i32>, <8 x i32>) #3

				define <8 x float> @test_mm256_dpbf16ps_256(<8 x float> %E, <8 x i32> %A, <8 x i32> %B) local_unnamed_addr #2 {
				; CHECK-LABEL: test_mm256_dpbf16ps_256:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vdpbf16ps %ymm2, %ymm1, %ymm0 # encoding: [0x62,0xf2,0x76,0x28,0x52,0xc2]
				; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
				entry:
				%0 = tail call <8 x float> @llvm.x86.avx512bf16.dpbf16ps.256(<8 x float> %E, <8 x i32> %A, <8 x i32> %B) #4
				ret <8 x float> %0
				}

				define <8 x float> @test_mm256_maskz_dpbf16ps_256(<8 x float> %E, <8 x i32> %A, <8 x i32> %B, i8 zeroext %U) local_unnamed_addr #2 {
				; X86-LABEL: test_mm256_maskz_dpbf16ps_256:
				; X86: # %bb.0: # %entry
				; X86-NEXT: movzbl {{[0-9]+}}(%esp), %eax # encoding: [0x0f,0xb6,0x44,0x24,0x04]
				; X86-NEXT: kmovd %eax, %k1 # encoding: [0xc5,0xfb,0x92,0xc8]
				; X86-NEXT: vdpbf16ps %ymm2, %ymm1, %ymm0 {%k1} {z} # encoding: [0x62,0xf2,0x76,0xa9,0x52,0xc2]
				; X86-NEXT: retl # encoding: [0xc3]
				;
				; X64-LABEL: test_mm256_maskz_dpbf16ps_256:
				; X64: # %bb.0: # %entry
				; X64-NEXT: kmovd %edi, %k1 # encoding: [0xc5,0xfb,0x92,0xcf]
				; X64-NEXT: vdpbf16ps %ymm2, %ymm1, %ymm0 {%k1} {z} # encoding: [0x62,0xf2,0x76,0xa9,0x52,0xc2]
				; X64-NEXT: retq # encoding: [0xc3]
				entry:
				%0 = tail call <8 x float> @llvm.x86.avx512bf16.dpbf16ps.256(<8 x float> %E, <8 x i32> %A, <8 x i32> %B) #4
				%1 = bitcast i8 %U to <8 x i1>
				%2 = select <8 x i1> %1, <8 x float> %0, <8 x float> zeroinitializer
				ret <8 x float> %2
				}
				define <8 x float> @test_mm256_mask_dpbf16ps_256(i8 zeroext %U, <8 x float> %E, <8 x i32> %A, <8 x i32> %B) local_unnamed_addr #2 {
				; X86-LABEL: test_mm256_mask_dpbf16ps_256:
				; X86: # %bb.0: # %entry
				; X86-NEXT: movzbl {{[0-9]+}}(%esp), %eax # encoding: [0x0f,0xb6,0x44,0x24,0x04]
				; X86-NEXT: kmovd %eax, %k1 # encoding: [0xc5,0xfb,0x92,0xc8]
				; X86-NEXT: vdpbf16ps %ymm2, %ymm1, %ymm0 {%k1} # encoding: [0x62,0xf2,0x76,0x29,0x52,0xc2]
				; X86-NEXT: retl # encoding: [0xc3]
				;
				; X64-LABEL: test_mm256_mask_dpbf16ps_256:
				; X64: # %bb.0: # %entry
				; X64-NEXT: kmovd %edi, %k1 # encoding: [0xc5,0xfb,0x92,0xcf]
				; X64-NEXT: vdpbf16ps %ymm2, %ymm1, %ymm0 {%k1} # encoding: [0x62,0xf2,0x76,0x29,0x52,0xc2]
				; X64-NEXT: retq # encoding: [0xc3]
				entry:
				%0 = tail call <8 x float> @llvm.x86.avx512bf16.dpbf16ps.256(<8 x float> %E, <8 x i32> %A, <8 x i32> %B) #4
				%1 = bitcast i8 %U to <8 x i1>
				%2 = select <8 x i1> %1, <8 x float> %0, <8 x float> %E
				ret <8 x float> %2
				}

				declare <4 x float> @llvm.x86.avx512bf16.dpbf16ps.128(<4 x float>, <4 x i32>, <4 x i32>) #3

				define <4 x float> @test_mm128_dpbf16ps_128(<4 x float> %E, <4 x i32> %A, <4 x i32> %B) local_unnamed_addr #2 {
				; CHECK-LABEL: test_mm128_dpbf16ps_128:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: vdpbf16ps %xmm2, %xmm1, %xmm0 # encoding: [0x62,0xf2,0x76,0x08,0x52,0xc2]
				; CHECK-NEXT: ret{{[l\|q]}} # encoding: [0xc3]
				entry:
				%0 = tail call <4 x float> @llvm.x86.avx512bf16.dpbf16ps.128(<4 x float> %E, <4 x i32> %A, <4x i32> %B) #4
				ret <4 x float> %0
				}

				define <4 x float> @test_mm128_maskz_dpbf16ps_128(<4 x float> %E, <4 x i32> %A, <4 x i32> %B, i4 zeroext %U) local_unnamed_addr #2 {
				; X86-LABEL: test_mm128_maskz_dpbf16ps_128:
				; X86: # %bb.0: # %entry
				; X86-NEXT: movb {{[0-9]+}}(%esp), %al # encoding: [0x8a,0x44,0x24,0x04]
				; X86-NEXT: kmovd %eax, %k1 # encoding: [0xc5,0xfb,0x92,0xc8]
				; X86-NEXT: vdpbf16ps %xmm2, %xmm1, %xmm0 {%k1} {z} # encoding: [0x62,0xf2,0x76,0x89,0x52,0xc2]
				; X86-NEXT: retl # encoding: [0xc3]
				;
				; X64-LABEL: test_mm128_maskz_dpbf16ps_128:
				; X64: # %bb.0: # %entry
				; X64-NEXT: kmovd %edi, %k1 # encoding: [0xc5,0xfb,0x92,0xcf]
				; X64-NEXT: vdpbf16ps %xmm2, %xmm1, %xmm0 {%k1} {z} # encoding: [0x62,0xf2,0x76,0x89,0x52,0xc2]
				; X64-NEXT: retq # encoding: [0xc3]
				entry:
				%0 = tail call <4 x float> @llvm.x86.avx512bf16.dpbf16ps.128(<4 x float> %E, <4 x i32> %A, <4 x i32> %B) #4
				%1 = bitcast i4 %U to <4 x i1>
				%2 = select <4 x i1> %1, <4 x float> %0, <4 x float> zeroinitializer
				ret <4 x float> %2
				}
				define <4 x float> @test_mm128_mask_dpbf16ps_128(i4 zeroext %U, <4 x float> %E, <4 x i32> %A, <4 x i32> %B) local_unnamed_addr #2 {
				; X86-LABEL: test_mm128_mask_dpbf16ps_128:
				; X86: # %bb.0: # %entry
				; X86-NEXT: movb {{[0-9]+}}(%esp), %al # encoding: [0x8a,0x44,0x24,0x04]
				; X86-NEXT: kmovd %eax, %k1 # encoding: [0xc5,0xfb,0x92,0xc8]
				; X86-NEXT: vdpbf16ps %xmm2, %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x76,0x09,0x52,0xc2]
				; X86-NEXT: retl # encoding: [0xc3]
				;
				; X64-LABEL: test_mm128_mask_dpbf16ps_128:
				; X64: # %bb.0: # %entry
				; X64-NEXT: kmovd %edi, %k1 # encoding: [0xc5,0xfb,0x92,0xcf]
				; X64-NEXT: vdpbf16ps %xmm2, %xmm1, %xmm0 {%k1} # encoding: [0x62,0xf2,0x76,0x09,0x52,0xc2]
				; X64-NEXT: retq # encoding: [0xc3]
				entry:
				%0 = tail call <4 x float> @llvm.x86.avx512bf16.dpbf16ps.128(<4 x float> %E, <4 x i32> %A, <4 x i32> %B) #4
				%1 = bitcast i4 %U to <4 x i1>
				%2 = select <4 x i1> %1, <4 x float> %0, <4 x float> %E
				ret <4 x float> %2
				}

test/MC/Disassembler/X86/avx512bf16-att.txt

This file was added.

				# RUN: llvm-mc --disassemble %s -triple=i686-apple-darwin9 \| FileCheck %s

				# CHECK: vcvtne2ps2bf16 %zmm4, %zmm3, %zmm2
				0x62,0xf2,0x67,0x48,0x72,0xd4

				# CHECK: vcvtne2ps2bf16 %zmm4, %zmm3, %zmm2 {%k7}
				0x62,0xf2,0x67,0x4f,0x72,0xd4

				# CHECK: vcvtne2ps2bf16 %zmm4, %zmm3, %zmm2 {%k7} {z}
				0x62,0xf2,0x67,0xcf,0x72,0xd4

				# CHECK: vcvtne2ps2bf16 268435456(%esp,%esi,8), %zmm3, %zmm2
				0x62,0xf2,0x67,0x48,0x72,0x94,0xf4,0x00,0x00,0x00,0x10

				# CHECK: vcvtne2ps2bf16 291(%edi,%eax,4), %zmm3, %zmm2 {%k7}
				0x62,0xf2,0x67,0x4f,0x72,0x94,0x87,0x23,0x01,0x00,0x00

				# CHECK: vcvtne2ps2bf16 (%eax){1to16}, %zmm3, %zmm2
				0x62,0xf2,0x67,0x58,0x72,0x10

				# CHECK: vcvtne2ps2bf16 -2048(,%ebp,2), %zmm3, %zmm2
				0x62,0xf2,0x67,0x48,0x72,0x14,0x6d,0x00,0xf8,0xff,0xff

				# CHECK: vcvtne2ps2bf16 8128(%ecx), %zmm3, %zmm2 {%k7} {z}
				0x62,0xf2,0x67,0xcf,0x72,0x51,0x7f

				# CHECK: vcvtne2ps2bf16 -512(%edx){1to16}, %zmm3, %zmm2 {%k7} {z}
				0x62,0xf2,0x67,0xdf,0x72,0x52,0x80

				# CHECK: vcvtneps2bf16 %zmm3, %ymm2
				0x62,0xf2,0x7e,0x48,0x72,0xd3

				# CHECK: vcvtneps2bf16 %zmm3, %ymm2 {%k7}
				0x62,0xf2,0x7e,0x4f,0x72,0xd3

				# CHECK: vcvtneps2bf16 %zmm3, %ymm2 {%k7} {z}
				0x62,0xf2,0x7e,0xcf,0x72,0xd3

				# CHECK: vcvtneps2bf16 268435456(%esp,%esi,8), %ymm2
				0x62,0xf2,0x7e,0x48,0x72,0x94,0xf4,0x00,0x00,0x00,0x10

				# CHECK: vcvtneps2bf16 291(%edi,%eax,4), %ymm2 {%k7}
				0x62,0xf2,0x7e,0x4f,0x72,0x94,0x87,0x23,0x01,0x00,0x00

				# CHECK: vcvtneps2bf16 (%eax){1to16}, %ymm2
				0x62,0xf2,0x7e,0x58,0x72,0x10

				# CHECK: vcvtneps2bf16 -2048(,%ebp,2), %ymm2
				0x62,0xf2,0x7e,0x48,0x72,0x14,0x6d,0x00,0xf8,0xff,0xff

				# CHECK: vcvtneps2bf16 8128(%ecx), %ymm2 {%k7} {z}
				0x62,0xf2,0x7e,0xcf,0x72,0x51,0x7f

				# CHECK: vcvtneps2bf16 -512(%edx){1to16}, %ymm2 {%k7} {z}
				0x62,0xf2,0x7e,0xdf,0x72,0x52,0x80

				# CHECK: vdpbf16ps %zmm4, %zmm3, %zmm2
				0x62,0xf2,0x66,0x48,0x52,0xd4

				# CHECK: vdpbf16ps %zmm4, %zmm3, %zmm2 {%k7}
				0x62,0xf2,0x66,0x4f,0x52,0xd4

				# CHECK: vdpbf16ps %zmm4, %zmm3, %zmm2 {%k7} {z}
				0x62,0xf2,0x66,0xcf,0x52,0xd4

				# CHECK: vdpbf16ps 268435456(%esp,%esi,8), %zmm3, %zmm2
				0x62,0xf2,0x66,0x48,0x52,0x94,0xf4,0x00,0x00,0x00,0x10

				# CHECK: vdpbf16ps 291(%edi,%eax,4), %zmm3, %zmm2 {%k7}
				0x62,0xf2,0x66,0x4f,0x52,0x94,0x87,0x23,0x01,0x00,0x00

				# CHECK: vdpbf16ps (%eax){1to16}, %zmm3, %zmm2
				0x62,0xf2,0x66,0x58,0x52,0x10

				# CHECK: vdpbf16ps -2048(,%ebp,2), %zmm3, %zmm2
				0x62,0xf2,0x66,0x48,0x52,0x14,0x6d,0x00,0xf8,0xff,0xff

				# CHECK: vdpbf16ps 8128(%ecx), %zmm3, %zmm2 {%k7} {z}
				0x62,0xf2,0x66,0xcf,0x52,0x51,0x7f

				# CHECK: vdpbf16ps -512(%edx){1to16}, %zmm3, %zmm2 {%k7} {z}
				0x62,0xf2,0x66,0xdf,0x52,0x52,0x80

test/MC/Disassembler/X86/avx512bf16-intel.txt

This file was added.

				# RUN: llvm-mc --disassemble %s -triple=i686 -x86-asm-syntax=intel --output-asm-variant=1 \| FileCheck %s

				# CHECK: vcvtne2ps2bf16 zmm2, zmm3, zmm4
				0x62,0xf2,0x67,0x48,0x72,0xd4

				# CHECK: vcvtne2ps2bf16 zmm2 {k7}, zmm3, zmm4
				0x62,0xf2,0x67,0x4f,0x72,0xd4

				# CHECK: vcvtne2ps2bf16 zmm2 {k7} {z}, zmm3, zmm4
				0x62,0xf2,0x67,0xcf,0x72,0xd4

				# CHECK: vcvtne2ps2bf16 zmm2, zmm3, zmmword ptr [esp + 8*esi + 268435456]
				0x62,0xf2,0x67,0x48,0x72,0x94,0xf4,0x00,0x00,0x00,0x10

				# CHECK: vcvtne2ps2bf16 zmm2 {k7}, zmm3, zmmword ptr [edi + 4*eax + 291]
				0x62,0xf2,0x67,0x4f,0x72,0x94,0x87,0x23,0x01,0x00,0x00

				# CHECK: vcvtne2ps2bf16 zmm2, zmm3, dword ptr [eax]{1to16}
				0x62,0xf2,0x67,0x58,0x72,0x10

				# CHECK: vcvtne2ps2bf16 zmm2, zmm3, zmmword ptr [2*ebp - 2048]
				0x62,0xf2,0x67,0x48,0x72,0x14,0x6d,0x00,0xf8,0xff,0xff

				# CHECK: vcvtne2ps2bf16 zmm2 {k7} {z}, zmm3, zmmword ptr [ecx + 8128]
				0x62,0xf2,0x67,0xcf,0x72,0x51,0x7f

				# CHECK: vcvtne2ps2bf16 zmm2 {k7} {z}, zmm3, dword ptr [edx - 512]{1to16}
				0x62,0xf2,0x67,0xdf,0x72,0x52,0x80

				# CHECK: vcvtneps2bf16 ymm2, zmm3
				0x62,0xf2,0x7e,0x48,0x72,0xd3

				# CHECK: vcvtneps2bf16 ymm2 {k7}, zmm3
				0x62,0xf2,0x7e,0x4f,0x72,0xd3

				# CHECK: vcvtneps2bf16 ymm2 {k7} {z}, zmm3
				0x62,0xf2,0x7e,0xcf,0x72,0xd3

				# CHECK: vcvtneps2bf16 ymm2, zmmword ptr [esp + 8*esi + 268435456]
				0x62,0xf2,0x7e,0x48,0x72,0x94,0xf4,0x00,0x00,0x00,0x10

				# CHECK: vcvtneps2bf16 ymm2 {k7}, zmmword ptr [edi + 4*eax + 291]
				0x62,0xf2,0x7e,0x4f,0x72,0x94,0x87,0x23,0x01,0x00,0x00

				# CHECK: vcvtneps2bf16 ymm2, dword ptr [eax]{1to16}
				0x62,0xf2,0x7e,0x58,0x72,0x10

				# CHECK: vcvtneps2bf16 ymm2, zmmword ptr [2*ebp - 2048]
				0x62,0xf2,0x7e,0x48,0x72,0x14,0x6d,0x00,0xf8,0xff,0xff

				# CHECK: vcvtneps2bf16 ymm2 {k7} {z}, zmmword ptr [ecx + 8128]
				0x62,0xf2,0x7e,0xcf,0x72,0x51,0x7f

				# CHECK: vcvtneps2bf16 ymm2 {k7} {z}, dword ptr [edx - 512]{1to16}
				0x62,0xf2,0x7e,0xdf,0x72,0x52,0x80

				# CHECK: vdpbf16ps zmm2, zmm3, zmm4
				0x62,0xf2,0x66,0x48,0x52,0xd4

				# CHECK: vdpbf16ps zmm2 {k7}, zmm3, zmm4
				0x62,0xf2,0x66,0x4f,0x52,0xd4

				# CHECK: vdpbf16ps zmm2 {k7} {z}, zmm3, zmm4
				0x62,0xf2,0x66,0xcf,0x52,0xd4

				# CHECK: vdpbf16ps zmm2, zmm3, zmmword ptr [esp + 8*esi + 268435456]
				0x62,0xf2,0x66,0x48,0x52,0x94,0xf4,0x00,0x00,0x00,0x10

				# CHECK: vdpbf16ps zmm2 {k7}, zmm3, zmmword ptr [edi + 4*eax + 291]
				0x62,0xf2,0x66,0x4f,0x52,0x94,0x87,0x23,0x01,0x00,0x00

				# CHECK: vdpbf16ps zmm2, zmm3, dword ptr [eax]{1to16}
				0x62,0xf2,0x66,0x58,0x52,0x10

				# CHECK: vdpbf16ps zmm2, zmm3, zmmword ptr [2*ebp - 2048]
				0x62,0xf2,0x66,0x48,0x52,0x14,0x6d,0x00,0xf8,0xff,0xff

				# CHECK: vdpbf16ps zmm2 {k7} {z}, zmm3, zmmword ptr [ecx + 8128]
				0x62,0xf2,0x66,0xcf,0x52,0x51,0x7f

				# CHECK: vdpbf16ps zmm2 {k7} {z}, zmm3, dword ptr [edx - 512]{1to16}
				0x62,0xf2,0x66,0xdf,0x52,0x52,0x80

test/MC/Disassembler/X86/avx512bf16vl-att.txt

This file was added.

				# RUN: llvm-mc --disassemble %s -triple=i686-apple-darwin9 \| FileCheck %s

				# CHECK: vcvtne2ps2bf16 %ymm4, %ymm3, %ymm2
				0x62,0xf2,0x67,0x28,0x72,0xd4

				# CHECK: vcvtne2ps2bf16 %ymm4, %ymm3, %ymm2 {%k7}
				0x62,0xf2,0x67,0x2f,0x72,0xd4

				# CHECK: vcvtne2ps2bf16 %ymm4, %ymm3, %ymm2 {%k7} {z}
				0x62,0xf2,0x67,0xaf,0x72,0xd4

				# CHECK: vcvtne2ps2bf16 %xmm4, %xmm3, %xmm2
				0x62,0xf2,0x67,0x08,0x72,0xd4

				# CHECK: vcvtne2ps2bf16 %xmm4, %xmm3, %xmm2 {%k7}
				0x62,0xf2,0x67,0x0f,0x72,0xd4

				# CHECK: vcvtne2ps2bf16 %xmm4, %xmm3, %xmm2 {%k7} {z}
				0x62,0xf2,0x67,0x8f,0x72,0xd4

				# CHECK: vcvtne2ps2bf16 268435456(%esp,%esi,8), %ymm3, %ymm2
				0x62,0xf2,0x67,0x28,0x72,0x94,0xf4,0x00,0x00,0x00,0x10

				# CHECK: vcvtne2ps2bf16 291(%edi,%eax,4), %ymm3, %ymm2 {%k7}
				0x62,0xf2,0x67,0x2f,0x72,0x94,0x87,0x23,0x01,0x00,0x00

				# CHECK: vcvtne2ps2bf16 (%eax){1to8}, %ymm3, %ymm2
				0x62,0xf2,0x67,0x38,0x72,0x10

				# CHECK: vcvtne2ps2bf16 -1024(,%ebp,2), %ymm3, %ymm2
				0x62,0xf2,0x67,0x28,0x72,0x14,0x6d,0x00,0xfc,0xff,0xff

				# CHECK: vcvtne2ps2bf16 4064(%ecx), %ymm3, %ymm2 {%k7} {z}
				0x62,0xf2,0x67,0xaf,0x72,0x51,0x7f

				# CHECK: vcvtne2ps2bf16 -512(%edx){1to8}, %ymm3, %ymm2 {%k7} {z}
				0x62,0xf2,0x67,0xbf,0x72,0x52,0x80

				# CHECK: vcvtne2ps2bf16 268435456(%esp,%esi,8), %xmm3, %xmm2
				0x62,0xf2,0x67,0x08,0x72,0x94,0xf4,0x00,0x00,0x00,0x10

				# CHECK: vcvtne2ps2bf16 291(%edi,%eax,4), %xmm3, %xmm2 {%k7}
				0x62,0xf2,0x67,0x0f,0x72,0x94,0x87,0x23,0x01,0x00,0x00

				# CHECK: vcvtne2ps2bf16 (%eax){1to4}, %xmm3, %xmm2
				0x62,0xf2,0x67,0x18,0x72,0x10

				# CHECK: vcvtne2ps2bf16 -512(,%ebp,2), %xmm3, %xmm2
				0x62,0xf2,0x67,0x08,0x72,0x14,0x6d,0x00,0xfe,0xff,0xff

				# CHECK: vcvtne2ps2bf16 2032(%ecx), %xmm3, %xmm2 {%k7} {z}
				0x62,0xf2,0x67,0x8f,0x72,0x51,0x7f

				# CHECK: vcvtne2ps2bf16 -512(%edx){1to4}, %xmm3, %xmm2 {%k7} {z}
				0x62,0xf2,0x67,0x9f,0x72,0x52,0x80

				# CHECK: vcvtneps2bf16 %xmm3, %xmm2
				0x62,0xf2,0x7e,0x08,0x72,0xd3

				# CHECK: vcvtneps2bf16 %xmm3, %xmm2 {%k7}
				0x62,0xf2,0x7e,0x0f,0x72,0xd3

				# CHECK: vcvtneps2bf16 %xmm3, %xmm2 {%k7} {z}
				0x62,0xf2,0x7e,0x8f,0x72,0xd3

				# CHECK: vcvtneps2bf16 %ymm3, %xmm2
				0x62,0xf2,0x7e,0x28,0x72,0xd3

				# CHECK: vcvtneps2bf16 %ymm3, %xmm2 {%k7}
				0x62,0xf2,0x7e,0x2f,0x72,0xd3

				# CHECK: vcvtneps2bf16 %ymm3, %xmm2 {%k7} {z}
				0x62,0xf2,0x7e,0xaf,0x72,0xd3

				# CHECK: vcvtneps2bf16x 268435456(%esp,%esi,8), %xmm2
				0x62,0xf2,0x7e,0x08,0x72,0x94,0xf4,0x00,0x00,0x00,0x10

				# CHECK: vcvtneps2bf16x 291(%edi,%eax,4), %xmm2 {%k7}
				0x62,0xf2,0x7e,0x0f,0x72,0x94,0x87,0x23,0x01,0x00,0x00

				# CHECK: vcvtneps2bf16 (%eax){1to4}, %xmm2
				0x62,0xf2,0x7e,0x18,0x72,0x10

				# CHECK: vcvtneps2bf16x -512(,%ebp,2), %xmm2
				0x62,0xf2,0x7e,0x08,0x72,0x14,0x6d,0x00,0xfe,0xff,0xff

				# CHECK: vcvtneps2bf16x 2032(%ecx), %xmm2 {%k7} {z}
				0x62,0xf2,0x7e,0x8f,0x72,0x51,0x7f

				# CHECK: vcvtneps2bf16 -512(%edx){1to4}, %xmm2 {%k7} {z}
				0x62,0xf2,0x7e,0x9f,0x72,0x52,0x80

				# CHECK: vcvtneps2bf16 (%eax){1to8}, %xmm2
				0x62,0xf2,0x7e,0x38,0x72,0x10

				# CHECK: vcvtneps2bf16y -1024(,%ebp,2), %xmm2
				0x62,0xf2,0x7e,0x28,0x72,0x14,0x6d,0x00,0xfc,0xff,0xff

				# CHECK: vcvtneps2bf16y 4064(%ecx), %xmm2 {%k7} {z}
				0x62,0xf2,0x7e,0xaf,0x72,0x51,0x7f

				# CHECK: vcvtneps2bf16 -512(%edx){1to8}, %xmm2 {%k7} {z}
				0x62,0xf2,0x7e,0xbf,0x72,0x52,0x80

				# CHECK: vdpbf16ps %ymm4, %ymm3, %ymm2
				0x62,0xf2,0x66,0x28,0x52,0xd4

				# CHECK: vdpbf16ps %ymm4, %ymm3, %ymm2 {%k7}
				0x62,0xf2,0x66,0x2f,0x52,0xd4

				# CHECK: vdpbf16ps %ymm4, %ymm3, %ymm2 {%k7} {z}
				0x62,0xf2,0x66,0xaf,0x52,0xd4

				# CHECK: vdpbf16ps %xmm4, %xmm3, %xmm2
				0x62,0xf2,0x66,0x08,0x52,0xd4

				# CHECK: vdpbf16ps %xmm4, %xmm3, %xmm2 {%k7}
				0x62,0xf2,0x66,0x0f,0x52,0xd4

				# CHECK: vdpbf16ps %xmm4, %xmm3, %xmm2 {%k7} {z}
				0x62,0xf2,0x66,0x8f,0x52,0xd4

				# CHECK: vdpbf16ps 268435456(%esp,%esi,8), %ymm3, %ymm2
				0x62,0xf2,0x66,0x28,0x52,0x94,0xf4,0x00,0x00,0x00,0x10

				# CHECK: vdpbf16ps 291(%edi,%eax,4), %ymm3, %ymm2 {%k7}
				0x62,0xf2,0x66,0x2f,0x52,0x94,0x87,0x23,0x01,0x00,0x00

				# CHECK: vdpbf16ps (%eax){1to8}, %ymm3, %ymm2
				0x62,0xf2,0x66,0x38,0x52,0x10

				# CHECK: vdpbf16ps -1024(,%ebp,2), %ymm3, %ymm2
				0x62,0xf2,0x66,0x28,0x52,0x14,0x6d,0x00,0xfc,0xff,0xff

				# CHECK: vdpbf16ps 4064(%ecx), %ymm3, %ymm2 {%k7} {z}
				0x62,0xf2,0x66,0xaf,0x52,0x51,0x7f

				# CHECK: vdpbf16ps -512(%edx){1to8}, %ymm3, %ymm2 {%k7} {z}
				0x62,0xf2,0x66,0xbf,0x52,0x52,0x80

				# CHECK: vdpbf16ps 268435456(%esp,%esi,8), %xmm3, %xmm2
				0x62,0xf2,0x66,0x08,0x52,0x94,0xf4,0x00,0x00,0x00,0x10

				# CHECK: vdpbf16ps 291(%edi,%eax,4), %xmm3, %xmm2 {%k7}
				0x62,0xf2,0x66,0x0f,0x52,0x94,0x87,0x23,0x01,0x00,0x00

				# CHECK: vdpbf16ps (%eax){1to4}, %xmm3, %xmm2
				0x62,0xf2,0x66,0x18,0x52,0x10

				# CHECK: vdpbf16ps -512(,%ebp,2), %xmm3, %xmm2
				0x62,0xf2,0x66,0x08,0x52,0x14,0x6d,0x00,0xfe,0xff,0xff

				# CHECK: vdpbf16ps 2032(%ecx), %xmm3, %xmm2 {%k7} {z}
				0x62,0xf2,0x66,0x8f,0x52,0x51,0x7f

				# CHECK: vdpbf16ps -512(%edx){1to4}, %xmm3, %xmm2 {%k7} {z}
				0x62,0xf2,0x66,0x9f,0x52,0x52,0x80

test/MC/Disassembler/X86/avx512bf16vl-intel.txt

This file was added.

				# RUN: llvm-mc --disassemble %s -triple=i686 -x86-asm-syntax=intel --output-asm-variant=1 \| FileCheck %s

				# CHECK: vcvtne2ps2bf16 ymm2, ymm3, ymm4
				0x62,0xf2,0x67,0x28,0x72,0xd4

				# CHECK: vcvtne2ps2bf16 ymm2 {k7}, ymm3, ymm4
				0x62,0xf2,0x67,0x2f,0x72,0xd4

				# CHECK: vcvtne2ps2bf16 ymm2 {k7} {z}, ymm3, ymm4
				0x62,0xf2,0x67,0xaf,0x72,0xd4

				# CHECK: vcvtne2ps2bf16 xmm2, xmm3, xmm4
				0x62,0xf2,0x67,0x08,0x72,0xd4

				# CHECK: vcvtne2ps2bf16 xmm2 {k7}, xmm3, xmm4
				0x62,0xf2,0x67,0x0f,0x72,0xd4

				# CHECK: vcvtne2ps2bf16 xmm2 {k7} {z}, xmm3, xmm4
				0x62,0xf2,0x67,0x8f,0x72,0xd4

				# CHECK: vcvtne2ps2bf16 ymm2, ymm3, ymmword ptr [esp + 8*esi + 268435456]
				0x62,0xf2,0x67,0x28,0x72,0x94,0xf4,0x00,0x00,0x00,0x10

				# CHECK: vcvtne2ps2bf16 ymm2 {k7}, ymm3, ymmword ptr [edi + 4*eax + 291]
				0x62,0xf2,0x67,0x2f,0x72,0x94,0x87,0x23,0x01,0x00,0x00

				# CHECK: vcvtne2ps2bf16 ymm2, ymm3, dword ptr [eax]{1to8}
				0x62,0xf2,0x67,0x38,0x72,0x10

				# CHECK: vcvtne2ps2bf16 ymm2, ymm3, ymmword ptr [2*ebp - 1024]
				0x62,0xf2,0x67,0x28,0x72,0x14,0x6d,0x00,0xfc,0xff,0xff

				# CHECK: vcvtne2ps2bf16 ymm2 {k7} {z}, ymm3, ymmword ptr [ecx + 4064]
				0x62,0xf2,0x67,0xaf,0x72,0x51,0x7f

				# CHECK: vcvtne2ps2bf16 ymm2 {k7} {z}, ymm3, dword ptr [edx - 512]{1to8}
				0x62,0xf2,0x67,0xbf,0x72,0x52,0x80

				# CHECK: vcvtne2ps2bf16 xmm2, xmm3, xmmword ptr [esp + 8*esi + 268435456]
				0x62,0xf2,0x67,0x08,0x72,0x94,0xf4,0x00,0x00,0x00,0x10

				# CHECK: vcvtne2ps2bf16 xmm2 {k7}, xmm3, xmmword ptr [edi + 4*eax + 291]
				0x62,0xf2,0x67,0x0f,0x72,0x94,0x87,0x23,0x01,0x00,0x00

				# CHECK: vcvtne2ps2bf16 xmm2, xmm3, dword ptr [eax]{1to4}
				0x62,0xf2,0x67,0x18,0x72,0x10

				# CHECK: vcvtne2ps2bf16 xmm2, xmm3, xmmword ptr [2*ebp - 512]
				0x62,0xf2,0x67,0x08,0x72,0x14,0x6d,0x00,0xfe,0xff,0xff

				# CHECK: vcvtne2ps2bf16 xmm2 {k7} {z}, xmm3, xmmword ptr [ecx + 2032]
				0x62,0xf2,0x67,0x8f,0x72,0x51,0x7f

				# CHECK: vcvtne2ps2bf16 xmm2 {k7} {z}, xmm3, dword ptr [edx - 512]{1to4}
				0x62,0xf2,0x67,0x9f,0x72,0x52,0x80

				# CHECK: vcvtneps2bf16 xmm2, xmm3
				0x62,0xf2,0x7e,0x08,0x72,0xd3

				# CHECK: vcvtneps2bf16 xmm2 {k7}, xmm3
				0x62,0xf2,0x7e,0x0f,0x72,0xd3

				# CHECK: vcvtneps2bf16 xmm2 {k7} {z}, xmm3
				0x62,0xf2,0x7e,0x8f,0x72,0xd3

				# CHECK: vcvtneps2bf16 xmm2, ymm3
				0x62,0xf2,0x7e,0x28,0x72,0xd3

				# CHECK: vcvtneps2bf16 xmm2 {k7}, ymm3
				0x62,0xf2,0x7e,0x2f,0x72,0xd3

				# CHECK: vcvtneps2bf16 xmm2 {k7} {z}, ymm3
				0x62,0xf2,0x7e,0xaf,0x72,0xd3

				# CHECK: vcvtneps2bf16 xmm2, xmmword ptr [esp + 8*esi + 268435456]
				0x62,0xf2,0x7e,0x08,0x72,0x94,0xf4,0x00,0x00,0x00,0x10

				# CHECK: vcvtneps2bf16 xmm2 {k7}, xmmword ptr [edi + 4*eax + 291]
				0x62,0xf2,0x7e,0x0f,0x72,0x94,0x87,0x23,0x01,0x00,0x00

				# CHECK: vcvtneps2bf16 xmm2, dword ptr [eax]{1to4}
				0x62,0xf2,0x7e,0x18,0x72,0x10

				# CHECK: vcvtneps2bf16 xmm2, xmmword ptr [2*ebp - 512]
				0x62,0xf2,0x7e,0x08,0x72,0x14,0x6d,0x00,0xfe,0xff,0xff

				# CHECK: vcvtneps2bf16 xmm2 {k7} {z}, xmmword ptr [ecx + 2032]
				0x62,0xf2,0x7e,0x8f,0x72,0x51,0x7f

				# CHECK: vcvtneps2bf16 xmm2 {k7} {z}, dword ptr [edx - 512]{1to4}
				0x62,0xf2,0x7e,0x9f,0x72,0x52,0x80

				# CHECK: vcvtneps2bf16 xmm2, dword ptr [eax]{1to8}
				0x62,0xf2,0x7e,0x38,0x72,0x10

				# CHECK: vcvtneps2bf16 xmm2, ymmword ptr [2*ebp - 1024]
				0x62,0xf2,0x7e,0x28,0x72,0x14,0x6d,0x00,0xfc,0xff,0xff

				# CHECK: vcvtneps2bf16 xmm2 {k7} {z}, ymmword ptr [ecx + 4064]
				0x62,0xf2,0x7e,0xaf,0x72,0x51,0x7f

				# CHECK: vcvtneps2bf16 xmm2 {k7} {z}, dword ptr [edx - 512]{1to8}
				0x62,0xf2,0x7e,0xbf,0x72,0x52,0x80

				# CHECK: vdpbf16ps ymm2, ymm3, ymm4
				0x62,0xf2,0x66,0x28,0x52,0xd4

				# CHECK: vdpbf16ps ymm2 {k7}, ymm3, ymm4
				0x62,0xf2,0x66,0x2f,0x52,0xd4

				# CHECK: vdpbf16ps ymm2 {k7} {z}, ymm3, ymm4
				0x62,0xf2,0x66,0xaf,0x52,0xd4

				# CHECK: vdpbf16ps xmm2, xmm3, xmm4
				0x62,0xf2,0x66,0x08,0x52,0xd4

				# CHECK: vdpbf16ps xmm2 {k7}, xmm3, xmm4
				0x62,0xf2,0x66,0x0f,0x52,0xd4

				# CHECK: vdpbf16ps xmm2 {k7} {z}, xmm3, xmm4
				0x62,0xf2,0x66,0x8f,0x52,0xd4

				# CHECK: vdpbf16ps ymm2, ymm3, ymmword ptr [esp + 8*esi + 268435456]
				0x62,0xf2,0x66,0x28,0x52,0x94,0xf4,0x00,0x00,0x00,0x10

				# CHECK: vdpbf16ps ymm2 {k7}, ymm3, ymmword ptr [edi + 4*eax + 291]
				0x62,0xf2,0x66,0x2f,0x52,0x94,0x87,0x23,0x01,0x00,0x00

				# CHECK: vdpbf16ps ymm2, ymm3, dword ptr [eax]{1to8}
				0x62,0xf2,0x66,0x38,0x52,0x10

				# CHECK: vdpbf16ps ymm2, ymm3, ymmword ptr [2*ebp - 1024]
				0x62,0xf2,0x66,0x28,0x52,0x14,0x6d,0x00,0xfc,0xff,0xff

				# CHECK: vdpbf16ps ymm2 {k7} {z}, ymm3, ymmword ptr [ecx + 4064]
				0x62,0xf2,0x66,0xaf,0x52,0x51,0x7f

				# CHECK: vdpbf16ps ymm2 {k7} {z}, ymm3, dword ptr [edx - 512]{1to8}
				0x62,0xf2,0x66,0xbf,0x52,0x52,0x80

				# CHECK: vdpbf16ps xmm2, xmm3, xmmword ptr [esp + 8*esi + 268435456]
				0x62,0xf2,0x66,0x08,0x52,0x94,0xf4,0x00,0x00,0x00,0x10

				# CHECK: vdpbf16ps xmm2 {k7}, xmm3, xmmword ptr [edi + 4*eax + 291]
				0x62,0xf2,0x66,0x0f,0x52,0x94,0x87,0x23,0x01,0x00,0x00

				# CHECK: vdpbf16ps xmm2, xmm3, dword ptr [eax]{1to4}
				0x62,0xf2,0x66,0x18,0x52,0x10

				# CHECK: vdpbf16ps xmm2, xmm3, xmmword ptr [2*ebp - 512]
				0x62,0xf2,0x66,0x08,0x52,0x14,0x6d,0x00,0xfe,0xff,0xff

				# CHECK: vdpbf16ps xmm2 {k7} {z}, xmm3, xmmword ptr [ecx + 2032]
				0x62,0xf2,0x66,0x8f,0x52,0x51,0x7f

				# CHECK: vdpbf16ps xmm2 {k7} {z}, xmm3, dword ptr [edx - 512]{1to4}
				0x62,0xf2,0x66,0x9f,0x52,0x52,0x80

test/MC/Disassembler/X86/x86-64-avx512bf16-att.txt

This file was added.

				# RUN: llvm-mc --disassemble %s -triple=x86_64-apple-darwin9 \| FileCheck %s

				# CHECK: vcvtne2ps2bf16 %zmm24, %zmm23, %zmm22
				0x62,0x82,0x47,0x40,0x72,0xf0

				# CHECK: vcvtne2ps2bf16 %zmm24, %zmm23, %zmm22 {%k7}
				0x62,0x82,0x47,0x47,0x72,0xf0

				# CHECK: vcvtne2ps2bf16 %zmm24, %zmm23, %zmm22 {%k7} {z}
				0x62,0x82,0x47,0xc7,0x72,0xf0

				# CHECK: vcvtne2ps2bf16 268435456(%rbp,%r14,8), %zmm23, %zmm22
				0x62,0xa2,0x47,0x40,0x72,0xb4,0xf5,0x00,0x00,0x00,0x10

				# CHECK: vcvtne2ps2bf16 291(%r8,%rax,4), %zmm23, %zmm22 {%k7}
				0x62,0xc2,0x47,0x47,0x72,0xb4,0x80,0x23,0x01,0x00,0x00

				# CHECK: vcvtne2ps2bf16 (%rip){1to16}, %zmm23, %zmm22
				0x62,0xe2,0x47,0x50,0x72,0x35,0x00,0x00,0x00,0x00

				# CHECK: vcvtne2ps2bf16 -2048(,%rbp,2), %zmm23, %zmm22
				0x62,0xe2,0x47,0x40,0x72,0x34,0x6d,0x00,0xf8,0xff,0xff

				# CHECK: vcvtne2ps2bf16 8128(%rcx), %zmm23, %zmm22 {%k7} {z}
				0x62,0xe2,0x47,0xc7,0x72,0x71,0x7f

				# CHECK: vcvtne2ps2bf16 -512(%rdx){1to16}, %zmm23, %zmm22 {%k7} {z}
				0x62,0xe2,0x47,0xd7,0x72,0x72,0x80

				# CHECK: vcvtneps2bf16 %zmm23, %ymm22
				0x62,0xa2,0x7e,0x48,0x72,0xf7

				# CHECK: vcvtneps2bf16 %zmm23, %ymm22 {%k7}
				0x62,0xa2,0x7e,0x4f,0x72,0xf7

				# CHECK: vcvtneps2bf16 %zmm23, %ymm22 {%k7} {z}
				0x62,0xa2,0x7e,0xcf,0x72,0xf7

				# CHECK: vcvtneps2bf16 268435456(%rbp,%r14,8), %ymm22
				0x62,0xa2,0x7e,0x48,0x72,0xb4,0xf5,0x00,0x00,0x00,0x10

				# CHECK: vcvtneps2bf16 291(%r8,%rax,4), %ymm22 {%k7}
				0x62,0xc2,0x7e,0x4f,0x72,0xb4,0x80,0x23,0x01,0x00,0x00

				# CHECK: vcvtneps2bf16 (%rip){1to16}, %ymm22
				0x62,0xe2,0x7e,0x58,0x72,0x35,0x00,0x00,0x00,0x00

				# CHECK: vcvtneps2bf16 -2048(,%rbp,2), %ymm22
				0x62,0xe2,0x7e,0x48,0x72,0x34,0x6d,0x00,0xf8,0xff,0xff

				# CHECK: vcvtneps2bf16 8128(%rcx), %ymm22 {%k7} {z}
				0x62,0xe2,0x7e,0xcf,0x72,0x71,0x7f

				# CHECK: vcvtneps2bf16 -512(%rdx){1to16}, %ymm22 {%k7} {z}
				0x62,0xe2,0x7e,0xdf,0x72,0x72,0x80

				# CHECK: vdpbf16ps %zmm24, %zmm23, %zmm22
				0x62,0x82,0x46,0x40,0x52,0xf0

				# CHECK: vdpbf16ps %zmm24, %zmm23, %zmm22 {%k7}
				0x62,0x82,0x46,0x47,0x52,0xf0

				# CHECK: vdpbf16ps %zmm24, %zmm23, %zmm22 {%k7} {z}
				0x62,0x82,0x46,0xc7,0x52,0xf0

				# CHECK: vdpbf16ps 268435456(%rbp,%r14,8), %zmm23, %zmm22
				0x62,0xa2,0x46,0x40,0x52,0xb4,0xf5,0x00,0x00,0x00,0x10

				# CHECK: vdpbf16ps 291(%r8,%rax,4), %zmm23, %zmm22 {%k7}
				0x62,0xc2,0x46,0x47,0x52,0xb4,0x80,0x23,0x01,0x00,0x00

				# CHECK: vdpbf16ps (%rip){1to16}, %zmm23, %zmm22
				0x62,0xe2,0x46,0x50,0x52,0x35,0x00,0x00,0x00,0x00

				# CHECK: vdpbf16ps -2048(,%rbp,2), %zmm23, %zmm22
				0x62,0xe2,0x46,0x40,0x52,0x34,0x6d,0x00,0xf8,0xff,0xff

				# CHECK: vdpbf16ps 8128(%rcx), %zmm23, %zmm22 {%k7} {z}
				0x62,0xe2,0x46,0xc7,0x52,0x71,0x7f

				# CHECK: vdpbf16ps -512(%rdx){1to16}, %zmm23, %zmm22 {%k7} {z}
				0x62,0xe2,0x46,0xd7,0x52,0x72,0x80

test/MC/Disassembler/X86/x86-64-avx512bf16-intel.txt

This file was added.

				# RUN: llvm-mc --disassemble %s -triple=x86_64 -x86-asm-syntax=intel --output-asm-variant=1 \| FileCheck %s

				# CHECK: vcvtne2ps2bf16 zmm22, zmm23, zmm24
				0x62,0x82,0x47,0x40,0x72,0xf0

				# CHECK: vcvtne2ps2bf16 zmm22 {k7}, zmm23, zmm24
				0x62,0x82,0x47,0x47,0x72,0xf0

				# CHECK: vcvtne2ps2bf16 zmm22 {k7} {z}, zmm23, zmm24
				0x62,0x82,0x47,0xc7,0x72,0xf0

				# CHECK: vcvtne2ps2bf16 zmm22, zmm23, zmmword ptr [rbp + 8*r14 + 268435456]
				0x62,0xa2,0x47,0x40,0x72,0xb4,0xf5,0x00,0x00,0x00,0x10

				# CHECK: vcvtne2ps2bf16 zmm22 {k7}, zmm23, zmmword ptr [r8 + 4*rax + 291]
				0x62,0xc2,0x47,0x47,0x72,0xb4,0x80,0x23,0x01,0x00,0x00

				# CHECK: vcvtne2ps2bf16 zmm22, zmm23, dword ptr [rip]{1to16}
				0x62,0xe2,0x47,0x50,0x72,0x35,0x00,0x00,0x00,0x00

				# CHECK: vcvtne2ps2bf16 zmm22, zmm23, zmmword ptr [2*rbp - 2048]
				0x62,0xe2,0x47,0x40,0x72,0x34,0x6d,0x00,0xf8,0xff,0xff

				# CHECK: vcvtne2ps2bf16 zmm22 {k7} {z}, zmm23, zmmword ptr [rcx + 8128]
				0x62,0xe2,0x47,0xc7,0x72,0x71,0x7f

				# CHECK: vcvtne2ps2bf16 zmm22 {k7} {z}, zmm23, dword ptr [rdx - 512]{1to16}
				0x62,0xe2,0x47,0xd7,0x72,0x72,0x80

				# CHECK: vcvtneps2bf16 ymm22, zmm23
				0x62,0xa2,0x7e,0x48,0x72,0xf7

				# CHECK: vcvtneps2bf16 ymm22 {k7}, zmm23
				0x62,0xa2,0x7e,0x4f,0x72,0xf7

				# CHECK: vcvtneps2bf16 ymm22 {k7} {z}, zmm23
				0x62,0xa2,0x7e,0xcf,0x72,0xf7

				# CHECK: vcvtneps2bf16 ymm22, zmmword ptr [rbp + 8*r14 + 268435456]
				0x62,0xa2,0x7e,0x48,0x72,0xb4,0xf5,0x00,0x00,0x00,0x10

				# CHECK: vcvtneps2bf16 ymm22 {k7}, zmmword ptr [r8 + 4*rax + 291]
				0x62,0xc2,0x7e,0x4f,0x72,0xb4,0x80,0x23,0x01,0x00,0x00

				# CHECK: vcvtneps2bf16 ymm22, dword ptr [rip]{1to16}
				0x62,0xe2,0x7e,0x58,0x72,0x35,0x00,0x00,0x00,0x00

				# CHECK: vcvtneps2bf16 ymm22, zmmword ptr [2*rbp - 2048]
				0x62,0xe2,0x7e,0x48,0x72,0x34,0x6d,0x00,0xf8,0xff,0xff

				# CHECK: vcvtneps2bf16 ymm22 {k7} {z}, zmmword ptr [rcx + 8128]
				0x62,0xe2,0x7e,0xcf,0x72,0x71,0x7f

				# CHECK: vcvtneps2bf16 ymm22 {k7} {z}, dword ptr [rdx - 512]{1to16}
				0x62,0xe2,0x7e,0xdf,0x72,0x72,0x80

				# CHECK: vdpbf16ps zmm22, zmm23, zmm24
				0x62,0x82,0x46,0x40,0x52,0xf0

				# CHECK: vdpbf16ps zmm22 {k7}, zmm23, zmm24
				0x62,0x82,0x46,0x47,0x52,0xf0

				# CHECK: vdpbf16ps zmm22 {k7} {z}, zmm23, zmm24
				0x62,0x82,0x46,0xc7,0x52,0xf0

				# CHECK: vdpbf16ps zmm22, zmm23, zmmword ptr [rbp + 8*r14 + 268435456]
				0x62,0xa2,0x46,0x40,0x52,0xb4,0xf5,0x00,0x00,0x00,0x10

				# CHECK: vdpbf16ps zmm22 {k7}, zmm23, zmmword ptr [r8 + 4*rax + 291]
				0x62,0xc2,0x46,0x47,0x52,0xb4,0x80,0x23,0x01,0x00,0x00

				# CHECK: vdpbf16ps zmm22, zmm23, dword ptr [rip]{1to16}
				0x62,0xe2,0x46,0x50,0x52,0x35,0x00,0x00,0x00,0x00

				# CHECK: vdpbf16ps zmm22, zmm23, zmmword ptr [2*rbp - 2048]
				0x62,0xe2,0x46,0x40,0x52,0x34,0x6d,0x00,0xf8,0xff,0xff

				# CHECK: vdpbf16ps zmm22 {k7} {z}, zmm23, zmmword ptr [rcx + 8128]
				0x62,0xe2,0x46,0xc7,0x52,0x71,0x7f

				# CHECK: vdpbf16ps zmm22 {k7} {z}, zmm23, dword ptr [rdx - 512]{1to16}
				0x62,0xe2,0x46,0xd7,0x52,0x72,0x80

test/MC/Disassembler/X86/x86-64-avx512bf16vl-att.txt

This file was added.

				# RUN: llvm-mc --disassemble %s -triple=x86_64-apple-darwin9 \| FileCheck %s

				# CHECK: vcvtne2ps2bf16 %ymm24, %ymm23, %ymm22
				0x62,0x82,0x47,0x20,0x72,0xf0

				# CHECK: vcvtne2ps2bf16 %ymm24, %ymm23, %ymm22 {%k7}
				0x62,0x82,0x47,0x27,0x72,0xf0

				# CHECK: vcvtne2ps2bf16 %ymm24, %ymm23, %ymm22 {%k7} {z}
				0x62,0x82,0x47,0xa7,0x72,0xf0

				# CHECK: vcvtne2ps2bf16 %xmm24, %xmm23, %xmm22
				0x62,0x82,0x47,0x00,0x72,0xf0

				# CHECK: vcvtne2ps2bf16 %xmm24, %xmm23, %xmm22 {%k7}
				0x62,0x82,0x47,0x07,0x72,0xf0

				# CHECK: vcvtne2ps2bf16 %xmm24, %xmm23, %xmm22 {%k7} {z}
				0x62,0x82,0x47,0x87,0x72,0xf0

				# CHECK: vcvtne2ps2bf16 268435456(%rbp,%r14,8), %ymm23, %ymm22
				0x62,0xa2,0x47,0x20,0x72,0xb4,0xf5,0x00,0x00,0x00,0x10

				# CHECK: vcvtne2ps2bf16 291(%r8,%rax,4), %ymm23, %ymm22 {%k7}
				0x62,0xc2,0x47,0x27,0x72,0xb4,0x80,0x23,0x01,0x00,0x00

				# CHECK: vcvtne2ps2bf16 (%rip){1to8}, %ymm23, %ymm22
				0x62,0xe2,0x47,0x30,0x72,0x35,0x00,0x00,0x00,0x00

				# CHECK: vcvtne2ps2bf16 -1024(,%rbp,2), %ymm23, %ymm22
				0x62,0xe2,0x47,0x20,0x72,0x34,0x6d,0x00,0xfc,0xff,0xff

				# CHECK: vcvtne2ps2bf16 4064(%rcx), %ymm23, %ymm22 {%k7} {z}
				0x62,0xe2,0x47,0xa7,0x72,0x71,0x7f

				# CHECK: vcvtne2ps2bf16 -512(%rdx){1to8}, %ymm23, %ymm22 {%k7} {z}
				0x62,0xe2,0x47,0xb7,0x72,0x72,0x80

				# CHECK: vcvtne2ps2bf16 268435456(%rbp,%r14,8), %xmm23, %xmm22
				0x62,0xa2,0x47,0x00,0x72,0xb4,0xf5,0x00,0x00,0x00,0x10

				# CHECK: vcvtne2ps2bf16 291(%r8,%rax,4), %xmm23, %xmm22 {%k7}
				0x62,0xc2,0x47,0x07,0x72,0xb4,0x80,0x23,0x01,0x00,0x00

				# CHECK: vcvtne2ps2bf16 (%rip){1to4}, %xmm23, %xmm22
				0x62,0xe2,0x47,0x10,0x72,0x35,0x00,0x00,0x00,0x00

				# CHECK: vcvtne2ps2bf16 -512(,%rbp,2), %xmm23, %xmm22
				0x62,0xe2,0x47,0x00,0x72,0x34,0x6d,0x00,0xfe,0xff,0xff

				# CHECK: vcvtne2ps2bf16 2032(%rcx), %xmm23, %xmm22 {%k7} {z}
				0x62,0xe2,0x47,0x87,0x72,0x71,0x7f

				# CHECK: vcvtne2ps2bf16 -512(%rdx){1to4}, %xmm23, %xmm22 {%k7} {z}
				0x62,0xe2,0x47,0x97,0x72,0x72,0x80

				# CHECK: vcvtneps2bf16 %xmm23, %xmm22
				0x62,0xa2,0x7e,0x08,0x72,0xf7

				# CHECK: vcvtneps2bf16 %xmm23, %xmm22 {%k7}
				0x62,0xa2,0x7e,0x0f,0x72,0xf7

				# CHECK: vcvtneps2bf16 %xmm23, %xmm22 {%k7} {z}
				0x62,0xa2,0x7e,0x8f,0x72,0xf7

				# CHECK: vcvtneps2bf16 %ymm23, %xmm22
				0x62,0xa2,0x7e,0x28,0x72,0xf7

				# CHECK: vcvtneps2bf16 %ymm23, %xmm22 {%k7}
				0x62,0xa2,0x7e,0x2f,0x72,0xf7

				# CHECK: vcvtneps2bf16 %ymm23, %xmm22 {%k7} {z}
				0x62,0xa2,0x7e,0xaf,0x72,0xf7

				# CHECK: vcvtneps2bf16x 268435456(%rbp,%r14,8), %xmm22
				0x62,0xa2,0x7e,0x08,0x72,0xb4,0xf5,0x00,0x00,0x00,0x10

				# CHECK: vcvtneps2bf16x 291(%r8,%rax,4), %xmm22 {%k7}
				0x62,0xc2,0x7e,0x0f,0x72,0xb4,0x80,0x23,0x01,0x00,0x00

				# CHECK: vcvtneps2bf16 (%rip){1to4}, %xmm22
				0x62,0xe2,0x7e,0x18,0x72,0x35,0x00,0x00,0x00,0x00

				# CHECK: vcvtneps2bf16x -512(,%rbp,2), %xmm22
				0x62,0xe2,0x7e,0x08,0x72,0x34,0x6d,0x00,0xfe,0xff,0xff

				# CHECK: vcvtneps2bf16x 2032(%rcx), %xmm22 {%k7} {z}
				0x62,0xe2,0x7e,0x8f,0x72,0x71,0x7f

				# CHECK: vcvtneps2bf16 -512(%rdx){1to4}, %xmm22 {%k7} {z}
				0x62,0xe2,0x7e,0x9f,0x72,0x72,0x80

				# CHECK: vcvtneps2bf16 (%rip){1to8}, %xmm22
				0x62,0xe2,0x7e,0x38,0x72,0x35,0x00,0x00,0x00,0x00

				# CHECK: vcvtneps2bf16y -1024(,%rbp,2), %xmm22
				0x62,0xe2,0x7e,0x28,0x72,0x34,0x6d,0x00,0xfc,0xff,0xff

				# CHECK: vcvtneps2bf16y 4064(%rcx), %xmm22 {%k7} {z}
				0x62,0xe2,0x7e,0xaf,0x72,0x71,0x7f

				# CHECK: vcvtneps2bf16 -512(%rdx){1to8}, %xmm22 {%k7} {z}
				0x62,0xe2,0x7e,0xbf,0x72,0x72,0x80

				# CHECK: vdpbf16ps %ymm24, %ymm23, %ymm22
				0x62,0x82,0x46,0x20,0x52,0xf0

				# CHECK: vdpbf16ps %ymm24, %ymm23, %ymm22 {%k7}
				0x62,0x82,0x46,0x27,0x52,0xf0

				# CHECK: vdpbf16ps %ymm24, %ymm23, %ymm22 {%k7} {z}
				0x62,0x82,0x46,0xa7,0x52,0xf0

				# CHECK: vdpbf16ps %xmm24, %xmm23, %xmm22
				0x62,0x82,0x46,0x00,0x52,0xf0

				# CHECK: vdpbf16ps %xmm24, %xmm23, %xmm22 {%k7}
				0x62,0x82,0x46,0x07,0x52,0xf0

				# CHECK: vdpbf16ps %xmm24, %xmm23, %xmm22 {%k7} {z}
				0x62,0x82,0x46,0x87,0x52,0xf0

				# CHECK: vdpbf16ps 268435456(%rbp,%r14,8), %ymm23, %ymm22
				0x62,0xa2,0x46,0x20,0x52,0xb4,0xf5,0x00,0x00,0x00,0x10

				# CHECK: vdpbf16ps 291(%r8,%rax,4), %ymm23, %ymm22 {%k7}
				0x62,0xc2,0x46,0x27,0x52,0xb4,0x80,0x23,0x01,0x00,0x00

				# CHECK: vdpbf16ps (%rip){1to8}, %ymm23, %ymm22
				0x62,0xe2,0x46,0x30,0x52,0x35,0x00,0x00,0x00,0x00

				# CHECK: vdpbf16ps -1024(,%rbp,2), %ymm23, %ymm22
				0x62,0xe2,0x46,0x20,0x52,0x34,0x6d,0x00,0xfc,0xff,0xff

				# CHECK: vdpbf16ps 4064(%rcx), %ymm23, %ymm22 {%k7} {z}
				0x62,0xe2,0x46,0xa7,0x52,0x71,0x7f

				# CHECK: vdpbf16ps -512(%rdx){1to8}, %ymm23, %ymm22 {%k7} {z}
				0x62,0xe2,0x46,0xb7,0x52,0x72,0x80

				# CHECK: vdpbf16ps 268435456(%rbp,%r14,8), %xmm23, %xmm22
				0x62,0xa2,0x46,0x00,0x52,0xb4,0xf5,0x00,0x00,0x00,0x10

				# CHECK: vdpbf16ps 291(%r8,%rax,4), %xmm23, %xmm22 {%k7}
				0x62,0xc2,0x46,0x07,0x52,0xb4,0x80,0x23,0x01,0x00,0x00

				# CHECK: vdpbf16ps (%rip){1to4}, %xmm23, %xmm22
				0x62,0xe2,0x46,0x10,0x52,0x35,0x00,0x00,0x00,0x00

				# CHECK: vdpbf16ps -512(,%rbp,2), %xmm23, %xmm22
				0x62,0xe2,0x46,0x00,0x52,0x34,0x6d,0x00,0xfe,0xff,0xff

				# CHECK: vdpbf16ps 2032(%rcx), %xmm23, %xmm22 {%k7} {z}
				0x62,0xe2,0x46,0x87,0x52,0x71,0x7f

				# CHECK: vdpbf16ps -512(%rdx){1to4}, %xmm23, %xmm22 {%k7} {z}
				0x62,0xe2,0x46,0x97,0x52,0x72,0x80

test/MC/Disassembler/X86/x86-64-avx512bf16vl-intel.txt

This file was added.

				# RUN: llvm-mc --disassemble %s -triple=x86_64 -x86-asm-syntax=intel --output-asm-variant=1 \| FileCheck %s

				# CHECK: vcvtne2ps2bf16 ymm22, ymm23, ymm24
				0x62,0x82,0x47,0x20,0x72,0xf0

				# CHECK: vcvtne2ps2bf16 ymm22 {k7}, ymm23, ymm24
				0x62,0x82,0x47,0x27,0x72,0xf0

				# CHECK: vcvtne2ps2bf16 ymm22 {k7} {z}, ymm23, ymm24
				0x62,0x82,0x47,0xa7,0x72,0xf0

				# CHECK: vcvtne2ps2bf16 xmm22, xmm23, xmm24
				0x62,0x82,0x47,0x00,0x72,0xf0

				# CHECK: vcvtne2ps2bf16 xmm22 {k7}, xmm23, xmm24
				0x62,0x82,0x47,0x07,0x72,0xf0

				# CHECK: vcvtne2ps2bf16 xmm22 {k7} {z}, xmm23, xmm24
				0x62,0x82,0x47,0x87,0x72,0xf0

				# CHECK: vcvtne2ps2bf16 ymm22, ymm23, ymmword ptr [rbp + 8*r14 + 268435456]
				0x62,0xa2,0x47,0x20,0x72,0xb4,0xf5,0x00,0x00,0x00,0x10

				# CHECK: vcvtne2ps2bf16 ymm22 {k7}, ymm23, ymmword ptr [r8 + 4*rax + 291]
				0x62,0xc2,0x47,0x27,0x72,0xb4,0x80,0x23,0x01,0x00,0x00

				# CHECK: vcvtne2ps2bf16 ymm22, ymm23, dword ptr [rip]{1to8}
				0x62,0xe2,0x47,0x30,0x72,0x35,0x00,0x00,0x00,0x00

				# CHECK: vcvtne2ps2bf16 ymm22, ymm23, ymmword ptr [2*rbp - 1024]
				0x62,0xe2,0x47,0x20,0x72,0x34,0x6d,0x00,0xfc,0xff,0xff

				# CHECK: vcvtne2ps2bf16 ymm22 {k7} {z}, ymm23, ymmword ptr [rcx + 4064]
				0x62,0xe2,0x47,0xa7,0x72,0x71,0x7f

				# CHECK: vcvtne2ps2bf16 ymm22 {k7} {z}, ymm23, dword ptr [rdx - 512]{1to8}
				0x62,0xe2,0x47,0xb7,0x72,0x72,0x80

				# CHECK: vcvtne2ps2bf16 xmm22, xmm23, xmmword ptr [rbp + 8*r14 + 268435456]
				0x62,0xa2,0x47,0x00,0x72,0xb4,0xf5,0x00,0x00,0x00,0x10

				# CHECK: vcvtne2ps2bf16 xmm22 {k7}, xmm23, xmmword ptr [r8 + 4*rax + 291]
				0x62,0xc2,0x47,0x07,0x72,0xb4,0x80,0x23,0x01,0x00,0x00

				# CHECK: vcvtne2ps2bf16 xmm22, xmm23, dword ptr [rip]{1to4}
				0x62,0xe2,0x47,0x10,0x72,0x35,0x00,0x00,0x00,0x00

				# CHECK: vcvtne2ps2bf16 xmm22, xmm23, xmmword ptr [2*rbp - 512]
				0x62,0xe2,0x47,0x00,0x72,0x34,0x6d,0x00,0xfe,0xff,0xff

				# CHECK: vcvtne2ps2bf16 xmm22 {k7} {z}, xmm23, xmmword ptr [rcx + 2032]
				0x62,0xe2,0x47,0x87,0x72,0x71,0x7f

				# CHECK: vcvtne2ps2bf16 xmm22 {k7} {z}, xmm23, dword ptr [rdx - 512]{1to4}
				0x62,0xe2,0x47,0x97,0x72,0x72,0x80

				# CHECK: vcvtneps2bf16 xmm22, xmm23
				0x62,0xa2,0x7e,0x08,0x72,0xf7

				# CHECK: vcvtneps2bf16 xmm22 {k7}, xmm23
				0x62,0xa2,0x7e,0x0f,0x72,0xf7

				# CHECK: vcvtneps2bf16 xmm22 {k7} {z}, xmm23
				0x62,0xa2,0x7e,0x8f,0x72,0xf7

				# CHECK: vcvtneps2bf16 xmm22, ymm23
				0x62,0xa2,0x7e,0x28,0x72,0xf7

				# CHECK: vcvtneps2bf16 xmm22 {k7}, ymm23
				0x62,0xa2,0x7e,0x2f,0x72,0xf7

				# CHECK: vcvtneps2bf16 xmm22 {k7} {z}, ymm23
				0x62,0xa2,0x7e,0xaf,0x72,0xf7

				# CHECK: vcvtneps2bf16 xmm22, xmmword ptr [rbp + 8*r14 + 268435456]
				0x62,0xa2,0x7e,0x08,0x72,0xb4,0xf5,0x00,0x00,0x00,0x10

				# CHECK: vcvtneps2bf16 xmm22 {k7}, xmmword ptr [r8 + 4*rax + 291]
				0x62,0xc2,0x7e,0x0f,0x72,0xb4,0x80,0x23,0x01,0x00,0x00

				# CHECK: vcvtneps2bf16 xmm22, dword ptr [rip]{1to4}
				0x62,0xe2,0x7e,0x18,0x72,0x35,0x00,0x00,0x00,0x00

				# CHECK: vcvtneps2bf16 xmm22, xmmword ptr [2*rbp - 512]
				0x62,0xe2,0x7e,0x08,0x72,0x34,0x6d,0x00,0xfe,0xff,0xff

				# CHECK: vcvtneps2bf16 xmm22 {k7} {z}, xmmword ptr [rcx + 2032]
				0x62,0xe2,0x7e,0x8f,0x72,0x71,0x7f

				# CHECK: vcvtneps2bf16 xmm22 {k7} {z}, dword ptr [rdx - 512]{1to4}
				0x62,0xe2,0x7e,0x9f,0x72,0x72,0x80

				# CHECK: vcvtneps2bf16 xmm22, dword ptr [rip]{1to8}
				0x62,0xe2,0x7e,0x38,0x72,0x35,0x00,0x00,0x00,0x00

				# CHECK: vcvtneps2bf16 xmm22, ymmword ptr [2*rbp - 1024]
				0x62,0xe2,0x7e,0x28,0x72,0x34,0x6d,0x00,0xfc,0xff,0xff

				# CHECK: vcvtneps2bf16 xmm22 {k7} {z}, ymmword ptr [rcx + 4064]
				0x62,0xe2,0x7e,0xaf,0x72,0x71,0x7f

				# CHECK: vcvtneps2bf16 xmm22 {k7} {z}, dword ptr [rdx - 512]{1to8}
				0x62,0xe2,0x7e,0xbf,0x72,0x72,0x80

				# CHECK: vdpbf16ps ymm22, ymm23, ymm24
				0x62,0x82,0x46,0x20,0x52,0xf0

				# CHECK: vdpbf16ps ymm22 {k7}, ymm23, ymm24
				0x62,0x82,0x46,0x27,0x52,0xf0

				# CHECK: vdpbf16ps ymm22 {k7} {z}, ymm23, ymm24
				0x62,0x82,0x46,0xa7,0x52,0xf0

				# CHECK: vdpbf16ps xmm22, xmm23, xmm24
				0x62,0x82,0x46,0x00,0x52,0xf0

				# CHECK: vdpbf16ps xmm22 {k7}, xmm23, xmm24
				0x62,0x82,0x46,0x07,0x52,0xf0

				# CHECK: vdpbf16ps xmm22 {k7} {z}, xmm23, xmm24
				0x62,0x82,0x46,0x87,0x52,0xf0

				# CHECK: vdpbf16ps ymm22, ymm23, ymmword ptr [rbp + 8*r14 + 268435456]
				0x62,0xa2,0x46,0x20,0x52,0xb4,0xf5,0x00,0x00,0x00,0x10

				# CHECK: vdpbf16ps ymm22 {k7}, ymm23, ymmword ptr [r8 + 4*rax + 291]
				0x62,0xc2,0x46,0x27,0x52,0xb4,0x80,0x23,0x01,0x00,0x00

				# CHECK: vdpbf16ps ymm22, ymm23, dword ptr [rip]{1to8}
				0x62,0xe2,0x46,0x30,0x52,0x35,0x00,0x00,0x00,0x00

				# CHECK: vdpbf16ps ymm22, ymm23, ymmword ptr [2*rbp - 1024]
				0x62,0xe2,0x46,0x20,0x52,0x34,0x6d,0x00,0xfc,0xff,0xff

				# CHECK: vdpbf16ps ymm22 {k7} {z}, ymm23, ymmword ptr [rcx + 4064]
				0x62,0xe2,0x46,0xa7,0x52,0x71,0x7f

				# CHECK: vdpbf16ps ymm22 {k7} {z}, ymm23, dword ptr [rdx - 512]{1to8}
				0x62,0xe2,0x46,0xb7,0x52,0x72,0x80

				# CHECK: vdpbf16ps xmm22, xmm23, xmmword ptr [rbp + 8*r14 + 268435456]
				0x62,0xa2,0x46,0x00,0x52,0xb4,0xf5,0x00,0x00,0x00,0x10

				# CHECK: vdpbf16ps xmm22 {k7}, xmm23, xmmword ptr [r8 + 4*rax + 291]
				0x62,0xc2,0x46,0x07,0x52,0xb4,0x80,0x23,0x01,0x00,0x00

				# CHECK: vdpbf16ps xmm22, xmm23, dword ptr [rip]{1to4}
				0x62,0xe2,0x46,0x10,0x52,0x35,0x00,0x00,0x00,0x00

				# CHECK: vdpbf16ps xmm22, xmm23, xmmword ptr [2*rbp - 512]
				0x62,0xe2,0x46,0x00,0x52,0x34,0x6d,0x00,0xfe,0xff,0xff

				# CHECK: vdpbf16ps xmm22 {k7} {z}, xmm23, xmmword ptr [rcx + 2032]
				0x62,0xe2,0x46,0x87,0x52,0x71,0x7f

				# CHECK: vdpbf16ps xmm22 {k7} {z}, xmm23, dword ptr [rdx - 512]{1to4}
				0x62,0xe2,0x46,0x97,0x52,0x72,0x80

test/MC/X86/avx512_bf16-encoding.s

This file was added.

				// RUN: llvm-mc -triple i686-unknown-unknown --show-encoding < %s \| FileCheck %s

				// CHECK: vcvtne2ps2bf16 %zmm4, %zmm5, %zmm6
				// CHECK: encoding: [0x62,0xf2,0x57,0x48,0x72,0xf4]
				vcvtne2ps2bf16 %zmm4, %zmm5, %zmm6

				// CHECK: vcvtne2ps2bf16 %zmm4, %zmm5, %zmm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x57,0x4f,0x72,0xf4]
				vcvtne2ps2bf16 %zmm4, %zmm5, %zmm6 {%k7}

				// CHECK: vcvtne2ps2bf16 %zmm4, %zmm5, %zmm6 {%k7} {z}
				// CHECK: encoding: [0x62,0xf2,0x57,0xcf,0x72,0xf4]
				vcvtne2ps2bf16 %zmm4, %zmm5, %zmm6 {%k7} {z}

				// CHECK: vcvtne2ps2bf16 (%ecx), %zmm5, %zmm6
				// CHECK: encoding: [0x62,0xf2,0x57,0x48,0x72,0x31]
				vcvtne2ps2bf16 (%ecx), %zmm5, %zmm6

				// CHECK: vcvtne2ps2bf16 291(%esp,%esi,8), %zmm5, %zmm6
				// CHECK: encoding: [0x62,0xf2,0x57,0x48,0x72,0xb4,0xf4,0x23,0x01,0x00,0x00]
				vcvtne2ps2bf16 291(%esp,%esi,8), %zmm5, %zmm6

				// CHECK: vcvtne2ps2bf16 268435456(%esp,%esi,8), %zmm5, %zmm6
				// CHECK: encoding: [0x62,0xf2,0x57,0x48,0x72,0xb4,0xf4,0x00,0x00,0x00,0x10]
				vcvtne2ps2bf16 268435456(%esp,%esi,8), %zmm5, %zmm6

				// CHECK: vcvtne2ps2bf16 -64(%esp), %zmm5, %zmm6
				// CHECK: encoding: [0x62,0xf2,0x57,0x48,0x72,0x74,0x24,0xff]
				vcvtne2ps2bf16 -64(%esp), %zmm5, %zmm6

				// CHECK: vcvtne2ps2bf16 (%eax){1to16}, %zmm5, %zmm6
				// CHECK: encoding: [0x62,0xf2,0x57,0x58,0x72,0x30]
				vcvtne2ps2bf16 (%eax){1to16}, %zmm5, %zmm6

				// CHECK: vcvtne2ps2bf16 8128(%edx), %zmm5, %zmm6
				// CHECK: encoding: [0x62,0xf2,0x57,0x48,0x72,0x72,0x7f]
				vcvtne2ps2bf16 8128(%edx), %zmm5, %zmm6

				// CHECK: vcvtne2ps2bf16 -8192(%edx), %zmm5, %zmm6
				// CHECK: encoding: [0x62,0xf2,0x57,0x48,0x72,0x72,0x80]
				vcvtne2ps2bf16 -8192(%edx), %zmm5, %zmm6

				// CHECK: vcvtne2ps2bf16 508(%edx){1to16}, %zmm5, %zmm6
				// CHECK: encoding: [0x62,0xf2,0x57,0x58,0x72,0x72,0x7f]
				vcvtne2ps2bf16 508(%edx){1to16}, %zmm5, %zmm6

				// CHECK: vcvtne2ps2bf16 -512(%edx){1to16}, %zmm5, %zmm6
				// CHECK: encoding: [0x62,0xf2,0x57,0x58,0x72,0x72,0x80]
				vcvtne2ps2bf16 -512(%edx){1to16}, %zmm5, %zmm6

				// CHECK: vcvtneps2bf16 %zmm5, %ymm6
				// CHECK: encoding: [0x62,0xf2,0x7e,0x48,0x72,0xf5]
				vcvtneps2bf16 %zmm5, %ymm6

				// CHECK: vcvtneps2bf16 268435456(%esp,%esi,8), %ymm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x7e,0x4f,0x72,0xb4,0xf4,0x00,0x00,0x00,0x10]
				vcvtneps2bf16 268435456(%esp,%esi,8), %ymm6 {%k7}

				// CHECK: vcvtneps2bf16 (%ecx){1to16}, %ymm6
				// CHECK: encoding: [0x62,0xf2,0x7e,0x58,0x72,0x31]
				vcvtneps2bf16 (%ecx){1to16}, %ymm6

				// CHECK: vcvtneps2bf16 8128(%ecx), %ymm6
				// CHECK: encoding: [0x62,0xf2,0x7e,0x48,0x72,0x71,0x7f]
				vcvtneps2bf16 8128(%ecx), %ymm6

				// CHECK: vcvtneps2bf16 -512(%edx){1to16}, %ymm6 {%k7} {z}
				// CHECK: encoding: [0x62,0xf2,0x7e,0xdf,0x72,0x72,0x80]
				vcvtneps2bf16 -512(%edx){1to16}, %ymm6 {%k7} {z}

				// CHECK: vdpbf16ps %zmm4, %zmm5, %zmm6
				// CHECK: encoding: [0x62,0xf2,0x56,0x48,0x52,0xf4]
				vdpbf16ps %zmm4, %zmm5, %zmm6

				// CHECK: vdpbf16ps 268435456(%esp,%esi,8), %zmm5, %zmm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x56,0x4f,0x52,0xb4,0xf4,0x00,0x00,0x00,0x10]
				vdpbf16ps 268435456(%esp,%esi,8), %zmm5, %zmm6 {%k7}

				// CHECK: vdpbf16ps (%ecx){1to16}, %zmm5, %zmm6
				// CHECK: encoding: [0x62,0xf2,0x56,0x58,0x52,0x31]
				vdpbf16ps (%ecx){1to16}, %zmm5, %zmm6

				// CHECK: vdpbf16ps 8128(%ecx), %zmm5, %zmm6
				// CHECK: encoding: [0x62,0xf2,0x56,0x48,0x52,0x71,0x7f]
				vdpbf16ps 8128(%ecx), %zmm5, %zmm6

				// CHECK: vdpbf16ps -512(%edx){1to16}, %zmm5, %zmm6 {%k7} {z}
				// CHECK: encoding: [0x62,0xf2,0x56,0xdf,0x52,0x72,0x80]
				vdpbf16ps -512(%edx){1to16}, %zmm5, %zmm6 {%k7} {z}

test/MC/X86/avx512_bf16_vl-encoding.s

This file was added.

				// RUN: llvm-mc -triple i686-unknown-unknown --show-encoding < %s \| FileCheck %s

				// CHECK: vcvtne2ps2bf16 %xmm4, %xmm5, %xmm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x57,0x0f,0x72,0xf4]
				vcvtne2ps2bf16 %xmm4, %xmm5, %xmm6 {%k7}

				// CHECK: vcvtne2ps2bf16 %xmm4, %xmm5, %xmm6 {%k7} {z}
				// CHECK: encoding: [0x62,0xf2,0x57,0x8f,0x72,0xf4]
				vcvtne2ps2bf16 %xmm4, %xmm5, %xmm6 {%k7} {z}

				// CHECK: vcvtne2ps2bf16 (%ecx), %xmm5, %xmm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x57,0x0f,0x72,0x31]
				vcvtne2ps2bf16 (%ecx), %xmm5, %xmm6 {%k7}

				// CHECK: vcvtne2ps2bf16 291(%esp,%esi,8), %xmm5, %xmm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x57,0x0f,0x72,0xb4,0xf4,0x23,0x01,0x00,0x00]
				vcvtne2ps2bf16 291(%esp,%esi,8), %xmm5, %xmm6 {%k7}

				// CHECK: vcvtne2ps2bf16 268435456(%esp,%esi,8), %xmm5, %xmm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x57,0x0f,0x72,0xb4,0xf4,0x00,0x00,0x00,0x10]
				vcvtne2ps2bf16 268435456(%esp,%esi,8), %xmm5, %xmm6 {%k7}

				// CHECK: vcvtne2ps2bf16 -16(%esp), %xmm5, %xmm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x57,0x0f,0x72,0x74,0x24,0xff]
				vcvtne2ps2bf16 -16(%esp), %xmm5, %xmm6 {%k7}

				// CHECK: vcvtne2ps2bf16 (%eax){1to4}, %xmm5, %xmm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x57,0x1f,0x72,0x30]
				vcvtne2ps2bf16 (%eax){1to4}, %xmm5, %xmm6 {%k7}

				// CHECK: vcvtne2ps2bf16 2032(%edx), %xmm5, %xmm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x57,0x0f,0x72,0x72,0x7f]
				vcvtne2ps2bf16 2032(%edx), %xmm5, %xmm6 {%k7}

				// CHECK: vcvtne2ps2bf16 -2048(%edx), %xmm5, %xmm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x57,0x0f,0x72,0x72,0x80]
				vcvtne2ps2bf16 -2048(%edx), %xmm5, %xmm6 {%k7}

				// CHECK: vcvtne2ps2bf16 508(%edx){1to4}, %xmm5, %xmm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x57,0x1f,0x72,0x72,0x7f]
				vcvtne2ps2bf16 508(%edx){1to4}, %xmm5, %xmm6 {%k7}

				// CHECK: vcvtne2ps2bf16 -512(%edx){1to4}, %xmm5, %xmm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x57,0x1f,0x72,0x72,0x80]
				vcvtne2ps2bf16 -512(%edx){1to4}, %xmm5, %xmm6 {%k7}

				// CHECK: vcvtne2ps2bf16 %ymm4, %ymm5, %ymm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x57,0x2f,0x72,0xf4]
				vcvtne2ps2bf16 %ymm4, %ymm5, %ymm6 {%k7}

				// CHECK: vcvtne2ps2bf16 %ymm4, %ymm5, %ymm6 {%k7} {z}
				// CHECK: encoding: [0x62,0xf2,0x57,0xaf,0x72,0xf4]
				vcvtne2ps2bf16 %ymm4, %ymm5, %ymm6 {%k7} {z}

				// CHECK: vcvtne2ps2bf16 (%ecx), %ymm5, %ymm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x57,0x2f,0x72,0x31]
				vcvtne2ps2bf16 (%ecx), %ymm5, %ymm6 {%k7}

				// CHECK: vcvtne2ps2bf16 291(%esp,%esi,8), %ymm5, %ymm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x57,0x2f,0x72,0xb4,0xf4,0x23,0x01,0x00,0x00]
				vcvtne2ps2bf16 291(%esp,%esi,8), %ymm5, %ymm6 {%k7}

				// CHECK: vcvtne2ps2bf16 268435456(%esp,%esi,8), %ymm5, %ymm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x57,0x2f,0x72,0xb4,0xf4,0x00,0x00,0x00,0x10]
				vcvtne2ps2bf16 268435456(%esp,%esi,8), %ymm5, %ymm6 {%k7}

				// CHECK: vcvtne2ps2bf16 -32(%esp), %ymm5, %ymm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x57,0x2f,0x72,0x74,0x24,0xff]
				vcvtne2ps2bf16 -32(%esp), %ymm5, %ymm6 {%k7}

				// CHECK: vcvtne2ps2bf16 (%eax){1to8}, %ymm5, %ymm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x57,0x3f,0x72,0x30]
				vcvtne2ps2bf16 (%eax){1to8}, %ymm5, %ymm6 {%k7}

				// CHECK: vcvtne2ps2bf16 4064(%edx), %ymm5, %ymm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x57,0x2f,0x72,0x72,0x7f]
				vcvtne2ps2bf16 4064(%edx), %ymm5, %ymm6 {%k7}

				// CHECK: vcvtne2ps2bf16 -4096(%edx), %ymm5, %ymm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x57,0x2f,0x72,0x72,0x80]
				vcvtne2ps2bf16 -4096(%edx), %ymm5, %ymm6 {%k7}

				// CHECK: vcvtne2ps2bf16 508(%edx){1to8}, %ymm5, %ymm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x57,0x3f,0x72,0x72,0x7f]
				vcvtne2ps2bf16 508(%edx){1to8}, %ymm5, %ymm6 {%k7}

				// CHECK: vcvtne2ps2bf16 -512(%edx){1to8}, %ymm5, %ymm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x57,0x3f,0x72,0x72,0x80]
				vcvtne2ps2bf16 -512(%edx){1to8}, %ymm5, %ymm6 {%k7}

				// CHECK: vcvtneps2bf16 %xmm5, %xmm6
				// CHECK: encoding: [0x62,0xf2,0x7e,0x08,0x72,0xf5]
				vcvtneps2bf16 %xmm5, %xmm6

				// CHECK: vcvtneps2bf16x 268435456(%esp,%esi,8), %xmm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x7e,0x0f,0x72,0xb4,0xf4,0x00,0x00,0x00,0x10]
				vcvtneps2bf16x 268435456(%esp,%esi,8), %xmm6 {%k7}

				// CHECK: vcvtneps2bf16 (%ecx){1to4}, %xmm6
				// CHECK: encoding: [0x62,0xf2,0x7e,0x18,0x72,0x31]
				vcvtneps2bf16 (%ecx){1to4}, %xmm6

				// CHECK: vcvtneps2bf16x 2032(%ecx), %xmm6
				// CHECK: encoding: [0x62,0xf2,0x7e,0x08,0x72,0x71,0x7f]
				vcvtneps2bf16x 2032(%ecx), %xmm6

				// CHECK: vcvtneps2bf16 -512(%edx){1to4}, %xmm6 {%k7} {z}
				// CHECK: encoding: [0x62,0xf2,0x7e,0x9f,0x72,0x72,0x80]
				vcvtneps2bf16 -512(%edx){1to4}, %xmm6 {%k7} {z}

				// CHECK: vcvtneps2bf16 %ymm5, %xmm6
				// CHECK: encoding: [0x62,0xf2,0x7e,0x28,0x72,0xf5]
				vcvtneps2bf16 %ymm5, %xmm6

				// CHECK: vcvtneps2bf16y 268435456(%esp,%esi,8), %xmm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x7e,0x2f,0x72,0xb4,0xf4,0x00,0x00,0x00,0x10]
				vcvtneps2bf16y 268435456(%esp,%esi,8), %xmm6 {%k7}

				// CHECK: vcvtneps2bf16 (%ecx){1to8}, %xmm6
				// CHECK: encoding: [0x62,0xf2,0x7e,0x38,0x72,0x31]
				vcvtneps2bf16 (%ecx){1to8}, %xmm6

				// CHECK: vcvtneps2bf16y 4064(%ecx), %xmm6
				// CHECK: encoding: [0x62,0xf2,0x7e,0x28,0x72,0x71,0x7f]
				vcvtneps2bf16y 4064(%ecx), %xmm6

				// CHECK: vcvtneps2bf16 -512(%edx){1to8}, %xmm6 {%k7} {z}
				// CHECK: encoding: [0x62,0xf2,0x7e,0xbf,0x72,0x72,0x80]
				vcvtneps2bf16 -512(%edx){1to8}, %xmm6 {%k7} {z}

				// CHECK: vdpbf16ps %ymm4, %ymm5, %ymm6
				// CHECK: encoding: [0x62,0xf2,0x56,0x28,0x52,0xf4]
				vdpbf16ps %ymm4, %ymm5, %ymm6

				// CHECK: vdpbf16ps 268435456(%esp,%esi,8), %ymm5, %ymm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x56,0x2f,0x52,0xb4,0xf4,0x00,0x00,0x00,0x10]
				vdpbf16ps 268435456(%esp,%esi,8), %ymm5, %ymm6 {%k7}

				// CHECK: vdpbf16ps (%ecx){1to8}, %ymm5, %ymm6
				// CHECK: encoding: [0x62,0xf2,0x56,0x38,0x52,0x31]
				vdpbf16ps (%ecx){1to8}, %ymm5, %ymm6

				// CHECK: vdpbf16ps 4064(%ecx), %ymm5, %ymm6
				// CHECK: encoding: [0x62,0xf2,0x56,0x28,0x52,0x71,0x7f]
				vdpbf16ps 4064(%ecx), %ymm5, %ymm6

				// CHECK: vdpbf16ps -512(%edx){1to8}, %ymm5, %ymm6 {%k7} {z}
				// CHECK: encoding: [0x62,0xf2,0x56,0xbf,0x52,0x72,0x80]
				vdpbf16ps -512(%edx){1to8}, %ymm5, %ymm6 {%k7} {z}

				// CHECK: vdpbf16ps %xmm4, %xmm5, %xmm6
				// CHECK: encoding: [0x62,0xf2,0x56,0x08,0x52,0xf4]
				vdpbf16ps %xmm4, %xmm5, %xmm6

				// CHECK: vdpbf16ps 268435456(%esp,%esi,8), %xmm5, %xmm6 {%k7}
				// CHECK: encoding: [0x62,0xf2,0x56,0x0f,0x52,0xb4,0xf4,0x00,0x00,0x00,0x10]
				vdpbf16ps 268435456(%esp,%esi,8), %xmm5, %xmm6 {%k7}

				// CHECK: vdpbf16ps (%ecx){1to4}, %xmm5, %xmm6
				// CHECK: encoding: [0x62,0xf2,0x56,0x18,0x52,0x31]
				vdpbf16ps (%ecx){1to4}, %xmm5, %xmm6

				// CHECK: vdpbf16ps 2032(%ecx), %xmm5, %xmm6
				// CHECK: encoding: [0x62,0xf2,0x56,0x08,0x52,0x71,0x7f]
				vdpbf16ps 2032(%ecx), %xmm5, %xmm6

				// CHECK: vdpbf16ps -512(%edx){1to4}, %xmm5, %xmm6 {%k7} {z}
				// CHECK: encoding: [0x62,0xf2,0x56,0x9f,0x52,0x72,0x80]
				vdpbf16ps -512(%edx){1to4}, %xmm5, %xmm6 {%k7} {z}

test/MC/X86/intel-syntax-avx512_bf16.s

This file was added.

				// RUN: llvm-mc -triple i686-unknown-unknown -x86-asm-syntax=intel -output-asm-variant=1 --show-encoding %s \| FileCheck %s

				// CHECK: vcvtne2ps2bf16 zmm6, zmm5, zmm4
				// CHECK: encoding: [0x62,0xf2,0x57,0x48,0x72,0xf4]
				vcvtne2ps2bf16 zmm6, zmm5, zmm4

				// CHECK: vcvtne2ps2bf16 zmm6 {k7}, zmm5, zmm4
				// CHECK: encoding: [0x62,0xf2,0x57,0x4f,0x72,0xf4]
				vcvtne2ps2bf16 zmm6 {k7}, zmm5, zmm4

				// CHECK: vcvtne2ps2bf16 zmm6 {k7} {z}, zmm5, zmm4
				// CHECK: encoding: [0x62,0xf2,0x57,0xcf,0x72,0xf4]
				vcvtne2ps2bf16 zmm6 {k7} {z}, zmm5, zmm4

				// CHECK: vcvtne2ps2bf16 zmm6, zmm5, zmmword ptr [ecx]
				// CHECK: encoding: [0x62,0xf2,0x57,0x48,0x72,0x31]
				vcvtne2ps2bf16 zmm6, zmm5, zmmword ptr [ecx]

				// CHECK: vcvtne2ps2bf16 zmm6, zmm5, zmmword ptr [esp + 8*esi + 291]
				// CHECK: encoding: [0x62,0xf2,0x57,0x48,0x72,0xb4,0xf4,0x23,0x01,0x00,0x00]
				vcvtne2ps2bf16 zmm6, zmm5, zmmword ptr [esp + 8*esi + 291]

				// CHECK: vcvtne2ps2bf16 zmm6, zmm5, zmmword ptr [esp + 8*esi + 268435456]
				// CHECK: encoding: [0x62,0xf2,0x57,0x48,0x72,0xb4,0xf4,0x00,0x00,0x00,0x10]
				vcvtne2ps2bf16 zmm6, zmm5, zmmword ptr [esp + 8*esi + 268435456]

				// CHECK: vcvtne2ps2bf16 zmm6, zmm5, zmmword ptr [esp - 4]
				// CHECK: encoding: [0x62,0xf2,0x57,0x48,0x72,0xb4,0x24,0xfc,0xff,0xff,0xff]
				vcvtne2ps2bf16 zmm6, zmm5, zmmword ptr [esp - 4]

				// CHECK: vcvtne2ps2bf16 zmm6, zmm5, dword ptr [eax]{1to16}
				// CHECK: encoding: [0x62,0xf2,0x57,0x58,0x72,0x30]
				vcvtne2ps2bf16 zmm6, zmm5, dword ptr [eax]{1to16}

				// CHECK: vcvtne2ps2bf16 zmm6, zmm5, zmmword ptr [edx + 8128]
				// CHECK: encoding: [0x62,0xf2,0x57,0x48,0x72,0x72,0x7f]
				vcvtne2ps2bf16 zmm6, zmm5, zmmword ptr [edx + 8128]

				// CHECK: vcvtne2ps2bf16 zmm6, zmm5, zmmword ptr [edx - 8192]
				// CHECK: encoding: [0x62,0xf2,0x57,0x48,0x72,0x72,0x80]
				vcvtne2ps2bf16 zmm6, zmm5, zmmword ptr [edx - 8192]

				// CHECK: vcvtne2ps2bf16 zmm6, zmm5, dword ptr [edx + 508]{1to16}
				// CHECK: encoding: [0x62,0xf2,0x57,0x58,0x72,0x72,0x7f]
				vcvtne2ps2bf16 zmm6, zmm5, dword ptr [edx + 508]{1to16}

				// CHECK: vcvtne2ps2bf16 zmm6, zmm5, dword ptr [edx - 512]{1to16}
				// CHECK: encoding: [0x62,0xf2,0x57,0x58,0x72,0x72,0x80]
				vcvtne2ps2bf16 zmm6, zmm5, dword ptr [edx - 512]{1to16}

				// CHECK: vcvtneps2bf16 ymm6, zmm5
				// CHECK: encoding: [0x62,0xf2,0x7e,0x48,0x72,0xf5]
				vcvtneps2bf16 ymm6, zmm5

				// CHECK: vcvtneps2bf16 ymm6 {k7}, zmmword ptr [esp + 8*esi + 268435456]
				// CHECK: encoding: [0x62,0xf2,0x7e,0x4f,0x72,0xb4,0xf4,0x00,0x00,0x00,0x10]
				vcvtneps2bf16 ymm6 {k7}, zmmword ptr [esp + 8*esi + 268435456]

				// CHECK: vcvtneps2bf16 ymm6, dword ptr [ecx]{1to16}
				// CHECK: encoding: [0x62,0xf2,0x7e,0x58,0x72,0x31]
				vcvtneps2bf16 ymm6, dword ptr [ecx]{1to16}

				// CHECK: vcvtneps2bf16 ymm6, zmmword ptr [ecx + 8128]
				// CHECK: encoding: [0x62,0xf2,0x7e,0x48,0x72,0x71,0x7f]
				vcvtneps2bf16 ymm6, zmmword ptr [ecx + 8128]

				// CHECK: vcvtneps2bf16 ymm6 {k7} {z}, dword ptr [edx - 512]{1to16}
				// CHECK: encoding: [0x62,0xf2,0x7e,0xdf,0x72,0x72,0x80]
				vcvtneps2bf16 ymm6 {k7} {z}, dword ptr [edx - 512]{1to16}

				// CHECK: vdpbf16ps zmm6, zmm5, zmm4
				// CHECK: encoding: [0x62,0xf2,0x56,0x48,0x52,0xf4]
				vdpbf16ps zmm6, zmm5, zmm4

				// CHECK: vdpbf16ps zmm6 {k7}, zmm5, zmmword ptr [esp + 8*esi + 268435456]
				// CHECK: encoding: [0x62,0xf2,0x56,0x4f,0x52,0xb4,0xf4,0x00,0x00,0x00,0x10]
				vdpbf16ps zmm6 {k7}, zmm5, zmmword ptr [esp + 8*esi + 268435456]

				// CHECK: vdpbf16ps zmm6, zmm5, dword ptr [ecx]{1to16}
				// CHECK: encoding: [0x62,0xf2,0x56,0x58,0x52,0x31]
				vdpbf16ps zmm6, zmm5, dword ptr [ecx]{1to16}

				// CHECK: vdpbf16ps zmm6, zmm5, zmmword ptr [ecx + 8128]
				// CHECK: encoding: [0x62,0xf2,0x56,0x48,0x52,0x71,0x7f]
				vdpbf16ps zmm6, zmm5, zmmword ptr [ecx + 8128]

				// CHECK: vdpbf16ps zmm6 {k7} {z}, zmm5, dword ptr [edx - 512]{1to16}
				// CHECK: encoding: [0x62,0xf2,0x56,0xdf,0x52,0x72,0x80]
				vdpbf16ps zmm6 {k7} {z}, zmm5, dword ptr [edx - 512]{1to16}

test/MC/X86/intel-syntax-avx512_bf16_vl.s

This file was added.

				// RUN: llvm-mc -triple i686-unknown-unknown -x86-asm-syntax=intel -output-asm-variant=1 --show-encoding %s \| FileCheck %s

				// CHECK: vcvtne2ps2bf16 xmm6 {k7}, xmm5, xmm4
				// CHECK: encoding: [0x62,0xf2,0x57,0x0f,0x72,0xf4]
				vcvtne2ps2bf16 xmm6 {k7}, xmm5, xmm4

				// CHECK: vcvtne2ps2bf16 xmm6 {k7} {z}, xmm5, xmm4
				// CHECK: encoding: [0x62,0xf2,0x57,0x8f,0x72,0xf4]
				vcvtne2ps2bf16 xmm6 {k7} {z}, xmm5, xmm4

				// CHECK: vcvtne2ps2bf16 xmm6 {k7}, xmm5, xmmword ptr [ecx]
				// CHECK: encoding: [0x62,0xf2,0x57,0x0f,0x72,0x31]
				vcvtne2ps2bf16 xmm6 {k7}, xmm5, xmmword ptr [ecx]

				// CHECK: vcvtne2ps2bf16 xmm6 {k7}, xmm5, xmmword ptr [esp + 8*esi + 291]
				// CHECK: encoding: [0x62,0xf2,0x57,0x0f,0x72,0xb4,0xf4,0x23,0x01,0x00,0x00]
				vcvtne2ps2bf16 xmm6 {k7}, xmm5, xmmword ptr [esp + 8*esi + 291]

				// CHECK: vcvtne2ps2bf16 xmm6 {k7}, xmm5, xmmword ptr [esp + 8*esi + 268435456]
				// CHECK: encoding: [0x62,0xf2,0x57,0x0f,0x72,0xb4,0xf4,0x00,0x00,0x00,0x10]
				vcvtne2ps2bf16 xmm6 {k7}, xmm5, xmmword ptr [esp + 8*esi + 268435456]

				// CHECK: vcvtne2ps2bf16 xmm6 {k7}, xmm5, xmmword ptr [esp - 4]
				// CHECK: encoding: [0x62,0xf2,0x57,0x0f,0x72,0xb4,0x24,0xfc,0xff,0xff,0xff]
				vcvtne2ps2bf16 xmm6 {k7}, xmm5, xmmword ptr [esp - 4]

				// CHECK: vcvtne2ps2bf16 xmm6 {k7}, xmm5, dword ptr [eax]{1to4}
				// CHECK: encoding: [0x62,0xf2,0x57,0x1f,0x72,0x30]
				vcvtne2ps2bf16 xmm6 {k7}, xmm5, dword ptr [eax]{1to4}

				// CHECK: vcvtne2ps2bf16 xmm6 {k7}, xmm5, xmmword ptr [edx + 2032]
				// CHECK: encoding: [0x62,0xf2,0x57,0x0f,0x72,0x72,0x7f]
				vcvtne2ps2bf16 xmm6 {k7}, xmm5, xmmword ptr [edx + 2032]

				// CHECK: vcvtne2ps2bf16 xmm6 {k7}, xmm5, xmmword ptr [edx - 2048]
				// CHECK: encoding: [0x62,0xf2,0x57,0x0f,0x72,0x72,0x80]
				vcvtne2ps2bf16 xmm6 {k7}, xmm5, xmmword ptr [edx - 2048]

				// CHECK: vcvtne2ps2bf16 xmm6 {k7}, xmm5, dword ptr [edx + 508]{1to4}
				// CHECK: encoding: [0x62,0xf2,0x57,0x1f,0x72,0x72,0x7f]
				vcvtne2ps2bf16 xmm6 {k7}, xmm5, dword ptr [edx + 508]{1to4}

				// CHECK: vcvtne2ps2bf16 xmm6 {k7}, xmm5, dword ptr [edx - 512]{1to4}
				// CHECK: encoding: [0x62,0xf2,0x57,0x1f,0x72,0x72,0x80]
				vcvtne2ps2bf16 xmm6 {k7}, xmm5, dword ptr [edx - 512]{1to4}

				// CHECK: vcvtne2ps2bf16 ymm6 {k7}, ymm5, ymm4
				// CHECK: encoding: [0x62,0xf2,0x57,0x2f,0x72,0xf4]
				vcvtne2ps2bf16 ymm6 {k7}, ymm5, ymm4

				// CHECK: vcvtne2ps2bf16 ymm6 {k7} {z}, ymm5, ymm4
				// CHECK: encoding: [0x62,0xf2,0x57,0xaf,0x72,0xf4]
				vcvtne2ps2bf16 ymm6 {k7} {z}, ymm5, ymm4

				// CHECK: vcvtne2ps2bf16 ymm6 {k7}, ymm5, ymmword ptr [ecx]
				// CHECK: encoding: [0x62,0xf2,0x57,0x2f,0x72,0x31]
				vcvtne2ps2bf16 ymm6 {k7}, ymm5, ymmword ptr [ecx]

				// CHECK: vcvtne2ps2bf16 ymm6 {k7}, ymm5, ymmword ptr [esp + 8*esi + 291]
				// CHECK: encoding: [0x62,0xf2,0x57,0x2f,0x72,0xb4,0xf4,0x23,0x01,0x00,0x00]
				vcvtne2ps2bf16 ymm6 {k7}, ymm5, ymmword ptr [esp + 8*esi + 291]

				// CHECK: vcvtne2ps2bf16 ymm6 {k7}, ymm5, ymmword ptr [esp + 8*esi + 268435456]
				// CHECK: encoding: [0x62,0xf2,0x57,0x2f,0x72,0xb4,0xf4,0x00,0x00,0x00,0x10]
				vcvtne2ps2bf16 ymm6 {k7}, ymm5, ymmword ptr [esp + 8*esi + 268435456]

				// CHECK: vcvtne2ps2bf16 ymm6 {k7}, ymm5, ymmword ptr [esp - 4]
				// CHECK: encoding: [0x62,0xf2,0x57,0x2f,0x72,0xb4,0x24,0xfc,0xff,0xff,0xff]
				vcvtne2ps2bf16 ymm6 {k7}, ymm5, ymmword ptr [esp - 4]

				// CHECK: vcvtne2ps2bf16 ymm6 {k7}, ymm5, dword ptr [eax]{1to8}
				// CHECK: encoding: [0x62,0xf2,0x57,0x3f,0x72,0x30]
				vcvtne2ps2bf16 ymm6 {k7}, ymm5, dword ptr [eax]{1to8}

				// CHECK: vcvtne2ps2bf16 ymm6 {k7}, ymm5, ymmword ptr [edx + 4064]
				// CHECK: encoding: [0x62,0xf2,0x57,0x2f,0x72,0x72,0x7f]
				vcvtne2ps2bf16 ymm6 {k7}, ymm5, ymmword ptr [edx + 4064]

				// CHECK: vcvtne2ps2bf16 ymm6 {k7}, ymm5, ymmword ptr [edx - 4096]
				// CHECK: encoding: [0x62,0xf2,0x57,0x2f,0x72,0x72,0x80]
				vcvtne2ps2bf16 ymm6 {k7}, ymm5, ymmword ptr [edx - 4096]

				// CHECK: vcvtne2ps2bf16 ymm6 {k7}, ymm5, dword ptr [edx + 508]{1to8}
				// CHECK: encoding: [0x62,0xf2,0x57,0x3f,0x72,0x72,0x7f]
				vcvtne2ps2bf16 ymm6 {k7}, ymm5, dword ptr [edx + 508]{1to8}

				// CHECK: vcvtne2ps2bf16 ymm6 {k7}, ymm5, dword ptr [edx - 512]{1to8}
				// CHECK: encoding: [0x62,0xf2,0x57,0x3f,0x72,0x72,0x80]
				vcvtne2ps2bf16 ymm6 {k7}, ymm5, dword ptr [edx - 512]{1to8}

				// CHECK: vcvtneps2bf16 xmm6, xmm5
				// CHECK: encoding: [0x62,0xf2,0x7e,0x08,0x72,0xf5]
				vcvtneps2bf16 xmm6, xmm5

				// CHECK: vcvtneps2bf16 xmm6 {k7}, xmmword ptr [esp + 8*esi + 268435456]
				// CHECK: encoding: [0x62,0xf2,0x7e,0x0f,0x72,0xb4,0xf4,0x00,0x00,0x00,0x10]
				vcvtneps2bf16 xmm6 {k7}, xmmword ptr [esp + 8*esi + 268435456]

				// CHECK: vcvtneps2bf16 xmm6, dword ptr [ecx]{1to4}
				// CHECK: encoding: [0x62,0xf2,0x7e,0x18,0x72,0x31]
				vcvtneps2bf16 xmm6, dword ptr [ecx]{1to4}

				// CHECK: vcvtneps2bf16 xmm6, xmmword ptr [ecx + 2032]
				// CHECK: encoding: [0x62,0xf2,0x7e,0x08,0x72,0x71,0x7f]
				vcvtneps2bf16 xmm6, xmmword ptr [ecx + 2032]

				// CHECK: vcvtneps2bf16 xmm6 {k7} {z}, dword ptr [edx - 512]{1to4}
				// CHECK: encoding: [0x62,0xf2,0x7e,0x9f,0x72,0x72,0x80]
				vcvtneps2bf16 xmm6 {k7} {z}, dword ptr [edx - 512]{1to4}

				// CHECK: vcvtneps2bf16 xmm6, ymm5
				// CHECK: encoding: [0x62,0xf2,0x7e,0x28,0x72,0xf5]
				vcvtneps2bf16 xmm6, ymm5

				// CHECK: vcvtneps2bf16 xmm6 {k7}, ymmword ptr [esp + 8*esi + 268435456]
				// CHECK: encoding: [0x62,0xf2,0x7e,0x2f,0x72,0xb4,0xf4,0x00,0x00,0x00,0x10]
				vcvtneps2bf16 xmm6 {k7}, ymmword ptr [esp + 8*esi + 268435456]

				// CHECK: vcvtneps2bf16 xmm6, dword ptr [ecx]{1to8}
				// CHECK: encoding: [0x62,0xf2,0x7e,0x38,0x72,0x31]
				vcvtneps2bf16 xmm6, dword ptr [ecx]{1to8}

				// CHECK: vcvtneps2bf16 xmm6, ymmword ptr [ecx + 4064]
				// CHECK: encoding: [0x62,0xf2,0x7e,0x28,0x72,0x71,0x7f]
				vcvtneps2bf16 xmm6, ymmword ptr [ecx + 4064]

				// CHECK: vcvtneps2bf16 xmm6 {k7} {z}, dword ptr [edx - 512]{1to8}
				// CHECK: encoding: [0x62,0xf2,0x7e,0xbf,0x72,0x72,0x80]
				vcvtneps2bf16 xmm6 {k7} {z}, dword ptr [edx - 512]{1to8}

				// CHECK: vdpbf16ps ymm6, ymm5, ymm4
				// CHECK: encoding: [0x62,0xf2,0x56,0x28,0x52,0xf4]
				vdpbf16ps ymm6, ymm5, ymm4

				// CHECK: vdpbf16ps ymm6 {k7}, ymm5, ymmword ptr [esp + 8*esi + 268435456]
				// CHECK: encoding: [0x62,0xf2,0x56,0x2f,0x52,0xb4,0xf4,0x00,0x00,0x00,0x10]
				vdpbf16ps ymm6 {k7}, ymm5, ymmword ptr [esp + 8*esi + 268435456]

				// CHECK: vdpbf16ps ymm6, ymm5, dword ptr [ecx]{1to8}
				// CHECK: encoding: [0x62,0xf2,0x56,0x38,0x52,0x31]
				vdpbf16ps ymm6, ymm5, dword ptr [ecx]{1to8}

				// CHECK: vdpbf16ps ymm6, ymm5, ymmword ptr [ecx + 4064]
				// CHECK: encoding: [0x62,0xf2,0x56,0x28,0x52,0x71,0x7f]
				vdpbf16ps ymm6, ymm5, ymmword ptr [ecx + 4064]

				// CHECK: vdpbf16ps ymm6 {k7} {z}, ymm5, dword ptr [edx - 512]{1to8}
				// CHECK: encoding: [0x62,0xf2,0x56,0xbf,0x52,0x72,0x80]
				vdpbf16ps ymm6 {k7} {z}, ymm5, dword ptr [edx - 512]{1to8}

				// CHECK: vdpbf16ps xmm6, xmm5, xmm4
				// CHECK: encoding: [0x62,0xf2,0x56,0x08,0x52,0xf4]
				vdpbf16ps xmm6, xmm5, xmm4

				// CHECK: vdpbf16ps xmm6 {k7}, xmm5, xmmword ptr [esp + 8*esi + 268435456]
				// CHECK: encoding: [0x62,0xf2,0x56,0x0f,0x52,0xb4,0xf4,0x00,0x00,0x00,0x10]
				vdpbf16ps xmm6 {k7}, xmm5, xmmword ptr [esp + 8*esi + 268435456]

				// CHECK: vdpbf16ps xmm6, xmm5, dword ptr [ecx]{1to4}
				// CHECK: encoding: [0x62,0xf2,0x56,0x18,0x52,0x31]
				vdpbf16ps xmm6, xmm5, dword ptr [ecx]{1to4}

				// CHECK: vdpbf16ps xmm6, xmm5, xmmword ptr [ecx + 2032]
				// CHECK: encoding: [0x62,0xf2,0x56,0x08,0x52,0x71,0x7f]
				vdpbf16ps xmm6, xmm5, xmmword ptr [ecx + 2032]

				// CHECK: vdpbf16ps xmm6 {k7} {z}, xmm5, dword ptr [edx - 512]{1to4}
				// CHECK: encoding: [0x62,0xf2,0x56,0x9f,0x52,0x72,0x80]
				vdpbf16ps xmm6 {k7} {z}, xmm5, dword ptr [edx - 512]{1to4}

test/MC/X86/intel-syntax-x86-64-avx512_bf16.s

This file was added.

				// RUN: llvm-mc -triple x86_64-unknown-unknown -x86-asm-syntax=intel -output-asm-variant=1 --show-encoding %s \| FileCheck %s

				// CHECK: vcvtne2ps2bf16 zmm30, zmm29, zmm28
				// CHECK: encoding: [0x62,0x02,0x17,0x40,0x72,0xf4]
				vcvtne2ps2bf16 zmm30, zmm29, zmm28

				// CHECK: vcvtne2ps2bf16 zmm30 {k7}, zmm29, zmm28
				// CHECK: encoding: [0x62,0x02,0x17,0x47,0x72,0xf4]
				vcvtne2ps2bf16 zmm30 {k7}, zmm29, zmm28

				// CHECK: vcvtne2ps2bf16 zmm30 {k7} {z}, zmm29, zmm28
				// CHECK: encoding: [0x62,0x02,0x17,0xc7,0x72,0xf4]
				vcvtne2ps2bf16 zmm30 {k7} {z}, zmm29, zmm28

				// CHECK: vcvtne2ps2bf16 zmm30, zmm29, zmmword ptr [rcx]
				// CHECK: encoding: [0x62,0x62,0x17,0x40,0x72,0x31]
				vcvtne2ps2bf16 zmm30, zmm29, zmmword ptr [rcx]

				// CHECK: vcvtne2ps2bf16 zmm30, zmm29, zmmword ptr [rax + 8*r14 + 291]
				// CHECK: encoding: [0x62,0x22,0x17,0x40,0x72,0xb4,0xf0,0x23,0x01,0x00,0x00]
				vcvtne2ps2bf16 zmm30, zmm29, zmmword ptr [rax + 8*r14 + 291]

				// CHECK: vcvtne2ps2bf16 zmm30, zmm29, zmmword ptr [rax + 8*r14 + 268435456]
				// CHECK: encoding: [0x62,0x22,0x17,0x40,0x72,0xb4,0xf0,0x00,0x00,0x00,0x10]
				vcvtne2ps2bf16 zmm30, zmm29, zmmword ptr [rax + 8*r14 + 268435456]

				// CHECK: vcvtne2ps2bf16 zmm30, zmm29, zmmword ptr [rsp - 4]
				// CHECK: encoding: [0x62,0x62,0x17,0x40,0x72,0xb4,0x24,0xfc,0xff,0xff,0xff]
				vcvtne2ps2bf16 zmm30, zmm29, zmmword ptr [rsp - 4]

				// CHECK: vcvtne2ps2bf16 zmm30, zmm29, dword ptr [rcx]{1to16}
				// CHECK: encoding: [0x62,0x62,0x17,0x50,0x72,0x31]
				vcvtne2ps2bf16 zmm30, zmm29, dword ptr [rcx]{1to16}

				// CHECK: vcvtne2ps2bf16 zmm30, zmm29, zmmword ptr [rdx + 8128]
				// CHECK: encoding: [0x62,0x62,0x17,0x40,0x72,0x72,0x7f]
				vcvtne2ps2bf16 zmm30, zmm29, zmmword ptr [rdx + 8128]

				// CHECK: vcvtne2ps2bf16 zmm30, zmm29, zmmword ptr [rdx - 8192]
				// CHECK: encoding: [0x62,0x62,0x17,0x40,0x72,0x72,0x80]
				vcvtne2ps2bf16 zmm30, zmm29, zmmword ptr [rdx - 8192]

				// CHECK: vcvtne2ps2bf16 zmm30, zmm29, dword ptr [rdx + 508]{1to16}
				// CHECK: encoding: [0x62,0x62,0x17,0x50,0x72,0x72,0x7f]
				vcvtne2ps2bf16 zmm30, zmm29, dword ptr [rdx + 508]{1to16}

				// CHECK: vcvtne2ps2bf16 zmm30, zmm29, dword ptr [rdx - 512]{1to16}
				// CHECK: encoding: [0x62,0x62,0x17,0x50,0x72,0x72,0x80]
				vcvtne2ps2bf16 zmm30, zmm29, dword ptr [rdx - 512]{1to16}

				// CHECK: vcvtneps2bf16 ymm30, zmm29
				// CHECK: encoding: [0x62,0x02,0x7e,0x48,0x72,0xf5]
				vcvtneps2bf16 ymm30, zmm29

				// CHECK: vcvtneps2bf16 ymm30 {k7}, zmmword ptr [rbp + 8*r14 + 268435456]
				// CHECK: encoding: [0x62,0x22,0x7e,0x4f,0x72,0xb4,0xf5,0x00,0x00,0x00,0x10]
				vcvtneps2bf16 ymm30 {k7}, zmmword ptr [rbp + 8*r14 + 268435456]

				// CHECK: vcvtneps2bf16 ymm30, dword ptr [r9]{1to16}
				// CHECK: encoding: [0x62,0x42,0x7e,0x58,0x72,0x31]
				vcvtneps2bf16 ymm30, dword ptr [r9]{1to16}

				// CHECK: vcvtneps2bf16 ymm30, zmmword ptr [rcx + 8128]
				// CHECK: encoding: [0x62,0x62,0x7e,0x48,0x72,0x71,0x7f]
				vcvtneps2bf16 ymm30, zmmword ptr [rcx + 8128]

				// CHECK: vcvtneps2bf16 ymm30 {k7} {z}, dword ptr [rdx - 512]{1to16}
				// CHECK: encoding: [0x62,0x62,0x7e,0xdf,0x72,0x72,0x80]
				vcvtneps2bf16 ymm30 {k7} {z}, dword ptr [rdx - 512]{1to16}

				// CHECK: vdpbf16ps zmm30, zmm29, zmm28
				// CHECK: encoding: [0x62,0x02,0x16,0x40,0x52,0xf4]
				vdpbf16ps zmm30, zmm29, zmm28

				// CHECK: vdpbf16ps zmm30 {k7}, zmm29, zmmword ptr [rbp + 8*r14 + 268435456]
				// CHECK: encoding: [0x62,0x22,0x16,0x47,0x52,0xb4,0xf5,0x00,0x00,0x00,0x10]
				vdpbf16ps zmm30 {k7}, zmm29, zmmword ptr [rbp + 8*r14 + 268435456]

				// CHECK: vdpbf16ps zmm30, zmm29, dword ptr [r9]{1to16}
				// CHECK: encoding: [0x62,0x42,0x16,0x50,0x52,0x31]
				vdpbf16ps zmm30, zmm29, dword ptr [r9]{1to16}

				// CHECK: vdpbf16ps zmm30, zmm29, zmmword ptr [rcx + 8128]
				// CHECK: encoding: [0x62,0x62,0x16,0x40,0x52,0x71,0x7f]
				vdpbf16ps zmm30, zmm29, zmmword ptr [rcx + 8128]

				// CHECK: vdpbf16ps zmm30 {k7} {z}, zmm29, dword ptr [rdx - 512]{1to16}
				// CHECK: encoding: [0x62,0x62,0x16,0xd7,0x52,0x72,0x80]
				vdpbf16ps zmm30 {k7} {z}, zmm29, dword ptr [rdx - 512]{1to16}

test/MC/X86/intel-syntax-x86-64-avx512_bf16_vl.s

This file was added.

				// RUN: llvm-mc -triple x86_64-unknown-unknown -x86-asm-syntax=intel -output-asm-variant=1 --show-encoding %s \| FileCheck %s

				// CHECK: vcvtne2ps2bf16 xmm30, xmm29, xmm28
				// CHECK: encoding: [0x62,0x02,0x17,0x00,0x72,0xf4]
				vcvtne2ps2bf16 xmm30, xmm29, xmm28

				// CHECK: vcvtne2ps2bf16 xmm30 {k7}, xmm29, xmm28
				// CHECK: encoding: [0x62,0x02,0x17,0x07,0x72,0xf4]
				vcvtne2ps2bf16 xmm30 {k7}, xmm29, xmm28

				// CHECK: vcvtne2ps2bf16 xmm30 {k7} {z}, xmm29, xmm28
				// CHECK: encoding: [0x62,0x02,0x17,0x87,0x72,0xf4]
				vcvtne2ps2bf16 xmm30 {k7} {z}, xmm29, xmm28

				// CHECK: vcvtne2ps2bf16 xmm30, xmm29, xmmword ptr [rcx]
				// CHECK: encoding: [0x62,0x62,0x17,0x00,0x72,0x31]
				vcvtne2ps2bf16 xmm30, xmm29, xmmword ptr [rcx]

				// CHECK: vcvtne2ps2bf16 xmm30, xmm29, xmmword ptr [rax + 8*r14 + 291]
				// CHECK: encoding: [0x62,0x22,0x17,0x00,0x72,0xb4,0xf0,0x23,0x01,0x00,0x00]
				vcvtne2ps2bf16 xmm30, xmm29, xmmword ptr [rax + 8*r14 + 291]

				// CHECK: vcvtne2ps2bf16 xmm30, xmm29, xmmword ptr [rax + 8*r14 + 268435456]
				// CHECK: encoding: [0x62,0x22,0x17,0x00,0x72,0xb4,0xf0,0x00,0x00,0x00,0x10]
				vcvtne2ps2bf16 xmm30, xmm29, xmmword ptr [rax + 8*r14 + 268435456]

				// CHECK: vcvtne2ps2bf16 xmm30, xmm29, xmmword ptr [rsp - 4]
				// CHECK: encoding: [0x62,0x62,0x17,0x00,0x72,0xb4,0x24,0xfc,0xff,0xff,0xff]
				vcvtne2ps2bf16 xmm30, xmm29, xmmword ptr [rsp - 4]

				// CHECK: vcvtne2ps2bf16 xmm30, xmm29, dword ptr [rcx]{1to4}
				// CHECK: encoding: [0x62,0x62,0x17,0x10,0x72,0x31]
				vcvtne2ps2bf16 xmm30, xmm29, dword ptr [rcx]{1to4}

				// CHECK: vcvtne2ps2bf16 xmm30, xmm29, xmmword ptr [rdx + 2032]
				// CHECK: encoding: [0x62,0x62,0x17,0x00,0x72,0x72,0x7f]
				vcvtne2ps2bf16 xmm30, xmm29, xmmword ptr [rdx + 2032]

				// CHECK: vcvtne2ps2bf16 xmm30, xmm29, xmmword ptr [rdx - 2048]
				// CHECK: encoding: [0x62,0x62,0x17,0x00,0x72,0x72,0x80]
				vcvtne2ps2bf16 xmm30, xmm29, xmmword ptr [rdx - 2048]

				// CHECK: vcvtne2ps2bf16 xmm30, xmm29, dword ptr [rdx + 508]{1to4}
				// CHECK: encoding: [0x62,0x62,0x17,0x10,0x72,0x72,0x7f]
				vcvtne2ps2bf16 xmm30, xmm29, dword ptr [rdx + 508]{1to4}

				// CHECK: vcvtne2ps2bf16 xmm30, xmm29, dword ptr [rdx - 512]{1to4}
				// CHECK: encoding: [0x62,0x62,0x17,0x10,0x72,0x72,0x80]
				vcvtne2ps2bf16 xmm30, xmm29, dword ptr [rdx - 512]{1to4}

				// CHECK: vcvtne2ps2bf16 ymm30, ymm29, ymm28
				// CHECK: encoding: [0x62,0x02,0x17,0x20,0x72,0xf4]
				vcvtne2ps2bf16 ymm30, ymm29, ymm28

				// CHECK: vcvtne2ps2bf16 ymm30 {k7}, ymm29, ymm28
				// CHECK: encoding: [0x62,0x02,0x17,0x27,0x72,0xf4]
				vcvtne2ps2bf16 ymm30 {k7}, ymm29, ymm28

				// CHECK: vcvtne2ps2bf16 ymm30 {k7} {z}, ymm29, ymm28
				// CHECK: encoding: [0x62,0x02,0x17,0xa7,0x72,0xf4]
				vcvtne2ps2bf16 ymm30 {k7} {z}, ymm29, ymm28

				// CHECK: vcvtne2ps2bf16 ymm30, ymm29, ymmword ptr [rcx]
				// CHECK: encoding: [0x62,0x62,0x17,0x20,0x72,0x31]
				vcvtne2ps2bf16 ymm30, ymm29, ymmword ptr [rcx]

				// CHECK: vcvtne2ps2bf16 ymm30, ymm29, ymmword ptr [rax + 8*r14 + 291]
				// CHECK: encoding: [0x62,0x22,0x17,0x20,0x72,0xb4,0xf0,0x23,0x01,0x00,0x00]
				vcvtne2ps2bf16 ymm30, ymm29, ymmword ptr [rax + 8*r14 + 291]

				// CHECK: vcvtne2ps2bf16 ymm30, ymm29, ymmword ptr [rax + 8*r14 + 268435456]
				// CHECK: encoding: [0x62,0x22,0x17,0x20,0x72,0xb4,0xf0,0x00,0x00,0x00,0x10]
				vcvtne2ps2bf16 ymm30, ymm29, ymmword ptr [rax + 8*r14 + 268435456]

				// CHECK: vcvtne2ps2bf16 ymm30, ymm29, ymmword ptr [rsp - 4]
				// CHECK: encoding: [0x62,0x62,0x17,0x20,0x72,0xb4,0x24,0xfc,0xff,0xff,0xff]
				vcvtne2ps2bf16 ymm30, ymm29, ymmword ptr [rsp - 4]

				// CHECK: vcvtne2ps2bf16 ymm30, ymm29, dword ptr [rcx]{1to8}
				// CHECK: encoding: [0x62,0x62,0x17,0x30,0x72,0x31]
				vcvtne2ps2bf16 ymm30, ymm29, dword ptr [rcx]{1to8}

				// CHECK: vcvtne2ps2bf16 ymm30, ymm29, ymmword ptr [rdx + 4064]
				// CHECK: encoding: [0x62,0x62,0x17,0x20,0x72,0x72,0x7f]
				vcvtne2ps2bf16 ymm30, ymm29, ymmword ptr [rdx + 4064]

				// CHECK: vcvtne2ps2bf16 ymm30, ymm29, ymmword ptr [rdx - 4096]
				// CHECK: encoding: [0x62,0x62,0x17,0x20,0x72,0x72,0x80]
				vcvtne2ps2bf16 ymm30, ymm29, ymmword ptr [rdx - 4096]

				// CHECK: vcvtne2ps2bf16 ymm30, ymm29, dword ptr [rdx + 508]{1to8}
				// CHECK: encoding: [0x62,0x62,0x17,0x30,0x72,0x72,0x7f]
				vcvtne2ps2bf16 ymm30, ymm29, dword ptr [rdx + 508]{1to8}

				// CHECK: vcvtne2ps2bf16 ymm30, ymm29, dword ptr [rdx - 512]{1to8}
				// CHECK: encoding: [0x62,0x62,0x17,0x30,0x72,0x72,0x80]
				vcvtne2ps2bf16 ymm30, ymm29, dword ptr [rdx - 512]{1to8}

				// CHECK: vcvtneps2bf16 xmm30, xmm29
				// CHECK: encoding: [0x62,0x02,0x7e,0x08,0x72,0xf5]
				vcvtneps2bf16 xmm30, xmm29

				// CHECK: vcvtneps2bf16 xmm30 {k7}, xmmword ptr [rbp + 8*r14 + 268435456]
				// CHECK: encoding: [0x62,0x22,0x7e,0x0f,0x72,0xb4,0xf5,0x00,0x00,0x00,0x10]
				vcvtneps2bf16 xmm30 {k7}, xmmword ptr [rbp + 8*r14 + 268435456]

				// CHECK: vcvtneps2bf16 xmm30, dword ptr [r9]{1to4}
				// CHECK: encoding: [0x62,0x42,0x7e,0x18,0x72,0x31]
				vcvtneps2bf16 xmm30, dword ptr [r9]{1to4}

				// CHECK: vcvtneps2bf16 xmm30, xmmword ptr [rcx + 2032]
				// CHECK: encoding: [0x62,0x62,0x7e,0x08,0x72,0x71,0x7f]
				vcvtneps2bf16 xmm30, xmmword ptr [rcx + 2032]

				// CHECK: vcvtneps2bf16 xmm30 {k7} {z}, dword ptr [rdx - 512]{1to4}
				// CHECK: encoding: [0x62,0x62,0x7e,0x9f,0x72,0x72,0x80]
				vcvtneps2bf16 xmm30 {k7} {z}, dword ptr [rdx - 512]{1to4}

				// CHECK: vcvtneps2bf16 xmm30, ymm29
				// CHECK: encoding: [0x62,0x02,0x7e,0x28,0x72,0xf5]
				vcvtneps2bf16 xmm30, ymm29

				// CHECK: vcvtneps2bf16 xmm30 {k7}, ymmword ptr [rbp + 8*r14 + 268435456]
				// CHECK: encoding: [0x62,0x22,0x7e,0x2f,0x72,0xb4,0xf5,0x00,0x00,0x00,0x10]
				vcvtneps2bf16 xmm30 {k7}, ymmword ptr [rbp + 8*r14 + 268435456]

				// CHECK: vcvtneps2bf16 xmm30, dword ptr [r9]{1to8}
				// CHECK: encoding: [0x62,0x42,0x7e,0x38,0x72,0x31]
				vcvtneps2bf16 xmm30, dword ptr [r9]{1to8}

				// CHECK: vcvtneps2bf16 xmm30, ymmword ptr [rcx + 4064]
				// CHECK: encoding: [0x62,0x62,0x7e,0x28,0x72,0x71,0x7f]
				vcvtneps2bf16 xmm30, ymmword ptr [rcx + 4064]

				// CHECK: vcvtneps2bf16 xmm30 {k7} {z}, dword ptr [rdx - 512]{1to8}
				// CHECK: encoding: [0x62,0x62,0x7e,0xbf,0x72,0x72,0x80]
				vcvtneps2bf16 xmm30 {k7} {z}, dword ptr [rdx - 512]{1to8}

				// CHECK: vdpbf16ps ymm30, ymm29, ymm28
				// CHECK: encoding: [0x62,0x02,0x16,0x20,0x52,0xf4]
				vdpbf16ps ymm30, ymm29, ymm28

				// CHECK: vdpbf16ps ymm30 {k7}, ymm29, ymmword ptr [rbp + 8*r14 + 268435456]
				// CHECK: encoding: [0x62,0x22,0x16,0x27,0x52,0xb4,0xf5,0x00,0x00,0x00,0x10]
				vdpbf16ps ymm30 {k7}, ymm29, ymmword ptr [rbp + 8*r14 + 268435456]

				// CHECK: vdpbf16ps ymm30, ymm29, dword ptr [r9]{1to8}
				// CHECK: encoding: [0x62,0x42,0x16,0x30,0x52,0x31]
				vdpbf16ps ymm30, ymm29, dword ptr [r9]{1to8}

				// CHECK: vdpbf16ps ymm30, ymm29, ymmword ptr [rcx + 4064]
				// CHECK: encoding: [0x62,0x62,0x16,0x20,0x52,0x71,0x7f]
				vdpbf16ps ymm30, ymm29, ymmword ptr [rcx + 4064]

				// CHECK: vdpbf16ps ymm30 {k7} {z}, ymm29, dword ptr [rdx - 512]{1to8}
				// CHECK: encoding: [0x62,0x62,0x16,0xb7,0x52,0x72,0x80]
				vdpbf16ps ymm30 {k7} {z}, ymm29, dword ptr [rdx - 512]{1to8}

				// CHECK: vdpbf16ps xmm30, xmm29, xmm28
				// CHECK: encoding: [0x62,0x02,0x16,0x00,0x52,0xf4]
				vdpbf16ps xmm30, xmm29, xmm28

				// CHECK: vdpbf16ps xmm30 {k7}, xmm29, xmmword ptr [rbp + 8*r14 + 268435456]
				// CHECK: encoding: [0x62,0x22,0x16,0x07,0x52,0xb4,0xf5,0x00,0x00,0x00,0x10]
				vdpbf16ps xmm30 {k7}, xmm29, xmmword ptr [rbp + 8*r14 + 268435456]

				// CHECK: vdpbf16ps xmm30, xmm29, dword ptr [r9]{1to4}
				// CHECK: encoding: [0x62,0x42,0x16,0x10,0x52,0x31]
				vdpbf16ps xmm30, xmm29, dword ptr [r9]{1to4}

				// CHECK: vdpbf16ps xmm30, xmm29, xmmword ptr [rcx + 2032]
				// CHECK: encoding: [0x62,0x62,0x16,0x00,0x52,0x71,0x7f]
				vdpbf16ps xmm30, xmm29, xmmword ptr [rcx + 2032]

				// CHECK: vdpbf16ps xmm30 {k7} {z}, xmm29, dword ptr [rdx - 512]{1to4}
				// CHECK: encoding: [0x62,0x62,0x16,0x97,0x52,0x72,0x80]
				vdpbf16ps xmm30 {k7} {z}, xmm29, dword ptr [rdx - 512]{1to4}

test/MC/X86/x86-64-avx512_bf16-encoding.s

This file was added.

				// RUN: llvm-mc -triple x86_64-unknown-unknown --show-encoding < %s \| FileCheck %s

				// CHECK: vcvtne2ps2bf16 %zmm28, %zmm29, %zmm30
				// CHECK: encoding: [0x62,0x02,0x17,0x40,0x72,0xf4]
				vcvtne2ps2bf16 %zmm28, %zmm29, %zmm30

				// CHECK: vcvtne2ps2bf16 %zmm28, %zmm29, %zmm30 {%k7}
				// CHECK: encoding: [0x62,0x02,0x17,0x47,0x72,0xf4]
				vcvtne2ps2bf16 %zmm28, %zmm29, %zmm30 {%k7}

				// CHECK: vcvtne2ps2bf16 %zmm28, %zmm29, %zmm30 {%k7} {z}
				// CHECK: encoding: [0x62,0x02,0x17,0xc7,0x72,0xf4]
				vcvtne2ps2bf16 %zmm28, %zmm29, %zmm30 {%k7} {z}

				// CHECK: vcvtne2ps2bf16 (%rcx), %zmm29, %zmm30
				// CHECK: encoding: [0x62,0x62,0x17,0x40,0x72,0x31]
				vcvtne2ps2bf16 (%rcx), %zmm29, %zmm30

				// CHECK: vcvtne2ps2bf16 291(%rax,%r14,8), %zmm29, %zmm30
				// CHECK: encoding: [0x62,0x22,0x17,0x40,0x72,0xb4,0xf0,0x23,0x01,0x00,0x00]
				vcvtne2ps2bf16 291(%rax,%r14,8), %zmm29, %zmm30

				// CHECK: vcvtne2ps2bf16 268435456(%rax,%r14,8), %zmm29, %zmm30
				// CHECK: encoding: [0x62,0x22,0x17,0x40,0x72,0xb4,0xf0,0x00,0x00,0x00,0x10]
				vcvtne2ps2bf16 268435456(%rax,%r14,8), %zmm29, %zmm30

				// CHECK: vcvtne2ps2bf16 -64(%rsp), %zmm29, %zmm30
				// CHECK: encoding: [0x62,0x62,0x17,0x40,0x72,0x74,0x24,0xff]
				vcvtne2ps2bf16 -64(%rsp), %zmm29, %zmm30

				// CHECK: vcvtne2ps2bf16 (%rcx){1to16}, %zmm29, %zmm30
				// CHECK: encoding: [0x62,0x62,0x17,0x50,0x72,0x31]
				vcvtne2ps2bf16 (%rcx){1to16}, %zmm29, %zmm30

				// CHECK: vcvtne2ps2bf16 8128(%rdx), %zmm29, %zmm30
				// CHECK: encoding: [0x62,0x62,0x17,0x40,0x72,0x72,0x7f]
				vcvtne2ps2bf16 8128(%rdx), %zmm29, %zmm30

				// CHECK: vcvtne2ps2bf16 -8192(%rdx), %zmm29, %zmm30
				// CHECK: encoding: [0x62,0x62,0x17,0x40,0x72,0x72,0x80]
				vcvtne2ps2bf16 -8192(%rdx), %zmm29, %zmm30

				// CHECK: vcvtne2ps2bf16 508(%rdx){1to16}, %zmm29, %zmm30
				// CHECK: encoding: [0x62,0x62,0x17,0x50,0x72,0x72,0x7f]
				vcvtne2ps2bf16 508(%rdx){1to16}, %zmm29, %zmm30

				// CHECK: vcvtne2ps2bf16 -512(%rdx){1to16}, %zmm29, %zmm30
				// CHECK: encoding: [0x62,0x62,0x17,0x50,0x72,0x72,0x80]
				vcvtne2ps2bf16 -512(%rdx){1to16}, %zmm29, %zmm30

				// CHECK: vcvtneps2bf16 %zmm29, %ymm30
				// CHECK: encoding: [0x62,0x02,0x7e,0x48,0x72,0xf5]
				vcvtneps2bf16 %zmm29, %ymm30

				// CHECK: vcvtneps2bf16 268435456(%rbp,%r14,8), %ymm30 {%k7}
				// CHECK: encoding: [0x62,0x22,0x7e,0x4f,0x72,0xb4,0xf5,0x00,0x00,0x00,0x10]
				vcvtneps2bf16 268435456(%rbp,%r14,8), %ymm30 {%k7}

				// CHECK: vcvtneps2bf16 (%r9){1to16}, %ymm30
				// CHECK: encoding: [0x62,0x42,0x7e,0x58,0x72,0x31]
				vcvtneps2bf16 (%r9){1to16}, %ymm30

				// CHECK: vcvtneps2bf16 8128(%rcx), %ymm30
				// CHECK: encoding: [0x62,0x62,0x7e,0x48,0x72,0x71,0x7f]
				vcvtneps2bf16 8128(%rcx), %ymm30

				// CHECK: vcvtneps2bf16 -512(%rdx){1to16}, %ymm30 {%k7} {z}
				// CHECK: encoding: [0x62,0x62,0x7e,0xdf,0x72,0x72,0x80]
				vcvtneps2bf16 -512(%rdx){1to16}, %ymm30 {%k7} {z}

				// CHECK: vdpbf16ps %zmm28, %zmm29, %zmm30
				// CHECK: encoding: [0x62,0x02,0x16,0x40,0x52,0xf4]
				vdpbf16ps %zmm28, %zmm29, %zmm30

				// CHECK: vdpbf16ps 268435456(%rbp,%r14,8), %zmm29, %zmm30 {%k7}
				// CHECK: encoding: [0x62,0x22,0x16,0x47,0x52,0xb4,0xf5,0x00,0x00,0x00,0x10]
				vdpbf16ps 268435456(%rbp,%r14,8), %zmm29, %zmm30 {%k7}

				// CHECK: vdpbf16ps (%r9){1to16}, %zmm29, %zmm30
				// CHECK: encoding: [0x62,0x42,0x16,0x50,0x52,0x31]
				vdpbf16ps (%r9){1to16}, %zmm29, %zmm30

				// CHECK: vdpbf16ps 8128(%rcx), %zmm29, %zmm30
				// CHECK: encoding: [0x62,0x62,0x16,0x40,0x52,0x71,0x7f]
				vdpbf16ps 8128(%rcx), %zmm29, %zmm30

				// CHECK: vdpbf16ps -512(%rdx){1to16}, %zmm29, %zmm30 {%k7} {z}
				// CHECK: encoding: [0x62,0x62,0x16,0xd7,0x52,0x72,0x80]
				vdpbf16ps -512(%rdx){1to16}, %zmm29, %zmm30 {%k7} {z}

test/MC/X86/x86-64-avx512_bf16_vl-encoding.s

This file was added.

				// RUN: llvm-mc -triple x86_64-unknown-unknown --show-encoding < %s \| FileCheck %s

				// CHECK: vcvtne2ps2bf16 %xmm28, %xmm29, %xmm30
				// CHECK: encoding: [0x62,0x02,0x17,0x00,0x72,0xf4]
				vcvtne2ps2bf16 %xmm28, %xmm29, %xmm30

				// CHECK: vcvtne2ps2bf16 %xmm28, %xmm29, %xmm30 {%k7}
				// CHECK: encoding: [0x62,0x02,0x17,0x07,0x72,0xf4]
				vcvtne2ps2bf16 %xmm28, %xmm29, %xmm30 {%k7}

				// CHECK: vcvtne2ps2bf16 %xmm28, %xmm29, %xmm30 {%k7} {z}
				// CHECK: encoding: [0x62,0x02,0x17,0x87,0x72,0xf4]
				vcvtne2ps2bf16 %xmm28, %xmm29, %xmm30 {%k7} {z}

				// CHECK: vcvtne2ps2bf16 (%rcx), %xmm29, %xmm30
				// CHECK: encoding: [0x62,0x62,0x17,0x00,0x72,0x31]
				vcvtne2ps2bf16 (%rcx), %xmm29, %xmm30

				// CHECK: vcvtne2ps2bf16 291(%rax,%r14,8), %xmm29, %xmm30
				// CHECK: encoding: [0x62,0x22,0x17,0x00,0x72,0xb4,0xf0,0x23,0x01,0x00,0x00]
				vcvtne2ps2bf16 291(%rax,%r14,8), %xmm29, %xmm30

				// CHECK: vcvtne2ps2bf16 268435456(%rax,%r14,8), %xmm29, %xmm30
				// CHECK: encoding: [0x62,0x22,0x17,0x00,0x72,0xb4,0xf0,0x00,0x00,0x00,0x10]
				vcvtne2ps2bf16 268435456(%rax,%r14,8), %xmm29, %xmm30

				// CHECK: vcvtne2ps2bf16 -16(%rsp), %xmm29, %xmm30
				// CHECK: encoding: [0x62,0x62,0x17,0x00,0x72,0x74,0x24,0xff]
				vcvtne2ps2bf16 -16(%rsp), %xmm29, %xmm30

				// CHECK: vcvtne2ps2bf16 (%rcx){1to4}, %xmm29, %xmm30
				// CHECK: encoding: [0x62,0x62,0x17,0x10,0x72,0x31]
				vcvtne2ps2bf16 (%rcx){1to4}, %xmm29, %xmm30

				// CHECK: vcvtne2ps2bf16 2032(%rdx), %xmm29, %xmm30
				// CHECK: encoding: [0x62,0x62,0x17,0x00,0x72,0x72,0x7f]
				vcvtne2ps2bf16 2032(%rdx), %xmm29, %xmm30

				// CHECK: vcvtne2ps2bf16 -2048(%rdx), %xmm29, %xmm30
				// CHECK: encoding: [0x62,0x62,0x17,0x00,0x72,0x72,0x80]
				vcvtne2ps2bf16 -2048(%rdx), %xmm29, %xmm30

				// CHECK: vcvtne2ps2bf16 508(%rdx){1to4}, %xmm29, %xmm30
				// CHECK: encoding: [0x62,0x62,0x17,0x10,0x72,0x72,0x7f]
				vcvtne2ps2bf16 508(%rdx){1to4}, %xmm29, %xmm30

				// CHECK: vcvtne2ps2bf16 -512(%rdx){1to4}, %xmm29, %xmm30
				// CHECK: encoding: [0x62,0x62,0x17,0x10,0x72,0x72,0x80]
				vcvtne2ps2bf16 -512(%rdx){1to4}, %xmm29, %xmm30

				// CHECK: vcvtne2ps2bf16 %ymm28, %ymm29, %ymm30
				// CHECK: encoding: [0x62,0x02,0x17,0x20,0x72,0xf4]
				vcvtne2ps2bf16 %ymm28, %ymm29, %ymm30

				// CHECK: vcvtne2ps2bf16 %ymm28, %ymm29, %ymm30 {%k7}
				// CHECK: encoding: [0x62,0x02,0x17,0x27,0x72,0xf4]
				vcvtne2ps2bf16 %ymm28, %ymm29, %ymm30 {%k7}

				// CHECK: vcvtne2ps2bf16 %ymm28, %ymm29, %ymm30 {%k7} {z}
				// CHECK: encoding: [0x62,0x02,0x17,0xa7,0x72,0xf4]
				vcvtne2ps2bf16 %ymm28, %ymm29, %ymm30 {%k7} {z}

				// CHECK: vcvtne2ps2bf16 (%rcx), %ymm29, %ymm30
				// CHECK: encoding: [0x62,0x62,0x17,0x20,0x72,0x31]
				vcvtne2ps2bf16 (%rcx), %ymm29, %ymm30

				// CHECK: vcvtne2ps2bf16 291(%rax,%r14,8), %ymm29, %ymm30
				// CHECK: encoding: [0x62,0x22,0x17,0x20,0x72,0xb4,0xf0,0x23,0x01,0x00,0x00]
				vcvtne2ps2bf16 291(%rax,%r14,8), %ymm29, %ymm30

				// CHECK: vcvtne2ps2bf16 268435456(%rax,%r14,8), %ymm29, %ymm30
				// CHECK: encoding: [0x62,0x22,0x17,0x20,0x72,0xb4,0xf0,0x00,0x00,0x00,0x10]
				vcvtne2ps2bf16 268435456(%rax,%r14,8), %ymm29, %ymm30

				// CHECK: vcvtne2ps2bf16 -32(%rsp), %ymm29, %ymm30
				// CHECK: encoding: [0x62,0x62,0x17,0x20,0x72,0x74,0x24,0xff]
				vcvtne2ps2bf16 -32(%rsp), %ymm29, %ymm30

				// CHECK: vcvtne2ps2bf16 (%rcx){1to8}, %ymm29, %ymm30
				// CHECK: encoding: [0x62,0x62,0x17,0x30,0x72,0x31]
				vcvtne2ps2bf16 (%rcx){1to8}, %ymm29, %ymm30

				// CHECK: vcvtne2ps2bf16 4064(%rdx), %ymm29, %ymm30
				// CHECK: encoding: [0x62,0x62,0x17,0x20,0x72,0x72,0x7f]
				vcvtne2ps2bf16 4064(%rdx), %ymm29, %ymm30

				// CHECK: vcvtne2ps2bf16 -4096(%rdx), %ymm29, %ymm30
				// CHECK: encoding: [0x62,0x62,0x17,0x20,0x72,0x72,0x80]
				vcvtne2ps2bf16 -4096(%rdx), %ymm29, %ymm30

				// CHECK: vcvtne2ps2bf16 508(%rdx){1to8}, %ymm29, %ymm30
				// CHECK: encoding: [0x62,0x62,0x17,0x30,0x72,0x72,0x7f]
				vcvtne2ps2bf16 508(%rdx){1to8}, %ymm29, %ymm30

				// CHECK: vcvtne2ps2bf16 -512(%rdx){1to8}, %ymm29, %ymm30
				// CHECK: encoding: [0x62,0x62,0x17,0x30,0x72,0x72,0x80]
				vcvtne2ps2bf16 -512(%rdx){1to8}, %ymm29, %ymm30

				// CHECK: vcvtneps2bf16 %xmm29, %xmm30
				// CHECK: encoding: [0x62,0x02,0x7e,0x08,0x72,0xf5]
				vcvtneps2bf16 %xmm29, %xmm30

				// CHECK: vcvtneps2bf16x 268435456(%rbp,%r14,8), %xmm30 {%k7}
				// CHECK: encoding: [0x62,0x22,0x7e,0x0f,0x72,0xb4,0xf5,0x00,0x00,0x00,0x10]
				vcvtneps2bf16x 268435456(%rbp,%r14,8), %xmm30 {%k7}

				// CHECK: vcvtneps2bf16 (%r9){1to4}, %xmm30
				// CHECK: encoding: [0x62,0x42,0x7e,0x18,0x72,0x31]
				vcvtneps2bf16 (%r9){1to4}, %xmm30

				// CHECK: vcvtneps2bf16x 2032(%rcx), %xmm30
				// CHECK: encoding: [0x62,0x62,0x7e,0x08,0x72,0x71,0x7f]
				vcvtneps2bf16x 2032(%rcx), %xmm30

				// CHECK: vcvtneps2bf16 -512(%rdx){1to4}, %xmm30 {%k7} {z}
				// CHECK: encoding: [0x62,0x62,0x7e,0x9f,0x72,0x72,0x80]
				vcvtneps2bf16 -512(%rdx){1to4}, %xmm30 {%k7} {z}

				// CHECK: vcvtneps2bf16 %ymm29, %xmm30
				// CHECK: encoding: [0x62,0x02,0x7e,0x28,0x72,0xf5]
				vcvtneps2bf16 %ymm29, %xmm30

				// CHECK: vcvtneps2bf16y 268435456(%rbp,%r14,8), %xmm30 {%k7}
				// CHECK: encoding: [0x62,0x22,0x7e,0x2f,0x72,0xb4,0xf5,0x00,0x00,0x00,0x10]
				vcvtneps2bf16y 268435456(%rbp,%r14,8), %xmm30 {%k7}

				// CHECK: vcvtneps2bf16 (%r9){1to8}, %xmm30
				// CHECK: encoding: [0x62,0x42,0x7e,0x38,0x72,0x31]
				vcvtneps2bf16 (%r9){1to8}, %xmm30

				// CHECK: vcvtneps2bf16y 4064(%rcx), %xmm30
				// CHECK: encoding: [0x62,0x62,0x7e,0x28,0x72,0x71,0x7f]
				vcvtneps2bf16y 4064(%rcx), %xmm30

				// CHECK: vcvtneps2bf16 -512(%rdx){1to8}, %xmm30 {%k7} {z}
				// CHECK: encoding: [0x62,0x62,0x7e,0xbf,0x72,0x72,0x80]
				vcvtneps2bf16 -512(%rdx){1to8}, %xmm30 {%k7} {z}

				// CHECK: vdpbf16ps %ymm28, %ymm29, %ymm30
				// CHECK: encoding: [0x62,0x02,0x16,0x20,0x52,0xf4]
				vdpbf16ps %ymm28, %ymm29, %ymm30

				// CHECK: vdpbf16ps 268435456(%rbp,%r14,8), %ymm29, %ymm30 {%k7}
				// CHECK: encoding: [0x62,0x22,0x16,0x27,0x52,0xb4,0xf5,0x00,0x00,0x00,0x10]
				vdpbf16ps 268435456(%rbp,%r14,8), %ymm29, %ymm30 {%k7}

				// CHECK: vdpbf16ps (%r9){1to8}, %ymm29, %ymm30
				// CHECK: encoding: [0x62,0x42,0x16,0x30,0x52,0x31]
				vdpbf16ps (%r9){1to8}, %ymm29, %ymm30

				// CHECK: vdpbf16ps 4064(%rcx), %ymm29, %ymm30
				// CHECK: encoding: [0x62,0x62,0x16,0x20,0x52,0x71,0x7f]
				vdpbf16ps 4064(%rcx), %ymm29, %ymm30

				// CHECK: vdpbf16ps -512(%rdx){1to8}, %ymm29, %ymm30 {%k7} {z}
				// CHECK: encoding: [0x62,0x62,0x16,0xb7,0x52,0x72,0x80]
				vdpbf16ps -512(%rdx){1to8}, %ymm29, %ymm30 {%k7} {z}

				// CHECK: vdpbf16ps %xmm28, %xmm29, %xmm30
				// CHECK: encoding: [0x62,0x02,0x16,0x00,0x52,0xf4]
				vdpbf16ps %xmm28, %xmm29, %xmm30

				// CHECK: vdpbf16ps 268435456(%rbp,%r14,8), %xmm29, %xmm30 {%k7}
				// CHECK: encoding: [0x62,0x22,0x16,0x07,0x52,0xb4,0xf5,0x00,0x00,0x00,0x10]
				vdpbf16ps 268435456(%rbp,%r14,8), %xmm29, %xmm30 {%k7}

				// CHECK: vdpbf16ps (%r9){1to4}, %xmm29, %xmm30
				// CHECK: encoding: [0x62,0x42,0x16,0x10,0x52,0x31]
				vdpbf16ps (%r9){1to4}, %xmm29, %xmm30

				// CHECK: vdpbf16ps 2032(%rcx), %xmm29, %xmm30
				// CHECK: encoding: [0x62,0x62,0x16,0x00,0x52,0x71,0x7f]
				vdpbf16ps 2032(%rcx), %xmm29, %xmm30

				// CHECK: vdpbf16ps -512(%rdx){1to4}, %xmm29, %xmm30 {%k7} {z}
				// CHECK: encoding: [0x62,0x62,0x16,0x97,0x52,0x72,0x80]
				vdpbf16ps -512(%rdx){1to4}, %xmm29, %xmm30 {%k7} {z}

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Enable AVX512_BF16 instructions, which are supported for BFLOAT16 in Cooper Lake
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 196166

include/llvm/IR/IntrinsicsX86.td

lib/Support/Host.cpp

lib/Target/X86/X86.td

lib/Target/X86/X86ISelLowering.h

lib/Target/X86/X86ISelLowering.cpp

lib/Target/X86/X86InstrAVX512.td

lib/Target/X86/X86InstrFragmentsSIMD.td

lib/Target/X86/X86InstrInfo.td

lib/Target/X86/X86IntrinsicsInfo.h

lib/Target/X86/X86Subtarget.h

test/CodeGen/X86/avx512bf16-intrinsics.ll

test/CodeGen/X86/avx512bf16-vl-intrinsics.ll

test/MC/Disassembler/X86/avx512bf16-att.txt

test/MC/Disassembler/X86/avx512bf16-intel.txt

test/MC/Disassembler/X86/avx512bf16vl-att.txt

test/MC/Disassembler/X86/avx512bf16vl-intel.txt

test/MC/Disassembler/X86/x86-64-avx512bf16-att.txt

test/MC/Disassembler/X86/x86-64-avx512bf16-intel.txt

test/MC/Disassembler/X86/x86-64-avx512bf16vl-att.txt

test/MC/Disassembler/X86/x86-64-avx512bf16vl-intel.txt

test/MC/X86/avx512_bf16-encoding.s

test/MC/X86/avx512_bf16_vl-encoding.s

test/MC/X86/intel-syntax-avx512_bf16.s

test/MC/X86/intel-syntax-avx512_bf16_vl.s

test/MC/X86/intel-syntax-x86-64-avx512_bf16.s

test/MC/X86/intel-syntax-x86-64-avx512_bf16_vl.s

test/MC/X86/x86-64-avx512_bf16-encoding.s

test/MC/X86/x86-64-avx512_bf16_vl-encoding.s

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Enable AVX512_BF16 instructions, which are supported for BFLOAT16 in Cooper LakeClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 196166

include/llvm/IR/IntrinsicsX86.td

lib/Support/Host.cpp

lib/Target/X86/X86.td

lib/Target/X86/X86ISelLowering.h

lib/Target/X86/X86ISelLowering.cpp

lib/Target/X86/X86InstrAVX512.td

lib/Target/X86/X86InstrFragmentsSIMD.td

lib/Target/X86/X86InstrInfo.td

lib/Target/X86/X86IntrinsicsInfo.h

lib/Target/X86/X86Subtarget.h

test/CodeGen/X86/avx512bf16-intrinsics.ll

test/CodeGen/X86/avx512bf16-vl-intrinsics.ll

test/MC/Disassembler/X86/avx512bf16-att.txt

test/MC/Disassembler/X86/avx512bf16-intel.txt

test/MC/Disassembler/X86/avx512bf16vl-att.txt

test/MC/Disassembler/X86/avx512bf16vl-intel.txt

test/MC/Disassembler/X86/x86-64-avx512bf16-att.txt

test/MC/Disassembler/X86/x86-64-avx512bf16-intel.txt

test/MC/Disassembler/X86/x86-64-avx512bf16vl-att.txt

test/MC/Disassembler/X86/x86-64-avx512bf16vl-intel.txt

test/MC/X86/avx512_bf16-encoding.s

test/MC/X86/avx512_bf16_vl-encoding.s

test/MC/X86/intel-syntax-avx512_bf16.s

test/MC/X86/intel-syntax-avx512_bf16_vl.s

test/MC/X86/intel-syntax-x86-64-avx512_bf16.s

test/MC/X86/intel-syntax-x86-64-avx512_bf16_vl.s

test/MC/X86/x86-64-avx512_bf16-encoding.s

test/MC/X86/x86-64-avx512_bf16_vl-encoding.s

[X86] Enable AVX512_BF16 instructions, which are supported for BFLOAT16 in Cooper Lake
ClosedPublic