Diff 410931

llvm/include/llvm/IR/IntrinsicsNVVM.td

Show First 20 Lines • Show All 848 Lines • ▼ Show 20 Lines	def int_nvvm_cos_approx_ftz_f : GCCBuiltin<"__nvvm_cos_approx_ftz_f">,
DefaultAttrsIntrinsic<[llvm_float_ty], [llvm_float_ty], [IntrNoMem]>;		DefaultAttrsIntrinsic<[llvm_float_ty], [llvm_float_ty], [IntrNoMem]>;
def int_nvvm_cos_approx_f : GCCBuiltin<"__nvvm_cos_approx_f">,		def int_nvvm_cos_approx_f : GCCBuiltin<"__nvvm_cos_approx_f">,
DefaultAttrsIntrinsic<[llvm_float_ty], [llvm_float_ty], [IntrNoMem]>;		DefaultAttrsIntrinsic<[llvm_float_ty], [llvm_float_ty], [IntrNoMem]>;

//		//
// Fma		// Fma
//		//

def int_nvvm_fma_rn_ftz_f : GCCBuiltin<"__nvvm_fma_rn_ftz_f">,		foreach variant = ["_rn_f16", "_rn_ftz_f16", "_rn_sat_f16",
DefaultAttrsIntrinsic<[llvm_float_ty], [llvm_float_ty, llvm_float_ty, llvm_float_ty],		"_rn_ftz_sat_f16", "_rn_relu_f16", "_rn_ftz_relu_f16"] in {
		def int_nvvm_fma # variant : GCCBuiltin<!strconcat("__nvvm_fma", variant)>,
		DefaultAttrsIntrinsic<[llvm_half_ty],
		[llvm_half_ty, llvm_half_ty, llvm_half_ty],
[IntrNoMem, IntrSpeculatable]>;		[IntrNoMem, IntrSpeculatable]>;
def int_nvvm_fma_rn_f : GCCBuiltin<"__nvvm_fma_rn_f">,		}
DefaultAttrsIntrinsic<[llvm_float_ty], [llvm_float_ty, llvm_float_ty, llvm_float_ty],
[IntrNoMem, IntrSpeculatable]>;		foreach variant = ["_rn_f16x2", "_rn_ftz_f16x2", "_rn_sat_f16x2",
def int_nvvm_fma_rz_ftz_f : GCCBuiltin<"__nvvm_fma_rz_ftz_f">,		"_rn_ftz_sat_f16x2", "_rn_relu_f16x2", "_rn_ftz_relu_f16x2"] in {
DefaultAttrsIntrinsic<[llvm_float_ty], [llvm_float_ty, llvm_float_ty, llvm_float_ty],		def int_nvvm_fma # variant : GCCBuiltin<!strconcat("__nvvm_fma", variant)>,
[IntrNoMem, IntrSpeculatable]>;		DefaultAttrsIntrinsic<[llvm_v2f16_ty],
def int_nvvm_fma_rz_f : GCCBuiltin<"__nvvm_fma_rz_f">,		[llvm_v2f16_ty, llvm_v2f16_ty, llvm_v2f16_ty],
DefaultAttrsIntrinsic<[llvm_float_ty], [llvm_float_ty, llvm_float_ty, llvm_float_ty],
[IntrNoMem, IntrSpeculatable]>;
def int_nvvm_fma_rm_ftz_f : GCCBuiltin<"__nvvm_fma_rm_ftz_f">,
DefaultAttrsIntrinsic<[llvm_float_ty], [llvm_float_ty, llvm_float_ty, llvm_float_ty],
[IntrNoMem, IntrSpeculatable]>;
def int_nvvm_fma_rm_f : GCCBuiltin<"__nvvm_fma_rm_f">,
DefaultAttrsIntrinsic<[llvm_float_ty], [llvm_float_ty, llvm_float_ty, llvm_float_ty],
[IntrNoMem, IntrSpeculatable]>;
def int_nvvm_fma_rp_ftz_f : GCCBuiltin<"__nvvm_fma_rp_ftz_f">,
DefaultAttrsIntrinsic<[llvm_float_ty], [llvm_float_ty, llvm_float_ty, llvm_float_ty],
[IntrNoMem, IntrSpeculatable]>;
def int_nvvm_fma_rp_f : GCCBuiltin<"__nvvm_fma_rp_f">,
DefaultAttrsIntrinsic<[llvm_float_ty], [llvm_float_ty, llvm_float_ty, llvm_float_ty],
[IntrNoMem, IntrSpeculatable]>;		[IntrNoMem, IntrSpeculatable]>;
		}

def int_nvvm_fma_rn_d : GCCBuiltin<"__nvvm_fma_rn_d">,		foreach variant = ["_rn_bf16", "_rn_relu_bf16"] in {
DefaultAttrsIntrinsic<[llvm_double_ty],		def int_nvvm_fma # variant : GCCBuiltin<!strconcat("__nvvm_fma", variant)>,
[llvm_double_ty, llvm_double_ty, llvm_double_ty],		DefaultAttrsIntrinsic<[llvm_i16_ty],
		[llvm_i16_ty, llvm_i16_ty, llvm_i16_ty],
[IntrNoMem, IntrSpeculatable]>;		[IntrNoMem, IntrSpeculatable]>;
def int_nvvm_fma_rz_d : GCCBuiltin<"__nvvm_fma_rz_d">,		}
DefaultAttrsIntrinsic<[llvm_double_ty],
[llvm_double_ty, llvm_double_ty, llvm_double_ty],		foreach variant = ["_rn_bf16x2", "_rn_relu_bf16x2"] in {
		def int_nvvm_fma # variant : GCCBuiltin<!strconcat("__nvvm_fma", variant)>,
		DefaultAttrsIntrinsic<[llvm_i32_ty],
		[llvm_i32_ty, llvm_i32_ty, llvm_i32_ty],
[IntrNoMem, IntrSpeculatable]>;		[IntrNoMem, IntrSpeculatable]>;
def int_nvvm_fma_rm_d : GCCBuiltin<"__nvvm_fma_rm_d">,		}
DefaultAttrsIntrinsic<[llvm_double_ty],
[llvm_double_ty, llvm_double_ty, llvm_double_ty],		foreach variant = ["_rn_ftz_f", "_rn_f", "_rz_ftz_f", "_rz_f", "_rm_ftz_f",
		"_rm_f", "_rp_ftz_f", "_rp_f"] in {
		def int_nvvm_fma # variant : GCCBuiltin<!strconcat("__nvvm_fma", variant)>,
		DefaultAttrsIntrinsic<[llvm_float_ty],
		[llvm_float_ty, llvm_float_ty, llvm_float_ty],
[IntrNoMem, IntrSpeculatable]>;		[IntrNoMem, IntrSpeculatable]>;
def int_nvvm_fma_rp_d : GCCBuiltin<"__nvvm_fma_rp_d">,		}

		foreach variant = ["_rn_d", "_rz_d", "_rm_d", "_rp_d"] in {
		def int_nvvm_fma # variant : GCCBuiltin<!strconcat("__nvvm_fma", variant)>,
DefaultAttrsIntrinsic<[llvm_double_ty],		DefaultAttrsIntrinsic<[llvm_double_ty],
[llvm_double_ty, llvm_double_ty, llvm_double_ty],		[llvm_double_ty, llvm_double_ty, llvm_double_ty],
[IntrNoMem, IntrSpeculatable]>;		[IntrNoMem, IntrSpeculatable]>;
		}

//		//
// Rcp		// Rcp
//		//

def int_nvvm_rcp_rn_ftz_f : GCCBuiltin<"__nvvm_rcp_rn_ftz_f">,		def int_nvvm_rcp_rn_ftz_f : GCCBuiltin<"__nvvm_rcp_rn_ftz_f">,
DefaultAttrsIntrinsic<[llvm_float_ty], [llvm_float_ty], [IntrNoMem]>;		DefaultAttrsIntrinsic<[llvm_float_ty], [llvm_float_ty], [IntrNoMem]>;
def int_nvvm_rcp_rn_f : GCCBuiltin<"__nvvm_rcp_rn_f">,		def int_nvvm_rcp_rn_f : GCCBuiltin<"__nvvm_rcp_rn_f">,
▲ Show 20 Lines • Show All 3,751 Lines • Show Last 20 Lines

llvm/lib/Target/NVPTX/NVPTXInstrInfo.td

	Show First 20 Lines • Show All 139 Lines • ▼ Show 20 Lines
	def do_SQRTF32_RN : Predicate<"usePrecSqrtF32()">;			def do_SQRTF32_RN : Predicate<"usePrecSqrtF32()">;

	def hasHWROT32 : Predicate<"Subtarget->hasHWROT32()">;			def hasHWROT32 : Predicate<"Subtarget->hasHWROT32()">;
	def noHWROT32 : Predicate<"!Subtarget->hasHWROT32()">;			def noHWROT32 : Predicate<"!Subtarget->hasHWROT32()">;

	def True : Predicate<"true">;			def True : Predicate<"true">;

	def hasPTX31 : Predicate<"Subtarget->getPTXVersion() >= 31">;			def hasPTX31 : Predicate<"Subtarget->getPTXVersion() >= 31">;
				def hasPTX42 : Predicate<"Subtarget->getPTXVersion() >= 42">;
	def hasPTX60 : Predicate<"Subtarget->getPTXVersion() >= 60">;			def hasPTX60 : Predicate<"Subtarget->getPTXVersion() >= 60">;
	def hasPTX61 : Predicate<"Subtarget->getPTXVersion() >= 61">;			def hasPTX61 : Predicate<"Subtarget->getPTXVersion() >= 61">;
	def hasPTX63 : Predicate<"Subtarget->getPTXVersion() >= 63">;			def hasPTX63 : Predicate<"Subtarget->getPTXVersion() >= 63">;
	def hasPTX64 : Predicate<"Subtarget->getPTXVersion() >= 64">;			def hasPTX64 : Predicate<"Subtarget->getPTXVersion() >= 64">;
	def hasPTX65 : Predicate<"Subtarget->getPTXVersion() >= 65">;			def hasPTX65 : Predicate<"Subtarget->getPTXVersion() >= 65">;
	def hasPTX70 : Predicate<"Subtarget->getPTXVersion() >= 70">;			def hasPTX70 : Predicate<"Subtarget->getPTXVersion() >= 70">;
	def hasPTX71 : Predicate<"Subtarget->getPTXVersion() >= 71">;			def hasPTX71 : Predicate<"Subtarget->getPTXVersion() >= 71">;
	def hasPTX72 : Predicate<"Subtarget->getPTXVersion() >= 72">;			def hasPTX72 : Predicate<"Subtarget->getPTXVersion() >= 72">;

	def hasSM30 : Predicate<"Subtarget->getSmVersion() >= 30">;			def hasSM30 : Predicate<"Subtarget->getSmVersion() >= 30">;
				def hasSM53 : Predicate<"Subtarget->getSmVersion() >= 53">;
	def hasSM70 : Predicate<"Subtarget->getSmVersion() >= 70">;			def hasSM70 : Predicate<"Subtarget->getSmVersion() >= 70">;
	def hasSM72 : Predicate<"Subtarget->getSmVersion() >= 72">;			def hasSM72 : Predicate<"Subtarget->getSmVersion() >= 72">;
	def hasSM75 : Predicate<"Subtarget->getSmVersion() >= 75">;			def hasSM75 : Predicate<"Subtarget->getSmVersion() >= 75">;
	def hasSM80 : Predicate<"Subtarget->getSmVersion() >= 80">;			def hasSM80 : Predicate<"Subtarget->getSmVersion() >= 80">;
	def hasSM86 : Predicate<"Subtarget->getSmVersion() >= 86">;			def hasSM86 : Predicate<"Subtarget->getSmVersion() >= 86">;

	// non-sync shfl instructions are not available on sm_70+ in PTX6.4+			// non-sync shfl instructions are not available on sm_70+ in PTX6.4+
	def hasSHFL : Predicate<"!(Subtarget->getSmVersion() >= 70"			def hasSHFL : Predicate<"!(Subtarget->getSmVersion() >= 70"
	▲ Show 20 Lines • Show All 3,051 Lines • Show Last 20 Lines

llvm/lib/Target/NVPTX/NVPTXIntrinsics.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 562 Lines • ▼ Show 20 Lines	list<Predicate> Preds = []>
: NVPTXInst<(outs t_regclass:$dst),		: NVPTXInst<(outs t_regclass:$dst),
(ins s0_regclass:$src0, s1_regclass:$src1),		(ins s0_regclass:$src0, s1_regclass:$src1),
OpcStr,		OpcStr,
[(set t_regclass:$dst, (IntOP s0_regclass:$src0, s1_regclass:$src1))]>,		[(set t_regclass:$dst, (IntOP s0_regclass:$src0, s1_regclass:$src1))]>,
Requires<Preds>;		Requires<Preds>;

class F_MATH_3<string OpcStr, NVPTXRegClass t_regclass,		class F_MATH_3<string OpcStr, NVPTXRegClass t_regclass,
NVPTXRegClass s0_regclass, NVPTXRegClass s1_regclass,		NVPTXRegClass s0_regclass, NVPTXRegClass s1_regclass,
NVPTXRegClass s2_regclass, Intrinsic IntOP>		NVPTXRegClass s2_regclass, Intrinsic IntOP, list<Predicate> Preds = []>
: NVPTXInst<(outs t_regclass:$dst),		: NVPTXInst<(outs t_regclass:$dst),
(ins s0_regclass:$src0, s1_regclass:$src1, s2_regclass:$src2),		(ins s0_regclass:$src0, s1_regclass:$src1, s2_regclass:$src2),
OpcStr,		OpcStr,
[(set t_regclass:$dst,		[(set t_regclass:$dst,
(IntOP s0_regclass:$src0, s1_regclass:$src1, s2_regclass:$src2))]>;		(IntOP s0_regclass:$src0, s1_regclass:$src1, s2_regclass:$src2))]>,
		Requires<Preds>;

//		//
// MISC		// MISC
//		//

def INT_NVVM_PRMT : F_MATH_3<"prmt.b32 \t$dst, $src0, $src1, $src2;", Int32Regs,		def INT_NVVM_PRMT : F_MATH_3<"prmt.b32 \t$dst, $src0, $src1, $src2;", Int32Regs,
Int32Regs, Int32Regs, Int32Regs, int_nvvm_prmt>;		Int32Regs, Int32Regs, Int32Regs, int_nvvm_prmt>;

▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
def INT_NVVM_FMIN_D : F_MATH_2<"min.f64 \t$dst, $src0, $src1;", Float64Regs,		def INT_NVVM_FMIN_D : F_MATH_2<"min.f64 \t$dst, $src0, $src1;", Float64Regs,
Float64Regs, Float64Regs, int_nvvm_fmin_d>;		Float64Regs, Float64Regs, int_nvvm_fmin_d>;
def INT_NVVM_FMAX_D : F_MATH_2<"max.f64 \t$dst, $src0, $src1;", Float64Regs,		def INT_NVVM_FMAX_D : F_MATH_2<"max.f64 \t$dst, $src0, $src1;", Float64Regs,
Float64Regs, Float64Regs, int_nvvm_fmax_d>;		Float64Regs, Float64Regs, int_nvvm_fmax_d>;

//		//
// Min Max f16, f16x2, bf16, bf16x2		// Min Max f16, f16x2, bf16, bf16x2
//		//

class MIN_MAX_TUPLE<string V, Intrinsic I, NVPTXRegClass RC,		class MIN_MAX_TUPLE<string V, Intrinsic I, NVPTXRegClass RC,
list<Predicate> Preds = [hasPTX70, hasSM80]> {		list<Predicate> Preds = [hasPTX70, hasSM80]> {
string Variant = V;		string Variant = V;
Intrinsic Intr = I;		Intrinsic Intr = I;
NVPTXRegClass RegClass = RC;		NVPTXRegClass RegClass = RC;
list<Predicate> Predicates = Preds;		list<Predicate> Predicates = Preds;
}		}

▲ Show 20 Lines • Show All 267 Lines • ▼ Show 20 Lines	def INT_NVVM_COS_APPROX_FTZ_F : F_MATH_1<"cos.approx.ftz.f32 \t$dst, $src0;",
Float32Regs, Float32Regs, int_nvvm_cos_approx_ftz_f>;		Float32Regs, Float32Regs, int_nvvm_cos_approx_ftz_f>;
def INT_NVVM_COS_APPROX_F : F_MATH_1<"cos.approx.f32 \t$dst, $src0;",		def INT_NVVM_COS_APPROX_F : F_MATH_1<"cos.approx.f32 \t$dst, $src0;",
Float32Regs, Float32Regs, int_nvvm_cos_approx_f>;		Float32Regs, Float32Regs, int_nvvm_cos_approx_f>;

//		//
// Fma		// Fma
//		//

def INT_NVVM_FMA_RN_FTZ_F		class FMA_TUPLE<string V, Intrinsic I, NVPTXRegClass RC,
: F_MATH_3<"fma.rn.ftz.f32 \t$dst, $src0, $src1, $src2;", Float32Regs,		list<Predicate> Preds = []> {
		traUnsubmitted Done Reply Inline Actions I think the default should be the most useful/common and the least surprising value. I'd argue that in this case it would be `[]`. This would give reader a reasonable idea about what's going on even without looking at FMA_TUPLE implementation. tra: I think the default should be the most useful/common and the least surprising value. I'd argue…
		jchlandaAuthorUnsubmitted Done Reply Inline Actions Agreed, I wrote that class before folding in f32 and f64, `hasPTX70, hasSM80` made more sense then. Changed now. jchlanda: Agreed, I wrote that class before folding in f32 and f64, `hasPTX70, hasSM80` made more sense…
Float32Regs, Float32Regs, Float32Regs, int_nvvm_fma_rn_ftz_f>;		string Variant = V;
def INT_NVVM_FMA_RN_F : F_MATH_3<"fma.rn.f32 \t$dst, $src0, $src1, $src2;",		Intrinsic Intr = I;
Float32Regs, Float32Regs, Float32Regs, Float32Regs, int_nvvm_fma_rn_f>;		NVPTXRegClass RegClass = RC;
def INT_NVVM_FMA_RZ_FTZ_F		list<Predicate> Predicates = Preds;
: F_MATH_3<"fma.rz.ftz.f32 \t$dst, $src0, $src1, $src2;", Float32Regs,		}
Float32Regs, Float32Regs, Float32Regs, int_nvvm_fma_rz_ftz_f>;
def INT_NVVM_FMA_RZ_F : F_MATH_3<"fma.rz.f32 \t$dst, $src0, $src1, $src2;",		multiclass FMA_INST {
Float32Regs, Float32Regs, Float32Regs, Float32Regs, int_nvvm_fma_rz_f>;		foreach P = [
def INT_NVVM_FMA_RM_FTZ_F		FMA_TUPLE<"_rn_f64", int_nvvm_fma_rn_d, Float64Regs>,
: F_MATH_3<"fma.rm.ftz.f32 \t$dst, $src0, $src1, $src2;", Float32Regs,		FMA_TUPLE<"_rz_f64", int_nvvm_fma_rz_d, Float64Regs>,
Float32Regs, Float32Regs, Float32Regs, int_nvvm_fma_rm_ftz_f>;		FMA_TUPLE<"_rm_f64", int_nvvm_fma_rm_d, Float64Regs>,
def INT_NVVM_FMA_RM_F : F_MATH_3<"fma.rm.f32 \t$dst, $src0, $src1, $src2;",		FMA_TUPLE<"_rp_f64", int_nvvm_fma_rp_d, Float64Regs>,
Float32Regs, Float32Regs, Float32Regs, Float32Regs, int_nvvm_fma_rm_f>;
def INT_NVVM_FMA_RP_FTZ_F		FMA_TUPLE<"_rn_ftz_f32", int_nvvm_fma_rn_ftz_f, Float32Regs>,
: F_MATH_3<"fma.rp.ftz.f32 \t$dst, $src0, $src1, $src2;", Float32Regs,		FMA_TUPLE<"_rn_f32", int_nvvm_fma_rn_f, Float32Regs>,
Float32Regs, Float32Regs, Float32Regs, int_nvvm_fma_rp_ftz_f>;		FMA_TUPLE<"_rz_ftz_f32", int_nvvm_fma_rz_ftz_f, Float32Regs>,
def INT_NVVM_FMA_RP_F : F_MATH_3<"fma.rp.f32 \t$dst, $src0, $src1, $src2;",		FMA_TUPLE<"_rz_f32", int_nvvm_fma_rz_f, Float32Regs>,
Float32Regs, Float32Regs, Float32Regs, Float32Regs, int_nvvm_fma_rp_f>;		FMA_TUPLE<"_rm_f32", int_nvvm_fma_rm_f, Float32Regs>,
		FMA_TUPLE<"_rm_ftz_f32", int_nvvm_fma_rm_ftz_f, Float32Regs>,
def INT_NVVM_FMA_RN_D : F_MATH_3<"fma.rn.f64 \t$dst, $src0, $src1, $src2;",		FMA_TUPLE<"_rp_f32", int_nvvm_fma_rp_f, Float32Regs>,
Float64Regs, Float64Regs, Float64Regs, Float64Regs, int_nvvm_fma_rn_d>;		FMA_TUPLE<"_rp_ftz_f32", int_nvvm_fma_rp_ftz_f, Float32Regs>,
def INT_NVVM_FMA_RZ_D : F_MATH_3<"fma.rz.f64 \t$dst, $src0, $src1, $src2;",
Float64Regs, Float64Regs, Float64Regs, Float64Regs, int_nvvm_fma_rz_d>;		FMA_TUPLE<"_rn_f16", int_nvvm_fma_rn_f16, Float16Regs, [hasPTX42, hasSM53]>,
def INT_NVVM_FMA_RM_D : F_MATH_3<"fma.rm.f64 \t$dst, $src0, $src1, $src2;",		FMA_TUPLE<"_rn_ftz_f16", int_nvvm_fma_rn_ftz_f16, Float16Regs,
Float64Regs, Float64Regs, Float64Regs, Float64Regs, int_nvvm_fma_rm_d>;		[hasPTX42, hasSM53]>,
def INT_NVVM_FMA_RP_D : F_MATH_3<"fma.rp.f64 \t$dst, $src0, $src1, $src2;",		FMA_TUPLE<"_rn_sat_f16", int_nvvm_fma_rn_sat_f16, Float16Regs,
Float64Regs, Float64Regs, Float64Regs, Float64Regs, int_nvvm_fma_rp_d>;		[hasPTX42, hasSM53]>,
		FMA_TUPLE<"_rn_ftz_sat_f16", int_nvvm_fma_rn_ftz_sat_f16, Float16Regs,
		[hasPTX42, hasSM53]>,
		FMA_TUPLE<"_rn_relu_f16", int_nvvm_fma_rn_relu_f16, Float16Regs,
		[hasPTX70, hasSM80]>,
		FMA_TUPLE<"_rn_ftz_relu_f16", int_nvvm_fma_rn_ftz_relu_f16, Float16Regs,
		[hasPTX70, hasSM80]>,

		FMA_TUPLE<"_rn_f16x2", int_nvvm_fma_rn_f16x2, Float16x2Regs,
		[hasPTX42, hasSM53]>,
		FMA_TUPLE<"_rn_ftz_f16x2", int_nvvm_fma_rn_ftz_f16x2, Float16x2Regs,
		[hasPTX42, hasSM53]>,
		FMA_TUPLE<"_rn_sat_f16x2", int_nvvm_fma_rn_sat_f16x2, Float16x2Regs,
		[hasPTX42, hasSM53]>,
		FMA_TUPLE<"_rn_ftz_sat_f16x2", int_nvvm_fma_rn_ftz_sat_f16x2,
		Float16x2Regs, [hasPTX42, hasSM53]>,
		FMA_TUPLE<"_rn_relu_f16x2", int_nvvm_fma_rn_relu_f16x2, Float16x2Regs,
		[hasPTX70, hasSM80]>,
		FMA_TUPLE<"_rn_ftz_relu_f16x2", int_nvvm_fma_rn_ftz_relu_f16x2,
		Float16x2Regs, [hasPTX70, hasSM80]>,

		FMA_TUPLE<"_rn_bf16", int_nvvm_fma_rn_bf16, Int16Regs, [hasPTX70, hasSM80]>,
		FMA_TUPLE<"_rn_relu_bf16", int_nvvm_fma_rn_relu_bf16, Int16Regs,
		[hasPTX70, hasSM80]>,

		FMA_TUPLE<"_rn_bf16x2", int_nvvm_fma_rn_bf16x2, Int32Regs,
		[hasPTX70, hasSM80]>,
		FMA_TUPLE<"_rn_relu_bf16x2", int_nvvm_fma_rn_relu_bf16x2, Int32Regs,
		[hasPTX70, hasSM80]>
		] in {
		def P.Variant :
		F_MATH_3<!strconcat("fma",
		!subst("_", ".", P.Variant), " \t$dst, $src0, $src1, $src2;"),
		P.RegClass, P.RegClass, P.RegClass, P.RegClass, P.Intr, P.Predicates>;
		}
		}

		defm INT_NVVM_FMA : FMA_INST;

//		//
// Rcp		// Rcp
//		//

def INT_NVVM_RCP_RN_FTZ_F : F_MATH_1<"rcp.rn.ftz.f32 \t$dst, $src0;",		def INT_NVVM_RCP_RN_FTZ_F : F_MATH_1<"rcp.rn.ftz.f32 \t$dst, $src0;",
Float32Regs, Float32Regs, int_nvvm_rcp_rn_ftz_f>;		Float32Regs, Float32Regs, int_nvvm_rcp_rn_ftz_f>;
def INT_NVVM_RCP_RN_F : F_MATH_1<"rcp.rn.f32 \t$dst, $src0;",		def INT_NVVM_RCP_RN_F : F_MATH_1<"rcp.rn.f32 \t$dst, $src0;",
▲ Show 20 Lines • Show All 5,681 Lines • Show Last 20 Lines

llvm/lib/Target/NVPTX/NVPTXTargetTransformInfo.cpp

Show First 20 Lines • Show All 189 Lines • ▼ Show 20 Lines	const SimplifyAction Action = [II]() -> SimplifyAction {
case Intrinsic::nvvm_floor_ftz_f:		case Intrinsic::nvvm_floor_ftz_f:
return {Intrinsic::floor, FTZ_MustBeOn};		return {Intrinsic::floor, FTZ_MustBeOn};
case Intrinsic::nvvm_fma_rn_d:		case Intrinsic::nvvm_fma_rn_d:
return {Intrinsic::fma, FTZ_Any};		return {Intrinsic::fma, FTZ_Any};
case Intrinsic::nvvm_fma_rn_f:		case Intrinsic::nvvm_fma_rn_f:
return {Intrinsic::fma, FTZ_MustBeOff};		return {Intrinsic::fma, FTZ_MustBeOff};
case Intrinsic::nvvm_fma_rn_ftz_f:		case Intrinsic::nvvm_fma_rn_ftz_f:
return {Intrinsic::fma, FTZ_MustBeOn};		return {Intrinsic::fma, FTZ_MustBeOn};
		case Intrinsic::nvvm_fma_rn_f16:
		return {Intrinsic::fma, FTZ_MustBeOff, true};
		case Intrinsic::nvvm_fma_rn_ftz_f16:
		return {Intrinsic::fma, FTZ_MustBeOn, true};
		case Intrinsic::nvvm_fma_rn_f16x2:
		return {Intrinsic::fma, FTZ_MustBeOff, true};
		case Intrinsic::nvvm_fma_rn_ftz_f16x2:
		return {Intrinsic::fma, FTZ_MustBeOn, true};
case Intrinsic::nvvm_fmax_d:		case Intrinsic::nvvm_fmax_d:
return {Intrinsic::maxnum, FTZ_Any};		return {Intrinsic::maxnum, FTZ_Any};
case Intrinsic::nvvm_fmax_f:		case Intrinsic::nvvm_fmax_f:
return {Intrinsic::maxnum, FTZ_MustBeOff};		return {Intrinsic::maxnum, FTZ_MustBeOff};
case Intrinsic::nvvm_fmax_ftz_f:		case Intrinsic::nvvm_fmax_ftz_f:
return {Intrinsic::maxnum, FTZ_MustBeOn};		return {Intrinsic::maxnum, FTZ_MustBeOn};
case Intrinsic::nvvm_fmax_nan_f:		case Intrinsic::nvvm_fmax_nan_f:
return {Intrinsic::maximum, FTZ_MustBeOff};		return {Intrinsic::maximum, FTZ_MustBeOff};
▲ Show 20 Lines • Show All 260 Lines • Show Last 20 Lines

llvm/test/CodeGen/NVPTX/math-intrins-sm53-ptx42.ll

This file was added.

				; RUN: llc < %s -march=nvptx64 -mcpu=sm_53 -mattr=+ptx42 \| FileCheck %s

				declare half @llvm.nvvm.fma.rn.f16(half, half, half)
				declare half @llvm.nvvm.fma.rn.ftz.f16(half, half, half)
				declare half @llvm.nvvm.fma.rn.sat.f16(half, half, half)
				declare half @llvm.nvvm.fma.rn.ftz.sat.f16(half, half, half)
				declare <2 x half> @llvm.nvvm.fma.rn.f16x2(<2 x half>, <2 x half>, <2 x half>)
				declare <2 x half> @llvm.nvvm.fma.rn.ftz.f16x2(<2 x half>, <2 x half>, <2 x half>)
				declare <2 x half> @llvm.nvvm.fma.rn.sat.f16x2(<2 x half>, <2 x half>, <2 x half>)
				declare <2 x half> @llvm.nvvm.fma.rn.ftz.sat.f16x2(<2 x half>, <2 x half>, <2 x half>)

				; CHECK-LABEL: fma_rn_f16
				define half @fma_rn_f16(half %0, half %1, half %2) {
				; CHECK-NOT: call
				; CHECK: fma.rn.f16
				%res = call half @llvm.nvvm.fma.rn.f16(half %0, half %1, half %2)
				ret half %res
				}

				; CHECK-LABEL: fma_rn_ftz_f16
				define half @fma_rn_ftz_f16(half %0, half %1, half %2) {
				; CHECK-NOT: call
				; CHECK: fma.rn.ftz.f16
				%res = call half @llvm.nvvm.fma.rn.ftz.f16(half %0, half %1, half %2)
				ret half %res
				}

				; CHECK-LABEL: fma_rn_sat_f16
				define half @fma_rn_sat_f16(half %0, half %1, half %2) {
				; CHECK-NOT: call
				; CHECK: fma.rn.sat.f16
				%res = call half @llvm.nvvm.fma.rn.sat.f16(half %0, half %1, half %2)
				ret half %res
				}

				; CHECK-LABEL: fma_rn_ftz_sat_f16
				define half @fma_rn_ftz_sat_f16(half %0, half %1, half %2) {
				; CHECK-NOT: call
				; CHECK: fma.rn.ftz.sat.f16
				%res = call half @llvm.nvvm.fma.rn.ftz.sat.f16(half %0, half %1, half %2)
				ret half %res
				}

				; CHECK-LABEL: fma_rn_f16x2
				define <2 x half> @fma_rn_f16x2(<2 x half> %0, <2 x half> %1, <2 x half> %2) {
				; CHECK-NOT: call
				; CHECK: fma.rn.f16x2
				%res = call <2 x half> @llvm.nvvm.fma.rn.f16x2(<2 x half> %0, <2 x half> %1, <2 x half> %2)
				ret <2 x half> %res
				}

				; CHECK-LABEL: fma_rn_ftz_f16x2
				define <2 x half> @fma_rn_ftz_f16x2(<2 x half> %0, <2 x half> %1, <2 x half> %2) {
				; CHECK-NOT: call
				; CHECK: fma.rn.ftz.f16x2
				%res = call <2 x half> @llvm.nvvm.fma.rn.ftz.f16x2(<2 x half> %0, <2 x half> %1, <2 x half> %2)
				ret <2 x half> %res
				}

				; CHECK-LABEL: fma_rn_sat_f16x2
				define <2 x half> @fma_rn_sat_f16x2(<2 x half> %0, <2 x half> %1, <2 x half> %2) {
				; CHECK-NOT: call
				; CHECK: fma.rn.sat.f16x2
				%res = call <2 x half> @llvm.nvvm.fma.rn.sat.f16x2(<2 x half> %0, <2 x half> %1, <2 x half> %2)
				ret <2 x half> %res
				}

				; CHECK-LABEL: fma_rn_ftz_sat_f16x2
				define <2 x half> @fma_rn_ftz_sat_f16x2(<2 x half> %0, <2 x half> %1, <2 x half> %2) {
				; CHECK-NOT: call
				; CHECK: fma.rn.ftz.sat.f16x2
				%res = call <2 x half> @llvm.nvvm.fma.rn.ftz.sat.f16x2(<2 x half> %0, <2 x half> %1, <2 x half> %2)
				ret <2 x half> %res
				}

llvm/test/CodeGen/NVPTX/math-intrins-sm80-ptx70-instcombine.ll

	Show All 18 Lines
	declare <2 x half> @llvm.nvvm.fmax.ftz.f16x2(<2 x half>, <2 x half>)			declare <2 x half> @llvm.nvvm.fmax.ftz.f16x2(<2 x half>, <2 x half>)
	declare float @llvm.nvvm.fmax.nan.f(float, float)			declare float @llvm.nvvm.fmax.nan.f(float, float)
	declare float @llvm.nvvm.fmax.ftz.nan.f(float, float)			declare float @llvm.nvvm.fmax.ftz.nan.f(float, float)
	declare half @llvm.nvvm.fmax.nan.f16(half, half)			declare half @llvm.nvvm.fmax.nan.f16(half, half)
	declare half @llvm.nvvm.fmax.ftz.nan.f16(half, half)			declare half @llvm.nvvm.fmax.ftz.nan.f16(half, half)
	declare <2 x half> @llvm.nvvm.fmax.nan.f16x2(<2 x half>, <2 x half>)			declare <2 x half> @llvm.nvvm.fmax.nan.f16x2(<2 x half>, <2 x half>)
	declare <2 x half> @llvm.nvvm.fmax.ftz.nan.f16x2(<2 x half>, <2 x half>)			declare <2 x half> @llvm.nvvm.fmax.ftz.nan.f16x2(<2 x half>, <2 x half>)

				; f16 and f16x2 fma are available since ptx 4.2 and sm_53.
				declare half @llvm.nvvm.fma.rn.f16(half, half, half)
				declare half @llvm.nvvm.fma.rn.ftz.f16(half, half, half)
				declare <2 x half> @llvm.nvvm.fma.rn.f16x2(<2 x half>, <2 x half>, <2 x half>)
				declare <2 x half> @llvm.nvvm.fma.rn.ftz.f16x2(<2 x half>, <2 x half>, <2 x half>)

	; CHECK-LABEL: fmin_f16			; CHECK-LABEL: fmin_f16
	define half @fmin_f16(half %0, half %1) {			define half @fmin_f16(half %0, half %1) {
	; CHECK-NOT: @llvm.nvvm.fmin.f16			; CHECK-NOT: @llvm.nvvm.fmin.f16
	; CHECK: @llvm.minnum.f16			; CHECK: @llvm.minnum.f16
	%res = call half @llvm.nvvm.fmin.f16(half %0, half %1)			%res = call half @llvm.nvvm.fmin.f16(half %0, half %1)
	ret half %res			ret half %res
	}			}

	▲ Show 20 Lines • Show All 224 Lines • ▼ Show 20 Lines
	; CHECK-LABEL: fmax_ftz_nan_f16x2_no_attr			; CHECK-LABEL: fmax_ftz_nan_f16x2_no_attr
	define <2 x half> @fmax_ftz_nan_f16x2_no_attr(<2 x half> %0, <2 x half> %1) {			define <2 x half> @fmax_ftz_nan_f16x2_no_attr(<2 x half> %0, <2 x half> %1) {
	; CHECK-NOT: @llvm.maximum.v2f16			; CHECK-NOT: @llvm.maximum.v2f16
	; CHECK: @llvm.nvvm.fmax.ftz.nan.f16x2			; CHECK: @llvm.nvvm.fmax.ftz.nan.f16x2
	%res = call <2 x half> @llvm.nvvm.fmax.ftz.nan.f16x2(<2 x half> %0, <2 x half> %1)			%res = call <2 x half> @llvm.nvvm.fmax.ftz.nan.f16x2(<2 x half> %0, <2 x half> %1)
	ret <2 x half> %res			ret <2 x half> %res
	}			}

				; CHECK-LABEL: fma_rn_f16
				define half @fma_rn_f16(half %0, half %1, half %2) {
				; CHECK-NOT: @llvm.nvvm.fma.rn.f16
				; CHECK: @llvm.fma.f16
				%res = call half @llvm.nvvm.fma.rn.f16(half %0, half %1, half %2)
				ret half %res
				}

				; CHECK-LABEL: fma_rn_ftz_f16_no_attr
				define half @fma_rn_ftz_f16_no_attr(half %0, half %1, half %2) {
				; CHECK-NOT: @llvm.fma.f16
				; CHECK: @llvm.nvvm.fma.rn.ftz.f16
				%res = call half @llvm.nvvm.fma.rn.ftz.f16(half %0, half %1, half %2)
				ret half %res
				}

				; CHECK-LABEL: fma_rn_ftz_f16
				define half @fma_rn_ftz_f16(half %0, half %1, half %2) #0 {
				; CHECK-NOT: @llvm.nvvm.fma.rn.ftz.f16
				; CHECK: @llvm.fma.f16
				%res = call half @llvm.nvvm.fma.rn.ftz.f16(half %0, half %1, half %2)
				ret half %res
				}

				; CHECK-LABEL: fma_rn_f16x2
				define <2 x half> @fma_rn_f16x2(<2 x half> %0, <2 x half> %1, <2 x half> %2) {
				; CHECK-NOT: @llvm.nvvm.fma.rn.f16x2
				; CHECK: @llvm.fma.v2f16
				%res = call <2 x half> @llvm.nvvm.fma.rn.f16x2(<2 x half> %0, <2 x half> %1, <2 x half> %2)
				ret <2 x half> %res
				}

				; CHECK-LABEL: fma_rn_ftz_f16x2
				define <2 x half> @fma_rn_ftz_f16x2(<2 x half> %0, <2 x half> %1, <2 x half> %2) #0 {
				; CHECK-NOT: @llvm.nvvm.fma.rn.ftz.f16x2
				; CHECK: @llvm.fma.v2f16
				%res = call <2 x half> @llvm.nvvm.fma.rn.ftz.f16x2(<2 x half> %0, <2 x half> %1, <2 x half> %2)
				ret <2 x half> %res
				}

				; CHECK-LABEL: fma_rn_ftz_f16x2_no_attr
				define <2 x half> @fma_rn_ftz_f16x2_no_attr(<2 x half> %0, <2 x half> %1, <2 x half> %2) {
				; CHECK-NOT: @llvm.fma.v2f16
				; CHECK: @llvm.nvvm.fma.rn.ftz.f16x2
				%res = call <2 x half> @llvm.nvvm.fma.rn.ftz.f16x2(<2 x half> %0, <2 x half> %1, <2 x half> %2)
				ret <2 x half> %res
				}

	attributes #0 = { "denormal-fp-math"="preserve-sign" }			attributes #0 = { "denormal-fp-math"="preserve-sign" }
	attributes #1 = { "denormal-fp-math-f32"="preserve-sign" }			attributes #1 = { "denormal-fp-math-f32"="preserve-sign" }

llvm/test/CodeGen/NVPTX/math-intrins-sm80-ptx70.ll

	Show All 29 Lines
	declare <2 x half> @llvm.nvvm.fmax.ftz.f16x2(<2 x half>, <2 x half>)			declare <2 x half> @llvm.nvvm.fmax.ftz.f16x2(<2 x half>, <2 x half>)
	declare <2 x half> @llvm.nvvm.fmax.nan.f16x2(<2 x half>, <2 x half>)			declare <2 x half> @llvm.nvvm.fmax.nan.f16x2(<2 x half>, <2 x half>)
	declare <2 x half> @llvm.nvvm.fmax.ftz.nan.f16x2(<2 x half>, <2 x half>)			declare <2 x half> @llvm.nvvm.fmax.ftz.nan.f16x2(<2 x half>, <2 x half>)
	declare i16 @llvm.nvvm.fmax.bf16(i16, i16)			declare i16 @llvm.nvvm.fmax.bf16(i16, i16)
	declare i16 @llvm.nvvm.fmax.nan.bf16(i16, i16)			declare i16 @llvm.nvvm.fmax.nan.bf16(i16, i16)
	declare i32 @llvm.nvvm.fmax.bf16x2(i32, i32)			declare i32 @llvm.nvvm.fmax.bf16x2(i32, i32)
	declare i32 @llvm.nvvm.fmax.nan.bf16x2(i32, i32)			declare i32 @llvm.nvvm.fmax.nan.bf16x2(i32, i32)

				declare half @llvm.nvvm.fma.rn.relu.f16(half, half, half)
				declare half @llvm.nvvm.fma.rn.ftz.relu.f16(half, half, half)
				declare <2 x half> @llvm.nvvm.fma.rn.relu.f16x2(<2 x half>, <2 x half>, <2 x half>)
				declare <2 x half> @llvm.nvvm.fma.rn.ftz.relu.f16x2(<2 x half>, <2 x half>, <2 x half>)
				declare i16 @llvm.nvvm.fma.rn.bf16(i16, i16, i16)
				declare i16 @llvm.nvvm.fma.rn.relu.bf16(i16, i16, i16)
				declare i32 @llvm.nvvm.fma.rn.bf16x2(i32, i32, i32)
				declare i32 @llvm.nvvm.fma.rn.relu.bf16x2(i32, i32, i32)

	; CHECK-LABEL: abs_bf16			; CHECK-LABEL: abs_bf16
	define i16 @abs_bf16(i16 %0) {			define i16 @abs_bf16(i16 %0) {
				; CHECK-NOT: call
	; CHECK: abs.bf16			; CHECK: abs.bf16
	%res = call i16 @llvm.nvvm.abs.bf16(i16 %0);			%res = call i16 @llvm.nvvm.abs.bf16(i16 %0);
	ret i16 %res			ret i16 %res
	}			}

	; CHECK-LABEL: abs_bf16x2			; CHECK-LABEL: abs_bf16x2
	define i32 @abs_bf16x2(i32 %0) {			define i32 @abs_bf16x2(i32 %0) {
				; CHECK-NOT: call
	; CHECK: abs.bf16x2			; CHECK: abs.bf16x2
	%res = call i32 @llvm.nvvm.abs.bf16x2(i32 %0);			%res = call i32 @llvm.nvvm.abs.bf16x2(i32 %0);
	ret i32 %res			ret i32 %res
	}			}

	; CHECK-LABEL: neg_bf16			; CHECK-LABEL: neg_bf16
	define i16 @neg_bf16(i16 %0) {			define i16 @neg_bf16(i16 %0) {
				; CHECK-NOT: call
	; CHECK: neg.bf16			; CHECK: neg.bf16
	%res = call i16 @llvm.nvvm.neg.bf16(i16 %0);			%res = call i16 @llvm.nvvm.neg.bf16(i16 %0);
	ret i16 %res			ret i16 %res
	}			}

	; CHECK-LABEL: neg_bf16x2			; CHECK-LABEL: neg_bf16x2
	define i32 @neg_bf16x2(i32 %0) {			define i32 @neg_bf16x2(i32 %0) {
				; CHECK-NOT: call
	; CHECK: neg.bf16x2			; CHECK: neg.bf16x2
	%res = call i32 @llvm.nvvm.neg.bf16x2(i32 %0);			%res = call i32 @llvm.nvvm.neg.bf16x2(i32 %0);
	ret i32 %res			ret i32 %res
	}			}

	; CHECK-LABEL: fmin_nan_f			; CHECK-LABEL: fmin_nan_f
	define float @fmin_nan_f(float %0, float %1) {			define float @fmin_nan_f(float %0, float %1) {
				; CHECK-NOT: call
	; CHECK: min.NaN.f32			; CHECK: min.NaN.f32
	%res = call float @llvm.nvvm.fmin.nan.f(float %0, float %1);			%res = call float @llvm.nvvm.fmin.nan.f(float %0, float %1);
	ret float %res			ret float %res
	}			}

	; CHECK-LABEL: fmin_ftz_nan_f			; CHECK-LABEL: fmin_ftz_nan_f
	define float @fmin_ftz_nan_f(float %0, float %1) {			define float @fmin_ftz_nan_f(float %0, float %1) {
				; CHECK-NOT: call
	; CHECK: min.ftz.NaN.f32			; CHECK: min.ftz.NaN.f32
	%res = call float @llvm.nvvm.fmin.ftz.nan.f(float %0, float %1);			%res = call float @llvm.nvvm.fmin.ftz.nan.f(float %0, float %1);
	ret float %res			ret float %res
	}			}

	; CHECK-LABEL: fmin_f16			; CHECK-LABEL: fmin_f16
	define half @fmin_f16(half %0, half %1) {			define half @fmin_f16(half %0, half %1) {
				; CHECK-NOT: call
	; CHECK: min.f16			; CHECK: min.f16
	%res = call half @llvm.nvvm.fmin.f16(half %0, half %1)			%res = call half @llvm.nvvm.fmin.f16(half %0, half %1)
	ret half %res			ret half %res
	}			}

	; CHECK-LABEL: fmin_ftz_f16			; CHECK-LABEL: fmin_ftz_f16
	define half @fmin_ftz_f16(half %0, half %1) {			define half @fmin_ftz_f16(half %0, half %1) {
				; CHECK-NOT: call
	; CHECK: min.ftz.f16			; CHECK: min.ftz.f16
	%res = call half @llvm.nvvm.fmin.ftz.f16(half %0, half %1)			%res = call half @llvm.nvvm.fmin.ftz.f16(half %0, half %1)
	ret half %res			ret half %res
	}			}

	; CHECK-LABEL: fmin_nan_f16			; CHECK-LABEL: fmin_nan_f16
	define half @fmin_nan_f16(half %0, half %1) {			define half @fmin_nan_f16(half %0, half %1) {
				; CHECK-NOT: call
	; CHECK: min.NaN.f16			; CHECK: min.NaN.f16
	%res = call half @llvm.nvvm.fmin.nan.f16(half %0, half %1)			%res = call half @llvm.nvvm.fmin.nan.f16(half %0, half %1)
	ret half %res			ret half %res
	}			}

	; CHECK-LABEL: fmin_ftz_nan_f16			; CHECK-LABEL: fmin_ftz_nan_f16
	define half @fmin_ftz_nan_f16(half %0, half %1) {			define half @fmin_ftz_nan_f16(half %0, half %1) {
				; CHECK-NOT: call
	; CHECK: min.ftz.NaN.f16			; CHECK: min.ftz.NaN.f16
	%res = call half @llvm.nvvm.fmin.ftz.nan.f16(half %0, half %1)			%res = call half @llvm.nvvm.fmin.ftz.nan.f16(half %0, half %1)
	ret half %res			ret half %res
	}			}

	; CHECK-LABEL: fmin_f16x2			; CHECK-LABEL: fmin_f16x2
	define <2 x half> @fmin_f16x2(<2 x half> %0, <2 x half> %1) {			define <2 x half> @fmin_f16x2(<2 x half> %0, <2 x half> %1) {
				; CHECK-NOT: call
	; CHECK: min.f16x2			; CHECK: min.f16x2
	%res = call <2 x half> @llvm.nvvm.fmin.f16x2(<2 x half> %0, <2 x half> %1)			%res = call <2 x half> @llvm.nvvm.fmin.f16x2(<2 x half> %0, <2 x half> %1)
	ret <2 x half> %res			ret <2 x half> %res
	}			}

	; CHECK-LABEL: fmin_ftz_f16x2			; CHECK-LABEL: fmin_ftz_f16x2
	define <2 x half> @fmin_ftz_f16x2(<2 x half> %0, <2 x half> %1) {			define <2 x half> @fmin_ftz_f16x2(<2 x half> %0, <2 x half> %1) {
				; CHECK-NOT: call
	; CHECK: min.ftz.f16x2			; CHECK: min.ftz.f16x2
	%res = call <2 x half> @llvm.nvvm.fmin.ftz.f16x2(<2 x half> %0, <2 x half> %1)			%res = call <2 x half> @llvm.nvvm.fmin.ftz.f16x2(<2 x half> %0, <2 x half> %1)
	ret <2 x half> %res			ret <2 x half> %res
	}			}

	; CHECK-LABEL: fmin_nan_f16x2			; CHECK-LABEL: fmin_nan_f16x2
	define <2 x half> @fmin_nan_f16x2(<2 x half> %0, <2 x half> %1) {			define <2 x half> @fmin_nan_f16x2(<2 x half> %0, <2 x half> %1) {
				; CHECK-NOT: call
	; CHECK: min.NaN.f16x2			; CHECK: min.NaN.f16x2
	%res = call <2 x half> @llvm.nvvm.fmin.nan.f16x2(<2 x half> %0, <2 x half> %1)			%res = call <2 x half> @llvm.nvvm.fmin.nan.f16x2(<2 x half> %0, <2 x half> %1)
	ret <2 x half> %res			ret <2 x half> %res
	}			}

	; CHECK-LABEL: fmin_ftz_nan_f16x2			; CHECK-LABEL: fmin_ftz_nan_f16x2
	define <2 x half> @fmin_ftz_nan_f16x2(<2 x half> %0, <2 x half> %1) {			define <2 x half> @fmin_ftz_nan_f16x2(<2 x half> %0, <2 x half> %1) {
				; CHECK-NOT: call
	; CHECK: min.ftz.NaN.f16x2			; CHECK: min.ftz.NaN.f16x2
	%res = call <2 x half> @llvm.nvvm.fmin.ftz.nan.f16x2(<2 x half> %0, <2 x half> %1)			%res = call <2 x half> @llvm.nvvm.fmin.ftz.nan.f16x2(<2 x half> %0, <2 x half> %1)
	ret <2 x half> %res			ret <2 x half> %res
	}			}

	; CHECK-LABEL: fmin_bf16			; CHECK-LABEL: fmin_bf16
	define i16 @fmin_bf16(i16 %0, i16 %1) {			define i16 @fmin_bf16(i16 %0, i16 %1) {
				; CHECK-NOT: call
	; CHECK: min.bf16			; CHECK: min.bf16
	%res = call i16 @llvm.nvvm.fmin.bf16(i16 %0, i16 %1)			%res = call i16 @llvm.nvvm.fmin.bf16(i16 %0, i16 %1)
	ret i16 %res			ret i16 %res
	}			}

	; CHECK-LABEL: fmin_nan_bf16			; CHECK-LABEL: fmin_nan_bf16
	define i16 @fmin_nan_bf16(i16 %0, i16 %1) {			define i16 @fmin_nan_bf16(i16 %0, i16 %1) {
				; CHECK-NOT: call
	; CHECK: min.NaN.bf16			; CHECK: min.NaN.bf16
	%res = call i16 @llvm.nvvm.fmin.nan.bf16(i16 %0, i16 %1)			%res = call i16 @llvm.nvvm.fmin.nan.bf16(i16 %0, i16 %1)
	ret i16 %res			ret i16 %res
	}			}

	; CHECK-LABEL: fmin_bf16x2			; CHECK-LABEL: fmin_bf16x2
	define i32 @fmin_bf16x2(i32 %0, i32 %1) {			define i32 @fmin_bf16x2(i32 %0, i32 %1) {
				; CHECK-NOT: call
	; CHECK: min.bf16x2			; CHECK: min.bf16x2
	%res = call i32 @llvm.nvvm.fmin.bf16x2(i32 %0, i32 %1)			%res = call i32 @llvm.nvvm.fmin.bf16x2(i32 %0, i32 %1)
	ret i32 %res			ret i32 %res
	}			}

	; CHECK-LABEL: fmin_nan_bf16x2			; CHECK-LABEL: fmin_nan_bf16x2
	define i32 @fmin_nan_bf16x2(i32 %0, i32 %1) {			define i32 @fmin_nan_bf16x2(i32 %0, i32 %1) {
				; CHECK-NOT: call
	; CHECK: min.NaN.bf16x2			; CHECK: min.NaN.bf16x2
	%res = call i32 @llvm.nvvm.fmin.nan.bf16x2(i32 %0, i32 %1)			%res = call i32 @llvm.nvvm.fmin.nan.bf16x2(i32 %0, i32 %1)
	ret i32 %res			ret i32 %res
	}			}

	; CHECK-LABEL: fmax_nan_f			; CHECK-LABEL: fmax_nan_f
	define float @fmax_nan_f(float %0, float %1) {			define float @fmax_nan_f(float %0, float %1) {
				; CHECK-NOT: call
	; CHECK: max.NaN.f32			; CHECK: max.NaN.f32
	%res = call float @llvm.nvvm.fmax.nan.f(float %0, float %1);			%res = call float @llvm.nvvm.fmax.nan.f(float %0, float %1);
	ret float %res			ret float %res
	}			}

	; CHECK-LABEL: fmax_ftz_nan_f			; CHECK-LABEL: fmax_ftz_nan_f
	define float @fmax_ftz_nan_f(float %0, float %1) {			define float @fmax_ftz_nan_f(float %0, float %1) {
				; CHECK-NOT: call
	; CHECK: max.ftz.NaN.f32			; CHECK: max.ftz.NaN.f32
	%res = call float @llvm.nvvm.fmax.ftz.nan.f(float %0, float %1);			%res = call float @llvm.nvvm.fmax.ftz.nan.f(float %0, float %1);
	ret float %res			ret float %res
	}			}

	; CHECK-LABEL: fmax_f16			; CHECK-LABEL: fmax_f16
	define half @fmax_f16(half %0, half %1) {			define half @fmax_f16(half %0, half %1) {
				; CHECK-NOT: call
	; CHECK: max.f16			; CHECK: max.f16
	%res = call half @llvm.nvvm.fmax.f16(half %0, half %1)			%res = call half @llvm.nvvm.fmax.f16(half %0, half %1)
	ret half %res			ret half %res
	}			}

	; CHECK-LABEL: fmax_ftz_f16			; CHECK-LABEL: fmax_ftz_f16
	define half @fmax_ftz_f16(half %0, half %1) {			define half @fmax_ftz_f16(half %0, half %1) {
				; CHECK-NOT: call
	; CHECK: max.ftz.f16			; CHECK: max.ftz.f16
	%res = call half @llvm.nvvm.fmax.ftz.f16(half %0, half %1)			%res = call half @llvm.nvvm.fmax.ftz.f16(half %0, half %1)
	ret half %res			ret half %res
	}			}

	; CHECK-LABEL: fmax_nan_f16			; CHECK-LABEL: fmax_nan_f16
	define half @fmax_nan_f16(half %0, half %1) {			define half @fmax_nan_f16(half %0, half %1) {
				; CHECK-NOT: call
	; CHECK: max.NaN.f16			; CHECK: max.NaN.f16
	%res = call half @llvm.nvvm.fmax.nan.f16(half %0, half %1)			%res = call half @llvm.nvvm.fmax.nan.f16(half %0, half %1)
	ret half %res			ret half %res
	}			}

	; CHECK-LABEL: fmax_ftz_nan_f16			; CHECK-LABEL: fmax_ftz_nan_f16
	define half @fmax_ftz_nan_f16(half %0, half %1) {			define half @fmax_ftz_nan_f16(half %0, half %1) {
				; CHECK-NOT: call
	; CHECK: max.ftz.NaN.f16			; CHECK: max.ftz.NaN.f16
	%res = call half @llvm.nvvm.fmax.ftz.nan.f16(half %0, half %1)			%res = call half @llvm.nvvm.fmax.ftz.nan.f16(half %0, half %1)
	ret half %res			ret half %res
	}			}

	; CHECK-LABEL: fmax_f16x2			; CHECK-LABEL: fmax_f16x2
	define <2 x half> @fmax_f16x2(<2 x half> %0, <2 x half> %1) {			define <2 x half> @fmax_f16x2(<2 x half> %0, <2 x half> %1) {
				; CHECK-NOT: call
	; CHECK: max.f16x2			; CHECK: max.f16x2
	%res = call <2 x half> @llvm.nvvm.fmax.f16x2(<2 x half> %0, <2 x half> %1)			%res = call <2 x half> @llvm.nvvm.fmax.f16x2(<2 x half> %0, <2 x half> %1)
	ret <2 x half> %res			ret <2 x half> %res
	}			}

	; CHECK-LABEL: fmax_ftz_f16x2			; CHECK-LABEL: fmax_ftz_f16x2
	define <2 x half> @fmax_ftz_f16x2(<2 x half> %0, <2 x half> %1) {			define <2 x half> @fmax_ftz_f16x2(<2 x half> %0, <2 x half> %1) {
				; CHECK-NOT: call
	; CHECK: max.ftz.f16x2			; CHECK: max.ftz.f16x2
	%res = call <2 x half> @llvm.nvvm.fmax.ftz.f16x2(<2 x half> %0, <2 x half> %1)			%res = call <2 x half> @llvm.nvvm.fmax.ftz.f16x2(<2 x half> %0, <2 x half> %1)
	ret <2 x half> %res			ret <2 x half> %res
	}			}

	; CHECK-LABEL: fmax_nan_f16x2			; CHECK-LABEL: fmax_nan_f16x2
	define <2 x half> @fmax_nan_f16x2(<2 x half> %0, <2 x half> %1) {			define <2 x half> @fmax_nan_f16x2(<2 x half> %0, <2 x half> %1) {
				; CHECK-NOT: call
	; CHECK: max.NaN.f16x2			; CHECK: max.NaN.f16x2
	%res = call <2 x half> @llvm.nvvm.fmax.nan.f16x2(<2 x half> %0, <2 x half> %1)			%res = call <2 x half> @llvm.nvvm.fmax.nan.f16x2(<2 x half> %0, <2 x half> %1)
	ret <2 x half> %res			ret <2 x half> %res
	}			}

	; CHECK-LABEL: fmax_ftz_nan_f16x2			; CHECK-LABEL: fmax_ftz_nan_f16x2
	define <2 x half> @fmax_ftz_nan_f16x2(<2 x half> %0, <2 x half> %1) {			define <2 x half> @fmax_ftz_nan_f16x2(<2 x half> %0, <2 x half> %1) {
				; CHECK-NOT: call
	; CHECK: max.ftz.NaN.f16x2			; CHECK: max.ftz.NaN.f16x2
	%res = call <2 x half> @llvm.nvvm.fmax.ftz.nan.f16x2(<2 x half> %0, <2 x half> %1)			%res = call <2 x half> @llvm.nvvm.fmax.ftz.nan.f16x2(<2 x half> %0, <2 x half> %1)
	ret <2 x half> %res			ret <2 x half> %res
	}			}

	; CHECK-LABEL: fmax_bf16			; CHECK-LABEL: fmax_bf16
	define i16 @fmax_bf16(i16 %0, i16 %1) {			define i16 @fmax_bf16(i16 %0, i16 %1) {
				; CHECK-NOT: call
	; CHECK: max.bf16			; CHECK: max.bf16
	%res = call i16 @llvm.nvvm.fmax.bf16(i16 %0, i16 %1)			%res = call i16 @llvm.nvvm.fmax.bf16(i16 %0, i16 %1)
	ret i16 %res			ret i16 %res
	}			}

	; CHECK-LABEL: fmax_nan_bf16			; CHECK-LABEL: fmax_nan_bf16
	define i16 @fmax_nan_bf16(i16 %0, i16 %1) {			define i16 @fmax_nan_bf16(i16 %0, i16 %1) {
				; CHECK-NOT: call
	; CHECK: max.NaN.bf16			; CHECK: max.NaN.bf16
	%res = call i16 @llvm.nvvm.fmax.nan.bf16(i16 %0, i16 %1)			%res = call i16 @llvm.nvvm.fmax.nan.bf16(i16 %0, i16 %1)
	ret i16 %res			ret i16 %res
	}			}

	; CHECK-LABEL: fmax_bf16x2			; CHECK-LABEL: fmax_bf16x2
	define i32 @fmax_bf16x2(i32 %0, i32 %1) {			define i32 @fmax_bf16x2(i32 %0, i32 %1) {
				; CHECK-NOT: call
	; CHECK: max.bf16x2			; CHECK: max.bf16x2
	%res = call i32 @llvm.nvvm.fmax.bf16x2(i32 %0, i32 %1)			%res = call i32 @llvm.nvvm.fmax.bf16x2(i32 %0, i32 %1)
	ret i32 %res			ret i32 %res
	}			}

	; CHECK-LABEL: fmax_nan_bf16x2			; CHECK-LABEL: fmax_nan_bf16x2
	define i32 @fmax_nan_bf16x2(i32 %0, i32 %1) {			define i32 @fmax_nan_bf16x2(i32 %0, i32 %1) {
				; CHECK-NOT: call
	; CHECK: max.NaN.bf16x2			; CHECK: max.NaN.bf16x2
	%res = call i32 @llvm.nvvm.fmax.nan.bf16x2(i32 %0, i32 %1)			%res = call i32 @llvm.nvvm.fmax.nan.bf16x2(i32 %0, i32 %1)
	ret i32 %res			ret i32 %res
	}			}

				; CHECK-LABEL: fma_rn_relu_f16
				define half @fma_rn_relu_f16(half %0, half %1, half %2) {
				; CHECK-NOT: call
				; CHECK: fma.rn.relu.f16
				%res = call half @llvm.nvvm.fma.rn.relu.f16(half %0, half %1, half %2)
				ret half %res
				}

				; CHECK-LABEL: fma_rn_ftz_relu_f16
				define half @fma_rn_ftz_relu_f16(half %0, half %1, half %2) {
				; CHECK-NOT: call
				; CHECK: fma.rn.ftz.relu.f16
				%res = call half @llvm.nvvm.fma.rn.ftz.relu.f16(half %0, half %1, half %2)
				ret half %res
				}

				; CHECK-LABEL: fma_rn_relu_f16x2
				define <2 x half> @fma_rn_relu_f16x2(<2 x half> %0, <2 x half> %1, <2 x half> %2) {
				; CHECK-NOT: call
				; CHECK: fma.rn.relu.f16x2
				%res = call <2 x half> @llvm.nvvm.fma.rn.relu.f16x2(<2 x half> %0, <2 x half> %1, <2 x half> %2)
				ret <2 x half> %res
				}

				; CHECK-LABEL: fma_rn_ftz_relu_f16x2
				define <2 x half> @fma_rn_ftz_relu_f16x2(<2 x half> %0, <2 x half> %1, <2 x half> %2) {
				; CHECK-NOT: call
				; CHECK: fma.rn.ftz.relu.f16x2
				%res = call <2 x half> @llvm.nvvm.fma.rn.ftz.relu.f16x2(<2 x half> %0, <2 x half> %1, <2 x half> %2)
				ret <2 x half> %res
				}

				; CHECK-LABEL: fma_rn_bf16
				define i16 @fma_rn_bf16(i16 %0, i16 %1, i16 %2) {
				; CHECK-NOT: call
				; CHECK: fma.rn.bf16
				%res = call i16 @llvm.nvvm.fma.rn.bf16(i16 %0, i16 %1, i16 %2)
				ret i16 %res
				}

				; CHECK-LABEL: fma_rn_relu_bf16
				define i16 @fma_rn_relu_bf16(i16 %0, i16 %1, i16 %2) {
				; CHECK-NOT: call
				; CHECK: fma.rn.relu.bf16
				%res = call i16 @llvm.nvvm.fma.rn.relu.bf16(i16 %0, i16 %1, i16 %2)
				ret i16 %res
				}

				; CHECK-LABEL: fma_rn_bf16x2
				define i32 @fma_rn_bf16x2(i32 %0, i32 %1, i32 %2) {
				; CHECK-NOT: call
				; CHECK: fma.rn.bf16x2
				%res = call i32 @llvm.nvvm.fma.rn.bf16x2(i32 %0, i32 %1, i32 %2)
				ret i32 %res
				}

				; CHECK-LABEL: fma_rn_relu_bf16x2
				define i32 @fma_rn_relu_bf16x2(i32 %0, i32 %1, i32 %2) {
				; CHECK-NOT: call
				; CHECK: fma.rn.relu.bf16x2
				%res = call i32 @llvm.nvvm.fma.rn.relu.bf16x2(i32 %0, i32 %1, i32 %2)
				ret i32 %res
				}

llvm/test/CodeGen/NVPTX/math-intrins-sm86-ptx72.ll

	Show All 30 Lines
	declare i32 @llvm.nvvm.fmax.nan.xorsign.abs.bf16x2(i32, i32)			declare i32 @llvm.nvvm.fmax.nan.xorsign.abs.bf16x2(i32, i32)
	declare float @llvm.nvvm.fmax.xorsign.abs.f(float, float)			declare float @llvm.nvvm.fmax.xorsign.abs.f(float, float)
	declare float @llvm.nvvm.fmax.ftz.xorsign.abs.f(float, float)			declare float @llvm.nvvm.fmax.ftz.xorsign.abs.f(float, float)
	declare float @llvm.nvvm.fmax.nan.xorsign.abs.f(float, float)			declare float @llvm.nvvm.fmax.nan.xorsign.abs.f(float, float)
	declare float @llvm.nvvm.fmax.ftz.nan.xorsign.abs.f(float, float)			declare float @llvm.nvvm.fmax.ftz.nan.xorsign.abs.f(float, float)

	; CHECK-LABEL: fmin_xorsign_abs_f16			; CHECK-LABEL: fmin_xorsign_abs_f16
	define half @fmin_xorsign_abs_f16(half %0, half %1) {			define half @fmin_xorsign_abs_f16(half %0, half %1) {
				; CHECK-NOT: call
	; CHECK: min.xorsign.abs.f16			; CHECK: min.xorsign.abs.f16
	%res = call half @llvm.nvvm.fmin.xorsign.abs.f16(half %0, half %1)			%res = call half @llvm.nvvm.fmin.xorsign.abs.f16(half %0, half %1)
	ret half %res			ret half %res
	}			}

	; CHECK-LABEL: fmin_ftz_xorsign_abs_f16			; CHECK-LABEL: fmin_ftz_xorsign_abs_f16
	define half @fmin_ftz_xorsign_abs_f16(half %0, half %1) {			define half @fmin_ftz_xorsign_abs_f16(half %0, half %1) {
				; CHECK-NOT: call
	; CHECK: min.ftz.xorsign.abs.f16			; CHECK: min.ftz.xorsign.abs.f16
	%res = call half @llvm.nvvm.fmin.ftz.xorsign.abs.f16(half %0, half %1)			%res = call half @llvm.nvvm.fmin.ftz.xorsign.abs.f16(half %0, half %1)
	ret half %res			ret half %res
	}			}

	; CHECK-LABEL: fmin_nan_xorsign_abs_f16			; CHECK-LABEL: fmin_nan_xorsign_abs_f16
	define half @fmin_nan_xorsign_abs_f16(half %0, half %1) {			define half @fmin_nan_xorsign_abs_f16(half %0, half %1) {
				; CHECK-NOT: call
	; CHECK: min.NaN.xorsign.abs.f16			; CHECK: min.NaN.xorsign.abs.f16
	%res = call half @llvm.nvvm.fmin.nan.xorsign.abs.f16(half %0, half %1)			%res = call half @llvm.nvvm.fmin.nan.xorsign.abs.f16(half %0, half %1)
	ret half %res			ret half %res
	}			}

	; CHECK-LABEL: fmin_ftz_nan_xorsign_abs_f16			; CHECK-LABEL: fmin_ftz_nan_xorsign_abs_f16
	define half @fmin_ftz_nan_xorsign_abs_f16(half %0, half %1) {			define half @fmin_ftz_nan_xorsign_abs_f16(half %0, half %1) {
				; CHECK-NOT: call
	; CHECK: min.ftz.NaN.xorsign.abs.f16			; CHECK: min.ftz.NaN.xorsign.abs.f16
	%res = call half @llvm.nvvm.fmin.ftz.nan.xorsign.abs.f16(half %0, half %1)			%res = call half @llvm.nvvm.fmin.ftz.nan.xorsign.abs.f16(half %0, half %1)
	ret half %res			ret half %res
	}			}

	; CHECK-LABEL: fmin_xorsign_abs_f16x2			; CHECK-LABEL: fmin_xorsign_abs_f16x2
	define <2 x half> @fmin_xorsign_abs_f16x2(<2 x half> %0, <2 x half> %1) {			define <2 x half> @fmin_xorsign_abs_f16x2(<2 x half> %0, <2 x half> %1) {
				; CHECK-NOT: call
	; CHECK: min.xorsign.abs.f16x2			; CHECK: min.xorsign.abs.f16x2
	%res = call <2 x half> @llvm.nvvm.fmin.xorsign.abs.f16x2(<2 x half> %0, <2 x half> %1)			%res = call <2 x half> @llvm.nvvm.fmin.xorsign.abs.f16x2(<2 x half> %0, <2 x half> %1)
	ret <2 x half> %res			ret <2 x half> %res
	}			}

	; CHECK-LABEL: fmin_ftz_xorsign_abs_f16x2			; CHECK-LABEL: fmin_ftz_xorsign_abs_f16x2
	define <2 x half> @fmin_ftz_xorsign_abs_f16x2(<2 x half> %0, <2 x half> %1) {			define <2 x half> @fmin_ftz_xorsign_abs_f16x2(<2 x half> %0, <2 x half> %1) {
				; CHECK-NOT: call
	; CHECK: min.ftz.xorsign.abs.f16x2			; CHECK: min.ftz.xorsign.abs.f16x2
	%res = call <2 x half> @llvm.nvvm.fmin.ftz.xorsign.abs.f16x2(<2 x half> %0, <2 x half> %1)			%res = call <2 x half> @llvm.nvvm.fmin.ftz.xorsign.abs.f16x2(<2 x half> %0, <2 x half> %1)
	ret <2 x half> %res			ret <2 x half> %res
	}			}

	; CHECK-LABEL: fmin_nan_xorsign_abs_f16x2			; CHECK-LABEL: fmin_nan_xorsign_abs_f16x2
	define <2 x half> @fmin_nan_xorsign_abs_f16x2(<2 x half> %0, <2 x half> %1) {			define <2 x half> @fmin_nan_xorsign_abs_f16x2(<2 x half> %0, <2 x half> %1) {
				; CHECK-NOT: call
	; CHECK: min.NaN.xorsign.abs.f16x2			; CHECK: min.NaN.xorsign.abs.f16x2
	%res = call <2 x half> @llvm.nvvm.fmin.nan.xorsign.abs.f16x2(<2 x half> %0, <2 x half> %1)			%res = call <2 x half> @llvm.nvvm.fmin.nan.xorsign.abs.f16x2(<2 x half> %0, <2 x half> %1)
	ret <2 x half> %res			ret <2 x half> %res
	}			}

	; CHECK-LABEL: fmin_ftz_nan_xorsign_abs_f16x2			; CHECK-LABEL: fmin_ftz_nan_xorsign_abs_f16x2
	define <2 x half> @fmin_ftz_nan_xorsign_abs_f16x2(<2 x half> %0, <2 x half> %1) {			define <2 x half> @fmin_ftz_nan_xorsign_abs_f16x2(<2 x half> %0, <2 x half> %1) {
				; CHECK-NOT: call
	; CHECK: min.ftz.NaN.xorsign.abs.f16x2			; CHECK: min.ftz.NaN.xorsign.abs.f16x2
	%res = call <2 x half> @llvm.nvvm.fmin.ftz.nan.xorsign.abs.f16x2(<2 x half> %0, <2 x half> %1)			%res = call <2 x half> @llvm.nvvm.fmin.ftz.nan.xorsign.abs.f16x2(<2 x half> %0, <2 x half> %1)
	ret <2 x half> %res			ret <2 x half> %res
	}			}

	; CHECK-LABEL: fmin_xorsign_abs_bf16			; CHECK-LABEL: fmin_xorsign_abs_bf16
	define i16 @fmin_xorsign_abs_bf16(i16 %0, i16 %1) {			define i16 @fmin_xorsign_abs_bf16(i16 %0, i16 %1) {
				; CHECK-NOT: call
	; CHECK: min.xorsign.abs.bf16			; CHECK: min.xorsign.abs.bf16
	%res = call i16 @llvm.nvvm.fmin.xorsign.abs.bf16(i16 %0, i16 %1)			%res = call i16 @llvm.nvvm.fmin.xorsign.abs.bf16(i16 %0, i16 %1)
	ret i16 %res			ret i16 %res
	}			}

	; CHECK-LABEL: fmin_nan_xorsign_abs_bf16			; CHECK-LABEL: fmin_nan_xorsign_abs_bf16
	define i16 @fmin_nan_xorsign_abs_bf16(i16 %0, i16 %1) {			define i16 @fmin_nan_xorsign_abs_bf16(i16 %0, i16 %1) {
				; CHECK-NOT: call
	; CHECK: min.NaN.xorsign.abs.bf16			; CHECK: min.NaN.xorsign.abs.bf16
	%res = call i16 @llvm.nvvm.fmin.nan.xorsign.abs.bf16(i16 %0, i16 %1)			%res = call i16 @llvm.nvvm.fmin.nan.xorsign.abs.bf16(i16 %0, i16 %1)
	ret i16 %res			ret i16 %res
	}			}

	; CHECK-LABEL: fmin_xorsign_abs_bf16x2			; CHECK-LABEL: fmin_xorsign_abs_bf16x2
	define i32 @fmin_xorsign_abs_bf16x2(i32 %0, i32 %1) {			define i32 @fmin_xorsign_abs_bf16x2(i32 %0, i32 %1) {
				; CHECK-NOT: call
	; CHECK: min.xorsign.abs.bf16x2			; CHECK: min.xorsign.abs.bf16x2
	%res = call i32 @llvm.nvvm.fmin.xorsign.abs.bf16x2(i32 %0, i32 %1)			%res = call i32 @llvm.nvvm.fmin.xorsign.abs.bf16x2(i32 %0, i32 %1)
	ret i32 %res			ret i32 %res
	}			}

	; CHECK-LABEL: fmin_nan_xorsign_abs_bf16x2			; CHECK-LABEL: fmin_nan_xorsign_abs_bf16x2
	define i32 @fmin_nan_xorsign_abs_bf16x2(i32 %0, i32 %1) {			define i32 @fmin_nan_xorsign_abs_bf16x2(i32 %0, i32 %1) {
				; CHECK-NOT: call
	; CHECK: min.NaN.xorsign.abs.bf16x2			; CHECK: min.NaN.xorsign.abs.bf16x2
	%res = call i32 @llvm.nvvm.fmin.nan.xorsign.abs.bf16x2(i32 %0, i32 %1)			%res = call i32 @llvm.nvvm.fmin.nan.xorsign.abs.bf16x2(i32 %0, i32 %1)
	ret i32 %res			ret i32 %res
	}			}

	; CHECK-LABEL: fmin_xorsign_abs_f			; CHECK-LABEL: fmin_xorsign_abs_f
	define float @fmin_xorsign_abs_f(float %0, float %1) {			define float @fmin_xorsign_abs_f(float %0, float %1) {
				; CHECK-NOT: call
	; CHECK: min.xorsign.abs.f			; CHECK: min.xorsign.abs.f
	%res = call float @llvm.nvvm.fmin.xorsign.abs.f(float %0, float %1)			%res = call float @llvm.nvvm.fmin.xorsign.abs.f(float %0, float %1)
	ret float %res			ret float %res
	}			}

	; CHECK-LABEL: fmin_ftz_xorsign_abs_f			; CHECK-LABEL: fmin_ftz_xorsign_abs_f
	define float @fmin_ftz_xorsign_abs_f(float %0, float %1) {			define float @fmin_ftz_xorsign_abs_f(float %0, float %1) {
				; CHECK-NOT: call
	; CHECK: min.ftz.xorsign.abs.f			; CHECK: min.ftz.xorsign.abs.f
	%res = call float @llvm.nvvm.fmin.ftz.xorsign.abs.f(float %0, float %1)			%res = call float @llvm.nvvm.fmin.ftz.xorsign.abs.f(float %0, float %1)
	ret float %res			ret float %res
	}			}

	; CHECK-LABEL: fmin_nan_xorsign_abs_f			; CHECK-LABEL: fmin_nan_xorsign_abs_f
	define float @fmin_nan_xorsign_abs_f(float %0, float %1) {			define float @fmin_nan_xorsign_abs_f(float %0, float %1) {
				; CHECK-NOT: call
	; CHECK: min.NaN.xorsign.abs.f			; CHECK: min.NaN.xorsign.abs.f
	%res = call float @llvm.nvvm.fmin.nan.xorsign.abs.f(float %0, float %1)			%res = call float @llvm.nvvm.fmin.nan.xorsign.abs.f(float %0, float %1)
	ret float %res			ret float %res
	}			}

	; CHECK-LABEL: fmin_ftz_nan_xorsign_abs_f			; CHECK-LABEL: fmin_ftz_nan_xorsign_abs_f
	define float @fmin_ftz_nan_xorsign_abs_f(float %0, float %1) {			define float @fmin_ftz_nan_xorsign_abs_f(float %0, float %1) {
				; CHECK-NOT: call
	; CHECK: min.ftz.NaN.xorsign.abs.f			; CHECK: min.ftz.NaN.xorsign.abs.f
	%res = call float @llvm.nvvm.fmin.ftz.nan.xorsign.abs.f(float %0, float %1)			%res = call float @llvm.nvvm.fmin.ftz.nan.xorsign.abs.f(float %0, float %1)
	ret float %res			ret float %res
	}			}

	; CHECK-LABEL: fmax_xorsign_abs_f16			; CHECK-LABEL: fmax_xorsign_abs_f16
	define half @fmax_xorsign_abs_f16(half %0, half %1) {			define half @fmax_xorsign_abs_f16(half %0, half %1) {
				; CHECK-NOT: call
	; CHECK: max.xorsign.abs.f16			; CHECK: max.xorsign.abs.f16
	%res = call half @llvm.nvvm.fmax.xorsign.abs.f16(half %0, half %1)			%res = call half @llvm.nvvm.fmax.xorsign.abs.f16(half %0, half %1)
	ret half %res			ret half %res
	}			}

	; CHECK-LABEL: fmax_ftz_xorsign_abs_f16			; CHECK-LABEL: fmax_ftz_xorsign_abs_f16
	define half @fmax_ftz_xorsign_abs_f16(half %0, half %1) {			define half @fmax_ftz_xorsign_abs_f16(half %0, half %1) {
				; CHECK-NOT: call
	; CHECK: max.ftz.xorsign.abs.f16			; CHECK: max.ftz.xorsign.abs.f16
	%res = call half @llvm.nvvm.fmax.ftz.xorsign.abs.f16(half %0, half %1)			%res = call half @llvm.nvvm.fmax.ftz.xorsign.abs.f16(half %0, half %1)
	ret half %res			ret half %res
	}			}

	; CHECK-LABEL: fmax_nan_xorsign_abs_f16			; CHECK-LABEL: fmax_nan_xorsign_abs_f16
	define half @fmax_nan_xorsign_abs_f16(half %0, half %1) {			define half @fmax_nan_xorsign_abs_f16(half %0, half %1) {
				; CHECK-NOT: call
	; CHECK: max.NaN.xorsign.abs.f16			; CHECK: max.NaN.xorsign.abs.f16
	%res = call half @llvm.nvvm.fmax.nan.xorsign.abs.f16(half %0, half %1)			%res = call half @llvm.nvvm.fmax.nan.xorsign.abs.f16(half %0, half %1)
	ret half %res			ret half %res
	}			}

	; CHECK-LABEL: fmax_ftz_nan_xorsign_abs_f16			; CHECK-LABEL: fmax_ftz_nan_xorsign_abs_f16
	define half @fmax_ftz_nan_xorsign_abs_f16(half %0, half %1) {			define half @fmax_ftz_nan_xorsign_abs_f16(half %0, half %1) {
				; CHECK-NOT: call
	; CHECK: max.ftz.NaN.xorsign.abs.f16			; CHECK: max.ftz.NaN.xorsign.abs.f16
	%res = call half @llvm.nvvm.fmax.ftz.nan.xorsign.abs.f16(half %0, half %1)			%res = call half @llvm.nvvm.fmax.ftz.nan.xorsign.abs.f16(half %0, half %1)
	ret half %res			ret half %res
	}			}

	; CHECK-LABEL: fmax_xorsign_abs_f16x2			; CHECK-LABEL: fmax_xorsign_abs_f16x2
	define <2 x half> @fmax_xorsign_abs_f16x2(<2 x half> %0, <2 x half> %1) {			define <2 x half> @fmax_xorsign_abs_f16x2(<2 x half> %0, <2 x half> %1) {
				; CHECK-NOT: call
	; CHECK: max.xorsign.abs.f16x2			; CHECK: max.xorsign.abs.f16x2
	%res = call <2 x half> @llvm.nvvm.fmax.xorsign.abs.f16x2(<2 x half> %0, <2 x half> %1)			%res = call <2 x half> @llvm.nvvm.fmax.xorsign.abs.f16x2(<2 x half> %0, <2 x half> %1)
	ret <2 x half> %res			ret <2 x half> %res
	}			}

	; CHECK-LABEL: fmax_ftz_xorsign_abs_f16x2			; CHECK-LABEL: fmax_ftz_xorsign_abs_f16x2
	define <2 x half> @fmax_ftz_xorsign_abs_f16x2(<2 x half> %0, <2 x half> %1) {			define <2 x half> @fmax_ftz_xorsign_abs_f16x2(<2 x half> %0, <2 x half> %1) {
				; CHECK-NOT: call
	; CHECK: max.ftz.xorsign.abs.f16x2			; CHECK: max.ftz.xorsign.abs.f16x2
	%res = call <2 x half> @llvm.nvvm.fmax.ftz.xorsign.abs.f16x2(<2 x half> %0, <2 x half> %1)			%res = call <2 x half> @llvm.nvvm.fmax.ftz.xorsign.abs.f16x2(<2 x half> %0, <2 x half> %1)
	ret <2 x half> %res			ret <2 x half> %res
	}			}

	; CHECK-LABEL: fmax_nan_xorsign_abs_f16x2			; CHECK-LABEL: fmax_nan_xorsign_abs_f16x2
	define <2 x half> @fmax_nan_xorsign_abs_f16x2(<2 x half> %0, <2 x half> %1) {			define <2 x half> @fmax_nan_xorsign_abs_f16x2(<2 x half> %0, <2 x half> %1) {
				; CHECK-NOT: call
	; CHECK: max.NaN.xorsign.abs.f16x2			; CHECK: max.NaN.xorsign.abs.f16x2
	%res = call <2 x half> @llvm.nvvm.fmax.nan.xorsign.abs.f16x2(<2 x half> %0, <2 x half> %1)			%res = call <2 x half> @llvm.nvvm.fmax.nan.xorsign.abs.f16x2(<2 x half> %0, <2 x half> %1)
	ret <2 x half> %res			ret <2 x half> %res
	}			}

	; CHECK-LABEL: fmax_ftz_nan_xorsign_abs_f16x2			; CHECK-LABEL: fmax_ftz_nan_xorsign_abs_f16x2
	define <2 x half> @fmax_ftz_nan_xorsign_abs_f16x2(<2 x half> %0, <2 x half> %1) {			define <2 x half> @fmax_ftz_nan_xorsign_abs_f16x2(<2 x half> %0, <2 x half> %1) {
				; CHECK-NOT: call
	; CHECK: max.ftz.NaN.xorsign.abs.f16x2			; CHECK: max.ftz.NaN.xorsign.abs.f16x2
	%res = call <2 x half> @llvm.nvvm.fmax.ftz.nan.xorsign.abs.f16x2(<2 x half> %0, <2 x half> %1)			%res = call <2 x half> @llvm.nvvm.fmax.ftz.nan.xorsign.abs.f16x2(<2 x half> %0, <2 x half> %1)
	ret <2 x half> %res			ret <2 x half> %res
	}			}

	; CHECK-LABEL: fmax_xorsign_abs_bf16			; CHECK-LABEL: fmax_xorsign_abs_bf16
	define i16 @fmax_xorsign_abs_bf16(i16 %0, i16 %1) {			define i16 @fmax_xorsign_abs_bf16(i16 %0, i16 %1) {
				; CHECK-NOT: call
	; CHECK: max.xorsign.abs.bf16			; CHECK: max.xorsign.abs.bf16
	%res = call i16 @llvm.nvvm.fmax.xorsign.abs.bf16(i16 %0, i16 %1)			%res = call i16 @llvm.nvvm.fmax.xorsign.abs.bf16(i16 %0, i16 %1)
	ret i16 %res			ret i16 %res
	}			}

	; CHECK-LABEL: fmax_nan_xorsign_abs_bf16			; CHECK-LABEL: fmax_nan_xorsign_abs_bf16
	define i16 @fmax_nan_xorsign_abs_bf16(i16 %0, i16 %1) {			define i16 @fmax_nan_xorsign_abs_bf16(i16 %0, i16 %1) {
				; CHECK-NOT: call
	; CHECK: max.NaN.xorsign.abs.bf16			; CHECK: max.NaN.xorsign.abs.bf16
	%res = call i16 @llvm.nvvm.fmax.nan.xorsign.abs.bf16(i16 %0, i16 %1)			%res = call i16 @llvm.nvvm.fmax.nan.xorsign.abs.bf16(i16 %0, i16 %1)
	ret i16 %res			ret i16 %res
	}			}

	; CHECK-LABEL: fmax_xorsign_abs_bf16x2			; CHECK-LABEL: fmax_xorsign_abs_bf16x2
	define i32 @fmax_xorsign_abs_bf16x2(i32 %0, i32 %1) {			define i32 @fmax_xorsign_abs_bf16x2(i32 %0, i32 %1) {
				; CHECK-NOT: call
	; CHECK: max.xorsign.abs.bf16x2			; CHECK: max.xorsign.abs.bf16x2
	%res = call i32 @llvm.nvvm.fmax.xorsign.abs.bf16x2(i32 %0, i32 %1)			%res = call i32 @llvm.nvvm.fmax.xorsign.abs.bf16x2(i32 %0, i32 %1)
	ret i32 %res			ret i32 %res
	}			}

	; CHECK-LABEL: fmax_nan_xorsign_abs_bf16x2			; CHECK-LABEL: fmax_nan_xorsign_abs_bf16x2
	define i32 @fmax_nan_xorsign_abs_bf16x2(i32 %0, i32 %1) {			define i32 @fmax_nan_xorsign_abs_bf16x2(i32 %0, i32 %1) {
				; CHECK-NOT: call
	; CHECK: max.NaN.xorsign.abs.bf16x2			; CHECK: max.NaN.xorsign.abs.bf16x2
	%res = call i32 @llvm.nvvm.fmax.nan.xorsign.abs.bf16x2(i32 %0, i32 %1)			%res = call i32 @llvm.nvvm.fmax.nan.xorsign.abs.bf16x2(i32 %0, i32 %1)
	ret i32 %res			ret i32 %res
	}			}

	; CHECK-LABEL: fmax_xorsign_abs_f			; CHECK-LABEL: fmax_xorsign_abs_f
	define float @fmax_xorsign_abs_f(float %0, float %1) {			define float @fmax_xorsign_abs_f(float %0, float %1) {
				; CHECK-NOT: call
	; CHECK: max.xorsign.abs.f			; CHECK: max.xorsign.abs.f
	%res = call float @llvm.nvvm.fmax.xorsign.abs.f(float %0, float %1)			%res = call float @llvm.nvvm.fmax.xorsign.abs.f(float %0, float %1)
	ret float %res			ret float %res
	}			}

	; CHECK-LABEL: fmax_ftz_xorsign_abs_f			; CHECK-LABEL: fmax_ftz_xorsign_abs_f
	define float @fmax_ftz_xorsign_abs_f(float %0, float %1) {			define float @fmax_ftz_xorsign_abs_f(float %0, float %1) {
				; CHECK-NOT: call
	; CHECK: max.ftz.xorsign.abs.f			; CHECK: max.ftz.xorsign.abs.f
	%res = call float @llvm.nvvm.fmax.ftz.xorsign.abs.f(float %0, float %1)			%res = call float @llvm.nvvm.fmax.ftz.xorsign.abs.f(float %0, float %1)
	ret float %res			ret float %res
	}			}

	; CHECK-LABEL: fmax_nan_xorsign_abs_f			; CHECK-LABEL: fmax_nan_xorsign_abs_f
	define float @fmax_nan_xorsign_abs_f(float %0, float %1) {			define float @fmax_nan_xorsign_abs_f(float %0, float %1) {
				; CHECK-NOT: call
	; CHECK: max.NaN.xorsign.abs.f			; CHECK: max.NaN.xorsign.abs.f
	%res = call float @llvm.nvvm.fmax.nan.xorsign.abs.f(float %0, float %1)			%res = call float @llvm.nvvm.fmax.nan.xorsign.abs.f(float %0, float %1)
	ret float %res			ret float %res
	}			}

	; CHECK-LABEL: fmax_ftz_nan_xorsign_abs_f			; CHECK-LABEL: fmax_ftz_nan_xorsign_abs_f
	define float @fmax_ftz_nan_xorsign_abs_f(float %0, float %1) {			define float @fmax_ftz_nan_xorsign_abs_f(float %0, float %1) {
				; CHECK-NOT: call
	; CHECK: max.ftz.NaN.xorsign.abs.f			; CHECK: max.ftz.NaN.xorsign.abs.f
	%res = call float @llvm.nvvm.fmax.ftz.nan.xorsign.abs.f(float %0, float %1)			%res = call float @llvm.nvvm.fmax.ftz.nan.xorsign.abs.f(float %0, float %1)
	ret float %res			ret float %res
	}			}

This is an archive of the discontinued LLVM Phabricator instance.

[NVPTX] Add more FMA intriniscs/builtins
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 410931

llvm/include/llvm/IR/IntrinsicsNVVM.td

llvm/lib/Target/NVPTX/NVPTXInstrInfo.td

llvm/lib/Target/NVPTX/NVPTXIntrinsics.td

llvm/lib/Target/NVPTX/NVPTXTargetTransformInfo.cpp

llvm/test/CodeGen/NVPTX/math-intrins-sm53-ptx42.ll

llvm/test/CodeGen/NVPTX/math-intrins-sm80-ptx70-instcombine.ll

llvm/test/CodeGen/NVPTX/math-intrins-sm80-ptx70.ll

llvm/test/CodeGen/NVPTX/math-intrins-sm86-ptx72.ll

This is an archive of the discontinued LLVM Phabricator instance.

[NVPTX] Add more FMA intriniscs/builtinsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 410931

llvm/include/llvm/IR/IntrinsicsNVVM.td

llvm/lib/Target/NVPTX/NVPTXInstrInfo.td

llvm/lib/Target/NVPTX/NVPTXIntrinsics.td

llvm/lib/Target/NVPTX/NVPTXTargetTransformInfo.cpp

llvm/test/CodeGen/NVPTX/math-intrins-sm53-ptx42.ll

llvm/test/CodeGen/NVPTX/math-intrins-sm80-ptx70-instcombine.ll

llvm/test/CodeGen/NVPTX/math-intrins-sm80-ptx70.ll

llvm/test/CodeGen/NVPTX/math-intrins-sm86-ptx72.ll

[NVPTX] Add more FMA intriniscs/builtins
ClosedPublic