This is an archive of the discontinued LLVM Phabricator instance.

This is a surprise. PTX ISA does not mention that .ftz is not applicable to cvt.*.f16.* instructions.
Is it only cvt that does not support .ftz or does it impact other instructions? PTX spec has add/sub/mul/fma/set/setp instructions that support f16 and have .ftz variant.

In D51042#1207769, @tra wrote:

This is a surprise. PTX ISA does not mention that .ftz is not applicable to cvt.*.f16.* instructions.
Is it only cvt that does not support .ftz or does it impact other instructions? PTX spec has add/sub/mul/fma/set/setp instructions that support f16 and have .ftz variant.

It's only cvt with an explicit rounding mode. I actually ran the output of f16-instructions.ll with FTZ through ptxas and removed instructions until it compiled it. This might even be a bug in ptxas.

In D51042#1207920, @bkramer wrote:

In D51042#1207769, @tra wrote:

This is a surprise. PTX ISA does not mention that .ftz is not applicable to cvt.*.f16.* instructions.
Is it only cvt that does not support .ftz or does it impact other instructions? PTX spec has add/sub/mul/fma/set/setp instructions that support f16 and have .ftz variant.

It's only cvt with an explicit rounding mode. I actually ran the output of f16-instructions.ll with FTZ through ptxas and removed instructions until it compiled it. This might even be a bug in ptxas.

It may be worth filing a bug with NVIDIA to either fix the problem or clarify the docs.

This revision is now accepted and ready to land.Aug 21 2018, 10:59 AM

Closed by commit rL340317: [NVPTX] Remove ftz variants of cvt with rounding mode (authored by d0k). · Explain WhyAug 21 2018, 11:45 AM

This revision was automatically updated to reflect the committed changes.

Revision Contents

Path

Size

llvm/

trunk/

lib/

Target/

NVPTX/

NVPTXInstrInfo.td

42 lines

test/

CodeGen/

NVPTX/

f16-instructions.ll

175 lines

Diff 161784

llvm/trunk/lib/Target/NVPTX/NVPTXInstrInfo.td

	Show First 20 Lines • Show All 2,619 Lines • ▼ Show 20 Lines
	def : Pat<(f64 (uint_to_fp Int64Regs:$a)),			def : Pat<(f64 (uint_to_fp Int64Regs:$a)),
	(CVT_f64_u64 Int64Regs:$a, CvtRN)>;			(CVT_f64_u64 Int64Regs:$a, CvtRN)>;


	// f16 -> sint			// f16 -> sint
	def : Pat<(i1 (fp_to_sint Float16Regs:$a)),			def : Pat<(i1 (fp_to_sint Float16Regs:$a)),
	(SETP_b16ri (BITCONVERT_16_F2I Float16Regs:$a), 0, CmpEQ)>;			(SETP_b16ri (BITCONVERT_16_F2I Float16Regs:$a), 0, CmpEQ)>;
	def : Pat<(i16 (fp_to_sint Float16Regs:$a)),			def : Pat<(i16 (fp_to_sint Float16Regs:$a)),
	(CVT_s16_f16 Float16Regs:$a, CvtRZI_FTZ)>, Requires<[doF32FTZ]>;
	def : Pat<(i16 (fp_to_sint Float16Regs:$a)),
	(CVT_s16_f16 Float16Regs:$a, CvtRZI)>;			(CVT_s16_f16 Float16Regs:$a, CvtRZI)>;
	def : Pat<(i32 (fp_to_sint Float16Regs:$a)),			def : Pat<(i32 (fp_to_sint Float16Regs:$a)),
	(CVT_s32_f16 Float16Regs:$a, CvtRZI_FTZ)>, Requires<[doF32FTZ]>;
	def : Pat<(i32 (fp_to_sint Float16Regs:$a)),
	(CVT_s32_f16 Float16Regs:$a, CvtRZI)>;			(CVT_s32_f16 Float16Regs:$a, CvtRZI)>;
	def : Pat<(i64 (fp_to_sint Float16Regs:$a)),			def : Pat<(i64 (fp_to_sint Float16Regs:$a)),
	(CVT_s64_f16 Float16Regs:$a, CvtRZI_FTZ)>, Requires<[doF32FTZ]>;
	def : Pat<(i64 (fp_to_sint Float16Regs:$a)),
	(CVT_s64_f16 Float16Regs:$a, CvtRZI)>;			(CVT_s64_f16 Float16Regs:$a, CvtRZI)>;

	// f16 -> uint			// f16 -> uint
	def : Pat<(i1 (fp_to_uint Float16Regs:$a)),			def : Pat<(i1 (fp_to_uint Float16Regs:$a)),
	(SETP_b16ri (BITCONVERT_16_F2I Float16Regs:$a), 0, CmpEQ)>;			(SETP_b16ri (BITCONVERT_16_F2I Float16Regs:$a), 0, CmpEQ)>;
	def : Pat<(i16 (fp_to_uint Float16Regs:$a)),			def : Pat<(i16 (fp_to_uint Float16Regs:$a)),
	(CVT_u16_f16 Float16Regs:$a, CvtRZI_FTZ)>, Requires<[doF32FTZ]>;
	def : Pat<(i16 (fp_to_uint Float16Regs:$a)),
	(CVT_u16_f16 Float16Regs:$a, CvtRZI)>;			(CVT_u16_f16 Float16Regs:$a, CvtRZI)>;
	def : Pat<(i32 (fp_to_uint Float16Regs:$a)),			def : Pat<(i32 (fp_to_uint Float16Regs:$a)),
	(CVT_u32_f16 Float16Regs:$a, CvtRZI_FTZ)>, Requires<[doF32FTZ]>;
	def : Pat<(i32 (fp_to_uint Float16Regs:$a)),
	(CVT_u32_f16 Float16Regs:$a, CvtRZI)>;			(CVT_u32_f16 Float16Regs:$a, CvtRZI)>;
	def : Pat<(i64 (fp_to_uint Float16Regs:$a)),			def : Pat<(i64 (fp_to_uint Float16Regs:$a)),
	(CVT_u64_f16 Float16Regs:$a, CvtRZI_FTZ)>, Requires<[doF32FTZ]>;
	def : Pat<(i64 (fp_to_uint Float16Regs:$a)),
	(CVT_u64_f16 Float16Regs:$a, CvtRZI)>;			(CVT_u64_f16 Float16Regs:$a, CvtRZI)>;

	// f32 -> sint			// f32 -> sint
	def : Pat<(i1 (fp_to_sint Float32Regs:$a)),			def : Pat<(i1 (fp_to_sint Float32Regs:$a)),
	(SETP_b32ri (BITCONVERT_32_F2I Float32Regs:$a), 0, CmpEQ)>;			(SETP_b32ri (BITCONVERT_32_F2I Float32Regs:$a), 0, CmpEQ)>;
	def : Pat<(i16 (fp_to_sint Float32Regs:$a)),			def : Pat<(i16 (fp_to_sint Float32Regs:$a)),
	(CVT_s16_f32 Float32Regs:$a, CvtRZI_FTZ)>, Requires<[doF32FTZ]>;			(CVT_s16_f32 Float32Regs:$a, CvtRZI_FTZ)>, Requires<[doF32FTZ]>;
	def : Pat<(i16 (fp_to_sint Float32Regs:$a)),			def : Pat<(i16 (fp_to_sint Float32Regs:$a)),
	▲ Show 20 Lines • Show All 281 Lines • ▼ Show 20 Lines
	// If we know that we're storing into an i32, we can avoid the final trunc.			// If we know that we're storing into an i32, we can avoid the final trunc.
	def : Pat<(ctpop Int16Regs:$a),			def : Pat<(ctpop Int16Regs:$a),
	(CVT_u16_u32 (POPCr32 (CVT_u32_u16 Int16Regs:$a, CvtNONE)), CvtNONE)>;			(CVT_u16_u32 (POPCr32 (CVT_u32_u16 Int16Regs:$a, CvtNONE)), CvtNONE)>;
	def : Pat<(i32 (zext (ctpop Int16Regs:$a))),			def : Pat<(i32 (zext (ctpop Int16Regs:$a))),
	(POPCr32 (CVT_u32_u16 Int16Regs:$a, CvtNONE))>;			(POPCr32 (CVT_u32_u16 Int16Regs:$a, CvtNONE))>;

	// fpround f32 -> f16			// fpround f32 -> f16
	def : Pat<(f16 (fpround Float32Regs:$a)),			def : Pat<(f16 (fpround Float32Regs:$a)),
	(CVT_f16_f32 Float32Regs:$a, CvtRN_FTZ)>, Requires<[doF32FTZ]>;
	def : Pat<(f16 (fpround Float32Regs:$a)),
	(CVT_f16_f32 Float32Regs:$a, CvtRN)>;			(CVT_f16_f32 Float32Regs:$a, CvtRN)>;

	// fpround f64 -> f16			// fpround f64 -> f16
	def : Pat<(f16 (fpround Float64Regs:$a)),			def : Pat<(f16 (fpround Float64Regs:$a)),
	(CVT_f16_f64 Float64Regs:$a, CvtRN_FTZ)>, Requires<[doF32FTZ]>;
	def : Pat<(f16 (fpround Float64Regs:$a)),
	(CVT_f16_f64 Float64Regs:$a, CvtRN)>;			(CVT_f16_f64 Float64Regs:$a, CvtRN)>;

	// fpround f64 -> f32			// fpround f64 -> f32
	def : Pat<(f32 (fpround Float64Regs:$a)),			def : Pat<(f32 (fpround Float64Regs:$a)),
	(CVT_f32_f64 Float64Regs:$a, CvtRN_FTZ)>, Requires<[doF32FTZ]>;			(CVT_f32_f64 Float64Regs:$a, CvtRN_FTZ)>, Requires<[doF32FTZ]>;
	def : Pat<(f32 (fpround Float64Regs:$a)),			def : Pat<(f32 (fpround Float64Regs:$a)),
	(CVT_f32_f64 Float64Regs:$a, CvtRN)>;			(CVT_f32_f64 Float64Regs:$a, CvtRN)>;

	// fpextend f16 -> f32			// fpextend f16 -> f32
	def : Pat<(f32 (fpextend Float16Regs:$a)),			def : Pat<(f32 (fpextend Float16Regs:$a)),
	(CVT_f32_f16 Float16Regs:$a, CvtNONE_FTZ)>, Requires<[doF32FTZ]>;			(CVT_f32_f16 Float16Regs:$a, CvtNONE_FTZ)>, Requires<[doF32FTZ]>;
	def : Pat<(f32 (fpextend Float16Regs:$a)),			def : Pat<(f32 (fpextend Float16Regs:$a)),
	(CVT_f32_f16 Float16Regs:$a, CvtNONE)>;			(CVT_f32_f16 Float16Regs:$a, CvtNONE)>;

	// fpextend f16 -> f64			// fpextend f16 -> f64
	def : Pat<(f64 (fpextend Float16Regs:$a)),			def : Pat<(f64 (fpextend Float16Regs:$a)),
	(CVT_f64_f16 Float16Regs:$a, CvtNONE_FTZ)>, Requires<[doF32FTZ]>;
	def : Pat<(f64 (fpextend Float16Regs:$a)),
	(CVT_f64_f16 Float16Regs:$a, CvtNONE)>;			(CVT_f64_f16 Float16Regs:$a, CvtNONE)>;

	// fpextend f32 -> f64			// fpextend f32 -> f64
	def : Pat<(f64 (fpextend Float32Regs:$a)),			def : Pat<(f64 (fpextend Float32Regs:$a)),
	(CVT_f64_f32 Float32Regs:$a, CvtNONE_FTZ)>, Requires<[doF32FTZ]>;			(CVT_f64_f32 Float32Regs:$a, CvtNONE_FTZ)>, Requires<[doF32FTZ]>;
	def : Pat<(f64 (fpextend Float32Regs:$a)),			def : Pat<(f64 (fpextend Float32Regs:$a)),
	(CVT_f64_f32 Float32Regs:$a, CvtNONE)>;			(CVT_f64_f32 Float32Regs:$a, CvtNONE)>;

	def retflag : SDNode<"NVPTXISD::RET_FLAG", SDTNone,			def retflag : SDNode<"NVPTXISD::RET_FLAG", SDTNone,
	[SDNPHasChain, SDNPOptInGlue]>;			[SDNPHasChain, SDNPOptInGlue]>;

	// fceil, ffloor, fround, ftrunc.			// fceil, ffloor, fround, ftrunc.

	def : Pat<(fceil Float16Regs:$a),			def : Pat<(fceil Float16Regs:$a),
	(CVT_f16_f16 Float16Regs:$a, CvtRPI_FTZ)>, Requires<[doF32FTZ]>;			(CVT_f16_f16 Float16Regs:$a, CvtRPI)>;
	def : Pat<(fceil Float16Regs:$a),
	(CVT_f16_f16 Float16Regs:$a, CvtRPI)>, Requires<[doNoF32FTZ]>;
	def : Pat<(fceil Float32Regs:$a),			def : Pat<(fceil Float32Regs:$a),
	(CVT_f32_f32 Float32Regs:$a, CvtRPI_FTZ)>, Requires<[doF32FTZ]>;			(CVT_f32_f32 Float32Regs:$a, CvtRPI_FTZ)>, Requires<[doF32FTZ]>;
	def : Pat<(fceil Float32Regs:$a),			def : Pat<(fceil Float32Regs:$a),
	(CVT_f32_f32 Float32Regs:$a, CvtRPI)>, Requires<[doNoF32FTZ]>;			(CVT_f32_f32 Float32Regs:$a, CvtRPI)>, Requires<[doNoF32FTZ]>;
	def : Pat<(fceil Float64Regs:$a),			def : Pat<(fceil Float64Regs:$a),
	(CVT_f64_f64 Float64Regs:$a, CvtRPI)>;			(CVT_f64_f64 Float64Regs:$a, CvtRPI)>;

	def : Pat<(ffloor Float16Regs:$a),			def : Pat<(ffloor Float16Regs:$a),
	(CVT_f16_f16 Float16Regs:$a, CvtRMI_FTZ)>, Requires<[doF32FTZ]>;			(CVT_f16_f16 Float16Regs:$a, CvtRMI)>;
	def : Pat<(ffloor Float16Regs:$a),
	(CVT_f16_f16 Float16Regs:$a, CvtRMI)>, Requires<[doNoF32FTZ]>;
	def : Pat<(ffloor Float32Regs:$a),			def : Pat<(ffloor Float32Regs:$a),
	(CVT_f32_f32 Float32Regs:$a, CvtRMI_FTZ)>, Requires<[doF32FTZ]>;			(CVT_f32_f32 Float32Regs:$a, CvtRMI_FTZ)>, Requires<[doF32FTZ]>;
	def : Pat<(ffloor Float32Regs:$a),			def : Pat<(ffloor Float32Regs:$a),
	(CVT_f32_f32 Float32Regs:$a, CvtRMI)>, Requires<[doNoF32FTZ]>;			(CVT_f32_f32 Float32Regs:$a, CvtRMI)>, Requires<[doNoF32FTZ]>;
	def : Pat<(ffloor Float64Regs:$a),			def : Pat<(ffloor Float64Regs:$a),
	(CVT_f64_f64 Float64Regs:$a, CvtRMI)>;			(CVT_f64_f64 Float64Regs:$a, CvtRMI)>;

	def : Pat<(fround Float16Regs:$a),
	(CVT_f16_f16 Float16Regs:$a, CvtRNI_FTZ)>, Requires<[doF32FTZ]>;
	def : Pat<(f16 (fround Float16Regs:$a)),			def : Pat<(f16 (fround Float16Regs:$a)),
	(CVT_f16_f16 Float16Regs:$a, CvtRNI)>, Requires<[doNoF32FTZ]>;			(CVT_f16_f16 Float16Regs:$a, CvtRNI)>;
	def : Pat<(fround Float32Regs:$a),			def : Pat<(fround Float32Regs:$a),
	(CVT_f32_f32 Float32Regs:$a, CvtRNI_FTZ)>, Requires<[doF32FTZ]>;			(CVT_f32_f32 Float32Regs:$a, CvtRNI_FTZ)>, Requires<[doF32FTZ]>;
	def : Pat<(f32 (fround Float32Regs:$a)),			def : Pat<(f32 (fround Float32Regs:$a)),
	(CVT_f32_f32 Float32Regs:$a, CvtRNI)>, Requires<[doNoF32FTZ]>;			(CVT_f32_f32 Float32Regs:$a, CvtRNI)>, Requires<[doNoF32FTZ]>;
	def : Pat<(f64 (fround Float64Regs:$a)),			def : Pat<(f64 (fround Float64Regs:$a)),
	(CVT_f64_f64 Float64Regs:$a, CvtRNI)>;			(CVT_f64_f64 Float64Regs:$a, CvtRNI)>;

	def : Pat<(ftrunc Float16Regs:$a),			def : Pat<(ftrunc Float16Regs:$a),
	(CVT_f16_f16 Float16Regs:$a, CvtRZI_FTZ)>, Requires<[doF32FTZ]>;			(CVT_f16_f16 Float16Regs:$a, CvtRZI)>;
	def : Pat<(ftrunc Float16Regs:$a),
	(CVT_f16_f16 Float16Regs:$a, CvtRZI)>, Requires<[doNoF32FTZ]>;
	def : Pat<(ftrunc Float32Regs:$a),			def : Pat<(ftrunc Float32Regs:$a),
	(CVT_f32_f32 Float32Regs:$a, CvtRZI_FTZ)>, Requires<[doF32FTZ]>;			(CVT_f32_f32 Float32Regs:$a, CvtRZI_FTZ)>, Requires<[doF32FTZ]>;
	def : Pat<(ftrunc Float32Regs:$a),			def : Pat<(ftrunc Float32Regs:$a),
	(CVT_f32_f32 Float32Regs:$a, CvtRZI)>, Requires<[doNoF32FTZ]>;			(CVT_f32_f32 Float32Regs:$a, CvtRZI)>, Requires<[doNoF32FTZ]>;
	def : Pat<(ftrunc Float64Regs:$a),			def : Pat<(ftrunc Float64Regs:$a),
	(CVT_f64_f64 Float64Regs:$a, CvtRZI)>;			(CVT_f64_f64 Float64Regs:$a, CvtRZI)>;

	// nearbyint and rint are implemented as rounding to nearest even. This isn't			// nearbyint and rint are implemented as rounding to nearest even. This isn't
	// strictly correct, because it causes us to ignore the rounding mode. But it			// strictly correct, because it causes us to ignore the rounding mode. But it
	// matches what CUDA's "libm" does.			// matches what CUDA's "libm" does.

	def : Pat<(fnearbyint Float16Regs:$a),			def : Pat<(fnearbyint Float16Regs:$a),
	(CVT_f16_f16 Float16Regs:$a, CvtRNI_FTZ)>, Requires<[doF32FTZ]>;			(CVT_f16_f16 Float16Regs:$a, CvtRNI)>;
	def : Pat<(fnearbyint Float16Regs:$a),
	(CVT_f16_f16 Float16Regs:$a, CvtRNI)>, Requires<[doNoF32FTZ]>;
	def : Pat<(fnearbyint Float32Regs:$a),			def : Pat<(fnearbyint Float32Regs:$a),
	(CVT_f32_f32 Float32Regs:$a, CvtRNI_FTZ)>, Requires<[doF32FTZ]>;			(CVT_f32_f32 Float32Regs:$a, CvtRNI_FTZ)>, Requires<[doF32FTZ]>;
	def : Pat<(fnearbyint Float32Regs:$a),			def : Pat<(fnearbyint Float32Regs:$a),
	(CVT_f32_f32 Float32Regs:$a, CvtRNI)>, Requires<[doNoF32FTZ]>;			(CVT_f32_f32 Float32Regs:$a, CvtRNI)>, Requires<[doNoF32FTZ]>;
	def : Pat<(fnearbyint Float64Regs:$a),			def : Pat<(fnearbyint Float64Regs:$a),
	(CVT_f64_f64 Float64Regs:$a, CvtRNI)>;			(CVT_f64_f64 Float64Regs:$a, CvtRNI)>;

	def : Pat<(frint Float16Regs:$a),			def : Pat<(frint Float16Regs:$a),
	(CVT_f16_f16 Float16Regs:$a, CvtRNI_FTZ)>, Requires<[doF32FTZ]>;			(CVT_f16_f16 Float16Regs:$a, CvtRNI)>;
	def : Pat<(frint Float16Regs:$a),
	(CVT_f16_f16 Float16Regs:$a, CvtRNI)>, Requires<[doNoF32FTZ]>;
	def : Pat<(frint Float32Regs:$a),			def : Pat<(frint Float32Regs:$a),
	(CVT_f32_f32 Float32Regs:$a, CvtRNI_FTZ)>, Requires<[doF32FTZ]>;			(CVT_f32_f32 Float32Regs:$a, CvtRNI_FTZ)>, Requires<[doF32FTZ]>;
	def : Pat<(frint Float32Regs:$a),			def : Pat<(frint Float32Regs:$a),
	(CVT_f32_f32 Float32Regs:$a, CvtRNI)>, Requires<[doNoF32FTZ]>;			(CVT_f32_f32 Float32Regs:$a, CvtRNI)>, Requires<[doNoF32FTZ]>;
	def : Pat<(frint Float64Regs:$a),			def : Pat<(frint Float64Regs:$a),
	(CVT_f64_f64 Float64Regs:$a, CvtRNI)>;			(CVT_f64_f64 Float64Regs:$a, CvtRNI)>;


	▲ Show 20 Lines • Show All 95 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/NVPTX/f16-instructions.ll

; ## Full FP16 support enabled by default.		; ## Full FP16 support enabled by default.
; RUN: llc < %s -mtriple=nvptx64-nvidia-cuda -mcpu=sm_53 -asm-verbose=false \		; RUN: llc < %s -mtriple=nvptx64-nvidia-cuda -mcpu=sm_53 -asm-verbose=false \
; RUN: -O0 -disable-post-ra -disable-fp-elim -verify-machineinstrs \		; RUN: -O0 -disable-post-ra -disable-fp-elim -verify-machineinstrs \
; RUN: \| FileCheck -check-prefixes CHECK,CHECK-F16 %s		; RUN: \| FileCheck -check-prefixes CHECK,CHECK-NOFTZ,CHECK-F16,CHECK-F16-NOFTZ %s
		; ## Full FP16 with FTZ
		; RUN: llc < %s -mtriple=nvptx64-nvidia-cuda -mcpu=sm_53 -asm-verbose=false \
		; RUN: -O0 -disable-post-ra -disable-fp-elim -verify-machineinstrs \
		; RUN: -nvptx-f32ftz \
		; RUN: \| FileCheck -check-prefixes CHECK,CHECK-F16,CHECK-F16-FTZ %s
; ## FP16 support explicitly disabled.		; ## FP16 support explicitly disabled.
; RUN: llc < %s -mtriple=nvptx64-nvidia-cuda -mcpu=sm_53 -asm-verbose=false \		; RUN: llc < %s -mtriple=nvptx64-nvidia-cuda -mcpu=sm_53 -asm-verbose=false \
; RUN: -O0 -disable-post-ra -disable-fp-elim --nvptx-no-f16-math \		; RUN: -O0 -disable-post-ra -disable-fp-elim --nvptx-no-f16-math \
; RUN: -verify-machineinstrs \		; RUN: -verify-machineinstrs \
; RUN: \| FileCheck -check-prefixes CHECK,CHECK-NOF16 %s		; RUN: \| FileCheck -check-prefixes CHECK,CHECK-NOFTZ,CHECK-NOF16 %s
; ## FP16 is not supported by hardware.		; ## FP16 is not supported by hardware.
; RUN: llc < %s -O0 -mtriple=nvptx64-nvidia-cuda -mcpu=sm_52 -asm-verbose=false \		; RUN: llc < %s -O0 -mtriple=nvptx64-nvidia-cuda -mcpu=sm_52 -asm-verbose=false \
; RUN: -disable-post-ra -disable-fp-elim -verify-machineinstrs \		; RUN: -disable-post-ra -disable-fp-elim -verify-machineinstrs \
; RUN: \| FileCheck -check-prefixes CHECK,CHECK-NOF16 %s		; RUN: \| FileCheck -check-prefixes CHECK,CHECK-NOFTZ,CHECK-NOF16 %s

target datalayout = "e-m:o-i64:64-i128:128-n32:64-S128"		target datalayout = "e-m:o-i64:64-i128:128-n32:64-S128"

; CHECK-LABEL: test_ret_const(		; CHECK-LABEL: test_ret_const(
; CHECK: mov.b16 [[R:%h[0-9]+]], 0x3C00;		; CHECK: mov.b16 [[R:%h[0-9]+]], 0x3C00;
; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define half @test_ret_const() #0 {		define half @test_ret_const() #0 {
ret half 1.0		ret half 1.0
}		}

; CHECK-LABEL: test_fadd(		; CHECK-LABEL: test_fadd(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fadd_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fadd_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fadd_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fadd_param_1];
; CHECK-F16-NEXT: add.rn.f16 [[R:%h[0-9]+]], [[A]], [[B]];		; CHECK-F16-NOFTZ-NEXT: add.rn.f16 [[R:%h[0-9]+]], [[A]], [[B]];
		; CHECK-F16-FTZ-NEXT: add.rn.ftz.f16 [[R:%h[0-9]+]], [[A]], [[B]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[A32:%f[0-9]+]], [[A]]		; CHECK-NOF16-DAG: cvt.f32.f16 [[A32:%f[0-9]+]], [[A]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[B32:%f[0-9]+]], [[B]]		; CHECK-NOF16-DAG: cvt.f32.f16 [[B32:%f[0-9]+]], [[B]]
; CHECK-NOF16-NEXT: add.rn.f32 [[R32:%f[0-9]+]], [[A32]], [[B32]];		; CHECK-NOF16-NEXT: add.rn.f32 [[R32:%f[0-9]+]], [[A32]], [[B32]];
; CHECK-NOF16-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[R32]]		; CHECK-NOF16-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[R32]]
; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define half @test_fadd(half %a, half %b) #0 {		define half @test_fadd(half %a, half %b) #0 {
%r = fadd half %a, %b		%r = fadd half %a, %b
ret half %r		ret half %r
}		}

; CHECK-LABEL: test_fadd_v1f16(		; CHECK-LABEL: test_fadd_v1f16(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fadd_v1f16_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fadd_v1f16_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fadd_v1f16_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fadd_v1f16_param_1];
; CHECK-F16-NEXT: add.rn.f16 [[R:%h[0-9]+]], [[A]], [[B]];		; CHECK-F16-NOFTZ-NEXT: add.rn.f16 [[R:%h[0-9]+]], [[A]], [[B]];
		; CHECK-F16-FTZ-NEXT: add.rn.ftz.f16 [[R:%h[0-9]+]], [[A]], [[B]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[A32:%f[0-9]+]], [[A]]		; CHECK-NOF16-DAG: cvt.f32.f16 [[A32:%f[0-9]+]], [[A]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[B32:%f[0-9]+]], [[B]]		; CHECK-NOF16-DAG: cvt.f32.f16 [[B32:%f[0-9]+]], [[B]]
; CHECK-NOF16-NEXT: add.rn.f32 [[R32:%f[0-9]+]], [[A32]], [[B32]];		; CHECK-NOF16-NEXT: add.rn.f32 [[R32:%f[0-9]+]], [[A32]], [[B32]];
; CHECK-NOF16-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[R32]]		; CHECK-NOF16-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[R32]]
; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define <1 x half> @test_fadd_v1f16(<1 x half> %a, <1 x half> %b) #0 {		define <1 x half> @test_fadd_v1f16(<1 x half> %a, <1 x half> %b) #0 {
%r = fadd <1 x half> %a, %b		%r = fadd <1 x half> %a, %b
ret <1 x half> %r		ret <1 x half> %r
}		}

; Check that we can lower fadd with immediate arguments.		; Check that we can lower fadd with immediate arguments.
; CHECK-LABEL: test_fadd_imm_0(		; CHECK-LABEL: test_fadd_imm_0(
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fadd_imm_0_param_0];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fadd_imm_0_param_0];
; CHECK-F16-DAG: mov.b16 [[A:%h[0-9]+]], 0x3C00;		; CHECK-F16-NOFTZ-DAG: mov.b16 [[A:%h[0-9]+]], 0x3C00;
; CHECK-F16-NEXT: add.rn.f16 [[R:%h[0-9]+]], [[B]], [[A]];		; CHECK-F16-NOFTZ-NEXT: add.rn.f16 [[R:%h[0-9]+]], [[B]], [[A]];
		; CHECK-F16-FTZ-DAG: mov.b16 [[A:%h[0-9]+]], 0x3C00;
		; CHECK-F16-FTZ-NEXT: add.rn.ftz.f16 [[R:%h[0-9]+]], [[B]], [[A]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[B32:%f[0-9]+]], [[B]]		; CHECK-NOF16-DAG: cvt.f32.f16 [[B32:%f[0-9]+]], [[B]]
; CHECK-NOF16-NEXT: add.rn.f32 [[R32:%f[0-9]+]], [[B32]], 0f3F800000;		; CHECK-NOF16-NEXT: add.rn.f32 [[R32:%f[0-9]+]], [[B32]], 0f3F800000;
; CHECK-NOF16-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[R32]]		; CHECK-NOF16-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[R32]]
; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define half @test_fadd_imm_0(half %b) #0 {		define half @test_fadd_imm_0(half %b) #0 {
%r = fadd half 1.0, %b		%r = fadd half 1.0, %b
ret half %r		ret half %r
}		}

; CHECK-LABEL: test_fadd_imm_1(		; CHECK-LABEL: test_fadd_imm_1(
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fadd_imm_1_param_0];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fadd_imm_1_param_0];
; CHECK-F16-DAG: mov.b16 [[A:%h[0-9]+]], 0x3C00;		; CHECK-F16-NOFTZ-DAG: mov.b16 [[A:%h[0-9]+]], 0x3C00;
; CHECK-F16-NEXT: add.rn.f16 [[R:%h[0-9]+]], [[B]], [[A]];		; CHECK-F16-NOFTZ-NEXT: add.rn.f16 [[R:%h[0-9]+]], [[B]], [[A]];
		; CHECK-F16-FTZ-DAG: mov.b16 [[A:%h[0-9]+]], 0x3C00;
		; CHECK-F16-FTZ-NEXT: add.rn.ftz.f16 [[R:%h[0-9]+]], [[B]], [[A]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[B32:%f[0-9]+]], [[B]]		; CHECK-NOF16-DAG: cvt.f32.f16 [[B32:%f[0-9]+]], [[B]]
; CHECK-NOF16-NEXT: add.rn.f32 [[R32:%f[0-9]+]], [[B32]], 0f3F800000;		; CHECK-NOF16-NEXT: add.rn.f32 [[R32:%f[0-9]+]], [[B32]], 0f3F800000;
; CHECK-NOF16-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[R32]]		; CHECK-NOF16-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[R32]]
; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define half @test_fadd_imm_1(half %a) #0 {		define half @test_fadd_imm_1(half %a) #0 {
%r = fadd half %a, 1.0		%r = fadd half %a, 1.0
ret half %r		ret half %r
}		}

; CHECK-LABEL: test_fsub(		; CHECK-LABEL: test_fsub(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fsub_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fsub_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fsub_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fsub_param_1];
; CHECK-F16-NEXT: sub.rn.f16 [[R:%h[0-9]+]], [[A]], [[B]];		; CHECK-F16-NOFTZ-NEXT: sub.rn.f16 [[R:%h[0-9]+]], [[A]], [[B]];
		; CHECK-F16-FTZ-NEXT: sub.rn.ftz.f16 [[R:%h[0-9]+]], [[A]], [[B]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[A32:%f[0-9]+]], [[A]]		; CHECK-NOF16-DAG: cvt.f32.f16 [[A32:%f[0-9]+]], [[A]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[B32:%f[0-9]+]], [[B]]		; CHECK-NOF16-DAG: cvt.f32.f16 [[B32:%f[0-9]+]], [[B]]
; CHECK-NOF16-NEXT: sub.rn.f32 [[R32:%f[0-9]+]], [[A32]], [[B32]];		; CHECK-NOF16-NEXT: sub.rn.f32 [[R32:%f[0-9]+]], [[A32]], [[B32]];
; CHECK-NOF16-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[R32]]		; CHECK-NOF16-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[R32]]
; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define half @test_fsub(half %a, half %b) #0 {		define half @test_fsub(half %a, half %b) #0 {
%r = fsub half %a, %b		%r = fsub half %a, %b
ret half %r		ret half %r
}		}

; CHECK-LABEL: test_fneg(		; CHECK-LABEL: test_fneg(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fneg_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fneg_param_0];
; CHECK-F16-NEXT: mov.b16 [[Z:%h[0-9]+]], 0x0000		; CHECK-F16-NOFTZ-NEXT: mov.b16 [[Z:%h[0-9]+]], 0x0000
; CHECK-F16-NEXT: sub.rn.f16 [[R:%h[0-9]+]], [[Z]], [[A]];		; CHECK-F16-NOFTZ-NEXT: sub.rn.f16 [[R:%h[0-9]+]], [[Z]], [[A]];
		; CHECK-F16-FTZ-NEXT: mov.b16 [[Z:%h[0-9]+]], 0x0000
		; CHECK-F16-FTZ-NEXT: sub.rn.ftz.f16 [[R:%h[0-9]+]], [[Z]], [[A]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[A32:%f[0-9]+]], [[A]]		; CHECK-NOF16-DAG: cvt.f32.f16 [[A32:%f[0-9]+]], [[A]]
; CHECK-NOF16-DAG: mov.f32 [[Z:%f[0-9]+]], 0f00000000;		; CHECK-NOF16-DAG: mov.f32 [[Z:%f[0-9]+]], 0f00000000;
; CHECK-NOF16-NEXT: sub.rn.f32 [[R32:%f[0-9]+]], [[Z]], [[A32]];		; CHECK-NOF16-NEXT: sub.rn.f32 [[R32:%f[0-9]+]], [[Z]], [[A32]];
; CHECK-NOF16-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[R32]]		; CHECK-NOF16-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[R32]]
; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define half @test_fneg(half %a) #0 {		define half @test_fneg(half %a) #0 {
%r = fsub half 0.0, %a		%r = fsub half 0.0, %a
ret half %r		ret half %r
}		}

; CHECK-LABEL: test_fmul(		; CHECK-LABEL: test_fmul(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fmul_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fmul_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fmul_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fmul_param_1];
; CHECK-F16-NEXT: mul.rn.f16 [[R:%h[0-9]+]], [[A]], [[B]];		; CHECK-F16-NOFTZ-NEXT: mul.rn.f16 [[R:%h[0-9]+]], [[A]], [[B]];
		; CHECK-F16-FTZ-NEXT: mul.rn.ftz.f16 [[R:%h[0-9]+]], [[A]], [[B]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[A32:%f[0-9]+]], [[A]]		; CHECK-NOF16-DAG: cvt.f32.f16 [[A32:%f[0-9]+]], [[A]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[B32:%f[0-9]+]], [[B]]		; CHECK-NOF16-DAG: cvt.f32.f16 [[B32:%f[0-9]+]], [[B]]
; CHECK-NOF16-NEXT: mul.rn.f32 [[R32:%f[0-9]+]], [[A32]], [[B32]];		; CHECK-NOF16-NEXT: mul.rn.f32 [[R32:%f[0-9]+]], [[A32]], [[B32]];
; CHECK-NOF16-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[R32]]		; CHECK-NOF16-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[R32]]
; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define half @test_fmul(half %a, half %b) #0 {		define half @test_fmul(half %a, half %b) #0 {
%r = fmul half %a, %b		%r = fmul half %a, %b
ret half %r		ret half %r
}		}

; CHECK-LABEL: test_fdiv(		; CHECK-LABEL: test_fdiv(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fdiv_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fdiv_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fdiv_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fdiv_param_1];
; CHECK-DAG: cvt.f32.f16 [[F0:%f[0-9]+]], [[A]];		; CHECK-NOFTZ-DAG: cvt.f32.f16 [[F0:%f[0-9]+]], [[A]];
; CHECK-DAG: cvt.f32.f16 [[F1:%f[0-9]+]], [[B]];		; CHECK-NOFTZ-DAG: cvt.f32.f16 [[F1:%f[0-9]+]], [[B]];
; CHECK-NEXT: div.rn.f32 [[FR:%f[0-9]+]], [[F0]], [[F1]];		; CHECK-NOFTZ-NEXT: div.rn.f32 [[FR:%f[0-9]+]], [[F0]], [[F1]];
		; CHECK-F16-FTZ-DAG: cvt.ftz.f32.f16 [[F0:%f[0-9]+]], [[A]];
		; CHECK-F16-FTZ-DAG: cvt.ftz.f32.f16 [[F1:%f[0-9]+]], [[B]];
		; CHECK-F16-FTZ-NEXT: div.rn.ftz.f32 [[FR:%f[0-9]+]], [[F0]], [[F1]];
; CHECK-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[FR]];		; CHECK-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[FR]];
; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define half @test_fdiv(half %a, half %b) #0 {		define half @test_fdiv(half %a, half %b) #0 {
%r = fdiv half %a, %b		%r = fdiv half %a, %b
ret half %r		ret half %r
}		}

; CHECK-LABEL: test_frem(		; CHECK-LABEL: test_frem(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_frem_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_frem_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_frem_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_frem_param_1];
; CHECK-DAG: cvt.f32.f16 [[FA:%f[0-9]+]], [[A]];		; CHECK-NOFTZ-DAG: cvt.f32.f16 [[FA:%f[0-9]+]], [[A]];
; CHECK-DAG: cvt.f32.f16 [[FB:%f[0-9]+]], [[B]];		; CHECK-NOFTZ-DAG: cvt.f32.f16 [[FB:%f[0-9]+]], [[B]];
; CHECK-NEXT: div.rn.f32 [[D:%f[0-9]+]], [[FA]], [[FB]];		; CHECK-NOFTZ-NEXT: div.rn.f32 [[D:%f[0-9]+]], [[FA]], [[FB]];
; CHECK-NEXT: cvt.rmi.f32.f32 [[DI:%f[0-9]+]], [[D]];		; CHECK-NOFTZ-NEXT: cvt.rmi.f32.f32 [[DI:%f[0-9]+]], [[D]];
; CHECK-NEXT: mul.f32 [[RI:%f[0-9]+]], [[DI]], [[FB]];		; CHECK-NOFTZ-NEXT: mul.f32 [[RI:%f[0-9]+]], [[DI]], [[FB]];
; CHECK-NEXT: sub.f32 [[RF:%f[0-9]+]], [[FA]], [[RI]];		; CHECK-NOFTZ-NEXT: sub.f32 [[RF:%f[0-9]+]], [[FA]], [[RI]];
		; CHECK-F16-FTZ-DAG: cvt.ftz.f32.f16 [[FA:%f[0-9]+]], [[A]];
		; CHECK-F16-FTZ-DAG: cvt.ftz.f32.f16 [[FB:%f[0-9]+]], [[B]];
		; CHECK-F16-FTZ-NEXT: div.rn.ftz.f32 [[D:%f[0-9]+]], [[FA]], [[FB]];
		; CHECK-F16-FTZ-NEXT: cvt.rmi.ftz.f32.f32 [[DI:%f[0-9]+]], [[D]];
		; CHECK-F16-FTZ-NEXT: mul.ftz.f32 [[RI:%f[0-9]+]], [[DI]], [[FB]];
		; CHECK-F16-FTZ-NEXT: sub.ftz.f32 [[RF:%f[0-9]+]], [[FA]], [[RI]];
; CHECK-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[RF]];		; CHECK-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[RF]];
; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define half @test_frem(half %a, half %b) #0 {		define half @test_frem(half %a, half %b) #0 {
%r = frem half %a, %b		%r = frem half %a, %b
ret half %r		ret half %r
}		}

▲ Show 20 Lines • Show All 108 Lines • ▼ Show 20 Lines	define half @test_select(half %a, half %b, i1 zeroext %c) #0 {
ret half %r		ret half %r
}		}

; CHECK-LABEL: test_select_cc(		; CHECK-LABEL: test_select_cc(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_select_cc_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_select_cc_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_select_cc_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_select_cc_param_1];
; CHECK-DAG: ld.param.b16 [[C:%h[0-9]+]], [test_select_cc_param_2];		; CHECK-DAG: ld.param.b16 [[C:%h[0-9]+]], [test_select_cc_param_2];
; CHECK-DAG: ld.param.b16 [[D:%h[0-9]+]], [test_select_cc_param_3];		; CHECK-DAG: ld.param.b16 [[D:%h[0-9]+]], [test_select_cc_param_3];
; CHECK-F16: setp.neu.f16 [[PRED:%p[0-9]+]], [[C]], [[D]]		; CHECK-F16-NOFTZ: setp.neu.f16 [[PRED:%p[0-9]+]], [[C]], [[D]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[DF:%f[0-9]+]], [[D]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[DF:%f[0-9]+]], [[D]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[CF:%f[0-9]+]], [[C]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[CF:%f[0-9]+]], [[C]];
; CHECK-NOF16: setp.neu.f32 [[PRED:%p[0-9]+]], [[CF]], [[DF]]		; CHECK-NOF16: setp.neu.f32 [[PRED:%p[0-9]+]], [[CF]], [[DF]]
; CHECK: selp.b16 [[R:%h[0-9]+]], [[A]], [[B]], [[PRED]];		; CHECK: selp.b16 [[R:%h[0-9]+]], [[A]], [[B]], [[PRED]];
; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define half @test_select_cc(half %a, half %b, half %c, half %d) #0 {		define half @test_select_cc(half %a, half %b, half %c, half %d) #0 {
%cc = fcmp une half %c, %d		%cc = fcmp une half %c, %d
%r = select i1 %cc, half %a, half %b		%r = select i1 %cc, half %a, half %b
ret half %r		ret half %r
}		}

; CHECK-LABEL: test_select_cc_f32_f16(		; CHECK-LABEL: test_select_cc_f32_f16(
; CHECK-DAG: ld.param.f32 [[A:%f[0-9]+]], [test_select_cc_f32_f16_param_0];		; CHECK-DAG: ld.param.f32 [[A:%f[0-9]+]], [test_select_cc_f32_f16_param_0];
; CHECK-DAG: ld.param.f32 [[B:%f[0-9]+]], [test_select_cc_f32_f16_param_1];		; CHECK-DAG: ld.param.f32 [[B:%f[0-9]+]], [test_select_cc_f32_f16_param_1];
; CHECK-DAG: ld.param.b16 [[C:%h[0-9]+]], [test_select_cc_f32_f16_param_2];		; CHECK-DAG: ld.param.b16 [[C:%h[0-9]+]], [test_select_cc_f32_f16_param_2];
; CHECK-DAG: ld.param.b16 [[D:%h[0-9]+]], [test_select_cc_f32_f16_param_3];		; CHECK-DAG: ld.param.b16 [[D:%h[0-9]+]], [test_select_cc_f32_f16_param_3];
; CHECK-F16: setp.neu.f16 [[PRED:%p[0-9]+]], [[C]], [[D]]		; CHECK-F16-NOFTZ: setp.neu.f16 [[PRED:%p[0-9]+]], [[C]], [[D]]
		; CHECK-F16-FTZ: setp.neu.ftz.f16 [[PRED:%p[0-9]+]], [[C]], [[D]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[DF:%f[0-9]+]], [[D]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[DF:%f[0-9]+]], [[D]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[CF:%f[0-9]+]], [[C]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[CF:%f[0-9]+]], [[C]];
; CHECK-NOF16: setp.neu.f32 [[PRED:%p[0-9]+]], [[CF]], [[DF]]		; CHECK-NOF16: setp.neu.f32 [[PRED:%p[0-9]+]], [[CF]], [[DF]]
; CHECK-NEXT: selp.f32 [[R:%f[0-9]+]], [[A]], [[B]], [[PRED]];		; CHECK-NEXT: selp.f32 [[R:%f[0-9]+]], [[A]], [[B]], [[PRED]];
; CHECK-NEXT: st.param.f32 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.f32 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define float @test_select_cc_f32_f16(float %a, float %b, half %c, half %d) #0 {		define float @test_select_cc_f32_f16(float %a, float %b, half %c, half %d) #0 {
%cc = fcmp une half %c, %d		%cc = fcmp une half %c, %d
%r = select i1 %cc, float %a, float %b		%r = select i1 %cc, float %a, float %b
ret float %r		ret float %r
}		}

; CHECK-LABEL: test_select_cc_f16_f32(		; CHECK-LABEL: test_select_cc_f16_f32(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_select_cc_f16_f32_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_select_cc_f16_f32_param_0];
; CHECK-DAG: ld.param.f32 [[C:%f[0-9]+]], [test_select_cc_f16_f32_param_2];		; CHECK-DAG: ld.param.f32 [[C:%f[0-9]+]], [test_select_cc_f16_f32_param_2];
; CHECK-DAG: ld.param.f32 [[D:%f[0-9]+]], [test_select_cc_f16_f32_param_3];		; CHECK-DAG: ld.param.f32 [[D:%f[0-9]+]], [test_select_cc_f16_f32_param_3];
; CHECK-DAG: setp.neu.f32 [[PRED:%p[0-9]+]], [[C]], [[D]]		; CHECK-NOFTZ-DAG: setp.neu.f32 [[PRED:%p[0-9]+]], [[C]], [[D]]
		; CHECK-F16-FTZ-DAG: setp.neu.ftz.f32 [[PRED:%p[0-9]+]], [[C]], [[D]]
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_select_cc_f16_f32_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_select_cc_f16_f32_param_1];
; CHECK-NEXT: selp.b16 [[R:%h[0-9]+]], [[A]], [[B]], [[PRED]];		; CHECK-NEXT: selp.b16 [[R:%h[0-9]+]], [[A]], [[B]], [[PRED]];
; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b16 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define half @test_select_cc_f16_f32(half %a, half %b, float %c, float %d) #0 {		define half @test_select_cc_f16_f32(half %a, half %b, float %c, float %d) #0 {
%cc = fcmp une float %c, %d		%cc = fcmp une float %c, %d
%r = select i1 %cc, half %a, half %b		%r = select i1 %cc, half %a, half %b
ret half %r		ret half %r
}		}

; CHECK-LABEL: test_fcmp_une(		; CHECK-LABEL: test_fcmp_une(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_une_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_une_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_une_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_une_param_1];
; CHECK-F16: setp.neu.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]		; CHECK-F16-NOFTZ: setp.neu.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
		; CHECK-F16-FTZ: setp.neu.ftz.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];
; CHECK-NOF16: setp.neu.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]		; CHECK-NOF16: setp.neu.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]
; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];		; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];
; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define i1 @test_fcmp_une(half %a, half %b) #0 {		define i1 @test_fcmp_une(half %a, half %b) #0 {
%r = fcmp une half %a, %b		%r = fcmp une half %a, %b
ret i1 %r		ret i1 %r
}		}

; CHECK-LABEL: test_fcmp_ueq(		; CHECK-LABEL: test_fcmp_ueq(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_ueq_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_ueq_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_ueq_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_ueq_param_1];
; CHECK-F16: setp.equ.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]		; CHECK-F16-NOFTZ: setp.equ.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
		; CHECK-F16-FTZ: setp.equ.ftz.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];
; CHECK-NOF16: setp.equ.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]		; CHECK-NOF16: setp.equ.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]
; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];		; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];
; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define i1 @test_fcmp_ueq(half %a, half %b) #0 {		define i1 @test_fcmp_ueq(half %a, half %b) #0 {
%r = fcmp ueq half %a, %b		%r = fcmp ueq half %a, %b
ret i1 %r		ret i1 %r
}		}

; CHECK-LABEL: test_fcmp_ugt(		; CHECK-LABEL: test_fcmp_ugt(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_ugt_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_ugt_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_ugt_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_ugt_param_1];
; CHECK-F16: setp.gtu.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]		; CHECK-F16-NOFTZ: setp.gtu.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
		; CHECK-F16-FTZ: setp.gtu.ftz.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];
; CHECK-NOF16: setp.gtu.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]		; CHECK-NOF16: setp.gtu.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]
; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];		; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];
; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define i1 @test_fcmp_ugt(half %a, half %b) #0 {		define i1 @test_fcmp_ugt(half %a, half %b) #0 {
%r = fcmp ugt half %a, %b		%r = fcmp ugt half %a, %b
ret i1 %r		ret i1 %r
}		}

; CHECK-LABEL: test_fcmp_uge(		; CHECK-LABEL: test_fcmp_uge(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_uge_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_uge_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_uge_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_uge_param_1];
; CHECK-F16: setp.geu.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]		; CHECK-F16-NOFTZ: setp.geu.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
		; CHECK-F16-FTZ: setp.geu.ftz.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];
; CHECK-NOF16: setp.geu.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]		; CHECK-NOF16: setp.geu.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]
; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];		; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];
; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define i1 @test_fcmp_uge(half %a, half %b) #0 {		define i1 @test_fcmp_uge(half %a, half %b) #0 {
%r = fcmp uge half %a, %b		%r = fcmp uge half %a, %b
ret i1 %r		ret i1 %r
}		}

; CHECK-LABEL: test_fcmp_ult(		; CHECK-LABEL: test_fcmp_ult(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_ult_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_ult_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_ult_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_ult_param_1];
; CHECK-F16: setp.ltu.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]		; CHECK-F16-NOFTZ: setp.ltu.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
		; CHECK-F16-FTZ: setp.ltu.ftz.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];
; CHECK-NOF16: setp.ltu.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]		; CHECK-NOF16: setp.ltu.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]
; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];		; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];
; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define i1 @test_fcmp_ult(half %a, half %b) #0 {		define i1 @test_fcmp_ult(half %a, half %b) #0 {
%r = fcmp ult half %a, %b		%r = fcmp ult half %a, %b
ret i1 %r		ret i1 %r
}		}

; CHECK-LABEL: test_fcmp_ule(		; CHECK-LABEL: test_fcmp_ule(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_ule_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_ule_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_ule_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_ule_param_1];
; CHECK-F16: setp.leu.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]		; CHECK-F16-NOFTZ: setp.leu.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
		; CHECK-F16-FTZ: setp.leu.ftz.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];
; CHECK-NOF16: setp.leu.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]		; CHECK-NOF16: setp.leu.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]
; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];		; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];
; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define i1 @test_fcmp_ule(half %a, half %b) #0 {		define i1 @test_fcmp_ule(half %a, half %b) #0 {
%r = fcmp ule half %a, %b		%r = fcmp ule half %a, %b
ret i1 %r		ret i1 %r
}		}


; CHECK-LABEL: test_fcmp_uno(		; CHECK-LABEL: test_fcmp_uno(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_uno_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_uno_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_uno_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_uno_param_1];
; CHECK-F16: setp.nan.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]		; CHECK-F16-NOFTZ: setp.nan.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
		; CHECK-F16-FTZ: setp.nan.ftz.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];
; CHECK-NOF16: setp.nan.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]		; CHECK-NOF16: setp.nan.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]
; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];		; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];
; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define i1 @test_fcmp_uno(half %a, half %b) #0 {		define i1 @test_fcmp_uno(half %a, half %b) #0 {
%r = fcmp uno half %a, %b		%r = fcmp uno half %a, %b
ret i1 %r		ret i1 %r
}		}

; CHECK-LABEL: test_fcmp_one(		; CHECK-LABEL: test_fcmp_one(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_one_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_one_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_one_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_one_param_1];
; CHECK-F16: setp.ne.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]		; CHECK-F16-NOFTZ: setp.ne.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
		; CHECK-F16-FTZ: setp.ne.ftz.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];
; CHECK-NOF16: setp.ne.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]		; CHECK-NOF16: setp.ne.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]
; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];		; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];
; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define i1 @test_fcmp_one(half %a, half %b) #0 {		define i1 @test_fcmp_one(half %a, half %b) #0 {
%r = fcmp one half %a, %b		%r = fcmp one half %a, %b
ret i1 %r		ret i1 %r
}		}

; CHECK-LABEL: test_fcmp_oeq(		; CHECK-LABEL: test_fcmp_oeq(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_oeq_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_oeq_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_oeq_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_oeq_param_1];
; CHECK-F16: setp.eq.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]		; CHECK-F16-NOFTZ: setp.eq.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
		; CHECK-F16-FTZ: setp.eq.ftz.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];
; CHECK-NOF16: setp.eq.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]		; CHECK-NOF16: setp.eq.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]
; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];		; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];
; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define i1 @test_fcmp_oeq(half %a, half %b) #0 {		define i1 @test_fcmp_oeq(half %a, half %b) #0 {
%r = fcmp oeq half %a, %b		%r = fcmp oeq half %a, %b
ret i1 %r		ret i1 %r
}		}

; CHECK-LABEL: test_fcmp_ogt(		; CHECK-LABEL: test_fcmp_ogt(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_ogt_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_ogt_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_ogt_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_ogt_param_1];
; CHECK-F16: setp.gt.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]		; CHECK-F16-NOFTZ: setp.gt.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
		; CHECK-F16-FTZ: setp.gt.ftz.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];
; CHECK-NOF16: setp.gt.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]		; CHECK-NOF16: setp.gt.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]
; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];		; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];
; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define i1 @test_fcmp_ogt(half %a, half %b) #0 {		define i1 @test_fcmp_ogt(half %a, half %b) #0 {
%r = fcmp ogt half %a, %b		%r = fcmp ogt half %a, %b
ret i1 %r		ret i1 %r
}		}

; CHECK-LABEL: test_fcmp_oge(		; CHECK-LABEL: test_fcmp_oge(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_oge_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_oge_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_oge_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_oge_param_1];
; CHECK-F16: setp.ge.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]		; CHECK-F16-NOFTZ: setp.ge.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
		; CHECK-F16-FTZ: setp.ge.ftz.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];
; CHECK-NOF16: setp.ge.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]		; CHECK-NOF16: setp.ge.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]
; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];		; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];
; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define i1 @test_fcmp_oge(half %a, half %b) #0 {		define i1 @test_fcmp_oge(half %a, half %b) #0 {
%r = fcmp oge half %a, %b		%r = fcmp oge half %a, %b
ret i1 %r		ret i1 %r
}		}

; XCHECK-LABEL: test_fcmp_olt(		; XCHECK-LABEL: test_fcmp_olt(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_olt_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_olt_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_olt_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_olt_param_1];
; CHECK-F16: setp.lt.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]		; CHECK-F16-NOFTZ: setp.lt.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
		; CHECK-F16-FTZ: setp.lt.ftz.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];
; CHECK-NOF16: setp.lt.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]		; CHECK-NOF16: setp.lt.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]
; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];		; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];
; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define i1 @test_fcmp_olt(half %a, half %b) #0 {		define i1 @test_fcmp_olt(half %a, half %b) #0 {
%r = fcmp olt half %a, %b		%r = fcmp olt half %a, %b
ret i1 %r		ret i1 %r
}		}

; XCHECK-LABEL: test_fcmp_ole(		; XCHECK-LABEL: test_fcmp_ole(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_ole_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_ole_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_ole_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_ole_param_1];
; CHECK-F16: setp.le.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]		; CHECK-F16-NOFTZ: setp.le.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
		; CHECK-F16-FTZ: setp.le.ftz.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];
; CHECK-NOF16: setp.le.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]		; CHECK-NOF16: setp.le.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]
; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];		; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];
; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define i1 @test_fcmp_ole(half %a, half %b) #0 {		define i1 @test_fcmp_ole(half %a, half %b) #0 {
%r = fcmp ole half %a, %b		%r = fcmp ole half %a, %b
ret i1 %r		ret i1 %r
}		}

; CHECK-LABEL: test_fcmp_ord(		; CHECK-LABEL: test_fcmp_ord(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_ord_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fcmp_ord_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_ord_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fcmp_ord_param_1];
; CHECK-F16: setp.num.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]		; CHECK-F16-NOFTZ: setp.num.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
		; CHECK-F16-FTZ: setp.num.ftz.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];
; CHECK-NOF16: setp.num.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]		; CHECK-NOF16: setp.num.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]
; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];		; CHECK-NEXT: selp.u32 [[R:%r[0-9]+]], 1, 0, [[PRED]];
; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];		; CHECK-NEXT: st.param.b32 [func_retval0+0], [[R]];
; CHECK-NEXT: ret;		; CHECK-NEXT: ret;
define i1 @test_fcmp_ord(half %a, half %b) #0 {		define i1 @test_fcmp_ord(half %a, half %b) #0 {
%r = fcmp ord half %a, %b		%r = fcmp ord half %a, %b
ret i1 %r		ret i1 %r
}		}

; CHECK-LABEL: test_br_cc(		; CHECK-LABEL: test_br_cc(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_br_cc_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_br_cc_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_br_cc_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_br_cc_param_1];
; CHECK-DAG: ld.param.u64 %[[C:rd[0-9]+]], [test_br_cc_param_2];		; CHECK-DAG: ld.param.u64 %[[C:rd[0-9]+]], [test_br_cc_param_2];
; CHECK-DAG: ld.param.u64 %[[D:rd[0-9]+]], [test_br_cc_param_3];		; CHECK-DAG: ld.param.u64 %[[D:rd[0-9]+]], [test_br_cc_param_3];
; CHECK-F16: setp.lt.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]		; CHECK-F16-NOFTZ: setp.lt.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
		; CHECK-F16-FTZ: setp.lt.ftz.f16 [[PRED:%p[0-9]+]], [[A]], [[B]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];
; CHECK-NOF16: setp.lt.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]		; CHECK-NOF16: setp.lt.f32 [[PRED:%p[0-9]+]], [[AF]], [[BF]]
; CHECK-NEXT: @[[PRED]] bra [[LABEL:LBB.*]];		; CHECK-NEXT: @[[PRED]] bra [[LABEL:LBB.*]];
; CHECK: st.u32 [%[[C]]],		; CHECK: st.u32 [%[[C]]],
; CHECK: [[LABEL]]:		; CHECK: [[LABEL]]:
; CHECK: st.u32 [%[[D]]],		; CHECK: st.u32 [%[[D]]],
; CHECK: ret;		; CHECK: ret;
▲ Show 20 Lines • Show All 116 Lines • ▼ Show 20 Lines	define half @test_sitofp_i64(i64 %a) #0 {
%r = sitofp i64 %a to half		%r = sitofp i64 %a to half
ret half %r		ret half %r
}		}

; CHECK-LABEL: test_uitofp_i32_fadd(		; CHECK-LABEL: test_uitofp_i32_fadd(
; CHECK-DAG: ld.param.u32 [[A:%r[0-9]+]], [test_uitofp_i32_fadd_param_0];		; CHECK-DAG: ld.param.u32 [[A:%r[0-9]+]], [test_uitofp_i32_fadd_param_0];
; CHECK-DAG: cvt.rn.f16.u32 [[C:%h[0-9]+]], [[A]];		; CHECK-DAG: cvt.rn.f16.u32 [[C:%h[0-9]+]], [[A]];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_uitofp_i32_fadd_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_uitofp_i32_fadd_param_1];
; CHECK-F16: add.rn.f16 [[R:%h[0-9]+]], [[B]], [[C]];		; CHECK-F16-NOFTZ: add.rn.f16 [[R:%h[0-9]+]], [[B]], [[C]];
		; CHECK-F16-FTZ: add.rn.ftz.f16 [[R:%h[0-9]+]], [[B]], [[C]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[B32:%f[0-9]+]], [[B]]		; CHECK-NOF16-DAG: cvt.f32.f16 [[B32:%f[0-9]+]], [[B]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[C32:%f[0-9]+]], [[C]]		; CHECK-NOF16-DAG: cvt.f32.f16 [[C32:%f[0-9]+]], [[C]]
; CHECK-NOF16-NEXT: add.rn.f32 [[R32:%f[0-9]+]], [[B32]], [[C32]];		; CHECK-NOF16-NEXT: add.rn.f32 [[R32:%f[0-9]+]], [[B32]], [[C32]];
; CHECK-NOF16-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[R32]]		; CHECK-NOF16-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[R32]]
; CHECK: st.param.b16 [func_retval0+0], [[R]];		; CHECK: st.param.b16 [func_retval0+0], [[R]];
; CHECK: ret;		; CHECK: ret;
define half @test_uitofp_i32_fadd(i32 %a, half %b) #0 {		define half @test_uitofp_i32_fadd(i32 %a, half %b) #0 {
%c = uitofp i32 %a to half		%c = uitofp i32 %a to half
%r = fadd half %b, %c		%r = fadd half %b, %c
ret half %r		ret half %r
}		}

; CHECK-LABEL: test_sitofp_i32_fadd(		; CHECK-LABEL: test_sitofp_i32_fadd(
; CHECK-DAG: ld.param.u32 [[A:%r[0-9]+]], [test_sitofp_i32_fadd_param_0];		; CHECK-DAG: ld.param.u32 [[A:%r[0-9]+]], [test_sitofp_i32_fadd_param_0];
; CHECK-DAG: cvt.rn.f16.s32 [[C:%h[0-9]+]], [[A]];		; CHECK-DAG: cvt.rn.f16.s32 [[C:%h[0-9]+]], [[A]];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_sitofp_i32_fadd_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_sitofp_i32_fadd_param_1];
; CHECK-F16: add.rn.f16 [[R:%h[0-9]+]], [[B]], [[C]];		; CHECK-F16-NOFTZ: add.rn.f16 [[R:%h[0-9]+]], [[B]], [[C]];
		; CHECK-F16-FTZ: add.rn.ftz.f16 [[R:%h[0-9]+]], [[B]], [[C]];
; XCHECK-NOF16-DAG: cvt.f32.f16 [[B32:%f[0-9]+]], [[B]]		; XCHECK-NOF16-DAG: cvt.f32.f16 [[B32:%f[0-9]+]], [[B]]
; XCHECK-NOF16-DAG: cvt.f32.f16 [[C32:%f[0-9]+]], [[C]]		; XCHECK-NOF16-DAG: cvt.f32.f16 [[C32:%f[0-9]+]], [[C]]
; XCHECK-NOF16-NEXT: add.rn.f32 [[R32:%f[0-9]+]], [[B32]], [[C32]];		; XCHECK-NOF16-NEXT: add.rn.f32 [[R32:%f[0-9]+]], [[B32]], [[C32]];
; XCHECK-NOF16-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[R32]]		; XCHECK-NOF16-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[R32]]
; CHECK: st.param.b16 [func_retval0+0], [[R]];		; CHECK: st.param.b16 [func_retval0+0], [[R]];
; CHECK: ret;		; CHECK: ret;
define half @test_sitofp_i32_fadd(i32 %a, half %b) #0 {		define half @test_sitofp_i32_fadd(i32 %a, half %b) #0 {
%c = sitofp i32 %a to half		%c = sitofp i32 %a to half
Show All 18 Lines
; CHECK: ret;		; CHECK: ret;
define half @test_fptrunc_double(double %a) #0 {		define half @test_fptrunc_double(double %a) #0 {
%r = fptrunc double %a to half		%r = fptrunc double %a to half
ret half %r		ret half %r
}		}

; CHECK-LABEL: test_fpext_float(		; CHECK-LABEL: test_fpext_float(
; CHECK: ld.param.b16 [[A:%h[0-9]+]], [test_fpext_float_param_0];		; CHECK: ld.param.b16 [[A:%h[0-9]+]], [test_fpext_float_param_0];
; CHECK: cvt.f32.f16 [[R:%f[0-9]+]], [[A]];		; CHECK-NOFTZ: cvt.f32.f16 [[R:%f[0-9]+]], [[A]];
		; CHECK-F16-FTZ: cvt.ftz.f32.f16 [[R:%f[0-9]+]], [[A]];
; CHECK: st.param.f32 [func_retval0+0], [[R]];		; CHECK: st.param.f32 [func_retval0+0], [[R]];
; CHECK: ret;		; CHECK: ret;
define float @test_fpext_float(half %a) #0 {		define float @test_fpext_float(half %a) #0 {
%r = fpext half %a to float		%r = fpext half %a to float
ret float %r		ret float %r
}		}

; CHECK-LABEL: test_fpext_double(		; CHECK-LABEL: test_fpext_double(
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
declare half @llvm.trunc.f16(half %a) #0		declare half @llvm.trunc.f16(half %a) #0
declare half @llvm.rint.f16(half %a) #0		declare half @llvm.rint.f16(half %a) #0
declare half @llvm.nearbyint.f16(half %a) #0		declare half @llvm.nearbyint.f16(half %a) #0
declare half @llvm.round.f16(half %a) #0		declare half @llvm.round.f16(half %a) #0
declare half @llvm.fmuladd.f16(half %a, half %b, half %c) #0		declare half @llvm.fmuladd.f16(half %a, half %b, half %c) #0

; CHECK-LABEL: test_sqrt(		; CHECK-LABEL: test_sqrt(
; CHECK: ld.param.b16 [[A:%h[0-9]+]], [test_sqrt_param_0];		; CHECK: ld.param.b16 [[A:%h[0-9]+]], [test_sqrt_param_0];
; CHECK: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];		; CHECK-NOFTZ: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];
; CHECK: sqrt.rn.f32 [[RF:%f[0-9]+]], [[AF]];		; CHECK-NOFTZ: sqrt.rn.f32 [[RF:%f[0-9]+]], [[AF]];
		; CHECK-F16-FTZ: cvt.ftz.f32.f16 [[AF:%f[0-9]+]], [[A]];
		; CHECK-F16-FTZ: sqrt.rn.ftz.f32 [[RF:%f[0-9]+]], [[AF]];
; CHECK: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[RF]];		; CHECK: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[RF]];
; CHECK: st.param.b16 [func_retval0+0], [[R]];		; CHECK: st.param.b16 [func_retval0+0], [[R]];
; CHECK: ret;		; CHECK: ret;
define half @test_sqrt(half %a) #0 {		define half @test_sqrt(half %a) #0 {
%r = call half @llvm.sqrt.f16(half %a)		%r = call half @llvm.sqrt.f16(half %a)
ret half %r		ret half %r
}		}

;;; Can't do this yet: requires libcall.		;;; Can't do this yet: requires libcall.
; XCHECK-LABEL: test_powi(		; XCHECK-LABEL: test_powi(
;define half @test_powi(half %a, i32 %b) #0 {		;define half @test_powi(half %a, i32 %b) #0 {
; %r = call half @llvm.powi.f16(half %a, i32 %b)		; %r = call half @llvm.powi.f16(half %a, i32 %b)
; ret half %r		; ret half %r
;}		;}

; CHECK-LABEL: test_sin(		; CHECK-LABEL: test_sin(
; CHECK: ld.param.b16 [[A:%h[0-9]+]], [test_sin_param_0];		; CHECK: ld.param.b16 [[A:%h[0-9]+]], [test_sin_param_0];
; CHECK: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];		; CHECK-NOFTZ: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];
		; CHECK-F16-FTZ: cvt.ftz.f32.f16 [[AF:%f[0-9]+]], [[A]];
; CHECK: sin.approx.f32 [[RF:%f[0-9]+]], [[AF]];		; CHECK: sin.approx.f32 [[RF:%f[0-9]+]], [[AF]];
; CHECK: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[RF]];		; CHECK: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[RF]];
; CHECK: st.param.b16 [func_retval0+0], [[R]];		; CHECK: st.param.b16 [func_retval0+0], [[R]];
; CHECK: ret;		; CHECK: ret;
define half @test_sin(half %a) #0 #1 {		define half @test_sin(half %a) #0 #1 {
%r = call half @llvm.sin.f16(half %a)		%r = call half @llvm.sin.f16(half %a)
ret half %r		ret half %r
}		}

; CHECK-LABEL: test_cos(		; CHECK-LABEL: test_cos(
; CHECK: ld.param.b16 [[A:%h[0-9]+]], [test_cos_param_0];		; CHECK: ld.param.b16 [[A:%h[0-9]+]], [test_cos_param_0];
; CHECK: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];		; CHECK-NOFTZ: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];
		; CHECK-F16-FTZ: cvt.ftz.f32.f16 [[AF:%f[0-9]+]], [[A]];
; CHECK: cos.approx.f32 [[RF:%f[0-9]+]], [[AF]];		; CHECK: cos.approx.f32 [[RF:%f[0-9]+]], [[AF]];
; CHECK: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[RF]];		; CHECK: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[RF]];
; CHECK: st.param.b16 [func_retval0+0], [[R]];		; CHECK: st.param.b16 [func_retval0+0], [[R]];
; CHECK: ret;		; CHECK: ret;
define half @test_cos(half %a) #0 #1 {		define half @test_cos(half %a) #0 #1 {
%r = call half @llvm.cos.f16(half %a)		%r = call half @llvm.cos.f16(half %a)
ret half %r		ret half %r
}		}
Show All 39 Lines
; %r = call half @llvm.log2.f16(half %a)		; %r = call half @llvm.log2.f16(half %a)
; ret half %r		; ret half %r
;}		;}

; CHECK-LABEL: test_fma(		; CHECK-LABEL: test_fma(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fma_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fma_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fma_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fma_param_1];
; CHECK-DAG: ld.param.b16 [[C:%h[0-9]+]], [test_fma_param_2];		; CHECK-DAG: ld.param.b16 [[C:%h[0-9]+]], [test_fma_param_2];
; CHECK-F16: fma.rn.f16 [[R:%h[0-9]+]], [[A]], [[B]], [[C]];		; CHECK-F16-NOFTZ: fma.rn.f16 [[R:%h[0-9]+]], [[A]], [[B]], [[C]];
		; CHECK-F16-FTZ: fma.rn.ftz.f16 [[R:%h[0-9]+]], [[A]], [[B]], [[C]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[A32:%f[0-9]+]], [[A]]		; CHECK-NOF16-DAG: cvt.f32.f16 [[A32:%f[0-9]+]], [[A]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[B32:%f[0-9]+]], [[B]]		; CHECK-NOF16-DAG: cvt.f32.f16 [[B32:%f[0-9]+]], [[B]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[C32:%f[0-9]+]], [[C]]		; CHECK-NOF16-DAG: cvt.f32.f16 [[C32:%f[0-9]+]], [[C]]
; CHECK-NOF16-NEXT: fma.rn.f32 [[R32:%f[0-9]+]], [[A32]], [[B32]], [[C32]];		; CHECK-NOF16-NEXT: fma.rn.f32 [[R32:%f[0-9]+]], [[A32]], [[B32]], [[C32]];
; CHECK-NOF16-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[R32]]		; CHECK-NOF16-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[R32]]
; CHECK: st.param.b16 [func_retval0+0], [[R]];		; CHECK: st.param.b16 [func_retval0+0], [[R]];
; CHECK: ret		; CHECK: ret
define half @test_fma(half %a, half %b, half %c) #0 {		define half @test_fma(half %a, half %b, half %c) #0 {
%r = call half @llvm.fma.f16(half %a, half %b, half %c)		%r = call half @llvm.fma.f16(half %a, half %b, half %c)
ret half %r		ret half %r
}		}

; CHECK-LABEL: test_fabs(		; CHECK-LABEL: test_fabs(
; CHECK: ld.param.b16 [[A:%h[0-9]+]], [test_fabs_param_0];		; CHECK: ld.param.b16 [[A:%h[0-9]+]], [test_fabs_param_0];
; CHECK: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];		; CHECK-NOFTZ: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];
; CHECK: abs.f32 [[RF:%f[0-9]+]], [[AF]];		; CHECK-NOFTZ: abs.f32 [[RF:%f[0-9]+]], [[AF]];
		; CHECK-F16-FTZ: cvt.ftz.f32.f16 [[AF:%f[0-9]+]], [[A]];
		; CHECK-F16-FTZ: abs.ftz.f32 [[RF:%f[0-9]+]], [[AF]];
; CHECK: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[RF]];		; CHECK: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[RF]];
; CHECK: st.param.b16 [func_retval0+0], [[R]];		; CHECK: st.param.b16 [func_retval0+0], [[R]];
; CHECK: ret;		; CHECK: ret;
define half @test_fabs(half %a) #0 {		define half @test_fabs(half %a) #0 {
%r = call half @llvm.fabs.f16(half %a)		%r = call half @llvm.fabs.f16(half %a)
ret half %r		ret half %r
}		}

; CHECK-LABEL: test_minnum(		; CHECK-LABEL: test_minnum(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_minnum_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_minnum_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_minnum_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_minnum_param_1];
; CHECK-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];		; CHECK-NOFTZ-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];
; CHECK-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];		; CHECK-NOFTZ-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];
; CHECK: min.f32 [[RF:%f[0-9]+]], [[AF]], [[BF]];		; CHECK-NOFTZ: min.f32 [[RF:%f[0-9]+]], [[AF]], [[BF]];
		; CHECK-F16-FTZ-DAG: cvt.ftz.f32.f16 [[AF:%f[0-9]+]], [[A]];
		; CHECK-F16-FTZ-DAG: cvt.ftz.f32.f16 [[BF:%f[0-9]+]], [[B]];
		; CHECK-F16-FTZ: min.ftz.f32 [[RF:%f[0-9]+]], [[AF]], [[BF]];
; CHECK: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[RF]];		; CHECK: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[RF]];
; CHECK: st.param.b16 [func_retval0+0], [[R]];		; CHECK: st.param.b16 [func_retval0+0], [[R]];
; CHECK: ret;		; CHECK: ret;
define half @test_minnum(half %a, half %b) #0 {		define half @test_minnum(half %a, half %b) #0 {
%r = call half @llvm.minnum.f16(half %a, half %b)		%r = call half @llvm.minnum.f16(half %a, half %b)
ret half %r		ret half %r
}		}

; CHECK-LABEL: test_maxnum(		; CHECK-LABEL: test_maxnum(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_maxnum_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_maxnum_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_maxnum_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_maxnum_param_1];
; CHECK-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];		; CHECK-NOFTZ-DAG: cvt.f32.f16 [[AF:%f[0-9]+]], [[A]];
; CHECK-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];		; CHECK-NOFTZ-DAG: cvt.f32.f16 [[BF:%f[0-9]+]], [[B]];
; CHECK: max.f32 [[RF:%f[0-9]+]], [[AF]], [[BF]];		; CHECK-NOFTZ: max.f32 [[RF:%f[0-9]+]], [[AF]], [[BF]];
		; CHECK-F16-FTZ-DAG: cvt.ftz.f32.f16 [[AF:%f[0-9]+]], [[A]];
		; CHECK-F16-FTZ-DAG: cvt.ftz.f32.f16 [[BF:%f[0-9]+]], [[B]];
		; CHECK-F16-FTZ: max.ftz.f32 [[RF:%f[0-9]+]], [[AF]], [[BF]];
; CHECK: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[RF]];		; CHECK: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[RF]];
; CHECK: st.param.b16 [func_retval0+0], [[R]];		; CHECK: st.param.b16 [func_retval0+0], [[R]];
; CHECK: ret;		; CHECK: ret;
define half @test_maxnum(half %a, half %b) #0 {		define half @test_maxnum(half %a, half %b) #0 {
%r = call half @llvm.maxnum.f16(half %a, half %b)		%r = call half @llvm.maxnum.f16(half %a, half %b)
ret half %r		ret half %r
}		}

▲ Show 20 Lines • Show All 55 Lines • ▼ Show 20 Lines
; CHECK-DAG: ld.param.b16 [[AH:%h[0-9]+]], [test_copysign_extended_param_0];		; CHECK-DAG: ld.param.b16 [[AH:%h[0-9]+]], [test_copysign_extended_param_0];
; CHECK-DAG: ld.param.b16 [[BH:%h[0-9]+]], [test_copysign_extended_param_1];		; CHECK-DAG: ld.param.b16 [[BH:%h[0-9]+]], [test_copysign_extended_param_1];
; CHECK-DAG: mov.b16 [[AS:%rs[0-9]+]], [[AH]];		; CHECK-DAG: mov.b16 [[AS:%rs[0-9]+]], [[AH]];
; CHECK-DAG: mov.b16 [[BS:%rs[0-9]+]], [[BH]];		; CHECK-DAG: mov.b16 [[BS:%rs[0-9]+]], [[BH]];
; CHECK-DAG: and.b16 [[AX:%rs[0-9]+]], [[AS]], 32767;		; CHECK-DAG: and.b16 [[AX:%rs[0-9]+]], [[AS]], 32767;
; CHECK-DAG: and.b16 [[BX:%rs[0-9]+]], [[BS]], -32768;		; CHECK-DAG: and.b16 [[BX:%rs[0-9]+]], [[BS]], -32768;
; CHECK: or.b16 [[RX:%rs[0-9]+]], [[AX]], [[BX]];		; CHECK: or.b16 [[RX:%rs[0-9]+]], [[AX]], [[BX]];
; CHECK: mov.b16 [[R:%h[0-9]+]], [[RX]];		; CHECK: mov.b16 [[R:%h[0-9]+]], [[RX]];
; CHECK: cvt.f32.f16 [[XR:%f[0-9]+]], [[R]];		; CHECK-NOFTZ: cvt.f32.f16 [[XR:%f[0-9]+]], [[R]];
		; CHECK-F16-FTZ: cvt.ftz.f32.f16 [[XR:%f[0-9]+]], [[R]];
; CHECK: st.param.f32 [func_retval0+0], [[XR]];		; CHECK: st.param.f32 [func_retval0+0], [[XR]];
; CHECK: ret;		; CHECK: ret;
define float @test_copysign_extended(half %a, half %b) #0 {		define float @test_copysign_extended(half %a, half %b) #0 {
%r = call half @llvm.copysign.f16(half %a, half %b)		%r = call half @llvm.copysign.f16(half %a, half %b)
%xr = fpext half %r to float		%xr = fpext half %r to float
ret float %xr		ret float %xr
}		}

▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines	define half @test_round(half %a) #0 {
%r = call half @llvm.round.f16(half %a)		%r = call half @llvm.round.f16(half %a)
ret half %r		ret half %r
}		}

; CHECK-LABEL: test_fmuladd(		; CHECK-LABEL: test_fmuladd(
; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fmuladd_param_0];		; CHECK-DAG: ld.param.b16 [[A:%h[0-9]+]], [test_fmuladd_param_0];
; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fmuladd_param_1];		; CHECK-DAG: ld.param.b16 [[B:%h[0-9]+]], [test_fmuladd_param_1];
; CHECK-DAG: ld.param.b16 [[C:%h[0-9]+]], [test_fmuladd_param_2];		; CHECK-DAG: ld.param.b16 [[C:%h[0-9]+]], [test_fmuladd_param_2];
; CHECK-F16: fma.rn.f16 [[R:%h[0-9]+]], [[A]], [[B]], [[C]];		; CHECK-F16-NOFTZ: fma.rn.f16 [[R:%h[0-9]+]], [[A]], [[B]], [[C]];
		; CHECK-F16-FTZ: fma.rn.ftz.f16 [[R:%h[0-9]+]], [[A]], [[B]], [[C]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[A32:%f[0-9]+]], [[A]]		; CHECK-NOF16-DAG: cvt.f32.f16 [[A32:%f[0-9]+]], [[A]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[B32:%f[0-9]+]], [[B]]		; CHECK-NOF16-DAG: cvt.f32.f16 [[B32:%f[0-9]+]], [[B]]
; CHECK-NOF16-DAG: cvt.f32.f16 [[C32:%f[0-9]+]], [[C]]		; CHECK-NOF16-DAG: cvt.f32.f16 [[C32:%f[0-9]+]], [[C]]
; CHECK-NOF16-NEXT: fma.rn.f32 [[R32:%f[0-9]+]], [[A32]], [[B32]], [[C32]];		; CHECK-NOF16-NEXT: fma.rn.f32 [[R32:%f[0-9]+]], [[A32]], [[B32]], [[C32]];
; CHECK-NOF16-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[R32]]		; CHECK-NOF16-NEXT: cvt.rn.f16.f32 [[R:%h[0-9]+]], [[R32]]
; CHECK: st.param.b16 [func_retval0+0], [[R]];		; CHECK: st.param.b16 [func_retval0+0], [[R]];
; CHECK: ret;		; CHECK: ret;
define half @test_fmuladd(half %a, half %b, half %c) #0 {		define half @test_fmuladd(half %a, half %b, half %c) #0 {
%r = call half @llvm.fmuladd.f16(half %a, half %b, half %c)		%r = call half @llvm.fmuladd.f16(half %a, half %b, half %c)
ret half %r		ret half %r
}		}

attributes #0 = { nounwind }		attributes #0 = { nounwind }
attributes #1 = { "unsafe-fp-math" = "true" }		attributes #1 = { "unsafe-fp-math" = "true" }

This is an archive of the discontinued LLVM Phabricator instance.

[NVPTX] Remove ftz variants of cvt with rounding modeClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 161784

llvm/trunk/lib/Target/NVPTX/NVPTXInstrInfo.td

llvm/trunk/test/CodeGen/NVPTX/f16-instructions.ll

[NVPTX] Remove ftz variants of cvt with rounding mode
ClosedPublic