Diff 413025

llvm/lib/Target/AArch64/AArch64InstrFormats.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 1,172 Lines • ▼ Show 20 Lines	def fpimm16XForm : SDNodeXForm<fpimm, [{
}]>;		}]>;

def fpimm32XForm : SDNodeXForm<fpimm, [{		def fpimm32XForm : SDNodeXForm<fpimm, [{
APFloat InVal = N->getValueAPF();		APFloat InVal = N->getValueAPF();
uint32_t enc = AArch64_AM::getFP32Imm(InVal);		uint32_t enc = AArch64_AM::getFP32Imm(InVal);
return CurDAG->getTargetConstant(enc, SDLoc(N), MVT::i32);		return CurDAG->getTargetConstant(enc, SDLoc(N), MVT::i32);
}]>;		}]>;

		def fpimm32SIMDModImmType4XForm : SDNodeXForm<fpimm, [{
		uint32_t enc = AArch64_AM::encodeAdvSIMDModImmType4(N->getValueAPF()
		.bitcastToAPInt()
		.getZExtValue());
		return CurDAG->getTargetConstant(enc, SDLoc(N), MVT::i32);
		}]>;

def fpimm64XForm : SDNodeXForm<fpimm, [{		def fpimm64XForm : SDNodeXForm<fpimm, [{
APFloat InVal = N->getValueAPF();		APFloat InVal = N->getValueAPF();
uint32_t enc = AArch64_AM::getFP64Imm(InVal);		uint32_t enc = AArch64_AM::getFP64Imm(InVal);
return CurDAG->getTargetConstant(enc, SDLoc(N), MVT::i32);		return CurDAG->getTargetConstant(enc, SDLoc(N), MVT::i32);
}]>;		}]>;

def fpimm16 : Operand<f16>,		def fpimm16 : Operand<f16>,
FPImmLeaf<f16, [{		FPImmLeaf<f16, [{
return AArch64_AM::getFP16Imm(Imm) != -1;		return AArch64_AM::getFP16Imm(Imm) != -1;
}], fpimm16XForm> {		}], fpimm16XForm> {
let ParserMatchClass = FPImmOperand;		let ParserMatchClass = FPImmOperand;
let PrintMethod = "printFPImmOperand";		let PrintMethod = "printFPImmOperand";
}		}

def fpimm32 : Operand<f32>,		def fpimm32 : Operand<f32>,
FPImmLeaf<f32, [{		FPImmLeaf<f32, [{
return AArch64_AM::getFP32Imm(Imm) != -1;		return AArch64_AM::getFP32Imm(Imm) != -1;
}], fpimm32XForm> {		}], fpimm32XForm> {
let ParserMatchClass = FPImmOperand;		let ParserMatchClass = FPImmOperand;
let PrintMethod = "printFPImmOperand";		let PrintMethod = "printFPImmOperand";
}		}

		def fpimm32SIMDModImmType4 : FPImmLeaf<f32, [{
		dmgreenUnsubmitted Done Reply Inline Actions This likely doesn't need to be an Operand, it can just be a FPImmLeaf dmgreen: This likely doesn't need to be an Operand, it can just be a FPImmLeaf
		AllenAuthorUnsubmitted Done Reply Inline Actions Yes, verified ok! Allen: Yes, verified ok!
		dmgreenUnsubmitted Done Reply Inline Actions It's likely worth calling this out as a "AdvSIMDModImmType4" constant somehow. Maybe call it fpimm32SIMDModImmType4? Same for the XForm. dmgreen: It's likely worth calling this out as a "AdvSIMDModImmType4" constant somehow. Maybe call it…
		uint64_t Enc = Imm.bitcastToAPInt().getZExtValue();
		return Enc != 0 && AArch64_AM::isAdvSIMDModImmType4(Enc << 32 \| Enc);
		}], fpimm32SIMDModImmType4XForm> {
		}

def fpimm64 : Operand<f64>,		def fpimm64 : Operand<f64>,
FPImmLeaf<f64, [{		FPImmLeaf<f64, [{
return AArch64_AM::getFP64Imm(Imm) != -1;		return AArch64_AM::getFP64Imm(Imm) != -1;
}], fpimm64XForm> {		}], fpimm64XForm> {
let ParserMatchClass = FPImmOperand;		let ParserMatchClass = FPImmOperand;
let PrintMethod = "printFPImmOperand";		let PrintMethod = "printFPImmOperand";
}		}

▲ Show 20 Lines • Show All 10,296 Lines • Show Last 20 Lines

llvm/lib/Target/AArch64/AArch64InstrInfo.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 1,542 Lines • ▼ Show 20 Lines


	def : Pat<(f32 fpimm:$in),			def : Pat<(f32 fpimm:$in),
	(COPY_TO_REGCLASS (MOVi32imm (bitcast_fpimm_to_i32 f32:$in)), FPR32)>;			(COPY_TO_REGCLASS (MOVi32imm (bitcast_fpimm_to_i32 f32:$in)), FPR32)>;
	def : Pat<(f64 fpimm:$in),			def : Pat<(f64 fpimm:$in),
	(COPY_TO_REGCLASS (MOVi64imm (bitcast_fpimm_to_i64 f64:$in)), FPR64)>;			(COPY_TO_REGCLASS (MOVi64imm (bitcast_fpimm_to_i64 f64:$in)), FPR64)>;


	// Deal with the various forms of (ELF) large addressing with MOVZ/MOVK			// Deal with the various forms of (ELF) large addressing with MOVZ/MOVK
				AllenAuthorUnsubmitted Done Reply Inline Actions It's strange that here error with the following info, as it is ok on my local linux ? AArch64InstrInfo.td:1551:1: error: Type set is empty for each HW mode in 'MOVIv2s_ns' def MOVIv2s_ns : BaseSIMDModifiedImmVectorShift<1, 1, 0b10, V128, "movi", ".2s", Allen: It's strange that here error with the following info, as it is ok on my local linux ? >…
				dmgreenUnsubmitted Done Reply Inline Actions This doesn't need to define a new instruction, it can use the existing MOVI (which I believe is probably called MOVIv2i32?) dmgreen: This doesn't need to define a new instruction, it can use the existing MOVI (which I believe is…
				AllenAuthorUnsubmitted Done Reply Inline Actions Thanks, delete unneeded instruction MOVI2s_ns Allen: Thanks, delete unneeded instruction MOVI2s_ns
	// sequences.			// sequences.
	def : Pat<(AArch64WrapperLarge tglobaladdr:$g3, tglobaladdr:$g2,			def : Pat<(AArch64WrapperLarge tglobaladdr:$g3, tglobaladdr:$g2,
	tglobaladdr:$g1, tglobaladdr:$g0),			tglobaladdr:$g1, tglobaladdr:$g0),
	(MOVKXi (MOVKXi (MOVKXi (MOVZXi tglobaladdr:$g0, 0),			(MOVKXi (MOVKXi (MOVKXi (MOVZXi tglobaladdr:$g0, 0),
	tglobaladdr:$g1, 16),			tglobaladdr:$g1, 16),
	tglobaladdr:$g2, 32),			tglobaladdr:$g2, 32),
	tglobaladdr:$g3, 48)>;			tglobaladdr:$g3, 48)>;

	▲ Show 20 Lines • Show All 4,580 Lines • ▼ Show 20 Lines
	def : Pat<(v2i32 immAllOnesV), (EXTRACT_SUBREG (MOVIv2d_ns (i32 255)), dsub)>;			def : Pat<(v2i32 immAllOnesV), (EXTRACT_SUBREG (MOVIv2d_ns (i32 255)), dsub)>;
	def : Pat<(v4i16 immAllOnesV), (EXTRACT_SUBREG (MOVIv2d_ns (i32 255)), dsub)>;			def : Pat<(v4i16 immAllOnesV), (EXTRACT_SUBREG (MOVIv2d_ns (i32 255)), dsub)>;
	def : Pat<(v8i8 immAllOnesV), (EXTRACT_SUBREG (MOVIv2d_ns (i32 255)), dsub)>;			def : Pat<(v8i8 immAllOnesV), (EXTRACT_SUBREG (MOVIv2d_ns (i32 255)), dsub)>;

	// EDIT per word & halfword: 2s, 4h, 4s, & 8h			// EDIT per word & halfword: 2s, 4h, 4s, & 8h
	let isReMaterializable = 1, isAsCheapAsAMove = 1 in			let isReMaterializable = 1, isAsCheapAsAMove = 1 in
	defm MOVI : SIMDModifiedImmVectorShift<0, 0b10, 0b00, "movi">;			defm MOVI : SIMDModifiedImmVectorShift<0, 0b10, 0b00, "movi">;

				let Predicates = [HasNEON] in {
				// Using the MOVI to materialize fp constants.
				dmgreenUnsubmitted Done Reply Inline Actions It is quite uncommon to not have NEON, but can you add a predicate for it: let Predicates = [HasNEON] in { It might be worth adding a run line without neon (`-mattr=-neon`) for the new remat test case too, to show the difference. dmgreen: It is quite uncommon to not have NEON, but can you add a predicate for it: ``` let Predicates =…
				def : Pat<(f32 fpimm32SIMDModImmType4:$in),
				(EXTRACT_SUBREG (MOVIv2i32 (fpimm32SIMDModImmType4XForm f32:$in),
				(i32 24)),
				ssub)>;
				}

	def : InstAlias<"movi $Vd.4h, $imm", (MOVIv4i16 V64:$Vd, imm0_255:$imm, 0), 0>;			def : InstAlias<"movi $Vd.4h, $imm", (MOVIv4i16 V64:$Vd, imm0_255:$imm, 0), 0>;
	def : InstAlias<"movi $Vd.8h, $imm", (MOVIv8i16 V128:$Vd, imm0_255:$imm, 0), 0>;			def : InstAlias<"movi $Vd.8h, $imm", (MOVIv8i16 V128:$Vd, imm0_255:$imm, 0), 0>;
	def : InstAlias<"movi $Vd.2s, $imm", (MOVIv2i32 V64:$Vd, imm0_255:$imm, 0), 0>;			def : InstAlias<"movi $Vd.2s, $imm", (MOVIv2i32 V64:$Vd, imm0_255:$imm, 0), 0>;
	def : InstAlias<"movi $Vd.4s, $imm", (MOVIv4i32 V128:$Vd, imm0_255:$imm, 0), 0>;			def : InstAlias<"movi $Vd.4s, $imm", (MOVIv4i32 V128:$Vd, imm0_255:$imm, 0), 0>;

	def : InstAlias<"movi.4h $Vd, $imm", (MOVIv4i16 V64:$Vd, imm0_255:$imm, 0), 0>;			def : InstAlias<"movi.4h $Vd, $imm", (MOVIv4i16 V64:$Vd, imm0_255:$imm, 0), 0>;
	def : InstAlias<"movi.8h $Vd, $imm", (MOVIv8i16 V128:$Vd, imm0_255:$imm, 0), 0>;			def : InstAlias<"movi.8h $Vd, $imm", (MOVIv8i16 V128:$Vd, imm0_255:$imm, 0), 0>;
	def : InstAlias<"movi.2s $Vd, $imm", (MOVIv2i32 V64:$Vd, imm0_255:$imm, 0), 0>;			def : InstAlias<"movi.2s $Vd, $imm", (MOVIv2i32 V64:$Vd, imm0_255:$imm, 0), 0>;
	▲ Show 20 Lines • Show All 2,217 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/fabs.ll

Show All 16 Lines	; CHECK-NEXT: ret
ret double %cond		ret double %cond
}		}

; Try again with different type, predicate, and compare constant.		; Try again with different type, predicate, and compare constant.

define float @still_not_fabs(float %x) #0 {		define float @still_not_fabs(float %x) #0 {
; CHECK-LABEL: still_not_fabs:		; CHECK-LABEL: still_not_fabs:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: mov w8, #-2147483648		; CHECK-NEXT: movi v1.2s, #128, lsl #24
; CHECK-NEXT: fneg s2, s0		; CHECK-NEXT: fneg s2, s0
; CHECK-NEXT: fmov s1, w8
; CHECK-NEXT: fcmp s0, s1		; CHECK-NEXT: fcmp s0, s1
; CHECK-NEXT: fcsel s0, s0, s2, ge		; CHECK-NEXT: fcsel s0, s0, s2, ge
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%cmp = fcmp nnan oge float %x, -0.0		%cmp = fcmp nnan oge float %x, -0.0
%sub = fsub nnan float -0.0, %x		%sub = fsub nnan float -0.0, %x
%cond = select i1 %cmp, float %x, float %sub		%cond = select i1 %cmp, float %x, float %sub
ret float %cond		ret float %cond
}		}
▲ Show 20 Lines • Show All 51 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/fcvt-fixed.ll

Show First 20 Lines • Show All 81 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%fix = fmul double %dbl, 18446744073709551616.0		%fix = fmul double %dbl, 18446744073709551616.0
%cvt = fptosi double %fix to i64		%cvt = fptosi double %fix to i64
ret i64 %cvt		ret i64 %cvt
}		}

define i32 @fcvtzs_f16_i32_7(half %flt) {		define i32 @fcvtzs_f16_i32_7(half %flt) {
; CHECK-NO16-LABEL: fcvtzs_f16_i32_7:		; CHECK-NO16-LABEL: fcvtzs_f16_i32_7:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: mov w8, #1124073472		; CHECK-NO16-NEXT: movi v1.2s, #67, lsl #24
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fmov s1, w8
; CHECK-NO16-NEXT: fmul s0, s0, s1		; CHECK-NO16-NEXT: fmul s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fcvtzs w0, s0		; CHECK-NO16-NEXT: fcvtzs w0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: fcvtzs_f16_i32_7:		; CHECK-FP16-LABEL: fcvtzs_f16_i32_7:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: fcvtzs w0, h0, #7		; CHECK-FP16-NEXT: fcvtzs w0, h0, #7
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%fix = fmul half %flt, 128.0		%fix = fmul half %flt, 128.0
%cvt = fptosi half %fix to i32		%cvt = fptosi half %fix to i32
ret i32 %cvt		ret i32 %cvt
}		}

define i32 @fcvtzs_f16_i32_15(half %flt) {		define i32 @fcvtzs_f16_i32_15(half %flt) {
; CHECK-NO16-LABEL: fcvtzs_f16_i32_15:		; CHECK-NO16-LABEL: fcvtzs_f16_i32_15:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: mov w8, #1191182336		; CHECK-NO16-NEXT: movi v1.2s, #71, lsl #24
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fmov s1, w8
; CHECK-NO16-NEXT: fmul s0, s0, s1		; CHECK-NO16-NEXT: fmul s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fcvtzs w0, s0		; CHECK-NO16-NEXT: fcvtzs w0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: fcvtzs_f16_i32_15:		; CHECK-FP16-LABEL: fcvtzs_f16_i32_15:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: fcvtzs w0, h0, #15		; CHECK-FP16-NEXT: fcvtzs w0, h0, #15
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%fix = fmul half %flt, 32768.0		%fix = fmul half %flt, 32768.0
%cvt = fptosi half %fix to i32		%cvt = fptosi half %fix to i32
ret i32 %cvt		ret i32 %cvt
}		}

define i64 @fcvtzs_f16_i64_7(half %flt) {		define i64 @fcvtzs_f16_i64_7(half %flt) {
; CHECK-NO16-LABEL: fcvtzs_f16_i64_7:		; CHECK-NO16-LABEL: fcvtzs_f16_i64_7:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: mov w8, #1124073472		; CHECK-NO16-NEXT: movi v1.2s, #67, lsl #24
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fmov s1, w8
; CHECK-NO16-NEXT: fmul s0, s0, s1		; CHECK-NO16-NEXT: fmul s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fcvtzs x0, s0		; CHECK-NO16-NEXT: fcvtzs x0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: fcvtzs_f16_i64_7:		; CHECK-FP16-LABEL: fcvtzs_f16_i64_7:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: fcvtzs x0, h0, #7		; CHECK-FP16-NEXT: fcvtzs x0, h0, #7
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%fix = fmul half %flt, 128.0		%fix = fmul half %flt, 128.0
%cvt = fptosi half %fix to i64		%cvt = fptosi half %fix to i64
ret i64 %cvt		ret i64 %cvt
}		}

define i64 @fcvtzs_f16_i64_15(half %flt) {		define i64 @fcvtzs_f16_i64_15(half %flt) {
; CHECK-NO16-LABEL: fcvtzs_f16_i64_15:		; CHECK-NO16-LABEL: fcvtzs_f16_i64_15:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: mov w8, #1191182336		; CHECK-NO16-NEXT: movi v1.2s, #71, lsl #24
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fmov s1, w8
; CHECK-NO16-NEXT: fmul s0, s0, s1		; CHECK-NO16-NEXT: fmul s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fcvtzs x0, s0		; CHECK-NO16-NEXT: fcvtzs x0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: fcvtzs_f16_i64_15:		; CHECK-FP16-LABEL: fcvtzs_f16_i64_15:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
▲ Show 20 Lines • Show All 84 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%fix = fmul double %dbl, 18446744073709551616.0		%fix = fmul double %dbl, 18446744073709551616.0
%cvt = fptoui double %fix to i64		%cvt = fptoui double %fix to i64
ret i64 %cvt		ret i64 %cvt
}		}

define i32 @fcvtzu_f16_i32_7(half %flt) {		define i32 @fcvtzu_f16_i32_7(half %flt) {
; CHECK-NO16-LABEL: fcvtzu_f16_i32_7:		; CHECK-NO16-LABEL: fcvtzu_f16_i32_7:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: mov w8, #1124073472		; CHECK-NO16-NEXT: movi v1.2s, #67, lsl #24
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fmov s1, w8
; CHECK-NO16-NEXT: fmul s0, s0, s1		; CHECK-NO16-NEXT: fmul s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fcvtzu w0, s0		; CHECK-NO16-NEXT: fcvtzu w0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: fcvtzu_f16_i32_7:		; CHECK-FP16-LABEL: fcvtzu_f16_i32_7:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: fcvtzu w0, h0, #7		; CHECK-FP16-NEXT: fcvtzu w0, h0, #7
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%fix = fmul half %flt, 128.0		%fix = fmul half %flt, 128.0
%cvt = fptoui half %fix to i32		%cvt = fptoui half %fix to i32
ret i32 %cvt		ret i32 %cvt
}		}

define i32 @fcvtzu_f16_i32_15(half %flt) {		define i32 @fcvtzu_f16_i32_15(half %flt) {
; CHECK-NO16-LABEL: fcvtzu_f16_i32_15:		; CHECK-NO16-LABEL: fcvtzu_f16_i32_15:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: mov w8, #1191182336		; CHECK-NO16-NEXT: movi v1.2s, #71, lsl #24
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fmov s1, w8
; CHECK-NO16-NEXT: fmul s0, s0, s1		; CHECK-NO16-NEXT: fmul s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fcvtzu w0, s0		; CHECK-NO16-NEXT: fcvtzu w0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: fcvtzu_f16_i32_15:		; CHECK-FP16-LABEL: fcvtzu_f16_i32_15:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: fcvtzu w0, h0, #15		; CHECK-FP16-NEXT: fcvtzu w0, h0, #15
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%fix = fmul half %flt, 32768.0		%fix = fmul half %flt, 32768.0
%cvt = fptoui half %fix to i32		%cvt = fptoui half %fix to i32
ret i32 %cvt		ret i32 %cvt
}		}

define i64 @fcvtzu_f16_i64_7(half %flt) {		define i64 @fcvtzu_f16_i64_7(half %flt) {
; CHECK-NO16-LABEL: fcvtzu_f16_i64_7:		; CHECK-NO16-LABEL: fcvtzu_f16_i64_7:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: mov w8, #1124073472		; CHECK-NO16-NEXT: movi v1.2s, #67, lsl #24
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fmov s1, w8
; CHECK-NO16-NEXT: fmul s0, s0, s1		; CHECK-NO16-NEXT: fmul s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fcvtzu x0, s0		; CHECK-NO16-NEXT: fcvtzu x0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: fcvtzu_f16_i64_7:		; CHECK-FP16-LABEL: fcvtzu_f16_i64_7:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: fcvtzu x0, h0, #7		; CHECK-FP16-NEXT: fcvtzu x0, h0, #7
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%fix = fmul half %flt, 128.0		%fix = fmul half %flt, 128.0
%cvt = fptoui half %fix to i64		%cvt = fptoui half %fix to i64
ret i64 %cvt		ret i64 %cvt
}		}

define i64 @fcvtzu_f16_i64_15(half %flt) {		define i64 @fcvtzu_f16_i64_15(half %flt) {
; CHECK-NO16-LABEL: fcvtzu_f16_i64_15:		; CHECK-NO16-LABEL: fcvtzu_f16_i64_15:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: mov w8, #1191182336		; CHECK-NO16-NEXT: movi v1.2s, #71, lsl #24
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fmov s1, w8
; CHECK-NO16-NEXT: fmul s0, s0, s1		; CHECK-NO16-NEXT: fmul s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fcvtzu x0, s0		; CHECK-NO16-NEXT: fcvtzu x0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: fcvtzu_f16_i64_15:		; CHECK-FP16-LABEL: fcvtzu_f16_i64_15:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
▲ Show 20 Lines • Show All 84 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%cvt = sitofp i64 %long to double		%cvt = sitofp i64 %long to double
%fix = fdiv double %cvt, 18446744073709551616.0		%fix = fdiv double %cvt, 18446744073709551616.0
ret double %fix		ret double %fix
}		}

define half @scvtf_f16_i32_7(i32 %int) {		define half @scvtf_f16_i32_7(i32 %int) {
; CHECK-NO16-LABEL: scvtf_f16_i32_7:		; CHECK-NO16-LABEL: scvtf_f16_i32_7:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: scvtf s0, w0		; CHECK-NO16-NEXT: scvtf s1, w0
; CHECK-NO16-NEXT: mov w8, #1124073472		; CHECK-NO16-NEXT: movi v0.2s, #67, lsl #24
; CHECK-NO16-NEXT: fmov s1, w8		; CHECK-NO16-NEXT: fcvt h1, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt s1, h1
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fdiv s0, s1, s0
; CHECK-NO16-NEXT: fdiv s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: scvtf_f16_i32_7:		; CHECK-FP16-LABEL: scvtf_f16_i32_7:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: scvtf h0, w0, #7		; CHECK-FP16-NEXT: scvtf h0, w0, #7
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%cvt = sitofp i32 %int to half		%cvt = sitofp i32 %int to half
%fix = fdiv half %cvt, 128.0		%fix = fdiv half %cvt, 128.0
ret half %fix		ret half %fix
}		}

define half @scvtf_f16_i32_15(i32 %int) {		define half @scvtf_f16_i32_15(i32 %int) {
; CHECK-NO16-LABEL: scvtf_f16_i32_15:		; CHECK-NO16-LABEL: scvtf_f16_i32_15:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: scvtf s0, w0		; CHECK-NO16-NEXT: scvtf s1, w0
; CHECK-NO16-NEXT: mov w8, #1191182336		; CHECK-NO16-NEXT: movi v0.2s, #71, lsl #24
; CHECK-NO16-NEXT: fmov s1, w8		; CHECK-NO16-NEXT: fcvt h1, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt s1, h1
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fdiv s0, s1, s0
; CHECK-NO16-NEXT: fdiv s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: scvtf_f16_i32_15:		; CHECK-FP16-LABEL: scvtf_f16_i32_15:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: scvtf h0, w0, #15		; CHECK-FP16-NEXT: scvtf h0, w0, #15
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%cvt = sitofp i32 %int to half		%cvt = sitofp i32 %int to half
%fix = fdiv half %cvt, 32768.0		%fix = fdiv half %cvt, 32768.0
ret half %fix		ret half %fix
}		}

define half @scvtf_f16_i64_7(i64 %long) {		define half @scvtf_f16_i64_7(i64 %long) {
; CHECK-NO16-LABEL: scvtf_f16_i64_7:		; CHECK-NO16-LABEL: scvtf_f16_i64_7:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: scvtf s0, x0		; CHECK-NO16-NEXT: scvtf s1, x0
; CHECK-NO16-NEXT: mov w8, #1124073472		; CHECK-NO16-NEXT: movi v0.2s, #67, lsl #24
; CHECK-NO16-NEXT: fmov s1, w8		; CHECK-NO16-NEXT: fcvt h1, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt s1, h1
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fdiv s0, s1, s0
; CHECK-NO16-NEXT: fdiv s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: scvtf_f16_i64_7:		; CHECK-FP16-LABEL: scvtf_f16_i64_7:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: scvtf h0, x0, #7		; CHECK-FP16-NEXT: scvtf h0, x0, #7
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%cvt = sitofp i64 %long to half		%cvt = sitofp i64 %long to half
%fix = fdiv half %cvt, 128.0		%fix = fdiv half %cvt, 128.0
ret half %fix		ret half %fix
}		}

define half @scvtf_f16_i64_15(i64 %long) {		define half @scvtf_f16_i64_15(i64 %long) {
; CHECK-NO16-LABEL: scvtf_f16_i64_15:		; CHECK-NO16-LABEL: scvtf_f16_i64_15:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: scvtf s0, x0		; CHECK-NO16-NEXT: scvtf s1, x0
; CHECK-NO16-NEXT: mov w8, #1191182336		; CHECK-NO16-NEXT: movi v0.2s, #71, lsl #24
; CHECK-NO16-NEXT: fmov s1, w8		; CHECK-NO16-NEXT: fcvt h1, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt s1, h1
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fdiv s0, s1, s0
; CHECK-NO16-NEXT: fdiv s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: scvtf_f16_i64_15:		; CHECK-FP16-LABEL: scvtf_f16_i64_15:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: scvtf h0, x0, #15		; CHECK-FP16-NEXT: scvtf h0, x0, #15
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%cvt = sitofp i64 %long to half		%cvt = sitofp i64 %long to half
▲ Show 20 Lines • Show All 81 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%cvt = uitofp i64 %long to double		%cvt = uitofp i64 %long to double
%fix = fdiv double %cvt, 18446744073709551616.0		%fix = fdiv double %cvt, 18446744073709551616.0
ret double %fix		ret double %fix
}		}

define half @ucvtf_f16_i32_7(i32 %int) {		define half @ucvtf_f16_i32_7(i32 %int) {
; CHECK-NO16-LABEL: ucvtf_f16_i32_7:		; CHECK-NO16-LABEL: ucvtf_f16_i32_7:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: ucvtf s0, w0		; CHECK-NO16-NEXT: ucvtf s1, w0
; CHECK-NO16-NEXT: mov w8, #1124073472		; CHECK-NO16-NEXT: movi v0.2s, #67, lsl #24
; CHECK-NO16-NEXT: fmov s1, w8		; CHECK-NO16-NEXT: fcvt h1, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt s1, h1
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fdiv s0, s1, s0
; CHECK-NO16-NEXT: fdiv s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: ucvtf_f16_i32_7:		; CHECK-FP16-LABEL: ucvtf_f16_i32_7:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: ucvtf h0, w0, #7		; CHECK-FP16-NEXT: ucvtf h0, w0, #7
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%cvt = uitofp i32 %int to half		%cvt = uitofp i32 %int to half
%fix = fdiv half %cvt, 128.0		%fix = fdiv half %cvt, 128.0
ret half %fix		ret half %fix
}		}

define half @ucvtf_f16_i32_15(i32 %int) {		define half @ucvtf_f16_i32_15(i32 %int) {
; CHECK-NO16-LABEL: ucvtf_f16_i32_15:		; CHECK-NO16-LABEL: ucvtf_f16_i32_15:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: ucvtf s0, w0		; CHECK-NO16-NEXT: ucvtf s1, w0
; CHECK-NO16-NEXT: mov w8, #1191182336		; CHECK-NO16-NEXT: movi v0.2s, #71, lsl #24
; CHECK-NO16-NEXT: fmov s1, w8		; CHECK-NO16-NEXT: fcvt h1, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt s1, h1
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fdiv s0, s1, s0
; CHECK-NO16-NEXT: fdiv s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: ucvtf_f16_i32_15:		; CHECK-FP16-LABEL: ucvtf_f16_i32_15:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: ucvtf h0, w0, #15		; CHECK-FP16-NEXT: ucvtf h0, w0, #15
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%cvt = uitofp i32 %int to half		%cvt = uitofp i32 %int to half
%fix = fdiv half %cvt, 32768.0		%fix = fdiv half %cvt, 32768.0
ret half %fix		ret half %fix
}		}

define half @ucvtf_f16_i64_7(i64 %long) {		define half @ucvtf_f16_i64_7(i64 %long) {
; CHECK-NO16-LABEL: ucvtf_f16_i64_7:		; CHECK-NO16-LABEL: ucvtf_f16_i64_7:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: ucvtf s0, x0		; CHECK-NO16-NEXT: ucvtf s1, x0
; CHECK-NO16-NEXT: mov w8, #1124073472		; CHECK-NO16-NEXT: movi v0.2s, #67, lsl #24
; CHECK-NO16-NEXT: fmov s1, w8		; CHECK-NO16-NEXT: fcvt h1, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt s1, h1
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fdiv s0, s1, s0
; CHECK-NO16-NEXT: fdiv s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: ucvtf_f16_i64_7:		; CHECK-FP16-LABEL: ucvtf_f16_i64_7:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: ucvtf h0, x0, #7		; CHECK-FP16-NEXT: ucvtf h0, x0, #7
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%cvt = uitofp i64 %long to half		%cvt = uitofp i64 %long to half
%fix = fdiv half %cvt, 128.0		%fix = fdiv half %cvt, 128.0
ret half %fix		ret half %fix
}		}

define half @ucvtf_f16_i64_15(i64 %long) {		define half @ucvtf_f16_i64_15(i64 %long) {
; CHECK-NO16-LABEL: ucvtf_f16_i64_15:		; CHECK-NO16-LABEL: ucvtf_f16_i64_15:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: ucvtf s0, x0		; CHECK-NO16-NEXT: ucvtf s1, x0
; CHECK-NO16-NEXT: mov w8, #1191182336		; CHECK-NO16-NEXT: movi v0.2s, #71, lsl #24
; CHECK-NO16-NEXT: fmov s1, w8		; CHECK-NO16-NEXT: fcvt h1, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt s1, h1
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fdiv s0, s1, s0
; CHECK-NO16-NEXT: fdiv s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: ucvtf_f16_i64_15:		; CHECK-FP16-LABEL: ucvtf_f16_i64_15:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: ucvtf h0, x0, #15		; CHECK-FP16-NEXT: ucvtf h0, x0, #15
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%cvt = uitofp i64 %long to half		%cvt = uitofp i64 %long to half
▲ Show 20 Lines • Show All 79 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%fix = fmul double %dbl, 18446744073709551616.0		%fix = fmul double %dbl, 18446744073709551616.0
%cvt = call i64 @llvm.fptosi.sat.i64.f64(double %fix)		%cvt = call i64 @llvm.fptosi.sat.i64.f64(double %fix)
ret i64 %cvt		ret i64 %cvt
}		}

define i32 @fcvtzs_sat_f16_i32_7(half %dbl) {		define i32 @fcvtzs_sat_f16_i32_7(half %dbl) {
; CHECK-NO16-LABEL: fcvtzs_sat_f16_i32_7:		; CHECK-NO16-LABEL: fcvtzs_sat_f16_i32_7:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: mov w8, #1124073472		; CHECK-NO16-NEXT: movi v1.2s, #67, lsl #24
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fmov s1, w8
; CHECK-NO16-NEXT: fmul s0, s0, s1		; CHECK-NO16-NEXT: fmul s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fcvtzs w0, s0		; CHECK-NO16-NEXT: fcvtzs w0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: fcvtzs_sat_f16_i32_7:		; CHECK-FP16-LABEL: fcvtzs_sat_f16_i32_7:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: fcvtzs w0, h0, #7		; CHECK-FP16-NEXT: fcvtzs w0, h0, #7
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%fix = fmul half %dbl, 128.0		%fix = fmul half %dbl, 128.0
%cvt = call i32 @llvm.fptosi.sat.i32.f16(half %fix)		%cvt = call i32 @llvm.fptosi.sat.i32.f16(half %fix)
ret i32 %cvt		ret i32 %cvt
}		}

define i32 @fcvtzs_sat_f16_i32_15(half %dbl) {		define i32 @fcvtzs_sat_f16_i32_15(half %dbl) {
; CHECK-NO16-LABEL: fcvtzs_sat_f16_i32_15:		; CHECK-NO16-LABEL: fcvtzs_sat_f16_i32_15:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: mov w8, #1191182336		; CHECK-NO16-NEXT: movi v1.2s, #71, lsl #24
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fmov s1, w8
; CHECK-NO16-NEXT: fmul s0, s0, s1		; CHECK-NO16-NEXT: fmul s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fcvtzs w0, s0		; CHECK-NO16-NEXT: fcvtzs w0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: fcvtzs_sat_f16_i32_15:		; CHECK-FP16-LABEL: fcvtzs_sat_f16_i32_15:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: fcvtzs w0, h0, #15		; CHECK-FP16-NEXT: fcvtzs w0, h0, #15
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%fix = fmul half %dbl, 32768.0		%fix = fmul half %dbl, 32768.0
%cvt = call i32 @llvm.fptosi.sat.i32.f16(half %fix)		%cvt = call i32 @llvm.fptosi.sat.i32.f16(half %fix)
ret i32 %cvt		ret i32 %cvt
}		}

define i64 @fcvtzs_sat_f16_i64_7(half %dbl) {		define i64 @fcvtzs_sat_f16_i64_7(half %dbl) {
; CHECK-NO16-LABEL: fcvtzs_sat_f16_i64_7:		; CHECK-NO16-LABEL: fcvtzs_sat_f16_i64_7:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: mov w8, #1124073472		; CHECK-NO16-NEXT: movi v1.2s, #67, lsl #24
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fmov s1, w8
; CHECK-NO16-NEXT: fmul s0, s0, s1		; CHECK-NO16-NEXT: fmul s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fcvtzs x0, s0		; CHECK-NO16-NEXT: fcvtzs x0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: fcvtzs_sat_f16_i64_7:		; CHECK-FP16-LABEL: fcvtzs_sat_f16_i64_7:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: fcvtzs x0, h0, #7		; CHECK-FP16-NEXT: fcvtzs x0, h0, #7
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%fix = fmul half %dbl, 128.0		%fix = fmul half %dbl, 128.0
%cvt = call i64 @llvm.fptosi.sat.i64.f16(half %fix)		%cvt = call i64 @llvm.fptosi.sat.i64.f16(half %fix)
ret i64 %cvt		ret i64 %cvt
}		}

define i64 @fcvtzs_sat_f16_i64_15(half %dbl) {		define i64 @fcvtzs_sat_f16_i64_15(half %dbl) {
; CHECK-NO16-LABEL: fcvtzs_sat_f16_i64_15:		; CHECK-NO16-LABEL: fcvtzs_sat_f16_i64_15:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: mov w8, #1191182336		; CHECK-NO16-NEXT: movi v1.2s, #71, lsl #24
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fmov s1, w8
; CHECK-NO16-NEXT: fmul s0, s0, s1		; CHECK-NO16-NEXT: fmul s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fcvtzs x0, s0		; CHECK-NO16-NEXT: fcvtzs x0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: fcvtzs_sat_f16_i64_15:		; CHECK-FP16-LABEL: fcvtzs_sat_f16_i64_15:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
▲ Show 20 Lines • Show All 81 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%fix = fmul double %dbl, 18446744073709551616.0		%fix = fmul double %dbl, 18446744073709551616.0
%cvt = call i64 @llvm.fptoui.sat.i64.f64(double %fix)		%cvt = call i64 @llvm.fptoui.sat.i64.f64(double %fix)
ret i64 %cvt		ret i64 %cvt
}		}

define i32 @fcvtzu_sat_f16_i32_7(half %dbl) {		define i32 @fcvtzu_sat_f16_i32_7(half %dbl) {
; CHECK-NO16-LABEL: fcvtzu_sat_f16_i32_7:		; CHECK-NO16-LABEL: fcvtzu_sat_f16_i32_7:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: mov w8, #1124073472		; CHECK-NO16-NEXT: movi v1.2s, #67, lsl #24
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fmov s1, w8
; CHECK-NO16-NEXT: fmul s0, s0, s1		; CHECK-NO16-NEXT: fmul s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fcvtzu w0, s0		; CHECK-NO16-NEXT: fcvtzu w0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: fcvtzu_sat_f16_i32_7:		; CHECK-FP16-LABEL: fcvtzu_sat_f16_i32_7:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: fcvtzu w0, h0, #7		; CHECK-FP16-NEXT: fcvtzu w0, h0, #7
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%fix = fmul half %dbl, 128.0		%fix = fmul half %dbl, 128.0
%cvt = call i32 @llvm.fptoui.sat.i32.f16(half %fix)		%cvt = call i32 @llvm.fptoui.sat.i32.f16(half %fix)
ret i32 %cvt		ret i32 %cvt
}		}

define i32 @fcvtzu_sat_f16_i32_15(half %dbl) {		define i32 @fcvtzu_sat_f16_i32_15(half %dbl) {
; CHECK-NO16-LABEL: fcvtzu_sat_f16_i32_15:		; CHECK-NO16-LABEL: fcvtzu_sat_f16_i32_15:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: mov w8, #1191182336		; CHECK-NO16-NEXT: movi v1.2s, #71, lsl #24
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fmov s1, w8
; CHECK-NO16-NEXT: fmul s0, s0, s1		; CHECK-NO16-NEXT: fmul s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fcvtzu w0, s0		; CHECK-NO16-NEXT: fcvtzu w0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: fcvtzu_sat_f16_i32_15:		; CHECK-FP16-LABEL: fcvtzu_sat_f16_i32_15:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: fcvtzu w0, h0, #15		; CHECK-FP16-NEXT: fcvtzu w0, h0, #15
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%fix = fmul half %dbl, 32768.0		%fix = fmul half %dbl, 32768.0
%cvt = call i32 @llvm.fptoui.sat.i32.f16(half %fix)		%cvt = call i32 @llvm.fptoui.sat.i32.f16(half %fix)
ret i32 %cvt		ret i32 %cvt
}		}

define i64 @fcvtzu_sat_f16_i64_7(half %dbl) {		define i64 @fcvtzu_sat_f16_i64_7(half %dbl) {
; CHECK-NO16-LABEL: fcvtzu_sat_f16_i64_7:		; CHECK-NO16-LABEL: fcvtzu_sat_f16_i64_7:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: mov w8, #1124073472		; CHECK-NO16-NEXT: movi v1.2s, #67, lsl #24
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fmov s1, w8
; CHECK-NO16-NEXT: fmul s0, s0, s1		; CHECK-NO16-NEXT: fmul s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fcvtzu x0, s0		; CHECK-NO16-NEXT: fcvtzu x0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: fcvtzu_sat_f16_i64_7:		; CHECK-FP16-LABEL: fcvtzu_sat_f16_i64_7:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: fcvtzu x0, h0, #7		; CHECK-FP16-NEXT: fcvtzu x0, h0, #7
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%fix = fmul half %dbl, 128.0		%fix = fmul half %dbl, 128.0
%cvt = call i64 @llvm.fptoui.sat.i64.f16(half %fix)		%cvt = call i64 @llvm.fptoui.sat.i64.f16(half %fix)
ret i64 %cvt		ret i64 %cvt
}		}

define i64 @fcvtzu_sat_f16_i64_15(half %dbl) {		define i64 @fcvtzu_sat_f16_i64_15(half %dbl) {
; CHECK-NO16-LABEL: fcvtzu_sat_f16_i64_15:		; CHECK-NO16-LABEL: fcvtzu_sat_f16_i64_15:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: mov w8, #1191182336		; CHECK-NO16-NEXT: movi v1.2s, #71, lsl #24
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fmov s1, w8
; CHECK-NO16-NEXT: fmul s0, s0, s1		; CHECK-NO16-NEXT: fmul s0, s0, s1
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fcvtzu x0, s0		; CHECK-NO16-NEXT: fcvtzu x0, s0
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: fcvtzu_sat_f16_i64_15:		; CHECK-FP16-LABEL: fcvtzu_sat_f16_i64_15:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: fcvtzu x0, h0, #15		; CHECK-FP16-NEXT: fcvtzu x0, h0, #15
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%fix = fmul half %dbl, 32768.0		%fix = fmul half %dbl, 32768.0
%cvt = call i64 @llvm.fptoui.sat.i64.f16(half %fix)		%cvt = call i64 @llvm.fptoui.sat.i64.f16(half %fix)
ret i64 %cvt		ret i64 %cvt
}		}

llvm/test/CodeGen/AArch64/fpimm.ll

	; RUN: llc -mtriple=aarch64-linux-gnu -verify-machineinstrs < %s \| FileCheck %s			; RUN: llc -mtriple=aarch64-linux-gnu -verify-machineinstrs < %s \| FileCheck %s
	; RUN: llc -mtriple=aarch64-apple-darwin -code-model=large -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=CHECK,LARGE			; RUN: llc -mtriple=aarch64-apple-darwin -code-model=large -verify-machineinstrs < %s \| FileCheck %s --check-prefixes=LARGE
	; RUN: llc -mtriple=aarch64-none-eabi -code-model=tiny -verify-machineinstrs < %s \| FileCheck %s			; RUN: llc -mtriple=aarch64-none-eabi -code-model=tiny -verify-machineinstrs < %s \| FileCheck %s

	@varf32 = global float 0.0			@varf32 = global float 0.0
	@varf64 = global double 0.0			@varf64 = global double 0.0

	define void @check_float() {			define void @check_float() {
	; CHECK-LABEL: check_float:			; CHECK-LABEL: check_float:

	%val = load float, float* @varf32			%val = load float, float* @varf32
	%newval1 = fadd float %val, 8.5			%newval1 = fadd float %val, 8.5
	store volatile float %newval1, float* @varf32			store volatile float %newval1, float* @varf32
	; CHECK-DAG: fmov {{s[0-9]+}}, #8.5			; CHECK-DAG: fmov {{s[0-9]+}}, #8.5

	%newval2 = fadd float %val, 128.0			%newval2 = fadd float %val, 128.0
	store volatile float %newval2, float* @varf32			store volatile float %newval2, float* @varf32
	; CHECK-DAG: mov [[W128:w[0-9]+]], #1124073472			; CHECK-DAG: movi [[REG:v[0-9s]+]].2s, #67, lsl #24
	; CHECK-DAG: fmov {{s[0-9]+}}, [[W128]]

	; CHECK: ret			; CHECK: ret
	ret void			ret void
	}			}

	define void @check_double() {			define void @check_double() {
	; CHECK-LABEL: check_double:			; CHECK-LABEL: check_double:

	Show All 38 Lines

llvm/test/CodeGen/AArch64/fptosi-sat-scalar.ll

	Show First 20 Lines • Show All 125 Lines • ▼ Show 20 Lines

	define i100 @test_signed_i100_f32(float %f) nounwind {			define i100 @test_signed_i100_f32(float %f) nounwind {
	; CHECK-LABEL: test_signed_i100_f32:			; CHECK-LABEL: test_signed_i100_f32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str d8, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str d8, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: str x30, [sp, #8] // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #8] // 8-byte Folded Spill
	; CHECK-NEXT: fmov s8, s0			; CHECK-NEXT: fmov s8, s0
	; CHECK-NEXT: bl __fixsfti			; CHECK-NEXT: bl __fixsfti
	; CHECK-NEXT: mov w8, #-251658240			; CHECK-NEXT: movi v0.2s, #241, lsl #24
				; CHECK-NEXT: mov w8, #1895825407
	; CHECK-NEXT: mov x10, #34359738367			; CHECK-NEXT: mov x10, #34359738367
	; CHECK-NEXT: ldr x30, [sp, #8] // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp, #8] // 8-byte Folded Reload
	; CHECK-NEXT: fmov s0, w8
	; CHECK-NEXT: mov w8, #1895825407
	; CHECK-NEXT: fcmp s8, s0			; CHECK-NEXT: fcmp s8, s0
	; CHECK-NEXT: fmov s0, w8			; CHECK-NEXT: fmov s0, w8
	; CHECK-NEXT: mov x8, #-34359738368			; CHECK-NEXT: mov x8, #-34359738368
	; CHECK-NEXT: csel x9, xzr, x0, lt			; CHECK-NEXT: csel x9, xzr, x0, lt
	; CHECK-NEXT: csel x8, x8, x1, lt			; CHECK-NEXT: csel x8, x8, x1, lt
	; CHECK-NEXT: fcmp s8, s0			; CHECK-NEXT: fcmp s8, s0
	; CHECK-NEXT: csel x8, x10, x8, gt			; CHECK-NEXT: csel x8, x10, x8, gt
	; CHECK-NEXT: csinv x9, x9, xzr, le			; CHECK-NEXT: csinv x9, x9, xzr, le
	; CHECK-NEXT: fcmp s8, s8			; CHECK-NEXT: fcmp s8, s8
	; CHECK-NEXT: csel x0, xzr, x9, vs			; CHECK-NEXT: csel x0, xzr, x9, vs
	; CHECK-NEXT: csel x1, xzr, x8, vs			; CHECK-NEXT: csel x1, xzr, x8, vs
	; CHECK-NEXT: ldr d8, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr d8, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%x = call i100 @llvm.fptosi.sat.i100.f32(float %f)			%x = call i100 @llvm.fptosi.sat.i100.f32(float %f)
	ret i100 %x			ret i100 %x
	}			}

	define i128 @test_signed_i128_f32(float %f) nounwind {			define i128 @test_signed_i128_f32(float %f) nounwind {
	; CHECK-LABEL: test_signed_i128_f32:			; CHECK-LABEL: test_signed_i128_f32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str d8, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str d8, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: str x30, [sp, #8] // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #8] // 8-byte Folded Spill
	; CHECK-NEXT: fmov s8, s0			; CHECK-NEXT: fmov s8, s0
	; CHECK-NEXT: bl __fixsfti			; CHECK-NEXT: bl __fixsfti
	; CHECK-NEXT: mov w8, #-16777216			; CHECK-NEXT: movi v0.2s, #255, lsl #24
				; CHECK-NEXT: mov w8, #2130706431
	; CHECK-NEXT: mov x10, #9223372036854775807			; CHECK-NEXT: mov x10, #9223372036854775807
	; CHECK-NEXT: ldr x30, [sp, #8] // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp, #8] // 8-byte Folded Reload
	; CHECK-NEXT: fmov s0, w8
	; CHECK-NEXT: mov w8, #2130706431
	; CHECK-NEXT: fcmp s8, s0			; CHECK-NEXT: fcmp s8, s0
	; CHECK-NEXT: fmov s0, w8			; CHECK-NEXT: fmov s0, w8
	; CHECK-NEXT: mov x8, #-9223372036854775808			; CHECK-NEXT: mov x8, #-9223372036854775808
	; CHECK-NEXT: csel x9, xzr, x0, lt			; CHECK-NEXT: csel x9, xzr, x0, lt
	; CHECK-NEXT: csel x8, x8, x1, lt			; CHECK-NEXT: csel x8, x8, x1, lt
	; CHECK-NEXT: fcmp s8, s0			; CHECK-NEXT: fcmp s8, s0
	; CHECK-NEXT: csel x8, x10, x8, gt			; CHECK-NEXT: csel x8, x10, x8, gt
	; CHECK-NEXT: csinv x9, x9, xzr, le			; CHECK-NEXT: csinv x9, x9, xzr, le
	▲ Show 20 Lines • Show All 394 Lines • ▼ Show 20 Lines
	define i100 @test_signed_i100_f16(half %f) nounwind {			define i100 @test_signed_i100_f16(half %f) nounwind {
	; CHECK-LABEL: test_signed_i100_f16:			; CHECK-LABEL: test_signed_i100_f16:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str d8, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str d8, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: fcvt s8, h0			; CHECK-NEXT: fcvt s8, h0
	; CHECK-NEXT: str x30, [sp, #8] // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #8] // 8-byte Folded Spill
	; CHECK-NEXT: fmov s0, s8			; CHECK-NEXT: fmov s0, s8
	; CHECK-NEXT: bl __fixsfti			; CHECK-NEXT: bl __fixsfti
	; CHECK-NEXT: mov w8, #-251658240			; CHECK-NEXT: movi v0.2s, #241, lsl #24
				; CHECK-NEXT: mov w8, #1895825407
	; CHECK-NEXT: mov x10, #34359738367			; CHECK-NEXT: mov x10, #34359738367
	; CHECK-NEXT: ldr x30, [sp, #8] // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp, #8] // 8-byte Folded Reload
	; CHECK-NEXT: fmov s0, w8
	; CHECK-NEXT: mov w8, #1895825407
	; CHECK-NEXT: fcmp s8, s0			; CHECK-NEXT: fcmp s8, s0
	; CHECK-NEXT: fmov s0, w8			; CHECK-NEXT: fmov s0, w8
	; CHECK-NEXT: mov x8, #-34359738368			; CHECK-NEXT: mov x8, #-34359738368
	; CHECK-NEXT: csel x9, xzr, x0, lt			; CHECK-NEXT: csel x9, xzr, x0, lt
	; CHECK-NEXT: csel x8, x8, x1, lt			; CHECK-NEXT: csel x8, x8, x1, lt
	; CHECK-NEXT: fcmp s8, s0			; CHECK-NEXT: fcmp s8, s0
	; CHECK-NEXT: csel x8, x10, x8, gt			; CHECK-NEXT: csel x8, x10, x8, gt
	; CHECK-NEXT: csinv x9, x9, xzr, le			; CHECK-NEXT: csinv x9, x9, xzr, le
	Show All 9 Lines
	define i128 @test_signed_i128_f16(half %f) nounwind {			define i128 @test_signed_i128_f16(half %f) nounwind {
	; CHECK-LABEL: test_signed_i128_f16:			; CHECK-LABEL: test_signed_i128_f16:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: str d8, [sp, #-16]! // 8-byte Folded Spill			; CHECK-NEXT: str d8, [sp, #-16]! // 8-byte Folded Spill
	; CHECK-NEXT: fcvt s8, h0			; CHECK-NEXT: fcvt s8, h0
	; CHECK-NEXT: str x30, [sp, #8] // 8-byte Folded Spill			; CHECK-NEXT: str x30, [sp, #8] // 8-byte Folded Spill
	; CHECK-NEXT: fmov s0, s8			; CHECK-NEXT: fmov s0, s8
	; CHECK-NEXT: bl __fixsfti			; CHECK-NEXT: bl __fixsfti
	; CHECK-NEXT: mov w8, #-16777216			; CHECK-NEXT: movi v0.2s, #255, lsl #24
				; CHECK-NEXT: mov w8, #2130706431
	; CHECK-NEXT: mov x10, #9223372036854775807			; CHECK-NEXT: mov x10, #9223372036854775807
	; CHECK-NEXT: ldr x30, [sp, #8] // 8-byte Folded Reload			; CHECK-NEXT: ldr x30, [sp, #8] // 8-byte Folded Reload
	; CHECK-NEXT: fmov s0, w8
	; CHECK-NEXT: mov w8, #2130706431
	; CHECK-NEXT: fcmp s8, s0			; CHECK-NEXT: fcmp s8, s0
	; CHECK-NEXT: fmov s0, w8			; CHECK-NEXT: fmov s0, w8
	; CHECK-NEXT: mov x8, #-9223372036854775808			; CHECK-NEXT: mov x8, #-9223372036854775808
	; CHECK-NEXT: csel x9, xzr, x0, lt			; CHECK-NEXT: csel x9, xzr, x0, lt
	; CHECK-NEXT: csel x8, x8, x1, lt			; CHECK-NEXT: csel x8, x8, x1, lt
	; CHECK-NEXT: fcmp s8, s0			; CHECK-NEXT: fcmp s8, s0
	; CHECK-NEXT: csel x8, x10, x8, gt			; CHECK-NEXT: csel x8, x10, x8, gt
	; CHECK-NEXT: csinv x9, x9, xzr, le			; CHECK-NEXT: csinv x9, x9, xzr, le
	; CHECK-NEXT: fcmp s8, s8			; CHECK-NEXT: fcmp s8, s8
	; CHECK-NEXT: csel x0, xzr, x9, vs			; CHECK-NEXT: csel x0, xzr, x9, vs
	; CHECK-NEXT: csel x1, xzr, x8, vs			; CHECK-NEXT: csel x1, xzr, x8, vs
	; CHECK-NEXT: ldr d8, [sp], #16 // 8-byte Folded Reload			; CHECK-NEXT: ldr d8, [sp], #16 // 8-byte Folded Reload
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%x = call i128 @llvm.fptosi.sat.i128.f16(half %f)			%x = call i128 @llvm.fptosi.sat.i128.f16(half %f)
	ret i128 %x			ret i128 %x
	}			}

llvm/test/CodeGen/AArch64/fptosi-sat-vector.ll

	Show First 20 Lines • Show All 821 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: .cfi_offset b8, -48			; CHECK-NEXT: .cfi_offset b8, -48
	; CHECK-NEXT: .cfi_offset b9, -56			; CHECK-NEXT: .cfi_offset b9, -56
	; CHECK-NEXT: .cfi_offset b10, -64			; CHECK-NEXT: .cfi_offset b10, -64
	; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0			; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0
	; CHECK-NEXT: mov s8, v0.s[1]			; CHECK-NEXT: mov s8, v0.s[1]
	; CHECK-NEXT: str q0, [sp] // 16-byte Folded Spill			; CHECK-NEXT: str q0, [sp] // 16-byte Folded Spill
	; CHECK-NEXT: fmov s0, s8			; CHECK-NEXT: fmov s0, s8
	; CHECK-NEXT: bl __fixsfti			; CHECK-NEXT: bl __fixsfti
	; CHECK-NEXT: mov w8, #-251658240			; CHECK-NEXT: movi v9.2s, #241, lsl #24
				; CHECK-NEXT: mov w8, #1895825407
	; CHECK-NEXT: mov x21, #-34359738368			; CHECK-NEXT: mov x21, #-34359738368
	; CHECK-NEXT: mov x22, #34359738367			; CHECK-NEXT: mov x22, #34359738367
	; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload
				; CHECK-NEXT: fmov s10, w8
	; CHECK-NEXT: // kill: def $s0 killed $s0 killed $q0			; CHECK-NEXT: // kill: def $s0 killed $s0 killed $q0
	; CHECK-NEXT: fmov s9, w8
	; CHECK-NEXT: mov w8, #1895825407
	; CHECK-NEXT: fcmp s8, s9			; CHECK-NEXT: fcmp s8, s9
	; CHECK-NEXT: fmov s10, w8
	; CHECK-NEXT: csel x8, xzr, x0, lt			; CHECK-NEXT: csel x8, xzr, x0, lt
	; CHECK-NEXT: csel x9, x21, x1, lt			; CHECK-NEXT: csel x9, x21, x1, lt
	; CHECK-NEXT: fcmp s8, s10			; CHECK-NEXT: fcmp s8, s10
	; CHECK-NEXT: csel x9, x22, x9, gt			; CHECK-NEXT: csel x9, x22, x9, gt
	; CHECK-NEXT: csinv x8, x8, xzr, le			; CHECK-NEXT: csinv x8, x8, xzr, le
	; CHECK-NEXT: fcmp s8, s8			; CHECK-NEXT: fcmp s8, s8
	; CHECK-NEXT: csel x19, xzr, x8, vs			; CHECK-NEXT: csel x19, xzr, x8, vs
	; CHECK-NEXT: csel x20, xzr, x9, vs			; CHECK-NEXT: csel x20, xzr, x9, vs
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: .cfi_offset b8, -48			; CHECK-NEXT: .cfi_offset b8, -48
	; CHECK-NEXT: .cfi_offset b9, -56			; CHECK-NEXT: .cfi_offset b9, -56
	; CHECK-NEXT: .cfi_offset b10, -64			; CHECK-NEXT: .cfi_offset b10, -64
	; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0			; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0
	; CHECK-NEXT: mov s8, v0.s[1]			; CHECK-NEXT: mov s8, v0.s[1]
	; CHECK-NEXT: str q0, [sp] // 16-byte Folded Spill			; CHECK-NEXT: str q0, [sp] // 16-byte Folded Spill
	; CHECK-NEXT: fmov s0, s8			; CHECK-NEXT: fmov s0, s8
	; CHECK-NEXT: bl __fixsfti			; CHECK-NEXT: bl __fixsfti
	; CHECK-NEXT: mov w8, #-16777216			; CHECK-NEXT: movi v9.2s, #255, lsl #24
				; CHECK-NEXT: mov w8, #2130706431
	; CHECK-NEXT: mov x21, #-9223372036854775808			; CHECK-NEXT: mov x21, #-9223372036854775808
	; CHECK-NEXT: mov x22, #9223372036854775807			; CHECK-NEXT: mov x22, #9223372036854775807
	; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload
				; CHECK-NEXT: fmov s10, w8
	; CHECK-NEXT: // kill: def $s0 killed $s0 killed $q0			; CHECK-NEXT: // kill: def $s0 killed $s0 killed $q0
	; CHECK-NEXT: fmov s9, w8
	; CHECK-NEXT: mov w8, #2130706431
	; CHECK-NEXT: fcmp s8, s9			; CHECK-NEXT: fcmp s8, s9
	; CHECK-NEXT: fmov s10, w8
	; CHECK-NEXT: csel x8, xzr, x0, lt			; CHECK-NEXT: csel x8, xzr, x0, lt
	; CHECK-NEXT: csel x9, x21, x1, lt			; CHECK-NEXT: csel x9, x21, x1, lt
	; CHECK-NEXT: fcmp s8, s10			; CHECK-NEXT: fcmp s8, s10
	; CHECK-NEXT: csel x9, x22, x9, gt			; CHECK-NEXT: csel x9, x22, x9, gt
	; CHECK-NEXT: csinv x8, x8, xzr, le			; CHECK-NEXT: csinv x8, x8, xzr, le
	; CHECK-NEXT: fcmp s8, s8			; CHECK-NEXT: fcmp s8, s8
	; CHECK-NEXT: csel x19, xzr, x8, vs			; CHECK-NEXT: csel x19, xzr, x8, vs
	; CHECK-NEXT: csel x20, xzr, x9, vs			; CHECK-NEXT: csel x20, xzr, x9, vs
	▲ Show 20 Lines • Show All 187 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: .cfi_offset w30, -72			; CHECK-NEXT: .cfi_offset w30, -72
	; CHECK-NEXT: .cfi_offset b8, -80			; CHECK-NEXT: .cfi_offset b8, -80
	; CHECK-NEXT: .cfi_offset b9, -88			; CHECK-NEXT: .cfi_offset b9, -88
	; CHECK-NEXT: .cfi_offset b10, -96			; CHECK-NEXT: .cfi_offset b10, -96
	; CHECK-NEXT: mov s8, v0.s[1]			; CHECK-NEXT: mov s8, v0.s[1]
	; CHECK-NEXT: str q0, [sp, #16] // 16-byte Folded Spill			; CHECK-NEXT: str q0, [sp, #16] // 16-byte Folded Spill
	; CHECK-NEXT: fmov s0, s8			; CHECK-NEXT: fmov s0, s8
	; CHECK-NEXT: bl __fixsfti			; CHECK-NEXT: bl __fixsfti
	; CHECK-NEXT: mov w8, #-251658240			; CHECK-NEXT: movi v9.2s, #241, lsl #24
				; CHECK-NEXT: mov w8, #1895825407
	; CHECK-NEXT: mov x25, #-34359738368			; CHECK-NEXT: mov x25, #-34359738368
	; CHECK-NEXT: ldr q0, [sp, #16] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp, #16] // 16-byte Folded Reload
	; CHECK-NEXT: mov x26, #34359738367			; CHECK-NEXT: mov x26, #34359738367
	; CHECK-NEXT: fmov s9, w8
	; CHECK-NEXT: mov w8, #1895825407
	; CHECK-NEXT: ext v0.16b, v0.16b, v0.16b, #8
	; CHECK-NEXT: fcmp s8, s9
	; CHECK-NEXT: fmov s10, w8			; CHECK-NEXT: fmov s10, w8
	; CHECK-NEXT: str q0, [sp] // 16-byte Folded Spill			; CHECK-NEXT: fcmp s8, s9
	; CHECK-NEXT: // kill: def $s0 killed $s0 killed $q0			; CHECK-NEXT: ext v0.16b, v0.16b, v0.16b, #8
	; CHECK-NEXT: csel x8, xzr, x0, lt			; CHECK-NEXT: csel x8, xzr, x0, lt
	; CHECK-NEXT: csel x9, x25, x1, lt			; CHECK-NEXT: csel x9, x25, x1, lt
	; CHECK-NEXT: fcmp s8, s10			; CHECK-NEXT: fcmp s8, s10
				; CHECK-NEXT: str q0, [sp] // 16-byte Folded Spill
				; CHECK-NEXT: // kill: def $s0 killed $s0 killed $q0
	; CHECK-NEXT: csel x9, x26, x9, gt			; CHECK-NEXT: csel x9, x26, x9, gt
	; CHECK-NEXT: csinv x8, x8, xzr, le			; CHECK-NEXT: csinv x8, x8, xzr, le
	; CHECK-NEXT: fcmp s8, s8			; CHECK-NEXT: fcmp s8, s8
	; CHECK-NEXT: csel x19, xzr, x8, vs			; CHECK-NEXT: csel x19, xzr, x8, vs
	; CHECK-NEXT: csel x20, xzr, x9, vs			; CHECK-NEXT: csel x20, xzr, x9, vs
	; CHECK-NEXT: bl __fixsfti			; CHECK-NEXT: bl __fixsfti
	; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload
	; CHECK-NEXT: fcmp s0, s9			; CHECK-NEXT: fcmp s0, s9
	▲ Show 20 Lines • Show All 75 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: .cfi_offset w30, -72			; CHECK-NEXT: .cfi_offset w30, -72
	; CHECK-NEXT: .cfi_offset b8, -80			; CHECK-NEXT: .cfi_offset b8, -80
	; CHECK-NEXT: .cfi_offset b9, -88			; CHECK-NEXT: .cfi_offset b9, -88
	; CHECK-NEXT: .cfi_offset b10, -96			; CHECK-NEXT: .cfi_offset b10, -96
	; CHECK-NEXT: mov s8, v0.s[1]			; CHECK-NEXT: mov s8, v0.s[1]
	; CHECK-NEXT: str q0, [sp, #16] // 16-byte Folded Spill			; CHECK-NEXT: str q0, [sp, #16] // 16-byte Folded Spill
	; CHECK-NEXT: fmov s0, s8			; CHECK-NEXT: fmov s0, s8
	; CHECK-NEXT: bl __fixsfti			; CHECK-NEXT: bl __fixsfti
	; CHECK-NEXT: mov w8, #-16777216			; CHECK-NEXT: movi v9.2s, #255, lsl #24
				; CHECK-NEXT: mov w8, #2130706431
	; CHECK-NEXT: mov x25, #-9223372036854775808			; CHECK-NEXT: mov x25, #-9223372036854775808
	; CHECK-NEXT: ldr q0, [sp, #16] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp, #16] // 16-byte Folded Reload
	; CHECK-NEXT: mov x26, #9223372036854775807			; CHECK-NEXT: mov x26, #9223372036854775807
	; CHECK-NEXT: fmov s9, w8
	; CHECK-NEXT: mov w8, #2130706431
	; CHECK-NEXT: ext v0.16b, v0.16b, v0.16b, #8
	; CHECK-NEXT: fcmp s8, s9
	; CHECK-NEXT: fmov s10, w8			; CHECK-NEXT: fmov s10, w8
	; CHECK-NEXT: str q0, [sp] // 16-byte Folded Spill			; CHECK-NEXT: fcmp s8, s9
	; CHECK-NEXT: // kill: def $s0 killed $s0 killed $q0			; CHECK-NEXT: ext v0.16b, v0.16b, v0.16b, #8
	; CHECK-NEXT: csel x8, xzr, x0, lt			; CHECK-NEXT: csel x8, xzr, x0, lt
	; CHECK-NEXT: csel x9, x25, x1, lt			; CHECK-NEXT: csel x9, x25, x1, lt
	; CHECK-NEXT: fcmp s8, s10			; CHECK-NEXT: fcmp s8, s10
				; CHECK-NEXT: str q0, [sp] // 16-byte Folded Spill
				; CHECK-NEXT: // kill: def $s0 killed $s0 killed $q0
	; CHECK-NEXT: csel x9, x26, x9, gt			; CHECK-NEXT: csel x9, x26, x9, gt
	; CHECK-NEXT: csinv x8, x8, xzr, le			; CHECK-NEXT: csinv x8, x8, xzr, le
	; CHECK-NEXT: fcmp s8, s8			; CHECK-NEXT: fcmp s8, s8
	; CHECK-NEXT: csel x19, xzr, x8, vs			; CHECK-NEXT: csel x19, xzr, x8, vs
	; CHECK-NEXT: csel x20, xzr, x9, vs			; CHECK-NEXT: csel x20, xzr, x9, vs
	; CHECK-NEXT: bl __fixsfti			; CHECK-NEXT: bl __fixsfti
	; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload
	; CHECK-NEXT: fcmp s0, s9			; CHECK-NEXT: fcmp s0, s9
	▲ Show 20 Lines • Show All 621 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: .cfi_offset b9, -88			; CHECK-NEXT: .cfi_offset b9, -88
	; CHECK-NEXT: .cfi_offset b10, -96			; CHECK-NEXT: .cfi_offset b10, -96
	; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0			; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0
	; CHECK-NEXT: mov h1, v0.h[1]			; CHECK-NEXT: mov h1, v0.h[1]
	; CHECK-NEXT: str q0, [sp] // 16-byte Folded Spill			; CHECK-NEXT: str q0, [sp] // 16-byte Folded Spill
	; CHECK-NEXT: fcvt s8, h1			; CHECK-NEXT: fcvt s8, h1
	; CHECK-NEXT: fmov s0, s8			; CHECK-NEXT: fmov s0, s8
	; CHECK-NEXT: bl __fixsfti			; CHECK-NEXT: bl __fixsfti
	; CHECK-NEXT: mov w8, #-251658240			; CHECK-NEXT: movi v9.2s, #241, lsl #24
				; CHECK-NEXT: mov w8, #1895825407
	; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload
	; CHECK-NEXT: mov x25, #-34359738368			; CHECK-NEXT: mov x25, #-34359738368
	; CHECK-NEXT: mov x26, #34359738367			; CHECK-NEXT: mov x26, #34359738367
	; CHECK-NEXT: fmov s9, w8
	; CHECK-NEXT: mov w8, #1895825407
	; CHECK-NEXT: mov h0, v0.h[2]
	; CHECK-NEXT: fcmp s8, s9
	; CHECK-NEXT: fmov s10, w8			; CHECK-NEXT: fmov s10, w8
				; CHECK-NEXT: fcmp s8, s9
				; CHECK-NEXT: mov h0, v0.h[2]
	; CHECK-NEXT: csel x8, xzr, x0, lt			; CHECK-NEXT: csel x8, xzr, x0, lt
	; CHECK-NEXT: csel x9, x25, x1, lt			; CHECK-NEXT: csel x9, x25, x1, lt
	; CHECK-NEXT: fcmp s8, s10			; CHECK-NEXT: fcmp s8, s10
	; CHECK-NEXT: csel x9, x26, x9, gt			; CHECK-NEXT: csel x9, x26, x9, gt
	; CHECK-NEXT: csinv x8, x8, xzr, le			; CHECK-NEXT: csinv x8, x8, xzr, le
	; CHECK-NEXT: fcmp s8, s8			; CHECK-NEXT: fcmp s8, s8
	; CHECK-NEXT: fcvt s8, h0			; CHECK-NEXT: fcvt s8, h0
	; CHECK-NEXT: csel x19, xzr, x8, vs			; CHECK-NEXT: csel x19, xzr, x8, vs
	▲ Show 20 Lines • Show All 83 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: .cfi_offset b9, -88			; CHECK-NEXT: .cfi_offset b9, -88
	; CHECK-NEXT: .cfi_offset b10, -96			; CHECK-NEXT: .cfi_offset b10, -96
	; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0			; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0
	; CHECK-NEXT: mov h1, v0.h[1]			; CHECK-NEXT: mov h1, v0.h[1]
	; CHECK-NEXT: str q0, [sp] // 16-byte Folded Spill			; CHECK-NEXT: str q0, [sp] // 16-byte Folded Spill
	; CHECK-NEXT: fcvt s8, h1			; CHECK-NEXT: fcvt s8, h1
	; CHECK-NEXT: fmov s0, s8			; CHECK-NEXT: fmov s0, s8
	; CHECK-NEXT: bl __fixsfti			; CHECK-NEXT: bl __fixsfti
	; CHECK-NEXT: mov w8, #-16777216			; CHECK-NEXT: movi v9.2s, #255, lsl #24
				; CHECK-NEXT: mov w8, #2130706431
	; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp] // 16-byte Folded Reload
	; CHECK-NEXT: mov x25, #-9223372036854775808			; CHECK-NEXT: mov x25, #-9223372036854775808
	; CHECK-NEXT: mov x26, #9223372036854775807			; CHECK-NEXT: mov x26, #9223372036854775807
	; CHECK-NEXT: fmov s9, w8
	; CHECK-NEXT: mov w8, #2130706431
	; CHECK-NEXT: mov h0, v0.h[2]
	; CHECK-NEXT: fcmp s8, s9
	; CHECK-NEXT: fmov s10, w8			; CHECK-NEXT: fmov s10, w8
				; CHECK-NEXT: fcmp s8, s9
				; CHECK-NEXT: mov h0, v0.h[2]
	; CHECK-NEXT: csel x8, xzr, x0, lt			; CHECK-NEXT: csel x8, xzr, x0, lt
	; CHECK-NEXT: csel x9, x25, x1, lt			; CHECK-NEXT: csel x9, x25, x1, lt
	; CHECK-NEXT: fcmp s8, s10			; CHECK-NEXT: fcmp s8, s10
	; CHECK-NEXT: csel x9, x26, x9, gt			; CHECK-NEXT: csel x9, x26, x9, gt
	; CHECK-NEXT: csinv x8, x8, xzr, le			; CHECK-NEXT: csinv x8, x8, xzr, le
	; CHECK-NEXT: fcmp s8, s8			; CHECK-NEXT: fcmp s8, s8
	; CHECK-NEXT: fcvt s8, h0			; CHECK-NEXT: fcvt s8, h0
	; CHECK-NEXT: csel x19, xzr, x8, vs			; CHECK-NEXT: csel x19, xzr, x8, vs
	▲ Show 20 Lines • Show All 623 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: str q0, [sp, #48] // 16-byte Folded Spill			; CHECK-NEXT: str q0, [sp, #48] // 16-byte Folded Spill
	; CHECK-NEXT: mov x19, x8			; CHECK-NEXT: mov x19, x8
	; CHECK-NEXT: ext v0.16b, v0.16b, v0.16b, #8			; CHECK-NEXT: ext v0.16b, v0.16b, v0.16b, #8
	; CHECK-NEXT: str q0, [sp, #32] // 16-byte Folded Spill			; CHECK-NEXT: str q0, [sp, #32] // 16-byte Folded Spill
	; CHECK-NEXT: mov h0, v0.h[1]			; CHECK-NEXT: mov h0, v0.h[1]
	; CHECK-NEXT: fcvt s8, h0			; CHECK-NEXT: fcvt s8, h0
	; CHECK-NEXT: fmov s0, s8			; CHECK-NEXT: fmov s0, s8
	; CHECK-NEXT: bl __fixsfti			; CHECK-NEXT: bl __fixsfti
	; CHECK-NEXT: mov w8, #-251658240			; CHECK-NEXT: movi v10.2s, #241, lsl #24
				; CHECK-NEXT: mov w8, #1895825407
	; CHECK-NEXT: ldr q0, [sp, #32] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp, #32] // 16-byte Folded Reload
	; CHECK-NEXT: mov x25, #-34359738368			; CHECK-NEXT: mov x25, #-34359738368
	; CHECK-NEXT: mov x23, #34359738367			; CHECK-NEXT: mov x23, #34359738367
	; CHECK-NEXT: fmov s10, w8
	; CHECK-NEXT: mov w8, #1895825407
	; CHECK-NEXT: mov h0, v0.h[3]
	; CHECK-NEXT: fcmp s8, s10
	; CHECK-NEXT: fmov s9, w8			; CHECK-NEXT: fmov s9, w8
				; CHECK-NEXT: fcmp s8, s10
				; CHECK-NEXT: mov h0, v0.h[3]
	; CHECK-NEXT: csel x8, xzr, x0, lt			; CHECK-NEXT: csel x8, xzr, x0, lt
	; CHECK-NEXT: csel x9, x25, x1, lt			; CHECK-NEXT: csel x9, x25, x1, lt
	; CHECK-NEXT: fcmp s8, s9			; CHECK-NEXT: fcmp s8, s9
	; CHECK-NEXT: csel x9, x23, x9, gt			; CHECK-NEXT: csel x9, x23, x9, gt
	; CHECK-NEXT: csinv x8, x8, xzr, le			; CHECK-NEXT: csinv x8, x8, xzr, le
	; CHECK-NEXT: fcmp s8, s8			; CHECK-NEXT: fcmp s8, s8
	; CHECK-NEXT: fcvt s8, h0			; CHECK-NEXT: fcvt s8, h0
	; CHECK-NEXT: csel x8, xzr, x8, vs			; CHECK-NEXT: csel x8, xzr, x8, vs
	▲ Show 20 Lines • Show All 184 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: .cfi_offset b10, -128			; CHECK-NEXT: .cfi_offset b10, -128
	; CHECK-NEXT: str q0, [sp, #48] // 16-byte Folded Spill			; CHECK-NEXT: str q0, [sp, #48] // 16-byte Folded Spill
	; CHECK-NEXT: mov x19, x8			; CHECK-NEXT: mov x19, x8
	; CHECK-NEXT: ext v0.16b, v0.16b, v0.16b, #8			; CHECK-NEXT: ext v0.16b, v0.16b, v0.16b, #8
	; CHECK-NEXT: fcvt s8, h0			; CHECK-NEXT: fcvt s8, h0
	; CHECK-NEXT: str q0, [sp, #32] // 16-byte Folded Spill			; CHECK-NEXT: str q0, [sp, #32] // 16-byte Folded Spill
	; CHECK-NEXT: fmov s0, s8			; CHECK-NEXT: fmov s0, s8
	; CHECK-NEXT: bl __fixsfti			; CHECK-NEXT: bl __fixsfti
	; CHECK-NEXT: mov w8, #-16777216			; CHECK-NEXT: movi v10.2s, #255, lsl #24
				; CHECK-NEXT: mov w8, #2130706431
	; CHECK-NEXT: ldr q0, [sp, #32] // 16-byte Folded Reload			; CHECK-NEXT: ldr q0, [sp, #32] // 16-byte Folded Reload
	; CHECK-NEXT: mov x21, #-9223372036854775808			; CHECK-NEXT: mov x21, #-9223372036854775808
	; CHECK-NEXT: mov x22, #9223372036854775807			; CHECK-NEXT: mov x22, #9223372036854775807
	; CHECK-NEXT: fmov s10, w8
	; CHECK-NEXT: mov w8, #2130706431
	; CHECK-NEXT: mov h0, v0.h[1]
	; CHECK-NEXT: fcmp s8, s10
	; CHECK-NEXT: fmov s9, w8			; CHECK-NEXT: fmov s9, w8
				; CHECK-NEXT: fcmp s8, s10
				; CHECK-NEXT: mov h0, v0.h[1]
	; CHECK-NEXT: csel x8, xzr, x0, lt			; CHECK-NEXT: csel x8, xzr, x0, lt
	; CHECK-NEXT: csel x9, x21, x1, lt			; CHECK-NEXT: csel x9, x21, x1, lt
	; CHECK-NEXT: fcmp s8, s9			; CHECK-NEXT: fcmp s8, s9
	; CHECK-NEXT: csel x9, x22, x9, gt			; CHECK-NEXT: csel x9, x22, x9, gt
	; CHECK-NEXT: csinv x8, x8, xzr, le			; CHECK-NEXT: csinv x8, x8, xzr, le
	; CHECK-NEXT: fcmp s8, s8			; CHECK-NEXT: fcmp s8, s8
	; CHECK-NEXT: fcvt s8, h0			; CHECK-NEXT: fcvt s8, h0
	; CHECK-NEXT: csel x8, xzr, x8, vs			; CHECK-NEXT: csel x8, xzr, x8, vs
	▲ Show 20 Lines • Show All 953 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/remat-const-float-simd.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc < %s -mtriple=aarch64-none-linux-gnu -verify-machineinstrs -mattr=+neon \| FileCheck %s --check-prefixes=CHECK,CHECK-NEON
				; RUN: llc < %s -mtriple=aarch64-none-linux-gnu -verify-machineinstrs -mattr=-neon \| FileCheck %s --check-prefixes=CHECK,CHECK-SCALAR

				; Check that big fp constants can be rematerialized with movi
				target triple = "aarch64-unknown-linux-gnu"

				; float foo(void) { return float(2147483648); }
				dmgreenUnsubmitted Not Done Reply Inline Actions 0x7fffffff -> 2147483648, as the 0x7fffffff gets rounded. dmgreen: 0x7fffffff -> 2147483648, as the 0x7fffffff gets rounded.
				define float @foo() {
				; CHECK-LABEL: foo:
				; CHECK: // %bb.0: // %entry
				; CHECK-NEON-NEXT: movi v0.2s, #79, lsl #24
				; CHECK-SCALAR-NEXT: mov w8, #1325400064
				; CHECK-SCALAR-NEXT: fmov s0, w8
				; CHECK-NEXT: ret
				entry:
				ret float 0x41E0000000000000
				}

				; float foo2(float p) { return p + float(2147483648); }
				define float @foo2(float %f) {
				; CHECK-LABEL: foo2:
				; CHECK: // %bb.0: // %entry
				; CHECK-NEON-NEXT: movi v1.2s, #79, lsl #24
				; CHECK-NEON-NEXT: fadd s0, s0, s1
				; CHECK-SCALAR-NEXT: mov w8, #1325400064
				; CHECK-SCALAR-NEXT: fmov s1, w8
				; CHECK-SCALAR-NEXT: fadd s0, s0, s1
				; CHECK-NEXT: ret
				entry:
				%p = fadd float %f, 0x41E0000000000000
				ret float %p
				}

llvm/test/CodeGen/AArch64/vecreduce-fadd-legalization.ll

	Show First 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%b = call reassoc fp128 @llvm.vector.reduce.fadd.f128.v1f128(fp128 0xL00000000000000008000000000000000, <1 x fp128> %a)			%b = call reassoc fp128 @llvm.vector.reduce.fadd.f128.v1f128(fp128 0xL00000000000000008000000000000000, <1 x fp128> %a)
	ret fp128 %b			ret fp128 %b
	}			}

	define float @test_v3f32(<3 x float> %a) nounwind {			define float @test_v3f32(<3 x float> %a) nounwind {
	; CHECK-LABEL: test_v3f32:			; CHECK-LABEL: test_v3f32:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: mov w8, #-2147483648			; CHECK-NEXT: movi v1.2s, #128, lsl #24
	; CHECK-NEXT: fmov s1, w8
	; CHECK-NEXT: mov v0.s[3], v1.s[0]			; CHECK-NEXT: mov v0.s[3], v1.s[0]
	; CHECK-NEXT: faddp v0.4s, v0.4s, v0.4s			; CHECK-NEXT: faddp v0.4s, v0.4s, v0.4s
	; CHECK-NEXT: faddp s0, v0.2s			; CHECK-NEXT: faddp s0, v0.2s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%b = call reassoc float @llvm.vector.reduce.fadd.f32.v3f32(float -0.0, <3 x float> %a)			%b = call reassoc float @llvm.vector.reduce.fadd.f32.v3f32(float -0.0, <3 x float> %a)
	ret float %b			ret float %b
	}			}

	▲ Show 20 Lines • Show All 41 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[AArch64] Use simd mov to materialize big fp constants
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 413025

llvm/lib/Target/AArch64/AArch64InstrFormats.td

llvm/lib/Target/AArch64/AArch64InstrInfo.td

llvm/test/CodeGen/AArch64/fabs.ll

llvm/test/CodeGen/AArch64/fcvt-fixed.ll

llvm/test/CodeGen/AArch64/fpimm.ll

llvm/test/CodeGen/AArch64/fptosi-sat-scalar.ll

llvm/test/CodeGen/AArch64/fptosi-sat-vector.ll

llvm/test/CodeGen/AArch64/remat-const-float-simd.ll

llvm/test/CodeGen/AArch64/vecreduce-fadd-legalization.ll

This is an archive of the discontinued LLVM Phabricator instance.

[AArch64] Use simd mov to materialize big fp constantsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 413025

llvm/lib/Target/AArch64/AArch64InstrFormats.td

llvm/lib/Target/AArch64/AArch64InstrInfo.td

llvm/test/CodeGen/AArch64/fabs.ll

llvm/test/CodeGen/AArch64/fcvt-fixed.ll

llvm/test/CodeGen/AArch64/fpimm.ll

llvm/test/CodeGen/AArch64/fptosi-sat-scalar.ll

llvm/test/CodeGen/AArch64/fptosi-sat-vector.ll

llvm/test/CodeGen/AArch64/remat-const-float-simd.ll

llvm/test/CodeGen/AArch64/vecreduce-fadd-legalization.ll

[AArch64] Use simd mov to materialize big fp constants
ClosedPublic