This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Target/AArch64/
-
Target/
-
AArch64/
3/4
AArch64InstrInfo.td
-
test/CodeGen/AArch64/
-
CodeGen/
-
AArch64/
-
arm64-convert-v4f64.ll
-
concat_vector-truncate-combine.ll
-
dag-combine-trunc-build-vec.ll
-
fcvt_combine.ll
-
fp16-v8-instructions.ll
-
fpclamptosat_vec.ll
-
fptosi-sat-vector.ll
-
fptoui-sat-vector.ll
-
neon-truncstore.ll

Differential D115435

[AArch64] Add a tablegen pattern for UZP1.
ClosedPublic

Authored by labrinea on Dec 9 2021, 2:25 AM.

Download Raw Diff

Details

Reviewers

llvm-commits
dmgreen
jaykang10
SjoerdMeijer
momchil.velikov
sjarus

Commits

rG65033ef9e8a6: [AArch64] Add a tablegen pattern for UZP1.

Summary

Converts concat_vectors(V64 (trunc V128), V64 (trunc V128)) and concat_vectors(V32 (trunc V64), V32 (trunc V64)), which would otherwise be lowered as xtn followed by xtn2, to uzp1.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

labrinea created this revision.Dec 9 2021, 2:25 AM

Herald added subscribers: hiraditya, kristof.beyls. · View Herald TranscriptDec 9 2021, 2:25 AM

labrinea requested review of this revision.Dec 9 2021, 2:25 AM

Herald added a project: Restricted Project. · View Herald TranscriptDec 9 2021, 2:25 AM

Harbormaster completed remote builds in B138393: Diff 393077.Dec 9 2021, 2:55 AM

Rebased and adjusted one more test (LLVM :: CodeGen/AArch64/fpclamptosat_vec.ll).

Herald added a reviewer: sjarus. · View Herald TranscriptDec 9 2021, 3:00 AM

Herald added subscribers: armkevincheng, eric-k256. · View Herald Transcript

Harbormaster completed remote builds in B138400: Diff 393090.Dec 9 2021, 3:46 AM

LGTM. Less instructions is almost always good.

This revision is now accepted and ready to land.Dec 10 2021, 1:14 AM

SjoerdMeijer added inline comments.Dec 10 2021, 1:27 AM

llvm/lib/Target/AArch64/AArch64InstrInfo.td
5291	I was wondering if we also need patterns that work on V64 values/regs, so that we get the `uzp1 .8b` variants?

Added patterns for V64.

labrinea marked an inline comment as done.Dec 13 2021, 7:24 AM

Harbormaster completed remote builds in B138968: Diff 393888.Dec 13 2021, 7:37 AM

dmgreen added inline comments.Dec 14 2021, 12:56 AM

llvm/lib/Target/AArch64/AArch64InstrInfo.td
5291	Does this pattern and the one below work? I think illegal types don't get this far through lowering, and tablegen often balks at them.

labrinea marked an inline comment as done.Dec 14 2021, 1:44 AM

labrinea added inline comments.

llvm/lib/Target/AArch64/AArch64InstrInfo.td
5291	Yes they do. I have added tests for them in `llvm/test/CodeGen/AArch64/concat_vector-truncate-combine.ll`. However, the pattern for the `2s` variant didn't work (v1i64 --> v2i32).

dmgreen added inline comments.Dec 14 2021, 2:00 AM

llvm/lib/Target/AArch64/AArch64InstrInfo.td
5291	OK. These two already seem to produce the single instruction, without the need for this patch: https://godbolt.org/z/15Yh1a4bv I'm not sure if they are actually doing much.

This revision was landed with ongoing or failed builds.Dec 14 2021, 3:56 AM

Closed by commit rG65033ef9e8a6: [AArch64] Add a tablegen pattern for UZP1. (authored by labrinea). · Explain Why

This revision was automatically updated to reflect the committed changes.

labrinea marked an inline comment as done.

labrinea added a commit: rG65033ef9e8a6: [AArch64] Add a tablegen pattern for UZP1..

Revision Contents

Path

Size

llvm/

lib/

Target/

AArch64/

AArch64InstrInfo.td

10 lines

test/

CodeGen/

AArch64/

arm64-convert-v4f64.ll

5 lines

concat_vector-truncate-combine.ll

46 lines

dag-combine-trunc-build-vec.ll

3 lines

fcvt_combine.ll

72 lines

fp16-v8-instructions.ll

36 lines

160 lines

120 lines

124 lines

57 lines

Diff 394202

llvm/lib/Target/AArch64/AArch64InstrInfo.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 5,282 Lines • ▼ Show 20 Lines

	defm TRN1 : SIMDZipVector<0b010, "trn1", AArch64trn1>;			defm TRN1 : SIMDZipVector<0b010, "trn1", AArch64trn1>;
	defm TRN2 : SIMDZipVector<0b110, "trn2", AArch64trn2>;			defm TRN2 : SIMDZipVector<0b110, "trn2", AArch64trn2>;
	defm UZP1 : SIMDZipVector<0b001, "uzp1", AArch64uzp1>;			defm UZP1 : SIMDZipVector<0b001, "uzp1", AArch64uzp1>;
	defm UZP2 : SIMDZipVector<0b101, "uzp2", AArch64uzp2>;			defm UZP2 : SIMDZipVector<0b101, "uzp2", AArch64uzp2>;
	defm ZIP1 : SIMDZipVector<0b011, "zip1", AArch64zip1>;			defm ZIP1 : SIMDZipVector<0b011, "zip1", AArch64zip1>;
	defm ZIP2 : SIMDZipVector<0b111, "zip2", AArch64zip2>;			defm ZIP2 : SIMDZipVector<0b111, "zip2", AArch64zip2>;

				def : Pat<(v16i8 (concat_vectors (v8i8 (trunc (v8i16 V128:$Vn))),
				SjoerdMeijerUnsubmitted Done Reply Inline Actions I was wondering if we also need patterns that work on V64 values/regs, so that we get the `uzp1 .8b` variants? SjoerdMeijer: I was wondering if we also need patterns that work on V64 values/regs, so that we get the `uzp1…
				dmgreenUnsubmitted Done Reply Inline Actions Does this pattern and the one below work? I think illegal types don't get this far through lowering, and tablegen often balks at them. dmgreen: Does this pattern and the one below work? I think illegal types don't get this far through…
				labrineaAuthorUnsubmitted Done Reply Inline Actions Yes they do. I have added tests for them in `llvm/test/CodeGen/AArch64/concat_vector-truncate-combine.ll`. However, the pattern for the `2s` variant didn't work (v1i64 --> v2i32). labrinea: Yes they do. I have added tests for them in `llvm/test/CodeGen/AArch64/concat_vector-truncate…
				dmgreenUnsubmitted Not Done Reply Inline Actions OK. These two already seem to produce the single instruction, without the need for this patch: https://godbolt.org/z/15Yh1a4bv I'm not sure if they are actually doing much. dmgreen: OK. These two already seem to produce the single instruction, without the need for this patch…
				(v8i8 (trunc (v8i16 V128:$Vm))))),
				(UZP1v16i8 V128:$Vn, V128:$Vm)>;
				def : Pat<(v8i16 (concat_vectors (v4i16 (trunc (v4i32 V128:$Vn))),
				(v4i16 (trunc (v4i32 V128:$Vm))))),
				(UZP1v8i16 V128:$Vn, V128:$Vm)>;
				def : Pat<(v4i32 (concat_vectors (v2i32 (trunc (v2i64 V128:$Vn))),
				(v2i32 (trunc (v2i64 V128:$Vm))))),
				(UZP1v4i32 V128:$Vn, V128:$Vm)>;

	//----------------------------------------------------------------------------			//----------------------------------------------------------------------------
	// AdvSIMD TBL/TBX instructions			// AdvSIMD TBL/TBX instructions
	//----------------------------------------------------------------------------			//----------------------------------------------------------------------------

	defm TBL : SIMDTableLookup< 0, "tbl">;			defm TBL : SIMDTableLookup< 0, "tbl">;
	defm TBX : SIMDTableLookupTied<1, "tbx">;			defm TBX : SIMDTableLookupTied<1, "tbx">;

	def : Pat<(v8i8 (int_aarch64_neon_tbl1 (v16i8 VecListOne128:$Rn), (v8i8 V64:$Ri))),			def : Pat<(v8i8 (int_aarch64_neon_tbl1 (v16i8 VecListOne128:$Rn), (v8i8 V64:$Ri))),
	▲ Show 20 Lines • Show All 2,941 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/arm64-convert-v4f64.ll

Show First 20 Lines • Show All 51 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%tmp1 = load <4 x i64>, <4 x i64>* %ptr		%tmp1 = load <4 x i64>, <4 x i64>* %ptr
%tmp2 = uitofp <4 x i64> %tmp1 to <4 x half>		%tmp2 = uitofp <4 x i64> %tmp1 to <4 x half>
ret <4 x half> %tmp2		ret <4 x half> %tmp2
}		}

define <4 x i16> @trunc_v4i64_to_v4i16(<4 x i64>* %ptr) {		define <4 x i16> @trunc_v4i64_to_v4i16(<4 x i64>* %ptr) {
; CHECK-LABEL: trunc_v4i64_to_v4i16:		; CHECK-LABEL: trunc_v4i64_to_v4i16:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: ldp q0, q1, [x0]		; CHECK-NEXT: ldp q1, q0, [x0]
; CHECK-NEXT: xtn v0.2s, v0.2d		; CHECK-NEXT: uzp1 v0.4s, v1.4s, v0.4s
; CHECK-NEXT: xtn2 v0.4s, v1.2d
; CHECK-NEXT: xtn v0.4h, v0.4s		; CHECK-NEXT: xtn v0.4h, v0.4s
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%tmp1 = load <4 x i64>, <4 x i64>* %ptr		%tmp1 = load <4 x i64>, <4 x i64>* %ptr
%tmp2 = trunc <4 x i64> %tmp1 to <4 x i16>		%tmp2 = trunc <4 x i64> %tmp1 to <4 x i16>
ret <4 x i16> %tmp2		ret <4 x i16> %tmp2
}		}

define <4 x i16> @fptoui_v4f64_to_v4i16(<4 x double>* %ptr) {		define <4 x i16> @fptoui_v4f64_to_v4i16(<4 x double>* %ptr) {
Show All 13 Lines

llvm/test/CodeGen/AArch64/concat_vector-truncate-combine.ll

	Show All 10 Lines
	; CHECK-NEXT: xtn.4h v0, v0			; CHECK-NEXT: xtn.4h v0, v0
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%at = trunc <2 x i64> %a to <2 x i16>			%at = trunc <2 x i64> %a to <2 x i16>
	%bt = trunc <2 x i64> %b to <2 x i16>			%bt = trunc <2 x i64> %b to <2 x i16>
	%shuffle = shufflevector <2 x i16> %at, <2 x i16> %bt, <4 x i32> <i32 0, i32 1, i32 2, i32 3>			%shuffle = shufflevector <2 x i16> %at, <2 x i16> %bt, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
	ret <4 x i16> %shuffle			ret <4 x i16> %shuffle
	}			}

				define <4 x i32> @test_concat_truncate_v2i64_to_v4i32(<2 x i64> %a, <2 x i64> %b) #0 {
				entry:
				; CHECK-LABEL: test_concat_truncate_v2i64_to_v4i32:
				; CHECK-NEXT: uzp1.4s v0, v0, v1
				; CHECK-NEXT: ret
				%at = trunc <2 x i64> %a to <2 x i32>
				%bt = trunc <2 x i64> %b to <2 x i32>
				%shuffle = shufflevector <2 x i32> %at, <2 x i32> %bt, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
				ret <4 x i32> %shuffle
				}

				define <4 x i16> @test_concat_truncate_v2i32_to_v4i16(<2 x i32> %a, <2 x i32> %b) #0 {
				entry:
				; CHECK-LABEL: test_concat_truncate_v2i32_to_v4i16:
				; CHECK-NEXT: uzp1.4h v0, v0, v1
				; CHECK-NEXT: ret
				%at = trunc <2 x i32> %a to <2 x i16>
				%bt = trunc <2 x i32> %b to <2 x i16>
				%shuffle = shufflevector <2 x i16> %at, <2 x i16> %bt, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
				ret <4 x i16> %shuffle
				}

	define <8 x i8> @test_concat_truncate_v4i32_to_v8i8(<4 x i32> %a, <4 x i32> %b) #0 {			define <8 x i8> @test_concat_truncate_v4i32_to_v8i8(<4 x i32> %a, <4 x i32> %b) #0 {
	entry:			entry:
	; CHECK-LABEL: test_concat_truncate_v4i32_to_v8i8:			; CHECK-LABEL: test_concat_truncate_v4i32_to_v8i8:
	; CHECK-NEXT: uzp1.8h v0, v0, v1			; CHECK-NEXT: uzp1.8h v0, v0, v1
	; CHECK-NEXT: xtn.8b v0, v0			; CHECK-NEXT: xtn.8b v0, v0
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%at = trunc <4 x i32> %a to <4 x i8>			%at = trunc <4 x i32> %a to <4 x i8>
	%bt = trunc <4 x i32> %b to <4 x i8>			%bt = trunc <4 x i32> %b to <4 x i8>
	%shuffle = shufflevector <4 x i8> %at, <4 x i8> %bt, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>			%shuffle = shufflevector <4 x i8> %at, <4 x i8> %bt, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>
	ret <8 x i8> %shuffle			ret <8 x i8> %shuffle
	}			}

	define <8 x i16> @test_concat_truncate_v4i32_to_v8i16(<4 x i32> %a, <4 x i32> %b) #0 {			define <8 x i16> @test_concat_truncate_v4i32_to_v8i16(<4 x i32> %a, <4 x i32> %b) #0 {
	entry:			entry:
	; CHECK-LABEL: test_concat_truncate_v4i32_to_v8i16:			; CHECK-LABEL: test_concat_truncate_v4i32_to_v8i16:
	; CHECK-NEXT: xtn.4h v0, v0			; CHECK-NEXT: uzp1.8h v0, v0, v1
	; CHECK-NEXT: xtn2.8h v0, v1
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	%at = trunc <4 x i32> %a to <4 x i16>			%at = trunc <4 x i32> %a to <4 x i16>
	%bt = trunc <4 x i32> %b to <4 x i16>			%bt = trunc <4 x i32> %b to <4 x i16>
	%shuffle = shufflevector <4 x i16> %at, <4 x i16> %bt, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>			%shuffle = shufflevector <4 x i16> %at, <4 x i16> %bt, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>
	ret <8 x i16> %shuffle			ret <8 x i16> %shuffle
	}			}

				define <8 x i8> @test_concat_truncate_v4i16_to_v8i8(<4 x i16> %a, <4 x i16> %b) #0 {
				entry:
				; CHECK-LABEL: test_concat_truncate_v4i16_to_v8i8:
				; CHECK-NEXT: uzp1.8b v0, v0, v1
				; CHECK-NEXT: ret
				%at = trunc <4 x i16> %a to <4 x i8>
				%bt = trunc <4 x i16> %b to <4 x i8>
				%shuffle = shufflevector <4 x i8> %at, <4 x i8> %bt, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>
				ret <8 x i8> %shuffle
				}

				define <16 x i8> @test_concat_truncate_v8i16_to_v16i8(<8 x i16> %a, <8 x i16> %b) #0 {
				entry:
				; CHECK-LABEL: test_concat_truncate_v8i16_to_v16i8:
				; CHECK-NEXT: uzp1.16b v0, v0, v1
				; CHECK-NEXT: ret
				%at = trunc <8 x i16> %a to <8 x i8>
				%bt = trunc <8 x i16> %b to <8 x i8>
				%shuffle = shufflevector <8 x i8> %at, <8 x i8> %bt, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15>
				ret <16 x i8> %shuffle
				}

	; The concat_vectors operation in this test is introduced when splitting			; The concat_vectors operation in this test is introduced when splitting
	; the fptrunc operation due to the split <vscale x 4 x double> input operand.			; the fptrunc operation due to the split <vscale x 4 x double> input operand.
	define void @test_concat_fptrunc_v4f64_to_v4f32(<vscale x 4 x float>* %ptr) #1 {			define void @test_concat_fptrunc_v4f64_to_v4f32(<vscale x 4 x float>* %ptr) #1 {
	entry:			entry:
	; CHECK-LABEL: test_concat_fptrunc_v4f64_to_v4f32:			; CHECK-LABEL: test_concat_fptrunc_v4f64_to_v4f32:
	; CHECK: fmov z0.d, #1.00000000			; CHECK: fmov z0.d, #1.00000000
	; CHECK-NEXT: ptrue p0.d			; CHECK-NEXT: ptrue p0.d
	Show All 13 Lines

llvm/test/CodeGen/AArch64/dag-combine-trunc-build-vec.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=aarch64 < %s \| FileCheck %s			; RUN: llc -mtriple=aarch64 < %s \| FileCheck %s

	; This test is reduced fom https://github.com/android/ndk/issues/1207 for an			; This test is reduced fom https://github.com/android/ndk/issues/1207 for an
	; issue with the following DAGCobmine operation:			; issue with the following DAGCobmine operation:
	; truncate(build_vector(x,y)) -> build_vector(truncate(x),truncate(y))			; truncate(build_vector(x,y)) -> build_vector(truncate(x),truncate(y))
	; The combine should avoid creating illegal types if types have already been			; The combine should avoid creating illegal types if types have already been
	; legalized.			; legalized.

	define void @no_combine(i32 %p) local_unnamed_addr {			define void @no_combine(i32 %p) local_unnamed_addr {
	; CHECK-LABEL: no_combine:			; CHECK-LABEL: no_combine:
	; CHECK: // %bb.0:			; CHECK: // %bb.0:
	; CHECK-NEXT: movi v0.4h, #4			; CHECK-NEXT: movi v0.4h, #4
	; CHECK-NEXT: dup v1.4s, w0			; CHECK-NEXT: dup v1.4s, w0
	; CHECK-NEXT: xtn v1.4h, v1.4s			; CHECK-NEXT: xtn v1.4h, v1.4s
	; CHECK-NEXT: mov v1.d[1], v0.d[0]			; CHECK-NEXT: mov v1.d[1], v0.d[0]
	; CHECK-NEXT: xtn v0.8b, v1.8h			; CHECK-NEXT: uzp1 v0.16b, v1.16b, v1.16b
	; CHECK-NEXT: xtn2 v0.16b, v1.8h
	; CHECK-NEXT: str q0, [x8]			; CHECK-NEXT: str q0, [x8]
	; CHECK-NEXT: ret			; CHECK-NEXT: ret

	; The two shufflevector operations are needed to force the DAGCombine to happen			; The two shufflevector operations are needed to force the DAGCombine to happen
	; after type legalization and before operation legalization. Removing either			; after type legalization and before operation legalization. Removing either
	; makes the combine to happen before type legalization and the issue no longer			; makes the combine to happen before type legalization and the issue no longer
	; repros.			; repros.
	%1 = insertelement <16 x i32> undef, i32 %p, i32 0			%1 = insertelement <16 x i32> undef, i32 %p, i32 0
	Show All 22 Lines

llvm/test/CodeGen/AArch64/fcvt_combine.ll

Show First 20 Lines • Show All 174 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%scale = fmul <3 x float> %in, <float 4.0, float 4.0, float 4.0>		%scale = fmul <3 x float> %in, <float 4.0, float 4.0, float 4.0>
%val = fptosi <3 x float> %scale to <3 x i32>		%val = fptosi <3 x float> %scale to <3 x i32>
ret <3 x i32> %val		ret <3 x i32> %val
}		}

define <8 x i16> @test_v8f16(<8 x half> %in) {		define <8 x i16> @test_v8f16(<8 x half> %in) {
; CHECK-NO16-LABEL: test_v8f16:		; CHECK-NO16-LABEL: test_v8f16:
; CHECK-NO16: // %bb.0:		; CHECK-NO16: // %bb.0:
; CHECK-NO16-NEXT: mov h2, v0.h[1]		; CHECK-NO16-NEXT: mov h2, v0.h[4]
; CHECK-NO16-NEXT: mov h3, v0.h[4]		; CHECK-NO16-NEXT: mov h3, v0.h[5]
; CHECK-NO16-NEXT: mov h4, v0.h[5]		; CHECK-NO16-NEXT: mov h4, v0.h[1]
; CHECK-NO16-NEXT: mov h5, v0.h[2]		; CHECK-NO16-NEXT: mov h5, v0.h[2]
; CHECK-NO16-NEXT: fcvt s6, h0		; CHECK-NO16-NEXT: mov h6, v0.h[6]
		; CHECK-NO16-NEXT: fcvt s7, h0
; CHECK-NO16-NEXT: fmov s1, #4.00000000		; CHECK-NO16-NEXT: fmov s1, #4.00000000
; CHECK-NO16-NEXT: mov h7, v0.h[6]
; CHECK-NO16-NEXT: mov h16, v0.h[3]		; CHECK-NO16-NEXT: mov h16, v0.h[3]
; CHECK-NO16-NEXT: fcvt s2, h2		; CHECK-NO16-NEXT: fcvt s2, h2
; CHECK-NO16-NEXT: fcvt s3, h3		; CHECK-NO16-NEXT: fcvt s3, h3
; CHECK-NO16-NEXT: fcvt s4, h4		; CHECK-NO16-NEXT: fcvt s4, h4
; CHECK-NO16-NEXT: fcvt s5, h5
; CHECK-NO16-NEXT: fmul s6, s6, s1
; CHECK-NO16-NEXT: mov h0, v0.h[7]		; CHECK-NO16-NEXT: mov h0, v0.h[7]
; CHECK-NO16-NEXT: fcvt s7, h7		; CHECK-NO16-NEXT: fcvt s5, h5
		; CHECK-NO16-NEXT: fcvt s6, h6
		; CHECK-NO16-NEXT: fmul s7, s7, s1
; CHECK-NO16-NEXT: fcvt s16, h16		; CHECK-NO16-NEXT: fcvt s16, h16
; CHECK-NO16-NEXT: fmul s2, s2, s1		; CHECK-NO16-NEXT: fmul s2, s2, s1
; CHECK-NO16-NEXT: fmul s3, s3, s1		; CHECK-NO16-NEXT: fmul s3, s3, s1
; CHECK-NO16-NEXT: fmul s4, s4, s1		; CHECK-NO16-NEXT: fmul s4, s4, s1
; CHECK-NO16-NEXT: fmul s5, s5, s1
; CHECK-NO16-NEXT: fcvt h6, s6
; CHECK-NO16-NEXT: fcvt s0, h0		; CHECK-NO16-NEXT: fcvt s0, h0
; CHECK-NO16-NEXT: fmul s7, s7, s1		; CHECK-NO16-NEXT: fmul s5, s5, s1
		; CHECK-NO16-NEXT: fmul s6, s6, s1
		; CHECK-NO16-NEXT: fcvt h7, s7
; CHECK-NO16-NEXT: fmul s16, s16, s1		; CHECK-NO16-NEXT: fmul s16, s16, s1
; CHECK-NO16-NEXT: fcvt h2, s2		; CHECK-NO16-NEXT: fcvt h2, s2
; CHECK-NO16-NEXT: fcvt h3, s3		; CHECK-NO16-NEXT: fcvt h3, s3
; CHECK-NO16-NEXT: fcvt h4, s4		; CHECK-NO16-NEXT: fcvt h4, s4
; CHECK-NO16-NEXT: fcvt h5, s5
; CHECK-NO16-NEXT: fmul s0, s0, s1		; CHECK-NO16-NEXT: fmul s0, s0, s1
; CHECK-NO16-NEXT: fcvt h1, s7		; CHECK-NO16-NEXT: fcvt h1, s5
; CHECK-NO16-NEXT: mov v6.h[1], v2.h[0]		; CHECK-NO16-NEXT: fcvt h5, s6
; CHECK-NO16-NEXT: fcvt h2, s16		; CHECK-NO16-NEXT: mov v2.h[1], v3.h[0]
; CHECK-NO16-NEXT: mov v3.h[1], v4.h[0]		; CHECK-NO16-NEXT: fcvt h3, s16
		; CHECK-NO16-NEXT: mov v7.h[1], v4.h[0]
; CHECK-NO16-NEXT: fcvt h0, s0		; CHECK-NO16-NEXT: fcvt h0, s0
; CHECK-NO16-NEXT: mov v6.h[2], v5.h[0]		; CHECK-NO16-NEXT: mov v2.h[2], v5.h[0]
; CHECK-NO16-NEXT: mov v3.h[2], v1.h[0]		; CHECK-NO16-NEXT: mov v7.h[2], v1.h[0]
; CHECK-NO16-NEXT: mov v6.h[3], v2.h[0]		; CHECK-NO16-NEXT: mov v2.h[3], v0.h[0]
; CHECK-NO16-NEXT: mov v3.h[3], v0.h[0]		; CHECK-NO16-NEXT: mov v7.h[3], v3.h[0]
; CHECK-NO16-NEXT: fcvtl v0.4s, v6.4h		; CHECK-NO16-NEXT: fcvtl v0.4s, v2.4h
; CHECK-NO16-NEXT: fcvtl v1.4s, v3.4h		; CHECK-NO16-NEXT: fcvtl v1.4s, v7.4h
; CHECK-NO16-NEXT: fcvtzs v0.4s, v0.4s		; CHECK-NO16-NEXT: fcvtzs v0.4s, v0.4s
; CHECK-NO16-NEXT: fcvtzs v1.4s, v1.4s		; CHECK-NO16-NEXT: fcvtzs v1.4s, v1.4s
; CHECK-NO16-NEXT: xtn v0.4h, v0.4s		; CHECK-NO16-NEXT: uzp1 v0.8h, v1.8h, v0.8h
; CHECK-NO16-NEXT: xtn2 v0.8h, v1.4s
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: test_v8f16:		; CHECK-FP16-LABEL: test_v8f16:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h, #2		; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h, #2
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%scale = fmul <8 x half> %in, <half 4.0, half 4.0, half 4.0, half 4.0, half 4.0, half 4.0, half 4.0, half 4.0>		%scale = fmul <8 x half> %in, <half 4.0, half 4.0, half 4.0, half 4.0, half 4.0, half 4.0, half 4.0, half 4.0>
%val = fptosi <8 x half> %scale to <8 x i16>		%val = fptosi <8 x half> %scale to <8 x i16>
▲ Show 20 Lines • Show All 307 Lines • ▼ Show 20 Lines
; CHECK-NO16-NEXT: csel w13, w13, w9, lt		; CHECK-NO16-NEXT: csel w13, w13, w9, lt
; CHECK-NO16-NEXT: mov s0, v1.s[2]		; CHECK-NO16-NEXT: mov s0, v1.s[2]
; CHECK-NO16-NEXT: cmn w13, #8, lsl #12 // =32768		; CHECK-NO16-NEXT: cmn w13, #8, lsl #12 // =32768
; CHECK-NO16-NEXT: fmov s2, w11		; CHECK-NO16-NEXT: fmov s2, w11
; CHECK-NO16-NEXT: csel w13, w13, w10, gt		; CHECK-NO16-NEXT: csel w13, w13, w10, gt
; CHECK-NO16-NEXT: cmp w14, w9		; CHECK-NO16-NEXT: cmp w14, w9
; CHECK-NO16-NEXT: csel w14, w14, w9, lt		; CHECK-NO16-NEXT: csel w14, w14, w9, lt
; CHECK-NO16-NEXT: cmn w14, #8, lsl #12 // =32768		; CHECK-NO16-NEXT: cmn w14, #8, lsl #12 // =32768
; CHECK-NO16-NEXT: fcvtzs w16, s0
; CHECK-NO16-NEXT: csel w14, w14, w10, gt		; CHECK-NO16-NEXT: csel w14, w14, w10, gt
; CHECK-NO16-NEXT: cmp w15, w9		; CHECK-NO16-NEXT: cmp w15, w9
; CHECK-NO16-NEXT: csel w15, w15, w9, lt		; CHECK-NO16-NEXT: csel w15, w15, w9, lt
; CHECK-NO16-NEXT: mov s0, v1.s[3]
; CHECK-NO16-NEXT: cmn w15, #8, lsl #12 // =32768		; CHECK-NO16-NEXT: cmn w15, #8, lsl #12 // =32768
; CHECK-NO16-NEXT: csel w15, w15, w10, gt		; CHECK-NO16-NEXT: csel w11, w15, w10, gt
; CHECK-NO16-NEXT: cmp w16, w9
; CHECK-NO16-NEXT: csel w11, w16, w9, lt
; CHECK-NO16-NEXT: cmn w11, #8, lsl #12 // =32768
; CHECK-NO16-NEXT: fmov s1, w15
; CHECK-NO16-NEXT: fcvtzs w15, s0		; CHECK-NO16-NEXT: fcvtzs w15, s0
; CHECK-NO16-NEXT: csel w11, w11, w10, gt		; CHECK-NO16-NEXT: mov s0, v1.s[3]
; CHECK-NO16-NEXT: mov v2.s[1], w8		; CHECK-NO16-NEXT: mov v2.s[1], w8
; CHECK-NO16-NEXT: mov v1.s[1], w14		; CHECK-NO16-NEXT: fmov s1, w11
; CHECK-NO16-NEXT: cmp w15, w9		; CHECK-NO16-NEXT: cmp w15, w9
; CHECK-NO16-NEXT: csel w8, w15, w9, lt		; CHECK-NO16-NEXT: csel w8, w15, w9, lt
		; CHECK-NO16-NEXT: fcvtzs w11, s0
; CHECK-NO16-NEXT: cmn w8, #8, lsl #12 // =32768		; CHECK-NO16-NEXT: cmn w8, #8, lsl #12 // =32768
		; CHECK-NO16-NEXT: mov v1.s[1], w14
; CHECK-NO16-NEXT: csel w8, w8, w10, gt		; CHECK-NO16-NEXT: csel w8, w8, w10, gt
; CHECK-NO16-NEXT: mov v1.s[2], w11
; CHECK-NO16-NEXT: mov v2.s[2], w12		; CHECK-NO16-NEXT: mov v2.s[2], w12
; CHECK-NO16-NEXT: mov v1.s[3], w8		; CHECK-NO16-NEXT: cmp w11, w9
		; CHECK-NO16-NEXT: csel w9, w11, w9, lt
		; CHECK-NO16-NEXT: mov v1.s[2], w8
		; CHECK-NO16-NEXT: cmn w9, #8, lsl #12 // =32768
		; CHECK-NO16-NEXT: csel w8, w9, w10, gt
; CHECK-NO16-NEXT: mov v2.s[3], w13		; CHECK-NO16-NEXT: mov v2.s[3], w13
; CHECK-NO16-NEXT: xtn v0.4h, v1.4s		; CHECK-NO16-NEXT: mov v1.s[3], w8
; CHECK-NO16-NEXT: xtn2 v0.8h, v2.4s		; CHECK-NO16-NEXT: uzp1 v0.8h, v1.8h, v2.8h
; CHECK-NO16-NEXT: ret		; CHECK-NO16-NEXT: ret
;		;
; CHECK-FP16-LABEL: test_v8f16_sat:		; CHECK-FP16-LABEL: test_v8f16_sat:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h, #2		; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h, #2
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%mul.i = fmul <8 x half> %in, <half 4.0, half 4.0, half 4.0, half 4.0, half 4.0, half 4.0, half 4.0, half 4.0>		%mul.i = fmul <8 x half> %in, <half 4.0, half 4.0, half 4.0, half 4.0, half 4.0, half 4.0, half 4.0, half 4.0>
%val = call <8 x i16> @llvm.fptosi.sat.v8i16.v8f16(<8 x half> %mul.i)		%val = call <8 x i16> @llvm.fptosi.sat.v8i16.v8f16(<8 x half> %mul.i)
▲ Show 20 Lines • Show All 60 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/fp16-v8-instructions.ll

Show First 20 Lines • Show All 655 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%1 = insertelement <8 x half> undef, half %a, i64 0		%1 = insertelement <8 x half> undef, half %a, i64 0
store <8 x half> %1, <8 x half>* %b, align 4		store <8 x half> %1, <8 x half>* %b, align 4
ret void		ret void
}		}

define <8 x i8> @fptosi_i8(<8 x half> %a) #0 {		define <8 x i8> @fptosi_i8(<8 x half> %a) #0 {
; CHECK-CVT-LABEL: fptosi_i8:		; CHECK-CVT-LABEL: fptosi_i8:
; CHECK-CVT: // %bb.0:		; CHECK-CVT: // %bb.0:
; CHECK-CVT-NEXT: fcvtl v1.4s, v0.4h		; CHECK-CVT-NEXT: fcvtl2 v1.4s, v0.8h
; CHECK-CVT-NEXT: fcvtl2 v0.4s, v0.8h		; CHECK-CVT-NEXT: fcvtl v0.4s, v0.4h
; CHECK-CVT-NEXT: fcvtzs v1.4s, v1.4s		; CHECK-CVT-NEXT: fcvtzs v1.4s, v1.4s
; CHECK-CVT-NEXT: fcvtzs v0.4s, v0.4s		; CHECK-CVT-NEXT: fcvtzs v0.4s, v0.4s
; CHECK-CVT-NEXT: xtn v1.4h, v1.4s		; CHECK-CVT-NEXT: uzp1 v0.8h, v0.8h, v1.8h
; CHECK-CVT-NEXT: xtn2 v1.8h, v0.4s		; CHECK-CVT-NEXT: xtn v0.8b, v0.8h
; CHECK-CVT-NEXT: xtn v0.8b, v1.8h
; CHECK-CVT-NEXT: ret		; CHECK-CVT-NEXT: ret
;		;
; CHECK-FP16-LABEL: fptosi_i8:		; CHECK-FP16-LABEL: fptosi_i8:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h		; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h
; CHECK-FP16-NEXT: xtn v0.8b, v0.8h		; CHECK-FP16-NEXT: xtn v0.8b, v0.8h
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%1 = fptosi<8 x half> %a to <8 x i8>		%1 = fptosi<8 x half> %a to <8 x i8>
ret <8 x i8> %1		ret <8 x i8> %1
}		}

define <8 x i16> @fptosi_i16(<8 x half> %a) #0 {		define <8 x i16> @fptosi_i16(<8 x half> %a) #0 {
; CHECK-CVT_DAG: fcvtl [[LO:v[0-9]+\.4s]], v0.4h		; CHECK-CVT_DAG: fcvtl [[LO:v[0-9]+\.4s]], v0.4h
; CHECK-CVT_DAG: fcvtl2 [[HI:v[0-9]+\.4s]], v0.8h		; CHECK-CVT_DAG: fcvtl2 [[HI:v[0-9]+\.4s]], v0.8h
; CHECK-CVT_DAG: fcvtzs [[LOF32:v[0-9]+\.4s]], [[LO]]		; CHECK-CVT_DAG: fcvtzs [[LOF32:v[0-9]+\.4s]], [[LO]]
; CHECK-CVT_DAG: xtn [[I16:v[0-9]+]].4h, [[LOF32]]		; CHECK-CVT_DAG: xtn [[I16:v[0-9]+]].4h, [[LOF32]]
; CHECK-CVT_DAG: fcvtzs [[HIF32:v[0-9]+\.4s]], [[HI]]		; CHECK-CVT_DAG: fcvtzs [[HIF32:v[0-9]+\.4s]], [[HI]]
; CHECK-CVT_DAG: xtn2 [[I16]].8h, [[HIF32]]		; CHECK-CVT_DAG: xtn2 [[I16]].8h, [[HIF32]]
; CHECK-COMMON_NEXT: ret		; CHECK-COMMON_NEXT: ret
; CHECK-CVT-LABEL: fptosi_i16:		; CHECK-CVT-LABEL: fptosi_i16:
; CHECK-CVT: // %bb.0:		; CHECK-CVT: // %bb.0:
; CHECK-CVT-NEXT: fcvtl v1.4s, v0.4h		; CHECK-CVT-NEXT: fcvtl2 v1.4s, v0.8h
; CHECK-CVT-NEXT: fcvtl2 v0.4s, v0.8h		; CHECK-CVT-NEXT: fcvtl v0.4s, v0.4h
; CHECK-CVT-NEXT: fcvtzs v1.4s, v1.4s		; CHECK-CVT-NEXT: fcvtzs v1.4s, v1.4s
; CHECK-CVT-NEXT: fcvtzs v2.4s, v0.4s		; CHECK-CVT-NEXT: fcvtzs v0.4s, v0.4s
; CHECK-CVT-NEXT: xtn v0.4h, v1.4s		; CHECK-CVT-NEXT: uzp1 v0.8h, v0.8h, v1.8h
; CHECK-CVT-NEXT: xtn2 v0.8h, v2.4s
; CHECK-CVT-NEXT: ret		; CHECK-CVT-NEXT: ret
;		;
; CHECK-FP16-LABEL: fptosi_i16:		; CHECK-FP16-LABEL: fptosi_i16:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h		; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%1 = fptosi<8 x half> %a to <8 x i16>		%1 = fptosi<8 x half> %a to <8 x i16>
ret <8 x i16> %1		ret <8 x i16> %1
}		}

define <8 x i8> @fptoui_i8(<8 x half> %a) #0 {		define <8 x i8> @fptoui_i8(<8 x half> %a) #0 {
; CHECK-CVT-LABEL: fptoui_i8:		; CHECK-CVT-LABEL: fptoui_i8:
; CHECK-CVT: // %bb.0:		; CHECK-CVT: // %bb.0:
; CHECK-CVT-NEXT: fcvtl v1.4s, v0.4h		; CHECK-CVT-NEXT: fcvtl2 v1.4s, v0.8h
; CHECK-CVT-NEXT: fcvtl2 v0.4s, v0.8h		; CHECK-CVT-NEXT: fcvtl v0.4s, v0.4h
; CHECK-CVT-NEXT: fcvtzu v1.4s, v1.4s		; CHECK-CVT-NEXT: fcvtzu v1.4s, v1.4s
; CHECK-CVT-NEXT: fcvtzu v0.4s, v0.4s		; CHECK-CVT-NEXT: fcvtzu v0.4s, v0.4s
; CHECK-CVT-NEXT: xtn v1.4h, v1.4s		; CHECK-CVT-NEXT: uzp1 v0.8h, v0.8h, v1.8h
; CHECK-CVT-NEXT: xtn2 v1.8h, v0.4s		; CHECK-CVT-NEXT: xtn v0.8b, v0.8h
; CHECK-CVT-NEXT: xtn v0.8b, v1.8h
; CHECK-CVT-NEXT: ret		; CHECK-CVT-NEXT: ret
;		;
; CHECK-FP16-LABEL: fptoui_i8:		; CHECK-FP16-LABEL: fptoui_i8:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: fcvtzu v0.8h, v0.8h		; CHECK-FP16-NEXT: fcvtzu v0.8h, v0.8h
; CHECK-FP16-NEXT: xtn v0.8b, v0.8h		; CHECK-FP16-NEXT: xtn v0.8b, v0.8h
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%1 = fptoui<8 x half> %a to <8 x i8>		%1 = fptoui<8 x half> %a to <8 x i8>
ret <8 x i8> %1		ret <8 x i8> %1
}		}

define <8 x i16> @fptoui_i16(<8 x half> %a) #0 {		define <8 x i16> @fptoui_i16(<8 x half> %a) #0 {
; CHECK-CVT-LABEL: fptoui_i16:		; CHECK-CVT-LABEL: fptoui_i16:
; CHECK-CVT: // %bb.0:		; CHECK-CVT: // %bb.0:
; CHECK-CVT-NEXT: fcvtl v1.4s, v0.4h		; CHECK-CVT-NEXT: fcvtl2 v1.4s, v0.8h
; CHECK-CVT-NEXT: fcvtl2 v0.4s, v0.8h		; CHECK-CVT-NEXT: fcvtl v0.4s, v0.4h
; CHECK-CVT-NEXT: fcvtzu v1.4s, v1.4s		; CHECK-CVT-NEXT: fcvtzu v1.4s, v1.4s
; CHECK-CVT-NEXT: fcvtzu v2.4s, v0.4s		; CHECK-CVT-NEXT: fcvtzu v0.4s, v0.4s
; CHECK-CVT-NEXT: xtn v0.4h, v1.4s		; CHECK-CVT-NEXT: uzp1 v0.8h, v0.8h, v1.8h
; CHECK-CVT-NEXT: xtn2 v0.8h, v2.4s
; CHECK-CVT-NEXT: ret		; CHECK-CVT-NEXT: ret
;		;
; CHECK-FP16-LABEL: fptoui_i16:		; CHECK-FP16-LABEL: fptoui_i16:
; CHECK-FP16: // %bb.0:		; CHECK-FP16: // %bb.0:
; CHECK-FP16-NEXT: fcvtzu v0.8h, v0.8h		; CHECK-FP16-NEXT: fcvtzu v0.8h, v0.8h
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
%1 = fptoui<8 x half> %a to <8 x i16>		%1 = fptoui<8 x half> %a to <8 x i16>
ret <8 x i16> %1		ret <8 x i16> %1
▲ Show 20 Lines • Show All 1,000 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/fpclamptosat_vec.ll

Show First 20 Lines • Show All 74 Lines • ▼ Show 20 Lines	entry:
%spec.store.select7 = select <4 x i1> %1, <4 x i64> %spec.store.select, <4 x i64> <i64 -2147483648, i64 -2147483648, i64 -2147483648, i64 -2147483648>		%spec.store.select7 = select <4 x i1> %1, <4 x i64> %spec.store.select, <4 x i64> <i64 -2147483648, i64 -2147483648, i64 -2147483648, i64 -2147483648>
%conv6 = trunc <4 x i64> %spec.store.select7 to <4 x i32>		%conv6 = trunc <4 x i64> %spec.store.select7 to <4 x i32>
ret <4 x i32> %conv6		ret <4 x i32> %conv6
}		}

define <4 x i32> @utest_f32i32(<4 x float> %x) {		define <4 x i32> @utest_f32i32(<4 x float> %x) {
; CHECK-LABEL: utest_f32i32:		; CHECK-LABEL: utest_f32i32:
; CHECK: // %bb.0: // %entry		; CHECK: // %bb.0: // %entry
; CHECK-NEXT: fcvtl v2.2d, v0.2s		; CHECK-NEXT: fcvtl2 v2.2d, v0.4s
; CHECK-NEXT: fcvtl2 v0.2d, v0.4s		; CHECK-NEXT: fcvtl v0.2d, v0.2s
; CHECK-NEXT: movi v1.2d, #0x000000ffffffff		; CHECK-NEXT: movi v1.2d, #0x000000ffffffff
; CHECK-NEXT: fcvtzu v2.2d, v2.2d		; CHECK-NEXT: fcvtzu v2.2d, v2.2d
; CHECK-NEXT: fcvtzu v0.2d, v0.2d		; CHECK-NEXT: fcvtzu v0.2d, v0.2d
; CHECK-NEXT: cmhi v3.2d, v1.2d, v2.2d		; CHECK-NEXT: cmhi v3.2d, v1.2d, v2.2d
; CHECK-NEXT: cmhi v1.2d, v1.2d, v0.2d		; CHECK-NEXT: cmhi v1.2d, v1.2d, v0.2d
; CHECK-NEXT: and v2.16b, v2.16b, v3.16b		; CHECK-NEXT: and v2.16b, v2.16b, v3.16b
; CHECK-NEXT: and v0.16b, v0.16b, v1.16b		; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
; CHECK-NEXT: orn v2.16b, v2.16b, v3.16b		; CHECK-NEXT: orn v2.16b, v2.16b, v3.16b
; CHECK-NEXT: orn v1.16b, v0.16b, v1.16b		; CHECK-NEXT: orn v0.16b, v0.16b, v1.16b
; CHECK-NEXT: xtn v0.2s, v2.2d		; CHECK-NEXT: uzp1 v0.4s, v0.4s, v2.4s
; CHECK-NEXT: xtn2 v0.4s, v1.2d
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%conv = fptoui <4 x float> %x to <4 x i64>		%conv = fptoui <4 x float> %x to <4 x i64>
%0 = icmp ult <4 x i64> %conv, <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>		%0 = icmp ult <4 x i64> %conv, <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>
%spec.store.select = select <4 x i1> %0, <4 x i64> %conv, <4 x i64> <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>		%spec.store.select = select <4 x i1> %0, <4 x i64> %conv, <4 x i64> <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>
%conv6 = trunc <4 x i64> %spec.store.select to <4 x i32>		%conv6 = trunc <4 x i64> %spec.store.select to <4 x i32>
ret <4 x i32> %conv6		ret <4 x i32> %conv6
}		}
Show All 29 Lines	entry:
ret <4 x i32> %conv6		ret <4 x i32> %conv6
}		}

define <4 x i32> @utesth_f16i32(<4 x half> %x) {		define <4 x i32> @utesth_f16i32(<4 x half> %x) {
; CHECK-CVT-LABEL: utesth_f16i32:		; CHECK-CVT-LABEL: utesth_f16i32:
; CHECK-CVT: // %bb.0: // %entry		; CHECK-CVT: // %bb.0: // %entry
; CHECK-CVT-NEXT: // kill: def $d0 killed $d0 def $q0		; CHECK-CVT-NEXT: // kill: def $d0 killed $d0 def $q0
; CHECK-CVT-NEXT: mov h2, v0.h[2]		; CHECK-CVT-NEXT: mov h2, v0.h[2]
; CHECK-CVT-NEXT: mov h3, v0.h[1]		; CHECK-CVT-NEXT: mov h3, v0.h[3]
; CHECK-CVT-NEXT: fcvt s4, h0		; CHECK-CVT-NEXT: mov h4, v0.h[1]
; CHECK-CVT-NEXT: mov h0, v0.h[3]		; CHECK-CVT-NEXT: fcvt s0, h0
; CHECK-CVT-NEXT: movi v1.2d, #0x000000ffffffff		; CHECK-CVT-NEXT: movi v1.2d, #0x000000ffffffff
; CHECK-CVT-NEXT: fcvt s2, h2		; CHECK-CVT-NEXT: fcvt s2, h2
; CHECK-CVT-NEXT: fcvt s3, h3		; CHECK-CVT-NEXT: fcvt s3, h3
; CHECK-CVT-NEXT: fcvtzu x8, s4		; CHECK-CVT-NEXT: fcvtzu x9, s0
; CHECK-CVT-NEXT: fcvt s0, h0		; CHECK-CVT-NEXT: fcvtzu x8, s2
; CHECK-CVT-NEXT: fcvtzu x9, s2		; CHECK-CVT-NEXT: fcvt s2, h4
; CHECK-CVT-NEXT: fmov d2, x8		; CHECK-CVT-NEXT: fmov d0, x8
; CHECK-CVT-NEXT: fcvtzu x8, s3		; CHECK-CVT-NEXT: fcvtzu x8, s3
; CHECK-CVT-NEXT: fmov d3, x9		; CHECK-CVT-NEXT: fmov d3, x9
; CHECK-CVT-NEXT: fcvtzu x9, s0		; CHECK-CVT-NEXT: fcvtzu x9, s2
; CHECK-CVT-NEXT: mov v2.d[1], x8		; CHECK-CVT-NEXT: mov v0.d[1], x8
; CHECK-CVT-NEXT: mov v3.d[1], x9		; CHECK-CVT-NEXT: mov v3.d[1], x9
; CHECK-CVT-NEXT: cmhi v0.2d, v1.2d, v2.2d		; CHECK-CVT-NEXT: cmhi v2.2d, v1.2d, v0.2d
; CHECK-CVT-NEXT: cmhi v1.2d, v1.2d, v3.2d		; CHECK-CVT-NEXT: cmhi v1.2d, v1.2d, v3.2d
; CHECK-CVT-NEXT: and v2.16b, v2.16b, v0.16b		; CHECK-CVT-NEXT: and v0.16b, v0.16b, v2.16b
; CHECK-CVT-NEXT: and v3.16b, v3.16b, v1.16b		; CHECK-CVT-NEXT: and v3.16b, v3.16b, v1.16b
; CHECK-CVT-NEXT: orn v0.16b, v2.16b, v0.16b		; CHECK-CVT-NEXT: orn v0.16b, v0.16b, v2.16b
; CHECK-CVT-NEXT: orn v1.16b, v3.16b, v1.16b		; CHECK-CVT-NEXT: orn v1.16b, v3.16b, v1.16b
; CHECK-CVT-NEXT: xtn v0.2s, v0.2d		; CHECK-CVT-NEXT: uzp1 v0.4s, v1.4s, v0.4s
; CHECK-CVT-NEXT: xtn2 v0.4s, v1.2d
; CHECK-CVT-NEXT: ret		; CHECK-CVT-NEXT: ret
;		;
; CHECK-FP16-LABEL: utesth_f16i32:		; CHECK-FP16-LABEL: utesth_f16i32:
; CHECK-FP16: // %bb.0: // %entry		; CHECK-FP16: // %bb.0: // %entry
; CHECK-FP16-NEXT: // kill: def $d0 killed $d0 def $q0		; CHECK-FP16-NEXT: // kill: def $d0 killed $d0 def $q0
; CHECK-FP16-NEXT: mov h2, v0.h[2]		; CHECK-FP16-NEXT: mov h2, v0.h[2]
; CHECK-FP16-NEXT: mov h3, v0.h[1]		; CHECK-FP16-NEXT: mov h3, v0.h[3]
; CHECK-FP16-NEXT: fcvtzu x8, h0		; CHECK-FP16-NEXT: fcvtzu x9, h0
; CHECK-FP16-NEXT: mov h0, v0.h[3]
; CHECK-FP16-NEXT: movi v1.2d, #0x000000ffffffff		; CHECK-FP16-NEXT: movi v1.2d, #0x000000ffffffff
; CHECK-FP16-NEXT: fcvtzu x9, h2		; CHECK-FP16-NEXT: fcvtzu x8, h2
; CHECK-FP16-NEXT: fmov d2, x8		; CHECK-FP16-NEXT: mov h2, v0.h[1]
		; CHECK-FP16-NEXT: fmov d0, x8
; CHECK-FP16-NEXT: fcvtzu x8, h3		; CHECK-FP16-NEXT: fcvtzu x8, h3
; CHECK-FP16-NEXT: fmov d3, x9		; CHECK-FP16-NEXT: fmov d3, x9
; CHECK-FP16-NEXT: fcvtzu x9, h0		; CHECK-FP16-NEXT: fcvtzu x9, h2
; CHECK-FP16-NEXT: mov v2.d[1], x8		; CHECK-FP16-NEXT: mov v0.d[1], x8
; CHECK-FP16-NEXT: mov v3.d[1], x9		; CHECK-FP16-NEXT: mov v3.d[1], x9
; CHECK-FP16-NEXT: cmhi v0.2d, v1.2d, v2.2d		; CHECK-FP16-NEXT: cmhi v2.2d, v1.2d, v0.2d
; CHECK-FP16-NEXT: cmhi v1.2d, v1.2d, v3.2d		; CHECK-FP16-NEXT: cmhi v1.2d, v1.2d, v3.2d
; CHECK-FP16-NEXT: and v2.16b, v2.16b, v0.16b		; CHECK-FP16-NEXT: and v0.16b, v0.16b, v2.16b
; CHECK-FP16-NEXT: and v3.16b, v3.16b, v1.16b		; CHECK-FP16-NEXT: and v3.16b, v3.16b, v1.16b
; CHECK-FP16-NEXT: orn v0.16b, v2.16b, v0.16b		; CHECK-FP16-NEXT: orn v0.16b, v0.16b, v2.16b
; CHECK-FP16-NEXT: orn v1.16b, v3.16b, v1.16b		; CHECK-FP16-NEXT: orn v1.16b, v3.16b, v1.16b
; CHECK-FP16-NEXT: xtn v0.2s, v0.2d		; CHECK-FP16-NEXT: uzp1 v0.4s, v1.4s, v0.4s
; CHECK-FP16-NEXT: xtn2 v0.4s, v1.2d
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
entry:		entry:
%conv = fptoui <4 x half> %x to <4 x i64>		%conv = fptoui <4 x half> %x to <4 x i64>
%0 = icmp ult <4 x i64> %conv, <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>		%0 = icmp ult <4 x i64> %conv, <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>
%spec.store.select = select <4 x i1> %0, <4 x i64> %conv, <4 x i64> <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>		%spec.store.select = select <4 x i1> %0, <4 x i64> %conv, <4 x i64> <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>
%conv6 = trunc <4 x i64> %spec.store.select to <4 x i32>		%conv6 = trunc <4 x i64> %spec.store.select to <4 x i32>
ret <4 x i32> %conv6		ret <4 x i32> %conv6
}		}
▲ Show 20 Lines • Show All 122 Lines • ▼ Show 20 Lines
; CHECK-CVT-LABEL: stest_f16i16:		; CHECK-CVT-LABEL: stest_f16i16:
; CHECK-CVT: // %bb.0: // %entry		; CHECK-CVT: // %bb.0: // %entry
; CHECK-CVT-NEXT: fcvtl2 v2.4s, v0.8h		; CHECK-CVT-NEXT: fcvtl2 v2.4s, v0.8h
; CHECK-CVT-NEXT: fcvtl v0.4s, v0.4h		; CHECK-CVT-NEXT: fcvtl v0.4s, v0.4h
; CHECK-CVT-NEXT: movi v1.4s, #127, msl #8		; CHECK-CVT-NEXT: movi v1.4s, #127, msl #8
; CHECK-CVT-NEXT: mvni v3.4s, #127, msl #8		; CHECK-CVT-NEXT: mvni v3.4s, #127, msl #8
; CHECK-CVT-NEXT: fcvtzs v2.4s, v2.4s		; CHECK-CVT-NEXT: fcvtzs v2.4s, v2.4s
; CHECK-CVT-NEXT: fcvtzs v0.4s, v0.4s		; CHECK-CVT-NEXT: fcvtzs v0.4s, v0.4s
; CHECK-CVT-NEXT: smin v1.4s, v2.4s, v1.4s		; CHECK-CVT-NEXT: smin v2.4s, v2.4s, v1.4s
; CHECK-CVT-NEXT: sqxtn v0.4h, v0.4s		; CHECK-CVT-NEXT: smin v0.4s, v0.4s, v1.4s
; CHECK-CVT-NEXT: smax v1.4s, v1.4s, v3.4s		; CHECK-CVT-NEXT: smax v1.4s, v2.4s, v3.4s
; CHECK-CVT-NEXT: xtn2 v0.8h, v1.4s		; CHECK-CVT-NEXT: smax v0.4s, v0.4s, v3.4s
		; CHECK-CVT-NEXT: uzp1 v0.8h, v0.8h, v1.8h
; CHECK-CVT-NEXT: ret		; CHECK-CVT-NEXT: ret
;		;
; CHECK-FP16-LABEL: stest_f16i16:		; CHECK-FP16-LABEL: stest_f16i16:
; CHECK-FP16: // %bb.0: // %entry		; CHECK-FP16: // %bb.0: // %entry
; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h		; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
entry:		entry:
%conv = fptosi <8 x half> %x to <8 x i32>		%conv = fptosi <8 x half> %x to <8 x i32>
%0 = icmp slt <8 x i32> %conv, <i32 32767, i32 32767, i32 32767, i32 32767, i32 32767, i32 32767, i32 32767, i32 32767>		%0 = icmp slt <8 x i32> %conv, <i32 32767, i32 32767, i32 32767, i32 32767, i32 32767, i32 32767, i32 32767, i32 32767>
%spec.store.select = select <8 x i1> %0, <8 x i32> %conv, <8 x i32> <i32 32767, i32 32767, i32 32767, i32 32767, i32 32767, i32 32767, i32 32767, i32 32767>		%spec.store.select = select <8 x i1> %0, <8 x i32> %conv, <8 x i32> <i32 32767, i32 32767, i32 32767, i32 32767, i32 32767, i32 32767, i32 32767, i32 32767>
%1 = icmp sgt <8 x i32> %spec.store.select, <i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768>		%1 = icmp sgt <8 x i32> %spec.store.select, <i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768>
%spec.store.select7 = select <8 x i1> %1, <8 x i32> %spec.store.select, <8 x i32> <i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768>		%spec.store.select7 = select <8 x i1> %1, <8 x i32> %spec.store.select, <8 x i32> <i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768>
%conv6 = trunc <8 x i32> %spec.store.select7 to <8 x i16>		%conv6 = trunc <8 x i32> %spec.store.select7 to <8 x i16>
ret <8 x i16> %conv6		ret <8 x i16> %conv6
}		}

define <8 x i16> @utesth_f16i16(<8 x half> %x) {		define <8 x i16> @utesth_f16i16(<8 x half> %x) {
; CHECK-LABEL: utesth_f16i16:		; CHECK-LABEL: utesth_f16i16:
; CHECK: // %bb.0: // %entry		; CHECK: // %bb.0: // %entry
; CHECK-NEXT: fcvtl2 v2.4s, v0.8h		; CHECK-NEXT: fcvtl2 v2.4s, v0.8h
; CHECK-NEXT: fcvtl v0.4s, v0.4h		; CHECK-NEXT: fcvtl v0.4s, v0.4h
; CHECK-NEXT: movi v1.2d, #0x00ffff0000ffff		; CHECK-NEXT: movi v1.2d, #0x00ffff0000ffff
; CHECK-NEXT: fcvtzu v2.4s, v2.4s		; CHECK-NEXT: fcvtzu v2.4s, v2.4s
; CHECK-NEXT: fcvtzu v0.4s, v0.4s		; CHECK-NEXT: fcvtzu v0.4s, v0.4s
; CHECK-NEXT: umin v1.4s, v2.4s, v1.4s		; CHECK-NEXT: umin v2.4s, v2.4s, v1.4s
; CHECK-NEXT: uqxtn v0.4h, v0.4s		; CHECK-NEXT: umin v0.4s, v0.4s, v1.4s
; CHECK-NEXT: xtn2 v0.8h, v1.4s		; CHECK-NEXT: uzp1 v0.8h, v0.8h, v2.8h
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%conv = fptoui <8 x half> %x to <8 x i32>		%conv = fptoui <8 x half> %x to <8 x i32>
%0 = icmp ult <8 x i32> %conv, <i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535>		%0 = icmp ult <8 x i32> %conv, <i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535>
%spec.store.select = select <8 x i1> %0, <8 x i32> %conv, <8 x i32> <i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535>		%spec.store.select = select <8 x i1> %0, <8 x i32> %conv, <8 x i32> <i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535>
%conv6 = trunc <8 x i32> %spec.store.select to <8 x i16>		%conv6 = trunc <8 x i32> %spec.store.select to <8 x i16>
ret <8 x i16> %conv6		ret <8 x i16> %conv6
}		}

define <8 x i16> @ustest_f16i16(<8 x half> %x) {		define <8 x i16> @ustest_f16i16(<8 x half> %x) {
; CHECK-CVT-LABEL: ustest_f16i16:		; CHECK-CVT-LABEL: ustest_f16i16:
; CHECK-CVT: // %bb.0: // %entry		; CHECK-CVT: // %bb.0: // %entry
; CHECK-CVT-NEXT: fcvtl2 v2.4s, v0.8h		; CHECK-CVT-NEXT: fcvtl2 v2.4s, v0.8h
; CHECK-CVT-NEXT: fcvtl v0.4s, v0.4h		; CHECK-CVT-NEXT: fcvtl v0.4s, v0.4h
; CHECK-CVT-NEXT: movi v1.2d, #0x00ffff0000ffff		; CHECK-CVT-NEXT: movi v1.2d, #0x00ffff0000ffff
; CHECK-CVT-NEXT: fcvtzu v2.4s, v2.4s		; CHECK-CVT-NEXT: fcvtzu v2.4s, v2.4s
; CHECK-CVT-NEXT: fcvtzu v0.4s, v0.4s		; CHECK-CVT-NEXT: fcvtzu v0.4s, v0.4s
; CHECK-CVT-NEXT: umin v1.4s, v2.4s, v1.4s		; CHECK-CVT-NEXT: umin v2.4s, v2.4s, v1.4s
; CHECK-CVT-NEXT: uqxtn v0.4h, v0.4s		; CHECK-CVT-NEXT: umin v0.4s, v0.4s, v1.4s
; CHECK-CVT-NEXT: xtn2 v0.8h, v1.4s		; CHECK-CVT-NEXT: uzp1 v0.8h, v0.8h, v2.8h
; CHECK-CVT-NEXT: ret		; CHECK-CVT-NEXT: ret
;		;
; CHECK-FP16-LABEL: ustest_f16i16:		; CHECK-FP16-LABEL: ustest_f16i16:
; CHECK-FP16: // %bb.0: // %entry		; CHECK-FP16: // %bb.0: // %entry
; CHECK-FP16-NEXT: fcvtzu v0.8h, v0.8h		; CHECK-FP16-NEXT: fcvtzu v0.8h, v0.8h
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
entry:		entry:
%conv = fptosi <8 x half> %x to <8 x i32>		%conv = fptosi <8 x half> %x to <8 x i32>
▲ Show 20 Lines • Show All 422 Lines • ▼ Show 20 Lines	entry:
%spec.store.select7 = call <4 x i64> @llvm.smax.v4i64(<4 x i64> %spec.store.select, <4 x i64> <i64 -2147483648, i64 -2147483648, i64 -2147483648, i64 -2147483648>)		%spec.store.select7 = call <4 x i64> @llvm.smax.v4i64(<4 x i64> %spec.store.select, <4 x i64> <i64 -2147483648, i64 -2147483648, i64 -2147483648, i64 -2147483648>)
%conv6 = trunc <4 x i64> %spec.store.select7 to <4 x i32>		%conv6 = trunc <4 x i64> %spec.store.select7 to <4 x i32>
ret <4 x i32> %conv6		ret <4 x i32> %conv6
}		}

define <4 x i32> @utest_f32i32_mm(<4 x float> %x) {		define <4 x i32> @utest_f32i32_mm(<4 x float> %x) {
; CHECK-LABEL: utest_f32i32_mm:		; CHECK-LABEL: utest_f32i32_mm:
; CHECK: // %bb.0: // %entry		; CHECK: // %bb.0: // %entry
; CHECK-NEXT: fcvtl v2.2d, v0.2s		; CHECK-NEXT: fcvtl2 v2.2d, v0.4s
; CHECK-NEXT: fcvtl2 v0.2d, v0.4s		; CHECK-NEXT: fcvtl v0.2d, v0.2s
; CHECK-NEXT: movi v1.2d, #0x000000ffffffff		; CHECK-NEXT: movi v1.2d, #0x000000ffffffff
; CHECK-NEXT: fcvtzu v2.2d, v2.2d		; CHECK-NEXT: fcvtzu v2.2d, v2.2d
; CHECK-NEXT: fcvtzu v0.2d, v0.2d		; CHECK-NEXT: fcvtzu v0.2d, v0.2d
; CHECK-NEXT: cmhi v3.2d, v1.2d, v2.2d		; CHECK-NEXT: cmhi v3.2d, v1.2d, v2.2d
; CHECK-NEXT: cmhi v1.2d, v1.2d, v0.2d		; CHECK-NEXT: cmhi v1.2d, v1.2d, v0.2d
; CHECK-NEXT: and v2.16b, v2.16b, v3.16b		; CHECK-NEXT: and v2.16b, v2.16b, v3.16b
; CHECK-NEXT: and v0.16b, v0.16b, v1.16b		; CHECK-NEXT: and v0.16b, v0.16b, v1.16b
; CHECK-NEXT: orn v2.16b, v2.16b, v3.16b		; CHECK-NEXT: orn v2.16b, v2.16b, v3.16b
; CHECK-NEXT: orn v1.16b, v0.16b, v1.16b		; CHECK-NEXT: orn v0.16b, v0.16b, v1.16b
; CHECK-NEXT: xtn v0.2s, v2.2d		; CHECK-NEXT: uzp1 v0.4s, v0.4s, v2.4s
; CHECK-NEXT: xtn2 v0.4s, v1.2d
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%conv = fptoui <4 x float> %x to <4 x i64>		%conv = fptoui <4 x float> %x to <4 x i64>
%spec.store.select = call <4 x i64> @llvm.umin.v4i64(<4 x i64> %conv, <4 x i64> <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>)		%spec.store.select = call <4 x i64> @llvm.umin.v4i64(<4 x i64> %conv, <4 x i64> <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>)
%conv6 = trunc <4 x i64> %spec.store.select to <4 x i32>		%conv6 = trunc <4 x i64> %spec.store.select to <4 x i32>
ret <4 x i32> %conv6		ret <4 x i32> %conv6
}		}

Show All 24 Lines	entry:
ret <4 x i32> %conv6		ret <4 x i32> %conv6
}		}

define <4 x i32> @utesth_f16i32_mm(<4 x half> %x) {		define <4 x i32> @utesth_f16i32_mm(<4 x half> %x) {
; CHECK-CVT-LABEL: utesth_f16i32_mm:		; CHECK-CVT-LABEL: utesth_f16i32_mm:
; CHECK-CVT: // %bb.0: // %entry		; CHECK-CVT: // %bb.0: // %entry
; CHECK-CVT-NEXT: // kill: def $d0 killed $d0 def $q0		; CHECK-CVT-NEXT: // kill: def $d0 killed $d0 def $q0
; CHECK-CVT-NEXT: mov h2, v0.h[2]		; CHECK-CVT-NEXT: mov h2, v0.h[2]
; CHECK-CVT-NEXT: mov h3, v0.h[1]		; CHECK-CVT-NEXT: mov h3, v0.h[3]
; CHECK-CVT-NEXT: fcvt s4, h0		; CHECK-CVT-NEXT: mov h4, v0.h[1]
; CHECK-CVT-NEXT: mov h0, v0.h[3]		; CHECK-CVT-NEXT: fcvt s0, h0
; CHECK-CVT-NEXT: movi v1.2d, #0x000000ffffffff		; CHECK-CVT-NEXT: movi v1.2d, #0x000000ffffffff
; CHECK-CVT-NEXT: fcvt s2, h2		; CHECK-CVT-NEXT: fcvt s2, h2
; CHECK-CVT-NEXT: fcvt s3, h3		; CHECK-CVT-NEXT: fcvt s3, h3
; CHECK-CVT-NEXT: fcvtzu x8, s4		; CHECK-CVT-NEXT: fcvtzu x9, s0
; CHECK-CVT-NEXT: fcvt s0, h0		; CHECK-CVT-NEXT: fcvtzu x8, s2
; CHECK-CVT-NEXT: fcvtzu x9, s2		; CHECK-CVT-NEXT: fcvt s2, h4
; CHECK-CVT-NEXT: fmov d2, x8		; CHECK-CVT-NEXT: fmov d0, x8
; CHECK-CVT-NEXT: fcvtzu x8, s3		; CHECK-CVT-NEXT: fcvtzu x8, s3
; CHECK-CVT-NEXT: fmov d3, x9		; CHECK-CVT-NEXT: fmov d3, x9
; CHECK-CVT-NEXT: fcvtzu x9, s0		; CHECK-CVT-NEXT: fcvtzu x9, s2
; CHECK-CVT-NEXT: mov v2.d[1], x8		; CHECK-CVT-NEXT: mov v0.d[1], x8
; CHECK-CVT-NEXT: mov v3.d[1], x9		; CHECK-CVT-NEXT: mov v3.d[1], x9
; CHECK-CVT-NEXT: cmhi v0.2d, v1.2d, v2.2d		; CHECK-CVT-NEXT: cmhi v2.2d, v1.2d, v0.2d
; CHECK-CVT-NEXT: cmhi v1.2d, v1.2d, v3.2d		; CHECK-CVT-NEXT: cmhi v1.2d, v1.2d, v3.2d
; CHECK-CVT-NEXT: and v2.16b, v2.16b, v0.16b		; CHECK-CVT-NEXT: and v0.16b, v0.16b, v2.16b
; CHECK-CVT-NEXT: and v3.16b, v3.16b, v1.16b		; CHECK-CVT-NEXT: and v3.16b, v3.16b, v1.16b
; CHECK-CVT-NEXT: orn v0.16b, v2.16b, v0.16b		; CHECK-CVT-NEXT: orn v0.16b, v0.16b, v2.16b
; CHECK-CVT-NEXT: orn v1.16b, v3.16b, v1.16b		; CHECK-CVT-NEXT: orn v1.16b, v3.16b, v1.16b
; CHECK-CVT-NEXT: xtn v0.2s, v0.2d		; CHECK-CVT-NEXT: uzp1 v0.4s, v1.4s, v0.4s
; CHECK-CVT-NEXT: xtn2 v0.4s, v1.2d
; CHECK-CVT-NEXT: ret		; CHECK-CVT-NEXT: ret
;		;
; CHECK-FP16-LABEL: utesth_f16i32_mm:		; CHECK-FP16-LABEL: utesth_f16i32_mm:
; CHECK-FP16: // %bb.0: // %entry		; CHECK-FP16: // %bb.0: // %entry
; CHECK-FP16-NEXT: // kill: def $d0 killed $d0 def $q0		; CHECK-FP16-NEXT: // kill: def $d0 killed $d0 def $q0
; CHECK-FP16-NEXT: mov h2, v0.h[2]		; CHECK-FP16-NEXT: mov h2, v0.h[2]
; CHECK-FP16-NEXT: mov h3, v0.h[1]		; CHECK-FP16-NEXT: mov h3, v0.h[3]
; CHECK-FP16-NEXT: fcvtzu x8, h0		; CHECK-FP16-NEXT: fcvtzu x9, h0
; CHECK-FP16-NEXT: mov h0, v0.h[3]
; CHECK-FP16-NEXT: movi v1.2d, #0x000000ffffffff		; CHECK-FP16-NEXT: movi v1.2d, #0x000000ffffffff
; CHECK-FP16-NEXT: fcvtzu x9, h2		; CHECK-FP16-NEXT: fcvtzu x8, h2
; CHECK-FP16-NEXT: fmov d2, x8		; CHECK-FP16-NEXT: mov h2, v0.h[1]
		; CHECK-FP16-NEXT: fmov d0, x8
; CHECK-FP16-NEXT: fcvtzu x8, h3		; CHECK-FP16-NEXT: fcvtzu x8, h3
; CHECK-FP16-NEXT: fmov d3, x9		; CHECK-FP16-NEXT: fmov d3, x9
; CHECK-FP16-NEXT: fcvtzu x9, h0		; CHECK-FP16-NEXT: fcvtzu x9, h2
; CHECK-FP16-NEXT: mov v2.d[1], x8		; CHECK-FP16-NEXT: mov v0.d[1], x8
; CHECK-FP16-NEXT: mov v3.d[1], x9		; CHECK-FP16-NEXT: mov v3.d[1], x9
; CHECK-FP16-NEXT: cmhi v0.2d, v1.2d, v2.2d		; CHECK-FP16-NEXT: cmhi v2.2d, v1.2d, v0.2d
; CHECK-FP16-NEXT: cmhi v1.2d, v1.2d, v3.2d		; CHECK-FP16-NEXT: cmhi v1.2d, v1.2d, v3.2d
; CHECK-FP16-NEXT: and v2.16b, v2.16b, v0.16b		; CHECK-FP16-NEXT: and v0.16b, v0.16b, v2.16b
; CHECK-FP16-NEXT: and v3.16b, v3.16b, v1.16b		; CHECK-FP16-NEXT: and v3.16b, v3.16b, v1.16b
; CHECK-FP16-NEXT: orn v0.16b, v2.16b, v0.16b		; CHECK-FP16-NEXT: orn v0.16b, v0.16b, v2.16b
; CHECK-FP16-NEXT: orn v1.16b, v3.16b, v1.16b		; CHECK-FP16-NEXT: orn v1.16b, v3.16b, v1.16b
; CHECK-FP16-NEXT: xtn v0.2s, v0.2d		; CHECK-FP16-NEXT: uzp1 v0.4s, v1.4s, v0.4s
; CHECK-FP16-NEXT: xtn2 v0.4s, v1.2d
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
entry:		entry:
%conv = fptoui <4 x half> %x to <4 x i64>		%conv = fptoui <4 x half> %x to <4 x i64>
%spec.store.select = call <4 x i64> @llvm.umin.v4i64(<4 x i64> %conv, <4 x i64> <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>)		%spec.store.select = call <4 x i64> @llvm.umin.v4i64(<4 x i64> %conv, <4 x i64> <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>)
%conv6 = trunc <4 x i64> %spec.store.select to <4 x i32>		%conv6 = trunc <4 x i64> %spec.store.select to <4 x i32>
ret <4 x i32> %conv6		ret <4 x i32> %conv6
}		}

▲ Show 20 Lines • Show All 109 Lines • ▼ Show 20 Lines
; CHECK-CVT-LABEL: stest_f16i16_mm:		; CHECK-CVT-LABEL: stest_f16i16_mm:
; CHECK-CVT: // %bb.0: // %entry		; CHECK-CVT: // %bb.0: // %entry
; CHECK-CVT-NEXT: fcvtl2 v2.4s, v0.8h		; CHECK-CVT-NEXT: fcvtl2 v2.4s, v0.8h
; CHECK-CVT-NEXT: fcvtl v0.4s, v0.4h		; CHECK-CVT-NEXT: fcvtl v0.4s, v0.4h
; CHECK-CVT-NEXT: movi v1.4s, #127, msl #8		; CHECK-CVT-NEXT: movi v1.4s, #127, msl #8
; CHECK-CVT-NEXT: mvni v3.4s, #127, msl #8		; CHECK-CVT-NEXT: mvni v3.4s, #127, msl #8
; CHECK-CVT-NEXT: fcvtzs v2.4s, v2.4s		; CHECK-CVT-NEXT: fcvtzs v2.4s, v2.4s
; CHECK-CVT-NEXT: fcvtzs v0.4s, v0.4s		; CHECK-CVT-NEXT: fcvtzs v0.4s, v0.4s
; CHECK-CVT-NEXT: smin v1.4s, v2.4s, v1.4s		; CHECK-CVT-NEXT: smin v2.4s, v2.4s, v1.4s
; CHECK-CVT-NEXT: sqxtn v0.4h, v0.4s		; CHECK-CVT-NEXT: smin v0.4s, v0.4s, v1.4s
; CHECK-CVT-NEXT: smax v1.4s, v1.4s, v3.4s		; CHECK-CVT-NEXT: smax v1.4s, v2.4s, v3.4s
; CHECK-CVT-NEXT: xtn2 v0.8h, v1.4s		; CHECK-CVT-NEXT: smax v0.4s, v0.4s, v3.4s
		; CHECK-CVT-NEXT: uzp1 v0.8h, v0.8h, v1.8h
; CHECK-CVT-NEXT: ret		; CHECK-CVT-NEXT: ret
;		;
; CHECK-FP16-LABEL: stest_f16i16_mm:		; CHECK-FP16-LABEL: stest_f16i16_mm:
; CHECK-FP16: // %bb.0: // %entry		; CHECK-FP16: // %bb.0: // %entry
; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h		; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
entry:		entry:
%conv = fptosi <8 x half> %x to <8 x i32>		%conv = fptosi <8 x half> %x to <8 x i32>
%spec.store.select = call <8 x i32> @llvm.smin.v8i32(<8 x i32> %conv, <8 x i32> <i32 32767, i32 32767, i32 32767, i32 32767, i32 32767, i32 32767, i32 32767, i32 32767>)		%spec.store.select = call <8 x i32> @llvm.smin.v8i32(<8 x i32> %conv, <8 x i32> <i32 32767, i32 32767, i32 32767, i32 32767, i32 32767, i32 32767, i32 32767, i32 32767>)
%spec.store.select7 = call <8 x i32> @llvm.smax.v8i32(<8 x i32> %spec.store.select, <8 x i32> <i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768>)		%spec.store.select7 = call <8 x i32> @llvm.smax.v8i32(<8 x i32> %spec.store.select, <8 x i32> <i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768, i32 -32768>)
%conv6 = trunc <8 x i32> %spec.store.select7 to <8 x i16>		%conv6 = trunc <8 x i32> %spec.store.select7 to <8 x i16>
ret <8 x i16> %conv6		ret <8 x i16> %conv6
}		}

define <8 x i16> @utesth_f16i16_mm(<8 x half> %x) {		define <8 x i16> @utesth_f16i16_mm(<8 x half> %x) {
; CHECK-LABEL: utesth_f16i16_mm:		; CHECK-LABEL: utesth_f16i16_mm:
; CHECK: // %bb.0: // %entry		; CHECK: // %bb.0: // %entry
; CHECK-NEXT: fcvtl2 v2.4s, v0.8h		; CHECK-NEXT: fcvtl2 v2.4s, v0.8h
; CHECK-NEXT: fcvtl v0.4s, v0.4h		; CHECK-NEXT: fcvtl v0.4s, v0.4h
; CHECK-NEXT: movi v1.2d, #0x00ffff0000ffff		; CHECK-NEXT: movi v1.2d, #0x00ffff0000ffff
; CHECK-NEXT: fcvtzu v2.4s, v2.4s		; CHECK-NEXT: fcvtzu v2.4s, v2.4s
; CHECK-NEXT: fcvtzu v0.4s, v0.4s		; CHECK-NEXT: fcvtzu v0.4s, v0.4s
; CHECK-NEXT: umin v1.4s, v2.4s, v1.4s		; CHECK-NEXT: umin v2.4s, v2.4s, v1.4s
; CHECK-NEXT: uqxtn v0.4h, v0.4s		; CHECK-NEXT: umin v0.4s, v0.4s, v1.4s
; CHECK-NEXT: xtn2 v0.8h, v1.4s		; CHECK-NEXT: uzp1 v0.8h, v0.8h, v2.8h
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%conv = fptoui <8 x half> %x to <8 x i32>		%conv = fptoui <8 x half> %x to <8 x i32>
%spec.store.select = call <8 x i32> @llvm.umin.v8i32(<8 x i32> %conv, <8 x i32> <i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535>)		%spec.store.select = call <8 x i32> @llvm.umin.v8i32(<8 x i32> %conv, <8 x i32> <i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535>)
%conv6 = trunc <8 x i32> %spec.store.select to <8 x i16>		%conv6 = trunc <8 x i32> %spec.store.select to <8 x i16>
ret <8 x i16> %conv6		ret <8 x i16> %conv6
}		}

define <8 x i16> @ustest_f16i16_mm(<8 x half> %x) {		define <8 x i16> @ustest_f16i16_mm(<8 x half> %x) {
; CHECK-CVT-LABEL: ustest_f16i16_mm:		; CHECK-CVT-LABEL: ustest_f16i16_mm:
; CHECK-CVT: // %bb.0: // %entry		; CHECK-CVT: // %bb.0: // %entry
; CHECK-CVT-NEXT: fcvtl2 v2.4s, v0.8h		; CHECK-CVT-NEXT: fcvtl2 v2.4s, v0.8h
; CHECK-CVT-NEXT: fcvtl v0.4s, v0.4h		; CHECK-CVT-NEXT: fcvtl v0.4s, v0.4h
; CHECK-CVT-NEXT: movi v1.2d, #0x00ffff0000ffff		; CHECK-CVT-NEXT: movi v1.2d, #0x00ffff0000ffff
; CHECK-CVT-NEXT: fcvtzu v2.4s, v2.4s		; CHECK-CVT-NEXT: fcvtzu v2.4s, v2.4s
; CHECK-CVT-NEXT: fcvtzu v0.4s, v0.4s		; CHECK-CVT-NEXT: fcvtzu v0.4s, v0.4s
; CHECK-CVT-NEXT: umin v1.4s, v2.4s, v1.4s		; CHECK-CVT-NEXT: umin v2.4s, v2.4s, v1.4s
; CHECK-CVT-NEXT: uqxtn v0.4h, v0.4s		; CHECK-CVT-NEXT: umin v0.4s, v0.4s, v1.4s
; CHECK-CVT-NEXT: xtn2 v0.8h, v1.4s		; CHECK-CVT-NEXT: uzp1 v0.8h, v0.8h, v2.8h
; CHECK-CVT-NEXT: ret		; CHECK-CVT-NEXT: ret
;		;
; CHECK-FP16-LABEL: ustest_f16i16_mm:		; CHECK-FP16-LABEL: ustest_f16i16_mm:
; CHECK-FP16: // %bb.0: // %entry		; CHECK-FP16: // %bb.0: // %entry
; CHECK-FP16-NEXT: fcvtzu v0.8h, v0.8h		; CHECK-FP16-NEXT: fcvtzu v0.8h, v0.8h
; CHECK-FP16-NEXT: ret		; CHECK-FP16-NEXT: ret
entry:		entry:
%conv = fptosi <8 x half> %x to <8 x i32>		%conv = fptosi <8 x half> %x to <8 x i32>
▲ Show 20 Lines • Show All 352 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/fptosi-sat-vector.ll

	Show First 20 Lines • Show All 2,087 Lines • ▼ Show 20 Lines
	; CHECK-CVT-NEXT: cmp w10, #0			; CHECK-CVT-NEXT: cmp w10, #0
	; CHECK-CVT-NEXT: csel w10, w10, wzr, lt			; CHECK-CVT-NEXT: csel w10, w10, wzr, lt
	; CHECK-CVT-NEXT: fcvtzs w12, s2			; CHECK-CVT-NEXT: fcvtzs w12, s2
	; CHECK-CVT-NEXT: cmp w10, #0			; CHECK-CVT-NEXT: cmp w10, #0
	; CHECK-CVT-NEXT: mov s0, v0.s[3]			; CHECK-CVT-NEXT: mov s0, v0.s[3]
	; CHECK-CVT-NEXT: csinv w10, w10, wzr, ge			; CHECK-CVT-NEXT: csinv w10, w10, wzr, ge
	; CHECK-CVT-NEXT: cmp w11, #0			; CHECK-CVT-NEXT: cmp w11, #0
	; CHECK-CVT-NEXT: csel w11, w11, wzr, lt			; CHECK-CVT-NEXT: csel w11, w11, wzr, lt
	; CHECK-CVT-NEXT: fcvtzs w14, s1
	; CHECK-CVT-NEXT: cmp w11, #0
	; CHECK-CVT-NEXT: fmov s2, w9			; CHECK-CVT-NEXT: fmov s2, w9
				; CHECK-CVT-NEXT: cmp w11, #0
	; CHECK-CVT-NEXT: csinv w11, w11, wzr, ge			; CHECK-CVT-NEXT: csinv w11, w11, wzr, ge
	; CHECK-CVT-NEXT: cmp w12, #0			; CHECK-CVT-NEXT: cmp w12, #0
	; CHECK-CVT-NEXT: csel w12, w12, wzr, lt			; CHECK-CVT-NEXT: csel w12, w12, wzr, lt
	; CHECK-CVT-NEXT: cmp w12, #0			; CHECK-CVT-NEXT: cmp w12, #0
	; CHECK-CVT-NEXT: csinv w12, w12, wzr, ge			; CHECK-CVT-NEXT: csinv w12, w12, wzr, ge
	; CHECK-CVT-NEXT: cmp w13, #0			; CHECK-CVT-NEXT: cmp w13, #0
	; CHECK-CVT-NEXT: csel w13, w13, wzr, lt			; CHECK-CVT-NEXT: csel w13, w13, wzr, lt
	; CHECK-CVT-NEXT: cmp w13, #0			; CHECK-CVT-NEXT: cmp w13, #0
	; CHECK-CVT-NEXT: csinv w13, w13, wzr, ge			; CHECK-CVT-NEXT: csinv w9, w13, wzr, ge
	; CHECK-CVT-NEXT: cmp w14, #0			; CHECK-CVT-NEXT: fcvtzs w13, s1
	; CHECK-CVT-NEXT: csel w9, w14, wzr, lt
	; CHECK-CVT-NEXT: cmp w9, #0
	; CHECK-CVT-NEXT: fmov s1, w13
	; CHECK-CVT-NEXT: fcvtzs w13, s0
	; CHECK-CVT-NEXT: csinv w9, w9, wzr, ge
	; CHECK-CVT-NEXT: mov v2.s[1], w8			; CHECK-CVT-NEXT: mov v2.s[1], w8
	; CHECK-CVT-NEXT: mov v1.s[1], w12			; CHECK-CVT-NEXT: fmov s1, w9
	; CHECK-CVT-NEXT: cmp w13, #0			; CHECK-CVT-NEXT: cmp w13, #0
	; CHECK-CVT-NEXT: csel w8, w13, wzr, lt			; CHECK-CVT-NEXT: csel w8, w13, wzr, lt
				; CHECK-CVT-NEXT: fcvtzs w9, s0
	; CHECK-CVT-NEXT: cmp w8, #0			; CHECK-CVT-NEXT: cmp w8, #0
				; CHECK-CVT-NEXT: mov v1.s[1], w12
	; CHECK-CVT-NEXT: csinv w8, w8, wzr, ge			; CHECK-CVT-NEXT: csinv w8, w8, wzr, ge
	; CHECK-CVT-NEXT: mov v1.s[2], w9			; CHECK-CVT-NEXT: cmp w9, #0
				; CHECK-CVT-NEXT: csel w9, w9, wzr, lt
	; CHECK-CVT-NEXT: mov v2.s[2], w10			; CHECK-CVT-NEXT: mov v2.s[2], w10
	; CHECK-CVT-NEXT: mov v1.s[3], w8			; CHECK-CVT-NEXT: cmp w9, #0
				; CHECK-CVT-NEXT: mov v1.s[2], w8
				; CHECK-CVT-NEXT: csinv w8, w9, wzr, ge
	; CHECK-CVT-NEXT: mov v2.s[3], w11			; CHECK-CVT-NEXT: mov v2.s[3], w11
	; CHECK-CVT-NEXT: xtn v0.4h, v1.4s			; CHECK-CVT-NEXT: mov v1.s[3], w8
	; CHECK-CVT-NEXT: xtn2 v0.8h, v2.4s			; CHECK-CVT-NEXT: uzp1 v0.8h, v1.8h, v2.8h
	; CHECK-CVT-NEXT: xtn v0.8b, v0.8h			; CHECK-CVT-NEXT: xtn v0.8b, v0.8h
	; CHECK-CVT-NEXT: ret			; CHECK-CVT-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: test_signed_v8f16_v8i1:			; CHECK-FP16-LABEL: test_signed_v8f16_v8i1:
	; CHECK-FP16: // %bb.0:			; CHECK-FP16: // %bb.0:
	; CHECK-FP16-NEXT: movi v1.2d, #0000000000000000			; CHECK-FP16-NEXT: movi v1.2d, #0000000000000000
	; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h			; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h
	; CHECK-FP16-NEXT: smin v0.8h, v0.8h, v1.8h			; CHECK-FP16-NEXT: smin v0.8h, v0.8h, v1.8h
	Show All 33 Lines
	; CHECK-CVT-NEXT: cmp w12, #127			; CHECK-CVT-NEXT: cmp w12, #127
	; CHECK-CVT-NEXT: csel w12, w12, w8, lt			; CHECK-CVT-NEXT: csel w12, w12, w8, lt
	; CHECK-CVT-NEXT: fcvtzs w14, s2			; CHECK-CVT-NEXT: fcvtzs w14, s2
	; CHECK-CVT-NEXT: cmn w12, #128			; CHECK-CVT-NEXT: cmn w12, #128
	; CHECK-CVT-NEXT: mov s0, v0.s[3]			; CHECK-CVT-NEXT: mov s0, v0.s[3]
	; CHECK-CVT-NEXT: csel w12, w12, w10, gt			; CHECK-CVT-NEXT: csel w12, w12, w10, gt
	; CHECK-CVT-NEXT: cmp w13, #127			; CHECK-CVT-NEXT: cmp w13, #127
	; CHECK-CVT-NEXT: csel w13, w13, w8, lt			; CHECK-CVT-NEXT: csel w13, w13, w8, lt
	; CHECK-CVT-NEXT: fcvtzs w16, s1
	; CHECK-CVT-NEXT: cmn w13, #128
	; CHECK-CVT-NEXT: fmov s2, w11			; CHECK-CVT-NEXT: fmov s2, w11
				; CHECK-CVT-NEXT: cmn w13, #128
	; CHECK-CVT-NEXT: csel w13, w13, w10, gt			; CHECK-CVT-NEXT: csel w13, w13, w10, gt
	; CHECK-CVT-NEXT: cmp w14, #127			; CHECK-CVT-NEXT: cmp w14, #127
	; CHECK-CVT-NEXT: csel w14, w14, w8, lt			; CHECK-CVT-NEXT: csel w14, w14, w8, lt
	; CHECK-CVT-NEXT: cmn w14, #128			; CHECK-CVT-NEXT: cmn w14, #128
	; CHECK-CVT-NEXT: csel w14, w14, w10, gt			; CHECK-CVT-NEXT: csel w14, w14, w10, gt
	; CHECK-CVT-NEXT: cmp w15, #127			; CHECK-CVT-NEXT: cmp w15, #127
	; CHECK-CVT-NEXT: csel w15, w15, w8, lt			; CHECK-CVT-NEXT: csel w15, w15, w8, lt
	; CHECK-CVT-NEXT: cmn w15, #128			; CHECK-CVT-NEXT: cmn w15, #128
	; CHECK-CVT-NEXT: csel w15, w15, w10, gt			; CHECK-CVT-NEXT: csel w11, w15, w10, gt
	; CHECK-CVT-NEXT: cmp w16, #127			; CHECK-CVT-NEXT: fcvtzs w15, s1
	; CHECK-CVT-NEXT: csel w11, w16, w8, lt
	; CHECK-CVT-NEXT: cmn w11, #128
	; CHECK-CVT-NEXT: fmov s1, w15
	; CHECK-CVT-NEXT: fcvtzs w15, s0
	; CHECK-CVT-NEXT: csel w11, w11, w10, gt
	; CHECK-CVT-NEXT: mov v2.s[1], w9			; CHECK-CVT-NEXT: mov v2.s[1], w9
	; CHECK-CVT-NEXT: mov v1.s[1], w14			; CHECK-CVT-NEXT: fmov s1, w11
	; CHECK-CVT-NEXT: cmp w15, #127			; CHECK-CVT-NEXT: cmp w15, #127
	; CHECK-CVT-NEXT: csel w8, w15, w8, lt			; CHECK-CVT-NEXT: csel w9, w15, w8, lt
				; CHECK-CVT-NEXT: fcvtzs w11, s0
				; CHECK-CVT-NEXT: cmn w9, #128
				; CHECK-CVT-NEXT: mov v1.s[1], w14
				; CHECK-CVT-NEXT: csel w9, w9, w10, gt
				; CHECK-CVT-NEXT: cmp w11, #127
				; CHECK-CVT-NEXT: csel w8, w11, w8, lt
				; CHECK-CVT-NEXT: mov v2.s[2], w12
	; CHECK-CVT-NEXT: cmn w8, #128			; CHECK-CVT-NEXT: cmn w8, #128
				; CHECK-CVT-NEXT: mov v1.s[2], w9
	; CHECK-CVT-NEXT: csel w8, w8, w10, gt			; CHECK-CVT-NEXT: csel w8, w8, w10, gt
	; CHECK-CVT-NEXT: mov v1.s[2], w11
	; CHECK-CVT-NEXT: mov v2.s[2], w12
	; CHECK-CVT-NEXT: mov v1.s[3], w8
	; CHECK-CVT-NEXT: mov v2.s[3], w13			; CHECK-CVT-NEXT: mov v2.s[3], w13
	; CHECK-CVT-NEXT: xtn v0.4h, v1.4s			; CHECK-CVT-NEXT: mov v1.s[3], w8
	; CHECK-CVT-NEXT: xtn2 v0.8h, v2.4s			; CHECK-CVT-NEXT: uzp1 v0.8h, v1.8h, v2.8h
	; CHECK-CVT-NEXT: xtn v0.8b, v0.8h			; CHECK-CVT-NEXT: xtn v0.8b, v0.8h
	; CHECK-CVT-NEXT: ret			; CHECK-CVT-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: test_signed_v8f16_v8i8:			; CHECK-FP16-LABEL: test_signed_v8f16_v8i8:
	; CHECK-FP16: // %bb.0:			; CHECK-FP16: // %bb.0:
	; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h			; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h
	; CHECK-FP16-NEXT: sqxtn v0.8b, v0.8h			; CHECK-FP16-NEXT: sqxtn v0.8b, v0.8h
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-NEXT: ret
	Show All 29 Lines
	; CHECK-CVT-NEXT: cmp w12, #4095			; CHECK-CVT-NEXT: cmp w12, #4095
	; CHECK-CVT-NEXT: csel w12, w12, w8, lt			; CHECK-CVT-NEXT: csel w12, w12, w8, lt
	; CHECK-CVT-NEXT: fcvtzs w14, s2			; CHECK-CVT-NEXT: fcvtzs w14, s2
	; CHECK-CVT-NEXT: cmn w12, #1, lsl #12 // =4096			; CHECK-CVT-NEXT: cmn w12, #1, lsl #12 // =4096
	; CHECK-CVT-NEXT: mov s0, v0.s[3]			; CHECK-CVT-NEXT: mov s0, v0.s[3]
	; CHECK-CVT-NEXT: csel w12, w12, w10, gt			; CHECK-CVT-NEXT: csel w12, w12, w10, gt
	; CHECK-CVT-NEXT: cmp w13, #4095			; CHECK-CVT-NEXT: cmp w13, #4095
	; CHECK-CVT-NEXT: csel w13, w13, w8, lt			; CHECK-CVT-NEXT: csel w13, w13, w8, lt
	; CHECK-CVT-NEXT: fcvtzs w16, s1
	; CHECK-CVT-NEXT: cmn w13, #1, lsl #12 // =4096
	; CHECK-CVT-NEXT: fmov s2, w11			; CHECK-CVT-NEXT: fmov s2, w11
				; CHECK-CVT-NEXT: cmn w13, #1, lsl #12 // =4096
	; CHECK-CVT-NEXT: csel w13, w13, w10, gt			; CHECK-CVT-NEXT: csel w13, w13, w10, gt
	; CHECK-CVT-NEXT: cmp w14, #4095			; CHECK-CVT-NEXT: cmp w14, #4095
	; CHECK-CVT-NEXT: csel w14, w14, w8, lt			; CHECK-CVT-NEXT: csel w14, w14, w8, lt
	; CHECK-CVT-NEXT: cmn w14, #1, lsl #12 // =4096			; CHECK-CVT-NEXT: cmn w14, #1, lsl #12 // =4096
	; CHECK-CVT-NEXT: csel w14, w14, w10, gt			; CHECK-CVT-NEXT: csel w14, w14, w10, gt
	; CHECK-CVT-NEXT: cmp w15, #4095			; CHECK-CVT-NEXT: cmp w15, #4095
	; CHECK-CVT-NEXT: csel w15, w15, w8, lt			; CHECK-CVT-NEXT: csel w15, w15, w8, lt
	; CHECK-CVT-NEXT: cmn w15, #1, lsl #12 // =4096			; CHECK-CVT-NEXT: cmn w15, #1, lsl #12 // =4096
	; CHECK-CVT-NEXT: csel w15, w15, w10, gt			; CHECK-CVT-NEXT: csel w11, w15, w10, gt
	; CHECK-CVT-NEXT: cmp w16, #4095			; CHECK-CVT-NEXT: fcvtzs w15, s1
	; CHECK-CVT-NEXT: csel w11, w16, w8, lt
	; CHECK-CVT-NEXT: cmn w11, #1, lsl #12 // =4096
	; CHECK-CVT-NEXT: fmov s1, w15
	; CHECK-CVT-NEXT: fcvtzs w15, s0
	; CHECK-CVT-NEXT: csel w11, w11, w10, gt
	; CHECK-CVT-NEXT: mov v2.s[1], w9			; CHECK-CVT-NEXT: mov v2.s[1], w9
	; CHECK-CVT-NEXT: mov v1.s[1], w14			; CHECK-CVT-NEXT: fmov s1, w11
	; CHECK-CVT-NEXT: cmp w15, #4095			; CHECK-CVT-NEXT: cmp w15, #4095
	; CHECK-CVT-NEXT: csel w8, w15, w8, lt			; CHECK-CVT-NEXT: csel w9, w15, w8, lt
				; CHECK-CVT-NEXT: fcvtzs w11, s0
				; CHECK-CVT-NEXT: cmn w9, #1, lsl #12 // =4096
				; CHECK-CVT-NEXT: mov v1.s[1], w14
				; CHECK-CVT-NEXT: csel w9, w9, w10, gt
				; CHECK-CVT-NEXT: cmp w11, #4095
				; CHECK-CVT-NEXT: csel w8, w11, w8, lt
				; CHECK-CVT-NEXT: mov v2.s[2], w12
	; CHECK-CVT-NEXT: cmn w8, #1, lsl #12 // =4096			; CHECK-CVT-NEXT: cmn w8, #1, lsl #12 // =4096
				; CHECK-CVT-NEXT: mov v1.s[2], w9
	; CHECK-CVT-NEXT: csel w8, w8, w10, gt			; CHECK-CVT-NEXT: csel w8, w8, w10, gt
	; CHECK-CVT-NEXT: mov v1.s[2], w11
	; CHECK-CVT-NEXT: mov v2.s[2], w12
	; CHECK-CVT-NEXT: mov v1.s[3], w8
	; CHECK-CVT-NEXT: mov v2.s[3], w13			; CHECK-CVT-NEXT: mov v2.s[3], w13
	; CHECK-CVT-NEXT: xtn v0.4h, v1.4s			; CHECK-CVT-NEXT: mov v1.s[3], w8
	; CHECK-CVT-NEXT: xtn2 v0.8h, v2.4s			; CHECK-CVT-NEXT: uzp1 v0.8h, v1.8h, v2.8h
	; CHECK-CVT-NEXT: ret			; CHECK-CVT-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: test_signed_v8f16_v8i13:			; CHECK-FP16-LABEL: test_signed_v8f16_v8i13:
	; CHECK-FP16: // %bb.0:			; CHECK-FP16: // %bb.0:
	; CHECK-FP16-NEXT: mvni v1.8h, #240, lsl #8			; CHECK-FP16-NEXT: mvni v1.8h, #240, lsl #8
	; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h			; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h
	; CHECK-FP16-NEXT: smin v0.8h, v0.8h, v1.8h			; CHECK-FP16-NEXT: smin v0.8h, v0.8h, v1.8h
	; CHECK-FP16-NEXT: movi v1.8h, #240, lsl #8			; CHECK-FP16-NEXT: movi v1.8h, #240, lsl #8
	Show All 31 Lines
	; CHECK-CVT-NEXT: cmp w12, w8			; CHECK-CVT-NEXT: cmp w12, w8
	; CHECK-CVT-NEXT: csel w12, w12, w8, lt			; CHECK-CVT-NEXT: csel w12, w12, w8, lt
	; CHECK-CVT-NEXT: fcvtzs w14, s2			; CHECK-CVT-NEXT: fcvtzs w14, s2
	; CHECK-CVT-NEXT: cmn w12, #8, lsl #12 // =32768			; CHECK-CVT-NEXT: cmn w12, #8, lsl #12 // =32768
	; CHECK-CVT-NEXT: mov s0, v0.s[3]			; CHECK-CVT-NEXT: mov s0, v0.s[3]
	; CHECK-CVT-NEXT: csel w12, w12, w10, gt			; CHECK-CVT-NEXT: csel w12, w12, w10, gt
	; CHECK-CVT-NEXT: cmp w13, w8			; CHECK-CVT-NEXT: cmp w13, w8
	; CHECK-CVT-NEXT: csel w13, w13, w8, lt			; CHECK-CVT-NEXT: csel w13, w13, w8, lt
	; CHECK-CVT-NEXT: fcvtzs w16, s1
	; CHECK-CVT-NEXT: cmn w13, #8, lsl #12 // =32768
	; CHECK-CVT-NEXT: fmov s2, w11			; CHECK-CVT-NEXT: fmov s2, w11
				; CHECK-CVT-NEXT: cmn w13, #8, lsl #12 // =32768
	; CHECK-CVT-NEXT: csel w13, w13, w10, gt			; CHECK-CVT-NEXT: csel w13, w13, w10, gt
	; CHECK-CVT-NEXT: cmp w14, w8			; CHECK-CVT-NEXT: cmp w14, w8
	; CHECK-CVT-NEXT: csel w14, w14, w8, lt			; CHECK-CVT-NEXT: csel w14, w14, w8, lt
	; CHECK-CVT-NEXT: cmn w14, #8, lsl #12 // =32768			; CHECK-CVT-NEXT: cmn w14, #8, lsl #12 // =32768
	; CHECK-CVT-NEXT: csel w14, w14, w10, gt			; CHECK-CVT-NEXT: csel w14, w14, w10, gt
	; CHECK-CVT-NEXT: cmp w15, w8			; CHECK-CVT-NEXT: cmp w15, w8
	; CHECK-CVT-NEXT: csel w15, w15, w8, lt			; CHECK-CVT-NEXT: csel w15, w15, w8, lt
	; CHECK-CVT-NEXT: cmn w15, #8, lsl #12 // =32768			; CHECK-CVT-NEXT: cmn w15, #8, lsl #12 // =32768
	; CHECK-CVT-NEXT: csel w15, w15, w10, gt			; CHECK-CVT-NEXT: csel w11, w15, w10, gt
	; CHECK-CVT-NEXT: cmp w16, w8			; CHECK-CVT-NEXT: fcvtzs w15, s1
	; CHECK-CVT-NEXT: csel w11, w16, w8, lt
	; CHECK-CVT-NEXT: cmn w11, #8, lsl #12 // =32768
	; CHECK-CVT-NEXT: fmov s1, w15
	; CHECK-CVT-NEXT: fcvtzs w15, s0
	; CHECK-CVT-NEXT: csel w11, w11, w10, gt
	; CHECK-CVT-NEXT: mov v2.s[1], w9			; CHECK-CVT-NEXT: mov v2.s[1], w9
	; CHECK-CVT-NEXT: mov v1.s[1], w14			; CHECK-CVT-NEXT: fmov s1, w11
	; CHECK-CVT-NEXT: cmp w15, w8			; CHECK-CVT-NEXT: cmp w15, w8
	; CHECK-CVT-NEXT: csel w8, w15, w8, lt			; CHECK-CVT-NEXT: csel w9, w15, w8, lt
				; CHECK-CVT-NEXT: fcvtzs w11, s0
				; CHECK-CVT-NEXT: cmn w9, #8, lsl #12 // =32768
				; CHECK-CVT-NEXT: mov v1.s[1], w14
				; CHECK-CVT-NEXT: csel w9, w9, w10, gt
				; CHECK-CVT-NEXT: cmp w11, w8
				; CHECK-CVT-NEXT: csel w8, w11, w8, lt
				; CHECK-CVT-NEXT: mov v2.s[2], w12
	; CHECK-CVT-NEXT: cmn w8, #8, lsl #12 // =32768			; CHECK-CVT-NEXT: cmn w8, #8, lsl #12 // =32768
				; CHECK-CVT-NEXT: mov v1.s[2], w9
	; CHECK-CVT-NEXT: csel w8, w8, w10, gt			; CHECK-CVT-NEXT: csel w8, w8, w10, gt
	; CHECK-CVT-NEXT: mov v1.s[2], w11
	; CHECK-CVT-NEXT: mov v2.s[2], w12
	; CHECK-CVT-NEXT: mov v1.s[3], w8
	; CHECK-CVT-NEXT: mov v2.s[3], w13			; CHECK-CVT-NEXT: mov v2.s[3], w13
	; CHECK-CVT-NEXT: xtn v0.4h, v1.4s			; CHECK-CVT-NEXT: mov v1.s[3], w8
	; CHECK-CVT-NEXT: xtn2 v0.8h, v2.4s			; CHECK-CVT-NEXT: uzp1 v0.8h, v1.8h, v2.8h
	; CHECK-CVT-NEXT: ret			; CHECK-CVT-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: test_signed_v8f16_v8i16:			; CHECK-FP16-LABEL: test_signed_v8f16_v8i16:
	; CHECK-FP16: // %bb.0:			; CHECK-FP16: // %bb.0:
	; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h			; CHECK-FP16-NEXT: fcvtzs v0.8h, v0.8h
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-NEXT: ret
	%x = call <8 x i16> @llvm.fptosi.sat.v8f16.v8i16(<8 x half> %f)			%x = call <8 x i16> @llvm.fptosi.sat.v8f16.v8i16(<8 x half> %f)
	ret <8 x i16> %x			ret <8 x i16> %x
	▲ Show 20 Lines • Show All 618 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/fptoui-sat-vector.ll

	Show First 20 Lines • Show All 1,769 Lines • ▼ Show 20 Lines
	; CHECK-CVT-NEXT: cmp w11, #1			; CHECK-CVT-NEXT: cmp w11, #1
	; CHECK-CVT-NEXT: csinc w11, w11, wzr, lo			; CHECK-CVT-NEXT: csinc w11, w11, wzr, lo
	; CHECK-CVT-NEXT: cmp w12, #1			; CHECK-CVT-NEXT: cmp w12, #1
	; CHECK-CVT-NEXT: csinc w12, w12, wzr, lo			; CHECK-CVT-NEXT: csinc w12, w12, wzr, lo
	; CHECK-CVT-NEXT: cmp w13, #1			; CHECK-CVT-NEXT: cmp w13, #1
	; CHECK-CVT-NEXT: csinc w13, w13, wzr, lo			; CHECK-CVT-NEXT: csinc w13, w13, wzr, lo
	; CHECK-CVT-NEXT: cmp w10, #1			; CHECK-CVT-NEXT: cmp w10, #1
	; CHECK-CVT-NEXT: csinc w10, w10, wzr, lo			; CHECK-CVT-NEXT: csinc w10, w10, wzr, lo
	; CHECK-CVT-NEXT: fmov s2, w10			; CHECK-CVT-NEXT: fmov s2, w9
	; CHECK-CVT-NEXT: fcvtzu w10, s1			; CHECK-CVT-NEXT: fcvtzu w9, s1
	; CHECK-CVT-NEXT: fmov s1, w9			; CHECK-CVT-NEXT: fmov s3, w10
	; CHECK-CVT-NEXT: mov v2.s[1], w13			; CHECK-CVT-NEXT: mov v2.s[1], w8
	; CHECK-CVT-NEXT: cmp w10, #1			; CHECK-CVT-NEXT: cmp w9, #1
	; CHECK-CVT-NEXT: csinc w9, w10, wzr, lo			; CHECK-CVT-NEXT: csinc w8, w9, wzr, lo
	; CHECK-CVT-NEXT: fcvtzu w10, s0			; CHECK-CVT-NEXT: fcvtzu w9, s0
	; CHECK-CVT-NEXT: mov v1.s[1], w8			; CHECK-CVT-NEXT: mov v3.s[1], w13
	; CHECK-CVT-NEXT: mov v2.s[2], w9			; CHECK-CVT-NEXT: mov v2.s[2], w11
	; CHECK-CVT-NEXT: cmp w10, #1			; CHECK-CVT-NEXT: cmp w9, #1
	; CHECK-CVT-NEXT: csinc w8, w10, wzr, lo			; CHECK-CVT-NEXT: mov v3.s[2], w8
	; CHECK-CVT-NEXT: mov v1.s[2], w11			; CHECK-CVT-NEXT: csinc w8, w9, wzr, lo
	; CHECK-CVT-NEXT: mov v2.s[3], w8			; CHECK-CVT-NEXT: mov v2.s[3], w12
	; CHECK-CVT-NEXT: mov v1.s[3], w12			; CHECK-CVT-NEXT: mov v3.s[3], w8
	; CHECK-CVT-NEXT: xtn v0.4h, v2.4s			; CHECK-CVT-NEXT: uzp1 v0.8h, v3.8h, v2.8h
	; CHECK-CVT-NEXT: xtn2 v0.8h, v1.4s
	; CHECK-CVT-NEXT: xtn v0.8b, v0.8h			; CHECK-CVT-NEXT: xtn v0.8b, v0.8h
	; CHECK-CVT-NEXT: ret			; CHECK-CVT-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: test_unsigned_v8f16_v8i1:			; CHECK-FP16-LABEL: test_unsigned_v8f16_v8i1:
	; CHECK-FP16: // %bb.0:			; CHECK-FP16: // %bb.0:
	; CHECK-FP16-NEXT: movi v1.8h, #1			; CHECK-FP16-NEXT: movi v1.8h, #1
	; CHECK-FP16-NEXT: fcvtzu v0.8h, v0.8h			; CHECK-FP16-NEXT: fcvtzu v0.8h, v0.8h
	; CHECK-FP16-NEXT: umin v0.8h, v0.8h, v1.8h			; CHECK-FP16-NEXT: umin v0.8h, v0.8h, v1.8h
	Show All 28 Lines
	; CHECK-CVT-NEXT: cmp w12, #255			; CHECK-CVT-NEXT: cmp w12, #255
	; CHECK-CVT-NEXT: csel w12, w12, w8, lo			; CHECK-CVT-NEXT: csel w12, w12, w8, lo
	; CHECK-CVT-NEXT: cmp w13, #255			; CHECK-CVT-NEXT: cmp w13, #255
	; CHECK-CVT-NEXT: csel w13, w13, w8, lo			; CHECK-CVT-NEXT: csel w13, w13, w8, lo
	; CHECK-CVT-NEXT: cmp w14, #255			; CHECK-CVT-NEXT: cmp w14, #255
	; CHECK-CVT-NEXT: csel w14, w14, w8, lo			; CHECK-CVT-NEXT: csel w14, w14, w8, lo
	; CHECK-CVT-NEXT: cmp w11, #255			; CHECK-CVT-NEXT: cmp w11, #255
	; CHECK-CVT-NEXT: csel w11, w11, w8, lo			; CHECK-CVT-NEXT: csel w11, w11, w8, lo
	; CHECK-CVT-NEXT: fmov s2, w11			; CHECK-CVT-NEXT: fmov s2, w10
	; CHECK-CVT-NEXT: fcvtzu w11, s1			; CHECK-CVT-NEXT: fcvtzu w10, s1
	; CHECK-CVT-NEXT: fmov s1, w10			; CHECK-CVT-NEXT: fmov s3, w11
	; CHECK-CVT-NEXT: mov v2.s[1], w14			; CHECK-CVT-NEXT: mov v2.s[1], w9
	; CHECK-CVT-NEXT: cmp w11, #255			; CHECK-CVT-NEXT: cmp w10, #255
	; CHECK-CVT-NEXT: csel w10, w11, w8, lo			; CHECK-CVT-NEXT: csel w9, w10, w8, lo
	; CHECK-CVT-NEXT: fcvtzu w11, s0			; CHECK-CVT-NEXT: fcvtzu w10, s0
	; CHECK-CVT-NEXT: mov v1.s[1], w9			; CHECK-CVT-NEXT: mov v3.s[1], w14
	; CHECK-CVT-NEXT: mov v2.s[2], w10			; CHECK-CVT-NEXT: mov v2.s[2], w12
	; CHECK-CVT-NEXT: cmp w11, #255			; CHECK-CVT-NEXT: cmp w10, #255
	; CHECK-CVT-NEXT: csel w8, w11, w8, lo			; CHECK-CVT-NEXT: csel w8, w10, w8, lo
	; CHECK-CVT-NEXT: mov v1.s[2], w12			; CHECK-CVT-NEXT: mov v3.s[2], w9
	; CHECK-CVT-NEXT: mov v2.s[3], w8			; CHECK-CVT-NEXT: mov v2.s[3], w13
	; CHECK-CVT-NEXT: mov v1.s[3], w13			; CHECK-CVT-NEXT: mov v3.s[3], w8
	; CHECK-CVT-NEXT: xtn v0.4h, v2.4s			; CHECK-CVT-NEXT: uzp1 v0.8h, v3.8h, v2.8h
	; CHECK-CVT-NEXT: xtn2 v0.8h, v1.4s
	; CHECK-CVT-NEXT: xtn v0.8b, v0.8h			; CHECK-CVT-NEXT: xtn v0.8b, v0.8h
	; CHECK-CVT-NEXT: ret			; CHECK-CVT-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: test_unsigned_v8f16_v8i8:			; CHECK-FP16-LABEL: test_unsigned_v8f16_v8i8:
	; CHECK-FP16: // %bb.0:			; CHECK-FP16: // %bb.0:
	; CHECK-FP16-NEXT: fcvtzu v0.8h, v0.8h			; CHECK-FP16-NEXT: fcvtzu v0.8h, v0.8h
	; CHECK-FP16-NEXT: uqxtn v0.8b, v0.8h			; CHECK-FP16-NEXT: uqxtn v0.8b, v0.8h
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-NEXT: ret
	Show All 26 Lines
	; CHECK-CVT-NEXT: cmp w12, w8			; CHECK-CVT-NEXT: cmp w12, w8
	; CHECK-CVT-NEXT: csel w12, w12, w8, lo			; CHECK-CVT-NEXT: csel w12, w12, w8, lo
	; CHECK-CVT-NEXT: cmp w13, w8			; CHECK-CVT-NEXT: cmp w13, w8
	; CHECK-CVT-NEXT: csel w13, w13, w8, lo			; CHECK-CVT-NEXT: csel w13, w13, w8, lo
	; CHECK-CVT-NEXT: cmp w14, w8			; CHECK-CVT-NEXT: cmp w14, w8
	; CHECK-CVT-NEXT: csel w14, w14, w8, lo			; CHECK-CVT-NEXT: csel w14, w14, w8, lo
	; CHECK-CVT-NEXT: cmp w11, w8			; CHECK-CVT-NEXT: cmp w11, w8
	; CHECK-CVT-NEXT: csel w11, w11, w8, lo			; CHECK-CVT-NEXT: csel w11, w11, w8, lo
	; CHECK-CVT-NEXT: fmov s2, w11			; CHECK-CVT-NEXT: fmov s2, w10
	; CHECK-CVT-NEXT: fcvtzu w11, s1			; CHECK-CVT-NEXT: fcvtzu w10, s1
	; CHECK-CVT-NEXT: fmov s1, w10			; CHECK-CVT-NEXT: fmov s3, w11
	; CHECK-CVT-NEXT: mov v2.s[1], w14			; CHECK-CVT-NEXT: mov v2.s[1], w9
	; CHECK-CVT-NEXT: cmp w11, w8			; CHECK-CVT-NEXT: cmp w10, w8
	; CHECK-CVT-NEXT: csel w10, w11, w8, lo			; CHECK-CVT-NEXT: csel w9, w10, w8, lo
	; CHECK-CVT-NEXT: fcvtzu w11, s0			; CHECK-CVT-NEXT: fcvtzu w10, s0
	; CHECK-CVT-NEXT: mov v1.s[1], w9			; CHECK-CVT-NEXT: mov v3.s[1], w14
	; CHECK-CVT-NEXT: mov v2.s[2], w10			; CHECK-CVT-NEXT: mov v2.s[2], w12
	; CHECK-CVT-NEXT: cmp w11, w8			; CHECK-CVT-NEXT: cmp w10, w8
	; CHECK-CVT-NEXT: csel w8, w11, w8, lo			; CHECK-CVT-NEXT: csel w8, w10, w8, lo
	; CHECK-CVT-NEXT: mov v1.s[2], w12			; CHECK-CVT-NEXT: mov v3.s[2], w9
	; CHECK-CVT-NEXT: mov v2.s[3], w8			; CHECK-CVT-NEXT: mov v2.s[3], w13
	; CHECK-CVT-NEXT: mov v1.s[3], w13			; CHECK-CVT-NEXT: mov v3.s[3], w8
	; CHECK-CVT-NEXT: xtn v0.4h, v2.4s			; CHECK-CVT-NEXT: uzp1 v0.8h, v3.8h, v2.8h
	; CHECK-CVT-NEXT: xtn2 v0.8h, v1.4s
	; CHECK-CVT-NEXT: ret			; CHECK-CVT-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: test_unsigned_v8f16_v8i13:			; CHECK-FP16-LABEL: test_unsigned_v8f16_v8i13:
	; CHECK-FP16: // %bb.0:			; CHECK-FP16: // %bb.0:
	; CHECK-FP16-NEXT: mvni v1.8h, #224, lsl #8			; CHECK-FP16-NEXT: mvni v1.8h, #224, lsl #8
	; CHECK-FP16-NEXT: fcvtzu v0.8h, v0.8h			; CHECK-FP16-NEXT: fcvtzu v0.8h, v0.8h
	; CHECK-FP16-NEXT: umin v0.8h, v0.8h, v1.8h			; CHECK-FP16-NEXT: umin v0.8h, v0.8h, v1.8h
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-NEXT: ret
	Show All 26 Lines
	; CHECK-CVT-NEXT: cmp w12, w8			; CHECK-CVT-NEXT: cmp w12, w8
	; CHECK-CVT-NEXT: csel w12, w12, w8, lo			; CHECK-CVT-NEXT: csel w12, w12, w8, lo
	; CHECK-CVT-NEXT: cmp w13, w8			; CHECK-CVT-NEXT: cmp w13, w8
	; CHECK-CVT-NEXT: csel w13, w13, w8, lo			; CHECK-CVT-NEXT: csel w13, w13, w8, lo
	; CHECK-CVT-NEXT: cmp w14, w8			; CHECK-CVT-NEXT: cmp w14, w8
	; CHECK-CVT-NEXT: csel w14, w14, w8, lo			; CHECK-CVT-NEXT: csel w14, w14, w8, lo
	; CHECK-CVT-NEXT: cmp w11, w8			; CHECK-CVT-NEXT: cmp w11, w8
	; CHECK-CVT-NEXT: csel w11, w11, w8, lo			; CHECK-CVT-NEXT: csel w11, w11, w8, lo
	; CHECK-CVT-NEXT: fmov s2, w11			; CHECK-CVT-NEXT: fmov s2, w10
	; CHECK-CVT-NEXT: fcvtzu w11, s1			; CHECK-CVT-NEXT: fcvtzu w10, s1
	; CHECK-CVT-NEXT: fmov s1, w10			; CHECK-CVT-NEXT: fmov s3, w11
	; CHECK-CVT-NEXT: mov v2.s[1], w14			; CHECK-CVT-NEXT: mov v2.s[1], w9
	; CHECK-CVT-NEXT: cmp w11, w8			; CHECK-CVT-NEXT: cmp w10, w8
	; CHECK-CVT-NEXT: csel w10, w11, w8, lo			; CHECK-CVT-NEXT: csel w9, w10, w8, lo
	; CHECK-CVT-NEXT: fcvtzu w11, s0			; CHECK-CVT-NEXT: fcvtzu w10, s0
	; CHECK-CVT-NEXT: mov v1.s[1], w9			; CHECK-CVT-NEXT: mov v3.s[1], w14
	; CHECK-CVT-NEXT: mov v2.s[2], w10			; CHECK-CVT-NEXT: mov v2.s[2], w12
	; CHECK-CVT-NEXT: cmp w11, w8			; CHECK-CVT-NEXT: cmp w10, w8
	; CHECK-CVT-NEXT: csel w8, w11, w8, lo			; CHECK-CVT-NEXT: csel w8, w10, w8, lo
	; CHECK-CVT-NEXT: mov v1.s[2], w12			; CHECK-CVT-NEXT: mov v3.s[2], w9
	; CHECK-CVT-NEXT: mov v2.s[3], w8			; CHECK-CVT-NEXT: mov v2.s[3], w13
	; CHECK-CVT-NEXT: mov v1.s[3], w13			; CHECK-CVT-NEXT: mov v3.s[3], w8
	; CHECK-CVT-NEXT: xtn v0.4h, v2.4s			; CHECK-CVT-NEXT: uzp1 v0.8h, v3.8h, v2.8h
	; CHECK-CVT-NEXT: xtn2 v0.8h, v1.4s
	; CHECK-CVT-NEXT: ret			; CHECK-CVT-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: test_unsigned_v8f16_v8i16:			; CHECK-FP16-LABEL: test_unsigned_v8f16_v8i16:
	; CHECK-FP16: // %bb.0:			; CHECK-FP16: // %bb.0:
	; CHECK-FP16-NEXT: fcvtzu v0.8h, v0.8h			; CHECK-FP16-NEXT: fcvtzu v0.8h, v0.8h
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-NEXT: ret
	%x = call <8 x i16> @llvm.fptoui.sat.v8f16.v8i16(<8 x half> %f)			%x = call <8 x i16> @llvm.fptoui.sat.v8f16.v8i16(<8 x half> %f)
	ret <8 x i16> %x			ret <8 x i16> %x
	▲ Show 20 Lines • Show All 509 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/neon-truncstore.ll

Show All 12 Lines	; CHECK-NEXT: ret
%b = trunc <2 x i64> %a to <2 x i32>		%b = trunc <2 x i64> %a to <2 x i32>
store <2 x i32> %b, <2 x i32>* %result		store <2 x i32> %b, <2 x i32>* %result
ret void		ret void
}		}

define void @v4i64_v4i32(<4 x i64> %a, <4 x i32>* %result) {		define void @v4i64_v4i32(<4 x i64> %a, <4 x i32>* %result) {
; CHECK-LABEL: v4i64_v4i32:		; CHECK-LABEL: v4i64_v4i32:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: xtn v0.2s, v0.2d		; CHECK-NEXT: uzp1 v0.4s, v0.4s, v1.4s
; CHECK-NEXT: xtn2 v0.4s, v1.2d
; CHECK-NEXT: str q0, [x0]		; CHECK-NEXT: str q0, [x0]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%b = trunc <4 x i64> %a to <4 x i32>		%b = trunc <4 x i64> %a to <4 x i32>
store <4 x i32> %b, <4 x i32>* %result		store <4 x i32> %b, <4 x i32>* %result
ret void		ret void
}		}

define void @v8i64_v8i32(<8 x i64> %a, <8 x i32>* %result) {		define void @v8i64_v8i32(<8 x i64> %a, <8 x i32>* %result) {
; CHECK-LABEL: v8i64_v8i32:		; CHECK-LABEL: v8i64_v8i32:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: xtn v2.2s, v2.2d		; CHECK-NEXT: uzp1 v2.4s, v2.4s, v3.4s
; CHECK-NEXT: xtn v0.2s, v0.2d		; CHECK-NEXT: uzp1 v0.4s, v0.4s, v1.4s
; CHECK-NEXT: xtn2 v2.4s, v3.2d
; CHECK-NEXT: xtn2 v0.4s, v1.2d
; CHECK-NEXT: stp q0, q2, [x0]		; CHECK-NEXT: stp q0, q2, [x0]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%b = trunc <8 x i64> %a to <8 x i32>		%b = trunc <8 x i64> %a to <8 x i32>
store <8 x i32> %b, <8 x i32>* %result		store <8 x i32> %b, <8 x i32>* %result
ret void		ret void
}		}

define void @v2i32_v2i16(<2 x i32> %a, <2 x i16>* %result) {		define void @v2i32_v2i16(<2 x i32> %a, <2 x i16>* %result) {
Show All 19 Lines	; CHECK-NEXT: ret
%b = trunc <4 x i32> %a to <4 x i16>		%b = trunc <4 x i32> %a to <4 x i16>
store <4 x i16> %b, <4 x i16>* %result		store <4 x i16> %b, <4 x i16>* %result
ret void		ret void
}		}

define void @v8i32_v8i16(<8 x i32> %a, <8 x i16>* %result) {		define void @v8i32_v8i16(<8 x i32> %a, <8 x i16>* %result) {
; CHECK-LABEL: v8i32_v8i16:		; CHECK-LABEL: v8i32_v8i16:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: xtn v0.4h, v0.4s		; CHECK-NEXT: uzp1 v0.8h, v0.8h, v1.8h
; CHECK-NEXT: xtn2 v0.8h, v1.4s
; CHECK-NEXT: str q0, [x0]		; CHECK-NEXT: str q0, [x0]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%b = trunc <8 x i32> %a to <8 x i16>		%b = trunc <8 x i32> %a to <8 x i16>
store <8 x i16> %b, <8 x i16>* %result		store <8 x i16> %b, <8 x i16>* %result
ret void		ret void
}		}

define void @v16i32_v16i16(<16 x i32> %a, <16 x i16>* %result) {		define void @v16i32_v16i16(<16 x i32> %a, <16 x i16>* %result) {
; CHECK-LABEL: v16i32_v16i16:		; CHECK-LABEL: v16i32_v16i16:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: xtn v2.4h, v2.4s		; CHECK-NEXT: uzp1 v2.8h, v2.8h, v3.8h
; CHECK-NEXT: xtn v0.4h, v0.4s		; CHECK-NEXT: uzp1 v0.8h, v0.8h, v1.8h
; CHECK-NEXT: xtn2 v2.8h, v3.4s
; CHECK-NEXT: xtn2 v0.8h, v1.4s
; CHECK-NEXT: stp q0, q2, [x0]		; CHECK-NEXT: stp q0, q2, [x0]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%b = trunc <16 x i32> %a to <16 x i16>		%b = trunc <16 x i32> %a to <16 x i16>
store <16 x i16> %b, <16 x i16>* %result		store <16 x i16> %b, <16 x i16>* %result
ret void		ret void
}		}

define void @v2i32_v2i8(<2 x i32> %a, <2 x i8>* %result) {		define void @v2i32_v2i8(<2 x i32> %a, <2 x i8>* %result) {
Show All 20 Lines	; CHECK-NEXT: ret
%b = trunc <4 x i32> %a to <4 x i8>		%b = trunc <4 x i32> %a to <4 x i8>
store <4 x i8> %b, <4 x i8>* %result		store <4 x i8> %b, <4 x i8>* %result
ret void		ret void
}		}

define void @v8i32_v8i8(<8 x i32> %a, <8 x i8>* %result) {		define void @v8i32_v8i8(<8 x i32> %a, <8 x i8>* %result) {
; CHECK-LABEL: v8i32_v8i8:		; CHECK-LABEL: v8i32_v8i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: xtn v0.4h, v0.4s		; CHECK-NEXT: uzp1 v0.8h, v0.8h, v1.8h
; CHECK-NEXT: xtn2 v0.8h, v1.4s
; CHECK-NEXT: xtn v0.8b, v0.8h		; CHECK-NEXT: xtn v0.8b, v0.8h
; CHECK-NEXT: str d0, [x0]		; CHECK-NEXT: str d0, [x0]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%b = trunc <8 x i32> %a to <8 x i8>		%b = trunc <8 x i32> %a to <8 x i8>
store <8 x i8> %b, <8 x i8>* %result		store <8 x i8> %b, <8 x i8>* %result
ret void		ret void
}		}

define void @v16i32_v16i8(<16 x i32> %a, <16 x i8>* %result) {		define void @v16i32_v16i8(<16 x i32> %a, <16 x i8>* %result) {
; CHECK-LABEL: v16i32_v16i8:		; CHECK-LABEL: v16i32_v16i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: xtn v0.4h, v0.4s		; CHECK-NEXT: uzp1 v2.8h, v2.8h, v3.8h
; CHECK-NEXT: xtn v2.4h, v2.4s		; CHECK-NEXT: uzp1 v0.8h, v0.8h, v1.8h
; CHECK-NEXT: xtn2 v0.8h, v1.4s		; CHECK-NEXT: uzp1 v0.16b, v0.16b, v2.16b
; CHECK-NEXT: xtn2 v2.8h, v3.4s
; CHECK-NEXT: xtn v0.8b, v0.8h
; CHECK-NEXT: xtn2 v0.16b, v2.8h
; CHECK-NEXT: str q0, [x0]		; CHECK-NEXT: str q0, [x0]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%b = trunc <16 x i32> %a to <16 x i8>		%b = trunc <16 x i32> %a to <16 x i8>
store <16 x i8> %b, <16 x i8>* %result		store <16 x i8> %b, <16 x i8>* %result
ret void		ret void
}		}

define void @v32i32_v32i8(<32 x i32> %a, <32 x i8>* %result) {		define void @v32i32_v32i8(<32 x i32> %a, <32 x i8>* %result) {
; CHECK-LABEL: v32i32_v32i8:		; CHECK-LABEL: v32i32_v32i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: xtn v4.4h, v4.4s		; CHECK-NEXT: uzp1 v6.8h, v6.8h, v7.8h
; CHECK-NEXT: xtn v0.4h, v0.4s		; CHECK-NEXT: uzp1 v2.8h, v2.8h, v3.8h
; CHECK-NEXT: xtn v6.4h, v6.4s		; CHECK-NEXT: uzp1 v3.8h, v4.8h, v5.8h
; CHECK-NEXT: xtn v2.4h, v2.4s		; CHECK-NEXT: uzp1 v0.8h, v0.8h, v1.8h
; CHECK-NEXT: xtn2 v4.8h, v5.4s		; CHECK-NEXT: uzp1 v1.16b, v3.16b, v6.16b
; CHECK-NEXT: xtn2 v0.8h, v1.4s		; CHECK-NEXT: uzp1 v0.16b, v0.16b, v2.16b
; CHECK-NEXT: xtn2 v6.8h, v7.4s
; CHECK-NEXT: xtn2 v2.8h, v3.4s
; CHECK-NEXT: xtn v1.8b, v4.8h
; CHECK-NEXT: xtn v0.8b, v0.8h
; CHECK-NEXT: xtn2 v1.16b, v6.8h
; CHECK-NEXT: xtn2 v0.16b, v2.8h
; CHECK-NEXT: stp q0, q1, [x0]		; CHECK-NEXT: stp q0, q1, [x0]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%b = trunc <32 x i32> %a to <32 x i8>		%b = trunc <32 x i32> %a to <32 x i8>
store <32 x i8> %b, <32 x i8>* %result		store <32 x i8> %b, <32 x i8>* %result
ret void		ret void
}		}

define void @v2i16_v2i8(<2 x i16> %a, <2 x i8>* %result) {		define void @v2i16_v2i8(<2 x i16> %a, <2 x i8>* %result) {
Show All 31 Lines	; CHECK-NEXT: ret
%b = trunc <8 x i16> %a to <8 x i8>		%b = trunc <8 x i16> %a to <8 x i8>
store <8 x i8> %b, <8 x i8>* %result		store <8 x i8> %b, <8 x i8>* %result
ret void		ret void
}		}

define void @v16i16_v16i8(<16 x i16> %a, <16 x i8>* %result) {		define void @v16i16_v16i8(<16 x i16> %a, <16 x i8>* %result) {
; CHECK-LABEL: v16i16_v16i8:		; CHECK-LABEL: v16i16_v16i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: xtn v0.8b, v0.8h		; CHECK-NEXT: uzp1 v0.16b, v0.16b, v1.16b
; CHECK-NEXT: xtn2 v0.16b, v1.8h
; CHECK-NEXT: str q0, [x0]		; CHECK-NEXT: str q0, [x0]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%b = trunc <16 x i16> %a to <16 x i8>		%b = trunc <16 x i16> %a to <16 x i8>
store <16 x i8> %b, <16 x i8>* %result		store <16 x i8> %b, <16 x i8>* %result
ret void		ret void
}		}

define void @v32i16_v32i8(<32 x i16> %a, <32 x i8>* %result) {		define void @v32i16_v32i8(<32 x i16> %a, <32 x i8>* %result) {
; CHECK-LABEL: v32i16_v32i8:		; CHECK-LABEL: v32i16_v32i8:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: xtn v2.8b, v2.8h		; CHECK-NEXT: uzp1 v2.16b, v2.16b, v3.16b
; CHECK-NEXT: xtn v0.8b, v0.8h		; CHECK-NEXT: uzp1 v0.16b, v0.16b, v1.16b
; CHECK-NEXT: xtn2 v2.16b, v3.8h
; CHECK-NEXT: xtn2 v0.16b, v1.8h
; CHECK-NEXT: stp q0, q2, [x0]		; CHECK-NEXT: stp q0, q2, [x0]
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%b = trunc <32 x i16> %a to <32 x i8>		%b = trunc <32 x i16> %a to <32 x i8>
store <32 x i8> %b, <32 x i8>* %result		store <32 x i8> %b, <32 x i8>* %result
ret void		ret void
}		}