This is an archive of the discontinued LLVM Phabricator instance.

[AArch64][GlobalISel] G_FMINNUM and G_FMAXNUM vector lowering
ClosedPublic

Authored by dmgreen on Jul 24 2023, 3:06 PM.

Download Raw Diff

Details

Reviewers

aemerson
paquette
stuij
samtebbs
arsenm

Commits

rGe8e49a356769: [AArch64][GlobalISel] G_FMINNUM and G_FMAXNUM vector lowering

Summary

This attempts to expand the handling for G_FMAXNUM/G_FMINNUM for vector types, which is hopefully fairly straightforward now that fptrunc and fpext are working.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

dmgreen created this revision.Jul 24 2023, 3:06 PM

Herald added a project: Restricted Project. · View Herald TranscriptJul 24 2023, 3:06 PM

Herald added subscribers: hiraditya, kristof.beyls. · View Herald Transcript

dmgreen requested review of this revision.Jul 24 2023, 3:06 PM

Herald added a project: Restricted Project. · View Herald TranscriptJul 24 2023, 3:06 PM

Herald added a subscriber: wdng. · View Herald Transcript

Harbormaster completed remote builds in B247796: Diff 543609.Jul 24 2023, 3:07 PM

tschuett added inline comments.Jul 24 2023, 9:50 PM

llvm/test/CodeGen/AArch64/fminmax.ll
271	The 3 x f32 seems to fail again, but it should be in reach.
402	The 7 is ugly for both.
1409	For 16 Gisel seems to be better?!?

dmgreen added inline comments.Jul 25 2023, 3:45 AM

llvm/test/CodeGen/AArch64/fminmax.ll
271	It's just uglyness from buildvectors with undef elements. You can see it moving out-of and into the same register: mov s2, v0.s[1] .. mov v0.s[1], v2.s[0] And it shouldn't be setting v0.s[3], as those value are just undef. All that can be cleaned up with other combines, they just haven't been implemented yet (and they resolve around what happens to propagated undef elements, so have some dragons).
402	The calling convention here is very odd. They seem to match between the two, at least.
1409	The SDAG for fp16 without fullfp16 has always scalarized many instructions, and I don't believe anyone has looked into fixing it, as it's fairly low priority. It's worth getting it right with GISel if we can though.

May I ask you to add :

...
---
name:            3xs32_legal_with_full_fp16
alignment:       4
body:             |
  bb.0:
    liveins: $h0, $h1
    %a:_(<3 x s32>) = IMPLICIT_DEF
    %b:_(<3 x s32>) = IMPLICIT_DEF
    %minnum:_(<3 x s32>) = G_FMINNUM %a, %b
    %c:_(<3 x s32>) = COPY %minnum(<3 x s32>)
    RET_ReallyLR implicit %c

to llvm/test/CodeGen/AArch64/GlobalISel/legalize-fminnum.mir?

In D156171#4531873, @tschuett wrote:

May I ask you to add :

...
---
name:            3xs32_legal_with_full_fp16
alignment:       4
body:             |
  bb.0:
    liveins: $h0, $h1
    %a:_(<3 x s32>) = IMPLICIT_DEF
    %b:_(<3 x s32>) = IMPLICIT_DEF
    %minnum:_(<3 x s32>) = G_FMINNUM %a, %b
    %c:_(<3 x s32>) = COPY %minnum(<3 x s32>)
    RET_ReallyLR implicit %c

to llvm/test/CodeGen/AArch64/GlobalISel/legalize-fminnum.mir?

This needs to use G_IMPLICIT_DEF, not IMPLICIT_DEF

LGTM (with other comments addressed), thanks.

llvm/lib/Target/AArch64/GISel/AArch64LegalizerInfo.cpp
929–934	General musing out loud, not for this patch: we should find a way to factor out these common vector rules cleanly.

This revision is now accepted and ready to land.Jul 25 2023, 2:56 PM

dmgreen added a child revision: D156614: [AArch64][GISel] Handling for G_VECREDUCE_FMIN and G_VECREDUCE_FMAX.Jul 30 2023, 6:58 AM

dmgreen added a parent revision: D155601: [AArch64][GISel] Additional FPExt vector lowering.Jul 30 2023, 7:01 AM

Update and rebase.

Harbormaster completed remote builds in B249052: Diff 545441.Jul 30 2023, 7:27 AM

In D156171#4531923, @arsenm wrote:
In D156171#4531873, @tschuett wrote:
May I ask you to add :
...
---
name:            3xs32_legal_with_full_fp16
alignment:       4
body:             |
  bb.0:
    liveins: $h0, $h1
    %a:_(<3 x s32>) = IMPLICIT_DEF
    %b:_(<3 x s32>) = IMPLICIT_DEF
    %minnum:_(<3 x s32>) = G_FMINNUM %a, %b
    %c:_(<3 x s32>) = COPY %minnum(<3 x s32>)
    RET_ReallyLR implicit %c
to llvm/test/CodeGen/AArch64/GlobalISel/legalize-fminnum.mir?
This needs to use G_IMPLICIT_DEF, not IMPLICIT_DEF

I've added a test, but it's a little different. I am not a huge fan of tests with IMPLICIT_DEF/undef as they could just be simplified away in the future, and the <3 x s32> needs to go somewhere legal in order to be valid (I think). It adds a test for the legalization that is currently seen when lowering.

dmgreen mentioned this in rGcf39dea58d8d: [AArch64] Add a fminnum/fmaxnum test. NFC.Jul 30 2023, 9:27 AM

This revision was landed with ongoing or failed builds.Jul 30 2023, 11:35 PM

Closed by commit rGe8e49a356769: [AArch64][GlobalISel] G_FMINNUM and G_FMAXNUM vector lowering (authored by dmgreen). · Explain Why

This revision was automatically updated to reflect the committed changes.

dmgreen added a commit: rGe8e49a356769: [AArch64][GlobalISel] G_FMINNUM and G_FMAXNUM vector lowering.

Revision Contents

Path

Size

llvm/

lib/

Target/

AArch64/

GISel/

AArch64LegalizerInfo.cpp

13 lines

test/

CodeGen/

AArch64/

GlobalISel/

legalize-fminnum.mir

159 lines

legalizer-info-validation.mir

8 lines

fminmax.ll

1866 lines

Diff 545511

llvm/lib/Target/AArch64/GISel/AArch64LegalizerInfo.cpp

Show First 20 Lines • Show All 913 Lines • ▼ Show 20 Lines	CTPOPActions
.clampScalar(0, s32, s128)		.clampScalar(0, s32, s128)
.widenScalarToNextPow2(0)		.widenScalarToNextPow2(0)
.minScalarEltSameAsIf(always, 1, 0)		.minScalarEltSameAsIf(always, 1, 0)
.maxScalarEltSameAsIf(always, 1, 0);		.maxScalarEltSameAsIf(always, 1, 0);

// TODO: Vector types.		// TODO: Vector types.
getActionDefinitionsBuilder({G_SADDSAT, G_SSUBSAT}).lowerIf(isScalar(0));		getActionDefinitionsBuilder({G_SADDSAT, G_SSUBSAT}).lowerIf(isScalar(0));

// TODO: Vector types.
getActionDefinitionsBuilder({G_FMAXNUM, G_FMINNUM})		getActionDefinitionsBuilder({G_FMAXNUM, G_FMINNUM})
.legalFor({MinFPScalar, s32, s64})		.legalFor({MinFPScalar, s32, s64, v2s32, v4s32, v2s64})
		.legalIf([=](const LegalityQuery &Query) {
		const auto &Ty = Query.Types[0];
		return (Ty == v8s16 \|\| Ty == v4s16) && HasFP16;
		})
.libcallFor({s128})		.libcallFor({s128})
.minScalar(0, MinFPScalar);		.minScalarOrElt(0, MinFPScalar)
		.clampNumElements(0, v4s16, v8s16)
		.clampNumElements(0, v2s32, v4s32)
		.clampNumElements(0, v2s64, v2s64)
		.moreElementsToNextPow2(0);

		aemersonUnsubmitted Not Done Reply Inline Actions General musing out loud, not for this patch: we should find a way to factor out these common vector rules cleanly. aemerson: General musing out loud, not for this patch: we should find a way to factor out these common…
getActionDefinitionsBuilder({G_FMAXIMUM, G_FMINIMUM})		getActionDefinitionsBuilder({G_FMAXIMUM, G_FMINIMUM})
.legalFor({MinFPScalar, s32, s64, v2s32, v4s32, v2s64})		.legalFor({MinFPScalar, s32, s64, v2s32, v4s32, v2s64})
.legalIf([=](const LegalityQuery &Query) {		.legalIf([=](const LegalityQuery &Query) {
const auto &Ty = Query.Types[0];		const auto &Ty = Query.Types[0];
return (Ty == v8s16 \|\| Ty == v4s16) && HasFP16;		return (Ty == v8s16 \|\| Ty == v4s16) && HasFP16;
})		})
.minScalar(0, MinFPScalar)		.minScalar(0, MinFPScalar)
.clampNumElements(0, v4s16, v8s16)		.clampNumElements(0, v4s16, v8s16)
▲ Show 20 Lines • Show All 755 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/GlobalISel/legalize-fminnum.mir

	# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py			# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
	# RUN: llc -mtriple=aarch64-unknown-unknown -run-pass=legalizer -mattr=+fullfp16 -verify-machineinstrs %s -o - \| FileCheck %s --check-prefix=FP16			# RUN: llc -mtriple=aarch64-unknown-unknown -run-pass=legalizer -mattr=+fullfp16 -verify-machineinstrs %s -o - \| FileCheck %s --check-prefixes=CHECK,CHECK-FP16
	# RUN: llc -mtriple=aarch64-unknown-unknown -run-pass=legalizer -verify-machineinstrs %s -o - \| FileCheck %s --check-prefix=NO-FP16			# RUN: llc -mtriple=aarch64-unknown-unknown -run-pass=legalizer -verify-machineinstrs %s -o - \| FileCheck %s --check-prefixes=CHECK,CHECK-NOFP16
	...			...
	---			---
	name: s16_legal_with_full_fp16			name: s16_legal_with_full_fp16
	alignment: 4			alignment: 4
	body: \|			body: \|
	bb.0:			bb.0:
	liveins: $h0, $h1			liveins: $h0, $h1
	; FP16-LABEL: name: s16_legal_with_full_fp16			; CHECK-FP16-LABEL: name: s16_legal_with_full_fp16
	; FP16: %a:_(s16) = COPY $h0			; CHECK-FP16: liveins: $h0, $h1
	; FP16: %b:_(s16) = COPY $h1			; CHECK-FP16-NEXT: {{ $}}
	; FP16: %minnum:_(s16) = G_FMINNUM %a, %b			; CHECK-FP16-NEXT: %a:_(s16) = COPY $h0
	; FP16: $h0 = COPY %minnum(s16)			; CHECK-FP16-NEXT: %b:_(s16) = COPY $h1
	; FP16: RET_ReallyLR implicit $h0			; CHECK-FP16-NEXT: %minnum:_(s16) = G_FMINNUM %a, %b
	; NO-FP16-LABEL: name: s16_legal_with_full_fp16			; CHECK-FP16-NEXT: $h0 = COPY %minnum(s16)
	; NO-FP16: %a:_(s16) = COPY $h0			; CHECK-FP16-NEXT: RET_ReallyLR implicit $h0
	; NO-FP16: %b:_(s16) = COPY $h1			;
	; NO-FP16: [[FPEXT:%[0-9]+]]:_(s32) = G_FPEXT %a(s16)			; CHECK-NOFP16-LABEL: name: s16_legal_with_full_fp16
	; NO-FP16: [[FPEXT1:%[0-9]+]]:_(s32) = G_FPEXT %b(s16)			; CHECK-NOFP16: liveins: $h0, $h1
	; NO-FP16: [[FMINNUM:%[0-9]+]]:_(s32) = G_FMINNUM [[FPEXT]], [[FPEXT1]]			; CHECK-NOFP16-NEXT: {{ $}}
	; NO-FP16: %minnum:_(s16) = G_FPTRUNC [[FMINNUM]](s32)			; CHECK-NOFP16-NEXT: %a:_(s16) = COPY $h0
	; NO-FP16: $h0 = COPY %minnum(s16)			; CHECK-NOFP16-NEXT: %b:_(s16) = COPY $h1
	; NO-FP16: RET_ReallyLR implicit $h0			; CHECK-NOFP16-NEXT: [[FPEXT:%[0-9]+]]:_(s32) = G_FPEXT %a(s16)
				; CHECK-NOFP16-NEXT: [[FPEXT1:%[0-9]+]]:_(s32) = G_FPEXT %b(s16)
				; CHECK-NOFP16-NEXT: [[FMINNUM:%[0-9]+]]:_(s32) = G_FMINNUM [[FPEXT]], [[FPEXT1]]
				; CHECK-NOFP16-NEXT: %minnum:_(s16) = G_FPTRUNC [[FMINNUM]](s32)
				; CHECK-NOFP16-NEXT: $h0 = COPY %minnum(s16)
				; CHECK-NOFP16-NEXT: RET_ReallyLR implicit $h0
	%a:_(s16) = COPY $h0			%a:_(s16) = COPY $h0
	%b:_(s16) = COPY $h1			%b:_(s16) = COPY $h1
	%minnum:_(s16) = G_FMINNUM %a, %b			%minnum:_(s16) = G_FMINNUM %a, %b
	$h0 = COPY %minnum(s16)			$h0 = COPY %minnum(s16)
	RET_ReallyLR implicit $h0			RET_ReallyLR implicit $h0

	...			...
	---			---
	name: s32_legal			name: s32_legal
	alignment: 4			alignment: 4
	body: \|			body: \|
	bb.0:			bb.0:
	liveins: $s0, $s1			liveins: $s0, $s1
	; FP16-LABEL: name: s32_legal			; CHECK-LABEL: name: s32_legal
	; FP16: %a:_(s32) = COPY $s0			; CHECK: liveins: $s0, $s1
	; FP16: %b:_(s32) = COPY $s1			; CHECK-NEXT: {{ $}}
	; FP16: %minnum:_(s32) = G_FMINNUM %a, %b			; CHECK-NEXT: %a:_(s32) = COPY $s0
	; FP16: $s0 = COPY %minnum(s32)			; CHECK-NEXT: %b:_(s32) = COPY $s1
	; FP16: RET_ReallyLR implicit $s0			; CHECK-NEXT: %minnum:_(s32) = G_FMINNUM %a, %b
	; NO-FP16-LABEL: name: s32_legal			; CHECK-NEXT: $s0 = COPY %minnum(s32)
	; NO-FP16: %a:_(s32) = COPY $s0			; CHECK-NEXT: RET_ReallyLR implicit $s0
	; NO-FP16: %b:_(s32) = COPY $s1
	; NO-FP16: %minnum:_(s32) = G_FMINNUM %a, %b
	; NO-FP16: $s0 = COPY %minnum(s32)
	; NO-FP16: RET_ReallyLR implicit $s0
	%a:_(s32) = COPY $s0			%a:_(s32) = COPY $s0
	%b:_(s32) = COPY $s1			%b:_(s32) = COPY $s1
	%minnum:_(s32) = G_FMINNUM %a, %b			%minnum:_(s32) = G_FMINNUM %a, %b
	$s0 = COPY %minnum(s32)			$s0 = COPY %minnum(s32)
	RET_ReallyLR implicit $s0			RET_ReallyLR implicit $s0

	...			...
	---			---
	name: s64_legal			name: s64_legal
	alignment: 4			alignment: 4
	body: \|			body: \|
	bb.0:			bb.0:
	liveins: $d0, $d1			liveins: $d0, $d1
	; FP16-LABEL: name: s64_legal			; CHECK-LABEL: name: s64_legal
	; FP16: %a:_(s64) = COPY $d0			; CHECK: liveins: $d0, $d1
	; FP16: %b:_(s64) = COPY $d1			; CHECK-NEXT: {{ $}}
	; FP16: %minnum:_(s64) = G_FMINNUM %a, %b			; CHECK-NEXT: %a:_(s64) = COPY $d0
	; FP16: $d0 = COPY %minnum(s64)			; CHECK-NEXT: %b:_(s64) = COPY $d1
	; FP16: RET_ReallyLR implicit $d0			; CHECK-NEXT: %minnum:_(s64) = G_FMINNUM %a, %b
	; NO-FP16-LABEL: name: s64_legal			; CHECK-NEXT: $d0 = COPY %minnum(s64)
	; NO-FP16: %a:_(s64) = COPY $d0			; CHECK-NEXT: RET_ReallyLR implicit $d0
	; NO-FP16: %b:_(s64) = COPY $d1
	; NO-FP16: %minnum:_(s64) = G_FMINNUM %a, %b
	; NO-FP16: $d0 = COPY %minnum(s64)
	; NO-FP16: RET_ReallyLR implicit $d0
	%a:_(s64) = COPY $d0			%a:_(s64) = COPY $d0
	%b:_(s64) = COPY $d1			%b:_(s64) = COPY $d1
	%minnum:_(s64) = G_FMINNUM %a, %b			%minnum:_(s64) = G_FMINNUM %a, %b
	$d0 = COPY %minnum(s64)			$d0 = COPY %minnum(s64)
	RET_ReallyLR implicit $d0			RET_ReallyLR implicit $d0

	...			...
	---			---
	name: s128_libcall			name: s128_libcall
	alignment: 4			alignment: 4
	body: \|			body: \|
	bb.0:			bb.0:
	liveins: $q0, $q1			liveins: $q0, $q1
	; FP16-LABEL: name: s128_libcall			; CHECK-LABEL: name: s128_libcall
	; FP16: %a:_(s128) = COPY $q0			; CHECK: liveins: $q0, $q1
	; FP16: %b:_(s128) = COPY $q1			; CHECK-NEXT: {{ $}}
	; FP16: ADJCALLSTACKDOWN 0, 0, implicit-def $sp, implicit $sp			; CHECK-NEXT: %a:_(s128) = COPY $q0
	; FP16: $q0 = COPY %a(s128)			; CHECK-NEXT: %b:_(s128) = COPY $q1
	; FP16: $q1 = COPY %b(s128)			; CHECK-NEXT: ADJCALLSTACKDOWN 0, 0, implicit-def $sp, implicit $sp
	; FP16: BL &fminl, csr_aarch64_aapcs, implicit-def $lr, implicit $sp, implicit $q0, implicit $q1, implicit-def $q0			; CHECK-NEXT: $q0 = COPY %a(s128)
	; FP16: ADJCALLSTACKUP 0, 0, implicit-def $sp, implicit $sp			; CHECK-NEXT: $q1 = COPY %b(s128)
	; FP16: %minnum:_(s128) = COPY $q0			; CHECK-NEXT: BL &fminl, csr_aarch64_aapcs, implicit-def $lr, implicit $sp, implicit $q0, implicit $q1, implicit-def $q0
	; FP16: $q0 = COPY %minnum(s128)			; CHECK-NEXT: ADJCALLSTACKUP 0, 0, implicit-def $sp, implicit $sp
	; FP16: RET_ReallyLR implicit $q0			; CHECK-NEXT: %minnum:_(s128) = COPY $q0
	; NO-FP16-LABEL: name: s128_libcall			; CHECK-NEXT: $q0 = COPY %minnum(s128)
	; NO-FP16: %a:_(s128) = COPY $q0			; CHECK-NEXT: RET_ReallyLR implicit $q0
	; NO-FP16: %b:_(s128) = COPY $q1
	; NO-FP16: ADJCALLSTACKDOWN 0, 0, implicit-def $sp, implicit $sp
	; NO-FP16: $q0 = COPY %a(s128)
	; NO-FP16: $q1 = COPY %b(s128)
	; NO-FP16: BL &fminl, csr_aarch64_aapcs, implicit-def $lr, implicit $sp, implicit $q0, implicit $q1, implicit-def $q0
	; NO-FP16: ADJCALLSTACKUP 0, 0, implicit-def $sp, implicit $sp
	; NO-FP16: %minnum:_(s128) = COPY $q0
	; NO-FP16: $q0 = COPY %minnum(s128)
	; NO-FP16: RET_ReallyLR implicit $q0
	%a:_(s128) = COPY $q0			%a:_(s128) = COPY $q0
	%b:_(s128) = COPY $q1			%b:_(s128) = COPY $q1
	%minnum:_(s128) = G_FMINNUM %a, %b			%minnum:_(s128) = G_FMINNUM %a, %b
	$q0 = COPY %minnum(s128)			$q0 = COPY %minnum(s128)
	RET_ReallyLR implicit $q0			RET_ReallyLR implicit $q0

				...
				---
				name: v4s32_legal
				alignment: 4
				body: \|
				bb.0:
				liveins: $q0, $q1
				; CHECK-LABEL: name: v4s32_legal
				; CHECK: liveins: $q0, $q1
				; CHECK-NEXT: {{ $}}
				; CHECK-NEXT: %a:_(<4 x s32>) = COPY $q0
				; CHECK-NEXT: %b:_(<4 x s32>) = COPY $q1
				; CHECK-NEXT: %minnum:_(<4 x s32>) = G_FMINNUM %a, %b
				; CHECK-NEXT: $q0 = COPY %minnum(<4 x s32>)
				; CHECK-NEXT: RET_ReallyLR implicit $q0
				%a:_(<4 x s32>) = COPY $q0
				%b:_(<4 x s32>) = COPY $q1
				%minnum:_(<4 x s32>) = G_FMINNUM %a, %b
				$q0 = COPY %minnum(<4 x s32>)
				RET_ReallyLR implicit $q0

				...
				---
				name: v3s32_widen
				alignment: 4
				body: \|
				bb.1.entry:
				liveins: $q0, $q1
				%2:_(<2 x s64>) = COPY $q0
				%3:_(<4 x s32>) = G_BITCAST %2:_(<2 x s64>)
				%4:_(s32), %5:_(s32), %6:_(s32), %7:_(s32) = G_UNMERGE_VALUES %3:_(<4 x s32>)
				%0:_(<3 x s32>) = G_BUILD_VECTOR %4:_(s32), %5:_(s32), %6:_(s32)
				%8:_(<2 x s64>) = COPY $q1
				%9:_(<4 x s32>) = G_BITCAST %8:_(<2 x s64>)
				%10:_(s32), %11:_(s32), %12:_(s32), %13:_(s32) = G_UNMERGE_VALUES %9:_(<4 x s32>)
				%1:_(<3 x s32>) = G_BUILD_VECTOR %10:_(s32), %11:_(s32), %12:_(s32)
				%14:_(<3 x s32>) = G_FMINNUM %0:_, %1:_
				%15:_(s32), %16:_(s32), %17:_(s32) = G_UNMERGE_VALUES %14:_(<3 x s32>)
				%18:_(s32) = G_IMPLICIT_DEF
				%19:_(<4 x s32>) = G_BUILD_VECTOR %15:_(s32), %16:_(s32), %17:_(s32), %18:_(s32)
				$q0 = COPY %19:_(<4 x s32>)
				RET_ReallyLR implicit $q0

				...

llvm/test/CodeGen/AArch64/GlobalISel/legalizer-info-validation.mir

	Show First 20 Lines • Show All 515 Lines • ▼ Show 20 Lines
	# DEBUG-NEXT: G_IS_FPCLASS (opcode {{[0-9]+}}): 2 type indices, 0 imm indices			# DEBUG-NEXT: G_IS_FPCLASS (opcode {{[0-9]+}}): 2 type indices, 0 imm indices
	# DEBUG-NEXT: .. type index coverage check SKIPPED: no rules defined			# DEBUG-NEXT: .. type index coverage check SKIPPED: no rules defined
	# DEBUG-NEXT: .. imm index coverage check SKIPPED: no rules defined			# DEBUG-NEXT: .. imm index coverage check SKIPPED: no rules defined
	# DEBUG-NEXT: G_FCANONICALIZE (opcode {{[0-9]+}}): 1 type index, 0 imm indices			# DEBUG-NEXT: G_FCANONICALIZE (opcode {{[0-9]+}}): 1 type index, 0 imm indices
	# DEBUG-NEXT: .. type index coverage check SKIPPED: no rules defined			# DEBUG-NEXT: .. type index coverage check SKIPPED: no rules defined
	# DEBUG-NEXT: .. imm index coverage check SKIPPED: no rules defined			# DEBUG-NEXT: .. imm index coverage check SKIPPED: no rules defined
	# DEBUG-NEXT: G_FMINNUM (opcode {{[0-9]+}}): 1 type index			# DEBUG-NEXT: G_FMINNUM (opcode {{[0-9]+}}): 1 type index
	# DEBUG-NEXT: .. opcode {{[0-9]+}} is aliased to {{[0-9]+}}			# DEBUG-NEXT: .. opcode {{[0-9]+}} is aliased to {{[0-9]+}}
	# DEBUG-NEXT: .. the first uncovered type index: 1, OK			# DEBUG-NEXT: .. type index coverage check SKIPPED: user-defined predicate detected
	# DEBUG-NEXT: .. the first uncovered imm index: 0, OK			# DEBUG-NEXT: .. imm index coverage check SKIPPED: user-defined predicate detected
	# DEBUG-NEXT: G_FMAXNUM (opcode {{[0-9]+}}): 1 type index			# DEBUG-NEXT: G_FMAXNUM (opcode {{[0-9]+}}): 1 type index
	# DEBUG-NEXT: .. the first uncovered type index: 1, OK			# DEBUG-NEXT: .. type index coverage check SKIPPED: user-defined predicate detected
	# DEBUG-NEXT: .. the first uncovered imm index: 0, OK			# DEBUG-NEXT: .. imm index coverage check SKIPPED: user-defined predicate detected
	# DEBUG-NEXT: G_FMINNUM_IEEE (opcode {{[0-9]+}}): 1 type index			# DEBUG-NEXT: G_FMINNUM_IEEE (opcode {{[0-9]+}}): 1 type index
	# DEBUG-NEXT: .. type index coverage check SKIPPED: no rules defined			# DEBUG-NEXT: .. type index coverage check SKIPPED: no rules defined
	# DEBUG-NEXT: .. imm index coverage check SKIPPED: no rules defined			# DEBUG-NEXT: .. imm index coverage check SKIPPED: no rules defined
	# DEBUG-NEXT: G_FMAXNUM_IEEE (opcode {{[0-9]+}}): 1 type index			# DEBUG-NEXT: G_FMAXNUM_IEEE (opcode {{[0-9]+}}): 1 type index
	# DEBUG-NEXT: .. type index coverage check SKIPPED: no rules defined			# DEBUG-NEXT: .. type index coverage check SKIPPED: no rules defined
	# DEBUG-NEXT: .. imm index coverage check SKIPPED: no rules defined			# DEBUG-NEXT: .. imm index coverage check SKIPPED: no rules defined
	# DEBUG-NEXT: G_FMINIMUM (opcode {{[0-9]+}}): 1 type index			# DEBUG-NEXT: G_FMINIMUM (opcode {{[0-9]+}}): 1 type index
	# DEBUG-NEXT: .. opcode {{[0-9]+}} is aliased to {{[0-9]+}}			# DEBUG-NEXT: .. opcode {{[0-9]+}} is aliased to {{[0-9]+}}
	▲ Show 20 Lines • Show All 219 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/fminmax.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 3
	; RUN: llc -mtriple=aarch64-none-eabi -verify-machineinstrs %s -o - \| FileCheck %s --check-prefixes=CHECK,CHECK-NOFP16			; RUN: llc -mtriple=aarch64-none-eabi -verify-machineinstrs %s -o - \| FileCheck %s --check-prefixes=CHECK,CHECK-SD,CHECK-NOFP16-SD
	; RUN: llc -mtriple=aarch64-none-eabi -mattr=+fullfp16 -verify-machineinstrs %s -o - \| FileCheck %s --check-prefixes=CHECK,CHECK-FP16			; RUN: llc -mtriple=aarch64-none-eabi -mattr=+fullfp16 -verify-machineinstrs %s -o - \| FileCheck %s --check-prefixes=CHECK,CHECK-SD,CHECK-FP16-SD
				; RUN: llc -mtriple=aarch64-none-eabi -global-isel -verify-machineinstrs %s -o - \| FileCheck %s --check-prefixes=CHECK,CHECK-GI,CHECK-NOFP16-GI
				; RUN: llc -mtriple=aarch64-none-eabi -mattr=+fullfp16 -global-isel -verify-machineinstrs %s -o - \| FileCheck %s --check-prefixes=CHECK,CHECK-GI,CHECK-FP16-GI

	define double @min_f64(double %a, double %b) {			define double @min_f64(double %a, double %b) {
	; CHECK-LABEL: min_f64:			; CHECK-LABEL: min_f64:
	; CHECK: // %bb.0: // %entry			; CHECK: // %bb.0: // %entry
	; CHECK-NEXT: fminnm d0, d0, d1			; CHECK-NEXT: fminnm d0, d0, d1
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%c = call double @llvm.minnum.f64(double %a, double %b)			%c = call double @llvm.minnum.f64(double %a, double %b)
	Show All 26 Lines
	; CHECK-NEXT: fmaxnm s0, s0, s1			; CHECK-NEXT: fmaxnm s0, s0, s1
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%c = call float @llvm.maxnum.f32(float %a, float %b)			%c = call float @llvm.maxnum.f32(float %a, float %b)
	ret float %c			ret float %c
	}			}

	define half @min_f16(half %a, half %b) {			define half @min_f16(half %a, half %b) {
	; CHECK-NOFP16-LABEL: min_f16:			; CHECK-NOFP16-SD-LABEL: min_f16:
	; CHECK-NOFP16: // %bb.0: // %entry			; CHECK-NOFP16-SD: // %bb.0: // %entry
	; CHECK-NOFP16-NEXT: fcvt s1, h1			; CHECK-NOFP16-SD-NEXT: fcvt s1, h1
	; CHECK-NOFP16-NEXT: fcvt s0, h0			; CHECK-NOFP16-SD-NEXT: fcvt s0, h0
	; CHECK-NOFP16-NEXT: fminnm s0, s0, s1			; CHECK-NOFP16-SD-NEXT: fminnm s0, s0, s1
	; CHECK-NOFP16-NEXT: fcvt h0, s0			; CHECK-NOFP16-SD-NEXT: fcvt h0, s0
	; CHECK-NOFP16-NEXT: ret			; CHECK-NOFP16-SD-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: min_f16:			; CHECK-FP16-SD-LABEL: min_f16:
	; CHECK-FP16: // %bb.0: // %entry			; CHECK-FP16-SD: // %bb.0: // %entry
	; CHECK-FP16-NEXT: fminnm h0, h0, h1			; CHECK-FP16-SD-NEXT: fminnm h0, h0, h1
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-SD-NEXT: ret
				;
				; CHECK-NOFP16-GI-LABEL: min_f16:
				; CHECK-NOFP16-GI: // %bb.0: // %entry
				; CHECK-NOFP16-GI-NEXT: fcvt s0, h0
				; CHECK-NOFP16-GI-NEXT: fcvt s1, h1
				; CHECK-NOFP16-GI-NEXT: fminnm s0, s0, s1
				; CHECK-NOFP16-GI-NEXT: fcvt h0, s0
				; CHECK-NOFP16-GI-NEXT: ret
				;
				; CHECK-FP16-GI-LABEL: min_f16:
				; CHECK-FP16-GI: // %bb.0: // %entry
				; CHECK-FP16-GI-NEXT: fminnm h0, h0, h1
				; CHECK-FP16-GI-NEXT: ret
	entry:			entry:
	%c = call half @llvm.minnum.f16(half %a, half %b)			%c = call half @llvm.minnum.f16(half %a, half %b)
	ret half %c			ret half %c
	}			}

	define half @max_f16(half %a, half %b) {			define half @max_f16(half %a, half %b) {
	; CHECK-NOFP16-LABEL: max_f16:			; CHECK-NOFP16-SD-LABEL: max_f16:
	; CHECK-NOFP16: // %bb.0: // %entry			; CHECK-NOFP16-SD: // %bb.0: // %entry
	; CHECK-NOFP16-NEXT: fcvt s1, h1			; CHECK-NOFP16-SD-NEXT: fcvt s1, h1
	; CHECK-NOFP16-NEXT: fcvt s0, h0			; CHECK-NOFP16-SD-NEXT: fcvt s0, h0
	; CHECK-NOFP16-NEXT: fmaxnm s0, s0, s1			; CHECK-NOFP16-SD-NEXT: fmaxnm s0, s0, s1
	; CHECK-NOFP16-NEXT: fcvt h0, s0			; CHECK-NOFP16-SD-NEXT: fcvt h0, s0
	; CHECK-NOFP16-NEXT: ret			; CHECK-NOFP16-SD-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: max_f16:			; CHECK-FP16-SD-LABEL: max_f16:
	; CHECK-FP16: // %bb.0: // %entry			; CHECK-FP16-SD: // %bb.0: // %entry
	; CHECK-FP16-NEXT: fmaxnm h0, h0, h1			; CHECK-FP16-SD-NEXT: fmaxnm h0, h0, h1
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-SD-NEXT: ret
				;
				; CHECK-NOFP16-GI-LABEL: max_f16:
				; CHECK-NOFP16-GI: // %bb.0: // %entry
				; CHECK-NOFP16-GI-NEXT: fcvt s0, h0
				; CHECK-NOFP16-GI-NEXT: fcvt s1, h1
				; CHECK-NOFP16-GI-NEXT: fmaxnm s0, s0, s1
				; CHECK-NOFP16-GI-NEXT: fcvt h0, s0
				; CHECK-NOFP16-GI-NEXT: ret
				;
				; CHECK-FP16-GI-LABEL: max_f16:
				; CHECK-FP16-GI: // %bb.0: // %entry
				; CHECK-FP16-GI-NEXT: fmaxnm h0, h0, h1
				; CHECK-FP16-GI-NEXT: ret
	entry:			entry:
	%c = call half @llvm.maxnum.f16(half %a, half %b)			%c = call half @llvm.maxnum.f16(half %a, half %b)
	ret half %c			ret half %c
	}			}

	define <2 x double> @min_v2f64(<2 x double> %a, <2 x double> %b) {			define <2 x double> @min_v2f64(<2 x double> %a, <2 x double> %b) {
	; CHECK-LABEL: min_v2f64:			; CHECK-LABEL: min_v2f64:
	; CHECK: // %bb.0: // %entry			; CHECK: // %bb.0: // %entry
	Show All 10 Lines
	; CHECK-NEXT: fmaxnm v0.2d, v0.2d, v1.2d			; CHECK-NEXT: fmaxnm v0.2d, v0.2d, v1.2d
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%c = call <2 x double> @llvm.maxnum.v2f64(<2 x double> %a, <2 x double> %b)			%c = call <2 x double> @llvm.maxnum.v2f64(<2 x double> %a, <2 x double> %b)
	ret <2 x double> %c			ret <2 x double> %c
	}			}

	define <3 x double> @min_v3f64(<3 x double> %a, <3 x double> %b) {			define <3 x double> @min_v3f64(<3 x double> %a, <3 x double> %b) {
	; CHECK-LABEL: min_v3f64:			; CHECK-SD-LABEL: min_v3f64:
	; CHECK: // %bb.0: // %entry			; CHECK-SD: // %bb.0: // %entry
	; CHECK-NEXT: // kill: def $d3 killed $d3 def $q3			; CHECK-SD-NEXT: // kill: def $d3 killed $d3 def $q3
	; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0			; CHECK-SD-NEXT: // kill: def $d0 killed $d0 def $q0
	; CHECK-NEXT: // kill: def $d4 killed $d4 def $q4			; CHECK-SD-NEXT: // kill: def $d4 killed $d4 def $q4
	; CHECK-NEXT: // kill: def $d1 killed $d1 def $q1			; CHECK-SD-NEXT: // kill: def $d1 killed $d1 def $q1
	; CHECK-NEXT: // kill: def $d2 killed $d2 def $q2			; CHECK-SD-NEXT: // kill: def $d2 killed $d2 def $q2
	; CHECK-NEXT: // kill: def $d5 killed $d5 def $q5			; CHECK-SD-NEXT: // kill: def $d5 killed $d5 def $q5
	; CHECK-NEXT: mov v3.d[1], v4.d[0]			; CHECK-SD-NEXT: mov v3.d[1], v4.d[0]
	; CHECK-NEXT: mov v0.d[1], v1.d[0]			; CHECK-SD-NEXT: mov v0.d[1], v1.d[0]
	; CHECK-NEXT: fminnm v2.2d, v2.2d, v5.2d			; CHECK-SD-NEXT: fminnm v2.2d, v2.2d, v5.2d
	; CHECK-NEXT: // kill: def $d2 killed $d2 killed $q2			; CHECK-SD-NEXT: // kill: def $d2 killed $d2 killed $q2
	; CHECK-NEXT: fminnm v0.2d, v0.2d, v3.2d			; CHECK-SD-NEXT: fminnm v0.2d, v0.2d, v3.2d
	; CHECK-NEXT: ext v1.16b, v0.16b, v0.16b, #8			; CHECK-SD-NEXT: ext v1.16b, v0.16b, v0.16b, #8
	; CHECK-NEXT: // kill: def $d0 killed $d0 killed $q0			; CHECK-SD-NEXT: // kill: def $d0 killed $d0 killed $q0
	; CHECK-NEXT: // kill: def $d1 killed $d1 killed $q1			; CHECK-SD-NEXT: // kill: def $d1 killed $d1 killed $q1
	; CHECK-NEXT: ret			; CHECK-SD-NEXT: ret
				;
				; CHECK-GI-LABEL: min_v3f64:
				; CHECK-GI: // %bb.0: // %entry
				; CHECK-GI-NEXT: // kill: def $d0 killed $d0 def $q0
				; CHECK-GI-NEXT: // kill: def $d3 killed $d3 def $q3
				; CHECK-GI-NEXT: // kill: def $d1 killed $d1 def $q1
				; CHECK-GI-NEXT: // kill: def $d4 killed $d4 def $q4
				; CHECK-GI-NEXT: fminnm d2, d2, d5
				; CHECK-GI-NEXT: mov v0.d[1], v1.d[0]
				; CHECK-GI-NEXT: mov v3.d[1], v4.d[0]
				; CHECK-GI-NEXT: fminnm v0.2d, v0.2d, v3.2d
				; CHECK-GI-NEXT: mov d1, v0.d[1]
				; CHECK-GI-NEXT: // kill: def $d0 killed $d0 killed $q0
				; CHECK-GI-NEXT: ret
	entry:			entry:
	%c = call <3 x double> @llvm.minnum.v3f64(<3 x double> %a, <3 x double> %b)			%c = call <3 x double> @llvm.minnum.v3f64(<3 x double> %a, <3 x double> %b)
	ret <3 x double> %c			ret <3 x double> %c
	}			}

	define <3 x double> @max_v3f64(<3 x double> %a, <3 x double> %b) {			define <3 x double> @max_v3f64(<3 x double> %a, <3 x double> %b) {
	; CHECK-LABEL: max_v3f64:			; CHECK-SD-LABEL: max_v3f64:
	; CHECK: // %bb.0: // %entry			; CHECK-SD: // %bb.0: // %entry
	; CHECK-NEXT: // kill: def $d3 killed $d3 def $q3			; CHECK-SD-NEXT: // kill: def $d3 killed $d3 def $q3
	; CHECK-NEXT: // kill: def $d0 killed $d0 def $q0			; CHECK-SD-NEXT: // kill: def $d0 killed $d0 def $q0
	; CHECK-NEXT: // kill: def $d4 killed $d4 def $q4			; CHECK-SD-NEXT: // kill: def $d4 killed $d4 def $q4
	; CHECK-NEXT: // kill: def $d1 killed $d1 def $q1			; CHECK-SD-NEXT: // kill: def $d1 killed $d1 def $q1
	; CHECK-NEXT: // kill: def $d2 killed $d2 def $q2			; CHECK-SD-NEXT: // kill: def $d2 killed $d2 def $q2
	; CHECK-NEXT: // kill: def $d5 killed $d5 def $q5			; CHECK-SD-NEXT: // kill: def $d5 killed $d5 def $q5
	; CHECK-NEXT: mov v3.d[1], v4.d[0]			; CHECK-SD-NEXT: mov v3.d[1], v4.d[0]
	; CHECK-NEXT: mov v0.d[1], v1.d[0]			; CHECK-SD-NEXT: mov v0.d[1], v1.d[0]
	; CHECK-NEXT: fmaxnm v2.2d, v2.2d, v5.2d			; CHECK-SD-NEXT: fmaxnm v2.2d, v2.2d, v5.2d
	; CHECK-NEXT: // kill: def $d2 killed $d2 killed $q2			; CHECK-SD-NEXT: // kill: def $d2 killed $d2 killed $q2
	; CHECK-NEXT: fmaxnm v0.2d, v0.2d, v3.2d			; CHECK-SD-NEXT: fmaxnm v0.2d, v0.2d, v3.2d
	; CHECK-NEXT: ext v1.16b, v0.16b, v0.16b, #8			; CHECK-SD-NEXT: ext v1.16b, v0.16b, v0.16b, #8
	; CHECK-NEXT: // kill: def $d0 killed $d0 killed $q0			; CHECK-SD-NEXT: // kill: def $d0 killed $d0 killed $q0
	; CHECK-NEXT: // kill: def $d1 killed $d1 killed $q1			; CHECK-SD-NEXT: // kill: def $d1 killed $d1 killed $q1
	; CHECK-NEXT: ret			; CHECK-SD-NEXT: ret
				;
				; CHECK-GI-LABEL: max_v3f64:
				; CHECK-GI: // %bb.0: // %entry
				; CHECK-GI-NEXT: // kill: def $d0 killed $d0 def $q0
				; CHECK-GI-NEXT: // kill: def $d3 killed $d3 def $q3
				; CHECK-GI-NEXT: // kill: def $d1 killed $d1 def $q1
				; CHECK-GI-NEXT: // kill: def $d4 killed $d4 def $q4
				; CHECK-GI-NEXT: fmaxnm d2, d2, d5
				; CHECK-GI-NEXT: mov v0.d[1], v1.d[0]
				; CHECK-GI-NEXT: mov v3.d[1], v4.d[0]
				; CHECK-GI-NEXT: fmaxnm v0.2d, v0.2d, v3.2d
				; CHECK-GI-NEXT: mov d1, v0.d[1]
				; CHECK-GI-NEXT: // kill: def $d0 killed $d0 killed $q0
				; CHECK-GI-NEXT: ret
	entry:			entry:
	%c = call <3 x double> @llvm.maxnum.v3f64(<3 x double> %a, <3 x double> %b)			%c = call <3 x double> @llvm.maxnum.v3f64(<3 x double> %a, <3 x double> %b)
	ret <3 x double> %c			ret <3 x double> %c
	}			}

	define <4 x double> @min_v4f64(<4 x double> %a, <4 x double> %b) {			define <4 x double> @min_v4f64(<4 x double> %a, <4 x double> %b) {
	; CHECK-LABEL: min_v4f64:			; CHECK-LABEL: min_v4f64:
	; CHECK: // %bb.0: // %entry			; CHECK: // %bb.0: // %entry
	Show All 32 Lines
	; CHECK-NEXT: fmaxnm v0.2s, v0.2s, v1.2s			; CHECK-NEXT: fmaxnm v0.2s, v0.2s, v1.2s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%c = call <2 x float> @llvm.maxnum.v2f32(<2 x float> %a, <2 x float> %b)			%c = call <2 x float> @llvm.maxnum.v2f32(<2 x float> %a, <2 x float> %b)
	ret <2 x float> %c			ret <2 x float> %c
	}			}

	define <3 x float> @min_v3f32(<3 x float> %a, <3 x float> %b) {			define <3 x float> @min_v3f32(<3 x float> %a, <3 x float> %b) {
	; CHECK-LABEL: min_v3f32:			; CHECK-SD-LABEL: min_v3f32:
	; CHECK: // %bb.0: // %entry			; CHECK-SD: // %bb.0: // %entry
	; CHECK-NEXT: fminnm v0.4s, v0.4s, v1.4s			; CHECK-SD-NEXT: fminnm v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ret			; CHECK-SD-NEXT: ret
				;
				; CHECK-GI-LABEL: min_v3f32:
				; CHECK-GI: // %bb.0: // %entry
				; CHECK-GI-NEXT: mov s2, v0.s[1]
				; CHECK-GI-NEXT: mov s3, v1.s[1]
				; CHECK-GI-NEXT: mov s4, v0.s[2]
				; CHECK-GI-NEXT: mov s5, v1.s[2]
				; CHECK-GI-NEXT: mov v0.s[1], v2.s[0]
				; CHECK-GI-NEXT: mov v1.s[1], v3.s[0]
				; CHECK-GI-NEXT: mov v0.s[2], v4.s[0]
				; CHECK-GI-NEXT: mov v1.s[2], v5.s[0]
				; CHECK-GI-NEXT: mov v0.s[3], v0.s[0]
				; CHECK-GI-NEXT: mov v1.s[3], v0.s[0]
				; CHECK-GI-NEXT: fminnm v0.4s, v0.4s, v1.4s
				; CHECK-GI-NEXT: mov s1, v0.s[1]
				; CHECK-GI-NEXT: mov s2, v0.s[2]
				; CHECK-GI-NEXT: mov v0.s[1], v1.s[0]
				; CHECK-GI-NEXT: mov v0.s[2], v2.s[0]
				; CHECK-GI-NEXT: mov v0.s[3], v0.s[0]
				; CHECK-GI-NEXT: ret
	entry:			entry:
	%c = call <3 x float> @llvm.minnum.v3f32(<3 x float> %a, <3 x float> %b)			%c = call <3 x float> @llvm.minnum.v3f32(<3 x float> %a, <3 x float> %b)
				tschuettUnsubmitted Not Done Reply Inline Actions The 3 x f32 seems to fail again, but it should be in reach. tschuett: The 3 x f32 seems to fail again, but it should be in reach.
				dmgreenAuthorUnsubmitted Done Reply Inline Actions It's just uglyness from buildvectors with undef elements. You can see it moving out-of and into the same register: mov s2, v0.s[1] .. mov v0.s[1], v2.s[0] And it shouldn't be setting v0.s[3], as those value are just undef. All that can be cleaned up with other combines, they just haven't been implemented yet (and they resolve around what happens to propagated undef elements, so have some dragons). dmgreen: It's just uglyness from buildvectors with undef elements. You can see it moving out-of and into…
	ret <3 x float> %c			ret <3 x float> %c
	}			}

	define <3 x float> @max_v3f32(<3 x float> %a, <3 x float> %b) {			define <3 x float> @max_v3f32(<3 x float> %a, <3 x float> %b) {
	; CHECK-LABEL: max_v3f32:			; CHECK-SD-LABEL: max_v3f32:
	; CHECK: // %bb.0: // %entry			; CHECK-SD: // %bb.0: // %entry
	; CHECK-NEXT: fmaxnm v0.4s, v0.4s, v1.4s			; CHECK-SD-NEXT: fmaxnm v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ret			; CHECK-SD-NEXT: ret
				;
				; CHECK-GI-LABEL: max_v3f32:
				; CHECK-GI: // %bb.0: // %entry
				; CHECK-GI-NEXT: mov s2, v0.s[1]
				; CHECK-GI-NEXT: mov s3, v1.s[1]
				; CHECK-GI-NEXT: mov s4, v0.s[2]
				; CHECK-GI-NEXT: mov s5, v1.s[2]
				; CHECK-GI-NEXT: mov v0.s[1], v2.s[0]
				; CHECK-GI-NEXT: mov v1.s[1], v3.s[0]
				; CHECK-GI-NEXT: mov v0.s[2], v4.s[0]
				; CHECK-GI-NEXT: mov v1.s[2], v5.s[0]
				; CHECK-GI-NEXT: mov v0.s[3], v0.s[0]
				; CHECK-GI-NEXT: mov v1.s[3], v0.s[0]
				; CHECK-GI-NEXT: fmaxnm v0.4s, v0.4s, v1.4s
				; CHECK-GI-NEXT: mov s1, v0.s[1]
				; CHECK-GI-NEXT: mov s2, v0.s[2]
				; CHECK-GI-NEXT: mov v0.s[1], v1.s[0]
				; CHECK-GI-NEXT: mov v0.s[2], v2.s[0]
				; CHECK-GI-NEXT: mov v0.s[3], v0.s[0]
				; CHECK-GI-NEXT: ret
	entry:			entry:
	%c = call <3 x float> @llvm.maxnum.v3f32(<3 x float> %a, <3 x float> %b)			%c = call <3 x float> @llvm.maxnum.v3f32(<3 x float> %a, <3 x float> %b)
	ret <3 x float> %c			ret <3 x float> %c
	}			}

	define <4 x float> @min_v4f32(<4 x float> %a, <4 x float> %b) {			define <4 x float> @min_v4f32(<4 x float> %a, <4 x float> %b) {
	; CHECK-LABEL: min_v4f32:			; CHECK-LABEL: min_v4f32:
	; CHECK: // %bb.0: // %entry			; CHECK: // %bb.0: // %entry
	Show All 10 Lines
	; CHECK-NEXT: fmaxnm v0.4s, v0.4s, v1.4s			; CHECK-NEXT: fmaxnm v0.4s, v0.4s, v1.4s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%c = call <4 x float> @llvm.maxnum.v4f32(<4 x float> %a, <4 x float> %b)			%c = call <4 x float> @llvm.maxnum.v4f32(<4 x float> %a, <4 x float> %b)
	ret <4 x float> %c			ret <4 x float> %c
	}			}

	define <7 x float> @min_v7f32(<7 x float> %a, <7 x float> %b) {			define <7 x float> @min_v7f32(<7 x float> %a, <7 x float> %b) {
	; CHECK-LABEL: min_v7f32:			; CHECK-SD-LABEL: min_v7f32:
	; CHECK: // %bb.0: // %entry			; CHECK-SD: // %bb.0: // %entry
	; CHECK-NEXT: mov x8, sp			; CHECK-SD-NEXT: mov x8, sp
	; CHECK-NEXT: // kill: def $s7 killed $s7 def $q7			; CHECK-SD-NEXT: // kill: def $s7 killed $s7 def $q7
	; CHECK-NEXT: // kill: def $s0 killed $s0 def $q0			; CHECK-SD-NEXT: // kill: def $s0 killed $s0 def $q0
	; CHECK-NEXT: // kill: def $s1 killed $s1 def $q1			; CHECK-SD-NEXT: // kill: def $s1 killed $s1 def $q1
	; CHECK-NEXT: add x9, sp, #32			; CHECK-SD-NEXT: add x9, sp, #32
	; CHECK-NEXT: mov v0.s[1], v1.s[0]			; CHECK-SD-NEXT: mov v0.s[1], v1.s[0]
	; CHECK-NEXT: ldr s1, [sp, #24]			; CHECK-SD-NEXT: ldr s1, [sp, #24]
	; CHECK-NEXT: // kill: def $s4 killed $s4 def $q4			; CHECK-SD-NEXT: // kill: def $s4 killed $s4 def $q4
	; CHECK-NEXT: // kill: def $s5 killed $s5 def $q5			; CHECK-SD-NEXT: // kill: def $s5 killed $s5 def $q5
	; CHECK-NEXT: // kill: def $s2 killed $s2 def $q2			; CHECK-SD-NEXT: // kill: def $s2 killed $s2 def $q2
	; CHECK-NEXT: // kill: def $s6 killed $s6 def $q6			; CHECK-SD-NEXT: // kill: def $s6 killed $s6 def $q6
	; CHECK-NEXT: // kill: def $s3 killed $s3 def $q3			; CHECK-SD-NEXT: // kill: def $s3 killed $s3 def $q3
	; CHECK-NEXT: ld1 { v7.s }[1], [x8]			; CHECK-SD-NEXT: ld1 { v7.s }[1], [x8]
	; CHECK-NEXT: add x8, sp, #8			; CHECK-SD-NEXT: add x8, sp, #8
	; CHECK-NEXT: ld1 { v1.s }[1], [x9]			; CHECK-SD-NEXT: ld1 { v1.s }[1], [x9]
	; CHECK-NEXT: mov v0.s[2], v2.s[0]			; CHECK-SD-NEXT: mov v0.s[2], v2.s[0]
	; CHECK-NEXT: mov v4.s[1], v5.s[0]			; CHECK-SD-NEXT: mov v4.s[1], v5.s[0]
	; CHECK-NEXT: ld1 { v7.s }[2], [x8]			; CHECK-SD-NEXT: ld1 { v7.s }[2], [x8]
	; CHECK-NEXT: add x8, sp, #16			; CHECK-SD-NEXT: add x8, sp, #16
	; CHECK-NEXT: mov v0.s[3], v3.s[0]			; CHECK-SD-NEXT: mov v0.s[3], v3.s[0]
	; CHECK-NEXT: mov v4.s[2], v6.s[0]			; CHECK-SD-NEXT: mov v4.s[2], v6.s[0]
	; CHECK-NEXT: ld1 { v7.s }[3], [x8]			; CHECK-SD-NEXT: ld1 { v7.s }[3], [x8]
	; CHECK-NEXT: add x8, sp, #40			; CHECK-SD-NEXT: add x8, sp, #40
	; CHECK-NEXT: ld1 { v1.s }[2], [x8]			; CHECK-SD-NEXT: ld1 { v1.s }[2], [x8]
	; CHECK-NEXT: fminnm v0.4s, v0.4s, v7.4s			; CHECK-SD-NEXT: fminnm v0.4s, v0.4s, v7.4s
	; CHECK-NEXT: fminnm v4.4s, v4.4s, v1.4s			; CHECK-SD-NEXT: fminnm v4.4s, v4.4s, v1.4s
	; CHECK-NEXT: mov s1, v0.s[1]			; CHECK-SD-NEXT: mov s1, v0.s[1]
	; CHECK-NEXT: mov s2, v0.s[2]			; CHECK-SD-NEXT: mov s2, v0.s[2]
	; CHECK-NEXT: mov s3, v0.s[3]			; CHECK-SD-NEXT: mov s3, v0.s[3]
	; CHECK-NEXT: // kill: def $s0 killed $s0 killed $q0			; CHECK-SD-NEXT: // kill: def $s0 killed $s0 killed $q0
	; CHECK-NEXT: mov s5, v4.s[1]			; CHECK-SD-NEXT: mov s5, v4.s[1]
	; CHECK-NEXT: mov s6, v4.s[2]			; CHECK-SD-NEXT: mov s6, v4.s[2]
	; CHECK-NEXT: // kill: def $s4 killed $s4 killed $q4			; CHECK-SD-NEXT: // kill: def $s4 killed $s4 killed $q4
	; CHECK-NEXT: ret			; CHECK-SD-NEXT: ret
				;
				; CHECK-GI-LABEL: min_v7f32:
				; CHECK-GI: // %bb.0: // %entry
				; CHECK-GI-NEXT: // kill: def $s0 killed $s0 def $q0
				; CHECK-GI-NEXT: // kill: def $s1 killed $s1 def $q1
				; CHECK-GI-NEXT: ldr s16, [sp]
				; CHECK-GI-NEXT: // kill: def $s4 killed $s4 def $q4
				; CHECK-GI-NEXT: // kill: def $s7 killed $s7 def $q7
				; CHECK-GI-NEXT: // kill: def $s5 killed $s5 def $q5
				; CHECK-GI-NEXT: // kill: def $s2 killed $s2 def $q2
				; CHECK-GI-NEXT: // kill: def $s6 killed $s6 def $q6
				; CHECK-GI-NEXT: // kill: def $s3 killed $s3 def $q3
				; CHECK-GI-NEXT: mov v0.s[1], v1.s[0]
				; CHECK-GI-NEXT: ldr s19, [sp, #24]
				; CHECK-GI-NEXT: ldr s20, [sp, #32]
				; CHECK-GI-NEXT: mov v7.s[1], v16.s[0]
				; CHECK-GI-NEXT: ldr s17, [sp, #8]
				; CHECK-GI-NEXT: mov v4.s[1], v5.s[0]
				; CHECK-GI-NEXT: ldr s21, [sp, #40]
				; CHECK-GI-NEXT: mov v19.s[1], v20.s[0]
				; CHECK-GI-NEXT: ldr s18, [sp, #16]
				; CHECK-GI-NEXT: mov v0.s[2], v2.s[0]
				; CHECK-GI-NEXT: mov v7.s[2], v17.s[0]
				; CHECK-GI-NEXT: mov v4.s[2], v6.s[0]
				; CHECK-GI-NEXT: mov v19.s[2], v21.s[0]
				; CHECK-GI-NEXT: mov v0.s[3], v3.s[0]
				; CHECK-GI-NEXT: mov v7.s[3], v18.s[0]
				; CHECK-GI-NEXT: mov v4.s[3], v0.s[0]
				; CHECK-GI-NEXT: mov v19.s[3], v0.s[0]
				; CHECK-GI-NEXT: fminnm v0.4s, v0.4s, v7.4s
				; CHECK-GI-NEXT: fminnm v4.4s, v4.4s, v19.4s
				; CHECK-GI-NEXT: mov s1, v0.s[1]
				; CHECK-GI-NEXT: mov s2, v0.s[2]
				; CHECK-GI-NEXT: mov s3, v0.s[3]
				; CHECK-GI-NEXT: // kill: def $s0 killed $s0 killed $q0
				; CHECK-GI-NEXT: mov s5, v4.s[1]
				; CHECK-GI-NEXT: mov s6, v4.s[2]
				; CHECK-GI-NEXT: // kill: def $s4 killed $s4 killed $q4
				; CHECK-GI-NEXT: ret
	entry:			entry:
	%c = call <7 x float> @llvm.minnum.v7f32(<7 x float> %a, <7 x float> %b)			%c = call <7 x float> @llvm.minnum.v7f32(<7 x float> %a, <7 x float> %b)
				tschuettUnsubmitted Not Done Reply Inline Actions The 7 is ugly for both. tschuett: The 7 is ugly for both.
				dmgreenAuthorUnsubmitted Done Reply Inline Actions The calling convention here is very odd. They seem to match between the two, at least. dmgreen: The calling convention here is very odd. They seem to match between the two, at least.
	ret <7 x float> %c			ret <7 x float> %c
	}			}

	define <7 x float> @max_v7f32(<7 x float> %a, <7 x float> %b) {			define <7 x float> @max_v7f32(<7 x float> %a, <7 x float> %b) {
	; CHECK-LABEL: max_v7f32:			; CHECK-SD-LABEL: max_v7f32:
	; CHECK: // %bb.0: // %entry			; CHECK-SD: // %bb.0: // %entry
	; CHECK-NEXT: mov x8, sp			; CHECK-SD-NEXT: mov x8, sp
	; CHECK-NEXT: // kill: def $s7 killed $s7 def $q7			; CHECK-SD-NEXT: // kill: def $s7 killed $s7 def $q7
	; CHECK-NEXT: // kill: def $s0 killed $s0 def $q0			; CHECK-SD-NEXT: // kill: def $s0 killed $s0 def $q0
	; CHECK-NEXT: // kill: def $s1 killed $s1 def $q1			; CHECK-SD-NEXT: // kill: def $s1 killed $s1 def $q1
	; CHECK-NEXT: add x9, sp, #32			; CHECK-SD-NEXT: add x9, sp, #32
	; CHECK-NEXT: mov v0.s[1], v1.s[0]			; CHECK-SD-NEXT: mov v0.s[1], v1.s[0]
	; CHECK-NEXT: ldr s1, [sp, #24]			; CHECK-SD-NEXT: ldr s1, [sp, #24]
	; CHECK-NEXT: // kill: def $s4 killed $s4 def $q4			; CHECK-SD-NEXT: // kill: def $s4 killed $s4 def $q4
	; CHECK-NEXT: // kill: def $s5 killed $s5 def $q5			; CHECK-SD-NEXT: // kill: def $s5 killed $s5 def $q5
	; CHECK-NEXT: // kill: def $s2 killed $s2 def $q2			; CHECK-SD-NEXT: // kill: def $s2 killed $s2 def $q2
	; CHECK-NEXT: // kill: def $s6 killed $s6 def $q6			; CHECK-SD-NEXT: // kill: def $s6 killed $s6 def $q6
	; CHECK-NEXT: // kill: def $s3 killed $s3 def $q3			; CHECK-SD-NEXT: // kill: def $s3 killed $s3 def $q3
	; CHECK-NEXT: ld1 { v7.s }[1], [x8]			; CHECK-SD-NEXT: ld1 { v7.s }[1], [x8]
	; CHECK-NEXT: add x8, sp, #8			; CHECK-SD-NEXT: add x8, sp, #8
	; CHECK-NEXT: ld1 { v1.s }[1], [x9]			; CHECK-SD-NEXT: ld1 { v1.s }[1], [x9]
	; CHECK-NEXT: mov v0.s[2], v2.s[0]			; CHECK-SD-NEXT: mov v0.s[2], v2.s[0]
	; CHECK-NEXT: mov v4.s[1], v5.s[0]			; CHECK-SD-NEXT: mov v4.s[1], v5.s[0]
	; CHECK-NEXT: ld1 { v7.s }[2], [x8]			; CHECK-SD-NEXT: ld1 { v7.s }[2], [x8]
	; CHECK-NEXT: add x8, sp, #16			; CHECK-SD-NEXT: add x8, sp, #16
	; CHECK-NEXT: mov v0.s[3], v3.s[0]			; CHECK-SD-NEXT: mov v0.s[3], v3.s[0]
	; CHECK-NEXT: mov v4.s[2], v6.s[0]			; CHECK-SD-NEXT: mov v4.s[2], v6.s[0]
	; CHECK-NEXT: ld1 { v7.s }[3], [x8]			; CHECK-SD-NEXT: ld1 { v7.s }[3], [x8]
	; CHECK-NEXT: add x8, sp, #40			; CHECK-SD-NEXT: add x8, sp, #40
	; CHECK-NEXT: ld1 { v1.s }[2], [x8]			; CHECK-SD-NEXT: ld1 { v1.s }[2], [x8]
	; CHECK-NEXT: fmaxnm v0.4s, v0.4s, v7.4s			; CHECK-SD-NEXT: fmaxnm v0.4s, v0.4s, v7.4s
	; CHECK-NEXT: fmaxnm v4.4s, v4.4s, v1.4s			; CHECK-SD-NEXT: fmaxnm v4.4s, v4.4s, v1.4s
	; CHECK-NEXT: mov s1, v0.s[1]			; CHECK-SD-NEXT: mov s1, v0.s[1]
	; CHECK-NEXT: mov s2, v0.s[2]			; CHECK-SD-NEXT: mov s2, v0.s[2]
	; CHECK-NEXT: mov s3, v0.s[3]			; CHECK-SD-NEXT: mov s3, v0.s[3]
	; CHECK-NEXT: // kill: def $s0 killed $s0 killed $q0			; CHECK-SD-NEXT: // kill: def $s0 killed $s0 killed $q0
	; CHECK-NEXT: mov s5, v4.s[1]			; CHECK-SD-NEXT: mov s5, v4.s[1]
	; CHECK-NEXT: mov s6, v4.s[2]			; CHECK-SD-NEXT: mov s6, v4.s[2]
	; CHECK-NEXT: // kill: def $s4 killed $s4 killed $q4			; CHECK-SD-NEXT: // kill: def $s4 killed $s4 killed $q4
	; CHECK-NEXT: ret			; CHECK-SD-NEXT: ret
				;
				; CHECK-GI-LABEL: max_v7f32:
				; CHECK-GI: // %bb.0: // %entry
				; CHECK-GI-NEXT: // kill: def $s0 killed $s0 def $q0
				; CHECK-GI-NEXT: // kill: def $s1 killed $s1 def $q1
				; CHECK-GI-NEXT: ldr s16, [sp]
				; CHECK-GI-NEXT: // kill: def $s4 killed $s4 def $q4
				; CHECK-GI-NEXT: // kill: def $s7 killed $s7 def $q7
				; CHECK-GI-NEXT: // kill: def $s5 killed $s5 def $q5
				; CHECK-GI-NEXT: // kill: def $s2 killed $s2 def $q2
				; CHECK-GI-NEXT: // kill: def $s6 killed $s6 def $q6
				; CHECK-GI-NEXT: // kill: def $s3 killed $s3 def $q3
				; CHECK-GI-NEXT: mov v0.s[1], v1.s[0]
				; CHECK-GI-NEXT: ldr s19, [sp, #24]
				; CHECK-GI-NEXT: ldr s20, [sp, #32]
				; CHECK-GI-NEXT: mov v7.s[1], v16.s[0]
				; CHECK-GI-NEXT: ldr s17, [sp, #8]
				; CHECK-GI-NEXT: mov v4.s[1], v5.s[0]
				; CHECK-GI-NEXT: ldr s21, [sp, #40]
				; CHECK-GI-NEXT: mov v19.s[1], v20.s[0]
				; CHECK-GI-NEXT: ldr s18, [sp, #16]
				; CHECK-GI-NEXT: mov v0.s[2], v2.s[0]
				; CHECK-GI-NEXT: mov v7.s[2], v17.s[0]
				; CHECK-GI-NEXT: mov v4.s[2], v6.s[0]
				; CHECK-GI-NEXT: mov v19.s[2], v21.s[0]
				; CHECK-GI-NEXT: mov v0.s[3], v3.s[0]
				; CHECK-GI-NEXT: mov v7.s[3], v18.s[0]
				; CHECK-GI-NEXT: mov v4.s[3], v0.s[0]
				; CHECK-GI-NEXT: mov v19.s[3], v0.s[0]
				; CHECK-GI-NEXT: fmaxnm v0.4s, v0.4s, v7.4s
				; CHECK-GI-NEXT: fmaxnm v4.4s, v4.4s, v19.4s
				; CHECK-GI-NEXT: mov s1, v0.s[1]
				; CHECK-GI-NEXT: mov s2, v0.s[2]
				; CHECK-GI-NEXT: mov s3, v0.s[3]
				; CHECK-GI-NEXT: // kill: def $s0 killed $s0 killed $q0
				; CHECK-GI-NEXT: mov s5, v4.s[1]
				; CHECK-GI-NEXT: mov s6, v4.s[2]
				; CHECK-GI-NEXT: // kill: def $s4 killed $s4 killed $q4
				; CHECK-GI-NEXT: ret
	entry:			entry:
	%c = call <7 x float> @llvm.maxnum.v7f32(<7 x float> %a, <7 x float> %b)			%c = call <7 x float> @llvm.maxnum.v7f32(<7 x float> %a, <7 x float> %b)
	ret <7 x float> %c			ret <7 x float> %c
	}			}

	define <8 x float> @min_v8f32(<8 x float> %a, <8 x float> %b) {			define <8 x float> @min_v8f32(<8 x float> %a, <8 x float> %b) {
	; CHECK-LABEL: min_v8f32:			; CHECK-LABEL: min_v8f32:
	; CHECK: // %bb.0: // %entry			; CHECK: // %bb.0: // %entry
	Show All 12 Lines
	; CHECK-NEXT: fmaxnm v1.4s, v1.4s, v3.4s			; CHECK-NEXT: fmaxnm v1.4s, v1.4s, v3.4s
	; CHECK-NEXT: ret			; CHECK-NEXT: ret
	entry:			entry:
	%c = call <8 x float> @llvm.maxnum.v8f32(<8 x float> %a, <8 x float> %b)			%c = call <8 x float> @llvm.maxnum.v8f32(<8 x float> %a, <8 x float> %b)
	ret <8 x float> %c			ret <8 x float> %c
	}			}

	define <4 x half> @min_v4f16(<4 x half> %a, <4 x half> %b) {			define <4 x half> @min_v4f16(<4 x half> %a, <4 x half> %b) {
	; CHECK-NOFP16-LABEL: min_v4f16:			; CHECK-NOFP16-SD-LABEL: min_v4f16:
	; CHECK-NOFP16: // %bb.0: // %entry			; CHECK-NOFP16-SD: // %bb.0: // %entry
	; CHECK-NOFP16-NEXT: // kill: def $d1 killed $d1 def $q1			; CHECK-NOFP16-SD-NEXT: // kill: def $d1 killed $d1 def $q1
	; CHECK-NOFP16-NEXT: // kill: def $d0 killed $d0 def $q0			; CHECK-NOFP16-SD-NEXT: // kill: def $d0 killed $d0 def $q0
	; CHECK-NOFP16-NEXT: mov h2, v1.h[1]			; CHECK-NOFP16-SD-NEXT: mov h2, v1.h[1]
	; CHECK-NOFP16-NEXT: mov h3, v0.h[1]			; CHECK-NOFP16-SD-NEXT: mov h3, v0.h[1]
	; CHECK-NOFP16-NEXT: fcvt s4, h1			; CHECK-NOFP16-SD-NEXT: fcvt s4, h1
	; CHECK-NOFP16-NEXT: fcvt s5, h0			; CHECK-NOFP16-SD-NEXT: fcvt s5, h0
	; CHECK-NOFP16-NEXT: mov h6, v1.h[2]			; CHECK-NOFP16-SD-NEXT: mov h6, v1.h[2]
	; CHECK-NOFP16-NEXT: mov h7, v0.h[2]			; CHECK-NOFP16-SD-NEXT: mov h7, v0.h[2]
	; CHECK-NOFP16-NEXT: mov h1, v1.h[3]			; CHECK-NOFP16-SD-NEXT: mov h1, v1.h[3]
	; CHECK-NOFP16-NEXT: fcvt s2, h2			; CHECK-NOFP16-SD-NEXT: fcvt s2, h2
	; CHECK-NOFP16-NEXT: fcvt s3, h3			; CHECK-NOFP16-SD-NEXT: fcvt s3, h3
	; CHECK-NOFP16-NEXT: fminnm s4, s5, s4			; CHECK-NOFP16-SD-NEXT: fminnm s4, s5, s4
	; CHECK-NOFP16-NEXT: fcvt s5, h7			; CHECK-NOFP16-SD-NEXT: fcvt s5, h7
	; CHECK-NOFP16-NEXT: fcvt s1, h1			; CHECK-NOFP16-SD-NEXT: fcvt s1, h1
	; CHECK-NOFP16-NEXT: fminnm s2, s3, s2			; CHECK-NOFP16-SD-NEXT: fminnm s2, s3, s2
	; CHECK-NOFP16-NEXT: fcvt s3, h6			; CHECK-NOFP16-SD-NEXT: fcvt s3, h6
	; CHECK-NOFP16-NEXT: mov h6, v0.h[3]			; CHECK-NOFP16-SD-NEXT: mov h6, v0.h[3]
	; CHECK-NOFP16-NEXT: fcvt h0, s4			; CHECK-NOFP16-SD-NEXT: fcvt h0, s4
	; CHECK-NOFP16-NEXT: fcvt h2, s2			; CHECK-NOFP16-SD-NEXT: fcvt h2, s2
	; CHECK-NOFP16-NEXT: fminnm s3, s5, s3			; CHECK-NOFP16-SD-NEXT: fminnm s3, s5, s3
	; CHECK-NOFP16-NEXT: fcvt s4, h6			; CHECK-NOFP16-SD-NEXT: fcvt s4, h6
	; CHECK-NOFP16-NEXT: mov v0.h[1], v2.h[0]			; CHECK-NOFP16-SD-NEXT: mov v0.h[1], v2.h[0]
	; CHECK-NOFP16-NEXT: fcvt h2, s3			; CHECK-NOFP16-SD-NEXT: fcvt h2, s3
	; CHECK-NOFP16-NEXT: fminnm s1, s4, s1			; CHECK-NOFP16-SD-NEXT: fminnm s1, s4, s1
	; CHECK-NOFP16-NEXT: mov v0.h[2], v2.h[0]			; CHECK-NOFP16-SD-NEXT: mov v0.h[2], v2.h[0]
	; CHECK-NOFP16-NEXT: fcvt h1, s1			; CHECK-NOFP16-SD-NEXT: fcvt h1, s1
	; CHECK-NOFP16-NEXT: mov v0.h[3], v1.h[0]			; CHECK-NOFP16-SD-NEXT: mov v0.h[3], v1.h[0]
	; CHECK-NOFP16-NEXT: // kill: def $d0 killed $d0 killed $q0			; CHECK-NOFP16-SD-NEXT: // kill: def $d0 killed $d0 killed $q0
	; CHECK-NOFP16-NEXT: ret			; CHECK-NOFP16-SD-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: min_v4f16:			; CHECK-FP16-SD-LABEL: min_v4f16:
	; CHECK-FP16: // %bb.0: // %entry			; CHECK-FP16-SD: // %bb.0: // %entry
	; CHECK-FP16-NEXT: fminnm v0.4h, v0.4h, v1.4h			; CHECK-FP16-SD-NEXT: fminnm v0.4h, v0.4h, v1.4h
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-SD-NEXT: ret
				;
				; CHECK-NOFP16-GI-LABEL: min_v4f16:
				; CHECK-NOFP16-GI: // %bb.0: // %entry
				; CHECK-NOFP16-GI-NEXT: fcvtl v0.4s, v0.4h
				; CHECK-NOFP16-GI-NEXT: fcvtl v1.4s, v1.4h
				; CHECK-NOFP16-GI-NEXT: fminnm v0.4s, v0.4s, v1.4s
				; CHECK-NOFP16-GI-NEXT: fcvtn v0.4h, v0.4s
				; CHECK-NOFP16-GI-NEXT: ret
				;
				; CHECK-FP16-GI-LABEL: min_v4f16:
				; CHECK-FP16-GI: // %bb.0: // %entry
				; CHECK-FP16-GI-NEXT: fminnm v0.4h, v0.4h, v1.4h
				; CHECK-FP16-GI-NEXT: ret
	entry:			entry:
	%c = call <4 x half> @llvm.minnum.v4f16(<4 x half> %a, <4 x half> %b)			%c = call <4 x half> @llvm.minnum.v4f16(<4 x half> %a, <4 x half> %b)
	ret <4 x half> %c			ret <4 x half> %c
	}			}

	define <4 x half> @max_v4f16(<4 x half> %a, <4 x half> %b) {			define <4 x half> @max_v4f16(<4 x half> %a, <4 x half> %b) {
	; CHECK-NOFP16-LABEL: max_v4f16:			; CHECK-NOFP16-SD-LABEL: max_v4f16:
	; CHECK-NOFP16: // %bb.0: // %entry			; CHECK-NOFP16-SD: // %bb.0: // %entry
	; CHECK-NOFP16-NEXT: // kill: def $d1 killed $d1 def $q1			; CHECK-NOFP16-SD-NEXT: // kill: def $d1 killed $d1 def $q1
	; CHECK-NOFP16-NEXT: // kill: def $d0 killed $d0 def $q0			; CHECK-NOFP16-SD-NEXT: // kill: def $d0 killed $d0 def $q0
	; CHECK-NOFP16-NEXT: mov h2, v1.h[1]			; CHECK-NOFP16-SD-NEXT: mov h2, v1.h[1]
	; CHECK-NOFP16-NEXT: mov h3, v0.h[1]			; CHECK-NOFP16-SD-NEXT: mov h3, v0.h[1]
	; CHECK-NOFP16-NEXT: fcvt s4, h1			; CHECK-NOFP16-SD-NEXT: fcvt s4, h1
	; CHECK-NOFP16-NEXT: fcvt s5, h0			; CHECK-NOFP16-SD-NEXT: fcvt s5, h0
	; CHECK-NOFP16-NEXT: mov h6, v1.h[2]			; CHECK-NOFP16-SD-NEXT: mov h6, v1.h[2]
	; CHECK-NOFP16-NEXT: mov h7, v0.h[2]			; CHECK-NOFP16-SD-NEXT: mov h7, v0.h[2]
	; CHECK-NOFP16-NEXT: mov h1, v1.h[3]			; CHECK-NOFP16-SD-NEXT: mov h1, v1.h[3]
	; CHECK-NOFP16-NEXT: fcvt s2, h2			; CHECK-NOFP16-SD-NEXT: fcvt s2, h2
	; CHECK-NOFP16-NEXT: fcvt s3, h3			; CHECK-NOFP16-SD-NEXT: fcvt s3, h3
	; CHECK-NOFP16-NEXT: fmaxnm s4, s5, s4			; CHECK-NOFP16-SD-NEXT: fmaxnm s4, s5, s4
	; CHECK-NOFP16-NEXT: fcvt s5, h7			; CHECK-NOFP16-SD-NEXT: fcvt s5, h7
	; CHECK-NOFP16-NEXT: fcvt s1, h1			; CHECK-NOFP16-SD-NEXT: fcvt s1, h1
	; CHECK-NOFP16-NEXT: fmaxnm s2, s3, s2			; CHECK-NOFP16-SD-NEXT: fmaxnm s2, s3, s2
	; CHECK-NOFP16-NEXT: fcvt s3, h6			; CHECK-NOFP16-SD-NEXT: fcvt s3, h6
	; CHECK-NOFP16-NEXT: mov h6, v0.h[3]			; CHECK-NOFP16-SD-NEXT: mov h6, v0.h[3]
	; CHECK-NOFP16-NEXT: fcvt h0, s4			; CHECK-NOFP16-SD-NEXT: fcvt h0, s4
	; CHECK-NOFP16-NEXT: fcvt h2, s2			; CHECK-NOFP16-SD-NEXT: fcvt h2, s2
	; CHECK-NOFP16-NEXT: fmaxnm s3, s5, s3			; CHECK-NOFP16-SD-NEXT: fmaxnm s3, s5, s3
	; CHECK-NOFP16-NEXT: fcvt s4, h6			; CHECK-NOFP16-SD-NEXT: fcvt s4, h6
	; CHECK-NOFP16-NEXT: mov v0.h[1], v2.h[0]			; CHECK-NOFP16-SD-NEXT: mov v0.h[1], v2.h[0]
	; CHECK-NOFP16-NEXT: fcvt h2, s3			; CHECK-NOFP16-SD-NEXT: fcvt h2, s3
	; CHECK-NOFP16-NEXT: fmaxnm s1, s4, s1			; CHECK-NOFP16-SD-NEXT: fmaxnm s1, s4, s1
	; CHECK-NOFP16-NEXT: mov v0.h[2], v2.h[0]			; CHECK-NOFP16-SD-NEXT: mov v0.h[2], v2.h[0]
	; CHECK-NOFP16-NEXT: fcvt h1, s1			; CHECK-NOFP16-SD-NEXT: fcvt h1, s1
	; CHECK-NOFP16-NEXT: mov v0.h[3], v1.h[0]			; CHECK-NOFP16-SD-NEXT: mov v0.h[3], v1.h[0]
	; CHECK-NOFP16-NEXT: // kill: def $d0 killed $d0 killed $q0			; CHECK-NOFP16-SD-NEXT: // kill: def $d0 killed $d0 killed $q0
	; CHECK-NOFP16-NEXT: ret			; CHECK-NOFP16-SD-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: max_v4f16:			; CHECK-FP16-SD-LABEL: max_v4f16:
	; CHECK-FP16: // %bb.0: // %entry			; CHECK-FP16-SD: // %bb.0: // %entry
	; CHECK-FP16-NEXT: fmaxnm v0.4h, v0.4h, v1.4h			; CHECK-FP16-SD-NEXT: fmaxnm v0.4h, v0.4h, v1.4h
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-SD-NEXT: ret
				;
				; CHECK-NOFP16-GI-LABEL: max_v4f16:
				; CHECK-NOFP16-GI: // %bb.0: // %entry
				; CHECK-NOFP16-GI-NEXT: fcvtl v0.4s, v0.4h
				; CHECK-NOFP16-GI-NEXT: fcvtl v1.4s, v1.4h
				; CHECK-NOFP16-GI-NEXT: fmaxnm v0.4s, v0.4s, v1.4s
				; CHECK-NOFP16-GI-NEXT: fcvtn v0.4h, v0.4s
				; CHECK-NOFP16-GI-NEXT: ret
				;
				; CHECK-FP16-GI-LABEL: max_v4f16:
				; CHECK-FP16-GI: // %bb.0: // %entry
				; CHECK-FP16-GI-NEXT: fmaxnm v0.4h, v0.4h, v1.4h
				; CHECK-FP16-GI-NEXT: ret
	entry:			entry:
	%c = call <4 x half> @llvm.maxnum.v4f16(<4 x half> %a, <4 x half> %b)			%c = call <4 x half> @llvm.maxnum.v4f16(<4 x half> %a, <4 x half> %b)
	ret <4 x half> %c			ret <4 x half> %c
	}			}

	define <7 x half> @min_v7f16(<7 x half> %a, <7 x half> %b) {			define <7 x half> @min_v7f16(<7 x half> %a, <7 x half> %b) {
	; CHECK-NOFP16-LABEL: min_v7f16:			; CHECK-NOFP16-SD-LABEL: min_v7f16:
	; CHECK-NOFP16: // %bb.0: // %entry			; CHECK-NOFP16-SD: // %bb.0: // %entry
	; CHECK-NOFP16-NEXT: mov h2, v1.h[1]			; CHECK-NOFP16-SD-NEXT: mov h2, v1.h[1]
	; CHECK-NOFP16-NEXT: mov h3, v0.h[1]			; CHECK-NOFP16-SD-NEXT: mov h3, v0.h[1]
	; CHECK-NOFP16-NEXT: fcvt s4, h1			; CHECK-NOFP16-SD-NEXT: fcvt s4, h1
	; CHECK-NOFP16-NEXT: fcvt s5, h0			; CHECK-NOFP16-SD-NEXT: fcvt s5, h0
	; CHECK-NOFP16-NEXT: mov h6, v1.h[2]			; CHECK-NOFP16-SD-NEXT: mov h6, v1.h[2]
	; CHECK-NOFP16-NEXT: mov h7, v0.h[2]			; CHECK-NOFP16-SD-NEXT: mov h7, v0.h[2]
	; CHECK-NOFP16-NEXT: mov h16, v1.h[3]			; CHECK-NOFP16-SD-NEXT: mov h16, v1.h[3]
	; CHECK-NOFP16-NEXT: mov h17, v0.h[3]			; CHECK-NOFP16-SD-NEXT: mov h17, v0.h[3]
	; CHECK-NOFP16-NEXT: fcvt s2, h2			; CHECK-NOFP16-SD-NEXT: fcvt s2, h2
	; CHECK-NOFP16-NEXT: fcvt s3, h3			; CHECK-NOFP16-SD-NEXT: fcvt s3, h3
	; CHECK-NOFP16-NEXT: fminnm s4, s5, s4			; CHECK-NOFP16-SD-NEXT: fminnm s4, s5, s4
	; CHECK-NOFP16-NEXT: fcvt s5, h6			; CHECK-NOFP16-SD-NEXT: fcvt s5, h6
	; CHECK-NOFP16-NEXT: fcvt s6, h7			; CHECK-NOFP16-SD-NEXT: fcvt s6, h7
	; CHECK-NOFP16-NEXT: fcvt s7, h16			; CHECK-NOFP16-SD-NEXT: fcvt s7, h16
	; CHECK-NOFP16-NEXT: fcvt s16, h17			; CHECK-NOFP16-SD-NEXT: fcvt s16, h17
	; CHECK-NOFP16-NEXT: fminnm s3, s3, s2			; CHECK-NOFP16-SD-NEXT: fminnm s3, s3, s2
	; CHECK-NOFP16-NEXT: fcvt h2, s4			; CHECK-NOFP16-SD-NEXT: fcvt h2, s4
	; CHECK-NOFP16-NEXT: fminnm s4, s6, s5			; CHECK-NOFP16-SD-NEXT: fminnm s4, s6, s5
	; CHECK-NOFP16-NEXT: mov h5, v1.h[4]			; CHECK-NOFP16-SD-NEXT: mov h5, v1.h[4]
	; CHECK-NOFP16-NEXT: mov h6, v0.h[4]			; CHECK-NOFP16-SD-NEXT: mov h6, v0.h[4]
	; CHECK-NOFP16-NEXT: fminnm s7, s16, s7			; CHECK-NOFP16-SD-NEXT: fminnm s7, s16, s7
	; CHECK-NOFP16-NEXT: fcvt h3, s3			; CHECK-NOFP16-SD-NEXT: fcvt h3, s3
	; CHECK-NOFP16-NEXT: mov h16, v0.h[5]			; CHECK-NOFP16-SD-NEXT: mov h16, v0.h[5]
	; CHECK-NOFP16-NEXT: fcvt s5, h5			; CHECK-NOFP16-SD-NEXT: fcvt s5, h5
	; CHECK-NOFP16-NEXT: fcvt s6, h6			; CHECK-NOFP16-SD-NEXT: fcvt s6, h6
	; CHECK-NOFP16-NEXT: fcvt h7, s7			; CHECK-NOFP16-SD-NEXT: fcvt h7, s7
	; CHECK-NOFP16-NEXT: mov v2.h[1], v3.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[1], v3.h[0]
	; CHECK-NOFP16-NEXT: fcvt h3, s4			; CHECK-NOFP16-SD-NEXT: fcvt h3, s4
	; CHECK-NOFP16-NEXT: mov h4, v1.h[5]			; CHECK-NOFP16-SD-NEXT: mov h4, v1.h[5]
	; CHECK-NOFP16-NEXT: fminnm s5, s6, s5			; CHECK-NOFP16-SD-NEXT: fminnm s5, s6, s5
	; CHECK-NOFP16-NEXT: mov h6, v1.h[6]			; CHECK-NOFP16-SD-NEXT: mov h6, v1.h[6]
	; CHECK-NOFP16-NEXT: mov v2.h[2], v3.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[2], v3.h[0]
	; CHECK-NOFP16-NEXT: mov h1, v1.h[7]			; CHECK-NOFP16-SD-NEXT: mov h1, v1.h[7]
	; CHECK-NOFP16-NEXT: fcvt s3, h4			; CHECK-NOFP16-SD-NEXT: fcvt s3, h4
	; CHECK-NOFP16-NEXT: fcvt s4, h16			; CHECK-NOFP16-SD-NEXT: fcvt s4, h16
	; CHECK-NOFP16-NEXT: mov h16, v0.h[6]			; CHECK-NOFP16-SD-NEXT: mov h16, v0.h[6]
	; CHECK-NOFP16-NEXT: mov h0, v0.h[7]			; CHECK-NOFP16-SD-NEXT: mov h0, v0.h[7]
	; CHECK-NOFP16-NEXT: mov v2.h[3], v7.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[3], v7.h[0]
	; CHECK-NOFP16-NEXT: fcvt s1, h1			; CHECK-NOFP16-SD-NEXT: fcvt s1, h1
	; CHECK-NOFP16-NEXT: fminnm s3, s4, s3			; CHECK-NOFP16-SD-NEXT: fminnm s3, s4, s3
	; CHECK-NOFP16-NEXT: fcvt h4, s5			; CHECK-NOFP16-SD-NEXT: fcvt h4, s5
	; CHECK-NOFP16-NEXT: fcvt s5, h6			; CHECK-NOFP16-SD-NEXT: fcvt s5, h6
	; CHECK-NOFP16-NEXT: fcvt s6, h16			; CHECK-NOFP16-SD-NEXT: fcvt s6, h16
	; CHECK-NOFP16-NEXT: fcvt s0, h0			; CHECK-NOFP16-SD-NEXT: fcvt s0, h0
	; CHECK-NOFP16-NEXT: mov v2.h[4], v4.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[4], v4.h[0]
	; CHECK-NOFP16-NEXT: fcvt h3, s3			; CHECK-NOFP16-SD-NEXT: fcvt h3, s3
	; CHECK-NOFP16-NEXT: fminnm s4, s6, s5			; CHECK-NOFP16-SD-NEXT: fminnm s4, s6, s5
	; CHECK-NOFP16-NEXT: fminnm s0, s0, s1			; CHECK-NOFP16-SD-NEXT: fminnm s0, s0, s1
	; CHECK-NOFP16-NEXT: mov v2.h[5], v3.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[5], v3.h[0]
	; CHECK-NOFP16-NEXT: fcvt h3, s4			; CHECK-NOFP16-SD-NEXT: fcvt h3, s4
	; CHECK-NOFP16-NEXT: fcvt h0, s0			; CHECK-NOFP16-SD-NEXT: fcvt h0, s0
	; CHECK-NOFP16-NEXT: mov v2.h[6], v3.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[6], v3.h[0]
	; CHECK-NOFP16-NEXT: mov v2.h[7], v0.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[7], v0.h[0]
	; CHECK-NOFP16-NEXT: mov v0.16b, v2.16b			; CHECK-NOFP16-SD-NEXT: mov v0.16b, v2.16b
	; CHECK-NOFP16-NEXT: ret			; CHECK-NOFP16-SD-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: min_v7f16:			; CHECK-FP16-SD-LABEL: min_v7f16:
	; CHECK-FP16: // %bb.0: // %entry			; CHECK-FP16-SD: // %bb.0: // %entry
	; CHECK-FP16-NEXT: fminnm v0.8h, v0.8h, v1.8h			; CHECK-FP16-SD-NEXT: fminnm v0.8h, v0.8h, v1.8h
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-SD-NEXT: ret
				;
				; CHECK-NOFP16-GI-LABEL: min_v7f16:
				; CHECK-NOFP16-GI: // %bb.0: // %entry
				; CHECK-NOFP16-GI-NEXT: mov h2, v0.h[4]
				; CHECK-NOFP16-GI-NEXT: mov h3, v0.h[5]
				; CHECK-NOFP16-GI-NEXT: mov h4, v1.h[4]
				; CHECK-NOFP16-GI-NEXT: mov h5, v1.h[5]
				; CHECK-NOFP16-GI-NEXT: mov h6, v0.h[6]
				; CHECK-NOFP16-GI-NEXT: mov h7, v1.h[6]
				; CHECK-NOFP16-GI-NEXT: fcvtl v1.4s, v1.4h
				; CHECK-NOFP16-GI-NEXT: mov v2.h[1], v3.h[0]
				; CHECK-NOFP16-GI-NEXT: mov v4.h[1], v5.h[0]
				; CHECK-NOFP16-GI-NEXT: mov v2.h[2], v6.h[0]
				; CHECK-NOFP16-GI-NEXT: mov v4.h[2], v7.h[0]
				; CHECK-NOFP16-GI-NEXT: mov v2.h[3], v0.h[0]
				; CHECK-NOFP16-GI-NEXT: mov v4.h[3], v0.h[0]
				; CHECK-NOFP16-GI-NEXT: fcvtl v2.4s, v2.4h
				; CHECK-NOFP16-GI-NEXT: fcvtl v3.4s, v4.4h
				; CHECK-NOFP16-GI-NEXT: mov s4, v2.s[1]
				; CHECK-NOFP16-GI-NEXT: mov s6, v2.s[2]
				; CHECK-NOFP16-GI-NEXT: mov s5, v3.s[1]
				; CHECK-NOFP16-GI-NEXT: mov s7, v3.s[2]
				; CHECK-NOFP16-GI-NEXT: mov v2.s[1], v4.s[0]
				; CHECK-NOFP16-GI-NEXT: mov v3.s[1], v5.s[0]
				; CHECK-NOFP16-GI-NEXT: mov v2.s[2], v6.s[0]
				; CHECK-NOFP16-GI-NEXT: mov v3.s[2], v7.s[0]
				; CHECK-NOFP16-GI-NEXT: mov v2.s[3], v0.s[0]
				; CHECK-NOFP16-GI-NEXT: mov v3.s[3], v0.s[0]
				; CHECK-NOFP16-GI-NEXT: fcvtl v0.4s, v0.4h
				; CHECK-NOFP16-GI-NEXT: fminnm v2.4s, v2.4s, v3.4s
				; CHECK-NOFP16-GI-NEXT: fminnm v0.4s, v0.4s, v1.4s
				; CHECK-NOFP16-GI-NEXT: mov s1, v2.s[1]
				; CHECK-NOFP16-GI-NEXT: mov s3, v2.s[2]
				; CHECK-NOFP16-GI-NEXT: fcvtn v0.4h, v0.4s
				; CHECK-NOFP16-GI-NEXT: mov v2.s[1], v1.s[0]
				; CHECK-NOFP16-GI-NEXT: mov h1, v0.h[1]
				; CHECK-NOFP16-GI-NEXT: mov h4, v0.h[2]
				; CHECK-NOFP16-GI-NEXT: mov h5, v0.h[3]
				; CHECK-NOFP16-GI-NEXT: mov v2.s[2], v3.s[0]
				; CHECK-NOFP16-GI-NEXT: mov v0.h[1], v1.h[0]
				; CHECK-NOFP16-GI-NEXT: mov v2.s[3], v0.s[0]
				; CHECK-NOFP16-GI-NEXT: mov v0.h[2], v4.h[0]
				; CHECK-NOFP16-GI-NEXT: fcvtn v1.4h, v2.4s
				; CHECK-NOFP16-GI-NEXT: mov v0.h[3], v5.h[0]
				; CHECK-NOFP16-GI-NEXT: mov h2, v1.h[1]
				; CHECK-NOFP16-GI-NEXT: mov v0.h[4], v1.h[0]
				; CHECK-NOFP16-GI-NEXT: mov h1, v1.h[2]
				; CHECK-NOFP16-GI-NEXT: mov v0.h[5], v2.h[0]
				; CHECK-NOFP16-GI-NEXT: mov v0.h[6], v1.h[0]
				; CHECK-NOFP16-GI-NEXT: mov v0.h[7], v0.h[0]
				; CHECK-NOFP16-GI-NEXT: ret
				;
				; CHECK-FP16-GI-LABEL: min_v7f16:
				; CHECK-FP16-GI: // %bb.0: // %entry
				; CHECK-FP16-GI-NEXT: mov h2, v0.h[1]
				; CHECK-FP16-GI-NEXT: mov h3, v0.h[2]
				; CHECK-FP16-GI-NEXT: mov h4, v0.h[3]
				; CHECK-FP16-GI-NEXT: mov h5, v0.h[4]
				; CHECK-FP16-GI-NEXT: mov h6, v0.h[5]
				; CHECK-FP16-GI-NEXT: mov h7, v0.h[6]
				; CHECK-FP16-GI-NEXT: mov h16, v1.h[1]
				; CHECK-FP16-GI-NEXT: mov h17, v1.h[2]
				; CHECK-FP16-GI-NEXT: mov v0.h[1], v2.h[0]
				; CHECK-FP16-GI-NEXT: mov h18, v1.h[3]
				; CHECK-FP16-GI-NEXT: mov h19, v1.h[4]
				; CHECK-FP16-GI-NEXT: mov h20, v1.h[5]
				; CHECK-FP16-GI-NEXT: mov h21, v1.h[6]
				; CHECK-FP16-GI-NEXT: mov v1.h[1], v16.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[2], v3.h[0]
				; CHECK-FP16-GI-NEXT: mov v1.h[2], v17.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[3], v4.h[0]
				; CHECK-FP16-GI-NEXT: mov v1.h[3], v18.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[4], v5.h[0]
				; CHECK-FP16-GI-NEXT: mov v1.h[4], v19.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[5], v6.h[0]
				; CHECK-FP16-GI-NEXT: mov v1.h[5], v20.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[6], v7.h[0]
				; CHECK-FP16-GI-NEXT: mov v1.h[6], v21.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[7], v0.h[0]
				; CHECK-FP16-GI-NEXT: mov v1.h[7], v0.h[0]
				; CHECK-FP16-GI-NEXT: fminnm v0.8h, v0.8h, v1.8h
				; CHECK-FP16-GI-NEXT: mov h1, v0.h[1]
				; CHECK-FP16-GI-NEXT: mov h2, v0.h[2]
				; CHECK-FP16-GI-NEXT: mov h3, v0.h[3]
				; CHECK-FP16-GI-NEXT: mov h4, v0.h[4]
				; CHECK-FP16-GI-NEXT: mov h5, v0.h[5]
				; CHECK-FP16-GI-NEXT: mov h6, v0.h[6]
				; CHECK-FP16-GI-NEXT: mov v0.h[1], v1.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[2], v2.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[3], v3.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[4], v4.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[5], v5.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[6], v6.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[7], v0.h[0]
				; CHECK-FP16-GI-NEXT: ret
	entry:			entry:
	%c = call <7 x half> @llvm.minnum.v7f16(<7 x half> %a, <7 x half> %b)			%c = call <7 x half> @llvm.minnum.v7f16(<7 x half> %a, <7 x half> %b)
	ret <7 x half> %c			ret <7 x half> %c
	}			}

	define <7 x half> @max_v7f16(<7 x half> %a, <7 x half> %b) {			define <7 x half> @max_v7f16(<7 x half> %a, <7 x half> %b) {
	; CHECK-NOFP16-LABEL: max_v7f16:			; CHECK-NOFP16-SD-LABEL: max_v7f16:
	; CHECK-NOFP16: // %bb.0: // %entry			; CHECK-NOFP16-SD: // %bb.0: // %entry
	; CHECK-NOFP16-NEXT: mov h2, v1.h[1]			; CHECK-NOFP16-SD-NEXT: mov h2, v1.h[1]
	; CHECK-NOFP16-NEXT: mov h3, v0.h[1]			; CHECK-NOFP16-SD-NEXT: mov h3, v0.h[1]
	; CHECK-NOFP16-NEXT: fcvt s4, h1			; CHECK-NOFP16-SD-NEXT: fcvt s4, h1
	; CHECK-NOFP16-NEXT: fcvt s5, h0			; CHECK-NOFP16-SD-NEXT: fcvt s5, h0
	; CHECK-NOFP16-NEXT: mov h6, v1.h[2]			; CHECK-NOFP16-SD-NEXT: mov h6, v1.h[2]
	; CHECK-NOFP16-NEXT: mov h7, v0.h[2]			; CHECK-NOFP16-SD-NEXT: mov h7, v0.h[2]
	; CHECK-NOFP16-NEXT: mov h16, v1.h[3]			; CHECK-NOFP16-SD-NEXT: mov h16, v1.h[3]
	; CHECK-NOFP16-NEXT: mov h17, v0.h[3]			; CHECK-NOFP16-SD-NEXT: mov h17, v0.h[3]
	; CHECK-NOFP16-NEXT: fcvt s2, h2			; CHECK-NOFP16-SD-NEXT: fcvt s2, h2
	; CHECK-NOFP16-NEXT: fcvt s3, h3			; CHECK-NOFP16-SD-NEXT: fcvt s3, h3
	; CHECK-NOFP16-NEXT: fmaxnm s4, s5, s4			; CHECK-NOFP16-SD-NEXT: fmaxnm s4, s5, s4
	; CHECK-NOFP16-NEXT: fcvt s5, h6			; CHECK-NOFP16-SD-NEXT: fcvt s5, h6
	; CHECK-NOFP16-NEXT: fcvt s6, h7			; CHECK-NOFP16-SD-NEXT: fcvt s6, h7
	; CHECK-NOFP16-NEXT: fcvt s7, h16			; CHECK-NOFP16-SD-NEXT: fcvt s7, h16
	; CHECK-NOFP16-NEXT: fcvt s16, h17			; CHECK-NOFP16-SD-NEXT: fcvt s16, h17
	; CHECK-NOFP16-NEXT: fmaxnm s3, s3, s2			; CHECK-NOFP16-SD-NEXT: fmaxnm s3, s3, s2
	; CHECK-NOFP16-NEXT: fcvt h2, s4			; CHECK-NOFP16-SD-NEXT: fcvt h2, s4
	; CHECK-NOFP16-NEXT: fmaxnm s4, s6, s5			; CHECK-NOFP16-SD-NEXT: fmaxnm s4, s6, s5
	; CHECK-NOFP16-NEXT: mov h5, v1.h[4]			; CHECK-NOFP16-SD-NEXT: mov h5, v1.h[4]
	; CHECK-NOFP16-NEXT: mov h6, v0.h[4]			; CHECK-NOFP16-SD-NEXT: mov h6, v0.h[4]
	; CHECK-NOFP16-NEXT: fmaxnm s7, s16, s7			; CHECK-NOFP16-SD-NEXT: fmaxnm s7, s16, s7
	; CHECK-NOFP16-NEXT: fcvt h3, s3			; CHECK-NOFP16-SD-NEXT: fcvt h3, s3
	; CHECK-NOFP16-NEXT: mov h16, v0.h[5]			; CHECK-NOFP16-SD-NEXT: mov h16, v0.h[5]
	; CHECK-NOFP16-NEXT: fcvt s5, h5			; CHECK-NOFP16-SD-NEXT: fcvt s5, h5
	; CHECK-NOFP16-NEXT: fcvt s6, h6			; CHECK-NOFP16-SD-NEXT: fcvt s6, h6
	; CHECK-NOFP16-NEXT: fcvt h7, s7			; CHECK-NOFP16-SD-NEXT: fcvt h7, s7
	; CHECK-NOFP16-NEXT: mov v2.h[1], v3.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[1], v3.h[0]
	; CHECK-NOFP16-NEXT: fcvt h3, s4			; CHECK-NOFP16-SD-NEXT: fcvt h3, s4
	; CHECK-NOFP16-NEXT: mov h4, v1.h[5]			; CHECK-NOFP16-SD-NEXT: mov h4, v1.h[5]
	; CHECK-NOFP16-NEXT: fmaxnm s5, s6, s5			; CHECK-NOFP16-SD-NEXT: fmaxnm s5, s6, s5
	; CHECK-NOFP16-NEXT: mov h6, v1.h[6]			; CHECK-NOFP16-SD-NEXT: mov h6, v1.h[6]
	; CHECK-NOFP16-NEXT: mov v2.h[2], v3.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[2], v3.h[0]
	; CHECK-NOFP16-NEXT: mov h1, v1.h[7]			; CHECK-NOFP16-SD-NEXT: mov h1, v1.h[7]
	; CHECK-NOFP16-NEXT: fcvt s3, h4			; CHECK-NOFP16-SD-NEXT: fcvt s3, h4
	; CHECK-NOFP16-NEXT: fcvt s4, h16			; CHECK-NOFP16-SD-NEXT: fcvt s4, h16
	; CHECK-NOFP16-NEXT: mov h16, v0.h[6]			; CHECK-NOFP16-SD-NEXT: mov h16, v0.h[6]
	; CHECK-NOFP16-NEXT: mov h0, v0.h[7]			; CHECK-NOFP16-SD-NEXT: mov h0, v0.h[7]
	; CHECK-NOFP16-NEXT: mov v2.h[3], v7.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[3], v7.h[0]
	; CHECK-NOFP16-NEXT: fcvt s1, h1			; CHECK-NOFP16-SD-NEXT: fcvt s1, h1
	; CHECK-NOFP16-NEXT: fmaxnm s3, s4, s3			; CHECK-NOFP16-SD-NEXT: fmaxnm s3, s4, s3
	; CHECK-NOFP16-NEXT: fcvt h4, s5			; CHECK-NOFP16-SD-NEXT: fcvt h4, s5
	; CHECK-NOFP16-NEXT: fcvt s5, h6			; CHECK-NOFP16-SD-NEXT: fcvt s5, h6
	; CHECK-NOFP16-NEXT: fcvt s6, h16			; CHECK-NOFP16-SD-NEXT: fcvt s6, h16
	; CHECK-NOFP16-NEXT: fcvt s0, h0			; CHECK-NOFP16-SD-NEXT: fcvt s0, h0
	; CHECK-NOFP16-NEXT: mov v2.h[4], v4.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[4], v4.h[0]
	; CHECK-NOFP16-NEXT: fcvt h3, s3			; CHECK-NOFP16-SD-NEXT: fcvt h3, s3
	; CHECK-NOFP16-NEXT: fmaxnm s4, s6, s5			; CHECK-NOFP16-SD-NEXT: fmaxnm s4, s6, s5
	; CHECK-NOFP16-NEXT: fmaxnm s0, s0, s1			; CHECK-NOFP16-SD-NEXT: fmaxnm s0, s0, s1
	; CHECK-NOFP16-NEXT: mov v2.h[5], v3.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[5], v3.h[0]
	; CHECK-NOFP16-NEXT: fcvt h3, s4			; CHECK-NOFP16-SD-NEXT: fcvt h3, s4
	; CHECK-NOFP16-NEXT: fcvt h0, s0			; CHECK-NOFP16-SD-NEXT: fcvt h0, s0
	; CHECK-NOFP16-NEXT: mov v2.h[6], v3.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[6], v3.h[0]
	; CHECK-NOFP16-NEXT: mov v2.h[7], v0.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[7], v0.h[0]
	; CHECK-NOFP16-NEXT: mov v0.16b, v2.16b			; CHECK-NOFP16-SD-NEXT: mov v0.16b, v2.16b
	; CHECK-NOFP16-NEXT: ret			; CHECK-NOFP16-SD-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: max_v7f16:			; CHECK-FP16-SD-LABEL: max_v7f16:
	; CHECK-FP16: // %bb.0: // %entry			; CHECK-FP16-SD: // %bb.0: // %entry
	; CHECK-FP16-NEXT: fmaxnm v0.8h, v0.8h, v1.8h			; CHECK-FP16-SD-NEXT: fmaxnm v0.8h, v0.8h, v1.8h
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-SD-NEXT: ret
				;
				; CHECK-NOFP16-GI-LABEL: max_v7f16:
				; CHECK-NOFP16-GI: // %bb.0: // %entry
				; CHECK-NOFP16-GI-NEXT: mov h2, v0.h[4]
				; CHECK-NOFP16-GI-NEXT: mov h3, v0.h[5]
				; CHECK-NOFP16-GI-NEXT: mov h4, v1.h[4]
				; CHECK-NOFP16-GI-NEXT: mov h5, v1.h[5]
				; CHECK-NOFP16-GI-NEXT: mov h6, v0.h[6]
				; CHECK-NOFP16-GI-NEXT: mov h7, v1.h[6]
				; CHECK-NOFP16-GI-NEXT: fcvtl v1.4s, v1.4h
				; CHECK-NOFP16-GI-NEXT: mov v2.h[1], v3.h[0]
				; CHECK-NOFP16-GI-NEXT: mov v4.h[1], v5.h[0]
				; CHECK-NOFP16-GI-NEXT: mov v2.h[2], v6.h[0]
				; CHECK-NOFP16-GI-NEXT: mov v4.h[2], v7.h[0]
				; CHECK-NOFP16-GI-NEXT: mov v2.h[3], v0.h[0]
				; CHECK-NOFP16-GI-NEXT: mov v4.h[3], v0.h[0]
				; CHECK-NOFP16-GI-NEXT: fcvtl v2.4s, v2.4h
				; CHECK-NOFP16-GI-NEXT: fcvtl v3.4s, v4.4h
				; CHECK-NOFP16-GI-NEXT: mov s4, v2.s[1]
				; CHECK-NOFP16-GI-NEXT: mov s6, v2.s[2]
				; CHECK-NOFP16-GI-NEXT: mov s5, v3.s[1]
				; CHECK-NOFP16-GI-NEXT: mov s7, v3.s[2]
				; CHECK-NOFP16-GI-NEXT: mov v2.s[1], v4.s[0]
				; CHECK-NOFP16-GI-NEXT: mov v3.s[1], v5.s[0]
				; CHECK-NOFP16-GI-NEXT: mov v2.s[2], v6.s[0]
				; CHECK-NOFP16-GI-NEXT: mov v3.s[2], v7.s[0]
				; CHECK-NOFP16-GI-NEXT: mov v2.s[3], v0.s[0]
				; CHECK-NOFP16-GI-NEXT: mov v3.s[3], v0.s[0]
				; CHECK-NOFP16-GI-NEXT: fcvtl v0.4s, v0.4h
				; CHECK-NOFP16-GI-NEXT: fmaxnm v2.4s, v2.4s, v3.4s
				; CHECK-NOFP16-GI-NEXT: fmaxnm v0.4s, v0.4s, v1.4s
				; CHECK-NOFP16-GI-NEXT: mov s1, v2.s[1]
				; CHECK-NOFP16-GI-NEXT: mov s3, v2.s[2]
				; CHECK-NOFP16-GI-NEXT: fcvtn v0.4h, v0.4s
				; CHECK-NOFP16-GI-NEXT: mov v2.s[1], v1.s[0]
				; CHECK-NOFP16-GI-NEXT: mov h1, v0.h[1]
				; CHECK-NOFP16-GI-NEXT: mov h4, v0.h[2]
				; CHECK-NOFP16-GI-NEXT: mov h5, v0.h[3]
				; CHECK-NOFP16-GI-NEXT: mov v2.s[2], v3.s[0]
				; CHECK-NOFP16-GI-NEXT: mov v0.h[1], v1.h[0]
				; CHECK-NOFP16-GI-NEXT: mov v2.s[3], v0.s[0]
				; CHECK-NOFP16-GI-NEXT: mov v0.h[2], v4.h[0]
				; CHECK-NOFP16-GI-NEXT: fcvtn v1.4h, v2.4s
				; CHECK-NOFP16-GI-NEXT: mov v0.h[3], v5.h[0]
				; CHECK-NOFP16-GI-NEXT: mov h2, v1.h[1]
				; CHECK-NOFP16-GI-NEXT: mov v0.h[4], v1.h[0]
				; CHECK-NOFP16-GI-NEXT: mov h1, v1.h[2]
				; CHECK-NOFP16-GI-NEXT: mov v0.h[5], v2.h[0]
				; CHECK-NOFP16-GI-NEXT: mov v0.h[6], v1.h[0]
				; CHECK-NOFP16-GI-NEXT: mov v0.h[7], v0.h[0]
				; CHECK-NOFP16-GI-NEXT: ret
				;
				; CHECK-FP16-GI-LABEL: max_v7f16:
				; CHECK-FP16-GI: // %bb.0: // %entry
				; CHECK-FP16-GI-NEXT: mov h2, v0.h[1]
				; CHECK-FP16-GI-NEXT: mov h3, v0.h[2]
				; CHECK-FP16-GI-NEXT: mov h4, v0.h[3]
				; CHECK-FP16-GI-NEXT: mov h5, v0.h[4]
				; CHECK-FP16-GI-NEXT: mov h6, v0.h[5]
				; CHECK-FP16-GI-NEXT: mov h7, v0.h[6]
				; CHECK-FP16-GI-NEXT: mov h16, v1.h[1]
				; CHECK-FP16-GI-NEXT: mov h17, v1.h[2]
				; CHECK-FP16-GI-NEXT: mov v0.h[1], v2.h[0]
				; CHECK-FP16-GI-NEXT: mov h18, v1.h[3]
				; CHECK-FP16-GI-NEXT: mov h19, v1.h[4]
				; CHECK-FP16-GI-NEXT: mov h20, v1.h[5]
				; CHECK-FP16-GI-NEXT: mov h21, v1.h[6]
				; CHECK-FP16-GI-NEXT: mov v1.h[1], v16.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[2], v3.h[0]
				; CHECK-FP16-GI-NEXT: mov v1.h[2], v17.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[3], v4.h[0]
				; CHECK-FP16-GI-NEXT: mov v1.h[3], v18.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[4], v5.h[0]
				; CHECK-FP16-GI-NEXT: mov v1.h[4], v19.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[5], v6.h[0]
				; CHECK-FP16-GI-NEXT: mov v1.h[5], v20.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[6], v7.h[0]
				; CHECK-FP16-GI-NEXT: mov v1.h[6], v21.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[7], v0.h[0]
				; CHECK-FP16-GI-NEXT: mov v1.h[7], v0.h[0]
				; CHECK-FP16-GI-NEXT: fmaxnm v0.8h, v0.8h, v1.8h
				; CHECK-FP16-GI-NEXT: mov h1, v0.h[1]
				; CHECK-FP16-GI-NEXT: mov h2, v0.h[2]
				; CHECK-FP16-GI-NEXT: mov h3, v0.h[3]
				; CHECK-FP16-GI-NEXT: mov h4, v0.h[4]
				; CHECK-FP16-GI-NEXT: mov h5, v0.h[5]
				; CHECK-FP16-GI-NEXT: mov h6, v0.h[6]
				; CHECK-FP16-GI-NEXT: mov v0.h[1], v1.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[2], v2.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[3], v3.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[4], v4.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[5], v5.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[6], v6.h[0]
				; CHECK-FP16-GI-NEXT: mov v0.h[7], v0.h[0]
				; CHECK-FP16-GI-NEXT: ret
	entry:			entry:
	%c = call <7 x half> @llvm.maxnum.v7f16(<7 x half> %a, <7 x half> %b)			%c = call <7 x half> @llvm.maxnum.v7f16(<7 x half> %a, <7 x half> %b)
	ret <7 x half> %c			ret <7 x half> %c
	}			}

	define <8 x half> @min_v8f16(<8 x half> %a, <8 x half> %b) {			define <8 x half> @min_v8f16(<8 x half> %a, <8 x half> %b) {
	; CHECK-NOFP16-LABEL: min_v8f16:			; CHECK-NOFP16-SD-LABEL: min_v8f16:
	; CHECK-NOFP16: // %bb.0: // %entry			; CHECK-NOFP16-SD: // %bb.0: // %entry
	; CHECK-NOFP16-NEXT: mov h2, v1.h[1]			; CHECK-NOFP16-SD-NEXT: mov h2, v1.h[1]
	; CHECK-NOFP16-NEXT: mov h3, v0.h[1]			; CHECK-NOFP16-SD-NEXT: mov h3, v0.h[1]
	; CHECK-NOFP16-NEXT: fcvt s4, h1			; CHECK-NOFP16-SD-NEXT: fcvt s4, h1
	; CHECK-NOFP16-NEXT: fcvt s5, h0			; CHECK-NOFP16-SD-NEXT: fcvt s5, h0
	; CHECK-NOFP16-NEXT: mov h6, v1.h[2]			; CHECK-NOFP16-SD-NEXT: mov h6, v1.h[2]
	; CHECK-NOFP16-NEXT: mov h7, v0.h[2]			; CHECK-NOFP16-SD-NEXT: mov h7, v0.h[2]
	; CHECK-NOFP16-NEXT: mov h16, v1.h[3]			; CHECK-NOFP16-SD-NEXT: mov h16, v1.h[3]
	; CHECK-NOFP16-NEXT: mov h17, v0.h[3]			; CHECK-NOFP16-SD-NEXT: mov h17, v0.h[3]
	; CHECK-NOFP16-NEXT: fcvt s2, h2			; CHECK-NOFP16-SD-NEXT: fcvt s2, h2
	; CHECK-NOFP16-NEXT: fcvt s3, h3			; CHECK-NOFP16-SD-NEXT: fcvt s3, h3
	; CHECK-NOFP16-NEXT: fminnm s4, s5, s4			; CHECK-NOFP16-SD-NEXT: fminnm s4, s5, s4
	; CHECK-NOFP16-NEXT: fcvt s5, h6			; CHECK-NOFP16-SD-NEXT: fcvt s5, h6
	; CHECK-NOFP16-NEXT: fcvt s6, h7			; CHECK-NOFP16-SD-NEXT: fcvt s6, h7
	; CHECK-NOFP16-NEXT: fcvt s7, h16			; CHECK-NOFP16-SD-NEXT: fcvt s7, h16
	; CHECK-NOFP16-NEXT: fcvt s16, h17			; CHECK-NOFP16-SD-NEXT: fcvt s16, h17
	; CHECK-NOFP16-NEXT: fminnm s3, s3, s2			; CHECK-NOFP16-SD-NEXT: fminnm s3, s3, s2
	; CHECK-NOFP16-NEXT: fcvt h2, s4			; CHECK-NOFP16-SD-NEXT: fcvt h2, s4
	; CHECK-NOFP16-NEXT: fminnm s4, s6, s5			; CHECK-NOFP16-SD-NEXT: fminnm s4, s6, s5
	; CHECK-NOFP16-NEXT: mov h5, v1.h[4]			; CHECK-NOFP16-SD-NEXT: mov h5, v1.h[4]
	; CHECK-NOFP16-NEXT: mov h6, v0.h[4]			; CHECK-NOFP16-SD-NEXT: mov h6, v0.h[4]
	; CHECK-NOFP16-NEXT: fminnm s7, s16, s7			; CHECK-NOFP16-SD-NEXT: fminnm s7, s16, s7
	; CHECK-NOFP16-NEXT: fcvt h3, s3			; CHECK-NOFP16-SD-NEXT: fcvt h3, s3
	; CHECK-NOFP16-NEXT: mov h16, v0.h[5]			; CHECK-NOFP16-SD-NEXT: mov h16, v0.h[5]
	; CHECK-NOFP16-NEXT: fcvt s5, h5			; CHECK-NOFP16-SD-NEXT: fcvt s5, h5
	; CHECK-NOFP16-NEXT: fcvt s6, h6			; CHECK-NOFP16-SD-NEXT: fcvt s6, h6
	; CHECK-NOFP16-NEXT: fcvt h7, s7			; CHECK-NOFP16-SD-NEXT: fcvt h7, s7
	; CHECK-NOFP16-NEXT: mov v2.h[1], v3.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[1], v3.h[0]
	; CHECK-NOFP16-NEXT: fcvt h3, s4			; CHECK-NOFP16-SD-NEXT: fcvt h3, s4
	; CHECK-NOFP16-NEXT: mov h4, v1.h[5]			; CHECK-NOFP16-SD-NEXT: mov h4, v1.h[5]
	; CHECK-NOFP16-NEXT: fminnm s5, s6, s5			; CHECK-NOFP16-SD-NEXT: fminnm s5, s6, s5
	; CHECK-NOFP16-NEXT: mov h6, v1.h[6]			; CHECK-NOFP16-SD-NEXT: mov h6, v1.h[6]
	; CHECK-NOFP16-NEXT: mov v2.h[2], v3.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[2], v3.h[0]
	; CHECK-NOFP16-NEXT: mov h1, v1.h[7]			; CHECK-NOFP16-SD-NEXT: mov h1, v1.h[7]
	; CHECK-NOFP16-NEXT: fcvt s3, h4			; CHECK-NOFP16-SD-NEXT: fcvt s3, h4
	; CHECK-NOFP16-NEXT: fcvt s4, h16			; CHECK-NOFP16-SD-NEXT: fcvt s4, h16
	; CHECK-NOFP16-NEXT: mov h16, v0.h[6]			; CHECK-NOFP16-SD-NEXT: mov h16, v0.h[6]
	; CHECK-NOFP16-NEXT: mov h0, v0.h[7]			; CHECK-NOFP16-SD-NEXT: mov h0, v0.h[7]
	; CHECK-NOFP16-NEXT: mov v2.h[3], v7.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[3], v7.h[0]
	; CHECK-NOFP16-NEXT: fcvt s1, h1			; CHECK-NOFP16-SD-NEXT: fcvt s1, h1
	; CHECK-NOFP16-NEXT: fminnm s3, s4, s3			; CHECK-NOFP16-SD-NEXT: fminnm s3, s4, s3
	; CHECK-NOFP16-NEXT: fcvt h4, s5			; CHECK-NOFP16-SD-NEXT: fcvt h4, s5
	; CHECK-NOFP16-NEXT: fcvt s5, h6			; CHECK-NOFP16-SD-NEXT: fcvt s5, h6
	; CHECK-NOFP16-NEXT: fcvt s6, h16			; CHECK-NOFP16-SD-NEXT: fcvt s6, h16
	; CHECK-NOFP16-NEXT: fcvt s0, h0			; CHECK-NOFP16-SD-NEXT: fcvt s0, h0
	; CHECK-NOFP16-NEXT: mov v2.h[4], v4.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[4], v4.h[0]
	; CHECK-NOFP16-NEXT: fcvt h3, s3			; CHECK-NOFP16-SD-NEXT: fcvt h3, s3
	; CHECK-NOFP16-NEXT: fminnm s4, s6, s5			; CHECK-NOFP16-SD-NEXT: fminnm s4, s6, s5
	; CHECK-NOFP16-NEXT: fminnm s0, s0, s1			; CHECK-NOFP16-SD-NEXT: fminnm s0, s0, s1
	; CHECK-NOFP16-NEXT: mov v2.h[5], v3.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[5], v3.h[0]
	; CHECK-NOFP16-NEXT: fcvt h3, s4			; CHECK-NOFP16-SD-NEXT: fcvt h3, s4
	; CHECK-NOFP16-NEXT: fcvt h0, s0			; CHECK-NOFP16-SD-NEXT: fcvt h0, s0
	; CHECK-NOFP16-NEXT: mov v2.h[6], v3.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[6], v3.h[0]
	; CHECK-NOFP16-NEXT: mov v2.h[7], v0.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[7], v0.h[0]
	; CHECK-NOFP16-NEXT: mov v0.16b, v2.16b			; CHECK-NOFP16-SD-NEXT: mov v0.16b, v2.16b
	; CHECK-NOFP16-NEXT: ret			; CHECK-NOFP16-SD-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: min_v8f16:			; CHECK-FP16-SD-LABEL: min_v8f16:
	; CHECK-FP16: // %bb.0: // %entry			; CHECK-FP16-SD: // %bb.0: // %entry
	; CHECK-FP16-NEXT: fminnm v0.8h, v0.8h, v1.8h			; CHECK-FP16-SD-NEXT: fminnm v0.8h, v0.8h, v1.8h
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-SD-NEXT: ret
				;
				; CHECK-NOFP16-GI-LABEL: min_v8f16:
				; CHECK-NOFP16-GI: // %bb.0: // %entry
				; CHECK-NOFP16-GI-NEXT: fcvtl v2.4s, v0.4h
				; CHECK-NOFP16-GI-NEXT: fcvtl v3.4s, v1.4h
				; CHECK-NOFP16-GI-NEXT: fcvtl2 v0.4s, v0.8h
				; CHECK-NOFP16-GI-NEXT: fcvtl2 v1.4s, v1.8h
				; CHECK-NOFP16-GI-NEXT: fminnm v2.4s, v2.4s, v3.4s
				; CHECK-NOFP16-GI-NEXT: fminnm v1.4s, v0.4s, v1.4s
				; CHECK-NOFP16-GI-NEXT: fcvtn v0.4h, v2.4s
				; CHECK-NOFP16-GI-NEXT: fcvtn2 v0.8h, v1.4s
				; CHECK-NOFP16-GI-NEXT: ret
				;
				; CHECK-FP16-GI-LABEL: min_v8f16:
				; CHECK-FP16-GI: // %bb.0: // %entry
				; CHECK-FP16-GI-NEXT: fminnm v0.8h, v0.8h, v1.8h
				; CHECK-FP16-GI-NEXT: ret
	entry:			entry:
	%c = call <8 x half> @llvm.minnum.v8f16(<8 x half> %a, <8 x half> %b)			%c = call <8 x half> @llvm.minnum.v8f16(<8 x half> %a, <8 x half> %b)
	ret <8 x half> %c			ret <8 x half> %c
	}			}

	define <8 x half> @max_v8f16(<8 x half> %a, <8 x half> %b) {			define <8 x half> @max_v8f16(<8 x half> %a, <8 x half> %b) {
	; CHECK-NOFP16-LABEL: max_v8f16:			; CHECK-NOFP16-SD-LABEL: max_v8f16:
	; CHECK-NOFP16: // %bb.0: // %entry			; CHECK-NOFP16-SD: // %bb.0: // %entry
	; CHECK-NOFP16-NEXT: mov h2, v1.h[1]			; CHECK-NOFP16-SD-NEXT: mov h2, v1.h[1]
	; CHECK-NOFP16-NEXT: mov h3, v0.h[1]			; CHECK-NOFP16-SD-NEXT: mov h3, v0.h[1]
	; CHECK-NOFP16-NEXT: fcvt s4, h1			; CHECK-NOFP16-SD-NEXT: fcvt s4, h1
	; CHECK-NOFP16-NEXT: fcvt s5, h0			; CHECK-NOFP16-SD-NEXT: fcvt s5, h0
	; CHECK-NOFP16-NEXT: mov h6, v1.h[2]			; CHECK-NOFP16-SD-NEXT: mov h6, v1.h[2]
	; CHECK-NOFP16-NEXT: mov h7, v0.h[2]			; CHECK-NOFP16-SD-NEXT: mov h7, v0.h[2]
	; CHECK-NOFP16-NEXT: mov h16, v1.h[3]			; CHECK-NOFP16-SD-NEXT: mov h16, v1.h[3]
	; CHECK-NOFP16-NEXT: mov h17, v0.h[3]			; CHECK-NOFP16-SD-NEXT: mov h17, v0.h[3]
	; CHECK-NOFP16-NEXT: fcvt s2, h2			; CHECK-NOFP16-SD-NEXT: fcvt s2, h2
	; CHECK-NOFP16-NEXT: fcvt s3, h3			; CHECK-NOFP16-SD-NEXT: fcvt s3, h3
	; CHECK-NOFP16-NEXT: fmaxnm s4, s5, s4			; CHECK-NOFP16-SD-NEXT: fmaxnm s4, s5, s4
	; CHECK-NOFP16-NEXT: fcvt s5, h6			; CHECK-NOFP16-SD-NEXT: fcvt s5, h6
	; CHECK-NOFP16-NEXT: fcvt s6, h7			; CHECK-NOFP16-SD-NEXT: fcvt s6, h7
	; CHECK-NOFP16-NEXT: fcvt s7, h16			; CHECK-NOFP16-SD-NEXT: fcvt s7, h16
	; CHECK-NOFP16-NEXT: fcvt s16, h17			; CHECK-NOFP16-SD-NEXT: fcvt s16, h17
	; CHECK-NOFP16-NEXT: fmaxnm s3, s3, s2			; CHECK-NOFP16-SD-NEXT: fmaxnm s3, s3, s2
	; CHECK-NOFP16-NEXT: fcvt h2, s4			; CHECK-NOFP16-SD-NEXT: fcvt h2, s4
	; CHECK-NOFP16-NEXT: fmaxnm s4, s6, s5			; CHECK-NOFP16-SD-NEXT: fmaxnm s4, s6, s5
	; CHECK-NOFP16-NEXT: mov h5, v1.h[4]			; CHECK-NOFP16-SD-NEXT: mov h5, v1.h[4]
	; CHECK-NOFP16-NEXT: mov h6, v0.h[4]			; CHECK-NOFP16-SD-NEXT: mov h6, v0.h[4]
	; CHECK-NOFP16-NEXT: fmaxnm s7, s16, s7			; CHECK-NOFP16-SD-NEXT: fmaxnm s7, s16, s7
	; CHECK-NOFP16-NEXT: fcvt h3, s3			; CHECK-NOFP16-SD-NEXT: fcvt h3, s3
	; CHECK-NOFP16-NEXT: mov h16, v0.h[5]			; CHECK-NOFP16-SD-NEXT: mov h16, v0.h[5]
	; CHECK-NOFP16-NEXT: fcvt s5, h5			; CHECK-NOFP16-SD-NEXT: fcvt s5, h5
	; CHECK-NOFP16-NEXT: fcvt s6, h6			; CHECK-NOFP16-SD-NEXT: fcvt s6, h6
	; CHECK-NOFP16-NEXT: fcvt h7, s7			; CHECK-NOFP16-SD-NEXT: fcvt h7, s7
	; CHECK-NOFP16-NEXT: mov v2.h[1], v3.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[1], v3.h[0]
	; CHECK-NOFP16-NEXT: fcvt h3, s4			; CHECK-NOFP16-SD-NEXT: fcvt h3, s4
	; CHECK-NOFP16-NEXT: mov h4, v1.h[5]			; CHECK-NOFP16-SD-NEXT: mov h4, v1.h[5]
	; CHECK-NOFP16-NEXT: fmaxnm s5, s6, s5			; CHECK-NOFP16-SD-NEXT: fmaxnm s5, s6, s5
	; CHECK-NOFP16-NEXT: mov h6, v1.h[6]			; CHECK-NOFP16-SD-NEXT: mov h6, v1.h[6]
	; CHECK-NOFP16-NEXT: mov v2.h[2], v3.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[2], v3.h[0]
	; CHECK-NOFP16-NEXT: mov h1, v1.h[7]			; CHECK-NOFP16-SD-NEXT: mov h1, v1.h[7]
	; CHECK-NOFP16-NEXT: fcvt s3, h4			; CHECK-NOFP16-SD-NEXT: fcvt s3, h4
	; CHECK-NOFP16-NEXT: fcvt s4, h16			; CHECK-NOFP16-SD-NEXT: fcvt s4, h16
	; CHECK-NOFP16-NEXT: mov h16, v0.h[6]			; CHECK-NOFP16-SD-NEXT: mov h16, v0.h[6]
	; CHECK-NOFP16-NEXT: mov h0, v0.h[7]			; CHECK-NOFP16-SD-NEXT: mov h0, v0.h[7]
	; CHECK-NOFP16-NEXT: mov v2.h[3], v7.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[3], v7.h[0]
	; CHECK-NOFP16-NEXT: fcvt s1, h1			; CHECK-NOFP16-SD-NEXT: fcvt s1, h1
	; CHECK-NOFP16-NEXT: fmaxnm s3, s4, s3			; CHECK-NOFP16-SD-NEXT: fmaxnm s3, s4, s3
	; CHECK-NOFP16-NEXT: fcvt h4, s5			; CHECK-NOFP16-SD-NEXT: fcvt h4, s5
	; CHECK-NOFP16-NEXT: fcvt s5, h6			; CHECK-NOFP16-SD-NEXT: fcvt s5, h6
	; CHECK-NOFP16-NEXT: fcvt s6, h16			; CHECK-NOFP16-SD-NEXT: fcvt s6, h16
	; CHECK-NOFP16-NEXT: fcvt s0, h0			; CHECK-NOFP16-SD-NEXT: fcvt s0, h0
	; CHECK-NOFP16-NEXT: mov v2.h[4], v4.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[4], v4.h[0]
	; CHECK-NOFP16-NEXT: fcvt h3, s3			; CHECK-NOFP16-SD-NEXT: fcvt h3, s3
	; CHECK-NOFP16-NEXT: fmaxnm s4, s6, s5			; CHECK-NOFP16-SD-NEXT: fmaxnm s4, s6, s5
	; CHECK-NOFP16-NEXT: fmaxnm s0, s0, s1			; CHECK-NOFP16-SD-NEXT: fmaxnm s0, s0, s1
	; CHECK-NOFP16-NEXT: mov v2.h[5], v3.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[5], v3.h[0]
	; CHECK-NOFP16-NEXT: fcvt h3, s4			; CHECK-NOFP16-SD-NEXT: fcvt h3, s4
	; CHECK-NOFP16-NEXT: fcvt h0, s0			; CHECK-NOFP16-SD-NEXT: fcvt h0, s0
	; CHECK-NOFP16-NEXT: mov v2.h[6], v3.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[6], v3.h[0]
	; CHECK-NOFP16-NEXT: mov v2.h[7], v0.h[0]			; CHECK-NOFP16-SD-NEXT: mov v2.h[7], v0.h[0]
	; CHECK-NOFP16-NEXT: mov v0.16b, v2.16b			; CHECK-NOFP16-SD-NEXT: mov v0.16b, v2.16b
	; CHECK-NOFP16-NEXT: ret			; CHECK-NOFP16-SD-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: max_v8f16:			; CHECK-FP16-SD-LABEL: max_v8f16:
	; CHECK-FP16: // %bb.0: // %entry			; CHECK-FP16-SD: // %bb.0: // %entry
	; CHECK-FP16-NEXT: fmaxnm v0.8h, v0.8h, v1.8h			; CHECK-FP16-SD-NEXT: fmaxnm v0.8h, v0.8h, v1.8h
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-SD-NEXT: ret
				;
				; CHECK-NOFP16-GI-LABEL: max_v8f16:
				; CHECK-NOFP16-GI: // %bb.0: // %entry
				; CHECK-NOFP16-GI-NEXT: fcvtl v2.4s, v0.4h
				; CHECK-NOFP16-GI-NEXT: fcvtl v3.4s, v1.4h
				; CHECK-NOFP16-GI-NEXT: fcvtl2 v0.4s, v0.8h
				; CHECK-NOFP16-GI-NEXT: fcvtl2 v1.4s, v1.8h
				; CHECK-NOFP16-GI-NEXT: fmaxnm v2.4s, v2.4s, v3.4s
				; CHECK-NOFP16-GI-NEXT: fmaxnm v1.4s, v0.4s, v1.4s
				; CHECK-NOFP16-GI-NEXT: fcvtn v0.4h, v2.4s
				; CHECK-NOFP16-GI-NEXT: fcvtn2 v0.8h, v1.4s
				; CHECK-NOFP16-GI-NEXT: ret
				;
				; CHECK-FP16-GI-LABEL: max_v8f16:
				; CHECK-FP16-GI: // %bb.0: // %entry
				; CHECK-FP16-GI-NEXT: fmaxnm v0.8h, v0.8h, v1.8h
				; CHECK-FP16-GI-NEXT: ret
	entry:			entry:
	%c = call <8 x half> @llvm.maxnum.v8f16(<8 x half> %a, <8 x half> %b)			%c = call <8 x half> @llvm.maxnum.v8f16(<8 x half> %a, <8 x half> %b)
	ret <8 x half> %c			ret <8 x half> %c
	}			}

	define <16 x half> @min_v16f16(<16 x half> %a, <16 x half> %b) {			define <16 x half> @min_v16f16(<16 x half> %a, <16 x half> %b) {
	; CHECK-NOFP16-LABEL: min_v16f16:			; CHECK-NOFP16-SD-LABEL: min_v16f16:
	; CHECK-NOFP16: // %bb.0: // %entry			; CHECK-NOFP16-SD: // %bb.0: // %entry
	; CHECK-NOFP16-NEXT: mov h4, v2.h[1]			; CHECK-NOFP16-SD-NEXT: mov h4, v2.h[1]
	; CHECK-NOFP16-NEXT: mov h5, v0.h[1]			; CHECK-NOFP16-SD-NEXT: mov h5, v0.h[1]
	; CHECK-NOFP16-NEXT: fcvt s6, h2			; CHECK-NOFP16-SD-NEXT: fcvt s6, h2
	; CHECK-NOFP16-NEXT: fcvt s7, h0			; CHECK-NOFP16-SD-NEXT: fcvt s7, h0
	; CHECK-NOFP16-NEXT: mov h16, v2.h[2]			; CHECK-NOFP16-SD-NEXT: mov h16, v2.h[2]
	; CHECK-NOFP16-NEXT: mov h17, v0.h[2]			; CHECK-NOFP16-SD-NEXT: mov h17, v0.h[2]
	; CHECK-NOFP16-NEXT: mov h18, v3.h[1]			; CHECK-NOFP16-SD-NEXT: mov h18, v3.h[1]
	; CHECK-NOFP16-NEXT: mov h19, v1.h[1]			; CHECK-NOFP16-SD-NEXT: mov h19, v1.h[1]
	; CHECK-NOFP16-NEXT: fcvt s4, h4			; CHECK-NOFP16-SD-NEXT: fcvt s4, h4
	; CHECK-NOFP16-NEXT: fcvt s5, h5			; CHECK-NOFP16-SD-NEXT: fcvt s5, h5
	; CHECK-NOFP16-NEXT: fminnm s6, s7, s6			; CHECK-NOFP16-SD-NEXT: fminnm s6, s7, s6
	; CHECK-NOFP16-NEXT: fcvt s20, h1			; CHECK-NOFP16-SD-NEXT: fcvt s20, h1
	; CHECK-NOFP16-NEXT: fcvt s7, h16			; CHECK-NOFP16-SD-NEXT: fcvt s7, h16
	; CHECK-NOFP16-NEXT: fcvt s16, h17			; CHECK-NOFP16-SD-NEXT: fcvt s16, h17
	; CHECK-NOFP16-NEXT: mov h17, v2.h[3]			; CHECK-NOFP16-SD-NEXT: mov h17, v2.h[3]
	; CHECK-NOFP16-NEXT: fcvt s18, h18			; CHECK-NOFP16-SD-NEXT: fcvt s18, h18
	; CHECK-NOFP16-NEXT: fminnm s5, s5, s4			; CHECK-NOFP16-SD-NEXT: fminnm s5, s5, s4
	; CHECK-NOFP16-NEXT: fcvt s19, h19			; CHECK-NOFP16-SD-NEXT: fcvt s19, h19
	; CHECK-NOFP16-NEXT: fcvt h4, s6			; CHECK-NOFP16-SD-NEXT: fcvt h4, s6
	; CHECK-NOFP16-NEXT: mov h6, v0.h[3]			; CHECK-NOFP16-SD-NEXT: mov h6, v0.h[3]
	; CHECK-NOFP16-NEXT: fminnm s7, s16, s7			; CHECK-NOFP16-SD-NEXT: fminnm s7, s16, s7
	; CHECK-NOFP16-NEXT: fcvt s16, h3			; CHECK-NOFP16-SD-NEXT: fcvt s16, h3
	; CHECK-NOFP16-NEXT: mov h21, v0.h[4]			; CHECK-NOFP16-SD-NEXT: mov h21, v0.h[4]
	; CHECK-NOFP16-NEXT: fcvt s17, h17			; CHECK-NOFP16-SD-NEXT: fcvt s17, h17
	; CHECK-NOFP16-NEXT: fcvt h5, s5			; CHECK-NOFP16-SD-NEXT: fcvt h5, s5
	; CHECK-NOFP16-NEXT: fminnm s18, s19, s18			; CHECK-NOFP16-SD-NEXT: fminnm s18, s19, s18
	; CHECK-NOFP16-NEXT: fcvt s6, h6			; CHECK-NOFP16-SD-NEXT: fcvt s6, h6
	; CHECK-NOFP16-NEXT: mov h19, v3.h[2]			; CHECK-NOFP16-SD-NEXT: mov h19, v3.h[2]
	; CHECK-NOFP16-NEXT: fminnm s16, s20, s16			; CHECK-NOFP16-SD-NEXT: fminnm s16, s20, s16
	; CHECK-NOFP16-NEXT: mov h20, v1.h[2]			; CHECK-NOFP16-SD-NEXT: mov h20, v1.h[2]
	; CHECK-NOFP16-NEXT: fcvt s21, h21			; CHECK-NOFP16-SD-NEXT: fcvt s21, h21
	; CHECK-NOFP16-NEXT: mov v4.h[1], v5.h[0]			; CHECK-NOFP16-SD-NEXT: mov v4.h[1], v5.h[0]
	; CHECK-NOFP16-NEXT: fcvt h5, s7			; CHECK-NOFP16-SD-NEXT: fcvt h5, s7
	; CHECK-NOFP16-NEXT: mov h7, v2.h[4]			; CHECK-NOFP16-SD-NEXT: mov h7, v2.h[4]
	; CHECK-NOFP16-NEXT: fminnm s6, s6, s17			; CHECK-NOFP16-SD-NEXT: fminnm s6, s6, s17
	; CHECK-NOFP16-NEXT: mov h17, v3.h[3]			; CHECK-NOFP16-SD-NEXT: mov h17, v3.h[3]
	; CHECK-NOFP16-NEXT: fcvt s19, h19			; CHECK-NOFP16-SD-NEXT: fcvt s19, h19
	; CHECK-NOFP16-NEXT: fcvt s20, h20			; CHECK-NOFP16-SD-NEXT: fcvt s20, h20
	; CHECK-NOFP16-NEXT: mov v4.h[2], v5.h[0]			; CHECK-NOFP16-SD-NEXT: mov v4.h[2], v5.h[0]
	; CHECK-NOFP16-NEXT: fcvt h5, s16			; CHECK-NOFP16-SD-NEXT: fcvt h5, s16
	; CHECK-NOFP16-NEXT: fcvt s7, h7			; CHECK-NOFP16-SD-NEXT: fcvt s7, h7
	; CHECK-NOFP16-NEXT: fcvt h16, s18			; CHECK-NOFP16-SD-NEXT: fcvt h16, s18
	; CHECK-NOFP16-NEXT: mov h18, v1.h[3]			; CHECK-NOFP16-SD-NEXT: mov h18, v1.h[3]
	; CHECK-NOFP16-NEXT: fcvt h6, s6			; CHECK-NOFP16-SD-NEXT: fcvt h6, s6
	; CHECK-NOFP16-NEXT: fminnm s7, s21, s7			; CHECK-NOFP16-SD-NEXT: fminnm s7, s21, s7
	; CHECK-NOFP16-NEXT: mov v5.h[1], v16.h[0]			; CHECK-NOFP16-SD-NEXT: mov v5.h[1], v16.h[0]
	; CHECK-NOFP16-NEXT: fcvt s16, h17			; CHECK-NOFP16-SD-NEXT: fcvt s16, h17
	; CHECK-NOFP16-NEXT: fminnm s17, s20, s19			; CHECK-NOFP16-SD-NEXT: fminnm s17, s20, s19
	; CHECK-NOFP16-NEXT: fcvt s18, h18			; CHECK-NOFP16-SD-NEXT: fcvt s18, h18
	; CHECK-NOFP16-NEXT: mov h19, v3.h[4]			; CHECK-NOFP16-SD-NEXT: mov h19, v3.h[4]
	; CHECK-NOFP16-NEXT: mov h20, v1.h[4]			; CHECK-NOFP16-SD-NEXT: mov h20, v1.h[4]
	; CHECK-NOFP16-NEXT: mov v4.h[3], v6.h[0]			; CHECK-NOFP16-SD-NEXT: mov v4.h[3], v6.h[0]
	; CHECK-NOFP16-NEXT: fcvt h6, s7			; CHECK-NOFP16-SD-NEXT: fcvt h6, s7
	; CHECK-NOFP16-NEXT: fminnm s7, s18, s16			; CHECK-NOFP16-SD-NEXT: fminnm s7, s18, s16
	; CHECK-NOFP16-NEXT: fcvt h16, s17			; CHECK-NOFP16-SD-NEXT: fcvt h16, s17
	; CHECK-NOFP16-NEXT: fcvt s17, h19			; CHECK-NOFP16-SD-NEXT: fcvt s17, h19
	; CHECK-NOFP16-NEXT: fcvt s18, h20			; CHECK-NOFP16-SD-NEXT: fcvt s18, h20
	; CHECK-NOFP16-NEXT: mov v4.h[4], v6.h[0]			; CHECK-NOFP16-SD-NEXT: mov v4.h[4], v6.h[0]
	; CHECK-NOFP16-NEXT: mov h19, v1.h[5]			; CHECK-NOFP16-SD-NEXT: mov h19, v1.h[5]
	; CHECK-NOFP16-NEXT: mov v5.h[2], v16.h[0]			; CHECK-NOFP16-SD-NEXT: mov v5.h[2], v16.h[0]
	; CHECK-NOFP16-NEXT: fcvt h6, s7			; CHECK-NOFP16-SD-NEXT: fcvt h6, s7
	; CHECK-NOFP16-NEXT: fminnm s7, s18, s17			; CHECK-NOFP16-SD-NEXT: fminnm s7, s18, s17
	; CHECK-NOFP16-NEXT: mov h16, v2.h[5]			; CHECK-NOFP16-SD-NEXT: mov h16, v2.h[5]
	; CHECK-NOFP16-NEXT: mov h17, v0.h[5]			; CHECK-NOFP16-SD-NEXT: mov h17, v0.h[5]
	; CHECK-NOFP16-NEXT: mov h18, v3.h[5]			; CHECK-NOFP16-SD-NEXT: mov h18, v3.h[5]
	; CHECK-NOFP16-NEXT: mov v5.h[3], v6.h[0]			; CHECK-NOFP16-SD-NEXT: mov v5.h[3], v6.h[0]
	; CHECK-NOFP16-NEXT: fcvt h6, s7			; CHECK-NOFP16-SD-NEXT: fcvt h6, s7
	; CHECK-NOFP16-NEXT: fcvt s7, h16			; CHECK-NOFP16-SD-NEXT: fcvt s7, h16
	; CHECK-NOFP16-NEXT: fcvt s16, h17			; CHECK-NOFP16-SD-NEXT: fcvt s16, h17
	; CHECK-NOFP16-NEXT: fcvt s17, h18			; CHECK-NOFP16-SD-NEXT: fcvt s17, h18
	; CHECK-NOFP16-NEXT: fcvt s18, h19			; CHECK-NOFP16-SD-NEXT: fcvt s18, h19
	; CHECK-NOFP16-NEXT: mov h19, v2.h[6]			; CHECK-NOFP16-SD-NEXT: mov h19, v2.h[6]
	; CHECK-NOFP16-NEXT: mov h2, v2.h[7]			; CHECK-NOFP16-SD-NEXT: mov h2, v2.h[7]
	; CHECK-NOFP16-NEXT: mov v5.h[4], v6.h[0]			; CHECK-NOFP16-SD-NEXT: mov v5.h[4], v6.h[0]
	; CHECK-NOFP16-NEXT: mov h6, v0.h[6]			; CHECK-NOFP16-SD-NEXT: mov h6, v0.h[6]
	; CHECK-NOFP16-NEXT: fminnm s7, s16, s7			; CHECK-NOFP16-SD-NEXT: fminnm s7, s16, s7
	; CHECK-NOFP16-NEXT: fminnm s16, s18, s17			; CHECK-NOFP16-SD-NEXT: fminnm s16, s18, s17
	; CHECK-NOFP16-NEXT: mov h17, v3.h[6]			; CHECK-NOFP16-SD-NEXT: mov h17, v3.h[6]
	; CHECK-NOFP16-NEXT: mov h18, v1.h[6]			; CHECK-NOFP16-SD-NEXT: mov h18, v1.h[6]
	; CHECK-NOFP16-NEXT: fcvt s19, h19			; CHECK-NOFP16-SD-NEXT: fcvt s19, h19
	; CHECK-NOFP16-NEXT: fcvt s6, h6			; CHECK-NOFP16-SD-NEXT: fcvt s6, h6
	; CHECK-NOFP16-NEXT: mov h0, v0.h[7]			; CHECK-NOFP16-SD-NEXT: mov h0, v0.h[7]
	; CHECK-NOFP16-NEXT: mov h3, v3.h[7]			; CHECK-NOFP16-SD-NEXT: mov h3, v3.h[7]
	; CHECK-NOFP16-NEXT: mov h1, v1.h[7]			; CHECK-NOFP16-SD-NEXT: mov h1, v1.h[7]
	; CHECK-NOFP16-NEXT: fcvt s17, h17			; CHECK-NOFP16-SD-NEXT: fcvt s17, h17
	; CHECK-NOFP16-NEXT: fcvt h7, s7			; CHECK-NOFP16-SD-NEXT: fcvt h7, s7
	; CHECK-NOFP16-NEXT: fcvt s18, h18			; CHECK-NOFP16-SD-NEXT: fcvt s18, h18
	; CHECK-NOFP16-NEXT: fcvt s2, h2			; CHECK-NOFP16-SD-NEXT: fcvt s2, h2
	; CHECK-NOFP16-NEXT: fminnm s6, s6, s19			; CHECK-NOFP16-SD-NEXT: fminnm s6, s6, s19
	; CHECK-NOFP16-NEXT: fcvt s0, h0			; CHECK-NOFP16-SD-NEXT: fcvt s0, h0
	; CHECK-NOFP16-NEXT: fcvt s3, h3			; CHECK-NOFP16-SD-NEXT: fcvt s3, h3
	; CHECK-NOFP16-NEXT: fcvt s1, h1			; CHECK-NOFP16-SD-NEXT: fcvt s1, h1
	; CHECK-NOFP16-NEXT: fcvt h16, s16			; CHECK-NOFP16-SD-NEXT: fcvt h16, s16
	; CHECK-NOFP16-NEXT: fminnm s17, s18, s17			; CHECK-NOFP16-SD-NEXT: fminnm s17, s18, s17
	; CHECK-NOFP16-NEXT: mov v4.h[5], v7.h[0]			; CHECK-NOFP16-SD-NEXT: mov v4.h[5], v7.h[0]
	; CHECK-NOFP16-NEXT: fcvt h6, s6			; CHECK-NOFP16-SD-NEXT: fcvt h6, s6
	; CHECK-NOFP16-NEXT: fminnm s0, s0, s2			; CHECK-NOFP16-SD-NEXT: fminnm s0, s0, s2
	; CHECK-NOFP16-NEXT: fminnm s1, s1, s3			; CHECK-NOFP16-SD-NEXT: fminnm s1, s1, s3
	; CHECK-NOFP16-NEXT: mov v5.h[5], v16.h[0]			; CHECK-NOFP16-SD-NEXT: mov v5.h[5], v16.h[0]
	; CHECK-NOFP16-NEXT: fcvt h2, s17			; CHECK-NOFP16-SD-NEXT: fcvt h2, s17
	; CHECK-NOFP16-NEXT: mov v4.h[6], v6.h[0]			; CHECK-NOFP16-SD-NEXT: mov v4.h[6], v6.h[0]
	; CHECK-NOFP16-NEXT: fcvt h0, s0			; CHECK-NOFP16-SD-NEXT: fcvt h0, s0
	; CHECK-NOFP16-NEXT: fcvt h1, s1			; CHECK-NOFP16-SD-NEXT: fcvt h1, s1
	; CHECK-NOFP16-NEXT: mov v5.h[6], v2.h[0]			; CHECK-NOFP16-SD-NEXT: mov v5.h[6], v2.h[0]
	; CHECK-NOFP16-NEXT: mov v4.h[7], v0.h[0]			; CHECK-NOFP16-SD-NEXT: mov v4.h[7], v0.h[0]
	; CHECK-NOFP16-NEXT: mov v5.h[7], v1.h[0]			; CHECK-NOFP16-SD-NEXT: mov v5.h[7], v1.h[0]
	; CHECK-NOFP16-NEXT: mov v0.16b, v4.16b			; CHECK-NOFP16-SD-NEXT: mov v0.16b, v4.16b
	; CHECK-NOFP16-NEXT: mov v1.16b, v5.16b			; CHECK-NOFP16-SD-NEXT: mov v1.16b, v5.16b
	; CHECK-NOFP16-NEXT: ret			; CHECK-NOFP16-SD-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: min_v16f16:			; CHECK-FP16-SD-LABEL: min_v16f16:
	; CHECK-FP16: // %bb.0: // %entry			; CHECK-FP16-SD: // %bb.0: // %entry
	; CHECK-FP16-NEXT: fminnm v0.8h, v0.8h, v2.8h			; CHECK-FP16-SD-NEXT: fminnm v0.8h, v0.8h, v2.8h
	; CHECK-FP16-NEXT: fminnm v1.8h, v1.8h, v3.8h			; CHECK-FP16-SD-NEXT: fminnm v1.8h, v1.8h, v3.8h
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-SD-NEXT: ret
				;
				; CHECK-NOFP16-GI-LABEL: min_v16f16:
				; CHECK-NOFP16-GI: // %bb.0: // %entry
				; CHECK-NOFP16-GI-NEXT: fcvtl v4.4s, v0.4h
				; CHECK-NOFP16-GI-NEXT: fcvtl v5.4s, v2.4h
				; CHECK-NOFP16-GI-NEXT: fcvtl v6.4s, v1.4h
				; CHECK-NOFP16-GI-NEXT: fcvtl v7.4s, v3.4h
				; CHECK-NOFP16-GI-NEXT: fcvtl2 v0.4s, v0.8h
				; CHECK-NOFP16-GI-NEXT: fcvtl2 v2.4s, v2.8h
				; CHECK-NOFP16-GI-NEXT: fcvtl2 v1.4s, v1.8h
				; CHECK-NOFP16-GI-NEXT: fcvtl2 v3.4s, v3.8h
				; CHECK-NOFP16-GI-NEXT: fminnm v4.4s, v4.4s, v5.4s
				; CHECK-NOFP16-GI-NEXT: fminnm v5.4s, v6.4s, v7.4s
				; CHECK-NOFP16-GI-NEXT: fminnm v2.4s, v0.4s, v2.4s
				; CHECK-NOFP16-GI-NEXT: fminnm v3.4s, v1.4s, v3.4s
				; CHECK-NOFP16-GI-NEXT: fcvtn v0.4h, v4.4s
				; CHECK-NOFP16-GI-NEXT: fcvtn v1.4h, v5.4s
				; CHECK-NOFP16-GI-NEXT: fcvtn2 v0.8h, v2.4s
				; CHECK-NOFP16-GI-NEXT: fcvtn2 v1.8h, v3.4s
				; CHECK-NOFP16-GI-NEXT: ret
				;
				; CHECK-FP16-GI-LABEL: min_v16f16:
				; CHECK-FP16-GI: // %bb.0: // %entry
				; CHECK-FP16-GI-NEXT: fminnm v0.8h, v0.8h, v2.8h
				; CHECK-FP16-GI-NEXT: fminnm v1.8h, v1.8h, v3.8h
				; CHECK-FP16-GI-NEXT: ret
	entry:			entry:
	%c = call <16 x half> @llvm.minnum.v16f16(<16 x half> %a, <16 x half> %b)			%c = call <16 x half> @llvm.minnum.v16f16(<16 x half> %a, <16 x half> %b)
	ret <16 x half> %c			ret <16 x half> %c
	}			}

	define <16 x half> @max_v16f16(<16 x half> %a, <16 x half> %b) {			define <16 x half> @max_v16f16(<16 x half> %a, <16 x half> %b) {
	; CHECK-NOFP16-LABEL: max_v16f16:			; CHECK-NOFP16-SD-LABEL: max_v16f16:
	; CHECK-NOFP16: // %bb.0: // %entry			; CHECK-NOFP16-SD: // %bb.0: // %entry
	; CHECK-NOFP16-NEXT: mov h4, v2.h[1]			; CHECK-NOFP16-SD-NEXT: mov h4, v2.h[1]
	; CHECK-NOFP16-NEXT: mov h5, v0.h[1]			; CHECK-NOFP16-SD-NEXT: mov h5, v0.h[1]
	; CHECK-NOFP16-NEXT: fcvt s6, h2			; CHECK-NOFP16-SD-NEXT: fcvt s6, h2
	; CHECK-NOFP16-NEXT: fcvt s7, h0			; CHECK-NOFP16-SD-NEXT: fcvt s7, h0
	; CHECK-NOFP16-NEXT: mov h16, v2.h[2]			; CHECK-NOFP16-SD-NEXT: mov h16, v2.h[2]
	; CHECK-NOFP16-NEXT: mov h17, v0.h[2]			; CHECK-NOFP16-SD-NEXT: mov h17, v0.h[2]
	; CHECK-NOFP16-NEXT: mov h18, v3.h[1]			; CHECK-NOFP16-SD-NEXT: mov h18, v3.h[1]
	; CHECK-NOFP16-NEXT: mov h19, v1.h[1]			; CHECK-NOFP16-SD-NEXT: mov h19, v1.h[1]
	; CHECK-NOFP16-NEXT: fcvt s4, h4			; CHECK-NOFP16-SD-NEXT: fcvt s4, h4
	; CHECK-NOFP16-NEXT: fcvt s5, h5			; CHECK-NOFP16-SD-NEXT: fcvt s5, h5
	; CHECK-NOFP16-NEXT: fmaxnm s6, s7, s6			; CHECK-NOFP16-SD-NEXT: fmaxnm s6, s7, s6
	; CHECK-NOFP16-NEXT: fcvt s20, h1			; CHECK-NOFP16-SD-NEXT: fcvt s20, h1
	; CHECK-NOFP16-NEXT: fcvt s7, h16			; CHECK-NOFP16-SD-NEXT: fcvt s7, h16
	; CHECK-NOFP16-NEXT: fcvt s16, h17			; CHECK-NOFP16-SD-NEXT: fcvt s16, h17
	; CHECK-NOFP16-NEXT: mov h17, v2.h[3]			; CHECK-NOFP16-SD-NEXT: mov h17, v2.h[3]
	; CHECK-NOFP16-NEXT: fcvt s18, h18			; CHECK-NOFP16-SD-NEXT: fcvt s18, h18
	; CHECK-NOFP16-NEXT: fmaxnm s5, s5, s4			; CHECK-NOFP16-SD-NEXT: fmaxnm s5, s5, s4
	; CHECK-NOFP16-NEXT: fcvt s19, h19			; CHECK-NOFP16-SD-NEXT: fcvt s19, h19
	; CHECK-NOFP16-NEXT: fcvt h4, s6			; CHECK-NOFP16-SD-NEXT: fcvt h4, s6
	; CHECK-NOFP16-NEXT: mov h6, v0.h[3]			; CHECK-NOFP16-SD-NEXT: mov h6, v0.h[3]
	; CHECK-NOFP16-NEXT: fmaxnm s7, s16, s7			; CHECK-NOFP16-SD-NEXT: fmaxnm s7, s16, s7
	; CHECK-NOFP16-NEXT: fcvt s16, h3			; CHECK-NOFP16-SD-NEXT: fcvt s16, h3
	; CHECK-NOFP16-NEXT: mov h21, v0.h[4]			; CHECK-NOFP16-SD-NEXT: mov h21, v0.h[4]
	; CHECK-NOFP16-NEXT: fcvt s17, h17			; CHECK-NOFP16-SD-NEXT: fcvt s17, h17
	; CHECK-NOFP16-NEXT: fcvt h5, s5			; CHECK-NOFP16-SD-NEXT: fcvt h5, s5
	; CHECK-NOFP16-NEXT: fmaxnm s18, s19, s18			; CHECK-NOFP16-SD-NEXT: fmaxnm s18, s19, s18
	; CHECK-NOFP16-NEXT: fcvt s6, h6			; CHECK-NOFP16-SD-NEXT: fcvt s6, h6
	; CHECK-NOFP16-NEXT: mov h19, v3.h[2]			; CHECK-NOFP16-SD-NEXT: mov h19, v3.h[2]
	; CHECK-NOFP16-NEXT: fmaxnm s16, s20, s16			; CHECK-NOFP16-SD-NEXT: fmaxnm s16, s20, s16
	; CHECK-NOFP16-NEXT: mov h20, v1.h[2]			; CHECK-NOFP16-SD-NEXT: mov h20, v1.h[2]
	; CHECK-NOFP16-NEXT: fcvt s21, h21			; CHECK-NOFP16-SD-NEXT: fcvt s21, h21
	; CHECK-NOFP16-NEXT: mov v4.h[1], v5.h[0]			; CHECK-NOFP16-SD-NEXT: mov v4.h[1], v5.h[0]
	; CHECK-NOFP16-NEXT: fcvt h5, s7			; CHECK-NOFP16-SD-NEXT: fcvt h5, s7
	; CHECK-NOFP16-NEXT: mov h7, v2.h[4]			; CHECK-NOFP16-SD-NEXT: mov h7, v2.h[4]
	; CHECK-NOFP16-NEXT: fmaxnm s6, s6, s17			; CHECK-NOFP16-SD-NEXT: fmaxnm s6, s6, s17
	; CHECK-NOFP16-NEXT: mov h17, v3.h[3]			; CHECK-NOFP16-SD-NEXT: mov h17, v3.h[3]
	; CHECK-NOFP16-NEXT: fcvt s19, h19			; CHECK-NOFP16-SD-NEXT: fcvt s19, h19
	; CHECK-NOFP16-NEXT: fcvt s20, h20			; CHECK-NOFP16-SD-NEXT: fcvt s20, h20
	; CHECK-NOFP16-NEXT: mov v4.h[2], v5.h[0]			; CHECK-NOFP16-SD-NEXT: mov v4.h[2], v5.h[0]
	; CHECK-NOFP16-NEXT: fcvt h5, s16			; CHECK-NOFP16-SD-NEXT: fcvt h5, s16
	; CHECK-NOFP16-NEXT: fcvt s7, h7			; CHECK-NOFP16-SD-NEXT: fcvt s7, h7
	; CHECK-NOFP16-NEXT: fcvt h16, s18			; CHECK-NOFP16-SD-NEXT: fcvt h16, s18
	; CHECK-NOFP16-NEXT: mov h18, v1.h[3]			; CHECK-NOFP16-SD-NEXT: mov h18, v1.h[3]
	; CHECK-NOFP16-NEXT: fcvt h6, s6			; CHECK-NOFP16-SD-NEXT: fcvt h6, s6
	; CHECK-NOFP16-NEXT: fmaxnm s7, s21, s7			; CHECK-NOFP16-SD-NEXT: fmaxnm s7, s21, s7
	; CHECK-NOFP16-NEXT: mov v5.h[1], v16.h[0]			; CHECK-NOFP16-SD-NEXT: mov v5.h[1], v16.h[0]
	; CHECK-NOFP16-NEXT: fcvt s16, h17			; CHECK-NOFP16-SD-NEXT: fcvt s16, h17
	; CHECK-NOFP16-NEXT: fmaxnm s17, s20, s19			; CHECK-NOFP16-SD-NEXT: fmaxnm s17, s20, s19
	; CHECK-NOFP16-NEXT: fcvt s18, h18			; CHECK-NOFP16-SD-NEXT: fcvt s18, h18
	; CHECK-NOFP16-NEXT: mov h19, v3.h[4]			; CHECK-NOFP16-SD-NEXT: mov h19, v3.h[4]
	; CHECK-NOFP16-NEXT: mov h20, v1.h[4]			; CHECK-NOFP16-SD-NEXT: mov h20, v1.h[4]
	; CHECK-NOFP16-NEXT: mov v4.h[3], v6.h[0]			; CHECK-NOFP16-SD-NEXT: mov v4.h[3], v6.h[0]
	; CHECK-NOFP16-NEXT: fcvt h6, s7			; CHECK-NOFP16-SD-NEXT: fcvt h6, s7
	; CHECK-NOFP16-NEXT: fmaxnm s7, s18, s16			; CHECK-NOFP16-SD-NEXT: fmaxnm s7, s18, s16
	; CHECK-NOFP16-NEXT: fcvt h16, s17			; CHECK-NOFP16-SD-NEXT: fcvt h16, s17
	; CHECK-NOFP16-NEXT: fcvt s17, h19			; CHECK-NOFP16-SD-NEXT: fcvt s17, h19
	; CHECK-NOFP16-NEXT: fcvt s18, h20			; CHECK-NOFP16-SD-NEXT: fcvt s18, h20
	; CHECK-NOFP16-NEXT: mov v4.h[4], v6.h[0]			; CHECK-NOFP16-SD-NEXT: mov v4.h[4], v6.h[0]
	; CHECK-NOFP16-NEXT: mov h19, v1.h[5]			; CHECK-NOFP16-SD-NEXT: mov h19, v1.h[5]
	; CHECK-NOFP16-NEXT: mov v5.h[2], v16.h[0]			; CHECK-NOFP16-SD-NEXT: mov v5.h[2], v16.h[0]
	; CHECK-NOFP16-NEXT: fcvt h6, s7			; CHECK-NOFP16-SD-NEXT: fcvt h6, s7
	; CHECK-NOFP16-NEXT: fmaxnm s7, s18, s17			; CHECK-NOFP16-SD-NEXT: fmaxnm s7, s18, s17
	; CHECK-NOFP16-NEXT: mov h16, v2.h[5]			; CHECK-NOFP16-SD-NEXT: mov h16, v2.h[5]
	; CHECK-NOFP16-NEXT: mov h17, v0.h[5]			; CHECK-NOFP16-SD-NEXT: mov h17, v0.h[5]
	; CHECK-NOFP16-NEXT: mov h18, v3.h[5]			; CHECK-NOFP16-SD-NEXT: mov h18, v3.h[5]
	; CHECK-NOFP16-NEXT: mov v5.h[3], v6.h[0]			; CHECK-NOFP16-SD-NEXT: mov v5.h[3], v6.h[0]
	; CHECK-NOFP16-NEXT: fcvt h6, s7			; CHECK-NOFP16-SD-NEXT: fcvt h6, s7
	; CHECK-NOFP16-NEXT: fcvt s7, h16			; CHECK-NOFP16-SD-NEXT: fcvt s7, h16
	; CHECK-NOFP16-NEXT: fcvt s16, h17			; CHECK-NOFP16-SD-NEXT: fcvt s16, h17
	; CHECK-NOFP16-NEXT: fcvt s17, h18			; CHECK-NOFP16-SD-NEXT: fcvt s17, h18
	; CHECK-NOFP16-NEXT: fcvt s18, h19			; CHECK-NOFP16-SD-NEXT: fcvt s18, h19
	; CHECK-NOFP16-NEXT: mov h19, v2.h[6]			; CHECK-NOFP16-SD-NEXT: mov h19, v2.h[6]
	; CHECK-NOFP16-NEXT: mov h2, v2.h[7]			; CHECK-NOFP16-SD-NEXT: mov h2, v2.h[7]
	; CHECK-NOFP16-NEXT: mov v5.h[4], v6.h[0]			; CHECK-NOFP16-SD-NEXT: mov v5.h[4], v6.h[0]
	; CHECK-NOFP16-NEXT: mov h6, v0.h[6]			; CHECK-NOFP16-SD-NEXT: mov h6, v0.h[6]
	; CHECK-NOFP16-NEXT: fmaxnm s7, s16, s7			; CHECK-NOFP16-SD-NEXT: fmaxnm s7, s16, s7
	; CHECK-NOFP16-NEXT: fmaxnm s16, s18, s17			; CHECK-NOFP16-SD-NEXT: fmaxnm s16, s18, s17
	; CHECK-NOFP16-NEXT: mov h17, v3.h[6]			; CHECK-NOFP16-SD-NEXT: mov h17, v3.h[6]
	; CHECK-NOFP16-NEXT: mov h18, v1.h[6]			; CHECK-NOFP16-SD-NEXT: mov h18, v1.h[6]
	; CHECK-NOFP16-NEXT: fcvt s19, h19			; CHECK-NOFP16-SD-NEXT: fcvt s19, h19
	; CHECK-NOFP16-NEXT: fcvt s6, h6			; CHECK-NOFP16-SD-NEXT: fcvt s6, h6
	; CHECK-NOFP16-NEXT: mov h0, v0.h[7]			; CHECK-NOFP16-SD-NEXT: mov h0, v0.h[7]
	; CHECK-NOFP16-NEXT: mov h3, v3.h[7]			; CHECK-NOFP16-SD-NEXT: mov h3, v3.h[7]
	; CHECK-NOFP16-NEXT: mov h1, v1.h[7]			; CHECK-NOFP16-SD-NEXT: mov h1, v1.h[7]
	; CHECK-NOFP16-NEXT: fcvt s17, h17			; CHECK-NOFP16-SD-NEXT: fcvt s17, h17
	; CHECK-NOFP16-NEXT: fcvt h7, s7			; CHECK-NOFP16-SD-NEXT: fcvt h7, s7
	; CHECK-NOFP16-NEXT: fcvt s18, h18			; CHECK-NOFP16-SD-NEXT: fcvt s18, h18
	; CHECK-NOFP16-NEXT: fcvt s2, h2			; CHECK-NOFP16-SD-NEXT: fcvt s2, h2
	; CHECK-NOFP16-NEXT: fmaxnm s6, s6, s19			; CHECK-NOFP16-SD-NEXT: fmaxnm s6, s6, s19
	; CHECK-NOFP16-NEXT: fcvt s0, h0			; CHECK-NOFP16-SD-NEXT: fcvt s0, h0
	; CHECK-NOFP16-NEXT: fcvt s3, h3			; CHECK-NOFP16-SD-NEXT: fcvt s3, h3
	; CHECK-NOFP16-NEXT: fcvt s1, h1			; CHECK-NOFP16-SD-NEXT: fcvt s1, h1
	; CHECK-NOFP16-NEXT: fcvt h16, s16			; CHECK-NOFP16-SD-NEXT: fcvt h16, s16
	; CHECK-NOFP16-NEXT: fmaxnm s17, s18, s17			; CHECK-NOFP16-SD-NEXT: fmaxnm s17, s18, s17
	; CHECK-NOFP16-NEXT: mov v4.h[5], v7.h[0]			; CHECK-NOFP16-SD-NEXT: mov v4.h[5], v7.h[0]
	; CHECK-NOFP16-NEXT: fcvt h6, s6			; CHECK-NOFP16-SD-NEXT: fcvt h6, s6
	; CHECK-NOFP16-NEXT: fmaxnm s0, s0, s2			; CHECK-NOFP16-SD-NEXT: fmaxnm s0, s0, s2
	; CHECK-NOFP16-NEXT: fmaxnm s1, s1, s3			; CHECK-NOFP16-SD-NEXT: fmaxnm s1, s1, s3
	; CHECK-NOFP16-NEXT: mov v5.h[5], v16.h[0]			; CHECK-NOFP16-SD-NEXT: mov v5.h[5], v16.h[0]
	; CHECK-NOFP16-NEXT: fcvt h2, s17			; CHECK-NOFP16-SD-NEXT: fcvt h2, s17
	; CHECK-NOFP16-NEXT: mov v4.h[6], v6.h[0]			; CHECK-NOFP16-SD-NEXT: mov v4.h[6], v6.h[0]
	; CHECK-NOFP16-NEXT: fcvt h0, s0			; CHECK-NOFP16-SD-NEXT: fcvt h0, s0
	; CHECK-NOFP16-NEXT: fcvt h1, s1			; CHECK-NOFP16-SD-NEXT: fcvt h1, s1
	; CHECK-NOFP16-NEXT: mov v5.h[6], v2.h[0]			; CHECK-NOFP16-SD-NEXT: mov v5.h[6], v2.h[0]
	; CHECK-NOFP16-NEXT: mov v4.h[7], v0.h[0]			; CHECK-NOFP16-SD-NEXT: mov v4.h[7], v0.h[0]
	; CHECK-NOFP16-NEXT: mov v5.h[7], v1.h[0]			; CHECK-NOFP16-SD-NEXT: mov v5.h[7], v1.h[0]
	; CHECK-NOFP16-NEXT: mov v0.16b, v4.16b			; CHECK-NOFP16-SD-NEXT: mov v0.16b, v4.16b
	; CHECK-NOFP16-NEXT: mov v1.16b, v5.16b			; CHECK-NOFP16-SD-NEXT: mov v1.16b, v5.16b
	; CHECK-NOFP16-NEXT: ret			; CHECK-NOFP16-SD-NEXT: ret
	;			;
	; CHECK-FP16-LABEL: max_v16f16:			; CHECK-FP16-SD-LABEL: max_v16f16:
	; CHECK-FP16: // %bb.0: // %entry			; CHECK-FP16-SD: // %bb.0: // %entry
	; CHECK-FP16-NEXT: fmaxnm v0.8h, v0.8h, v2.8h			; CHECK-FP16-SD-NEXT: fmaxnm v0.8h, v0.8h, v2.8h
	; CHECK-FP16-NEXT: fmaxnm v1.8h, v1.8h, v3.8h			; CHECK-FP16-SD-NEXT: fmaxnm v1.8h, v1.8h, v3.8h
	; CHECK-FP16-NEXT: ret			; CHECK-FP16-SD-NEXT: ret
				;
				; CHECK-NOFP16-GI-LABEL: max_v16f16:
				; CHECK-NOFP16-GI: // %bb.0: // %entry
				; CHECK-NOFP16-GI-NEXT: fcvtl v4.4s, v0.4h
				; CHECK-NOFP16-GI-NEXT: fcvtl v5.4s, v2.4h
				; CHECK-NOFP16-GI-NEXT: fcvtl v6.4s, v1.4h
				; CHECK-NOFP16-GI-NEXT: fcvtl v7.4s, v3.4h
				; CHECK-NOFP16-GI-NEXT: fcvtl2 v0.4s, v0.8h
				; CHECK-NOFP16-GI-NEXT: fcvtl2 v2.4s, v2.8h
				; CHECK-NOFP16-GI-NEXT: fcvtl2 v1.4s, v1.8h
				; CHECK-NOFP16-GI-NEXT: fcvtl2 v3.4s, v3.8h
				; CHECK-NOFP16-GI-NEXT: fmaxnm v4.4s, v4.4s, v5.4s
				; CHECK-NOFP16-GI-NEXT: fmaxnm v5.4s, v6.4s, v7.4s
				; CHECK-NOFP16-GI-NEXT: fmaxnm v2.4s, v0.4s, v2.4s
				; CHECK-NOFP16-GI-NEXT: fmaxnm v3.4s, v1.4s, v3.4s
				; CHECK-NOFP16-GI-NEXT: fcvtn v0.4h, v4.4s
				; CHECK-NOFP16-GI-NEXT: fcvtn v1.4h, v5.4s
				; CHECK-NOFP16-GI-NEXT: fcvtn2 v0.8h, v2.4s
				; CHECK-NOFP16-GI-NEXT: fcvtn2 v1.8h, v3.4s
				; CHECK-NOFP16-GI-NEXT: ret
				;
				; CHECK-FP16-GI-LABEL: max_v16f16:
				; CHECK-FP16-GI: // %bb.0: // %entry
				; CHECK-FP16-GI-NEXT: fmaxnm v0.8h, v0.8h, v2.8h
				; CHECK-FP16-GI-NEXT: fmaxnm v1.8h, v1.8h, v3.8h
				; CHECK-FP16-GI-NEXT: ret
	entry:			entry:
	%c = call <16 x half> @llvm.maxnum.v16f16(<16 x half> %a, <16 x half> %b)			%c = call <16 x half> @llvm.maxnum.v16f16(<16 x half> %a, <16 x half> %b)
				tschuettUnsubmitted Not Done Reply Inline Actions For 16 Gisel seems to be better?!? tschuett: For 16 Gisel seems to be better?!?
				dmgreenAuthorUnsubmitted Done Reply Inline Actions The SDAG for fp16 without fullfp16 has always scalarized many instructions, and I don't believe anyone has looked into fixing it, as it's fairly low priority. It's worth getting it right with GISel if we can though. dmgreen: The SDAG for fp16 without fullfp16 has always scalarized many instructions, and I don't believe…
	ret <16 x half> %c			ret <16 x half> %c
	}			}

	declare <16 x half> @llvm.maxnum.v16f16(<16 x half>, <16 x half>)			declare <16 x half> @llvm.maxnum.v16f16(<16 x half>, <16 x half>)
	declare <16 x half> @llvm.minnum.v16f16(<16 x half>, <16 x half>)			declare <16 x half> @llvm.minnum.v16f16(<16 x half>, <16 x half>)
	declare <2 x double> @llvm.maxnum.v2f64(<2 x double>, <2 x double>)			declare <2 x double> @llvm.maxnum.v2f64(<2 x double>, <2 x double>)
	declare <2 x double> @llvm.minnum.v2f64(<2 x double>, <2 x double>)			declare <2 x double> @llvm.minnum.v2f64(<2 x double>, <2 x double>)
	declare <2 x float> @llvm.maxnum.v2f32(<2 x float>, <2 x float>)			declare <2 x float> @llvm.maxnum.v2f32(<2 x float>, <2 x float>)
	Show All 25 Lines