This is an archive of the discontinued LLVM Phabricator instance.

Fix flakiness in fp16-promote.ll
ClosedPublic

Authored by pirama on Apr 20 2015, 10:28 AM.

Download Raw Diff

Details

Reviewers

mzolotukhin
ab
srhines

Commits

rG80f958dbf430: Fix flakiness in fp16-promote.ll
rL235363: Fix flakiness in fp16-promote.ll

Summary

In the f16-promote test, make the checks for native conversion instructions
similar to the libcall checks:

Remove hard coded register names
Do not check exact instruction sequences.

This fixes test flakiness due to non-determinism in instruction
scheduling and register allocation. I also fixed a few minor things in
the CHECK-LIBCALL checks.

I'll try to find a way to check that unnecessary loads, stores, or
conversions don't happen.

Diff Detail

Repository: rL LLVM

Event Timeline

pirama updated this revision to Diff 24028.Apr 20 2015, 10:28 AM

pirama retitled this revision from to Fix flakiness in fp16-promote.ll.

pirama updated this object.

pirama edited the test plan for this revision. (Show Details)

pirama added reviewers: mzolotukhin, srhines, ab.

pirama added a subscriber: Unknown Object (MLST).

Patch 2. Fix accidental change of the mattr flag from vfp3 to vfp4.

I'm fine with this, even though I'd prefer the very explicit tests, for instance with [[R1:r[0-9]+]] patterns to not care about register allocation. It seems to me that we're at a point in the project's life where it's much more important to avoid regressions than to make it easy to add new features.

Note that one advantage of just checking for instructions is that, for the -LIBCALL/-FP16, one trick you can use to avoid duplicating the entire checks is to have an initial pattern, but then test everything using that pattern in generic CHECK: lines. So, at the very first match, you'd have:

; CHECK-LABEL: test_fadd:
; CHECK-FP16: [[F16_TO_F32:vcvtb.f32.f16]]
; CHECK-LIBCALL: [[F16_TO_F32:bl __gnu_h2f_ieee]]
; CHECK: [[F32_TO_F16]]
; CHECK: vadd.f32
; CHECK-FP16: [[F32_TO_F16:vcvtb.f16.f32]]
; CHECK-LIBCALL: [[F32_TO_F16:bl __gnu_f2h_ieee]]

That lets you avoid duplicating most of the remaining CHECK lines:

; CHECK-LABEL: test_fsub:
; CHECK: [[F16_TO_F32]]
; CHECK: [[F16_TO_F32]]
; CHECK: vsub.f32
; CHECK: [[F32_TO_F16]]

(with the appropriate --check-prefix=CHECK, or CHECK-ALL like you have)

test/CodeGen/ARM/fp16-promote.ll
886 ↗	(On Diff #24028)	Without -NEXT, there's no point in checking .fnstart, right?

I can probably add regular expressions to match registers. It is still a problem that a different instruction schedule will cause the test to fail.

Is it possible that an explicit target CPU or another option in the command line will remove the variations? If so, we should do that instead of changing the test. I am not familiar enough with the backend to know this.

In D9112#158400, @pirama wrote:

I can probably add regular expressions to match registers. It is still a problem that a different instruction schedule will cause the test to fail.

Is it possible that an explicit target CPU or another option in the command line will remove the variations? If so, we should do that instead of changing the test. I am not familiar enough with the backend to know this.

If you set an explicit triple, IIRC there's a default CPU chosen (in this case probably cortex-a8), so I don't expect that to vary. Schedule variations are still possible because of other changes missing from trunk though, probably like the register allocation issue here. (+ Renato, who would have the advice you're looking for)

In any case, bots are still broken, so this should be fixed one way or the other, soon ;)

-Ahmed

In any case, bots are still broken, so this should be fixed one way or the other, soon ;)

How about I commit this patch (sans the .fnstart), so I don't block others? I'll either add explicit register checks or merge the duplicate checks in a followup patch after we decide about the right strategy?

That sounds like the pragmatic solution, and less noisy than reverting, so a reluctant LGTM ;)
I'll let Michael accept, if it fixes the issue.

Thanks!
-Ahmed

Yep, please commit the patch to fix the bots, and then follow up as needed later.

Thanks!

This revision is now accepted and ready to land.Apr 20 2015, 4:56 PM

Closed by commit rL235363: Fix flakiness in fp16-promote.ll (authored by pirama). · Explain WhyApr 20 2015, 4:58 PM

This revision was automatically updated to reflect the committed changes.

Thanks Ahmad, Michael.

For future reference, how do I check the status of the bots? In lab.llvm.org:8011/grid, I see the nightly tests are failing, but couldn't find any reference to a failure of this test.

Revision Contents

Path

Size

llvm/

trunk/

test/

CodeGen/

ARM/

fp16-promote.ll

772 lines

Diff 24081

llvm/trunk/test/CodeGen/ARM/fp16-promote.ll

	; RUN: llc -asm-verbose=false < %s -mattr=+vfp3,+fp16 \| FileCheck %s -check-prefix=CHECK-FP16 -check-prefix=CHECK-ALL			; RUN: llc -asm-verbose=false < %s -mattr=+vfp3,+fp16 \| FileCheck %s -check-prefix=CHECK-FP16 -check-prefix=CHECK-ALL
	; RUN: llc -asm-verbose=false < %s \| FileCheck %s -check-prefix=CHECK-LIBCALL -check-prefix=CHECK-ALL			; RUN: llc -asm-verbose=false < %s \| FileCheck %s -check-prefix=CHECK-LIBCALL -check-prefix=CHECK-ALL

	target datalayout = "e-p:32:32:32-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-n32"			target datalayout = "e-p:32:32:32-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-n32"
	target triple = "armv7-eabihf"			target triple = "armv7-eabihf"

	; CHECK-FP16-LABEL: test_fadd:			; CHECK-FP16-LABEL: test_fadd:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r2, [r0]			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r1, [r1]			; CHECK-FP16: vadd.f32
	; CHECK-FP16-NEXT: vmov s0, r1			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: vmov s2, r2
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s2, s2
	; CHECK-FP16-NEXT: vadd.f32 s0, s2, s0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r1, s0
	; CHECK-FP16-NEXT: strh r1, [r0]
	; CHECK-FP16-NEXT: bx lr
	; CHECK-LIBCALL-LABEL: test_fadd:			; CHECK-LIBCALL-LABEL: test_fadd:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: vadd.f32			; CHECK-LIBCALL: vadd.f32
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_fadd(half* %p, half* %q) #0 {			define void @test_fadd(half* %p, half* %q) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%b = load half, half* %q, align 2			%b = load half, half* %q, align 2
	%r = fadd half %a, %b			%r = fadd half %a, %b
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_fsub:			; CHECK-FP16-LABEL: test_fsub:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r2, [r0]			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r1, [r1]			; CHECK-FP16: vsub.f32
	; CHECK-FP16-NEXT: vmov s0, r1			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: vmov s2, r2
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s2, s2
	; CHECK-FP16-NEXT: vsub.f32 s0, s2, s0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r1, s0
	; CHECK-FP16-NEXT: strh r1, [r0]
	; CHECK-FP16-NEXT: bx lr
	; CHECK-LIBCALL-LABEL: test_fsub:			; CHECK-LIBCALL-LABEL: test_fsub:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: vsub.f32			; CHECK-LIBCALL: vsub.f32
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_fsub(half* %p, half* %q) #0 {			define void @test_fsub(half* %p, half* %q) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%b = load half, half* %q, align 2			%b = load half, half* %q, align 2
	%r = fsub half %a, %b			%r = fsub half %a, %b
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_fmul:			; CHECK-FP16-LABEL: test_fmul:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r2, [r0]			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r1, [r1]			; CHECK-FP16: vmul.f32
	; CHECK-FP16-NEXT: vmov s0, r1			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: vmov s2, r2
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s2, s2
	; CHECK-FP16-NEXT: vmul.f32 s0, s2, s0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r1, s0
	; CHECK-FP16-NEXT: strh r1, [r0]
	; CHECK-FP16-NEXT: bx lr
	; CHECK-LIBCALL-LABEL: test_fmul			; CHECK-LIBCALL-LABEL: test_fmul
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: vmul.f32			; CHECK-LIBCALL: vmul.f32
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_fmul(half* %p, half* %q) #0 {			define void @test_fmul(half* %p, half* %q) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%b = load half, half* %q, align 2			%b = load half, half* %q, align 2
	%r = fmul half %a, %b			%r = fmul half %a, %b
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_fdiv:			; CHECK-FP16-LABEL: test_fdiv:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r2, [r0]			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r1, [r1]			; CHECK-FP16: vdiv.f32
	; CHECK-FP16-NEXT: vmov s0, r1			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: vmov s2, r2
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s2, s2
	; CHECK-FP16-NEXT: vdiv.f32 s0, s2, s0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r1, s0
	; CHECK-FP16-NEXT: strh r1, [r0]
	; CHECK-FP16-NEXT: bx lr
	; CHECK-LIBCALL-LABEL: test_fdiv			; CHECK-LIBCALL-LABEL: test_fdiv
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: vdiv.f32			; CHECK-LIBCALL: vdiv.f32
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_fdiv(half* %p, half* %q) #0 {			define void @test_fdiv(half* %p, half* %q) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%b = load half, half* %q, align 2			%b = load half, half* %q, align 2
	%r = fdiv half %a, %b			%r = fdiv half %a, %b
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_frem:			; CHECK-FP16-LABEL: test_frem:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: push {r4, lr}			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: mov r4, r0			; CHECK-FP16: bl fmodf
	; CHECK-FP16-NEXT: ldrh r0, [r1]			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: ldrh r1, [r4]
	; CHECK-FP16-NEXT: vmov s2, r0
	; CHECK-FP16-NEXT: vmov s0, r1
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s2, s2
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: vmov r1, s2
	; CHECK-FP16-NEXT: bl fmodf
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r4]
	; CHECK-FP16-NEXT: pop {r4, pc}
	; CHECK-LIBCALL-LABEL: test_frem			; CHECK-LIBCALL-LABEL: test_frem
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl fmodf			; CHECK-LIBCALL: bl fmodf
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_frem(half* %p, half* %q) #0 {			define void @test_frem(half* %p, half* %q) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%b = load half, half* %q, align 2			%b = load half, half* %q, align 2
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; CHECK-ALL-NEXT: b test_callee			; CHECK-ALL-NEXT: b test_callee
	define half @test_tailcall_flipped(half %a, half %b) #0 {			define half @test_tailcall_flipped(half %a, half %b) #0 {
	%r = tail call half @test_callee(half %b, half %a)			%r = tail call half @test_callee(half %b, half %a)
	ret half %r			ret half %r
	}			}

	; Optimizer picks %p or %q based on %c and only loads that value			; Optimizer picks %p or %q based on %c and only loads that value
	; No conversion is needed			; No conversion is needed
	; CHECK-BOTH-LABEL: test_select:			; CHECK-ALL-LABEL: test_select:
	; CHECK-BOTH-NEXT: .fnstart			; CHECK-ALL-NEXT: .fnstart
	; CHECK-BOTH-NEXT: cmp r2, #0			; CHECK-ALL-NEXT: cmp r2, #0
	; CHECK-BOTH-NEXT: movne r1, r0			; CHECK-ALL-NEXT: movne r1, r0
	; CHECK-BOTH-NEXT: ldrh r1, [r1]			; CHECK-ALL-NEXT: ldrh r1, [r1]
	; CHECK-BOTH-NEXT: strh r1, [r0]			; CHECK-ALL-NEXT: strh r1, [r0]
	; CHECK-BOTH-NEXT: bx lr			; CHECK-ALL-NEXT: bx lr
	define void @test_select(half* %p, half* %q, i1 zeroext %c) #0 {			define void @test_select(half* %p, half* %q, i1 zeroext %c) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%b = load half, half* %q, align 2			%b = load half, half* %q, align 2
	%r = select i1 %c, half %a, half %b			%r = select i1 %c, half %a, half %b
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; Test only two variants of fcmp. These get translated to f32 vcmpe			; Test only two variants of fcmp. These get translated to f32 vcmpe
	; instructions anyway.			; instructions anyway.
	; CHECK-FP16-LABEL: test_fcmp_une:			; CHECK-FP16-LABEL: test_fcmp_une:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r2, [r0]			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r0, [r1]			; CHECK-FP16: vcmpe.f32
	; CHECK-FP16-NEXT: vmov s0, r0			; CHECK-FP16: vmrs APSR_nzcv, fpscr
	; CHECK-FP16-NEXT: vmov s2, r2			; CHECK-FP16: movwne
	; CHECK-FP16-NEXT: mov r0, #0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s2, s2
	; CHECK-FP16-NEXT: vcmpe.f32 s2, s0
	; CHECK-FP16-NEXT: vmrs APSR_nzcv, fpscr
	; CHECK-FP16-NEXT: movwne r0, #1
	; CHECK-FP16-NEXT: bx lr
	; CHECK-LIBCALL-LABEL: test_fcmp_une:			; CHECK-LIBCALL-LABEL: test_fcmp_une:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: vcmpe.f32			; CHECK-LIBCALL: vcmpe.f32
	; CHECK-LIBCALL: movwne			; CHECK-LIBCALL: movwne
	define i1 @test_fcmp_une(half* %p, half* %q) #0 {			define i1 @test_fcmp_une(half* %p, half* %q) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%b = load half, half* %q, align 2			%b = load half, half* %q, align 2
	%r = fcmp une half %a, %b			%r = fcmp une half %a, %b
	ret i1 %r			ret i1 %r
	}			}

	; CHECK-FP16-LABEL: test_fcmp_ueq:			; CHECK-FP16-LABEL: test_fcmp_ueq:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r2, [r0]			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r0, [r1]			; CHECK-FP16: vcmpe.f32
	; CHECK-FP16-NEXT: vmov s0, r0			; CHECK-FP16: vmrs APSR_nzcv, fpscr
	; CHECK-FP16-NEXT: vmov s2, r2			; CHECK-FP16: movweq
	; CHECK-FP16-NEXT: mov r0, #0			; CHECK-FP16: movwvs
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s2, s2
	; CHECK-FP16-NEXT: vcmpe.f32 s2, s0
	; CHECK-FP16-NEXT: vmrs APSR_nzcv, fpscr
	; CHECK-FP16-NEXT: movweq r0, #1
	; CHECK-FP16-NEXT: movwvs r0, #1
	; CHECK-FP16-NEXT: bx lr
	; CHECK-LIBCALL-LABEL: test_fcmp_ueq:			; CHECK-LIBCALL-LABEL: test_fcmp_ueq:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: vcmpe.f32			; CHECK-LIBCALL: vcmpe.f32
	; CHECK-LIBCALL: movweq			; CHECK-LIBCALL: movweq
	define i1 @test_fcmp_ueq(half* %p, half* %q) #0 {			define i1 @test_fcmp_ueq(half* %p, half* %q) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%b = load half, half* %q, align 2			%b = load half, half* %q, align 2
	%r = fcmp ueq half %a, %b			%r = fcmp ueq half %a, %b
	ret i1 %r			ret i1 %r
	}			}

	; CHECK-FP16-LABEL: test_br_cc:			; CHECK-FP16-LABEL: test_br_cc:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r0, [r0]			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r1, [r1]			; CHECK-FP16: vcmpe.f32
	; CHECK-FP16-NEXT: vmov s0, r1			; CHECK-FP16: vmrs APSR_nzcv, fpscr
	; CHECK-FP16-NEXT: vmov s2, r0			; CHECK-FP16: strmi
	; CHECK-FP16-NEXT: mov r0, #0			; CHECK-FP16: strpl
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s2, s2
	; CHECK-FP16-NEXT: vcmpe.f32 s2, s0
	; CHECK-FP16-NEXT: vmrs APSR_nzcv, fpscr
	; CHECK-FP16-NEXT: strmi r0, [r3]
	; CHECK-FP16-NEXT: strpl r0, [r2]
	; CHECK-FP16-NEXT: bx lr
	; CHECK-LIBCALL-LABEL: test_br_cc:			; CHECK-LIBCALL-LABEL: test_br_cc:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: vcmpe.f32			; CHECK-LIBCALL: vcmpe.f32
	; CHECK-LIBCALL: strmi			; CHECK-LIBCALL: strmi
	; CHECK-LIBCALL: strpl			; CHECK-LIBCALL: strpl
	define void @test_br_cc(half* %p, half* %q, i32* %p1, i32* %p2) #0 {			define void @test_br_cc(half* %p, half* %q, i32* %p1, i32* %p2) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%b = load half, half* %q, align 2			%b = load half, half* %q, align 2
	%c = fcmp uge half %a, %b			%c = fcmp uge half %a, %b
	br i1 %c, label %then, label %else			br i1 %c, label %then, label %else
	then:			then:
	store i32 0, i32* %p1			store i32 0, i32* %p1
	ret void			ret void
	else:			else:
	store i32 0, i32* %p2			store i32 0, i32* %p2
	ret void			ret void
	}			}

	declare i1 @test_dummy(half* %p) #0			declare i1 @test_dummy(half* %p) #0
	; CHECK-FP16-LABEL: test_phi:			; CHECK-FP16-LABEL: test_phi:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: push {r4, lr}			; CHECK-FP16: [[LOOP:.LBB[1-9_]+]]:
	; CHECK-FP16-NEXT: vpush {d8, d9}			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: mov r4, r0			; CHECK-FP16: bl test_dummy
	; CHECK-FP16-NEXT: ldrh r0, [r4]			; CHECK-FP16: bne [[LOOP]]
	; CHECK-FP16-NEXT: vmov s0, r0			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s18, s0
	; CHECK-FP16-NEXT: [[LOOP:.LBB[1-9_]+]]:
	; CHECK-FP16-NEXT: ldrh r0, [r4]
	; CHECK-FP16-NEXT: vmov.f32 s16, s18
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: mov r0, r4
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s18, s0
	; CHECK-FP16-NEXT: bl test_dummy
	; CHECK-FP16-NEXT: tst r0, #1
	; CHECK-FP16-NEXT: bne [[LOOP]]
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s16
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r4]
	; CHECK-LIBCALL-LABEL: test_phi:			; CHECK-LIBCALL-LABEL: test_phi:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: [[LOOP:.LBB[1-9_]+]]:			; CHECK-LIBCALL: [[LOOP:.LBB[1-9_]+]]:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl test_dummy			; CHECK-LIBCALL: bl test_dummy
				; CHECK-LIBCALL: bne [[LOOP]]
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_phi(half* %p) #0 {			define void @test_phi(half* %p) #0 {
	entry:			entry:
	%a = load half, half* %p			%a = load half, half* %p
	br label %loop			br label %loop
	loop:			loop:
	%r = phi half [%a, %entry], [%b, %loop]			%r = phi half [%a, %entry], [%b, %loop]
	%b = load half, half* %p			%b = load half, half* %p
	%c = call i1 @test_dummy(half* %p)			%c = call i1 @test_dummy(half* %p)
	br i1 %c, label %loop, label %return			br i1 %c, label %loop, label %return
	return:			return:
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_fptosi_i32:			; CHECK-FP16-LABEL: test_fptosi_i32:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r0, [r0]			; CHECK-FP16: vcvt.s32.f32
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vcvt.s32.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: bx
	; CHECK-LIBCALL-LABEL: test_fptosi_i32:			; CHECK-LIBCALL-LABEL: test_fptosi_i32:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: vcvt.s32.f32			; CHECK-LIBCALL: vcvt.s32.f32
	define i32 @test_fptosi_i32(half* %p) #0 {			define i32 @test_fptosi_i32(half* %p) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%r = fptosi half %a to i32			%r = fptosi half %a to i32
	ret i32 %r			ret i32 %r
	}			}

	; CHECK-FP16-LABEL: test_fptosi_i64:			; CHECK-FP16-LABEL: test_fptosi_i64:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: push {r11, lr}			; CHECK-FP16: bl __aeabi_f2lz
	; CHECK-FP16-NEXT: ldrh r0, [r0]
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: __aeabi_f2lz
	; CHECK-FP16-NEXT: pop {r11, pc}
	; CHECK-LIBCALL-LABEL: test_fptosi_i64:			; CHECK-LIBCALL-LABEL: test_fptosi_i64:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl __aeabi_f2lz			; CHECK-LIBCALL: bl __aeabi_f2lz
	define i64 @test_fptosi_i64(half* %p) #0 {			define i64 @test_fptosi_i64(half* %p) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%r = fptosi half %a to i64			%r = fptosi half %a to i64
	ret i64 %r			ret i64 %r
	}			}

	; CHECK-FP16-LABEL: test_fptoui_i32:			; CHECK-FP16-LABEL: test_fptoui_i32:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r0, [r0]			; CHECK-FP16: vcvt.u32.f32
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vcvt.u32.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: bx
	; CHECK-LIBCALL-LABEL: test_fptoui_i32:			; CHECK-LIBCALL-LABEL: test_fptoui_i32:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: vcvt.u32.f32			; CHECK-LIBCALL: vcvt.u32.f32
	define i32 @test_fptoui_i32(half* %p) #0 {			define i32 @test_fptoui_i32(half* %p) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%r = fptoui half %a to i32			%r = fptoui half %a to i32
	ret i32 %r			ret i32 %r
	}			}

	; CHECK-FP16-LABEL: test_fptoui_i64:			; CHECK-FP16-LABEL: test_fptoui_i64:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: push {r11, lr}			; CHECK-FP16: bl __aeabi_f2ulz
	; CHECK-FP16-NEXT: ldrh r0, [r0]
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: __aeabi_f2ulz
	; CHECK-FP16-NEXT: pop {r11, pc}
	; CHECK-LIBCALL-LABEL: test_fptoui_i64:			; CHECK-LIBCALL-LABEL: test_fptoui_i64:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl __aeabi_f2ulz			; CHECK-LIBCALL: bl __aeabi_f2ulz
	define i64 @test_fptoui_i64(half* %p) #0 {			define i64 @test_fptoui_i64(half* %p) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%r = fptoui half %a to i64			%r = fptoui half %a to i64
	ret i64 %r			ret i64 %r
	}			}

	; CHECK-FP16-LABEL: test_sitofp_i32:			; CHECK-FP16-LABEL: test_sitofp_i32:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvt.f32.s32
	; CHECK-FP16-NEXT: vmov s0, r0			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: vcvt.f32.s32 s0, s0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r1]
	; CHECK-FP16-NEXT: bx
	; CHECK-LIBCALL-LABEL: test_sitofp_i32:			; CHECK-LIBCALL-LABEL: test_sitofp_i32:
	; CHECK-LIBCALL: vcvt.f32.s32			; CHECK-LIBCALL: vcvt.f32.s32
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_sitofp_i32(i32 %a, half* %p) #0 {			define void @test_sitofp_i32(i32 %a, half* %p) #0 {
	%r = sitofp i32 %a to half			%r = sitofp i32 %a to half
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_uitofp_i32:			; CHECK-FP16-LABEL: test_uitofp_i32:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvt.f32.u32
	; CHECK-FP16-NEXT: vmov s0, r0			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: vcvt.f32.u32 s0, s0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r1]
	; CHECK-FP16-NEXT: bx
	; CHECK-LIBCALL-LABEL: test_uitofp_i32:			; CHECK-LIBCALL-LABEL: test_uitofp_i32:
	; CHECK-LIBCALL: vcvt.f32.u32			; CHECK-LIBCALL: vcvt.f32.u32
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_uitofp_i32(i32 %a, half* %p) #0 {			define void @test_uitofp_i32(i32 %a, half* %p) #0 {
	%r = uitofp i32 %a to half			%r = uitofp i32 %a to half
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_sitofp_i64:			; CHECK-FP16-LABEL: test_sitofp_i64:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: bl __aeabi_l2f
	; CHECK-FP16-NEXT: push {r4, lr}			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: mov r4, r2
	; CHECK-FP16-NEXT: bl __aeabi_l2f
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r4]
	; CHECK-FP16-NEXT: pop {r4, pc}
	; CHECK-LIBCALL-LABEL: test_sitofp_i64:			; CHECK-LIBCALL-LABEL: test_sitofp_i64:
	; CHECK-LIBCALL: bl __aeabi_l2f			; CHECK-LIBCALL: bl __aeabi_l2f
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_sitofp_i64(i64 %a, half* %p) #0 {			define void @test_sitofp_i64(i64 %a, half* %p) #0 {
	%r = sitofp i64 %a to half			%r = sitofp i64 %a to half
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_uitofp_i64:			; CHECK-FP16-LABEL: test_uitofp_i64:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: bl __aeabi_ul2f
	; CHECK-FP16-NEXT: push {r4, lr}			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: mov r4, r2
	; CHECK-FP16-NEXT: bl __aeabi_ul2f
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r4]
	; CHECK-FP16-NEXT: pop {r4, pc}
	; CHECK-LIBCALL-LABEL: test_uitofp_i64:			; CHECK-LIBCALL-LABEL: test_uitofp_i64:
	; CHECK-LIBCALL: bl __aeabi_ul2f			; CHECK-LIBCALL: bl __aeabi_ul2f
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_uitofp_i64(i64 %a, half* %p) #0 {			define void @test_uitofp_i64(i64 %a, half* %p) #0 {
	%r = uitofp i64 %a to half			%r = uitofp i64 %a to half
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_fptrunc_float:			; CHECK-FP16-LABEL: test_fptrunc_float:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r1]
	; CHECK-FP16-NEXT: bx
	; CHECK-LIBCALL-LABEL: test_fptrunc_float:			; CHECK-LIBCALL-LABEL: test_fptrunc_float:
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_fptrunc_float(float %f, half* %p) #0 {			define void @test_fptrunc_float(float %f, half* %p) #0 {
	%a = fptrunc float %f to half			%a = fptrunc float %f to half
	store half %a, half* %p			store half %a, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_fptrunc_double:			; CHECK-FP16-LABEL: test_fptrunc_double:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: bl __aeabi_d2h
	; CHECK-FP16-NEXT: push {r4, lr}
	; CHECK-FP16-NEXT: mov r4, r2
	; CHECK-FP16-NEXT: bl __aeabi_d2h
	; CHECK-FP16-NEXT: strh r0, [r4]
	; CHECK-FP16-NEXT: pop {r4, pc}
	; CHECK-LIBCALL-LABEL: test_fptrunc_double:			; CHECK-LIBCALL-LABEL: test_fptrunc_double:
	; CHECK-LIBCALL: bl __aeabi_d2h			; CHECK-LIBCALL: bl __aeabi_d2h
	define void @test_fptrunc_double(double %d, half* %p) #0 {			define void @test_fptrunc_double(double %d, half* %p) #0 {
	%a = fptrunc double %d to half			%a = fptrunc double %d to half
	store half %a, half* %p			store half %a, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_fpextend_float:			; CHECK-FP16-LABEL: test_fpextend_float:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r0, [r0]
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: bx lr
	; CHECK-LIBCALL-LABEL: test_fpextend_float:			; CHECK-LIBCALL-LABEL: test_fpextend_float:
	; CHECK-LIBCALL: b __gnu_h2f_ieee			; CHECK-LIBCALL: b __gnu_h2f_ieee
	define float @test_fpextend_float(half* %p) {			define float @test_fpextend_float(half* %p) {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%r = fpext half %a to float			%r = fpext half %a to float
	ret float %r			ret float %r
	}			}

	; CHECK-FP16-LABEL: test_fpextend_double:			; CHECK-FP16-LABEL: test_fpextend_double:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r0, [r0]			; CHECK-FP16: vcvt.f64.f32
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vcvt.f64.f32 d16, s0
	; CHECK-FP16-NEXT: vmov r0, r1, d16
	; CHECK-FP16-NEXT: bx lr
	; CHECK-LIBCALL-LABEL: test_fpextend_double:			; CHECK-LIBCALL-LABEL: test_fpextend_double:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: vcvt.f64.f32			; CHECK-LIBCALL: vcvt.f64.f32
	define double @test_fpextend_double(half* %p) {			define double @test_fpextend_double(half* %p) {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%r = fpext half %a to double			%r = fpext half %a to double
	ret double %r			ret double %r
	}			}

	; CHECK-BOTH-LABEL: test_bitcast_halftoi16:			; CHECK-ALL-LABEL: test_bitcast_halftoi16:
	; CHECK-BOTH-NEXT: .fnstart			; CHECK-ALL-NEXT: .fnstart
	; CHECK-BOTH-NEXT: ldrh r0, [r0]			; CHECK-ALL-NEXT: ldrh r0, [r0]
	; CHECK-BOTH-NEXT: bx lr			; CHECK-ALL-NEXT: bx lr
	define i16 @test_bitcast_halftoi16(half* %p) #0 {			define i16 @test_bitcast_halftoi16(half* %p) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%r = bitcast half %a to i16			%r = bitcast half %a to i16
	ret i16 %r			ret i16 %r
	}			}

	; CHECK-BOTH-LABEL: test_bitcast_i16tohalf:			; CHECK-ALL-LABEL: test_bitcast_i16tohalf:
	; CHECK-BOTH-NEXT: .fnstart			; CHECK-ALL-NEXT: .fnstart
	; CHECK-BOTH-NEXT: strh r0, [r1]			; CHECK-ALL-NEXT: strh r0, [r1]
	; CHECK-BOTH-NEXT: bx lr			; CHECK-ALL-NEXT: bx lr
	define void @test_bitcast_i16tohalf(i16 %a, half* %p) #0 {			define void @test_bitcast_i16tohalf(i16 %a, half* %p) #0 {
	%r = bitcast i16 %a to half			%r = bitcast i16 %a to half
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	declare half @llvm.sqrt.f16(half %a) #0			declare half @llvm.sqrt.f16(half %a) #0
	declare half @llvm.powi.f16(half %a, i32 %b) #0			declare half @llvm.powi.f16(half %a, i32 %b) #0
	Show All 14 Lines
	declare half @llvm.ceil.f16(half %a) #0			declare half @llvm.ceil.f16(half %a) #0
	declare half @llvm.trunc.f16(half %a) #0			declare half @llvm.trunc.f16(half %a) #0
	declare half @llvm.rint.f16(half %a) #0			declare half @llvm.rint.f16(half %a) #0
	declare half @llvm.nearbyint.f16(half %a) #0			declare half @llvm.nearbyint.f16(half %a) #0
	declare half @llvm.round.f16(half %a) #0			declare half @llvm.round.f16(half %a) #0
	declare half @llvm.fmuladd.f16(half %a, half %b, half %c) #0			declare half @llvm.fmuladd.f16(half %a, half %b, half %c) #0

	; CHECK-FP16-LABEL: test_sqrt:			; CHECK-FP16-LABEL: test_sqrt:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r1, [r0]			; CHECK-FP16: vsqrt.f32
	; CHECK-FP16-NEXT: vmov s0, r1			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vsqrt.f32 s0, s0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r1, s0
	; CHECK-FP16-NEXT: strh r1, [r0]
	; CHECK-FP16-NEXT: bx lr
	; CHECK-LIBCALL-LABEL: test_sqrt:			; CHECK-LIBCALL-LABEL: test_sqrt:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: vsqrt.f32			; CHECK-LIBCALL: vsqrt.f32
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_sqrt(half* %p) #0 {			define void @test_sqrt(half* %p) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%r = call half @llvm.sqrt.f16(half %a)			%r = call half @llvm.sqrt.f16(half %a)
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_fpowi:			; CHECK-FP16-LABEL: test_fpowi:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: push {r4, lr}			; CHECK-FP16: bl __powisf2
	; CHECK-FP16-NEXT: mov r4, r0			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: ldrh r0, [r4]
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: bl __powisf2
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r4]
	; CHECK-FP16-NEXT: pop {r4, pc}
	; CHECK-LIBCALL-LABEL: test_fpowi:			; CHECK-LIBCALL-LABEL: test_fpowi:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl __powisf2			; CHECK-LIBCALL: bl __powisf2
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_fpowi(half* %p, i32 %b) #0 {			define void @test_fpowi(half* %p, i32 %b) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%r = call half @llvm.powi.f16(half %a, i32 %b)			%r = call half @llvm.powi.f16(half %a, i32 %b)
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_sin:			; CHECK-FP16-LABEL: test_sin:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: push {r4, lr}			; CHECK-FP16: bl sinf
	; CHECK-FP16-NEXT: mov r4, r0			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: ldrh r0, [r4]
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: bl sinf
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r4]
	; CHECK-FP16-NEXT: pop {r4, pc}
	; CHECK-LIBCALL-LABEL: test_sin:			; CHECK-LIBCALL-LABEL: test_sin:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl sinf			; CHECK-LIBCALL: bl sinf
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_sin(half* %p) #0 {			define void @test_sin(half* %p) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%r = call half @llvm.sin.f16(half %a)			%r = call half @llvm.sin.f16(half %a)
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_cos:			; CHECK-FP16-LABEL: test_cos:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: push {r4, lr}			; CHECK-FP16: bl cosf
	; CHECK-FP16-NEXT: mov r4, r0			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: ldrh r0, [r4]
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: bl cosf
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r4]
	; CHECK-FP16-NEXT: pop {r4, pc}
	; CHECK-LIBCALL-LABEL: test_cos:			; CHECK-LIBCALL-LABEL: test_cos:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl cosf			; CHECK-LIBCALL: bl cosf
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_cos(half* %p) #0 {			define void @test_cos(half* %p) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%r = call half @llvm.cos.f16(half %a)			%r = call half @llvm.cos.f16(half %a)
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_pow:			; CHECK-FP16-LABEL: test_pow:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: push {r4, lr}			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: mov r4, r0			; CHECK-FP16: bl powf
	; CHECK-FP16-NEXT: ldrh r0, [r1]			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: ldrh r1, [r4]
	; CHECK-FP16-NEXT: vmov s2, r0
	; CHECK-FP16-NEXT: vmov s0, r1
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s2, s2
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: vmov r1, s2
	; CHECK-FP16-NEXT: bl powf
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r4]
	; CHECK-FP16-NEXT: pop {r4, pc}
	; CHECK-LIBCALL-LABEL: test_pow:			; CHECK-LIBCALL-LABEL: test_pow:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl powf			; CHECK-LIBCALL: bl powf
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_pow(half* %p, half* %q) #0 {			define void @test_pow(half* %p, half* %q) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%b = load half, half* %q, align 2			%b = load half, half* %q, align 2
	%r = call half @llvm.pow.f16(half %a, half %b)			%r = call half @llvm.pow.f16(half %a, half %b)
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_exp:			; CHECK-FP16-LABEL: test_exp:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: push {r4, lr}			; CHECK-FP16: bl expf
	; CHECK-FP16-NEXT: mov r4, r0			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: ldrh r0, [r4]
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: bl expf
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r4]
	; CHECK-FP16-NEXT: pop {r4, pc}
	; CHECK-LIBCALL-LABEL: test_exp:			; CHECK-LIBCALL-LABEL: test_exp:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl expf			; CHECK-LIBCALL: bl expf
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_exp(half* %p) #0 {			define void @test_exp(half* %p) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%r = call half @llvm.exp.f16(half %a)			%r = call half @llvm.exp.f16(half %a)
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_exp2:			; CHECK-FP16-LABEL: test_exp2:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: push {r4, lr}			; CHECK-FP16: bl exp2f
	; CHECK-FP16-NEXT: mov r4, r0			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: ldrh r0, [r4]
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: bl exp2f
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r4]
	; CHECK-FP16-NEXT: pop {r4, pc}
	; CHECK-LIBCALL-LABEL: test_exp2:			; CHECK-LIBCALL-LABEL: test_exp2:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl exp2f			; CHECK-LIBCALL: bl exp2f
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_exp2(half* %p) #0 {			define void @test_exp2(half* %p) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%r = call half @llvm.exp2.f16(half %a)			%r = call half @llvm.exp2.f16(half %a)
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_log:			; CHECK-FP16-LABEL: test_log:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: push {r4, lr}			; CHECK-FP16: bl logf
	; CHECK-FP16-NEXT: mov r4, r0			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: ldrh r0, [r4]
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: bl logf
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r4]
	; CHECK-FP16-NEXT: pop {r4, pc}
	; CHECK-LIBCALL-LABEL: test_log:			; CHECK-LIBCALL-LABEL: test_log:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl logf			; CHECK-LIBCALL: bl logf
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_log(half* %p) #0 {			define void @test_log(half* %p) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%r = call half @llvm.log.f16(half %a)			%r = call half @llvm.log.f16(half %a)
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_log10:			; CHECK-FP16-LABEL: test_log10:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: push {r4, lr}			; CHECK-FP16: bl log10f
	; CHECK-FP16-NEXT: mov r4, r0			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: ldrh r0, [r4]
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: bl log10f
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r4]
	; CHECK-FP16-NEXT: pop {r4, pc}
	; CHECK-LIBCALL-LABEL: test_log10:			; CHECK-LIBCALL-LABEL: test_log10:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl log10f			; CHECK-LIBCALL: bl log10f
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_log10(half* %p) #0 {			define void @test_log10(half* %p) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%r = call half @llvm.log10.f16(half %a)			%r = call half @llvm.log10.f16(half %a)
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_log2:			; CHECK-FP16-LABEL: test_log2:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: push {r4, lr}			; CHECK-FP16: bl log2f
	; CHECK-FP16-NEXT: mov r4, r0			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: ldrh r0, [r4]
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: bl log2f
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r4]
	; CHECK-FP16-NEXT: pop {r4, pc}
	; CHECK-LIBCALL-LABEL: test_log2:			; CHECK-LIBCALL-LABEL: test_log2:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl log2f			; CHECK-LIBCALL: bl log2f
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_log2(half* %p) #0 {			define void @test_log2(half* %p) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%r = call half @llvm.log2.f16(half %a)			%r = call half @llvm.log2.f16(half %a)
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_fma:			; CHECK-FP16-LABEL: test_fma:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: push {r4, lr}			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: mov r4, r0			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r0, [r2]			; CHECK-FP16: bl fmaf
	; CHECK-FP16-NEXT: ldrh r1, [r1]			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: ldrh r2, [r4]
	; CHECK-FP16-NEXT: vmov s2, r1
	; CHECK-FP16-NEXT: vmov s4, r0
	; CHECK-FP16-NEXT: vmov s0, r2
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s2, s2
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s4, s4
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: vmov r1, s2
	; CHECK-FP16-NEXT: vmov r2, s4
	; CHECK-FP16-NEXT: bl fmaf
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r4]
	; CHECK-FP16-NEXT: pop {r4, pc}
	; CHECK-LIBCALL-LABEL: test_fma:			; CHECK-LIBCALL-LABEL: test_fma:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl fmaf			; CHECK-LIBCALL: bl fmaf
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_fma(half* %p, half* %q, half* %r) #0 {			define void @test_fma(half* %p, half* %q, half* %r) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%b = load half, half* %q, align 2			%b = load half, half* %q, align 2
	%c = load half, half* %r, align 2			%c = load half, half* %r, align 2
	%v = call half @llvm.fma.f16(half %a, half %b, half %c)			%v = call half @llvm.fma.f16(half %a, half %b, half %c)
	store half %v, half* %p			store half %v, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_fabs:			; CHECK-FP16-LABEL: test_fabs:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r1, [r0]			; CHECK-FP16: vabs.f32
	; CHECK-FP16-NEXT: vmov s0, r1			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vabs.f32 s0, s0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r1, s0
	; CHECK-FP16-NEXT: strh r1, [r0]
	; CHECK-FP16-NEXT: bx lr
	; CHECK-LIBCALL-LABEL: test_fabs:			; CHECK-LIBCALL-LABEL: test_fabs:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bfc			; CHECK-LIBCALL: bfc
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_fabs(half* %p) {			define void @test_fabs(half* %p) {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%r = call half @llvm.fabs.f16(half %a)			%r = call half @llvm.fabs.f16(half %a)
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_minnum:			; CHECK-FP16-LABEL: test_minnum:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: push {r4, lr}			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: mov r4, r0			; CHECK-FP16: bl fminf
	; CHECK-FP16-NEXT: ldrh r0, [r1]			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: ldrh r1, [r4]
	; CHECK-FP16-NEXT: vmov s2, r0
	; CHECK-FP16-NEXT: vmov s0, r1
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s2, s2
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: vmov r1, s2
	; CHECK-FP16-NEXT: bl fminf
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r4]
	; CHECK-FP16-NEXT: pop {r4, pc}
	; CHECK-LIBCALL-LABEL: test_minnum:			; CHECK-LIBCALL-LABEL: test_minnum:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl fminf			; CHECK-LIBCALL: bl fminf
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_minnum(half* %p, half* %q) #0 {			define void @test_minnum(half* %p, half* %q) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%b = load half, half* %q, align 2			%b = load half, half* %q, align 2
	%r = call half @llvm.minnum.f16(half %a, half %b)			%r = call half @llvm.minnum.f16(half %a, half %b)
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_maxnum:			; CHECK-FP16-LABEL: test_maxnum:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: push {r4, lr}			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: mov r4, r0			; CHECK-FP16: bl fmaxf
	; CHECK-FP16-NEXT: ldrh r0, [r1]			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: ldrh r1, [r4]
	; CHECK-FP16-NEXT: vmov s2, r0
	; CHECK-FP16-NEXT: vmov s0, r1
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s2, s2
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: vmov r1, s2
	; CHECK-FP16-NEXT: bl fmaxf
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r4]
	; CHECK-FP16-NEXT: pop {r4, pc}
	; CHECK-LIBCALL-LABEL: test_maxnum:			; CHECK-LIBCALL-LABEL: test_maxnum:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl fmaxf			; CHECK-LIBCALL: bl fmaxf
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_maxnum(half* %p, half* %q) #0 {			define void @test_maxnum(half* %p, half* %q) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%b = load half, half* %q, align 2			%b = load half, half* %q, align 2
	%r = call half @llvm.maxnum.f16(half %a, half %b)			%r = call half @llvm.maxnum.f16(half %a, half %b)
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_copysign:			; CHECK-FP16-LABEL: test_copysign:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r1, [r1]			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r2, [r0]			; CHECK-FP16: vbsl
	; CHECK-FP16-NEXT: vmov.i32 d2, #0x80000000			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: vmov s0, r2
	; CHECK-FP16-NEXT: vmov s2, r1
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s2, s2
	; CHECK-FP16-NEXT: vbsl d2, d1, d0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s4
	; CHECK-FP16-NEXT: vmov r1, s0
	; CHECK-FP16-NEXT: strh r1, [r0]
	; CHECK-FP16-NEXT: bx lr
	; CHECK-LIBCALL-LABEL: test_copysign:			; CHECK-LIBCALL-LABEL: test_copysign:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: vbsl			; CHECK-LIBCALL: vbsl
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_copysign(half* %p, half* %q) #0 {			define void @test_copysign(half* %p, half* %q) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%b = load half, half* %q, align 2			%b = load half, half* %q, align 2
	%r = call half @llvm.copysign.f16(half %a, half %b)			%r = call half @llvm.copysign.f16(half %a, half %b)
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_floor:			; CHECK-FP16-LABEL: test_floor:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: push {r4, lr}			; CHECK-FP16: bl floorf
	; CHECK-FP16-NEXT: mov r4, r0			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: ldrh r0, [r4]
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: bl floorf
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r4]
	; CHECK-FP16-NEXT: pop {r4, pc}
	; CHECK-LIBCALL-LABEL: test_floor:			; CHECK-LIBCALL-LABEL: test_floor:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl floorf			; CHECK-LIBCALL: bl floorf
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_floor(half* %p) {			define void @test_floor(half* %p) {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%r = call half @llvm.floor.f16(half %a)			%r = call half @llvm.floor.f16(half %a)
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_ceil:			; CHECK-FP16-LABEL: test_ceil:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: push {r4, lr}			; CHECK-FP16: bl ceilf
	; CHECK-FP16-NEXT: mov r4, r0			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: ldrh r0, [r4]
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: bl ceilf
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r4]
	; CHECK-FP16-NEXT: pop {r4, pc}
	; CHECK-LIBCALL-LABEL: test_ceil:			; CHECK-LIBCALL-LABEL: test_ceil:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl ceilf			; CHECK-LIBCALL: bl ceilf
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_ceil(half* %p) {			define void @test_ceil(half* %p) {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%r = call half @llvm.ceil.f16(half %a)			%r = call half @llvm.ceil.f16(half %a)
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_trunc:			; CHECK-FP16-LABEL: test_trunc:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: push {r4, lr}			; CHECK-FP16: bl truncf
	; CHECK-FP16-NEXT: mov r4, r0			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: ldrh r0, [r4]
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: bl truncf
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r4]
	; CHECK-FP16-NEXT: pop {r4, pc}
	; CHECK-LIBCALL-LABEL: test_trunc:			; CHECK-LIBCALL-LABEL: test_trunc:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl truncf			; CHECK-LIBCALL: bl truncf
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_trunc(half* %p) {			define void @test_trunc(half* %p) {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%r = call half @llvm.trunc.f16(half %a)			%r = call half @llvm.trunc.f16(half %a)
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_rint:			; CHECK-FP16-LABEL: test_rint:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: push {r4, lr}			; CHECK-FP16: bl rintf
	; CHECK-FP16-NEXT: mov r4, r0			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: ldrh r0, [r4]
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: bl rintf
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r4]
	; CHECK-FP16-NEXT: pop {r4, pc}
	; CHECK-LIBCALL-LABEL: test_rint:			; CHECK-LIBCALL-LABEL: test_rint:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl rintf			; CHECK-LIBCALL: bl rintf
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_rint(half* %p) {			define void @test_rint(half* %p) {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%r = call half @llvm.rint.f16(half %a)			%r = call half @llvm.rint.f16(half %a)
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_nearbyint:			; CHECK-FP16-LABEL: test_nearbyint:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: push {r4, lr}			; CHECK-FP16: bl nearbyintf
	; CHECK-FP16-NEXT: mov r4, r0			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: ldrh r0, [r4]
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: bl nearbyintf
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r4]
	; CHECK-FP16-NEXT: pop {r4, pc}
	; CHECK-LIBCALL-LABEL: test_nearbyint:			; CHECK-LIBCALL-LABEL: test_nearbyint:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl nearbyintf			; CHECK-LIBCALL: bl nearbyintf
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_nearbyint(half* %p) {			define void @test_nearbyint(half* %p) {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%r = call half @llvm.nearbyint.f16(half %a)			%r = call half @llvm.nearbyint.f16(half %a)
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_round:			; CHECK-FP16-LABEL: test_round:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: push {r4, lr}			; CHECK-FP16: bl roundf
	; CHECK-FP16-NEXT: mov r4, r0			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: ldrh r0, [r4]
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: bl roundf
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s0
	; CHECK-FP16-NEXT: vmov r0, s0
	; CHECK-FP16-NEXT: strh r0, [r4]
	; CHECK-FP16-NEXT: pop {r4, pc}
	; CHECK-LIBCALL-LABEL: test_round:			; CHECK-LIBCALL-LABEL: test_round:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl roundf			; CHECK-LIBCALL: bl roundf
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_round(half* %p) {			define void @test_round(half* %p) {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%r = call half @llvm.round.f16(half %a)			%r = call half @llvm.round.f16(half %a)
	store half %r, half* %p			store half %r, half* %p
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_fmuladd:			; CHECK-FP16-LABEL: test_fmuladd:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r2, [r2]			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r3, [r0]			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldrh r1, [r1]			; CHECK-FP16: vmla.f32
	; CHECK-FP16-NEXT: vmov s0, r1			; CHECK-FP16: vcvtb.f16.f32
	; CHECK-FP16-NEXT: vmov s2, r3
	; CHECK-FP16-NEXT: vmov s4, r2
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s2, s2
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s4, s4
	; CHECK-FP16-NEXT: vmla.f32 s4, s2, s0
	; CHECK-FP16-NEXT: vcvtb.f16.f32 s0, s4
	; CHECK-FP16-NEXT: vmov r1, s0
	; CHECK-FP16-NEXT: strh r1, [r0]
	; CHECK-FP16-NEXT: bx lr
	; CHECK-LIBCALL-LABEL: test_fmuladd:			; CHECK-LIBCALL-LABEL: test_fmuladd:
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: bl __gnu_h2f_ieee			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL: vmla.f32			; CHECK-LIBCALL: vmla.f32
	; CHECK-LIBCALL: bl __gnu_f2h_ieee			; CHECK-LIBCALL: bl __gnu_f2h_ieee
	define void @test_fmuladd(half* %p, half* %q, half* %r) #0 {			define void @test_fmuladd(half* %p, half* %q, half* %r) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%b = load half, half* %q, align 2			%b = load half, half* %q, align 2
	%c = load half, half* %r, align 2			%c = load half, half* %r, align 2
	%v = call half @llvm.fmuladd.f16(half %a, half %b, half %c)			%v = call half @llvm.fmuladd.f16(half %a, half %b, half %c)
	store half %v, half* %p			store half %v, half* %p
	ret void			ret void
	}			}

	; f16 vectors are not legal in the backend. Vector elements are not assigned			; f16 vectors are not legal in the backend. Vector elements are not assigned
	; to the register, but are stored in the stack instead. Hence insertelement			; to the register, but are stored in the stack instead. Hence insertelement
	; and extractelement have these extra loads and stores.			; and extractelement have these extra loads and stores.

	; CHECK-ALL-LABEL: test_insertelement:			; CHECK-ALL-LABEL: test_insertelement:
	; CHECK-ALL-NEXT: .fnstart			; CHECK-ALL-NEXT: .fnstart
	; CHECK-ALL-NEXT: sub sp, sp, #8			; CHECK-ALL-NEXT: sub sp, sp, #8
	; CHECK-ALL-NEXT: ldrh r3, [r1, #6]			; CHECK-ALL-NEXT: ldrh
	; CHECK-ALL-NEXT: strh r3, [sp, #6]			; CHECK-ALL-NEXT: strh
	; CHECK-ALL-NEXT: ldrh r3, [r1, #4]			; CHECK-ALL-NEXT: ldrh
	; CHECK-ALL-NEXT: strh r3, [sp, #4]			; CHECK-ALL-NEXT: strh
	; CHECK-ALL-NEXT: ldrh r3, [r1, #2]			; CHECK-ALL-NEXT: ldrh
	; CHECK-ALL-NEXT: strh r3, [sp, #2]			; CHECK-ALL-NEXT: strh
	; CHECK-ALL-NEXT: ldrh r3, [r1]			; CHECK-ALL-NEXT: ldrh
	; CHECK-ALL-NEXT: strh r3, [sp]			; CHECK-ALL-NEXT: strh
	; CHECK-ALL-NEXT: mov r3, sp			; CHECK-ALL-NEXT: mov
	; CHECK-ALL-NEXT: ldrh r0, [r0]			; CHECK-ALL-NEXT: ldrh
	; CHECK-ALL-NEXT: add r2, r3, r2, lsl #1			; CHECK-ALL-NEXT: add
	; CHECK-ALL-NEXT: strh r0, [r2]			; CHECK-ALL-NEXT: strh
	; CHECK-ALL-NEXT: ldrh r0, [sp, #6]			; CHECK-ALL-NEXT: ldrh
	; CHECK-ALL-NEXT: strh r0, [r1, #6]			; CHECK-ALL-NEXT: strh
	; CHECK-ALL-NEXT: ldrh r0, [sp, #4]			; CHECK-ALL-NEXT: ldrh
	; CHECK-ALL-NEXT: strh r0, [r1, #4]			; CHECK-ALL-NEXT: strh
	; CHECK-ALL-NEXT: ldrh r0, [sp, #2]			; CHECK-ALL-NEXT: ldrh
	; CHECK-ALL-NEXT: strh r0, [r1, #2]			; CHECK-ALL-NEXT: strh
	; CHECK-ALL-NEXT: ldrh r0, [sp]			; CHECK-ALL-NEXT: ldrh
	; CHECK-ALL-NEXT: strh r0, [r1]			; CHECK-ALL-NEXT: strh
	; CHECK-ALL-NEXT: add sp, sp, #8			; CHECK-ALL-NEXT: add sp, sp, #8
	; CHECK-ALL-NEXT: bx lr			; CHECK-ALL-NEXT: bx lr
	define void @test_insertelement(half* %p, <4 x half>* %q, i32 %i) #0 {			define void @test_insertelement(half* %p, <4 x half>* %q, i32 %i) #0 {
	%a = load half, half* %p, align 2			%a = load half, half* %p, align 2
	%b = load <4 x half>, <4 x half>* %q, align 8			%b = load <4 x half>, <4 x half>* %q, align 8
	%c = insertelement <4 x half> %b, half %a, i32 %i			%c = insertelement <4 x half> %b, half %a, i32 %i
	store <4 x half> %c, <4 x half>* %q			store <4 x half> %c, <4 x half>* %q
	ret void			ret void
	}			}

	; CHECK-ALL-LABEL: test_extractelement:			; CHECK-ALL-LABEL: test_extractelement:
	; CHECK-ALL-NEXT: .fnstart			; CHECK-ALL-NEXT: .fnstart
	; CHECK-ALL-NEXT: sub sp, sp, #8			; CHECK-ALL-NEXT: sub sp, sp, #8
	; CHECK-ALL-NEXT: ldrh r12, [r1, #2]			; CHECK-ALL-NEXT: ldrh
	; CHECK-ALL-NEXT: ldrh r3, [r1]			; CHECK-ALL-NEXT: ldrh
	; CHECK-ALL-NEXT: orr r3, r3, r12, lsl #16			; CHECK-ALL-NEXT: orr
	; CHECK-ALL-NEXT: str r3, [sp]			; CHECK-ALL-NEXT: str
	; CHECK-ALL-NEXT: ldrh r3, [r1, #6]			; CHECK-ALL-NEXT: ldrh
	; CHECK-ALL-NEXT: ldrh r1, [r1, #4]			; CHECK-ALL-NEXT: ldrh
	; CHECK-ALL-NEXT: orr r1, r1, r3, lsl #16			; CHECK-ALL-NEXT: orr
	; CHECK-ALL-NEXT: str r1, [sp, #4]			; CHECK-ALL-NEXT: str
	; CHECK-ALL-NEXT: mov r1, sp			; CHECK-ALL-NEXT: mov
	; CHECK-ALL-NEXT: add r1, r1, r2, lsl #1			; CHECK-ALL-NEXT: add
	; CHECK-ALL-NEXT: ldrh r1, [r1]			; CHECK-ALL-NEXT: ldrh
	; CHECK-ALL-NEXT: strh r1, [r0]			; CHECK-ALL-NEXT: strh
	; CHECK-ALL-NEXT: add sp, sp, #8			; CHECK-ALL-NEXT: add sp, sp, #8
	; CHECK-ALL-NEXT: bx lr			; CHECK-ALL-NEXT: bx lr
	define void @test_extractelement(half* %p, <4 x half>* %q, i32 %i) #0 {			define void @test_extractelement(half* %p, <4 x half>* %q, i32 %i) #0 {
	%a = load <4 x half>, <4 x half>* %q, align 8			%a = load <4 x half>, <4 x half>* %q, align 8
	%b = extractelement <4 x half> %a, i32 %i			%b = extractelement <4 x half> %a, i32 %i
	store half %b, half* %p			store half %b, half* %p
	ret void			ret void
	}			}

	; test struct operations			; test struct operations

	%struct.dummy = type { i32, half }			%struct.dummy = type { i32, half }

	; CHECK-ALL-LABEL: test_insertvalue:			; CHECK-ALL-LABEL: test_insertvalue:
	; CHECK-ALL-NEXT: .fnstart			; CHECK-ALL-NEXT: .fnstart
	; CHECK-ALL-NEXT: ldr r2, [r0]			; CHECK-ALL-NEXT: ldr
	; CHECK-ALL-NEXT: ldrh r1, [r1]			; CHECK-ALL-NEXT: ldrh
	; CHECK-ALL-NEXT: strh r1, [r0, #4]			; CHECK-ALL-NEXT: strh
	; CHECK-ALL-NEXT: str r2, [r0]			; CHECK-ALL-NEXT: str
	; CHECK-ALL-NEXT: bx lr			; CHECK-ALL-NEXT: bx lr
	define void @test_insertvalue(%struct.dummy* %p, half* %q) {			define void @test_insertvalue(%struct.dummy* %p, half* %q) {
	%a = load %struct.dummy, %struct.dummy* %p			%a = load %struct.dummy, %struct.dummy* %p
	%b = load half, half* %q			%b = load half, half* %q
	%c = insertvalue %struct.dummy %a, half %b, 1			%c = insertvalue %struct.dummy %a, half %b, 1
	store %struct.dummy %c, %struct.dummy* %p			store %struct.dummy %c, %struct.dummy* %p
	ret void			ret void
	}			}

	; CHECK-ALL-LABEL: test_extractvalue:			; CHECK-ALL-LABEL: test_extractvalue:
	; CHECK-ALL-NEXT: .fnstart			; CHECK-ALL-NEXT: .fnstart
	; CHECK-ALL-NEXT: ldrh r0, [r0, #4]			; CHECK-ALL-NEXT: ldrh
	; CHECK-ALL-NEXT: strh r0, [r1]			; CHECK-ALL-NEXT: strh
	; CHECK-ALL-NEXT: bx lr			; CHECK-ALL-NEXT: bx lr
	define void @test_extractvalue(%struct.dummy* %p, half* %q) {			define void @test_extractvalue(%struct.dummy* %p, half* %q) {
	%a = load %struct.dummy, %struct.dummy* %p			%a = load %struct.dummy, %struct.dummy* %p
	%b = extractvalue %struct.dummy %a, 1			%b = extractvalue %struct.dummy %a, 1
	store half %b, half* %q			store half %b, half* %q
	ret void			ret void
	}			}

	; CHECK-FP16-LABEL: test_struct_return:			; CHECK-FP16-LABEL: test_struct_return:
	; CHECK-FP16-NEXT: .fnstart			; CHECK-FP16: vcvtb.f32.f16
	; CHECK-FP16-NEXT: ldr r2, [r0]
	; CHECK-FP16-NEXT: ldrh r0, [r0, #4]
	; CHECK-FP16-NEXT: vmov s0, r0
	; CHECK-FP16-NEXT: mov r0, r2
	; CHECK-FP16-NEXT: vcvtb.f32.f16 s0, s0
	; CHECK-FP16-NEXT: vmov r1, s0
	; CHECK-FP16-NEXT: bx lr
	; CHECK-LIBCALL-LABEL: test_struct_return:			; CHECK-LIBCALL-LABEL: test_struct_return:
	; CHECK-LIBCALL-NEXT: .fnstart			; CHECK-LIBCALL: bl __gnu_h2f_ieee
	; CHECK-LIBCALL-NEXT: push {r4, lr}
	; CHECK-LIBCALL-NEXT: ldr r4, [r0]
	; CHECK-LIBCALL-NEXT: ldrh r0, [r0, #4]
	; CHECK-LIBCALL-NEXT: bl __gnu_h2f_ieee
	; CHECK-LIBCALL-NEXT: mov r1, r0
	; CHECK-LIBCALL-NEXT: mov r0, r4
	; CHECK-LIBCALL-NEXT: pop {r4, pc}
	define %struct.dummy @test_struct_return(%struct.dummy* %p) {			define %struct.dummy @test_struct_return(%struct.dummy* %p) {
	%a = load %struct.dummy, %struct.dummy* %p			%a = load %struct.dummy, %struct.dummy* %p
	ret %struct.dummy %a			ret %struct.dummy %a
	}			}

	; CHECK-ALL-LABEL: test_struct_arg:			; CHECK-ALL-LABEL: test_struct_arg:
	; CHECK-ALL-NEXT: .fnstart			; CHECK-ALL-NEXT: .fnstart
	; CHECK-ALL-NEXT: mov r0, r1			; CHECK-ALL-NEXT: mov r0, r1
	; CHECK-ALL-NEXT: bx lr			; CHECK-ALL-NEXT: bx lr
	define half @test_struct_arg(%struct.dummy %p) {			define half @test_struct_arg(%struct.dummy %p) {
	%a = extractvalue %struct.dummy %p, 1			%a = extractvalue %struct.dummy %p, 1
	ret half %a			ret half %a
	}			}

	attributes #0 = { nounwind }			attributes #0 = { nounwind }