This is an archive of the discontinued LLVM Phabricator instance.

It looks as though all checks are checking the same thing? Presumably this is expected? I wonder if allowing an extra combined check (--check-prefixes=CHECK,CHECK-ZFH-ILP32F or something) would make it more obvious when things *are* different between the different configs.

I'm not familiar with how Float16 is supposed to behave if the target doesn't advertise support zfh, but I come more from OpenCL where it's either fully supported or "storage-only", in which case I wouldn't expect a fadd to get past the frontend (or maybe it'd enforce promotion to float?). This isn't necessarily a blocker - I'm just showing the limits of my knowledge in this area.

In D112398#3087183, @frasercrmck wrote:

It looks as though all checks are checking the same thing? Presumably this is expected? I wonder if allowing an extra combined check (--check-prefixes=CHECK,CHECK-ZFH-ILP32F or something) would make it more obvious when things *are* different between the different configs.

I'm not familiar with how Float16 is supposed to behave if the target doesn't advertise support zfh, but I come more from OpenCL where it's either fully supported or "storage-only", in which case I wouldn't expect a fadd to get past the frontend (or maybe it'd enforce promotion to float?). This isn't necessarily a blocker - I'm just showing the limits of my knowledge in this area.

If I remember correctly, the frontend doesn't know if the backend has support for half. It only has a single flag to say whether Float16 should be a valid type. I believe on AArch64 gcc does promote it in the frontend when there are no native instructions. clang does not. The effect of this is that clang rounds a lot more often than gcc when half isn't supported. gcc will promote an entire expression an only round at places like assignment.

I'm curious about how we handle _Float16 here.

My understanding from the psabi and the Zfh draft, don't we want under Zfh + ilp32f to pass the float16 directly in a FP register?

So for a case like this

typedef _Float16 FP;
typedef struct A { FP a; FP b; } A;

void foo(A);

void bar()
{
    A a = {1.0, 2.0};
    foo(a);
}

I'd expect Zfh + ilp32 to pass an i32 (which we already do)

define dso_local void @bar() local_unnamed_addr #0 {
  tail call void @foo(i32 1073757184) #2
  ret void
}

and Zfh + ilp32f (and I understand ilp32d too) do

define dso_local void @bar() local_unnamed_addr #0 {
  tail call void @foo(half 1.0e+0.0, half 2.0e+0.0)
  ret void
}

Perhaps it was already decided against using FP regs for _Float16?

I think a similar consideration can be done for rv64 + Zfh and lp64 / lp64f / lp64d, the last two using FP registers.

If this is the case, then I understand a parameter like

typedef struct A { _Float16 a; float b; } A;

would also be passed as two FP registers in ilp32f, ilp32d, lp64f and lp64d.

From the psABI aspect, we already included that by this PR, this PR added size and alignment for _Float16, and we didn't added extra rule for that, because we believe that's already covered by existing rule:

For soft float ABI (ilp32/lp64):

Floating-point reals are passed the same way as aggregates of the same size, complex floating-point numbers are passed the same way as a struct containing two floating-point reals. (This constraint changes when the integer calling convention is augmented by the hardware floating-point calling convention.)

-> _Float16 following same rule as float, pass argument and return value in GPR.

For hard float ABI (ilp32f/lp64f/ilp32d/lp64d):

A real floating-point argument is passed in a floating-point argument register if it is no more than FLEN bits wide and at least one floating-point argument register is available. Otherwise, it is passed according to the integer calling convention. When a floating-point argument narrower than FLEN bits is passed in a floating-point register, it is 1-extended (NaN-boxed) to FLEN bits.

-> _Float16 following same rule as float, pass argument and return value in FPR.

So basically same as @rogfer01's understanding and the rule is same between w/ and w/o zfh.

@jrtc27 could you take a look for this revision?

Herald added subscribers: VincentWu, luke957. · View Herald TranscriptNov 11 2021, 2:55 AM

liaolucy added a subscriber: liaolucy.Dec 15 2021, 10:44 PM

Revision Contents

Path

Size

clang/

test/

CodeGen/

RISCV/

Float16.c

375 lines

Diff 381835

clang/test/CodeGen/RISCV/Float16.c

This file was added.

				// NOTE: Assertions have been autogenerated by utils/update_cc_test_checks.py
				// RUN: %clang_cc1 -triple riscv32 -O0 -target-abi ilp32 -emit-llvm %s \
				// RUN: -o - \| FileCheck --check-prefix=CHECK-NOZFH-ILP32 %s
				// RUN: %clang_cc1 -triple riscv32 -target-feature +experimental-zfh -O0 -target-abi ilp32 -emit-llvm %s \
				// RUN: -o - \| FileCheck --check-prefix=CHECK-ZFH-ILP32 %s
				// RUN: %clang_cc1 -triple riscv32 -O0 -target-abi ilp32f -emit-llvm %s \
				// RUN: -o - \| FileCheck --check-prefix=CHECK-NOZFH-ILP32F %s
				// RUN: %clang_cc1 -triple riscv32 -target-feature +experimental-zfh -O0 -target-abi ilp32f -emit-llvm %s \
				// RUN: -o - \| FileCheck --check-prefix=CHECK-ZFH-ILP32F %s

				#include <stdint.h>

				_Float16 varg(int num, ...);

				// CHECK-NOZFH-ILP32-LABEL: @foo(
				// CHECK-NOZFH-ILP32-NEXT: entry:
				// CHECK-NOZFH-ILP32-NEXT: [[A_ADDR:%.*]] = alloca half, align 2
				// CHECK-NOZFH-ILP32-NEXT: [[B_ADDR:%.*]] = alloca half, align 2
				// CHECK-NOZFH-ILP32-NEXT: store half [[A:%.]], half [[A_ADDR]], align 2
				// CHECK-NOZFH-ILP32-NEXT: store half [[B:%.]], half [[B_ADDR]], align 2
				// CHECK-NOZFH-ILP32-NEXT: [[TMP0:%.]] = load half, half [[A_ADDR]], align 2
				// CHECK-NOZFH-ILP32-NEXT: [[TMP1:%.]] = load half, half [[B_ADDR]], align 2
				// CHECK-NOZFH-ILP32-NEXT: [[ADD:%.*]] = fadd half [[TMP0]], [[TMP1]]
				// CHECK-NOZFH-ILP32-NEXT: ret half [[ADD]]
				//
				// CHECK-ZFH-ILP32-LABEL: @foo(
				// CHECK-ZFH-ILP32-NEXT: entry:
				// CHECK-ZFH-ILP32-NEXT: [[A_ADDR:%.*]] = alloca half, align 2
				// CHECK-ZFH-ILP32-NEXT: [[B_ADDR:%.*]] = alloca half, align 2
				// CHECK-ZFH-ILP32-NEXT: store half [[A:%.]], half [[A_ADDR]], align 2
				// CHECK-ZFH-ILP32-NEXT: store half [[B:%.]], half [[B_ADDR]], align 2
				// CHECK-ZFH-ILP32-NEXT: [[TMP0:%.]] = load half, half [[A_ADDR]], align 2
				// CHECK-ZFH-ILP32-NEXT: [[TMP1:%.]] = load half, half [[B_ADDR]], align 2
				// CHECK-ZFH-ILP32-NEXT: [[ADD:%.*]] = fadd half [[TMP0]], [[TMP1]]
				// CHECK-ZFH-ILP32-NEXT: ret half [[ADD]]
				//
				// CHECK-NOZFH-ILP32F-LABEL: @foo(
				// CHECK-NOZFH-ILP32F-NEXT: entry:
				// CHECK-NOZFH-ILP32F-NEXT: [[A_ADDR:%.*]] = alloca half, align 2
				// CHECK-NOZFH-ILP32F-NEXT: [[B_ADDR:%.*]] = alloca half, align 2
				// CHECK-NOZFH-ILP32F-NEXT: store half [[A:%.]], half [[A_ADDR]], align 2
				// CHECK-NOZFH-ILP32F-NEXT: store half [[B:%.]], half [[B_ADDR]], align 2
				// CHECK-NOZFH-ILP32F-NEXT: [[TMP0:%.]] = load half, half [[A_ADDR]], align 2
				// CHECK-NOZFH-ILP32F-NEXT: [[TMP1:%.]] = load half, half [[B_ADDR]], align 2
				// CHECK-NOZFH-ILP32F-NEXT: [[ADD:%.*]] = fadd half [[TMP0]], [[TMP1]]
				// CHECK-NOZFH-ILP32F-NEXT: ret half [[ADD]]
				//
				// CHECK-ZFH-ILP32F-LABEL: @foo(
				// CHECK-ZFH-ILP32F-NEXT: entry:
				// CHECK-ZFH-ILP32F-NEXT: [[A_ADDR:%.*]] = alloca half, align 2
				// CHECK-ZFH-ILP32F-NEXT: [[B_ADDR:%.*]] = alloca half, align 2
				// CHECK-ZFH-ILP32F-NEXT: store half [[A:%.]], half [[A_ADDR]], align 2
				// CHECK-ZFH-ILP32F-NEXT: store half [[B:%.]], half [[B_ADDR]], align 2
				// CHECK-ZFH-ILP32F-NEXT: [[TMP0:%.]] = load half, half [[A_ADDR]], align 2
				// CHECK-ZFH-ILP32F-NEXT: [[TMP1:%.]] = load half, half [[B_ADDR]], align 2
				// CHECK-ZFH-ILP32F-NEXT: [[ADD:%.*]] = fadd half [[TMP0]], [[TMP1]]
				// CHECK-ZFH-ILP32F-NEXT: ret half [[ADD]]
				//
				_Float16 foo(_Float16 a, _Float16 b) {
				return a + b;
				}

				// CHECK-NOZFH-ILP32-LABEL: @foo1(
				// CHECK-NOZFH-ILP32-NEXT: entry:
				// CHECK-NOZFH-ILP32-NEXT: [[A_ADDR:%.*]] = alloca half, align 2
				// CHECK-NOZFH-ILP32-NEXT: store half [[A:%.]], half [[A_ADDR]], align 2
				// CHECK-NOZFH-ILP32-NEXT: [[TMP0:%.]] = load half, half [[A_ADDR]], align 2
				// CHECK-NOZFH-ILP32-NEXT: [[CALL:%.*]] = call half (i32, ...) @varg(i32 1, half [[TMP0]])
				// CHECK-NOZFH-ILP32-NEXT: ret half [[CALL]]
				//
				// CHECK-ZFH-ILP32-LABEL: @foo1(
				// CHECK-ZFH-ILP32-NEXT: entry:
				// CHECK-ZFH-ILP32-NEXT: [[A_ADDR:%.*]] = alloca half, align 2
				// CHECK-ZFH-ILP32-NEXT: store half [[A:%.]], half [[A_ADDR]], align 2
				// CHECK-ZFH-ILP32-NEXT: [[TMP0:%.]] = load half, half [[A_ADDR]], align 2
				// CHECK-ZFH-ILP32-NEXT: [[CALL:%.*]] = call half (i32, ...) @varg(i32 1, half [[TMP0]])
				// CHECK-ZFH-ILP32-NEXT: ret half [[CALL]]
				//
				// CHECK-NOZFH-ILP32F-LABEL: @foo1(
				// CHECK-NOZFH-ILP32F-NEXT: entry:
				// CHECK-NOZFH-ILP32F-NEXT: [[A_ADDR:%.*]] = alloca half, align 2
				// CHECK-NOZFH-ILP32F-NEXT: store half [[A:%.]], half [[A_ADDR]], align 2
				// CHECK-NOZFH-ILP32F-NEXT: [[TMP0:%.]] = load half, half [[A_ADDR]], align 2
				// CHECK-NOZFH-ILP32F-NEXT: [[CALL:%.*]] = call half (i32, ...) @varg(i32 1, half [[TMP0]])
				// CHECK-NOZFH-ILP32F-NEXT: ret half [[CALL]]
				//
				// CHECK-ZFH-ILP32F-LABEL: @foo1(
				// CHECK-ZFH-ILP32F-NEXT: entry:
				// CHECK-ZFH-ILP32F-NEXT: [[A_ADDR:%.*]] = alloca half, align 2
				// CHECK-ZFH-ILP32F-NEXT: store half [[A:%.]], half [[A_ADDR]], align 2
				// CHECK-ZFH-ILP32F-NEXT: [[TMP0:%.]] = load half, half [[A_ADDR]], align 2
				// CHECK-ZFH-ILP32F-NEXT: [[CALL:%.*]] = call half (i32, ...) @varg(i32 1, half [[TMP0]])
				// CHECK-ZFH-ILP32F-NEXT: ret half [[CALL]]
				//
				_Float16 foo1(_Float16 a) {
				return varg(1, a);
				}

				struct f16_agg {
				_Float16 a, b;
				};

				// CHECK-NOZFH-ILP32-LABEL: @test_f16_agg_1(
				// CHECK-NOZFH-ILP32-NEXT: entry:
				// CHECK-NOZFH-ILP32-NEXT: [[X:%.]] = alloca [[STRUCT_F16_AGG:%.]], align 2
				// CHECK-NOZFH-ILP32-NEXT: [[TMP0:%.]] = bitcast %struct.f16_agg [[X]] to i32*
				// CHECK-NOZFH-ILP32-NEXT: store i32 [[X_COERCE:%.]], i32 [[TMP0]], align 2
				// CHECK-NOZFH-ILP32-NEXT: [[B:%.]] = getelementptr inbounds [[STRUCT_F16_AGG]], %struct.f16_agg [[X]], i32 0, i32 1
				// CHECK-NOZFH-ILP32-NEXT: [[TMP1:%.]] = load half, half [[B]], align 2
				// CHECK-NOZFH-ILP32-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_F16_AGG]], %struct.f16_agg [[X]], i32 0, i32 0
				// CHECK-NOZFH-ILP32-NEXT: [[TMP2:%.]] = load half, half [[A]], align 2
				// CHECK-NOZFH-ILP32-NEXT: [[ADD:%.*]] = fadd half [[TMP2]], [[TMP1]]
				// CHECK-NOZFH-ILP32-NEXT: store half [[ADD]], half* [[A]], align 2
				// CHECK-NOZFH-ILP32-NEXT: ret void
				//
				// CHECK-ZFH-ILP32-LABEL: @test_f16_agg_1(
				// CHECK-ZFH-ILP32-NEXT: entry:
				// CHECK-ZFH-ILP32-NEXT: [[X:%.]] = alloca [[STRUCT_F16_AGG:%.]], align 2
				// CHECK-ZFH-ILP32-NEXT: [[TMP0:%.]] = bitcast %struct.f16_agg [[X]] to i32*
				// CHECK-ZFH-ILP32-NEXT: store i32 [[X_COERCE:%.]], i32 [[TMP0]], align 2
				// CHECK-ZFH-ILP32-NEXT: [[B:%.]] = getelementptr inbounds [[STRUCT_F16_AGG]], %struct.f16_agg [[X]], i32 0, i32 1
				// CHECK-ZFH-ILP32-NEXT: [[TMP1:%.]] = load half, half [[B]], align 2
				// CHECK-ZFH-ILP32-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_F16_AGG]], %struct.f16_agg [[X]], i32 0, i32 0
				// CHECK-ZFH-ILP32-NEXT: [[TMP2:%.]] = load half, half [[A]], align 2
				// CHECK-ZFH-ILP32-NEXT: [[ADD:%.*]] = fadd half [[TMP2]], [[TMP1]]
				// CHECK-ZFH-ILP32-NEXT: store half [[ADD]], half* [[A]], align 2
				// CHECK-ZFH-ILP32-NEXT: ret void
				//
				// CHECK-NOZFH-ILP32F-LABEL: @test_f16_agg_1(
				// CHECK-NOZFH-ILP32F-NEXT: entry:
				// CHECK-NOZFH-ILP32F-NEXT: [[X:%.]] = alloca [[STRUCT_F16_AGG:%.]], align 2
				// CHECK-NOZFH-ILP32F-NEXT: [[TMP0:%.]] = bitcast %struct.f16_agg [[X]] to i32*
				// CHECK-NOZFH-ILP32F-NEXT: store i32 [[X_COERCE:%.]], i32 [[TMP0]], align 2
				// CHECK-NOZFH-ILP32F-NEXT: [[B:%.]] = getelementptr inbounds [[STRUCT_F16_AGG]], %struct.f16_agg [[X]], i32 0, i32 1
				// CHECK-NOZFH-ILP32F-NEXT: [[TMP1:%.]] = load half, half [[B]], align 2
				// CHECK-NOZFH-ILP32F-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_F16_AGG]], %struct.f16_agg [[X]], i32 0, i32 0
				// CHECK-NOZFH-ILP32F-NEXT: [[TMP2:%.]] = load half, half [[A]], align 2
				// CHECK-NOZFH-ILP32F-NEXT: [[ADD:%.*]] = fadd half [[TMP2]], [[TMP1]]
				// CHECK-NOZFH-ILP32F-NEXT: store half [[ADD]], half* [[A]], align 2
				// CHECK-NOZFH-ILP32F-NEXT: ret void
				//
				// CHECK-ZFH-ILP32F-LABEL: @test_f16_agg_1(
				// CHECK-ZFH-ILP32F-NEXT: entry:
				// CHECK-ZFH-ILP32F-NEXT: [[X:%.]] = alloca [[STRUCT_F16_AGG:%.]], align 2
				// CHECK-ZFH-ILP32F-NEXT: [[TMP0:%.]] = bitcast %struct.f16_agg [[X]] to i32*
				// CHECK-ZFH-ILP32F-NEXT: store i32 [[X_COERCE:%.]], i32 [[TMP0]], align 2
				// CHECK-ZFH-ILP32F-NEXT: [[B:%.]] = getelementptr inbounds [[STRUCT_F16_AGG]], %struct.f16_agg [[X]], i32 0, i32 1
				// CHECK-ZFH-ILP32F-NEXT: [[TMP1:%.]] = load half, half [[B]], align 2
				// CHECK-ZFH-ILP32F-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_F16_AGG]], %struct.f16_agg [[X]], i32 0, i32 0
				// CHECK-ZFH-ILP32F-NEXT: [[TMP2:%.]] = load half, half [[A]], align 2
				// CHECK-ZFH-ILP32F-NEXT: [[ADD:%.*]] = fadd half [[TMP2]], [[TMP1]]
				// CHECK-ZFH-ILP32F-NEXT: store half [[ADD]], half* [[A]], align 2
				// CHECK-ZFH-ILP32F-NEXT: ret void
				//
				void test_f16_agg_1(struct f16_agg x) {
				x.a += x.b;
				}

				struct f16_float_agg {
				_Float16 a;
				float b;
				};

				// CHECK-NOZFH-ILP32-LABEL: @test_f16_agg_2(
				// CHECK-NOZFH-ILP32-NEXT: entry:
				// CHECK-NOZFH-ILP32-NEXT: [[A:%.]] = alloca [[STRUCT_F16_FLOAT_AGG:%.]], align 4
				// CHECK-NOZFH-ILP32-NEXT: [[TMP0:%.]] = bitcast %struct.f16_float_agg [[A]] to [2 x i32]*
				// CHECK-NOZFH-ILP32-NEXT: store [2 x i32] [[A_COERCE:%.]], [2 x i32] [[TMP0]], align 4
				// CHECK-NOZFH-ILP32-NEXT: ret void
				//
				// CHECK-ZFH-ILP32-LABEL: @test_f16_agg_2(
				// CHECK-ZFH-ILP32-NEXT: entry:
				// CHECK-ZFH-ILP32-NEXT: [[A:%.]] = alloca [[STRUCT_F16_FLOAT_AGG:%.]], align 4
				// CHECK-ZFH-ILP32-NEXT: [[TMP0:%.]] = bitcast %struct.f16_float_agg [[A]] to [2 x i32]*
				// CHECK-ZFH-ILP32-NEXT: store [2 x i32] [[A_COERCE:%.]], [2 x i32] [[TMP0]], align 4
				// CHECK-ZFH-ILP32-NEXT: ret void
				//
				// CHECK-NOZFH-ILP32F-LABEL: @test_f16_agg_2(
				// CHECK-NOZFH-ILP32F-NEXT: entry:
				// CHECK-NOZFH-ILP32F-NEXT: [[A:%.]] = alloca [[STRUCT_F16_FLOAT_AGG:%.]], align 4
				// CHECK-NOZFH-ILP32F-NEXT: [[TMP0:%.]] = bitcast %struct.f16_float_agg [[A]] to [2 x i32]*
				// CHECK-NOZFH-ILP32F-NEXT: store [2 x i32] [[A_COERCE:%.]], [2 x i32] [[TMP0]], align 4
				// CHECK-NOZFH-ILP32F-NEXT: ret void
				//
				// CHECK-ZFH-ILP32F-LABEL: @test_f16_agg_2(
				// CHECK-ZFH-ILP32F-NEXT: entry:
				// CHECK-ZFH-ILP32F-NEXT: [[A:%.]] = alloca [[STRUCT_F16_FLOAT_AGG:%.]], align 4
				// CHECK-ZFH-ILP32F-NEXT: [[TMP0:%.]] = bitcast %struct.f16_float_agg [[A]] to [2 x i32]*
				// CHECK-ZFH-ILP32F-NEXT: store [2 x i32] [[A_COERCE:%.]], [2 x i32] [[TMP0]], align 4
				// CHECK-ZFH-ILP32F-NEXT: ret void
				//
				void test_f16_agg_2(struct f16_float_agg a) {}

				// CHECK-NOZFH-ILP32-LABEL: @test_f16_agg_3(
				// CHECK-NOZFH-ILP32-NEXT: entry:
				// CHECK-NOZFH-ILP32-NEXT: [[RETVAL:%.]] = alloca [[STRUCT_F16_FLOAT_AGG:%.]], align 4
				// CHECK-NOZFH-ILP32-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_F16_FLOAT_AGG]], %struct.f16_float_agg [[RETVAL]], i32 0, i32 0
				// CHECK-NOZFH-ILP32-NEXT: store half 0xH3C00, half* [[A]], align 4
				// CHECK-NOZFH-ILP32-NEXT: [[B:%.]] = getelementptr inbounds [[STRUCT_F16_FLOAT_AGG]], %struct.f16_float_agg [[RETVAL]], i32 0, i32 1
				// CHECK-NOZFH-ILP32-NEXT: store float 2.000000e+00, float* [[B]], align 4
				// CHECK-NOZFH-ILP32-NEXT: [[TMP0:%.]] = bitcast %struct.f16_float_agg [[RETVAL]] to [2 x i32]*
				// CHECK-NOZFH-ILP32-NEXT: [[TMP1:%.]] = load [2 x i32], [2 x i32] [[TMP0]], align 4
				// CHECK-NOZFH-ILP32-NEXT: ret [2 x i32] [[TMP1]]
				//
				// CHECK-ZFH-ILP32-LABEL: @test_f16_agg_3(
				// CHECK-ZFH-ILP32-NEXT: entry:
				// CHECK-ZFH-ILP32-NEXT: [[RETVAL:%.]] = alloca [[STRUCT_F16_FLOAT_AGG:%.]], align 4
				// CHECK-ZFH-ILP32-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_F16_FLOAT_AGG]], %struct.f16_float_agg [[RETVAL]], i32 0, i32 0
				// CHECK-ZFH-ILP32-NEXT: store half 0xH3C00, half* [[A]], align 4
				// CHECK-ZFH-ILP32-NEXT: [[B:%.]] = getelementptr inbounds [[STRUCT_F16_FLOAT_AGG]], %struct.f16_float_agg [[RETVAL]], i32 0, i32 1
				// CHECK-ZFH-ILP32-NEXT: store float 2.000000e+00, float* [[B]], align 4
				// CHECK-ZFH-ILP32-NEXT: [[TMP0:%.]] = bitcast %struct.f16_float_agg [[RETVAL]] to [2 x i32]*
				// CHECK-ZFH-ILP32-NEXT: [[TMP1:%.]] = load [2 x i32], [2 x i32] [[TMP0]], align 4
				// CHECK-ZFH-ILP32-NEXT: ret [2 x i32] [[TMP1]]
				//
				// CHECK-NOZFH-ILP32F-LABEL: @test_f16_agg_3(
				// CHECK-NOZFH-ILP32F-NEXT: entry:
				// CHECK-NOZFH-ILP32F-NEXT: [[RETVAL:%.]] = alloca [[STRUCT_F16_FLOAT_AGG:%.]], align 4
				// CHECK-NOZFH-ILP32F-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_F16_FLOAT_AGG]], %struct.f16_float_agg [[RETVAL]], i32 0, i32 0
				// CHECK-NOZFH-ILP32F-NEXT: store half 0xH3C00, half* [[A]], align 4
				// CHECK-NOZFH-ILP32F-NEXT: [[B:%.]] = getelementptr inbounds [[STRUCT_F16_FLOAT_AGG]], %struct.f16_float_agg [[RETVAL]], i32 0, i32 1
				// CHECK-NOZFH-ILP32F-NEXT: store float 2.000000e+00, float* [[B]], align 4
				// CHECK-NOZFH-ILP32F-NEXT: [[TMP0:%.]] = bitcast %struct.f16_float_agg [[RETVAL]] to [2 x i32]*
				// CHECK-NOZFH-ILP32F-NEXT: [[TMP1:%.]] = load [2 x i32], [2 x i32] [[TMP0]], align 4
				// CHECK-NOZFH-ILP32F-NEXT: ret [2 x i32] [[TMP1]]
				//
				// CHECK-ZFH-ILP32F-LABEL: @test_f16_agg_3(
				// CHECK-ZFH-ILP32F-NEXT: entry:
				// CHECK-ZFH-ILP32F-NEXT: [[RETVAL:%.]] = alloca [[STRUCT_F16_FLOAT_AGG:%.]], align 4
				// CHECK-ZFH-ILP32F-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_F16_FLOAT_AGG]], %struct.f16_float_agg [[RETVAL]], i32 0, i32 0
				// CHECK-ZFH-ILP32F-NEXT: store half 0xH3C00, half* [[A]], align 4
				// CHECK-ZFH-ILP32F-NEXT: [[B:%.]] = getelementptr inbounds [[STRUCT_F16_FLOAT_AGG]], %struct.f16_float_agg [[RETVAL]], i32 0, i32 1
				// CHECK-ZFH-ILP32F-NEXT: store float 2.000000e+00, float* [[B]], align 4
				// CHECK-ZFH-ILP32F-NEXT: [[TMP0:%.]] = bitcast %struct.f16_float_agg [[RETVAL]] to [2 x i32]*
				// CHECK-ZFH-ILP32F-NEXT: [[TMP1:%.]] = load [2 x i32], [2 x i32] [[TMP0]], align 4
				// CHECK-ZFH-ILP32F-NEXT: ret [2 x i32] [[TMP1]]
				//
				struct f16_float_agg test_f16_agg_3() { return (struct f16_float_agg){1.0, 2.0}; }

				struct f16_int_agg {
				_Float16 a;
				int32_t b;
				};

				// CHECK-NOZFH-ILP32-LABEL: @test_f16_agg_4(
				// CHECK-NOZFH-ILP32-NEXT: entry:
				// CHECK-NOZFH-ILP32-NEXT: [[A:%.]] = alloca [[STRUCT_F16_INT_AGG:%.]], align 4
				// CHECK-NOZFH-ILP32-NEXT: [[TMP0:%.]] = bitcast %struct.f16_int_agg [[A]] to [2 x i32]*
				// CHECK-NOZFH-ILP32-NEXT: store [2 x i32] [[A_COERCE:%.]], [2 x i32] [[TMP0]], align 4
				// CHECK-NOZFH-ILP32-NEXT: ret void
				//
				// CHECK-ZFH-ILP32-LABEL: @test_f16_agg_4(
				// CHECK-ZFH-ILP32-NEXT: entry:
				// CHECK-ZFH-ILP32-NEXT: [[A:%.]] = alloca [[STRUCT_F16_INT_AGG:%.]], align 4
				// CHECK-ZFH-ILP32-NEXT: [[TMP0:%.]] = bitcast %struct.f16_int_agg [[A]] to [2 x i32]*
				// CHECK-ZFH-ILP32-NEXT: store [2 x i32] [[A_COERCE:%.]], [2 x i32] [[TMP0]], align 4
				// CHECK-ZFH-ILP32-NEXT: ret void
				//
				// CHECK-NOZFH-ILP32F-LABEL: @test_f16_agg_4(
				// CHECK-NOZFH-ILP32F-NEXT: entry:
				// CHECK-NOZFH-ILP32F-NEXT: [[A:%.]] = alloca [[STRUCT_F16_INT_AGG:%.]], align 4
				// CHECK-NOZFH-ILP32F-NEXT: [[TMP0:%.]] = bitcast %struct.f16_int_agg [[A]] to [2 x i32]*
				// CHECK-NOZFH-ILP32F-NEXT: store [2 x i32] [[A_COERCE:%.]], [2 x i32] [[TMP0]], align 4
				// CHECK-NOZFH-ILP32F-NEXT: ret void
				//
				// CHECK-ZFH-ILP32F-LABEL: @test_f16_agg_4(
				// CHECK-ZFH-ILP32F-NEXT: entry:
				// CHECK-ZFH-ILP32F-NEXT: [[A:%.]] = alloca [[STRUCT_F16_INT_AGG:%.]], align 4
				// CHECK-ZFH-ILP32F-NEXT: [[TMP0:%.]] = bitcast %struct.f16_int_agg [[A]] to [2 x i32]*
				// CHECK-ZFH-ILP32F-NEXT: store [2 x i32] [[A_COERCE:%.]], [2 x i32] [[TMP0]], align 4
				// CHECK-ZFH-ILP32F-NEXT: ret void
				//
				void test_f16_agg_4(struct f16_int_agg a) {}

				// CHECK-NOZFH-ILP32-LABEL: @test_f16_agg_5(
				// CHECK-NOZFH-ILP32-NEXT: entry:
				// CHECK-NOZFH-ILP32-NEXT: [[RETVAL:%.]] = alloca [[STRUCT_F16_INT_AGG:%.]], align 4
				// CHECK-NOZFH-ILP32-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_F16_INT_AGG]], %struct.f16_int_agg [[RETVAL]], i32 0, i32 0
				// CHECK-NOZFH-ILP32-NEXT: store half 0xH3C00, half* [[A]], align 4
				// CHECK-NOZFH-ILP32-NEXT: [[B:%.]] = getelementptr inbounds [[STRUCT_F16_INT_AGG]], %struct.f16_int_agg [[RETVAL]], i32 0, i32 1
				// CHECK-NOZFH-ILP32-NEXT: store i32 2, i32* [[B]], align 4
				// CHECK-NOZFH-ILP32-NEXT: [[TMP0:%.]] = bitcast %struct.f16_int_agg [[RETVAL]] to [2 x i32]*
				// CHECK-NOZFH-ILP32-NEXT: [[TMP1:%.]] = load [2 x i32], [2 x i32] [[TMP0]], align 4
				// CHECK-NOZFH-ILP32-NEXT: ret [2 x i32] [[TMP1]]
				//
				// CHECK-ZFH-ILP32-LABEL: @test_f16_agg_5(
				// CHECK-ZFH-ILP32-NEXT: entry:
				// CHECK-ZFH-ILP32-NEXT: [[RETVAL:%.]] = alloca [[STRUCT_F16_INT_AGG:%.]], align 4
				// CHECK-ZFH-ILP32-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_F16_INT_AGG]], %struct.f16_int_agg [[RETVAL]], i32 0, i32 0
				// CHECK-ZFH-ILP32-NEXT: store half 0xH3C00, half* [[A]], align 4
				// CHECK-ZFH-ILP32-NEXT: [[B:%.]] = getelementptr inbounds [[STRUCT_F16_INT_AGG]], %struct.f16_int_agg [[RETVAL]], i32 0, i32 1
				// CHECK-ZFH-ILP32-NEXT: store i32 2, i32* [[B]], align 4
				// CHECK-ZFH-ILP32-NEXT: [[TMP0:%.]] = bitcast %struct.f16_int_agg [[RETVAL]] to [2 x i32]*
				// CHECK-ZFH-ILP32-NEXT: [[TMP1:%.]] = load [2 x i32], [2 x i32] [[TMP0]], align 4
				// CHECK-ZFH-ILP32-NEXT: ret [2 x i32] [[TMP1]]
				//
				// CHECK-NOZFH-ILP32F-LABEL: @test_f16_agg_5(
				// CHECK-NOZFH-ILP32F-NEXT: entry:
				// CHECK-NOZFH-ILP32F-NEXT: [[RETVAL:%.]] = alloca [[STRUCT_F16_INT_AGG:%.]], align 4
				// CHECK-NOZFH-ILP32F-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_F16_INT_AGG]], %struct.f16_int_agg [[RETVAL]], i32 0, i32 0
				// CHECK-NOZFH-ILP32F-NEXT: store half 0xH3C00, half* [[A]], align 4
				// CHECK-NOZFH-ILP32F-NEXT: [[B:%.]] = getelementptr inbounds [[STRUCT_F16_INT_AGG]], %struct.f16_int_agg [[RETVAL]], i32 0, i32 1
				// CHECK-NOZFH-ILP32F-NEXT: store i32 2, i32* [[B]], align 4
				// CHECK-NOZFH-ILP32F-NEXT: [[TMP0:%.]] = bitcast %struct.f16_int_agg [[RETVAL]] to [2 x i32]*
				// CHECK-NOZFH-ILP32F-NEXT: [[TMP1:%.]] = load [2 x i32], [2 x i32] [[TMP0]], align 4
				// CHECK-NOZFH-ILP32F-NEXT: ret [2 x i32] [[TMP1]]
				//
				// CHECK-ZFH-ILP32F-LABEL: @test_f16_agg_5(
				// CHECK-ZFH-ILP32F-NEXT: entry:
				// CHECK-ZFH-ILP32F-NEXT: [[RETVAL:%.]] = alloca [[STRUCT_F16_INT_AGG:%.]], align 4
				// CHECK-ZFH-ILP32F-NEXT: [[A:%.]] = getelementptr inbounds [[STRUCT_F16_INT_AGG]], %struct.f16_int_agg [[RETVAL]], i32 0, i32 0
				// CHECK-ZFH-ILP32F-NEXT: store half 0xH3C00, half* [[A]], align 4
				// CHECK-ZFH-ILP32F-NEXT: [[B:%.]] = getelementptr inbounds [[STRUCT_F16_INT_AGG]], %struct.f16_int_agg [[RETVAL]], i32 0, i32 1
				// CHECK-ZFH-ILP32F-NEXT: store i32 2, i32* [[B]], align 4
				// CHECK-ZFH-ILP32F-NEXT: [[TMP0:%.]] = bitcast %struct.f16_int_agg [[RETVAL]] to [2 x i32]*
				// CHECK-ZFH-ILP32F-NEXT: [[TMP1:%.]] = load [2 x i32], [2 x i32] [[TMP0]], align 4
				// CHECK-ZFH-ILP32F-NEXT: ret [2 x i32] [[TMP1]]
				//
				struct f16_int_agg test_f16_agg_5() { return (struct f16_int_agg){1.0, 2}; }

				// CHECK-NOZFH-ILP32-LABEL: @f16_scalar_stack_1(
				// CHECK-NOZFH-ILP32-NEXT: entry:
				// CHECK-NOZFH-ILP32-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
				// CHECK-NOZFH-ILP32-NEXT: [[B_ADDR:%.*]] = alloca i64, align 8
				// CHECK-NOZFH-ILP32-NEXT: [[C_ADDR:%.*]] = alloca float, align 4
				// CHECK-NOZFH-ILP32-NEXT: [[D_ADDR:%.*]] = alloca half, align 2
				// CHECK-NOZFH-ILP32-NEXT: store i32 [[A:%.]], i32 [[A_ADDR]], align 4
				// CHECK-NOZFH-ILP32-NEXT: store i64 [[B:%.]], i64 [[B_ADDR]], align 8
				// CHECK-NOZFH-ILP32-NEXT: store float [[C:%.]], float [[C_ADDR]], align 4
				// CHECK-NOZFH-ILP32-NEXT: store half [[D:%.]], half [[D_ADDR]], align 2
				// CHECK-NOZFH-ILP32-NEXT: [[TMP0:%.]] = load half, half [[D_ADDR]], align 2
				// CHECK-NOZFH-ILP32-NEXT: ret half [[TMP0]]
				//
				// CHECK-ZFH-ILP32-LABEL: @f16_scalar_stack_1(
				// CHECK-ZFH-ILP32-NEXT: entry:
				// CHECK-ZFH-ILP32-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
				// CHECK-ZFH-ILP32-NEXT: [[B_ADDR:%.*]] = alloca i64, align 8
				// CHECK-ZFH-ILP32-NEXT: [[C_ADDR:%.*]] = alloca float, align 4
				// CHECK-ZFH-ILP32-NEXT: [[D_ADDR:%.*]] = alloca half, align 2
				// CHECK-ZFH-ILP32-NEXT: store i32 [[A:%.]], i32 [[A_ADDR]], align 4
				// CHECK-ZFH-ILP32-NEXT: store i64 [[B:%.]], i64 [[B_ADDR]], align 8
				// CHECK-ZFH-ILP32-NEXT: store float [[C:%.]], float [[C_ADDR]], align 4
				// CHECK-ZFH-ILP32-NEXT: store half [[D:%.]], half [[D_ADDR]], align 2
				// CHECK-ZFH-ILP32-NEXT: [[TMP0:%.]] = load half, half [[D_ADDR]], align 2
				// CHECK-ZFH-ILP32-NEXT: ret half [[TMP0]]
				//
				// CHECK-NOZFH-ILP32F-LABEL: @f16_scalar_stack_1(
				// CHECK-NOZFH-ILP32F-NEXT: entry:
				// CHECK-NOZFH-ILP32F-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
				// CHECK-NOZFH-ILP32F-NEXT: [[B_ADDR:%.*]] = alloca i64, align 8
				// CHECK-NOZFH-ILP32F-NEXT: [[C_ADDR:%.*]] = alloca float, align 4
				// CHECK-NOZFH-ILP32F-NEXT: [[D_ADDR:%.*]] = alloca half, align 2
				// CHECK-NOZFH-ILP32F-NEXT: store i32 [[A:%.]], i32 [[A_ADDR]], align 4
				// CHECK-NOZFH-ILP32F-NEXT: store i64 [[B:%.]], i64 [[B_ADDR]], align 8
				// CHECK-NOZFH-ILP32F-NEXT: store float [[C:%.]], float [[C_ADDR]], align 4
				// CHECK-NOZFH-ILP32F-NEXT: store half [[D:%.]], half [[D_ADDR]], align 2
				// CHECK-NOZFH-ILP32F-NEXT: [[TMP0:%.]] = load half, half [[D_ADDR]], align 2
				// CHECK-NOZFH-ILP32F-NEXT: ret half [[TMP0]]
				//
				// CHECK-ZFH-ILP32F-LABEL: @f16_scalar_stack_1(
				// CHECK-ZFH-ILP32F-NEXT: entry:
				// CHECK-ZFH-ILP32F-NEXT: [[A_ADDR:%.*]] = alloca i32, align 4
				// CHECK-ZFH-ILP32F-NEXT: [[B_ADDR:%.*]] = alloca i64, align 8
				// CHECK-ZFH-ILP32F-NEXT: [[C_ADDR:%.*]] = alloca float, align 4
				// CHECK-ZFH-ILP32F-NEXT: [[D_ADDR:%.*]] = alloca half, align 2
				// CHECK-ZFH-ILP32F-NEXT: store i32 [[A:%.]], i32 [[A_ADDR]], align 4
				// CHECK-ZFH-ILP32F-NEXT: store i64 [[B:%.]], i64 [[B_ADDR]], align 8
				// CHECK-ZFH-ILP32F-NEXT: store float [[C:%.]], float [[C_ADDR]], align 4
				// CHECK-ZFH-ILP32F-NEXT: store half [[D:%.]], half [[D_ADDR]], align 2
				// CHECK-ZFH-ILP32F-NEXT: [[TMP0:%.]] = load half, half [[D_ADDR]], align 2
				// CHECK-ZFH-ILP32F-NEXT: ret half [[TMP0]]
				//
				_Float16 f16_scalar_stack_1(int32_t a, int64_t b, float c, _Float16 d) {
				return d;
				}

This is an archive of the discontinued LLVM Phabricator instance.

[RISCV] Add ABI testing for Float16.Needs ReviewPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 381835

clang/test/CodeGen/RISCV/Float16.c

[RISCV] Add ABI testing for Float16.
Needs ReviewPublic