Diff 341818

clang/include/clang/Basic/arm_mve.td

Show First 20 Lines • Show All 1,537 Lines • ▼ Show 20 Lines	in {
def "vreinterpretq_" # desttype: Intrinsic<		def "vreinterpretq_" # desttype: Intrinsic<
VecOf<desttype>, (args Vector:$x), (vreinterpret $x, VecOf<desttype>)>;		VecOf<desttype>, (args Vector:$x), (vreinterpret $x, VecOf<desttype>)>;
}		}
}		}

let params = T.All in {		let params = T.All in {
let pnt = PNT_None in {		let pnt = PNT_None in {
def vcreateq: Intrinsic<Vector, (args u64:$a, u64:$b),		def vcreateq: Intrinsic<Vector, (args u64:$a, u64:$b),
(bitcast (ielt_const (ielt_const (undef VecOf<u64>), $a, 0),		(vreinterpret (ielt_const (ielt_const (undef VecOf<u64>), $a, 0),
$b, 1), Vector)>;		$b, 1), Vector)>;
def vuninitializedq: Intrinsic<Vector, (args), (undef Vector)>;		def vuninitializedq: Intrinsic<Vector, (args), (undef Vector)>;
}		}

// This is the polymorphic form of vuninitializedq, which takes no type		// This is the polymorphic form of vuninitializedq, which takes no type
// suffix, but takes an _unevaluated_ vector parameter and returns an		// suffix, but takes an _unevaluated_ vector parameter and returns an
// uninitialized vector of the same vector type.		// uninitialized vector of the same vector type.
//		//
▲ Show 20 Lines • Show All 55 Lines • Show Last 20 Lines

clang/test/CodeGen/arm-mve-intrinsics/admin.c

	// NOTE: Assertions have been autogenerated by utils/update_cc_test_checks.py			// NOTE: Assertions have been autogenerated by utils/update_cc_test_checks.py
	// RUN: %clang_cc1 -triple thumbv8.1m.main-none-none-eabi -target-feature +mve.fp -mfloat-abi hard -fallow-half-arguments-and-returns -O0 -disable-O0-optnone -S -emit-llvm -o - %s \| opt -S -mem2reg -sroa -early-cse \| FileCheck %s			// RUN: %clang_cc1 -triple thumbv8.1m.main-none-none-eabi -target-feature +mve.fp -mfloat-abi hard -fallow-half-arguments-and-returns -O0 -disable-O0-optnone -S -emit-llvm -o - %s \| opt -S -mem2reg -sroa -early-cse \| FileCheck %s --check-prefix=CHECK-LE
				dmgreenUnsubmitted Done Reply Inline Actions Is this updated with update_cc_test_checks? It may make the output more verbose, but it will be more standard. dmgreen: Is this updated with update_cc_test_checks? It may make the output more verbose, but it will…
	// RUN: %clang_cc1 -triple thumbv8.1m.main-none-none-eabi -target-feature +mve.fp -mfloat-abi hard -fallow-half-arguments-and-returns -O0 -disable-O0-optnone -DPOLYMORPHIC -S -emit-llvm -o - %s \| opt -S -mem2reg -sroa -early-cse \| FileCheck %s			// RUN: %clang_cc1 -triple thumbv8.1m.main-none-none-eabi -target-feature +mve.fp -mfloat-abi hard -fallow-half-arguments-and-returns -O0 -disable-O0-optnone -DPOLYMORPHIC -S -emit-llvm -o - %s \| opt -S -mem2reg -sroa -early-cse \| FileCheck %s --check-prefix=CHECK-LE
				// RUN: %clang_cc1 -triple thumbebv8.1m.main-none-none-eabi -target-feature +mve.fp -mfloat-abi hard -fallow-half-arguments-and-returns -O0 -disable-O0-optnone -S -emit-llvm -o - %s \| opt -S -mem2reg -sroa -early-cse \| FileCheck %s --check-prefix=CHECK-BE
				// RUN: %clang_cc1 -triple thumbebv8.1m.main-none-none-eabi -target-feature +mve.fp -mfloat-abi hard -fallow-half-arguments-and-returns -O0 -disable-O0-optnone -DPOLYMORPHIC -S -emit-llvm -o - %s \| opt -S -mem2reg -sroa -early-cse \| FileCheck %s --check-prefix=CHECK-BE


	#include <arm_mve.h>			#include <arm_mve.h>

	// CHECK-LABEL: @test_vcreateq_f16(			// CHECK-LE-LABEL: @test_vcreateq_f16(
	// CHECK-NEXT: entry:			// CHECK-LE-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0			// CHECK-LE-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0
	// CHECK-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1			// CHECK-LE-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1
	// CHECK-NEXT: [[TMP2:%.*]] = bitcast <2 x i64> [[TMP1]] to <8 x half>			// CHECK-LE-NEXT: [[TMP2:%.*]] = bitcast <2 x i64> [[TMP1]] to <8 x half>
	// CHECK-NEXT: ret <8 x half> [[TMP2]]			// CHECK-LE-NEXT: ret <8 x half> [[TMP2]]
				//
				// CHECK-BE-LABEL: @test_vcreateq_f16(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0
				// CHECK-BE-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1
				// CHECK-BE-NEXT: [[TMP2:%.*]] = call <8 x half> @llvm.arm.mve.vreinterpretq.v8f16.v2i64(<2 x i64> [[TMP1]])
				// CHECK-BE-NEXT: ret <8 x half> [[TMP2]]
	//			//
	float16x8_t test_vcreateq_f16(uint64_t a, uint64_t b)			float16x8_t test_vcreateq_f16(uint64_t a, uint64_t b)
	{			{
	return vcreateq_f16(a, b);			return vcreateq_f16(a, b);
	}			}

	// CHECK-LABEL: @test_vcreateq_f32(			// CHECK-LE-LABEL: @test_vcreateq_f32(
	// CHECK-NEXT: entry:			// CHECK-LE-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0			// CHECK-LE-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0
	// CHECK-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1			// CHECK-LE-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1
	// CHECK-NEXT: [[TMP2:%.*]] = bitcast <2 x i64> [[TMP1]] to <4 x float>			// CHECK-LE-NEXT: [[TMP2:%.*]] = bitcast <2 x i64> [[TMP1]] to <4 x float>
	// CHECK-NEXT: ret <4 x float> [[TMP2]]			// CHECK-LE-NEXT: ret <4 x float> [[TMP2]]
				//
				// CHECK-BE-LABEL: @test_vcreateq_f32(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0
				// CHECK-BE-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1
				// CHECK-BE-NEXT: [[TMP2:%.*]] = call <4 x float> @llvm.arm.mve.vreinterpretq.v4f32.v2i64(<2 x i64> [[TMP1]])
				// CHECK-BE-NEXT: ret <4 x float> [[TMP2]]
	//			//
	float32x4_t test_vcreateq_f32(uint64_t a, uint64_t b)			float32x4_t test_vcreateq_f32(uint64_t a, uint64_t b)
	{			{
	return vcreateq_f32(a, b);			return vcreateq_f32(a, b);
	}			}

	// CHECK-LABEL: @test_vcreateq_s16(			// CHECK-LE-LABEL: @test_vcreateq_s16(
	// CHECK-NEXT: entry:			// CHECK-LE-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0			// CHECK-LE-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0
	// CHECK-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1			// CHECK-LE-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1
	// CHECK-NEXT: [[TMP2:%.*]] = bitcast <2 x i64> [[TMP1]] to <8 x i16>			// CHECK-LE-NEXT: [[TMP2:%.*]] = bitcast <2 x i64> [[TMP1]] to <8 x i16>
	// CHECK-NEXT: ret <8 x i16> [[TMP2]]			// CHECK-LE-NEXT: ret <8 x i16> [[TMP2]]
				//
				// CHECK-BE-LABEL: @test_vcreateq_s16(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0
				// CHECK-BE-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1
				// CHECK-BE-NEXT: [[TMP2:%.*]] = call <8 x i16> @llvm.arm.mve.vreinterpretq.v8i16.v2i64(<2 x i64> [[TMP1]])
				// CHECK-BE-NEXT: ret <8 x i16> [[TMP2]]
	//			//
	int16x8_t test_vcreateq_s16(uint64_t a, uint64_t b)			int16x8_t test_vcreateq_s16(uint64_t a, uint64_t b)
	{			{
	return vcreateq_s16(a, b);			return vcreateq_s16(a, b);
	}			}

	// CHECK-LABEL: @test_vcreateq_s32(			// CHECK-LE-LABEL: @test_vcreateq_s32(
	// CHECK-NEXT: entry:			// CHECK-LE-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0			// CHECK-LE-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0
	// CHECK-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1			// CHECK-LE-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1
	// CHECK-NEXT: [[TMP2:%.*]] = bitcast <2 x i64> [[TMP1]] to <4 x i32>			// CHECK-LE-NEXT: [[TMP2:%.*]] = bitcast <2 x i64> [[TMP1]] to <4 x i32>
	// CHECK-NEXT: ret <4 x i32> [[TMP2]]			// CHECK-LE-NEXT: ret <4 x i32> [[TMP2]]
				//
				// CHECK-BE-LABEL: @test_vcreateq_s32(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0
				// CHECK-BE-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1
				// CHECK-BE-NEXT: [[TMP2:%.*]] = call <4 x i32> @llvm.arm.mve.vreinterpretq.v4i32.v2i64(<2 x i64> [[TMP1]])
				// CHECK-BE-NEXT: ret <4 x i32> [[TMP2]]
	//			//
	int32x4_t test_vcreateq_s32(uint64_t a, uint64_t b)			int32x4_t test_vcreateq_s32(uint64_t a, uint64_t b)
	{			{
	return vcreateq_s32(a, b);			return vcreateq_s32(a, b);
	}			}

	// CHECK-LABEL: @test_vcreateq_s64(			// CHECK-LABEL: @test_vcreateq_s64(
				dmgreenUnsubmitted Done Reply Inline Actions You have to remove the old checks - the script isn't very good at that. What would probably be even better would be if it used --check-prefixes=CHECK,CHECK-LE. That way it should be able to common the snippets that don't change between LE and BE. dmgreen: You have to remove the old checks - the script isn't very good at that. What would probably be…
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0			// CHECK-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0
	// CHECK-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1			// CHECK-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1
	// CHECK-NEXT: ret <2 x i64> [[TMP1]]			// CHECK-NEXT: ret <2 x i64> [[TMP1]]
				// CHECK-LE-LABEL: @test_vcreateq_s64(
				// CHECK-LE-NEXT: entry:
				// CHECK-LE-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0
				// CHECK-LE-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1
				// CHECK-LE-NEXT: ret <2 x i64> [[TMP1]]
				//
				// CHECK-BE-LABEL: @test_vcreateq_s64(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0
				// CHECK-BE-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1
				// CHECK-BE-NEXT: ret <2 x i64> [[TMP1]]
				MarkMurrayARMUnsubmitted Not Done Reply Inline Actions Surely there is a problem here also? MarkMurrayARM: Surely there is a problem here also?
				dmgreenUnsubmitted Not Done Reply Inline Actions I don't see why these would be a problem. Can you elaborate? dmgreen: I don't see why these would be a problem. Can you elaborate?
				MarkMurrayARMUnsubmitted Not Done Reply Inline Actions I'm wondering if they need to be swapped in the BE case. MarkMurrayARM: I'm wondering if they need to be swapped in the BE case.
				tmathesonAuthorUnsubmitted Done Reply Inline Actions vcreateq is not endianness aware, it just inserts the two given 64 bit values `a` and `b` into the low and high lanes respectively. The bit representation of each 64 bit int will be different but that is not shown here. Therefore the IR is the same for big and little endian. I have also confirmed locally with runtime output: uint64x2_t w = vcreateq_u64(0x0000000000000001, 0x0000000000000002); printf("%d:%llu\n", 0, vgetq_lane_u64(w, 0)); printf("%d:%llu\n", 1, vgetq_lane_u64(w, 1)); which gives for both little and bit endian (with this patch): 0:1 1:2 tmatheson: vcreateq is not endianness aware, it just inserts the two given 64 bit values `a` and `b` into…
	//			//
	int64x2_t test_vcreateq_s64(uint64_t a, uint64_t b)			int64x2_t test_vcreateq_s64(uint64_t a, uint64_t b)
	{			{
	return vcreateq_s64(a, b);			return vcreateq_s64(a, b);
	}			}

	// CHECK-LABEL: @test_vcreateq_s8(			// CHECK-LE-LABEL: @test_vcreateq_s8(
	// CHECK-NEXT: entry:			// CHECK-LE-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0			// CHECK-LE-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0
	// CHECK-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1			// CHECK-LE-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1
	// CHECK-NEXT: [[TMP2:%.*]] = bitcast <2 x i64> [[TMP1]] to <16 x i8>			// CHECK-LE-NEXT: [[TMP2:%.*]] = bitcast <2 x i64> [[TMP1]] to <16 x i8>
	// CHECK-NEXT: ret <16 x i8> [[TMP2]]			// CHECK-LE-NEXT: ret <16 x i8> [[TMP2]]
				//
				// CHECK-BE-LABEL: @test_vcreateq_s8(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0
				// CHECK-BE-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1
				// CHECK-BE-NEXT: [[TMP2:%.*]] = call <16 x i8> @llvm.arm.mve.vreinterpretq.v16i8.v2i64(<2 x i64> [[TMP1]])
				// CHECK-BE-NEXT: ret <16 x i8> [[TMP2]]
	//			//
	int8x16_t test_vcreateq_s8(uint64_t a, uint64_t b)			int8x16_t test_vcreateq_s8(uint64_t a, uint64_t b)
	{			{
	return vcreateq_s8(a, b);			return vcreateq_s8(a, b);
	}			}

	// CHECK-LABEL: @test_vcreateq_u16(			// CHECK-LE-LABEL: @test_vcreateq_u16(
	// CHECK-NEXT: entry:			// CHECK-LE-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0			// CHECK-LE-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0
	// CHECK-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1			// CHECK-LE-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1
	// CHECK-NEXT: [[TMP2:%.*]] = bitcast <2 x i64> [[TMP1]] to <8 x i16>			// CHECK-LE-NEXT: [[TMP2:%.*]] = bitcast <2 x i64> [[TMP1]] to <8 x i16>
	// CHECK-NEXT: ret <8 x i16> [[TMP2]]			// CHECK-LE-NEXT: ret <8 x i16> [[TMP2]]
				//
				// CHECK-BE-LABEL: @test_vcreateq_u16(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0
				// CHECK-BE-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1
				// CHECK-BE-NEXT: [[TMP2:%.*]] = call <8 x i16> @llvm.arm.mve.vreinterpretq.v8i16.v2i64(<2 x i64> [[TMP1]])
				// CHECK-BE-NEXT: ret <8 x i16> [[TMP2]]
	//			//
	uint16x8_t test_vcreateq_u16(uint64_t a, uint64_t b)			uint16x8_t test_vcreateq_u16(uint64_t a, uint64_t b)
	{			{
	return vcreateq_u16(a, b);			return vcreateq_u16(a, b);
	}			}

	// CHECK-LABEL: @test_vcreateq_u32(			// CHECK-LE-LABEL: @test_vcreateq_u32(
	// CHECK-NEXT: entry:			// CHECK-LE-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0			// CHECK-LE-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0
	// CHECK-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1			// CHECK-LE-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1
	// CHECK-NEXT: [[TMP2:%.*]] = bitcast <2 x i64> [[TMP1]] to <4 x i32>			// CHECK-LE-NEXT: [[TMP2:%.*]] = bitcast <2 x i64> [[TMP1]] to <4 x i32>
	// CHECK-NEXT: ret <4 x i32> [[TMP2]]			// CHECK-LE-NEXT: ret <4 x i32> [[TMP2]]
				//
				// CHECK-BE-LABEL: @test_vcreateq_u32(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0
				// CHECK-BE-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1
				// CHECK-BE-NEXT: [[TMP2:%.*]] = call <4 x i32> @llvm.arm.mve.vreinterpretq.v4i32.v2i64(<2 x i64> [[TMP1]])
				// CHECK-BE-NEXT: ret <4 x i32> [[TMP2]]
	//			//
	uint32x4_t test_vcreateq_u32(uint64_t a, uint64_t b)			uint32x4_t test_vcreateq_u32(uint64_t a, uint64_t b)
	{			{
	return vcreateq_u32(a, b);			return vcreateq_u32(a, b);
	}			}

	// CHECK-LABEL: @test_vcreateq_u64(			// CHECK-LABEL: @test_vcreateq_u64(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0			// CHECK-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0
	// CHECK-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1			// CHECK-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1
	// CHECK-NEXT: ret <2 x i64> [[TMP1]]			// CHECK-NEXT: ret <2 x i64> [[TMP1]]
				// CHECK-LE-LABEL: @test_vcreateq_u64(
				// CHECK-LE-NEXT: entry:
				// CHECK-LE-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0
				// CHECK-LE-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1
				// CHECK-LE-NEXT: ret <2 x i64> [[TMP1]]
				//
				// CHECK-BE-LABEL: @test_vcreateq_u64(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0
				// CHECK-BE-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1
				// CHECK-BE-NEXT: ret <2 x i64> [[TMP1]]
				MarkMurrayARMUnsubmitted Not Done Reply Inline Actions And a problem here also (with BE)? MarkMurrayARM: And a problem here also (with BE)?
				tmathesonAuthorUnsubmitted Done Reply Inline Actions See above tmatheson: See above
	//			//
	uint64x2_t test_vcreateq_u64(uint64_t a, uint64_t b)			uint64x2_t test_vcreateq_u64(uint64_t a, uint64_t b)
	{			{
	return vcreateq_u64(a, b);			return vcreateq_u64(a, b);
	}			}

	// CHECK-LABEL: @test_vcreateq_u8(			// CHECK-LE-LABEL: @test_vcreateq_u8(
	// CHECK-NEXT: entry:			// CHECK-LE-NEXT: entry:
	// CHECK-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0			// CHECK-LE-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0
	// CHECK-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1			// CHECK-LE-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1
	// CHECK-NEXT: [[TMP2:%.*]] = bitcast <2 x i64> [[TMP1]] to <16 x i8>			// CHECK-LE-NEXT: [[TMP2:%.*]] = bitcast <2 x i64> [[TMP1]] to <16 x i8>
	// CHECK-NEXT: ret <16 x i8> [[TMP2]]			// CHECK-LE-NEXT: ret <16 x i8> [[TMP2]]
				//
				// CHECK-BE-LABEL: @test_vcreateq_u8(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: [[TMP0:%.]] = insertelement <2 x i64> undef, i64 [[A:%.]], i64 0
				// CHECK-BE-NEXT: [[TMP1:%.]] = insertelement <2 x i64> [[TMP0]], i64 [[B:%.]], i64 1
				// CHECK-BE-NEXT: [[TMP2:%.*]] = call <16 x i8> @llvm.arm.mve.vreinterpretq.v16i8.v2i64(<2 x i64> [[TMP1]])
				// CHECK-BE-NEXT: ret <16 x i8> [[TMP2]]
	//			//
	uint8x16_t test_vcreateq_u8(uint64_t a, uint64_t b)			uint8x16_t test_vcreateq_u8(uint64_t a, uint64_t b)
	{			{
	return vcreateq_u8(a, b);			return vcreateq_u8(a, b);
	}			}

	// CHECK-LABEL: @test_vuninitializedq_polymorphic_f16(			// CHECK-LABEL: @test_vuninitializedq_polymorphic_f16(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: ret <8 x half> undef			// CHECK-NEXT: ret <8 x half> undef
				// CHECK-LE-LABEL: @test_vuninitializedq_polymorphic_f16(
				// CHECK-LE-NEXT: entry:
				// CHECK-LE-NEXT: ret <8 x half> undef
				//
				// CHECK-BE-LABEL: @test_vuninitializedq_polymorphic_f16(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: ret <8 x half> undef
	//			//
	float16x8_t test_vuninitializedq_polymorphic_f16(float16x8_t (*funcptr)(void))			float16x8_t test_vuninitializedq_polymorphic_f16(float16x8_t (*funcptr)(void))
	{			{
	return vuninitializedq(funcptr());			return vuninitializedq(funcptr());
	}			}

	// CHECK-LABEL: @test_vuninitializedq_polymorphic_f32(			// CHECK-LABEL: @test_vuninitializedq_polymorphic_f32(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: ret <4 x float> undef			// CHECK-NEXT: ret <4 x float> undef
				// CHECK-LE-LABEL: @test_vuninitializedq_polymorphic_f32(
				// CHECK-LE-NEXT: entry:
				// CHECK-LE-NEXT: ret <4 x float> undef
				//
				// CHECK-BE-LABEL: @test_vuninitializedq_polymorphic_f32(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: ret <4 x float> undef
	//			//
	float32x4_t test_vuninitializedq_polymorphic_f32(float32x4_t (*funcptr)(void))			float32x4_t test_vuninitializedq_polymorphic_f32(float32x4_t (*funcptr)(void))
	{			{
	return vuninitializedq(funcptr());			return vuninitializedq(funcptr());
	}			}

	// CHECK-LABEL: @test_vuninitializedq_polymorphic_s8(			// CHECK-LABEL: @test_vuninitializedq_polymorphic_s8(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: ret <16 x i8> undef			// CHECK-NEXT: ret <16 x i8> undef
				// CHECK-LE-LABEL: @test_vuninitializedq_polymorphic_s8(
				// CHECK-LE-NEXT: entry:
				// CHECK-LE-NEXT: ret <16 x i8> undef
				//
				// CHECK-BE-LABEL: @test_vuninitializedq_polymorphic_s8(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: ret <16 x i8> undef
	//			//
	int8x16_t test_vuninitializedq_polymorphic_s8(int8x16_t (*funcptr)(void))			int8x16_t test_vuninitializedq_polymorphic_s8(int8x16_t (*funcptr)(void))
	{			{
	return vuninitializedq(funcptr());			return vuninitializedq(funcptr());
	}			}

	// CHECK-LABEL: @test_vuninitializedq_polymorphic_s16(			// CHECK-LABEL: @test_vuninitializedq_polymorphic_s16(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: ret <8 x i16> undef			// CHECK-NEXT: ret <8 x i16> undef
				// CHECK-LE-LABEL: @test_vuninitializedq_polymorphic_s16(
				// CHECK-LE-NEXT: entry:
				// CHECK-LE-NEXT: ret <8 x i16> undef
				//
				// CHECK-BE-LABEL: @test_vuninitializedq_polymorphic_s16(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: ret <8 x i16> undef
	//			//
	int16x8_t test_vuninitializedq_polymorphic_s16(int16x8_t (*funcptr)(void))			int16x8_t test_vuninitializedq_polymorphic_s16(int16x8_t (*funcptr)(void))
	{			{
	return vuninitializedq(funcptr());			return vuninitializedq(funcptr());
	}			}

	// CHECK-LABEL: @test_vuninitializedq_polymorphic_s32(			// CHECK-LABEL: @test_vuninitializedq_polymorphic_s32(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: ret <4 x i32> undef			// CHECK-NEXT: ret <4 x i32> undef
				// CHECK-LE-LABEL: @test_vuninitializedq_polymorphic_s32(
				// CHECK-LE-NEXT: entry:
				// CHECK-LE-NEXT: ret <4 x i32> undef
				//
				// CHECK-BE-LABEL: @test_vuninitializedq_polymorphic_s32(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: ret <4 x i32> undef
	//			//
	int32x4_t test_vuninitializedq_polymorphic_s32(int32x4_t (*funcptr)(void))			int32x4_t test_vuninitializedq_polymorphic_s32(int32x4_t (*funcptr)(void))
	{			{
	return vuninitializedq(funcptr());			return vuninitializedq(funcptr());
	}			}

	// CHECK-LABEL: @test_vuninitializedq_polymorphic_s64(			// CHECK-LABEL: @test_vuninitializedq_polymorphic_s64(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: ret <2 x i64> undef			// CHECK-NEXT: ret <2 x i64> undef
				// CHECK-LE-LABEL: @test_vuninitializedq_polymorphic_s64(
				// CHECK-LE-NEXT: entry:
				// CHECK-LE-NEXT: ret <2 x i64> undef
				//
				// CHECK-BE-LABEL: @test_vuninitializedq_polymorphic_s64(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: ret <2 x i64> undef
	//			//
	int64x2_t test_vuninitializedq_polymorphic_s64(int64x2_t (*funcptr)(void))			int64x2_t test_vuninitializedq_polymorphic_s64(int64x2_t (*funcptr)(void))
	{			{
	return vuninitializedq(funcptr());			return vuninitializedq(funcptr());
	}			}

	// CHECK-LABEL: @test_vuninitializedq_polymorphic_u8(			// CHECK-LABEL: @test_vuninitializedq_polymorphic_u8(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: ret <16 x i8> undef			// CHECK-NEXT: ret <16 x i8> undef
				// CHECK-LE-LABEL: @test_vuninitializedq_polymorphic_u8(
				// CHECK-LE-NEXT: entry:
				// CHECK-LE-NEXT: ret <16 x i8> undef
				//
				// CHECK-BE-LABEL: @test_vuninitializedq_polymorphic_u8(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: ret <16 x i8> undef
	//			//
	uint8x16_t test_vuninitializedq_polymorphic_u8(uint8x16_t (*funcptr)(void))			uint8x16_t test_vuninitializedq_polymorphic_u8(uint8x16_t (*funcptr)(void))
	{			{
	return vuninitializedq(funcptr());			return vuninitializedq(funcptr());
	}			}

	// CHECK-LABEL: @test_vuninitializedq_polymorphic_u16(			// CHECK-LABEL: @test_vuninitializedq_polymorphic_u16(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: ret <8 x i16> undef			// CHECK-NEXT: ret <8 x i16> undef
				// CHECK-LE-LABEL: @test_vuninitializedq_polymorphic_u16(
				// CHECK-LE-NEXT: entry:
				// CHECK-LE-NEXT: ret <8 x i16> undef
				//
				// CHECK-BE-LABEL: @test_vuninitializedq_polymorphic_u16(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: ret <8 x i16> undef
	//			//
	uint16x8_t test_vuninitializedq_polymorphic_u16(uint16x8_t (*funcptr)(void))			uint16x8_t test_vuninitializedq_polymorphic_u16(uint16x8_t (*funcptr)(void))
	{			{
	return vuninitializedq(funcptr());			return vuninitializedq(funcptr());
	}			}

	// CHECK-LABEL: @test_vuninitializedq_polymorphic_u32(			// CHECK-LABEL: @test_vuninitializedq_polymorphic_u32(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: ret <4 x i32> undef			// CHECK-NEXT: ret <4 x i32> undef
				// CHECK-LE-LABEL: @test_vuninitializedq_polymorphic_u32(
				// CHECK-LE-NEXT: entry:
				// CHECK-LE-NEXT: ret <4 x i32> undef
				//
				// CHECK-BE-LABEL: @test_vuninitializedq_polymorphic_u32(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: ret <4 x i32> undef
	//			//
	uint32x4_t test_vuninitializedq_polymorphic_u32(uint32x4_t (*funcptr)(void))			uint32x4_t test_vuninitializedq_polymorphic_u32(uint32x4_t (*funcptr)(void))
	{			{
	return vuninitializedq(funcptr());			return vuninitializedq(funcptr());
	}			}

	// CHECK-LABEL: @test_vuninitializedq_polymorphic_u64(			// CHECK-LABEL: @test_vuninitializedq_polymorphic_u64(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: ret <2 x i64> undef			// CHECK-NEXT: ret <2 x i64> undef
				// CHECK-LE-LABEL: @test_vuninitializedq_polymorphic_u64(
				// CHECK-LE-NEXT: entry:
				// CHECK-LE-NEXT: ret <2 x i64> undef
				//
				// CHECK-BE-LABEL: @test_vuninitializedq_polymorphic_u64(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: ret <2 x i64> undef
	//			//
	uint64x2_t test_vuninitializedq_polymorphic_u64(uint64x2_t (*funcptr)(void))			uint64x2_t test_vuninitializedq_polymorphic_u64(uint64x2_t (*funcptr)(void))
	{			{
	return vuninitializedq(funcptr());			return vuninitializedq(funcptr());
	}			}

	// CHECK-LABEL: @test_vuninitializedq_f16(			// CHECK-LABEL: @test_vuninitializedq_f16(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: ret <8 x half> undef			// CHECK-NEXT: ret <8 x half> undef
				// CHECK-LE-LABEL: @test_vuninitializedq_f16(
				// CHECK-LE-NEXT: entry:
				// CHECK-LE-NEXT: ret <8 x half> undef
				//
				// CHECK-BE-LABEL: @test_vuninitializedq_f16(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: ret <8 x half> undef
	//			//
	float16x8_t test_vuninitializedq_f16(void)			float16x8_t test_vuninitializedq_f16(void)
	{			{
	return vuninitializedq_f16();			return vuninitializedq_f16();
	}			}

	// CHECK-LABEL: @test_vuninitializedq_f32(			// CHECK-LABEL: @test_vuninitializedq_f32(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: ret <4 x float> undef			// CHECK-NEXT: ret <4 x float> undef
				// CHECK-LE-LABEL: @test_vuninitializedq_f32(
				// CHECK-LE-NEXT: entry:
				// CHECK-LE-NEXT: ret <4 x float> undef
				//
				// CHECK-BE-LABEL: @test_vuninitializedq_f32(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: ret <4 x float> undef
	//			//
	float32x4_t test_vuninitializedq_f32(void)			float32x4_t test_vuninitializedq_f32(void)
	{			{
	return vuninitializedq_f32();			return vuninitializedq_f32();
	}			}

	// CHECK-LABEL: @test_vuninitializedq_s16(			// CHECK-LABEL: @test_vuninitializedq_s16(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: ret <8 x i16> undef			// CHECK-NEXT: ret <8 x i16> undef
				// CHECK-LE-LABEL: @test_vuninitializedq_s16(
				// CHECK-LE-NEXT: entry:
				// CHECK-LE-NEXT: ret <8 x i16> undef
				//
				// CHECK-BE-LABEL: @test_vuninitializedq_s16(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: ret <8 x i16> undef
	//			//
	int16x8_t test_vuninitializedq_s16(void)			int16x8_t test_vuninitializedq_s16(void)
	{			{
	return vuninitializedq_s16();			return vuninitializedq_s16();
	}			}

	// CHECK-LABEL: @test_vuninitializedq_s32(			// CHECK-LABEL: @test_vuninitializedq_s32(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: ret <4 x i32> undef			// CHECK-NEXT: ret <4 x i32> undef
				// CHECK-LE-LABEL: @test_vuninitializedq_s32(
				// CHECK-LE-NEXT: entry:
				// CHECK-LE-NEXT: ret <4 x i32> undef
				//
				// CHECK-BE-LABEL: @test_vuninitializedq_s32(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: ret <4 x i32> undef
	//			//
	int32x4_t test_vuninitializedq_s32(void)			int32x4_t test_vuninitializedq_s32(void)
	{			{
	return vuninitializedq_s32();			return vuninitializedq_s32();
	}			}

	// CHECK-LABEL: @test_vuninitializedq_s64(			// CHECK-LABEL: @test_vuninitializedq_s64(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: ret <2 x i64> undef			// CHECK-NEXT: ret <2 x i64> undef
				// CHECK-LE-LABEL: @test_vuninitializedq_s64(
				// CHECK-LE-NEXT: entry:
				// CHECK-LE-NEXT: ret <2 x i64> undef
				//
				// CHECK-BE-LABEL: @test_vuninitializedq_s64(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: ret <2 x i64> undef
	//			//
	int64x2_t test_vuninitializedq_s64(void)			int64x2_t test_vuninitializedq_s64(void)
	{			{
	return vuninitializedq_s64();			return vuninitializedq_s64();
	}			}

	// CHECK-LABEL: @test_vuninitializedq_s8(			// CHECK-LABEL: @test_vuninitializedq_s8(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: ret <16 x i8> undef			// CHECK-NEXT: ret <16 x i8> undef
				// CHECK-LE-LABEL: @test_vuninitializedq_s8(
				// CHECK-LE-NEXT: entry:
				// CHECK-LE-NEXT: ret <16 x i8> undef
				//
				// CHECK-BE-LABEL: @test_vuninitializedq_s8(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: ret <16 x i8> undef
	//			//
	int8x16_t test_vuninitializedq_s8(void)			int8x16_t test_vuninitializedq_s8(void)
	{			{
	return vuninitializedq_s8();			return vuninitializedq_s8();
	}			}

	// CHECK-LABEL: @test_vuninitializedq_u16(			// CHECK-LABEL: @test_vuninitializedq_u16(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: ret <8 x i16> undef			// CHECK-NEXT: ret <8 x i16> undef
				// CHECK-LE-LABEL: @test_vuninitializedq_u16(
				// CHECK-LE-NEXT: entry:
				// CHECK-LE-NEXT: ret <8 x i16> undef
				//
				// CHECK-BE-LABEL: @test_vuninitializedq_u16(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: ret <8 x i16> undef
	//			//
	uint16x8_t test_vuninitializedq_u16(void)			uint16x8_t test_vuninitializedq_u16(void)
	{			{
	return vuninitializedq_u16();			return vuninitializedq_u16();
	}			}

	// CHECK-LABEL: @test_vuninitializedq_u32(			// CHECK-LABEL: @test_vuninitializedq_u32(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: ret <4 x i32> undef			// CHECK-NEXT: ret <4 x i32> undef
				// CHECK-LE-LABEL: @test_vuninitializedq_u32(
				// CHECK-LE-NEXT: entry:
				// CHECK-LE-NEXT: ret <4 x i32> undef
				//
				// CHECK-BE-LABEL: @test_vuninitializedq_u32(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: ret <4 x i32> undef
	//			//
	uint32x4_t test_vuninitializedq_u32(void)			uint32x4_t test_vuninitializedq_u32(void)
	{			{
	return vuninitializedq_u32();			return vuninitializedq_u32();
	}			}

	// CHECK-LABEL: @test_vuninitializedq_u64(			// CHECK-LABEL: @test_vuninitializedq_u64(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: ret <2 x i64> undef			// CHECK-NEXT: ret <2 x i64> undef
				// CHECK-LE-LABEL: @test_vuninitializedq_u64(
				// CHECK-LE-NEXT: entry:
				// CHECK-LE-NEXT: ret <2 x i64> undef
				//
				// CHECK-BE-LABEL: @test_vuninitializedq_u64(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: ret <2 x i64> undef
	//			//
	uint64x2_t test_vuninitializedq_u64(void)			uint64x2_t test_vuninitializedq_u64(void)
	{			{
	return vuninitializedq_u64();			return vuninitializedq_u64();
	}			}

	// CHECK-LABEL: @test_vuninitializedq_u8(			// CHECK-LABEL: @test_vuninitializedq_u8(
	// CHECK-NEXT: entry:			// CHECK-NEXT: entry:
	// CHECK-NEXT: ret <16 x i8> undef			// CHECK-NEXT: ret <16 x i8> undef
				// CHECK-LE-LABEL: @test_vuninitializedq_u8(
				// CHECK-LE-NEXT: entry:
				// CHECK-LE-NEXT: ret <16 x i8> undef
				//
				// CHECK-BE-LABEL: @test_vuninitializedq_u8(
				// CHECK-BE-NEXT: entry:
				// CHECK-BE-NEXT: ret <16 x i8> undef
	//			//
	uint8x16_t test_vuninitializedq_u8(void)			uint8x16_t test_vuninitializedq_u8(void)
	{			{
	return vuninitializedq_u8();			return vuninitializedq_u8();
	}			}

This is an archive of the discontinued LLVM Phabricator instance.

[ARM][MVE] vcreateq lane ordering for big endian
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 341818

clang/include/clang/Basic/arm_mve.td

clang/test/CodeGen/arm-mve-intrinsics/admin.c

This is an archive of the discontinued LLVM Phabricator instance.

[ARM][MVE] vcreateq lane ordering for big endianClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 341818

clang/include/clang/Basic/arm_mve.td

clang/test/CodeGen/arm-mve-intrinsics/admin.c

[ARM][MVE] vcreateq lane ordering for big endian
ClosedPublic