This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
clang/
-
lib/CodeGen/
-
CodeGen/
-
CGBuiltin.cpp
-
test/CodeGen/
-
CodeGen/
-
aarch64-neon-intrinsics.c
-
aarch64-neon-scalar-x-indexed-elem.c
-
aarch64-v8.1a-neon-intrinsics.c

Differential D59615

[AArch64] When creating SISD intrinsic calls widen scalar args into a zero vectors, not undef
AbandonedPublic

Authored by aemerson on Mar 20 2019, 2:39 PM.

Download Raw Diff

Details

Reviewers

kristof.beyls
t.p.northover
olista01

Summary

Some intrinsics like saturating operations may set flags, so if the scalar arg is inserted into an undef vector, the undef elements may trigger unwanted side effects. Using zero should be safer than undef.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

aemerson created this revision.Mar 20 2019, 2:39 PM

Herald added subscribers: arphaman, javed.absar. · View Herald TranscriptMar 20 2019, 2:39 PM

Did you look into a scalar variant of the intrinsic call instead? These instructions have non-vector variants (e.g. sqadd s0, s0, s0), and that's actually why the intrinsics exist in the first place. It'd be a shame to always require this extra work.

In D59615#1439153, @t.p.northover wrote:

Did you look into a scalar variant of the intrinsic call instead? These instructions have non-vector variants (e.g. sqadd s0, s0, s0), and that's actually why the intrinsics exist in the first place. It'd be a shame to always require this extra work.

This looks quite involved as the scalar intrinsics have illegal types etc, and at the moment I don't have a lot of time to spend on this, it was just intended as a fix for the unstable tests: http://lab.llvm.org:8011/builders/clang-cmake-aarch64-lld/builds/6257

Ping. I've filed PR41260 for the code quality issue.

Does anyone object to this? I'd like to get it off my review dashboard one way or the other.

Herald added a subscriber: danielkiss. · View Herald TranscriptAug 10 2020, 10:48 PM

I see two issues here:

We're still generating the wrong instruction.
The intrinsic is marked readnone, so any code that depends on whether it sets saturation flags is likely broken anyway.

Given the layers of wrongness here, this seems like a marginal improvement.

Despite all that, I guess this is an improvement... but please at least make the comment in the code reflect this discussion.

Seems no one is enthusiastic about this change, so I'm going to drop it.

Revision Contents

Path

Size

clang/

lib/

CodeGen/

CGBuiltin.cpp

7 lines

test/

CodeGen/

aarch64-neon-intrinsics.c

160 lines

aarch64-neon-scalar-x-indexed-elem.c

24 lines

aarch64-v8.1a-neon-intrinsics.c

48 lines

Diff 191586

clang/lib/CodeGen/CGBuiltin.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 5,044 Lines • ▼ Show 20 Lines	if (Ops[j]->getType()->getPrimitiveSizeInBits() ==
ArgTy->getPrimitiveSizeInBits())		ArgTy->getPrimitiveSizeInBits())
continue;		continue;

assert(ArgTy->isVectorTy() && !Ops[j]->getType()->isVectorTy());		assert(ArgTy->isVectorTy() && !Ops[j]->getType()->isVectorTy());
// The constant argument to an _n_ intrinsic always has Int32Ty, so truncate		// The constant argument to an _n_ intrinsic always has Int32Ty, so truncate
// it before inserting.		// it before inserting.
Ops[j] =		Ops[j] =
CGF.Builder.CreateTruncOrBitCast(Ops[j], ArgTy->getVectorElementType());		CGF.Builder.CreateTruncOrBitCast(Ops[j], ArgTy->getVectorElementType());
Ops[j] =		// If we use undef some intrinsics like vqshrns_n_u32 might set the
CGF.Builder.CreateInsertElement(UndefValue::get(ArgTy), Ops[j], C0);		// saturation flag with the undef elements, so instead insert into a zero
		// vector so we don't get unwanted side effects.
		Value *ZeroVector = Constant::getNullValue(cast<llvm::VectorType>(ArgTy));
		Ops[j] = CGF.Builder.CreateInsertElement(ZeroVector, Ops[j], C0);
}		}

Value *Result = CGF.EmitNeonCall(F, Ops, s);		Value *Result = CGF.EmitNeonCall(F, Ops, s);
llvm::Type *ResultType = CGF.ConvertType(E->getType());		llvm::Type *ResultType = CGF.ConvertType(E->getType());
if (ResultType->getPrimitiveSizeInBits() <		if (ResultType->getPrimitiveSizeInBits() <
Result->getType()->getPrimitiveSizeInBits())		Result->getType()->getPrimitiveSizeInBits())
return CGF.Builder.CreateExtractElement(Result, C0);		return CGF.Builder.CreateExtractElement(Result, C0);

▲ Show 20 Lines • Show All 8,867 Lines • Show Last 20 Lines

clang/test/CodeGen/aarch64-neon-intrinsics.c

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 8,397 Lines • ▼ Show 20 Lines
	// CHECK-LABEL: @test_vsubd_u64(			// CHECK-LABEL: @test_vsubd_u64(
	// CHECK: [[VSUBD_I:%.*]] = sub i64 %a, %b			// CHECK: [[VSUBD_I:%.*]] = sub i64 %a, %b
	// CHECK: ret i64 [[VSUBD_I]]			// CHECK: ret i64 [[VSUBD_I]]
	uint64_t test_vsubd_u64(uint64_t a, uint64_t b) {			uint64_t test_vsubd_u64(uint64_t a, uint64_t b) {
	return vsubd_u64(a, b);			return vsubd_u64(a, b);
	}			}

	// CHECK-LABEL: @test_vqaddb_s8(			// CHECK-LABEL: @test_vqaddb_s8(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> undef, i8 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %a, i64 0
	// CHECK: [[TMP1:%.*]] = insertelement <8 x i8> undef, i8 %b, i64 0			// CHECK: [[TMP1:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %b, i64 0
	// CHECK: [[VQADDB_S8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqadd.v8i8(<8 x i8> [[TMP0]], <8 x i8> [[TMP1]])			// CHECK: [[VQADDB_S8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqadd.v8i8(<8 x i8> [[TMP0]], <8 x i8> [[TMP1]])
	// CHECK: [[TMP2:%.*]] = extractelement <8 x i8> [[VQADDB_S8_I]], i64 0			// CHECK: [[TMP2:%.*]] = extractelement <8 x i8> [[VQADDB_S8_I]], i64 0
	// CHECK: ret i8 [[TMP2]]			// CHECK: ret i8 [[TMP2]]
	int8_t test_vqaddb_s8(int8_t a, int8_t b) {			int8_t test_vqaddb_s8(int8_t a, int8_t b) {
	return vqaddb_s8(a, b);			return vqaddb_s8(a, b);
	}			}

	// CHECK-LABEL: @test_vqaddh_s16(			// CHECK-LABEL: @test_vqaddh_s16(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> undef, i16 %b, i64 0			// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %b, i64 0
	// CHECK: [[VQADDH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqadd.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])			// CHECK: [[VQADDH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqadd.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])
	// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VQADDH_S16_I]], i64 0			// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VQADDH_S16_I]], i64 0
	// CHECK: ret i16 [[TMP2]]			// CHECK: ret i16 [[TMP2]]
	int16_t test_vqaddh_s16(int16_t a, int16_t b) {			int16_t test_vqaddh_s16(int16_t a, int16_t b) {
	return vqaddh_s16(a, b);			return vqaddh_s16(a, b);
	}			}

	// CHECK-LABEL: @test_vqadds_s32(			// CHECK-LABEL: @test_vqadds_s32(
	// CHECK: [[VQADDS_S32_I:%.*]] = call i32 @llvm.aarch64.neon.sqadd.i32(i32 %a, i32 %b)			// CHECK: [[VQADDS_S32_I:%.*]] = call i32 @llvm.aarch64.neon.sqadd.i32(i32 %a, i32 %b)
	// CHECK: ret i32 [[VQADDS_S32_I]]			// CHECK: ret i32 [[VQADDS_S32_I]]
	int32_t test_vqadds_s32(int32_t a, int32_t b) {			int32_t test_vqadds_s32(int32_t a, int32_t b) {
	return vqadds_s32(a, b);			return vqadds_s32(a, b);
	}			}

	// CHECK-LABEL: @test_vqaddd_s64(			// CHECK-LABEL: @test_vqaddd_s64(
	// CHECK: [[VQADDD_S64_I:%.*]] = call i64 @llvm.aarch64.neon.sqadd.i64(i64 %a, i64 %b)			// CHECK: [[VQADDD_S64_I:%.*]] = call i64 @llvm.aarch64.neon.sqadd.i64(i64 %a, i64 %b)
	// CHECK: ret i64 [[VQADDD_S64_I]]			// CHECK: ret i64 [[VQADDD_S64_I]]
	int64_t test_vqaddd_s64(int64_t a, int64_t b) {			int64_t test_vqaddd_s64(int64_t a, int64_t b) {
	return vqaddd_s64(a, b);			return vqaddd_s64(a, b);
	}			}

	// CHECK-LABEL: @test_vqaddb_u8(			// CHECK-LABEL: @test_vqaddb_u8(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> undef, i8 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %a, i64 0
	// CHECK: [[TMP1:%.*]] = insertelement <8 x i8> undef, i8 %b, i64 0			// CHECK: [[TMP1:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %b, i64 0
	// CHECK: [[VQADDB_U8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.uqadd.v8i8(<8 x i8> [[TMP0]], <8 x i8> [[TMP1]])			// CHECK: [[VQADDB_U8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.uqadd.v8i8(<8 x i8> [[TMP0]], <8 x i8> [[TMP1]])
	// CHECK: [[TMP2:%.*]] = extractelement <8 x i8> [[VQADDB_U8_I]], i64 0			// CHECK: [[TMP2:%.*]] = extractelement <8 x i8> [[VQADDB_U8_I]], i64 0
	// CHECK: ret i8 [[TMP2]]			// CHECK: ret i8 [[TMP2]]
	uint8_t test_vqaddb_u8(uint8_t a, uint8_t b) {			uint8_t test_vqaddb_u8(uint8_t a, uint8_t b) {
	return vqaddb_u8(a, b);			return vqaddb_u8(a, b);
	}			}

	// CHECK-LABEL: @test_vqaddh_u16(			// CHECK-LABEL: @test_vqaddh_u16(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> undef, i16 %b, i64 0			// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %b, i64 0
	// CHECK: [[VQADDH_U16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.uqadd.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])			// CHECK: [[VQADDH_U16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.uqadd.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])
	// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VQADDH_U16_I]], i64 0			// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VQADDH_U16_I]], i64 0
	// CHECK: ret i16 [[TMP2]]			// CHECK: ret i16 [[TMP2]]
	uint16_t test_vqaddh_u16(uint16_t a, uint16_t b) {			uint16_t test_vqaddh_u16(uint16_t a, uint16_t b) {
	return vqaddh_u16(a, b);			return vqaddh_u16(a, b);
	}			}

	// CHECK-LABEL: @test_vqadds_u32(			// CHECK-LABEL: @test_vqadds_u32(
	// CHECK: [[VQADDS_U32_I:%.*]] = call i32 @llvm.aarch64.neon.uqadd.i32(i32 %a, i32 %b)			// CHECK: [[VQADDS_U32_I:%.*]] = call i32 @llvm.aarch64.neon.uqadd.i32(i32 %a, i32 %b)
	// CHECK: ret i32 [[VQADDS_U32_I]]			// CHECK: ret i32 [[VQADDS_U32_I]]
	uint32_t test_vqadds_u32(uint32_t a, uint32_t b) {			uint32_t test_vqadds_u32(uint32_t a, uint32_t b) {
	return vqadds_u32(a, b);			return vqadds_u32(a, b);
	}			}

	// CHECK-LABEL: @test_vqaddd_u64(			// CHECK-LABEL: @test_vqaddd_u64(
	// CHECK: [[VQADDD_U64_I:%.*]] = call i64 @llvm.aarch64.neon.uqadd.i64(i64 %a, i64 %b)			// CHECK: [[VQADDD_U64_I:%.*]] = call i64 @llvm.aarch64.neon.uqadd.i64(i64 %a, i64 %b)
	// CHECK: ret i64 [[VQADDD_U64_I]]			// CHECK: ret i64 [[VQADDD_U64_I]]
	uint64_t test_vqaddd_u64(uint64_t a, uint64_t b) {			uint64_t test_vqaddd_u64(uint64_t a, uint64_t b) {
	return vqaddd_u64(a, b);			return vqaddd_u64(a, b);
	}			}

	// CHECK-LABEL: @test_vqsubb_s8(			// CHECK-LABEL: @test_vqsubb_s8(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> undef, i8 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %a, i64 0
	// CHECK: [[TMP1:%.*]] = insertelement <8 x i8> undef, i8 %b, i64 0			// CHECK: [[TMP1:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %b, i64 0
	// CHECK: [[VQSUBB_S8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqsub.v8i8(<8 x i8> [[TMP0]], <8 x i8> [[TMP1]])			// CHECK: [[VQSUBB_S8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqsub.v8i8(<8 x i8> [[TMP0]], <8 x i8> [[TMP1]])
	// CHECK: [[TMP2:%.*]] = extractelement <8 x i8> [[VQSUBB_S8_I]], i64 0			// CHECK: [[TMP2:%.*]] = extractelement <8 x i8> [[VQSUBB_S8_I]], i64 0
	// CHECK: ret i8 [[TMP2]]			// CHECK: ret i8 [[TMP2]]
	int8_t test_vqsubb_s8(int8_t a, int8_t b) {			int8_t test_vqsubb_s8(int8_t a, int8_t b) {
	return vqsubb_s8(a, b);			return vqsubb_s8(a, b);
	}			}

	// CHECK-LABEL: @test_vqsubh_s16(			// CHECK-LABEL: @test_vqsubh_s16(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> undef, i16 %b, i64 0			// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %b, i64 0
	// CHECK: [[VQSUBH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqsub.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])			// CHECK: [[VQSUBH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqsub.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])
	// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VQSUBH_S16_I]], i64 0			// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VQSUBH_S16_I]], i64 0
	// CHECK: ret i16 [[TMP2]]			// CHECK: ret i16 [[TMP2]]
	int16_t test_vqsubh_s16(int16_t a, int16_t b) {			int16_t test_vqsubh_s16(int16_t a, int16_t b) {
	return vqsubh_s16(a, b);			return vqsubh_s16(a, b);
	}			}

	// CHECK-LABEL: @test_vqsubs_s32(			// CHECK-LABEL: @test_vqsubs_s32(
	// CHECK: [[VQSUBS_S32_I:%.*]] = call i32 @llvm.aarch64.neon.sqsub.i32(i32 %a, i32 %b)			// CHECK: [[VQSUBS_S32_I:%.*]] = call i32 @llvm.aarch64.neon.sqsub.i32(i32 %a, i32 %b)
	// CHECK: ret i32 [[VQSUBS_S32_I]]			// CHECK: ret i32 [[VQSUBS_S32_I]]
	int32_t test_vqsubs_s32(int32_t a, int32_t b) {			int32_t test_vqsubs_s32(int32_t a, int32_t b) {
	return vqsubs_s32(a, b);			return vqsubs_s32(a, b);
	}			}

	// CHECK-LABEL: @test_vqsubd_s64(			// CHECK-LABEL: @test_vqsubd_s64(
	// CHECK: [[VQSUBD_S64_I:%.*]] = call i64 @llvm.aarch64.neon.sqsub.i64(i64 %a, i64 %b)			// CHECK: [[VQSUBD_S64_I:%.*]] = call i64 @llvm.aarch64.neon.sqsub.i64(i64 %a, i64 %b)
	// CHECK: ret i64 [[VQSUBD_S64_I]]			// CHECK: ret i64 [[VQSUBD_S64_I]]
	int64_t test_vqsubd_s64(int64_t a, int64_t b) {			int64_t test_vqsubd_s64(int64_t a, int64_t b) {
	return vqsubd_s64(a, b);			return vqsubd_s64(a, b);
	}			}

	// CHECK-LABEL: @test_vqsubb_u8(			// CHECK-LABEL: @test_vqsubb_u8(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> undef, i8 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %a, i64 0
	// CHECK: [[TMP1:%.*]] = insertelement <8 x i8> undef, i8 %b, i64 0			// CHECK: [[TMP1:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %b, i64 0
	// CHECK: [[VQSUBB_U8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.uqsub.v8i8(<8 x i8> [[TMP0]], <8 x i8> [[TMP1]])			// CHECK: [[VQSUBB_U8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.uqsub.v8i8(<8 x i8> [[TMP0]], <8 x i8> [[TMP1]])
	// CHECK: [[TMP2:%.*]] = extractelement <8 x i8> [[VQSUBB_U8_I]], i64 0			// CHECK: [[TMP2:%.*]] = extractelement <8 x i8> [[VQSUBB_U8_I]], i64 0
	// CHECK: ret i8 [[TMP2]]			// CHECK: ret i8 [[TMP2]]
	uint8_t test_vqsubb_u8(uint8_t a, uint8_t b) {			uint8_t test_vqsubb_u8(uint8_t a, uint8_t b) {
	return vqsubb_u8(a, b);			return vqsubb_u8(a, b);
	}			}

	// CHECK-LABEL: @test_vqsubh_u16(			// CHECK-LABEL: @test_vqsubh_u16(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> undef, i16 %b, i64 0			// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %b, i64 0
	// CHECK: [[VQSUBH_U16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.uqsub.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])			// CHECK: [[VQSUBH_U16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.uqsub.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])
	// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VQSUBH_U16_I]], i64 0			// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VQSUBH_U16_I]], i64 0
	// CHECK: ret i16 [[TMP2]]			// CHECK: ret i16 [[TMP2]]
	uint16_t test_vqsubh_u16(uint16_t a, uint16_t b) {			uint16_t test_vqsubh_u16(uint16_t a, uint16_t b) {
	return vqsubh_u16(a, b);			return vqsubh_u16(a, b);
	}			}

	// CHECK-LABEL: @test_vqsubs_u32(			// CHECK-LABEL: @test_vqsubs_u32(
	Show All 20 Lines
	// CHECK-LABEL: @test_vshld_u64(			// CHECK-LABEL: @test_vshld_u64(
	// CHECK: [[VSHLD_U64_I:%.*]] = call i64 @llvm.aarch64.neon.ushl.i64(i64 %a, i64 %b)			// CHECK: [[VSHLD_U64_I:%.*]] = call i64 @llvm.aarch64.neon.ushl.i64(i64 %a, i64 %b)
	// CHECK: ret i64 [[VSHLD_U64_I]]			// CHECK: ret i64 [[VSHLD_U64_I]]
	uint64_t test_vshld_u64(uint64_t a, uint64_t b) {			uint64_t test_vshld_u64(uint64_t a, uint64_t b) {
	return vshld_u64(a, b);			return vshld_u64(a, b);
	}			}

	// CHECK-LABEL: @test_vqshlb_s8(			// CHECK-LABEL: @test_vqshlb_s8(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> undef, i8 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %a, i64 0
	// CHECK: [[TMP1:%.*]] = insertelement <8 x i8> undef, i8 %b, i64 0			// CHECK: [[TMP1:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %b, i64 0
	// CHECK: [[VQSHLB_S8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqshl.v8i8(<8 x i8> [[TMP0]], <8 x i8> [[TMP1]])			// CHECK: [[VQSHLB_S8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqshl.v8i8(<8 x i8> [[TMP0]], <8 x i8> [[TMP1]])
	// CHECK: [[TMP2:%.*]] = extractelement <8 x i8> [[VQSHLB_S8_I]], i64 0			// CHECK: [[TMP2:%.*]] = extractelement <8 x i8> [[VQSHLB_S8_I]], i64 0
	// CHECK: ret i8 [[TMP2]]			// CHECK: ret i8 [[TMP2]]
	int8_t test_vqshlb_s8(int8_t a, int8_t b) {			int8_t test_vqshlb_s8(int8_t a, int8_t b) {
	return vqshlb_s8(a, b);			return vqshlb_s8(a, b);
	}			}

	// CHECK-LABEL: @test_vqshlh_s16(			// CHECK-LABEL: @test_vqshlh_s16(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> undef, i16 %b, i64 0			// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %b, i64 0
	// CHECK: [[VQSHLH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqshl.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])			// CHECK: [[VQSHLH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqshl.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])
	// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VQSHLH_S16_I]], i64 0			// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VQSHLH_S16_I]], i64 0
	// CHECK: ret i16 [[TMP2]]			// CHECK: ret i16 [[TMP2]]
	int16_t test_vqshlh_s16(int16_t a, int16_t b) {			int16_t test_vqshlh_s16(int16_t a, int16_t b) {
	return vqshlh_s16(a, b);			return vqshlh_s16(a, b);
	}			}

	// CHECK-LABEL: @test_vqshls_s32(			// CHECK-LABEL: @test_vqshls_s32(
	// CHECK: [[VQSHLS_S32_I:%.*]] = call i32 @llvm.aarch64.neon.sqshl.i32(i32 %a, i32 %b)			// CHECK: [[VQSHLS_S32_I:%.*]] = call i32 @llvm.aarch64.neon.sqshl.i32(i32 %a, i32 %b)
	// CHECK: ret i32 [[VQSHLS_S32_I]]			// CHECK: ret i32 [[VQSHLS_S32_I]]
	int32_t test_vqshls_s32(int32_t a, int32_t b) {			int32_t test_vqshls_s32(int32_t a, int32_t b) {
	return vqshls_s32(a, b);			return vqshls_s32(a, b);
	}			}

	// CHECK-LABEL: @test_vqshld_s64(			// CHECK-LABEL: @test_vqshld_s64(
	// CHECK: [[VQSHLD_S64_I:%.*]] = call i64 @llvm.aarch64.neon.sqshl.i64(i64 %a, i64 %b)			// CHECK: [[VQSHLD_S64_I:%.*]] = call i64 @llvm.aarch64.neon.sqshl.i64(i64 %a, i64 %b)
	// CHECK: ret i64 [[VQSHLD_S64_I]]			// CHECK: ret i64 [[VQSHLD_S64_I]]
	int64_t test_vqshld_s64(int64_t a, int64_t b) {			int64_t test_vqshld_s64(int64_t a, int64_t b) {
	return vqshld_s64(a, b);			return vqshld_s64(a, b);
	}			}

	// CHECK-LABEL: @test_vqshlb_u8(			// CHECK-LABEL: @test_vqshlb_u8(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> undef, i8 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %a, i64 0
	// CHECK: [[TMP1:%.*]] = insertelement <8 x i8> undef, i8 %b, i64 0			// CHECK: [[TMP1:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %b, i64 0
	// CHECK: [[VQSHLB_U8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.uqshl.v8i8(<8 x i8> [[TMP0]], <8 x i8> [[TMP1]])			// CHECK: [[VQSHLB_U8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.uqshl.v8i8(<8 x i8> [[TMP0]], <8 x i8> [[TMP1]])
	// CHECK: [[TMP2:%.*]] = extractelement <8 x i8> [[VQSHLB_U8_I]], i64 0			// CHECK: [[TMP2:%.*]] = extractelement <8 x i8> [[VQSHLB_U8_I]], i64 0
	// CHECK: ret i8 [[TMP2]]			// CHECK: ret i8 [[TMP2]]
	uint8_t test_vqshlb_u8(uint8_t a, uint8_t b) {			uint8_t test_vqshlb_u8(uint8_t a, uint8_t b) {
	return vqshlb_u8(a, b);			return vqshlb_u8(a, b);
	}			}

	// CHECK-LABEL: @test_vqshlh_u16(			// CHECK-LABEL: @test_vqshlh_u16(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> undef, i16 %b, i64 0			// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %b, i64 0
	// CHECK: [[VQSHLH_U16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.uqshl.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])			// CHECK: [[VQSHLH_U16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.uqshl.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])
	// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VQSHLH_U16_I]], i64 0			// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VQSHLH_U16_I]], i64 0
	// CHECK: ret i16 [[TMP2]]			// CHECK: ret i16 [[TMP2]]
	uint16_t test_vqshlh_u16(uint16_t a, uint16_t b) {			uint16_t test_vqshlh_u16(uint16_t a, uint16_t b) {
	return vqshlh_u16(a, b);			return vqshlh_u16(a, b);
	}			}

	// CHECK-LABEL: @test_vqshls_u32(			// CHECK-LABEL: @test_vqshls_u32(
	Show All 20 Lines
	// CHECK-LABEL: @test_vrshld_u64(			// CHECK-LABEL: @test_vrshld_u64(
	// CHECK: [[VRSHLD_U64_I:%.*]] = call i64 @llvm.aarch64.neon.urshl.i64(i64 %a, i64 %b)			// CHECK: [[VRSHLD_U64_I:%.*]] = call i64 @llvm.aarch64.neon.urshl.i64(i64 %a, i64 %b)
	// CHECK: ret i64 [[VRSHLD_U64_I]]			// CHECK: ret i64 [[VRSHLD_U64_I]]
	uint64_t test_vrshld_u64(uint64_t a, uint64_t b) {			uint64_t test_vrshld_u64(uint64_t a, uint64_t b) {
	return vrshld_u64(a, b);			return vrshld_u64(a, b);
	}			}

	// CHECK-LABEL: @test_vqrshlb_s8(			// CHECK-LABEL: @test_vqrshlb_s8(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> undef, i8 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %a, i64 0
	// CHECK: [[TMP1:%.*]] = insertelement <8 x i8> undef, i8 %b, i64 0			// CHECK: [[TMP1:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %b, i64 0
	// CHECK: [[VQRSHLB_S8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqrshl.v8i8(<8 x i8> [[TMP0]], <8 x i8> [[TMP1]])			// CHECK: [[VQRSHLB_S8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqrshl.v8i8(<8 x i8> [[TMP0]], <8 x i8> [[TMP1]])
	// CHECK: [[TMP2:%.*]] = extractelement <8 x i8> [[VQRSHLB_S8_I]], i64 0			// CHECK: [[TMP2:%.*]] = extractelement <8 x i8> [[VQRSHLB_S8_I]], i64 0
	// CHECK: ret i8 [[TMP2]]			// CHECK: ret i8 [[TMP2]]
	int8_t test_vqrshlb_s8(int8_t a, int8_t b) {			int8_t test_vqrshlb_s8(int8_t a, int8_t b) {
	return vqrshlb_s8(a, b);			return vqrshlb_s8(a, b);
	}			}

	// CHECK-LABEL: @test_vqrshlh_s16(			// CHECK-LABEL: @test_vqrshlh_s16(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> undef, i16 %b, i64 0			// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %b, i64 0
	// CHECK: [[VQRSHLH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrshl.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])			// CHECK: [[VQRSHLH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrshl.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])
	// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VQRSHLH_S16_I]], i64 0			// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VQRSHLH_S16_I]], i64 0
	// CHECK: ret i16 [[TMP2]]			// CHECK: ret i16 [[TMP2]]
	int16_t test_vqrshlh_s16(int16_t a, int16_t b) {			int16_t test_vqrshlh_s16(int16_t a, int16_t b) {
	return vqrshlh_s16(a, b);			return vqrshlh_s16(a, b);
	}			}

	// CHECK-LABEL: @test_vqrshls_s32(			// CHECK-LABEL: @test_vqrshls_s32(
	// CHECK: [[VQRSHLS_S32_I:%.*]] = call i32 @llvm.aarch64.neon.sqrshl.i32(i32 %a, i32 %b)			// CHECK: [[VQRSHLS_S32_I:%.*]] = call i32 @llvm.aarch64.neon.sqrshl.i32(i32 %a, i32 %b)
	// CHECK: ret i32 [[VQRSHLS_S32_I]]			// CHECK: ret i32 [[VQRSHLS_S32_I]]
	int32_t test_vqrshls_s32(int32_t a, int32_t b) {			int32_t test_vqrshls_s32(int32_t a, int32_t b) {
	return vqrshls_s32(a, b);			return vqrshls_s32(a, b);
	}			}

	// CHECK-LABEL: @test_vqrshld_s64(			// CHECK-LABEL: @test_vqrshld_s64(
	// CHECK: [[VQRSHLD_S64_I:%.*]] = call i64 @llvm.aarch64.neon.sqrshl.i64(i64 %a, i64 %b)			// CHECK: [[VQRSHLD_S64_I:%.*]] = call i64 @llvm.aarch64.neon.sqrshl.i64(i64 %a, i64 %b)
	// CHECK: ret i64 [[VQRSHLD_S64_I]]			// CHECK: ret i64 [[VQRSHLD_S64_I]]
	int64_t test_vqrshld_s64(int64_t a, int64_t b) {			int64_t test_vqrshld_s64(int64_t a, int64_t b) {
	return vqrshld_s64(a, b);			return vqrshld_s64(a, b);
	}			}

	// CHECK-LABEL: @test_vqrshlb_u8(			// CHECK-LABEL: @test_vqrshlb_u8(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> undef, i8 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %a, i64 0
	// CHECK: [[TMP1:%.*]] = insertelement <8 x i8> undef, i8 %b, i64 0			// CHECK: [[TMP1:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %b, i64 0
	// CHECK: [[VQRSHLB_U8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.uqrshl.v8i8(<8 x i8> [[TMP0]], <8 x i8> [[TMP1]])			// CHECK: [[VQRSHLB_U8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.uqrshl.v8i8(<8 x i8> [[TMP0]], <8 x i8> [[TMP1]])
	// CHECK: [[TMP2:%.*]] = extractelement <8 x i8> [[VQRSHLB_U8_I]], i64 0			// CHECK: [[TMP2:%.*]] = extractelement <8 x i8> [[VQRSHLB_U8_I]], i64 0
	// CHECK: ret i8 [[TMP2]]			// CHECK: ret i8 [[TMP2]]
	uint8_t test_vqrshlb_u8(uint8_t a, uint8_t b) {			uint8_t test_vqrshlb_u8(uint8_t a, uint8_t b) {
	return vqrshlb_u8(a, b);			return vqrshlb_u8(a, b);
	}			}

	// CHECK-LABEL: @test_vqrshlh_u16(			// CHECK-LABEL: @test_vqrshlh_u16(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> undef, i16 %b, i64 0			// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %b, i64 0
	// CHECK: [[VQRSHLH_U16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.uqrshl.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])			// CHECK: [[VQRSHLH_U16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.uqrshl.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])
	// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VQRSHLH_U16_I]], i64 0			// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VQRSHLH_U16_I]], i64 0
	// CHECK: ret i16 [[TMP2]]			// CHECK: ret i16 [[TMP2]]
	uint16_t test_vqrshlh_u16(uint16_t a, uint16_t b) {			uint16_t test_vqrshlh_u16(uint16_t a, uint16_t b) {
	return vqrshlh_u16(a, b);			return vqrshlh_u16(a, b);
	}			}

	// CHECK-LABEL: @test_vqrshls_u32(			// CHECK-LABEL: @test_vqrshls_u32(
	▲ Show 20 Lines • Show All 98 Lines • ▼ Show 20 Lines
	// CHECK: [[TMP0:%.*]] = bitcast <2 x double> %a to <16 x i8>			// CHECK: [[TMP0:%.*]] = bitcast <2 x double> %a to <16 x i8>
	// CHECK: [[VPMINQD_F64_I:%.*]] = call double @llvm.aarch64.neon.fminv.f64.v2f64(<2 x double> %a)			// CHECK: [[VPMINQD_F64_I:%.*]] = call double @llvm.aarch64.neon.fminv.f64.v2f64(<2 x double> %a)
	// CHECK: ret double [[VPMINQD_F64_I]]			// CHECK: ret double [[VPMINQD_F64_I]]
	float64_t test_vpminqd_f64(float64x2_t a) {			float64_t test_vpminqd_f64(float64x2_t a) {
	return vpminqd_f64(a);			return vpminqd_f64(a);
	}			}

	// CHECK-LABEL: @test_vqdmulhh_s16(			// CHECK-LABEL: @test_vqdmulhh_s16(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> undef, i16 %b, i64 0			// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %b, i64 0
	// CHECK: [[VQDMULHH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqdmulh.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])			// CHECK: [[VQDMULHH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqdmulh.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])
	// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VQDMULHH_S16_I]], i64 0			// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VQDMULHH_S16_I]], i64 0
	// CHECK: ret i16 [[TMP2]]			// CHECK: ret i16 [[TMP2]]
	int16_t test_vqdmulhh_s16(int16_t a, int16_t b) {			int16_t test_vqdmulhh_s16(int16_t a, int16_t b) {
	return vqdmulhh_s16(a, b);			return vqdmulhh_s16(a, b);
	}			}

	// CHECK-LABEL: @test_vqdmulhs_s32(			// CHECK-LABEL: @test_vqdmulhs_s32(
	// CHECK: [[VQDMULHS_S32_I:%.*]] = call i32 @llvm.aarch64.neon.sqdmulh.i32(i32 %a, i32 %b)			// CHECK: [[VQDMULHS_S32_I:%.*]] = call i32 @llvm.aarch64.neon.sqdmulh.i32(i32 %a, i32 %b)
	// CHECK: ret i32 [[VQDMULHS_S32_I]]			// CHECK: ret i32 [[VQDMULHS_S32_I]]
	int32_t test_vqdmulhs_s32(int32_t a, int32_t b) {			int32_t test_vqdmulhs_s32(int32_t a, int32_t b) {
	return vqdmulhs_s32(a, b);			return vqdmulhs_s32(a, b);
	}			}

	// CHECK-LABEL: @test_vqrdmulhh_s16(			// CHECK-LABEL: @test_vqrdmulhh_s16(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> undef, i16 %b, i64 0			// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %b, i64 0
	// CHECK: [[VQRDMULHH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrdmulh.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])			// CHECK: [[VQRDMULHH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrdmulh.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])
	// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VQRDMULHH_S16_I]], i64 0			// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VQRDMULHH_S16_I]], i64 0
	// CHECK: ret i16 [[TMP2]]			// CHECK: ret i16 [[TMP2]]
	int16_t test_vqrdmulhh_s16(int16_t a, int16_t b) {			int16_t test_vqrdmulhh_s16(int16_t a, int16_t b) {
	return vqrdmulhh_s16(a, b);			return vqrdmulhh_s16(a, b);
	}			}

	// CHECK-LABEL: @test_vqrdmulhs_s32(			// CHECK-LABEL: @test_vqrdmulhs_s32(
	▲ Show 20 Lines • Show All 4,973 Lines • ▼ Show 20 Lines
	// CHECK-LABEL: @test_vabsd_s64(			// CHECK-LABEL: @test_vabsd_s64(
	// CHECK: [[VABSD_S64_I:%.*]] = call i64 @llvm.aarch64.neon.abs.i64(i64 %a)			// CHECK: [[VABSD_S64_I:%.*]] = call i64 @llvm.aarch64.neon.abs.i64(i64 %a)
	// CHECK: ret i64 [[VABSD_S64_I]]			// CHECK: ret i64 [[VABSD_S64_I]]
	int64_t test_vabsd_s64(int64_t a) {			int64_t test_vabsd_s64(int64_t a) {
	return (int64_t)vabsd_s64(a);			return (int64_t)vabsd_s64(a);
	}			}

	// CHECK-LABEL: @test_vqabsb_s8(			// CHECK-LABEL: @test_vqabsb_s8(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> undef, i8 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %a, i64 0
	// CHECK: [[VQABSB_S8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqabs.v8i8(<8 x i8> [[TMP0]])			// CHECK: [[VQABSB_S8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqabs.v8i8(<8 x i8> [[TMP0]])
	// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQABSB_S8_I]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQABSB_S8_I]], i64 0
	// CHECK: ret i8 [[TMP1]]			// CHECK: ret i8 [[TMP1]]
	int8_t test_vqabsb_s8(int8_t a) {			int8_t test_vqabsb_s8(int8_t a) {
	return (int8_t)vqabsb_s8(a);			return (int8_t)vqabsb_s8(a);
	}			}

	// CHECK-LABEL: @test_vqabsh_s16(			// CHECK-LABEL: @test_vqabsh_s16(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[VQABSH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqabs.v4i16(<4 x i16> [[TMP0]])			// CHECK: [[VQABSH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqabs.v4i16(<4 x i16> [[TMP0]])
	// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQABSH_S16_I]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQABSH_S16_I]], i64 0
	// CHECK: ret i16 [[TMP1]]			// CHECK: ret i16 [[TMP1]]
	int16_t test_vqabsh_s16(int16_t a) {			int16_t test_vqabsh_s16(int16_t a) {
	return (int16_t)vqabsh_s16(a);			return (int16_t)vqabsh_s16(a);
	}			}

	// CHECK-LABEL: @test_vqabss_s32(			// CHECK-LABEL: @test_vqabss_s32(
	Show All 13 Lines
	// CHECK-LABEL: @test_vnegd_s64(			// CHECK-LABEL: @test_vnegd_s64(
	// CHECK: [[VNEGD_I:%.*]] = sub i64 0, %a			// CHECK: [[VNEGD_I:%.*]] = sub i64 0, %a
	// CHECK: ret i64 [[VNEGD_I]]			// CHECK: ret i64 [[VNEGD_I]]
	int64_t test_vnegd_s64(int64_t a) {			int64_t test_vnegd_s64(int64_t a) {
	return (int64_t)vnegd_s64(a);			return (int64_t)vnegd_s64(a);
	}			}

	// CHECK-LABEL: @test_vqnegb_s8(			// CHECK-LABEL: @test_vqnegb_s8(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> undef, i8 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %a, i64 0
	// CHECK: [[VQNEGB_S8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqneg.v8i8(<8 x i8> [[TMP0]])			// CHECK: [[VQNEGB_S8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqneg.v8i8(<8 x i8> [[TMP0]])
	// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQNEGB_S8_I]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQNEGB_S8_I]], i64 0
	// CHECK: ret i8 [[TMP1]]			// CHECK: ret i8 [[TMP1]]
	int8_t test_vqnegb_s8(int8_t a) {			int8_t test_vqnegb_s8(int8_t a) {
	return (int8_t)vqnegb_s8(a);			return (int8_t)vqnegb_s8(a);
	}			}

	// CHECK-LABEL: @test_vqnegh_s16(			// CHECK-LABEL: @test_vqnegh_s16(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[VQNEGH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqneg.v4i16(<4 x i16> [[TMP0]])			// CHECK: [[VQNEGH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqneg.v4i16(<4 x i16> [[TMP0]])
	// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQNEGH_S16_I]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQNEGH_S16_I]], i64 0
	// CHECK: ret i16 [[TMP1]]			// CHECK: ret i16 [[TMP1]]
	int16_t test_vqnegh_s16(int16_t a) {			int16_t test_vqnegh_s16(int16_t a) {
	return (int16_t)vqnegh_s16(a);			return (int16_t)vqnegh_s16(a);
	}			}

	// CHECK-LABEL: @test_vqnegs_s32(			// CHECK-LABEL: @test_vqnegs_s32(
	// CHECK: [[VQNEGS_S32_I:%.*]] = call i32 @llvm.aarch64.neon.sqneg.i32(i32 %a)			// CHECK: [[VQNEGS_S32_I:%.*]] = call i32 @llvm.aarch64.neon.sqneg.i32(i32 %a)
	// CHECK: ret i32 [[VQNEGS_S32_I]]			// CHECK: ret i32 [[VQNEGS_S32_I]]
	int32_t test_vqnegs_s32(int32_t a) {			int32_t test_vqnegs_s32(int32_t a) {
	return (int32_t)vqnegs_s32(a);			return (int32_t)vqnegs_s32(a);
	}			}

	// CHECK-LABEL: @test_vqnegd_s64(			// CHECK-LABEL: @test_vqnegd_s64(
	// CHECK: [[VQNEGD_S64_I:%.*]] = call i64 @llvm.aarch64.neon.sqneg.i64(i64 %a)			// CHECK: [[VQNEGD_S64_I:%.*]] = call i64 @llvm.aarch64.neon.sqneg.i64(i64 %a)
	// CHECK: ret i64 [[VQNEGD_S64_I]]			// CHECK: ret i64 [[VQNEGD_S64_I]]
	int64_t test_vqnegd_s64(int64_t a) {			int64_t test_vqnegd_s64(int64_t a) {
	return (int64_t)vqnegd_s64(a);			return (int64_t)vqnegd_s64(a);
	}			}

	// CHECK-LABEL: @test_vuqaddb_s8(			// CHECK-LABEL: @test_vuqaddb_s8(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> undef, i8 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %a, i64 0
	// CHECK: [[TMP1:%.*]] = insertelement <8 x i8> undef, i8 %b, i64 0			// CHECK: [[TMP1:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %b, i64 0
	// CHECK: [[VUQADDB_S8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.suqadd.v8i8(<8 x i8> [[TMP0]], <8 x i8> [[TMP1]])			// CHECK: [[VUQADDB_S8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.suqadd.v8i8(<8 x i8> [[TMP0]], <8 x i8> [[TMP1]])
	// CHECK: [[TMP2:%.*]] = extractelement <8 x i8> [[VUQADDB_S8_I]], i64 0			// CHECK: [[TMP2:%.*]] = extractelement <8 x i8> [[VUQADDB_S8_I]], i64 0
	// CHECK: ret i8 [[TMP2]]			// CHECK: ret i8 [[TMP2]]
	int8_t test_vuqaddb_s8(int8_t a, int8_t b) {			int8_t test_vuqaddb_s8(int8_t a, int8_t b) {
	return (int8_t)vuqaddb_s8(a, b);			return (int8_t)vuqaddb_s8(a, b);
	}			}

	// CHECK-LABEL: @test_vuqaddh_s16(			// CHECK-LABEL: @test_vuqaddh_s16(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> undef, i16 %b, i64 0			// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %b, i64 0
	// CHECK: [[VUQADDH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.suqadd.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])			// CHECK: [[VUQADDH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.suqadd.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])
	// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VUQADDH_S16_I]], i64 0			// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VUQADDH_S16_I]], i64 0
	// CHECK: ret i16 [[TMP2]]			// CHECK: ret i16 [[TMP2]]
	int16_t test_vuqaddh_s16(int16_t a, int16_t b) {			int16_t test_vuqaddh_s16(int16_t a, int16_t b) {
	return (int16_t)vuqaddh_s16(a, b);			return (int16_t)vuqaddh_s16(a, b);
	}			}

	// CHECK-LABEL: @test_vuqadds_s32(			// CHECK-LABEL: @test_vuqadds_s32(
	// CHECK: [[VUQADDS_S32_I:%.*]] = call i32 @llvm.aarch64.neon.suqadd.i32(i32 %a, i32 %b)			// CHECK: [[VUQADDS_S32_I:%.*]] = call i32 @llvm.aarch64.neon.suqadd.i32(i32 %a, i32 %b)
	// CHECK: ret i32 [[VUQADDS_S32_I]]			// CHECK: ret i32 [[VUQADDS_S32_I]]
	int32_t test_vuqadds_s32(int32_t a, int32_t b) {			int32_t test_vuqadds_s32(int32_t a, int32_t b) {
	return (int32_t)vuqadds_s32(a, b);			return (int32_t)vuqadds_s32(a, b);
	}			}

	// CHECK-LABEL: @test_vuqaddd_s64(			// CHECK-LABEL: @test_vuqaddd_s64(
	// CHECK: [[VUQADDD_S64_I:%.*]] = call i64 @llvm.aarch64.neon.suqadd.i64(i64 %a, i64 %b)			// CHECK: [[VUQADDD_S64_I:%.*]] = call i64 @llvm.aarch64.neon.suqadd.i64(i64 %a, i64 %b)
	// CHECK: ret i64 [[VUQADDD_S64_I]]			// CHECK: ret i64 [[VUQADDD_S64_I]]
	int64_t test_vuqaddd_s64(int64_t a, int64_t b) {			int64_t test_vuqaddd_s64(int64_t a, int64_t b) {
	return (int64_t)vuqaddd_s64(a, b);			return (int64_t)vuqaddd_s64(a, b);
	}			}

	// CHECK-LABEL: @test_vsqaddb_u8(			// CHECK-LABEL: @test_vsqaddb_u8(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> undef, i8 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %a, i64 0
	// CHECK: [[TMP1:%.*]] = insertelement <8 x i8> undef, i8 %b, i64 0			// CHECK: [[TMP1:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %b, i64 0
	// CHECK: [[VSQADDB_U8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.usqadd.v8i8(<8 x i8> [[TMP0]], <8 x i8> [[TMP1]])			// CHECK: [[VSQADDB_U8_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.usqadd.v8i8(<8 x i8> [[TMP0]], <8 x i8> [[TMP1]])
	// CHECK: [[TMP2:%.*]] = extractelement <8 x i8> [[VSQADDB_U8_I]], i64 0			// CHECK: [[TMP2:%.*]] = extractelement <8 x i8> [[VSQADDB_U8_I]], i64 0
	// CHECK: ret i8 [[TMP2]]			// CHECK: ret i8 [[TMP2]]
	uint8_t test_vsqaddb_u8(uint8_t a, uint8_t b) {			uint8_t test_vsqaddb_u8(uint8_t a, uint8_t b) {
	return (uint8_t)vsqaddb_u8(a, b);			return (uint8_t)vsqaddb_u8(a, b);
	}			}

	// CHECK-LABEL: @test_vsqaddh_u16(			// CHECK-LABEL: @test_vsqaddh_u16(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> undef, i16 %b, i64 0			// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %b, i64 0
	// CHECK: [[VSQADDH_U16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.usqadd.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])			// CHECK: [[VSQADDH_U16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.usqadd.v4i16(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])
	// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VSQADDH_U16_I]], i64 0			// CHECK: [[TMP2:%.*]] = extractelement <4 x i16> [[VSQADDH_U16_I]], i64 0
	// CHECK: ret i16 [[TMP2]]			// CHECK: ret i16 [[TMP2]]
	uint16_t test_vsqaddh_u16(uint16_t a, uint16_t b) {			uint16_t test_vsqaddh_u16(uint16_t a, uint16_t b) {
	return (uint16_t)vsqaddh_u16(a, b);			return (uint16_t)vsqaddh_u16(a, b);
	}			}

	// CHECK-LABEL: @test_vsqadds_u32(			// CHECK-LABEL: @test_vsqadds_u32(
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	// CHECK: [[VQDMLXL_I:%.*]] = call i64 @llvm.aarch64.neon.sqdmulls.scalar(i32 %b, i32 %c)			// CHECK: [[VQDMLXL_I:%.*]] = call i64 @llvm.aarch64.neon.sqdmulls.scalar(i32 %b, i32 %c)
	// CHECK: [[VQDMLXL1_I:%.*]] = call i64 @llvm.aarch64.neon.sqsub.i64(i64 %a, i64 [[VQDMLXL_I]])			// CHECK: [[VQDMLXL1_I:%.*]] = call i64 @llvm.aarch64.neon.sqsub.i64(i64 %a, i64 [[VQDMLXL_I]])
	// CHECK: ret i64 [[VQDMLXL1_I]]			// CHECK: ret i64 [[VQDMLXL1_I]]
	int64_t test_vqdmlsls_s32(int64_t a, int32_t b, int32_t c) {			int64_t test_vqdmlsls_s32(int64_t a, int32_t b, int32_t c) {
	return (int64_t)vqdmlsls_s32(a, b, c);			return (int64_t)vqdmlsls_s32(a, b, c);
	}			}

	// CHECK-LABEL: @test_vqdmullh_s16(			// CHECK-LABEL: @test_vqdmullh_s16(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> undef, i16 %b, i64 0			// CHECK: [[TMP1:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %b, i64 0
	// CHECK: [[VQDMULLH_S16_I:%.*]] = call <4 x i32> @llvm.aarch64.neon.sqdmull.v4i32(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])			// CHECK: [[VQDMULLH_S16_I:%.*]] = call <4 x i32> @llvm.aarch64.neon.sqdmull.v4i32(<4 x i16> [[TMP0]], <4 x i16> [[TMP1]])
	// CHECK: [[TMP2:%.*]] = extractelement <4 x i32> [[VQDMULLH_S16_I]], i64 0			// CHECK: [[TMP2:%.*]] = extractelement <4 x i32> [[VQDMULLH_S16_I]], i64 0
	// CHECK: ret i32 [[TMP2]]			// CHECK: ret i32 [[TMP2]]
	int32_t test_vqdmullh_s16(int16_t a, int16_t b) {			int32_t test_vqdmullh_s16(int16_t a, int16_t b) {
	return (int32_t)vqdmullh_s16(a, b);			return (int32_t)vqdmullh_s16(a, b);
	}			}

	// CHECK-LABEL: @test_vqdmulls_s32(			// CHECK-LABEL: @test_vqdmulls_s32(
	// CHECK: [[VQDMULLS_S32_I:%.*]] = call i64 @llvm.aarch64.neon.sqdmulls.scalar(i32 %a, i32 %b)			// CHECK: [[VQDMULLS_S32_I:%.*]] = call i64 @llvm.aarch64.neon.sqdmulls.scalar(i32 %a, i32 %b)
	// CHECK: ret i64 [[VQDMULLS_S32_I]]			// CHECK: ret i64 [[VQDMULLS_S32_I]]
	int64_t test_vqdmulls_s32(int32_t a, int32_t b) {			int64_t test_vqdmulls_s32(int32_t a, int32_t b) {
	return (int64_t)vqdmulls_s32(a, b);			return (int64_t)vqdmulls_s32(a, b);
	}			}

	// CHECK-LABEL: @test_vqmovunh_s16(			// CHECK-LABEL: @test_vqmovunh_s16(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[VQMOVUNH_S16_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqxtun.v8i8(<8 x i16> [[TMP0]])			// CHECK: [[VQMOVUNH_S16_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqxtun.v8i8(<8 x i16> [[TMP0]])
	// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQMOVUNH_S16_I]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQMOVUNH_S16_I]], i64 0
	// CHECK: ret i8 [[TMP1]]			// CHECK: ret i8 [[TMP1]]
	int8_t test_vqmovunh_s16(int16_t a) {			int8_t test_vqmovunh_s16(int16_t a) {
	return (int8_t)vqmovunh_s16(a);			return (int8_t)vqmovunh_s16(a);
	}			}

	// CHECK-LABEL: @test_vqmovuns_s32(			// CHECK-LABEL: @test_vqmovuns_s32(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i32> undef, i32 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i32> zeroinitializer, i32 %a, i64 0
	// CHECK: [[VQMOVUNS_S32_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqxtun.v4i16(<4 x i32> [[TMP0]])			// CHECK: [[VQMOVUNS_S32_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqxtun.v4i16(<4 x i32> [[TMP0]])
	// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQMOVUNS_S32_I]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQMOVUNS_S32_I]], i64 0
	// CHECK: ret i16 [[TMP1]]			// CHECK: ret i16 [[TMP1]]
	int16_t test_vqmovuns_s32(int32_t a) {			int16_t test_vqmovuns_s32(int32_t a) {
	return (int16_t)vqmovuns_s32(a);			return (int16_t)vqmovuns_s32(a);
	}			}

	// CHECK-LABEL: @test_vqmovund_s64(			// CHECK-LABEL: @test_vqmovund_s64(
	// CHECK: [[VQMOVUND_S64_I:%.*]] = call i32 @llvm.aarch64.neon.scalar.sqxtun.i32.i64(i64 %a)			// CHECK: [[VQMOVUND_S64_I:%.*]] = call i32 @llvm.aarch64.neon.scalar.sqxtun.i32.i64(i64 %a)
	// CHECK: ret i32 [[VQMOVUND_S64_I]]			// CHECK: ret i32 [[VQMOVUND_S64_I]]
	int32_t test_vqmovund_s64(int64_t a) {			int32_t test_vqmovund_s64(int64_t a) {
	return (int32_t)vqmovund_s64(a);			return (int32_t)vqmovund_s64(a);
	}			}

	// CHECK-LABEL: @test_vqmovnh_s16(			// CHECK-LABEL: @test_vqmovnh_s16(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[VQMOVNH_S16_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqxtn.v8i8(<8 x i16> [[TMP0]])			// CHECK: [[VQMOVNH_S16_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqxtn.v8i8(<8 x i16> [[TMP0]])
	// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQMOVNH_S16_I]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQMOVNH_S16_I]], i64 0
	// CHECK: ret i8 [[TMP1]]			// CHECK: ret i8 [[TMP1]]
	int8_t test_vqmovnh_s16(int16_t a) {			int8_t test_vqmovnh_s16(int16_t a) {
	return (int8_t)vqmovnh_s16(a);			return (int8_t)vqmovnh_s16(a);
	}			}

	// CHECK-LABEL: @test_vqmovns_s32(			// CHECK-LABEL: @test_vqmovns_s32(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i32> undef, i32 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i32> zeroinitializer, i32 %a, i64 0
	// CHECK: [[VQMOVNS_S32_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqxtn.v4i16(<4 x i32> [[TMP0]])			// CHECK: [[VQMOVNS_S32_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqxtn.v4i16(<4 x i32> [[TMP0]])
	// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQMOVNS_S32_I]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQMOVNS_S32_I]], i64 0
	// CHECK: ret i16 [[TMP1]]			// CHECK: ret i16 [[TMP1]]
	int16_t test_vqmovns_s32(int32_t a) {			int16_t test_vqmovns_s32(int32_t a) {
	return (int16_t)vqmovns_s32(a);			return (int16_t)vqmovns_s32(a);
	}			}

	// CHECK-LABEL: @test_vqmovnd_s64(			// CHECK-LABEL: @test_vqmovnd_s64(
	// CHECK: [[VQMOVND_S64_I:%.*]] = call i32 @llvm.aarch64.neon.scalar.sqxtn.i32.i64(i64 %a)			// CHECK: [[VQMOVND_S64_I:%.*]] = call i32 @llvm.aarch64.neon.scalar.sqxtn.i32.i64(i64 %a)
	// CHECK: ret i32 [[VQMOVND_S64_I]]			// CHECK: ret i32 [[VQMOVND_S64_I]]
	int32_t test_vqmovnd_s64(int64_t a) {			int32_t test_vqmovnd_s64(int64_t a) {
	return (int32_t)vqmovnd_s64(a);			return (int32_t)vqmovnd_s64(a);
	}			}

	// CHECK-LABEL: @test_vqmovnh_u16(			// CHECK-LABEL: @test_vqmovnh_u16(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[VQMOVNH_U16_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.uqxtn.v8i8(<8 x i16> [[TMP0]])			// CHECK: [[VQMOVNH_U16_I:%.*]] = call <8 x i8> @llvm.aarch64.neon.uqxtn.v8i8(<8 x i16> [[TMP0]])
	// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQMOVNH_U16_I]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQMOVNH_U16_I]], i64 0
	// CHECK: ret i8 [[TMP1]]			// CHECK: ret i8 [[TMP1]]
	int8_t test_vqmovnh_u16(int16_t a) {			int8_t test_vqmovnh_u16(int16_t a) {
	return (int8_t)vqmovnh_u16(a);			return (int8_t)vqmovnh_u16(a);
	}			}

	// CHECK-LABEL: @test_vqmovns_u32(			// CHECK-LABEL: @test_vqmovns_u32(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i32> undef, i32 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i32> zeroinitializer, i32 %a, i64 0
	// CHECK: [[VQMOVNS_U32_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.uqxtn.v4i16(<4 x i32> [[TMP0]])			// CHECK: [[VQMOVNS_U32_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.uqxtn.v4i16(<4 x i32> [[TMP0]])
	// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQMOVNS_U32_I]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQMOVNS_U32_I]], i64 0
	// CHECK: ret i16 [[TMP1]]			// CHECK: ret i16 [[TMP1]]
	int16_t test_vqmovns_u32(int32_t a) {			int16_t test_vqmovns_u32(int32_t a) {
	return (int16_t)vqmovns_u32(a);			return (int16_t)vqmovns_u32(a);
	}			}

	// CHECK-LABEL: @test_vqmovnd_u64(			// CHECK-LABEL: @test_vqmovnd_u64(
	▲ Show 20 Lines • Show All 403 Lines • ▼ Show 20 Lines
	// CHECK: [[TMP1:%.*]] = bitcast <8 x i8> [[TMP0]] to <1 x i64>			// CHECK: [[TMP1:%.*]] = bitcast <8 x i8> [[TMP0]] to <1 x i64>
	// CHECK: [[VSHL_N:%.*]] = shl <1 x i64> [[TMP1]], <i64 1>			// CHECK: [[VSHL_N:%.*]] = shl <1 x i64> [[TMP1]], <i64 1>
	// CHECK: ret <1 x i64> [[VSHL_N]]			// CHECK: ret <1 x i64> [[VSHL_N]]
	uint64x1_t test_vshl_n_u64(uint64x1_t a) {			uint64x1_t test_vshl_n_u64(uint64x1_t a) {
	return vshl_n_u64(a, 1);			return vshl_n_u64(a, 1);
	}			}

	// CHECK-LABEL: @test_vqshlb_n_s8(			// CHECK-LABEL: @test_vqshlb_n_s8(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> undef, i8 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %a, i64 0
	// CHECK: [[VQSHLB_N_S8:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqshl.v8i8(<8 x i8> [[TMP0]], <8 x i8> <i8 7, i8 undef, i8 undef, i8 undef, i8 undef, i8 undef, i8 undef, i8 undef>)			// CHECK: [[VQSHLB_N_S8:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqshl.v8i8(<8 x i8> [[TMP0]], <8 x i8> <i8 7, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0>)
	// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQSHLB_N_S8]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQSHLB_N_S8]], i64 0
	// CHECK: ret i8 [[TMP1]]			// CHECK: ret i8 [[TMP1]]
	int8_t test_vqshlb_n_s8(int8_t a) {			int8_t test_vqshlb_n_s8(int8_t a) {
	return (int8_t)vqshlb_n_s8(a, 7);			return (int8_t)vqshlb_n_s8(a, 7);
	}			}

	// CHECK-LABEL: @test_vqshlh_n_s16(			// CHECK-LABEL: @test_vqshlh_n_s16(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[VQSHLH_N_S16:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqshl.v4i16(<4 x i16> [[TMP0]], <4 x i16> <i16 15, i16 undef, i16 undef, i16 undef>)			// CHECK: [[VQSHLH_N_S16:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqshl.v4i16(<4 x i16> [[TMP0]], <4 x i16> <i16 15, i16 0, i16 0, i16 0>)
	// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQSHLH_N_S16]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQSHLH_N_S16]], i64 0
	// CHECK: ret i16 [[TMP1]]			// CHECK: ret i16 [[TMP1]]
	int16_t test_vqshlh_n_s16(int16_t a) {			int16_t test_vqshlh_n_s16(int16_t a) {
	return (int16_t)vqshlh_n_s16(a, 15);			return (int16_t)vqshlh_n_s16(a, 15);
	}			}

	// CHECK-LABEL: @test_vqshls_n_s32(			// CHECK-LABEL: @test_vqshls_n_s32(
	// CHECK: [[VQSHLS_N_S32:%.*]] = call i32 @llvm.aarch64.neon.sqshl.i32(i32 %a, i32 31)			// CHECK: [[VQSHLS_N_S32:%.*]] = call i32 @llvm.aarch64.neon.sqshl.i32(i32 %a, i32 31)
	▲ Show 20 Lines • Show All 132 Lines • ▼ Show 20 Lines
	// CHECK: [[VQSHL_N:%.*]] = bitcast <8 x i8> [[TMP0]] to <1 x i64>			// CHECK: [[VQSHL_N:%.*]] = bitcast <8 x i8> [[TMP0]] to <1 x i64>
	// CHECK: [[VQSHL_N1:%.*]] = call <1 x i64> @llvm.aarch64.neon.sqshl.v1i64(<1 x i64> [[VQSHL_N]], <1 x i64> <i64 1>)			// CHECK: [[VQSHL_N1:%.*]] = call <1 x i64> @llvm.aarch64.neon.sqshl.v1i64(<1 x i64> [[VQSHL_N]], <1 x i64> <i64 1>)
	// CHECK: ret <1 x i64> [[VQSHL_N1]]			// CHECK: ret <1 x i64> [[VQSHL_N1]]
	int64x1_t test_vqshl_n_s64(int64x1_t a) {			int64x1_t test_vqshl_n_s64(int64x1_t a) {
	return vqshl_n_s64(a, 1);			return vqshl_n_s64(a, 1);
	}			}

	// CHECK-LABEL: @test_vqshlb_n_u8(			// CHECK-LABEL: @test_vqshlb_n_u8(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> undef, i8 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %a, i64 0
	// CHECK: [[VQSHLB_N_U8:%.*]] = call <8 x i8> @llvm.aarch64.neon.uqshl.v8i8(<8 x i8> [[TMP0]], <8 x i8> <i8 7, i8 undef, i8 undef, i8 undef, i8 undef, i8 undef, i8 undef, i8 undef>)			// CHECK: [[VQSHLB_N_U8:%.*]] = call <8 x i8> @llvm.aarch64.neon.uqshl.v8i8(<8 x i8> [[TMP0]], <8 x i8> <i8 7, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0>)
	// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQSHLB_N_U8]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQSHLB_N_U8]], i64 0
	// CHECK: ret i8 [[TMP1]]			// CHECK: ret i8 [[TMP1]]
	uint8_t test_vqshlb_n_u8(uint8_t a) {			uint8_t test_vqshlb_n_u8(uint8_t a) {
	return (uint8_t)vqshlb_n_u8(a, 7);			return (uint8_t)vqshlb_n_u8(a, 7);
	}			}

	// CHECK-LABEL: @test_vqshlh_n_u16(			// CHECK-LABEL: @test_vqshlh_n_u16(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[VQSHLH_N_U16:%.*]] = call <4 x i16> @llvm.aarch64.neon.uqshl.v4i16(<4 x i16> [[TMP0]], <4 x i16> <i16 15, i16 undef, i16 undef, i16 undef>)			// CHECK: [[VQSHLH_N_U16:%.*]] = call <4 x i16> @llvm.aarch64.neon.uqshl.v4i16(<4 x i16> [[TMP0]], <4 x i16> <i16 15, i16 0, i16 0, i16 0>)
	// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQSHLH_N_U16]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQSHLH_N_U16]], i64 0
	// CHECK: ret i16 [[TMP1]]			// CHECK: ret i16 [[TMP1]]
	uint16_t test_vqshlh_n_u16(uint16_t a) {			uint16_t test_vqshlh_n_u16(uint16_t a) {
	return (uint16_t)vqshlh_n_u16(a, 15);			return (uint16_t)vqshlh_n_u16(a, 15);
	}			}

	// CHECK-LABEL: @test_vqshls_n_u32(			// CHECK-LABEL: @test_vqshls_n_u32(
	// CHECK: [[VQSHLS_N_U32:%.*]] = call i32 @llvm.aarch64.neon.uqshl.i32(i32 %a, i32 31)			// CHECK: [[VQSHLS_N_U32:%.*]] = call i32 @llvm.aarch64.neon.uqshl.i32(i32 %a, i32 31)
	Show All 14 Lines
	// CHECK: [[VQSHL_N:%.*]] = bitcast <8 x i8> [[TMP0]] to <1 x i64>			// CHECK: [[VQSHL_N:%.*]] = bitcast <8 x i8> [[TMP0]] to <1 x i64>
	// CHECK: [[VQSHL_N1:%.*]] = call <1 x i64> @llvm.aarch64.neon.uqshl.v1i64(<1 x i64> [[VQSHL_N]], <1 x i64> <i64 1>)			// CHECK: [[VQSHL_N1:%.*]] = call <1 x i64> @llvm.aarch64.neon.uqshl.v1i64(<1 x i64> [[VQSHL_N]], <1 x i64> <i64 1>)
	// CHECK: ret <1 x i64> [[VQSHL_N1]]			// CHECK: ret <1 x i64> [[VQSHL_N1]]
	uint64x1_t test_vqshl_n_u64(uint64x1_t a) {			uint64x1_t test_vqshl_n_u64(uint64x1_t a) {
	return vqshl_n_u64(a, 1);			return vqshl_n_u64(a, 1);
	}			}

	// CHECK-LABEL: @test_vqshlub_n_s8(			// CHECK-LABEL: @test_vqshlub_n_s8(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> undef, i8 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i8> zeroinitializer, i8 %a, i64 0
	// CHECK: [[VQSHLUB_N_S8:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqshlu.v8i8(<8 x i8> [[TMP0]], <8 x i8> <i8 7, i8 undef, i8 undef, i8 undef, i8 undef, i8 undef, i8 undef, i8 undef>)			// CHECK: [[VQSHLUB_N_S8:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqshlu.v8i8(<8 x i8> [[TMP0]], <8 x i8> <i8 7, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0, i8 0>)
	// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQSHLUB_N_S8]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQSHLUB_N_S8]], i64 0
	// CHECK: ret i8 [[TMP1]]			// CHECK: ret i8 [[TMP1]]
	int8_t test_vqshlub_n_s8(int8_t a) {			int8_t test_vqshlub_n_s8(int8_t a) {
	return (int8_t)vqshlub_n_s8(a, 7);			return (int8_t)vqshlub_n_s8(a, 7);
	}			}

	// CHECK-LABEL: @test_vqshluh_n_s16(			// CHECK-LABEL: @test_vqshluh_n_s16(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[VQSHLUH_N_S16:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqshlu.v4i16(<4 x i16> [[TMP0]], <4 x i16> <i16 15, i16 undef, i16 undef, i16 undef>)			// CHECK: [[VQSHLUH_N_S16:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqshlu.v4i16(<4 x i16> [[TMP0]], <4 x i16> <i16 15, i16 0, i16 0, i16 0>)
	// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQSHLUH_N_S16]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQSHLUH_N_S16]], i64 0
	// CHECK: ret i16 [[TMP1]]			// CHECK: ret i16 [[TMP1]]
	int16_t test_vqshluh_n_s16(int16_t a) {			int16_t test_vqshluh_n_s16(int16_t a) {
	return (int16_t)vqshluh_n_s16(a, 15);			return (int16_t)vqshluh_n_s16(a, 15);
	}			}

	// CHECK-LABEL: @test_vqshlus_n_s32(			// CHECK-LABEL: @test_vqshlus_n_s32(
	// CHECK: [[VQSHLUS_N_S32:%.*]] = call i32 @llvm.aarch64.neon.sqshlu.i32(i32 %a, i32 31)			// CHECK: [[VQSHLUS_N_S32:%.*]] = call i32 @llvm.aarch64.neon.sqshlu.i32(i32 %a, i32 31)
	▲ Show 20 Lines • Show All 98 Lines • ▼ Show 20 Lines
	// CHECK: [[VSLI_N1:%.*]] = bitcast <8 x i8> [[TMP1]] to <1 x i64>			// CHECK: [[VSLI_N1:%.*]] = bitcast <8 x i8> [[TMP1]] to <1 x i64>
	// CHECK: [[VSLI_N2:%.*]] = call <1 x i64> @llvm.aarch64.neon.vsli.v1i64(<1 x i64> [[VSLI_N]], <1 x i64> [[VSLI_N1]], i32 1)			// CHECK: [[VSLI_N2:%.*]] = call <1 x i64> @llvm.aarch64.neon.vsli.v1i64(<1 x i64> [[VSLI_N]], <1 x i64> [[VSLI_N1]], i32 1)
	// CHECK: ret <1 x i64> [[VSLI_N2]]			// CHECK: ret <1 x i64> [[VSLI_N2]]
	uint64x1_t test_vsli_n_u64(uint64x1_t a, uint64x1_t b) {			uint64x1_t test_vsli_n_u64(uint64x1_t a, uint64x1_t b) {
	return vsli_n_u64(a, b, 1);			return vsli_n_u64(a, b, 1);
	}			}

	// CHECK-LABEL: @test_vqshrnh_n_s16(			// CHECK-LABEL: @test_vqshrnh_n_s16(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[VQSHRNH_N_S16:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqshrn.v8i8(<8 x i16> [[TMP0]], i32 8)			// CHECK: [[VQSHRNH_N_S16:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqshrn.v8i8(<8 x i16> [[TMP0]], i32 8)
	// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQSHRNH_N_S16]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQSHRNH_N_S16]], i64 0
	// CHECK: ret i8 [[TMP1]]			// CHECK: ret i8 [[TMP1]]
	int8_t test_vqshrnh_n_s16(int16_t a) {			int8_t test_vqshrnh_n_s16(int16_t a) {
	return (int8_t)vqshrnh_n_s16(a, 8);			return (int8_t)vqshrnh_n_s16(a, 8);
	}			}

	// CHECK-LABEL: @test_vqshrns_n_s32(			// CHECK-LABEL: @test_vqshrns_n_s32(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i32> undef, i32 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i32> zeroinitializer, i32 %a, i64 0
	// CHECK: [[VQSHRNS_N_S32:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqshrn.v4i16(<4 x i32> [[TMP0]], i32 16)			// CHECK: [[VQSHRNS_N_S32:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqshrn.v4i16(<4 x i32> [[TMP0]], i32 16)
	// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQSHRNS_N_S32]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQSHRNS_N_S32]], i64 0
	// CHECK: ret i16 [[TMP1]]			// CHECK: ret i16 [[TMP1]]
	int16_t test_vqshrns_n_s32(int32_t a) {			int16_t test_vqshrns_n_s32(int32_t a) {
	return (int16_t)vqshrns_n_s32(a, 16);			return (int16_t)vqshrns_n_s32(a, 16);
	}			}

	// CHECK-LABEL: @test_vqshrnd_n_s64(			// CHECK-LABEL: @test_vqshrnd_n_s64(
	// CHECK: [[VQSHRND_N_S64:%.*]] = call i32 @llvm.aarch64.neon.sqshrn.i32(i64 %a, i32 32)			// CHECK: [[VQSHRND_N_S64:%.*]] = call i32 @llvm.aarch64.neon.sqshrn.i32(i64 %a, i32 32)
	// CHECK: ret i32 [[VQSHRND_N_S64]]			// CHECK: ret i32 [[VQSHRND_N_S64]]
	int32_t test_vqshrnd_n_s64(int64_t a) {			int32_t test_vqshrnd_n_s64(int64_t a) {
	return (int32_t)vqshrnd_n_s64(a, 32);			return (int32_t)vqshrnd_n_s64(a, 32);
	}			}

	// CHECK-LABEL: @test_vqshrnh_n_u16(			// CHECK-LABEL: @test_vqshrnh_n_u16(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[VQSHRNH_N_U16:%.*]] = call <8 x i8> @llvm.aarch64.neon.uqshrn.v8i8(<8 x i16> [[TMP0]], i32 8)			// CHECK: [[VQSHRNH_N_U16:%.*]] = call <8 x i8> @llvm.aarch64.neon.uqshrn.v8i8(<8 x i16> [[TMP0]], i32 8)
	// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQSHRNH_N_U16]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQSHRNH_N_U16]], i64 0
	// CHECK: ret i8 [[TMP1]]			// CHECK: ret i8 [[TMP1]]
	uint8_t test_vqshrnh_n_u16(uint16_t a) {			uint8_t test_vqshrnh_n_u16(uint16_t a) {
	return (uint8_t)vqshrnh_n_u16(a, 8);			return (uint8_t)vqshrnh_n_u16(a, 8);
	}			}

	// CHECK-LABEL: @test_vqshrns_n_u32(			// CHECK-LABEL: @test_vqshrns_n_u32(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i32> undef, i32 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i32> zeroinitializer, i32 %a, i64 0
	// CHECK: [[VQSHRNS_N_U32:%.*]] = call <4 x i16> @llvm.aarch64.neon.uqshrn.v4i16(<4 x i32> [[TMP0]], i32 16)			// CHECK: [[VQSHRNS_N_U32:%.*]] = call <4 x i16> @llvm.aarch64.neon.uqshrn.v4i16(<4 x i32> [[TMP0]], i32 16)
	// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQSHRNS_N_U32]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQSHRNS_N_U32]], i64 0
	// CHECK: ret i16 [[TMP1]]			// CHECK: ret i16 [[TMP1]]
	uint16_t test_vqshrns_n_u32(uint32_t a) {			uint16_t test_vqshrns_n_u32(uint32_t a) {
	return (uint16_t)vqshrns_n_u32(a, 16);			return (uint16_t)vqshrns_n_u32(a, 16);
	}			}

	// CHECK-LABEL: @test_vqshrnd_n_u64(			// CHECK-LABEL: @test_vqshrnd_n_u64(
	// CHECK: [[VQSHRND_N_U64:%.*]] = call i32 @llvm.aarch64.neon.uqshrn.i32(i64 %a, i32 32)			// CHECK: [[VQSHRND_N_U64:%.*]] = call i32 @llvm.aarch64.neon.uqshrn.i32(i64 %a, i32 32)
	// CHECK: ret i32 [[VQSHRND_N_U64]]			// CHECK: ret i32 [[VQSHRND_N_U64]]
	uint32_t test_vqshrnd_n_u64(uint64_t a) {			uint32_t test_vqshrnd_n_u64(uint64_t a) {
	return (uint32_t)vqshrnd_n_u64(a, 32);			return (uint32_t)vqshrnd_n_u64(a, 32);
	}			}

	// CHECK-LABEL: @test_vqrshrnh_n_s16(			// CHECK-LABEL: @test_vqrshrnh_n_s16(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[VQRSHRNH_N_S16:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqrshrn.v8i8(<8 x i16> [[TMP0]], i32 8)			// CHECK: [[VQRSHRNH_N_S16:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqrshrn.v8i8(<8 x i16> [[TMP0]], i32 8)
	// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQRSHRNH_N_S16]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQRSHRNH_N_S16]], i64 0
	// CHECK: ret i8 [[TMP1]]			// CHECK: ret i8 [[TMP1]]
	int8_t test_vqrshrnh_n_s16(int16_t a) {			int8_t test_vqrshrnh_n_s16(int16_t a) {
	return (int8_t)vqrshrnh_n_s16(a, 8);			return (int8_t)vqrshrnh_n_s16(a, 8);
	}			}

	// CHECK-LABEL: @test_vqrshrns_n_s32(			// CHECK-LABEL: @test_vqrshrns_n_s32(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i32> undef, i32 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i32> zeroinitializer, i32 %a, i64 0
	// CHECK: [[VQRSHRNS_N_S32:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrshrn.v4i16(<4 x i32> [[TMP0]], i32 16)			// CHECK: [[VQRSHRNS_N_S32:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrshrn.v4i16(<4 x i32> [[TMP0]], i32 16)
	// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQRSHRNS_N_S32]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQRSHRNS_N_S32]], i64 0
	// CHECK: ret i16 [[TMP1]]			// CHECK: ret i16 [[TMP1]]
	int16_t test_vqrshrns_n_s32(int32_t a) {			int16_t test_vqrshrns_n_s32(int32_t a) {
	return (int16_t)vqrshrns_n_s32(a, 16);			return (int16_t)vqrshrns_n_s32(a, 16);
	}			}

	// CHECK-LABEL: @test_vqrshrnd_n_s64(			// CHECK-LABEL: @test_vqrshrnd_n_s64(
	// CHECK: [[VQRSHRND_N_S64:%.*]] = call i32 @llvm.aarch64.neon.sqrshrn.i32(i64 %a, i32 32)			// CHECK: [[VQRSHRND_N_S64:%.*]] = call i32 @llvm.aarch64.neon.sqrshrn.i32(i64 %a, i32 32)
	// CHECK: ret i32 [[VQRSHRND_N_S64]]			// CHECK: ret i32 [[VQRSHRND_N_S64]]
	int32_t test_vqrshrnd_n_s64(int64_t a) {			int32_t test_vqrshrnd_n_s64(int64_t a) {
	return (int32_t)vqrshrnd_n_s64(a, 32);			return (int32_t)vqrshrnd_n_s64(a, 32);
	}			}

	// CHECK-LABEL: @test_vqrshrnh_n_u16(			// CHECK-LABEL: @test_vqrshrnh_n_u16(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[VQRSHRNH_N_U16:%.*]] = call <8 x i8> @llvm.aarch64.neon.uqrshrn.v8i8(<8 x i16> [[TMP0]], i32 8)			// CHECK: [[VQRSHRNH_N_U16:%.*]] = call <8 x i8> @llvm.aarch64.neon.uqrshrn.v8i8(<8 x i16> [[TMP0]], i32 8)
	// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQRSHRNH_N_U16]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQRSHRNH_N_U16]], i64 0
	// CHECK: ret i8 [[TMP1]]			// CHECK: ret i8 [[TMP1]]
	uint8_t test_vqrshrnh_n_u16(uint16_t a) {			uint8_t test_vqrshrnh_n_u16(uint16_t a) {
	return (uint8_t)vqrshrnh_n_u16(a, 8);			return (uint8_t)vqrshrnh_n_u16(a, 8);
	}			}

	// CHECK-LABEL: @test_vqrshrns_n_u32(			// CHECK-LABEL: @test_vqrshrns_n_u32(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i32> undef, i32 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i32> zeroinitializer, i32 %a, i64 0
	// CHECK: [[VQRSHRNS_N_U32:%.*]] = call <4 x i16> @llvm.aarch64.neon.uqrshrn.v4i16(<4 x i32> [[TMP0]], i32 16)			// CHECK: [[VQRSHRNS_N_U32:%.*]] = call <4 x i16> @llvm.aarch64.neon.uqrshrn.v4i16(<4 x i32> [[TMP0]], i32 16)
	// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQRSHRNS_N_U32]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQRSHRNS_N_U32]], i64 0
	// CHECK: ret i16 [[TMP1]]			// CHECK: ret i16 [[TMP1]]
	uint16_t test_vqrshrns_n_u32(uint32_t a) {			uint16_t test_vqrshrns_n_u32(uint32_t a) {
	return (uint16_t)vqrshrns_n_u32(a, 16);			return (uint16_t)vqrshrns_n_u32(a, 16);
	}			}

	// CHECK-LABEL: @test_vqrshrnd_n_u64(			// CHECK-LABEL: @test_vqrshrnd_n_u64(
	// CHECK: [[VQRSHRND_N_U64:%.*]] = call i32 @llvm.aarch64.neon.uqrshrn.i32(i64 %a, i32 32)			// CHECK: [[VQRSHRND_N_U64:%.*]] = call i32 @llvm.aarch64.neon.uqrshrn.i32(i64 %a, i32 32)
	// CHECK: ret i32 [[VQRSHRND_N_U64]]			// CHECK: ret i32 [[VQRSHRND_N_U64]]
	uint32_t test_vqrshrnd_n_u64(uint64_t a) {			uint32_t test_vqrshrnd_n_u64(uint64_t a) {
	return (uint32_t)vqrshrnd_n_u64(a, 32);			return (uint32_t)vqrshrnd_n_u64(a, 32);
	}			}

	// CHECK-LABEL: @test_vqshrunh_n_s16(			// CHECK-LABEL: @test_vqshrunh_n_s16(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[VQSHRUNH_N_S16:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqshrun.v8i8(<8 x i16> [[TMP0]], i32 8)			// CHECK: [[VQSHRUNH_N_S16:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqshrun.v8i8(<8 x i16> [[TMP0]], i32 8)
	// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQSHRUNH_N_S16]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQSHRUNH_N_S16]], i64 0
	// CHECK: ret i8 [[TMP1]]			// CHECK: ret i8 [[TMP1]]
	int8_t test_vqshrunh_n_s16(int16_t a) {			int8_t test_vqshrunh_n_s16(int16_t a) {
	return (int8_t)vqshrunh_n_s16(a, 8);			return (int8_t)vqshrunh_n_s16(a, 8);
	}			}

	// CHECK-LABEL: @test_vqshruns_n_s32(			// CHECK-LABEL: @test_vqshruns_n_s32(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i32> undef, i32 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i32> zeroinitializer, i32 %a, i64 0
	// CHECK: [[VQSHRUNS_N_S32:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqshrun.v4i16(<4 x i32> [[TMP0]], i32 16)			// CHECK: [[VQSHRUNS_N_S32:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqshrun.v4i16(<4 x i32> [[TMP0]], i32 16)
	// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQSHRUNS_N_S32]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQSHRUNS_N_S32]], i64 0
	// CHECK: ret i16 [[TMP1]]			// CHECK: ret i16 [[TMP1]]
	int16_t test_vqshruns_n_s32(int32_t a) {			int16_t test_vqshruns_n_s32(int32_t a) {
	return (int16_t)vqshruns_n_s32(a, 16);			return (int16_t)vqshruns_n_s32(a, 16);
	}			}

	// CHECK-LABEL: @test_vqshrund_n_s64(			// CHECK-LABEL: @test_vqshrund_n_s64(
	// CHECK: [[VQSHRUND_N_S64:%.*]] = call i32 @llvm.aarch64.neon.sqshrun.i32(i64 %a, i32 32)			// CHECK: [[VQSHRUND_N_S64:%.*]] = call i32 @llvm.aarch64.neon.sqshrun.i32(i64 %a, i32 32)
	// CHECK: ret i32 [[VQSHRUND_N_S64]]			// CHECK: ret i32 [[VQSHRUND_N_S64]]
	int32_t test_vqshrund_n_s64(int64_t a) {			int32_t test_vqshrund_n_s64(int64_t a) {
	return (int32_t)vqshrund_n_s64(a, 32);			return (int32_t)vqshrund_n_s64(a, 32);
	}			}

	// CHECK-LABEL: @test_vqrshrunh_n_s16(			// CHECK-LABEL: @test_vqrshrunh_n_s16(
	// CHECK: [[TMP0:%.*]] = insertelement <8 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <8 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[VQRSHRUNH_N_S16:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqrshrun.v8i8(<8 x i16> [[TMP0]], i32 8)			// CHECK: [[VQRSHRUNH_N_S16:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqrshrun.v8i8(<8 x i16> [[TMP0]], i32 8)
	// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQRSHRUNH_N_S16]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <8 x i8> [[VQRSHRUNH_N_S16]], i64 0
	// CHECK: ret i8 [[TMP1]]			// CHECK: ret i8 [[TMP1]]
	int8_t test_vqrshrunh_n_s16(int16_t a) {			int8_t test_vqrshrunh_n_s16(int16_t a) {
	return (int8_t)vqrshrunh_n_s16(a, 8);			return (int8_t)vqrshrunh_n_s16(a, 8);
	}			}

	// CHECK-LABEL: @test_vqrshruns_n_s32(			// CHECK-LABEL: @test_vqrshruns_n_s32(
	// CHECK: [[TMP0:%.*]] = insertelement <4 x i32> undef, i32 %a, i64 0			// CHECK: [[TMP0:%.*]] = insertelement <4 x i32> zeroinitializer, i32 %a, i64 0
	// CHECK: [[VQRSHRUNS_N_S32:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrshrun.v4i16(<4 x i32> [[TMP0]], i32 16)			// CHECK: [[VQRSHRUNS_N_S32:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrshrun.v4i16(<4 x i32> [[TMP0]], i32 16)
	// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQRSHRUNS_N_S32]], i64 0			// CHECK: [[TMP1:%.*]] = extractelement <4 x i16> [[VQRSHRUNS_N_S32]], i64 0
	// CHECK: ret i16 [[TMP1]]			// CHECK: ret i16 [[TMP1]]
	int16_t test_vqrshruns_n_s32(int32_t a) {			int16_t test_vqrshruns_n_s32(int32_t a) {
	return (int16_t)vqrshruns_n_s32(a, 16);			return (int16_t)vqrshruns_n_s32(a, 16);
	}			}

	// CHECK-LABEL: @test_vqrshrund_n_s64(			// CHECK-LABEL: @test_vqrshrund_n_s64(
	▲ Show 20 Lines • Show All 3,245 Lines • Show Last 20 Lines

clang/test/CodeGen/aarch64-neon-scalar-x-indexed-elem.c

	Show First 20 Lines • Show All 244 Lines • ▼ Show 20 Lines
	float64x1_t test_vfms_laneq_f64(float64x1_t a, float64x1_t b, float64x2_t v) {			float64x1_t test_vfms_laneq_f64(float64x1_t a, float64x1_t b, float64x2_t v) {
	return vfms_laneq_f64(a, b, v, 0);			return vfms_laneq_f64(a, b, v, 0);
	}			}

	// CHECK-LABEL: define i32 @test_vqdmullh_lane_s16(i16 %a, <4 x i16> %b) #0 {			// CHECK-LABEL: define i32 @test_vqdmullh_lane_s16(i16 %a, <4 x i16> %b) #0 {
	// CHECK: [[TMP0:%.*]] = bitcast <4 x i16> %b to <8 x i8>			// CHECK: [[TMP0:%.*]] = bitcast <4 x i16> %b to <8 x i8>
	// CHECK: [[TMP1:%.*]] = bitcast <8 x i8> [[TMP0]] to <4 x i16>			// CHECK: [[TMP1:%.*]] = bitcast <8 x i8> [[TMP0]] to <4 x i16>
	// CHECK: [[VGET_LANE:%.*]] = extractelement <4 x i16> [[TMP1]], i32 3			// CHECK: [[VGET_LANE:%.*]] = extractelement <4 x i16> [[TMP1]], i32 3
	// CHECK: [[TMP2:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP2:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[TMP3:%.*]] = insertelement <4 x i16> undef, i16 [[VGET_LANE]], i64 0			// CHECK: [[TMP3:%.*]] = insertelement <4 x i16> zeroinitializer, i16 [[VGET_LANE]], i64 0
	// CHECK: [[VQDMULLH_S16_I:%.*]] = call <4 x i32> @llvm.aarch64.neon.sqdmull.v4i32(<4 x i16> [[TMP2]], <4 x i16> [[TMP3]])			// CHECK: [[VQDMULLH_S16_I:%.*]] = call <4 x i32> @llvm.aarch64.neon.sqdmull.v4i32(<4 x i16> [[TMP2]], <4 x i16> [[TMP3]])
	// CHECK: [[TMP4:%.*]] = extractelement <4 x i32> [[VQDMULLH_S16_I]], i64 0			// CHECK: [[TMP4:%.*]] = extractelement <4 x i32> [[VQDMULLH_S16_I]], i64 0
	// CHECK: ret i32 [[TMP4]]			// CHECK: ret i32 [[TMP4]]
	int32_t test_vqdmullh_lane_s16(int16_t a, int16x4_t b) {			int32_t test_vqdmullh_lane_s16(int16_t a, int16x4_t b) {
	return vqdmullh_lane_s16(a, b, 3);			return vqdmullh_lane_s16(a, b, 3);
	}			}

	// CHECK-LABEL: define i64 @test_vqdmulls_lane_s32(i32 %a, <2 x i32> %b) #0 {			// CHECK-LABEL: define i64 @test_vqdmulls_lane_s32(i32 %a, <2 x i32> %b) #0 {
	// CHECK: [[TMP0:%.*]] = bitcast <2 x i32> %b to <8 x i8>			// CHECK: [[TMP0:%.*]] = bitcast <2 x i32> %b to <8 x i8>
	// CHECK: [[TMP1:%.*]] = bitcast <8 x i8> [[TMP0]] to <2 x i32>			// CHECK: [[TMP1:%.*]] = bitcast <8 x i8> [[TMP0]] to <2 x i32>
	// CHECK: [[VGET_LANE:%.*]] = extractelement <2 x i32> [[TMP1]], i32 1			// CHECK: [[VGET_LANE:%.*]] = extractelement <2 x i32> [[TMP1]], i32 1
	// CHECK: [[VQDMULLS_S32_I:%.*]] = call i64 @llvm.aarch64.neon.sqdmulls.scalar(i32 %a, i32 [[VGET_LANE]])			// CHECK: [[VQDMULLS_S32_I:%.*]] = call i64 @llvm.aarch64.neon.sqdmulls.scalar(i32 %a, i32 [[VGET_LANE]])
	// CHECK: ret i64 [[VQDMULLS_S32_I]]			// CHECK: ret i64 [[VQDMULLS_S32_I]]
	int64_t test_vqdmulls_lane_s32(int32_t a, int32x2_t b) {			int64_t test_vqdmulls_lane_s32(int32_t a, int32x2_t b) {
	return vqdmulls_lane_s32(a, b, 1);			return vqdmulls_lane_s32(a, b, 1);
	}			}

	// CHECK-LABEL: define i32 @test_vqdmullh_laneq_s16(i16 %a, <8 x i16> %b) #1 {			// CHECK-LABEL: define i32 @test_vqdmullh_laneq_s16(i16 %a, <8 x i16> %b) #1 {
	// CHECK: [[TMP0:%.*]] = bitcast <8 x i16> %b to <16 x i8>			// CHECK: [[TMP0:%.*]] = bitcast <8 x i16> %b to <16 x i8>
	// CHECK: [[TMP1:%.*]] = bitcast <16 x i8> [[TMP0]] to <8 x i16>			// CHECK: [[TMP1:%.*]] = bitcast <16 x i8> [[TMP0]] to <8 x i16>
	// CHECK: [[VGETQ_LANE:%.*]] = extractelement <8 x i16> [[TMP1]], i32 7			// CHECK: [[VGETQ_LANE:%.*]] = extractelement <8 x i16> [[TMP1]], i32 7
	// CHECK: [[TMP2:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP2:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[TMP3:%.*]] = insertelement <4 x i16> undef, i16 [[VGETQ_LANE]], i64 0			// CHECK: [[TMP3:%.*]] = insertelement <4 x i16> zeroinitializer, i16 [[VGETQ_LANE]], i64 0
	// CHECK: [[VQDMULLH_S16_I:%.*]] = call <4 x i32> @llvm.aarch64.neon.sqdmull.v4i32(<4 x i16> [[TMP2]], <4 x i16> [[TMP3]])			// CHECK: [[VQDMULLH_S16_I:%.*]] = call <4 x i32> @llvm.aarch64.neon.sqdmull.v4i32(<4 x i16> [[TMP2]], <4 x i16> [[TMP3]])
	// CHECK: [[TMP4:%.*]] = extractelement <4 x i32> [[VQDMULLH_S16_I]], i64 0			// CHECK: [[TMP4:%.*]] = extractelement <4 x i32> [[VQDMULLH_S16_I]], i64 0
	// CHECK: ret i32 [[TMP4]]			// CHECK: ret i32 [[TMP4]]
	int32_t test_vqdmullh_laneq_s16(int16_t a, int16x8_t b) {			int32_t test_vqdmullh_laneq_s16(int16_t a, int16x8_t b) {
	return vqdmullh_laneq_s16(a, b, 7);			return vqdmullh_laneq_s16(a, b, 7);
	}			}

	// CHECK-LABEL: define i64 @test_vqdmulls_laneq_s32(i32 %a, <4 x i32> %b) #1 {			// CHECK-LABEL: define i64 @test_vqdmulls_laneq_s32(i32 %a, <4 x i32> %b) #1 {
	// CHECK: [[TMP0:%.*]] = bitcast <4 x i32> %b to <16 x i8>			// CHECK: [[TMP0:%.*]] = bitcast <4 x i32> %b to <16 x i8>
	// CHECK: [[TMP1:%.*]] = bitcast <16 x i8> [[TMP0]] to <4 x i32>			// CHECK: [[TMP1:%.*]] = bitcast <16 x i8> [[TMP0]] to <4 x i32>
	// CHECK: [[VGETQ_LANE:%.*]] = extractelement <4 x i32> [[TMP1]], i32 3			// CHECK: [[VGETQ_LANE:%.*]] = extractelement <4 x i32> [[TMP1]], i32 3
	// CHECK: [[VQDMULLS_S32_I:%.*]] = call i64 @llvm.aarch64.neon.sqdmulls.scalar(i32 %a, i32 [[VGETQ_LANE]])			// CHECK: [[VQDMULLS_S32_I:%.*]] = call i64 @llvm.aarch64.neon.sqdmulls.scalar(i32 %a, i32 [[VGETQ_LANE]])
	// CHECK: ret i64 [[VQDMULLS_S32_I]]			// CHECK: ret i64 [[VQDMULLS_S32_I]]
	int64_t test_vqdmulls_laneq_s32(int32_t a, int32x4_t b) {			int64_t test_vqdmulls_laneq_s32(int32_t a, int32x4_t b) {
	return vqdmulls_laneq_s32(a, b, 3);			return vqdmulls_laneq_s32(a, b, 3);
	}			}

	// CHECK-LABEL: define i16 @test_vqdmulhh_lane_s16(i16 %a, <4 x i16> %b) #0 {			// CHECK-LABEL: define i16 @test_vqdmulhh_lane_s16(i16 %a, <4 x i16> %b) #0 {
	// CHECK: [[TMP0:%.*]] = bitcast <4 x i16> %b to <8 x i8>			// CHECK: [[TMP0:%.*]] = bitcast <4 x i16> %b to <8 x i8>
	// CHECK: [[TMP1:%.*]] = bitcast <8 x i8> [[TMP0]] to <4 x i16>			// CHECK: [[TMP1:%.*]] = bitcast <8 x i8> [[TMP0]] to <4 x i16>
	// CHECK: [[VGET_LANE:%.*]] = extractelement <4 x i16> [[TMP1]], i32 3			// CHECK: [[VGET_LANE:%.*]] = extractelement <4 x i16> [[TMP1]], i32 3
	// CHECK: [[TMP2:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP2:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[TMP3:%.*]] = insertelement <4 x i16> undef, i16 [[VGET_LANE]], i64 0			// CHECK: [[TMP3:%.*]] = insertelement <4 x i16> zeroinitializer, i16 [[VGET_LANE]], i64 0
	// CHECK: [[VQDMULHH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqdmulh.v4i16(<4 x i16> [[TMP2]], <4 x i16> [[TMP3]])			// CHECK: [[VQDMULHH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqdmulh.v4i16(<4 x i16> [[TMP2]], <4 x i16> [[TMP3]])
	// CHECK: [[TMP4:%.*]] = extractelement <4 x i16> [[VQDMULHH_S16_I]], i64 0			// CHECK: [[TMP4:%.*]] = extractelement <4 x i16> [[VQDMULHH_S16_I]], i64 0
	// CHECK: ret i16 [[TMP4]]			// CHECK: ret i16 [[TMP4]]
	int16_t test_vqdmulhh_lane_s16(int16_t a, int16x4_t b) {			int16_t test_vqdmulhh_lane_s16(int16_t a, int16x4_t b) {
	return vqdmulhh_lane_s16(a, b, 3);			return vqdmulhh_lane_s16(a, b, 3);
	}			}

	// CHECK-LABEL: define i32 @test_vqdmulhs_lane_s32(i32 %a, <2 x i32> %b) #0 {			// CHECK-LABEL: define i32 @test_vqdmulhs_lane_s32(i32 %a, <2 x i32> %b) #0 {
	// CHECK: [[TMP0:%.*]] = bitcast <2 x i32> %b to <8 x i8>			// CHECK: [[TMP0:%.*]] = bitcast <2 x i32> %b to <8 x i8>
	// CHECK: [[TMP1:%.*]] = bitcast <8 x i8> [[TMP0]] to <2 x i32>			// CHECK: [[TMP1:%.*]] = bitcast <8 x i8> [[TMP0]] to <2 x i32>
	// CHECK: [[VGET_LANE:%.*]] = extractelement <2 x i32> [[TMP1]], i32 1			// CHECK: [[VGET_LANE:%.*]] = extractelement <2 x i32> [[TMP1]], i32 1
	// CHECK: [[VQDMULHS_S32_I:%.*]] = call i32 @llvm.aarch64.neon.sqdmulh.i32(i32 %a, i32 [[VGET_LANE]])			// CHECK: [[VQDMULHS_S32_I:%.*]] = call i32 @llvm.aarch64.neon.sqdmulh.i32(i32 %a, i32 [[VGET_LANE]])
	// CHECK: ret i32 [[VQDMULHS_S32_I]]			// CHECK: ret i32 [[VQDMULHS_S32_I]]
	int32_t test_vqdmulhs_lane_s32(int32_t a, int32x2_t b) {			int32_t test_vqdmulhs_lane_s32(int32_t a, int32x2_t b) {
	return vqdmulhs_lane_s32(a, b, 1);			return vqdmulhs_lane_s32(a, b, 1);
	}			}


	// CHECK-LABEL: define i16 @test_vqdmulhh_laneq_s16(i16 %a, <8 x i16> %b) #1 {			// CHECK-LABEL: define i16 @test_vqdmulhh_laneq_s16(i16 %a, <8 x i16> %b) #1 {
	// CHECK: [[TMP0:%.*]] = bitcast <8 x i16> %b to <16 x i8>			// CHECK: [[TMP0:%.*]] = bitcast <8 x i16> %b to <16 x i8>
	// CHECK: [[TMP1:%.*]] = bitcast <16 x i8> [[TMP0]] to <8 x i16>			// CHECK: [[TMP1:%.*]] = bitcast <16 x i8> [[TMP0]] to <8 x i16>
	// CHECK: [[VGETQ_LANE:%.*]] = extractelement <8 x i16> [[TMP1]], i32 7			// CHECK: [[VGETQ_LANE:%.*]] = extractelement <8 x i16> [[TMP1]], i32 7
	// CHECK: [[TMP2:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP2:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[TMP3:%.*]] = insertelement <4 x i16> undef, i16 [[VGETQ_LANE]], i64 0			// CHECK: [[TMP3:%.*]] = insertelement <4 x i16> zeroinitializer, i16 [[VGETQ_LANE]], i64 0
	// CHECK: [[VQDMULHH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqdmulh.v4i16(<4 x i16> [[TMP2]], <4 x i16> [[TMP3]])			// CHECK: [[VQDMULHH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqdmulh.v4i16(<4 x i16> [[TMP2]], <4 x i16> [[TMP3]])
	// CHECK: [[TMP4:%.*]] = extractelement <4 x i16> [[VQDMULHH_S16_I]], i64 0			// CHECK: [[TMP4:%.*]] = extractelement <4 x i16> [[VQDMULHH_S16_I]], i64 0
	// CHECK: ret i16 [[TMP4]]			// CHECK: ret i16 [[TMP4]]
	int16_t test_vqdmulhh_laneq_s16(int16_t a, int16x8_t b) {			int16_t test_vqdmulhh_laneq_s16(int16_t a, int16x8_t b) {
	return vqdmulhh_laneq_s16(a, b, 7);			return vqdmulhh_laneq_s16(a, b, 7);
	}			}


	// CHECK-LABEL: define i32 @test_vqdmulhs_laneq_s32(i32 %a, <4 x i32> %b) #1 {			// CHECK-LABEL: define i32 @test_vqdmulhs_laneq_s32(i32 %a, <4 x i32> %b) #1 {
	// CHECK: [[TMP0:%.*]] = bitcast <4 x i32> %b to <16 x i8>			// CHECK: [[TMP0:%.*]] = bitcast <4 x i32> %b to <16 x i8>
	// CHECK: [[TMP1:%.*]] = bitcast <16 x i8> [[TMP0]] to <4 x i32>			// CHECK: [[TMP1:%.*]] = bitcast <16 x i8> [[TMP0]] to <4 x i32>
	// CHECK: [[VGETQ_LANE:%.*]] = extractelement <4 x i32> [[TMP1]], i32 3			// CHECK: [[VGETQ_LANE:%.*]] = extractelement <4 x i32> [[TMP1]], i32 3
	// CHECK: [[VQDMULHS_S32_I:%.*]] = call i32 @llvm.aarch64.neon.sqdmulh.i32(i32 %a, i32 [[VGETQ_LANE]])			// CHECK: [[VQDMULHS_S32_I:%.*]] = call i32 @llvm.aarch64.neon.sqdmulh.i32(i32 %a, i32 [[VGETQ_LANE]])
	// CHECK: ret i32 [[VQDMULHS_S32_I]]			// CHECK: ret i32 [[VQDMULHS_S32_I]]
	int32_t test_vqdmulhs_laneq_s32(int32_t a, int32x4_t b) {			int32_t test_vqdmulhs_laneq_s32(int32_t a, int32x4_t b) {
	return vqdmulhs_laneq_s32(a, b, 3);			return vqdmulhs_laneq_s32(a, b, 3);
	}			}

	// CHECK-LABEL: define i16 @test_vqrdmulhh_lane_s16(i16 %a, <4 x i16> %b) #0 {			// CHECK-LABEL: define i16 @test_vqrdmulhh_lane_s16(i16 %a, <4 x i16> %b) #0 {
	// CHECK: [[TMP0:%.*]] = bitcast <4 x i16> %b to <8 x i8>			// CHECK: [[TMP0:%.*]] = bitcast <4 x i16> %b to <8 x i8>
	// CHECK: [[TMP1:%.*]] = bitcast <8 x i8> [[TMP0]] to <4 x i16>			// CHECK: [[TMP1:%.*]] = bitcast <8 x i8> [[TMP0]] to <4 x i16>
	// CHECK: [[VGET_LANE:%.*]] = extractelement <4 x i16> [[TMP1]], i32 3			// CHECK: [[VGET_LANE:%.*]] = extractelement <4 x i16> [[TMP1]], i32 3
	// CHECK: [[TMP2:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP2:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[TMP3:%.*]] = insertelement <4 x i16> undef, i16 [[VGET_LANE]], i64 0			// CHECK: [[TMP3:%.*]] = insertelement <4 x i16> zeroinitializer, i16 [[VGET_LANE]], i64 0
	// CHECK: [[VQRDMULHH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrdmulh.v4i16(<4 x i16> [[TMP2]], <4 x i16> [[TMP3]])			// CHECK: [[VQRDMULHH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrdmulh.v4i16(<4 x i16> [[TMP2]], <4 x i16> [[TMP3]])
	// CHECK: [[TMP4:%.*]] = extractelement <4 x i16> [[VQRDMULHH_S16_I]], i64 0			// CHECK: [[TMP4:%.*]] = extractelement <4 x i16> [[VQRDMULHH_S16_I]], i64 0
	// CHECK: ret i16 [[TMP4]]			// CHECK: ret i16 [[TMP4]]
	int16_t test_vqrdmulhh_lane_s16(int16_t a, int16x4_t b) {			int16_t test_vqrdmulhh_lane_s16(int16_t a, int16x4_t b) {
	return vqrdmulhh_lane_s16(a, b, 3);			return vqrdmulhh_lane_s16(a, b, 3);
	}			}

	// CHECK-LABEL: define i32 @test_vqrdmulhs_lane_s32(i32 %a, <2 x i32> %b) #0 {			// CHECK-LABEL: define i32 @test_vqrdmulhs_lane_s32(i32 %a, <2 x i32> %b) #0 {
	// CHECK: [[TMP0:%.*]] = bitcast <2 x i32> %b to <8 x i8>			// CHECK: [[TMP0:%.*]] = bitcast <2 x i32> %b to <8 x i8>
	// CHECK: [[TMP1:%.*]] = bitcast <8 x i8> [[TMP0]] to <2 x i32>			// CHECK: [[TMP1:%.*]] = bitcast <8 x i8> [[TMP0]] to <2 x i32>
	// CHECK: [[VGET_LANE:%.*]] = extractelement <2 x i32> [[TMP1]], i32 1			// CHECK: [[VGET_LANE:%.*]] = extractelement <2 x i32> [[TMP1]], i32 1
	// CHECK: [[VQRDMULHS_S32_I:%.*]] = call i32 @llvm.aarch64.neon.sqrdmulh.i32(i32 %a, i32 [[VGET_LANE]])			// CHECK: [[VQRDMULHS_S32_I:%.*]] = call i32 @llvm.aarch64.neon.sqrdmulh.i32(i32 %a, i32 [[VGET_LANE]])
	// CHECK: ret i32 [[VQRDMULHS_S32_I]]			// CHECK: ret i32 [[VQRDMULHS_S32_I]]
	int32_t test_vqrdmulhs_lane_s32(int32_t a, int32x2_t b) {			int32_t test_vqrdmulhs_lane_s32(int32_t a, int32x2_t b) {
	return vqrdmulhs_lane_s32(a, b, 1);			return vqrdmulhs_lane_s32(a, b, 1);
	}			}


	// CHECK-LABEL: define i16 @test_vqrdmulhh_laneq_s16(i16 %a, <8 x i16> %b) #1 {			// CHECK-LABEL: define i16 @test_vqrdmulhh_laneq_s16(i16 %a, <8 x i16> %b) #1 {
	// CHECK: [[TMP0:%.*]] = bitcast <8 x i16> %b to <16 x i8>			// CHECK: [[TMP0:%.*]] = bitcast <8 x i16> %b to <16 x i8>
	// CHECK: [[TMP1:%.*]] = bitcast <16 x i8> [[TMP0]] to <8 x i16>			// CHECK: [[TMP1:%.*]] = bitcast <16 x i8> [[TMP0]] to <8 x i16>
	// CHECK: [[VGETQ_LANE:%.*]] = extractelement <8 x i16> [[TMP1]], i32 7			// CHECK: [[VGETQ_LANE:%.*]] = extractelement <8 x i16> [[TMP1]], i32 7
	// CHECK: [[TMP2:%.*]] = insertelement <4 x i16> undef, i16 %a, i64 0			// CHECK: [[TMP2:%.*]] = insertelement <4 x i16> zeroinitializer, i16 %a, i64 0
	// CHECK: [[TMP3:%.*]] = insertelement <4 x i16> undef, i16 [[VGETQ_LANE]], i64 0			// CHECK: [[TMP3:%.*]] = insertelement <4 x i16> zeroinitializer, i16 [[VGETQ_LANE]], i64 0
	// CHECK: [[VQRDMULHH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrdmulh.v4i16(<4 x i16> [[TMP2]], <4 x i16> [[TMP3]])			// CHECK: [[VQRDMULHH_S16_I:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrdmulh.v4i16(<4 x i16> [[TMP2]], <4 x i16> [[TMP3]])
	// CHECK: [[TMP4:%.*]] = extractelement <4 x i16> [[VQRDMULHH_S16_I]], i64 0			// CHECK: [[TMP4:%.*]] = extractelement <4 x i16> [[VQRDMULHH_S16_I]], i64 0
	// CHECK: ret i16 [[TMP4]]			// CHECK: ret i16 [[TMP4]]
	int16_t test_vqrdmulhh_laneq_s16(int16_t a, int16x8_t b) {			int16_t test_vqrdmulhh_laneq_s16(int16_t a, int16x8_t b) {
	return vqrdmulhh_laneq_s16(a, b, 7);			return vqrdmulhh_laneq_s16(a, b, 7);
	}			}


	▲ Show 20 Lines • Show All 165 Lines • Show Last 20 Lines

clang/test/CodeGen/aarch64-v8.1a-neon-intrinsics.c

	Show All 33 Lines
	// CHECK: shufflevector <4 x i32> {{%.}}, <4 x i32> {{%.}}, <4 x i32> <i32 3, i32 3, i32 3, i32 3>			// CHECK: shufflevector <4 x i32> {{%.}}, <4 x i32> {{%.}}, <4 x i32> <i32 3, i32 3, i32 3, i32 3>
	// CHECK: call <4 x i32> @llvm.aarch64.neon.sqrdmulh.v4i32(<4 x i32> {{%.}}, <4 x i32> {{%.}})			// CHECK: call <4 x i32> @llvm.aarch64.neon.sqrdmulh.v4i32(<4 x i32> {{%.}}, <4 x i32> {{%.}})
	// CHECK: call <4 x i32> @llvm.aarch64.neon.sqadd.v4i32(<4 x i32> {{%.}}, <4 x i32> {{%.}})			// CHECK: call <4 x i32> @llvm.aarch64.neon.sqadd.v4i32(<4 x i32> {{%.}}, <4 x i32> {{%.}})
	return vqrdmlahq_laneq_s32(a, b, v, 3);			return vqrdmlahq_laneq_s32(a, b, v, 3);
	}			}

	// CHECK-LABEL: test_vqrdmlahh_s16			// CHECK-LABEL: test_vqrdmlahh_s16
	int16_t test_vqrdmlahh_s16(int16_t a, int16_t b, int16_t c) {			int16_t test_vqrdmlahh_s16(int16_t a, int16_t b, int16_t c) {
	// CHECK: [[insb:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insb:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[insc:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insc:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[mul:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrdmulh.v4i16(<4 x i16> [[insb]], <4 x i16> [[insc]])			// CHECK: [[mul:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrdmulh.v4i16(<4 x i16> [[insb]], <4 x i16> [[insc]])
	// CHECK: extractelement <4 x i16> [[mul]], i64 0			// CHECK: extractelement <4 x i16> [[mul]], i64 0
	// CHECK: [[insa:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insa:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[insmul:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insmul:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[add:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqadd.v4i16(<4 x i16> [[insa]], <4 x i16> [[insmul]])			// CHECK: [[add:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqadd.v4i16(<4 x i16> [[insa]], <4 x i16> [[insmul]])
	// CHECK: extractelement <4 x i16> [[add]], i64 0			// CHECK: extractelement <4 x i16> [[add]], i64 0
	return vqrdmlahh_s16(a, b, c);			return vqrdmlahh_s16(a, b, c);
	}			}

	// CHECK-LABEL: test_vqrdmlahs_s32			// CHECK-LABEL: test_vqrdmlahs_s32
	int32_t test_vqrdmlahs_s32(int32_t a, int32_t b, int32_t c) {			int32_t test_vqrdmlahs_s32(int32_t a, int32_t b, int32_t c) {
	// CHECK: call i32 @llvm.aarch64.neon.sqrdmulh.i32(i32 {{%.}}, i32 {{%.}})			// CHECK: call i32 @llvm.aarch64.neon.sqrdmulh.i32(i32 {{%.}}, i32 {{%.}})
	// CHECK: call i32 @llvm.aarch64.neon.sqadd.i32(i32 {{%.}}, i32 {{%.}})			// CHECK: call i32 @llvm.aarch64.neon.sqadd.i32(i32 {{%.}}, i32 {{%.}})
	return vqrdmlahs_s32(a, b, c);			return vqrdmlahs_s32(a, b, c);
	}			}

	// CHECK-LABEL: test_vqrdmlahh_lane_s16			// CHECK-LABEL: test_vqrdmlahh_lane_s16
	int16_t test_vqrdmlahh_lane_s16(int16_t a, int16_t b, int16x4_t c) {			int16_t test_vqrdmlahh_lane_s16(int16_t a, int16_t b, int16x4_t c) {
	// CHECK: extractelement <4 x i16> {{%.*}}, i32 3			// CHECK: extractelement <4 x i16> {{%.*}}, i32 3
	// CHECK: [[insb:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insb:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[insc:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insc:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[mul:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrdmulh.v4i16(<4 x i16> [[insb]], <4 x i16> [[insc]])			// CHECK: [[mul:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrdmulh.v4i16(<4 x i16> [[insb]], <4 x i16> [[insc]])
	// CHECK: extractelement <4 x i16> [[mul]], i64 0			// CHECK: extractelement <4 x i16> [[mul]], i64 0
	// CHECK: [[insa:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insa:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[insmul:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insmul:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[add:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqadd.v4i16(<4 x i16> [[insa]], <4 x i16> [[insmul]])			// CHECK: [[add:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqadd.v4i16(<4 x i16> [[insa]], <4 x i16> [[insmul]])
	// CHECK: extractelement <4 x i16> [[add]], i64 0			// CHECK: extractelement <4 x i16> [[add]], i64 0
	return vqrdmlahh_lane_s16(a, b, c, 3);			return vqrdmlahh_lane_s16(a, b, c, 3);
	}			}

	// CHECK-LABEL: test_vqrdmlahs_lane_s32			// CHECK-LABEL: test_vqrdmlahs_lane_s32
	int32_t test_vqrdmlahs_lane_s32(int32_t a, int32_t b, int32x2_t c) {			int32_t test_vqrdmlahs_lane_s32(int32_t a, int32_t b, int32x2_t c) {
	// CHECK: extractelement <2 x i32> {{%.*}}, i32 1			// CHECK: extractelement <2 x i32> {{%.*}}, i32 1
	// CHECK: call i32 @llvm.aarch64.neon.sqrdmulh.i32(i32 {{%.}}, i32 {{%.}})			// CHECK: call i32 @llvm.aarch64.neon.sqrdmulh.i32(i32 {{%.}}, i32 {{%.}})
	// CHECK: call i32 @llvm.aarch64.neon.sqadd.i32(i32 {{%.}}, i32 {{%.}})			// CHECK: call i32 @llvm.aarch64.neon.sqadd.i32(i32 {{%.}}, i32 {{%.}})
	return vqrdmlahs_lane_s32(a, b, c, 1);			return vqrdmlahs_lane_s32(a, b, c, 1);
	}			}

	// CHECK-LABEL: test_vqrdmlahh_laneq_s16			// CHECK-LABEL: test_vqrdmlahh_laneq_s16
	int16_t test_vqrdmlahh_laneq_s16(int16_t a, int16_t b, int16x8_t c) {			int16_t test_vqrdmlahh_laneq_s16(int16_t a, int16_t b, int16x8_t c) {
	// CHECK: extractelement <8 x i16> {{%.*}}, i32 7			// CHECK: extractelement <8 x i16> {{%.*}}, i32 7
	// CHECK: [[insb:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insb:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[insc:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insc:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[mul:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrdmulh.v4i16(<4 x i16> [[insb]], <4 x i16> [[insc]])			// CHECK: [[mul:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrdmulh.v4i16(<4 x i16> [[insb]], <4 x i16> [[insc]])
	// CHECK: extractelement <4 x i16> [[mul]], i64 0			// CHECK: extractelement <4 x i16> [[mul]], i64 0
	// CHECK: [[insa:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insa:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[insmul:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insmul:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[add:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqadd.v4i16(<4 x i16> [[insa]], <4 x i16> [[insmul]])			// CHECK: [[add:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqadd.v4i16(<4 x i16> [[insa]], <4 x i16> [[insmul]])
	// CHECK: extractelement <4 x i16> [[add]], i64 0			// CHECK: extractelement <4 x i16> [[add]], i64 0
	return vqrdmlahh_laneq_s16(a, b, c, 7);			return vqrdmlahh_laneq_s16(a, b, c, 7);
	}			}

	// CHECK-LABEL: test_vqrdmlahs_laneq_s32			// CHECK-LABEL: test_vqrdmlahs_laneq_s32
	int32_t test_vqrdmlahs_laneq_s32(int32_t a, int32_t b, int32x4_t c) {			int32_t test_vqrdmlahs_laneq_s32(int32_t a, int32_t b, int32x4_t c) {
	// CHECK: extractelement <4 x i32> {{%.*}}, i32 3			// CHECK: extractelement <4 x i32> {{%.*}}, i32 3
	Show All 31 Lines
	// CHECK: shufflevector <4 x i32> {{%.}}, <4 x i32> {{%.}}, <4 x i32> <i32 3, i32 3, i32 3, i32 3>			// CHECK: shufflevector <4 x i32> {{%.}}, <4 x i32> {{%.}}, <4 x i32> <i32 3, i32 3, i32 3, i32 3>
	// CHECK: call <4 x i32> @llvm.aarch64.neon.sqrdmulh.v4i32(<4 x i32> {{%.}}, <4 x i32> {{%.}})			// CHECK: call <4 x i32> @llvm.aarch64.neon.sqrdmulh.v4i32(<4 x i32> {{%.}}, <4 x i32> {{%.}})
	// CHECK: call <4 x i32> @llvm.aarch64.neon.sqsub.v4i32(<4 x i32> {{%.}}, <4 x i32> {{%.}})			// CHECK: call <4 x i32> @llvm.aarch64.neon.sqsub.v4i32(<4 x i32> {{%.}}, <4 x i32> {{%.}})
	return vqrdmlshq_laneq_s32(a, b, v, 3);			return vqrdmlshq_laneq_s32(a, b, v, 3);
	}			}

	// CHECK-LABEL: test_vqrdmlshh_s16			// CHECK-LABEL: test_vqrdmlshh_s16
	int16_t test_vqrdmlshh_s16(int16_t a, int16_t b, int16_t c) {			int16_t test_vqrdmlshh_s16(int16_t a, int16_t b, int16_t c) {
	// CHECK: [[insb:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insb:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[insc:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insc:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[mul:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrdmulh.v4i16(<4 x i16> [[insb]], <4 x i16> [[insc]])			// CHECK: [[mul:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrdmulh.v4i16(<4 x i16> [[insb]], <4 x i16> [[insc]])
	// CHECK: extractelement <4 x i16> [[mul]], i64 0			// CHECK: extractelement <4 x i16> [[mul]], i64 0
	// CHECK: [[insa:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insa:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[insmul:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insmul:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[sub:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqsub.v4i16(<4 x i16> [[insa]], <4 x i16> [[insmul]])			// CHECK: [[sub:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqsub.v4i16(<4 x i16> [[insa]], <4 x i16> [[insmul]])
	// CHECK: extractelement <4 x i16> [[sub]], i64 0			// CHECK: extractelement <4 x i16> [[sub]], i64 0
	return vqrdmlshh_s16(a, b, c);			return vqrdmlshh_s16(a, b, c);
	}			}

	// CHECK-LABEL: test_vqrdmlshs_s32			// CHECK-LABEL: test_vqrdmlshs_s32
	int32_t test_vqrdmlshs_s32(int32_t a, int32_t b, int32_t c) {			int32_t test_vqrdmlshs_s32(int32_t a, int32_t b, int32_t c) {
	// CHECK: call i32 @llvm.aarch64.neon.sqrdmulh.i32(i32 {{%.}}, i32 {{%.}})			// CHECK: call i32 @llvm.aarch64.neon.sqrdmulh.i32(i32 {{%.}}, i32 {{%.}})
	// CHECK: call i32 @llvm.aarch64.neon.sqsub.i32(i32 {{%.}}, i32 {{%.}})			// CHECK: call i32 @llvm.aarch64.neon.sqsub.i32(i32 {{%.}}, i32 {{%.}})
	return vqrdmlshs_s32(a, b, c);			return vqrdmlshs_s32(a, b, c);
	}			}

	// CHECK-LABEL: test_vqrdmlshh_lane_s16			// CHECK-LABEL: test_vqrdmlshh_lane_s16
	int16_t test_vqrdmlshh_lane_s16(int16_t a, int16_t b, int16x4_t c) {			int16_t test_vqrdmlshh_lane_s16(int16_t a, int16_t b, int16x4_t c) {
	// CHECK: extractelement <4 x i16> {{%.*}}, i32 3			// CHECK: extractelement <4 x i16> {{%.*}}, i32 3
	// CHECK: [[insb:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insb:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[insc:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insc:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[mul:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrdmulh.v4i16(<4 x i16> [[insb]], <4 x i16> [[insc]])			// CHECK: [[mul:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrdmulh.v4i16(<4 x i16> [[insb]], <4 x i16> [[insc]])
	// CHECK: extractelement <4 x i16> [[mul]], i64 0			// CHECK: extractelement <4 x i16> [[mul]], i64 0
	// CHECK: [[insa:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insa:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[insmul:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insmul:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[sub:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqsub.v4i16(<4 x i16> [[insa]], <4 x i16> [[insmul]])			// CHECK: [[sub:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqsub.v4i16(<4 x i16> [[insa]], <4 x i16> [[insmul]])
	// CHECK: extractelement <4 x i16> [[sub]], i64 0			// CHECK: extractelement <4 x i16> [[sub]], i64 0
	return vqrdmlshh_lane_s16(a, b, c, 3);			return vqrdmlshh_lane_s16(a, b, c, 3);
	}			}

	// CHECK-LABEL: test_vqrdmlshs_lane_s32			// CHECK-LABEL: test_vqrdmlshs_lane_s32
	int32_t test_vqrdmlshs_lane_s32(int32_t a, int32_t b, int32x2_t c) {			int32_t test_vqrdmlshs_lane_s32(int32_t a, int32_t b, int32x2_t c) {
	// CHECK: extractelement <2 x i32> {{%.*}}, i32 1			// CHECK: extractelement <2 x i32> {{%.*}}, i32 1
	// CHECK: call i32 @llvm.aarch64.neon.sqrdmulh.i32(i32 {{%.}}, i32 {{%.}})			// CHECK: call i32 @llvm.aarch64.neon.sqrdmulh.i32(i32 {{%.}}, i32 {{%.}})
	// CHECK: call i32 @llvm.aarch64.neon.sqsub.i32(i32 {{%.}}, i32 {{%.}})			// CHECK: call i32 @llvm.aarch64.neon.sqsub.i32(i32 {{%.}}, i32 {{%.}})
	return vqrdmlshs_lane_s32(a, b, c, 1);			return vqrdmlshs_lane_s32(a, b, c, 1);
	}			}

	// CHECK-LABEL: test_vqrdmlshh_laneq_s16			// CHECK-LABEL: test_vqrdmlshh_laneq_s16
	int16_t test_vqrdmlshh_laneq_s16(int16_t a, int16_t b, int16x8_t c) {			int16_t test_vqrdmlshh_laneq_s16(int16_t a, int16_t b, int16x8_t c) {
	// CHECK: extractelement <8 x i16> {{%.*}}, i32 7			// CHECK: extractelement <8 x i16> {{%.*}}, i32 7
	// CHECK: [[insb:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insb:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[insc:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insc:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[mul:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrdmulh.v4i16(<4 x i16> [[insb]], <4 x i16> [[insc]])			// CHECK: [[mul:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrdmulh.v4i16(<4 x i16> [[insb]], <4 x i16> [[insc]])
	// CHECK: extractelement <4 x i16> [[mul]], i64 0			// CHECK: extractelement <4 x i16> [[mul]], i64 0
	// CHECK: [[insa:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insa:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[insmul:%.]] = insertelement <4 x i16> undef, i16 {{%.}}, i64 0			// CHECK: [[insmul:%.]] = insertelement <4 x i16> zeroinitializer, i16 {{%.}}, i64 0
	// CHECK: [[sub:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqsub.v4i16(<4 x i16> [[insa]], <4 x i16> [[insmul]])			// CHECK: [[sub:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqsub.v4i16(<4 x i16> [[insa]], <4 x i16> [[insmul]])
	// CHECK: extractelement <4 x i16> [[sub]], i64 0			// CHECK: extractelement <4 x i16> [[sub]], i64 0
	return vqrdmlshh_laneq_s16(a, b, c, 7);			return vqrdmlshh_laneq_s16(a, b, c, 7);
	}			}

	// CHECK-LABEL: test_vqrdmlshs_laneq_s32			// CHECK-LABEL: test_vqrdmlshs_laneq_s32
	int32_t test_vqrdmlshs_laneq_s32(int32_t a, int32_t b, int32x4_t c) {			int32_t test_vqrdmlshs_laneq_s32(int32_t a, int32_t b, int32x4_t c) {
	// CHECK: extractelement <4 x i32> {{%.*}}, i32 3			// CHECK: extractelement <4 x i32> {{%.*}}, i32 3
	// CHECK: call i32 @llvm.aarch64.neon.sqrdmulh.i32(i32 {{%.}}, i32 {{%.}})			// CHECK: call i32 @llvm.aarch64.neon.sqrdmulh.i32(i32 {{%.}}, i32 {{%.}})
	// CHECK: call i32 @llvm.aarch64.neon.sqsub.i32(i32 {{%.}}, i32 {{%.}})			// CHECK: call i32 @llvm.aarch64.neon.sqsub.i32(i32 {{%.}}, i32 {{%.}})
	return vqrdmlshs_laneq_s32(a, b, c, 3);			return vqrdmlshs_laneq_s32(a, b, c, 3);
	}			}