This is an archive of the discontinued LLVM Phabricator instance.

[ARM] Avoid pointless vrev of element-wise vmov
ClosedPublic

Authored by john.brawn on Mar 20 2020, 10:19 AM.

Download Raw Diff

Details

Reviewers

dmgreen
simon_tatham
SjoerdMeijer

Commits

rGcd58fb632533: [ARM] Avoid pointless vrev of element-wise vmov

Summary

If we have an element-wise vmov immediate instruction then a subsequent vrev with width greater or equal to the vmov element width, then that vrev won't do anything. Add a DAG combine to convert bitcasts that would become such vrevs into vector_reg_casts instead.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

john.brawn created this revision.Mar 20 2020, 10:19 AM

Herald added a project: Restricted Project. · View Herald TranscriptMar 20 2020, 10:19 AM

Herald added subscribers: hiraditya, kristof.beyls. · View Herald Transcript

john.brawn added a child revision: D76515: [ARM] Fix incorrect handling of big-endian vmov.i64.Mar 20 2020, 10:22 AM

Harbormaster completed remote builds in B49915: Diff 251687.Mar 20 2020, 10:50 AM

I see. Because we are just swapping around the same values anyway. Makes sense.

Would it make sense to do this as a DAG fold? That way we would get MVE for free too.

llvm/test/CodeGen/ARM/vmov.ll
416–1	Can you please run the update script on this with old codegen, pre-commit the result and then show the diffs against new codegen here. It might help to make them hard-float too.

In D76514#1937042, @dmgreen wrote:

Would it make sense to do this as a DAG fold? That way we would get MVE for free too.

Do you mean do something in PerformDAGCombine? I don't think that would work, because the only way to do it that I can see would be to remove the bitcast but then we'd get an error due to a type mismatch.

We added a VECTOR_REG_CAST, which it like a bitcast but doesn't change the bits. Similar to the AArch64 NVCAST.

Not that you have to do this here, but it also might allow more patterns to be converted, removing move vrev's. Essentially if the immediate after it has been bitcast/vrev'd is still a legal immediate, we can just generate the new immediate and VECTOR_REG_CAST it.

Do this in ARMTargetLowering::PerformDAGCombine

john.brawn marked an inline comment as done.Mar 26 2020, 11:42 AM

john.brawn added inline comments.

llvm/test/CodeGen/ARM/vmov.ll
416–1	I tried using update_llc_test_checks.py, but it doesn't really work well here because the compiler output is different when big-endian and little-endian (for the llc before this patch, and also in the tests that aren't to do with this patch) and the only way the script can cope with that is to have entirely separate check prefixes, which doesn't do a good job of checking that the code generated doesn't change depending on endianness.

RKSimon added a subscriber: RKSimon.Mar 26 2020, 1:18 PM

RKSimon added inline comments.

llvm/test/CodeGen/ARM/vmov.ll
416–1	you can add common prefixes: --check-prefixes=ALL,LE --check-prefixes=ALL,BE

john.brawn marked an inline comment as done.Mar 27 2020, 5:12 AM

john.brawn added inline comments.

llvm/test/CodeGen/ARM/vmov.ll
416–1	update_llc_test_checks.py ignores everything but the last prefix (there's a FIXME in it about this).

The code looks OK. I think update_llc_test_checks should work, I've used it elsewhere in the past.

You may run into problems with zero vectors no longer being recognized? Like in the passthru of masked loads. Can you rebase this onto the MVE tests too?

Rebase and add adjust MVE masked load handling. Also make use of update_llc_checks - I tried it again and this time it did use a single CHECK when both little-endian and big-endian code generation are the same, so it looks like I was using it wrong somehow before (though I don't know in what way).

LGTM, Thanks.

This revision is now accepted and ready to land.Apr 3 2020, 8:40 AM

Closed by commit rGcd58fb632533: [ARM] Avoid pointless vrev of element-wise vmov (authored by john.brawn). · Explain WhyApr 3 2020, 9:42 AM

This revision was automatically updated to reflect the committed changes.

john.brawn mentioned this in rG966ae762229f: Run update_llc_test on test/CodeGen/ARM/vmov.ll.

Revision Contents

Path

Size

llvm/

lib/

Target/

ARM/

ARMISelLowering.cpp

32 lines

test/

CodeGen/

ARM/

vmov.ll

1016 lines

Thumb2/

mve-masked-load.ll

6 lines

mve-vmovimm.ll

255 lines

Diff 254844

llvm/lib/Target/ARM/ARMISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 937 Lines • ▼ Show 20 Lines	if (Subtarget->hasNEON() \|\| Subtarget->hasMVEIntegerOps()) {
setTargetDAGCombine(ISD::SIGN_EXTEND);		setTargetDAGCombine(ISD::SIGN_EXTEND);
setTargetDAGCombine(ISD::ZERO_EXTEND);		setTargetDAGCombine(ISD::ZERO_EXTEND);
setTargetDAGCombine(ISD::ANY_EXTEND);		setTargetDAGCombine(ISD::ANY_EXTEND);
setTargetDAGCombine(ISD::INTRINSIC_WO_CHAIN);		setTargetDAGCombine(ISD::INTRINSIC_WO_CHAIN);
setTargetDAGCombine(ISD::INTRINSIC_W_CHAIN);		setTargetDAGCombine(ISD::INTRINSIC_W_CHAIN);
setTargetDAGCombine(ISD::INTRINSIC_VOID);		setTargetDAGCombine(ISD::INTRINSIC_VOID);
setTargetDAGCombine(ISD::VECREDUCE_ADD);		setTargetDAGCombine(ISD::VECREDUCE_ADD);
setTargetDAGCombine(ISD::ADD);		setTargetDAGCombine(ISD::ADD);
		setTargetDAGCombine(ISD::BITCAST);
}		}

if (!Subtarget->hasFP64()) {		if (!Subtarget->hasFP64()) {
// When targeting a floating-point unit with only single-precision		// When targeting a floating-point unit with only single-precision
// operations, f64 is legal for the few double-precision instructions which		// operations, f64 is legal for the few double-precision instructions which
// are present However, no double-precision operations other than moves,		// are present However, no double-precision operations other than moves,
// loads and stores are provided by the hardware.		// loads and stores are provided by the hardware.
setOperationAction(ISD::FADD, MVT::f64, Expand);		setOperationAction(ISD::FADD, MVT::f64, Expand);
▲ Show 20 Lines • Show All 8,264 Lines • ▼ Show 20 Lines	static SDValue LowerMLOAD(SDValue Op, SelectionDAG &DAG) {
// zero too, and other values are lowered to a select.		// zero too, and other values are lowered to a select.
SDValue ZeroVec = DAG.getNode(ARMISD::VMOVIMM, dl, VT,		SDValue ZeroVec = DAG.getNode(ARMISD::VMOVIMM, dl, VT,
DAG.getTargetConstant(0, dl, MVT::i32));		DAG.getTargetConstant(0, dl, MVT::i32));
SDValue NewLoad = DAG.getMaskedLoad(		SDValue NewLoad = DAG.getMaskedLoad(
VT, dl, N->getChain(), N->getBasePtr(), N->getOffset(), Mask, ZeroVec,		VT, dl, N->getChain(), N->getBasePtr(), N->getOffset(), Mask, ZeroVec,
N->getMemoryVT(), N->getMemOperand(), N->getAddressingMode(),		N->getMemoryVT(), N->getMemOperand(), N->getAddressingMode(),
N->getExtensionType(), N->isExpandingLoad());		N->getExtensionType(), N->isExpandingLoad());
SDValue Combo = NewLoad;		SDValue Combo = NewLoad;
if (!PassThru.isUndef() &&		bool PassThruIsCastZero = (PassThru.getOpcode() == ISD::BITCAST \|\|
(PassThru.getOpcode() != ISD::BITCAST \|\|		PassThru.getOpcode() == ARMISD::VECTOR_REG_CAST) &&
!isZeroVector(PassThru->getOperand(0))))		isZeroVector(PassThru->getOperand(0));
		if (!PassThru.isUndef() && !PassThruIsCastZero)
Combo = DAG.getNode(ISD::VSELECT, dl, VT, Mask, NewLoad, PassThru);		Combo = DAG.getNode(ISD::VSELECT, dl, VT, Mask, NewLoad, PassThru);
return DAG.getMergeValues({Combo, NewLoad.getValue(1)}, dl);		return DAG.getMergeValues({Combo, NewLoad.getValue(1)}, dl);
}		}

static SDValue LowerAtomicLoadStore(SDValue Op, SelectionDAG &DAG) {		static SDValue LowerAtomicLoadStore(SDValue Op, SelectionDAG &DAG) {
if (isStrongerThanMonotonic(cast<AtomicSDNode>(Op)->getOrdering()))		if (isStrongerThanMonotonic(cast<AtomicSDNode>(Op)->getOrdering()))
// Acquire/Release load/store is not legal for targets without a dmb or		// Acquire/Release load/store is not legal for targets without a dmb or
// equivalent available.		// equivalent available.
▲ Show 20 Lines • Show All 5,969 Lines • ▼ Show 20 Lines	if (Res.getNode()) {
else if (Known.Zero == 0xffff0000)		else if (Known.Zero == 0xffff0000)
Res = DAG.getNode(ISD::AssertZext, dl, MVT::i32, Res,		Res = DAG.getNode(ISD::AssertZext, dl, MVT::i32, Res,
DAG.getValueType(MVT::i16));		DAG.getValueType(MVT::i16));
}		}

return Res;		return Res;
}		}

		static SDValue PerformBITCASTCombine(SDNode *N, SelectionDAG &DAG) {
		SDValue Src = N->getOperand(0);

		// We may have a bitcast of something that has already had this bitcast
		// combine performed on it, so skip past any VECTOR_REG_CASTs.
		while (Src.getOpcode() == ARMISD::VECTOR_REG_CAST)
		Src = Src.getOperand(0);

		// Bitcast from element-wise VMOV or VMVN doesn't need VREV if the VREV that
		// would be generated is at least the width of the element type.
		EVT SrcVT = Src.getValueType();
		EVT DstVT = N->getValueType(0);
		if ((Src.getOpcode() == ARMISD::VMOVIMM \|\|
		Src.getOpcode() == ARMISD::VMVNIMM \|\|
		Src.getOpcode() == ARMISD::VMOVFPIMM) &&
		SrcVT.getScalarSizeInBits() <= DstVT.getScalarSizeInBits() &&
		DAG.getDataLayout().isBigEndian())
		return DAG.getNode(ARMISD::VECTOR_REG_CAST, SDLoc(N), DstVT, Src);

		return SDValue();
		}

SDValue ARMTargetLowering::PerformDAGCombine(SDNode *N,		SDValue ARMTargetLowering::PerformDAGCombine(SDNode *N,
DAGCombinerInfo &DCI) const {		DAGCombinerInfo &DCI) const {
switch (N->getOpcode()) {		switch (N->getOpcode()) {
default: break;		default: break;
case ISD::ABS: return PerformABSCombine(N, DCI, Subtarget);		case ISD::ABS: return PerformABSCombine(N, DCI, Subtarget);
case ARMISD::ADDE: return PerformADDECombine(N, DCI, Subtarget);		case ARMISD::ADDE: return PerformADDECombine(N, DCI, Subtarget);
case ARMISD::UMLAL: return PerformUMLALCombine(N, DCI.DAG, Subtarget);		case ARMISD::UMLAL: return PerformUMLALCombine(N, DCI.DAG, Subtarget);
case ISD::ADD: return PerformADDCombine(N, DCI, Subtarget);		case ISD::ADD: return PerformADDCombine(N, DCI, Subtarget);
Show All 37 Lines	SDValue ARMTargetLowering::PerformDAGCombine(SDNode *N,
case ISD::LOAD: return PerformLOADCombine(N, DCI);		case ISD::LOAD: return PerformLOADCombine(N, DCI);
case ARMISD::VLD1DUP:		case ARMISD::VLD1DUP:
case ARMISD::VLD2DUP:		case ARMISD::VLD2DUP:
case ARMISD::VLD3DUP:		case ARMISD::VLD3DUP:
case ARMISD::VLD4DUP:		case ARMISD::VLD4DUP:
return PerformVLDCombine(N, DCI);		return PerformVLDCombine(N, DCI);
case ARMISD::BUILD_VECTOR:		case ARMISD::BUILD_VECTOR:
return PerformARMBUILD_VECTORCombine(N, DCI);		return PerformARMBUILD_VECTORCombine(N, DCI);
		case ISD::BITCAST:
		return PerformBITCASTCombine(N, DCI.DAG);
case ARMISD::PREDICATE_CAST:		case ARMISD::PREDICATE_CAST:
return PerformPREDICATE_CASTCombine(N, DCI);		return PerformPREDICATE_CASTCombine(N, DCI);
case ARMISD::VECTOR_REG_CAST:		case ARMISD::VECTOR_REG_CAST:
return PerformVECTOR_REG_CASTCombine(N, DCI, Subtarget);		return PerformVECTOR_REG_CASTCombine(N, DCI, Subtarget);
case ARMISD::VCMP:		case ARMISD::VCMP:
return PerformVCMPCombine(N, DCI, Subtarget);		return PerformVCMPCombine(N, DCI, Subtarget);
case ISD::VECREDUCE_ADD:		case ISD::VECREDUCE_ADD:
return PerformVECREDUCE_ADDCombine(N, DCI.DAG, Subtarget);		return PerformVECREDUCE_ADDCombine(N, DCI.DAG, Subtarget);
▲ Show 20 Lines • Show All 2,894 Lines • Show Last 20 Lines

llvm/test/CodeGen/ARM/vmov.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
		dmgreenUnsubmitted Not Done Reply Inline Actions Can you please run the update script on this with old codegen, pre-commit the result and then show the diffs against new codegen here. It might help to make them hard-float too. dmgreen: Can you please run the update script on this with old codegen, pre-commit the result and then…
		john.brawnAuthorUnsubmitted Done Reply Inline Actions I tried using update_llc_test_checks.py, but it doesn't really work well here because the compiler output is different when big-endian and little-endian (for the llc before this patch, and also in the tests that aren't to do with this patch) and the only way the script can cope with that is to have entirely separate check prefixes, which doesn't do a good job of checking that the code generated doesn't change depending on endianness. john.brawn: I tried using update_llc_test_checks.py, but it doesn't really work well here because the…
		RKSimonUnsubmitted Not Done Reply Inline Actions you can add common prefixes: --check-prefixes=ALL,LE --check-prefixes=ALL,BE RKSimon: you can add common prefixes: --check-prefixes=ALL,LE --check-prefixes=ALL,BE
		john.brawnAuthorUnsubmitted Done Reply Inline Actions update_llc_test_checks.py ignores everything but the last prefix (there's a FIXME in it about this). john.brawn: update_llc_test_checks.py ignores everything but the last prefix (there's a FIXME in it about…
; RUN: llc -mtriple=arm-eabi -mattr=+neon %s -o - \| FileCheck --check-prefixes=CHECK,CHECK-LE %s		; RUN: llc -mtriple=arm-eabi -mattr=+neon,+fullfp16 %s -o - \| FileCheck --check-prefixes=CHECK,CHECK-LE %s
; RUN: llc -mtriple=armeb-eabi -mattr=+neon %s -o - \| FileCheck --check-prefixes=CHECK,CHECK-BE %s		; RUN: llc -mtriple=armeb-eabi -mattr=+neon,+fullfp16 %s -o - \| FileCheck --check-prefixes=CHECK,CHECK-BE %s

define arm_aapcs_vfpcc <8 x i8> @v_movi8() nounwind {		define arm_aapcs_vfpcc <8 x i8> @v_movi8() nounwind {
; CHECK-LE-LABEL: v_movi8:		; CHECK-LABEL: v_movi8:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmov.i8 d0, #0x8		; CHECK-NEXT: vmov.i8 d0, #0x8
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_movi8:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmov.i8 d16, #0x8
; CHECK-BE-NEXT: vrev64.8 d0, d16
; CHECK-BE-NEXT: mov pc, lr
ret <8 x i8> < i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8 >		ret <8 x i8> < i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8 >
}		}

define arm_aapcs_vfpcc <4 x i16> @v_movi16a() nounwind {		define arm_aapcs_vfpcc <4 x i16> @v_movi16a() nounwind {
; CHECK-LE-LABEL: v_movi16a:		; CHECK-LABEL: v_movi16a:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmov.i16 d0, #0x10		; CHECK-NEXT: vmov.i16 d0, #0x10
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_movi16a:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmov.i16 d16, #0x10
; CHECK-BE-NEXT: vrev64.16 d0, d16
; CHECK-BE-NEXT: mov pc, lr
ret <4 x i16> < i16 16, i16 16, i16 16, i16 16 >		ret <4 x i16> < i16 16, i16 16, i16 16, i16 16 >
}		}

define arm_aapcs_vfpcc <4 x i16> @v_movi16b() nounwind {		define arm_aapcs_vfpcc <4 x i16> @v_movi16b() nounwind {
; CHECK-LE-LABEL: v_movi16b:		; CHECK-LABEL: v_movi16b:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmov.i16 d0, #0x1000		; CHECK-NEXT: vmov.i16 d0, #0x1000
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_movi16b:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmov.i16 d16, #0x1000
; CHECK-BE-NEXT: vrev64.16 d0, d16
; CHECK-BE-NEXT: mov pc, lr
ret <4 x i16> < i16 4096, i16 4096, i16 4096, i16 4096 >		ret <4 x i16> < i16 4096, i16 4096, i16 4096, i16 4096 >
}		}

define arm_aapcs_vfpcc <4 x i16> @v_mvni16a() nounwind {		define arm_aapcs_vfpcc <4 x i16> @v_mvni16a() nounwind {
; CHECK-LE-LABEL: v_mvni16a:		; CHECK-LABEL: v_mvni16a:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmvn.i16 d0, #0x10		; CHECK-NEXT: vmvn.i16 d0, #0x10
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_mvni16a:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmvn.i16 d16, #0x10
; CHECK-BE-NEXT: vrev64.16 d0, d16
; CHECK-BE-NEXT: mov pc, lr
ret <4 x i16> < i16 65519, i16 65519, i16 65519, i16 65519 >		ret <4 x i16> < i16 65519, i16 65519, i16 65519, i16 65519 >
}		}

define arm_aapcs_vfpcc <4 x i16> @v_mvni16b() nounwind {		define arm_aapcs_vfpcc <4 x i16> @v_mvni16b() nounwind {
; CHECK-LE-LABEL: v_mvni16b:		; CHECK-LABEL: v_mvni16b:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmvn.i16 d0, #0x1000		; CHECK-NEXT: vmvn.i16 d0, #0x1000
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_mvni16b:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmvn.i16 d16, #0x1000
; CHECK-BE-NEXT: vrev64.16 d0, d16
; CHECK-BE-NEXT: mov pc, lr
ret <4 x i16> < i16 61439, i16 61439, i16 61439, i16 61439 >		ret <4 x i16> < i16 61439, i16 61439, i16 61439, i16 61439 >
}		}

define arm_aapcs_vfpcc <2 x i32> @v_movi32a() nounwind {		define arm_aapcs_vfpcc <2 x i32> @v_movi32a() nounwind {
; CHECK-LE-LABEL: v_movi32a:		; CHECK-LABEL: v_movi32a:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmov.i32 d0, #0x20		; CHECK-NEXT: vmov.i32 d0, #0x20
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_movi32a:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmov.i32 d16, #0x20
; CHECK-BE-NEXT: vrev64.32 d0, d16
; CHECK-BE-NEXT: mov pc, lr
ret <2 x i32> < i32 32, i32 32 >		ret <2 x i32> < i32 32, i32 32 >
}		}

define arm_aapcs_vfpcc <2 x i32> @v_movi32b() nounwind {		define arm_aapcs_vfpcc <2 x i32> @v_movi32b() nounwind {
; CHECK-LE-LABEL: v_movi32b:		; CHECK-LABEL: v_movi32b:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmov.i32 d0, #0x2000		; CHECK-NEXT: vmov.i32 d0, #0x2000
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_movi32b:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmov.i32 d16, #0x2000
; CHECK-BE-NEXT: vrev64.32 d0, d16
; CHECK-BE-NEXT: mov pc, lr
ret <2 x i32> < i32 8192, i32 8192 >		ret <2 x i32> < i32 8192, i32 8192 >
}		}

define arm_aapcs_vfpcc <2 x i32> @v_movi32c() nounwind {		define arm_aapcs_vfpcc <2 x i32> @v_movi32c() nounwind {
; CHECK-LE-LABEL: v_movi32c:		; CHECK-LABEL: v_movi32c:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmov.i32 d0, #0x200000		; CHECK-NEXT: vmov.i32 d0, #0x200000
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_movi32c:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmov.i32 d16, #0x200000
; CHECK-BE-NEXT: vrev64.32 d0, d16
; CHECK-BE-NEXT: mov pc, lr
ret <2 x i32> < i32 2097152, i32 2097152 >		ret <2 x i32> < i32 2097152, i32 2097152 >
}		}

define arm_aapcs_vfpcc <2 x i32> @v_movi32d() nounwind {		define arm_aapcs_vfpcc <2 x i32> @v_movi32d() nounwind {
; CHECK-LE-LABEL: v_movi32d:		; CHECK-LABEL: v_movi32d:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmov.i32 d0, #0x20000000		; CHECK-NEXT: vmov.i32 d0, #0x20000000
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_movi32d:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmov.i32 d16, #0x20000000
; CHECK-BE-NEXT: vrev64.32 d0, d16
; CHECK-BE-NEXT: mov pc, lr
ret <2 x i32> < i32 536870912, i32 536870912 >		ret <2 x i32> < i32 536870912, i32 536870912 >
}		}

define arm_aapcs_vfpcc <2 x i32> @v_movi32e() nounwind {		define arm_aapcs_vfpcc <2 x i32> @v_movi32e() nounwind {
; CHECK-LE-LABEL: v_movi32e:		; CHECK-LABEL: v_movi32e:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmov.i32 d0, #0x20ff		; CHECK-NEXT: vmov.i32 d0, #0x20ff
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_movi32e:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmov.i32 d16, #0x20ff
; CHECK-BE-NEXT: vrev64.32 d0, d16
; CHECK-BE-NEXT: mov pc, lr
ret <2 x i32> < i32 8447, i32 8447 >		ret <2 x i32> < i32 8447, i32 8447 >
}		}

define arm_aapcs_vfpcc <2 x i32> @v_movi32f() nounwind {		define arm_aapcs_vfpcc <2 x i32> @v_movi32f() nounwind {
; CHECK-LE-LABEL: v_movi32f:		; CHECK-LABEL: v_movi32f:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmov.i32 d0, #0x20ffff		; CHECK-NEXT: vmov.i32 d0, #0x20ffff
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_movi32f:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmov.i32 d16, #0x20ffff
; CHECK-BE-NEXT: vrev64.32 d0, d16
; CHECK-BE-NEXT: mov pc, lr
ret <2 x i32> < i32 2162687, i32 2162687 >		ret <2 x i32> < i32 2162687, i32 2162687 >
}		}

define arm_aapcs_vfpcc <2 x i32> @v_mvni32a() nounwind {		define arm_aapcs_vfpcc <2 x i32> @v_mvni32a() nounwind {
; CHECK-LE-LABEL: v_mvni32a:		; CHECK-LABEL: v_mvni32a:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmvn.i32 d0, #0x20		; CHECK-NEXT: vmvn.i32 d0, #0x20
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_mvni32a:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmvn.i32 d16, #0x20
; CHECK-BE-NEXT: vrev64.32 d0, d16
; CHECK-BE-NEXT: mov pc, lr
ret <2 x i32> < i32 4294967263, i32 4294967263 >		ret <2 x i32> < i32 4294967263, i32 4294967263 >
}		}

define arm_aapcs_vfpcc <2 x i32> @v_mvni32b() nounwind {		define arm_aapcs_vfpcc <2 x i32> @v_mvni32b() nounwind {
; CHECK-LE-LABEL: v_mvni32b:		; CHECK-LABEL: v_mvni32b:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmvn.i32 d0, #0x2000		; CHECK-NEXT: vmvn.i32 d0, #0x2000
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_mvni32b:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmvn.i32 d16, #0x2000
; CHECK-BE-NEXT: vrev64.32 d0, d16
; CHECK-BE-NEXT: mov pc, lr
ret <2 x i32> < i32 4294959103, i32 4294959103 >		ret <2 x i32> < i32 4294959103, i32 4294959103 >
}		}

define arm_aapcs_vfpcc <2 x i32> @v_mvni32c() nounwind {		define arm_aapcs_vfpcc <2 x i32> @v_mvni32c() nounwind {
; CHECK-LE-LABEL: v_mvni32c:		; CHECK-LABEL: v_mvni32c:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmvn.i32 d0, #0x200000		; CHECK-NEXT: vmvn.i32 d0, #0x200000
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_mvni32c:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmvn.i32 d16, #0x200000
; CHECK-BE-NEXT: vrev64.32 d0, d16
; CHECK-BE-NEXT: mov pc, lr
ret <2 x i32> < i32 4292870143, i32 4292870143 >		ret <2 x i32> < i32 4292870143, i32 4292870143 >
}		}

define arm_aapcs_vfpcc <2 x i32> @v_mvni32d() nounwind {		define arm_aapcs_vfpcc <2 x i32> @v_mvni32d() nounwind {
; CHECK-LE-LABEL: v_mvni32d:		; CHECK-LABEL: v_mvni32d:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmvn.i32 d0, #0x20000000		; CHECK-NEXT: vmvn.i32 d0, #0x20000000
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_mvni32d:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmvn.i32 d16, #0x20000000
; CHECK-BE-NEXT: vrev64.32 d0, d16
; CHECK-BE-NEXT: mov pc, lr
ret <2 x i32> < i32 3758096383, i32 3758096383 >		ret <2 x i32> < i32 3758096383, i32 3758096383 >
}		}

define arm_aapcs_vfpcc <2 x i32> @v_mvni32e() nounwind {		define arm_aapcs_vfpcc <2 x i32> @v_mvni32e() nounwind {
; CHECK-LE-LABEL: v_mvni32e:		; CHECK-LABEL: v_mvni32e:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmvn.i32 d0, #0x20ff		; CHECK-NEXT: vmvn.i32 d0, #0x20ff
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_mvni32e:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmvn.i32 d16, #0x20ff
; CHECK-BE-NEXT: vrev64.32 d0, d16
; CHECK-BE-NEXT: mov pc, lr
ret <2 x i32> < i32 4294958848, i32 4294958848 >		ret <2 x i32> < i32 4294958848, i32 4294958848 >
}		}

define arm_aapcs_vfpcc <2 x i32> @v_mvni32f() nounwind {		define arm_aapcs_vfpcc <2 x i32> @v_mvni32f() nounwind {
; CHECK-LE-LABEL: v_mvni32f:		; CHECK-LABEL: v_mvni32f:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmvn.i32 d0, #0x20ffff		; CHECK-NEXT: vmvn.i32 d0, #0x20ffff
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_mvni32f:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmvn.i32 d16, #0x20ffff
; CHECK-BE-NEXT: vrev64.32 d0, d16
; CHECK-BE-NEXT: mov pc, lr
ret <2 x i32> < i32 4292804608, i32 4292804608 >		ret <2 x i32> < i32 4292804608, i32 4292804608 >
}		}

define arm_aapcs_vfpcc <1 x i64> @v_movi64() nounwind {		define arm_aapcs_vfpcc <1 x i64> @v_movi64() nounwind {
; CHECK-LABEL: v_movi64:		; CHECK-LABEL: v_movi64:
; CHECK: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-NEXT: vmov.i64 d0, #0xff0000ff0000ffff		; CHECK-NEXT: vmov.i64 d0, #0xff0000ff0000ffff
; CHECK-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
ret <1 x i64> < i64 18374687574888349695 >		ret <1 x i64> < i64 18374687574888349695 >
}		}

define arm_aapcs_vfpcc <16 x i8> @v_movQi8() nounwind {		define arm_aapcs_vfpcc <16 x i8> @v_movQi8() nounwind {
; CHECK-LE-LABEL: v_movQi8:		; CHECK-LABEL: v_movQi8:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmov.i8 q0, #0x8		; CHECK-NEXT: vmov.i8 q0, #0x8
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_movQi8:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmov.i8 q8, #0x8
; CHECK-BE-NEXT: vrev64.8 q0, q8
; CHECK-BE-NEXT: mov pc, lr
ret <16 x i8> < i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8 >		ret <16 x i8> < i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8 >
}		}

define arm_aapcs_vfpcc <8 x i16> @v_movQi16a() nounwind {		define arm_aapcs_vfpcc <8 x i16> @v_movQi16a() nounwind {
; CHECK-LE-LABEL: v_movQi16a:		; CHECK-LABEL: v_movQi16a:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmov.i16 q0, #0x10		; CHECK-NEXT: vmov.i16 q0, #0x10
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_movQi16a:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmov.i16 q8, #0x10
; CHECK-BE-NEXT: vrev64.16 q0, q8
; CHECK-BE-NEXT: mov pc, lr
ret <8 x i16> < i16 16, i16 16, i16 16, i16 16, i16 16, i16 16, i16 16, i16 16 >		ret <8 x i16> < i16 16, i16 16, i16 16, i16 16, i16 16, i16 16, i16 16, i16 16 >
}		}

define arm_aapcs_vfpcc <8 x i16> @v_movQi16b() nounwind {		define arm_aapcs_vfpcc <8 x i16> @v_movQi16b() nounwind {
; CHECK-LE-LABEL: v_movQi16b:		; CHECK-LABEL: v_movQi16b:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmov.i16 q0, #0x1000		; CHECK-NEXT: vmov.i16 q0, #0x1000
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_movQi16b:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmov.i16 q8, #0x1000
; CHECK-BE-NEXT: vrev64.16 q0, q8
; CHECK-BE-NEXT: mov pc, lr
ret <8 x i16> < i16 4096, i16 4096, i16 4096, i16 4096, i16 4096, i16 4096, i16 4096, i16 4096 >		ret <8 x i16> < i16 4096, i16 4096, i16 4096, i16 4096, i16 4096, i16 4096, i16 4096, i16 4096 >
}		}

define arm_aapcs_vfpcc <4 x i32> @v_movQi32a() nounwind {		define arm_aapcs_vfpcc <4 x i32> @v_movQi32a() nounwind {
; CHECK-LE-LABEL: v_movQi32a:		; CHECK-LABEL: v_movQi32a:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmov.i32 q0, #0x20		; CHECK-NEXT: vmov.i32 q0, #0x20
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_movQi32a:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmov.i32 q8, #0x20
; CHECK-BE-NEXT: vrev64.32 q0, q8
; CHECK-BE-NEXT: mov pc, lr
ret <4 x i32> < i32 32, i32 32, i32 32, i32 32 >		ret <4 x i32> < i32 32, i32 32, i32 32, i32 32 >
}		}

define arm_aapcs_vfpcc <4 x i32> @v_movQi32b() nounwind {		define arm_aapcs_vfpcc <4 x i32> @v_movQi32b() nounwind {
; CHECK-LE-LABEL: v_movQi32b:		; CHECK-LABEL: v_movQi32b:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmov.i32 q0, #0x2000		; CHECK-NEXT: vmov.i32 q0, #0x2000
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_movQi32b:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmov.i32 q8, #0x2000
; CHECK-BE-NEXT: vrev64.32 q0, q8
; CHECK-BE-NEXT: mov pc, lr
ret <4 x i32> < i32 8192, i32 8192, i32 8192, i32 8192 >		ret <4 x i32> < i32 8192, i32 8192, i32 8192, i32 8192 >
}		}

define arm_aapcs_vfpcc <4 x i32> @v_movQi32c() nounwind {		define arm_aapcs_vfpcc <4 x i32> @v_movQi32c() nounwind {
; CHECK-LE-LABEL: v_movQi32c:		; CHECK-LABEL: v_movQi32c:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmov.i32 q0, #0x200000		; CHECK-NEXT: vmov.i32 q0, #0x200000
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_movQi32c:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmov.i32 q8, #0x200000
; CHECK-BE-NEXT: vrev64.32 q0, q8
; CHECK-BE-NEXT: mov pc, lr
ret <4 x i32> < i32 2097152, i32 2097152, i32 2097152, i32 2097152 >		ret <4 x i32> < i32 2097152, i32 2097152, i32 2097152, i32 2097152 >
}		}

define arm_aapcs_vfpcc <4 x i32> @v_movQi32d() nounwind {		define arm_aapcs_vfpcc <4 x i32> @v_movQi32d() nounwind {
; CHECK-LE-LABEL: v_movQi32d:		; CHECK-LABEL: v_movQi32d:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmov.i32 q0, #0x20000000		; CHECK-NEXT: vmov.i32 q0, #0x20000000
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_movQi32d:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmov.i32 q8, #0x20000000
; CHECK-BE-NEXT: vrev64.32 q0, q8
; CHECK-BE-NEXT: mov pc, lr
ret <4 x i32> < i32 536870912, i32 536870912, i32 536870912, i32 536870912 >		ret <4 x i32> < i32 536870912, i32 536870912, i32 536870912, i32 536870912 >
}		}

define arm_aapcs_vfpcc <4 x i32> @v_movQi32e() nounwind {		define arm_aapcs_vfpcc <4 x i32> @v_movQi32e() nounwind {
; CHECK-LE-LABEL: v_movQi32e:		; CHECK-LABEL: v_movQi32e:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmov.i32 q0, #0x20ff		; CHECK-NEXT: vmov.i32 q0, #0x20ff
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_movQi32e:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmov.i32 q8, #0x20ff
; CHECK-BE-NEXT: vrev64.32 q0, q8
; CHECK-BE-NEXT: mov pc, lr
ret <4 x i32> < i32 8447, i32 8447, i32 8447, i32 8447 >		ret <4 x i32> < i32 8447, i32 8447, i32 8447, i32 8447 >
}		}

define arm_aapcs_vfpcc <4 x i32> @v_movQi32f() nounwind {		define arm_aapcs_vfpcc <4 x i32> @v_movQi32f() nounwind {
; CHECK-LE-LABEL: v_movQi32f:		; CHECK-LABEL: v_movQi32f:
; CHECK-LE: @ %bb.0:		; CHECK: @ %bb.0:
; CHECK-LE-NEXT: vmov.i32 q0, #0x20ffff		; CHECK-NEXT: vmov.i32 q0, #0x20ffff
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_movQi32f:
; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmov.i32 q8, #0x20ffff
; CHECK-BE-NEXT: vrev64.32 q0, q8
; CHECK-BE-NEXT: mov pc, lr
ret <4 x i32> < i32 2162687, i32 2162687, i32 2162687, i32 2162687 >		ret <4 x i32> < i32 2162687, i32 2162687, i32 2162687, i32 2162687 >
}		}

define arm_aapcs_vfpcc <2 x i64> @v_movQi64() nounwind {		define arm_aapcs_vfpcc <2 x i64> @v_movQi64() nounwind {
; CHECK-LE-LABEL: v_movQi64:		; CHECK-LE-LABEL: v_movQi64:
; CHECK-LE: @ %bb.0:		; CHECK-LE: @ %bb.0:
; CHECK-LE-NEXT: vmov.i64 q0, #0xff0000ff0000ffff		; CHECK-LE-NEXT: vmov.i64 q0, #0xff0000ff0000ffff
; CHECK-LE-NEXT: mov pc, lr		; CHECK-LE-NEXT: mov pc, lr
;		;
; CHECK-BE-LABEL: v_movQi64:		; CHECK-BE-LABEL: v_movQi64:
; CHECK-BE: @ %bb.0:		; CHECK-BE: @ %bb.0:
; CHECK-BE-NEXT: vmov.i64 q0, #0xffffff0000ff		; CHECK-BE-NEXT: vmov.i64 q0, #0xffffff0000ff
; CHECK-BE-NEXT: mov pc, lr		; CHECK-BE-NEXT: mov pc, lr
ret <2 x i64> < i64 18374687574888349695, i64 18374687574888349695 >		ret <2 x i64> < i64 18374687574888349695, i64 18374687574888349695 >
}		}

; Check for correct assembler printing for immediate values.		; Check for correct assembler printing for immediate values.
%struct.int8x8_t = type { <8 x i8> }		%struct.int8x8_t = type { <8 x i8> }
define arm_aapcs_vfpcc void @vdupn128(%struct.int8x8_t* noalias nocapture sret %agg.result) nounwind {		define arm_aapcs_vfpcc void @vdupn128(%struct.int8x8_t* noalias nocapture sret %agg.result) nounwind {
; CHECK-LE-LABEL: vdupn128:		; CHECK-LABEL: vdupn128:
; CHECK-LE: @ %bb.0: @ %entry		; CHECK: @ %bb.0: @ %entry
; CHECK-LE-NEXT: vmov.i8 d16, #0x80		; CHECK-NEXT: vmov.i8 d16, #0x80
; CHECK-LE-NEXT: vstr d16, [r0]		; CHECK-NEXT: vstr d16, [r0]
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: vdupn128:
; CHECK-BE: @ %bb.0: @ %entry
; CHECK-BE-NEXT: vmov.i8 d16, #0x80
; CHECK-BE-NEXT: vrev64.8 d16, d16
; CHECK-BE-NEXT: vstr d16, [r0]
; CHECK-BE-NEXT: mov pc, lr
entry:		entry:
%0 = getelementptr inbounds %struct.int8x8_t, %struct.int8x8_t* %agg.result, i32 0, i32 0 ; <<8 x i8>*> [#uses=1]		%0 = getelementptr inbounds %struct.int8x8_t, %struct.int8x8_t* %agg.result, i32 0, i32 0 ; <<8 x i8>*> [#uses=1]
store <8 x i8> <i8 -128, i8 -128, i8 -128, i8 -128, i8 -128, i8 -128, i8 -128, i8 -128>, <8 x i8>* %0, align 8		store <8 x i8> <i8 -128, i8 -128, i8 -128, i8 -128, i8 -128, i8 -128, i8 -128, i8 -128>, <8 x i8>* %0, align 8
ret void		ret void
}		}

define arm_aapcs_vfpcc void @vdupnneg75(%struct.int8x8_t* noalias nocapture sret %agg.result) nounwind {		define arm_aapcs_vfpcc void @vdupnneg75(%struct.int8x8_t* noalias nocapture sret %agg.result) nounwind {
; CHECK-LE-LABEL: vdupnneg75:		; CHECK-LABEL: vdupnneg75:
; CHECK-LE: @ %bb.0: @ %entry		; CHECK: @ %bb.0: @ %entry
; CHECK-LE-NEXT: vmov.i8 d16, #0xb5		; CHECK-NEXT: vmov.i8 d16, #0xb5
; CHECK-LE-NEXT: vstr d16, [r0]		; CHECK-NEXT: vstr d16, [r0]
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: vdupnneg75:
; CHECK-BE: @ %bb.0: @ %entry
; CHECK-BE-NEXT: vmov.i8 d16, #0xb5
; CHECK-BE-NEXT: vrev64.8 d16, d16
; CHECK-BE-NEXT: vstr d16, [r0]
; CHECK-BE-NEXT: mov pc, lr
entry:		entry:
%0 = getelementptr inbounds %struct.int8x8_t, %struct.int8x8_t* %agg.result, i32 0, i32 0 ; <<8 x i8>*> [#uses=1]		%0 = getelementptr inbounds %struct.int8x8_t, %struct.int8x8_t* %agg.result, i32 0, i32 0 ; <<8 x i8>*> [#uses=1]
store <8 x i8> <i8 -75, i8 -75, i8 -75, i8 -75, i8 -75, i8 -75, i8 -75, i8 -75>, <8 x i8>* %0, align 8		store <8 x i8> <i8 -75, i8 -75, i8 -75, i8 -75, i8 -75, i8 -75, i8 -75, i8 -75>, <8 x i8>* %0, align 8
ret void		ret void
}		}

define arm_aapcs_vfpcc <8 x i16> @vmovls8(<8 x i8>* %A) nounwind {		define arm_aapcs_vfpcc <8 x i16> @vmovls8(<8 x i8>* %A) nounwind {
; CHECK-LE-LABEL: vmovls8:		; CHECK-LE-LABEL: vmovls8:
▲ Show 20 Lines • Show All 347 Lines • ▼ Show 20 Lines	; CHECK-BE-NEXT: mov pc, lr
%tmp2 = trunc <4 x i32> %tmp1 to <4 x i16>		%tmp2 = trunc <4 x i32> %tmp1 to <4 x i16>
store <4 x i16> %tmp2, <4 x i16>* %b, align 8		store <4 x i16> %tmp2, <4 x i16>* %b, align 8
ret void		ret void
}		}

; Use vmov.f32 to materialize f32 immediate splats		; Use vmov.f32 to materialize f32 immediate splats
; rdar://10437054		; rdar://10437054
define arm_aapcs_vfpcc void @v_mov_v2f32(<2 x float>* nocapture %p) nounwind {		define arm_aapcs_vfpcc void @v_mov_v2f32(<2 x float>* nocapture %p) nounwind {
; CHECK-LE-LABEL: v_mov_v2f32:		; CHECK-LABEL: v_mov_v2f32:
; CHECK-LE: @ %bb.0: @ %entry		; CHECK: @ %bb.0: @ %entry
; CHECK-LE-NEXT: vmov.f32 d16, #-1.600000e+01		; CHECK-NEXT: vmov.f32 d16, #-1.600000e+01
; CHECK-LE-NEXT: vstr d16, [r0]		; CHECK-NEXT: vstr d16, [r0]
; CHECK-LE-NEXT: mov pc, lr		; CHECK-NEXT: mov pc, lr
;
; CHECK-BE-LABEL: v_mov_v2f32:
; CHECK-BE: @ %bb.0: @ %entry
; CHECK-BE-NEXT: vmov.f32 d16, #-1.600000e+01
; CHECK-BE-NEXT: vrev64.32 d16, d16
; CHECK-BE-NEXT: vstr d16, [r0]
; CHECK-BE-NEXT: mov pc, lr
entry:		entry:
store <2 x float> <float -1.600000e+01, float -1.600000e+01>, <2 x float>* %p, align 4		store <2 x float> <float -1.600000e+01, float -1.600000e+01>, <2 x float>* %p, align 4
ret void		ret void
}		}

define arm_aapcs_vfpcc void @v_mov_v4f32(<4 x float>* nocapture %p) nounwind {		define arm_aapcs_vfpcc void @v_mov_v4f32(<4 x float>* nocapture %p) nounwind {
; CHECK-LE-LABEL: v_mov_v4f32:		; CHECK-LE-LABEL: v_mov_v4f32:
; CHECK-LE: @ %bb.0: @ %entry		; CHECK-LE: @ %bb.0: @ %entry
; CHECK-LE-NEXT: vmov.f32 q8, #3.100000e+01		; CHECK-LE-NEXT: vmov.f32 q8, #3.100000e+01
; CHECK-LE-NEXT: vst1.32 {d16, d17}, [r0]		; CHECK-LE-NEXT: vst1.32 {d16, d17}, [r0]
; CHECK-LE-NEXT: mov pc, lr		; CHECK-LE-NEXT: mov pc, lr
;		;
; CHECK-BE-LABEL: v_mov_v4f32:		; CHECK-BE-LABEL: v_mov_v4f32:
; CHECK-BE: @ %bb.0: @ %entry		; CHECK-BE: @ %bb.0: @ %entry
; CHECK-BE-NEXT: vmov.f32 q8, #3.100000e+01		; CHECK-BE-NEXT: vmov.f32 q8, #3.100000e+01
; CHECK-BE-NEXT: vrev64.32 q8, q8
; CHECK-BE-NEXT: vstmia r0, {d16, d17}		; CHECK-BE-NEXT: vstmia r0, {d16, d17}
; CHECK-BE-NEXT: mov pc, lr		; CHECK-BE-NEXT: mov pc, lr
entry:		entry:
store <4 x float> <float 3.100000e+01, float 3.100000e+01, float 3.100000e+01, float 3.100000e+01>, <4 x float>* %p, align 4		store <4 x float> <float 3.100000e+01, float 3.100000e+01, float 3.100000e+01, float 3.100000e+01>, <4 x float>* %p, align 4
ret void		ret void
}		}

define arm_aapcs_vfpcc void @v_mov_v4f32_undef(<4 x float> * nocapture %p) nounwind {		define arm_aapcs_vfpcc void @v_mov_v4f32_undef(<4 x float> * nocapture %p) nounwind {
Show All 33 Lines
; CHECK-LE-NEXT: vmovn.i32 d16, q8		; CHECK-LE-NEXT: vmovn.i32 d16, q8
; CHECK-LE-NEXT: vst1.16 {d16}, [r0]		; CHECK-LE-NEXT: vst1.16 {d16}, [r0]
;		;
; CHECK-BE-LABEL: any_extend:		; CHECK-BE-LABEL: any_extend:
; CHECK-BE: @ %bb.0: @ %entry		; CHECK-BE: @ %bb.0: @ %entry
; CHECK-BE-NEXT: vmov.i16 d16, #0x1		; CHECK-BE-NEXT: vmov.i16 d16, #0x1
; CHECK-BE-NEXT: vrev64.32 d17, d0		; CHECK-BE-NEXT: vrev64.32 d17, d0
; CHECK-BE-NEXT: vrev64.32 q9, q1		; CHECK-BE-NEXT: vrev64.32 q9, q1
; CHECK-BE-NEXT: vrev32.16 d16, d16
; CHECK-BE-NEXT: vand d16, d17, d16		; CHECK-BE-NEXT: vand d16, d17, d16
; CHECK-BE-NEXT: vrev32.16 d16, d16		; CHECK-BE-NEXT: vrev32.16 d16, d16
; CHECK-BE-NEXT: vmovl.u16 q8, d16		; CHECK-BE-NEXT: vmovl.u16 q8, d16
; CHECK-BE-NEXT: vsub.i32 q8, q8, q9		; CHECK-BE-NEXT: vsub.i32 q8, q8, q9
; CHECK-BE-NEXT: vmovn.i32 d16, q8		; CHECK-BE-NEXT: vmovn.i32 d16, q8
; CHECK-BE-NEXT: vst1.16 {d16}, [r0]		; CHECK-BE-NEXT: vst1.16 {d16}, [r0]
entry:		entry:
%and.i186 = zext <4 x i1> %x to <4 x i32>		%and.i186 = zext <4 x i1> %x to <4 x i32>
%add.i185 = sub <4 x i32> %and.i186, %y		%add.i185 = sub <4 x i32> %and.i186, %y
%sub.i = sub <4 x i32> %add.i185, zeroinitializer		%sub.i = sub <4 x i32> %add.i185, zeroinitializer
%add.i = add <4 x i32> %sub.i, zeroinitializer		%add.i = add <4 x i32> %sub.i, zeroinitializer
%vmovn.i = trunc <4 x i32> %add.i to <4 x i16>		%vmovn.i = trunc <4 x i32> %add.i to <4 x i16>
tail call void @llvm.arm.neon.vst1.p0i8.v4i16(i8* undef, <4 x i16> %vmovn.i, i32 2)		tail call void @llvm.arm.neon.vst1.p0i8.v4i16(i8* undef, <4 x i16> %vmovn.i, i32 2)
unreachable		unreachable
}		}

		define arm_aapcs_vfpcc void @v_movi8_sti8(i8* %p) {
		; CHECK-LABEL: v_movi8_sti8:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i8 d16, #0x1
		; CHECK-NEXT: vst1.8 {d16}, [r0]
		; CHECK-NEXT: mov pc, lr
		call void @llvm.arm.neon.vst1.p0i8.v8i8(i8* %p, <8 x i8> <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>, i32 1)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movi8_sti16(i8* %p) {
		; CHECK-LABEL: v_movi8_sti16:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i8 d16, #0x1
		; CHECK-NEXT: vst1.16 {d16}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <8 x i8> <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1> to <4 x i16>
		call void @llvm.arm.neon.vst1.p0i8.v4i16(i8* %p, <4 x i16> %val, i32 2)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movi8_stf16(i8* %p) {
		; CHECK-LABEL: v_movi8_stf16:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i8 d16, #0x1
		; CHECK-NEXT: vst1.16 {d16}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <8 x i8> <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1> to <4 x half>
		call void @llvm.arm.neon.vst1.p0i8.v4f16(i8* %p, <4 x half> %val, i32 2)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movi8_sti32(i8* %p) {
		; CHECK-LABEL: v_movi8_sti32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i8 d16, #0x1
		; CHECK-NEXT: vst1.32 {d16}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <8 x i8> <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1> to <2 x i32>
		call void @llvm.arm.neon.vst1.p0i8.v2i32(i8* %p, <2 x i32> %val, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movi8_stf32(i8* %p) {
		; CHECK-LABEL: v_movi8_stf32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i8 d16, #0x1
		; CHECK-NEXT: vst1.32 {d16}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <8 x i8> <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1> to <2 x float>
		call void @llvm.arm.neon.vst1.p0i8.v2f32(i8* %p, <2 x float> %val, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movi8_sti64(i8* %p) {
		; CHECK-LABEL: v_movi8_sti64:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i8 d16, #0x1
		; CHECK-NEXT: vst1.64 {d16}, [r0:64]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <8 x i8> <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1> to <1 x i64>
		call void @llvm.arm.neon.vst1.p0i8.v1i64(i8* %p, <1 x i64> %val, i32 8)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movi16_sti16(i8* %p) {
		; CHECK-LABEL: v_movi16_sti16:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i16 d16, #0x1
		; CHECK-NEXT: vst1.16 {d16}, [r0]
		; CHECK-NEXT: mov pc, lr
		call void @llvm.arm.neon.vst1.p0i8.v4i16(i8* %p, <4 x i16> <i16 1, i16 1, i16 1, i16 1>, i32 2)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movi16_stf16(i8* %p) {
		; CHECK-LABEL: v_movi16_stf16:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i16 d16, #0x1
		; CHECK-NEXT: vst1.16 {d16}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <4 x i16> <i16 1, i16 1, i16 1, i16 1> to <4 x half>
		call void @llvm.arm.neon.vst1.p0i8.v4f16(i8* %p, <4 x half> %val, i32 2)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movi16_sti32(i8* %p) {
		; CHECK-LABEL: v_movi16_sti32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i16 d16, #0x1
		; CHECK-NEXT: vst1.32 {d16}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <4 x i16> <i16 1, i16 1, i16 1, i16 1> to <2 x i32>
		call void @llvm.arm.neon.vst1.p0i8.v2i32(i8* %p, <2 x i32> %val, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movi16_stf32(i8* %p) {
		; CHECK-LABEL: v_movi16_stf32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i16 d16, #0x1
		; CHECK-NEXT: vst1.32 {d16}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <4 x i16> <i16 1, i16 1, i16 1, i16 1> to <2 x float>
		call void @llvm.arm.neon.vst1.p0i8.v2f32(i8* %p, <2 x float> %val, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movi16_sti64(i8* %p) {
		; CHECK-LABEL: v_movi16_sti64:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i16 d16, #0x1
		; CHECK-NEXT: vst1.64 {d16}, [r0:64]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <4 x i16> <i16 1, i16 1, i16 1, i16 1> to <1 x i64>
		call void @llvm.arm.neon.vst1.p0i8.v1i64(i8* %p, <1 x i64> %val, i32 8)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movi32_sti32(i8* %p) {
		; CHECK-LABEL: v_movi32_sti32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i32 d16, #0x1
		; CHECK-NEXT: vst1.32 {d16}, [r0]
		; CHECK-NEXT: mov pc, lr
		call void @llvm.arm.neon.vst1.p0i8.v2i32(i8* %p, <2 x i32> <i32 1, i32 1>, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movi32_stf32(i8* %p) {
		; CHECK-LABEL: v_movi32_stf32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i32 d16, #0x1
		; CHECK-NEXT: vst1.32 {d16}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <2 x i32> <i32 1, i32 1> to <2 x float>
		call void @llvm.arm.neon.vst1.p0i8.v2f32(i8* %p, <2 x float> %val, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movi32_sti64(i8* %p) {
		; CHECK-LABEL: v_movi32_sti64:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i32 d16, #0x1
		; CHECK-NEXT: vst1.64 {d16}, [r0:64]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <2 x i32> <i32 1, i32 1> to <1 x i64>
		call void @llvm.arm.neon.vst1.p0i8.v1i64(i8* %p, <1 x i64> %val, i32 8)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movf32_stf32(i8* %p) {
		; CHECK-LABEL: v_movf32_stf32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.f32 d16, #1.000000e+00
		; CHECK-NEXT: vst1.32 {d16}, [r0]
		; CHECK-NEXT: mov pc, lr
		call void @llvm.arm.neon.vst1.p0i8.v2f32(i8* %p, <2 x float> <float 1.0, float 1.0>, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void@v_movf32_sti32(i8* %p) {
		; FIXME: We should use vmov.f32 instead of mov then vdup
		; CHECK-LABEL: v_movf32_sti32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: mov r1, #1065353216
		; CHECK-NEXT: vdup.32 d16, r1
		; CHECK-NEXT: vst1.32 {d16}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <2 x float> <float 1.0, float 1.0> to <2 x i32>
		call void @llvm.arm.neon.vst1.p0i8.v2i32(i8* %p, <2 x i32> %val, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movf32_sti64(i8* %p) {
		; CHECK-LE-LABEL: v_movf32_sti64:
		; CHECK-LE: @ %bb.0:
		; CHECK-LE-NEXT: mov r1, #1065353216
		; CHECK-LE-NEXT: vdup.32 d16, r1
		; CHECK-LE-NEXT: vst1.64 {d16}, [r0:64]
		; CHECK-LE-NEXT: mov pc, lr
		;
		; FIXME: vrev is not needed here
		; CHECK-BE-LABEL: v_movf32_sti64:
		; CHECK-BE: @ %bb.0:
		; CHECK-BE-NEXT: mov r1, #1065353216
		; CHECK-BE-NEXT: vdup.32 d16, r1
		; CHECK-BE-NEXT: vrev64.32 d16, d16
		; CHECK-BE-NEXT: vst1.64 {d16}, [r0:64]
		; CHECK-BE-NEXT: mov pc, lr
		%val = bitcast <2 x float> <float 1.0, float 1.0> to <1 x i64>
		call void @llvm.arm.neon.vst1.p0i8.v1i64(i8* %p, <1 x i64> %val, i32 8)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movi64_sti64(i8* %p) {
		; CHECK-LABEL: v_movi64_sti64:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i64 d16, #0xff
		; CHECK-NEXT: vst1.64 {d16}, [r0:64]
		; CHECK-NEXT: mov pc, lr
		call void @llvm.arm.neon.vst1.p0i8.v1i64(i8* %p, <1 x i64> <i64 255>, i32 8)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movQi8_sti8(i8* %p) {
		; CHECK-LABEL: v_movQi8_sti8:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i8 q8, #0x1
		; CHECK-NEXT: vst1.8 {d16, d17}, [r0]
		; CHECK-NEXT: mov pc, lr
		call void @llvm.arm.neon.vst1.p0i8.v16i8(i8* %p, <16 x i8> <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>, i32 1)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movQi8_sti16(i8* %p) {
		; CHECK-LABEL: v_movQi8_sti16:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i8 q8, #0x1
		; CHECK-NEXT: vst1.16 {d16, d17}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <16 x i8> <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1> to <8 x i16>
		call void @llvm.arm.neon.vst1.p0i8.v8i16(i8* %p, <8 x i16> %val, i32 2)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movQi8_stf16(i8* %p) {
		; CHECK-LABEL: v_movQi8_stf16:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i8 q8, #0x1
		; CHECK-NEXT: vst1.16 {d16, d17}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <16 x i8> <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1> to <8 x half>
		call void @llvm.arm.neon.vst1.p0i8.v8f16(i8* %p, <8 x half> %val, i32 2)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movQi8_sti32(i8* %p) {
		; CHECK-LABEL: v_movQi8_sti32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i8 q8, #0x1
		; CHECK-NEXT: vst1.32 {d16, d17}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <16 x i8> <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1> to <4 x i32>
		call void @llvm.arm.neon.vst1.p0i8.v4i32(i8* %p, <4 x i32> %val, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movQi8_stf32(i8* %p) {
		; CHECK-LABEL: v_movQi8_stf32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i8 q8, #0x1
		; CHECK-NEXT: vst1.32 {d16, d17}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <16 x i8> <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1> to <4 x float>
		call void @llvm.arm.neon.vst1.p0i8.v4f32(i8* %p, <4 x float> %val, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movQi8_sti64(i8* %p) {
		; CHECK-LABEL: v_movQi8_sti64:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i8 q8, #0x1
		; CHECK-NEXT: vst1.64 {d16, d17}, [r0:64]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <16 x i8> <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1> to <2 x i64>
		call void @llvm.arm.neon.vst1.p0i8.v2i64(i8* %p, <2 x i64> %val, i32 8)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movQi16_sti16(i8* %p) {
		; CHECK-LABEL: v_movQi16_sti16:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i16 q8, #0x1
		; CHECK-NEXT: vst1.16 {d16, d17}, [r0]
		; CHECK-NEXT: mov pc, lr
		call void @llvm.arm.neon.vst1.p0i8.v8i16(i8* %p, <8 x i16> <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>, i32 2)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movQi16_stf16(i8* %p) {
		; CHECK-LABEL: v_movQi16_stf16:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i16 q8, #0x1
		; CHECK-NEXT: vst1.16 {d16, d17}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <8 x i16> <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1> to <8 x half>
		call void @llvm.arm.neon.vst1.p0i8.v8f16(i8* %p, <8 x half> %val, i32 2)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movQi16_sti32(i8* %p) {
		; CHECK-LABEL: v_movQi16_sti32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i16 q8, #0x1
		; CHECK-NEXT: vst1.32 {d16, d17}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <8 x i16> <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1> to <4 x i32>
		call void @llvm.arm.neon.vst1.p0i8.v4i32(i8* %p, <4 x i32> %val, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movQi16_stf32(i8* %p) {
		; CHECK-LABEL: v_movQi16_stf32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i16 q8, #0x1
		; CHECK-NEXT: vst1.32 {d16, d17}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <8 x i16> <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1> to <4 x float>
		call void @llvm.arm.neon.vst1.p0i8.v4f32(i8* %p, <4 x float> %val, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movQi16_sti64(i8* %p) {
		; CHECK-LABEL: v_movQi16_sti64:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i16 q8, #0x1
		; CHECK-NEXT: vst1.64 {d16, d17}, [r0:64]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <8 x i16> <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1> to <2 x i64>
		call void @llvm.arm.neon.vst1.p0i8.v2i64(i8* %p, <2 x i64> %val, i32 8)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movQi32_sti32(i8* %p) {
		; CHECK-LABEL: v_movQi32_sti32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i32 q8, #0x1
		; CHECK-NEXT: vst1.32 {d16, d17}, [r0]
		; CHECK-NEXT: mov pc, lr
		call void @llvm.arm.neon.vst1.p0i8.v4i32(i8* %p, <4 x i32> <i32 1, i32 1, i32 1, i32 1>, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movQi32_stf32(i8* %p) {
		; CHECK-LABEL: v_movQi32_stf32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i32 q8, #0x1
		; CHECK-NEXT: vst1.32 {d16, d17}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <4 x i32> <i32 1, i32 1, i32 1, i32 1> to <4 x float>
		call void @llvm.arm.neon.vst1.p0i8.v4f32(i8* %p, <4 x float> %val, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movQi32_sti64(i8* %p) {
		; CHECK-LABEL: v_movQi32_sti64:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i32 q8, #0x1
		; CHECK-NEXT: vst1.64 {d16, d17}, [r0:64]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <4 x i32> <i32 1, i32 1, i32 1, i32 1> to <2 x i64>
		call void @llvm.arm.neon.vst1.p0i8.v2i64(i8* %p, <2 x i64> %val, i32 8)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movQf32_stf32(i8* %p) {
		; CHECK-LABEL: v_movQf32_stf32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.f32 q8, #1.000000e+00
		; CHECK-NEXT: vst1.32 {d16, d17}, [r0]
		; CHECK-NEXT: mov pc, lr
		call void @llvm.arm.neon.vst1.p0i8.v4f32(i8* %p, <4 x float> <float 1.0, float 1.0, float 1.0, float 1.0>, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movQf32_sti32(i8* %p) {
		; FIXME: We should use vmov.f32 instead of mov then vdup
		; CHECK-LABEL: v_movQf32_sti32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: mov r1, #1065353216
		; CHECK-NEXT: vdup.32 q8, r1
		; CHECK-NEXT: vst1.32 {d16, d17}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <4 x float> <float 1.0, float 1.0, float 1.0, float 1.0> to <4 x i32>
		call void @llvm.arm.neon.vst1.p0i8.v4i32(i8* %p, <4 x i32> %val, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movQf32_sti64(i8* %p) {
		; CHECK-LE-LABEL: v_movQf32_sti64:
		; CHECK-LE: @ %bb.0:
		; CHECK-LE-NEXT: mov r1, #1065353216
		; CHECK-LE-NEXT: vdup.32 q8, r1
		; CHECK-LE-NEXT: vst1.64 {d16, d17}, [r0:64]
		; CHECK-LE-NEXT: mov pc, lr
		;
		; FIXME: vrev is not needed here
		; CHECK-BE-LABEL: v_movQf32_sti64:
		; CHECK-BE: @ %bb.0:
		; CHECK-BE-NEXT: mov r1, #1065353216
		; CHECK-BE-NEXT: vdup.32 q8, r1
		; CHECK-BE-NEXT: vrev64.32 q8, q8
		; CHECK-BE-NEXT: vst1.64 {d16, d17}, [r0:64]
		; CHECK-BE-NEXT: mov pc, lr
		%val = bitcast <4 x float> <float 1.0, float 1.0, float 1.0, float 1.0> to <2 x i64>
		call void @llvm.arm.neon.vst1.p0i8.v2i64(i8* %p, <2 x i64> %val, i32 8)
		ret void
		}

		define arm_aapcs_vfpcc void @v_movQi64_sti64(i8* %p) {
		; CHECK-LABEL: v_movQi64_sti64:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmov.i64 q8, #0xff
		; CHECK-NEXT: vst1.64 {d16, d17}, [r0:64]
		; CHECK-NEXT: mov pc, lr
		call void @llvm.arm.neon.vst1.p0i8.v2i64(i8* %p, <2 x i64> <i64 255, i64 255>, i32 8)
		ret void
		}

		define arm_aapcs_vfpcc void @v_mvni16_sti16(i8* %p) {
		; CHECK-LABEL: v_mvni16_sti16:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmvn.i16 d16, #0xfe
		; CHECK-NEXT: vst1.16 {d16}, [r0]
		; CHECK-NEXT: mov pc, lr
		call void @llvm.arm.neon.vst1.p0i8.v4i16(i8* %p, <4 x i16> <i16 65281, i16 65281, i16 65281, i16 65281>, i32 2)
		ret void
		}

		define arm_aapcs_vfpcc void @v_mvni16_stf16(i8* %p) {
		; CHECK-LABEL: v_mvni16_stf16:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmvn.i16 d16, #0xfe
		; CHECK-NEXT: vst1.16 {d16}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <4 x i16> <i16 65281, i16 65281, i16 65281, i16 65281> to <4 x half>
		call void @llvm.arm.neon.vst1.p0i8.v4f16(i8* %p, <4 x half> %val, i32 2)
		ret void
		}

		define arm_aapcs_vfpcc void @v_mvni16_sti32(i8* %p) {
		; CHECK-LABEL: v_mvni16_sti32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmvn.i16 d16, #0xfe
		; CHECK-NEXT: vst1.32 {d16}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <4 x i16> <i16 65281, i16 65281, i16 65281, i16 65281> to <2 x i32>
		call void @llvm.arm.neon.vst1.p0i8.v2i32(i8* %p, <2 x i32> %val, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void @v_mvni16_stf32(i8* %p) {
		; CHECK-LABEL: v_mvni16_stf32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmvn.i16 d16, #0xfe
		; CHECK-NEXT: vst1.32 {d16}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <4 x i16> <i16 65281, i16 65281, i16 65281, i16 65281> to <2 x float>
		call void @llvm.arm.neon.vst1.p0i8.v2f32(i8* %p, <2 x float> %val, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void @v_mvni16_sti64(i8* %p) {
		; CHECK-LABEL: v_mvni16_sti64:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmvn.i16 d16, #0xfe
		; CHECK-NEXT: vst1.64 {d16}, [r0:64]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <4 x i16> <i16 65281, i16 65281, i16 65281, i16 65281> to <1 x i64>
		call void @llvm.arm.neon.vst1.p0i8.v1i64(i8* %p, <1 x i64> %val, i32 8)
		ret void
		}

		define arm_aapcs_vfpcc void @v_mvni32_sti32(i8* %p) {
		; CHECK-LABEL: v_mvni32_sti32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmvn.i32 d16, #0xfe
		; CHECK-NEXT: vst1.32 {d16}, [r0]
		; CHECK-NEXT: mov pc, lr
		call void @llvm.arm.neon.vst1.p0i8.v2i32(i8* %p, <2 x i32> <i32 4294967041, i32 4294967041>, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void @v_mvni32_stf32(i8* %p) {
		; CHECK-LABEL: v_mvni32_stf32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmvn.i32 d16, #0xfe
		; CHECK-NEXT: vst1.32 {d16}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <2 x i32> <i32 4294967041, i32 4294967041> to <2 x float>
		call void @llvm.arm.neon.vst1.p0i8.v2f32(i8* %p, <2 x float> %val, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void @v_mvni32_sti64(i8* %p) {
		; CHECK-LABEL: v_mvni32_sti64:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmvn.i32 d16, #0xfe
		; CHECK-NEXT: vst1.64 {d16}, [r0:64]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <2 x i32> <i32 4294967041, i32 4294967041> to <1 x i64>
		call void @llvm.arm.neon.vst1.p0i8.v1i64(i8* %p, <1 x i64> %val, i32 8)
		ret void
		}


		define arm_aapcs_vfpcc void @v_mvnQi16_sti16(i8* %p) {
		; CHECK-LABEL: v_mvnQi16_sti16:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmvn.i16 q8, #0xfe
		; CHECK-NEXT: vst1.16 {d16, d17}, [r0]
		; CHECK-NEXT: mov pc, lr
		call void @llvm.arm.neon.vst1.p0i8.v8i16(i8* %p, <8 x i16> <i16 65281, i16 65281, i16 65281, i16 65281, i16 65281, i16 65281, i16 65281, i16 65281>, i32 2)
		ret void
		}

		define arm_aapcs_vfpcc void @v_mvnQi16_stf16(i8* %p) {
		; CHECK-LABEL: v_mvnQi16_stf16:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmvn.i16 q8, #0xfe
		; CHECK-NEXT: vst1.16 {d16, d17}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <8 x i16> <i16 65281, i16 65281, i16 65281, i16 65281, i16 65281, i16 65281, i16 65281, i16 65281> to <8 x half>
		call void @llvm.arm.neon.vst1.p0i8.v8f16(i8* %p, <8 x half> %val, i32 2)
		ret void
		}

		define arm_aapcs_vfpcc void @v_mvnQi16_sti32(i8* %p) {
		; CHECK-LABEL: v_mvnQi16_sti32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmvn.i16 q8, #0xfe
		; CHECK-NEXT: vst1.32 {d16, d17}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <8 x i16> <i16 65281, i16 65281, i16 65281, i16 65281, i16 65281, i16 65281, i16 65281, i16 65281> to <4 x i32>
		call void @llvm.arm.neon.vst1.p0i8.v4i32(i8* %p, <4 x i32> %val, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void @v_mvnQi16_stf32(i8* %p) {
		; CHECK-LABEL: v_mvnQi16_stf32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmvn.i16 q8, #0xfe
		; CHECK-NEXT: vst1.32 {d16, d17}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <8 x i16> <i16 65281, i16 65281, i16 65281, i16 65281, i16 65281, i16 65281, i16 65281, i16 65281> to <4 x float>
		call void @llvm.arm.neon.vst1.p0i8.v4f32(i8* %p, <4 x float> %val, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void @v_mvnQi16_sti64(i8* %p) {
		; CHECK-LABEL: v_mvnQi16_sti64:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmvn.i16 q8, #0xfe
		; CHECK-NEXT: vst1.64 {d16, d17}, [r0:64]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <8 x i16> <i16 65281, i16 65281, i16 65281, i16 65281, i16 65281, i16 65281, i16 65281, i16 65281> to <2 x i64>
		call void @llvm.arm.neon.vst1.p0i8.v2i64(i8* %p, <2 x i64> %val, i32 8)
		ret void
		}

		define arm_aapcs_vfpcc void @v_mvnQi32_sti32(i8* %p) {
		; CHECK-LABEL: v_mvnQi32_sti32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmvn.i32 q8, #0xfe
		; CHECK-NEXT: vst1.32 {d16, d17}, [r0]
		; CHECK-NEXT: mov pc, lr
		call void @llvm.arm.neon.vst1.p0i8.v4i32(i8* %p, <4 x i32> <i32 4294967041, i32 4294967041, i32 4294967041, i32 4294967041>, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void @v_mvnQi32_stf32(i8* %p) {
		; CHECK-LABEL: v_mvnQi32_stf32:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmvn.i32 q8, #0xfe
		; CHECK-NEXT: vst1.32 {d16, d17}, [r0]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <4 x i32> <i32 4294967041, i32 4294967041, i32 4294967041, i32 4294967041> to <4 x float>
		call void @llvm.arm.neon.vst1.p0i8.v4f32(i8* %p, <4 x float> %val, i32 4)
		ret void
		}

		define arm_aapcs_vfpcc void @v_mvnQi32_sti64(i8* %p) {
		; CHECK-LABEL: v_mvnQi32_sti64:
		; CHECK: @ %bb.0:
		; CHECK-NEXT: vmvn.i32 q8, #0xfe
		; CHECK-NEXT: vst1.64 {d16, d17}, [r0:64]
		; CHECK-NEXT: mov pc, lr
		%val = bitcast <4 x i32> <i32 4294967041, i32 4294967041, i32 4294967041, i32 4294967041> to <2 x i64>
		call void @llvm.arm.neon.vst1.p0i8.v2i64(i8* %p, <2 x i64> %val, i32 8)
		ret void
		}

		declare void @llvm.arm.neon.vst1.p0i8.v8i8(i8*, <8 x i8>, i32) nounwind
declare void @llvm.arm.neon.vst1.p0i8.v4i16(i8*, <4 x i16>, i32) nounwind		declare void @llvm.arm.neon.vst1.p0i8.v4i16(i8*, <4 x i16>, i32) nounwind
		declare void @llvm.arm.neon.vst1.p0i8.v4f16(i8*, <4 x half>, i32) nounwind
		declare void @llvm.arm.neon.vst1.p0i8.v2i32(i8*, <2 x i32>, i32) nounwind
		declare void @llvm.arm.neon.vst1.p0i8.v2f32(i8*, <2 x float>, i32) nounwind
		declare void @llvm.arm.neon.vst1.p0i8.v1i64(i8*, <1 x i64>, i32) nounwind

		declare void @llvm.arm.neon.vst1.p0i8.v16i8(i8*, <16 x i8>, i32) nounwind
		declare void @llvm.arm.neon.vst1.p0i8.v8i16(i8*, <8 x i16>, i32) nounwind
		declare void @llvm.arm.neon.vst1.p0i8.v8f16(i8*, <8 x half>, i32) nounwind
		declare void @llvm.arm.neon.vst1.p0i8.v4i32(i8*, <4 x i32>, i32) nounwind
		declare void @llvm.arm.neon.vst1.p0i8.v4f32(i8*, <4 x float>, i32) nounwind
		declare void @llvm.arm.neon.vst1.p0i8.v2i64(i8*, <2 x i64>, i32) nounwind

llvm/test/CodeGen/Thumb2/mve-masked-load.ll

	Show First 20 Lines • Show All 1,824 Lines • ▼ Show 20 Lines
	; CHECK-BE-NEXT: and r1, r2, #3			; CHECK-BE-NEXT: and r1, r2, #3
	; CHECK-BE-NEXT: lsls r2, r2, #31			; CHECK-BE-NEXT: lsls r2, r2, #31
	; CHECK-BE-NEXT: beq .LBB49_2			; CHECK-BE-NEXT: beq .LBB49_2
	; CHECK-BE-NEXT: @ %bb.1: @ %cond.load			; CHECK-BE-NEXT: @ %bb.1: @ %cond.load
	; CHECK-BE-NEXT: vldr d1, .LCPI49_0			; CHECK-BE-NEXT: vldr d1, .LCPI49_0
	; CHECK-BE-NEXT: vldr d0, [r0]			; CHECK-BE-NEXT: vldr d0, [r0]
	; CHECK-BE-NEXT: b .LBB49_3			; CHECK-BE-NEXT: b .LBB49_3
	; CHECK-BE-NEXT: .LBB49_2:			; CHECK-BE-NEXT: .LBB49_2:
	; CHECK-BE-NEXT: vmov.i32 q1, #0x0			; CHECK-BE-NEXT: vmov.i32 q0, #0x0
	; CHECK-BE-NEXT: vrev64.32 q0, q1
	; CHECK-BE-NEXT: .LBB49_3: @ %else			; CHECK-BE-NEXT: .LBB49_3: @ %else
	; CHECK-BE-NEXT: lsls r1, r1, #30			; CHECK-BE-NEXT: lsls r1, r1, #30
	; CHECK-BE-NEXT: it mi			; CHECK-BE-NEXT: it mi
	; CHECK-BE-NEXT: vldrmi d1, [r0, #8]			; CHECK-BE-NEXT: vldrmi d1, [r0, #8]
	; CHECK-BE-NEXT: add sp, #4			; CHECK-BE-NEXT: add sp, #4
	; CHECK-BE-NEXT: bx lr			; CHECK-BE-NEXT: bx lr
	; CHECK-BE-NEXT: .p2align 3			; CHECK-BE-NEXT: .p2align 3
	; CHECK-BE-NEXT: @ %bb.4:			; CHECK-BE-NEXT: @ %bb.4:
	▲ Show 20 Lines • Show All 76 Lines • ▼ Show 20 Lines
	; CHECK-BE-NEXT: and r1, r2, #3			; CHECK-BE-NEXT: and r1, r2, #3
	; CHECK-BE-NEXT: lsls r2, r2, #31			; CHECK-BE-NEXT: lsls r2, r2, #31
	; CHECK-BE-NEXT: beq .LBB50_2			; CHECK-BE-NEXT: beq .LBB50_2
	; CHECK-BE-NEXT: @ %bb.1: @ %cond.load			; CHECK-BE-NEXT: @ %bb.1: @ %cond.load
	; CHECK-BE-NEXT: vldr d1, .LCPI50_0			; CHECK-BE-NEXT: vldr d1, .LCPI50_0
	; CHECK-BE-NEXT: vldr d0, [r0]			; CHECK-BE-NEXT: vldr d0, [r0]
	; CHECK-BE-NEXT: b .LBB50_3			; CHECK-BE-NEXT: b .LBB50_3
	; CHECK-BE-NEXT: .LBB50_2:			; CHECK-BE-NEXT: .LBB50_2:
	; CHECK-BE-NEXT: vmov.i32 q1, #0x0			; CHECK-BE-NEXT: vmov.i32 q0, #0x0
	; CHECK-BE-NEXT: vrev64.32 q0, q1
	; CHECK-BE-NEXT: .LBB50_3: @ %else			; CHECK-BE-NEXT: .LBB50_3: @ %else
	; CHECK-BE-NEXT: lsls r1, r1, #30			; CHECK-BE-NEXT: lsls r1, r1, #30
	; CHECK-BE-NEXT: it mi			; CHECK-BE-NEXT: it mi
	; CHECK-BE-NEXT: vldrmi d1, [r0, #8]			; CHECK-BE-NEXT: vldrmi d1, [r0, #8]
	; CHECK-BE-NEXT: add sp, #4			; CHECK-BE-NEXT: add sp, #4
	; CHECK-BE-NEXT: bx lr			; CHECK-BE-NEXT: bx lr
	; CHECK-BE-NEXT: .p2align 3			; CHECK-BE-NEXT: .p2align 3
	; CHECK-BE-NEXT: @ %bb.4:			; CHECK-BE-NEXT: @ %bb.4:
	▲ Show 20 Lines • Show All 260 Lines • Show Last 20 Lines

llvm/test/CodeGen/Thumb2/mve-vmovimm.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=thumbv8.1m.main-arm-none-eabi -mattr=+mve -verify-machineinstrs %s -o - \| FileCheck %s --check-prefix=CHECK --check-prefix=CHECKLE			; RUN: llc -mtriple=thumbv8.1m.main-arm-none-eabi -mattr=+mve -verify-machineinstrs %s -o - \| FileCheck %s --check-prefix=CHECK --check-prefix=CHECKLE
	; RUN: llc -mtriple=thumbv8.1m.main-arm-none-eabi -mattr=+mve.fp -verify-machineinstrs %s -o - \| FileCheck %s --check-prefix=CHECK --check-prefix=CHECKLE			; RUN: llc -mtriple=thumbv8.1m.main-arm-none-eabi -mattr=+mve.fp -verify-machineinstrs %s -o - \| FileCheck %s --check-prefix=CHECK --check-prefix=CHECKLE
	; RUN: llc -mtriple=thumbebv8.1m.main-arm-none-eabi -mattr=+mve.fp -verify-machineinstrs %s -o - \| FileCheck %s --check-prefix=CHECK --check-prefix=CHECKBE			; RUN: llc -mtriple=thumbebv8.1m.main-arm-none-eabi -mattr=+mve.fp -verify-machineinstrs %s -o - \| FileCheck %s --check-prefix=CHECK --check-prefix=CHECKBE

	define arm_aapcs_vfpcc <16 x i8> @mov_int8_1() {			define arm_aapcs_vfpcc <16 x i8> @mov_int8_1() {
	; CHECKLE-LABEL: mov_int8_1:			; CHECK-LABEL: mov_int8_1:
	; CHECKLE: @ %bb.0: @ %entry			; CHECK: @ %bb.0: @ %entry
	; CHECKLE-NEXT: vmov.i8 q0, #0x1			; CHECK-NEXT: vmov.i8 q0, #0x1
	; CHECKLE-NEXT: bx lr			; CHECK-NEXT: bx lr
	;
	; CHECKBE-LABEL: mov_int8_1:
	; CHECKBE: @ %bb.0: @ %entry
	; CHECKBE-NEXT: vmov.i8 q1, #0x1
	; CHECKBE-NEXT: vrev64.8 q0, q1
	; CHECKBE-NEXT: bx lr
	entry:			entry:
	ret <16 x i8> <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>			ret <16 x i8> <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>
	}			}

	define arm_aapcs_vfpcc <16 x i8> @mov_int8_m1() {			define arm_aapcs_vfpcc <16 x i8> @mov_int8_m1() {
	; CHECKLE-LABEL: mov_int8_m1:			; CHECK-LABEL: mov_int8_m1:
	; CHECKLE: @ %bb.0: @ %entry			; CHECK: @ %bb.0: @ %entry
	; CHECKLE-NEXT: vmov.i8 q0, #0xff			; CHECK-NEXT: vmov.i8 q0, #0xff
	; CHECKLE-NEXT: bx lr			; CHECK-NEXT: bx lr
	;
	; CHECKBE-LABEL: mov_int8_m1:
	; CHECKBE: @ %bb.0: @ %entry
	; CHECKBE-NEXT: vmov.i8 q1, #0xff
	; CHECKBE-NEXT: vrev64.8 q0, q1
	; CHECKBE-NEXT: bx lr
	entry:			entry:
	ret <16 x i8> <i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1>			ret <16 x i8> <i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1>
	}			}

	define arm_aapcs_vfpcc <8 x i16> @mov_int16_1() {			define arm_aapcs_vfpcc <8 x i16> @mov_int16_1() {
	; CHECKLE-LABEL: mov_int16_1:			; CHECK-LABEL: mov_int16_1:
	; CHECKLE: @ %bb.0: @ %entry			; CHECK: @ %bb.0: @ %entry
	; CHECKLE-NEXT: vmov.i16 q0, #0x1			; CHECK-NEXT: vmov.i16 q0, #0x1
	; CHECKLE-NEXT: bx lr			; CHECK-NEXT: bx lr
	;
	; CHECKBE-LABEL: mov_int16_1:
	; CHECKBE: @ %bb.0: @ %entry
	; CHECKBE-NEXT: vmov.i16 q1, #0x1
	; CHECKBE-NEXT: vrev64.16 q0, q1
	; CHECKBE-NEXT: bx lr
	entry:			entry:
	ret <8 x i16> <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>			ret <8 x i16> <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>
	}			}

	define arm_aapcs_vfpcc <8 x i16> @mov_int16_m1() {			define arm_aapcs_vfpcc <8 x i16> @mov_int16_m1() {
	; CHECKLE-LABEL: mov_int16_m1:			; CHECK-LABEL: mov_int16_m1:
	; CHECKLE: @ %bb.0: @ %entry			; CHECK: @ %bb.0: @ %entry
	; CHECKLE-NEXT: vmov.i8 q0, #0xff			; CHECK-NEXT: vmov.i8 q0, #0xff
	; CHECKLE-NEXT: bx lr			; CHECK-NEXT: bx lr
	;
	; CHECKBE-LABEL: mov_int16_m1:
	; CHECKBE: @ %bb.0: @ %entry
	; CHECKBE-NEXT: vmov.i8 q1, #0xff
	; CHECKBE-NEXT: vrev64.8 q0, q1
	; CHECKBE-NEXT: bx lr
	entry:			entry:
	ret <8 x i16> <i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1>			ret <8 x i16> <i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1>
	}			}

	define arm_aapcs_vfpcc <8 x i16> @mov_int16_256() {			define arm_aapcs_vfpcc <8 x i16> @mov_int16_256() {
	; CHECKLE-LABEL: mov_int16_256:			; CHECK-LABEL: mov_int16_256:
	; CHECKLE: @ %bb.0: @ %entry			; CHECK: @ %bb.0: @ %entry
	; CHECKLE-NEXT: vmov.i16 q0, #0x100			; CHECK-NEXT: vmov.i16 q0, #0x100
	; CHECKLE-NEXT: bx lr			; CHECK-NEXT: bx lr
	;
	; CHECKBE-LABEL: mov_int16_256:
	; CHECKBE: @ %bb.0: @ %entry
	; CHECKBE-NEXT: vmov.i16 q1, #0x100
	; CHECKBE-NEXT: vrev64.16 q0, q1
	; CHECKBE-NEXT: bx lr
	entry:			entry:
	ret <8 x i16> <i16 256, i16 256, i16 256, i16 256, i16 256, i16 256, i16 256, i16 256>			ret <8 x i16> <i16 256, i16 256, i16 256, i16 256, i16 256, i16 256, i16 256, i16 256>
	}			}

	define arm_aapcs_vfpcc <8 x i16> @mov_int16_257() {			define arm_aapcs_vfpcc <8 x i16> @mov_int16_257() {
	; CHECKLE-LABEL: mov_int16_257:			; CHECK-LABEL: mov_int16_257:
	; CHECKLE: @ %bb.0: @ %entry			; CHECK: @ %bb.0: @ %entry
	; CHECKLE-NEXT: vmov.i8 q0, #0x1			; CHECK-NEXT: vmov.i8 q0, #0x1
	; CHECKLE-NEXT: bx lr			; CHECK-NEXT: bx lr
	;
	; CHECKBE-LABEL: mov_int16_257:
	; CHECKBE: @ %bb.0: @ %entry
	; CHECKBE-NEXT: vmov.i8 q1, #0x1
	; CHECKBE-NEXT: vrev64.8 q0, q1
	; CHECKBE-NEXT: bx lr
	entry:			entry:
	ret <8 x i16> <i16 257, i16 257, i16 257, i16 257, i16 257, i16 257, i16 257, i16 257>			ret <8 x i16> <i16 257, i16 257, i16 257, i16 257, i16 257, i16 257, i16 257, i16 257>
	}			}

	define arm_aapcs_vfpcc <8 x i16> @mov_int16_258() {			define arm_aapcs_vfpcc <8 x i16> @mov_int16_258() {
	; CHECKLE-LABEL: mov_int16_258:			; CHECKLE-LABEL: mov_int16_258:
	; CHECKLE: @ %bb.0: @ %entry			; CHECKLE: @ %bb.0: @ %entry
	; CHECKLE-NEXT: adr r0, .LCPI6_0			; CHECKLE-NEXT: adr r0, .LCPI6_0
	Show All 20 Lines
	; CHECKBE-NEXT: .long 16908546			; CHECKBE-NEXT: .long 16908546
	; CHECKBE-NEXT: .long 16908546 @ double 8.204306265173532E-304			; CHECKBE-NEXT: .long 16908546 @ double 8.204306265173532E-304
	; CHECKBE-NEXT: .long 16908546			; CHECKBE-NEXT: .long 16908546
	entry:			entry:
	ret <8 x i16> <i16 258, i16 258, i16 258, i16 258, i16 258, i16 258, i16 258, i16 258>			ret <8 x i16> <i16 258, i16 258, i16 258, i16 258, i16 258, i16 258, i16 258, i16 258>
	}			}

	define arm_aapcs_vfpcc <4 x i32> @mov_int32_1() {			define arm_aapcs_vfpcc <4 x i32> @mov_int32_1() {
	; CHECKLE-LABEL: mov_int32_1:			; CHECK-LABEL: mov_int32_1:
	; CHECKLE: @ %bb.0: @ %entry			; CHECK: @ %bb.0: @ %entry
	; CHECKLE-NEXT: vmov.i32 q0, #0x1			; CHECK-NEXT: vmov.i32 q0, #0x1
	; CHECKLE-NEXT: bx lr			; CHECK-NEXT: bx lr
	;
	; CHECKBE-LABEL: mov_int32_1:
	; CHECKBE: @ %bb.0: @ %entry
	; CHECKBE-NEXT: vmov.i32 q1, #0x1
	; CHECKBE-NEXT: vrev64.32 q0, q1
	; CHECKBE-NEXT: bx lr
	entry:			entry:
	ret <4 x i32> <i32 1, i32 1, i32 1, i32 1>			ret <4 x i32> <i32 1, i32 1, i32 1, i32 1>
	}			}

	define arm_aapcs_vfpcc <4 x i32> @mov_int32_256() {			define arm_aapcs_vfpcc <4 x i32> @mov_int32_256() {
	; CHECKLE-LABEL: mov_int32_256:			; CHECK-LABEL: mov_int32_256:
	; CHECKLE: @ %bb.0: @ %entry			; CHECK: @ %bb.0: @ %entry
	; CHECKLE-NEXT: vmov.i32 q0, #0x100			; CHECK-NEXT: vmov.i32 q0, #0x100
	; CHECKLE-NEXT: bx lr			; CHECK-NEXT: bx lr
	;
	; CHECKBE-LABEL: mov_int32_256:
	; CHECKBE: @ %bb.0: @ %entry
	; CHECKBE-NEXT: vmov.i32 q1, #0x100
	; CHECKBE-NEXT: vrev64.32 q0, q1
	; CHECKBE-NEXT: bx lr
	entry:			entry:
	ret <4 x i32> <i32 256, i32 256, i32 256, i32 256>			ret <4 x i32> <i32 256, i32 256, i32 256, i32 256>
	}			}

	define arm_aapcs_vfpcc <4 x i32> @mov_int32_65536() {			define arm_aapcs_vfpcc <4 x i32> @mov_int32_65536() {
	; CHECKLE-LABEL: mov_int32_65536:			; CHECK-LABEL: mov_int32_65536:
	; CHECKLE: @ %bb.0: @ %entry			; CHECK: @ %bb.0: @ %entry
	; CHECKLE-NEXT: vmov.i32 q0, #0x10000			; CHECK-NEXT: vmov.i32 q0, #0x10000
	; CHECKLE-NEXT: bx lr			; CHECK-NEXT: bx lr
	;
	; CHECKBE-LABEL: mov_int32_65536:
	; CHECKBE: @ %bb.0: @ %entry
	; CHECKBE-NEXT: vmov.i32 q1, #0x10000
	; CHECKBE-NEXT: vrev64.32 q0, q1
	; CHECKBE-NEXT: bx lr
	entry:			entry:
	ret <4 x i32> <i32 65536, i32 65536, i32 65536, i32 65536>			ret <4 x i32> <i32 65536, i32 65536, i32 65536, i32 65536>
	}			}

	define arm_aapcs_vfpcc <4 x i32> @mov_int32_16777216() {			define arm_aapcs_vfpcc <4 x i32> @mov_int32_16777216() {
	; CHECKLE-LABEL: mov_int32_16777216:			; CHECK-LABEL: mov_int32_16777216:
	; CHECKLE: @ %bb.0: @ %entry			; CHECK: @ %bb.0: @ %entry
	; CHECKLE-NEXT: vmov.i32 q0, #0x1000000			; CHECK-NEXT: vmov.i32 q0, #0x1000000
	; CHECKLE-NEXT: bx lr			; CHECK-NEXT: bx lr
	;
	; CHECKBE-LABEL: mov_int32_16777216:
	; CHECKBE: @ %bb.0: @ %entry
	; CHECKBE-NEXT: vmov.i32 q1, #0x1000000
	; CHECKBE-NEXT: vrev64.32 q0, q1
	; CHECKBE-NEXT: bx lr
	entry:			entry:
	ret <4 x i32> <i32 16777216, i32 16777216, i32 16777216, i32 16777216>			ret <4 x i32> <i32 16777216, i32 16777216, i32 16777216, i32 16777216>
	}			}

	define arm_aapcs_vfpcc <4 x i32> @mov_int32_16777217() {			define arm_aapcs_vfpcc <4 x i32> @mov_int32_16777217() {
	; CHECKLE-LABEL: mov_int32_16777217:			; CHECKLE-LABEL: mov_int32_16777217:
	; CHECKLE: @ %bb.0: @ %entry			; CHECKLE: @ %bb.0: @ %entry
	; CHECKLE-NEXT: adr r0, .LCPI11_0			; CHECKLE-NEXT: adr r0, .LCPI11_0
	Show All 20 Lines
	; CHECKBE-NEXT: .long 16777217			; CHECKBE-NEXT: .long 16777217
	; CHECKBE-NEXT: .long 16777217 @ double 7.2911290000737531E-304			; CHECKBE-NEXT: .long 16777217 @ double 7.2911290000737531E-304
	; CHECKBE-NEXT: .long 16777217			; CHECKBE-NEXT: .long 16777217
	entry:			entry:
	ret <4 x i32> <i32 16777217, i32 16777217, i32 16777217, i32 16777217>			ret <4 x i32> <i32 16777217, i32 16777217, i32 16777217, i32 16777217>
	}			}

	define arm_aapcs_vfpcc <4 x i32> @mov_int32_17919() {			define arm_aapcs_vfpcc <4 x i32> @mov_int32_17919() {
	; CHECKLE-LABEL: mov_int32_17919:			; CHECK-LABEL: mov_int32_17919:
	; CHECKLE: @ %bb.0: @ %entry			; CHECK: @ %bb.0: @ %entry
	; CHECKLE-NEXT: vmov.i32 q0, #0x45ff			; CHECK-NEXT: vmov.i32 q0, #0x45ff
	; CHECKLE-NEXT: bx lr			; CHECK-NEXT: bx lr
	;
	; CHECKBE-LABEL: mov_int32_17919:
	; CHECKBE: @ %bb.0: @ %entry
	; CHECKBE-NEXT: vmov.i32 q1, #0x45ff
	; CHECKBE-NEXT: vrev64.32 q0, q1
	; CHECKBE-NEXT: bx lr
	entry:			entry:
	ret <4 x i32> <i32 17919, i32 17919, i32 17919, i32 17919>			ret <4 x i32> <i32 17919, i32 17919, i32 17919, i32 17919>
	}			}

	define arm_aapcs_vfpcc <4 x i32> @mov_int32_4587519() {			define arm_aapcs_vfpcc <4 x i32> @mov_int32_4587519() {
	; CHECKLE-LABEL: mov_int32_4587519:			; CHECK-LABEL: mov_int32_4587519:
	; CHECKLE: @ %bb.0: @ %entry			; CHECK: @ %bb.0: @ %entry
	; CHECKLE-NEXT: vmov.i32 q0, #0x45ffff			; CHECK-NEXT: vmov.i32 q0, #0x45ffff
	; CHECKLE-NEXT: bx lr			; CHECK-NEXT: bx lr
	;
	; CHECKBE-LABEL: mov_int32_4587519:
	; CHECKBE: @ %bb.0: @ %entry
	; CHECKBE-NEXT: vmov.i32 q1, #0x45ffff
	; CHECKBE-NEXT: vrev64.32 q0, q1
	; CHECKBE-NEXT: bx lr
	entry:			entry:
	ret <4 x i32> <i32 4587519, i32 4587519, i32 4587519, i32 4587519>			ret <4 x i32> <i32 4587519, i32 4587519, i32 4587519, i32 4587519>
	}			}

	define arm_aapcs_vfpcc <4 x i32> @mov_int32_m1() {			define arm_aapcs_vfpcc <4 x i32> @mov_int32_m1() {
	; CHECKLE-LABEL: mov_int32_m1:			; CHECK-LABEL: mov_int32_m1:
	; CHECKLE: @ %bb.0: @ %entry			; CHECK: @ %bb.0: @ %entry
	; CHECKLE-NEXT: vmov.i8 q0, #0xff			; CHECK-NEXT: vmov.i8 q0, #0xff
	; CHECKLE-NEXT: bx lr			; CHECK-NEXT: bx lr
	;
	; CHECKBE-LABEL: mov_int32_m1:
	; CHECKBE: @ %bb.0: @ %entry
	; CHECKBE-NEXT: vmov.i8 q1, #0xff
	; CHECKBE-NEXT: vrev64.8 q0, q1
	; CHECKBE-NEXT: bx lr
	entry:			entry:
	ret <4 x i32> <i32 -1, i32 -1, i32 -1, i32 -1>			ret <4 x i32> <i32 -1, i32 -1, i32 -1, i32 -1>
	}			}

	define arm_aapcs_vfpcc <4 x i32> @mov_int32_4294901760() {			define arm_aapcs_vfpcc <4 x i32> @mov_int32_4294901760() {
	; CHECKLE-LABEL: mov_int32_4294901760:			; CHECK-LABEL: mov_int32_4294901760:
	; CHECKLE: @ %bb.0: @ %entry			; CHECK: @ %bb.0: @ %entry
	; CHECKLE-NEXT: vmvn.i32 q0, #0xffff			; CHECK-NEXT: vmvn.i32 q0, #0xffff
	; CHECKLE-NEXT: bx lr			; CHECK-NEXT: bx lr
	;
	; CHECKBE-LABEL: mov_int32_4294901760:
	; CHECKBE: @ %bb.0: @ %entry
	; CHECKBE-NEXT: vmvn.i32 q1, #0xffff
	; CHECKBE-NEXT: vrev64.32 q0, q1
	; CHECKBE-NEXT: bx lr
	entry:			entry:
	ret <4 x i32> <i32 4294901760, i32 4294901760, i32 4294901760, i32 4294901760>			ret <4 x i32> <i32 4294901760, i32 4294901760, i32 4294901760, i32 4294901760>
	}			}

	define arm_aapcs_vfpcc <4 x i32> @mov_int32_4278190335() {			define arm_aapcs_vfpcc <4 x i32> @mov_int32_4278190335() {
	; CHECKLE-LABEL: mov_int32_4278190335:			; CHECKLE-LABEL: mov_int32_4278190335:
	; CHECKLE: @ %bb.0: @ %entry			; CHECKLE: @ %bb.0: @ %entry
	; CHECKLE-NEXT: adr r0, .LCPI16_0			; CHECKLE-NEXT: adr r0, .LCPI16_0
	Show All 20 Lines
	; CHECKBE-NEXT: .long 4278190335			; CHECKBE-NEXT: .long 4278190335
	; CHECKBE-NEXT: .long 4278190335 @ double -5.4874634341155774E+303			; CHECKBE-NEXT: .long 4278190335 @ double -5.4874634341155774E+303
	; CHECKBE-NEXT: .long 4278190335			; CHECKBE-NEXT: .long 4278190335
	entry:			entry:
	ret <4 x i32> <i32 4278190335, i32 4278190335, i32 4278190335, i32 4278190335>			ret <4 x i32> <i32 4278190335, i32 4278190335, i32 4278190335, i32 4278190335>
	}			}

	define arm_aapcs_vfpcc <4 x i32> @mov_int32_4278255615() {			define arm_aapcs_vfpcc <4 x i32> @mov_int32_4278255615() {
	; CHECKLE-LABEL: mov_int32_4278255615:			; CHECK-LABEL: mov_int32_4278255615:
	; CHECKLE: @ %bb.0: @ %entry			; CHECK: @ %bb.0: @ %entry
	; CHECKLE-NEXT: vmvn.i32 q0, #0xff0000			; CHECK-NEXT: vmvn.i32 q0, #0xff0000
	; CHECKLE-NEXT: bx lr			; CHECK-NEXT: bx lr
	;
	; CHECKBE-LABEL: mov_int32_4278255615:
	; CHECKBE: @ %bb.0: @ %entry
	; CHECKBE-NEXT: vmvn.i32 q1, #0xff0000
	; CHECKBE-NEXT: vrev64.32 q0, q1
	; CHECKBE-NEXT: bx lr
	entry:			entry:
	ret <4 x i32> <i32 4278255615, i32 4278255615, i32 4278255615, i32 4278255615>			ret <4 x i32> <i32 4278255615, i32 4278255615, i32 4278255615, i32 4278255615>
	}			}

	define arm_aapcs_vfpcc <2 x i64> @mov_int64_1() {			define arm_aapcs_vfpcc <2 x i64> @mov_int64_1() {
	; CHECKLE-LABEL: mov_int64_1:			; CHECKLE-LABEL: mov_int64_1:
	; CHECKLE: @ %bb.0: @ %entry			; CHECKLE: @ %bb.0: @ %entry
	; CHECKLE-NEXT: adr r0, .LCPI18_0			; CHECKLE-NEXT: adr r0, .LCPI18_0
	Show All 34 Lines
	; CHECKBE: @ %bb.0: @ %entry			; CHECKBE: @ %bb.0: @ %entry
	; CHECKBE-NEXT: vmov.i64 q0, #0xff00000000			; CHECKBE-NEXT: vmov.i64 q0, #0xff00000000
	; CHECKBE-NEXT: bx lr			; CHECKBE-NEXT: bx lr
	entry:			entry:
	ret <2 x i64> < i64 255, i64 255 >			ret <2 x i64> < i64 255, i64 255 >
	}			}

	define arm_aapcs_vfpcc <2 x i64> @mov_int64_m1() {			define arm_aapcs_vfpcc <2 x i64> @mov_int64_m1() {
	; CHECKLE-LABEL: mov_int64_m1:			; CHECK-LABEL: mov_int64_m1:
	; CHECKLE: @ %bb.0: @ %entry			; CHECK: @ %bb.0: @ %entry
	; CHECKLE-NEXT: vmov.i8 q0, #0xff			; CHECK-NEXT: vmov.i8 q0, #0xff
	; CHECKLE-NEXT: bx lr			; CHECK-NEXT: bx lr
	;
	; CHECKBE-LABEL: mov_int64_m1:
	; CHECKBE: @ %bb.0: @ %entry
	; CHECKBE-NEXT: vmov.i8 q1, #0xff
	; CHECKBE-NEXT: vrev64.8 q0, q1
	; CHECKBE-NEXT: bx lr
	entry:			entry:
	ret <2 x i64> < i64 -1, i64 -1 >			ret <2 x i64> < i64 -1, i64 -1 >
	}			}

	define arm_aapcs_vfpcc <2 x i64> @mov_int64_ff0000ff0000ffff() {			define arm_aapcs_vfpcc <2 x i64> @mov_int64_ff0000ff0000ffff() {
	; CHECKLE-LABEL: mov_int64_ff0000ff0000ffff:			; CHECKLE-LABEL: mov_int64_ff0000ff0000ffff:
	; CHECKLE: @ %bb.0: @ %entry			; CHECKLE: @ %bb.0: @ %entry
	; CHECKLE-NEXT: vmov.i64 q0, #0xff0000ff0000ffff			; CHECKLE-NEXT: vmov.i64 q0, #0xff0000ff0000ffff
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
	define arm_aapcs_vfpcc <16 x i8> @mov_int64_0f0f0f0f0f0f0f0f() {			define arm_aapcs_vfpcc <16 x i8> @mov_int64_0f0f0f0f0f0f0f0f() {
	; CHECKLE-LABEL: mov_int64_0f0f0f0f0f0f0f0f:			; CHECKLE-LABEL: mov_int64_0f0f0f0f0f0f0f0f:
	; CHECKLE: @ %bb.0: @ %entry			; CHECKLE: @ %bb.0: @ %entry
	; CHECKLE-NEXT: vmov.i16 q0, #0xff			; CHECKLE-NEXT: vmov.i16 q0, #0xff
	; CHECKLE-NEXT: bx lr			; CHECKLE-NEXT: bx lr
	;			;
	; CHECKBE-LABEL: mov_int64_0f0f0f0f0f0f0f0f:			; CHECKBE-LABEL: mov_int64_0f0f0f0f0f0f0f0f:
	; CHECKBE: @ %bb.0: @ %entry			; CHECKBE: @ %bb.0: @ %entry
	; CHECKBE-NEXT: vmov.i16 q1, #0xff00			; CHECKBE-NEXT: vmov.i16 q0, #0xff00
	; CHECKBE-NEXT: vrev64.16 q0, q1
	; CHECKBE-NEXT: bx lr			; CHECKBE-NEXT: bx lr
	entry:			entry:
	ret <16 x i8> <i8 -1, i8 0, i8 -1, i8 0, i8 -1, i8 0, i8 -1, i8 0, i8 -1, i8 0, i8 -1, i8 0, i8 -1, i8 0, i8 -1, i8 0>			ret <16 x i8> <i8 -1, i8 0, i8 -1, i8 0, i8 -1, i8 0, i8 -1, i8 0, i8 -1, i8 0, i8 -1, i8 0, i8 -1, i8 0, i8 -1, i8 0>
	}			}

	define arm_aapcs_vfpcc <4 x float> @mov_float_1() {			define arm_aapcs_vfpcc <4 x float> @mov_float_1() {
	; CHECKLE-LABEL: mov_float_1:			; CHECKLE-LABEL: mov_float_1:
	; CHECKLE: @ %bb.0: @ %entry			; CHECKLE: @ %bb.0: @ %entry
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; CHECKBE-NEXT: .long 3225419776			; CHECKBE-NEXT: .long 3225419776
	; CHECKBE-NEXT: .long 3225419776 @ double -32.000022917985916			; CHECKBE-NEXT: .long 3225419776 @ double -32.000022917985916
	; CHECKBE-NEXT: .long 3225419776			; CHECKBE-NEXT: .long 3225419776
	entry:			entry:
	ret <4 x float> <float -3.000000e+00, float -3.000000e+00, float -3.000000e+00, float -3.000000e+00>			ret <4 x float> <float -3.000000e+00, float -3.000000e+00, float -3.000000e+00, float -3.000000e+00>
	}			}

	define arm_aapcs_vfpcc <8 x half> @mov_float16_1() {			define arm_aapcs_vfpcc <8 x half> @mov_float16_1() {
	; CHECKLE-LABEL: mov_float16_1:			; CHECK-LABEL: mov_float16_1:
	; CHECKLE: @ %bb.0: @ %entry			; CHECK: @ %bb.0: @ %entry
	; CHECKLE-NEXT: vmov.i16 q0, #0x3c00			; CHECK-NEXT: vmov.i16 q0, #0x3c00
	; CHECKLE-NEXT: bx lr			; CHECK-NEXT: bx lr
	;
	; CHECKBE-LABEL: mov_float16_1:
	; CHECKBE: @ %bb.0: @ %entry
	; CHECKBE-NEXT: vmov.i16 q1, #0x3c00
	; CHECKBE-NEXT: vrev64.16 q0, q1
	; CHECKBE-NEXT: bx lr

	entry:			entry:
	ret <8 x half> <half 1.000000e+00, half 1.000000e+00, half 1.000000e+00, half 1.000000e+00, half 1.000000e+00, half 1.000000e+00, half 1.000000e+00, half 1.000000e+00>			ret <8 x half> <half 1.000000e+00, half 1.000000e+00, half 1.000000e+00, half 1.000000e+00, half 1.000000e+00, half 1.000000e+00, half 1.000000e+00, half 1.000000e+00>
	}			}

	define arm_aapcs_vfpcc <8 x half> @mov_float16_m3() {			define arm_aapcs_vfpcc <8 x half> @mov_float16_m3() {
	; CHECKLE-LABEL: mov_float16_m3:			; CHECK-LABEL: mov_float16_m3:
	; CHECKLE: @ %bb.0: @ %entry			; CHECK: @ %bb.0: @ %entry
	; CHECKLE-NEXT: vmov.i16 q0, #0xc200			; CHECK-NEXT: vmov.i16 q0, #0xc200
	; CHECKLE-NEXT: bx lr			; CHECK-NEXT: bx lr
	;
	; CHECKBE-LABEL: mov_float16_m3:
	; CHECKBE: @ %bb.0: @ %entry
	; CHECKBE-NEXT: vmov.i16 q1, #0xc200
	; CHECKBE-NEXT: vrev64.16 q0, q1
	; CHECKBE-NEXT: bx lr

	entry:			entry:
	ret <8 x half> <half -3.000000e+00, half -3.000000e+00, half -3.000000e+00, half -3.000000e+00, half -3.000000e+00, half -3.000000e+00, half -3.000000e+00, half -3.000000e+00>			ret <8 x half> <half -3.000000e+00, half -3.000000e+00, half -3.000000e+00, half -3.000000e+00, half -3.000000e+00, half -3.000000e+00, half -3.000000e+00, half -3.000000e+00>
	}			}

	define arm_aapcs_vfpcc <2 x double> @mov_double_1() {			define arm_aapcs_vfpcc <2 x double> @mov_double_1() {
	; CHECKLE-LABEL: mov_double_1:			; CHECKLE-LABEL: mov_double_1:
	; CHECKLE: @ %bb.0: @ %entry			; CHECKLE: @ %bb.0: @ %entry
	▲ Show 20 Lines • Show All 67 Lines • Show Last 20 Lines