This is an archive of the discontinued LLVM Phabricator instance.

[ARM] Make a BE predicate bitcast consistent with the rest of llvm
ClosedPublic

Authored by dmgreen on Jan 16 2021, 8:57 AM.

Download Raw Diff

Details

Reviewers

SjoerdMeijer
ostannard
simon_tatham
efriedma

Commits

rG1db7b9ceaae4: [ARM] Make a BE predicate bitcast consistent with the rest of llvm

Summary

We were storing predicate registers, such as a <8 x i1>, in the opposite order to how the rest of llvm expects. This actually turns out to be correct for the one place that usually uses it - the ScalarizeMaskedMemIntrin pass, but only because the pass was incorrect itself. This fixes the order so that bits are stored in the opposite order and bitcasts work as expected. This allows the Scalarization pass to be fixed, as in https://reviews.llvm.org/D94765.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

dmgreen created this revision.Jan 16 2021, 8:57 AM

Herald added subscribers: danielkiss, hiraditya, kristof.beyls. · View Herald TranscriptJan 16 2021, 8:57 AM

dmgreen requested review of this revision.Jan 16 2021, 8:57 AM

Herald added a project: Restricted Project. · View Herald TranscriptJan 16 2021, 8:57 AM

dmgreen mentioned this in D94765: Expand masked mem intrinsics correctly wrt big-endian.Jan 16 2021, 9:00 AM

markus added a subscriber: markus.Jan 17 2021, 9:13 PM

We were storing predicate registers, such as a <8 x i1>, in the opposite order to how the rest of llvm expects.

It should be mentioned that it is, at least to me, unclear what llvm expects wrt this and as far as I know it is not documented anywhere. Simple experiment suggest that bit order is reversed for big endian targets

define i8 @foo() {
entry:
  %v = insertelement <8 x i1> zeroinitializer, i1 true, i8 0
  %bc = bitcast <8 x i1> %v to i8
  ret i8 %bc
}

$ llc -O3 bitcast.ll --mtriple arm -o -     # lsb is set in scalar
$ llc -O3 bitcast.ll --mtriple armeb -o -     # msb is set in scalar

with similar results for mips (big-endian) and amd64 (little-endian).

So before we go ahead an commit anything this should probably be clarified. I tried raising the issue on llvm-dev without much definitive response https://lists.llvm.org/pipermail/llvm-dev/2021-January/147725.html

In D94867#2504155, @markus wrote:
We were storing predicate registers, such as a <8 x i1>, in the opposite order to how the rest of llvm expects.

It should be mentioned that it is, at least to me, unclear what llvm expects wrt this and as far as I know it is not documented anywhere. Simple experiment suggest that bit order is reversed for big endian targets
define i8 @foo() {
entry:
  %v = insertelement <8 x i1> zeroinitializer, i1 true, i8 0
  %bc = bitcast <8 x i1> %v to i8
  ret i8 %bc
}
$ llc -O3 bitcast.ll --mtriple arm -o -     # lsb is set in scalar
$ llc -O3 bitcast.ll --mtriple armeb -o -     # msb is set in scalar
with similar results for mips (big-endian) and amd64 (little-endian).

Yes, but that is base ARM and it is only MVE that is incorrect. You can see here that things were inconsistent, which is what this patch is fixing:
https://godbolt.org/z/M8Y6dv

So before we go ahead an commit anything this should probably be clarified. I tried raising the issue on llvm-dev without much definitive response https://lists.llvm.org/pipermail/llvm-dev/2021-January/147725.html

It comes from https://reviews.llvm.org/D42100#992315. This patch just brings MVE inline with what the rest of llvm expects.

Yes, but that is base ARM and it is only MVE that is incorrect. You can see here that things were inconsistent, which is what this patch is fixing:
https://godbolt.org/z/M8Y6dv

Yes. I agree. As long was we know which is the right behavior.

It comes from https://reviews.llvm.org/D42100#992315. This patch just brings MVE inline with what the rest of llvm expects.

Thank you! I have been trying to find where this decision was taken. But now that we know that shouldn't we make an effort to document this in the lang-ref document (or is it already and simply couldn't find it)? It seems like something that is quite fundamental to be aware of and not at all obvious.

Ping

dmgreen added a child revision: D94765: Expand masked mem intrinsics correctly wrt big-endian.Feb 1 2021, 12:13 AM

ping

LGTM

This revision is now accepted and ready to land.Feb 8 2021, 1:16 AM

Closed by commit rG1db7b9ceaae4: [ARM] Make a BE predicate bitcast consistent with the rest of llvm (authored by dmgreen). · Explain WhyFeb 11 2021, 1:00 AM

This revision was automatically updated to reflect the committed changes.

dmgreen added a commit: rG1db7b9ceaae4: [ARM] Make a BE predicate bitcast consistent with the rest of llvm.

dmgreen mentioned this in rG9498315c9ba3: Expand masked mem intrinsics correctly wrt big-endian.

Revision Contents

Path

Size

llvm/

lib/

Target/

ARM/

ARMISelLowering.cpp

21 lines

test/

CodeGen/

Thumb2/

578 lines

72 lines

80 lines

35 lines

mve-pred-loadstore.ll

32 lines

Diff 322915

llvm/lib/Target/ARM/ARMISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 9,445 Lines • ▼ Show 20 Lines	static SDValue LowerPredicateLoad(SDValue Op, SelectionDAG &DAG) {

// The basic MVE VLDR on a v4i1/v8i1 actually loads the entire 16bit		// The basic MVE VLDR on a v4i1/v8i1 actually loads the entire 16bit
// predicate, with the "v4i1" bits spread out over the 16 bits loaded. We		// predicate, with the "v4i1" bits spread out over the 16 bits loaded. We
// need to make sure that 8/4 bits are actually loaded into the correct		// need to make sure that 8/4 bits are actually loaded into the correct
// place, which means loading the value and then shuffling the values into		// place, which means loading the value and then shuffling the values into
// the bottom bits of the predicate.		// the bottom bits of the predicate.
// Equally, VLDR for an v16i1 will actually load 32bits (so will be incorrect		// Equally, VLDR for an v16i1 will actually load 32bits (so will be incorrect
// for BE).		// for BE).
		// Speaking of BE, apparently the rest of llvm will assume a reverse order to
		// a natural VMSR(load), so needs to be reversed.

SDLoc dl(Op);		SDLoc dl(Op);
SDValue Load = DAG.getExtLoad(		SDValue Load = DAG.getExtLoad(
ISD::EXTLOAD, dl, MVT::i32, LD->getChain(), LD->getBasePtr(),		ISD::EXTLOAD, dl, MVT::i32, LD->getChain(), LD->getBasePtr(),
EVT::getIntegerVT(*DAG.getContext(), MemVT.getSizeInBits()),		EVT::getIntegerVT(*DAG.getContext(), MemVT.getSizeInBits()),
LD->getMemOperand());		LD->getMemOperand());
SDValue Pred = DAG.getNode(ARMISD::PREDICATE_CAST, dl, MVT::v16i1, Load);		SDValue Val = Load;
		if (DAG.getDataLayout().isBigEndian())
		Val = DAG.getNode(ISD::SRL, dl, MVT::i32,
		DAG.getNode(ISD::BITREVERSE, dl, MVT::i32, Load),
		DAG.getConstant(32 - MemVT.getSizeInBits(), dl, MVT::i32));
		SDValue Pred = DAG.getNode(ARMISD::PREDICATE_CAST, dl, MVT::v16i1, Val);
if (MemVT != MVT::v16i1)		if (MemVT != MVT::v16i1)
Pred = DAG.getNode(ISD::EXTRACT_SUBVECTOR, dl, MemVT, Pred,		Pred = DAG.getNode(ISD::EXTRACT_SUBVECTOR, dl, MemVT, Pred,
DAG.getConstant(0, dl, MVT::i32));		DAG.getConstant(0, dl, MVT::i32));
return DAG.getMergeValues({Pred, Load.getValue(1)}, dl);		return DAG.getMergeValues({Pred, Load.getValue(1)}, dl);
}		}

void ARMTargetLowering::LowerLOAD(SDNode *N, SmallVectorImpl<SDValue> &Results,		void ARMTargetLowering::LowerLOAD(SDNode *N, SmallVectorImpl<SDValue> &Results,
SelectionDAG &DAG) const {		SelectionDAG &DAG) const {
Show All 24 Lines	static SDValue LowerPredicateStore(SDValue Op, SelectionDAG &DAG) {
assert(ST->isUnindexed() && "Expected a unindexed store");		assert(ST->isUnindexed() && "Expected a unindexed store");

// Only store the v4i1 or v8i1 worth of bits, via a buildvector with top bits		// Only store the v4i1 or v8i1 worth of bits, via a buildvector with top bits
// unset and a scalar store.		// unset and a scalar store.
SDLoc dl(Op);		SDLoc dl(Op);
SDValue Build = ST->getValue();		SDValue Build = ST->getValue();
if (MemVT != MVT::v16i1) {		if (MemVT != MVT::v16i1) {
SmallVector<SDValue, 16> Ops;		SmallVector<SDValue, 16> Ops;
for (unsigned I = 0; I < MemVT.getVectorNumElements(); I++)		for (unsigned I = 0; I < MemVT.getVectorNumElements(); I++) {
		unsigned Elt = DAG.getDataLayout().isBigEndian()
		? MemVT.getVectorNumElements() - I - 1
		: I;
Ops.push_back(DAG.getNode(ISD::EXTRACT_VECTOR_ELT, dl, MVT::i32, Build,		Ops.push_back(DAG.getNode(ISD::EXTRACT_VECTOR_ELT, dl, MVT::i32, Build,
DAG.getConstant(I, dl, MVT::i32)));		DAG.getConstant(Elt, dl, MVT::i32)));
		}
for (unsigned I = MemVT.getVectorNumElements(); I < 16; I++)		for (unsigned I = MemVT.getVectorNumElements(); I < 16; I++)
Ops.push_back(DAG.getUNDEF(MVT::i32));		Ops.push_back(DAG.getUNDEF(MVT::i32));
Build = DAG.getNode(ISD::BUILD_VECTOR, dl, MVT::v16i1, Ops);		Build = DAG.getNode(ISD::BUILD_VECTOR, dl, MVT::v16i1, Ops);
}		}
SDValue GRP = DAG.getNode(ARMISD::PREDICATE_CAST, dl, MVT::i32, Build);		SDValue GRP = DAG.getNode(ARMISD::PREDICATE_CAST, dl, MVT::i32, Build);
		if (MemVT == MVT::v16i1 && DAG.getDataLayout().isBigEndian())
		GRP = DAG.getNode(ISD::SRL, dl, MVT::i32,
		DAG.getNode(ISD::BITREVERSE, dl, MVT::i32, GRP),
		DAG.getConstant(16, dl, MVT::i32));
return DAG.getTruncStore(		return DAG.getTruncStore(
ST->getChain(), dl, GRP, ST->getBasePtr(),		ST->getChain(), dl, GRP, ST->getBasePtr(),
EVT::getIntegerVT(*DAG.getContext(), MemVT.getSizeInBits()),		EVT::getIntegerVT(*DAG.getContext(), MemVT.getSizeInBits()),
ST->getMemOperand());		ST->getMemOperand());
}		}

static SDValue LowerSTORE(SDValue Op, SelectionDAG &DAG,		static SDValue LowerSTORE(SDValue Op, SelectionDAG &DAG,
const ARMSubtarget *Subtarget) {		const ARMSubtarget *Subtarget) {
▲ Show 20 Lines • Show All 9,988 Lines • Show Last 20 Lines

llvm/test/CodeGen/Thumb2/mve-masked-ldst.ll

Show First 20 Lines • Show All 810 Lines • ▼ Show 20 Lines	entry:
%0 = load <8 x i16>, <8 x i16>* %mask, align 2		%0 = load <8 x i16>, <8 x i16>* %mask, align 2
%1 = icmp sgt <8 x i16> %0, zeroinitializer		%1 = icmp sgt <8 x i16> %0, zeroinitializer
%2 = call <8 x half> @llvm.masked.load.v8f16.p0v8f16(<8 x half>* %src, i32 2, <8 x i1> %1, <8 x half> undef)		%2 = call <8 x half> @llvm.masked.load.v8f16.p0v8f16(<8 x half>* %src, i32 2, <8 x i1> %1, <8 x half> undef)
call void @llvm.masked.store.v8f16.p0v8f16(<8 x half> %2, <8 x half>* %dest, i32 2, <8 x i1> %1)		call void @llvm.masked.store.v8f16.p0v8f16(<8 x half> %2, <8 x half>* %dest, i32 2, <8 x i1> %1)
ret void		ret void
}		}

define void @foo_v4f32_v4f16(<4 x float> %dest, <4 x i16> %mask, <4 x half> *%src) {		define void @foo_v4f32_v4f16(<4 x float> %dest, <4 x i16> %mask, <4 x half> *%src) {
; CHECK-LABEL: foo_v4f32_v4f16:		; CHECK-LE-LABEL: foo_v4f32_v4f16:
; CHECK: @ %bb.0: @ %entry		; CHECK-LE: @ %bb.0: @ %entry
; CHECK-NEXT: .save {r7, lr}		; CHECK-LE-NEXT: .save {r7, lr}
; CHECK-NEXT: push {r7, lr}		; CHECK-LE-NEXT: push {r7, lr}
; CHECK-NEXT: .pad #8		; CHECK-LE-NEXT: .pad #8
; CHECK-NEXT: sub sp, #8		; CHECK-LE-NEXT: sub sp, #8
; CHECK-NEXT: vldrh.s32 q0, [r1]		; CHECK-LE-NEXT: vldrh.s32 q0, [r1]
; CHECK-NEXT: vcmp.s32 gt, q0, zr		; CHECK-LE-NEXT: vcmp.s32 gt, q0, zr
; CHECK-NEXT: @ implicit-def: $q0		; CHECK-LE-NEXT: @ implicit-def: $q0
; CHECK-NEXT: vmrs lr, p0		; CHECK-LE-NEXT: vmrs lr, p0
; CHECK-NEXT: and r1, lr, #1		; CHECK-LE-NEXT: and r1, lr, #1
; CHECK-NEXT: ubfx r3, lr, #4, #1		; CHECK-LE-NEXT: ubfx r3, lr, #4, #1
; CHECK-NEXT: rsb.w r12, r1, #0		; CHECK-LE-NEXT: rsb.w r12, r1, #0
; CHECK-NEXT: movs r1, #0		; CHECK-LE-NEXT: movs r1, #0
; CHECK-NEXT: rsbs r3, r3, #0		; CHECK-LE-NEXT: rsbs r3, r3, #0
; CHECK-NEXT: bfi r1, r12, #0, #1		; CHECK-LE-NEXT: bfi r1, r12, #0, #1
; CHECK-NEXT: bfi r1, r3, #1, #1		; CHECK-LE-NEXT: bfi r1, r3, #1, #1
; CHECK-NEXT: ubfx r3, lr, #8, #1		; CHECK-LE-NEXT: ubfx r3, lr, #8, #1
; CHECK-NEXT: rsbs r3, r3, #0		; CHECK-LE-NEXT: rsbs r3, r3, #0
; CHECK-NEXT: bfi r1, r3, #2, #1		; CHECK-LE-NEXT: bfi r1, r3, #2, #1
; CHECK-NEXT: ubfx r3, lr, #12, #1		; CHECK-LE-NEXT: ubfx r3, lr, #12, #1
; CHECK-NEXT: rsbs r3, r3, #0		; CHECK-LE-NEXT: rsbs r3, r3, #0
; CHECK-NEXT: bfi r1, r3, #3, #1		; CHECK-LE-NEXT: bfi r1, r3, #3, #1
; CHECK-NEXT: lsls r3, r1, #31		; CHECK-LE-NEXT: lsls r3, r1, #31
; CHECK-NEXT: bne .LBB18_6		; CHECK-LE-NEXT: bne .LBB18_6
; CHECK-NEXT: @ %bb.1: @ %else		; CHECK-LE-NEXT: @ %bb.1: @ %else
; CHECK-NEXT: lsls r3, r1, #30		; CHECK-LE-NEXT: lsls r3, r1, #30
; CHECK-NEXT: bmi .LBB18_7		; CHECK-LE-NEXT: bmi .LBB18_7
; CHECK-NEXT: .LBB18_2: @ %else2		; CHECK-LE-NEXT: .LBB18_2: @ %else2
; CHECK-NEXT: lsls r3, r1, #29		; CHECK-LE-NEXT: lsls r3, r1, #29
; CHECK-NEXT: bmi .LBB18_8		; CHECK-LE-NEXT: bmi .LBB18_8
; CHECK-NEXT: .LBB18_3: @ %else5		; CHECK-LE-NEXT: .LBB18_3: @ %else5
; CHECK-NEXT: lsls r1, r1, #28		; CHECK-LE-NEXT: lsls r1, r1, #28
; CHECK-NEXT: bpl .LBB18_5		; CHECK-LE-NEXT: bpl .LBB18_5
; CHECK-NEXT: .LBB18_4: @ %cond.load7		; CHECK-LE-NEXT: .LBB18_4: @ %cond.load7
; CHECK-NEXT: vmovx.f16 s4, s0		; CHECK-LE-NEXT: vmovx.f16 s4, s0
; CHECK-NEXT: vins.f16 s0, s4		; CHECK-LE-NEXT: vins.f16 s0, s4
; CHECK-NEXT: vldr.16 s4, [r2, #6]		; CHECK-LE-NEXT: vldr.16 s4, [r2, #6]
; CHECK-NEXT: vins.f16 s1, s4		; CHECK-LE-NEXT: vins.f16 s1, s4
; CHECK-NEXT: .LBB18_5: @ %else8		; CHECK-LE-NEXT: .LBB18_5: @ %else8
; CHECK-NEXT: vmrs r2, p0		; CHECK-LE-NEXT: vmrs r2, p0
; CHECK-NEXT: movs r1, #0		; CHECK-LE-NEXT: movs r1, #0
; CHECK-NEXT: vcvtt.f32.f16 s7, s1		; CHECK-LE-NEXT: vcvtt.f32.f16 s7, s1
; CHECK-NEXT: vcvtb.f32.f16 s6, s1		; CHECK-LE-NEXT: vcvtb.f32.f16 s6, s1
; CHECK-NEXT: vcvtt.f32.f16 s5, s0		; CHECK-LE-NEXT: vcvtt.f32.f16 s5, s0
; CHECK-NEXT: vcvtb.f32.f16 s4, s0		; CHECK-LE-NEXT: vcvtb.f32.f16 s4, s0
; CHECK-NEXT: and r3, r2, #1		; CHECK-LE-NEXT: and r3, r2, #1
; CHECK-NEXT: rsbs r3, r3, #0		; CHECK-LE-NEXT: rsbs r3, r3, #0
; CHECK-NEXT: bfi r1, r3, #0, #1		; CHECK-LE-NEXT: bfi r1, r3, #0, #1
; CHECK-NEXT: ubfx r3, r2, #4, #1		; CHECK-LE-NEXT: ubfx r3, r2, #4, #1
; CHECK-NEXT: rsbs r3, r3, #0		; CHECK-LE-NEXT: rsbs r3, r3, #0
; CHECK-NEXT: bfi r1, r3, #1, #1		; CHECK-LE-NEXT: bfi r1, r3, #1, #1
; CHECK-NEXT: ubfx r3, r2, #8, #1		; CHECK-LE-NEXT: ubfx r3, r2, #8, #1
; CHECK-NEXT: ubfx r2, r2, #12, #1		; CHECK-LE-NEXT: ubfx r2, r2, #12, #1
; CHECK-NEXT: rsbs r3, r3, #0		; CHECK-LE-NEXT: rsbs r3, r3, #0
; CHECK-NEXT: bfi r1, r3, #2, #1		; CHECK-LE-NEXT: bfi r1, r3, #2, #1
; CHECK-NEXT: rsbs r2, r2, #0		; CHECK-LE-NEXT: rsbs r2, r2, #0
; CHECK-NEXT: bfi r1, r2, #3, #1		; CHECK-LE-NEXT: bfi r1, r2, #3, #1
; CHECK-NEXT: lsls r2, r1, #31		; CHECK-LE-NEXT: lsls r2, r1, #31
; CHECK-NEXT: itt ne		; CHECK-LE-NEXT: itt ne
; CHECK-NEXT: vmovne r2, s4		; CHECK-LE-NEXT: vmovne r2, s4
; CHECK-NEXT: strne r2, [r0]		; CHECK-LE-NEXT: strne r2, [r0]
; CHECK-NEXT: lsls r2, r1, #30		; CHECK-LE-NEXT: lsls r2, r1, #30
; CHECK-NEXT: itt mi		; CHECK-LE-NEXT: itt mi
; CHECK-NEXT: vmovmi r2, s5		; CHECK-LE-NEXT: vmovmi r2, s5
; CHECK-NEXT: strmi r2, [r0, #4]		; CHECK-LE-NEXT: strmi r2, [r0, #4]
; CHECK-NEXT: lsls r2, r1, #29		; CHECK-LE-NEXT: lsls r2, r1, #29
; CHECK-NEXT: itt mi		; CHECK-LE-NEXT: itt mi
; CHECK-NEXT: vmovmi r2, s6		; CHECK-LE-NEXT: vmovmi r2, s6
; CHECK-NEXT: strmi r2, [r0, #8]		; CHECK-LE-NEXT: strmi r2, [r0, #8]
; CHECK-NEXT: lsls r1, r1, #28		; CHECK-LE-NEXT: lsls r1, r1, #28
; CHECK-NEXT: itt mi		; CHECK-LE-NEXT: itt mi
; CHECK-NEXT: vmovmi r1, s7		; CHECK-LE-NEXT: vmovmi r1, s7
; CHECK-NEXT: strmi r1, [r0, #12]		; CHECK-LE-NEXT: strmi r1, [r0, #12]
; CHECK-NEXT: add sp, #8		; CHECK-LE-NEXT: add sp, #8
; CHECK-NEXT: pop {r7, pc}		; CHECK-LE-NEXT: pop {r7, pc}
; CHECK-NEXT: .LBB18_6: @ %cond.load		; CHECK-LE-NEXT: .LBB18_6: @ %cond.load
; CHECK-NEXT: vldr.16 s0, [r2]		; CHECK-LE-NEXT: vldr.16 s0, [r2]
; CHECK-NEXT: lsls r3, r1, #30		; CHECK-LE-NEXT: lsls r3, r1, #30
; CHECK-NEXT: bpl .LBB18_2		; CHECK-LE-NEXT: bpl .LBB18_2
; CHECK-NEXT: .LBB18_7: @ %cond.load1		; CHECK-LE-NEXT: .LBB18_7: @ %cond.load1
; CHECK-NEXT: vldr.16 s4, [r2, #2]		; CHECK-LE-NEXT: vldr.16 s4, [r2, #2]
; CHECK-NEXT: vins.f16 s0, s4		; CHECK-LE-NEXT: vins.f16 s0, s4
; CHECK-NEXT: vmovx.f16 s4, s1		; CHECK-LE-NEXT: vmovx.f16 s4, s1
; CHECK-NEXT: vins.f16 s1, s4		; CHECK-LE-NEXT: vins.f16 s1, s4
; CHECK-NEXT: lsls r3, r1, #29		; CHECK-LE-NEXT: lsls r3, r1, #29
; CHECK-NEXT: bpl .LBB18_3		; CHECK-LE-NEXT: bpl .LBB18_3
; CHECK-NEXT: .LBB18_8: @ %cond.load4		; CHECK-LE-NEXT: .LBB18_8: @ %cond.load4
; CHECK-NEXT: vmovx.f16 s4, s0		; CHECK-LE-NEXT: vmovx.f16 s4, s0
; CHECK-NEXT: vins.f16 s0, s4		; CHECK-LE-NEXT: vins.f16 s0, s4
; CHECK-NEXT: vmovx.f16 s4, s1		; CHECK-LE-NEXT: vmovx.f16 s4, s1
; CHECK-NEXT: vldr.16 s1, [r2, #4]		; CHECK-LE-NEXT: vldr.16 s1, [r2, #4]
; CHECK-NEXT: vins.f16 s1, s4		; CHECK-LE-NEXT: vins.f16 s1, s4
; CHECK-NEXT: lsls r1, r1, #28		; CHECK-LE-NEXT: lsls r1, r1, #28
; CHECK-NEXT: bmi .LBB18_4		; CHECK-LE-NEXT: bmi .LBB18_4
; CHECK-NEXT: b .LBB18_5		; CHECK-LE-NEXT: b .LBB18_5
		;
		; CHECK-BE-LABEL: foo_v4f32_v4f16:
		; CHECK-BE: @ %bb.0: @ %entry
		; CHECK-BE-NEXT: .save {r7, lr}
		; CHECK-BE-NEXT: push {r7, lr}
		; CHECK-BE-NEXT: .pad #8
		; CHECK-BE-NEXT: sub sp, #8
		; CHECK-BE-NEXT: vldrh.s32 q0, [r1]
		; CHECK-BE-NEXT: vcmp.s32 gt, q0, zr
		; CHECK-BE-NEXT: @ implicit-def: $q0
		; CHECK-BE-NEXT: vmrs lr, p0
		; CHECK-BE-NEXT: ubfx r1, lr, #12, #1
		; CHECK-BE-NEXT: ubfx r3, lr, #8, #1
		; CHECK-BE-NEXT: rsb.w r12, r1, #0
		; CHECK-BE-NEXT: movs r1, #0
		; CHECK-BE-NEXT: bfi r1, r12, #0, #1
		; CHECK-BE-NEXT: rsbs r3, r3, #0
		; CHECK-BE-NEXT: bfi r1, r3, #1, #1
		; CHECK-BE-NEXT: ubfx r3, lr, #4, #1
		; CHECK-BE-NEXT: rsbs r3, r3, #0
		; CHECK-BE-NEXT: bfi r1, r3, #2, #1
		; CHECK-BE-NEXT: and r3, lr, #1
		; CHECK-BE-NEXT: rsbs r3, r3, #0
		; CHECK-BE-NEXT: bfi r1, r3, #3, #1
		; CHECK-BE-NEXT: lsls r3, r1, #31
		; CHECK-BE-NEXT: bne .LBB18_6
		; CHECK-BE-NEXT: @ %bb.1: @ %else
		; CHECK-BE-NEXT: lsls r3, r1, #30
		; CHECK-BE-NEXT: bmi .LBB18_7
		; CHECK-BE-NEXT: .LBB18_2: @ %else2
		; CHECK-BE-NEXT: lsls r3, r1, #29
		; CHECK-BE-NEXT: bmi .LBB18_8
		; CHECK-BE-NEXT: .LBB18_3: @ %else5
		; CHECK-BE-NEXT: lsls r1, r1, #28
		; CHECK-BE-NEXT: bpl .LBB18_5
		; CHECK-BE-NEXT: .LBB18_4: @ %cond.load7
		; CHECK-BE-NEXT: vmovx.f16 s4, s0
		; CHECK-BE-NEXT: vins.f16 s0, s4
		; CHECK-BE-NEXT: vldr.16 s4, [r2, #6]
		; CHECK-BE-NEXT: vins.f16 s1, s4
		; CHECK-BE-NEXT: .LBB18_5: @ %else8
		; CHECK-BE-NEXT: vmrs r2, p0
		; CHECK-BE-NEXT: movs r1, #0
		; CHECK-BE-NEXT: vcvtt.f32.f16 s7, s1
		; CHECK-BE-NEXT: vcvtb.f32.f16 s6, s1
		; CHECK-BE-NEXT: vcvtt.f32.f16 s5, s0
		; CHECK-BE-NEXT: vcvtb.f32.f16 s4, s0
		; CHECK-BE-NEXT: ubfx r3, r2, #12, #1
		; CHECK-BE-NEXT: rsbs r3, r3, #0
		; CHECK-BE-NEXT: bfi r1, r3, #0, #1
		; CHECK-BE-NEXT: ubfx r3, r2, #8, #1
		; CHECK-BE-NEXT: rsbs r3, r3, #0
		; CHECK-BE-NEXT: bfi r1, r3, #1, #1
		; CHECK-BE-NEXT: ubfx r3, r2, #4, #1
		; CHECK-BE-NEXT: and r2, r2, #1
		; CHECK-BE-NEXT: rsbs r3, r3, #0
		; CHECK-BE-NEXT: bfi r1, r3, #2, #1
		; CHECK-BE-NEXT: rsbs r2, r2, #0
		; CHECK-BE-NEXT: bfi r1, r2, #3, #1
		; CHECK-BE-NEXT: lsls r2, r1, #31
		; CHECK-BE-NEXT: itt ne
		; CHECK-BE-NEXT: vmovne r2, s4
		; CHECK-BE-NEXT: strne r2, [r0]
		; CHECK-BE-NEXT: lsls r2, r1, #30
		; CHECK-BE-NEXT: itt mi
		; CHECK-BE-NEXT: vmovmi r2, s5
		; CHECK-BE-NEXT: strmi r2, [r0, #4]
		; CHECK-BE-NEXT: lsls r2, r1, #29
		; CHECK-BE-NEXT: itt mi
		; CHECK-BE-NEXT: vmovmi r2, s6
		; CHECK-BE-NEXT: strmi r2, [r0, #8]
		; CHECK-BE-NEXT: lsls r1, r1, #28
		; CHECK-BE-NEXT: itt mi
		; CHECK-BE-NEXT: vmovmi r1, s7
		; CHECK-BE-NEXT: strmi r1, [r0, #12]
		; CHECK-BE-NEXT: add sp, #8
		; CHECK-BE-NEXT: pop {r7, pc}
		; CHECK-BE-NEXT: .LBB18_6: @ %cond.load
		; CHECK-BE-NEXT: vldr.16 s0, [r2]
		; CHECK-BE-NEXT: lsls r3, r1, #30
		; CHECK-BE-NEXT: bpl .LBB18_2
		; CHECK-BE-NEXT: .LBB18_7: @ %cond.load1
		; CHECK-BE-NEXT: vldr.16 s4, [r2, #2]
		; CHECK-BE-NEXT: vins.f16 s0, s4
		; CHECK-BE-NEXT: vmovx.f16 s4, s1
		; CHECK-BE-NEXT: vins.f16 s1, s4
		; CHECK-BE-NEXT: lsls r3, r1, #29
		; CHECK-BE-NEXT: bpl .LBB18_3
		; CHECK-BE-NEXT: .LBB18_8: @ %cond.load4
		; CHECK-BE-NEXT: vmovx.f16 s4, s0
		; CHECK-BE-NEXT: vins.f16 s0, s4
		; CHECK-BE-NEXT: vmovx.f16 s4, s1
		; CHECK-BE-NEXT: vldr.16 s1, [r2, #4]
		; CHECK-BE-NEXT: vins.f16 s1, s4
		; CHECK-BE-NEXT: lsls r1, r1, #28
		; CHECK-BE-NEXT: bmi .LBB18_4
		; CHECK-BE-NEXT: b .LBB18_5
entry:		entry:
%0 = load <4 x i16>, <4 x i16>* %mask, align 2		%0 = load <4 x i16>, <4 x i16>* %mask, align 2
%1 = icmp sgt <4 x i16> %0, zeroinitializer		%1 = icmp sgt <4 x i16> %0, zeroinitializer
%2 = call <4 x half> @llvm.masked.load.v4f16.p0v4f16(<4 x half>* %src, i32 2, <4 x i1> %1, <4 x half> undef)		%2 = call <4 x half> @llvm.masked.load.v4f16.p0v4f16(<4 x half>* %src, i32 2, <4 x i1> %1, <4 x half> undef)
%3 = fpext <4 x half> %2 to <4 x float>		%3 = fpext <4 x half> %2 to <4 x float>
call void @llvm.masked.store.v4f32.p0v4f32(<4 x float> %3, <4 x float>* %dest, i32 2, <4 x i1> %1)		call void @llvm.masked.store.v4f32.p0v4f32(<4 x float> %3, <4 x float>* %dest, i32 2, <4 x i1> %1)
ret void		ret void
}		}

define void @foo_v4f32_v4f16_unaligned(<4 x float> %dest, <4 x i16> %mask, <4 x half> *%src) {		define void @foo_v4f32_v4f16_unaligned(<4 x float> %dest, <4 x i16> %mask, <4 x half> *%src) {
; CHECK-LABEL: foo_v4f32_v4f16_unaligned:		; CHECK-LE-LABEL: foo_v4f32_v4f16_unaligned:
; CHECK: @ %bb.0: @ %entry		; CHECK-LE: @ %bb.0: @ %entry
; CHECK-NEXT: .save {r7, lr}		; CHECK-LE-NEXT: .save {r7, lr}
; CHECK-NEXT: push {r7, lr}		; CHECK-LE-NEXT: push {r7, lr}
; CHECK-NEXT: .pad #8		; CHECK-LE-NEXT: .pad #8
; CHECK-NEXT: sub sp, #8		; CHECK-LE-NEXT: sub sp, #8
; CHECK-NEXT: vldrh.s32 q0, [r1]		; CHECK-LE-NEXT: vldrh.s32 q0, [r1]
; CHECK-NEXT: vcmp.s32 gt, q0, zr		; CHECK-LE-NEXT: vcmp.s32 gt, q0, zr
; CHECK-NEXT: @ implicit-def: $q0		; CHECK-LE-NEXT: @ implicit-def: $q0
; CHECK-NEXT: vmrs lr, p0		; CHECK-LE-NEXT: vmrs lr, p0
; CHECK-NEXT: and r1, lr, #1		; CHECK-LE-NEXT: and r1, lr, #1
; CHECK-NEXT: ubfx r3, lr, #4, #1		; CHECK-LE-NEXT: ubfx r3, lr, #4, #1
; CHECK-NEXT: rsb.w r12, r1, #0		; CHECK-LE-NEXT: rsb.w r12, r1, #0
; CHECK-NEXT: movs r1, #0		; CHECK-LE-NEXT: movs r1, #0
; CHECK-NEXT: rsbs r3, r3, #0		; CHECK-LE-NEXT: rsbs r3, r3, #0
; CHECK-NEXT: bfi r1, r12, #0, #1		; CHECK-LE-NEXT: bfi r1, r12, #0, #1
; CHECK-NEXT: bfi r1, r3, #1, #1		; CHECK-LE-NEXT: bfi r1, r3, #1, #1
; CHECK-NEXT: ubfx r3, lr, #8, #1		; CHECK-LE-NEXT: ubfx r3, lr, #8, #1
; CHECK-NEXT: rsbs r3, r3, #0		; CHECK-LE-NEXT: rsbs r3, r3, #0
; CHECK-NEXT: bfi r1, r3, #2, #1		; CHECK-LE-NEXT: bfi r1, r3, #2, #1
; CHECK-NEXT: ubfx r3, lr, #12, #1		; CHECK-LE-NEXT: ubfx r3, lr, #12, #1
; CHECK-NEXT: rsbs r3, r3, #0		; CHECK-LE-NEXT: rsbs r3, r3, #0
; CHECK-NEXT: bfi r1, r3, #3, #1		; CHECK-LE-NEXT: bfi r1, r3, #3, #1
; CHECK-NEXT: lsls r3, r1, #31		; CHECK-LE-NEXT: lsls r3, r1, #31
; CHECK-NEXT: bne .LBB19_6		; CHECK-LE-NEXT: bne .LBB19_6
; CHECK-NEXT: @ %bb.1: @ %else		; CHECK-LE-NEXT: @ %bb.1: @ %else
; CHECK-NEXT: lsls r3, r1, #30		; CHECK-LE-NEXT: lsls r3, r1, #30
; CHECK-NEXT: bmi .LBB19_7		; CHECK-LE-NEXT: bmi .LBB19_7
; CHECK-NEXT: .LBB19_2: @ %else2		; CHECK-LE-NEXT: .LBB19_2: @ %else2
; CHECK-NEXT: lsls r3, r1, #29		; CHECK-LE-NEXT: lsls r3, r1, #29
; CHECK-NEXT: bmi .LBB19_8		; CHECK-LE-NEXT: bmi .LBB19_8
; CHECK-NEXT: .LBB19_3: @ %else5		; CHECK-LE-NEXT: .LBB19_3: @ %else5
; CHECK-NEXT: lsls r1, r1, #28		; CHECK-LE-NEXT: lsls r1, r1, #28
; CHECK-NEXT: bpl .LBB19_5		; CHECK-LE-NEXT: bpl .LBB19_5
; CHECK-NEXT: .LBB19_4: @ %cond.load7		; CHECK-LE-NEXT: .LBB19_4: @ %cond.load7
; CHECK-NEXT: vmovx.f16 s4, s0		; CHECK-LE-NEXT: vmovx.f16 s4, s0
; CHECK-NEXT: vins.f16 s0, s4		; CHECK-LE-NEXT: vins.f16 s0, s4
; CHECK-NEXT: vldr.16 s4, [r2, #6]		; CHECK-LE-NEXT: vldr.16 s4, [r2, #6]
; CHECK-NEXT: vins.f16 s1, s4		; CHECK-LE-NEXT: vins.f16 s1, s4
; CHECK-NEXT: .LBB19_5: @ %else8		; CHECK-LE-NEXT: .LBB19_5: @ %else8
; CHECK-NEXT: vmrs r2, p0		; CHECK-LE-NEXT: vmrs r2, p0
; CHECK-NEXT: movs r1, #0		; CHECK-LE-NEXT: movs r1, #0
; CHECK-NEXT: vcvtt.f32.f16 s7, s1		; CHECK-LE-NEXT: vcvtt.f32.f16 s7, s1
; CHECK-NEXT: vcvtb.f32.f16 s6, s1		; CHECK-LE-NEXT: vcvtb.f32.f16 s6, s1
; CHECK-NEXT: vcvtt.f32.f16 s5, s0		; CHECK-LE-NEXT: vcvtt.f32.f16 s5, s0
; CHECK-NEXT: vcvtb.f32.f16 s4, s0		; CHECK-LE-NEXT: vcvtb.f32.f16 s4, s0
; CHECK-NEXT: and r3, r2, #1		; CHECK-LE-NEXT: and r3, r2, #1
; CHECK-NEXT: rsbs r3, r3, #0		; CHECK-LE-NEXT: rsbs r3, r3, #0
; CHECK-NEXT: bfi r1, r3, #0, #1		; CHECK-LE-NEXT: bfi r1, r3, #0, #1
; CHECK-NEXT: ubfx r3, r2, #4, #1		; CHECK-LE-NEXT: ubfx r3, r2, #4, #1
; CHECK-NEXT: rsbs r3, r3, #0		; CHECK-LE-NEXT: rsbs r3, r3, #0
; CHECK-NEXT: bfi r1, r3, #1, #1		; CHECK-LE-NEXT: bfi r1, r3, #1, #1
; CHECK-NEXT: ubfx r3, r2, #8, #1		; CHECK-LE-NEXT: ubfx r3, r2, #8, #1
; CHECK-NEXT: ubfx r2, r2, #12, #1		; CHECK-LE-NEXT: ubfx r2, r2, #12, #1
; CHECK-NEXT: rsbs r3, r3, #0		; CHECK-LE-NEXT: rsbs r3, r3, #0
; CHECK-NEXT: bfi r1, r3, #2, #1		; CHECK-LE-NEXT: bfi r1, r3, #2, #1
; CHECK-NEXT: rsbs r2, r2, #0		; CHECK-LE-NEXT: rsbs r2, r2, #0
; CHECK-NEXT: bfi r1, r2, #3, #1		; CHECK-LE-NEXT: bfi r1, r2, #3, #1
; CHECK-NEXT: lsls r2, r1, #31		; CHECK-LE-NEXT: lsls r2, r1, #31
; CHECK-NEXT: itt ne		; CHECK-LE-NEXT: itt ne
; CHECK-NEXT: vmovne r2, s4		; CHECK-LE-NEXT: vmovne r2, s4
; CHECK-NEXT: strne r2, [r0]		; CHECK-LE-NEXT: strne r2, [r0]
; CHECK-NEXT: lsls r2, r1, #30		; CHECK-LE-NEXT: lsls r2, r1, #30
; CHECK-NEXT: itt mi		; CHECK-LE-NEXT: itt mi
; CHECK-NEXT: vmovmi r2, s5		; CHECK-LE-NEXT: vmovmi r2, s5
; CHECK-NEXT: strmi r2, [r0, #4]		; CHECK-LE-NEXT: strmi r2, [r0, #4]
; CHECK-NEXT: lsls r2, r1, #29		; CHECK-LE-NEXT: lsls r2, r1, #29
; CHECK-NEXT: itt mi		; CHECK-LE-NEXT: itt mi
; CHECK-NEXT: vmovmi r2, s6		; CHECK-LE-NEXT: vmovmi r2, s6
; CHECK-NEXT: strmi r2, [r0, #8]		; CHECK-LE-NEXT: strmi r2, [r0, #8]
; CHECK-NEXT: lsls r1, r1, #28		; CHECK-LE-NEXT: lsls r1, r1, #28
; CHECK-NEXT: itt mi		; CHECK-LE-NEXT: itt mi
; CHECK-NEXT: vmovmi r1, s7		; CHECK-LE-NEXT: vmovmi r1, s7
; CHECK-NEXT: strmi r1, [r0, #12]		; CHECK-LE-NEXT: strmi r1, [r0, #12]
; CHECK-NEXT: add sp, #8		; CHECK-LE-NEXT: add sp, #8
; CHECK-NEXT: pop {r7, pc}		; CHECK-LE-NEXT: pop {r7, pc}
; CHECK-NEXT: .LBB19_6: @ %cond.load		; CHECK-LE-NEXT: .LBB19_6: @ %cond.load
; CHECK-NEXT: vldr.16 s0, [r2]		; CHECK-LE-NEXT: vldr.16 s0, [r2]
; CHECK-NEXT: lsls r3, r1, #30		; CHECK-LE-NEXT: lsls r3, r1, #30
; CHECK-NEXT: bpl .LBB19_2		; CHECK-LE-NEXT: bpl .LBB19_2
; CHECK-NEXT: .LBB19_7: @ %cond.load1		; CHECK-LE-NEXT: .LBB19_7: @ %cond.load1
; CHECK-NEXT: vldr.16 s4, [r2, #2]		; CHECK-LE-NEXT: vldr.16 s4, [r2, #2]
; CHECK-NEXT: vins.f16 s0, s4		; CHECK-LE-NEXT: vins.f16 s0, s4
; CHECK-NEXT: vmovx.f16 s4, s1		; CHECK-LE-NEXT: vmovx.f16 s4, s1
; CHECK-NEXT: vins.f16 s1, s4		; CHECK-LE-NEXT: vins.f16 s1, s4
; CHECK-NEXT: lsls r3, r1, #29		; CHECK-LE-NEXT: lsls r3, r1, #29
; CHECK-NEXT: bpl .LBB19_3		; CHECK-LE-NEXT: bpl .LBB19_3
; CHECK-NEXT: .LBB19_8: @ %cond.load4		; CHECK-LE-NEXT: .LBB19_8: @ %cond.load4
; CHECK-NEXT: vmovx.f16 s4, s0		; CHECK-LE-NEXT: vmovx.f16 s4, s0
; CHECK-NEXT: vins.f16 s0, s4		; CHECK-LE-NEXT: vins.f16 s0, s4
; CHECK-NEXT: vmovx.f16 s4, s1		; CHECK-LE-NEXT: vmovx.f16 s4, s1
; CHECK-NEXT: vldr.16 s1, [r2, #4]		; CHECK-LE-NEXT: vldr.16 s1, [r2, #4]
; CHECK-NEXT: vins.f16 s1, s4		; CHECK-LE-NEXT: vins.f16 s1, s4
; CHECK-NEXT: lsls r1, r1, #28		; CHECK-LE-NEXT: lsls r1, r1, #28
; CHECK-NEXT: bmi .LBB19_4		; CHECK-LE-NEXT: bmi .LBB19_4
; CHECK-NEXT: b .LBB19_5		; CHECK-LE-NEXT: b .LBB19_5
		;
		; CHECK-BE-LABEL: foo_v4f32_v4f16_unaligned:
		; CHECK-BE: @ %bb.0: @ %entry
		; CHECK-BE-NEXT: .save {r7, lr}
		; CHECK-BE-NEXT: push {r7, lr}
		; CHECK-BE-NEXT: .pad #8
		; CHECK-BE-NEXT: sub sp, #8
		; CHECK-BE-NEXT: vldrh.s32 q0, [r1]
		; CHECK-BE-NEXT: vcmp.s32 gt, q0, zr
		; CHECK-BE-NEXT: @ implicit-def: $q0
		; CHECK-BE-NEXT: vmrs lr, p0
		; CHECK-BE-NEXT: ubfx r1, lr, #12, #1
		; CHECK-BE-NEXT: ubfx r3, lr, #8, #1
		; CHECK-BE-NEXT: rsb.w r12, r1, #0
		; CHECK-BE-NEXT: movs r1, #0
		; CHECK-BE-NEXT: bfi r1, r12, #0, #1
		; CHECK-BE-NEXT: rsbs r3, r3, #0
		; CHECK-BE-NEXT: bfi r1, r3, #1, #1
		; CHECK-BE-NEXT: ubfx r3, lr, #4, #1
		; CHECK-BE-NEXT: rsbs r3, r3, #0
		; CHECK-BE-NEXT: bfi r1, r3, #2, #1
		; CHECK-BE-NEXT: and r3, lr, #1
		; CHECK-BE-NEXT: rsbs r3, r3, #0
		; CHECK-BE-NEXT: bfi r1, r3, #3, #1
		; CHECK-BE-NEXT: lsls r3, r1, #31
		; CHECK-BE-NEXT: bne .LBB19_6
		; CHECK-BE-NEXT: @ %bb.1: @ %else
		; CHECK-BE-NEXT: lsls r3, r1, #30
		; CHECK-BE-NEXT: bmi .LBB19_7
		; CHECK-BE-NEXT: .LBB19_2: @ %else2
		; CHECK-BE-NEXT: lsls r3, r1, #29
		; CHECK-BE-NEXT: bmi .LBB19_8
		; CHECK-BE-NEXT: .LBB19_3: @ %else5
		; CHECK-BE-NEXT: lsls r1, r1, #28
		; CHECK-BE-NEXT: bpl .LBB19_5
		; CHECK-BE-NEXT: .LBB19_4: @ %cond.load7
		; CHECK-BE-NEXT: vmovx.f16 s4, s0
		; CHECK-BE-NEXT: vins.f16 s0, s4
		; CHECK-BE-NEXT: vldr.16 s4, [r2, #6]
		; CHECK-BE-NEXT: vins.f16 s1, s4
		; CHECK-BE-NEXT: .LBB19_5: @ %else8
		; CHECK-BE-NEXT: vmrs r2, p0
		; CHECK-BE-NEXT: movs r1, #0
		; CHECK-BE-NEXT: vcvtt.f32.f16 s7, s1
		; CHECK-BE-NEXT: vcvtb.f32.f16 s6, s1
		; CHECK-BE-NEXT: vcvtt.f32.f16 s5, s0
		; CHECK-BE-NEXT: vcvtb.f32.f16 s4, s0
		; CHECK-BE-NEXT: ubfx r3, r2, #12, #1
		; CHECK-BE-NEXT: rsbs r3, r3, #0
		; CHECK-BE-NEXT: bfi r1, r3, #0, #1
		; CHECK-BE-NEXT: ubfx r3, r2, #8, #1
		; CHECK-BE-NEXT: rsbs r3, r3, #0
		; CHECK-BE-NEXT: bfi r1, r3, #1, #1
		; CHECK-BE-NEXT: ubfx r3, r2, #4, #1
		; CHECK-BE-NEXT: and r2, r2, #1
		; CHECK-BE-NEXT: rsbs r3, r3, #0
		; CHECK-BE-NEXT: bfi r1, r3, #2, #1
		; CHECK-BE-NEXT: rsbs r2, r2, #0
		; CHECK-BE-NEXT: bfi r1, r2, #3, #1
		; CHECK-BE-NEXT: lsls r2, r1, #31
		; CHECK-BE-NEXT: itt ne
		; CHECK-BE-NEXT: vmovne r2, s4
		; CHECK-BE-NEXT: strne r2, [r0]
		; CHECK-BE-NEXT: lsls r2, r1, #30
		; CHECK-BE-NEXT: itt mi
		; CHECK-BE-NEXT: vmovmi r2, s5
		; CHECK-BE-NEXT: strmi r2, [r0, #4]
		; CHECK-BE-NEXT: lsls r2, r1, #29
		; CHECK-BE-NEXT: itt mi
		; CHECK-BE-NEXT: vmovmi r2, s6
		; CHECK-BE-NEXT: strmi r2, [r0, #8]
		; CHECK-BE-NEXT: lsls r1, r1, #28
		; CHECK-BE-NEXT: itt mi
		; CHECK-BE-NEXT: vmovmi r1, s7
		; CHECK-BE-NEXT: strmi r1, [r0, #12]
		; CHECK-BE-NEXT: add sp, #8
		; CHECK-BE-NEXT: pop {r7, pc}
		; CHECK-BE-NEXT: .LBB19_6: @ %cond.load
		; CHECK-BE-NEXT: vldr.16 s0, [r2]
		; CHECK-BE-NEXT: lsls r3, r1, #30
		; CHECK-BE-NEXT: bpl .LBB19_2
		; CHECK-BE-NEXT: .LBB19_7: @ %cond.load1
		; CHECK-BE-NEXT: vldr.16 s4, [r2, #2]
		; CHECK-BE-NEXT: vins.f16 s0, s4
		; CHECK-BE-NEXT: vmovx.f16 s4, s1
		; CHECK-BE-NEXT: vins.f16 s1, s4
		; CHECK-BE-NEXT: lsls r3, r1, #29
		; CHECK-BE-NEXT: bpl .LBB19_3
		; CHECK-BE-NEXT: .LBB19_8: @ %cond.load4
		; CHECK-BE-NEXT: vmovx.f16 s4, s0
		; CHECK-BE-NEXT: vins.f16 s0, s4
		; CHECK-BE-NEXT: vmovx.f16 s4, s1
		; CHECK-BE-NEXT: vldr.16 s1, [r2, #4]
		; CHECK-BE-NEXT: vins.f16 s1, s4
		; CHECK-BE-NEXT: lsls r1, r1, #28
		; CHECK-BE-NEXT: bmi .LBB19_4
		; CHECK-BE-NEXT: b .LBB19_5
entry:		entry:
%0 = load <4 x i16>, <4 x i16>* %mask, align 2		%0 = load <4 x i16>, <4 x i16>* %mask, align 2
%1 = icmp sgt <4 x i16> %0, zeroinitializer		%1 = icmp sgt <4 x i16> %0, zeroinitializer
%2 = call <4 x half> @llvm.masked.load.v4f16.p0v4f16(<4 x half>* %src, i32 2, <4 x i1> %1, <4 x half> undef)		%2 = call <4 x half> @llvm.masked.load.v4f16.p0v4f16(<4 x half>* %src, i32 2, <4 x i1> %1, <4 x half> undef)
%3 = fpext <4 x half> %2 to <4 x float>		%3 = fpext <4 x half> %2 to <4 x float>
call void @llvm.masked.store.v4f32.p0v4f32(<4 x float> %3, <4 x float>* %dest, i32 1, <4 x i1> %1)		call void @llvm.masked.store.v4f32.p0v4f32(<4 x float> %3, <4 x float>* %dest, i32 1, <4 x i1> %1)
ret void		ret void
}		}
Show All 21 Lines

llvm/test/CodeGen/Thumb2/mve-masked-load.ll

	Show First 20 Lines • Show All 84 Lines • ▼ Show 20 Lines
	; CHECK-BE-LABEL: masked_v4i32_align1_undef:			; CHECK-BE-LABEL: masked_v4i32_align1_undef:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: .pad #4			; CHECK-BE-NEXT: .pad #4
	; CHECK-BE-NEXT: sub sp, #4			; CHECK-BE-NEXT: sub sp, #4
	; CHECK-BE-NEXT: vrev64.32 q1, q0			; CHECK-BE-NEXT: vrev64.32 q1, q0
	; CHECK-BE-NEXT: vcmp.s32 gt, q1, zr			; CHECK-BE-NEXT: vcmp.s32 gt, q1, zr
	; CHECK-BE-NEXT: @ implicit-def: $q1			; CHECK-BE-NEXT: @ implicit-def: $q1
	; CHECK-BE-NEXT: vmrs r2, p0			; CHECK-BE-NEXT: vmrs r2, p0
	; CHECK-BE-NEXT: and r1, r2, #1			; CHECK-BE-NEXT: ubfx r1, r2, #12, #1
	; CHECK-BE-NEXT: rsbs r3, r1, #0			; CHECK-BE-NEXT: rsbs r3, r1, #0
	; CHECK-BE-NEXT: movs r1, #0			; CHECK-BE-NEXT: movs r1, #0
	; CHECK-BE-NEXT: bfi r1, r3, #0, #1			; CHECK-BE-NEXT: bfi r1, r3, #0, #1
	; CHECK-BE-NEXT: ubfx r3, r2, #4, #1			; CHECK-BE-NEXT: ubfx r3, r2, #8, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r1, r3, #1, #1			; CHECK-BE-NEXT: bfi r1, r3, #1, #1
	; CHECK-BE-NEXT: ubfx r3, r2, #8, #1			; CHECK-BE-NEXT: ubfx r3, r2, #4, #1
	; CHECK-BE-NEXT: ubfx r2, r2, #12, #1			; CHECK-BE-NEXT: and r2, r2, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r1, r3, #2, #1			; CHECK-BE-NEXT: bfi r1, r3, #2, #1
	; CHECK-BE-NEXT: rsbs r2, r2, #0			; CHECK-BE-NEXT: rsbs r2, r2, #0
	; CHECK-BE-NEXT: bfi r1, r2, #3, #1			; CHECK-BE-NEXT: bfi r1, r2, #3, #1
	; CHECK-BE-NEXT: lsls r2, r1, #31			; CHECK-BE-NEXT: lsls r2, r1, #31
	; CHECK-BE-NEXT: itt ne			; CHECK-BE-NEXT: itt ne
	; CHECK-BE-NEXT: ldrne r2, [r0]			; CHECK-BE-NEXT: ldrne r2, [r0]
	; CHECK-BE-NEXT: vmovne.32 q1[0], r2			; CHECK-BE-NEXT: vmovne.32 q1[0], r2
	▲ Show 20 Lines • Show All 126 Lines • ▼ Show 20 Lines
	; CHECK-BE-LABEL: zext16_masked_v4i32_align1_undef:			; CHECK-BE-LABEL: zext16_masked_v4i32_align1_undef:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: .pad #4			; CHECK-BE-NEXT: .pad #4
	; CHECK-BE-NEXT: sub sp, #4			; CHECK-BE-NEXT: sub sp, #4
	; CHECK-BE-NEXT: vrev64.32 q1, q0			; CHECK-BE-NEXT: vrev64.32 q1, q0
	; CHECK-BE-NEXT: @ implicit-def: $q0			; CHECK-BE-NEXT: @ implicit-def: $q0
	; CHECK-BE-NEXT: vcmp.s32 gt, q1, zr			; CHECK-BE-NEXT: vcmp.s32 gt, q1, zr
	; CHECK-BE-NEXT: vmrs r2, p0			; CHECK-BE-NEXT: vmrs r2, p0
	; CHECK-BE-NEXT: and r1, r2, #1			; CHECK-BE-NEXT: ubfx r1, r2, #12, #1
	; CHECK-BE-NEXT: rsbs r3, r1, #0			; CHECK-BE-NEXT: rsbs r3, r1, #0
	; CHECK-BE-NEXT: movs r1, #0			; CHECK-BE-NEXT: movs r1, #0
	; CHECK-BE-NEXT: bfi r1, r3, #0, #1			; CHECK-BE-NEXT: bfi r1, r3, #0, #1
	; CHECK-BE-NEXT: ubfx r3, r2, #4, #1			; CHECK-BE-NEXT: ubfx r3, r2, #8, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r1, r3, #1, #1			; CHECK-BE-NEXT: bfi r1, r3, #1, #1
	; CHECK-BE-NEXT: ubfx r3, r2, #8, #1			; CHECK-BE-NEXT: ubfx r3, r2, #4, #1
	; CHECK-BE-NEXT: ubfx r2, r2, #12, #1			; CHECK-BE-NEXT: and r2, r2, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r1, r3, #2, #1			; CHECK-BE-NEXT: bfi r1, r3, #2, #1
	; CHECK-BE-NEXT: rsbs r2, r2, #0			; CHECK-BE-NEXT: rsbs r2, r2, #0
	; CHECK-BE-NEXT: bfi r1, r2, #3, #1			; CHECK-BE-NEXT: bfi r1, r2, #3, #1
	; CHECK-BE-NEXT: lsls r2, r1, #31			; CHECK-BE-NEXT: lsls r2, r1, #31
	; CHECK-BE-NEXT: itt ne			; CHECK-BE-NEXT: itt ne
	; CHECK-BE-NEXT: ldrhne r2, [r0]			; CHECK-BE-NEXT: ldrhne r2, [r0]
	; CHECK-BE-NEXT: vmovne.32 q0[0], r2			; CHECK-BE-NEXT: vmovne.32 q0[0], r2
	▲ Show 20 Lines • Show All 133 Lines • ▼ Show 20 Lines
	; CHECK-BE-LABEL: sext16_masked_v4i32_align1_undef:			; CHECK-BE-LABEL: sext16_masked_v4i32_align1_undef:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: .pad #4			; CHECK-BE-NEXT: .pad #4
	; CHECK-BE-NEXT: sub sp, #4			; CHECK-BE-NEXT: sub sp, #4
	; CHECK-BE-NEXT: vrev64.32 q1, q0			; CHECK-BE-NEXT: vrev64.32 q1, q0
	; CHECK-BE-NEXT: @ implicit-def: $q0			; CHECK-BE-NEXT: @ implicit-def: $q0
	; CHECK-BE-NEXT: vcmp.s32 gt, q1, zr			; CHECK-BE-NEXT: vcmp.s32 gt, q1, zr
	; CHECK-BE-NEXT: vmrs r2, p0			; CHECK-BE-NEXT: vmrs r2, p0
	; CHECK-BE-NEXT: and r1, r2, #1			; CHECK-BE-NEXT: ubfx r1, r2, #12, #1
	; CHECK-BE-NEXT: rsbs r3, r1, #0			; CHECK-BE-NEXT: rsbs r3, r1, #0
	; CHECK-BE-NEXT: movs r1, #0			; CHECK-BE-NEXT: movs r1, #0
	; CHECK-BE-NEXT: bfi r1, r3, #0, #1			; CHECK-BE-NEXT: bfi r1, r3, #0, #1
	; CHECK-BE-NEXT: ubfx r3, r2, #4, #1			; CHECK-BE-NEXT: ubfx r3, r2, #8, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r1, r3, #1, #1			; CHECK-BE-NEXT: bfi r1, r3, #1, #1
	; CHECK-BE-NEXT: ubfx r3, r2, #8, #1			; CHECK-BE-NEXT: ubfx r3, r2, #4, #1
	; CHECK-BE-NEXT: ubfx r2, r2, #12, #1			; CHECK-BE-NEXT: and r2, r2, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r1, r3, #2, #1			; CHECK-BE-NEXT: bfi r1, r3, #2, #1
	; CHECK-BE-NEXT: rsbs r2, r2, #0			; CHECK-BE-NEXT: rsbs r2, r2, #0
	; CHECK-BE-NEXT: bfi r1, r2, #3, #1			; CHECK-BE-NEXT: bfi r1, r2, #3, #1
	; CHECK-BE-NEXT: lsls r2, r1, #31			; CHECK-BE-NEXT: lsls r2, r1, #31
	; CHECK-BE-NEXT: itt ne			; CHECK-BE-NEXT: itt ne
	; CHECK-BE-NEXT: ldrhne r2, [r0]			; CHECK-BE-NEXT: ldrhne r2, [r0]
	; CHECK-BE-NEXT: vmovne.32 q0[0], r2			; CHECK-BE-NEXT: vmovne.32 q0[0], r2
	▲ Show 20 Lines • Show All 207 Lines • ▼ Show 20 Lines
	; CHECK-BE-LABEL: masked_v8i16_align1_undef:			; CHECK-BE-LABEL: masked_v8i16_align1_undef:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: .pad #8			; CHECK-BE-NEXT: .pad #8
	; CHECK-BE-NEXT: sub sp, #8			; CHECK-BE-NEXT: sub sp, #8
	; CHECK-BE-NEXT: vrev64.16 q1, q0			; CHECK-BE-NEXT: vrev64.16 q1, q0
	; CHECK-BE-NEXT: vcmp.s16 gt, q1, zr			; CHECK-BE-NEXT: vcmp.s16 gt, q1, zr
	; CHECK-BE-NEXT: @ implicit-def: $q1			; CHECK-BE-NEXT: @ implicit-def: $q1
	; CHECK-BE-NEXT: vmrs r1, p0			; CHECK-BE-NEXT: vmrs r1, p0
	; CHECK-BE-NEXT: and r2, r1, #1			; CHECK-BE-NEXT: ubfx r2, r1, #14, #1
	; CHECK-BE-NEXT: rsbs r3, r2, #0			; CHECK-BE-NEXT: rsbs r3, r2, #0
	; CHECK-BE-NEXT: movs r2, #0			; CHECK-BE-NEXT: movs r2, #0
	; CHECK-BE-NEXT: bfi r2, r3, #0, #1			; CHECK-BE-NEXT: bfi r2, r3, #0, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #2, #1			; CHECK-BE-NEXT: ubfx r3, r1, #12, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #1, #1			; CHECK-BE-NEXT: bfi r2, r3, #1, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #4, #1			; CHECK-BE-NEXT: ubfx r3, r1, #10, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #2, #1			; CHECK-BE-NEXT: bfi r2, r3, #2, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #6, #1			; CHECK-BE-NEXT: ubfx r3, r1, #8, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #3, #1			; CHECK-BE-NEXT: bfi r2, r3, #3, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #8, #1			; CHECK-BE-NEXT: ubfx r3, r1, #6, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #4, #1			; CHECK-BE-NEXT: bfi r2, r3, #4, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #10, #1			; CHECK-BE-NEXT: ubfx r3, r1, #4, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #5, #1			; CHECK-BE-NEXT: bfi r2, r3, #5, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #12, #1			; CHECK-BE-NEXT: ubfx r3, r1, #2, #1
	; CHECK-BE-NEXT: ubfx r1, r1, #14, #1			; CHECK-BE-NEXT: and r1, r1, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #6, #1			; CHECK-BE-NEXT: bfi r2, r3, #6, #1
	; CHECK-BE-NEXT: rsbs r1, r1, #0			; CHECK-BE-NEXT: rsbs r1, r1, #0
	; CHECK-BE-NEXT: bfi r2, r1, #7, #1			; CHECK-BE-NEXT: bfi r2, r1, #7, #1
	; CHECK-BE-NEXT: uxtb r1, r2			; CHECK-BE-NEXT: uxtb r1, r2
	; CHECK-BE-NEXT: lsls r2, r2, #31			; CHECK-BE-NEXT: lsls r2, r2, #31
	; CHECK-BE-NEXT: itt ne			; CHECK-BE-NEXT: itt ne
	; CHECK-BE-NEXT: ldrhne r2, [r0]			; CHECK-BE-NEXT: ldrhne r2, [r0]
	▲ Show 20 Lines • Show All 610 Lines • ▼ Show 20 Lines
	; CHECK-BE-LABEL: masked_v4f32_align1_undef:			; CHECK-BE-LABEL: masked_v4f32_align1_undef:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: .pad #4			; CHECK-BE-NEXT: .pad #4
	; CHECK-BE-NEXT: sub sp, #4			; CHECK-BE-NEXT: sub sp, #4
	; CHECK-BE-NEXT: vrev64.32 q1, q0			; CHECK-BE-NEXT: vrev64.32 q1, q0
	; CHECK-BE-NEXT: vcmp.s32 gt, q1, zr			; CHECK-BE-NEXT: vcmp.s32 gt, q1, zr
	; CHECK-BE-NEXT: @ implicit-def: $q1			; CHECK-BE-NEXT: @ implicit-def: $q1
	; CHECK-BE-NEXT: vmrs r2, p0			; CHECK-BE-NEXT: vmrs r2, p0
	; CHECK-BE-NEXT: and r1, r2, #1			; CHECK-BE-NEXT: ubfx r1, r2, #12, #1
	; CHECK-BE-NEXT: rsbs r3, r1, #0			; CHECK-BE-NEXT: rsbs r3, r1, #0
	; CHECK-BE-NEXT: movs r1, #0			; CHECK-BE-NEXT: movs r1, #0
	; CHECK-BE-NEXT: bfi r1, r3, #0, #1			; CHECK-BE-NEXT: bfi r1, r3, #0, #1
	; CHECK-BE-NEXT: ubfx r3, r2, #4, #1			; CHECK-BE-NEXT: ubfx r3, r2, #8, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r1, r3, #1, #1			; CHECK-BE-NEXT: bfi r1, r3, #1, #1
	; CHECK-BE-NEXT: ubfx r3, r2, #8, #1			; CHECK-BE-NEXT: ubfx r3, r2, #4, #1
	; CHECK-BE-NEXT: ubfx r2, r2, #12, #1			; CHECK-BE-NEXT: and r2, r2, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r1, r3, #2, #1			; CHECK-BE-NEXT: bfi r1, r3, #2, #1
	; CHECK-BE-NEXT: rsbs r2, r2, #0			; CHECK-BE-NEXT: rsbs r2, r2, #0
	; CHECK-BE-NEXT: bfi r1, r2, #3, #1			; CHECK-BE-NEXT: bfi r1, r2, #3, #1
	; CHECK-BE-NEXT: lsls r2, r1, #31			; CHECK-BE-NEXT: lsls r2, r1, #31
	; CHECK-BE-NEXT: itt ne			; CHECK-BE-NEXT: itt ne
	; CHECK-BE-NEXT: ldrne r2, [r0]			; CHECK-BE-NEXT: ldrne r2, [r0]
	; CHECK-BE-NEXT: vmovne s4, r2			; CHECK-BE-NEXT: vmovne s4, r2
	▲ Show 20 Lines • Show All 258 Lines • ▼ Show 20 Lines
	; CHECK-BE-LABEL: masked_v8f16_align1_undef:			; CHECK-BE-LABEL: masked_v8f16_align1_undef:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: .pad #40			; CHECK-BE-NEXT: .pad #40
	; CHECK-BE-NEXT: sub sp, #40			; CHECK-BE-NEXT: sub sp, #40
	; CHECK-BE-NEXT: vrev64.16 q1, q0			; CHECK-BE-NEXT: vrev64.16 q1, q0
	; CHECK-BE-NEXT: vcmp.s16 gt, q1, zr			; CHECK-BE-NEXT: vcmp.s16 gt, q1, zr
	; CHECK-BE-NEXT: @ implicit-def: $q1			; CHECK-BE-NEXT: @ implicit-def: $q1
	; CHECK-BE-NEXT: vmrs r1, p0			; CHECK-BE-NEXT: vmrs r1, p0
	; CHECK-BE-NEXT: and r2, r1, #1			; CHECK-BE-NEXT: ubfx r2, r1, #14, #1
	; CHECK-BE-NEXT: rsbs r3, r2, #0			; CHECK-BE-NEXT: rsbs r3, r2, #0
	; CHECK-BE-NEXT: movs r2, #0			; CHECK-BE-NEXT: movs r2, #0
	; CHECK-BE-NEXT: bfi r2, r3, #0, #1			; CHECK-BE-NEXT: bfi r2, r3, #0, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #2, #1			; CHECK-BE-NEXT: ubfx r3, r1, #12, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #1, #1			; CHECK-BE-NEXT: bfi r2, r3, #1, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #4, #1			; CHECK-BE-NEXT: ubfx r3, r1, #10, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #2, #1			; CHECK-BE-NEXT: bfi r2, r3, #2, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #6, #1			; CHECK-BE-NEXT: ubfx r3, r1, #8, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #3, #1			; CHECK-BE-NEXT: bfi r2, r3, #3, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #8, #1			; CHECK-BE-NEXT: ubfx r3, r1, #6, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #4, #1			; CHECK-BE-NEXT: bfi r2, r3, #4, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #10, #1			; CHECK-BE-NEXT: ubfx r3, r1, #4, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #5, #1			; CHECK-BE-NEXT: bfi r2, r3, #5, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #12, #1			; CHECK-BE-NEXT: ubfx r3, r1, #2, #1
	; CHECK-BE-NEXT: ubfx r1, r1, #14, #1			; CHECK-BE-NEXT: and r1, r1, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #6, #1			; CHECK-BE-NEXT: bfi r2, r3, #6, #1
	; CHECK-BE-NEXT: rsbs r1, r1, #0			; CHECK-BE-NEXT: rsbs r1, r1, #0
	; CHECK-BE-NEXT: bfi r2, r1, #7, #1			; CHECK-BE-NEXT: bfi r2, r1, #7, #1
	; CHECK-BE-NEXT: uxtb r1, r2			; CHECK-BE-NEXT: uxtb r1, r2
	; CHECK-BE-NEXT: lsls r2, r2, #31			; CHECK-BE-NEXT: lsls r2, r2, #31
	; CHECK-BE-NEXT: bne .LBB45_10			; CHECK-BE-NEXT: bne .LBB45_10
	; CHECK-BE-NEXT: @ %bb.1: @ %else			; CHECK-BE-NEXT: @ %bb.1: @ %else
	▲ Show 20 Lines • Show All 417 Lines • ▼ Show 20 Lines
	; CHECK-BE-LABEL: anyext_v4i16_align1:			; CHECK-BE-LABEL: anyext_v4i16_align1:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: .pad #4			; CHECK-BE-NEXT: .pad #4
	; CHECK-BE-NEXT: sub sp, #4			; CHECK-BE-NEXT: sub sp, #4
	; CHECK-BE-NEXT: vrev64.32 q1, q0			; CHECK-BE-NEXT: vrev64.32 q1, q0
	; CHECK-BE-NEXT: mov.w r12, #0			; CHECK-BE-NEXT: mov.w r12, #0
	; CHECK-BE-NEXT: vcmp.s32 gt, q1, zr			; CHECK-BE-NEXT: vcmp.s32 gt, q1, zr
	; CHECK-BE-NEXT: vmrs r3, p0			; CHECK-BE-NEXT: vmrs r3, p0
	; CHECK-BE-NEXT: and r1, r3, #1			; CHECK-BE-NEXT: ubfx r1, r3, #12, #1
	; CHECK-BE-NEXT: rsbs r2, r1, #0			; CHECK-BE-NEXT: rsbs r2, r1, #0
	; CHECK-BE-NEXT: movs r1, #0			; CHECK-BE-NEXT: movs r1, #0
	; CHECK-BE-NEXT: bfi r1, r2, #0, #1			; CHECK-BE-NEXT: bfi r1, r2, #0, #1
	; CHECK-BE-NEXT: ubfx r2, r3, #4, #1			; CHECK-BE-NEXT: ubfx r2, r3, #8, #1
	; CHECK-BE-NEXT: rsbs r2, r2, #0			; CHECK-BE-NEXT: rsbs r2, r2, #0
	; CHECK-BE-NEXT: bfi r1, r2, #1, #1			; CHECK-BE-NEXT: bfi r1, r2, #1, #1
	; CHECK-BE-NEXT: ubfx r2, r3, #8, #1			; CHECK-BE-NEXT: ubfx r2, r3, #4, #1
	; CHECK-BE-NEXT: rsbs r2, r2, #0			; CHECK-BE-NEXT: rsbs r2, r2, #0
	; CHECK-BE-NEXT: bfi r1, r2, #2, #1			; CHECK-BE-NEXT: bfi r1, r2, #2, #1
	; CHECK-BE-NEXT: ubfx r2, r3, #12, #1			; CHECK-BE-NEXT: and r2, r3, #1
	; CHECK-BE-NEXT: rsbs r2, r2, #0			; CHECK-BE-NEXT: rsbs r2, r2, #0
	; CHECK-BE-NEXT: bfi r1, r2, #3, #1			; CHECK-BE-NEXT: bfi r1, r2, #3, #1
	; CHECK-BE-NEXT: lsls r2, r1, #31			; CHECK-BE-NEXT: lsls r2, r1, #31
	; CHECK-BE-NEXT: beq .LBB52_2			; CHECK-BE-NEXT: beq .LBB52_2
	; CHECK-BE-NEXT: @ %bb.1: @ %cond.load			; CHECK-BE-NEXT: @ %bb.1: @ %cond.load
	; CHECK-BE-NEXT: ldrh r2, [r0]			; CHECK-BE-NEXT: ldrh r2, [r0]
	; CHECK-BE-NEXT: vdup.32 q1, r12			; CHECK-BE-NEXT: vdup.32 q1, r12
	; CHECK-BE-NEXT: vmov.32 q1[0], r2			; CHECK-BE-NEXT: vmov.32 q1[0], r2
	▲ Show 20 Lines • Show All 158 Lines • Show Last 20 Lines

llvm/test/CodeGen/Thumb2/mve-masked-store.ll

	Show First 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	;			;
	; CHECK-BE-LABEL: masked_v4i32_align1:			; CHECK-BE-LABEL: masked_v4i32_align1:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: .pad #4			; CHECK-BE-NEXT: .pad #4
	; CHECK-BE-NEXT: sub sp, #4			; CHECK-BE-NEXT: sub sp, #4
	; CHECK-BE-NEXT: vrev64.32 q1, q0			; CHECK-BE-NEXT: vrev64.32 q1, q0
	; CHECK-BE-NEXT: vcmp.s32 gt, q1, zr			; CHECK-BE-NEXT: vcmp.s32 gt, q1, zr
	; CHECK-BE-NEXT: vmrs r2, p0			; CHECK-BE-NEXT: vmrs r2, p0
	; CHECK-BE-NEXT: and r1, r2, #1			; CHECK-BE-NEXT: ubfx r1, r2, #12, #1
	; CHECK-BE-NEXT: rsbs r3, r1, #0			; CHECK-BE-NEXT: rsbs r3, r1, #0
	; CHECK-BE-NEXT: movs r1, #0			; CHECK-BE-NEXT: movs r1, #0
	; CHECK-BE-NEXT: bfi r1, r3, #0, #1			; CHECK-BE-NEXT: bfi r1, r3, #0, #1
	; CHECK-BE-NEXT: ubfx r3, r2, #4, #1			; CHECK-BE-NEXT: ubfx r3, r2, #8, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r1, r3, #1, #1			; CHECK-BE-NEXT: bfi r1, r3, #1, #1
	; CHECK-BE-NEXT: ubfx r3, r2, #8, #1			; CHECK-BE-NEXT: ubfx r3, r2, #4, #1
	; CHECK-BE-NEXT: ubfx r2, r2, #12, #1			; CHECK-BE-NEXT: and r2, r2, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r1, r3, #2, #1			; CHECK-BE-NEXT: bfi r1, r3, #2, #1
	; CHECK-BE-NEXT: rsbs r2, r2, #0			; CHECK-BE-NEXT: rsbs r2, r2, #0
	; CHECK-BE-NEXT: bfi r1, r2, #3, #1			; CHECK-BE-NEXT: bfi r1, r2, #3, #1
	; CHECK-BE-NEXT: lsls r2, r1, #31			; CHECK-BE-NEXT: lsls r2, r1, #31
	; CHECK-BE-NEXT: itt ne			; CHECK-BE-NEXT: itt ne
	; CHECK-BE-NEXT: vmovne r2, s4			; CHECK-BE-NEXT: vmovne r2, s4
	; CHECK-BE-NEXT: strne r2, [r0]			; CHECK-BE-NEXT: strne r2, [r0]
	▲ Show 20 Lines • Show All 165 Lines • ▼ Show 20 Lines
	;			;
	; CHECK-BE-LABEL: masked_v8i16_align1:			; CHECK-BE-LABEL: masked_v8i16_align1:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: .pad #8			; CHECK-BE-NEXT: .pad #8
	; CHECK-BE-NEXT: sub sp, #8			; CHECK-BE-NEXT: sub sp, #8
	; CHECK-BE-NEXT: vrev64.16 q1, q0			; CHECK-BE-NEXT: vrev64.16 q1, q0
	; CHECK-BE-NEXT: vcmp.s16 gt, q1, zr			; CHECK-BE-NEXT: vcmp.s16 gt, q1, zr
	; CHECK-BE-NEXT: vmrs r1, p0			; CHECK-BE-NEXT: vmrs r1, p0
	; CHECK-BE-NEXT: and r2, r1, #1			; CHECK-BE-NEXT: ubfx r2, r1, #14, #1
	; CHECK-BE-NEXT: rsbs r3, r2, #0			; CHECK-BE-NEXT: rsbs r3, r2, #0
	; CHECK-BE-NEXT: movs r2, #0			; CHECK-BE-NEXT: movs r2, #0
	; CHECK-BE-NEXT: bfi r2, r3, #0, #1			; CHECK-BE-NEXT: bfi r2, r3, #0, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #2, #1			; CHECK-BE-NEXT: ubfx r3, r1, #12, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #1, #1			; CHECK-BE-NEXT: bfi r2, r3, #1, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #4, #1			; CHECK-BE-NEXT: ubfx r3, r1, #10, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #2, #1			; CHECK-BE-NEXT: bfi r2, r3, #2, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #6, #1			; CHECK-BE-NEXT: ubfx r3, r1, #8, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #3, #1			; CHECK-BE-NEXT: bfi r2, r3, #3, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #8, #1			; CHECK-BE-NEXT: ubfx r3, r1, #6, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #4, #1			; CHECK-BE-NEXT: bfi r2, r3, #4, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #10, #1			; CHECK-BE-NEXT: ubfx r3, r1, #4, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #5, #1			; CHECK-BE-NEXT: bfi r2, r3, #5, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #12, #1			; CHECK-BE-NEXT: ubfx r3, r1, #2, #1
	; CHECK-BE-NEXT: ubfx r1, r1, #14, #1			; CHECK-BE-NEXT: and r1, r1, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #6, #1			; CHECK-BE-NEXT: bfi r2, r3, #6, #1
	; CHECK-BE-NEXT: rsbs r1, r1, #0			; CHECK-BE-NEXT: rsbs r1, r1, #0
	; CHECK-BE-NEXT: bfi r2, r1, #7, #1			; CHECK-BE-NEXT: bfi r2, r1, #7, #1
	; CHECK-BE-NEXT: uxtb r1, r2			; CHECK-BE-NEXT: uxtb r1, r2
	; CHECK-BE-NEXT: lsls r2, r2, #31			; CHECK-BE-NEXT: lsls r2, r2, #31
	; CHECK-BE-NEXT: itt ne			; CHECK-BE-NEXT: itt ne
	; CHECK-BE-NEXT: vmovne.u16 r2, q1[0]			; CHECK-BE-NEXT: vmovne.u16 r2, q1[0]
	▲ Show 20 Lines • Show All 234 Lines • ▼ Show 20 Lines
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: .pad #4			; CHECK-BE-NEXT: .pad #4
	; CHECK-BE-NEXT: sub sp, #4			; CHECK-BE-NEXT: sub sp, #4
	; CHECK-BE-NEXT: vrev64.32 q2, q1			; CHECK-BE-NEXT: vrev64.32 q2, q1
	; CHECK-BE-NEXT: movs r1, #0			; CHECK-BE-NEXT: movs r1, #0
	; CHECK-BE-NEXT: vcmp.i32 ne, q2, zr			; CHECK-BE-NEXT: vcmp.i32 ne, q2, zr
	; CHECK-BE-NEXT: vrev64.32 q1, q0			; CHECK-BE-NEXT: vrev64.32 q1, q0
	; CHECK-BE-NEXT: vmrs r2, p0			; CHECK-BE-NEXT: vmrs r2, p0
	; CHECK-BE-NEXT: and r3, r2, #1			; CHECK-BE-NEXT: ubfx r3, r2, #12, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r1, r3, #0, #1			; CHECK-BE-NEXT: bfi r1, r3, #0, #1
	; CHECK-BE-NEXT: ubfx r3, r2, #4, #1			; CHECK-BE-NEXT: ubfx r3, r2, #8, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r1, r3, #1, #1			; CHECK-BE-NEXT: bfi r1, r3, #1, #1
	; CHECK-BE-NEXT: ubfx r3, r2, #8, #1			; CHECK-BE-NEXT: ubfx r3, r2, #4, #1
	; CHECK-BE-NEXT: ubfx r2, r2, #12, #1			; CHECK-BE-NEXT: and r2, r2, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r1, r3, #2, #1			; CHECK-BE-NEXT: bfi r1, r3, #2, #1
	; CHECK-BE-NEXT: rsbs r2, r2, #0			; CHECK-BE-NEXT: rsbs r2, r2, #0
	; CHECK-BE-NEXT: bfi r1, r2, #3, #1			; CHECK-BE-NEXT: bfi r1, r2, #3, #1
	; CHECK-BE-NEXT: lsls r2, r1, #31			; CHECK-BE-NEXT: lsls r2, r1, #31
	; CHECK-BE-NEXT: itt ne			; CHECK-BE-NEXT: itt ne
	; CHECK-BE-NEXT: vmovne r2, s4			; CHECK-BE-NEXT: vmovne r2, s4
	; CHECK-BE-NEXT: strne r2, [r0]			; CHECK-BE-NEXT: strne r2, [r0]
	▲ Show 20 Lines • Show All 211 Lines • ▼ Show 20 Lines
	; CHECK-BE-LABEL: masked_v8f16_align1:			; CHECK-BE-LABEL: masked_v8f16_align1:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: .pad #40			; CHECK-BE-NEXT: .pad #40
	; CHECK-BE-NEXT: sub sp, #40			; CHECK-BE-NEXT: sub sp, #40
	; CHECK-BE-NEXT: vrev64.16 q2, q1			; CHECK-BE-NEXT: vrev64.16 q2, q1
	; CHECK-BE-NEXT: vrev64.16 q1, q0			; CHECK-BE-NEXT: vrev64.16 q1, q0
	; CHECK-BE-NEXT: vcmp.i16 ne, q2, zr			; CHECK-BE-NEXT: vcmp.i16 ne, q2, zr
	; CHECK-BE-NEXT: vmrs r1, p0			; CHECK-BE-NEXT: vmrs r1, p0
	; CHECK-BE-NEXT: and r2, r1, #1			; CHECK-BE-NEXT: ubfx r2, r1, #14, #1
	; CHECK-BE-NEXT: rsbs r3, r2, #0			; CHECK-BE-NEXT: rsbs r3, r2, #0
	; CHECK-BE-NEXT: movs r2, #0			; CHECK-BE-NEXT: movs r2, #0
	; CHECK-BE-NEXT: bfi r2, r3, #0, #1			; CHECK-BE-NEXT: bfi r2, r3, #0, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #2, #1			; CHECK-BE-NEXT: ubfx r3, r1, #12, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #1, #1			; CHECK-BE-NEXT: bfi r2, r3, #1, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #4, #1			; CHECK-BE-NEXT: ubfx r3, r1, #10, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #2, #1			; CHECK-BE-NEXT: bfi r2, r3, #2, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #6, #1			; CHECK-BE-NEXT: ubfx r3, r1, #8, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #3, #1			; CHECK-BE-NEXT: bfi r2, r3, #3, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #8, #1			; CHECK-BE-NEXT: ubfx r3, r1, #6, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #4, #1			; CHECK-BE-NEXT: bfi r2, r3, #4, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #10, #1			; CHECK-BE-NEXT: ubfx r3, r1, #4, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #5, #1			; CHECK-BE-NEXT: bfi r2, r3, #5, #1
	; CHECK-BE-NEXT: ubfx r3, r1, #12, #1			; CHECK-BE-NEXT: ubfx r3, r1, #2, #1
	; CHECK-BE-NEXT: ubfx r1, r1, #14, #1			; CHECK-BE-NEXT: and r1, r1, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r2, r3, #6, #1			; CHECK-BE-NEXT: bfi r2, r3, #6, #1
	; CHECK-BE-NEXT: rsbs r1, r1, #0			; CHECK-BE-NEXT: rsbs r1, r1, #0
	; CHECK-BE-NEXT: bfi r2, r1, #7, #1			; CHECK-BE-NEXT: bfi r2, r1, #7, #1
	; CHECK-BE-NEXT: uxtb r1, r2			; CHECK-BE-NEXT: uxtb r1, r2
	; CHECK-BE-NEXT: lsls r2, r2, #31			; CHECK-BE-NEXT: lsls r2, r2, #31
	; CHECK-BE-NEXT: bne .LBB16_9			; CHECK-BE-NEXT: bne .LBB16_9
	; CHECK-BE-NEXT: @ %bb.1: @ %else			; CHECK-BE-NEXT: @ %bb.1: @ %else
	▲ Show 20 Lines • Show All 380 Lines • ▼ Show 20 Lines
	;			;
	; CHECK-BE-LABEL: masked_v4i16_align1:			; CHECK-BE-LABEL: masked_v4i16_align1:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: .pad #4			; CHECK-BE-NEXT: .pad #4
	; CHECK-BE-NEXT: sub sp, #4			; CHECK-BE-NEXT: sub sp, #4
	; CHECK-BE-NEXT: vrev64.32 q1, q0			; CHECK-BE-NEXT: vrev64.32 q1, q0
	; CHECK-BE-NEXT: vcmp.s32 gt, q1, zr			; CHECK-BE-NEXT: vcmp.s32 gt, q1, zr
	; CHECK-BE-NEXT: vmrs r2, p0			; CHECK-BE-NEXT: vmrs r2, p0
	; CHECK-BE-NEXT: and r1, r2, #1			; CHECK-BE-NEXT: ubfx r1, r2, #12, #1
	; CHECK-BE-NEXT: rsbs r3, r1, #0			; CHECK-BE-NEXT: rsbs r3, r1, #0
	; CHECK-BE-NEXT: movs r1, #0			; CHECK-BE-NEXT: movs r1, #0
	; CHECK-BE-NEXT: bfi r1, r3, #0, #1			; CHECK-BE-NEXT: bfi r1, r3, #0, #1
	; CHECK-BE-NEXT: ubfx r3, r2, #4, #1			; CHECK-BE-NEXT: ubfx r3, r2, #8, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r1, r3, #1, #1			; CHECK-BE-NEXT: bfi r1, r3, #1, #1
	; CHECK-BE-NEXT: ubfx r3, r2, #8, #1			; CHECK-BE-NEXT: ubfx r3, r2, #4, #1
	; CHECK-BE-NEXT: ubfx r2, r2, #12, #1			; CHECK-BE-NEXT: and r2, r2, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r1, r3, #2, #1			; CHECK-BE-NEXT: bfi r1, r3, #2, #1
	; CHECK-BE-NEXT: rsbs r2, r2, #0			; CHECK-BE-NEXT: rsbs r2, r2, #0
	; CHECK-BE-NEXT: bfi r1, r2, #3, #1			; CHECK-BE-NEXT: bfi r1, r2, #3, #1
	; CHECK-BE-NEXT: lsls r2, r1, #31			; CHECK-BE-NEXT: lsls r2, r1, #31
	; CHECK-BE-NEXT: itt ne			; CHECK-BE-NEXT: itt ne
	; CHECK-BE-NEXT: vmovne r2, s4			; CHECK-BE-NEXT: vmovne r2, s4
	; CHECK-BE-NEXT: strhne r2, [r0]			; CHECK-BE-NEXT: strhne r2, [r0]
	▲ Show 20 Lines • Show All 102 Lines • ▼ Show 20 Lines
	; CHECK-LE-NEXT: bx lr			; CHECK-LE-NEXT: bx lr
	;			;
	; CHECK-BE-LABEL: masked_v4f16_align4:			; CHECK-BE-LABEL: masked_v4f16_align4:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: .pad #4			; CHECK-BE-NEXT: .pad #4
	; CHECK-BE-NEXT: sub sp, #4			; CHECK-BE-NEXT: sub sp, #4
	; CHECK-BE-NEXT: vrev64.32 q1, q0			; CHECK-BE-NEXT: vrev64.32 q1, q0
	; CHECK-BE-NEXT: movs r1, #0			; CHECK-BE-NEXT: movs r1, #0
	; CHECK-BE-NEXT: vcmp.f32 s4, #0			; CHECK-BE-NEXT: vcmp.f32 s7, #0
	; CHECK-BE-NEXT: movs r2, #0			; CHECK-BE-NEXT: movs r2, #0
	; CHECK-BE-NEXT: vmrs APSR_nzcv, fpscr			; CHECK-BE-NEXT: vmrs APSR_nzcv, fpscr
	; CHECK-BE-NEXT: it gt			; CHECK-BE-NEXT: it gt
	; CHECK-BE-NEXT: movgt r1, #1			; CHECK-BE-NEXT: movgt r1, #1
	; CHECK-BE-NEXT: cmp r1, #0			; CHECK-BE-NEXT: cmp r1, #0
	; CHECK-BE-NEXT: vcmp.f32 s5, #0			; CHECK-BE-NEXT: vcmp.f32 s6, #0
	; CHECK-BE-NEXT: cset r1, ne			; CHECK-BE-NEXT: cset r1, ne
	; CHECK-BE-NEXT: vmrs APSR_nzcv, fpscr			; CHECK-BE-NEXT: vmrs APSR_nzcv, fpscr
	; CHECK-BE-NEXT: and r1, r1, #1			; CHECK-BE-NEXT: and r1, r1, #1
	; CHECK-BE-NEXT: vcmp.f32 s6, #0			; CHECK-BE-NEXT: vcmp.f32 s5, #0
	; CHECK-BE-NEXT: rsb.w r3, r1, #0			; CHECK-BE-NEXT: rsb.w r3, r1, #0
	; CHECK-BE-NEXT: mov.w r1, #0			; CHECK-BE-NEXT: mov.w r1, #0
	; CHECK-BE-NEXT: bfi r1, r3, #0, #1			; CHECK-BE-NEXT: bfi r1, r3, #0, #1
	; CHECK-BE-NEXT: mov.w r3, #0			; CHECK-BE-NEXT: mov.w r3, #0
	; CHECK-BE-NEXT: it gt			; CHECK-BE-NEXT: it gt
	; CHECK-BE-NEXT: movgt r3, #1			; CHECK-BE-NEXT: movgt r3, #1
	; CHECK-BE-NEXT: cmp r3, #0			; CHECK-BE-NEXT: cmp r3, #0
	; CHECK-BE-NEXT: cset r3, ne			; CHECK-BE-NEXT: cset r3, ne
	; CHECK-BE-NEXT: vmrs APSR_nzcv, fpscr			; CHECK-BE-NEXT: vmrs APSR_nzcv, fpscr
	; CHECK-BE-NEXT: and r3, r3, #1			; CHECK-BE-NEXT: and r3, r3, #1
	; CHECK-BE-NEXT: vcmp.f32 s7, #0			; CHECK-BE-NEXT: vcmp.f32 s4, #0
	; CHECK-BE-NEXT: rsb.w r3, r3, #0			; CHECK-BE-NEXT: rsb.w r3, r3, #0
	; CHECK-BE-NEXT: vcvtb.f16.f32 s0, s4			; CHECK-BE-NEXT: vcvtb.f16.f32 s0, s4
	; CHECK-BE-NEXT: bfi r1, r3, #1, #1			; CHECK-BE-NEXT: bfi r1, r3, #1, #1
	; CHECK-BE-NEXT: mov.w r3, #0			; CHECK-BE-NEXT: mov.w r3, #0
	; CHECK-BE-NEXT: it gt			; CHECK-BE-NEXT: it gt
	; CHECK-BE-NEXT: movgt r3, #1			; CHECK-BE-NEXT: movgt r3, #1
	; CHECK-BE-NEXT: cmp r3, #0			; CHECK-BE-NEXT: cmp r3, #0
	; CHECK-BE-NEXT: cset r3, ne			; CHECK-BE-NEXT: cset r3, ne
	▲ Show 20 Lines • Show All 134 Lines • ▼ Show 20 Lines
	; CHECK-LE-NEXT: bx lr			; CHECK-LE-NEXT: bx lr
	;			;
	; CHECK-BE-LABEL: masked_v4f16_align2:			; CHECK-BE-LABEL: masked_v4f16_align2:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: .pad #4			; CHECK-BE-NEXT: .pad #4
	; CHECK-BE-NEXT: sub sp, #4			; CHECK-BE-NEXT: sub sp, #4
	; CHECK-BE-NEXT: vrev64.32 q1, q0			; CHECK-BE-NEXT: vrev64.32 q1, q0
	; CHECK-BE-NEXT: movs r1, #0			; CHECK-BE-NEXT: movs r1, #0
	; CHECK-BE-NEXT: vcmp.f32 s4, #0			; CHECK-BE-NEXT: vcmp.f32 s7, #0
	; CHECK-BE-NEXT: movs r2, #0			; CHECK-BE-NEXT: movs r2, #0
	; CHECK-BE-NEXT: vmrs APSR_nzcv, fpscr			; CHECK-BE-NEXT: vmrs APSR_nzcv, fpscr
	; CHECK-BE-NEXT: it gt			; CHECK-BE-NEXT: it gt
	; CHECK-BE-NEXT: movgt r1, #1			; CHECK-BE-NEXT: movgt r1, #1
	; CHECK-BE-NEXT: cmp r1, #0			; CHECK-BE-NEXT: cmp r1, #0
	; CHECK-BE-NEXT: vcmp.f32 s5, #0			; CHECK-BE-NEXT: vcmp.f32 s6, #0
	; CHECK-BE-NEXT: cset r1, ne			; CHECK-BE-NEXT: cset r1, ne
	; CHECK-BE-NEXT: vmrs APSR_nzcv, fpscr			; CHECK-BE-NEXT: vmrs APSR_nzcv, fpscr
	; CHECK-BE-NEXT: and r1, r1, #1			; CHECK-BE-NEXT: and r1, r1, #1
	; CHECK-BE-NEXT: vcmp.f32 s6, #0			; CHECK-BE-NEXT: vcmp.f32 s5, #0
	; CHECK-BE-NEXT: rsb.w r3, r1, #0			; CHECK-BE-NEXT: rsb.w r3, r1, #0
	; CHECK-BE-NEXT: mov.w r1, #0			; CHECK-BE-NEXT: mov.w r1, #0
	; CHECK-BE-NEXT: bfi r1, r3, #0, #1			; CHECK-BE-NEXT: bfi r1, r3, #0, #1
	; CHECK-BE-NEXT: mov.w r3, #0			; CHECK-BE-NEXT: mov.w r3, #0
	; CHECK-BE-NEXT: it gt			; CHECK-BE-NEXT: it gt
	; CHECK-BE-NEXT: movgt r3, #1			; CHECK-BE-NEXT: movgt r3, #1
	; CHECK-BE-NEXT: cmp r3, #0			; CHECK-BE-NEXT: cmp r3, #0
	; CHECK-BE-NEXT: cset r3, ne			; CHECK-BE-NEXT: cset r3, ne
	; CHECK-BE-NEXT: vmrs APSR_nzcv, fpscr			; CHECK-BE-NEXT: vmrs APSR_nzcv, fpscr
	; CHECK-BE-NEXT: and r3, r3, #1			; CHECK-BE-NEXT: and r3, r3, #1
	; CHECK-BE-NEXT: vcmp.f32 s7, #0			; CHECK-BE-NEXT: vcmp.f32 s4, #0
	; CHECK-BE-NEXT: rsb.w r3, r3, #0			; CHECK-BE-NEXT: rsb.w r3, r3, #0
	; CHECK-BE-NEXT: vcvtb.f16.f32 s0, s4			; CHECK-BE-NEXT: vcvtb.f16.f32 s0, s4
	; CHECK-BE-NEXT: bfi r1, r3, #1, #1			; CHECK-BE-NEXT: bfi r1, r3, #1, #1
	; CHECK-BE-NEXT: mov.w r3, #0			; CHECK-BE-NEXT: mov.w r3, #0
	; CHECK-BE-NEXT: it gt			; CHECK-BE-NEXT: it gt
	; CHECK-BE-NEXT: movgt r3, #1			; CHECK-BE-NEXT: movgt r3, #1
	; CHECK-BE-NEXT: cmp r3, #0			; CHECK-BE-NEXT: cmp r3, #0
	; CHECK-BE-NEXT: cset r3, ne			; CHECK-BE-NEXT: cset r3, ne
	▲ Show 20 Lines • Show All 142 Lines • ▼ Show 20 Lines
	; CHECK-LE-NEXT: bx lr			; CHECK-LE-NEXT: bx lr
	;			;
	; CHECK-BE-LABEL: masked_v4f16_align1:			; CHECK-BE-LABEL: masked_v4f16_align1:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: .pad #20			; CHECK-BE-NEXT: .pad #20
	; CHECK-BE-NEXT: sub sp, #20			; CHECK-BE-NEXT: sub sp, #20
	; CHECK-BE-NEXT: vrev64.32 q1, q0			; CHECK-BE-NEXT: vrev64.32 q1, q0
	; CHECK-BE-NEXT: movs r1, #0			; CHECK-BE-NEXT: movs r1, #0
	; CHECK-BE-NEXT: vcmp.f32 s4, #0			; CHECK-BE-NEXT: vcmp.f32 s7, #0
	; CHECK-BE-NEXT: movs r2, #0			; CHECK-BE-NEXT: movs r2, #0
	; CHECK-BE-NEXT: vmrs APSR_nzcv, fpscr			; CHECK-BE-NEXT: vmrs APSR_nzcv, fpscr
	; CHECK-BE-NEXT: it gt			; CHECK-BE-NEXT: it gt
	; CHECK-BE-NEXT: movgt r1, #1			; CHECK-BE-NEXT: movgt r1, #1
	; CHECK-BE-NEXT: cmp r1, #0			; CHECK-BE-NEXT: cmp r1, #0
	; CHECK-BE-NEXT: vcmp.f32 s5, #0			; CHECK-BE-NEXT: vcmp.f32 s6, #0
	; CHECK-BE-NEXT: cset r1, ne			; CHECK-BE-NEXT: cset r1, ne
	; CHECK-BE-NEXT: vmrs APSR_nzcv, fpscr			; CHECK-BE-NEXT: vmrs APSR_nzcv, fpscr
	; CHECK-BE-NEXT: and r1, r1, #1			; CHECK-BE-NEXT: and r1, r1, #1
	; CHECK-BE-NEXT: vcmp.f32 s6, #0			; CHECK-BE-NEXT: vcmp.f32 s5, #0
	; CHECK-BE-NEXT: rsb.w r3, r1, #0			; CHECK-BE-NEXT: rsb.w r3, r1, #0
	; CHECK-BE-NEXT: mov.w r1, #0			; CHECK-BE-NEXT: mov.w r1, #0
	; CHECK-BE-NEXT: bfi r1, r3, #0, #1			; CHECK-BE-NEXT: bfi r1, r3, #0, #1
	; CHECK-BE-NEXT: mov.w r3, #0			; CHECK-BE-NEXT: mov.w r3, #0
	; CHECK-BE-NEXT: it gt			; CHECK-BE-NEXT: it gt
	; CHECK-BE-NEXT: movgt r3, #1			; CHECK-BE-NEXT: movgt r3, #1
	; CHECK-BE-NEXT: cmp r3, #0			; CHECK-BE-NEXT: cmp r3, #0
	; CHECK-BE-NEXT: cset r3, ne			; CHECK-BE-NEXT: cset r3, ne
	; CHECK-BE-NEXT: vmrs APSR_nzcv, fpscr			; CHECK-BE-NEXT: vmrs APSR_nzcv, fpscr
	; CHECK-BE-NEXT: and r3, r3, #1			; CHECK-BE-NEXT: and r3, r3, #1
	; CHECK-BE-NEXT: vcmp.f32 s7, #0			; CHECK-BE-NEXT: vcmp.f32 s4, #0
	; CHECK-BE-NEXT: rsb.w r3, r3, #0			; CHECK-BE-NEXT: rsb.w r3, r3, #0
	; CHECK-BE-NEXT: vcvtb.f16.f32 s0, s4			; CHECK-BE-NEXT: vcvtb.f16.f32 s0, s4
	; CHECK-BE-NEXT: bfi r1, r3, #1, #1			; CHECK-BE-NEXT: bfi r1, r3, #1, #1
	; CHECK-BE-NEXT: mov.w r3, #0			; CHECK-BE-NEXT: mov.w r3, #0
	; CHECK-BE-NEXT: it gt			; CHECK-BE-NEXT: it gt
	; CHECK-BE-NEXT: movgt r3, #1			; CHECK-BE-NEXT: movgt r3, #1
	; CHECK-BE-NEXT: cmp r3, #0			; CHECK-BE-NEXT: cmp r3, #0
	; CHECK-BE-NEXT: cset r3, ne			; CHECK-BE-NEXT: cset r3, ne
	▲ Show 20 Lines • Show All 72 Lines • Show Last 20 Lines

llvm/test/CodeGen/Thumb2/mve-pred-bitcast.ll

	Show All 22 Lines
	; CHECK-LE-NEXT: vpsel q0, q0, q1			; CHECK-LE-NEXT: vpsel q0, q0, q1
	; CHECK-LE-NEXT: add sp, #4			; CHECK-LE-NEXT: add sp, #4
	; CHECK-LE-NEXT: bx lr			; CHECK-LE-NEXT: bx lr
	;			;
	; CHECK-BE-LABEL: bitcast_to_v4i1:			; CHECK-BE-LABEL: bitcast_to_v4i1:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: .pad #4			; CHECK-BE-NEXT: .pad #4
	; CHECK-BE-NEXT: sub sp, #4			; CHECK-BE-NEXT: sub sp, #4
	; CHECK-BE-NEXT: and r0, r0, #15			; CHECK-BE-NEXT: rbit r0, r0
	; CHECK-BE-NEXT: vmov.i8 q1, #0x0			; CHECK-BE-NEXT: vmov.i8 q1, #0x0
	; CHECK-BE-NEXT: vmov.i8 q2, #0xff			; CHECK-BE-NEXT: vmov.i8 q2, #0xff
				; CHECK-BE-NEXT: lsrs r0, r0, #28
	; CHECK-BE-NEXT: vmsr p0, r0			; CHECK-BE-NEXT: vmsr p0, r0
	; CHECK-BE-NEXT: vpsel q1, q2, q1			; CHECK-BE-NEXT: vpsel q1, q2, q1
	; CHECK-BE-NEXT: vmov.u8 r0, q1[2]			; CHECK-BE-NEXT: vmov.u8 r0, q1[2]
	; CHECK-BE-NEXT: vmov.u8 r1, q1[0]			; CHECK-BE-NEXT: vmov.u8 r1, q1[0]
	; CHECK-BE-NEXT: vmov q2[2], q2[0], r1, r0			; CHECK-BE-NEXT: vmov q2[2], q2[0], r1, r0
	; CHECK-BE-NEXT: vmov.u8 r0, q1[3]			; CHECK-BE-NEXT: vmov.u8 r0, q1[3]
	; CHECK-BE-NEXT: vmov.u8 r1, q1[1]			; CHECK-BE-NEXT: vmov.u8 r1, q1[1]
	; CHECK-BE-NEXT: vrev64.32 q1, q0			; CHECK-BE-NEXT: vrev64.32 q1, q0
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; CHECK-LE-NEXT: bx lr			; CHECK-LE-NEXT: bx lr
	;			;
	; CHECK-BE-LABEL: bitcast_to_v8i1:			; CHECK-BE-LABEL: bitcast_to_v8i1:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: .pad #8			; CHECK-BE-NEXT: .pad #8
	; CHECK-BE-NEXT: sub sp, #8			; CHECK-BE-NEXT: sub sp, #8
	; CHECK-BE-NEXT: uxtb r0, r0			; CHECK-BE-NEXT: uxtb r0, r0
	; CHECK-BE-NEXT: vmov.i8 q1, #0x0			; CHECK-BE-NEXT: vmov.i8 q1, #0x0
				; CHECK-BE-NEXT: rbit r0, r0
	; CHECK-BE-NEXT: vmov.i8 q2, #0xff			; CHECK-BE-NEXT: vmov.i8 q2, #0xff
				; CHECK-BE-NEXT: lsrs r0, r0, #24
	; CHECK-BE-NEXT: vmsr p0, r0			; CHECK-BE-NEXT: vmsr p0, r0
	; CHECK-BE-NEXT: vpsel q2, q2, q1			; CHECK-BE-NEXT: vpsel q2, q2, q1
	; CHECK-BE-NEXT: vmov.u8 r0, q2[0]			; CHECK-BE-NEXT: vmov.u8 r0, q2[0]
	; CHECK-BE-NEXT: vmov.16 q1[0], r0			; CHECK-BE-NEXT: vmov.16 q1[0], r0
	; CHECK-BE-NEXT: vmov.u8 r0, q2[1]			; CHECK-BE-NEXT: vmov.u8 r0, q2[1]
	; CHECK-BE-NEXT: vmov.16 q1[1], r0			; CHECK-BE-NEXT: vmov.16 q1[1], r0
	; CHECK-BE-NEXT: vmov.u8 r0, q2[2]			; CHECK-BE-NEXT: vmov.u8 r0, q2[2]
	; CHECK-BE-NEXT: vmov.16 q1[2], r0			; CHECK-BE-NEXT: vmov.16 q1[2], r0
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; CHECK-BE-NEXT: push {r4, r6, r7, lr}			; CHECK-BE-NEXT: push {r4, r6, r7, lr}
	; CHECK-BE-NEXT: .setfp r7, sp, #8			; CHECK-BE-NEXT: .setfp r7, sp, #8
	; CHECK-BE-NEXT: add r7, sp, #8			; CHECK-BE-NEXT: add r7, sp, #8
	; CHECK-BE-NEXT: .pad #16			; CHECK-BE-NEXT: .pad #16
	; CHECK-BE-NEXT: sub sp, #16			; CHECK-BE-NEXT: sub sp, #16
	; CHECK-BE-NEXT: mov r4, sp			; CHECK-BE-NEXT: mov r4, sp
	; CHECK-BE-NEXT: bfc r4, #0, #4			; CHECK-BE-NEXT: bfc r4, #0, #4
	; CHECK-BE-NEXT: mov sp, r4			; CHECK-BE-NEXT: mov sp, r4
				; CHECK-BE-NEXT: uxth r0, r0
	; CHECK-BE-NEXT: vrev64.8 q1, q0			; CHECK-BE-NEXT: vrev64.8 q1, q0
				; CHECK-BE-NEXT: rbit r0, r0
	; CHECK-BE-NEXT: vmov.i32 q0, #0x0			; CHECK-BE-NEXT: vmov.i32 q0, #0x0
	; CHECK-BE-NEXT: sub.w r4, r7, #8			; CHECK-BE-NEXT: sub.w r4, r7, #8
	; CHECK-BE-NEXT: vrev32.8 q0, q0			; CHECK-BE-NEXT: vrev32.8 q0, q0
				; CHECK-BE-NEXT: lsrs r0, r0, #16
	; CHECK-BE-NEXT: vmsr p0, r0			; CHECK-BE-NEXT: vmsr p0, r0
	; CHECK-BE-NEXT: vpsel q1, q1, q0			; CHECK-BE-NEXT: vpsel q1, q1, q0
	; CHECK-BE-NEXT: vrev64.8 q0, q1			; CHECK-BE-NEXT: vrev64.8 q0, q1
	; CHECK-BE-NEXT: mov sp, r4			; CHECK-BE-NEXT: mov sp, r4
	; CHECK-BE-NEXT: pop {r4, r6, r7, pc}			; CHECK-BE-NEXT: pop {r4, r6, r7, pc}
	entry:			entry:
	%c = bitcast i16 %b to <16 x i1>			%c = bitcast i16 %b to <16 x i1>
	%s = select <16 x i1> %c, <16 x i8> %a, <16 x i8> zeroinitializer			%s = select <16 x i1> %c, <16 x i8> %a, <16 x i8> zeroinitializer
	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	;			;
	; CHECK-BE-LABEL: bitcast_from_v4i1:			; CHECK-BE-LABEL: bitcast_from_v4i1:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: .pad #4			; CHECK-BE-NEXT: .pad #4
	; CHECK-BE-NEXT: sub sp, #4			; CHECK-BE-NEXT: sub sp, #4
	; CHECK-BE-NEXT: vrev64.32 q1, q0			; CHECK-BE-NEXT: vrev64.32 q1, q0
	; CHECK-BE-NEXT: vcmp.i32 eq, q1, zr			; CHECK-BE-NEXT: vcmp.i32 eq, q1, zr
	; CHECK-BE-NEXT: vmrs r1, p0			; CHECK-BE-NEXT: vmrs r1, p0
	; CHECK-BE-NEXT: and r0, r1, #1			; CHECK-BE-NEXT: ubfx r0, r1, #12, #1
	; CHECK-BE-NEXT: rsbs r2, r0, #0			; CHECK-BE-NEXT: rsbs r2, r0, #0
	; CHECK-BE-NEXT: movs r0, #0			; CHECK-BE-NEXT: movs r0, #0
	; CHECK-BE-NEXT: bfi r0, r2, #0, #1			; CHECK-BE-NEXT: bfi r0, r2, #0, #1
	; CHECK-BE-NEXT: ubfx r2, r1, #4, #1			; CHECK-BE-NEXT: ubfx r2, r1, #8, #1
	; CHECK-BE-NEXT: rsbs r2, r2, #0			; CHECK-BE-NEXT: rsbs r2, r2, #0
	; CHECK-BE-NEXT: bfi r0, r2, #1, #1			; CHECK-BE-NEXT: bfi r0, r2, #1, #1
	; CHECK-BE-NEXT: ubfx r2, r1, #8, #1			; CHECK-BE-NEXT: ubfx r2, r1, #4, #1
	; CHECK-BE-NEXT: ubfx r1, r1, #12, #1			; CHECK-BE-NEXT: and r1, r1, #1
	; CHECK-BE-NEXT: rsbs r2, r2, #0			; CHECK-BE-NEXT: rsbs r2, r2, #0
	; CHECK-BE-NEXT: bfi r0, r2, #2, #1			; CHECK-BE-NEXT: bfi r0, r2, #2, #1
	; CHECK-BE-NEXT: rsbs r1, r1, #0			; CHECK-BE-NEXT: rsbs r1, r1, #0
	; CHECK-BE-NEXT: bfi r0, r1, #3, #1			; CHECK-BE-NEXT: bfi r0, r1, #3, #1
	; CHECK-BE-NEXT: add sp, #4			; CHECK-BE-NEXT: add sp, #4
	; CHECK-BE-NEXT: bx lr			; CHECK-BE-NEXT: bx lr
	entry:			entry:
	%c = icmp eq <4 x i32> %a, zeroinitializer			%c = icmp eq <4 x i32> %a, zeroinitializer
	Show All 39 Lines
	;			;
	; CHECK-BE-LABEL: bitcast_from_v8i1:			; CHECK-BE-LABEL: bitcast_from_v8i1:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: .pad #8			; CHECK-BE-NEXT: .pad #8
	; CHECK-BE-NEXT: sub sp, #8			; CHECK-BE-NEXT: sub sp, #8
	; CHECK-BE-NEXT: vrev64.16 q1, q0			; CHECK-BE-NEXT: vrev64.16 q1, q0
	; CHECK-BE-NEXT: vcmp.i16 eq, q1, zr			; CHECK-BE-NEXT: vcmp.i16 eq, q1, zr
	; CHECK-BE-NEXT: vmrs r1, p0			; CHECK-BE-NEXT: vmrs r1, p0
	; CHECK-BE-NEXT: and r0, r1, #1			; CHECK-BE-NEXT: ubfx r0, r1, #14, #1
	; CHECK-BE-NEXT: rsbs r2, r0, #0			; CHECK-BE-NEXT: rsbs r2, r0, #0
	; CHECK-BE-NEXT: movs r0, #0			; CHECK-BE-NEXT: movs r0, #0
	; CHECK-BE-NEXT: bfi r0, r2, #0, #1			; CHECK-BE-NEXT: bfi r0, r2, #0, #1
	; CHECK-BE-NEXT: ubfx r2, r1, #2, #1			; CHECK-BE-NEXT: ubfx r2, r1, #12, #1
	; CHECK-BE-NEXT: rsbs r2, r2, #0			; CHECK-BE-NEXT: rsbs r2, r2, #0
	; CHECK-BE-NEXT: bfi r0, r2, #1, #1			; CHECK-BE-NEXT: bfi r0, r2, #1, #1
	; CHECK-BE-NEXT: ubfx r2, r1, #4, #1			; CHECK-BE-NEXT: ubfx r2, r1, #10, #1
	; CHECK-BE-NEXT: rsbs r2, r2, #0			; CHECK-BE-NEXT: rsbs r2, r2, #0
	; CHECK-BE-NEXT: bfi r0, r2, #2, #1			; CHECK-BE-NEXT: bfi r0, r2, #2, #1
	; CHECK-BE-NEXT: ubfx r2, r1, #6, #1			; CHECK-BE-NEXT: ubfx r2, r1, #8, #1
	; CHECK-BE-NEXT: rsbs r2, r2, #0			; CHECK-BE-NEXT: rsbs r2, r2, #0
	; CHECK-BE-NEXT: bfi r0, r2, #3, #1			; CHECK-BE-NEXT: bfi r0, r2, #3, #1
	; CHECK-BE-NEXT: ubfx r2, r1, #8, #1			; CHECK-BE-NEXT: ubfx r2, r1, #6, #1
	; CHECK-BE-NEXT: rsbs r2, r2, #0			; CHECK-BE-NEXT: rsbs r2, r2, #0
	; CHECK-BE-NEXT: bfi r0, r2, #4, #1			; CHECK-BE-NEXT: bfi r0, r2, #4, #1
	; CHECK-BE-NEXT: ubfx r2, r1, #10, #1			; CHECK-BE-NEXT: ubfx r2, r1, #4, #1
	; CHECK-BE-NEXT: rsbs r2, r2, #0			; CHECK-BE-NEXT: rsbs r2, r2, #0
	; CHECK-BE-NEXT: bfi r0, r2, #5, #1			; CHECK-BE-NEXT: bfi r0, r2, #5, #1
	; CHECK-BE-NEXT: ubfx r2, r1, #12, #1			; CHECK-BE-NEXT: ubfx r2, r1, #2, #1
	; CHECK-BE-NEXT: ubfx r1, r1, #14, #1			; CHECK-BE-NEXT: and r1, r1, #1
	; CHECK-BE-NEXT: rsbs r2, r2, #0			; CHECK-BE-NEXT: rsbs r2, r2, #0
	; CHECK-BE-NEXT: bfi r0, r2, #6, #1			; CHECK-BE-NEXT: bfi r0, r2, #6, #1
	; CHECK-BE-NEXT: rsbs r1, r1, #0			; CHECK-BE-NEXT: rsbs r1, r1, #0
	; CHECK-BE-NEXT: bfi r0, r1, #7, #1			; CHECK-BE-NEXT: bfi r0, r1, #7, #1
	; CHECK-BE-NEXT: uxtb r0, r0			; CHECK-BE-NEXT: uxtb r0, r0
	; CHECK-BE-NEXT: add sp, #8			; CHECK-BE-NEXT: add sp, #8
	; CHECK-BE-NEXT: bx lr			; CHECK-BE-NEXT: bx lr
	entry:			entry:
	Show All 31 Lines
	; CHECK-BE-NEXT: sub sp, #16			; CHECK-BE-NEXT: sub sp, #16
	; CHECK-BE-NEXT: mov r4, sp			; CHECK-BE-NEXT: mov r4, sp
	; CHECK-BE-NEXT: bfc r4, #0, #4			; CHECK-BE-NEXT: bfc r4, #0, #4
	; CHECK-BE-NEXT: mov sp, r4			; CHECK-BE-NEXT: mov sp, r4
	; CHECK-BE-NEXT: vrev64.8 q1, q0			; CHECK-BE-NEXT: vrev64.8 q1, q0
	; CHECK-BE-NEXT: sub.w r4, r7, #8			; CHECK-BE-NEXT: sub.w r4, r7, #8
	; CHECK-BE-NEXT: vcmp.i8 eq, q1, zr			; CHECK-BE-NEXT: vcmp.i8 eq, q1, zr
	; CHECK-BE-NEXT: vmrs r0, p0			; CHECK-BE-NEXT: vmrs r0, p0
	; CHECK-BE-NEXT: uxth r0, r0			; CHECK-BE-NEXT: rbit r0, r0
				; CHECK-BE-NEXT: lsrs r0, r0, #16
	; CHECK-BE-NEXT: mov sp, r4			; CHECK-BE-NEXT: mov sp, r4
	; CHECK-BE-NEXT: pop {r4, r6, r7, pc}			; CHECK-BE-NEXT: pop {r4, r6, r7, pc}
	entry:			entry:
	%c = icmp eq <16 x i8> %a, zeroinitializer			%c = icmp eq <16 x i8> %a, zeroinitializer
	%b = bitcast <16 x i1> %c to i16			%b = bitcast <16 x i1> %c to i16
	ret i16 %b			ret i16 %b
	}			}

	▲ Show 20 Lines • Show All 46 Lines • Show Last 20 Lines

llvm/test/CodeGen/Thumb2/mve-pred-loadstore.ll

	Show All 20 Lines
	; CHECK-LE-NEXT: vpsel q0, q0, q1			; CHECK-LE-NEXT: vpsel q0, q0, q1
	; CHECK-LE-NEXT: bx lr			; CHECK-LE-NEXT: bx lr
	;			;
	; CHECK-BE-LABEL: load_v4i1:			; CHECK-BE-LABEL: load_v4i1:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: ldrb r0, [r0]			; CHECK-BE-NEXT: ldrb r0, [r0]
	; CHECK-BE-NEXT: vmov.i8 q1, #0x0			; CHECK-BE-NEXT: vmov.i8 q1, #0x0
	; CHECK-BE-NEXT: vmov.i8 q2, #0xff			; CHECK-BE-NEXT: vmov.i8 q2, #0xff
				; CHECK-BE-NEXT: rbit r0, r0
				; CHECK-BE-NEXT: lsrs r0, r0, #28
	; CHECK-BE-NEXT: vmsr p0, r0			; CHECK-BE-NEXT: vmsr p0, r0
	; CHECK-BE-NEXT: vpsel q1, q2, q1			; CHECK-BE-NEXT: vpsel q1, q2, q1
	; CHECK-BE-NEXT: vmov.u8 r0, q1[2]			; CHECK-BE-NEXT: vmov.u8 r0, q1[2]
	; CHECK-BE-NEXT: vmov.u8 r1, q1[0]			; CHECK-BE-NEXT: vmov.u8 r1, q1[0]
	; CHECK-BE-NEXT: vmov q2[2], q2[0], r1, r0			; CHECK-BE-NEXT: vmov q2[2], q2[0], r1, r0
	; CHECK-BE-NEXT: vmov.u8 r0, q1[3]			; CHECK-BE-NEXT: vmov.u8 r0, q1[3]
	; CHECK-BE-NEXT: vmov.u8 r1, q1[1]			; CHECK-BE-NEXT: vmov.u8 r1, q1[1]
	; CHECK-BE-NEXT: vrev64.32 q1, q0			; CHECK-BE-NEXT: vrev64.32 q1, q0
	Show All 38 Lines
	; CHECK-LE-NEXT: vpsel q0, q0, q1			; CHECK-LE-NEXT: vpsel q0, q0, q1
	; CHECK-LE-NEXT: bx lr			; CHECK-LE-NEXT: bx lr
	;			;
	; CHECK-BE-LABEL: load_v8i1:			; CHECK-BE-LABEL: load_v8i1:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: ldrb r0, [r0]			; CHECK-BE-NEXT: ldrb r0, [r0]
	; CHECK-BE-NEXT: vmov.i8 q1, #0x0			; CHECK-BE-NEXT: vmov.i8 q1, #0x0
	; CHECK-BE-NEXT: vmov.i8 q2, #0xff			; CHECK-BE-NEXT: vmov.i8 q2, #0xff
				; CHECK-BE-NEXT: rbit r0, r0
				; CHECK-BE-NEXT: lsrs r0, r0, #24
	; CHECK-BE-NEXT: vmsr p0, r0			; CHECK-BE-NEXT: vmsr p0, r0
	; CHECK-BE-NEXT: vpsel q2, q2, q1			; CHECK-BE-NEXT: vpsel q2, q2, q1
	; CHECK-BE-NEXT: vmov.u8 r0, q2[0]			; CHECK-BE-NEXT: vmov.u8 r0, q2[0]
	; CHECK-BE-NEXT: vmov.16 q1[0], r0			; CHECK-BE-NEXT: vmov.16 q1[0], r0
	; CHECK-BE-NEXT: vmov.u8 r0, q2[1]			; CHECK-BE-NEXT: vmov.u8 r0, q2[1]
	; CHECK-BE-NEXT: vmov.16 q1[1], r0			; CHECK-BE-NEXT: vmov.16 q1[1], r0
	; CHECK-BE-NEXT: vmov.u8 r0, q2[2]			; CHECK-BE-NEXT: vmov.u8 r0, q2[2]
	; CHECK-BE-NEXT: vmov.16 q1[2], r0			; CHECK-BE-NEXT: vmov.16 q1[2], r0
	Show All 29 Lines
	; CHECK-LE-NEXT: vpsel q0, q0, q1			; CHECK-LE-NEXT: vpsel q0, q0, q1
	; CHECK-LE-NEXT: bx lr			; CHECK-LE-NEXT: bx lr
	;			;
	; CHECK-BE-LABEL: load_v16i1:			; CHECK-BE-LABEL: load_v16i1:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: ldrh r0, [r0]			; CHECK-BE-NEXT: ldrh r0, [r0]
	; CHECK-BE-NEXT: vrev64.8 q1, q0			; CHECK-BE-NEXT: vrev64.8 q1, q0
	; CHECK-BE-NEXT: vmov.i32 q0, #0x0			; CHECK-BE-NEXT: vmov.i32 q0, #0x0
				; CHECK-BE-NEXT: rbit r0, r0
	; CHECK-BE-NEXT: vrev32.8 q0, q0			; CHECK-BE-NEXT: vrev32.8 q0, q0
				; CHECK-BE-NEXT: lsrs r0, r0, #16
	; CHECK-BE-NEXT: vmsr p0, r0			; CHECK-BE-NEXT: vmsr p0, r0
	; CHECK-BE-NEXT: vpsel q1, q1, q0			; CHECK-BE-NEXT: vpsel q1, q1, q0
	; CHECK-BE-NEXT: vrev64.8 q0, q1			; CHECK-BE-NEXT: vrev64.8 q0, q1
	; CHECK-BE-NEXT: bx lr			; CHECK-BE-NEXT: bx lr
	entry:			entry:
	%c = load <16 x i1>, <16 x i1>* %src			%c = load <16 x i1>, <16 x i1>* %src
	%s = select <16 x i1> %c, <16 x i8> %a, <16 x i8> zeroinitializer			%s = select <16 x i1> %c, <16 x i8> %a, <16 x i8> zeroinitializer
	ret <16 x i8> %s			ret <16 x i8> %s
	▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines
	; CHECK-LE-NEXT: bx lr			; CHECK-LE-NEXT: bx lr
	;			;
	; CHECK-BE-LABEL: store_v4i1:			; CHECK-BE-LABEL: store_v4i1:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: vrev64.32 q1, q0			; CHECK-BE-NEXT: vrev64.32 q1, q0
	; CHECK-BE-NEXT: movs r3, #0			; CHECK-BE-NEXT: movs r3, #0
	; CHECK-BE-NEXT: vcmp.i32 eq, q1, zr			; CHECK-BE-NEXT: vcmp.i32 eq, q1, zr
	; CHECK-BE-NEXT: vmrs r1, p0			; CHECK-BE-NEXT: vmrs r1, p0
	; CHECK-BE-NEXT: and r2, r1, #1			; CHECK-BE-NEXT: ubfx r2, r1, #12, #1
	; CHECK-BE-NEXT: rsbs r2, r2, #0			; CHECK-BE-NEXT: rsbs r2, r2, #0
	; CHECK-BE-NEXT: bfi r3, r2, #0, #1			; CHECK-BE-NEXT: bfi r3, r2, #0, #1
	; CHECK-BE-NEXT: ubfx r2, r1, #4, #1			; CHECK-BE-NEXT: ubfx r2, r1, #8, #1
	; CHECK-BE-NEXT: rsbs r2, r2, #0			; CHECK-BE-NEXT: rsbs r2, r2, #0
	; CHECK-BE-NEXT: bfi r3, r2, #1, #1			; CHECK-BE-NEXT: bfi r3, r2, #1, #1
	; CHECK-BE-NEXT: ubfx r2, r1, #8, #1			; CHECK-BE-NEXT: ubfx r2, r1, #4, #1
	; CHECK-BE-NEXT: ubfx r1, r1, #12, #1			; CHECK-BE-NEXT: and r1, r1, #1
	; CHECK-BE-NEXT: rsbs r2, r2, #0			; CHECK-BE-NEXT: rsbs r2, r2, #0
	; CHECK-BE-NEXT: bfi r3, r2, #2, #1			; CHECK-BE-NEXT: bfi r3, r2, #2, #1
	; CHECK-BE-NEXT: rsbs r1, r1, #0			; CHECK-BE-NEXT: rsbs r1, r1, #0
	; CHECK-BE-NEXT: bfi r3, r1, #3, #1			; CHECK-BE-NEXT: bfi r3, r1, #3, #1
	; CHECK-BE-NEXT: strb r3, [r0]			; CHECK-BE-NEXT: strb r3, [r0]
	; CHECK-BE-NEXT: bx lr			; CHECK-BE-NEXT: bx lr
	entry:			entry:
	%c = icmp eq <4 x i32> %a, zeroinitializer			%c = icmp eq <4 x i32> %a, zeroinitializer
	Show All 34 Lines
	; CHECK-LE-NEXT: strb r1, [r0]			; CHECK-LE-NEXT: strb r1, [r0]
	; CHECK-LE-NEXT: bx lr			; CHECK-LE-NEXT: bx lr
	;			;
	; CHECK-BE-LABEL: store_v8i1:			; CHECK-BE-LABEL: store_v8i1:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: vrev64.16 q1, q0			; CHECK-BE-NEXT: vrev64.16 q1, q0
	; CHECK-BE-NEXT: vcmp.i16 eq, q1, zr			; CHECK-BE-NEXT: vcmp.i16 eq, q1, zr
	; CHECK-BE-NEXT: vmrs r2, p0			; CHECK-BE-NEXT: vmrs r2, p0
	; CHECK-BE-NEXT: and r1, r2, #1			; CHECK-BE-NEXT: ubfx r1, r2, #14, #1
	; CHECK-BE-NEXT: rsbs r3, r1, #0			; CHECK-BE-NEXT: rsbs r3, r1, #0
	; CHECK-BE-NEXT: movs r1, #0			; CHECK-BE-NEXT: movs r1, #0
	; CHECK-BE-NEXT: bfi r1, r3, #0, #1			; CHECK-BE-NEXT: bfi r1, r3, #0, #1
	; CHECK-BE-NEXT: ubfx r3, r2, #2, #1			; CHECK-BE-NEXT: ubfx r3, r2, #12, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r1, r3, #1, #1			; CHECK-BE-NEXT: bfi r1, r3, #1, #1
	; CHECK-BE-NEXT: ubfx r3, r2, #4, #1			; CHECK-BE-NEXT: ubfx r3, r2, #10, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r1, r3, #2, #1			; CHECK-BE-NEXT: bfi r1, r3, #2, #1
	; CHECK-BE-NEXT: ubfx r3, r2, #6, #1			; CHECK-BE-NEXT: ubfx r3, r2, #8, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r1, r3, #3, #1			; CHECK-BE-NEXT: bfi r1, r3, #3, #1
	; CHECK-BE-NEXT: ubfx r3, r2, #8, #1			; CHECK-BE-NEXT: ubfx r3, r2, #6, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r1, r3, #4, #1			; CHECK-BE-NEXT: bfi r1, r3, #4, #1
	; CHECK-BE-NEXT: ubfx r3, r2, #10, #1			; CHECK-BE-NEXT: ubfx r3, r2, #4, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r1, r3, #5, #1			; CHECK-BE-NEXT: bfi r1, r3, #5, #1
	; CHECK-BE-NEXT: ubfx r3, r2, #12, #1			; CHECK-BE-NEXT: ubfx r3, r2, #2, #1
	; CHECK-BE-NEXT: ubfx r2, r2, #14, #1			; CHECK-BE-NEXT: and r2, r2, #1
	; CHECK-BE-NEXT: rsbs r3, r3, #0			; CHECK-BE-NEXT: rsbs r3, r3, #0
	; CHECK-BE-NEXT: bfi r1, r3, #6, #1			; CHECK-BE-NEXT: bfi r1, r3, #6, #1
	; CHECK-BE-NEXT: rsbs r2, r2, #0			; CHECK-BE-NEXT: rsbs r2, r2, #0
	; CHECK-BE-NEXT: bfi r1, r2, #7, #1			; CHECK-BE-NEXT: bfi r1, r2, #7, #1
	; CHECK-BE-NEXT: strb r1, [r0]			; CHECK-BE-NEXT: strb r1, [r0]
	; CHECK-BE-NEXT: bx lr			; CHECK-BE-NEXT: bx lr
	entry:			entry:
	%c = icmp eq <8 x i16> %a, zeroinitializer			%c = icmp eq <8 x i16> %a, zeroinitializer
	Show All 9 Lines
	; CHECK-LE-NEXT: strh r1, [r0]			; CHECK-LE-NEXT: strh r1, [r0]
	; CHECK-LE-NEXT: bx lr			; CHECK-LE-NEXT: bx lr
	;			;
	; CHECK-BE-LABEL: store_v16i1:			; CHECK-BE-LABEL: store_v16i1:
	; CHECK-BE: @ %bb.0: @ %entry			; CHECK-BE: @ %bb.0: @ %entry
	; CHECK-BE-NEXT: vrev64.8 q1, q0			; CHECK-BE-NEXT: vrev64.8 q1, q0
	; CHECK-BE-NEXT: vcmp.i8 eq, q1, zr			; CHECK-BE-NEXT: vcmp.i8 eq, q1, zr
	; CHECK-BE-NEXT: vmrs r1, p0			; CHECK-BE-NEXT: vmrs r1, p0
				; CHECK-BE-NEXT: rbit r1, r1
				; CHECK-BE-NEXT: lsrs r1, r1, #16
	; CHECK-BE-NEXT: strh r1, [r0]			; CHECK-BE-NEXT: strh r1, [r0]
	; CHECK-BE-NEXT: bx lr			; CHECK-BE-NEXT: bx lr
	entry:			entry:
	%c = icmp eq <16 x i8> %a, zeroinitializer			%c = icmp eq <16 x i8> %a, zeroinitializer
	store <16 x i1> %c, <16 x i1>* %dst			store <16 x i1> %c, <16 x i1>* %dst
	ret void			ret void
	}			}

	▲ Show 20 Lines • Show All 308 Lines • Show Last 20 Lines