Diff 262033

llvm/lib/Target/ARM/ARMISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 12,645 Lines • ▼ Show 20 Lines	static bool isValidMVECond(unsigned CC, bool IsFloat) {
case ARMCC::HS:		case ARMCC::HS:
case ARMCC::HI:		case ARMCC::HI:
return !IsFloat;		return !IsFloat;
default:		default:
return false;		return false;
};		};
}		}

		static ARMCC::CondCodes getVCMPCondCode(SDValue N) {
		if (N->getOpcode() == ARMISD::VCMP)
		return (ARMCC::CondCodes)N->getConstantOperandVal(2);
		else if (N->getOpcode() == ARMISD::VCMPZ)
		dmgreenUnsubmitted Done Reply Inline Actions This can just be `return (ARMCC::CondCodes)N->getConstantOperandVal(2)` dmgreen: This can just be `return (ARMCC::CondCodes)N->getConstantOperandVal(2)`
		return (ARMCC::CondCodes)N->getConstantOperandVal(1);
		else
		llvm_unreachable("Not a VCMP/VCMPZ!");
		}

		static bool CanInvertMVEVCMP(SDValue N) {
		ARMCC::CondCodes CC = ARMCC::getOppositeCondition(getVCMPCondCode(N));
		return isValidMVECond(CC, N->getOperand(0).getValueType().isFloatingPoint());
		}

static SDValue PerformORCombine_i1(SDNode *N,		static SDValue PerformORCombine_i1(SDNode *N,
TargetLowering::DAGCombinerInfo &DCI,		TargetLowering::DAGCombinerInfo &DCI,
		dmgreenUnsubmitted Done Reply Inline Actions N->getOperand(0).getValueType(),... dmgreen: N->getOperand(0).getValueType(),...
const ARMSubtarget *Subtarget) {		const ARMSubtarget *Subtarget) {
// Try to invert "or A, B" -> "and ~A, ~B", as the "and" is easier to chain		// Try to invert "or A, B" -> "and ~A, ~B", as the "and" is easier to chain
// together with predicates		// together with predicates
EVT VT = N->getValueType(0);		EVT VT = N->getValueType(0);
		SDLoc DL(N);
SDValue N0 = N->getOperand(0);		SDValue N0 = N->getOperand(0);
SDValue N1 = N->getOperand(1);		SDValue N1 = N->getOperand(1);

ARMCC::CondCodes CondCode0 = ARMCC::AL;		auto IsFreelyInvertable = [&](SDValue V) {
ARMCC::CondCodes CondCode1 = ARMCC::AL;		if (V->getOpcode() == ARMISD::VCMP \|\| V->getOpcode() == ARMISD::VCMPZ)
if (N0->getOpcode() == ARMISD::VCMP)		return CanInvertMVEVCMP(V);
CondCode0 = (ARMCC::CondCodes)cast<const ConstantSDNode>(N0->getOperand(2))		return false;
->getZExtValue();		};
else if (N0->getOpcode() == ARMISD::VCMPZ)
CondCode0 = (ARMCC::CondCodes)cast<const ConstantSDNode>(N0->getOperand(1))
->getZExtValue();
if (N1->getOpcode() == ARMISD::VCMP)
CondCode1 = (ARMCC::CondCodes)cast<const ConstantSDNode>(N1->getOperand(2))
->getZExtValue();
else if (N1->getOpcode() == ARMISD::VCMPZ)
CondCode1 = (ARMCC::CondCodes)cast<const ConstantSDNode>(N1->getOperand(1))
->getZExtValue();

if (CondCode0 == ARMCC::AL \|\| CondCode1 == ARMCC::AL)
return SDValue();

unsigned Opposite0 = ARMCC::getOppositeCondition(CondCode0);
unsigned Opposite1 = ARMCC::getOppositeCondition(CondCode1);

if (!isValidMVECond(Opposite0,		// At least one operand must be freely invertable.
N0->getOperand(0)->getValueType(0).isFloatingPoint()) \|\|		if (!(IsFreelyInvertable(N0) \|\| IsFreelyInvertable(N1)))
		dmgreenUnsubmitted Done Reply Inline Actions Maybe make an IsFreelyInvertable() function/lambda. Then this will just be if (IsFreelyInvertable(N0) \|\| IsFreelyInvertable(N1)) We can then add things like swapping operands to it, if we teach it those tricks. dmgreen: Maybe make an IsFreelyInvertable() function/lambda. Then this will just be if…
!isValidMVECond(Opposite1,
N1->getOperand(0)->getValueType(0).isFloatingPoint()))
return SDValue();		return SDValue();
		dmgreenUnsubmitted Done Reply Inline Actions These can use DL too. The not is in a way coming from the Or. dmgreen: These can use DL too. The not is in a way coming from the Or.

SmallVector<SDValue, 4> Ops0;		SDValue NewN0 = DCI.DAG.getLogicalNOT(DL, N0, VT);
Ops0.push_back(N0->getOperand(0));		SDValue NewN1 = DCI.DAG.getLogicalNOT(DL, N1, VT);
if (N0->getOpcode() == ARMISD::VCMP)		SDValue And = DCI.DAG.getNode(ISD::AND, DL, VT, NewN0, NewN1);
Ops0.push_back(N0->getOperand(1));		return DCI.DAG.getLogicalNOT(DL, And, VT);
Ops0.push_back(DCI.DAG.getConstant(Opposite0, SDLoc(N0), MVT::i32));
SmallVector<SDValue, 4> Ops1;
Ops1.push_back(N1->getOperand(0));
if (N1->getOpcode() == ARMISD::VCMP)
Ops1.push_back(N1->getOperand(1));
Ops1.push_back(DCI.DAG.getConstant(Opposite1, SDLoc(N1), MVT::i32));

SDValue NewN0 = DCI.DAG.getNode(N0->getOpcode(), SDLoc(N0), VT, Ops0);
SDValue NewN1 = DCI.DAG.getNode(N1->getOpcode(), SDLoc(N1), VT, Ops1);
SDValue And = DCI.DAG.getNode(ISD::AND, SDLoc(N), VT, NewN0, NewN1);
return DCI.DAG.getNode(ISD::XOR, SDLoc(N), VT, And,
DCI.DAG.getAllOnesConstant(SDLoc(N), VT));
}		}

/// PerformORCombine - Target-specific dag combine xforms for ISD::OR		/// PerformORCombine - Target-specific dag combine xforms for ISD::OR
static SDValue PerformORCombine(SDNode *N,		static SDValue PerformORCombine(SDNode *N,
TargetLowering::DAGCombinerInfo &DCI,		TargetLowering::DAGCombinerInfo &DCI,
const ARMSubtarget *Subtarget) {		const ARMSubtarget *Subtarget) {
// Attempt to use immediate-form VORR		// Attempt to use immediate-form VORR
BuildVectorSDNode *BVN = dyn_cast<BuildVectorSDNode>(N->getOperand(1));		BuildVectorSDNode *BVN = dyn_cast<BuildVectorSDNode>(N->getOperand(1));
▲ Show 20 Lines • Show All 104 Lines • ▼ Show 20 Lines	if (!Subtarget->isThumb1Only()) {
// fold (xor (select cc, 0, c), x) -> (select cc, x, (xor, x, c))		// fold (xor (select cc, 0, c), x) -> (select cc, x, (xor, x, c))
if (SDValue Result = combineSelectAndUseCommutative(N, false, DCI))		if (SDValue Result = combineSelectAndUseCommutative(N, false, DCI))
return Result;		return Result;

if (SDValue Result = PerformSHLSimplify(N, DCI, Subtarget))		if (SDValue Result = PerformSHLSimplify(N, DCI, Subtarget))
return Result;		return Result;
}		}

		if (Subtarget->hasMVEIntegerOps()) {
		// fold (xor(vcmp/z, 1)) into a vcmp with the opposite condition.
		SDValue N0 = N->getOperand(0);
		SDValue N1 = N->getOperand(1);
		const TargetLowering *TLI = Subtarget->getTargetLowering();
		if (TLI->isConstTrueVal(N1.getNode()) &&
		(N0->getOpcode() == ARMISD::VCMP \|\| N0->getOpcode() == ARMISD::VCMPZ)) {
		if (CanInvertMVEVCMP(N0)) {
		SDLoc DL(N0);
		ARMCC::CondCodes CC = ARMCC::getOppositeCondition(getVCMPCondCode(N0));

		SmallVector<SDValue, 4> Ops;
		Ops.push_back(N0->getOperand(0));
		if (N0->getOpcode() == ARMISD::VCMP)
		Ops.push_back(N0->getOperand(1));
		Ops.push_back(DCI.DAG.getConstant(CC, DL, MVT::i32));
		return DCI.DAG.getNode(N0->getOpcode(), DL, N0->getValueType(0), Ops);
		dmgreenUnsubmitted Done Reply Inline Actions Just create a SDLoc for N0. Same above in the other function. dmgreen: Just create a SDLoc for N0. Same above in the other function.
		}
		}
		}

return SDValue();		return SDValue();
}		}

// ParseBFI - given a BFI instruction in N, extract the "from" value (Rn) and return it,		// ParseBFI - given a BFI instruction in N, extract the "from" value (Rn) and return it,
// and fill in FromMask and ToMask with (consecutive) bits in "from" to be extracted and		// and fill in FromMask and ToMask with (consecutive) bits in "from" to be extracted and
// their position in "to" (Rd).		// their position in "to" (Rd).
static SDValue ParseBFI(SDNode *N, APInt &ToMask, APInt &FromMask) {		static SDValue ParseBFI(SDNode *N, APInt &ToMask, APInt &FromMask) {
assert(N->getOpcode() == ARMISD::BFI);		assert(N->getOpcode() == ARMISD::BFI);
▲ Show 20 Lines • Show All 5,390 Lines • Show Last 20 Lines

llvm/test/CodeGen/Thumb2/LowOverheadLoops/cond-vector-reduce-mve-codegen.ll

	Show First 20 Lines • Show All 290 Lines • ▼ Show 20 Lines
	for.cond.cleanup: ; preds = %middle.block, %entry			for.cond.cleanup: ; preds = %middle.block, %entry
	%res.0.lcssa = phi i32 [ 0, %entry ], [ %reduce, %middle.block ]			%res.0.lcssa = phi i32 [ 0, %entry ], [ %reduce, %middle.block ]
	ret i32 %res.0.lcssa			ret i32 %res.0.lcssa
	}			}

	define dso_local i32 @or_mul_reduce_add(i32* noalias nocapture readonly %a, i32* noalias nocapture readonly %b, i32* noalias nocapture readonly %c, i32* noalias nocapture readonly %d, i32 %N) {			define dso_local i32 @or_mul_reduce_add(i32* noalias nocapture readonly %a, i32* noalias nocapture readonly %b, i32* noalias nocapture readonly %c, i32* noalias nocapture readonly %d, i32 %N) {
	; CHECK-LABEL: or_mul_reduce_add:			; CHECK-LABEL: or_mul_reduce_add:
	; CHECK: @ %bb.0: @ %entry			; CHECK: @ %bb.0: @ %entry
	; CHECK-NEXT: push {r4, r5, r6, lr}			; CHECK-NEXT: push {r4, r5, r7, lr}
	; CHECK-NEXT: sub sp, #4			; CHECK-NEXT: ldr.w r12, [sp, #16]
	; CHECK-NEXT: ldr.w r12, [sp, #20]
	; CHECK-NEXT: cmp.w r12, #0			; CHECK-NEXT: cmp.w r12, #0
	; CHECK-NEXT: beq .LBB3_4			; CHECK-NEXT: beq .LBB3_4
	; CHECK-NEXT: @ %bb.1: @ %vector.ph			; CHECK-NEXT: @ %bb.1: @ %vector.ph
	; CHECK-NEXT: add.w r4, r12, #3			; CHECK-NEXT: add.w r4, r12, #3
	; CHECK-NEXT: vmov.i32 q1, #0x0			; CHECK-NEXT: vmov.i32 q1, #0x0
	; CHECK-NEXT: bic r4, r4, #3			; CHECK-NEXT: bic r4, r4, #3
	; CHECK-NEXT: subs r5, r4, #4			; CHECK-NEXT: subs r5, r4, #4
	; CHECK-NEXT: movs r4, #1			; CHECK-NEXT: movs r4, #1
	; CHECK-NEXT: add.w lr, r4, r5, lsr #2			; CHECK-NEXT: add.w lr, r4, r5, lsr #2
	; CHECK-NEXT: lsrs r4, r5, #2			; CHECK-NEXT: lsrs r4, r5, #2
	; CHECK-NEXT: sub.w r4, r12, r4, lsl #2			; CHECK-NEXT: sub.w r4, r12, r4, lsl #2
	; CHECK-NEXT: dls lr, lr			; CHECK-NEXT: dls lr, lr
	; CHECK-NEXT: .LBB3_2: @ %vector.body			; CHECK-NEXT: .LBB3_2: @ %vector.body
	; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1			; CHECK-NEXT: @ =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: vctp.32 r12			; CHECK-NEXT: vctp.32 r12
	; CHECK-NEXT: vmov q0, q1			; CHECK-NEXT: vmov q0, q1
	; CHECK-NEXT: vstr p0, [sp] @ 4-byte Spill
	; CHECK-NEXT: sub.w r12, r12, #4
	; CHECK-NEXT: vpstt			; CHECK-NEXT: vpstt
	; CHECK-NEXT: vldrwt.u32 q1, [r1], #16			; CHECK-NEXT: vldrwt.u32 q1, [r1], #16
	; CHECK-NEXT: vldrwt.u32 q2, [r0], #16			; CHECK-NEXT: vldrwt.u32 q2, [r0], #16
				; CHECK-NEXT: vpnot
	; CHECK-NEXT: vsub.i32 q1, q2, q1			; CHECK-NEXT: vsub.i32 q1, q2, q1
	; CHECK-NEXT: vcmp.i32 eq, q1, zr			; CHECK-NEXT: sub.w r12, r12, #4
	; CHECK-NEXT: vmrs r5, p0			; CHECK-NEXT: vpstee
	; CHECK-NEXT: vldr p0, [sp] @ 4-byte Reload			; CHECK-NEXT: vcmpt.i32 ne, q1, zr
	; CHECK-NEXT: vmrs r6, p0			; CHECK-NEXT: vldrwe.u32 q1, [r3], #16
	; CHECK-NEXT: orrs r5, r6			; CHECK-NEXT: vldrwe.u32 q2, [r2], #16
	; CHECK-NEXT: vmsr p0, r5
	; CHECK-NEXT: vpstt
	; CHECK-NEXT: vldrwt.u32 q1, [r3], #16
	; CHECK-NEXT: vldrwt.u32 q2, [r2], #16
	; CHECK-NEXT: vmul.i32 q1, q2, q1			; CHECK-NEXT: vmul.i32 q1, q2, q1
	; CHECK-NEXT: vadd.i32 q1, q1, q0			; CHECK-NEXT: vadd.i32 q1, q1, q0
	; CHECK-NEXT: le lr, .LBB3_2			; CHECK-NEXT: le lr, .LBB3_2
	; CHECK-NEXT: @ %bb.3: @ %middle.block			; CHECK-NEXT: @ %bb.3: @ %middle.block
	; CHECK-NEXT: vctp.32 r4			; CHECK-NEXT: vctp.32 r4
	; CHECK-NEXT: vpsel q0, q1, q0			; CHECK-NEXT: vpsel q0, q1, q0
	; CHECK-NEXT: vaddv.u32 r0, q0			; CHECK-NEXT: vaddv.u32 r0, q0
	; CHECK-NEXT: add sp, #4			; CHECK-NEXT: pop {r4, r5, r7, pc}
	; CHECK-NEXT: pop {r4, r5, r6, pc}
	; CHECK-NEXT: .LBB3_4:			; CHECK-NEXT: .LBB3_4:
	; CHECK-NEXT: movs r0, #0			; CHECK-NEXT: movs r0, #0
	; CHECK-NEXT: add sp, #4			; CHECK-NEXT: pop {r4, r5, r7, pc}
	; CHECK-NEXT: pop {r4, r5, r6, pc}
	entry:			entry:
	%cmp8 = icmp eq i32 %N, 0			%cmp8 = icmp eq i32 %N, 0
	br i1 %cmp8, label %for.cond.cleanup, label %vector.ph			br i1 %cmp8, label %for.cond.cleanup, label %vector.ph

	vector.ph: ; preds = %entry			vector.ph: ; preds = %entry
	%n.rnd.up = add i32 %N, 3			%n.rnd.up = add i32 %N, 3
	%n.vec = and i32 %n.rnd.up, -4			%n.vec = and i32 %n.rnd.up, -4
	%trip.count.minus.1 = add i32 %N, -1			%trip.count.minus.1 = add i32 %N, -1
	▲ Show 20 Lines • Show All 175 Lines • Show Last 20 Lines

llvm/test/CodeGen/Thumb2/mve-pred-or.ll

Show First 20 Lines • Show All 118 Lines • ▼ Show 20 Lines	entry:
%s = select <4 x i1> %o, <4 x i32> %a, <4 x i32> %b		%s = select <4 x i1> %o, <4 x i32> %a, <4 x i32> %b
ret <4 x i32> %s		ret <4 x i32> %s
}		}

define arm_aapcs_vfpcc <4 x i32> @cmpulez_v4i1(<4 x i32> %a, <4 x i32> %b) {		define arm_aapcs_vfpcc <4 x i32> @cmpulez_v4i1(<4 x i32> %a, <4 x i32> %b) {
; CHECK-LABEL: cmpulez_v4i1:		; CHECK-LABEL: cmpulez_v4i1:
; CHECK: @ %bb.0: @ %entry		; CHECK: @ %bb.0: @ %entry
; CHECK-NEXT: vcmp.u32 cs, q1, zr		; CHECK-NEXT: vcmp.u32 cs, q1, zr
; CHECK-NEXT: vmrs r0, p0		; CHECK-NEXT: vpnot
; CHECK-NEXT: vcmp.i32 eq, q0, zr		; CHECK-NEXT: vpst
; CHECK-NEXT: vmrs r1, p0		; CHECK-NEXT: vcmpt.i32 ne, q0, zr
; CHECK-NEXT: orrs r0, r1		; CHECK-NEXT: vpsel q0, q1, q0
; CHECK-NEXT: vmsr p0, r0
; CHECK-NEXT: vpsel q0, q0, q1
; CHECK-NEXT: bx lr		; CHECK-NEXT: bx lr
entry:		entry:
%c1 = icmp eq <4 x i32> %a, zeroinitializer		%c1 = icmp eq <4 x i32> %a, zeroinitializer
%c2 = icmp ule <4 x i32> %b, zeroinitializer		%c2 = icmp ule <4 x i32> %b, zeroinitializer
%o = or <4 x i1> %c1, %c2		%o = or <4 x i1> %c1, %c2
%s = select <4 x i1> %o, <4 x i32> %a, <4 x i32> %b		%s = select <4 x i1> %o, <4 x i32> %a, <4 x i32> %b
ret <4 x i32> %s		ret <4 x i32> %s
}		}
▲ Show 20 Lines • Show All 101 Lines • ▼ Show 20 Lines	entry:
%s = select <4 x i1> %o, <4 x i32> %a, <4 x i32> %b		%s = select <4 x i1> %o, <4 x i32> %a, <4 x i32> %b
ret <4 x i32> %s		ret <4 x i32> %s
}		}

define arm_aapcs_vfpcc <4 x i32> @cmpult_v4i1(<4 x i32> %a, <4 x i32> %b, <4 x i32> %c) {		define arm_aapcs_vfpcc <4 x i32> @cmpult_v4i1(<4 x i32> %a, <4 x i32> %b, <4 x i32> %c) {
; CHECK-LABEL: cmpult_v4i1:		; CHECK-LABEL: cmpult_v4i1:
; CHECK: @ %bb.0: @ %entry		; CHECK: @ %bb.0: @ %entry
; CHECK-NEXT: vcmp.u32 hi, q2, q1		; CHECK-NEXT: vcmp.u32 hi, q2, q1
; CHECK-NEXT: vmrs r0, p0		; CHECK-NEXT: vpnot
; CHECK-NEXT: vcmp.i32 eq, q0, zr		; CHECK-NEXT: vpst
; CHECK-NEXT: vmrs r1, p0		; CHECK-NEXT: vcmpt.i32 ne, q0, zr
; CHECK-NEXT: orrs r0, r1		; CHECK-NEXT: vpsel q0, q1, q0
; CHECK-NEXT: vmsr p0, r0
; CHECK-NEXT: vpsel q0, q0, q1
; CHECK-NEXT: bx lr		; CHECK-NEXT: bx lr
entry:		entry:
%c1 = icmp eq <4 x i32> %a, zeroinitializer		%c1 = icmp eq <4 x i32> %a, zeroinitializer
%c2 = icmp ult <4 x i32> %b, %c		%c2 = icmp ult <4 x i32> %b, %c
%o = or <4 x i1> %c1, %c2		%o = or <4 x i1> %c1, %c2
%s = select <4 x i1> %o, <4 x i32> %a, <4 x i32> %b		%s = select <4 x i1> %o, <4 x i32> %a, <4 x i32> %b
ret <4 x i32> %s		ret <4 x i32> %s
}		}

define arm_aapcs_vfpcc <4 x i32> @cmpugt_v4i1(<4 x i32> %a, <4 x i32> %b, <4 x i32> %c) {		define arm_aapcs_vfpcc <4 x i32> @cmpugt_v4i1(<4 x i32> %a, <4 x i32> %b, <4 x i32> %c) {
; CHECK-LABEL: cmpugt_v4i1:		; CHECK-LABEL: cmpugt_v4i1:
; CHECK: @ %bb.0: @ %entry		; CHECK: @ %bb.0: @ %entry
; CHECK-NEXT: vcmp.u32 hi, q1, q2		; CHECK-NEXT: vcmp.u32 hi, q1, q2
; CHECK-NEXT: vmrs r0, p0		; CHECK-NEXT: vpnot
; CHECK-NEXT: vcmp.i32 eq, q0, zr		; CHECK-NEXT: vpst
; CHECK-NEXT: vmrs r1, p0		; CHECK-NEXT: vcmpt.i32 ne, q0, zr
; CHECK-NEXT: orrs r0, r1		; CHECK-NEXT: vpsel q0, q1, q0
; CHECK-NEXT: vmsr p0, r0
; CHECK-NEXT: vpsel q0, q0, q1
; CHECK-NEXT: bx lr		; CHECK-NEXT: bx lr
entry:		entry:
%c1 = icmp eq <4 x i32> %a, zeroinitializer		%c1 = icmp eq <4 x i32> %a, zeroinitializer
%c2 = icmp ugt <4 x i32> %b, %c		%c2 = icmp ugt <4 x i32> %b, %c
%o = or <4 x i1> %c1, %c2		%o = or <4 x i1> %c1, %c2
%s = select <4 x i1> %o, <4 x i32> %a, <4 x i32> %b		%s = select <4 x i1> %o, <4 x i32> %a, <4 x i32> %b
ret <4 x i32> %s		ret <4 x i32> %s
}		}

define arm_aapcs_vfpcc <4 x i32> @cmpule_v4i1(<4 x i32> %a, <4 x i32> %b, <4 x i32> %c) {		define arm_aapcs_vfpcc <4 x i32> @cmpule_v4i1(<4 x i32> %a, <4 x i32> %b, <4 x i32> %c) {
; CHECK-LABEL: cmpule_v4i1:		; CHECK-LABEL: cmpule_v4i1:
; CHECK: @ %bb.0: @ %entry		; CHECK: @ %bb.0: @ %entry
; CHECK-NEXT: vcmp.u32 cs, q2, q1		; CHECK-NEXT: vcmp.u32 cs, q2, q1
; CHECK-NEXT: vmrs r0, p0		; CHECK-NEXT: vpnot
; CHECK-NEXT: vcmp.i32 eq, q0, zr		; CHECK-NEXT: vpst
; CHECK-NEXT: vmrs r1, p0		; CHECK-NEXT: vcmpt.i32 ne, q0, zr
; CHECK-NEXT: orrs r0, r1		; CHECK-NEXT: vpsel q0, q1, q0
; CHECK-NEXT: vmsr p0, r0
; CHECK-NEXT: vpsel q0, q0, q1
; CHECK-NEXT: bx lr		; CHECK-NEXT: bx lr
entry:		entry:
%c1 = icmp eq <4 x i32> %a, zeroinitializer		%c1 = icmp eq <4 x i32> %a, zeroinitializer
%c2 = icmp ule <4 x i32> %b, %c		%c2 = icmp ule <4 x i32> %b, %c
%o = or <4 x i1> %c1, %c2		%o = or <4 x i1> %c1, %c2
%s = select <4 x i1> %o, <4 x i32> %a, <4 x i32> %b		%s = select <4 x i1> %o, <4 x i32> %a, <4 x i32> %b
ret <4 x i32> %s		ret <4 x i32> %s
}		}

define arm_aapcs_vfpcc <4 x i32> @cmpuge_v4i1(<4 x i32> %a, <4 x i32> %b, <4 x i32> %c) {		define arm_aapcs_vfpcc <4 x i32> @cmpuge_v4i1(<4 x i32> %a, <4 x i32> %b, <4 x i32> %c) {
; CHECK-LABEL: cmpuge_v4i1:		; CHECK-LABEL: cmpuge_v4i1:
; CHECK: @ %bb.0: @ %entry		; CHECK: @ %bb.0: @ %entry
; CHECK-NEXT: vcmp.u32 cs, q1, q2		; CHECK-NEXT: vcmp.u32 cs, q1, q2
; CHECK-NEXT: vmrs r0, p0		; CHECK-NEXT: vpnot
; CHECK-NEXT: vcmp.i32 eq, q0, zr		; CHECK-NEXT: vpst
; CHECK-NEXT: vmrs r1, p0		; CHECK-NEXT: vcmpt.i32 ne, q0, zr
; CHECK-NEXT: orrs r0, r1		; CHECK-NEXT: vpsel q0, q1, q0
; CHECK-NEXT: vmsr p0, r0
; CHECK-NEXT: vpsel q0, q0, q1
; CHECK-NEXT: bx lr		; CHECK-NEXT: bx lr
entry:		entry:
%c1 = icmp eq <4 x i32> %a, zeroinitializer		%c1 = icmp eq <4 x i32> %a, zeroinitializer
%c2 = icmp uge <4 x i32> %b, %c		%c2 = icmp uge <4 x i32> %b, %c
%o = or <4 x i1> %c1, %c2		%o = or <4 x i1> %c1, %c2
%s = select <4 x i1> %o, <4 x i32> %a, <4 x i32> %b		%s = select <4 x i1> %o, <4 x i32> %a, <4 x i32> %b
ret <4 x i32> %s		ret <4 x i32> %s
}		}
▲ Show 20 Lines • Show All 171 Lines • Show Last 20 Lines

llvm/test/CodeGen/Thumb2/mve-vcmpf.ll

	Show First 20 Lines • Show All 477 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: lsls r0, r2, #31			; CHECK-MVE-NEXT: lsls r0, r2, #31
	; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9			; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9
	; CHECK-MVE-NEXT: lsls r0, r1, #31			; CHECK-MVE-NEXT: lsls r0, r1, #31
	; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8			; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_ugt_v4f32:			; CHECK-MVEFP-LABEL: vcmp_ugt_v4f32:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f32 ge, q1, q0			; CHECK-MVEFP-NEXT: vcmp.f32 lt, q1, q0
	; CHECK-MVEFP-NEXT: vpsel q0, q3, q2			; CHECK-MVEFP-NEXT: vpsel q0, q2, q3
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp ugt <4 x float> %src, %src2			%c = fcmp ugt <4 x float> %src, %src2
	%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b			%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b
	ret <4 x float> %s			ret <4 x float> %s
	}			}

	define arm_aapcs_vfpcc <4 x float> @vcmp_uge_v4f32(<4 x float> %src, <4 x float> %src2, <4 x float> %a, <4 x float> %b) {			define arm_aapcs_vfpcc <4 x float> @vcmp_uge_v4f32(<4 x float> %src, <4 x float> %src2, <4 x float> %a, <4 x float> %b) {
	Show All 34 Lines
	; CHECK-MVE-NEXT: lsls r0, r2, #31			; CHECK-MVE-NEXT: lsls r0, r2, #31
	; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9			; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9
	; CHECK-MVE-NEXT: lsls r0, r1, #31			; CHECK-MVE-NEXT: lsls r0, r1, #31
	; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8			; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_uge_v4f32:			; CHECK-MVEFP-LABEL: vcmp_uge_v4f32:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f32 gt, q1, q0			; CHECK-MVEFP-NEXT: vcmp.f32 le, q1, q0
	; CHECK-MVEFP-NEXT: vpsel q0, q3, q2			; CHECK-MVEFP-NEXT: vpsel q0, q2, q3
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp uge <4 x float> %src, %src2			%c = fcmp uge <4 x float> %src, %src2
	%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b			%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b
	ret <4 x float> %s			ret <4 x float> %s
	}			}

	define arm_aapcs_vfpcc <4 x float> @vcmp_ult_v4f32(<4 x float> %src, <4 x float> %src2, <4 x float> %a, <4 x float> %b) {			define arm_aapcs_vfpcc <4 x float> @vcmp_ult_v4f32(<4 x float> %src, <4 x float> %src2, <4 x float> %a, <4 x float> %b) {
	Show All 34 Lines
	; CHECK-MVE-NEXT: lsls r0, r2, #31			; CHECK-MVE-NEXT: lsls r0, r2, #31
	; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9			; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9
	; CHECK-MVE-NEXT: lsls r0, r1, #31			; CHECK-MVE-NEXT: lsls r0, r1, #31
	; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8			; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_ult_v4f32:			; CHECK-MVEFP-LABEL: vcmp_ult_v4f32:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f32 ge, q0, q1			; CHECK-MVEFP-NEXT: vcmp.f32 lt, q0, q1
	; CHECK-MVEFP-NEXT: vpsel q0, q3, q2			; CHECK-MVEFP-NEXT: vpsel q0, q2, q3
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp ult <4 x float> %src, %src2			%c = fcmp ult <4 x float> %src, %src2
	%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b			%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b
	ret <4 x float> %s			ret <4 x float> %s
	}			}

	define arm_aapcs_vfpcc <4 x float> @vcmp_ule_v4f32(<4 x float> %src, <4 x float> %src2, <4 x float> %a, <4 x float> %b) {			define arm_aapcs_vfpcc <4 x float> @vcmp_ule_v4f32(<4 x float> %src, <4 x float> %src2, <4 x float> %a, <4 x float> %b) {
	Show All 34 Lines
	; CHECK-MVE-NEXT: lsls r0, r2, #31			; CHECK-MVE-NEXT: lsls r0, r2, #31
	; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9			; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9
	; CHECK-MVE-NEXT: lsls r0, r1, #31			; CHECK-MVE-NEXT: lsls r0, r1, #31
	; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8			; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_ule_v4f32:			; CHECK-MVEFP-LABEL: vcmp_ule_v4f32:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f32 gt, q0, q1			; CHECK-MVEFP-NEXT: vcmp.f32 le, q0, q1
	; CHECK-MVEFP-NEXT: vpsel q0, q3, q2			; CHECK-MVEFP-NEXT: vpsel q0, q2, q3
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp ule <4 x float> %src, %src2			%c = fcmp ule <4 x float> %src, %src2
	%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b			%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b
	ret <4 x float> %s			ret <4 x float> %s
	}			}

	define arm_aapcs_vfpcc <4 x float> @vcmp_ord_v4f32(<4 x float> %src, <4 x float> %src2, <4 x float> %a, <4 x float> %b) {			define arm_aapcs_vfpcc <4 x float> @vcmp_ord_v4f32(<4 x float> %src, <4 x float> %src2, <4 x float> %a, <4 x float> %b) {
	▲ Show 20 Lines • Show All 1,240 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: vmov r0, s0			; CHECK-MVE-NEXT: vmov r0, s0
	; CHECK-MVE-NEXT: vmov.16 q4[7], r0			; CHECK-MVE-NEXT: vmov.16 q4[7], r0
	; CHECK-MVE-NEXT: vmov q0, q4			; CHECK-MVE-NEXT: vmov q0, q4
	; CHECK-MVE-NEXT: vpop {d8, d9, d10, d11}			; CHECK-MVE-NEXT: vpop {d8, d9, d10, d11}
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_ugt_v8f16:			; CHECK-MVEFP-LABEL: vcmp_ugt_v8f16:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f16 ge, q1, q0			; CHECK-MVEFP-NEXT: vcmp.f16 lt, q1, q0
	; CHECK-MVEFP-NEXT: vpsel q0, q3, q2			; CHECK-MVEFP-NEXT: vpsel q0, q2, q3
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp ugt <8 x half> %src, %src2			%c = fcmp ugt <8 x half> %src, %src2
	%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b			%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b
	ret <8 x half> %s			ret <8 x half> %s
	}			}

	define arm_aapcs_vfpcc <8 x half> @vcmp_uge_v8f16(<8 x half> %src, <8 x half> %src2, <8 x half> %a, <8 x half> %b) {			define arm_aapcs_vfpcc <8 x half> @vcmp_uge_v8f16(<8 x half> %src, <8 x half> %src2, <8 x half> %a, <8 x half> %b) {
	▲ Show 20 Lines • Show All 106 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: vmov r0, s0			; CHECK-MVE-NEXT: vmov r0, s0
	; CHECK-MVE-NEXT: vmov.16 q4[7], r0			; CHECK-MVE-NEXT: vmov.16 q4[7], r0
	; CHECK-MVE-NEXT: vmov q0, q4			; CHECK-MVE-NEXT: vmov q0, q4
	; CHECK-MVE-NEXT: vpop {d8, d9, d10, d11}			; CHECK-MVE-NEXT: vpop {d8, d9, d10, d11}
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_uge_v8f16:			; CHECK-MVEFP-LABEL: vcmp_uge_v8f16:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f16 gt, q1, q0			; CHECK-MVEFP-NEXT: vcmp.f16 le, q1, q0
	; CHECK-MVEFP-NEXT: vpsel q0, q3, q2			; CHECK-MVEFP-NEXT: vpsel q0, q2, q3
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp uge <8 x half> %src, %src2			%c = fcmp uge <8 x half> %src, %src2
	%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b			%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b
	ret <8 x half> %s			ret <8 x half> %s
	}			}

	define arm_aapcs_vfpcc <8 x half> @vcmp_ult_v8f16(<8 x half> %src, <8 x half> %src2, <8 x half> %a, <8 x half> %b) {			define arm_aapcs_vfpcc <8 x half> @vcmp_ult_v8f16(<8 x half> %src, <8 x half> %src2, <8 x half> %a, <8 x half> %b) {
	▲ Show 20 Lines • Show All 106 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: vmov r0, s0			; CHECK-MVE-NEXT: vmov r0, s0
	; CHECK-MVE-NEXT: vmov.16 q4[7], r0			; CHECK-MVE-NEXT: vmov.16 q4[7], r0
	; CHECK-MVE-NEXT: vmov q0, q4			; CHECK-MVE-NEXT: vmov q0, q4
	; CHECK-MVE-NEXT: vpop {d8, d9, d10, d11}			; CHECK-MVE-NEXT: vpop {d8, d9, d10, d11}
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_ult_v8f16:			; CHECK-MVEFP-LABEL: vcmp_ult_v8f16:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f16 ge, q0, q1			; CHECK-MVEFP-NEXT: vcmp.f16 lt, q0, q1
	; CHECK-MVEFP-NEXT: vpsel q0, q3, q2			; CHECK-MVEFP-NEXT: vpsel q0, q2, q3
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp ult <8 x half> %src, %src2			%c = fcmp ult <8 x half> %src, %src2
	%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b			%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b
	ret <8 x half> %s			ret <8 x half> %s
	}			}

	define arm_aapcs_vfpcc <8 x half> @vcmp_ule_v8f16(<8 x half> %src, <8 x half> %src2, <8 x half> %a, <8 x half> %b) {			define arm_aapcs_vfpcc <8 x half> @vcmp_ule_v8f16(<8 x half> %src, <8 x half> %src2, <8 x half> %a, <8 x half> %b) {
	▲ Show 20 Lines • Show All 106 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: vmov r0, s0			; CHECK-MVE-NEXT: vmov r0, s0
	; CHECK-MVE-NEXT: vmov.16 q4[7], r0			; CHECK-MVE-NEXT: vmov.16 q4[7], r0
	; CHECK-MVE-NEXT: vmov q0, q4			; CHECK-MVE-NEXT: vmov q0, q4
	; CHECK-MVE-NEXT: vpop {d8, d9, d10, d11}			; CHECK-MVE-NEXT: vpop {d8, d9, d10, d11}
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_ule_v8f16:			; CHECK-MVEFP-LABEL: vcmp_ule_v8f16:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f16 gt, q0, q1			; CHECK-MVEFP-NEXT: vcmp.f16 le, q0, q1
	; CHECK-MVEFP-NEXT: vpsel q0, q3, q2			; CHECK-MVEFP-NEXT: vpsel q0, q2, q3
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp ule <8 x half> %src, %src2			%c = fcmp ule <8 x half> %src, %src2
	%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b			%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b
	ret <8 x half> %s			ret <8 x half> %s
	}			}

	define arm_aapcs_vfpcc <8 x half> @vcmp_ord_v8f16(<8 x half> %src, <8 x half> %src2, <8 x half> %a, <8 x half> %b) {			define arm_aapcs_vfpcc <8 x half> @vcmp_ord_v8f16(<8 x half> %src, <8 x half> %src2, <8 x half> %a, <8 x half> %b) {
	▲ Show 20 Lines • Show All 248 Lines • Show Last 20 Lines

llvm/test/CodeGen/Thumb2/mve-vcmpfr.ll

	Show First 20 Lines • Show All 502 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9			; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9
	; CHECK-MVE-NEXT: lsls r0, r1, #31			; CHECK-MVE-NEXT: lsls r0, r1, #31
	; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8			; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_ugt_v4f32:			; CHECK-MVEFP-LABEL: vcmp_ugt_v4f32:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vmov r0, s4			; CHECK-MVEFP-NEXT: vmov r0, s4
	; CHECK-MVEFP-NEXT: vcmp.f32 le, q0, r0			; CHECK-MVEFP-NEXT: vcmp.f32 gt, q0, r0
	; CHECK-MVEFP-NEXT: vpsel q0, q3, q2			; CHECK-MVEFP-NEXT: vpsel q0, q2, q3
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%i = insertelement <4 x float> undef, float %src2, i32 0			%i = insertelement <4 x float> undef, float %src2, i32 0
	%sp = shufflevector <4 x float> %i, <4 x float> undef, <4 x i32> zeroinitializer			%sp = shufflevector <4 x float> %i, <4 x float> undef, <4 x i32> zeroinitializer
	%c = fcmp ugt <4 x float> %src, %sp			%c = fcmp ugt <4 x float> %src, %sp
	%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b			%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b
	ret <4 x float> %s			ret <4 x float> %s
	}			}
	Show All 37 Lines
	; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9			; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9
	; CHECK-MVE-NEXT: lsls r0, r1, #31			; CHECK-MVE-NEXT: lsls r0, r1, #31
	; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8			; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_uge_v4f32:			; CHECK-MVEFP-LABEL: vcmp_uge_v4f32:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vmov r0, s4			; CHECK-MVEFP-NEXT: vmov r0, s4
	; CHECK-MVEFP-NEXT: vcmp.f32 lt, q0, r0			; CHECK-MVEFP-NEXT: vcmp.f32 ge, q0, r0
	; CHECK-MVEFP-NEXT: vpsel q0, q3, q2			; CHECK-MVEFP-NEXT: vpsel q0, q2, q3
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%i = insertelement <4 x float> undef, float %src2, i32 0			%i = insertelement <4 x float> undef, float %src2, i32 0
	%sp = shufflevector <4 x float> %i, <4 x float> undef, <4 x i32> zeroinitializer			%sp = shufflevector <4 x float> %i, <4 x float> undef, <4 x i32> zeroinitializer
	%c = fcmp uge <4 x float> %src, %sp			%c = fcmp uge <4 x float> %src, %sp
	%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b			%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b
	ret <4 x float> %s			ret <4 x float> %s
	}			}
	Show All 37 Lines
	; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9			; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9
	; CHECK-MVE-NEXT: lsls r0, r1, #31			; CHECK-MVE-NEXT: lsls r0, r1, #31
	; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8			; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_ult_v4f32:			; CHECK-MVEFP-LABEL: vcmp_ult_v4f32:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vmov r0, s4			; CHECK-MVEFP-NEXT: vmov r0, s4
	; CHECK-MVEFP-NEXT: vcmp.f32 ge, q0, r0			; CHECK-MVEFP-NEXT: vcmp.f32 lt, q0, r0
	; CHECK-MVEFP-NEXT: vpsel q0, q3, q2			; CHECK-MVEFP-NEXT: vpsel q0, q2, q3
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%i = insertelement <4 x float> undef, float %src2, i32 0			%i = insertelement <4 x float> undef, float %src2, i32 0
	%sp = shufflevector <4 x float> %i, <4 x float> undef, <4 x i32> zeroinitializer			%sp = shufflevector <4 x float> %i, <4 x float> undef, <4 x i32> zeroinitializer
	%c = fcmp ult <4 x float> %src, %sp			%c = fcmp ult <4 x float> %src, %sp
	%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b			%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b
	ret <4 x float> %s			ret <4 x float> %s
	}			}
	Show All 37 Lines
	; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9			; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9
	; CHECK-MVE-NEXT: lsls r0, r1, #31			; CHECK-MVE-NEXT: lsls r0, r1, #31
	; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8			; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_ule_v4f32:			; CHECK-MVEFP-LABEL: vcmp_ule_v4f32:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vmov r0, s4			; CHECK-MVEFP-NEXT: vmov r0, s4
	; CHECK-MVEFP-NEXT: vcmp.f32 gt, q0, r0			; CHECK-MVEFP-NEXT: vcmp.f32 le, q0, r0
	; CHECK-MVEFP-NEXT: vpsel q0, q3, q2			; CHECK-MVEFP-NEXT: vpsel q0, q2, q3
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%i = insertelement <4 x float> undef, float %src2, i32 0			%i = insertelement <4 x float> undef, float %src2, i32 0
	%sp = shufflevector <4 x float> %i, <4 x float> undef, <4 x i32> zeroinitializer			%sp = shufflevector <4 x float> %i, <4 x float> undef, <4 x i32> zeroinitializer
	%c = fcmp ule <4 x float> %src, %sp			%c = fcmp ule <4 x float> %src, %sp
	%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b			%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b
	ret <4 x float> %s			ret <4 x float> %s
	}			}
	▲ Show 20 Lines • Show All 1,254 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: vmov.16 q3[7], r0			; CHECK-MVE-NEXT: vmov.16 q3[7], r0
	; CHECK-MVE-NEXT: vmov q0, q3			; CHECK-MVE-NEXT: vmov q0, q3
	; CHECK-MVE-NEXT: vpop {d8, d9, d10}			; CHECK-MVE-NEXT: vpop {d8, d9, d10}
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_ugt_v8f16:			; CHECK-MVEFP-LABEL: vcmp_ugt_v8f16:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: ldrh r0, [r0]			; CHECK-MVEFP-NEXT: ldrh r0, [r0]
	; CHECK-MVEFP-NEXT: vcmp.f16 le, q0, r0			; CHECK-MVEFP-NEXT: vcmp.f16 gt, q0, r0
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%src2 = load half, half* %src2p			%src2 = load half, half* %src2p
	%i = insertelement <8 x half> undef, half %src2, i32 0			%i = insertelement <8 x half> undef, half %src2, i32 0
	%sp = shufflevector <8 x half> %i, <8 x half> undef, <8 x i32> zeroinitializer			%sp = shufflevector <8 x half> %i, <8 x half> undef, <8 x i32> zeroinitializer
	%c = fcmp ugt <8 x half> %src, %sp			%c = fcmp ugt <8 x half> %src, %sp
	%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b			%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b
	ret <8 x half> %s			ret <8 x half> %s
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: vmov.16 q3[7], r0			; CHECK-MVE-NEXT: vmov.16 q3[7], r0
	; CHECK-MVE-NEXT: vmov q0, q3			; CHECK-MVE-NEXT: vmov q0, q3
	; CHECK-MVE-NEXT: vpop {d8, d9, d10}			; CHECK-MVE-NEXT: vpop {d8, d9, d10}
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_uge_v8f16:			; CHECK-MVEFP-LABEL: vcmp_uge_v8f16:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: ldrh r0, [r0]			; CHECK-MVEFP-NEXT: ldrh r0, [r0]
	; CHECK-MVEFP-NEXT: vcmp.f16 lt, q0, r0			; CHECK-MVEFP-NEXT: vcmp.f16 ge, q0, r0
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%src2 = load half, half* %src2p			%src2 = load half, half* %src2p
	%i = insertelement <8 x half> undef, half %src2, i32 0			%i = insertelement <8 x half> undef, half %src2, i32 0
	%sp = shufflevector <8 x half> %i, <8 x half> undef, <8 x i32> zeroinitializer			%sp = shufflevector <8 x half> %i, <8 x half> undef, <8 x i32> zeroinitializer
	%c = fcmp uge <8 x half> %src, %sp			%c = fcmp uge <8 x half> %src, %sp
	%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b			%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b
	ret <8 x half> %s			ret <8 x half> %s
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: vmov.16 q3[7], r0			; CHECK-MVE-NEXT: vmov.16 q3[7], r0
	; CHECK-MVE-NEXT: vmov q0, q3			; CHECK-MVE-NEXT: vmov q0, q3
	; CHECK-MVE-NEXT: vpop {d8, d9, d10}			; CHECK-MVE-NEXT: vpop {d8, d9, d10}
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_ult_v8f16:			; CHECK-MVEFP-LABEL: vcmp_ult_v8f16:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: ldrh r0, [r0]			; CHECK-MVEFP-NEXT: ldrh r0, [r0]
	; CHECK-MVEFP-NEXT: vcmp.f16 ge, q0, r0			; CHECK-MVEFP-NEXT: vcmp.f16 lt, q0, r0
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%src2 = load half, half* %src2p			%src2 = load half, half* %src2p
	%i = insertelement <8 x half> undef, half %src2, i32 0			%i = insertelement <8 x half> undef, half %src2, i32 0
	%sp = shufflevector <8 x half> %i, <8 x half> undef, <8 x i32> zeroinitializer			%sp = shufflevector <8 x half> %i, <8 x half> undef, <8 x i32> zeroinitializer
	%c = fcmp ult <8 x half> %src, %sp			%c = fcmp ult <8 x half> %src, %sp
	%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b			%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b
	ret <8 x half> %s			ret <8 x half> %s
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: vmov.16 q3[7], r0			; CHECK-MVE-NEXT: vmov.16 q3[7], r0
	; CHECK-MVE-NEXT: vmov q0, q3			; CHECK-MVE-NEXT: vmov q0, q3
	; CHECK-MVE-NEXT: vpop {d8, d9, d10}			; CHECK-MVE-NEXT: vpop {d8, d9, d10}
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_ule_v8f16:			; CHECK-MVEFP-LABEL: vcmp_ule_v8f16:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: ldrh r0, [r0]			; CHECK-MVEFP-NEXT: ldrh r0, [r0]
	; CHECK-MVEFP-NEXT: vcmp.f16 gt, q0, r0			; CHECK-MVEFP-NEXT: vcmp.f16 le, q0, r0
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%src2 = load half, half* %src2p			%src2 = load half, half* %src2p
	%i = insertelement <8 x half> undef, half %src2, i32 0			%i = insertelement <8 x half> undef, half %src2, i32 0
	%sp = shufflevector <8 x half> %i, <8 x half> undef, <8 x i32> zeroinitializer			%sp = shufflevector <8 x half> %i, <8 x half> undef, <8 x i32> zeroinitializer
	%c = fcmp ule <8 x half> %src, %sp			%c = fcmp ule <8 x half> %src, %sp
	%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b			%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b
	ret <8 x half> %s			ret <8 x half> %s
	▲ Show 20 Lines • Show All 755 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9			; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9
	; CHECK-MVE-NEXT: lsls r0, r1, #31			; CHECK-MVE-NEXT: lsls r0, r1, #31
	; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8			; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_r_ugt_v4f32:			; CHECK-MVEFP-LABEL: vcmp_r_ugt_v4f32:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vmov r0, s4			; CHECK-MVEFP-NEXT: vmov r0, s4
	; CHECK-MVEFP-NEXT: vcmp.f32 ge, q0, r0			; CHECK-MVEFP-NEXT: vcmp.f32 lt, q0, r0
	; CHECK-MVEFP-NEXT: vpsel q0, q3, q2			; CHECK-MVEFP-NEXT: vpsel q0, q2, q3
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%i = insertelement <4 x float> undef, float %src2, i32 0			%i = insertelement <4 x float> undef, float %src2, i32 0
	%sp = shufflevector <4 x float> %i, <4 x float> undef, <4 x i32> zeroinitializer			%sp = shufflevector <4 x float> %i, <4 x float> undef, <4 x i32> zeroinitializer
	%c = fcmp ugt <4 x float> %sp, %src			%c = fcmp ugt <4 x float> %sp, %src
	%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b			%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b
	ret <4 x float> %s			ret <4 x float> %s
	}			}
	Show All 37 Lines
	; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9			; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9
	; CHECK-MVE-NEXT: lsls r0, r1, #31			; CHECK-MVE-NEXT: lsls r0, r1, #31
	; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8			; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_r_uge_v4f32:			; CHECK-MVEFP-LABEL: vcmp_r_uge_v4f32:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vmov r0, s4			; CHECK-MVEFP-NEXT: vmov r0, s4
	; CHECK-MVEFP-NEXT: vcmp.f32 gt, q0, r0			; CHECK-MVEFP-NEXT: vcmp.f32 le, q0, r0
	; CHECK-MVEFP-NEXT: vpsel q0, q3, q2			; CHECK-MVEFP-NEXT: vpsel q0, q2, q3
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%i = insertelement <4 x float> undef, float %src2, i32 0			%i = insertelement <4 x float> undef, float %src2, i32 0
	%sp = shufflevector <4 x float> %i, <4 x float> undef, <4 x i32> zeroinitializer			%sp = shufflevector <4 x float> %i, <4 x float> undef, <4 x i32> zeroinitializer
	%c = fcmp uge <4 x float> %sp, %src			%c = fcmp uge <4 x float> %sp, %src
	%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b			%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b
	ret <4 x float> %s			ret <4 x float> %s
	}			}
	Show All 37 Lines
	; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9			; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9
	; CHECK-MVE-NEXT: lsls r0, r1, #31			; CHECK-MVE-NEXT: lsls r0, r1, #31
	; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8			; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_r_ult_v4f32:			; CHECK-MVEFP-LABEL: vcmp_r_ult_v4f32:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vmov r0, s4			; CHECK-MVEFP-NEXT: vmov r0, s4
	; CHECK-MVEFP-NEXT: vcmp.f32 le, q0, r0			; CHECK-MVEFP-NEXT: vcmp.f32 gt, q0, r0
	; CHECK-MVEFP-NEXT: vpsel q0, q3, q2			; CHECK-MVEFP-NEXT: vpsel q0, q2, q3
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%i = insertelement <4 x float> undef, float %src2, i32 0			%i = insertelement <4 x float> undef, float %src2, i32 0
	%sp = shufflevector <4 x float> %i, <4 x float> undef, <4 x i32> zeroinitializer			%sp = shufflevector <4 x float> %i, <4 x float> undef, <4 x i32> zeroinitializer
	%c = fcmp ult <4 x float> %sp, %src			%c = fcmp ult <4 x float> %sp, %src
	%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b			%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b
	ret <4 x float> %s			ret <4 x float> %s
	}			}
	Show All 37 Lines
	; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9			; CHECK-MVE-NEXT: vseleq.f32 s1, s13, s9
	; CHECK-MVE-NEXT: lsls r0, r1, #31			; CHECK-MVE-NEXT: lsls r0, r1, #31
	; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8			; CHECK-MVE-NEXT: vseleq.f32 s0, s12, s8
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_r_ule_v4f32:			; CHECK-MVEFP-LABEL: vcmp_r_ule_v4f32:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vmov r0, s4			; CHECK-MVEFP-NEXT: vmov r0, s4
	; CHECK-MVEFP-NEXT: vcmp.f32 lt, q0, r0			; CHECK-MVEFP-NEXT: vcmp.f32 ge, q0, r0
	; CHECK-MVEFP-NEXT: vpsel q0, q3, q2			; CHECK-MVEFP-NEXT: vpsel q0, q2, q3
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%i = insertelement <4 x float> undef, float %src2, i32 0			%i = insertelement <4 x float> undef, float %src2, i32 0
	%sp = shufflevector <4 x float> %i, <4 x float> undef, <4 x i32> zeroinitializer			%sp = shufflevector <4 x float> %i, <4 x float> undef, <4 x i32> zeroinitializer
	%c = fcmp ule <4 x float> %sp, %src			%c = fcmp ule <4 x float> %sp, %src
	%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b			%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b
	ret <4 x float> %s			ret <4 x float> %s
	}			}
	▲ Show 20 Lines • Show All 1,254 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: vmov.16 q3[7], r0			; CHECK-MVE-NEXT: vmov.16 q3[7], r0
	; CHECK-MVE-NEXT: vmov q0, q3			; CHECK-MVE-NEXT: vmov q0, q3
	; CHECK-MVE-NEXT: vpop {d8, d9, d10}			; CHECK-MVE-NEXT: vpop {d8, d9, d10}
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_r_ugt_v8f16:			; CHECK-MVEFP-LABEL: vcmp_r_ugt_v8f16:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: ldrh r0, [r0]			; CHECK-MVEFP-NEXT: ldrh r0, [r0]
	; CHECK-MVEFP-NEXT: vcmp.f16 ge, q0, r0			; CHECK-MVEFP-NEXT: vcmp.f16 lt, q0, r0
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%src2 = load half, half* %src2p			%src2 = load half, half* %src2p
	%i = insertelement <8 x half> undef, half %src2, i32 0			%i = insertelement <8 x half> undef, half %src2, i32 0
	%sp = shufflevector <8 x half> %i, <8 x half> undef, <8 x i32> zeroinitializer			%sp = shufflevector <8 x half> %i, <8 x half> undef, <8 x i32> zeroinitializer
	%c = fcmp ugt <8 x half> %sp, %src			%c = fcmp ugt <8 x half> %sp, %src
	%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b			%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b
	ret <8 x half> %s			ret <8 x half> %s
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: vmov.16 q3[7], r0			; CHECK-MVE-NEXT: vmov.16 q3[7], r0
	; CHECK-MVE-NEXT: vmov q0, q3			; CHECK-MVE-NEXT: vmov q0, q3
	; CHECK-MVE-NEXT: vpop {d8, d9, d10}			; CHECK-MVE-NEXT: vpop {d8, d9, d10}
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_r_uge_v8f16:			; CHECK-MVEFP-LABEL: vcmp_r_uge_v8f16:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: ldrh r0, [r0]			; CHECK-MVEFP-NEXT: ldrh r0, [r0]
	; CHECK-MVEFP-NEXT: vcmp.f16 gt, q0, r0			; CHECK-MVEFP-NEXT: vcmp.f16 le, q0, r0
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%src2 = load half, half* %src2p			%src2 = load half, half* %src2p
	%i = insertelement <8 x half> undef, half %src2, i32 0			%i = insertelement <8 x half> undef, half %src2, i32 0
	%sp = shufflevector <8 x half> %i, <8 x half> undef, <8 x i32> zeroinitializer			%sp = shufflevector <8 x half> %i, <8 x half> undef, <8 x i32> zeroinitializer
	%c = fcmp uge <8 x half> %sp, %src			%c = fcmp uge <8 x half> %sp, %src
	%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b			%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b
	ret <8 x half> %s			ret <8 x half> %s
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: vmov.16 q3[7], r0			; CHECK-MVE-NEXT: vmov.16 q3[7], r0
	; CHECK-MVE-NEXT: vmov q0, q3			; CHECK-MVE-NEXT: vmov q0, q3
	; CHECK-MVE-NEXT: vpop {d8, d9, d10}			; CHECK-MVE-NEXT: vpop {d8, d9, d10}
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_r_ult_v8f16:			; CHECK-MVEFP-LABEL: vcmp_r_ult_v8f16:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: ldrh r0, [r0]			; CHECK-MVEFP-NEXT: ldrh r0, [r0]
	; CHECK-MVEFP-NEXT: vcmp.f16 le, q0, r0			; CHECK-MVEFP-NEXT: vcmp.f16 gt, q0, r0
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%src2 = load half, half* %src2p			%src2 = load half, half* %src2p
	%i = insertelement <8 x half> undef, half %src2, i32 0			%i = insertelement <8 x half> undef, half %src2, i32 0
	%sp = shufflevector <8 x half> %i, <8 x half> undef, <8 x i32> zeroinitializer			%sp = shufflevector <8 x half> %i, <8 x half> undef, <8 x i32> zeroinitializer
	%c = fcmp ult <8 x half> %sp, %src			%c = fcmp ult <8 x half> %sp, %src
	%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b			%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b
	ret <8 x half> %s			ret <8 x half> %s
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: vmov.16 q3[7], r0			; CHECK-MVE-NEXT: vmov.16 q3[7], r0
	; CHECK-MVE-NEXT: vmov q0, q3			; CHECK-MVE-NEXT: vmov q0, q3
	; CHECK-MVE-NEXT: vpop {d8, d9, d10}			; CHECK-MVE-NEXT: vpop {d8, d9, d10}
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_r_ule_v8f16:			; CHECK-MVEFP-LABEL: vcmp_r_ule_v8f16:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: ldrh r0, [r0]			; CHECK-MVEFP-NEXT: ldrh r0, [r0]
	; CHECK-MVEFP-NEXT: vcmp.f16 lt, q0, r0			; CHECK-MVEFP-NEXT: vcmp.f16 ge, q0, r0
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%src2 = load half, half* %src2p			%src2 = load half, half* %src2p
	%i = insertelement <8 x half> undef, half %src2, i32 0			%i = insertelement <8 x half> undef, half %src2, i32 0
	%sp = shufflevector <8 x half> %i, <8 x half> undef, <8 x i32> zeroinitializer			%sp = shufflevector <8 x half> %i, <8 x half> undef, <8 x i32> zeroinitializer
	%c = fcmp ule <8 x half> %sp, %src			%c = fcmp ule <8 x half> %sp, %src
	%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b			%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b
	ret <8 x half> %s			ret <8 x half> %s
	▲ Show 20 Lines • Show All 388 Lines • Show Last 20 Lines

llvm/test/CodeGen/Thumb2/mve-vcmpfz.ll

	Show First 20 Lines • Show All 477 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: lsls r0, r2, #31			; CHECK-MVE-NEXT: lsls r0, r2, #31
	; CHECK-MVE-NEXT: vseleq.f32 s1, s9, s5			; CHECK-MVE-NEXT: vseleq.f32 s1, s9, s5
	; CHECK-MVE-NEXT: lsls r0, r1, #31			; CHECK-MVE-NEXT: lsls r0, r1, #31
	; CHECK-MVE-NEXT: vseleq.f32 s0, s8, s4			; CHECK-MVE-NEXT: vseleq.f32 s0, s8, s4
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_ugt_v4f32:			; CHECK-MVEFP-LABEL: vcmp_ugt_v4f32:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f32 le, q0, zr			; CHECK-MVEFP-NEXT: vcmp.f32 gt, q0, zr
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp ugt <4 x float> %src, zeroinitializer			%c = fcmp ugt <4 x float> %src, zeroinitializer
	%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b			%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b
	ret <4 x float> %s			ret <4 x float> %s
	}			}

	define arm_aapcs_vfpcc <4 x float> @vcmp_uge_v4f32(<4 x float> %src, <4 x float> %a, <4 x float> %b) {			define arm_aapcs_vfpcc <4 x float> @vcmp_uge_v4f32(<4 x float> %src, <4 x float> %a, <4 x float> %b) {
	Show All 34 Lines
	; CHECK-MVE-NEXT: lsls r0, r2, #31			; CHECK-MVE-NEXT: lsls r0, r2, #31
	; CHECK-MVE-NEXT: vseleq.f32 s1, s9, s5			; CHECK-MVE-NEXT: vseleq.f32 s1, s9, s5
	; CHECK-MVE-NEXT: lsls r0, r1, #31			; CHECK-MVE-NEXT: lsls r0, r1, #31
	; CHECK-MVE-NEXT: vseleq.f32 s0, s8, s4			; CHECK-MVE-NEXT: vseleq.f32 s0, s8, s4
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_uge_v4f32:			; CHECK-MVEFP-LABEL: vcmp_uge_v4f32:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f32 lt, q0, zr			; CHECK-MVEFP-NEXT: vcmp.f32 ge, q0, zr
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp uge <4 x float> %src, zeroinitializer			%c = fcmp uge <4 x float> %src, zeroinitializer
	%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b			%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b
	ret <4 x float> %s			ret <4 x float> %s
	}			}

	define arm_aapcs_vfpcc <4 x float> @vcmp_ult_v4f32(<4 x float> %src, <4 x float> %a, <4 x float> %b) {			define arm_aapcs_vfpcc <4 x float> @vcmp_ult_v4f32(<4 x float> %src, <4 x float> %a, <4 x float> %b) {
	Show All 34 Lines
	; CHECK-MVE-NEXT: lsls r0, r2, #31			; CHECK-MVE-NEXT: lsls r0, r2, #31
	; CHECK-MVE-NEXT: vseleq.f32 s1, s9, s5			; CHECK-MVE-NEXT: vseleq.f32 s1, s9, s5
	; CHECK-MVE-NEXT: lsls r0, r1, #31			; CHECK-MVE-NEXT: lsls r0, r1, #31
	; CHECK-MVE-NEXT: vseleq.f32 s0, s8, s4			; CHECK-MVE-NEXT: vseleq.f32 s0, s8, s4
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_ult_v4f32:			; CHECK-MVEFP-LABEL: vcmp_ult_v4f32:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f32 ge, q0, zr			; CHECK-MVEFP-NEXT: vcmp.f32 lt, q0, zr
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp ult <4 x float> %src, zeroinitializer			%c = fcmp ult <4 x float> %src, zeroinitializer
	%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b			%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b
	ret <4 x float> %s			ret <4 x float> %s
	}			}

	define arm_aapcs_vfpcc <4 x float> @vcmp_ule_v4f32(<4 x float> %src, <4 x float> %a, <4 x float> %b) {			define arm_aapcs_vfpcc <4 x float> @vcmp_ule_v4f32(<4 x float> %src, <4 x float> %a, <4 x float> %b) {
	Show All 34 Lines
	; CHECK-MVE-NEXT: lsls r0, r2, #31			; CHECK-MVE-NEXT: lsls r0, r2, #31
	; CHECK-MVE-NEXT: vseleq.f32 s1, s9, s5			; CHECK-MVE-NEXT: vseleq.f32 s1, s9, s5
	; CHECK-MVE-NEXT: lsls r0, r1, #31			; CHECK-MVE-NEXT: lsls r0, r1, #31
	; CHECK-MVE-NEXT: vseleq.f32 s0, s8, s4			; CHECK-MVE-NEXT: vseleq.f32 s0, s8, s4
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_ule_v4f32:			; CHECK-MVEFP-LABEL: vcmp_ule_v4f32:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f32 gt, q0, zr			; CHECK-MVEFP-NEXT: vcmp.f32 le, q0, zr
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp ule <4 x float> %src, zeroinitializer			%c = fcmp ule <4 x float> %src, zeroinitializer
	%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b			%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b
	ret <4 x float> %s			ret <4 x float> %s
	}			}

	define arm_aapcs_vfpcc <4 x float> @vcmp_ord_v4f32(<4 x float> %src, <4 x float> %a, <4 x float> %b) {			define arm_aapcs_vfpcc <4 x float> @vcmp_ord_v4f32(<4 x float> %src, <4 x float> %a, <4 x float> %b) {
	▲ Show 20 Lines • Show All 1,204 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: vmov r0, s0			; CHECK-MVE-NEXT: vmov r0, s0
	; CHECK-MVE-NEXT: vmov.16 q3[7], r0			; CHECK-MVE-NEXT: vmov.16 q3[7], r0
	; CHECK-MVE-NEXT: vmov q0, q3			; CHECK-MVE-NEXT: vmov q0, q3
	; CHECK-MVE-NEXT: vpop {d8, d9}			; CHECK-MVE-NEXT: vpop {d8, d9}
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_ugt_v8f16:			; CHECK-MVEFP-LABEL: vcmp_ugt_v8f16:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f16 le, q0, zr			; CHECK-MVEFP-NEXT: vcmp.f16 gt, q0, zr
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp ugt <8 x half> %src, zeroinitializer			%c = fcmp ugt <8 x half> %src, zeroinitializer
	%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b			%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b
	ret <8 x half> %s			ret <8 x half> %s
	}			}

	define arm_aapcs_vfpcc <8 x half> @vcmp_uge_v8f16(<8 x half> %src, <8 x half> %a, <8 x half> %b) {			define arm_aapcs_vfpcc <8 x half> @vcmp_uge_v8f16(<8 x half> %src, <8 x half> %a, <8 x half> %b) {
	▲ Show 20 Lines • Show All 102 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: vmov r0, s0			; CHECK-MVE-NEXT: vmov r0, s0
	; CHECK-MVE-NEXT: vmov.16 q3[7], r0			; CHECK-MVE-NEXT: vmov.16 q3[7], r0
	; CHECK-MVE-NEXT: vmov q0, q3			; CHECK-MVE-NEXT: vmov q0, q3
	; CHECK-MVE-NEXT: vpop {d8, d9}			; CHECK-MVE-NEXT: vpop {d8, d9}
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_uge_v8f16:			; CHECK-MVEFP-LABEL: vcmp_uge_v8f16:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f16 lt, q0, zr			; CHECK-MVEFP-NEXT: vcmp.f16 ge, q0, zr
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp uge <8 x half> %src, zeroinitializer			%c = fcmp uge <8 x half> %src, zeroinitializer
	%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b			%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b
	ret <8 x half> %s			ret <8 x half> %s
	}			}

	define arm_aapcs_vfpcc <8 x half> @vcmp_ult_v8f16(<8 x half> %src, <8 x half> %a, <8 x half> %b) {			define arm_aapcs_vfpcc <8 x half> @vcmp_ult_v8f16(<8 x half> %src, <8 x half> %a, <8 x half> %b) {
	▲ Show 20 Lines • Show All 102 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: vmov r0, s0			; CHECK-MVE-NEXT: vmov r0, s0
	; CHECK-MVE-NEXT: vmov.16 q3[7], r0			; CHECK-MVE-NEXT: vmov.16 q3[7], r0
	; CHECK-MVE-NEXT: vmov q0, q3			; CHECK-MVE-NEXT: vmov q0, q3
	; CHECK-MVE-NEXT: vpop {d8, d9}			; CHECK-MVE-NEXT: vpop {d8, d9}
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_ult_v8f16:			; CHECK-MVEFP-LABEL: vcmp_ult_v8f16:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f16 ge, q0, zr			; CHECK-MVEFP-NEXT: vcmp.f16 lt, q0, zr
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp ult <8 x half> %src, zeroinitializer			%c = fcmp ult <8 x half> %src, zeroinitializer
	%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b			%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b
	ret <8 x half> %s			ret <8 x half> %s
	}			}

	define arm_aapcs_vfpcc <8 x half> @vcmp_ule_v8f16(<8 x half> %src, <8 x half> %a, <8 x half> %b) {			define arm_aapcs_vfpcc <8 x half> @vcmp_ule_v8f16(<8 x half> %src, <8 x half> %a, <8 x half> %b) {
	▲ Show 20 Lines • Show All 102 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: vmov r0, s0			; CHECK-MVE-NEXT: vmov r0, s0
	; CHECK-MVE-NEXT: vmov.16 q3[7], r0			; CHECK-MVE-NEXT: vmov.16 q3[7], r0
	; CHECK-MVE-NEXT: vmov q0, q3			; CHECK-MVE-NEXT: vmov q0, q3
	; CHECK-MVE-NEXT: vpop {d8, d9}			; CHECK-MVE-NEXT: vpop {d8, d9}
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_ule_v8f16:			; CHECK-MVEFP-LABEL: vcmp_ule_v8f16:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f16 gt, q0, zr			; CHECK-MVEFP-NEXT: vcmp.f16 le, q0, zr
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp ule <8 x half> %src, zeroinitializer			%c = fcmp ule <8 x half> %src, zeroinitializer
	%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b			%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b
	ret <8 x half> %s			ret <8 x half> %s
	}			}

	define arm_aapcs_vfpcc <8 x half> @vcmp_ord_v8f16(<8 x half> %src, <8 x half> %a, <8 x half> %b) {			define arm_aapcs_vfpcc <8 x half> @vcmp_ord_v8f16(<8 x half> %src, <8 x half> %a, <8 x half> %b) {
	▲ Show 20 Lines • Show All 717 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: lsls r0, r2, #31			; CHECK-MVE-NEXT: lsls r0, r2, #31
	; CHECK-MVE-NEXT: vseleq.f32 s1, s9, s5			; CHECK-MVE-NEXT: vseleq.f32 s1, s9, s5
	; CHECK-MVE-NEXT: lsls r0, r1, #31			; CHECK-MVE-NEXT: lsls r0, r1, #31
	; CHECK-MVE-NEXT: vseleq.f32 s0, s8, s4			; CHECK-MVE-NEXT: vseleq.f32 s0, s8, s4
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_r_ugt_v4f32:			; CHECK-MVEFP-LABEL: vcmp_r_ugt_v4f32:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f32 ge, q0, zr			; CHECK-MVEFP-NEXT: vcmp.f32 lt, q0, zr
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp ugt <4 x float> zeroinitializer, %src			%c = fcmp ugt <4 x float> zeroinitializer, %src
	%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b			%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b
	ret <4 x float> %s			ret <4 x float> %s
	}			}

	define arm_aapcs_vfpcc <4 x float> @vcmp_r_uge_v4f32(<4 x float> %src, <4 x float> %a, <4 x float> %b) {			define arm_aapcs_vfpcc <4 x float> @vcmp_r_uge_v4f32(<4 x float> %src, <4 x float> %a, <4 x float> %b) {
	Show All 34 Lines
	; CHECK-MVE-NEXT: lsls r0, r2, #31			; CHECK-MVE-NEXT: lsls r0, r2, #31
	; CHECK-MVE-NEXT: vseleq.f32 s1, s9, s5			; CHECK-MVE-NEXT: vseleq.f32 s1, s9, s5
	; CHECK-MVE-NEXT: lsls r0, r1, #31			; CHECK-MVE-NEXT: lsls r0, r1, #31
	; CHECK-MVE-NEXT: vseleq.f32 s0, s8, s4			; CHECK-MVE-NEXT: vseleq.f32 s0, s8, s4
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_r_uge_v4f32:			; CHECK-MVEFP-LABEL: vcmp_r_uge_v4f32:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f32 gt, q0, zr			; CHECK-MVEFP-NEXT: vcmp.f32 le, q0, zr
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp uge <4 x float> zeroinitializer, %src			%c = fcmp uge <4 x float> zeroinitializer, %src
	%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b			%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b
	ret <4 x float> %s			ret <4 x float> %s
	}			}

	define arm_aapcs_vfpcc <4 x float> @vcmp_r_ult_v4f32(<4 x float> %src, <4 x float> %a, <4 x float> %b) {			define arm_aapcs_vfpcc <4 x float> @vcmp_r_ult_v4f32(<4 x float> %src, <4 x float> %a, <4 x float> %b) {
	Show All 34 Lines
	; CHECK-MVE-NEXT: lsls r0, r2, #31			; CHECK-MVE-NEXT: lsls r0, r2, #31
	; CHECK-MVE-NEXT: vseleq.f32 s1, s9, s5			; CHECK-MVE-NEXT: vseleq.f32 s1, s9, s5
	; CHECK-MVE-NEXT: lsls r0, r1, #31			; CHECK-MVE-NEXT: lsls r0, r1, #31
	; CHECK-MVE-NEXT: vseleq.f32 s0, s8, s4			; CHECK-MVE-NEXT: vseleq.f32 s0, s8, s4
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_r_ult_v4f32:			; CHECK-MVEFP-LABEL: vcmp_r_ult_v4f32:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f32 le, q0, zr			; CHECK-MVEFP-NEXT: vcmp.f32 gt, q0, zr
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp ult <4 x float> zeroinitializer, %src			%c = fcmp ult <4 x float> zeroinitializer, %src
	%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b			%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b
	ret <4 x float> %s			ret <4 x float> %s
	}			}

	define arm_aapcs_vfpcc <4 x float> @vcmp_r_ule_v4f32(<4 x float> %src, <4 x float> %a, <4 x float> %b) {			define arm_aapcs_vfpcc <4 x float> @vcmp_r_ule_v4f32(<4 x float> %src, <4 x float> %a, <4 x float> %b) {
	Show All 34 Lines
	; CHECK-MVE-NEXT: lsls r0, r2, #31			; CHECK-MVE-NEXT: lsls r0, r2, #31
	; CHECK-MVE-NEXT: vseleq.f32 s1, s9, s5			; CHECK-MVE-NEXT: vseleq.f32 s1, s9, s5
	; CHECK-MVE-NEXT: lsls r0, r1, #31			; CHECK-MVE-NEXT: lsls r0, r1, #31
	; CHECK-MVE-NEXT: vseleq.f32 s0, s8, s4			; CHECK-MVE-NEXT: vseleq.f32 s0, s8, s4
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_r_ule_v4f32:			; CHECK-MVEFP-LABEL: vcmp_r_ule_v4f32:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f32 lt, q0, zr			; CHECK-MVEFP-NEXT: vcmp.f32 ge, q0, zr
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp ule <4 x float> zeroinitializer, %src			%c = fcmp ule <4 x float> zeroinitializer, %src
	%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b			%s = select <4 x i1> %c, <4 x float> %a, <4 x float> %b
	ret <4 x float> %s			ret <4 x float> %s
	}			}

	define arm_aapcs_vfpcc <4 x float> @vcmp_r_ord_v4f32(<4 x float> %src, <4 x float> %a, <4 x float> %b) {			define arm_aapcs_vfpcc <4 x float> @vcmp_r_ord_v4f32(<4 x float> %src, <4 x float> %a, <4 x float> %b) {
	▲ Show 20 Lines • Show All 1,204 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: vmov r0, s0			; CHECK-MVE-NEXT: vmov r0, s0
	; CHECK-MVE-NEXT: vmov.16 q3[7], r0			; CHECK-MVE-NEXT: vmov.16 q3[7], r0
	; CHECK-MVE-NEXT: vmov q0, q3			; CHECK-MVE-NEXT: vmov q0, q3
	; CHECK-MVE-NEXT: vpop {d8, d9}			; CHECK-MVE-NEXT: vpop {d8, d9}
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_r_ugt_v8f16:			; CHECK-MVEFP-LABEL: vcmp_r_ugt_v8f16:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f16 ge, q0, zr			; CHECK-MVEFP-NEXT: vcmp.f16 lt, q0, zr
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp ugt <8 x half> zeroinitializer, %src			%c = fcmp ugt <8 x half> zeroinitializer, %src
	%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b			%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b
	ret <8 x half> %s			ret <8 x half> %s
	}			}

	define arm_aapcs_vfpcc <8 x half> @vcmp_r_uge_v8f16(<8 x half> %src, <8 x half> %a, <8 x half> %b) {			define arm_aapcs_vfpcc <8 x half> @vcmp_r_uge_v8f16(<8 x half> %src, <8 x half> %a, <8 x half> %b) {
	▲ Show 20 Lines • Show All 102 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: vmov r0, s0			; CHECK-MVE-NEXT: vmov r0, s0
	; CHECK-MVE-NEXT: vmov.16 q3[7], r0			; CHECK-MVE-NEXT: vmov.16 q3[7], r0
	; CHECK-MVE-NEXT: vmov q0, q3			; CHECK-MVE-NEXT: vmov q0, q3
	; CHECK-MVE-NEXT: vpop {d8, d9}			; CHECK-MVE-NEXT: vpop {d8, d9}
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_r_uge_v8f16:			; CHECK-MVEFP-LABEL: vcmp_r_uge_v8f16:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f16 gt, q0, zr			; CHECK-MVEFP-NEXT: vcmp.f16 le, q0, zr
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp uge <8 x half> zeroinitializer, %src			%c = fcmp uge <8 x half> zeroinitializer, %src
	%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b			%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b
	ret <8 x half> %s			ret <8 x half> %s
	}			}

	define arm_aapcs_vfpcc <8 x half> @vcmp_r_ult_v8f16(<8 x half> %src, <8 x half> %a, <8 x half> %b) {			define arm_aapcs_vfpcc <8 x half> @vcmp_r_ult_v8f16(<8 x half> %src, <8 x half> %a, <8 x half> %b) {
	▲ Show 20 Lines • Show All 102 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: vmov r0, s0			; CHECK-MVE-NEXT: vmov r0, s0
	; CHECK-MVE-NEXT: vmov.16 q3[7], r0			; CHECK-MVE-NEXT: vmov.16 q3[7], r0
	; CHECK-MVE-NEXT: vmov q0, q3			; CHECK-MVE-NEXT: vmov q0, q3
	; CHECK-MVE-NEXT: vpop {d8, d9}			; CHECK-MVE-NEXT: vpop {d8, d9}
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_r_ult_v8f16:			; CHECK-MVEFP-LABEL: vcmp_r_ult_v8f16:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f16 le, q0, zr			; CHECK-MVEFP-NEXT: vcmp.f16 gt, q0, zr
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp ult <8 x half> zeroinitializer, %src			%c = fcmp ult <8 x half> zeroinitializer, %src
	%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b			%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b
	ret <8 x half> %s			ret <8 x half> %s
	}			}

	define arm_aapcs_vfpcc <8 x half> @vcmp_r_ule_v8f16(<8 x half> %src, <8 x half> %a, <8 x half> %b) {			define arm_aapcs_vfpcc <8 x half> @vcmp_r_ule_v8f16(<8 x half> %src, <8 x half> %a, <8 x half> %b) {
	▲ Show 20 Lines • Show All 102 Lines • ▼ Show 20 Lines
	; CHECK-MVE-NEXT: vmov r0, s0			; CHECK-MVE-NEXT: vmov r0, s0
	; CHECK-MVE-NEXT: vmov.16 q3[7], r0			; CHECK-MVE-NEXT: vmov.16 q3[7], r0
	; CHECK-MVE-NEXT: vmov q0, q3			; CHECK-MVE-NEXT: vmov q0, q3
	; CHECK-MVE-NEXT: vpop {d8, d9}			; CHECK-MVE-NEXT: vpop {d8, d9}
	; CHECK-MVE-NEXT: bx lr			; CHECK-MVE-NEXT: bx lr
	;			;
	; CHECK-MVEFP-LABEL: vcmp_r_ule_v8f16:			; CHECK-MVEFP-LABEL: vcmp_r_ule_v8f16:
	; CHECK-MVEFP: @ %bb.0: @ %entry			; CHECK-MVEFP: @ %bb.0: @ %entry
	; CHECK-MVEFP-NEXT: vcmp.f16 lt, q0, zr			; CHECK-MVEFP-NEXT: vcmp.f16 ge, q0, zr
	; CHECK-MVEFP-NEXT: vpsel q0, q2, q1			; CHECK-MVEFP-NEXT: vpsel q0, q1, q2
	; CHECK-MVEFP-NEXT: bx lr			; CHECK-MVEFP-NEXT: bx lr
	entry:			entry:
	%c = fcmp ule <8 x half> zeroinitializer, %src			%c = fcmp ule <8 x half> zeroinitializer, %src
	%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b			%s = select <8 x i1> %c, <8 x half> %a, <8 x half> %b
	ret <8 x half> %s			ret <8 x half> %s
	}			}

	define arm_aapcs_vfpcc <8 x half> @vcmp_r_ord_v8f16(<8 x half> %src, <8 x half> %a, <8 x half> %b) {			define arm_aapcs_vfpcc <8 x half> @vcmp_r_ord_v8f16(<8 x half> %src, <8 x half> %a, <8 x half> %b) {
	▲ Show 20 Lines • Show All 240 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[Target][ARM] Fold or(A, B) more aggressively for I1 Vectors
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 262033

llvm/lib/Target/ARM/ARMISelLowering.cpp

llvm/test/CodeGen/Thumb2/LowOverheadLoops/cond-vector-reduce-mve-codegen.ll

llvm/test/CodeGen/Thumb2/mve-pred-or.ll

llvm/test/CodeGen/Thumb2/mve-vcmpf.ll

llvm/test/CodeGen/Thumb2/mve-vcmpfr.ll

llvm/test/CodeGen/Thumb2/mve-vcmpfz.ll

This is an archive of the discontinued LLVM Phabricator instance.

[Target][ARM] Fold or(A, B) more aggressively for I1 VectorsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 262033

llvm/lib/Target/ARM/ARMISelLowering.cpp

llvm/test/CodeGen/Thumb2/LowOverheadLoops/cond-vector-reduce-mve-codegen.ll

llvm/test/CodeGen/Thumb2/mve-pred-or.ll

llvm/test/CodeGen/Thumb2/mve-vcmpf.ll

llvm/test/CodeGen/Thumb2/mve-vcmpfr.ll

llvm/test/CodeGen/Thumb2/mve-vcmpfz.ll

[Target][ARM] Fold or(A, B) more aggressively for I1 Vectors
ClosedPublic