Diff 443088

llvm/lib/Target/AArch64/AArch64ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 18,059 Lines • ▼ Show 20 Lines	static SDValue performCSELCombine(SDNode *N,
// CSEL 0, cttz(X), eq(X, 0) -> AND cttz bitwidth-1		// CSEL 0, cttz(X), eq(X, 0) -> AND cttz bitwidth-1
// CSEL cttz(X), 0, ne(X, 0) -> AND cttz bitwidth-1		// CSEL cttz(X), 0, ne(X, 0) -> AND cttz bitwidth-1
if (SDValue Folded = foldCSELofCTTZ(N, DAG))		if (SDValue Folded = foldCSELofCTTZ(N, DAG))
return Folded;		return Folded;

return performCONDCombine(N, DCI, DAG, 2, 3);		return performCONDCombine(N, DCI, DAG, 2, 3);
}		}

		// Try to re-use an already extended operand of a vector SetCC feeding a
		// extended select. Doing so avoids requiring another full extension of the
		// SET_CC result when lowering the select.
		static SDValue tryToWidenSetCCOperands(SDNode *Op, SelectionDAG &DAG) {
		EVT Op0MVT = Op->getOperand(0).getValueType();
		if (!Op0MVT.isVector() \|\| Op->use_empty())
		return SDValue();

		dmgreenUnsubmitted Done Reply Inline Actions Do you have a test for multiple uses? dmgreen: Do you have a test for multiple uses?
		fhahnAuthorUnsubmitted Done Reply Inline Actions I added one in 3836003e87ee, thanks! fhahn: I added one in 3836003e87ee, thanks!
		// Make sure that all uses of Op are VSELECTs with result matching types where
		// the result type has a larger element type than the SetCC operand.
		SDNode FirstUse = Op->use_begin();
		if (FirstUse->getOpcode() != ISD::VSELECT)
		return SDValue();
		EVT UseMVT = FirstUse->getValueType(0);
		if (UseMVT.getScalarSizeInBits() <= Op0MVT.getScalarSizeInBits())
		dmgreenUnsubmitted Done Reply Inline Actions I think this can skip the getScalarType call: UseMVT.getScalarSizeInBits() <= Op0MVT.getScalarSizeInBits() dmgreen: I think this can skip the getScalarType call: UseMVT.getScalarSizeInBits() <= Op0MVT.
		fhahnAuthorUnsubmitted Done Reply Inline Actions Thanks, simplified! fhahn: Thanks, simplified!
		return SDValue();
		if (any_of(Op->uses(), [&UseMVT](const SDNode *N) {
		return N->getOpcode() != ISD::VSELECT \|\| N->getValueType(0) != UseMVT;
		}))
		return SDValue();

		APInt V;
		if (!ISD::isConstantSplatVector(Op->getOperand(1).getNode(), V))
		return SDValue();

		SDLoc DL(Op);
		SDValue Op0ExtV;
		SDValue Op1ExtV;
		ISD::CondCode CC = cast<CondCodeSDNode>(Op->getOperand(2))->get();
		// Check if the first operand of the SET_CC is already extended. If it is,
		// split the SET_CC and re-use the extended version of the operand.
		SDNode *Op0SExt = DAG.getNodeIfExists(ISD::SIGN_EXTEND, DAG.getVTList(UseMVT),
		Op->getOperand(0));
		SDNode *Op0ZExt = DAG.getNodeIfExists(ISD::ZERO_EXTEND, DAG.getVTList(UseMVT),
		Op->getOperand(0));
		if (Op0SExt && (isSignedIntSetCC(CC) \|\| isIntEqualitySetCC(CC))) {
		dmgreenUnsubmitted Not Done Reply Inline Actions I think this might be able to combine the if blocks together for the ne/eq conditions: if (Op0SExt && (isSignedIntSetCC(CC) \|\| isIntEqualitySetCC(CC))) { Op0ExtV = SDValue(Op0SExt, 0); Op1ExtV = DAG.getNode(ISD::SIGN_EXTEND, DL, UseMVT, Op->getOperand(1)); } else if (Op0ZExt && (isUnsignedIntSetCC(CC) \|\| isIntEqualitySetCC(CC))) { Op0ExtV = SDValue(Op0ZExt, 0); Op1ExtV = DAG.getNode(ISD::ZERO_EXTEND, DL, UseMVT, Op->getOperand(1)); } else return SDValue(); dmgreen: I think this might be able to combine the if blocks together for the ne/eq conditions: ``` if…
		fhahnAuthorUnsubmitted Done Reply Inline Actions Simplified as suggested, thanks! fhahn: Simplified as suggested, thanks!
		Op0ExtV = SDValue(Op0SExt, 0);
		dmgreenUnsubmitted Done Reply Inline Actions Could these include eq and ne conditions too? dmgreen: Could these include eq and ne conditions too?
		fhahnAuthorUnsubmitted Done Reply Inline Actions Yes, updated! fhahn: Yes, updated!
		Op1ExtV = DAG.getNode(ISD::SIGN_EXTEND, DL, UseMVT, Op->getOperand(1));
		} else if (Op0ZExt && (isUnsignedIntSetCC(CC) \|\| isIntEqualitySetCC(CC))) {
		Op0ExtV = SDValue(Op0ZExt, 0);
		Op1ExtV = DAG.getNode(ISD::ZERO_EXTEND, DL, UseMVT, Op->getOperand(1));
		} else
		return SDValue();

		return DAG.getNode(ISD::SETCC, DL, UseMVT.changeVectorElementType(MVT::i1),
		Op0ExtV, Op1ExtV, Op->getOperand(2));
		}

static SDValue performSETCCCombine(SDNode *N, SelectionDAG &DAG) {		static SDValue performSETCCCombine(SDNode *N, SelectionDAG &DAG) {
assert(N->getOpcode() == ISD::SETCC && "Unexpected opcode!");		assert(N->getOpcode() == ISD::SETCC && "Unexpected opcode!");
SDValue LHS = N->getOperand(0);		SDValue LHS = N->getOperand(0);
SDValue RHS = N->getOperand(1);		SDValue RHS = N->getOperand(1);
ISD::CondCode Cond = cast<CondCodeSDNode>(N->getOperand(2))->get();		ISD::CondCode Cond = cast<CondCodeSDNode>(N->getOperand(2))->get();
SDLoc DL(N);		SDLoc DL(N);
EVT VT = N->getValueType(0);		EVT VT = N->getValueType(0);

		if (SDValue V = tryToWidenSetCCOperands(N, DAG))
		return V;

// setcc (csel 0, 1, cond, X), 1, ne ==> csel 0, 1, !cond, X		// setcc (csel 0, 1, cond, X), 1, ne ==> csel 0, 1, !cond, X
if (Cond == ISD::SETNE && isOneConstant(RHS) &&		if (Cond == ISD::SETNE && isOneConstant(RHS) &&
LHS->getOpcode() == AArch64ISD::CSEL &&		LHS->getOpcode() == AArch64ISD::CSEL &&
isNullConstant(LHS->getOperand(0)) && isOneConstant(LHS->getOperand(1)) &&		isNullConstant(LHS->getOperand(0)) && isOneConstant(LHS->getOperand(1)) &&
LHS->hasOneUse()) {		LHS->hasOneUse()) {
// Invert CSEL's condition.		// Invert CSEL's condition.
auto *OpCC = cast<ConstantSDNode>(LHS.getOperand(2));		auto *OpCC = cast<ConstantSDNode>(LHS.getOperand(2));
auto OldCond = static_cast<AArch64CC::CondCode>(OpCC->getZExtValue());		auto OldCond = static_cast<AArch64CC::CondCode>(OpCC->getZExtValue());
▲ Show 20 Lines • Show All 1,818 Lines • ▼ Show 20 Lines	void AArch64TargetLowering::ReplaceNodeResults(
case ISD::VECREDUCE_UMAX:		case ISD::VECREDUCE_UMAX:
case ISD::VECREDUCE_UMIN:		case ISD::VECREDUCE_UMIN:
Results.push_back(LowerVECREDUCE(SDValue(N, 0), DAG));		Results.push_back(LowerVECREDUCE(SDValue(N, 0), DAG));
return;		return;
case ISD::ADD:		case ISD::ADD:
case ISD::FADD:		case ISD::FADD:
ReplaceAddWithADDP(N, Results, DAG, Subtarget);		ReplaceAddWithADDP(N, Results, DAG, Subtarget);
return;		return;

dmgreenUnsubmitted Done Reply Inline Actions Whitespace dmgreen: Whitespace
fhahnAuthorUnsubmitted Done Reply Inline Actions Removed, thanks! fhahn: Removed, thanks!
case ISD::CTPOP:		case ISD::CTPOP:
if (SDValue Result = LowerCTPOP(SDValue(N, 0), DAG))		if (SDValue Result = LowerCTPOP(SDValue(N, 0), DAG))
Results.push_back(Result);		Results.push_back(Result);
return;		return;
case AArch64ISD::SADDV:		case AArch64ISD::SADDV:
ReplaceReductionResults(N, Results, DAG, ISD::ADD, AArch64ISD::SADDV);		ReplaceReductionResults(N, Results, DAG, ISD::ADD, AArch64ISD::SADDV);
return;		return;
case AArch64ISD::UADDV:		case AArch64ISD::UADDV:
▲ Show 20 Lines • Show All 1,694 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/vselect-ext.ll

Show First 20 Lines • Show All 79 Lines • ▼ Show 20 Lines	entry:
%cmp = icmp sgt <16 x i8> %a, <i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10>		%cmp = icmp sgt <16 x i8> %a, <i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10>
%sel = select <16 x i1> %cmp, <16 x i32> %ext, <16 x i32> zeroinitializer		%sel = select <16 x i1> %cmp, <16 x i32> %ext, <16 x i32> zeroinitializer
ret <16 x i32> %sel		ret <16 x i32> %sel
}		}

define <8 x i64> @same_zext_used_in_cmp_unsigned_pred_and_select_v8i64(<8 x i8> %a) {		define <8 x i64> @same_zext_used_in_cmp_unsigned_pred_and_select_v8i64(<8 x i8> %a) {
; CHECK-LABEL: same_zext_used_in_cmp_unsigned_pred_and_select_v8i64:		; CHECK-LABEL: same_zext_used_in_cmp_unsigned_pred_and_select_v8i64:
; CHECK: ; %bb.0:		; CHECK: ; %bb.0:
; CHECK-NEXT: movi.8b v1, #10		; CHECK-NEXT: ushll.8h v0, v0, #0
; CHECK-NEXT: ushll.8h v2, v0, #0		; CHECK-NEXT: mov w8, #10
; CHECK-NEXT: cmhi.8b v0, v0, v1		; CHECK-NEXT: ushll2.4s v2, v0, #0
; CHECK-NEXT: ushll.4s v1, v2, #0		; CHECK-NEXT: ushll.4s v0, v0, #0
; CHECK-NEXT: sshll.8h v0, v0, #0		; CHECK-NEXT: dup.2d v1, x8
; CHECK-NEXT: ushll2.4s v2, v2, #0		; CHECK-NEXT: ushll2.2d v3, v2, #0
; CHECK-NEXT: sshll.4s v3, v0, #0		; CHECK-NEXT: ushll2.2d v4, v0, #0
; CHECK-NEXT: sshll2.4s v0, v0, #0		; CHECK-NEXT: ushll.2d v0, v0, #0
; CHECK-NEXT: ushll.2d v4, v1, #0		; CHECK-NEXT: ushll.2d v2, v2, #0
; CHECK-NEXT: ushll.2d v5, v2, #0		; CHECK-NEXT: cmhi.2d v5, v0, v1
; CHECK-NEXT: ushll2.2d v1, v1, #0		; CHECK-NEXT: cmhi.2d v6, v2, v1
; CHECK-NEXT: ushll2.2d v2, v2, #0		; CHECK-NEXT: cmhi.2d v7, v3, v1
; CHECK-NEXT: sshll.2d v6, v3, #0		; CHECK-NEXT: cmhi.2d v1, v4, v1
; CHECK-NEXT: sshll.2d v7, v0, #0		; CHECK-NEXT: and.16b v3, v3, v7
; CHECK-NEXT: sshll2.2d v0, v0, #0		; CHECK-NEXT: and.16b v1, v4, v1
; CHECK-NEXT: sshll2.2d v16, v3, #0		; CHECK-NEXT: and.16b v2, v2, v6
; CHECK-NEXT: and.16b v3, v2, v0		; CHECK-NEXT: and.16b v0, v0, v5
; CHECK-NEXT: and.16b v1, v1, v16
; CHECK-NEXT: and.16b v2, v5, v7
; CHECK-NEXT: and.16b v0, v4, v6
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%ext = zext <8 x i8> %a to <8 x i64>		%ext = zext <8 x i8> %a to <8 x i64>
%cmp = icmp ugt <8 x i8> %a, <i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10>		%cmp = icmp ugt <8 x i8> %a, <i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10>
%sel = select <8 x i1> %cmp, <8 x i64> %ext, <8 x i64> zeroinitializer		%sel = select <8 x i1> %cmp, <8 x i64> %ext, <8 x i64> zeroinitializer
ret <8 x i64> %sel		ret <8 x i64> %sel
}		}


define <16 x i32> @same_zext_used_in_cmp_unsigned_pred_and_select_v16i32(<16 x i8> %a) {		define <16 x i32> @same_zext_used_in_cmp_unsigned_pred_and_select_v16i32(<16 x i8> %a) {
; CHECK-LABEL: same_zext_used_in_cmp_unsigned_pred_and_select_v16i32:		; CHECK-LABEL: same_zext_used_in_cmp_unsigned_pred_and_select_v16i32:
; CHECK: ; %bb.0:		; CHECK: ; %bb.0:
; CHECK-NEXT: movi.16b v1, #10		; CHECK-NEXT: movi.4s v1, #10
; CHECK-NEXT: ushll.8h v2, v0, #0		; CHECK-NEXT: ushll2.8h v2, v0, #0
; CHECK-NEXT: ushll2.8h v3, v0, #0		; CHECK-NEXT: ushll.8h v0, v0, #0
; CHECK-NEXT: ushll.4s v4, v2, #0		; CHECK-NEXT: ushll2.4s v3, v2, #0
; CHECK-NEXT: cmhi.16b v0, v0, v1		; CHECK-NEXT: ushll2.4s v4, v0, #0
; CHECK-NEXT: ushll.4s v5, v3, #0		; CHECK-NEXT: ushll.4s v0, v0, #0
; CHECK-NEXT: ushll2.4s v1, v3, #0		; CHECK-NEXT: ushll.4s v2, v2, #0
; CHECK-NEXT: sshll.8h v3, v0, #0		; CHECK-NEXT: cmhi.4s v5, v0, v1
; CHECK-NEXT: sshll2.8h v0, v0, #0		; CHECK-NEXT: cmhi.4s v6, v2, v1
; CHECK-NEXT: ushll2.4s v2, v2, #0		; CHECK-NEXT: cmhi.4s v7, v3, v1
; CHECK-NEXT: sshll.4s v6, v3, #0		; CHECK-NEXT: cmhi.4s v1, v4, v1
; CHECK-NEXT: sshll.4s v7, v0, #0		; CHECK-NEXT: and.16b v3, v3, v7
; CHECK-NEXT: sshll2.4s v0, v0, #0		; CHECK-NEXT: and.16b v1, v4, v1
; CHECK-NEXT: sshll2.4s v16, v3, #0		; CHECK-NEXT: and.16b v2, v2, v6
; CHECK-NEXT: and.16b v3, v1, v0		; CHECK-NEXT: and.16b v0, v0, v5
; CHECK-NEXT: and.16b v1, v2, v16
; CHECK-NEXT: and.16b v2, v5, v7
; CHECK-NEXT: and.16b v0, v4, v6
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%ext = zext <16 x i8> %a to <16 x i32>		%ext = zext <16 x i8> %a to <16 x i32>
%cmp = icmp ugt <16 x i8> %a, <i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10>		%cmp = icmp ugt <16 x i8> %a, <i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10>
%sel = select <16 x i1> %cmp, <16 x i32> %ext, <16 x i32> zeroinitializer		%sel = select <16 x i1> %cmp, <16 x i32> %ext, <16 x i32> zeroinitializer
ret <16 x i32> %sel		ret <16 x i32> %sel
}		}

define <8 x i32> @same_zext_used_in_cmp_unsigned_pred_and_select_v8i32(<8 x i8> %a) {		define <8 x i32> @same_zext_used_in_cmp_unsigned_pred_and_select_v8i32(<8 x i8> %a) {
; CHECK-LABEL: same_zext_used_in_cmp_unsigned_pred_and_select_v8i32:		; CHECK-LABEL: same_zext_used_in_cmp_unsigned_pred_and_select_v8i32:
; CHECK: ; %bb.0:		; CHECK: ; %bb.0:
; CHECK-NEXT: movi.8b v1, #10		; CHECK-NEXT: movi.4s v1, #10
; CHECK-NEXT: ushll.8h v2, v0, #0		; CHECK-NEXT: ushll.8h v0, v0, #0
; CHECK-NEXT: ushll.4s v3, v2, #0		; CHECK-NEXT: ushll2.4s v2, v0, #0
; CHECK-NEXT: cmhi.8b v0, v0, v1		; CHECK-NEXT: ushll.4s v0, v0, #0
; CHECK-NEXT: ushll2.4s v1, v2, #0		; CHECK-NEXT: cmhi.4s v3, v2, v1
; CHECK-NEXT: sshll.8h v0, v0, #0		; CHECK-NEXT: cmhi.4s v4, v0, v1
; CHECK-NEXT: sshll2.4s v2, v0, #0		; CHECK-NEXT: and.16b v1, v2, v3
; CHECK-NEXT: sshll.4s v0, v0, #0		; CHECK-NEXT: and.16b v0, v0, v4
; CHECK-NEXT: and.16b v1, v1, v2
; CHECK-NEXT: and.16b v0, v3, v0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%ext = zext <8 x i8> %a to <8 x i32>		%ext = zext <8 x i8> %a to <8 x i32>
%cmp = icmp ugt <8 x i8> %a, <i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10>		%cmp = icmp ugt <8 x i8> %a, <i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10>
%sel = select <8 x i1> %cmp, <8 x i32> %ext, <8 x i32> zeroinitializer		%sel = select <8 x i1> %cmp, <8 x i32> %ext, <8 x i32> zeroinitializer
ret <8 x i32> %sel		ret <8 x i32> %sel
}		}

define <8 x i32> @same_zext_used_in_cmp_unsigned_pred_and_select_v8i32_2(<8 x i16> %a) {		define <8 x i32> @same_zext_used_in_cmp_unsigned_pred_and_select_v8i32_2(<8 x i16> %a) {
; CHECK-LABEL: same_zext_used_in_cmp_unsigned_pred_and_select_v8i32_2:		; CHECK-LABEL: same_zext_used_in_cmp_unsigned_pred_and_select_v8i32_2:
		dmgreenUnsubmitted Done Reply Inline Actions Can you remove all of these with the lower cases. dmgreen: Can you remove all of these with the lower cases.
		fhahnAuthorUnsubmitted Done Reply Inline Actions Yeah I removed those. They were added by accident :( fhahn: Yeah I removed those. They were added by accident :(
; CHECK: ; %bb.0:		; CHECK: ; %bb.0:
; CHECK-NEXT: movi.8h v1, #10		; CHECK-NEXT: movi.4s v1, #10
; CHECK-NEXT: ushll.4s v2, v0, #0		; CHECK-NEXT: ushll2.4s v2, v0, #0
; CHECK-NEXT: cmhi.8h v1, v0, v1		; CHECK-NEXT: ushll.4s v0, v0, #0
; CHECK-NEXT: ushll2.4s v0, v0, #0		; CHECK-NEXT: cmhi.4s v3, v2, v1
; CHECK-NEXT: sshll2.4s v3, v1, #0		; CHECK-NEXT: cmhi.4s v4, v0, v1
; CHECK-NEXT: sshll.4s v4, v1, #0		; CHECK-NEXT: and.16b v1, v2, v3
; CHECK-NEXT: and.16b v1, v0, v3		; CHECK-NEXT: and.16b v0, v0, v4
; CHECK-NEXT: and.16b v0, v2, v4
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%ext = zext <8 x i16> %a to <8 x i32>		%ext = zext <8 x i16> %a to <8 x i32>
%cmp = icmp ugt <8 x i16> %a, <i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10>		%cmp = icmp ugt <8 x i16> %a, <i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10>
%sel = select <8 x i1> %cmp, <8 x i32> %ext, <8 x i32> zeroinitializer		%sel = select <8 x i1> %cmp, <8 x i32> %ext, <8 x i32> zeroinitializer
ret <8 x i32> %sel		ret <8 x i32> %sel
}		}


define <8 x i32> @same_zext_used_in_cmp_unsigned_pred_and_select_v8i32_from_v8i15(<8 x i15> %a) {		define <8 x i32> @same_zext_used_in_cmp_unsigned_pred_and_select_v8i32_from_v8i15(<8 x i15> %a) {
; CHECK-LABEL: same_zext_used_in_cmp_unsigned_pred_and_select_v8i32_from_v8i15:		; CHECK-LABEL: same_zext_used_in_cmp_unsigned_pred_and_select_v8i32_from_v8i15:
; CHECK: ; %bb.0:		; CHECK: ; %bb.0:
; CHECK-NEXT: movi.8h v1, #10		; CHECK-NEXT: movi.4s v1, #10
; CHECK-NEXT: bic.8h v0, #128, lsl #8		; CHECK-NEXT: bic.8h v0, #128, lsl #8
; CHECK-NEXT: ushll.4s v2, v0, #0		; CHECK-NEXT: ushll2.4s v2, v0, #0
; CHECK-NEXT: cmhi.8h v1, v0, v1		; CHECK-NEXT: ushll.4s v0, v0, #0
; CHECK-NEXT: ushll2.4s v0, v0, #0		; CHECK-NEXT: cmhi.4s v3, v2, v1
; CHECK-NEXT: ushll2.4s v3, v1, #0		; CHECK-NEXT: cmhi.4s v4, v0, v1
; CHECK-NEXT: ushll.4s v1, v1, #0		; CHECK-NEXT: and.16b v1, v2, v3
; CHECK-NEXT: shl.4s v3, v3, #17		; CHECK-NEXT: and.16b v0, v0, v4
; CHECK-NEXT: shl.4s v1, v1, #17
; CHECK-NEXT: sshr.4s v3, v3, #17
; CHECK-NEXT: sshr.4s v4, v1, #17
; CHECK-NEXT: and.16b v1, v0, v3
; CHECK-NEXT: and.16b v0, v2, v4
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%ext = zext <8 x i15> %a to <8 x i32>		%ext = zext <8 x i15> %a to <8 x i32>
%cmp = icmp ugt <8 x i15> %a, <i15 10, i15 10, i15 10, i15 10, i15 10, i15 10, i15 10, i15 10>		%cmp = icmp ugt <8 x i15> %a, <i15 10, i15 10, i15 10, i15 10, i15 10, i15 10, i15 10, i15 10>
%sel = select <8 x i1> %cmp, <8 x i32> %ext, <8 x i32> zeroinitializer		%sel = select <8 x i1> %cmp, <8 x i32> %ext, <8 x i32> zeroinitializer
ret <8 x i32> %sel		ret <8 x i32> %sel
}		}

define <7 x i32> @same_zext_used_in_cmp_unsigned_pred_and_select_v7i32(<7 x i16> %a) {		define <7 x i32> @same_zext_used_in_cmp_unsigned_pred_and_select_v7i32(<7 x i16> %a) {
▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines	; CHECK-NEXT: .loh AdrpLdr Lloh0, Lloh1
%cmp = icmp ugt <3 x i8> %a, <i8 10, i8 10, i8 10>		%cmp = icmp ugt <3 x i8> %a, <i8 10, i8 10, i8 10>
%sel = select <3 x i1> %cmp, <3 x i32> %ext, <3 x i32> zeroinitializer		%sel = select <3 x i1> %cmp, <3 x i32> %ext, <3 x i32> zeroinitializer
ret <3 x i32> %sel		ret <3 x i32> %sel
}		}

define <4 x i32> @same_zext_used_in_cmp_unsigned_pred_and_select_v4i32(<4 x i16> %a) {		define <4 x i32> @same_zext_used_in_cmp_unsigned_pred_and_select_v4i32(<4 x i16> %a) {
; CHECK-LABEL: same_zext_used_in_cmp_unsigned_pred_and_select_v4i32:		; CHECK-LABEL: same_zext_used_in_cmp_unsigned_pred_and_select_v4i32:
; CHECK: ; %bb.0:		; CHECK: ; %bb.0:
; CHECK-NEXT: movi.4h v1, #10		; CHECK-NEXT: movi.4s v1, #10
; CHECK-NEXT: ushll.4s v2, v0, #0		; CHECK-NEXT: ushll.4s v0, v0, #0
; CHECK-NEXT: cmhi.4h v0, v0, v1		; CHECK-NEXT: cmhi.4s v1, v0, v1
; CHECK-NEXT: sshll.4s v0, v0, #0		; CHECK-NEXT: and.16b v0, v0, v1
; CHECK-NEXT: and.16b v0, v2, v0
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%ext = zext <4 x i16> %a to <4 x i32>		%ext = zext <4 x i16> %a to <4 x i32>
%cmp = icmp ugt <4 x i16> %a, <i16 10, i16 10, i16 10, i16 10>		%cmp = icmp ugt <4 x i16> %a, <i16 10, i16 10, i16 10, i16 10>
%sel = select <4 x i1> %cmp, <4 x i32> %ext, <4 x i32> zeroinitializer		%sel = select <4 x i1> %cmp, <4 x i32> %ext, <4 x i32> zeroinitializer
ret <4 x i32> %sel		ret <4 x i32> %sel
}		}

define <2 x i32> @same_zext_used_in_cmp_unsigned_pred_and_select_v2i32(<2 x i16> %a) {		define <2 x i32> @same_zext_used_in_cmp_unsigned_pred_and_select_v2i32(<2 x i16> %a) {
Show All 9 Lines	; CHECK-NEXT: ret
%cmp = icmp ugt <2 x i16> %a, <i16 10, i16 10>		%cmp = icmp ugt <2 x i16> %a, <i16 10, i16 10>
%sel = select <2 x i1> %cmp, <2 x i32> %ext, <2 x i32> zeroinitializer		%sel = select <2 x i1> %cmp, <2 x i32> %ext, <2 x i32> zeroinitializer
ret <2 x i32> %sel		ret <2 x i32> %sel
}		}

define <8 x i32> @same_zext_used_in_cmp_eq_and_select_v8i32(<8 x i16> %a) {		define <8 x i32> @same_zext_used_in_cmp_eq_and_select_v8i32(<8 x i16> %a) {
; CHECK-LABEL: same_zext_used_in_cmp_eq_and_select_v8i32:		; CHECK-LABEL: same_zext_used_in_cmp_eq_and_select_v8i32:
; CHECK: ; %bb.0:		; CHECK: ; %bb.0:
; CHECK-NEXT: movi.8h v1, #10		; CHECK-NEXT: movi.4s v1, #10
; CHECK-NEXT: ushll.4s v2, v0, #0		; CHECK-NEXT: ushll2.4s v2, v0, #0
; CHECK-NEXT: cmeq.8h v1, v0, v1		; CHECK-NEXT: ushll.4s v0, v0, #0
; CHECK-NEXT: ushll2.4s v0, v0, #0		; CHECK-NEXT: cmeq.4s v3, v2, v1
; CHECK-NEXT: sshll2.4s v3, v1, #0		; CHECK-NEXT: cmeq.4s v4, v0, v1
; CHECK-NEXT: sshll.4s v4, v1, #0		; CHECK-NEXT: and.16b v1, v2, v3
; CHECK-NEXT: and.16b v1, v0, v3		; CHECK-NEXT: and.16b v0, v0, v4
; CHECK-NEXT: and.16b v0, v2, v4
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%ext = zext <8 x i16> %a to <8 x i32>		%ext = zext <8 x i16> %a to <8 x i32>
%cmp = icmp eq <8 x i16> %a, <i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10>		%cmp = icmp eq <8 x i16> %a, <i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10>
%sel = select <8 x i1> %cmp, <8 x i32> %ext, <8 x i32> zeroinitializer		%sel = select <8 x i1> %cmp, <8 x i32> %ext, <8 x i32> zeroinitializer
ret <8 x i32> %sel		ret <8 x i32> %sel
}		}

define <8 x i32> @same_zext_used_in_cmp_eq_and_select_v8i32_from_v8i13(<8 x i13> %a) {		define <8 x i32> @same_zext_used_in_cmp_eq_and_select_v8i32_from_v8i13(<8 x i13> %a) {
; CHECK-LABEL: same_zext_used_in_cmp_eq_and_select_v8i32_from_v8i13:		; CHECK-LABEL: same_zext_used_in_cmp_eq_and_select_v8i32_from_v8i13:
; CHECK: ; %bb.0:		; CHECK: ; %bb.0:
; CHECK-NEXT: movi.8h v1, #10		; CHECK-NEXT: movi.4s v1, #10
; CHECK-NEXT: bic.8h v0, #224, lsl #8		; CHECK-NEXT: bic.8h v0, #224, lsl #8
; CHECK-NEXT: ushll.4s v2, v0, #0		; CHECK-NEXT: ushll2.4s v2, v0, #0
; CHECK-NEXT: cmeq.8h v1, v0, v1		; CHECK-NEXT: ushll.4s v0, v0, #0
; CHECK-NEXT: ushll2.4s v0, v0, #0		; CHECK-NEXT: cmeq.4s v3, v2, v1
; CHECK-NEXT: ushll2.4s v3, v1, #0		; CHECK-NEXT: cmeq.4s v4, v0, v1
; CHECK-NEXT: ushll.4s v1, v1, #0		; CHECK-NEXT: and.16b v1, v2, v3
; CHECK-NEXT: shl.4s v3, v3, #19		; CHECK-NEXT: and.16b v0, v0, v4
; CHECK-NEXT: shl.4s v1, v1, #19
; CHECK-NEXT: sshr.4s v3, v3, #19
; CHECK-NEXT: sshr.4s v4, v1, #19
; CHECK-NEXT: and.16b v1, v0, v3
; CHECK-NEXT: and.16b v0, v2, v4
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%ext = zext <8 x i13> %a to <8 x i32>		%ext = zext <8 x i13> %a to <8 x i32>
%cmp = icmp eq <8 x i13> %a, <i13 10, i13 10, i13 10, i13 10, i13 10, i13 10, i13 10, i13 10>		%cmp = icmp eq <8 x i13> %a, <i13 10, i13 10, i13 10, i13 10, i13 10, i13 10, i13 10, i13 10>
%sel = select <8 x i1> %cmp, <8 x i32> %ext, <8 x i32> zeroinitializer		%sel = select <8 x i1> %cmp, <8 x i32> %ext, <8 x i32> zeroinitializer
ret <8 x i32> %sel		ret <8 x i32> %sel
}		}

define <16 x i32> @same_zext_used_in_cmp_ne_and_select_v8i32(<16 x i8> %a) {		define <16 x i32> @same_zext_used_in_cmp_ne_and_select_v8i32(<16 x i8> %a) {
; CHECK-LABEL: same_zext_used_in_cmp_ne_and_select_v8i32:		; CHECK-LABEL: same_zext_used_in_cmp_ne_and_select_v8i32:
; CHECK: ; %bb.0:		; CHECK: ; %bb.0:
; CHECK-NEXT: movi.16b v1, #10		; CHECK-NEXT: movi.4s v1, #10
; CHECK-NEXT: ushll.8h v2, v0, #0		; CHECK-NEXT: ushll2.8h v2, v0, #0
; CHECK-NEXT: ushll2.8h v3, v0, #0		; CHECK-NEXT: ushll.8h v0, v0, #0
; CHECK-NEXT: ushll.4s v4, v2, #0		; CHECK-NEXT: ushll2.4s v3, v2, #0
; CHECK-NEXT: cmeq.16b v0, v0, v1		; CHECK-NEXT: ushll2.4s v4, v0, #0
; CHECK-NEXT: ushll.4s v5, v3, #0		; CHECK-NEXT: ushll.4s v0, v0, #0
; CHECK-NEXT: mvn.16b v0, v0		; CHECK-NEXT: ushll.4s v2, v2, #0
; CHECK-NEXT: ushll2.4s v1, v3, #0		; CHECK-NEXT: cmeq.4s v5, v0, v1
; CHECK-NEXT: sshll.8h v3, v0, #0		; CHECK-NEXT: cmeq.4s v6, v2, v1
; CHECK-NEXT: sshll2.8h v0, v0, #0		; CHECK-NEXT: cmeq.4s v7, v3, v1
; CHECK-NEXT: ushll2.4s v2, v2, #0		; CHECK-NEXT: cmeq.4s v1, v4, v1
; CHECK-NEXT: sshll.4s v6, v3, #0		; CHECK-NEXT: bic.16b v3, v3, v7
; CHECK-NEXT: sshll.4s v7, v0, #0		; CHECK-NEXT: bic.16b v1, v4, v1
; CHECK-NEXT: sshll2.4s v0, v0, #0		; CHECK-NEXT: bic.16b v2, v2, v6
; CHECK-NEXT: sshll2.4s v16, v3, #0		; CHECK-NEXT: bic.16b v0, v0, v5
; CHECK-NEXT: and.16b v3, v1, v0
; CHECK-NEXT: and.16b v1, v2, v16
; CHECK-NEXT: and.16b v2, v5, v7
; CHECK-NEXT: and.16b v0, v4, v6
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%ext = zext <16 x i8> %a to <16 x i32>		%ext = zext <16 x i8> %a to <16 x i32>
%cmp = icmp ne <16 x i8> %a, <i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10>		%cmp = icmp ne <16 x i8> %a, <i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10>
%sel = select <16 x i1> %cmp, <16 x i32> %ext, <16 x i32> zeroinitializer		%sel = select <16 x i1> %cmp, <16 x i32> %ext, <16 x i32> zeroinitializer
ret <16 x i32> %sel		ret <16 x i32> %sel
}		}

; A variation of @same_zext_used_in_cmp_unsigned_pred_and_select, with with		; A variation of @same_zext_used_in_cmp_unsigned_pred_and_select, with with
▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines	entry:
%sel.2 = select <16 x i1> %cmp, <16 x i64> %v, <16 x i64> zeroinitializer		%sel.2 = select <16 x i1> %cmp, <16 x i64> %v, <16 x i64> zeroinitializer
store <16 x i64> %sel.2, <16 x i64>* %ptr		store <16 x i64> %sel.2, <16 x i64>* %ptr
ret <16 x i32> %sel		ret <16 x i32> %sel
}		}

define <16 x i32> @same_sext_used_in_cmp_signed_pred_and_select_v16i32(<16 x i8> %a) {		define <16 x i32> @same_sext_used_in_cmp_signed_pred_and_select_v16i32(<16 x i8> %a) {
; CHECK-LABEL: same_sext_used_in_cmp_signed_pred_and_select_v16i32:		; CHECK-LABEL: same_sext_used_in_cmp_signed_pred_and_select_v16i32:
; CHECK: ; %bb.0: ; %entry		; CHECK: ; %bb.0: ; %entry
; CHECK-NEXT: movi.16b v1, #10		; CHECK-NEXT: movi.4s v1, #10
; CHECK-NEXT: sshll.8h v3, v0, #0
; CHECK-NEXT: sshll2.8h v2, v0, #0		; CHECK-NEXT: sshll2.8h v2, v0, #0
; CHECK-NEXT: cmgt.16b v0, v0, v1		; CHECK-NEXT: sshll.8h v0, v0, #0
; CHECK-NEXT: ext.16b v1, v3, v3, #8		; CHECK-NEXT: sshll2.4s v3, v2, #0
; CHECK-NEXT: sshll.8h v5, v0, #0		; CHECK-NEXT: sshll2.4s v4, v0, #0
; CHECK-NEXT: sshll2.8h v0, v0, #0
; CHECK-NEXT: ext.16b v4, v2, v2, #8
; CHECK-NEXT: ext.16b v6, v5, v5, #8
; CHECK-NEXT: ext.16b v7, v0, v0, #8
; CHECK-NEXT: and.8b v0, v2, v0
; CHECK-NEXT: sshll.4s v2, v0, #0
; CHECK-NEXT: and.8b v0, v3, v5
; CHECK-NEXT: and.8b v1, v1, v6
; CHECK-NEXT: and.8b v3, v4, v7
; CHECK-NEXT: sshll.4s v0, v0, #0		; CHECK-NEXT: sshll.4s v0, v0, #0
; CHECK-NEXT: sshll.4s v1, v1, #0		; CHECK-NEXT: sshll.4s v2, v2, #0
; CHECK-NEXT: sshll.4s v3, v3, #0		; CHECK-NEXT: cmgt.4s v5, v0, v1
		; CHECK-NEXT: cmgt.4s v6, v2, v1
		; CHECK-NEXT: cmgt.4s v7, v3, v1
		; CHECK-NEXT: cmgt.4s v1, v4, v1
		; CHECK-NEXT: and.16b v3, v3, v7
		; CHECK-NEXT: and.16b v1, v4, v1
		; CHECK-NEXT: and.16b v2, v2, v6
		; CHECK-NEXT: and.16b v0, v0, v5
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%ext = sext <16 x i8> %a to <16 x i32>		%ext = sext <16 x i8> %a to <16 x i32>
%cmp = icmp sgt <16 x i8> %a, <i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10>		%cmp = icmp sgt <16 x i8> %a, <i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10>
%sel = select <16 x i1> %cmp, <16 x i32> %ext, <16 x i32> zeroinitializer		%sel = select <16 x i1> %cmp, <16 x i32> %ext, <16 x i32> zeroinitializer
ret <16 x i32> %sel		ret <16 x i32> %sel
}		}

define <8 x i32> @same_sext_used_in_cmp_eq_and_select_v8i32(<8 x i16> %a) {		define <8 x i32> @same_sext_used_in_cmp_eq_and_select_v8i32(<8 x i16> %a) {
; CHECK-LABEL: same_sext_used_in_cmp_eq_and_select_v8i32:		; CHECK-LABEL: same_sext_used_in_cmp_eq_and_select_v8i32:
; CHECK: ; %bb.0:		; CHECK: ; %bb.0:
; CHECK-NEXT: movi.8h v1, #10		; CHECK-NEXT: movi.4s v1, #10
; CHECK-NEXT: ext.16b v2, v0, v0, #8		; CHECK-NEXT: sshll2.4s v2, v0, #0
; CHECK-NEXT: cmeq.8h v1, v0, v1
; CHECK-NEXT: ext.16b v3, v1, v1, #8
; CHECK-NEXT: and.8b v0, v0, v1
; CHECK-NEXT: sshll.4s v0, v0, #0		; CHECK-NEXT: sshll.4s v0, v0, #0
; CHECK-NEXT: and.8b v1, v2, v3		; CHECK-NEXT: cmeq.4s v3, v2, v1
; CHECK-NEXT: sshll.4s v1, v1, #0		; CHECK-NEXT: cmeq.4s v4, v0, v1
		; CHECK-NEXT: and.16b v1, v2, v3
		; CHECK-NEXT: and.16b v0, v0, v4
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%ext = sext <8 x i16> %a to <8 x i32>		%ext = sext <8 x i16> %a to <8 x i32>
%cmp = icmp eq <8 x i16> %a, <i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10>		%cmp = icmp eq <8 x i16> %a, <i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10>
%sel = select <8 x i1> %cmp, <8 x i32> %ext, <8 x i32> zeroinitializer		%sel = select <8 x i1> %cmp, <8 x i32> %ext, <8 x i32> zeroinitializer
ret <8 x i32> %sel		ret <8 x i32> %sel
}		}

define <8 x i32> @same_sext_used_in_cmp_eq_and_select_v8i32_from_v8i13(<8 x i13> %a) {		define <8 x i32> @same_sext_used_in_cmp_eq_and_select_v8i32_from_v8i13(<8 x i13> %a) {
; CHECK-LABEL: same_sext_used_in_cmp_eq_and_select_v8i32_from_v8i13:		; CHECK-LABEL: same_sext_used_in_cmp_eq_and_select_v8i32_from_v8i13:
; CHECK: ; %bb.0:		; CHECK: ; %bb.0:
; CHECK-NEXT: movi.8h v1, #10		; CHECK-NEXT: ushll2.4s v2, v0, #0
; CHECK-NEXT: mov.16b v2, v0		; CHECK-NEXT: ushll.4s v0, v0, #0
; CHECK-NEXT: bic.8h v2, #224, lsl #8		; CHECK-NEXT: movi.4s v1, #10
; CHECK-NEXT: ushll2.4s v3, v0, #0
; CHECK-NEXT: cmeq.8h v1, v2, v1
; CHECK-NEXT: ushll.4s v0, v0, #0
; CHECK-NEXT: ushll.4s v2, v1, #0
; CHECK-NEXT: ushll2.4s v1, v1, #0
; CHECK-NEXT: shl.4s v3, v3, #19
; CHECK-NEXT: shl.4s v1, v1, #19
; CHECK-NEXT: shl.4s v0, v0, #19
; CHECK-NEXT: shl.4s v2, v2, #19		; CHECK-NEXT: shl.4s v2, v2, #19
; CHECK-NEXT: sshr.4s v3, v3, #19		; CHECK-NEXT: shl.4s v0, v0, #19
; CHECK-NEXT: sshr.4s v1, v1, #19
; CHECK-NEXT: sshr.4s v0, v0, #19
; CHECK-NEXT: sshr.4s v2, v2, #19		; CHECK-NEXT: sshr.4s v2, v2, #19
; CHECK-NEXT: and.16b v1, v3, v1		; CHECK-NEXT: sshr.4s v0, v0, #19
; CHECK-NEXT: and.16b v0, v0, v2		; CHECK-NEXT: cmeq.4s v3, v2, v1
		; CHECK-NEXT: cmeq.4s v4, v0, v1
		; CHECK-NEXT: and.16b v1, v2, v3
		; CHECK-NEXT: and.16b v0, v0, v4
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%ext = sext <8 x i13> %a to <8 x i32>		%ext = sext <8 x i13> %a to <8 x i32>
%cmp = icmp eq <8 x i13> %a, <i13 10, i13 10, i13 10, i13 10, i13 10, i13 10, i13 10, i13 10>		%cmp = icmp eq <8 x i13> %a, <i13 10, i13 10, i13 10, i13 10, i13 10, i13 10, i13 10, i13 10>
%sel = select <8 x i1> %cmp, <8 x i32> %ext, <8 x i32> zeroinitializer		%sel = select <8 x i1> %cmp, <8 x i32> %ext, <8 x i32> zeroinitializer
ret <8 x i32> %sel		ret <8 x i32> %sel
}		}

define <16 x i32> @same_sext_used_in_cmp_ne_and_select_v8i32(<16 x i8> %a) {		define <16 x i32> @same_sext_used_in_cmp_ne_and_select_v8i32(<16 x i8> %a) {
; CHECK-LABEL: same_sext_used_in_cmp_ne_and_select_v8i32:		; CHECK-LABEL: same_sext_used_in_cmp_ne_and_select_v8i32:
; CHECK: ; %bb.0:		; CHECK: ; %bb.0:
; CHECK-NEXT: movi.16b v1, #10		; CHECK-NEXT: movi.4s v1, #10
; CHECK-NEXT: sshll.8h v3, v0, #0
; CHECK-NEXT: sshll2.8h v2, v0, #0		; CHECK-NEXT: sshll2.8h v2, v0, #0
; CHECK-NEXT: cmeq.16b v0, v0, v1		; CHECK-NEXT: sshll.8h v0, v0, #0
; CHECK-NEXT: ext.16b v1, v3, v3, #8		; CHECK-NEXT: sshll2.4s v3, v2, #0
; CHECK-NEXT: mvn.16b v0, v0		; CHECK-NEXT: sshll2.4s v4, v0, #0
; CHECK-NEXT: sshll.8h v5, v0, #0
; CHECK-NEXT: sshll2.8h v0, v0, #0
; CHECK-NEXT: ext.16b v4, v2, v2, #8
; CHECK-NEXT: ext.16b v6, v5, v5, #8
; CHECK-NEXT: ext.16b v7, v0, v0, #8
; CHECK-NEXT: and.8b v0, v2, v0
; CHECK-NEXT: sshll.4s v2, v0, #0
; CHECK-NEXT: and.8b v0, v3, v5
; CHECK-NEXT: and.8b v1, v1, v6
; CHECK-NEXT: and.8b v3, v4, v7
; CHECK-NEXT: sshll.4s v0, v0, #0		; CHECK-NEXT: sshll.4s v0, v0, #0
; CHECK-NEXT: sshll.4s v1, v1, #0		; CHECK-NEXT: sshll.4s v2, v2, #0
; CHECK-NEXT: sshll.4s v3, v3, #0		; CHECK-NEXT: cmeq.4s v5, v0, v1
		; CHECK-NEXT: cmeq.4s v6, v2, v1
		; CHECK-NEXT: cmeq.4s v7, v3, v1
		; CHECK-NEXT: cmeq.4s v1, v4, v1
		; CHECK-NEXT: bic.16b v3, v3, v7
		; CHECK-NEXT: bic.16b v1, v4, v1
		; CHECK-NEXT: bic.16b v2, v2, v6
		; CHECK-NEXT: bic.16b v0, v0, v5
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%ext = sext <16 x i8> %a to <16 x i32>		%ext = sext <16 x i8> %a to <16 x i32>
%cmp = icmp ne <16 x i8> %a, <i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10>		%cmp = icmp ne <16 x i8> %a, <i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10>
%sel = select <16 x i1> %cmp, <16 x i32> %ext, <16 x i32> zeroinitializer		%sel = select <16 x i1> %cmp, <16 x i32> %ext, <16 x i32> zeroinitializer
ret <16 x i32> %sel		ret <16 x i32> %sel
}		}

define <8 x i32> @same_sext_used_in_cmp_signed_pred_and_select_v8i32(<8 x i16> %a) {		define <8 x i32> @same_sext_used_in_cmp_signed_pred_and_select_v8i32(<8 x i16> %a) {
; CHECK-LABEL: same_sext_used_in_cmp_signed_pred_and_select_v8i32:		; CHECK-LABEL: same_sext_used_in_cmp_signed_pred_and_select_v8i32:
; CHECK: ; %bb.0: ; %entry		; CHECK: ; %bb.0: ; %entry
; CHECK-NEXT: movi.8h v1, #10		; CHECK-NEXT: movi.4s v1, #10
; CHECK-NEXT: ext.16b v2, v0, v0, #8		; CHECK-NEXT: sshll2.4s v2, v0, #0
; CHECK-NEXT: cmgt.8h v1, v0, v1
; CHECK-NEXT: ext.16b v3, v1, v1, #8
; CHECK-NEXT: and.8b v0, v0, v1
; CHECK-NEXT: sshll.4s v0, v0, #0		; CHECK-NEXT: sshll.4s v0, v0, #0
; CHECK-NEXT: and.8b v1, v2, v3		; CHECK-NEXT: cmgt.4s v3, v2, v1
; CHECK-NEXT: sshll.4s v1, v1, #0		; CHECK-NEXT: cmgt.4s v4, v0, v1
		; CHECK-NEXT: and.16b v1, v2, v3
		; CHECK-NEXT: and.16b v0, v0, v4
; CHECK-NEXT: ret		; CHECK-NEXT: ret
entry:		entry:
%ext = sext <8 x i16> %a to <8 x i32>		%ext = sext <8 x i16> %a to <8 x i32>
%cmp = icmp sgt <8 x i16> %a, <i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10>		%cmp = icmp sgt <8 x i16> %a, <i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10>
%sel = select <8 x i1> %cmp, <8 x i32> %ext, <8 x i32> zeroinitializer		%sel = select <8 x i1> %cmp, <8 x i32> %ext, <8 x i32> zeroinitializer
ret <8 x i32> %sel		ret <8 x i32> %sel
}		}

define <8 x i32> @same_sext_used_in_cmp_unsigned_pred_and_select_v8i32_from_v8i15(<8 x i15> %a) {		define <8 x i32> @same_sext_used_in_cmp_unsigned_pred_and_select_v8i32_from_v8i15(<8 x i15> %a) {
; CHECK-LABEL: same_sext_used_in_cmp_unsigned_pred_and_select_v8i32_from_v8i15:		; CHECK-LABEL: same_sext_used_in_cmp_unsigned_pred_and_select_v8i32_from_v8i15:
; CHECK: ; %bb.0:		; CHECK: ; %bb.0:
; CHECK-NEXT: movi.8h v1, #10		; CHECK-NEXT: ushll2.4s v2, v0, #0
; CHECK-NEXT: shl.8h v2, v0, #1
; CHECK-NEXT: ushll2.4s v3, v0, #0
; CHECK-NEXT: sshr.8h v2, v2, #1
; CHECK-NEXT: ushll.4s v0, v0, #0		; CHECK-NEXT: ushll.4s v0, v0, #0
; CHECK-NEXT: shl.4s v3, v3, #17		; CHECK-NEXT: movi.4s v1, #10
; CHECK-NEXT: cmge.8h v1, v2, v1
; CHECK-NEXT: shl.4s v0, v0, #17
; CHECK-NEXT: ushll.4s v2, v1, #0
; CHECK-NEXT: sshr.4s v3, v3, #17
; CHECK-NEXT: ushll2.4s v1, v1, #0
; CHECK-NEXT: shl.4s v2, v2, #17		; CHECK-NEXT: shl.4s v2, v2, #17
; CHECK-NEXT: shl.4s v1, v1, #17		; CHECK-NEXT: shl.4s v0, v0, #17
; CHECK-NEXT: sshr.4s v0, v0, #17
; CHECK-NEXT: sshr.4s v2, v2, #17		; CHECK-NEXT: sshr.4s v2, v2, #17
; CHECK-NEXT: sshr.4s v1, v1, #17		; CHECK-NEXT: sshr.4s v0, v0, #17
; CHECK-NEXT: and.16b v0, v0, v2		; CHECK-NEXT: cmge.4s v3, v2, v1
; CHECK-NEXT: and.16b v1, v3, v1		; CHECK-NEXT: cmge.4s v4, v0, v1
		; CHECK-NEXT: and.16b v1, v2, v3
		; CHECK-NEXT: and.16b v0, v0, v4
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%ext = sext <8 x i15> %a to <8 x i32>		%ext = sext <8 x i15> %a to <8 x i32>
%cmp = icmp sge <8 x i15> %a, <i15 10, i15 10, i15 10, i15 10, i15 10, i15 10, i15 10, i15 10>		%cmp = icmp sge <8 x i15> %a, <i15 10, i15 10, i15 10, i15 10, i15 10, i15 10, i15 10, i15 10>
%sel = select <8 x i1> %cmp, <8 x i32> %ext, <8 x i32> zeroinitializer		%sel = select <8 x i1> %cmp, <8 x i32> %ext, <8 x i32> zeroinitializer
ret <8 x i32> %sel		ret <8 x i32> %sel
}		}

define <16 x i32> @same_sext_used_in_cmp_unsigned_pred_and_select(<16 x i8> %a) {		define <16 x i32> @same_sext_used_in_cmp_unsigned_pred_and_select(<16 x i8> %a) {
▲ Show 20 Lines • Show All 256 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[AArch64] Try to re-use extended operand for SETCC with vector ops.
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 443088

llvm/lib/Target/AArch64/AArch64ISelLowering.cpp

llvm/test/CodeGen/AArch64/vselect-ext.ll

This is an archive of the discontinued LLVM Phabricator instance.

[AArch64] Try to re-use extended operand for SETCC with vector ops.ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 443088

llvm/lib/Target/AArch64/AArch64ISelLowering.cpp

llvm/test/CodeGen/AArch64/vselect-ext.ll

[AArch64] Try to re-use extended operand for SETCC with vector ops.
ClosedPublic