Diff 505108

llvm/lib/CodeGen/SelectionDAG/DAGCombiner.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 11,798 Lines • ▼ Show 20 Lines	if (N0.getOpcode() == ISD::SETCC) {
//		//
// This is OK if we don't care about what happens if either operand is a		// This is OK if we don't care about what happens if either operand is a
// NaN.		// NaN.
//		//
if (N0.hasOneUse() && isLegalToCombineMinNumMaxNum(DAG, LHS, RHS, TLI)) {		if (N0.hasOneUse() && isLegalToCombineMinNumMaxNum(DAG, LHS, RHS, TLI)) {
if (SDValue FMinMax = combineMinNumMaxNum(DL, VT, LHS, RHS, N1, N2, CC))		if (SDValue FMinMax = combineMinNumMaxNum(DL, VT, LHS, RHS, N1, N2, CC))
return FMinMax;		return FMinMax;
}		}

		goldstein.w.nUnsubmitted Not Done Reply Inline Actions Maybe there should be one-use checks? Is `abd` more efficient if the sub operations are already needed? goldstein.w.n: Maybe there should be one-use checks? Is `abd` more efficient if the sub operations are already…
		RKSimonAuthorUnsubmitted Not Done Reply Inline Actions X86 is probably the worst case for this as it usually folds to sub(max(x,y),min(x,y)) - most other cases currently have a ABD instruction, or would gain from better ILP (see PPC's ABDS v4i32 variant). I'll add more extensive x86 test coverage and see what it looks like. RKSimon: X86 is probably the worst case for this as it usually folds to sub(max(x,y),min(x,y)) - most…
if (SDValue S = PerformMinMaxFpToSatCombine(LHS, RHS, N1, N2, CC, DAG))		if (SDValue S = PerformMinMaxFpToSatCombine(LHS, RHS, N1, N2, CC, DAG))
return S;		return S;
if (SDValue S = PerformUMinFpToSatCombine(LHS, RHS, N1, N2, CC, DAG))		if (SDValue S = PerformUMinFpToSatCombine(LHS, RHS, N1, N2, CC, DAG))
return S;		return S;

// If this select has a condition (setcc) with narrower operands than the		// If this select has a condition (setcc) with narrower operands than the
// select, try to widen the compare to match the select width.		// select, try to widen the compare to match the select width.
// TODO: This should be extended to handle any constant.		// TODO: This should be extended to handle any constant.
Show All 19 Lines	if (isNullOrNullSplat(RHS)) {
SDValue WideLHS = DAG.getNode(ExtOpcode, DL, WideVT, LHS);		SDValue WideLHS = DAG.getNode(ExtOpcode, DL, WideVT, LHS);
SDValue WideRHS = DAG.getNode(ExtOpcode, DL, WideVT, RHS);		SDValue WideRHS = DAG.getNode(ExtOpcode, DL, WideVT, RHS);
EVT WideSetCCVT = getSetCCResultType(WideVT);		EVT WideSetCCVT = getSetCCResultType(WideVT);
SDValue WideSetCC = DAG.getSetCC(DL, WideSetCCVT, WideLHS, WideRHS, CC);		SDValue WideSetCC = DAG.getSetCC(DL, WideSetCCVT, WideLHS, WideRHS, CC);
return DAG.getSelect(DL, N1.getValueType(), WideSetCC, N1, N2);		return DAG.getSelect(DL, N1.getValueType(), WideSetCC, N1, N2);
}		}
}		}

		// Match VSELECTs with absolute difference patterns.
		// (vselect (setcc a, b, set?gt), (sub a, b), (sub b, a)) --> (abd? a, b)
		// (vselect (setcc a, b, set?ge), (sub a, b), (sub b, a)) --> (abd? a, b)
		// (vselect (setcc a, b, set?lt), (sub b, a), (sub a, b)) --> (abd? a, b)
		// (vselect (setcc a, b, set?le), (sub b, a), (sub a, b)) --> (abd? a, b)
		if (N1.getOpcode() == ISD::SUB && N2.getOpcode() == ISD::SUB &&
		N1.getOperand(0) == N2.getOperand(1) &&
		N1.getOperand(1) == N2.getOperand(0)) {
		bool IsSigned = isSignedIntSetCC(CC);
		unsigned ABDOpc = IsSigned ? ISD::ABDS : ISD::ABDU;
		if (hasOperation(ABDOpc, VT)) {
		switch (CC) {
		case ISD::SETGT:
		case ISD::SETGE:
		case ISD::SETUGT:
		case ISD::SETUGE:
		if (LHS == N1.getOperand(0) && RHS == N1.getOperand(1))
		return DAG.getNode(ABDOpc, DL, VT, LHS, RHS);
		break;
		case ISD::SETLT:
		case ISD::SETLE:
		case ISD::SETULT:
		case ISD::SETULE:
		if (RHS == N1.getOperand(0) && LHS == N1.getOperand(1) )
		return DAG.getNode(ABDOpc, DL, VT, LHS, RHS);
		break;
		default:
		break;
		}
		}
		}

// Match VSELECTs into add with unsigned saturation.		// Match VSELECTs into add with unsigned saturation.
if (hasOperation(ISD::UADDSAT, VT)) {		if (hasOperation(ISD::UADDSAT, VT)) {
// Check if one of the arms of the VSELECT is vector with all bits set.		// Check if one of the arms of the VSELECT is vector with all bits set.
// If it's on the left side invert the predicate to simplify logic below.		// If it's on the left side invert the predicate to simplify logic below.
SDValue Other;		SDValue Other;
ISD::CondCode SatCC = CC;		ISD::CondCode SatCC = CC;
if (ISD::isConstantSplatVectorAllOnes(N1.getNode())) {		if (ISD::isConstantSplatVectorAllOnes(N1.getNode())) {
Other = N2;		Other = N2;
▲ Show 20 Lines • Show All 15,214 Lines • Show Last 20 Lines

llvm/lib/Target/PowerPC/PPCISelLowering.h

Show First 20 Lines • Show All 1,410 Lines • ▼ Show 20 Lines	private:
SDValue combineSHL(SDNode *N, DAGCombinerInfo &DCI) const;		SDValue combineSHL(SDNode *N, DAGCombinerInfo &DCI) const;
SDValue combineSRA(SDNode *N, DAGCombinerInfo &DCI) const;		SDValue combineSRA(SDNode *N, DAGCombinerInfo &DCI) const;
SDValue combineSRL(SDNode *N, DAGCombinerInfo &DCI) const;		SDValue combineSRL(SDNode *N, DAGCombinerInfo &DCI) const;
SDValue combineMUL(SDNode *N, DAGCombinerInfo &DCI) const;		SDValue combineMUL(SDNode *N, DAGCombinerInfo &DCI) const;
SDValue combineADD(SDNode *N, DAGCombinerInfo &DCI) const;		SDValue combineADD(SDNode *N, DAGCombinerInfo &DCI) const;
SDValue combineFMALike(SDNode *N, DAGCombinerInfo &DCI) const;		SDValue combineFMALike(SDNode *N, DAGCombinerInfo &DCI) const;
SDValue combineTRUNCATE(SDNode *N, DAGCombinerInfo &DCI) const;		SDValue combineTRUNCATE(SDNode *N, DAGCombinerInfo &DCI) const;
SDValue combineSetCC(SDNode *N, DAGCombinerInfo &DCI) const;		SDValue combineSetCC(SDNode *N, DAGCombinerInfo &DCI) const;
SDValue combineVSelect(SDNode *N, DAGCombinerInfo &DCI) const;
SDValue combineVectorShuffle(ShuffleVectorSDNode *SVN,		SDValue combineVectorShuffle(ShuffleVectorSDNode *SVN,
SelectionDAG &DAG) const;		SelectionDAG &DAG) const;
SDValue combineVReverseMemOP(ShuffleVectorSDNode SVN, LSBaseSDNode LSBase,		SDValue combineVReverseMemOP(ShuffleVectorSDNode SVN, LSBaseSDNode LSBase,
DAGCombinerInfo &DCI) const;		DAGCombinerInfo &DCI) const;

/// ConvertSETCCToSubtract - looks at SETCC that compares ints. It replaces		/// ConvertSETCCToSubtract - looks at SETCC that compares ints. It replaces
/// SETCC with integer subtraction when (1) there is a legal way of doing it		/// SETCC with integer subtraction when (1) there is a legal way of doing it
/// (2) keeping the result of comparison in GPR has performance benefit.		/// (2) keeping the result of comparison in GPR has performance benefit.
▲ Show 20 Lines • Show All 69 Lines • Show Last 20 Lines

llvm/lib/Target/PowerPC/PPCISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 1,384 Lines • ▼ Show 20 Lines
setTargetDAGCombine({ISD::SIGN_EXTEND, ISD::ZERO_EXTEND, ISD::ANY_EXTEND});		setTargetDAGCombine({ISD::SIGN_EXTEND, ISD::ZERO_EXTEND, ISD::ANY_EXTEND});

setTargetDAGCombine({ISD::TRUNCATE, ISD::VECTOR_SHUFFLE});		setTargetDAGCombine({ISD::TRUNCATE, ISD::VECTOR_SHUFFLE});

if (Subtarget.useCRBits()) {		if (Subtarget.useCRBits()) {
setTargetDAGCombine({ISD::TRUNCATE, ISD::SETCC, ISD::SELECT_CC});		setTargetDAGCombine({ISD::TRUNCATE, ISD::SETCC, ISD::SELECT_CC});
}		}

if (Subtarget.hasP9Altivec()) {
setTargetDAGCombine({ISD::VSELECT});
}

setLibcallName(RTLIB::LOG_F128, "logf128");		setLibcallName(RTLIB::LOG_F128, "logf128");
setLibcallName(RTLIB::LOG2_F128, "log2f128");		setLibcallName(RTLIB::LOG2_F128, "log2f128");
setLibcallName(RTLIB::LOG10_F128, "log10f128");		setLibcallName(RTLIB::LOG10_F128, "log10f128");
setLibcallName(RTLIB::EXP_F128, "expf128");		setLibcallName(RTLIB::EXP_F128, "expf128");
setLibcallName(RTLIB::EXP2_F128, "exp2f128");		setLibcallName(RTLIB::EXP2_F128, "exp2f128");
setLibcallName(RTLIB::SIN_F128, "sinf128");		setLibcallName(RTLIB::SIN_F128, "sinf128");
setLibcallName(RTLIB::COS_F128, "cosf128");		setLibcallName(RTLIB::COS_F128, "cosf128");
setLibcallName(RTLIB::POW_F128, "powf128");		setLibcallName(RTLIB::POW_F128, "powf128");
▲ Show 20 Lines • Show All 14,668 Lines • ▼ Show 20 Lines	if (LHS.getOpcode() == ISD::INTRINSIC_WO_CHAIN &&
DAG.getConstant(CompOpc, dl, MVT::i32),		DAG.getConstant(CompOpc, dl, MVT::i32),
DAG.getRegister(PPC::CR6, MVT::i32),		DAG.getRegister(PPC::CR6, MVT::i32),
N->getOperand(4), CompNode.getValue(1));		N->getOperand(4), CompNode.getValue(1));
}		}
break;		break;
}		}
case ISD::BUILD_VECTOR:		case ISD::BUILD_VECTOR:
return DAGCombineBuildVector(N, DCI);		return DAGCombineBuildVector(N, DCI);
case ISD::VSELECT:
return combineVSelect(N, DCI);
}		}

return SDValue();		return SDValue();
}		}

SDValue		SDValue
PPCTargetLowering::BuildSDIVPow2(SDNode *N, const APInt &Divisor,		PPCTargetLowering::BuildSDIVPow2(SDNode *N, const APInt &Divisor,
SelectionDAG &DAG,		SelectionDAG &DAG,
▲ Show 20 Lines • Show All 1,609 Lines • ▼ Show 20 Lines	if (const ConstantInt *CI = dyn_cast<ConstantInt>(Mask)) {
return isUInt<16>(ConstVal) \|\|		return isUInt<16>(ConstVal) \|\|
(isUInt<16>(ConstVal >> 16) && !(ConstVal & 0xFFFF));		(isUInt<16>(ConstVal >> 16) && !(ConstVal & 0xFFFF));
}		}

// For non-constant masks, we can always use the record-form and.		// For non-constant masks, we can always use the record-form and.
return true;		return true;
}		}

// For type v4i32/v8ii16/v16i8, transform
// from (vselect (setcc a, b, setugt), (sub a, b), (sub b, a)) to (abdu a, b)
// from (vselect (setcc a, b, setuge), (sub a, b), (sub b, a)) to (abdu a, b)
// from (vselect (setcc a, b, setult), (sub b, a), (sub a, b)) to (abdu a, b)
// from (vselect (setcc a, b, setule), (sub b, a), (sub a, b)) to (abdu a, b)
// TODO: Move this to DAGCombiner?
SDValue PPCTargetLowering::combineVSelect(SDNode *N,
DAGCombinerInfo &DCI) const {
assert((N->getOpcode() == ISD::VSELECT) && "Need VSELECT node here");
assert(Subtarget.hasP9Altivec() &&
"Only combine this when P9 altivec supported!");

SelectionDAG &DAG = DCI.DAG;
SDLoc dl(N);
SDValue Cond = N->getOperand(0);
SDValue TrueOpnd = N->getOperand(1);
SDValue FalseOpnd = N->getOperand(2);
EVT VT = N->getOperand(1).getValueType();

if (Cond.getOpcode() != ISD::SETCC \|\| TrueOpnd.getOpcode() != ISD::SUB \|\|
FalseOpnd.getOpcode() != ISD::SUB)
return SDValue();

// ABSD only available for type v4i32/v8i16/v16i8
if (VT != MVT::v4i32 && VT != MVT::v8i16 && VT != MVT::v16i8)
return SDValue();

// At least to save one more dependent computation
if (!(Cond.hasOneUse() \|\| TrueOpnd.hasOneUse() \|\| FalseOpnd.hasOneUse()))
return SDValue();

ISD::CondCode CC = cast<CondCodeSDNode>(Cond.getOperand(2))->get();

// Can only handle unsigned comparison here
switch (CC) {
default:
return SDValue();
case ISD::SETUGT:
case ISD::SETUGE:
break;
case ISD::SETULT:
case ISD::SETULE:
std::swap(TrueOpnd, FalseOpnd);
break;
}

SDValue CmpOpnd1 = Cond.getOperand(0);
SDValue CmpOpnd2 = Cond.getOperand(1);

// SETCC CmpOpnd1 CmpOpnd2 cond
// TrueOpnd = CmpOpnd1 - CmpOpnd2
// FalseOpnd = CmpOpnd2 - CmpOpnd1
if (TrueOpnd.getOperand(0) == CmpOpnd1 &&
TrueOpnd.getOperand(1) == CmpOpnd2 &&
FalseOpnd.getOperand(0) == CmpOpnd2 &&
FalseOpnd.getOperand(1) == CmpOpnd1) {
return DAG.getNode(ISD::ABDU, dl, N->getOperand(1).getValueType(), CmpOpnd1,
CmpOpnd2, DAG.getTargetConstant(0, dl, MVT::i32));
}

return SDValue();
}

/// getAddrModeForFlags - Based on the set of address flags, select the most		/// getAddrModeForFlags - Based on the set of address flags, select the most
/// optimal instruction format to match by.		/// optimal instruction format to match by.
PPC::AddrMode PPCTargetLowering::getAddrModeForFlags(unsigned Flags) const {		PPC::AddrMode PPCTargetLowering::getAddrModeForFlags(unsigned Flags) const {
// This is not a node we should be handling here.		// This is not a node we should be handling here.
if (Flags == PPC::MOF_None)		if (Flags == PPC::MOF_None)
return PPC::AM_None;		return PPC::AM_None;
// Unaligned D-Forms are tried first, followed by the aligned D-Forms.		// Unaligned D-Forms are tried first, followed by the aligned D-Forms.
for (auto FlagSet : AddrModesMap.at(PPC::AM_DForm))		for (auto FlagSet : AddrModesMap.at(PPC::AM_DForm))
▲ Show 20 Lines • Show All 660 Lines • Show Last 20 Lines

llvm/test/CodeGen/AArch64/abd-combine.ll

Show First 20 Lines • Show All 101 Lines • ▼ Show 20 Lines	; CHECK-NEXT: ret
%abs = call <8 x i32> @llvm.abs.v8i32(<8 x i32> %sub, i1 0)		%abs = call <8 x i32> @llvm.abs.v8i32(<8 x i32> %sub, i1 0)
%result = trunc <8 x i32> %abs to <8 x i16>		%result = trunc <8 x i32> %abs to <8 x i16>
ret <8 x i16> %result		ret <8 x i16> %result
}		}

define <8 x i16> @abdu_ugt(<8 x i16>, <8 x i16>) {		define <8 x i16> @abdu_ugt(<8 x i16>, <8 x i16>) {
; CHECK-LABEL: abdu_ugt:		; CHECK-LABEL: abdu_ugt:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: cmhi v2.8h, v0.8h, v1.8h		; CHECK-NEXT: uabd v0.8h, v0.8h, v1.8h
; CHECK-NEXT: sub v3.8h, v0.8h, v1.8h
; CHECK-NEXT: sub v0.8h, v1.8h, v0.8h
; CHECK-NEXT: bit v0.16b, v3.16b, v2.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%3 = icmp ugt <8 x i16> %0, %1		%3 = icmp ugt <8 x i16> %0, %1
%4 = sub <8 x i16> %0, %1		%4 = sub <8 x i16> %0, %1
%5 = sub <8 x i16> %1, %0		%5 = sub <8 x i16> %1, %0
%6 = select <8 x i1> %3, <8 x i16> %4, <8 x i16> %5		%6 = select <8 x i1> %3, <8 x i16> %4, <8 x i16> %5
ret <8 x i16> %6		ret <8 x i16> %6
}		}

define <8 x i16> @abdu_uge(<8 x i16>, <8 x i16>) {		define <8 x i16> @abdu_uge(<8 x i16>, <8 x i16>) {
; CHECK-LABEL: abdu_uge:		; CHECK-LABEL: abdu_uge:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: cmhs v2.8h, v0.8h, v1.8h		; CHECK-NEXT: uabd v0.8h, v0.8h, v1.8h
; CHECK-NEXT: sub v3.8h, v0.8h, v1.8h
; CHECK-NEXT: sub v0.8h, v1.8h, v0.8h
; CHECK-NEXT: bit v0.16b, v3.16b, v2.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%3 = icmp uge <8 x i16> %0, %1		%3 = icmp uge <8 x i16> %0, %1
%4 = sub <8 x i16> %0, %1		%4 = sub <8 x i16> %0, %1
%5 = sub <8 x i16> %1, %0		%5 = sub <8 x i16> %1, %0
%6 = select <8 x i1> %3, <8 x i16> %4, <8 x i16> %5		%6 = select <8 x i1> %3, <8 x i16> %4, <8 x i16> %5
ret <8 x i16> %6		ret <8 x i16> %6
}		}

define <8 x i16> @abdu_ult(<8 x i16>, <8 x i16>) {		define <8 x i16> @abdu_ult(<8 x i16>, <8 x i16>) {
; CHECK-LABEL: abdu_ult:		; CHECK-LABEL: abdu_ult:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: cmhi v2.8h, v1.8h, v0.8h		; CHECK-NEXT: uabd v0.8h, v0.8h, v1.8h
; CHECK-NEXT: sub v3.8h, v0.8h, v1.8h
; CHECK-NEXT: sub v0.8h, v1.8h, v0.8h
; CHECK-NEXT: bif v0.16b, v3.16b, v2.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%3 = icmp ult <8 x i16> %0, %1		%3 = icmp ult <8 x i16> %0, %1
%4 = sub <8 x i16> %0, %1		%4 = sub <8 x i16> %0, %1
%5 = sub <8 x i16> %1, %0		%5 = sub <8 x i16> %1, %0
%6 = select <8 x i1> %3, <8 x i16> %5, <8 x i16> %4		%6 = select <8 x i1> %3, <8 x i16> %5, <8 x i16> %4
ret <8 x i16> %6		ret <8 x i16> %6
}		}

define <8 x i16> @abdu_ule(<8 x i16>, <8 x i16>) {		define <8 x i16> @abdu_ule(<8 x i16>, <8 x i16>) {
; CHECK-LABEL: abdu_ule:		; CHECK-LABEL: abdu_ule:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: cmhs v2.8h, v1.8h, v0.8h		; CHECK-NEXT: uabd v0.8h, v0.8h, v1.8h
; CHECK-NEXT: sub v3.8h, v0.8h, v1.8h
; CHECK-NEXT: sub v0.8h, v1.8h, v0.8h
; CHECK-NEXT: bif v0.16b, v3.16b, v2.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%3 = icmp ule <8 x i16> %0, %1		%3 = icmp ule <8 x i16> %0, %1
%4 = sub <8 x i16> %0, %1		%4 = sub <8 x i16> %0, %1
%5 = sub <8 x i16> %1, %0		%5 = sub <8 x i16> %1, %0
%6 = select <8 x i1> %3, <8 x i16> %5, <8 x i16> %4		%6 = select <8 x i1> %3, <8 x i16> %5, <8 x i16> %4
ret <8 x i16> %6		ret <8 x i16> %6
}		}

define <8 x i16> @abds_sgt(<8 x i16>, <8 x i16>) {		define <8 x i16> @abds_sgt(<8 x i16>, <8 x i16>) {
; CHECK-LABEL: abds_sgt:		; CHECK-LABEL: abds_sgt:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: cmgt v2.8h, v0.8h, v1.8h		; CHECK-NEXT: sabd v0.8h, v0.8h, v1.8h
; CHECK-NEXT: sub v3.8h, v0.8h, v1.8h
; CHECK-NEXT: sub v0.8h, v1.8h, v0.8h
; CHECK-NEXT: bit v0.16b, v3.16b, v2.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%3 = icmp sgt <8 x i16> %0, %1		%3 = icmp sgt <8 x i16> %0, %1
%4 = sub <8 x i16> %0, %1		%4 = sub <8 x i16> %0, %1
%5 = sub <8 x i16> %1, %0		%5 = sub <8 x i16> %1, %0
%6 = select <8 x i1> %3, <8 x i16> %4, <8 x i16> %5		%6 = select <8 x i1> %3, <8 x i16> %4, <8 x i16> %5
ret <8 x i16> %6		ret <8 x i16> %6
}		}

define <8 x i16> @abds_sge(<8 x i16>, <8 x i16>) {		define <8 x i16> @abds_sge(<8 x i16>, <8 x i16>) {
; CHECK-LABEL: abds_sge:		; CHECK-LABEL: abds_sge:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: cmge v2.8h, v0.8h, v1.8h		; CHECK-NEXT: sabd v0.8h, v0.8h, v1.8h
; CHECK-NEXT: sub v3.8h, v0.8h, v1.8h
; CHECK-NEXT: sub v0.8h, v1.8h, v0.8h
; CHECK-NEXT: bit v0.16b, v3.16b, v2.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%3 = icmp sge <8 x i16> %0, %1		%3 = icmp sge <8 x i16> %0, %1
%4 = sub <8 x i16> %0, %1		%4 = sub <8 x i16> %0, %1
%5 = sub <8 x i16> %1, %0		%5 = sub <8 x i16> %1, %0
%6 = select <8 x i1> %3, <8 x i16> %4, <8 x i16> %5		%6 = select <8 x i1> %3, <8 x i16> %4, <8 x i16> %5
ret <8 x i16> %6		ret <8 x i16> %6
}		}

define <8 x i16> @abds_slt(<8 x i16>, <8 x i16>) {		define <8 x i16> @abds_slt(<8 x i16>, <8 x i16>) {
; CHECK-LABEL: abds_slt:		; CHECK-LABEL: abds_slt:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: cmgt v2.8h, v1.8h, v0.8h		; CHECK-NEXT: sabd v0.8h, v0.8h, v1.8h
; CHECK-NEXT: sub v3.8h, v0.8h, v1.8h
; CHECK-NEXT: sub v0.8h, v1.8h, v0.8h
; CHECK-NEXT: bif v0.16b, v3.16b, v2.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%3 = icmp slt <8 x i16> %0, %1		%3 = icmp slt <8 x i16> %0, %1
%4 = sub <8 x i16> %0, %1		%4 = sub <8 x i16> %0, %1
%5 = sub <8 x i16> %1, %0		%5 = sub <8 x i16> %1, %0
%6 = select <8 x i1> %3, <8 x i16> %5, <8 x i16> %4		%6 = select <8 x i1> %3, <8 x i16> %5, <8 x i16> %4
ret <8 x i16> %6		ret <8 x i16> %6
}		}

define <8 x i16> @abds_sle(<8 x i16>, <8 x i16>) {		define <8 x i16> @abds_sle(<8 x i16>, <8 x i16>) {
; CHECK-LABEL: abds_sle:		; CHECK-LABEL: abds_sle:
; CHECK: // %bb.0:		; CHECK: // %bb.0:
; CHECK-NEXT: cmge v2.8h, v1.8h, v0.8h		; CHECK-NEXT: sabd v0.8h, v0.8h, v1.8h
; CHECK-NEXT: sub v3.8h, v0.8h, v1.8h
; CHECK-NEXT: sub v0.8h, v1.8h, v0.8h
; CHECK-NEXT: bif v0.16b, v3.16b, v2.16b
; CHECK-NEXT: ret		; CHECK-NEXT: ret
%3 = icmp sle <8 x i16> %0, %1		%3 = icmp sle <8 x i16> %0, %1
%4 = sub <8 x i16> %0, %1		%4 = sub <8 x i16> %0, %1
%5 = sub <8 x i16> %1, %0		%5 = sub <8 x i16> %1, %0
%6 = select <8 x i1> %3, <8 x i16> %5, <8 x i16> %4		%6 = select <8 x i1> %3, <8 x i16> %5, <8 x i16> %4
ret <8 x i16> %6		ret <8 x i16> %6
}		}

▲ Show 20 Lines • Show All 331 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/ppc64-P9-vabsd.ll

Show First 20 Lines • Show All 1,828 Lines • ▼ Show 20 Lines	; CHECK-PWR78-NEXT: blr
%5 = sub <16 x i8> %1, %0		%5 = sub <16 x i8> %1, %0
%6 = select <16 x i1> %3, <16 x i8> %5, <16 x i8> %4		%6 = select <16 x i1> %3, <16 x i8> %5, <16 x i8> %4
ret <16 x i8> %6		ret <16 x i8> %6
}		}

; Tests for ABDS icmp + sub + select sequence		; Tests for ABDS icmp + sub + select sequence

define <4 x i32> @absd_int32_sgt(<4 x i32>, <4 x i32>) {		define <4 x i32> @absd_int32_sgt(<4 x i32>, <4 x i32>) {
; CHECK-LABEL: absd_int32_sgt:		; CHECK-PWR9-LABEL: absd_int32_sgt:
; CHECK: # %bb.0:		; CHECK-PWR9: # %bb.0:
; CHECK-NEXT: vcmpgtsw v4, v2, v3		; CHECK-PWR9-NEXT: xvnegsp v3, v3
; CHECK-NEXT: vsubuwm v5, v2, v3		; CHECK-PWR9-NEXT: xvnegsp v2, v2
; CHECK-NEXT: vsubuwm v2, v3, v2		; CHECK-PWR9-NEXT: vabsduw v2, v2, v3
; CHECK-NEXT: xxsel v2, v2, v5, v4		; CHECK-PWR9-NEXT: blr
; CHECK-NEXT: blr		;
		; CHECK-PWR78-LABEL: absd_int32_sgt:
		; CHECK-PWR78: # %bb.0:
		; CHECK-PWR78-NEXT: vcmpgtsw v4, v2, v3
		; CHECK-PWR78-NEXT: vsubuwm v5, v2, v3
		; CHECK-PWR78-NEXT: vsubuwm v2, v3, v2
		; CHECK-PWR78-NEXT: xxsel v2, v2, v5, v4
		; CHECK-PWR78-NEXT: blr
%3 = icmp sgt <4 x i32> %0, %1		%3 = icmp sgt <4 x i32> %0, %1
%4 = sub <4 x i32> %0, %1		%4 = sub <4 x i32> %0, %1
%5 = sub <4 x i32> %1, %0		%5 = sub <4 x i32> %1, %0
%6 = select <4 x i1> %3, <4 x i32> %4, <4 x i32> %5		%6 = select <4 x i1> %3, <4 x i32> %4, <4 x i32> %5
ret <4 x i32> %6		ret <4 x i32> %6
}		}

define <4 x i32> @absd_int32_sge(<4 x i32>, <4 x i32>) {		define <4 x i32> @absd_int32_sge(<4 x i32>, <4 x i32>) {
; CHECK-LABEL: absd_int32_sge:		; CHECK-PWR9-LABEL: absd_int32_sge:
; CHECK: # %bb.0:		; CHECK-PWR9: # %bb.0:
; CHECK-NEXT: vcmpgtsw v4, v3, v2		; CHECK-PWR9-NEXT: xvnegsp v3, v3
; CHECK-NEXT: xxlnor vs0, v4, v4		; CHECK-PWR9-NEXT: xvnegsp v2, v2
; CHECK-NEXT: vsubuwm v4, v2, v3		; CHECK-PWR9-NEXT: vabsduw v2, v2, v3
; CHECK-NEXT: vsubuwm v2, v3, v2		; CHECK-PWR9-NEXT: blr
; CHECK-NEXT: xxsel v2, v2, v4, vs0		;
; CHECK-NEXT: blr		; CHECK-PWR78-LABEL: absd_int32_sge:
		; CHECK-PWR78: # %bb.0:
		; CHECK-PWR78-NEXT: vcmpgtsw v4, v3, v2
		; CHECK-PWR78-NEXT: xxlnor vs0, v4, v4
		; CHECK-PWR78-NEXT: vsubuwm v4, v2, v3
		; CHECK-PWR78-NEXT: vsubuwm v2, v3, v2
		; CHECK-PWR78-NEXT: xxsel v2, v2, v4, vs0
		; CHECK-PWR78-NEXT: blr
%3 = icmp sge <4 x i32> %0, %1		%3 = icmp sge <4 x i32> %0, %1
%4 = sub <4 x i32> %0, %1		%4 = sub <4 x i32> %0, %1
%5 = sub <4 x i32> %1, %0		%5 = sub <4 x i32> %1, %0
%6 = select <4 x i1> %3, <4 x i32> %4, <4 x i32> %5		%6 = select <4 x i1> %3, <4 x i32> %4, <4 x i32> %5
ret <4 x i32> %6		ret <4 x i32> %6
}		}

define <4 x i32> @absd_int32_slt(<4 x i32>, <4 x i32>) {		define <4 x i32> @absd_int32_slt(<4 x i32>, <4 x i32>) {
; CHECK-LABEL: absd_int32_slt:		; CHECK-PWR9-LABEL: absd_int32_slt:
; CHECK: # %bb.0:		; CHECK-PWR9: # %bb.0:
; CHECK-NEXT: vcmpgtsw v4, v3, v2		; CHECK-PWR9-NEXT: xvnegsp v3, v3
; CHECK-NEXT: vsubuwm v5, v2, v3		; CHECK-PWR9-NEXT: xvnegsp v2, v2
; CHECK-NEXT: vsubuwm v2, v3, v2		; CHECK-PWR9-NEXT: vabsduw v2, v2, v3
; CHECK-NEXT: xxsel v2, v5, v2, v4		; CHECK-PWR9-NEXT: blr
; CHECK-NEXT: blr		;
		; CHECK-PWR78-LABEL: absd_int32_slt:
		; CHECK-PWR78: # %bb.0:
		; CHECK-PWR78-NEXT: vcmpgtsw v4, v3, v2
		; CHECK-PWR78-NEXT: vsubuwm v5, v2, v3
		; CHECK-PWR78-NEXT: vsubuwm v2, v3, v2
		; CHECK-PWR78-NEXT: xxsel v2, v5, v2, v4
		; CHECK-PWR78-NEXT: blr
%3 = icmp slt <4 x i32> %0, %1		%3 = icmp slt <4 x i32> %0, %1
%4 = sub <4 x i32> %0, %1		%4 = sub <4 x i32> %0, %1
%5 = sub <4 x i32> %1, %0		%5 = sub <4 x i32> %1, %0
%6 = select <4 x i1> %3, <4 x i32> %5, <4 x i32> %4		%6 = select <4 x i1> %3, <4 x i32> %5, <4 x i32> %4
ret <4 x i32> %6		ret <4 x i32> %6
}		}

define <4 x i32> @absd_int32_sle(<4 x i32>, <4 x i32>) {		define <4 x i32> @absd_int32_sle(<4 x i32>, <4 x i32>) {
; CHECK-LABEL: absd_int32_sle:		; CHECK-PWR9-LABEL: absd_int32_sle:
; CHECK: # %bb.0:		; CHECK-PWR9: # %bb.0:
; CHECK-NEXT: vcmpgtsw v4, v2, v3		; CHECK-PWR9-NEXT: xvnegsp v3, v3
; CHECK-NEXT: xxlnor vs0, v4, v4		; CHECK-PWR9-NEXT: xvnegsp v2, v2
; CHECK-NEXT: vsubuwm v4, v2, v3		; CHECK-PWR9-NEXT: vabsduw v2, v2, v3
; CHECK-NEXT: vsubuwm v2, v3, v2		; CHECK-PWR9-NEXT: blr
; CHECK-NEXT: xxsel v2, v4, v2, vs0		;
; CHECK-NEXT: blr		; CHECK-PWR78-LABEL: absd_int32_sle:
		; CHECK-PWR78: # %bb.0:
		; CHECK-PWR78-NEXT: vcmpgtsw v4, v2, v3
		; CHECK-PWR78-NEXT: xxlnor vs0, v4, v4
		; CHECK-PWR78-NEXT: vsubuwm v4, v2, v3
		; CHECK-PWR78-NEXT: vsubuwm v2, v3, v2
		; CHECK-PWR78-NEXT: xxsel v2, v4, v2, vs0
		; CHECK-PWR78-NEXT: blr
%3 = icmp sle <4 x i32> %0, %1		%3 = icmp sle <4 x i32> %0, %1
%4 = sub <4 x i32> %0, %1		%4 = sub <4 x i32> %0, %1
%5 = sub <4 x i32> %1, %0		%5 = sub <4 x i32> %1, %0
%6 = select <4 x i1> %3, <4 x i32> %5, <4 x i32> %4		%6 = select <4 x i1> %3, <4 x i32> %5, <4 x i32> %4
ret <4 x i32> %6		ret <4 x i32> %6
}		}

define <8 x i16> @absd_int16_sgt(<8 x i16>, <8 x i16>) {		define <8 x i16> @absd_int16_sgt(<8 x i16>, <8 x i16>) {
▲ Show 20 Lines • Show All 204 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/abds-vector-128.ll

	Show First 20 Lines • Show All 793 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: pandn %xmm1, %xmm2			; SSE2-NEXT: pandn %xmm1, %xmm2
	; SSE2-NEXT: por %xmm3, %xmm2			; SSE2-NEXT: por %xmm3, %xmm2
	; SSE2-NEXT: movdqa %xmm2, %xmm0			; SSE2-NEXT: movdqa %xmm2, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE42-LABEL: abd_cmp_v16i8:			; SSE42-LABEL: abd_cmp_v16i8:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm0, %xmm2			; SSE42-NEXT: movdqa %xmm0, %xmm2
	; SSE42-NEXT: pcmpgtb %xmm1, %xmm2			; SSE42-NEXT: pminsb %xmm1, %xmm2
	; SSE42-NEXT: movdqa %xmm0, %xmm3			; SSE42-NEXT: pmaxsb %xmm1, %xmm0
	; SSE42-NEXT: psubb %xmm1, %xmm3			; SSE42-NEXT: psubb %xmm2, %xmm0
	; SSE42-NEXT: psubb %xmm0, %xmm1
	; SSE42-NEXT: movdqa %xmm2, %xmm0
	; SSE42-NEXT: pblendvb %xmm0, %xmm3, %xmm1
	; SSE42-NEXT: movdqa %xmm1, %xmm0
	; SSE42-NEXT: retq			; SSE42-NEXT: retq
	;			;
	; AVX1-LABEL: abd_cmp_v16i8:			; AVX-LABEL: abd_cmp_v16i8:
	; AVX1: # %bb.0:			; AVX: # %bb.0:
	; AVX1-NEXT: vpcmpgtb %xmm1, %xmm0, %xmm2			; AVX-NEXT: vpminsb %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vpsubb %xmm1, %xmm0, %xmm3			; AVX-NEXT: vpmaxsb %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsubb %xmm0, %xmm1, %xmm0			; AVX-NEXT: vpsubb %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpblendvb %xmm2, %xmm3, %xmm0, %xmm0			; AVX-NEXT: retq
	; AVX1-NEXT: retq
	;
	; AVX2-LABEL: abd_cmp_v16i8:
	; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtb %xmm1, %xmm0, %xmm2
	; AVX2-NEXT: vpsubb %xmm1, %xmm0, %xmm3
	; AVX2-NEXT: vpsubb %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: vpblendvb %xmm2, %xmm3, %xmm0, %xmm0
	; AVX2-NEXT: retq
	;
	; AVX512-LABEL: abd_cmp_v16i8:
	; AVX512: # %bb.0:
	; AVX512-NEXT: vpsubb %xmm1, %xmm0, %xmm2
	; AVX512-NEXT: vpsubb %xmm0, %xmm1, %xmm3
	; AVX512-NEXT: vpcmpgtb %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpblendvb %xmm0, %xmm2, %xmm3, %xmm0
	; AVX512-NEXT: retq
	%cmp = icmp sgt <16 x i8> %a, %b			%cmp = icmp sgt <16 x i8> %a, %b
	%ab = sub <16 x i8> %a, %b			%ab = sub <16 x i8> %a, %b
	%ba = sub <16 x i8> %b, %a			%ba = sub <16 x i8> %b, %a
	%sel = select <16 x i1> %cmp, <16 x i8> %ab, <16 x i8> %ba			%sel = select <16 x i1> %cmp, <16 x i8> %ab, <16 x i8> %ba
	ret <16 x i8> %sel			ret <16 x i8> %sel
	}			}

	define <8 x i16> @abd_cmp_v8i16(<8 x i16> %a, <8 x i16> %b) nounwind {			define <8 x i16> @abd_cmp_v8i16(<8 x i16> %a, <8 x i16> %b) nounwind {
	; SSE2-LABEL: abd_cmp_v8i16:			; SSE-LABEL: abd_cmp_v8i16:
	; SSE2: # %bb.0:			; SSE: # %bb.0:
	; SSE2-NEXT: movdqa %xmm1, %xmm2			; SSE-NEXT: movdqa %xmm0, %xmm2
	; SSE2-NEXT: pcmpgtw %xmm0, %xmm2			; SSE-NEXT: pminsw %xmm1, %xmm2
	; SSE2-NEXT: movdqa %xmm0, %xmm3			; SSE-NEXT: pmaxsw %xmm1, %xmm0
	; SSE2-NEXT: psubw %xmm1, %xmm3			; SSE-NEXT: psubw %xmm2, %xmm0
	; SSE2-NEXT: psubw %xmm0, %xmm1			; SSE-NEXT: retq
	; SSE2-NEXT: pand %xmm2, %xmm1
	; SSE2-NEXT: pandn %xmm3, %xmm2
	; SSE2-NEXT: por %xmm1, %xmm2
	; SSE2-NEXT: movdqa %xmm2, %xmm0
	; SSE2-NEXT: retq
	;
	; SSE42-LABEL: abd_cmp_v8i16:
	; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm1, %xmm2
	; SSE42-NEXT: pcmpgtw %xmm0, %xmm2
	; SSE42-NEXT: movdqa %xmm0, %xmm3
	; SSE42-NEXT: psubw %xmm1, %xmm3
	; SSE42-NEXT: psubw %xmm0, %xmm1
	; SSE42-NEXT: movdqa %xmm2, %xmm0
	; SSE42-NEXT: pblendvb %xmm0, %xmm1, %xmm3
	; SSE42-NEXT: movdqa %xmm3, %xmm0
	; SSE42-NEXT: retq
	;
	; AVX1-LABEL: abd_cmp_v8i16:
	; AVX1: # %bb.0:
	; AVX1-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm2
	; AVX1-NEXT: vpsubw %xmm1, %xmm0, %xmm3
	; AVX1-NEXT: vpsubw %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vpblendvb %xmm2, %xmm0, %xmm3, %xmm0
	; AVX1-NEXT: retq
	;
	; AVX2-LABEL: abd_cmp_v8i16:
	; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm2
	; AVX2-NEXT: vpsubw %xmm1, %xmm0, %xmm3
	; AVX2-NEXT: vpsubw %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: vpblendvb %xmm2, %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: abd_cmp_v8i16:			; AVX-LABEL: abd_cmp_v8i16:
	; AVX512: # %bb.0:			; AVX: # %bb.0:
	; AVX512-NEXT: vpsubw %xmm1, %xmm0, %xmm2			; AVX-NEXT: vpminsw %xmm1, %xmm0, %xmm2
	; AVX512-NEXT: vpsubw %xmm0, %xmm1, %xmm3			; AVX-NEXT: vpmaxsw %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm0			; AVX-NEXT: vpsubw %xmm2, %xmm0, %xmm0
	; AVX512-NEXT: vpblendvb %xmm0, %xmm3, %xmm2, %xmm0			; AVX-NEXT: retq
	; AVX512-NEXT: retq
	%cmp = icmp sge <8 x i16> %a, %b			%cmp = icmp sge <8 x i16> %a, %b
	%ab = sub <8 x i16> %a, %b			%ab = sub <8 x i16> %a, %b
	%ba = sub <8 x i16> %b, %a			%ba = sub <8 x i16> %b, %a
	%sel = select <8 x i1> %cmp, <8 x i16> %ab, <8 x i16> %ba			%sel = select <8 x i1> %cmp, <8 x i16> %ab, <8 x i16> %ba
	ret <8 x i16> %sel			ret <8 x i16> %sel
	}			}

	define <4 x i32> @abd_cmp_v4i32(<4 x i32> %a, <4 x i32> %b) nounwind {			define <4 x i32> @abd_cmp_v4i32(<4 x i32> %a, <4 x i32> %b) nounwind {
	; SSE2-LABEL: abd_cmp_v4i32:			; SSE2-LABEL: abd_cmp_v4i32:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa %xmm1, %xmm2			; SSE2-NEXT: movdqa %xmm1, %xmm2
	; SSE2-NEXT: pcmpgtd %xmm0, %xmm2			; SSE2-NEXT: pcmpgtd %xmm0, %xmm2
	; SSE2-NEXT: movdqa %xmm0, %xmm3			; SSE2-NEXT: movdqa %xmm0, %xmm3
	; SSE2-NEXT: psubd %xmm1, %xmm3			; SSE2-NEXT: psubd %xmm1, %xmm3
	; SSE2-NEXT: psubd %xmm0, %xmm1			; SSE2-NEXT: psubd %xmm0, %xmm1
	; SSE2-NEXT: pand %xmm2, %xmm1			; SSE2-NEXT: pand %xmm2, %xmm1
	; SSE2-NEXT: pandn %xmm3, %xmm2			; SSE2-NEXT: pandn %xmm3, %xmm2
	; SSE2-NEXT: por %xmm1, %xmm2			; SSE2-NEXT: por %xmm1, %xmm2
	; SSE2-NEXT: movdqa %xmm2, %xmm0			; SSE2-NEXT: movdqa %xmm2, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE42-LABEL: abd_cmp_v4i32:			; SSE42-LABEL: abd_cmp_v4i32:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm1, %xmm2			; SSE42-NEXT: movdqa %xmm0, %xmm2
	; SSE42-NEXT: pcmpgtd %xmm0, %xmm2			; SSE42-NEXT: pminsd %xmm1, %xmm2
	; SSE42-NEXT: movdqa %xmm0, %xmm3			; SSE42-NEXT: pmaxsd %xmm1, %xmm0
	; SSE42-NEXT: psubd %xmm1, %xmm3			; SSE42-NEXT: psubd %xmm2, %xmm0
	; SSE42-NEXT: psubd %xmm0, %xmm1
	; SSE42-NEXT: movdqa %xmm2, %xmm0
	; SSE42-NEXT: blendvps %xmm0, %xmm1, %xmm3
	; SSE42-NEXT: movaps %xmm3, %xmm0
	; SSE42-NEXT: retq			; SSE42-NEXT: retq
	;			;
	; AVX1-LABEL: abd_cmp_v4i32:			; AVX-LABEL: abd_cmp_v4i32:
	; AVX1: # %bb.0:			; AVX: # %bb.0:
	; AVX1-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm2			; AVX-NEXT: vpminsd %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vpsubd %xmm1, %xmm0, %xmm3			; AVX-NEXT: vpmaxsd %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsubd %xmm0, %xmm1, %xmm0			; AVX-NEXT: vpsubd %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vblendvps %xmm2, %xmm0, %xmm3, %xmm0			; AVX-NEXT: retq
	; AVX1-NEXT: retq
	;
	; AVX2-LABEL: abd_cmp_v4i32:
	; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm2
	; AVX2-NEXT: vpsubd %xmm1, %xmm0, %xmm3
	; AVX2-NEXT: vpsubd %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: vblendvps %xmm2, %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: retq
	;
	; AVX512-LABEL: abd_cmp_v4i32:
	; AVX512: # %bb.0:
	; AVX512-NEXT: vpcmpgtd %xmm0, %xmm1, %k1
	; AVX512-NEXT: vpsubd %xmm1, %xmm0, %xmm2
	; AVX512-NEXT: vpsubd %xmm0, %xmm1, %xmm2 {%k1}
	; AVX512-NEXT: vmovdqa %xmm2, %xmm0
	; AVX512-NEXT: retq
	%cmp = icmp slt <4 x i32> %a, %b			%cmp = icmp slt <4 x i32> %a, %b
	%ab = sub <4 x i32> %a, %b			%ab = sub <4 x i32> %a, %b
	%ba = sub <4 x i32> %b, %a			%ba = sub <4 x i32> %b, %a
	%sel = select <4 x i1> %cmp, <4 x i32> %ba, <4 x i32> %ab			%sel = select <4 x i1> %cmp, <4 x i32> %ba, <4 x i32> %ab
	ret <4 x i32> %sel			ret <4 x i32> %sel
	}			}

	define <2 x i64> @abd_cmp_v2i64(<2 x i64> %a, <2 x i64> %b) nounwind {			define <2 x i64> @abd_cmp_v2i64(<2 x i64> %a, <2 x i64> %b) nounwind {
	Show All 17 Lines
	; SSE2-NEXT: pand %xmm2, %xmm1			; SSE2-NEXT: pand %xmm2, %xmm1
	; SSE2-NEXT: pandn %xmm3, %xmm2			; SSE2-NEXT: pandn %xmm3, %xmm2
	; SSE2-NEXT: por %xmm1, %xmm2			; SSE2-NEXT: por %xmm1, %xmm2
	; SSE2-NEXT: movdqa %xmm2, %xmm0			; SSE2-NEXT: movdqa %xmm2, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE42-LABEL: abd_cmp_v2i64:			; SSE42-LABEL: abd_cmp_v2i64:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm1, %xmm2			; SSE42-NEXT: movdqa %xmm0, %xmm2
	; SSE42-NEXT: pcmpgtq %xmm0, %xmm2			; SSE42-NEXT: pcmpgtq %xmm1, %xmm2
	; SSE42-NEXT: movdqa %xmm0, %xmm3			; SSE42-NEXT: movdqa %xmm0, %xmm3
	; SSE42-NEXT: psubq %xmm1, %xmm3			; SSE42-NEXT: psubq %xmm1, %xmm3
	; SSE42-NEXT: psubq %xmm0, %xmm1			; SSE42-NEXT: psubq %xmm0, %xmm1
	; SSE42-NEXT: movdqa %xmm2, %xmm0			; SSE42-NEXT: movdqa %xmm2, %xmm0
	; SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm3			; SSE42-NEXT: blendvpd %xmm0, %xmm3, %xmm1
	; SSE42-NEXT: movapd %xmm3, %xmm0			; SSE42-NEXT: movapd %xmm1, %xmm0
	; SSE42-NEXT: retq			; SSE42-NEXT: retq
	;			;
	; AVX1-LABEL: abd_cmp_v2i64:			; AVX1-LABEL: abd_cmp_v2i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vpsubq %xmm1, %xmm0, %xmm3			; AVX1-NEXT: vpsubq %xmm1, %xmm0, %xmm3
	; AVX1-NEXT: vpsubq %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vpsubq %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm3, %xmm0			; AVX1-NEXT: vblendvpd %xmm2, %xmm3, %xmm0, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: abd_cmp_v2i64:			; AVX2-LABEL: abd_cmp_v2i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX2-NEXT: vpsubq %xmm1, %xmm0, %xmm3			; AVX2-NEXT: vpsubq %xmm1, %xmm0, %xmm3
	; AVX2-NEXT: vpsubq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpsubq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm3, %xmm0			; AVX2-NEXT: vblendvpd %xmm2, %xmm3, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: abd_cmp_v2i64:			; AVX512-LABEL: abd_cmp_v2i64:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpcmpnltq %xmm1, %xmm0, %k1			; AVX512-NEXT: vpminsq %xmm1, %xmm0, %xmm2
	; AVX512-NEXT: vpsubq %xmm0, %xmm1, %xmm2			; AVX512-NEXT: vpmaxsq %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpsubq %xmm1, %xmm0, %xmm2 {%k1}			; AVX512-NEXT: vpsubq %xmm2, %xmm0, %xmm0
	; AVX512-NEXT: vmovdqa %xmm2, %xmm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%cmp = icmp sge <2 x i64> %a, %b			%cmp = icmp sge <2 x i64> %a, %b
	%ab = sub <2 x i64> %a, %b			%ab = sub <2 x i64> %a, %b
	%ba = sub <2 x i64> %b, %a			%ba = sub <2 x i64> %b, %a
	%sel = select <2 x i1> %cmp, <2 x i64> %ab, <2 x i64> %ba			%sel = select <2 x i1> %cmp, <2 x i64> %ab, <2 x i64> %ba
	ret <2 x i64> %sel			ret <2 x i64> %sel
	}			}

	▲ Show 20 Lines • Show All 150 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: pandn %xmm2, %xmm1			; SSE2-NEXT: pandn %xmm2, %xmm1
	; SSE2-NEXT: por %xmm3, %xmm1			; SSE2-NEXT: por %xmm3, %xmm1
	; SSE2-NEXT: paddq %xmm1, %xmm0			; SSE2-NEXT: paddq %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE42-LABEL: abd_cmp_v2i64_multiuse_cmp:			; SSE42-LABEL: abd_cmp_v2i64_multiuse_cmp:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm0, %xmm2			; SSE42-NEXT: movdqa %xmm0, %xmm2
	; SSE42-NEXT: psubq %xmm1, %xmm2			; SSE42-NEXT: pcmpgtq %xmm1, %xmm0
	; SSE42-NEXT: movdqa %xmm1, %xmm3			; SSE42-NEXT: movdqa %xmm2, %xmm3
	; SSE42-NEXT: psubq %xmm0, %xmm3			; SSE42-NEXT: psubq %xmm1, %xmm3
	; SSE42-NEXT: pcmpgtq %xmm0, %xmm1			; SSE42-NEXT: movdqa %xmm1, %xmm4
	; SSE42-NEXT: movdqa %xmm1, %xmm0			; SSE42-NEXT: psubq %xmm2, %xmm4
	; SSE42-NEXT: blendvpd %xmm0, %xmm3, %xmm2			; SSE42-NEXT: blendvpd %xmm0, %xmm3, %xmm4
				; SSE42-NEXT: pcmpgtq %xmm2, %xmm1
				goldstein.w.nUnsubmitted Not Done Reply Inline Actions so seems multiuse cmp is slight regression. Think it could be fixed if goldstein.w.n: so seems multiuse cmp is slight regression. Think it could be fixed if
	; SSE42-NEXT: pcmpeqd %xmm0, %xmm0			; SSE42-NEXT: pcmpeqd %xmm0, %xmm0
	; SSE42-NEXT: pxor %xmm1, %xmm0			; SSE42-NEXT: pxor %xmm1, %xmm0
				goldstein.w.nUnsubmitted Not Done Reply Inline Actions the: pcmpgtq %xmm2, %xmm1 pcmpeqd %xmm0, %xmm0 pxor %xmm1, %xmm0 is just a duplicate of `pcmpgtq %xmm1, %xmm0`? Likewise for the avx/avx2 tests. Know whats going on there? But guess at the end of the day, this can be fixed in `LowerABD` by looking for existing dag nodes and will be probably be easier to do after this patch. Maybe add a TODO in x86 `LowerABD` to fixup missed optimizations. (Likewise we always `blendv` on `cmp` result, but should be doable on the `sub`, and for avx512 should be `vpternlogd` instead of `blendv`) goldstein.w.n: the: ``` pcmpgtq %xmm2, %xmm1 pcmpeqd %xmm0, %xmm0 pxor %xmm1, %xmm0 ``` is just a duplicate…
				RKSimonAuthorUnsubmitted Not Done Reply Inline Actions Yes, IIRC we have an existing problem with other problems with patterns using min/max pairs - we don't do enough to share SETCC nodes. RKSimon: Yes, IIRC we have an existing problem with other problems with patterns using min/max pairs…
				RKSimonAuthorUnsubmitted Not Done Reply Inline Actions We last looked at this for rG813459ed2b0b but I wonder if really we should be doing more generically with SETCC nodes before we get this far. RKSimon: We last looked at this for rG813459ed2b0b but I wonder if really we should be doing more…
				RKSimonAuthorUnsubmitted Not Done Reply Inline Actions We're also being hit by the freeze nodes making it tricky to match setcc(x,y) and setcc(freeze(y),freeze(x)) - I think I'd prefer to add this to the list of existing issues we're having with duplicate equivalent compares. RKSimon: We're also being hit by the freeze nodes making it tricky to match setcc(x,y) and setcc(freeze…
	; SSE42-NEXT: paddq %xmm2, %xmm0			; SSE42-NEXT: paddq %xmm4, %xmm0
	; SSE42-NEXT: retq			; SSE42-NEXT: retq
	;			;
	; AVX1-LABEL: abd_cmp_v2i64_multiuse_cmp:			; AVX1-LABEL: abd_cmp_v2i64_multiuse_cmp:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsubq %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vpsubq %xmm0, %xmm1, %xmm3			; AVX1-NEXT: vpsubq %xmm1, %xmm0, %xmm3
				; AVX1-NEXT: vpsubq %xmm0, %xmm1, %xmm4
				; AVX1-NEXT: vblendvpd %xmm2, %xmm3, %xmm4, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vblendvpd %xmm0, %xmm3, %xmm2, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpaddq %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpaddq %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: abd_cmp_v2i64_multiuse_cmp:			; AVX2-LABEL: abd_cmp_v2i64_multiuse_cmp:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpsubq %xmm1, %xmm0, %xmm2			; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
	; AVX2-NEXT: vpsubq %xmm0, %xmm1, %xmm3			; AVX2-NEXT: vpsubq %xmm1, %xmm0, %xmm3
				; AVX2-NEXT: vpsubq %xmm0, %xmm1, %xmm4
				; AVX2-NEXT: vblendvpd %xmm2, %xmm3, %xmm4, %xmm2
	; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX2-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: vblendvpd %xmm0, %xmm3, %xmm2, %xmm1			; AVX2-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm0			; AVX2-NEXT: vpaddq %xmm2, %xmm0, %xmm0
	; AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: abd_cmp_v2i64_multiuse_cmp:			; AVX512-LABEL: abd_cmp_v2i64_multiuse_cmp:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpcmpnltq %xmm1, %xmm0, %k1			; AVX512-NEXT: vpminsq %xmm1, %xmm0, %xmm2
	; AVX512-NEXT: vpsubq %xmm0, %xmm1, %xmm2			; AVX512-NEXT: vpmaxsq %xmm1, %xmm0, %xmm3
	; AVX512-NEXT: vpsubq %xmm1, %xmm0, %xmm2 {%k1}			; AVX512-NEXT: vpsubq %xmm2, %xmm3, %xmm2
	; AVX512-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0			; AVX512-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm0
	; AVX512-NEXT: vpternlogq $15, %xmm0, %xmm0, %xmm0			; AVX512-NEXT: vpternlogq $15, %xmm0, %xmm0, %xmm0
	; AVX512-NEXT: vpaddq %xmm2, %xmm0, %xmm0			; AVX512-NEXT: vpaddq %xmm2, %xmm0, %xmm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%cmp = icmp sge <2 x i64> %a, %b			%cmp = icmp sge <2 x i64> %a, %b
	%ab = sub <2 x i64> %a, %b			%ab = sub <2 x i64> %a, %b
	%ba = sub <2 x i64> %b, %a			%ba = sub <2 x i64> %b, %a
	%sel = select <2 x i1> %cmp, <2 x i64> %ab, <2 x i64> %ba			%sel = select <2 x i1> %cmp, <2 x i64> %ab, <2 x i64> %ba
	%ext = sext <2 x i1> %cmp to <2 x i64>			%ext = sext <2 x i1> %cmp to <2 x i64>
	%res = add <2 x i64> %ext, %sel			%res = add <2 x i64> %ext, %sel
	ret <2 x i64> %res			ret <2 x i64> %res
	}			}

	define <8 x i16> @abd_cmp_v8i16_multiuse_sub(<8 x i16> %a, <8 x i16> %b) nounwind {			define <8 x i16> @abd_cmp_v8i16_multiuse_sub(<8 x i16> %a, <8 x i16> %b) nounwind {
	; SSE2-LABEL: abd_cmp_v8i16_multiuse_sub:			; SSE-LABEL: abd_cmp_v8i16_multiuse_sub:
	; SSE2: # %bb.0:			; SSE: # %bb.0:
	; SSE2-NEXT: movdqa %xmm0, %xmm2			; SSE-NEXT: movdqa %xmm0, %xmm2
	; SSE2-NEXT: pcmpgtw %xmm1, %xmm2			; SSE-NEXT: psubw %xmm1, %xmm2
	; SSE2-NEXT: movdqa %xmm0, %xmm3			; SSE-NEXT: movdqa %xmm0, %xmm3
	; SSE2-NEXT: psubw %xmm1, %xmm3			; SSE-NEXT: pminsw %xmm1, %xmm3
	; SSE2-NEXT: psubw %xmm0, %xmm1			; SSE-NEXT: pmaxsw %xmm1, %xmm0
	; SSE2-NEXT: movdqa %xmm3, %xmm0			; SSE-NEXT: psubw %xmm3, %xmm0
	; SSE2-NEXT: pand %xmm2, %xmm0			; SSE-NEXT: paddw %xmm2, %xmm0
	; SSE2-NEXT: pandn %xmm1, %xmm2			; SSE-NEXT: retq
	; SSE2-NEXT: por %xmm0, %xmm2
	; SSE2-NEXT: paddw %xmm3, %xmm2
	; SSE2-NEXT: movdqa %xmm2, %xmm0
	; SSE2-NEXT: retq
	;
	; SSE42-LABEL: abd_cmp_v8i16_multiuse_sub:
	; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm0, %xmm2
	; SSE42-NEXT: pcmpgtw %xmm1, %xmm2
	; SSE42-NEXT: movdqa %xmm0, %xmm3
	; SSE42-NEXT: psubw %xmm1, %xmm3
	; SSE42-NEXT: psubw %xmm0, %xmm1
	; SSE42-NEXT: movdqa %xmm2, %xmm0
	; SSE42-NEXT: pblendvb %xmm0, %xmm3, %xmm1
	; SSE42-NEXT: paddw %xmm1, %xmm3
	; SSE42-NEXT: movdqa %xmm3, %xmm0
	; SSE42-NEXT: retq
	;
	; AVX1-LABEL: abd_cmp_v8i16_multiuse_sub:
	; AVX1: # %bb.0:
	; AVX1-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vpsubw %xmm1, %xmm0, %xmm3
	; AVX1-NEXT: vpsubw %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vpblendvb %xmm2, %xmm3, %xmm0, %xmm0
	; AVX1-NEXT: vpaddw %xmm0, %xmm3, %xmm0
	; AVX1-NEXT: retq
	;
	; AVX2-LABEL: abd_cmp_v8i16_multiuse_sub:
	; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm2
	; AVX2-NEXT: vpsubw %xmm1, %xmm0, %xmm3
	; AVX2-NEXT: vpsubw %xmm0, %xmm1, %xmm0
	; AVX2-NEXT: vpblendvb %xmm2, %xmm3, %xmm0, %xmm0
	; AVX2-NEXT: vpaddw %xmm0, %xmm3, %xmm0
	; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: abd_cmp_v8i16_multiuse_sub:			; AVX-LABEL: abd_cmp_v8i16_multiuse_sub:
	; AVX512: # %bb.0:			; AVX: # %bb.0:
	; AVX512-NEXT: vpsubw %xmm1, %xmm0, %xmm2			; AVX-NEXT: vpsubw %xmm1, %xmm0, %xmm2
	; AVX512-NEXT: vpsubw %xmm0, %xmm1, %xmm3			; AVX-NEXT: vpminsw %xmm1, %xmm0, %xmm3
	; AVX512-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm0			; AVX-NEXT: vpmaxsw %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: vpblendvb %xmm0, %xmm2, %xmm3, %xmm0			; AVX-NEXT: vpsubw %xmm3, %xmm0, %xmm0
	; AVX512-NEXT: vpaddw %xmm0, %xmm2, %xmm0			; AVX-NEXT: vpaddw %xmm0, %xmm2, %xmm0
	; AVX512-NEXT: retq			; AVX-NEXT: retq
	%cmp = icmp sgt <8 x i16> %a, %b			%cmp = icmp sgt <8 x i16> %a, %b
	%ab = sub <8 x i16> %a, %b			%ab = sub <8 x i16> %a, %b
	%ba = sub <8 x i16> %b, %a			%ba = sub <8 x i16> %b, %a
	%sel = select <8 x i1> %cmp, <8 x i16> %ab, <8 x i16> %ba			%sel = select <8 x i1> %cmp, <8 x i16> %ab, <8 x i16> %ba
	%res = add <8 x i16> %ab, %sel			%res = add <8 x i16> %ab, %sel
	ret <8 x i16> %res			ret <8 x i16> %res
	}			}

	Show All 18 Lines

llvm/test/CodeGen/X86/abds-vector-256.ll

	Show First 20 Lines • Show All 435 Lines • ▼ Show 20 Lines
	; select(icmp(a,b),sub(a,b),sub(b,a)) -> abds(a,b)			; select(icmp(a,b),sub(a,b),sub(b,a)) -> abds(a,b)
	;			;

	define <32 x i8> @abd_cmp_v32i8(<32 x i8> %a, <32 x i8> %b) nounwind {			define <32 x i8> @abd_cmp_v32i8(<32 x i8> %a, <32 x i8> %b) nounwind {
	; AVX1-LABEL: abd_cmp_v32i8:			; AVX1-LABEL: abd_cmp_v32i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vpcmpgtb %xmm2, %xmm3, %xmm4			; AVX1-NEXT: vpminsb %xmm2, %xmm3, %xmm4
	; AVX1-NEXT: vpcmpgtb %xmm1, %xmm0, %xmm5			; AVX1-NEXT: vpmaxsb %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4			; AVX1-NEXT: vpsubb %xmm4, %xmm2, %xmm2
	; AVX1-NEXT: vpsubb %xmm2, %xmm3, %xmm5			; AVX1-NEXT: vpminsb %xmm1, %xmm0, %xmm3
	; AVX1-NEXT: vpsubb %xmm1, %xmm0, %xmm6			; AVX1-NEXT: vpmaxsb %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm5			; AVX1-NEXT: vpsubb %xmm3, %xmm0, %xmm0
	; AVX1-NEXT: vpsubb %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; AVX1-NEXT: vpsubb %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; AVX1-NEXT: vandnps %ymm0, %ymm4, %ymm0
	; AVX1-NEXT: vandps %ymm4, %ymm5, %ymm1
	; AVX1-NEXT: vorps %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: abd_cmp_v32i8:			; AVX2-LABEL: abd_cmp_v32i8:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtb %ymm1, %ymm0, %ymm2			; AVX2-NEXT: vpminsb %ymm1, %ymm0, %ymm2
	; AVX2-NEXT: vpsubb %ymm1, %ymm0, %ymm3			; AVX2-NEXT: vpmaxsb %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpsubb %ymm0, %ymm1, %ymm0			; AVX2-NEXT: vpsubb %ymm2, %ymm0, %ymm0
	; AVX2-NEXT: vpblendvb %ymm2, %ymm3, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: abd_cmp_v32i8:			; AVX512-LABEL: abd_cmp_v32i8:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpsubb %ymm1, %ymm0, %ymm2			; AVX512-NEXT: vpminsb %ymm1, %ymm0, %ymm2
	; AVX512-NEXT: vpsubb %ymm0, %ymm1, %ymm3			; AVX512-NEXT: vpmaxsb %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vpcmpgtb %ymm1, %ymm0, %ymm0			; AVX512-NEXT: vpsubb %ymm2, %ymm0, %ymm0
	; AVX512-NEXT: vpblendvb %ymm0, %ymm2, %ymm3, %ymm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%cmp = icmp sgt <32 x i8> %a, %b			%cmp = icmp sgt <32 x i8> %a, %b
	%ab = sub <32 x i8> %a, %b			%ab = sub <32 x i8> %a, %b
	%ba = sub <32 x i8> %b, %a			%ba = sub <32 x i8> %b, %a
	%sel = select <32 x i1> %cmp, <32 x i8> %ab, <32 x i8> %ba			%sel = select <32 x i1> %cmp, <32 x i8> %ab, <32 x i8> %ba
	ret <32 x i8> %sel			ret <32 x i8> %sel
	}			}

	define <16 x i16> @abd_cmp_v16i16(<16 x i16> %a, <16 x i16> %b) nounwind {			define <16 x i16> @abd_cmp_v16i16(<16 x i16> %a, <16 x i16> %b) nounwind {
	; AVX1-LABEL: abd_cmp_v16i16:			; AVX1-LABEL: abd_cmp_v16i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vpcmpgtw %xmm2, %xmm3, %xmm4			; AVX1-NEXT: vpminsw %xmm2, %xmm3, %xmm4
	; AVX1-NEXT: vpcmpgtw %xmm0, %xmm1, %xmm5			; AVX1-NEXT: vpmaxsw %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4			; AVX1-NEXT: vpsubw %xmm4, %xmm2, %xmm2
	; AVX1-NEXT: vpsubw %xmm3, %xmm2, %xmm5			; AVX1-NEXT: vpminsw %xmm1, %xmm0, %xmm3
	; AVX1-NEXT: vpsubw %xmm1, %xmm0, %xmm6			; AVX1-NEXT: vpmaxsw %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm5			; AVX1-NEXT: vpsubw %xmm3, %xmm0, %xmm0
	; AVX1-NEXT: vpsubw %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpsubw %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; AVX1-NEXT: vandps %ymm0, %ymm4, %ymm0
	; AVX1-NEXT: vandnps %ymm5, %ymm4, %ymm1
	; AVX1-NEXT: vorps %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: abd_cmp_v16i16:			; AVX2-LABEL: abd_cmp_v16i16:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm2			; AVX2-NEXT: vpminsw %ymm1, %ymm0, %ymm2
	; AVX2-NEXT: vpsubw %ymm1, %ymm0, %ymm3			; AVX2-NEXT: vpmaxsw %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpsubw %ymm0, %ymm1, %ymm0			; AVX2-NEXT: vpsubw %ymm2, %ymm0, %ymm0
	; AVX2-NEXT: vpblendvb %ymm2, %ymm0, %ymm3, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: abd_cmp_v16i16:			; AVX512-LABEL: abd_cmp_v16i16:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpsubw %ymm1, %ymm0, %ymm2			; AVX512-NEXT: vpminsw %ymm1, %ymm0, %ymm2
	; AVX512-NEXT: vpsubw %ymm0, %ymm1, %ymm3			; AVX512-NEXT: vpmaxsw %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm0			; AVX512-NEXT: vpsubw %ymm2, %ymm0, %ymm0
	; AVX512-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%cmp = icmp sge <16 x i16> %a, %b			%cmp = icmp sge <16 x i16> %a, %b
	%ab = sub <16 x i16> %a, %b			%ab = sub <16 x i16> %a, %b
	%ba = sub <16 x i16> %b, %a			%ba = sub <16 x i16> %b, %a
	%sel = select <16 x i1> %cmp, <16 x i16> %ab, <16 x i16> %ba			%sel = select <16 x i1> %cmp, <16 x i16> %ab, <16 x i16> %ba
	ret <16 x i16> %sel			ret <16 x i16> %sel
	}			}

	define <8 x i32> @abd_cmp_v8i32(<8 x i32> %a, <8 x i32> %b) nounwind {			define <8 x i32> @abd_cmp_v8i32(<8 x i32> %a, <8 x i32> %b) nounwind {
	; AVX1-LABEL: abd_cmp_v8i32:			; AVX1-LABEL: abd_cmp_v8i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4			; AVX1-NEXT: vpminsd %xmm2, %xmm3, %xmm4
	; AVX1-NEXT: vpcmpgtd %xmm3, %xmm4, %xmm5			; AVX1-NEXT: vpmaxsd %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpsubd %xmm1, %xmm0, %xmm6			; AVX1-NEXT: vpsubd %xmm4, %xmm2, %xmm2
	; AVX1-NEXT: vpsubd %xmm4, %xmm3, %xmm7			; AVX1-NEXT: vpminsd %xmm1, %xmm0, %xmm3
	; AVX1-NEXT: vpsubd %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vpmaxsd %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vblendvps %xmm2, %xmm0, %xmm6, %xmm0			; AVX1-NEXT: vpsubd %xmm3, %xmm0, %xmm0
	; AVX1-NEXT: vpsubd %xmm3, %xmm4, %xmm1			; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; AVX1-NEXT: vblendvps %xmm5, %xmm1, %xmm7, %xmm1
	; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: abd_cmp_v8i32:			; AVX2-LABEL: abd_cmp_v8i32:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtd %ymm0, %ymm1, %ymm2			; AVX2-NEXT: vpminsd %ymm1, %ymm0, %ymm2
	; AVX2-NEXT: vpsubd %ymm1, %ymm0, %ymm3			; AVX2-NEXT: vpmaxsd %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpsubd %ymm0, %ymm1, %ymm0			; AVX2-NEXT: vpsubd %ymm2, %ymm0, %ymm0
	; AVX2-NEXT: vblendvps %ymm2, %ymm0, %ymm3, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: abd_cmp_v8i32:			; AVX512-LABEL: abd_cmp_v8i32:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpcmpgtd %ymm0, %ymm1, %k1			; AVX512-NEXT: vpminsd %ymm1, %ymm0, %ymm2
	; AVX512-NEXT: vpsubd %ymm1, %ymm0, %ymm2			; AVX512-NEXT: vpmaxsd %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vpsubd %ymm0, %ymm1, %ymm2 {%k1}			; AVX512-NEXT: vpsubd %ymm2, %ymm0, %ymm0
	; AVX512-NEXT: vmovdqa %ymm2, %ymm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%cmp = icmp slt <8 x i32> %a, %b			%cmp = icmp slt <8 x i32> %a, %b
	%ab = sub <8 x i32> %a, %b			%ab = sub <8 x i32> %a, %b
	%ba = sub <8 x i32> %b, %a			%ba = sub <8 x i32> %b, %a
	%sel = select <8 x i1> %cmp, <8 x i32> %ba, <8 x i32> %ab			%sel = select <8 x i1> %cmp, <8 x i32> %ba, <8 x i32> %ab
	ret <8 x i32> %sel			ret <8 x i32> %sel
	}			}

	define <4 x i64> @abd_cmp_v4i64(<4 x i64> %a, <4 x i64> %b) nounwind {			define <4 x i64> @abd_cmp_v4i64(<4 x i64> %a, <4 x i64> %b) nounwind {
	; AVX1-LABEL: abd_cmp_v4i64:			; AVX1-LABEL: abd_cmp_v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm5			; AVX1-NEXT: vpsubq %xmm2, %xmm3, %xmm5
	; AVX1-NEXT: vpsubq %xmm1, %xmm0, %xmm6			; AVX1-NEXT: vpsubq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpsubq %xmm4, %xmm3, %xmm7			; AVX1-NEXT: vblendvpd %xmm4, %xmm5, %xmm2, %xmm2
				; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm3
				; AVX1-NEXT: vpsubq %xmm1, %xmm0, %xmm4
	; AVX1-NEXT: vpsubq %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vpsubq %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm6, %xmm0			; AVX1-NEXT: vblendvpd %xmm3, %xmm4, %xmm0, %xmm0
	; AVX1-NEXT: vpsubq %xmm3, %xmm4, %xmm1			; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; AVX1-NEXT: vblendvpd %xmm5, %xmm1, %xmm7, %xmm1
	; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: abd_cmp_v4i64:			; AVX2-LABEL: abd_cmp_v4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtq %ymm0, %ymm1, %ymm2			; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm2
	; AVX2-NEXT: vpsubq %ymm1, %ymm0, %ymm3			; AVX2-NEXT: vpsubq %ymm1, %ymm0, %ymm3
	; AVX2-NEXT: vpsubq %ymm0, %ymm1, %ymm0			; AVX2-NEXT: vpsubq %ymm0, %ymm1, %ymm0
	; AVX2-NEXT: vblendvpd %ymm2, %ymm0, %ymm3, %ymm0			; AVX2-NEXT: vblendvpd %ymm2, %ymm3, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: abd_cmp_v4i64:			; AVX512-LABEL: abd_cmp_v4i64:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpcmpnltq %ymm1, %ymm0, %k1			; AVX512-NEXT: vpminsq %ymm1, %ymm0, %ymm2
	; AVX512-NEXT: vpsubq %ymm0, %ymm1, %ymm2			; AVX512-NEXT: vpmaxsq %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vpsubq %ymm1, %ymm0, %ymm2 {%k1}			; AVX512-NEXT: vpsubq %ymm2, %ymm0, %ymm0
	; AVX512-NEXT: vmovdqa %ymm2, %ymm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%cmp = icmp sge <4 x i64> %a, %b			%cmp = icmp sge <4 x i64> %a, %b
	%ab = sub <4 x i64> %a, %b			%ab = sub <4 x i64> %a, %b
	%ba = sub <4 x i64> %b, %a			%ba = sub <4 x i64> %b, %a
	%sel = select <4 x i1> %cmp, <4 x i64> %ab, <4 x i64> %ba			%sel = select <4 x i1> %cmp, <4 x i64> %ab, <4 x i64> %ba
	ret <4 x i64> %sel			ret <4 x i64> %sel
	}			}

	▲ Show 20 Lines • Show All 139 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/abds-vector-512.ll

	Show First 20 Lines • Show All 261 Lines • ▼ Show 20 Lines

	;			;
	; select(icmp(a,b),sub(a,b),sub(b,a)) -> abds(a,b)			; select(icmp(a,b),sub(a,b),sub(b,a)) -> abds(a,b)
	;			;

	define <64 x i8> @abd_cmp_v64i8(<64 x i8> %a, <64 x i8> %b) nounwind {			define <64 x i8> @abd_cmp_v64i8(<64 x i8> %a, <64 x i8> %b) nounwind {
	; AVX512BW-LABEL: abd_cmp_v64i8:			; AVX512BW-LABEL: abd_cmp_v64i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vpcmpgtb %zmm1, %zmm0, %k1			; AVX512BW-NEXT: vpminsb %zmm1, %zmm0, %zmm2
	; AVX512BW-NEXT: vpsubb %zmm0, %zmm1, %zmm2			; AVX512BW-NEXT: vpmaxsb %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpsubb %zmm1, %zmm0, %zmm2 {%k1}			; AVX512BW-NEXT: vpsubb %zmm2, %zmm0, %zmm0
	; AVX512BW-NEXT: vmovdqa64 %zmm2, %zmm0
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512DQ-LABEL: abd_cmp_v64i8:			; AVX512DQ-LABEL: abd_cmp_v64i8:
	; AVX512DQ: # %bb.0:			; AVX512DQ: # %bb.0:
	; AVX512DQ-NEXT: vextracti64x4 $1, %zmm1, %ymm2			; AVX512DQ-NEXT: vextracti64x4 $1, %zmm1, %ymm2
	; AVX512DQ-NEXT: vextracti64x4 $1, %zmm0, %ymm3			; AVX512DQ-NEXT: vextracti64x4 $1, %zmm0, %ymm3
	; AVX512DQ-NEXT: vpcmpgtb %ymm2, %ymm3, %ymm4			; AVX512DQ-NEXT: vpminsb %ymm2, %ymm3, %ymm4
	; AVX512DQ-NEXT: vpcmpgtb %ymm1, %ymm0, %ymm5			; AVX512DQ-NEXT: vpmaxsb %ymm2, %ymm3, %ymm2
	; AVX512DQ-NEXT: vinserti64x4 $1, %ymm4, %zmm5, %zmm4			; AVX512DQ-NEXT: vpsubb %ymm4, %ymm2, %ymm2
	; AVX512DQ-NEXT: vpsubb %ymm2, %ymm3, %ymm5			; AVX512DQ-NEXT: vpminsb %ymm1, %ymm0, %ymm3
	; AVX512DQ-NEXT: vpsubb %ymm1, %ymm0, %ymm6			; AVX512DQ-NEXT: vpmaxsb %ymm1, %ymm0, %ymm0
	; AVX512DQ-NEXT: vinserti64x4 $1, %ymm5, %zmm6, %zmm5			; AVX512DQ-NEXT: vpsubb %ymm3, %ymm0, %ymm0
	; AVX512DQ-NEXT: vpsubb %ymm3, %ymm2, %ymm2
	; AVX512DQ-NEXT: vpsubb %ymm0, %ymm1, %ymm0
	; AVX512DQ-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0			; AVX512DQ-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0
	; AVX512DQ-NEXT: vpternlogq $184, %zmm5, %zmm4, %zmm0
	; AVX512DQ-NEXT: retq			; AVX512DQ-NEXT: retq
	%cmp = icmp sgt <64 x i8> %a, %b			%cmp = icmp sgt <64 x i8> %a, %b
	%ab = sub <64 x i8> %a, %b			%ab = sub <64 x i8> %a, %b
	%ba = sub <64 x i8> %b, %a			%ba = sub <64 x i8> %b, %a
	%sel = select <64 x i1> %cmp, <64 x i8> %ab, <64 x i8> %ba			%sel = select <64 x i1> %cmp, <64 x i8> %ab, <64 x i8> %ba
	ret <64 x i8> %sel			ret <64 x i8> %sel
	}			}

	define <32 x i16> @abd_cmp_v32i16(<32 x i16> %a, <32 x i16> %b) nounwind {			define <32 x i16> @abd_cmp_v32i16(<32 x i16> %a, <32 x i16> %b) nounwind {
	; AVX512BW-LABEL: abd_cmp_v32i16:			; AVX512BW-LABEL: abd_cmp_v32i16:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vpcmpnltw %zmm1, %zmm0, %k1			; AVX512BW-NEXT: vpminsw %zmm1, %zmm0, %zmm2
	; AVX512BW-NEXT: vpsubw %zmm0, %zmm1, %zmm2			; AVX512BW-NEXT: vpmaxsw %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpsubw %zmm1, %zmm0, %zmm2 {%k1}			; AVX512BW-NEXT: vpsubw %zmm2, %zmm0, %zmm0
	; AVX512BW-NEXT: vmovdqa64 %zmm2, %zmm0
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512DQ-LABEL: abd_cmp_v32i16:			; AVX512DQ-LABEL: abd_cmp_v32i16:
	; AVX512DQ: # %bb.0:			; AVX512DQ: # %bb.0:
	; AVX512DQ-NEXT: vextracti64x4 $1, %zmm0, %ymm2			; AVX512DQ-NEXT: vextracti64x4 $1, %zmm1, %ymm2
	; AVX512DQ-NEXT: vextracti64x4 $1, %zmm1, %ymm3			; AVX512DQ-NEXT: vextracti64x4 $1, %zmm0, %ymm3
	; AVX512DQ-NEXT: vpcmpgtw %ymm2, %ymm3, %ymm4			; AVX512DQ-NEXT: vpminsw %ymm2, %ymm3, %ymm4
	; AVX512DQ-NEXT: vpcmpgtw %ymm0, %ymm1, %ymm5			; AVX512DQ-NEXT: vpmaxsw %ymm2, %ymm3, %ymm2
	; AVX512DQ-NEXT: vinserti64x4 $1, %ymm4, %zmm5, %zmm4			; AVX512DQ-NEXT: vpsubw %ymm4, %ymm2, %ymm2
	; AVX512DQ-NEXT: vpsubw %ymm3, %ymm2, %ymm5			; AVX512DQ-NEXT: vpminsw %ymm1, %ymm0, %ymm3
	; AVX512DQ-NEXT: vpsubw %ymm1, %ymm0, %ymm6			; AVX512DQ-NEXT: vpmaxsw %ymm1, %ymm0, %ymm0
	; AVX512DQ-NEXT: vinserti64x4 $1, %ymm5, %zmm6, %zmm5			; AVX512DQ-NEXT: vpsubw %ymm3, %ymm0, %ymm0
	; AVX512DQ-NEXT: vpsubw %ymm2, %ymm3, %ymm2
	; AVX512DQ-NEXT: vpsubw %ymm0, %ymm1, %ymm0
	; AVX512DQ-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0			; AVX512DQ-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0
	; AVX512DQ-NEXT: vpternlogq $226, %zmm5, %zmm4, %zmm0
	; AVX512DQ-NEXT: retq			; AVX512DQ-NEXT: retq
	%cmp = icmp sge <32 x i16> %a, %b			%cmp = icmp sge <32 x i16> %a, %b
	%ab = sub <32 x i16> %a, %b			%ab = sub <32 x i16> %a, %b
	%ba = sub <32 x i16> %b, %a			%ba = sub <32 x i16> %b, %a
	%sel = select <32 x i1> %cmp, <32 x i16> %ab, <32 x i16> %ba			%sel = select <32 x i1> %cmp, <32 x i16> %ab, <32 x i16> %ba
	ret <32 x i16> %sel			ret <32 x i16> %sel
	}			}

	define <16 x i32> @abd_cmp_v16i32(<16 x i32> %a, <16 x i32> %b) nounwind {			define <16 x i32> @abd_cmp_v16i32(<16 x i32> %a, <16 x i32> %b) nounwind {
	; AVX512-LABEL: abd_cmp_v16i32:			; AVX512-LABEL: abd_cmp_v16i32:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpcmpgtd %zmm0, %zmm1, %k1			; AVX512-NEXT: vpminsd %zmm1, %zmm0, %zmm2
	; AVX512-NEXT: vpsubd %zmm1, %zmm0, %zmm2			; AVX512-NEXT: vpmaxsd %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpsubd %zmm0, %zmm1, %zmm2 {%k1}			; AVX512-NEXT: vpsubd %zmm2, %zmm0, %zmm0
	; AVX512-NEXT: vmovdqa64 %zmm2, %zmm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%cmp = icmp slt <16 x i32> %a, %b			%cmp = icmp slt <16 x i32> %a, %b
	%ab = sub <16 x i32> %a, %b			%ab = sub <16 x i32> %a, %b
	%ba = sub <16 x i32> %b, %a			%ba = sub <16 x i32> %b, %a
	%sel = select <16 x i1> %cmp, <16 x i32> %ba, <16 x i32> %ab			%sel = select <16 x i1> %cmp, <16 x i32> %ba, <16 x i32> %ab
	ret <16 x i32> %sel			ret <16 x i32> %sel
	}			}

	define <8 x i64> @abd_cmp_v8i64(<8 x i64> %a, <8 x i64> %b) nounwind {			define <8 x i64> @abd_cmp_v8i64(<8 x i64> %a, <8 x i64> %b) nounwind {
	; AVX512-LABEL: abd_cmp_v8i64:			; AVX512-LABEL: abd_cmp_v8i64:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpcmpnltq %zmm1, %zmm0, %k1			; AVX512-NEXT: vpminsq %zmm1, %zmm0, %zmm2
	; AVX512-NEXT: vpsubq %zmm0, %zmm1, %zmm2			; AVX512-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpsubq %zmm1, %zmm0, %zmm2 {%k1}			; AVX512-NEXT: vpsubq %zmm2, %zmm0, %zmm0
	; AVX512-NEXT: vmovdqa64 %zmm2, %zmm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%cmp = icmp sge <8 x i64> %a, %b			%cmp = icmp sge <8 x i64> %a, %b
	%ab = sub <8 x i64> %a, %b			%ab = sub <8 x i64> %a, %b
	%ba = sub <8 x i64> %b, %a			%ba = sub <8 x i64> %b, %a
	%sel = select <8 x i1> %cmp, <8 x i64> %ab, <8 x i64> %ba			%sel = select <8 x i1> %cmp, <8 x i64> %ab, <8 x i64> %ba
	ret <8 x i64> %sel			ret <8 x i64> %sel
	}			}

	▲ Show 20 Lines • Show All 88 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/abdu-vector-128.ll

Show First 20 Lines • Show All 635 Lines • ▼ Show 20 Lines	; AVX512-NEXT: retq
ret <2 x i64> %sub		ret <2 x i64> %sub
}		}

;		;
; select(icmp(a,b),sub(a,b),sub(b,a)) -> abdu(a,b)		; select(icmp(a,b),sub(a,b),sub(b,a)) -> abdu(a,b)
;		;

define <16 x i8> @abd_cmp_v16i8(<16 x i8> %a, <16 x i8> %b) nounwind {		define <16 x i8> @abd_cmp_v16i8(<16 x i8> %a, <16 x i8> %b) nounwind {
; SSE2-LABEL: abd_cmp_v16i8:		; SSE-LABEL: abd_cmp_v16i8:
; SSE2: # %bb.0:		; SSE: # %bb.0:
; SSE2-NEXT: movdqa %xmm0, %xmm2		; SSE-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pminub %xmm1, %xmm2		; SSE-NEXT: pminub %xmm1, %xmm2
; SSE2-NEXT: pcmpeqb %xmm0, %xmm2		; SSE-NEXT: pmaxub %xmm1, %xmm0
; SSE2-NEXT: movdqa %xmm0, %xmm3		; SSE-NEXT: psubb %xmm2, %xmm0
; SSE2-NEXT: psubb %xmm1, %xmm3		; SSE-NEXT: retq
; SSE2-NEXT: psubb %xmm0, %xmm1
; SSE2-NEXT: pand %xmm2, %xmm1
; SSE2-NEXT: pandn %xmm3, %xmm2
; SSE2-NEXT: por %xmm1, %xmm2
; SSE2-NEXT: movdqa %xmm2, %xmm0
; SSE2-NEXT: retq
;
; SSE42-LABEL: abd_cmp_v16i8:
; SSE42: # %bb.0:
; SSE42-NEXT: movdqa %xmm0, %xmm2
; SSE42-NEXT: pminub %xmm1, %xmm2
; SSE42-NEXT: pcmpeqb %xmm0, %xmm2
; SSE42-NEXT: movdqa %xmm0, %xmm3
; SSE42-NEXT: psubb %xmm1, %xmm3
; SSE42-NEXT: psubb %xmm0, %xmm1
; SSE42-NEXT: movdqa %xmm2, %xmm0
; SSE42-NEXT: pblendvb %xmm0, %xmm1, %xmm3
; SSE42-NEXT: movdqa %xmm3, %xmm0
; SSE42-NEXT: retq
;
; AVX1-LABEL: abd_cmp_v16i8:
; AVX1: # %bb.0:
; AVX1-NEXT: vpminub %xmm1, %xmm0, %xmm2
; AVX1-NEXT: vpcmpeqb %xmm2, %xmm0, %xmm2
; AVX1-NEXT: vpsubb %xmm1, %xmm0, %xmm3
; AVX1-NEXT: vpsubb %xmm0, %xmm1, %xmm0
; AVX1-NEXT: vpblendvb %xmm2, %xmm0, %xmm3, %xmm0
; AVX1-NEXT: retq
;
; AVX2-LABEL: abd_cmp_v16i8:
; AVX2: # %bb.0:
; AVX2-NEXT: vpminub %xmm1, %xmm0, %xmm2
; AVX2-NEXT: vpcmpeqb %xmm2, %xmm0, %xmm2
; AVX2-NEXT: vpsubb %xmm1, %xmm0, %xmm3
; AVX2-NEXT: vpsubb %xmm0, %xmm1, %xmm0
; AVX2-NEXT: vpblendvb %xmm2, %xmm0, %xmm3, %xmm0
; AVX2-NEXT: retq
;		;
; AVX512-LABEL: abd_cmp_v16i8:		; AVX-LABEL: abd_cmp_v16i8:
; AVX512: # %bb.0:		; AVX: # %bb.0:
; AVX512-NEXT: vpsubb %xmm1, %xmm0, %xmm2		; AVX-NEXT: vpminub %xmm1, %xmm0, %xmm2
; AVX512-NEXT: vpsubb %xmm0, %xmm1, %xmm3		; AVX-NEXT: vpmaxub %xmm1, %xmm0, %xmm0
; AVX512-NEXT: vpminub %xmm1, %xmm0, %xmm1		; AVX-NEXT: vpsubb %xmm2, %xmm0, %xmm0
; AVX512-NEXT: vpcmpeqb %xmm1, %xmm0, %xmm0		; AVX-NEXT: retq
; AVX512-NEXT: vpblendvb %xmm0, %xmm3, %xmm2, %xmm0
; AVX512-NEXT: retq
%cmp = icmp ugt <16 x i8> %a, %b		%cmp = icmp ugt <16 x i8> %a, %b
%ab = sub <16 x i8> %a, %b		%ab = sub <16 x i8> %a, %b
%ba = sub <16 x i8> %b, %a		%ba = sub <16 x i8> %b, %a
%sel = select <16 x i1> %cmp, <16 x i8> %ab, <16 x i8> %ba		%sel = select <16 x i1> %cmp, <16 x i8> %ab, <16 x i8> %ba
ret <16 x i8> %sel		ret <16 x i8> %sel
}		}

define <8 x i16> @abd_cmp_v8i16(<8 x i16> %a, <8 x i16> %b) nounwind {		define <8 x i16> @abd_cmp_v8i16(<8 x i16> %a, <8 x i16> %b) nounwind {
Show All 10 Lines
; SSE2-NEXT: pandn %xmm1, %xmm2		; SSE2-NEXT: pandn %xmm1, %xmm2
; SSE2-NEXT: por %xmm3, %xmm2		; SSE2-NEXT: por %xmm3, %xmm2
; SSE2-NEXT: movdqa %xmm2, %xmm0		; SSE2-NEXT: movdqa %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE42-LABEL: abd_cmp_v8i16:		; SSE42-LABEL: abd_cmp_v8i16:
; SSE42: # %bb.0:		; SSE42: # %bb.0:
; SSE42-NEXT: movdqa %xmm0, %xmm2		; SSE42-NEXT: movdqa %xmm0, %xmm2
; SSE42-NEXT: pmaxuw %xmm1, %xmm2		; SSE42-NEXT: pminuw %xmm1, %xmm2
; SSE42-NEXT: pcmpeqw %xmm0, %xmm2		; SSE42-NEXT: pmaxuw %xmm1, %xmm0
; SSE42-NEXT: movdqa %xmm0, %xmm3		; SSE42-NEXT: psubw %xmm2, %xmm0
; SSE42-NEXT: psubw %xmm1, %xmm3
; SSE42-NEXT: psubw %xmm0, %xmm1
; SSE42-NEXT: movdqa %xmm2, %xmm0
; SSE42-NEXT: pblendvb %xmm0, %xmm3, %xmm1
; SSE42-NEXT: movdqa %xmm1, %xmm0
; SSE42-NEXT: retq		; SSE42-NEXT: retq
;		;
; AVX1-LABEL: abd_cmp_v8i16:		; AVX-LABEL: abd_cmp_v8i16:
; AVX1: # %bb.0:		; AVX: # %bb.0:
; AVX1-NEXT: vpmaxuw %xmm1, %xmm0, %xmm2		; AVX-NEXT: vpminuw %xmm1, %xmm0, %xmm2
; AVX1-NEXT: vpcmpeqw %xmm2, %xmm0, %xmm2		; AVX-NEXT: vpmaxuw %xmm1, %xmm0, %xmm0
; AVX1-NEXT: vpsubw %xmm1, %xmm0, %xmm3		; AVX-NEXT: vpsubw %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vpsubw %xmm0, %xmm1, %xmm0		; AVX-NEXT: retq
; AVX1-NEXT: vpblendvb %xmm2, %xmm3, %xmm0, %xmm0
; AVX1-NEXT: retq
;
; AVX2-LABEL: abd_cmp_v8i16:
; AVX2: # %bb.0:
; AVX2-NEXT: vpmaxuw %xmm1, %xmm0, %xmm2
; AVX2-NEXT: vpcmpeqw %xmm2, %xmm0, %xmm2
; AVX2-NEXT: vpsubw %xmm1, %xmm0, %xmm3
; AVX2-NEXT: vpsubw %xmm0, %xmm1, %xmm0
; AVX2-NEXT: vpblendvb %xmm2, %xmm3, %xmm0, %xmm0
; AVX2-NEXT: retq
;
; AVX512-LABEL: abd_cmp_v8i16:
; AVX512: # %bb.0:
; AVX512-NEXT: vpsubw %xmm1, %xmm0, %xmm2
; AVX512-NEXT: vpsubw %xmm0, %xmm1, %xmm3
; AVX512-NEXT: vpmaxuw %xmm1, %xmm0, %xmm1
; AVX512-NEXT: vpcmpeqw %xmm1, %xmm0, %xmm0
; AVX512-NEXT: vpblendvb %xmm0, %xmm2, %xmm3, %xmm0
; AVX512-NEXT: retq
%cmp = icmp uge <8 x i16> %a, %b		%cmp = icmp uge <8 x i16> %a, %b
%ab = sub <8 x i16> %a, %b		%ab = sub <8 x i16> %a, %b
%ba = sub <8 x i16> %b, %a		%ba = sub <8 x i16> %b, %a
%sel = select <8 x i1> %cmp, <8 x i16> %ab, <8 x i16> %ba		%sel = select <8 x i1> %cmp, <8 x i16> %ab, <8 x i16> %ba
ret <8 x i16> %sel		ret <8 x i16> %sel
}		}

define <4 x i32> @abd_cmp_v4i32(<4 x i32> %a, <4 x i32> %b) nounwind {		define <4 x i32> @abd_cmp_v4i32(<4 x i32> %a, <4 x i32> %b) nounwind {
Show All 11 Lines
; SSE2-NEXT: pandn %xmm3, %xmm2		; SSE2-NEXT: pandn %xmm3, %xmm2
; SSE2-NEXT: por %xmm1, %xmm2		; SSE2-NEXT: por %xmm1, %xmm2
; SSE2-NEXT: movdqa %xmm2, %xmm0		; SSE2-NEXT: movdqa %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE42-LABEL: abd_cmp_v4i32:		; SSE42-LABEL: abd_cmp_v4i32:
; SSE42: # %bb.0:		; SSE42: # %bb.0:
; SSE42-NEXT: movdqa %xmm0, %xmm2		; SSE42-NEXT: movdqa %xmm0, %xmm2
; SSE42-NEXT: pmaxud %xmm1, %xmm2		; SSE42-NEXT: pminud %xmm1, %xmm2
; SSE42-NEXT: pcmpeqd %xmm0, %xmm2		; SSE42-NEXT: pmaxud %xmm1, %xmm0
; SSE42-NEXT: movdqa %xmm0, %xmm3		; SSE42-NEXT: psubd %xmm2, %xmm0
; SSE42-NEXT: psubd %xmm1, %xmm3
; SSE42-NEXT: psubd %xmm0, %xmm1
; SSE42-NEXT: movdqa %xmm2, %xmm0
; SSE42-NEXT: blendvps %xmm0, %xmm3, %xmm1
; SSE42-NEXT: movaps %xmm1, %xmm0
; SSE42-NEXT: retq		; SSE42-NEXT: retq
;		;
; AVX1-LABEL: abd_cmp_v4i32:		; AVX-LABEL: abd_cmp_v4i32:
; AVX1: # %bb.0:		; AVX: # %bb.0:
; AVX1-NEXT: vpmaxud %xmm1, %xmm0, %xmm2		; AVX-NEXT: vpminud %xmm1, %xmm0, %xmm2
; AVX1-NEXT: vpcmpeqd %xmm2, %xmm0, %xmm2		; AVX-NEXT: vpmaxud %xmm1, %xmm0, %xmm0
; AVX1-NEXT: vpsubd %xmm1, %xmm0, %xmm3		; AVX-NEXT: vpsubd %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vpsubd %xmm0, %xmm1, %xmm0		; AVX-NEXT: retq
; AVX1-NEXT: vblendvps %xmm2, %xmm3, %xmm0, %xmm0
; AVX1-NEXT: retq
;
; AVX2-LABEL: abd_cmp_v4i32:
; AVX2: # %bb.0:
; AVX2-NEXT: vpmaxud %xmm1, %xmm0, %xmm2
; AVX2-NEXT: vpcmpeqd %xmm2, %xmm0, %xmm2
; AVX2-NEXT: vpsubd %xmm1, %xmm0, %xmm3
; AVX2-NEXT: vpsubd %xmm0, %xmm1, %xmm0
; AVX2-NEXT: vblendvps %xmm2, %xmm3, %xmm0, %xmm0
; AVX2-NEXT: retq
;
; AVX512-LABEL: abd_cmp_v4i32:
; AVX512: # %bb.0:
; AVX512-NEXT: vpcmpltud %xmm1, %xmm0, %k1
; AVX512-NEXT: vpsubd %xmm1, %xmm0, %xmm2
; AVX512-NEXT: vpsubd %xmm0, %xmm1, %xmm2 {%k1}
; AVX512-NEXT: vmovdqa %xmm2, %xmm0
; AVX512-NEXT: retq
%cmp = icmp ult <4 x i32> %a, %b		%cmp = icmp ult <4 x i32> %a, %b
%ab = sub <4 x i32> %a, %b		%ab = sub <4 x i32> %a, %b
%ba = sub <4 x i32> %b, %a		%ba = sub <4 x i32> %b, %a
%sel = select <4 x i1> %cmp, <4 x i32> %ba, <4 x i32> %ab		%sel = select <4 x i1> %cmp, <4 x i32> %ba, <4 x i32> %ab
ret <4 x i32> %sel		ret <4 x i32> %sel
}		}

define <2 x i64> @abd_cmp_v2i64(<2 x i64> %a, <2 x i64> %b) nounwind {		define <2 x i64> @abd_cmp_v2i64(<2 x i64> %a, <2 x i64> %b) nounwind {
Show All 18 Lines
; SSE2-NEXT: pandn %xmm3, %xmm2		; SSE2-NEXT: pandn %xmm3, %xmm2
; SSE2-NEXT: por %xmm1, %xmm2		; SSE2-NEXT: por %xmm1, %xmm2
; SSE2-NEXT: movdqa %xmm2, %xmm0		; SSE2-NEXT: movdqa %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE42-LABEL: abd_cmp_v2i64:		; SSE42-LABEL: abd_cmp_v2i64:
; SSE42: # %bb.0:		; SSE42: # %bb.0:
; SSE42-NEXT: movdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]		; SSE42-NEXT: movdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
; SSE42-NEXT: movdqa %xmm0, %xmm3		; SSE42-NEXT: movdqa %xmm1, %xmm3
; SSE42-NEXT: pxor %xmm2, %xmm3		; SSE42-NEXT: pxor %xmm2, %xmm3
; SSE42-NEXT: pxor %xmm1, %xmm2		; SSE42-NEXT: pxor %xmm0, %xmm2
; SSE42-NEXT: pcmpgtq %xmm3, %xmm2		; SSE42-NEXT: pcmpgtq %xmm3, %xmm2
; SSE42-NEXT: movdqa %xmm0, %xmm3		; SSE42-NEXT: movdqa %xmm0, %xmm3
; SSE42-NEXT: psubq %xmm1, %xmm3		; SSE42-NEXT: psubq %xmm1, %xmm3
; SSE42-NEXT: psubq %xmm0, %xmm1		; SSE42-NEXT: psubq %xmm0, %xmm1
; SSE42-NEXT: movdqa %xmm2, %xmm0		; SSE42-NEXT: movdqa %xmm2, %xmm0
; SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm3		; SSE42-NEXT: blendvpd %xmm0, %xmm3, %xmm1
; SSE42-NEXT: movapd %xmm3, %xmm0		; SSE42-NEXT: movapd %xmm1, %xmm0
; SSE42-NEXT: retq		; SSE42-NEXT: retq
;		;
; AVX1-LABEL: abd_cmp_v2i64:		; AVX1-LABEL: abd_cmp_v2i64:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]		; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3		; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3
; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm2		; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm2
; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2		; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
; AVX1-NEXT: vpsubq %xmm1, %xmm0, %xmm3		; AVX1-NEXT: vpsubq %xmm1, %xmm0, %xmm3
; AVX1-NEXT: vpsubq %xmm0, %xmm1, %xmm0		; AVX1-NEXT: vpsubq %xmm0, %xmm1, %xmm0
; AVX1-NEXT: vblendvpd %xmm2, %xmm0, %xmm3, %xmm0		; AVX1-NEXT: vblendvpd %xmm2, %xmm3, %xmm0, %xmm0
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: abd_cmp_v2i64:		; AVX2-LABEL: abd_cmp_v2i64:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]		; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3		; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm3
; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm2		; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm2
; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2		; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
; AVX2-NEXT: vpsubq %xmm1, %xmm0, %xmm3		; AVX2-NEXT: vpsubq %xmm1, %xmm0, %xmm3
; AVX2-NEXT: vpsubq %xmm0, %xmm1, %xmm0		; AVX2-NEXT: vpsubq %xmm0, %xmm1, %xmm0
; AVX2-NEXT: vblendvpd %xmm2, %xmm0, %xmm3, %xmm0		; AVX2-NEXT: vblendvpd %xmm2, %xmm3, %xmm0, %xmm0
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; AVX512-LABEL: abd_cmp_v2i64:		; AVX512-LABEL: abd_cmp_v2i64:
; AVX512: # %bb.0:		; AVX512: # %bb.0:
; AVX512-NEXT: vpcmpnltuq %xmm1, %xmm0, %k1		; AVX512-NEXT: vpminuq %xmm1, %xmm0, %xmm2
; AVX512-NEXT: vpsubq %xmm0, %xmm1, %xmm2		; AVX512-NEXT: vpmaxuq %xmm1, %xmm0, %xmm0
; AVX512-NEXT: vpsubq %xmm1, %xmm0, %xmm2 {%k1}		; AVX512-NEXT: vpsubq %xmm2, %xmm0, %xmm0
; AVX512-NEXT: vmovdqa %xmm2, %xmm0
; AVX512-NEXT: retq		; AVX512-NEXT: retq
%cmp = icmp uge <2 x i64> %a, %b		%cmp = icmp uge <2 x i64> %a, %b
%ab = sub <2 x i64> %a, %b		%ab = sub <2 x i64> %a, %b
%ba = sub <2 x i64> %b, %a		%ba = sub <2 x i64> %b, %a
%sel = select <2 x i1> %cmp, <2 x i64> %ab, <2 x i64> %ba		%sel = select <2 x i1> %cmp, <2 x i64> %ab, <2 x i64> %ba
ret <2 x i64> %sel		ret <2 x i64> %sel
}		}

Show All 24 Lines
; SSE2-NEXT: pand %xmm1, %xmm2		; SSE2-NEXT: pand %xmm1, %xmm2
; SSE2-NEXT: por %xmm0, %xmm2		; SSE2-NEXT: por %xmm0, %xmm2
; SSE2-NEXT: paddq %xmm1, %xmm2		; SSE2-NEXT: paddq %xmm1, %xmm2
; SSE2-NEXT: movdqa %xmm2, %xmm0		; SSE2-NEXT: movdqa %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE42-LABEL: abd_cmp_v2i64_multiuse_cmp:		; SSE42-LABEL: abd_cmp_v2i64_multiuse_cmp:
; SSE42: # %bb.0:		; SSE42: # %bb.0:
; SSE42-NEXT: movdqa %xmm0, %xmm2		; SSE42-NEXT: movdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
; SSE42-NEXT: psubq %xmm1, %xmm2
; SSE42-NEXT: movdqa %xmm1, %xmm3		; SSE42-NEXT: movdqa %xmm1, %xmm3
; SSE42-NEXT: psubq %xmm0, %xmm3		; SSE42-NEXT: pxor %xmm2, %xmm3
; SSE42-NEXT: movdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]		; SSE42-NEXT: pxor %xmm0, %xmm2
; SSE42-NEXT: pxor %xmm4, %xmm1		; SSE42-NEXT: pcmpgtq %xmm3, %xmm2
; SSE42-NEXT: pxor %xmm4, %xmm0		; SSE42-NEXT: movdqa %xmm0, %xmm3
; SSE42-NEXT: pcmpgtq %xmm1, %xmm0		; SSE42-NEXT: psubq %xmm1, %xmm3
; SSE42-NEXT: blendvpd %xmm0, %xmm2, %xmm3		; SSE42-NEXT: psubq %xmm0, %xmm1
; SSE42-NEXT: paddq %xmm3, %xmm0		; SSE42-NEXT: movdqa %xmm2, %xmm0
		; SSE42-NEXT: blendvpd %xmm0, %xmm3, %xmm1
		; SSE42-NEXT: paddq %xmm1, %xmm2
		; SSE42-NEXT: movdqa %xmm2, %xmm0
; SSE42-NEXT: retq		; SSE42-NEXT: retq
;		;
; AVX1-LABEL: abd_cmp_v2i64_multiuse_cmp:		; AVX1-LABEL: abd_cmp_v2i64_multiuse_cmp:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vpsubq %xmm1, %xmm0, %xmm2		; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
; AVX1-NEXT: vpsubq %xmm0, %xmm1, %xmm3		; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3
; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]		; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm2
; AVX1-NEXT: vpxor %xmm4, %xmm1, %xmm1		; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
; AVX1-NEXT: vpxor %xmm4, %xmm0, %xmm0		; AVX1-NEXT: vpsubq %xmm1, %xmm0, %xmm3
; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0		; AVX1-NEXT: vpsubq %xmm0, %xmm1, %xmm0
; AVX1-NEXT: vblendvpd %xmm0, %xmm2, %xmm3, %xmm1		; AVX1-NEXT: vblendvpd %xmm2, %xmm3, %xmm0, %xmm0
; AVX1-NEXT: vpaddq %xmm1, %xmm0, %xmm0		; AVX1-NEXT: vpaddq %xmm0, %xmm2, %xmm0
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: abd_cmp_v2i64_multiuse_cmp:		; AVX2-LABEL: abd_cmp_v2i64_multiuse_cmp:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpsubq %xmm1, %xmm0, %xmm2		; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
; AVX2-NEXT: vpsubq %xmm0, %xmm1, %xmm3		; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm3
; AVX2-NEXT: vmovdqa {{.*#+}} xmm4 = [9223372036854775808,9223372036854775808]		; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm2
; AVX2-NEXT: vpxor %xmm4, %xmm1, %xmm1		; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
; AVX2-NEXT: vpxor %xmm4, %xmm0, %xmm0		; AVX2-NEXT: vpsubq %xmm1, %xmm0, %xmm3
; AVX2-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0		; AVX2-NEXT: vpsubq %xmm0, %xmm1, %xmm0
; AVX2-NEXT: vblendvpd %xmm0, %xmm2, %xmm3, %xmm1		; AVX2-NEXT: vblendvpd %xmm2, %xmm3, %xmm0, %xmm0
; AVX2-NEXT: vpaddq %xmm1, %xmm0, %xmm0		; AVX2-NEXT: vpaddq %xmm0, %xmm2, %xmm0
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; AVX512-LABEL: abd_cmp_v2i64_multiuse_cmp:		; AVX512-LABEL: abd_cmp_v2i64_multiuse_cmp:
; AVX512: # %bb.0:		; AVX512: # %bb.0:
; AVX512-NEXT: vpcmpnleuq %xmm1, %xmm0, %k1		; AVX512-NEXT: vpcmpnleuq %xmm1, %xmm0, %k1
; AVX512-NEXT: vpsubq %xmm0, %xmm1, %xmm2		; AVX512-NEXT: vpminuq %xmm1, %xmm0, %xmm2
; AVX512-NEXT: vpsubq %xmm1, %xmm0, %xmm2 {%k1}		; AVX512-NEXT: vpmaxuq %xmm1, %xmm0, %xmm0
; AVX512-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0		; AVX512-NEXT: vpsubq %xmm2, %xmm0, %xmm0
; AVX512-NEXT: vpaddq %xmm0, %xmm2, %xmm2 {%k1}		; AVX512-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
; AVX512-NEXT: vmovdqa %xmm2, %xmm0		; AVX512-NEXT: vpaddq %xmm1, %xmm0, %xmm0 {%k1}
; AVX512-NEXT: retq		; AVX512-NEXT: retq
%cmp = icmp ugt <2 x i64> %a, %b		%cmp = icmp ugt <2 x i64> %a, %b
%ab = sub <2 x i64> %a, %b		%ab = sub <2 x i64> %a, %b
%ba = sub <2 x i64> %b, %a		%ba = sub <2 x i64> %b, %a
%sel = select <2 x i1> %cmp, <2 x i64> %ab, <2 x i64> %ba		%sel = select <2 x i1> %cmp, <2 x i64> %ab, <2 x i64> %ba
%ext = sext <2 x i1> %cmp to <2 x i64>		%ext = sext <2 x i1> %cmp to <2 x i64>
%res = add <2 x i64> %ext, %sel		%res = add <2 x i64> %ext, %sel
ret <2 x i64> %res		ret <2 x i64> %res
Show All 15 Lines
; SSE2-NEXT: por %xmm0, %xmm2		; SSE2-NEXT: por %xmm0, %xmm2
; SSE2-NEXT: paddw %xmm3, %xmm2		; SSE2-NEXT: paddw %xmm3, %xmm2
; SSE2-NEXT: movdqa %xmm2, %xmm0		; SSE2-NEXT: movdqa %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE42-LABEL: abd_cmp_v8i16_multiuse_sub:		; SSE42-LABEL: abd_cmp_v8i16_multiuse_sub:
; SSE42: # %bb.0:		; SSE42: # %bb.0:
; SSE42-NEXT: movdqa %xmm0, %xmm2		; SSE42-NEXT: movdqa %xmm0, %xmm2
; SSE42-NEXT: pmaxuw %xmm1, %xmm2		; SSE42-NEXT: psubw %xmm1, %xmm2
; SSE42-NEXT: pcmpeqw %xmm0, %xmm2
; SSE42-NEXT: movdqa %xmm0, %xmm3		; SSE42-NEXT: movdqa %xmm0, %xmm3
; SSE42-NEXT: psubw %xmm1, %xmm3		; SSE42-NEXT: pminuw %xmm1, %xmm3
; SSE42-NEXT: psubw %xmm0, %xmm1		; SSE42-NEXT: pmaxuw %xmm1, %xmm0
; SSE42-NEXT: movdqa %xmm2, %xmm0		; SSE42-NEXT: psubw %xmm3, %xmm0
; SSE42-NEXT: pblendvb %xmm0, %xmm3, %xmm1		; SSE42-NEXT: paddw %xmm2, %xmm0
; SSE42-NEXT: paddw %xmm1, %xmm3
; SSE42-NEXT: movdqa %xmm3, %xmm0
; SSE42-NEXT: retq		; SSE42-NEXT: retq
;		;
; AVX1-LABEL: abd_cmp_v8i16_multiuse_sub:		; AVX-LABEL: abd_cmp_v8i16_multiuse_sub:
; AVX1: # %bb.0:		; AVX: # %bb.0:
; AVX1-NEXT: vpmaxuw %xmm1, %xmm0, %xmm2		; AVX-NEXT: vpsubw %xmm1, %xmm0, %xmm2
; AVX1-NEXT: vpcmpeqw %xmm2, %xmm0, %xmm2		; AVX-NEXT: vpminuw %xmm1, %xmm0, %xmm3
; AVX1-NEXT: vpsubw %xmm1, %xmm0, %xmm3		; AVX-NEXT: vpmaxuw %xmm1, %xmm0, %xmm0
; AVX1-NEXT: vpsubw %xmm0, %xmm1, %xmm0		; AVX-NEXT: vpsubw %xmm3, %xmm0, %xmm0
; AVX1-NEXT: vpblendvb %xmm2, %xmm3, %xmm0, %xmm0		; AVX-NEXT: vpaddw %xmm0, %xmm2, %xmm0
; AVX1-NEXT: vpaddw %xmm0, %xmm3, %xmm0		; AVX-NEXT: retq
; AVX1-NEXT: retq
;
; AVX2-LABEL: abd_cmp_v8i16_multiuse_sub:
; AVX2: # %bb.0:
; AVX2-NEXT: vpmaxuw %xmm1, %xmm0, %xmm2
; AVX2-NEXT: vpcmpeqw %xmm2, %xmm0, %xmm2
; AVX2-NEXT: vpsubw %xmm1, %xmm0, %xmm3
; AVX2-NEXT: vpsubw %xmm0, %xmm1, %xmm0
; AVX2-NEXT: vpblendvb %xmm2, %xmm3, %xmm0, %xmm0
; AVX2-NEXT: vpaddw %xmm0, %xmm3, %xmm0
; AVX2-NEXT: retq
;
; AVX512-LABEL: abd_cmp_v8i16_multiuse_sub:
; AVX512: # %bb.0:
; AVX512-NEXT: vpsubw %xmm1, %xmm0, %xmm2
; AVX512-NEXT: vpsubw %xmm0, %xmm1, %xmm3
; AVX512-NEXT: vpmaxuw %xmm1, %xmm0, %xmm1
; AVX512-NEXT: vpcmpeqw %xmm1, %xmm0, %xmm0
; AVX512-NEXT: vpblendvb %xmm0, %xmm2, %xmm3, %xmm0
; AVX512-NEXT: vpaddw %xmm0, %xmm2, %xmm0
; AVX512-NEXT: retq
%cmp = icmp uge <8 x i16> %a, %b		%cmp = icmp uge <8 x i16> %a, %b
%ab = sub <8 x i16> %a, %b		%ab = sub <8 x i16> %a, %b
%ba = sub <8 x i16> %b, %a		%ba = sub <8 x i16> %b, %a
%sel = select <8 x i1> %cmp, <8 x i16> %ab, <8 x i16> %ba		%sel = select <8 x i1> %cmp, <8 x i16> %ab, <8 x i16> %ba
%res = add <8 x i16> %ab, %sel		%res = add <8 x i16> %ab, %sel
ret <8 x i16> %res		ret <8 x i16> %res
}		}

Show All 18 Lines

llvm/test/CodeGen/X86/abdu-vector-256.ll

	Show First 20 Lines • Show All 460 Lines • ▼ Show 20 Lines
	;			;

	define <32 x i8> @abd_cmp_v32i8(<32 x i8> %a, <32 x i8> %b) nounwind {			define <32 x i8> @abd_cmp_v32i8(<32 x i8> %a, <32 x i8> %b) nounwind {
	; AVX1-LABEL: abd_cmp_v32i8:			; AVX1-LABEL: abd_cmp_v32i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vpminub %xmm2, %xmm3, %xmm4			; AVX1-NEXT: vpminub %xmm2, %xmm3, %xmm4
	; AVX1-NEXT: vpcmpeqb %xmm4, %xmm3, %xmm4			; AVX1-NEXT: vpmaxub %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpminub %xmm1, %xmm0, %xmm5			; AVX1-NEXT: vpsubb %xmm4, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm5, %xmm0, %xmm5			; AVX1-NEXT: vpminub %xmm1, %xmm0, %xmm3
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4			; AVX1-NEXT: vpmaxub %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsubb %xmm2, %xmm3, %xmm5			; AVX1-NEXT: vpsubb %xmm3, %xmm0, %xmm0
	; AVX1-NEXT: vpsubb %xmm1, %xmm0, %xmm6			; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm5
	; AVX1-NEXT: vpsubb %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpsubb %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; AVX1-NEXT: vandps %ymm0, %ymm4, %ymm0
	; AVX1-NEXT: vandnps %ymm5, %ymm4, %ymm1
	; AVX1-NEXT: vorps %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: abd_cmp_v32i8:			; AVX2-LABEL: abd_cmp_v32i8:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpminub %ymm1, %ymm0, %ymm2			; AVX2-NEXT: vpminub %ymm1, %ymm0, %ymm2
	; AVX2-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2			; AVX2-NEXT: vpmaxub %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpsubb %ymm1, %ymm0, %ymm3			; AVX2-NEXT: vpsubb %ymm2, %ymm0, %ymm0
	; AVX2-NEXT: vpsubb %ymm0, %ymm1, %ymm0
	; AVX2-NEXT: vpblendvb %ymm2, %ymm0, %ymm3, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: abd_cmp_v32i8:			; AVX512-LABEL: abd_cmp_v32i8:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpsubb %ymm1, %ymm0, %ymm2			; AVX512-NEXT: vpminub %ymm1, %ymm0, %ymm2
	; AVX512-NEXT: vpsubb %ymm0, %ymm1, %ymm3			; AVX512-NEXT: vpmaxub %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vpminub %ymm1, %ymm0, %ymm1			; AVX512-NEXT: vpsubb %ymm2, %ymm0, %ymm0
	; AVX512-NEXT: vpcmpeqb %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vpblendvb %ymm0, %ymm3, %ymm2, %ymm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%cmp = icmp ugt <32 x i8> %a, %b			%cmp = icmp ugt <32 x i8> %a, %b
	%ab = sub <32 x i8> %a, %b			%ab = sub <32 x i8> %a, %b
	%ba = sub <32 x i8> %b, %a			%ba = sub <32 x i8> %b, %a
	%sel = select <32 x i1> %cmp, <32 x i8> %ab, <32 x i8> %ba			%sel = select <32 x i1> %cmp, <32 x i8> %ab, <32 x i8> %ba
	ret <32 x i8> %sel			ret <32 x i8> %sel
	}			}

	define <16 x i16> @abd_cmp_v16i16(<16 x i16> %a, <16 x i16> %b) nounwind {			define <16 x i16> @abd_cmp_v16i16(<16 x i16> %a, <16 x i16> %b) nounwind {
	; AVX1-LABEL: abd_cmp_v16i16:			; AVX1-LABEL: abd_cmp_v16i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vpmaxuw %xmm2, %xmm3, %xmm4			; AVX1-NEXT: vpminuw %xmm2, %xmm3, %xmm4
	; AVX1-NEXT: vpcmpeqw %xmm4, %xmm3, %xmm4			; AVX1-NEXT: vpmaxuw %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpmaxuw %xmm1, %xmm0, %xmm5			; AVX1-NEXT: vpsubw %xmm4, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqw %xmm5, %xmm0, %xmm5			; AVX1-NEXT: vpminuw %xmm1, %xmm0, %xmm3
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm5, %ymm4			; AVX1-NEXT: vpmaxuw %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsubw %xmm2, %xmm3, %xmm5			; AVX1-NEXT: vpsubw %xmm3, %xmm0, %xmm0
	; AVX1-NEXT: vpsubw %xmm1, %xmm0, %xmm6			; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm5
	; AVX1-NEXT: vpsubw %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpsubw %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; AVX1-NEXT: vandnps %ymm0, %ymm4, %ymm0
	; AVX1-NEXT: vandps %ymm4, %ymm5, %ymm1
	; AVX1-NEXT: vorps %ymm0, %ymm1, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: abd_cmp_v16i16:			; AVX2-LABEL: abd_cmp_v16i16:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpmaxuw %ymm1, %ymm0, %ymm2			; AVX2-NEXT: vpminuw %ymm1, %ymm0, %ymm2
	; AVX2-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm2			; AVX2-NEXT: vpmaxuw %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpsubw %ymm1, %ymm0, %ymm3			; AVX2-NEXT: vpsubw %ymm2, %ymm0, %ymm0
	; AVX2-NEXT: vpsubw %ymm0, %ymm1, %ymm0
	; AVX2-NEXT: vpblendvb %ymm2, %ymm3, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: abd_cmp_v16i16:			; AVX512-LABEL: abd_cmp_v16i16:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpsubw %ymm1, %ymm0, %ymm2			; AVX512-NEXT: vpminuw %ymm1, %ymm0, %ymm2
	; AVX512-NEXT: vpsubw %ymm0, %ymm1, %ymm3			; AVX512-NEXT: vpmaxuw %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vpmaxuw %ymm1, %ymm0, %ymm1			; AVX512-NEXT: vpsubw %ymm2, %ymm0, %ymm0
	; AVX512-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vpblendvb %ymm0, %ymm2, %ymm3, %ymm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%cmp = icmp uge <16 x i16> %a, %b			%cmp = icmp uge <16 x i16> %a, %b
	%ab = sub <16 x i16> %a, %b			%ab = sub <16 x i16> %a, %b
	%ba = sub <16 x i16> %b, %a			%ba = sub <16 x i16> %b, %a
	%sel = select <16 x i1> %cmp, <16 x i16> %ab, <16 x i16> %ba			%sel = select <16 x i1> %cmp, <16 x i16> %ab, <16 x i16> %ba
	ret <16 x i16> %sel			ret <16 x i16> %sel
	}			}

	define <8 x i32> @abd_cmp_v8i32(<8 x i32> %a, <8 x i32> %b) nounwind {			define <8 x i32> @abd_cmp_v8i32(<8 x i32> %a, <8 x i32> %b) nounwind {
	; AVX1-LABEL: abd_cmp_v8i32:			; AVX1-LABEL: abd_cmp_v8i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpmaxud %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm0, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vpminud %xmm2, %xmm3, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vpmaxud %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpmaxud %xmm3, %xmm4, %xmm5			; AVX1-NEXT: vpsubd %xmm4, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm5, %xmm4, %xmm5			; AVX1-NEXT: vpminud %xmm1, %xmm0, %xmm3
	; AVX1-NEXT: vpsubd %xmm1, %xmm0, %xmm6			; AVX1-NEXT: vpmaxud %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsubd %xmm3, %xmm4, %xmm7			; AVX1-NEXT: vpsubd %xmm3, %xmm0, %xmm0
	; AVX1-NEXT: vpsubd %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; AVX1-NEXT: vblendvps %xmm2, %xmm6, %xmm0, %xmm0
	; AVX1-NEXT: vpsubd %xmm4, %xmm3, %xmm1
	; AVX1-NEXT: vblendvps %xmm5, %xmm7, %xmm1, %xmm1
	; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: abd_cmp_v8i32:			; AVX2-LABEL: abd_cmp_v8i32:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpmaxud %ymm1, %ymm0, %ymm2			; AVX2-NEXT: vpminud %ymm1, %ymm0, %ymm2
	; AVX2-NEXT: vpcmpeqd %ymm2, %ymm0, %ymm2			; AVX2-NEXT: vpmaxud %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpsubd %ymm1, %ymm0, %ymm3			; AVX2-NEXT: vpsubd %ymm2, %ymm0, %ymm0
	; AVX2-NEXT: vpsubd %ymm0, %ymm1, %ymm0
	; AVX2-NEXT: vblendvps %ymm2, %ymm3, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: abd_cmp_v8i32:			; AVX512-LABEL: abd_cmp_v8i32:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpcmpltud %ymm1, %ymm0, %k1			; AVX512-NEXT: vpminud %ymm1, %ymm0, %ymm2
	; AVX512-NEXT: vpsubd %ymm1, %ymm0, %ymm2			; AVX512-NEXT: vpmaxud %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vpsubd %ymm0, %ymm1, %ymm2 {%k1}			; AVX512-NEXT: vpsubd %ymm2, %ymm0, %ymm0
	; AVX512-NEXT: vmovdqa %ymm2, %ymm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%cmp = icmp ult <8 x i32> %a, %b			%cmp = icmp ult <8 x i32> %a, %b
	%ab = sub <8 x i32> %a, %b			%ab = sub <8 x i32> %a, %b
	%ba = sub <8 x i32> %b, %a			%ba = sub <8 x i32> %b, %a
	%sel = select <8 x i1> %cmp, <8 x i32> %ba, <8 x i32> %ab			%sel = select <8 x i1> %cmp, <8 x i32> %ba, <8 x i32> %ab
	ret <8 x i32> %sel			ret <8 x i32> %sel
	}			}

	define <4 x i64> @abd_cmp_v4i64(<4 x i64> %a, <4 x i64> %b) nounwind {			define <4 x i64> @abd_cmp_v4i64(<4 x i64> %a, <4 x i64> %b) nounwind {
	; AVX1-LABEL: abd_cmp_v4i64:			; AVX1-LABEL: abd_cmp_v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm4			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm4
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm4, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vpxor %xmm3, %xmm5, %xmm6
	; AVX1-NEXT: vpxor %xmm2, %xmm4, %xmm5			; AVX1-NEXT: vpcmpgtq %xmm4, %xmm6, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm6			; AVX1-NEXT: vpsubq %xmm2, %xmm5, %xmm6
	; AVX1-NEXT: vpxor %xmm2, %xmm6, %xmm2			; AVX1-NEXT: vpsubq %xmm5, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm5, %xmm2, %xmm2			; AVX1-NEXT: vblendvpd %xmm4, %xmm6, %xmm2, %xmm2
	; AVX1-NEXT: vpsubq %xmm1, %xmm0, %xmm5			; AVX1-NEXT: vpxor %xmm3, %xmm1, %xmm4
	; AVX1-NEXT: vpsubq %xmm6, %xmm4, %xmm7			; AVX1-NEXT: vpxor %xmm3, %xmm0, %xmm3
				; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3
				; AVX1-NEXT: vpsubq %xmm1, %xmm0, %xmm4
	; AVX1-NEXT: vpsubq %xmm0, %xmm1, %xmm0			; AVX1-NEXT: vpsubq %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vblendvpd %xmm3, %xmm0, %xmm5, %xmm0			; AVX1-NEXT: vblendvpd %xmm3, %xmm4, %xmm0, %xmm0
	; AVX1-NEXT: vpsubq %xmm4, %xmm6, %xmm1			; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; AVX1-NEXT: vblendvpd %xmm2, %xmm1, %xmm7, %xmm1
	; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: abd_cmp_v4i64:			; AVX2-LABEL: abd_cmp_v4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]			; AVX2-NEXT: vpbroadcastq {{.*#+}} ymm2 = [9223372036854775808,9223372036854775808,9223372036854775808,9223372036854775808]
	; AVX2-NEXT: vpxor %ymm2, %ymm0, %ymm3			; AVX2-NEXT: vpxor %ymm2, %ymm1, %ymm3
	; AVX2-NEXT: vpxor %ymm2, %ymm1, %ymm2			; AVX2-NEXT: vpxor %ymm2, %ymm0, %ymm2
	; AVX2-NEXT: vpcmpgtq %ymm3, %ymm2, %ymm2			; AVX2-NEXT: vpcmpgtq %ymm3, %ymm2, %ymm2
	; AVX2-NEXT: vpsubq %ymm1, %ymm0, %ymm3			; AVX2-NEXT: vpsubq %ymm1, %ymm0, %ymm3
	; AVX2-NEXT: vpsubq %ymm0, %ymm1, %ymm0			; AVX2-NEXT: vpsubq %ymm0, %ymm1, %ymm0
	; AVX2-NEXT: vblendvpd %ymm2, %ymm0, %ymm3, %ymm0			; AVX2-NEXT: vblendvpd %ymm2, %ymm3, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: abd_cmp_v4i64:			; AVX512-LABEL: abd_cmp_v4i64:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpcmpnltuq %ymm1, %ymm0, %k1			; AVX512-NEXT: vpminuq %ymm1, %ymm0, %ymm2
	; AVX512-NEXT: vpsubq %ymm0, %ymm1, %ymm2			; AVX512-NEXT: vpmaxuq %ymm1, %ymm0, %ymm0
	; AVX512-NEXT: vpsubq %ymm1, %ymm0, %ymm2 {%k1}			; AVX512-NEXT: vpsubq %ymm2, %ymm0, %ymm0
	; AVX512-NEXT: vmovdqa %ymm2, %ymm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%cmp = icmp uge <4 x i64> %a, %b			%cmp = icmp uge <4 x i64> %a, %b
	%ab = sub <4 x i64> %a, %b			%ab = sub <4 x i64> %a, %b
	%ba = sub <4 x i64> %b, %a			%ba = sub <4 x i64> %b, %a
	%sel = select <4 x i1> %cmp, <4 x i64> %ab, <4 x i64> %ba			%sel = select <4 x i1> %cmp, <4 x i64> %ab, <4 x i64> %ba
	ret <4 x i64> %sel			ret <4 x i64> %sel
	}			}

	Show All 18 Lines

llvm/test/CodeGen/X86/abdu-vector-512.ll

	Show First 20 Lines • Show All 261 Lines • ▼ Show 20 Lines

	;			;
	; select(icmp(a,b),sub(a,b),sub(b,a)) -> abdu(a,b)			; select(icmp(a,b),sub(a,b),sub(b,a)) -> abdu(a,b)
	;			;

	define <64 x i8> @abd_cmp_v64i8(<64 x i8> %a, <64 x i8> %b) nounwind {			define <64 x i8> @abd_cmp_v64i8(<64 x i8> %a, <64 x i8> %b) nounwind {
	; AVX512BW-LABEL: abd_cmp_v64i8:			; AVX512BW-LABEL: abd_cmp_v64i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vpcmpnleub %zmm1, %zmm0, %k1			; AVX512BW-NEXT: vpminub %zmm1, %zmm0, %zmm2
	; AVX512BW-NEXT: vpsubb %zmm0, %zmm1, %zmm2			; AVX512BW-NEXT: vpmaxub %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpsubb %zmm1, %zmm0, %zmm2 {%k1}			; AVX512BW-NEXT: vpsubb %zmm2, %zmm0, %zmm0
	; AVX512BW-NEXT: vmovdqa64 %zmm2, %zmm0
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512DQ-LABEL: abd_cmp_v64i8:			; AVX512DQ-LABEL: abd_cmp_v64i8:
	; AVX512DQ: # %bb.0:			; AVX512DQ: # %bb.0:
	; AVX512DQ-NEXT: vextracti64x4 $1, %zmm1, %ymm2			; AVX512DQ-NEXT: vextracti64x4 $1, %zmm1, %ymm2
	; AVX512DQ-NEXT: vextracti64x4 $1, %zmm0, %ymm3			; AVX512DQ-NEXT: vextracti64x4 $1, %zmm0, %ymm3
	; AVX512DQ-NEXT: vpminub %ymm2, %ymm3, %ymm4			; AVX512DQ-NEXT: vpminub %ymm2, %ymm3, %ymm4
	; AVX512DQ-NEXT: vpcmpeqb %ymm4, %ymm3, %ymm4			; AVX512DQ-NEXT: vpmaxub %ymm2, %ymm3, %ymm2
	; AVX512DQ-NEXT: vpminub %ymm1, %ymm0, %ymm5			; AVX512DQ-NEXT: vpsubb %ymm4, %ymm2, %ymm2
	; AVX512DQ-NEXT: vpcmpeqb %ymm5, %ymm0, %ymm5			; AVX512DQ-NEXT: vpminub %ymm1, %ymm0, %ymm3
	; AVX512DQ-NEXT: vinserti64x4 $1, %ymm4, %zmm5, %zmm4			; AVX512DQ-NEXT: vpmaxub %ymm1, %ymm0, %ymm0
	; AVX512DQ-NEXT: vpsubb %ymm2, %ymm3, %ymm5			; AVX512DQ-NEXT: vpsubb %ymm3, %ymm0, %ymm0
	; AVX512DQ-NEXT: vpsubb %ymm1, %ymm0, %ymm6
	; AVX512DQ-NEXT: vinserti64x4 $1, %ymm5, %zmm6, %zmm5
	; AVX512DQ-NEXT: vpsubb %ymm3, %ymm2, %ymm2
	; AVX512DQ-NEXT: vpsubb %ymm0, %ymm1, %ymm0
	; AVX512DQ-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0			; AVX512DQ-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0
	; AVX512DQ-NEXT: vpternlogq $226, %zmm5, %zmm4, %zmm0
	; AVX512DQ-NEXT: retq			; AVX512DQ-NEXT: retq
	%cmp = icmp ugt <64 x i8> %a, %b			%cmp = icmp ugt <64 x i8> %a, %b
	%ab = sub <64 x i8> %a, %b			%ab = sub <64 x i8> %a, %b
	%ba = sub <64 x i8> %b, %a			%ba = sub <64 x i8> %b, %a
	%sel = select <64 x i1> %cmp, <64 x i8> %ab, <64 x i8> %ba			%sel = select <64 x i1> %cmp, <64 x i8> %ab, <64 x i8> %ba
	ret <64 x i8> %sel			ret <64 x i8> %sel
	}			}

	define <32 x i16> @abd_cmp_v32i16(<32 x i16> %a, <32 x i16> %b) nounwind {			define <32 x i16> @abd_cmp_v32i16(<32 x i16> %a, <32 x i16> %b) nounwind {
	; AVX512BW-LABEL: abd_cmp_v32i16:			; AVX512BW-LABEL: abd_cmp_v32i16:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vpcmpnltuw %zmm1, %zmm0, %k1			; AVX512BW-NEXT: vpminuw %zmm1, %zmm0, %zmm2
	; AVX512BW-NEXT: vpsubw %zmm0, %zmm1, %zmm2			; AVX512BW-NEXT: vpmaxuw %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpsubw %zmm1, %zmm0, %zmm2 {%k1}			; AVX512BW-NEXT: vpsubw %zmm2, %zmm0, %zmm0
	; AVX512BW-NEXT: vmovdqa64 %zmm2, %zmm0
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512DQ-LABEL: abd_cmp_v32i16:			; AVX512DQ-LABEL: abd_cmp_v32i16:
	; AVX512DQ: # %bb.0:			; AVX512DQ: # %bb.0:
	; AVX512DQ-NEXT: vextracti64x4 $1, %zmm1, %ymm2			; AVX512DQ-NEXT: vextracti64x4 $1, %zmm1, %ymm2
	; AVX512DQ-NEXT: vextracti64x4 $1, %zmm0, %ymm3			; AVX512DQ-NEXT: vextracti64x4 $1, %zmm0, %ymm3
	; AVX512DQ-NEXT: vpmaxuw %ymm2, %ymm3, %ymm4			; AVX512DQ-NEXT: vpminuw %ymm2, %ymm3, %ymm4
	; AVX512DQ-NEXT: vpcmpeqw %ymm4, %ymm3, %ymm4			; AVX512DQ-NEXT: vpmaxuw %ymm2, %ymm3, %ymm2
	; AVX512DQ-NEXT: vpmaxuw %ymm1, %ymm0, %ymm5			; AVX512DQ-NEXT: vpsubw %ymm4, %ymm2, %ymm2
	; AVX512DQ-NEXT: vpcmpeqw %ymm5, %ymm0, %ymm5			; AVX512DQ-NEXT: vpminuw %ymm1, %ymm0, %ymm3
	; AVX512DQ-NEXT: vinserti64x4 $1, %ymm4, %zmm5, %zmm4			; AVX512DQ-NEXT: vpmaxuw %ymm1, %ymm0, %ymm0
	; AVX512DQ-NEXT: vpsubw %ymm2, %ymm3, %ymm5			; AVX512DQ-NEXT: vpsubw %ymm3, %ymm0, %ymm0
	; AVX512DQ-NEXT: vpsubw %ymm1, %ymm0, %ymm6
	; AVX512DQ-NEXT: vinserti64x4 $1, %ymm5, %zmm6, %zmm5
	; AVX512DQ-NEXT: vpsubw %ymm3, %ymm2, %ymm2
	; AVX512DQ-NEXT: vpsubw %ymm0, %ymm1, %ymm0
	; AVX512DQ-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0			; AVX512DQ-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0
	; AVX512DQ-NEXT: vpternlogq $184, %zmm5, %zmm4, %zmm0
	; AVX512DQ-NEXT: retq			; AVX512DQ-NEXT: retq
	%cmp = icmp uge <32 x i16> %a, %b			%cmp = icmp uge <32 x i16> %a, %b
	%ab = sub <32 x i16> %a, %b			%ab = sub <32 x i16> %a, %b
	%ba = sub <32 x i16> %b, %a			%ba = sub <32 x i16> %b, %a
	%sel = select <32 x i1> %cmp, <32 x i16> %ab, <32 x i16> %ba			%sel = select <32 x i1> %cmp, <32 x i16> %ab, <32 x i16> %ba
	ret <32 x i16> %sel			ret <32 x i16> %sel
	}			}

	define <16 x i32> @abd_cmp_v16i32(<16 x i32> %a, <16 x i32> %b) nounwind {			define <16 x i32> @abd_cmp_v16i32(<16 x i32> %a, <16 x i32> %b) nounwind {
	; AVX512-LABEL: abd_cmp_v16i32:			; AVX512-LABEL: abd_cmp_v16i32:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpcmpltud %zmm1, %zmm0, %k1			; AVX512-NEXT: vpminud %zmm1, %zmm0, %zmm2
	; AVX512-NEXT: vpsubd %zmm1, %zmm0, %zmm2			; AVX512-NEXT: vpmaxud %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpsubd %zmm0, %zmm1, %zmm2 {%k1}			; AVX512-NEXT: vpsubd %zmm2, %zmm0, %zmm0
	; AVX512-NEXT: vmovdqa64 %zmm2, %zmm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%cmp = icmp ult <16 x i32> %a, %b			%cmp = icmp ult <16 x i32> %a, %b
	%ab = sub <16 x i32> %a, %b			%ab = sub <16 x i32> %a, %b
	%ba = sub <16 x i32> %b, %a			%ba = sub <16 x i32> %b, %a
	%sel = select <16 x i1> %cmp, <16 x i32> %ba, <16 x i32> %ab			%sel = select <16 x i1> %cmp, <16 x i32> %ba, <16 x i32> %ab
	ret <16 x i32> %sel			ret <16 x i32> %sel
	}			}

	define <8 x i64> @abd_cmp_v8i64(<8 x i64> %a, <8 x i64> %b) nounwind {			define <8 x i64> @abd_cmp_v8i64(<8 x i64> %a, <8 x i64> %b) nounwind {
	; AVX512-LABEL: abd_cmp_v8i64:			; AVX512-LABEL: abd_cmp_v8i64:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpcmpnltuq %zmm1, %zmm0, %k1			; AVX512-NEXT: vpminuq %zmm1, %zmm0, %zmm2
	; AVX512-NEXT: vpsubq %zmm0, %zmm1, %zmm2			; AVX512-NEXT: vpmaxuq %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpsubq %zmm1, %zmm0, %zmm2 {%k1}			; AVX512-NEXT: vpsubq %zmm2, %zmm0, %zmm0
	; AVX512-NEXT: vmovdqa64 %zmm2, %zmm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%cmp = icmp uge <8 x i64> %a, %b			%cmp = icmp uge <8 x i64> %a, %b
	%ab = sub <8 x i64> %a, %b			%ab = sub <8 x i64> %a, %b
	%ba = sub <8 x i64> %b, %a			%ba = sub <8 x i64> %b, %a
	%sel = select <8 x i1> %cmp, <8 x i64> %ab, <8 x i64> %ba			%sel = select <8 x i1> %cmp, <8 x i64> %ab, <8 x i64> %ba
	ret <8 x i64> %sel			ret <8 x i64> %sel
	}			}

	Show All 18 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[DAG] Match select(icmp(x,y),sub(x,y),sub(y,x)) -> abd(x,y) patterns
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 505108

llvm/lib/CodeGen/SelectionDAG/DAGCombiner.cpp

llvm/lib/Target/PowerPC/PPCISelLowering.h

llvm/lib/Target/PowerPC/PPCISelLowering.cpp

llvm/test/CodeGen/AArch64/abd-combine.ll

llvm/test/CodeGen/PowerPC/ppc64-P9-vabsd.ll

llvm/test/CodeGen/X86/abds-vector-128.ll

llvm/test/CodeGen/X86/abds-vector-256.ll

llvm/test/CodeGen/X86/abds-vector-512.ll

llvm/test/CodeGen/X86/abdu-vector-128.ll

llvm/test/CodeGen/X86/abdu-vector-256.ll

llvm/test/CodeGen/X86/abdu-vector-512.ll

This is an archive of the discontinued LLVM Phabricator instance.

[DAG] Match select(icmp(x,y),sub(x,y),sub(y,x)) -> abd(x,y) patternsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 505108

llvm/lib/CodeGen/SelectionDAG/DAGCombiner.cpp

llvm/lib/Target/PowerPC/PPCISelLowering.h

llvm/lib/Target/PowerPC/PPCISelLowering.cpp

llvm/test/CodeGen/AArch64/abd-combine.ll

llvm/test/CodeGen/PowerPC/ppc64-P9-vabsd.ll

llvm/test/CodeGen/X86/abds-vector-128.ll

llvm/test/CodeGen/X86/abds-vector-256.ll

llvm/test/CodeGen/X86/abds-vector-512.ll

llvm/test/CodeGen/X86/abdu-vector-128.ll

llvm/test/CodeGen/X86/abdu-vector-256.ll

llvm/test/CodeGen/X86/abdu-vector-512.ll

[DAG] Match select(icmp(x,y),sub(x,y),sub(y,x)) -> abd(x,y) patterns
ClosedPublic