This is an archive of the discontinued LLVM Phabricator instance.

[CodeGen] Add legalization for Integer Saturation Intrinsics.
Needs ReviewPublic

Authored by ab on Jan 14 2015, 2:04 PM.

Download Raw Diff

This revision needs review, but there are no reviewers specified.

Details

Reviewers: None

Summary

I don't think there's a lot of room for variance in the implementation, but I'd like to have opinions on one particular point: the scalar expansion.

The expanded code for the intrinsics is the equivalent 2icmp+2select, roughly corresponding to:

(x > max ? max : (x < min ? min : x))

that is:

%0 = icmp slt i32 %x, %min
%1 = select i1 %0, i32 %min, i32 %x
%2 = icmp sgt i32 %1, %max
%3 = select i1 %2, i32 %max, i32 %1

With, for signed n-bit saturation:

min: -(2^(n-1))
max: 2^(n-1)-1

However, an alternative expansion could be to not reuse the intermediate result, i.e.:

%0 = icmp slt i32 %x, %min
%1 = select i1 %0, i32 %min, i32 %x
%2 = icmp sgt i32 %x, %max                  ; <--- %x instead of %1
%3 = select i1 %2, i32 %max, i32 %1

I'm not entirely convinced which is better. In practice, the latter leads to increased register pressure, and actually resulted in some regressions, just for going through the intrinsic and back to the expansion.
The current patch uses the first one (with the dependency).

Anyway, this isn't a blocking problem for this patch, since the intrinsics aren't generated. We'll see about introducing more machinery (say a target hook to only generate the intrinsics when profitable, a register-pressure-aware legalization, or a later relaxation, etc..) if it's deemed necessary.

Based on D6976.

Diff Detail

Event Timeline

ab updated this revision to Diff 18183.Jan 14 2015, 2:04 PM

ab retitled this revision from to [CodeGen] Add legalization for Integer Saturation Intrinsics..

ab updated this object.

ab edited the test plan for this revision. (Show Details)

ab added a parent revision: D6976: Add Integer Saturation Intrinsics..Jan 14 2015, 2:08 PM

ab added a subscriber: Unknown Object (MLST).

tkn added a subscriber: tkn.Nov 17 2016, 7:08 PM

Revision Contents

Path

Size

include/

llvm/

CodeGen/

ISDOpcodes.h

12 lines

Target/

TargetSelectionDAG.td

6 lines

lib/

CodeGen/

SelectionDAG/

LegalizeDAG.cpp

26 lines

LegalizeIntegerTypes.cpp

87 lines

LegalizeTypes.h

6 lines

LegalizeVectorOps.cpp

52 lines

LegalizeVectorTypes.cpp

35 lines

SelectionDAGBuilder.cpp

15 lines

SelectionDAGDumper.cpp

2 lines

TargetLoweringBase.cpp

3 lines

test/

CodeGen/

X86/

saturation-legalization.ll

465 lines

Diff 18183

include/llvm/CodeGen/ISDOpcodes.h

Show First 20 Lines • Show All 217 Lines • ▼ Show 20 Lines	enum NodeType {
SADDO, UADDO,		SADDO, UADDO,

/// Same for subtraction.		/// Same for subtraction.
SSUBO, USUBO,		SSUBO, USUBO,

/// Same for multiplication.		/// Same for multiplication.
SMULO, UMULO,		SMULO, UMULO,

		/// [SU]SAT(X, N) - Saturate X to an N-bit integer.
		/// That is:
		/// sat(X, N) = (X < MIN_N) ? MIN_N : ((X > MAX_N) ? MAX_N : X)
		/// with:
		/// usat: MIN_N = 0, MAX_N = 2^N-1
		/// ssat: MIN_N = -2^(N-1), MAX_N = 2^(N-1)-1
		/// In other words:
		/// usat(X, N) = min(max(X, 0), 2^N-1)
		/// ssat(X, N) = min(max(X, -2^(N-1)), 2^(N-1)-1)
		/// These nodes are generated from the llvm.[su]sat intrinsics.
		SSAT, USAT,

/// Simple binary floating point operators.		/// Simple binary floating point operators.
FADD, FSUB, FMUL, FMA, FDIV, FREM,		FADD, FSUB, FMUL, FMA, FDIV, FREM,

/// FCOPYSIGN(X, Y) - Return the value of X with the sign of Y. NOTE: This		/// FCOPYSIGN(X, Y) - Return the value of X with the sign of Y. NOTE: This
/// DAG node does not require that X and Y have the same type, just that the		/// DAG node does not require that X and Y have the same type, just that the
/// are both floating point. X and the result must have the same type.		/// are both floating point. X and the result must have the same type.
/// FCOPYSIGN(f32, f64) is allowed.		/// FCOPYSIGN(f32, f64) is allowed.
FCOPYSIGN,		FCOPYSIGN,
▲ Show 20 Lines • Show All 632 Lines • Show Last 20 Lines

include/llvm/Target/TargetSelectionDAG.td

	Show First 20 Lines • Show All 93 Lines • ▼ Show 20 Lines
	def SDTUnaryOp : SDTypeProfile<1, 1, []>; // for bitconvert.			def SDTUnaryOp : SDTypeProfile<1, 1, []>; // for bitconvert.

	def SDTIntBinOp : SDTypeProfile<1, 2, [ // add, and, or, xor, udiv, etc.			def SDTIntBinOp : SDTypeProfile<1, 2, [ // add, and, or, xor, udiv, etc.
	SDTCisSameAs<0, 1>, SDTCisSameAs<0, 2>, SDTCisInt<0>			SDTCisSameAs<0, 1>, SDTCisSameAs<0, 2>, SDTCisInt<0>
	]>;			]>;
	def SDTIntShiftOp : SDTypeProfile<1, 2, [ // shl, sra, srl			def SDTIntShiftOp : SDTypeProfile<1, 2, [ // shl, sra, srl
	SDTCisSameAs<0, 1>, SDTCisInt<0>, SDTCisInt<2>			SDTCisSameAs<0, 1>, SDTCisInt<0>, SDTCisInt<2>
	]>;			]>;
				def SDTIntSatOp : SDTypeProfile<1, 2, [ // ssat, usat
				SDTCisSameAs<0, 1>, SDTCisInt<0>, SDTCisInt<2>
				]>;
	def SDTIntBinHiLoOp : SDTypeProfile<2, 2, [ // mulhi, mullo, sdivrem, udivrem			def SDTIntBinHiLoOp : SDTypeProfile<2, 2, [ // mulhi, mullo, sdivrem, udivrem
	SDTCisSameAs<0, 1>, SDTCisSameAs<0, 2>, SDTCisSameAs<0, 3>,SDTCisInt<0>			SDTCisSameAs<0, 1>, SDTCisSameAs<0, 2>, SDTCisSameAs<0, 3>,SDTCisInt<0>
	]>;			]>;

	def SDTFPBinOp : SDTypeProfile<1, 2, [ // fadd, fmul, etc.			def SDTFPBinOp : SDTypeProfile<1, 2, [ // fadd, fmul, etc.
	SDTCisSameAs<0, 1>, SDTCisSameAs<0, 2>, SDTCisFP<0>			SDTCisSameAs<0, 1>, SDTCisSameAs<0, 2>, SDTCisFP<0>
	]>;			]>;
	def SDTFPSignOp : SDTypeProfile<1, 2, [ // fcopysign.			def SDTFPSignOp : SDTypeProfile<1, 2, [ // fcopysign.
	▲ Show 20 Lines • Show All 259 Lines • ▼ Show 20 Lines
	def sext : SDNode<"ISD::SIGN_EXTEND", SDTIntExtendOp>;			def sext : SDNode<"ISD::SIGN_EXTEND", SDTIntExtendOp>;
	def zext : SDNode<"ISD::ZERO_EXTEND", SDTIntExtendOp>;			def zext : SDNode<"ISD::ZERO_EXTEND", SDTIntExtendOp>;
	def anyext : SDNode<"ISD::ANY_EXTEND" , SDTIntExtendOp>;			def anyext : SDNode<"ISD::ANY_EXTEND" , SDTIntExtendOp>;
	def trunc : SDNode<"ISD::TRUNCATE" , SDTIntTruncOp>;			def trunc : SDNode<"ISD::TRUNCATE" , SDTIntTruncOp>;
	def bitconvert : SDNode<"ISD::BITCAST" , SDTUnaryOp>;			def bitconvert : SDNode<"ISD::BITCAST" , SDTUnaryOp>;
	def extractelt : SDNode<"ISD::EXTRACT_VECTOR_ELT", SDTVecExtract>;			def extractelt : SDNode<"ISD::EXTRACT_VECTOR_ELT", SDTVecExtract>;
	def insertelt : SDNode<"ISD::INSERT_VECTOR_ELT", SDTVecInsert>;			def insertelt : SDNode<"ISD::INSERT_VECTOR_ELT", SDTVecInsert>;

				def ssat : SDNode<"ISD::SSAT" , SDTIntSatOp>;
				def usat : SDNode<"ISD::USAT" , SDTIntSatOp>;

	def fadd : SDNode<"ISD::FADD" , SDTFPBinOp, [SDNPCommutative]>;			def fadd : SDNode<"ISD::FADD" , SDTFPBinOp, [SDNPCommutative]>;
	def fsub : SDNode<"ISD::FSUB" , SDTFPBinOp>;			def fsub : SDNode<"ISD::FSUB" , SDTFPBinOp>;
	def fmul : SDNode<"ISD::FMUL" , SDTFPBinOp, [SDNPCommutative]>;			def fmul : SDNode<"ISD::FMUL" , SDTFPBinOp, [SDNPCommutative]>;
	def fdiv : SDNode<"ISD::FDIV" , SDTFPBinOp>;			def fdiv : SDNode<"ISD::FDIV" , SDTFPBinOp>;
	def frem : SDNode<"ISD::FREM" , SDTFPBinOp>;			def frem : SDNode<"ISD::FREM" , SDTFPBinOp>;
	def fma : SDNode<"ISD::FMA" , SDTFPTernaryOp>;			def fma : SDNode<"ISD::FMA" , SDTFPTernaryOp>;
	def fabs : SDNode<"ISD::FABS" , SDTFPUnaryOp>;			def fabs : SDNode<"ISD::FABS" , SDTFPUnaryOp>;
	def fminnum : SDNode<"ISD::FMINNUM" , SDTFPBinOp>;			def fminnum : SDNode<"ISD::FMINNUM" , SDTFPBinOp>;
	▲ Show 20 Lines • Show All 678 Lines • Show Last 20 Lines

lib/CodeGen/SelectionDAG/LegalizeDAG.cpp

Show First 20 Lines • Show All 3,751 Lines • ▼ Show 20 Lines	case ISD::USUBO: {
EVT SetCCType = getSetCCResultType(Node->getValueType(0));		EVT SetCCType = getSetCCResultType(Node->getValueType(0));
ISD::CondCode CC		ISD::CondCode CC
= Node->getOpcode() == ISD::UADDO ? ISD::SETULT : ISD::SETUGT;		= Node->getOpcode() == ISD::UADDO ? ISD::SETULT : ISD::SETUGT;
SDValue SetCC = DAG.getSetCC(dl, SetCCType, Sum, LHS, CC);		SDValue SetCC = DAG.getSetCC(dl, SetCCType, Sum, LHS, CC);

Results.push_back(DAG.getBoolExtOrTrunc(SetCC, dl, ResultType, ResultType));		Results.push_back(DAG.getBoolExtOrTrunc(SetCC, dl, ResultType, ResultType));
break;		break;
}		}
		case ISD::USAT:
		case ISD::SSAT: {
		SDValue Val = Node->getOperand(0);
		EVT VT = Val.getValueType();
		unsigned BitWidth = VT.getScalarSizeInBits();
		uint64_t SatBit = cast<ConstantSDNode>(Node->getOperand(1))->getZExtValue();
		APInt Max, Min;

		if (Node->getOpcode() == ISD::USAT) {
		Max = APInt::getLowBitsSet(BitWidth, SatBit);
		Min = APInt::getNullValue(BitWidth);
		} else {
		Max = APInt::getLowBitsSet(BitWidth, SatBit - 1);
		Min = APInt::getHighBitsSet(BitWidth, BitWidth - SatBit + 1);
		}

		SDValue MaxV = DAG.getConstant(Max, VT);
		SDValue MinV = DAG.getConstant(Min, VT);

		SDValue Res;
		Res = DAG.getSelectCC(dl, Val, MinV, MinV, Val, ISD::SETLT);
		Res = DAG.getSelectCC(dl, Res, MaxV, MaxV, Res, ISD::SETGT);

		Results.push_back(Res);
		break;
		}
case ISD::UMULO:		case ISD::UMULO:
case ISD::SMULO: {		case ISD::SMULO: {
EVT VT = Node->getValueType(0);		EVT VT = Node->getValueType(0);
EVT WideVT = EVT::getIntegerVT(DAG.getContext(), VT.getSizeInBits() 2);		EVT WideVT = EVT::getIntegerVT(DAG.getContext(), VT.getSizeInBits() 2);
SDValue LHS = Node->getOperand(0);		SDValue LHS = Node->getOperand(0);
SDValue RHS = Node->getOperand(1);		SDValue RHS = Node->getOperand(1);
SDValue BottomHalf;		SDValue BottomHalf;
SDValue TopHalf;		SDValue TopHalf;
▲ Show 20 Lines • Show All 593 Lines • Show Last 20 Lines

lib/CodeGen/SelectionDAG/LegalizeIntegerTypes.cpp

Show First 20 Lines • Show All 115 Lines • ▼ Show 20 Lines	#endif

case ISD::SADDO:		case ISD::SADDO:
case ISD::SSUBO: Res = PromoteIntRes_SADDSUBO(N, ResNo); break;		case ISD::SSUBO: Res = PromoteIntRes_SADDSUBO(N, ResNo); break;
case ISD::UADDO:		case ISD::UADDO:
case ISD::USUBO: Res = PromoteIntRes_UADDSUBO(N, ResNo); break;		case ISD::USUBO: Res = PromoteIntRes_UADDSUBO(N, ResNo); break;
case ISD::SMULO:		case ISD::SMULO:
case ISD::UMULO: Res = PromoteIntRes_XMULO(N, ResNo); break;		case ISD::UMULO: Res = PromoteIntRes_XMULO(N, ResNo); break;

		case ISD::USAT:
		case ISD::SSAT:
		Res = PromoteIntRes_SAT(N); break;

case ISD::ATOMIC_LOAD:		case ISD::ATOMIC_LOAD:
Res = PromoteIntRes_Atomic0(cast<AtomicSDNode>(N)); break;		Res = PromoteIntRes_Atomic0(cast<AtomicSDNode>(N)); break;

case ISD::ATOMIC_LOAD_ADD:		case ISD::ATOMIC_LOAD_ADD:
case ISD::ATOMIC_LOAD_SUB:		case ISD::ATOMIC_LOAD_SUB:
case ISD::ATOMIC_LOAD_AND:		case ISD::ATOMIC_LOAD_AND:
case ISD::ATOMIC_LOAD_OR:		case ISD::ATOMIC_LOAD_OR:
case ISD::ATOMIC_LOAD_XOR:		case ISD::ATOMIC_LOAD_XOR:
▲ Show 20 Lines • Show All 509 Lines • ▼ Show 20 Lines	case TargetLowering::TypeSplitVector:

return DAG.getNode(ISD::CONCAT_VECTORS, dl, NVT, EOp1, EOp2);		return DAG.getNode(ISD::CONCAT_VECTORS, dl, NVT, EOp1, EOp2);
}		}

// Truncate to NVT instead of VT		// Truncate to NVT instead of VT
return DAG.getNode(ISD::TRUNCATE, dl, NVT, Res);		return DAG.getNode(ISD::TRUNCATE, dl, NVT, Res);
}		}

		SDValue DAGTypeLegalizer::PromoteIntRes_SAT(SDNode *N) {
		SDValue Op = SExtPromotedInteger(N->getOperand(0));
		EVT NVT = Op.getValueType();
		SDValue SatBit = N->getOperand(1);
		SDLoc dl(N);

		return DAG.getNode(N->getOpcode(), dl, NVT, Op, SatBit);
		}

SDValue DAGTypeLegalizer::PromoteIntRes_UADDSUBO(SDNode *N, unsigned ResNo) {		SDValue DAGTypeLegalizer::PromoteIntRes_UADDSUBO(SDNode *N, unsigned ResNo) {
if (ResNo == 1)		if (ResNo == 1)
return PromoteIntRes_Overflow(N);		return PromoteIntRes_Overflow(N);

// The operation overflowed iff the result in the larger type is not the		// The operation overflowed iff the result in the larger type is not the
// zero extension of its truncation to the original type.		// zero extension of its truncation to the original type.
SDValue LHS = ZExtPromotedInteger(N->getOperand(0));		SDValue LHS = ZExtPromotedInteger(N->getOperand(0));
SDValue RHS = ZExtPromotedInteger(N->getOperand(1));		SDValue RHS = ZExtPromotedInteger(N->getOperand(1));
▲ Show 20 Lines • Show All 586 Lines • ▼ Show 20 Lines	#endif

case ISD::ADDE:		case ISD::ADDE:
case ISD::SUBE: ExpandIntRes_ADDSUBE(N, Lo, Hi); break;		case ISD::SUBE: ExpandIntRes_ADDSUBE(N, Lo, Hi); break;

case ISD::SHL:		case ISD::SHL:
case ISD::SRA:		case ISD::SRA:
case ISD::SRL: ExpandIntRes_Shift(N, Lo, Hi); break;		case ISD::SRL: ExpandIntRes_Shift(N, Lo, Hi); break;

		case ISD::USAT:
		case ISD::SSAT: ExpandIntRes_SAT(N, Lo, Hi); break;

case ISD::SADDO:		case ISD::SADDO:
case ISD::SSUBO: ExpandIntRes_SADDSUBO(N, Lo, Hi); break;		case ISD::SSUBO: ExpandIntRes_SADDSUBO(N, Lo, Hi); break;
case ISD::UADDO:		case ISD::UADDO:
case ISD::USUBO: ExpandIntRes_UADDSUBO(N, Lo, Hi); break;		case ISD::USUBO: ExpandIntRes_UADDSUBO(N, Lo, Hi); break;
case ISD::UMULO:		case ISD::UMULO:
case ISD::SMULO: ExpandIntRes_XMULO(N, Lo, Hi); break;		case ISD::SMULO: ExpandIntRes_XMULO(N, Lo, Hi); break;
}		}

▲ Show 20 Lines • Show All 842 Lines • ▼ Show 20 Lines	void DAGTypeLegalizer::ExpandIntRes_SDIV(SDNode *N,
else if (VT == MVT::i128)		else if (VT == MVT::i128)
LC = RTLIB::SDIV_I128;		LC = RTLIB::SDIV_I128;
assert(LC != RTLIB::UNKNOWN_LIBCALL && "Unsupported SDIV!");		assert(LC != RTLIB::UNKNOWN_LIBCALL && "Unsupported SDIV!");

SDValue Ops[2] = { N->getOperand(0), N->getOperand(1) };		SDValue Ops[2] = { N->getOperand(0), N->getOperand(1) };
SplitInteger(TLI.makeLibCall(DAG, LC, VT, Ops, 2, true, dl).first, Lo, Hi);		SplitInteger(TLI.makeLibCall(DAG, LC, VT, Ops, 2, true, dl).first, Lo, Hi);
}		}

		void DAGTypeLegalizer::ExpandIntRes_SAT(SDNode *N, SDValue &Lo, SDValue &Hi) {
		EVT VT = N->getValueType(0);
		SDLoc dl(N);
		SDValue Val = N->getOperand(0);
		unsigned BitWidth = VT.getScalarSizeInBits();
		uint64_t SatBit = cast<ConstantSDNode>(N->getOperand(1))->getZExtValue();
		APInt Max, Min;

		if (N->getOpcode() == ISD::USAT) {
		Max = APInt::getLowBitsSet(BitWidth, SatBit);
		Min = APInt::getNullValue(BitWidth);
		} else {
		Max = APInt::getLowBitsSet(BitWidth, SatBit - 1);
		Min = APInt::getHighBitsSet(BitWidth, BitWidth - SatBit + 1);
		}

		SDValue MaxV = DAG.getConstant(Max, VT);
		SDValue MinV = DAG.getConstant(Min, VT);

		SDValue LoMaxV, HiMaxV;
		SDValue LoMinV, HiMinV;

		SplitInteger(MaxV, LoMaxV, HiMaxV);
		SetExpandedInteger(MaxV, LoMaxV, HiMaxV);
		SplitInteger(MinV, LoMinV, HiMinV);
		SetExpandedInteger(MinV, LoMinV, HiMinV);

		SDValue MinSetCC;
		{
		SDValue NewLHS = Val, NewRHS = MinV;
		ISD::CondCode CCCode = ISD::SETLT;
		IntegerExpandSetCCOperands(NewLHS, NewRHS, CCCode, dl);
		// If ExpandSetCCOperands returned a scalar, we need to compare the result
		// against zero to select between true and false values.
		if (!NewRHS.getNode()) {
		NewRHS = DAG.getConstant(0, NewLHS.getValueType());
		CCCode = ISD::SETNE;
		}
		EVT SetCCType = getSetCCResultType(NewLHS.getValueType());
		MinSetCC = DAG.getSetCC(dl, SetCCType, NewLHS, NewRHS, CCCode);
		}

		SDValue MaxSetCC;
		{
		SDValue NewLHS = Val, NewRHS = MaxV;
		ISD::CondCode CCCode = ISD::SETGT;
		IntegerExpandSetCCOperands(NewLHS, NewRHS, CCCode, dl);
		// If ExpandSetCCOperands returned a scalar, we need to compare the result
		// against zero to select between true and false values.
		if (!NewRHS.getNode()) {
		NewRHS = DAG.getConstant(0, NewLHS.getValueType());
		CCCode = ISD::SETNE;
		}
		EVT SetCCType = getSetCCResultType(NewLHS.getValueType());
		MaxSetCC = DAG.getSetCC(dl, SetCCType, NewLHS, NewRHS, CCCode);
		}
		assert(MinSetCC.getValueType() == MaxSetCC.getValueType() &&
		"Inconsistent SETCC result types when expanding SSAT/USAT.");

		SDValue LoVal, HiVal;
		GetExpandedInteger(Val, LoVal, HiVal);

		EVT ResVT = LoVal.getValueType();

		Lo = DAG.getSelect(dl, ResVT, MinSetCC, LoMinV, LoVal);
		Lo = DAG.getSelect(dl, ResVT, MaxSetCC, LoMaxV, Lo);

		Hi = DAG.getSelect(dl, ResVT, MinSetCC, HiMinV, HiVal);
		Hi = DAG.getSelect(dl, ResVT, MaxSetCC, HiMaxV, Hi);
		}

void DAGTypeLegalizer::ExpandIntRes_Shift(SDNode *N,		void DAGTypeLegalizer::ExpandIntRes_Shift(SDNode *N,
SDValue &Lo, SDValue &Hi) {		SDValue &Lo, SDValue &Hi) {
EVT VT = N->getValueType(0);		EVT VT = N->getValueType(0);
SDLoc dl(N);		SDLoc dl(N);

// If we can emit an efficient shift operation, do so now. Check to see if		// If we can emit an efficient shift operation, do so now. Check to see if
// the RHS is a constant.		// the RHS is a constant.
if (ConstantSDNode *CN = dyn_cast<ConstantSDNode>(N->getOperand(1)))		if (ConstantSDNode *CN = dyn_cast<ConstantSDNode>(N->getOperand(1)))
▲ Show 20 Lines • Show All 989 Lines • Show Last 20 Lines

lib/CodeGen/SelectionDAG/LegalizeTypes.h

Show First 20 Lines • Show All 252 Lines • ▼ Show 20 Lines	private:
SDValue PromoteIntRes_SRA(SDNode *N);		SDValue PromoteIntRes_SRA(SDNode *N);
SDValue PromoteIntRes_SRL(SDNode *N);		SDValue PromoteIntRes_SRL(SDNode *N);
SDValue PromoteIntRes_TRUNCATE(SDNode *N);		SDValue PromoteIntRes_TRUNCATE(SDNode *N);
SDValue PromoteIntRes_UADDSUBO(SDNode *N, unsigned ResNo);		SDValue PromoteIntRes_UADDSUBO(SDNode *N, unsigned ResNo);
SDValue PromoteIntRes_UDIV(SDNode *N);		SDValue PromoteIntRes_UDIV(SDNode *N);
SDValue PromoteIntRes_UNDEF(SDNode *N);		SDValue PromoteIntRes_UNDEF(SDNode *N);
SDValue PromoteIntRes_VAARG(SDNode *N);		SDValue PromoteIntRes_VAARG(SDNode *N);
SDValue PromoteIntRes_XMULO(SDNode *N, unsigned ResNo);		SDValue PromoteIntRes_XMULO(SDNode *N, unsigned ResNo);
		SDValue PromoteIntRes_SAT(SDNode *N);

// Integer Operand Promotion.		// Integer Operand Promotion.
bool PromoteIntegerOperand(SDNode *N, unsigned OperandNo);		bool PromoteIntegerOperand(SDNode *N, unsigned OperandNo);
SDValue PromoteIntOp_ANY_EXTEND(SDNode *N);		SDValue PromoteIntOp_ANY_EXTEND(SDNode *N);
SDValue PromoteIntOp_ATOMIC_STORE(AtomicSDNode *N);		SDValue PromoteIntOp_ATOMIC_STORE(AtomicSDNode *N);
SDValue PromoteIntOp_BITCAST(SDNode *N);		SDValue PromoteIntOp_BITCAST(SDNode *N);
SDValue PromoteIntOp_BUILD_PAIR(SDNode *N);		SDValue PromoteIntOp_BUILD_PAIR(SDNode *N);
SDValue PromoteIntOp_BR_CC(SDNode *N, unsigned OpNo);		SDValue PromoteIntOp_BR_CC(SDNode *N, unsigned OpNo);
▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines	private:
void ExpandIntRes_BSWAP (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandIntRes_BSWAP (SDNode *N, SDValue &Lo, SDValue &Hi);
void ExpandIntRes_MUL (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandIntRes_MUL (SDNode *N, SDValue &Lo, SDValue &Hi);
void ExpandIntRes_SDIV (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandIntRes_SDIV (SDNode *N, SDValue &Lo, SDValue &Hi);
void ExpandIntRes_SREM (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandIntRes_SREM (SDNode *N, SDValue &Lo, SDValue &Hi);
void ExpandIntRes_UDIV (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandIntRes_UDIV (SDNode *N, SDValue &Lo, SDValue &Hi);
void ExpandIntRes_UREM (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandIntRes_UREM (SDNode *N, SDValue &Lo, SDValue &Hi);
void ExpandIntRes_Shift (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandIntRes_Shift (SDNode *N, SDValue &Lo, SDValue &Hi);

		void ExpandIntRes_SAT (SDNode *N, SDValue &Lo, SDValue &Hi);

void ExpandIntRes_SADDSUBO (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandIntRes_SADDSUBO (SDNode *N, SDValue &Lo, SDValue &Hi);
void ExpandIntRes_UADDSUBO (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandIntRes_UADDSUBO (SDNode *N, SDValue &Lo, SDValue &Hi);
void ExpandIntRes_XMULO (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandIntRes_XMULO (SDNode *N, SDValue &Lo, SDValue &Hi);

void ExpandIntRes_ATOMIC_LOAD (SDNode *N, SDValue &Lo, SDValue &Hi);		void ExpandIntRes_ATOMIC_LOAD (SDNode *N, SDValue &Lo, SDValue &Hi);

void ExpandShiftByConstant(SDNode *N, unsigned Amt,		void ExpandShiftByConstant(SDNode *N, unsigned Amt,
SDValue &Lo, SDValue &Hi);		SDValue &Lo, SDValue &Hi);
▲ Show 20 Lines • Show All 171 Lines • ▼ Show 20 Lines	private:
// Vector Result Scalarization: <1 x ty> -> ty.		// Vector Result Scalarization: <1 x ty> -> ty.
void ScalarizeVectorResult(SDNode *N, unsigned OpNo);		void ScalarizeVectorResult(SDNode *N, unsigned OpNo);
SDValue ScalarizeVecRes_MERGE_VALUES(SDNode *N, unsigned ResNo);		SDValue ScalarizeVecRes_MERGE_VALUES(SDNode *N, unsigned ResNo);
SDValue ScalarizeVecRes_BinOp(SDNode *N);		SDValue ScalarizeVecRes_BinOp(SDNode *N);
SDValue ScalarizeVecRes_TernaryOp(SDNode *N);		SDValue ScalarizeVecRes_TernaryOp(SDNode *N);
SDValue ScalarizeVecRes_UnaryOp(SDNode *N);		SDValue ScalarizeVecRes_UnaryOp(SDNode *N);
SDValue ScalarizeVecRes_InregOp(SDNode *N);		SDValue ScalarizeVecRes_InregOp(SDNode *N);

		SDValue ScalarizeVecRes_SAT(SDNode *N);
SDValue ScalarizeVecRes_BITCAST(SDNode *N);		SDValue ScalarizeVecRes_BITCAST(SDNode *N);
SDValue ScalarizeVecRes_BUILD_VECTOR(SDNode *N);		SDValue ScalarizeVecRes_BUILD_VECTOR(SDNode *N);
SDValue ScalarizeVecRes_CONVERT_RNDSAT(SDNode *N);		SDValue ScalarizeVecRes_CONVERT_RNDSAT(SDNode *N);
SDValue ScalarizeVecRes_EXTRACT_SUBVECTOR(SDNode *N);		SDValue ScalarizeVecRes_EXTRACT_SUBVECTOR(SDNode *N);
SDValue ScalarizeVecRes_FP_ROUND(SDNode *N);		SDValue ScalarizeVecRes_FP_ROUND(SDNode *N);
SDValue ScalarizeVecRes_FPOWI(SDNode *N);		SDValue ScalarizeVecRes_FPOWI(SDNode *N);
SDValue ScalarizeVecRes_INSERT_VECTOR_ELT(SDNode *N);		SDValue ScalarizeVecRes_INSERT_VECTOR_ELT(SDNode *N);
SDValue ScalarizeVecRes_LOAD(LoadSDNode *N);		SDValue ScalarizeVecRes_LOAD(LoadSDNode *N);
Show All 34 Lines	private:
// Vector Result Splitting: <128 x ty> -> 2 x <64 x ty>.		// Vector Result Splitting: <128 x ty> -> 2 x <64 x ty>.
void SplitVectorResult(SDNode *N, unsigned OpNo);		void SplitVectorResult(SDNode *N, unsigned OpNo);
void SplitVecRes_BinOp(SDNode *N, SDValue &Lo, SDValue &Hi);		void SplitVecRes_BinOp(SDNode *N, SDValue &Lo, SDValue &Hi);
void SplitVecRes_TernaryOp(SDNode *N, SDValue &Lo, SDValue &Hi);		void SplitVecRes_TernaryOp(SDNode *N, SDValue &Lo, SDValue &Hi);
void SplitVecRes_UnaryOp(SDNode *N, SDValue &Lo, SDValue &Hi);		void SplitVecRes_UnaryOp(SDNode *N, SDValue &Lo, SDValue &Hi);
void SplitVecRes_ExtendOp(SDNode *N, SDValue &Lo, SDValue &Hi);		void SplitVecRes_ExtendOp(SDNode *N, SDValue &Lo, SDValue &Hi);
void SplitVecRes_InregOp(SDNode *N, SDValue &Lo, SDValue &Hi);		void SplitVecRes_InregOp(SDNode *N, SDValue &Lo, SDValue &Hi);

		void SplitVecRes_SAT(SDNode *N, SDValue &Lo, SDValue &Hi);
void SplitVecRes_BITCAST(SDNode *N, SDValue &Lo, SDValue &Hi);		void SplitVecRes_BITCAST(SDNode *N, SDValue &Lo, SDValue &Hi);
void SplitVecRes_BUILD_PAIR(SDNode *N, SDValue &Lo, SDValue &Hi);		void SplitVecRes_BUILD_PAIR(SDNode *N, SDValue &Lo, SDValue &Hi);
void SplitVecRes_BUILD_VECTOR(SDNode *N, SDValue &Lo, SDValue &Hi);		void SplitVecRes_BUILD_VECTOR(SDNode *N, SDValue &Lo, SDValue &Hi);
void SplitVecRes_CONCAT_VECTORS(SDNode *N, SDValue &Lo, SDValue &Hi);		void SplitVecRes_CONCAT_VECTORS(SDNode *N, SDValue &Lo, SDValue &Hi);
void SplitVecRes_EXTRACT_SUBVECTOR(SDNode *N, SDValue &Lo, SDValue &Hi);		void SplitVecRes_EXTRACT_SUBVECTOR(SDNode *N, SDValue &Lo, SDValue &Hi);
void SplitVecRes_INSERT_SUBVECTOR(SDNode *N, SDValue &Lo, SDValue &Hi);		void SplitVecRes_INSERT_SUBVECTOR(SDNode *N, SDValue &Lo, SDValue &Hi);
void SplitVecRes_FPOWI(SDNode *N, SDValue &Lo, SDValue &Hi);		void SplitVecRes_FPOWI(SDNode *N, SDValue &Lo, SDValue &Hi);
void SplitVecRes_INSERT_VECTOR_ELT(SDNode *N, SDValue &Lo, SDValue &Hi);		void SplitVecRes_INSERT_VECTOR_ELT(SDNode *N, SDValue &Lo, SDValue &Hi);
▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines	private:
SDValue WidenVecRes_Ternary(SDNode *N);		SDValue WidenVecRes_Ternary(SDNode *N);
SDValue WidenVecRes_Binary(SDNode *N);		SDValue WidenVecRes_Binary(SDNode *N);
SDValue WidenVecRes_BinaryCanTrap(SDNode *N);		SDValue WidenVecRes_BinaryCanTrap(SDNode *N);
SDValue WidenVecRes_Convert(SDNode *N);		SDValue WidenVecRes_Convert(SDNode *N);
SDValue WidenVecRes_POWI(SDNode *N);		SDValue WidenVecRes_POWI(SDNode *N);
SDValue WidenVecRes_Shift(SDNode *N);		SDValue WidenVecRes_Shift(SDNode *N);
SDValue WidenVecRes_Unary(SDNode *N);		SDValue WidenVecRes_Unary(SDNode *N);
SDValue WidenVecRes_InregOp(SDNode *N);		SDValue WidenVecRes_InregOp(SDNode *N);
		SDValue WidenVecRes_SAT(SDNode *N);

// Widen Vector Operand.		// Widen Vector Operand.
bool WidenVectorOperand(SDNode *N, unsigned OpNo);		bool WidenVectorOperand(SDNode *N, unsigned OpNo);
SDValue WidenVecOp_BITCAST(SDNode *N);		SDValue WidenVecOp_BITCAST(SDNode *N);
SDValue WidenVecOp_CONCAT_VECTORS(SDNode *N);		SDValue WidenVecOp_CONCAT_VECTORS(SDNode *N);
SDValue WidenVecOp_EXTEND(SDNode *N);		SDValue WidenVecOp_EXTEND(SDNode *N);
SDValue WidenVecOp_EXTRACT_VECTOR_ELT(SDNode *N);		SDValue WidenVecOp_EXTRACT_VECTOR_ELT(SDNode *N);
SDValue WidenVecOp_EXTRACT_SUBVECTOR(SDNode *N);		SDValue WidenVecOp_EXTRACT_SUBVECTOR(SDNode *N);
▲ Show 20 Lines • Show All 114 Lines • Show Last 20 Lines

lib/CodeGen/SelectionDAG/LegalizeVectorOps.cpp

Show First 20 Lines • Show All 99 Lines • ▼ Show 20 Lines	class VectorLegalizer {

/// \brief Implement vselect in terms of XOR, AND, OR when blend is not		/// \brief Implement vselect in terms of XOR, AND, OR when blend is not
/// supported by the target.		/// supported by the target.
SDValue ExpandVSELECT(SDValue Op);		SDValue ExpandVSELECT(SDValue Op);
SDValue ExpandSELECT(SDValue Op);		SDValue ExpandSELECT(SDValue Op);
SDValue ExpandLoad(SDValue Op);		SDValue ExpandLoad(SDValue Op);
SDValue ExpandStore(SDValue Op);		SDValue ExpandStore(SDValue Op);
SDValue ExpandFNEG(SDValue Op);		SDValue ExpandFNEG(SDValue Op);
		SDValue ExpandSAT(SDValue Op);

/// \brief Implements vector promotion.		/// \brief Implements vector promotion.
///		///
/// This is essentially just bitcasting the operands to a different type and		/// This is essentially just bitcasting the operands to a different type and
/// bitcasting the result back to the original type.		/// bitcasting the result back to the original type.
SDValue Promote(SDValue Op);		SDValue Promote(SDValue Op);

/// \brief Implements [SU]INT_TO_FP vector promotion.		/// \brief Implements [SU]INT_TO_FP vector promotion.
▲ Show 20 Lines • Show All 195 Lines • ▼ Show 20 Lines	SDValue VectorLegalizer::LegalizeOp(SDValue Op) {
case ISD::FFLOOR:		case ISD::FFLOOR:
case ISD::FP_ROUND:		case ISD::FP_ROUND:
case ISD::FP_EXTEND:		case ISD::FP_EXTEND:
case ISD::FMA:		case ISD::FMA:
case ISD::SIGN_EXTEND_INREG:		case ISD::SIGN_EXTEND_INREG:
case ISD::ANY_EXTEND_VECTOR_INREG:		case ISD::ANY_EXTEND_VECTOR_INREG:
case ISD::SIGN_EXTEND_VECTOR_INREG:		case ISD::SIGN_EXTEND_VECTOR_INREG:
case ISD::ZERO_EXTEND_VECTOR_INREG:		case ISD::ZERO_EXTEND_VECTOR_INREG:
		case ISD::SSAT:
		case ISD::USAT:
QueryType = Node->getValueType(0);		QueryType = Node->getValueType(0);
break;		break;
case ISD::FP_ROUND_INREG:		case ISD::FP_ROUND_INREG:
QueryType = cast<VTSDNode>(Node->getOperand(1))->getVT();		QueryType = cast<VTSDNode>(Node->getOperand(1))->getVT();
break;		break;
case ISD::SINT_TO_FP:		case ISD::SINT_TO_FP:
case ISD::UINT_TO_FP:		case ISD::UINT_TO_FP:
QueryType = Node->getOperand(0).getValueType();		QueryType = Node->getOperand(0).getValueType();
▲ Show 20 Lines • Show All 353 Lines • ▼ Show 20 Lines	SDValue VectorLegalizer::Expand(SDValue Op) {
case ISD::SELECT:		case ISD::SELECT:
return ExpandSELECT(Op);		return ExpandSELECT(Op);
case ISD::UINT_TO_FP:		case ISD::UINT_TO_FP:
return ExpandUINT_TO_FLOAT(Op);		return ExpandUINT_TO_FLOAT(Op);
case ISD::FNEG:		case ISD::FNEG:
return ExpandFNEG(Op);		return ExpandFNEG(Op);
case ISD::SETCC:		case ISD::SETCC:
return UnrollVSETCC(Op);		return UnrollVSETCC(Op);
		case ISD::SSAT:
		case ISD::USAT:
		return ExpandSAT(Op);
default:		default:
return DAG.UnrollVectorOp(Op.getNode());		return DAG.UnrollVectorOp(Op.getNode());
}		}
}		}

		SDValue VectorLegalizer::ExpandSAT(SDValue Op) {
		SDLoc DL(Op);

		SDValue Val = Op.getOperand(0);
		EVT VT = Val.getValueType();

		uint64_t SatBit = cast<ConstantSDNode>(Op.getOperand(1))->getZExtValue();

		assert(VT.isVector() && VT == Val.getValueType() && "Invalid type");

		if (TLI.getOperationAction(ISD::VSELECT, VT) == TargetLowering::Expand \|\|
		TLI.getOperationAction(ISD::SETCC, VT) == TargetLowering::Expand)
		return DAG.UnrollVectorOp(Op.getNode());

		EVT SVT = VT.getScalarType();
		unsigned BitWidth = SVT.getSizeInBits();
		APInt Max, Min;

		if (Op->getOpcode() == ISD::USAT) {
		Max = APInt::getLowBitsSet(BitWidth, SatBit);
		Min = APInt::getNullValue(BitWidth);
		} else {
		Max = APInt::getLowBitsSet(BitWidth, SatBit - 1);
		Min = APInt::getHighBitsSet(BitWidth, BitWidth - SatBit + 1);
		}

		SmallVector<SDValue, 8> MaxSplatArr(VT.getVectorNumElements(),
		DAG.getConstant(Max, SVT));
		SmallVector<SDValue, 8> MinSplatArr(VT.getVectorNumElements(),
		DAG.getConstant(Min, SVT));

		SDValue MaxV = DAG.getNode(ISD::BUILD_VECTOR, DL, VT, MaxSplatArr);
		SDValue MinV = DAG.getNode(ISD::BUILD_VECTOR, DL, VT, MinSplatArr);

		EVT SetCCType = TLI.getSetCCResultType(*DAG.getContext(), VT);
		SDValue MinSetCC = DAG.getSetCC(DL, SetCCType, Val, MinV, ISD::SETLT);

		SDValue Res;
		Res = DAG.getSelect(DL, VT, MinSetCC, MinV, Val);

		SDValue MaxSetCC = DAG.getSetCC(DL, SetCCType, Res, MaxV, ISD::SETGT);
		Res = DAG.getSelect(DL, VT, MaxSetCC, MaxV, Res);

		return Res;
		}

SDValue VectorLegalizer::ExpandSELECT(SDValue Op) {		SDValue VectorLegalizer::ExpandSELECT(SDValue Op) {
// Lower a select instruction where the condition is a scalar and the		// Lower a select instruction where the condition is a scalar and the
// operands are vectors. Lower this select to VSELECT and implement it		// operands are vectors. Lower this select to VSELECT and implement it
// using XOR AND OR. The selector bit is broadcasted.		// using XOR AND OR. The selector bit is broadcasted.
EVT VT = Op.getValueType();		EVT VT = Op.getValueType();
SDLoc DL(Op);		SDLoc DL(Op);

SDValue Mask = Op.getOperand(0);		SDValue Mask = Op.getOperand(0);
▲ Show 20 Lines • Show All 296 Lines • Show Last 20 Lines

lib/CodeGen/SelectionDAG/LegalizeVectorTypes.cpp

Show First 20 Lines • Show All 60 Lines • ▼ Show 20 Lines	#endif
case ISD::SCALAR_TO_VECTOR: R = ScalarizeVecRes_SCALAR_TO_VECTOR(N); break;		case ISD::SCALAR_TO_VECTOR: R = ScalarizeVecRes_SCALAR_TO_VECTOR(N); break;
case ISD::SIGN_EXTEND_INREG: R = ScalarizeVecRes_InregOp(N); break;		case ISD::SIGN_EXTEND_INREG: R = ScalarizeVecRes_InregOp(N); break;
case ISD::VSELECT: R = ScalarizeVecRes_VSELECT(N); break;		case ISD::VSELECT: R = ScalarizeVecRes_VSELECT(N); break;
case ISD::SELECT: R = ScalarizeVecRes_SELECT(N); break;		case ISD::SELECT: R = ScalarizeVecRes_SELECT(N); break;
case ISD::SELECT_CC: R = ScalarizeVecRes_SELECT_CC(N); break;		case ISD::SELECT_CC: R = ScalarizeVecRes_SELECT_CC(N); break;
case ISD::SETCC: R = ScalarizeVecRes_SETCC(N); break;		case ISD::SETCC: R = ScalarizeVecRes_SETCC(N); break;
case ISD::UNDEF: R = ScalarizeVecRes_UNDEF(N); break;		case ISD::UNDEF: R = ScalarizeVecRes_UNDEF(N); break;
case ISD::VECTOR_SHUFFLE: R = ScalarizeVecRes_VECTOR_SHUFFLE(N); break;		case ISD::VECTOR_SHUFFLE: R = ScalarizeVecRes_VECTOR_SHUFFLE(N); break;

		case ISD::SSAT:
		case ISD::USAT: R = ScalarizeVecRes_SAT(N); break;

case ISD::ANY_EXTEND:		case ISD::ANY_EXTEND:
case ISD::BSWAP:		case ISD::BSWAP:
case ISD::CTLZ:		case ISD::CTLZ:
case ISD::CTLZ_ZERO_UNDEF:		case ISD::CTLZ_ZERO_UNDEF:
case ISD::CTPOP:		case ISD::CTPOP:
case ISD::CTTZ:		case ISD::CTTZ:
case ISD::CTTZ_ZERO_UNDEF:		case ISD::CTTZ_ZERO_UNDEF:
case ISD::FABS:		case ISD::FABS:
▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines	case ISD::FMA:
break;		break;
}		}

// If R is null, the sub-method took care of registering the result.		// If R is null, the sub-method took care of registering the result.
if (R.getNode())		if (R.getNode())
SetScalarizedVector(SDValue(N, ResNo), R);		SetScalarizedVector(SDValue(N, ResNo), R);
}		}

		SDValue DAGTypeLegalizer::ScalarizeVecRes_SAT(SDNode *N) {
		SDValue Op = GetScalarizedVector(N->getOperand(0));
		SDValue SatBit = N->getOperand(1);
		return DAG.getNode(N->getOpcode(), SDLoc(N), Op.getValueType(), Op, SatBit);
		}

SDValue DAGTypeLegalizer::ScalarizeVecRes_BinOp(SDNode *N) {		SDValue DAGTypeLegalizer::ScalarizeVecRes_BinOp(SDNode *N) {
SDValue LHS = GetScalarizedVector(N->getOperand(0));		SDValue LHS = GetScalarizedVector(N->getOperand(0));
SDValue RHS = GetScalarizedVector(N->getOperand(1));		SDValue RHS = GetScalarizedVector(N->getOperand(1));
return DAG.getNode(N->getOpcode(), SDLoc(N),		return DAG.getNode(N->getOpcode(), SDLoc(N),
LHS.getValueType(), LHS, RHS);		LHS.getValueType(), LHS, RHS);
}		}

SDValue DAGTypeLegalizer::ScalarizeVecRes_TernaryOp(SDNode *N) {		SDValue DAGTypeLegalizer::ScalarizeVecRes_TernaryOp(SDNode *N) {
▲ Show 20 Lines • Show All 519 Lines • ▼ Show 20 Lines	#endif
case ISD::SHL:		case ISD::SHL:
case ISD::SRA:		case ISD::SRA:
case ISD::SRL:		case ISD::SRL:
case ISD::UREM:		case ISD::UREM:
case ISD::SREM:		case ISD::SREM:
case ISD::FREM:		case ISD::FREM:
SplitVecRes_BinOp(N, Lo, Hi);		SplitVecRes_BinOp(N, Lo, Hi);
break;		break;
		case ISD::SSAT:
		case ISD::USAT:
		SplitVecRes_SAT(N, Lo, Hi);
		break;
case ISD::FMA:		case ISD::FMA:
SplitVecRes_TernaryOp(N, Lo, Hi);		SplitVecRes_TernaryOp(N, Lo, Hi);
break;		break;
}		}

// If Lo/Hi is null, the sub-method took care of registering results etc.		// If Lo/Hi is null, the sub-method took care of registering results etc.
if (Lo.getNode())		if (Lo.getNode())
SetSplitVector(SDValue(N, ResNo), Lo, Hi);		SetSplitVector(SDValue(N, ResNo), Lo, Hi);
}		}

		void DAGTypeLegalizer::SplitVecRes_SAT(SDNode *N, SDValue &Lo, SDValue &Hi) {
		SDValue OpLo, OpHi;
		GetSplitVector(N->getOperand(0), OpLo, OpHi);
		SDValue SatBit = N->getOperand(1);
		SDLoc dl(N);

		Lo = DAG.getNode(N->getOpcode(), dl, OpLo.getValueType(), OpLo, SatBit);
		Hi = DAG.getNode(N->getOpcode(), dl, OpHi.getValueType(), OpHi, SatBit);
		}

void DAGTypeLegalizer::SplitVecRes_BinOp(SDNode *N, SDValue &Lo,		void DAGTypeLegalizer::SplitVecRes_BinOp(SDNode *N, SDValue &Lo,
SDValue &Hi) {		SDValue &Hi) {
SDValue LHSLo, LHSHi;		SDValue LHSLo, LHSHi;
GetSplitVector(N->getOperand(0), LHSLo, LHSHi);		GetSplitVector(N->getOperand(0), LHSLo, LHSHi);
SDValue RHSLo, RHSHi;		SDValue RHSLo, RHSHi;
GetSplitVector(N->getOperand(1), RHSLo, RHSHi);		GetSplitVector(N->getOperand(1), RHSLo, RHSHi);
SDLoc dl(N);		SDLoc dl(N);

▲ Show 20 Lines • Show All 1,093 Lines • ▼ Show 20 Lines	#endif
case ISD::FSIN:		case ISD::FSIN:
case ISD::FSQRT:		case ISD::FSQRT:
case ISD::FTRUNC:		case ISD::FTRUNC:
Res = WidenVecRes_Unary(N);		Res = WidenVecRes_Unary(N);
break;		break;
case ISD::FMA:		case ISD::FMA:
Res = WidenVecRes_Ternary(N);		Res = WidenVecRes_Ternary(N);
break;		break;
		case ISD::USAT:
		case ISD::SSAT:
		Res = WidenVecRes_SAT(N);
		break;
}		}

// If Res is null, the sub-method took care of registering the result.		// If Res is null, the sub-method took care of registering the result.
if (Res.getNode())		if (Res.getNode())
SetWidenedVector(SDValue(N, ResNo), Res);		SetWidenedVector(SDValue(N, ResNo), Res);
}		}

SDValue DAGTypeLegalizer::WidenVecRes_Ternary(SDNode *N) {		SDValue DAGTypeLegalizer::WidenVecRes_Ternary(SDNode *N) {
▲ Show 20 Lines • Show All 234 Lines • ▼ Show 20 Lines

SDValue DAGTypeLegalizer::WidenVecRes_POWI(SDNode *N) {		SDValue DAGTypeLegalizer::WidenVecRes_POWI(SDNode *N) {
EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));		EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));
SDValue InOp = GetWidenedVector(N->getOperand(0));		SDValue InOp = GetWidenedVector(N->getOperand(0));
SDValue ShOp = N->getOperand(1);		SDValue ShOp = N->getOperand(1);
return DAG.getNode(N->getOpcode(), SDLoc(N), WidenVT, InOp, ShOp);		return DAG.getNode(N->getOpcode(), SDLoc(N), WidenVT, InOp, ShOp);
}		}

		SDValue DAGTypeLegalizer::WidenVecRes_SAT(SDNode *N) {
		EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));
		SDValue InOp = GetWidenedVector(N->getOperand(0));
		SDValue SatBitOp = N->getOperand(1);
		return DAG.getNode(N->getOpcode(), SDLoc(N), WidenVT, InOp, SatBitOp);
		}

SDValue DAGTypeLegalizer::WidenVecRes_Shift(SDNode *N) {		SDValue DAGTypeLegalizer::WidenVecRes_Shift(SDNode *N) {
EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));		EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));
SDValue InOp = GetWidenedVector(N->getOperand(0));		SDValue InOp = GetWidenedVector(N->getOperand(0));
SDValue ShOp = N->getOperand(1);		SDValue ShOp = N->getOperand(1);

EVT ShVT = ShOp.getValueType();		EVT ShVT = ShOp.getValueType();
if (getTypeAction(ShVT) == TargetLowering::TypeWidenVector) {		if (getTypeAction(ShVT) == TargetLowering::TypeWidenVector) {
ShOp = GetWidenedVector(ShOp);		ShOp = GetWidenedVector(ShOp);
▲ Show 20 Lines • Show All 1,192 Lines • Show Last 20 Lines

lib/CodeGen/SelectionDAG/SelectionDAGBuilder.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 5,282 Lines • ▼ Show 20 Lines	case Intrinsic::ctlz: {
return nullptr;		return nullptr;
}		}
case Intrinsic::ctpop: {		case Intrinsic::ctpop: {
SDValue Arg = getValue(I.getArgOperand(0));		SDValue Arg = getValue(I.getArgOperand(0));
EVT Ty = Arg.getValueType();		EVT Ty = Arg.getValueType();
setValue(&I, DAG.getNode(ISD::CTPOP, sdl, Ty, Arg));		setValue(&I, DAG.getNode(ISD::CTPOP, sdl, Ty, Arg));
return nullptr;		return nullptr;
}		}
		case Intrinsic::ssat:
		case Intrinsic::usat: {
		unsigned Opcode;
		switch (Intrinsic) {
		default: llvm_unreachable("Impossible intrinsic"); // Can't reach here.
		case Intrinsic::ssat: Opcode = ISD::SSAT; break;
		case Intrinsic::usat: Opcode = ISD::USAT; break;
		}

		setValue(&I, DAG.getNode(Opcode, sdl,
		getValue(I.getArgOperand(0)).getValueType(),
		getValue(I.getArgOperand(0)),
		getValue(I.getArgOperand(1))));
		return nullptr;
		}
case Intrinsic::stacksave: {		case Intrinsic::stacksave: {
SDValue Op = getRoot();		SDValue Op = getRoot();
Res = DAG.getNode(ISD::STACKSAVE, sdl,		Res = DAG.getNode(ISD::STACKSAVE, sdl,
DAG.getVTList(TLI.getPointerTy(), MVT::Other), Op);		DAG.getVTList(TLI.getPointerTy(), MVT::Other), Op);
setValue(&I, Res);		setValue(&I, Res);
DAG.setRoot(Res.getValue(1));		DAG.setRoot(Res.getValue(1));
return nullptr;		return nullptr;
}		}
▲ Show 20 Lines • Show All 2,598 Lines • Show Last 20 Lines

lib/CodeGen/SelectionDAG/SelectionDAGDumper.cpp

Show First 20 Lines • Show All 209 Lines • ▼ Show 20 Lines	#endif
case ISD::SADDO: return "saddo";		case ISD::SADDO: return "saddo";
case ISD::UADDO: return "uaddo";		case ISD::UADDO: return "uaddo";
case ISD::SSUBO: return "ssubo";		case ISD::SSUBO: return "ssubo";
case ISD::USUBO: return "usubo";		case ISD::USUBO: return "usubo";
case ISD::SMULO: return "smulo";		case ISD::SMULO: return "smulo";
case ISD::UMULO: return "umulo";		case ISD::UMULO: return "umulo";
case ISD::SUBC: return "subc";		case ISD::SUBC: return "subc";
case ISD::SUBE: return "sube";		case ISD::SUBE: return "sube";
		case ISD::SSAT: return "ssat";
		case ISD::USAT: return "usat";
case ISD::SHL_PARTS: return "shl_parts";		case ISD::SHL_PARTS: return "shl_parts";
case ISD::SRA_PARTS: return "sra_parts";		case ISD::SRA_PARTS: return "sra_parts";
case ISD::SRL_PARTS: return "srl_parts";		case ISD::SRL_PARTS: return "srl_parts";

// Conversion operators.		// Conversion operators.
case ISD::SIGN_EXTEND: return "sign_extend";		case ISD::SIGN_EXTEND: return "sign_extend";
case ISD::ZERO_EXTEND: return "zero_extend";		case ISD::ZERO_EXTEND: return "zero_extend";
case ISD::ANY_EXTEND: return "any_extend";		case ISD::ANY_EXTEND: return "any_extend";
▲ Show 20 Lines • Show All 443 Lines • Show Last 20 Lines

lib/CodeGen/TargetLoweringBase.cpp

Show First 20 Lines • Show All 760 Lines • ▼ Show 20 Lines	setOperationAction(ISD::ATOMIC_CMP_SWAP_WITH_SUCCESS,
(MVT::SimpleValueType)VT, Expand);		(MVT::SimpleValueType)VT, Expand);

// These operations default to expand.		// These operations default to expand.
setOperationAction(ISD::FGETSIGN, (MVT::SimpleValueType)VT, Expand);		setOperationAction(ISD::FGETSIGN, (MVT::SimpleValueType)VT, Expand);
setOperationAction(ISD::CONCAT_VECTORS, (MVT::SimpleValueType)VT, Expand);		setOperationAction(ISD::CONCAT_VECTORS, (MVT::SimpleValueType)VT, Expand);
setOperationAction(ISD::FMINNUM, (MVT::SimpleValueType)VT, Expand);		setOperationAction(ISD::FMINNUM, (MVT::SimpleValueType)VT, Expand);
setOperationAction(ISD::FMAXNUM, (MVT::SimpleValueType)VT, Expand);		setOperationAction(ISD::FMAXNUM, (MVT::SimpleValueType)VT, Expand);

		setOperationAction(ISD::SSAT, (MVT::SimpleValueType)VT, Expand);
		setOperationAction(ISD::USAT, (MVT::SimpleValueType)VT, Expand);

// These library functions default to expand.		// These library functions default to expand.
setOperationAction(ISD::FROUND, (MVT::SimpleValueType)VT, Expand);		setOperationAction(ISD::FROUND, (MVT::SimpleValueType)VT, Expand);

// These operations default to expand for vector types.		// These operations default to expand for vector types.
if (VT >= MVT::FIRST_VECTOR_VALUETYPE &&		if (VT >= MVT::FIRST_VECTOR_VALUETYPE &&
VT <= MVT::LAST_VECTOR_VALUETYPE) {		VT <= MVT::LAST_VECTOR_VALUETYPE) {
setOperationAction(ISD::FCOPYSIGN, (MVT::SimpleValueType)VT, Expand);		setOperationAction(ISD::FCOPYSIGN, (MVT::SimpleValueType)VT, Expand);
setOperationAction(ISD::ANY_EXTEND_VECTOR_INREG,		setOperationAction(ISD::ANY_EXTEND_VECTOR_INREG,
▲ Show 20 Lines • Show All 736 Lines • Show Last 20 Lines

test/CodeGen/X86/saturation-legalization.ll

This file was added.

				; RUN: llc < %s \| FileCheck %s --check-prefix=CHECK --check-prefix=NOVSELECT
				; RUN: llc -mattr=+sse4.2 < %s \| FileCheck %s --check-prefix=CHECK --check-prefix=SSE42

				target datalayout = "e-m:o-i64:64-f80:128-n8:16:32:64-S128"
				target triple = "x86_64-unknown-linux"

				; There's no way of catching both qword/dword variants of both ABCD and
				; numbered regs, so a the patterns involving 64bits are a bit too specific.

				; What we really want to know is that the usat intrinsics are legalized to code
				; equivalent to (same for ssat, with the appropriate min/max constants):
				; %1 = icmp slt i8 %x, 0
				; %2 = select i1 %1, i8 0, i8 %x
				; %3 = icmp sgt i8 %x, 15
				; %4 = select i1 %3, i8 15, i8 %2
				; ret i8 %4

				declare i32 @llvm.ssat.i32(i32 %x, i32 %n)
				declare i32 @llvm.usat.i32(i32 %x, i32 %n)

				define i32 @test_ssat_expand(i32 %x) {
				; CHECK-LABEL: test_ssat_expand
				; CHECK: cmpl $-128, %edi
				; CHECK-NEXT: movl $-128, [[RES:%e[a-z0-9]+]]
				; CHECK-NEXT: cmovgel %edi, [[RES]]
				; CHECK-NEXT: cmpl $127, [[RES]]
				; CHECK-NEXT: movl $127, %eax
				; CHECK-NEXT: cmovlel [[RES]], %eax
				; CHECK-NEXT: retq
				%ssat_x = call i32 @llvm.ssat.i32(i32 %x, i32 8)
				ret i32 %ssat_x
				}

				define i32 @test_usat_expand(i32 %x) {
				; CHECK-LABEL: test_usat_expand
				; CHECK: xorl [[RES:%e[a-z0-9]+]], [[RES]]
				; CHECK-NEXT: testl %edi, %edi
				; CHECK-NEXT: cmovnsl %edi, [[RES]]
				; CHECK-NEXT: cmpl $255, [[RES]]
				; CHECK-NEXT: movl $255, %eax
				; CHECK-NEXT: cmovlel [[RES]], %eax
				; CHECK-NEXT: retq
				%ssat_x = call i32 @llvm.usat.i32(i32 %x, i32 8)
				ret i32 %ssat_x
				}

				declare i12 @llvm.ssat.i12(i12 %x, i32 %n)
				declare i12 @llvm.usat.i12(i12 %x, i32 %n)

				define i12 @test_ssat_12_promote_intres(i12 %x) {
				; CHECK-LABEL: test_ssat_12_promote_intres
				; CHECK: shll $4, %edi
				; CHECK-NEXT: sarw $4, %di
				; CHECK-NEXT: movswl %di, %eax
				; CHECK-NEXT: cmpl $-128, %eax
				; CHECK-NEXT: movw $-128, [[RES:%[bcd]x]]
				; CHECK-NEXT: cmovlw [[RES]], %ax
				; CHECK-NEXT: cwtl
				; CHECK-NEXT: cmpl $127, %eax
				; CHECK-NEXT: movw $127, [[RES]]
				; CHECK-NEXT: cmovgw [[RES]], %ax
				; CHECK-NEXT: # kill: AX<def> AX<kill> EAX<kill>
				; CHECK-NEXT: retq
				%ssat_x = call i12 @llvm.ssat.i12(i12 %x, i32 8)
				ret i12 %ssat_x
				}

				define i12 @test_usat_12_promote_intres(i12 %x) {
				; CHECK-LABEL: test_usat_12_promote_intres
				; CHECK: shll $4, %edi
				; CHECK-NEXT: xorl %eax, %eax
				; CHECK-NEXT: sarw $4, %di
				; CHECK-NEXT: cmovnsw %di, %ax
				; CHECK-NEXT: cwtl
				; CHECK-NEXT: cmpl $255, %eax
				; CHECK-NEXT: movw $255, [[MAX:%[bcd]x]]
				; CHECK-NEXT: cmovgw [[MAX]], %ax
				; CHECK-NEXT: # kill: AX<def> AX<kill> EAX<kill>
				; CHECK-NEXT: retq
				%ssat_x = call i12 @llvm.usat.i12(i12 %x, i32 8)
				ret i12 %ssat_x
				}

				declare i8 @llvm.ssat.i8(i8 %x, i32 %n)
				declare i8 @llvm.usat.i8(i8 %x, i32 %n)

				define i8 @test_ssat_8_expand(i8 %x) {
				; CHECK-LABEL: test_ssat_8_expand
				; CHECK: movsbl %dil, %eax
				; CHECK-NEXT: cmpl $-8, %eax
				; CHECK-NEXT: movb $-8, %cl
				; CHECK-NEXT: jl [[LTBB:.LBB[0-9_]+]]
				; CHECK: movb %dil, %cl
				; CHECK: [[LTBB]]:
				; CHECK-NEXT: movsbl %cl, %eax
				; CHECK-NEXT: cmpl $7, %eax
				; CHECK-NEXT: movb $7, %al
				; CHECK-NEXT: jg [[GTBB:.LBB[0-9_]+]]
				; CHECK: movb %cl, %al
				; CHECK: [[GTBB]]:
				; CHECK-NEXT: retq
				%ssat_x = call i8 @llvm.ssat.i8(i8 %x, i32 4)
				ret i8 %ssat_x
				}

				define i8 @test_usat_8_expand(i8 %x) {
				; CHECK-LABEL: test_usat_8_expand
				; CHECK: testb %dil, %dil
				; CHECK-NEXT: jns [[MAXCMPBB:.LBB[0-9_]+]]
				; CHECK: xorl %edi, %edi
				; CHECK: [[MAXCMPBB]]:
				; CHECK-NEXT: movsbl %dil, %eax
				; CHECK-NEXT: cmpl $15, %eax
				; CHECK-NEXT: movb $15, %al
				; CHECK-NEXT: jg [[EXITBB:.LBB[0-9_]+]]
				; CHECK: movb %dil, %al
				; CHECK: [[EXITBB]]:
				; CHECK-NEXT: retq

				%ssat_x = call i8 @llvm.usat.i8(i8 %x, i32 4)
				ret i8 %ssat_x
				}

				declare i128 @llvm.ssat.i128(i128 %x, i32 %n)
				declare i128 @llvm.usat.i128(i128 %x, i32 %n)

				; FIXME: add a testcase for when the saturation bit is larger than 64
				define i128 @test_ssat_128_expand_intres(i128 %x) {
				; CHECK-LABEL: test_ssat_128_expand_intres
				; Compare the lower 64bits of %x with -8.
				; CHECK: cmpq $-8, %rdi
				; If they are (ult) below -8, and the higher bits are -1, %x isn't in ]-8,-1]
				; CHECK-NEXT: setb [[X_LT_MIN:%[a-z0-9]+]]
				; Compare the higher 64bits of %x with -1.
				; CHECK-NEXT: cmpq $-1, %rsi
				; CHECK-NEXT: setl [[HI_X_LT_MONE:%[a-z0-9]+]]
				; If they are equal to -1, %x is negative, so the lower check is enough.
				; CHECK-NEXT: je [[HI_X_EQ_MONE_LBL:.LBB[0-9_]+]]
				; If they are lower than -1, %x < -1*2^64, so %x < -8.
				; If they are greater than -1, %x isn't negative, so %x > -8.
				; CHECK: movb [[HI_X_LT_MONE]], [[X_LT_MIN]]
				; CHECK: [[HI_X_EQ_MONE_LBL]]:
				; %rdx <- (%x < -8) ? -1 : %rsi (higher bits of %x)
				; CHECK-NEXT: cmpb $1, [[X_LT_MIN]]
				; CHECK-NEXT: sbbq %rdx, %rdx
				; CHECK-NEXT: notq %rdx
				; CHECK-NEXT: orq %rsi, %rdx
				; %rax <- (%x < -8) ? -8 : %rdi
				; CHECK-NEXT: testb [[X_LT_MIN]], [[X_LT_MIN]]
				; CHECK-NEXT: movq $-8, %rax
				; CHECK-NEXT: cmoveq %rdi, %rax
				; Compare the lower bits with 7.
				; CHECK-NEXT: cmpq $7, %rdi
				; CHECK-NEXT: seta [[X_GT_MAX:%[a-z0-9]+]]
				; CHECK-NEXT: testq %rsi, %rsi
				; CHECK-NEXT: setg [[HI_X_GT_ZERO:%[a-z0-9]+]]
				; If the higher bits aren't equal to 0, make sure they're greater than 0.
				; CHECK-NEXT: je [[HI_X_EQ_ZERO_LBL:.LBB[0-9_]+]]
				; CHECK: movb [[HI_X_GT_ZERO]], [[X_GT_MAX]]
				; CHECK: [[HI_X_EQ_ZERO_LBL]]:
				; CHECK-NEXT: xorl %e[[MAX_HI:[a-z0-9]+]], %e[[MAX_HI]]
				; CHECK-NEXT: testb [[X_GT_MAX]], [[X_GT_MAX]]
				; CHECK-NEXT: movl $7, %e[[MAX_LO:[a-z0-9]+]]
				; If %x > 7, return 7. Else return the minimum.
				; CHECK-NEXT: cmovneq %r[[MAX_LO]], %rax
				; CHECK-NEXT: cmovneq %r[[MAX_HI]], %rdx
				; CHECK-NEXT: retq
				%ssat_x = call i128 @llvm.ssat.i128(i128 %x, i32 4)
				ret i128 %ssat_x
				}

				define i128 @test_usat_128_expand_intres(i128 %x) {
				; CHECK-LABEL: test_usat_128_expand_intres
				; CHECK: cmpq $15, %rdi
				; CHECK-NEXT: seta [[X_GT_MAX:%[a-z0-9]+]]
				; CHECK-NEXT: xorl %e[[ZERO:[a-z0-9]+]], %e[[ZERO]]
				; CHECK-NEXT: testq %rsi, %rsi
				; CHECK-NEXT: cmovsq %r[[ZERO]], %rsi
				; CHECK-NEXT: cmovsq %r[[ZERO]], %rdi
				; CHECK-NEXT: setg [[HI_X_GT_ZERO:%[a-z0-9]+]]
				; CHECK-NEXT: je [[HI_X_EQ_ZERO_LBL:.LBB[0-9_]+]]
				; CHECK: movb [[HI_X_GT_ZERO]], [[X_GT_MAX]]
				; CHECK: [[HI_X_EQ_ZERO_LBL]]:
				; CHECK-NEXT: testb [[X_GT_MAX]], [[X_GT_MAX]]
				; CHECK-NEXT: movl $15, %e[[MAX_LO:[a-z0-9]+]]
				; CHECK-NEXT: cmovneq %r[[MAX_LO]], %rdi
				; CHECK-NEXT: cmovneq %r[[ZERO]], %rsi
				; CHECK-NEXT: movq %rdi, %rax
				; CHECK-NEXT: movq %rsi, %rdx
				; CHECK-NEXT: retq
				%ssat_x = call i128 @llvm.usat.i128(i128 %x, i32 4)
				ret i128 %ssat_x
				}

				declare i117 @llvm.ssat.i117(i117 %x, i32 %n)
				declare i117 @llvm.usat.i117(i117 %x, i32 %n)

				define i117 @test_ssat_117_promote_expand_intres(i117 %x) {
				; CHECK-LABEL: test_ssat_117_promote_expand_intres
				; CHECK: movq %rsi, [[SEXT_HI_X:%[a-z0-9]+]]
				; CHECK-NEXT: shlq $11, [[SEXT_HI_X]]
				; CHECK-NEXT: sarq $11, [[SEXT_HI_X]]
				; CHECK-NEXT: cmpq $7, %rdi
				; CHECK-NEXT: seta [[X_GT_MAX:%[a-z0-9]+]]
				; CHECK-NEXT: testq [[SEXT_HI_X]], [[SEXT_HI_X]]
				; CHECK-NEXT: setg [[SEXT_HI_X_GT_ZERO:%[a-z0-9]+]]
				; CHECK-NEXT: movabsq $9007199254740991, [[MASK_I117:%[a-z0-9]+]] # imm = 0x1FFFFFFFFFFFFF
				; CHECK-NEXT: andq [[MASK_I117]], %rsi
				; CHECK-NEXT: je [[NO_HI_BITS_SET_LBL:.LBB[0-9_]+]]
				; CHECK: movb [[SEXT_HI_X_GT_ZERO]], [[X_GT_MAX]]
				; CHECK: [[NO_HI_BITS_SET_LBL]]:
				; CHECK-NEXT: cmpq $-8, %rdi
				; CHECK-NEXT: setb [[X_LT_ZERO:%[a-z0-9]+]]
				; CHECK-NEXT: cmpq $-1, [[SEXT_HI_X]]
				; CHECK-NEXT: setl [[SEXT_HI_X_LT_ZERO:%[a-z0-9]+]]
				; CHECK-NEXT: cmpq [[MASK_I117]], %rsi
				; CHECK-NEXT: je [[NO_HI_BITS_SET_LBL_2:.LBB[0-9_]+]]
				; CHECK: movb [[SEXT_HI_X_LT_ZERO]], [[X_LT_ZERO]]
				; CHECK: [[NO_HI_BITS_SET_LBL_2]]:
				; CHECK-NEXT: cmpb $1, [[X_LT_ZERO]]
				; CHECK-NEXT: sbbq [[HI_TMP_RES:%[a-z0-9]+]], [[HI_TMP_RES]]
				; CHECK-NEXT: notq [[HI_TMP_RES]]
				; CHECK-NEXT: orq [[SEXT_HI_X]], [[HI_TMP_RES]]
				; CHECK-NEXT: testb [[X_LT_ZERO]], [[X_LT_ZERO]]
				; CHECK-NEXT: movq $-8, [[MIN_LO:%[a-z0-9]+]]
				; CHECK-NEXT: cmovneq [[MIN_LO]], %rdi
				; CHECK-NEXT: xorl %edx, %edx
				; CHECK-NEXT: testb [[X_GT_MAX]], [[X_GT_MAX]]
				; CHECK-NEXT: movl $7, %eax
				; CHECK-NEXT: cmoveq %rdi, %rax
				; CHECK-NEXT: cmoveq [[HI_TMP_RES]], %rdx
				; CHECK-NEXT: retq
				%ssat_x = call i117 @llvm.ssat.i117(i117 %x, i32 4)
				ret i117 %ssat_x
				}

				define i117 @test_usat_117_promote_expand_intres(i117 %x) {
				; CHECK-LABEL: test_usat_117_promote_expand_intres
				; CHECK: movq %rsi, [[SEXT_HI_X:%[a-z0-9]+]]
				; CHECK-NEXT: shlq $11, [[SEXT_HI_X]]
				; CHECK-NEXT: sarq $11, [[SEXT_HI_X]]
				; CHECK-NEXT: cmpq $15, %rdi
				; CHECK-NEXT: seta [[LO_GT_MAX:%[a-z0-9]+]]
				; CHECK-NEXT: xorl [[ZERO:%[a-z0-9]+]]d, [[ZERO]]d
				; CHECK-NEXT: testq [[SEXT_HI_X]], [[SEXT_HI_X]]
				; CHECK-NEXT: cmovsq [[ZERO]], %rdx
				; CHECK-NEXT: cmovsq [[ZERO]], %rdi
				; CHECK-NEXT: setg [[SEXT_HI_X_GT_ZERO:%[a-z0-9]+]]
				; CHECK-NEXT: movabsq $9007199254740991, [[MASK_I117:%[a-z0-9]+]] # imm = 0x1FFFFFFFFFFFFF
				; CHECK-NEXT: testq [[MASK_I117]], %rsi
				; CHECK-NEXT: je [[NO_HI_BITS_SET_LBL:.LBB[0-9_]+]]
				; CHECK: movb [[SEXT_HI_X_GT_ZERO]], [[LO_GT_MAX]]
				; CHECK: [[NO_HI_BITS_SET_LBL]]:
				; CHECK: testb [[LO_GT_MAX]], [[LO_GT_MAX]]
				; CHECK-NEXT: movl $15, %e[[MAX_LO:[a-z]+]]
				; CHECK-NEXT: cmovneq %r[[MAX_LO]], %rdi
				; CHECK-NEXT: cmovneq [[ZERO]], %rdx
				; CHECK-NEXT: movq %rdi, %rax
				; CHECK-NEXT: retq
				%ssat_x = call i117 @llvm.usat.i117(i117 %x, i32 4)
				ret i117 %ssat_x
				}

				declare <2 x i64> @llvm.ssat.v2i64(<2 x i64> %x, i32 %n)
				declare <2 x i64> @llvm.usat.v2i64(<2 x i64> %x, i32 %n)

				define <2 x i64> @test_ssat_v2i64_unroll_or_expand(<2 x i64> %x) {
				; NOVSELECT-LABEL: test_ssat_v2i64_unroll_or_expand
				; NOVSELECT: movd %xmm0, [[X0:%[a-z0-9]+]]
				; NOVSELECT-NEXT: cmpq $-8, [[X0]]
				; NOVSELECT-NEXT: movq $-8, [[MIN:%[a-z0-9]+]]
				; NOVSELECT-NEXT: cmovlq [[MIN]], [[X0]]
				; NOVSELECT-NEXT: cmpq $7, [[X0]]
				; NOVSELECT-NEXT: movl $7, %e[[MAX:[a-z0-9]+]]
				; NOVSELECT-NEXT: cmovgq %r[[MAX]], [[X0]]
				; NOVSELECT-NEXT: movd [[X0]], %xmm1
				; NOVSELECT-NEXT: pshufd $78, %xmm0, %xmm0 # xmm0 = xmm0[2,3,0,1]
				; NOVSELECT-NEXT: movd %xmm0, [[X1:%[a-z0-9]+]]
				; NOVSELECT-NEXT: cmpq $-8, [[X1]]
				; NOVSELECT-NEXT: cmovlq [[MIN]], [[X1]]
				; NOVSELECT-NEXT: cmpq $7, [[X1]]
				; NOVSELECT-NEXT: cmovgq %r[[MAX]], [[X1]]
				; NOVSELECT-NEXT: movd [[X1]], %xmm0
				; NOVSELECT-NEXT: punpcklqdq %xmm0, %xmm1 # xmm1 = xmm1[0],xmm0[0]
				; NOVSELECT-NEXT: movdqa %xmm1, %xmm0
				; NOVSELECT-NEXT: retq

				; SSE42-LABEL: test_ssat_v2i64_unroll_or_expand
				; SSE42: movdqa %xmm0, [[TMP1:%xmm[0-9]+]]
				; SSE42-NEXT: movdqa {{.*}}(%rip), %[[MIN:xmm[0-9]+]] # [[MIN]] = [18446744073709551608,18446744073709551608]
				; SSE42-NEXT: movdqa %[[MIN]], %xmm0
				; SSE42-NEXT: pcmpgtq [[TMP1]], %xmm0
				; SSE42-NEXT: blendvpd %[[MIN]], [[TMP1]]
				; SSE42-NEXT: movdqa {{.*}}(%rip), %[[MAX:xmm[0-9]+]] # [[MAX]] = [7,7]
				; SSE42-NEXT: movapd [[TMP1]], %xmm0
				; SSE42-NEXT: pcmpgtq %[[MAX]], %xmm0
				; SSE42-NEXT: blendvpd %[[MAX]], [[TMP1]]
				; SSE42-NEXT: movapd [[TMP1]], %xmm0
				; SSE42-NEXT: retq
				%ssat_x = call <2 x i64> @llvm.ssat.v2i64(<2 x i64> %x, i32 4)
				ret <2 x i64> %ssat_x
				}

				define <2 x i64> @test_usat_v2i64_unroll_or_expand(<2 x i64> %x) {
				; NOVSELECT-LABEL: test_usat_v2i64_unroll_or_expand
				; NOVSELECT: movd %xmm0, [[X0:%[a-z0-9]+]]
				; NOVSELECT-NEXT: xorl %e[[MIN:[a-z0-9]+]], %e[[MIN]]
				; NOVSELECT-NEXT: testq [[X0]], [[X0]]
				; NOVSELECT-NEXT: cmovsq %r[[MIN]], [[X0]]
				; NOVSELECT-NEXT: cmpq $15, [[X0]]
				; NOVSELECT-NEXT: movl $15, %e[[MAX:[a-z0-9]+]]
				; NOVSELECT-NEXT: cmovgq %r[[MAX]], [[X0]]
				; NOVSELECT-NEXT: movd [[X0]], %xmm1
				; NOVSELECT-NEXT: pshufd $78, %xmm0, %xmm0 # xmm0 = xmm0[2,3,0,1]
				; NOVSELECT-NEXT: movd %xmm0, [[X1:%[a-z0-9]+]]
				; NOVSELECT-NEXT: testq [[X1]], [[X1]]
				; NOVSELECT-NEXT: cmovsq %r[[MIN]], [[X1]]
				; NOVSELECT-NEXT: cmpq $15, [[X1]]
				; NOVSELECT-NEXT: cmovgq %r[[MAX]], [[X1]]
				; NOVSELECT-NEXT: movd [[X1]], %xmm0
				; NOVSELECT-NEXT: punpcklqdq %xmm0, %xmm1 # xmm1 = xmm1[0],xmm0[0]
				; NOVSELECT-NEXT: movdqa %xmm1, %xmm0
				; NOVSELECT-NEXT: retq

				; SSE42-LABEL: test_usat_v2i64_unroll
				; SSE42: movdqa %xmm0, [[TMP1:%xmm[0-9]+]]
				; SSE42-NEXT: xorpd [[MIN:%xmm[0-9]+]], [[MIN]]
				; SSE42-NEXT: pxor %xmm0, %xmm0
				; SSE42-NEXT: pcmpgtq [[TMP1]], %xmm0
				; SSE42-NEXT: blendvpd [[MIN]], [[TMP1]]
				; SSE42-NEXT: movdqa {{.*}}(%rip), %[[MAX:xmm[0-9]+]] # [[MAX]] = [15,15]
				; SSE42-NEXT: movapd [[TMP1]], %xmm0
				; SSE42-NEXT: pcmpgtq %[[MAX]], %xmm0
				; SSE42-NEXT: blendvpd %[[MAX]], [[TMP1]]
				; SSE42-NEXT: movapd [[TMP1]], %xmm0
				; SSE42-NEXT: retq
				%ssat_x = call <2 x i64> @llvm.usat.v2i64(<2 x i64> %x, i32 4)
				ret <2 x i64> %ssat_x
				}

				declare <4 x i30> @llvm.ssat.v4i30(<4 x i30> %x, i32 %n)
				declare <4 x i30> @llvm.usat.v4i30(<4 x i30> %x, i32 %n)

				define <4 x i30> @test_ssat_v4i30_promote_expand(<4 x i30> %x) {
				; SSE42-LABEL: test_ssat_v4i30_promote_expand
				; SSE42: movdqa %xmm0, [[TMP1:%xmm[0-9]+]]
				; SSE42-NEXT: pslld $2, [[TMP1]]
				; SSE42-NEXT: psrad $2, [[TMP1]]
				; SSE42-NEXT: movdqa {{.*}}(%rip), %[[MIN:xmm[0-9]+]] # [[MIN]] = [4294967288,4294967288,4294967288,4294967288]
				; SSE42-NEXT: movdqa %[[MIN]], %xmm0
				; SSE42-NEXT: pcmpgtd [[TMP1]], %xmm0
				; SSE42-NEXT: blendvps %[[MIN]], [[TMP1]]
				; SSE42-NEXT: movdqa {{.*}}(%rip), %[[MAX:xmm[0-9]+]] # [[MAX]] = [7,7,7,7]
				; SSE42-NEXT: movaps [[TMP1]], %xmm0
				; SSE42-NEXT: pcmpgtd %[[MAX]], %xmm0
				; SSE42-NEXT: blendvps %[[MAX]], [[TMP1]]
				; SSE42-NEXT: movaps [[TMP1]], %xmm0
				; SSE42-NEXT: retq
				%ssat_x = call <4 x i30> @llvm.ssat.v4i30(<4 x i30> %x, i32 4)
				ret <4 x i30> %ssat_x
				}

				define <4 x i30> @test_usat_v4i30_promote_expand(<4 x i30> %x) {
				; SSE42-LABEL: test_usat_v4i30_promote_expand
				; SSE42: movdqa %xmm0, [[TMP1]]
				; SSE42-NEXT: pslld $2, [[TMP1]]
				; SSE42-NEXT: psrad $2, [[TMP1]]
				; SSE42-NEXT: xorps [[MIN:%xmm[0-9]+]], [[MIN]]
				; SSE42-NEXT: pxor %xmm0, %xmm0
				; SSE42-NEXT: pcmpgtd [[TMP1]], %xmm0
				; SSE42-NEXT: blendvps [[MIN]], [[TMP1]]
				; SSE42-NEXT: movdqa {{.*}}(%rip), %[[MAX:xmm[0-9]+]] # [[MAX]] = [15,15,15,15]
				; SSE42-NEXT: movaps [[TMP1]], %xmm0
				; SSE42-NEXT: pcmpgtd %[[MAX]], %xmm0
				; SSE42-NEXT: blendvps %[[MAX]], [[TMP1]]
				; SSE42-NEXT: movaps [[TMP1]], %xmm0
				; SSE42-NEXT: retq
				%ssat_x = call <4 x i30> @llvm.usat.v4i30(<4 x i30> %x, i32 4)
				ret <4 x i30> %ssat_x
				}

				declare <3 x i32> @llvm.ssat.v3i32(<3 x i32> %x, i32 %n)
				declare <3 x i32> @llvm.usat.v3i32(<3 x i32> %x, i32 %n)

				;; The 4th element is undef, but it's not obvious so also saturate it.

				define <3 x i32> @test_ssat_v3i32_widen(<3 x i32> %x) {
				; NOVSELECT-LABEL: test_ssat_v3i32_widen
				; NOVSELECT: pshufd $-25, %xmm0, %xmm1 # xmm1 = xmm0[3,1,2,3]
				; NOVSELECT-NEXT: movd %xmm1, [[X0:%[a-z0-9]+]]
				; NOVSELECT-NEXT: cmpl $-8, [[X0]]
				; NOVSELECT-NEXT: movl $-8, [[MIN:%[a-z0-9]+]]
				; NOVSELECT-NEXT: cmovll [[MIN]], [[X0]]
				; NOVSELECT-NEXT: cmpl $7, [[X0]]
				; NOVSELECT-NEXT: movl $7, [[MAX:%[a-z0-9]+]]
				; NOVSELECT-NEXT: cmovgl [[MAX]], [[X0]]
				; NOVSELECT-NEXT: movd [[X0]], %xmm1
				; NOVSELECT-NEXT: pshufd $-27, %xmm0, %xmm2 # xmm2 = xmm0[1,1,2,3]
				; NOVSELECT-NEXT: movd %xmm2, [[X1:%[a-z0-9]+]]
				; NOVSELECT-NEXT: cmpl $-8, [[X1]]
				; NOVSELECT-NEXT: cmovll [[MIN]], [[X1]]
				; NOVSELECT-NEXT: cmpl $7, [[X1]]
				; NOVSELECT-NEXT: cmovgl [[MAX]], [[X1]]
				; NOVSELECT-NEXT: movd [[X1]], %xmm2
				; NOVSELECT-NEXT: punpckldq %xmm1, %xmm2 # xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1]
				; NOVSELECT-NEXT: movd %xmm0, [[X2:%[a-z0-9]+]]
				; NOVSELECT-NEXT: cmpl $-8, [[X2]]
				; NOVSELECT-NEXT: cmovll [[MIN]], [[X2]]
				; NOVSELECT-NEXT: cmpl $7, [[X2]]
				; NOVSELECT-NEXT: cmovgl [[MAX]], [[X2]]
				; NOVSELECT-NEXT: movd [[X2]], %xmm1
				; NOVSELECT-NEXT: pshufd $78, %xmm0, %xmm0 # xmm0 = xmm0[2,3,0,1]
				; NOVSELECT-NEXT: movd %xmm0, [[X3:%[a-z0-9]+]]
				; NOVSELECT-NEXT: cmpl $-8, [[X3]]
				; NOVSELECT-NEXT: cmovll [[MIN]], [[X3]]
				; NOVSELECT-NEXT: cmpl $7, [[X3]]
				; NOVSELECT-NEXT: cmovgl [[MAX]], [[X3]]
				; NOVSELECT-NEXT: movd [[X3]], %xmm0
				; NOVSELECT-NEXT: punpckldq %xmm0, %xmm1 # xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
				; NOVSELECT-NEXT: punpckldq %xmm2, %xmm1 # xmm1 = xmm1[0],xmm2[0],xmm1[1],xmm2[1]
				; NOVSELECT-NEXT: movdqa %xmm1, %xmm0
				; NOVSELECT-NEXT: retq
				%ssat_x = call <3 x i32> @llvm.ssat.v3i32(<3 x i32> %x, i32 4)
				ret <3 x i32> %ssat_x
				}

				define <3 x i32> @test_usat_v3i32_widen(<3 x i32> %x) {
				; NOVSELECT-LABEL: test_usat_v3i32_widen
				; NOVSELECT: pshufd $-25, %xmm0, %xmm1 # xmm1 = xmm0[3,1,2,3]
				; NOVSELECT-NEXT: movd %xmm1, [[X0:%[a-z0-9]+]]
				; NOVSELECT-NEXT: xorl [[MIN:%[a-z0-9]+]], [[MIN]]
				; NOVSELECT-NEXT: testl [[X0]], [[X0]]
				; NOVSELECT-NEXT: cmovsl [[MIN]], [[X0]]
				; NOVSELECT-NEXT: cmpl $15, [[X0]]
				; NOVSELECT-NEXT: movl $15, [[MAX:%[a-z0-9]+]]
				; NOVSELECT-NEXT: cmovgl [[MAX]], [[X0]]
				; NOVSELECT-NEXT: movd [[X0]], %xmm1
				; NOVSELECT-NEXT: pshufd $-27, %xmm0, %xmm2 # xmm2 = xmm0[1,1,2,3]
				; NOVSELECT-NEXT: movd %xmm2, [[X1:%[a-z0-9]+]]
				; NOVSELECT-NEXT: testl [[X1]], [[X1]]
				; NOVSELECT-NEXT: cmovsl [[MIN]], [[X1]]
				; NOVSELECT-NEXT: cmpl $15, [[X1]]
				; NOVSELECT-NEXT: cmovgl [[MAX]], [[X1]]
				; NOVSELECT-NEXT: movd [[X1]], %xmm2
				; NOVSELECT-NEXT: punpckldq %xmm1, %xmm2 # xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1]
				; NOVSELECT-NEXT: movd %xmm0, [[X2:%[a-z0-9]+]]
				; NOVSELECT-NEXT: testl [[X2]], [[X2]]
				; NOVSELECT-NEXT: cmovsl [[MIN]], [[X2]]
				; NOVSELECT-NEXT: cmpl $15, [[X2]]
				; NOVSELECT-NEXT: cmovgl [[MAX]], [[X2]]
				; NOVSELECT-NEXT: movd [[X2]], %xmm1
				; NOVSELECT-NEXT: pshufd $78, %xmm0, %xmm0 # xmm0 = xmm0[2,3,0,1]
				; NOVSELECT-NEXT: movd %xmm0, [[X3:%[a-z0-9]+]]
				; NOVSELECT-NEXT: testl [[X3]], [[X3]]
				; NOVSELECT-NEXT: cmovsl [[MIN]], [[X3]]
				; NOVSELECT-NEXT: cmpl $15, [[X3]]
				; NOVSELECT-NEXT: cmovgl [[MAX]], [[X3]]
				; NOVSELECT-NEXT: movd [[X3]], %xmm0
				; NOVSELECT-NEXT: punpckldq %xmm0, %xmm1 # xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
				; NOVSELECT-NEXT: punpckldq %xmm2, %xmm1 # xmm1 = xmm1[0],xmm2[0],xmm1[1],xmm2[1]
				; NOVSELECT-NEXT: movdqa %xmm1, %xmm0
				; NOVSELECT-NEXT: retq
				%ssat_x = call <3 x i32> @llvm.usat.v3i32(<3 x i32> %x, i32 4)
				ret <3 x i32> %ssat_x
				}

This is an archive of the discontinued LLVM Phabricator instance.

[CodeGen] Add legalization for Integer Saturation Intrinsics.Needs ReviewPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 18183

include/llvm/CodeGen/ISDOpcodes.h

include/llvm/Target/TargetSelectionDAG.td

lib/CodeGen/SelectionDAG/LegalizeDAG.cpp

lib/CodeGen/SelectionDAG/LegalizeIntegerTypes.cpp

lib/CodeGen/SelectionDAG/LegalizeTypes.h

lib/CodeGen/SelectionDAG/LegalizeVectorOps.cpp

lib/CodeGen/SelectionDAG/LegalizeVectorTypes.cpp

lib/CodeGen/SelectionDAG/SelectionDAGBuilder.cpp

lib/CodeGen/SelectionDAG/SelectionDAGDumper.cpp

lib/CodeGen/TargetLoweringBase.cpp

test/CodeGen/X86/saturation-legalization.ll

[CodeGen] Add legalization for Integer Saturation Intrinsics.
Needs ReviewPublic