Diff 297454

llvm/lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 26,939 Lines • ▼ Show 20 Lines	static SDValue LowerMINMAX(SDValue Op, SelectionDAG &DAG) {
if (VT == MVT::v32i16 \|\| VT == MVT::v64i8)		if (VT == MVT::v32i16 \|\| VT == MVT::v64i8)
return splitVectorIntBinary(Op, DAG);		return splitVectorIntBinary(Op, DAG);

SDLoc DL(Op);		SDLoc DL(Op);
unsigned Opcode = Op.getOpcode();		unsigned Opcode = Op.getOpcode();
SDValue N0 = Op.getOperand(0);		SDValue N0 = Op.getOperand(0);
SDValue N1 = Op.getOperand(1);		SDValue N1 = Op.getOperand(1);

// For pre-SSE41, we can perform UMIN/UMAX v8i16 by flipping the signbit,		// For pre-SSE41, we can perform UMIN/UMAX v8i16 by using psubusw.
// using the SMIN/SMAX instructions and flipping the signbit back.
if (VT == MVT::v8i16) {		if (VT == MVT::v8i16) {
assert((Opcode == ISD::UMIN \|\| Opcode == ISD::UMAX) &&		assert((Opcode == ISD::UMIN \|\| Opcode == ISD::UMAX) &&
"Unexpected MIN/MAX opcode");		"Unexpected MIN/MAX opcode");
SDValue Sign = DAG.getConstant(APInt::getSignedMinValue(16), DL, VT);		if (Opcode == ISD::UMIN)
N0 = DAG.getNode(ISD::XOR, DL, VT, N0, Sign);		return DAG.getNode(ISD::SUB, DL, VT, N0,
N1 = DAG.getNode(ISD::XOR, DL, VT, N1, Sign);		DAG.getNode(ISD::USUBSAT, DL, VT, N0, N1));
		RKSimonUnsubmitted Done Reply Inline Actions (style) Remove braces RKSimon: (style) Remove braces
Opcode = (Opcode == ISD::UMIN ? ISD::SMIN : ISD::SMAX);		return DAG.getNode(ISD::ADD, DL, VT,
SDValue Result = DAG.getNode(Opcode, DL, VT, N0, N1);		DAG.getNode(ISD::USUBSAT, DL, VT, N1, N0), N0);
return DAG.getNode(ISD::XOR, DL, VT, Result, Sign);
}		}

// Else, expand to a compare/select.		// Else, expand to a compare/select.
ISD::CondCode CC;		ISD::CondCode CC;
switch (Opcode) {		switch (Opcode) {
case ISD::SMIN: CC = ISD::CondCode::SETLT; break;		case ISD::SMIN: CC = ISD::CondCode::SETLT; break;
case ISD::SMAX: CC = ISD::CondCode::SETGT; break;		case ISD::SMAX: CC = ISD::CondCode::SETGT; break;
case ISD::UMIN: CC = ISD::CondCode::SETULT; break;		case ISD::UMIN: CC = ISD::CondCode::SETULT; break;
▲ Show 20 Lines • Show All 24,257 Lines • Show Last 20 Lines

llvm/lib/Target/X86/X86TargetTransformInfo.cpp

Show First 20 Lines • Show All 2,613 Lines • ▼ Show 20 Lines	static const CostTblEntry SSE2CostTbl[] = {
{ ISD::SADDSAT, MVT::v8i16, 1 },		{ ISD::SADDSAT, MVT::v8i16, 1 },
{ ISD::SADDSAT, MVT::v16i8, 1 },		{ ISD::SADDSAT, MVT::v16i8, 1 },
{ ISD::SMAX, MVT::v8i16, 1 },		{ ISD::SMAX, MVT::v8i16, 1 },
{ ISD::SMIN, MVT::v8i16, 1 },		{ ISD::SMIN, MVT::v8i16, 1 },
{ ISD::SSUBSAT, MVT::v8i16, 1 },		{ ISD::SSUBSAT, MVT::v8i16, 1 },
{ ISD::SSUBSAT, MVT::v16i8, 1 },		{ ISD::SSUBSAT, MVT::v16i8, 1 },
{ ISD::UADDSAT, MVT::v8i16, 1 },		{ ISD::UADDSAT, MVT::v8i16, 1 },
{ ISD::UADDSAT, MVT::v16i8, 1 },		{ ISD::UADDSAT, MVT::v16i8, 1 },
		{ ISD::UMAX, MVT::v8i16, 2 },
{ ISD::UMAX, MVT::v16i8, 1 },		{ ISD::UMAX, MVT::v16i8, 1 },
		{ ISD::UMIN, MVT::v8i16, 2 },
{ ISD::UMIN, MVT::v16i8, 1 },		{ ISD::UMIN, MVT::v16i8, 1 },
{ ISD::USUBSAT, MVT::v8i16, 1 },		{ ISD::USUBSAT, MVT::v8i16, 1 },
{ ISD::USUBSAT, MVT::v16i8, 1 },		{ ISD::USUBSAT, MVT::v16i8, 1 },
{ ISD::FMAXNUM, MVT::f64, 4 },		{ ISD::FMAXNUM, MVT::f64, 4 },
{ ISD::FMAXNUM, MVT::v2f64, 4 },		{ ISD::FMAXNUM, MVT::v2f64, 4 },
{ ISD::FSQRT, MVT::f64, 32 }, // Nehalem from http://www.agner.org/		{ ISD::FSQRT, MVT::f64, 32 }, // Nehalem from http://www.agner.org/
{ ISD::FSQRT, MVT::v2f64, 32 }, // Nehalem from http://www.agner.org/		{ ISD::FSQRT, MVT::v2f64, 32 }, // Nehalem from http://www.agner.org/
};		};
▲ Show 20 Lines • Show All 2,051 Lines • Show Last 20 Lines

llvm/test/Analysis/CostModel/X86/arith-uminmax.ll

	Show All 33 Lines
	; SSE2-NEXT: Cost Model: Found an estimated cost of 11 for instruction: %V2I64 = call <2 x i64> @llvm.umax.v2i64(<2 x i64> undef, <2 x i64> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 11 for instruction: %V2I64 = call <2 x i64> @llvm.umax.v2i64(<2 x i64> undef, <2 x i64> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 22 for instruction: %V4I64 = call <4 x i64> @llvm.umax.v4i64(<4 x i64> undef, <4 x i64> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 22 for instruction: %V4I64 = call <4 x i64> @llvm.umax.v4i64(<4 x i64> undef, <4 x i64> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 44 for instruction: %V8I64 = call <8 x i64> @llvm.umax.v8i64(<8 x i64> undef, <8 x i64> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 44 for instruction: %V8I64 = call <8 x i64> @llvm.umax.v8i64(<8 x i64> undef, <8 x i64> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I32 = call i32 @llvm.umax.i32(i32 undef, i32 undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I32 = call i32 @llvm.umax.i32(i32 undef, i32 undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V4I32 = call <4 x i32> @llvm.umax.v4i32(<4 x i32> undef, <4 x i32> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V4I32 = call <4 x i32> @llvm.umax.v4i32(<4 x i32> undef, <4 x i32> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 8 for instruction: %V8I32 = call <8 x i32> @llvm.umax.v8i32(<8 x i32> undef, <8 x i32> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 8 for instruction: %V8I32 = call <8 x i32> @llvm.umax.v8i32(<8 x i32> undef, <8 x i32> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 16 for instruction: %V16I32 = call <16 x i32> @llvm.umax.v16i32(<16 x i32> undef, <16 x i32> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 16 for instruction: %V16I32 = call <16 x i32> @llvm.umax.v16i32(<16 x i32> undef, <16 x i32> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I16 = call i16 @llvm.umax.i16(i16 undef, i16 undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I16 = call i16 @llvm.umax.i16(i16 undef, i16 undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V8I16 = call <8 x i16> @llvm.umax.v8i16(<8 x i16> undef, <8 x i16> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %V8I16 = call <8 x i16> @llvm.umax.v8i16(<8 x i16> undef, <8 x i16> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 8 for instruction: %V16I16 = call <16 x i16> @llvm.umax.v16i16(<16 x i16> undef, <16 x i16> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V16I16 = call <16 x i16> @llvm.umax.v16i16(<16 x i16> undef, <16 x i16> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 16 for instruction: %V32I16 = call <32 x i16> @llvm.umax.v32i16(<32 x i16> undef, <32 x i16> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 8 for instruction: %V32I16 = call <32 x i16> @llvm.umax.v32i16(<32 x i16> undef, <32 x i16> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I8 = call i8 @llvm.umax.i8(i8 undef, i8 undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I8 = call i8 @llvm.umax.i8(i8 undef, i8 undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 1 for instruction: %V16I8 = call <16 x i8> @llvm.umax.v16i8(<16 x i8> undef, <16 x i8> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 1 for instruction: %V16I8 = call <16 x i8> @llvm.umax.v16i8(<16 x i8> undef, <16 x i8> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %V32I8 = call <32 x i8> @llvm.umax.v32i8(<32 x i8> undef, <32 x i8> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %V32I8 = call <32 x i8> @llvm.umax.v32i8(<32 x i8> undef, <32 x i8> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V64I8 = call <64 x i8> @llvm.umax.v64i8(<64 x i8> undef, <64 x i8> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V64I8 = call <64 x i8> @llvm.umax.v64i8(<64 x i8> undef, <64 x i8> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 0 for instruction: ret i32 undef			; SSE2-NEXT: Cost Model: Found an estimated cost of 0 for instruction: ret i32 undef
	;			;
	; SSSE3-LABEL: 'umax'			; SSSE3-LABEL: 'umax'
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I64 = call i64 @llvm.umax.i64(i64 undef, i64 undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I64 = call i64 @llvm.umax.i64(i64 undef, i64 undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 11 for instruction: %V2I64 = call <2 x i64> @llvm.umax.v2i64(<2 x i64> undef, <2 x i64> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 11 for instruction: %V2I64 = call <2 x i64> @llvm.umax.v2i64(<2 x i64> undef, <2 x i64> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 22 for instruction: %V4I64 = call <4 x i64> @llvm.umax.v4i64(<4 x i64> undef, <4 x i64> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 22 for instruction: %V4I64 = call <4 x i64> @llvm.umax.v4i64(<4 x i64> undef, <4 x i64> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 44 for instruction: %V8I64 = call <8 x i64> @llvm.umax.v8i64(<8 x i64> undef, <8 x i64> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 44 for instruction: %V8I64 = call <8 x i64> @llvm.umax.v8i64(<8 x i64> undef, <8 x i64> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I32 = call i32 @llvm.umax.i32(i32 undef, i32 undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I32 = call i32 @llvm.umax.i32(i32 undef, i32 undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V4I32 = call <4 x i32> @llvm.umax.v4i32(<4 x i32> undef, <4 x i32> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V4I32 = call <4 x i32> @llvm.umax.v4i32(<4 x i32> undef, <4 x i32> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 8 for instruction: %V8I32 = call <8 x i32> @llvm.umax.v8i32(<8 x i32> undef, <8 x i32> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 8 for instruction: %V8I32 = call <8 x i32> @llvm.umax.v8i32(<8 x i32> undef, <8 x i32> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 16 for instruction: %V16I32 = call <16 x i32> @llvm.umax.v16i32(<16 x i32> undef, <16 x i32> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 16 for instruction: %V16I32 = call <16 x i32> @llvm.umax.v16i32(<16 x i32> undef, <16 x i32> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I16 = call i16 @llvm.umax.i16(i16 undef, i16 undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I16 = call i16 @llvm.umax.i16(i16 undef, i16 undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V8I16 = call <8 x i16> @llvm.umax.v8i16(<8 x i16> undef, <8 x i16> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %V8I16 = call <8 x i16> @llvm.umax.v8i16(<8 x i16> undef, <8 x i16> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 8 for instruction: %V16I16 = call <16 x i16> @llvm.umax.v16i16(<16 x i16> undef, <16 x i16> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V16I16 = call <16 x i16> @llvm.umax.v16i16(<16 x i16> undef, <16 x i16> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 16 for instruction: %V32I16 = call <32 x i16> @llvm.umax.v32i16(<32 x i16> undef, <32 x i16> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 8 for instruction: %V32I16 = call <32 x i16> @llvm.umax.v32i16(<32 x i16> undef, <32 x i16> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I8 = call i8 @llvm.umax.i8(i8 undef, i8 undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I8 = call i8 @llvm.umax.i8(i8 undef, i8 undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 1 for instruction: %V16I8 = call <16 x i8> @llvm.umax.v16i8(<16 x i8> undef, <16 x i8> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 1 for instruction: %V16I8 = call <16 x i8> @llvm.umax.v16i8(<16 x i8> undef, <16 x i8> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %V32I8 = call <32 x i8> @llvm.umax.v32i8(<32 x i8> undef, <32 x i8> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %V32I8 = call <32 x i8> @llvm.umax.v32i8(<32 x i8> undef, <32 x i8> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V64I8 = call <64 x i8> @llvm.umax.v64i8(<64 x i8> undef, <64 x i8> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V64I8 = call <64 x i8> @llvm.umax.v64i8(<64 x i8> undef, <64 x i8> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 0 for instruction: ret i32 undef			; SSSE3-NEXT: Cost Model: Found an estimated cost of 0 for instruction: ret i32 undef
	;			;
	; SSE42-LABEL: 'umax'			; SSE42-LABEL: 'umax'
	; SSE42-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I64 = call i64 @llvm.umax.i64(i64 undef, i64 undef)			; SSE42-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I64 = call i64 @llvm.umax.i64(i64 undef, i64 undef)
	▲ Show 20 Lines • Show All 158 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: Cost Model: Found an estimated cost of 11 for instruction: %V2I64 = call <2 x i64> @llvm.umin.v2i64(<2 x i64> undef, <2 x i64> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 11 for instruction: %V2I64 = call <2 x i64> @llvm.umin.v2i64(<2 x i64> undef, <2 x i64> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 22 for instruction: %V4I64 = call <4 x i64> @llvm.umin.v4i64(<4 x i64> undef, <4 x i64> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 22 for instruction: %V4I64 = call <4 x i64> @llvm.umin.v4i64(<4 x i64> undef, <4 x i64> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 44 for instruction: %V8I64 = call <8 x i64> @llvm.umin.v8i64(<8 x i64> undef, <8 x i64> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 44 for instruction: %V8I64 = call <8 x i64> @llvm.umin.v8i64(<8 x i64> undef, <8 x i64> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I32 = call i32 @llvm.umin.i32(i32 undef, i32 undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I32 = call i32 @llvm.umin.i32(i32 undef, i32 undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V4I32 = call <4 x i32> @llvm.umin.v4i32(<4 x i32> undef, <4 x i32> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V4I32 = call <4 x i32> @llvm.umin.v4i32(<4 x i32> undef, <4 x i32> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 8 for instruction: %V8I32 = call <8 x i32> @llvm.umin.v8i32(<8 x i32> undef, <8 x i32> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 8 for instruction: %V8I32 = call <8 x i32> @llvm.umin.v8i32(<8 x i32> undef, <8 x i32> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 16 for instruction: %V16I32 = call <16 x i32> @llvm.umin.v16i32(<16 x i32> undef, <16 x i32> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 16 for instruction: %V16I32 = call <16 x i32> @llvm.umin.v16i32(<16 x i32> undef, <16 x i32> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I16 = call i16 @llvm.umin.i16(i16 undef, i16 undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I16 = call i16 @llvm.umin.i16(i16 undef, i16 undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V8I16 = call <8 x i16> @llvm.umin.v8i16(<8 x i16> undef, <8 x i16> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %V8I16 = call <8 x i16> @llvm.umin.v8i16(<8 x i16> undef, <8 x i16> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 8 for instruction: %V16I16 = call <16 x i16> @llvm.umin.v16i16(<16 x i16> undef, <16 x i16> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V16I16 = call <16 x i16> @llvm.umin.v16i16(<16 x i16> undef, <16 x i16> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 16 for instruction: %V32I16 = call <32 x i16> @llvm.umin.v32i16(<32 x i16> undef, <32 x i16> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 8 for instruction: %V32I16 = call <32 x i16> @llvm.umin.v32i16(<32 x i16> undef, <32 x i16> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I8 = call i8 @llvm.umin.i8(i8 undef, i8 undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I8 = call i8 @llvm.umin.i8(i8 undef, i8 undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 1 for instruction: %V16I8 = call <16 x i8> @llvm.umin.v16i8(<16 x i8> undef, <16 x i8> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 1 for instruction: %V16I8 = call <16 x i8> @llvm.umin.v16i8(<16 x i8> undef, <16 x i8> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %V32I8 = call <32 x i8> @llvm.umin.v32i8(<32 x i8> undef, <32 x i8> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %V32I8 = call <32 x i8> @llvm.umin.v32i8(<32 x i8> undef, <32 x i8> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V64I8 = call <64 x i8> @llvm.umin.v64i8(<64 x i8> undef, <64 x i8> undef)			; SSE2-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V64I8 = call <64 x i8> @llvm.umin.v64i8(<64 x i8> undef, <64 x i8> undef)
	; SSE2-NEXT: Cost Model: Found an estimated cost of 0 for instruction: ret i32 undef			; SSE2-NEXT: Cost Model: Found an estimated cost of 0 for instruction: ret i32 undef
	;			;
	; SSSE3-LABEL: 'umin'			; SSSE3-LABEL: 'umin'
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I64 = call i64 @llvm.umin.i64(i64 undef, i64 undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I64 = call i64 @llvm.umin.i64(i64 undef, i64 undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 11 for instruction: %V2I64 = call <2 x i64> @llvm.umin.v2i64(<2 x i64> undef, <2 x i64> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 11 for instruction: %V2I64 = call <2 x i64> @llvm.umin.v2i64(<2 x i64> undef, <2 x i64> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 22 for instruction: %V4I64 = call <4 x i64> @llvm.umin.v4i64(<4 x i64> undef, <4 x i64> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 22 for instruction: %V4I64 = call <4 x i64> @llvm.umin.v4i64(<4 x i64> undef, <4 x i64> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 44 for instruction: %V8I64 = call <8 x i64> @llvm.umin.v8i64(<8 x i64> undef, <8 x i64> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 44 for instruction: %V8I64 = call <8 x i64> @llvm.umin.v8i64(<8 x i64> undef, <8 x i64> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I32 = call i32 @llvm.umin.i32(i32 undef, i32 undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I32 = call i32 @llvm.umin.i32(i32 undef, i32 undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V4I32 = call <4 x i32> @llvm.umin.v4i32(<4 x i32> undef, <4 x i32> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V4I32 = call <4 x i32> @llvm.umin.v4i32(<4 x i32> undef, <4 x i32> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 8 for instruction: %V8I32 = call <8 x i32> @llvm.umin.v8i32(<8 x i32> undef, <8 x i32> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 8 for instruction: %V8I32 = call <8 x i32> @llvm.umin.v8i32(<8 x i32> undef, <8 x i32> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 16 for instruction: %V16I32 = call <16 x i32> @llvm.umin.v16i32(<16 x i32> undef, <16 x i32> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 16 for instruction: %V16I32 = call <16 x i32> @llvm.umin.v16i32(<16 x i32> undef, <16 x i32> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I16 = call i16 @llvm.umin.i16(i16 undef, i16 undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I16 = call i16 @llvm.umin.i16(i16 undef, i16 undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V8I16 = call <8 x i16> @llvm.umin.v8i16(<8 x i16> undef, <8 x i16> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %V8I16 = call <8 x i16> @llvm.umin.v8i16(<8 x i16> undef, <8 x i16> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 8 for instruction: %V16I16 = call <16 x i16> @llvm.umin.v16i16(<16 x i16> undef, <16 x i16> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V16I16 = call <16 x i16> @llvm.umin.v16i16(<16 x i16> undef, <16 x i16> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 16 for instruction: %V32I16 = call <32 x i16> @llvm.umin.v32i16(<32 x i16> undef, <32 x i16> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 8 for instruction: %V32I16 = call <32 x i16> @llvm.umin.v32i16(<32 x i16> undef, <32 x i16> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I8 = call i8 @llvm.umin.i8(i8 undef, i8 undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I8 = call i8 @llvm.umin.i8(i8 undef, i8 undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 1 for instruction: %V16I8 = call <16 x i8> @llvm.umin.v16i8(<16 x i8> undef, <16 x i8> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 1 for instruction: %V16I8 = call <16 x i8> @llvm.umin.v16i8(<16 x i8> undef, <16 x i8> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %V32I8 = call <32 x i8> @llvm.umin.v32i8(<32 x i8> undef, <32 x i8> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %V32I8 = call <32 x i8> @llvm.umin.v32i8(<32 x i8> undef, <32 x i8> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V64I8 = call <64 x i8> @llvm.umin.v64i8(<64 x i8> undef, <64 x i8> undef)			; SSSE3-NEXT: Cost Model: Found an estimated cost of 4 for instruction: %V64I8 = call <64 x i8> @llvm.umin.v64i8(<64 x i8> undef, <64 x i8> undef)
	; SSSE3-NEXT: Cost Model: Found an estimated cost of 0 for instruction: ret i32 undef			; SSSE3-NEXT: Cost Model: Found an estimated cost of 0 for instruction: ret i32 undef
	;			;
	; SSE42-LABEL: 'umin'			; SSE42-LABEL: 'umin'
	; SSE42-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I64 = call i64 @llvm.umin.i64(i64 undef, i64 undef)			; SSE42-NEXT: Cost Model: Found an estimated cost of 2 for instruction: %I64 = call i64 @llvm.umin.i64(i64 undef, i64 undef)
	▲ Show 20 Lines • Show All 134 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/horizontal-reduce-umax.ll

Show First 20 Lines • Show All 233 Lines • ▼ Show 20 Lines	; X64-AVX-NEXT: retq
%7 = extractelement <4 x i32> %6, i32 0		%7 = extractelement <4 x i32> %6, i32 0
ret i32 %7		ret i32 %7
}		}

define i16 @test_reduce_v8i16(<8 x i16> %a0) {		define i16 @test_reduce_v8i16(<8 x i16> %a0) {
; X86-SSE2-LABEL: test_reduce_v8i16:		; X86-SSE2-LABEL: test_reduce_v8i16:
; X86-SSE2: ## %bb.0:		; X86-SSE2: ## %bb.0:
; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
; X86-SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; X86-SSE2-NEXT: psubusw %xmm0, %xmm1
; X86-SSE2-NEXT: pxor %xmm2, %xmm0		; X86-SSE2-NEXT: paddw %xmm0, %xmm1
; X86-SSE2-NEXT: pxor %xmm2, %xmm1
; X86-SSE2-NEXT: pmaxsw %xmm0, %xmm1
; X86-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; X86-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]
; X86-SSE2-NEXT: pmaxsw %xmm1, %xmm0		; X86-SSE2-NEXT: psubusw %xmm1, %xmm0
		; X86-SSE2-NEXT: paddw %xmm1, %xmm0
; X86-SSE2-NEXT: movdqa %xmm0, %xmm1		; X86-SSE2-NEXT: movdqa %xmm0, %xmm1
; X86-SSE2-NEXT: psrld $16, %xmm1		; X86-SSE2-NEXT: psrld $16, %xmm1
; X86-SSE2-NEXT: pmaxsw %xmm0, %xmm1		; X86-SSE2-NEXT: psubusw %xmm0, %xmm1
		; X86-SSE2-NEXT: paddw %xmm0, %xmm1
; X86-SSE2-NEXT: movd %xmm1, %eax		; X86-SSE2-NEXT: movd %xmm1, %eax
; X86-SSE2-NEXT: xorl $32768, %eax ## imm = 0x8000
; X86-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax		; X86-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax
; X86-SSE2-NEXT: retl		; X86-SSE2-NEXT: retl
;		;
; X86-SSE42-LABEL: test_reduce_v8i16:		; X86-SSE42-LABEL: test_reduce_v8i16:
; X86-SSE42: ## %bb.0:		; X86-SSE42: ## %bb.0:
; X86-SSE42-NEXT: pcmpeqd %xmm1, %xmm1		; X86-SSE42-NEXT: pcmpeqd %xmm1, %xmm1
; X86-SSE42-NEXT: pxor %xmm0, %xmm1		; X86-SSE42-NEXT: pxor %xmm0, %xmm1
; X86-SSE42-NEXT: phminposuw %xmm1, %xmm0		; X86-SSE42-NEXT: phminposuw %xmm1, %xmm0
Show All 10 Lines
; X86-AVX-NEXT: vmovd %xmm0, %eax		; X86-AVX-NEXT: vmovd %xmm0, %eax
; X86-AVX-NEXT: notl %eax		; X86-AVX-NEXT: notl %eax
; X86-AVX-NEXT: ## kill: def $ax killed $ax killed $eax		; X86-AVX-NEXT: ## kill: def $ax killed $ax killed $eax
; X86-AVX-NEXT: retl		; X86-AVX-NEXT: retl
;		;
; X64-SSE2-LABEL: test_reduce_v8i16:		; X64-SSE2-LABEL: test_reduce_v8i16:
; X64-SSE2: ## %bb.0:		; X64-SSE2: ## %bb.0:
; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
; X64-SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; X64-SSE2-NEXT: psubusw %xmm0, %xmm1
; X64-SSE2-NEXT: pxor %xmm2, %xmm0		; X64-SSE2-NEXT: paddw %xmm0, %xmm1
; X64-SSE2-NEXT: pxor %xmm2, %xmm1
; X64-SSE2-NEXT: pmaxsw %xmm0, %xmm1
; X64-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; X64-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]
; X64-SSE2-NEXT: pmaxsw %xmm1, %xmm0		; X64-SSE2-NEXT: psubusw %xmm1, %xmm0
		; X64-SSE2-NEXT: paddw %xmm1, %xmm0
; X64-SSE2-NEXT: movdqa %xmm0, %xmm1		; X64-SSE2-NEXT: movdqa %xmm0, %xmm1
; X64-SSE2-NEXT: psrld $16, %xmm1		; X64-SSE2-NEXT: psrld $16, %xmm1
; X64-SSE2-NEXT: pmaxsw %xmm0, %xmm1		; X64-SSE2-NEXT: psubusw %xmm0, %xmm1
		; X64-SSE2-NEXT: paddw %xmm0, %xmm1
; X64-SSE2-NEXT: movd %xmm1, %eax		; X64-SSE2-NEXT: movd %xmm1, %eax
; X64-SSE2-NEXT: xorl $32768, %eax ## imm = 0x8000
; X64-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax		; X64-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax
; X64-SSE2-NEXT: retq		; X64-SSE2-NEXT: retq
;		;
; X64-SSE42-LABEL: test_reduce_v8i16:		; X64-SSE42-LABEL: test_reduce_v8i16:
; X64-SSE42: ## %bb.0:		; X64-SSE42: ## %bb.0:
; X64-SSE42-NEXT: pcmpeqd %xmm1, %xmm1		; X64-SSE42-NEXT: pcmpeqd %xmm1, %xmm1
; X64-SSE42-NEXT: pxor %xmm0, %xmm1		; X64-SSE42-NEXT: pxor %xmm0, %xmm1
; X64-SSE42-NEXT: phminposuw %xmm1, %xmm0		; X64-SSE42-NEXT: phminposuw %xmm1, %xmm0
▲ Show 20 Lines • Show All 523 Lines • ▼ Show 20 Lines	; X64-AVX512-NEXT: retq
%9 = select <8 x i1> %8, <8 x i32> %6, <8 x i32> %7		%9 = select <8 x i1> %8, <8 x i32> %6, <8 x i32> %7
%10 = extractelement <8 x i32> %9, i32 0		%10 = extractelement <8 x i32> %9, i32 0
ret i32 %10		ret i32 %10
}		}

define i16 @test_reduce_v16i16(<16 x i16> %a0) {		define i16 @test_reduce_v16i16(<16 x i16> %a0) {
; X86-SSE2-LABEL: test_reduce_v16i16:		; X86-SSE2-LABEL: test_reduce_v16i16:
; X86-SSE2: ## %bb.0:		; X86-SSE2: ## %bb.0:
; X86-SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; X86-SSE2-NEXT: psubusw %xmm0, %xmm1
; X86-SSE2-NEXT: pxor %xmm2, %xmm1		; X86-SSE2-NEXT: paddw %xmm0, %xmm1
; X86-SSE2-NEXT: pxor %xmm2, %xmm0		; X86-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[2,3,2,3]
; X86-SSE2-NEXT: pmaxsw %xmm1, %xmm0		; X86-SSE2-NEXT: psubusw %xmm1, %xmm0
; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; X86-SSE2-NEXT: paddw %xmm1, %xmm0
; X86-SSE2-NEXT: pmaxsw %xmm0, %xmm1		; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
; X86-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; X86-SSE2-NEXT: psubusw %xmm0, %xmm1
; X86-SSE2-NEXT: pmaxsw %xmm1, %xmm0		; X86-SSE2-NEXT: paddw %xmm0, %xmm1
; X86-SSE2-NEXT: movdqa %xmm0, %xmm1		; X86-SSE2-NEXT: movdqa %xmm1, %xmm0
; X86-SSE2-NEXT: psrld $16, %xmm1		; X86-SSE2-NEXT: psrld $16, %xmm0
; X86-SSE2-NEXT: pmaxsw %xmm0, %xmm1		; X86-SSE2-NEXT: psubusw %xmm1, %xmm0
; X86-SSE2-NEXT: movd %xmm1, %eax		; X86-SSE2-NEXT: paddw %xmm1, %xmm0
; X86-SSE2-NEXT: xorl $32768, %eax ## imm = 0x8000		; X86-SSE2-NEXT: movd %xmm0, %eax
; X86-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax		; X86-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax
; X86-SSE2-NEXT: retl		; X86-SSE2-NEXT: retl
;		;
; X86-SSE42-LABEL: test_reduce_v16i16:		; X86-SSE42-LABEL: test_reduce_v16i16:
; X86-SSE42: ## %bb.0:		; X86-SSE42: ## %bb.0:
; X86-SSE42-NEXT: pmaxuw %xmm1, %xmm0		; X86-SSE42-NEXT: pmaxuw %xmm1, %xmm0
; X86-SSE42-NEXT: pcmpeqd %xmm1, %xmm1		; X86-SSE42-NEXT: pcmpeqd %xmm1, %xmm1
; X86-SSE42-NEXT: pxor %xmm0, %xmm1		; X86-SSE42-NEXT: pxor %xmm0, %xmm1
Show All 26 Lines
; X86-AVX2-NEXT: vmovd %xmm0, %eax		; X86-AVX2-NEXT: vmovd %xmm0, %eax
; X86-AVX2-NEXT: notl %eax		; X86-AVX2-NEXT: notl %eax
; X86-AVX2-NEXT: ## kill: def $ax killed $ax killed $eax		; X86-AVX2-NEXT: ## kill: def $ax killed $ax killed $eax
; X86-AVX2-NEXT: vzeroupper		; X86-AVX2-NEXT: vzeroupper
; X86-AVX2-NEXT: retl		; X86-AVX2-NEXT: retl
;		;
; X64-SSE2-LABEL: test_reduce_v16i16:		; X64-SSE2-LABEL: test_reduce_v16i16:
; X64-SSE2: ## %bb.0:		; X64-SSE2: ## %bb.0:
; X64-SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; X64-SSE2-NEXT: psubusw %xmm0, %xmm1
; X64-SSE2-NEXT: pxor %xmm2, %xmm1		; X64-SSE2-NEXT: paddw %xmm0, %xmm1
; X64-SSE2-NEXT: pxor %xmm2, %xmm0		; X64-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[2,3,2,3]
; X64-SSE2-NEXT: pmaxsw %xmm1, %xmm0		; X64-SSE2-NEXT: psubusw %xmm1, %xmm0
; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; X64-SSE2-NEXT: paddw %xmm1, %xmm0
; X64-SSE2-NEXT: pmaxsw %xmm0, %xmm1		; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
; X64-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; X64-SSE2-NEXT: psubusw %xmm0, %xmm1
; X64-SSE2-NEXT: pmaxsw %xmm1, %xmm0		; X64-SSE2-NEXT: paddw %xmm0, %xmm1
; X64-SSE2-NEXT: movdqa %xmm0, %xmm1		; X64-SSE2-NEXT: movdqa %xmm1, %xmm0
; X64-SSE2-NEXT: psrld $16, %xmm1		; X64-SSE2-NEXT: psrld $16, %xmm0
; X64-SSE2-NEXT: pmaxsw %xmm0, %xmm1		; X64-SSE2-NEXT: psubusw %xmm1, %xmm0
; X64-SSE2-NEXT: movd %xmm1, %eax		; X64-SSE2-NEXT: paddw %xmm1, %xmm0
; X64-SSE2-NEXT: xorl $32768, %eax ## imm = 0x8000		; X64-SSE2-NEXT: movd %xmm0, %eax
; X64-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax		; X64-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax
; X64-SSE2-NEXT: retq		; X64-SSE2-NEXT: retq
;		;
; X64-SSE42-LABEL: test_reduce_v16i16:		; X64-SSE42-LABEL: test_reduce_v16i16:
; X64-SSE42: ## %bb.0:		; X64-SSE42: ## %bb.0:
; X64-SSE42-NEXT: pmaxuw %xmm1, %xmm0		; X64-SSE42-NEXT: pmaxuw %xmm1, %xmm0
; X64-SSE42-NEXT: pcmpeqd %xmm1, %xmm1		; X64-SSE42-NEXT: pcmpeqd %xmm1, %xmm1
; X64-SSE42-NEXT: pxor %xmm0, %xmm1		; X64-SSE42-NEXT: pxor %xmm0, %xmm1
▲ Show 20 Lines • Show All 734 Lines • ▼ Show 20 Lines	; X64-AVX512-NEXT: retq
%12 = select <16 x i1> %11, <16 x i32> %9, <16 x i32> %10		%12 = select <16 x i1> %11, <16 x i32> %9, <16 x i32> %10
%13 = extractelement <16 x i32> %12, i32 0		%13 = extractelement <16 x i32> %12, i32 0
ret i32 %13		ret i32 %13
}		}

define i16 @test_reduce_v32i16(<32 x i16> %a0) {		define i16 @test_reduce_v32i16(<32 x i16> %a0) {
; X86-SSE2-LABEL: test_reduce_v32i16:		; X86-SSE2-LABEL: test_reduce_v32i16:
; X86-SSE2: ## %bb.0:		; X86-SSE2: ## %bb.0:
; X86-SSE2-NEXT: movdqa {{.*#+}} xmm4 = [32768,32768,32768,32768,32768,32768,32768,32768]		; X86-SSE2-NEXT: psubusw %xmm0, %xmm2
; X86-SSE2-NEXT: pxor %xmm4, %xmm3		; X86-SSE2-NEXT: paddw %xmm0, %xmm2
; X86-SSE2-NEXT: pxor %xmm4, %xmm1		; X86-SSE2-NEXT: psubusw %xmm1, %xmm3
; X86-SSE2-NEXT: pmaxsw %xmm3, %xmm1		; X86-SSE2-NEXT: paddw %xmm1, %xmm3
; X86-SSE2-NEXT: pxor %xmm4, %xmm2		; X86-SSE2-NEXT: psubusw %xmm2, %xmm3
; X86-SSE2-NEXT: pmaxsw %xmm1, %xmm2		; X86-SSE2-NEXT: paddw %xmm2, %xmm3
; X86-SSE2-NEXT: pxor %xmm4, %xmm0		; X86-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm3[2,3,2,3]
; X86-SSE2-NEXT: pmaxsw %xmm2, %xmm0		; X86-SSE2-NEXT: psubusw %xmm3, %xmm0
; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; X86-SSE2-NEXT: paddw %xmm3, %xmm0
; X86-SSE2-NEXT: pmaxsw %xmm0, %xmm1		; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
; X86-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; X86-SSE2-NEXT: psubusw %xmm0, %xmm1
; X86-SSE2-NEXT: pmaxsw %xmm1, %xmm0		; X86-SSE2-NEXT: paddw %xmm0, %xmm1
; X86-SSE2-NEXT: movdqa %xmm0, %xmm1		; X86-SSE2-NEXT: movdqa %xmm1, %xmm0
; X86-SSE2-NEXT: psrld $16, %xmm1		; X86-SSE2-NEXT: psrld $16, %xmm0
; X86-SSE2-NEXT: pmaxsw %xmm0, %xmm1		; X86-SSE2-NEXT: psubusw %xmm1, %xmm0
; X86-SSE2-NEXT: movd %xmm1, %eax		; X86-SSE2-NEXT: paddw %xmm1, %xmm0
; X86-SSE2-NEXT: xorl $32768, %eax ## imm = 0x8000		; X86-SSE2-NEXT: movd %xmm0, %eax
; X86-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax		; X86-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax
; X86-SSE2-NEXT: retl		; X86-SSE2-NEXT: retl
;		;
; X86-SSE42-LABEL: test_reduce_v32i16:		; X86-SSE42-LABEL: test_reduce_v32i16:
; X86-SSE42: ## %bb.0:		; X86-SSE42: ## %bb.0:
; X86-SSE42-NEXT: pmaxuw %xmm3, %xmm1		; X86-SSE42-NEXT: pmaxuw %xmm3, %xmm1
; X86-SSE42-NEXT: pmaxuw %xmm2, %xmm1		; X86-SSE42-NEXT: pmaxuw %xmm2, %xmm1
; X86-SSE42-NEXT: pmaxuw %xmm0, %xmm1		; X86-SSE42-NEXT: pmaxuw %xmm0, %xmm1
Show All 32 Lines
; X86-AVX2-NEXT: vmovd %xmm0, %eax		; X86-AVX2-NEXT: vmovd %xmm0, %eax
; X86-AVX2-NEXT: notl %eax		; X86-AVX2-NEXT: notl %eax
; X86-AVX2-NEXT: ## kill: def $ax killed $ax killed $eax		; X86-AVX2-NEXT: ## kill: def $ax killed $ax killed $eax
; X86-AVX2-NEXT: vzeroupper		; X86-AVX2-NEXT: vzeroupper
; X86-AVX2-NEXT: retl		; X86-AVX2-NEXT: retl
;		;
; X64-SSE2-LABEL: test_reduce_v32i16:		; X64-SSE2-LABEL: test_reduce_v32i16:
; X64-SSE2: ## %bb.0:		; X64-SSE2: ## %bb.0:
; X64-SSE2-NEXT: movdqa {{.*#+}} xmm4 = [32768,32768,32768,32768,32768,32768,32768,32768]		; X64-SSE2-NEXT: psubusw %xmm0, %xmm2
; X64-SSE2-NEXT: pxor %xmm4, %xmm3		; X64-SSE2-NEXT: paddw %xmm0, %xmm2
; X64-SSE2-NEXT: pxor %xmm4, %xmm1		; X64-SSE2-NEXT: psubusw %xmm1, %xmm3
; X64-SSE2-NEXT: pmaxsw %xmm3, %xmm1		; X64-SSE2-NEXT: paddw %xmm1, %xmm3
; X64-SSE2-NEXT: pxor %xmm4, %xmm2		; X64-SSE2-NEXT: psubusw %xmm2, %xmm3
; X64-SSE2-NEXT: pmaxsw %xmm1, %xmm2		; X64-SSE2-NEXT: paddw %xmm2, %xmm3
; X64-SSE2-NEXT: pxor %xmm4, %xmm0		; X64-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm3[2,3,2,3]
; X64-SSE2-NEXT: pmaxsw %xmm2, %xmm0		; X64-SSE2-NEXT: psubusw %xmm3, %xmm0
; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; X64-SSE2-NEXT: paddw %xmm3, %xmm0
; X64-SSE2-NEXT: pmaxsw %xmm0, %xmm1		; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
; X64-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; X64-SSE2-NEXT: psubusw %xmm0, %xmm1
; X64-SSE2-NEXT: pmaxsw %xmm1, %xmm0		; X64-SSE2-NEXT: paddw %xmm0, %xmm1
; X64-SSE2-NEXT: movdqa %xmm0, %xmm1		; X64-SSE2-NEXT: movdqa %xmm1, %xmm0
; X64-SSE2-NEXT: psrld $16, %xmm1		; X64-SSE2-NEXT: psrld $16, %xmm0
; X64-SSE2-NEXT: pmaxsw %xmm0, %xmm1		; X64-SSE2-NEXT: psubusw %xmm1, %xmm0
; X64-SSE2-NEXT: movd %xmm1, %eax		; X64-SSE2-NEXT: paddw %xmm1, %xmm0
; X64-SSE2-NEXT: xorl $32768, %eax ## imm = 0x8000		; X64-SSE2-NEXT: movd %xmm0, %eax
; X64-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax		; X64-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax
; X64-SSE2-NEXT: retq		; X64-SSE2-NEXT: retq
;		;
; X64-SSE42-LABEL: test_reduce_v32i16:		; X64-SSE42-LABEL: test_reduce_v32i16:
; X64-SSE42: ## %bb.0:		; X64-SSE42: ## %bb.0:
; X64-SSE42-NEXT: pmaxuw %xmm3, %xmm1		; X64-SSE42-NEXT: pmaxuw %xmm3, %xmm1
; X64-SSE42-NEXT: pmaxuw %xmm2, %xmm1		; X64-SSE42-NEXT: pmaxuw %xmm2, %xmm1
; X64-SSE42-NEXT: pmaxuw %xmm0, %xmm1		; X64-SSE42-NEXT: pmaxuw %xmm0, %xmm1
▲ Show 20 Lines • Show All 246 Lines • ▼ Show 20 Lines
;		;
; Partial Vector Reductions		; Partial Vector Reductions
;		;

define i16 @test_reduce_v16i16_v8i16(<16 x i16> %a0) {		define i16 @test_reduce_v16i16_v8i16(<16 x i16> %a0) {
; X86-SSE2-LABEL: test_reduce_v16i16_v8i16:		; X86-SSE2-LABEL: test_reduce_v16i16_v8i16:
; X86-SSE2: ## %bb.0:		; X86-SSE2: ## %bb.0:
; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
; X86-SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; X86-SSE2-NEXT: psubusw %xmm0, %xmm1
; X86-SSE2-NEXT: pxor %xmm2, %xmm0		; X86-SSE2-NEXT: paddw %xmm0, %xmm1
; X86-SSE2-NEXT: pxor %xmm2, %xmm1
; X86-SSE2-NEXT: pmaxsw %xmm0, %xmm1
; X86-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; X86-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]
; X86-SSE2-NEXT: pmaxsw %xmm1, %xmm0		; X86-SSE2-NEXT: psubusw %xmm1, %xmm0
		; X86-SSE2-NEXT: paddw %xmm1, %xmm0
; X86-SSE2-NEXT: movdqa %xmm0, %xmm1		; X86-SSE2-NEXT: movdqa %xmm0, %xmm1
; X86-SSE2-NEXT: psrld $16, %xmm1		; X86-SSE2-NEXT: psrld $16, %xmm1
; X86-SSE2-NEXT: pmaxsw %xmm0, %xmm1		; X86-SSE2-NEXT: psubusw %xmm0, %xmm1
		; X86-SSE2-NEXT: paddw %xmm0, %xmm1
; X86-SSE2-NEXT: movd %xmm1, %eax		; X86-SSE2-NEXT: movd %xmm1, %eax
; X86-SSE2-NEXT: xorl $32768, %eax ## imm = 0x8000
; X86-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax		; X86-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax
; X86-SSE2-NEXT: retl		; X86-SSE2-NEXT: retl
;		;
; X86-SSE42-LABEL: test_reduce_v16i16_v8i16:		; X86-SSE42-LABEL: test_reduce_v16i16_v8i16:
; X86-SSE42: ## %bb.0:		; X86-SSE42: ## %bb.0:
; X86-SSE42-NEXT: pcmpeqd %xmm1, %xmm1		; X86-SSE42-NEXT: pcmpeqd %xmm1, %xmm1
; X86-SSE42-NEXT: pxor %xmm0, %xmm1		; X86-SSE42-NEXT: pxor %xmm0, %xmm1
; X86-SSE42-NEXT: phminposuw %xmm1, %xmm0		; X86-SSE42-NEXT: phminposuw %xmm1, %xmm0
Show All 11 Lines
; X86-AVX-NEXT: notl %eax		; X86-AVX-NEXT: notl %eax
; X86-AVX-NEXT: ## kill: def $ax killed $ax killed $eax		; X86-AVX-NEXT: ## kill: def $ax killed $ax killed $eax
; X86-AVX-NEXT: vzeroupper		; X86-AVX-NEXT: vzeroupper
; X86-AVX-NEXT: retl		; X86-AVX-NEXT: retl
;		;
; X64-SSE2-LABEL: test_reduce_v16i16_v8i16:		; X64-SSE2-LABEL: test_reduce_v16i16_v8i16:
; X64-SSE2: ## %bb.0:		; X64-SSE2: ## %bb.0:
; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
; X64-SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; X64-SSE2-NEXT: psubusw %xmm0, %xmm1
; X64-SSE2-NEXT: pxor %xmm2, %xmm0		; X64-SSE2-NEXT: paddw %xmm0, %xmm1
; X64-SSE2-NEXT: pxor %xmm2, %xmm1
; X64-SSE2-NEXT: pmaxsw %xmm0, %xmm1
; X64-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; X64-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]
; X64-SSE2-NEXT: pmaxsw %xmm1, %xmm0		; X64-SSE2-NEXT: psubusw %xmm1, %xmm0
		; X64-SSE2-NEXT: paddw %xmm1, %xmm0
; X64-SSE2-NEXT: movdqa %xmm0, %xmm1		; X64-SSE2-NEXT: movdqa %xmm0, %xmm1
; X64-SSE2-NEXT: psrld $16, %xmm1		; X64-SSE2-NEXT: psrld $16, %xmm1
; X64-SSE2-NEXT: pmaxsw %xmm0, %xmm1		; X64-SSE2-NEXT: psubusw %xmm0, %xmm1
		; X64-SSE2-NEXT: paddw %xmm0, %xmm1
; X64-SSE2-NEXT: movd %xmm1, %eax		; X64-SSE2-NEXT: movd %xmm1, %eax
; X64-SSE2-NEXT: xorl $32768, %eax ## imm = 0x8000
; X64-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax		; X64-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax
; X64-SSE2-NEXT: retq		; X64-SSE2-NEXT: retq
;		;
; X64-SSE42-LABEL: test_reduce_v16i16_v8i16:		; X64-SSE42-LABEL: test_reduce_v16i16_v8i16:
; X64-SSE42: ## %bb.0:		; X64-SSE42: ## %bb.0:
; X64-SSE42-NEXT: pcmpeqd %xmm1, %xmm1		; X64-SSE42-NEXT: pcmpeqd %xmm1, %xmm1
; X64-SSE42-NEXT: pxor %xmm0, %xmm1		; X64-SSE42-NEXT: pxor %xmm0, %xmm1
; X64-SSE42-NEXT: phminposuw %xmm1, %xmm0		; X64-SSE42-NEXT: phminposuw %xmm1, %xmm0
▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines	; X64-AVX512-NEXT: retq
%10 = extractelement <16 x i16> %9, i32 0		%10 = extractelement <16 x i16> %9, i32 0
ret i16 %10		ret i16 %10
}		}

define i16 @test_reduce_v32i16_v8i16(<32 x i16> %a0) {		define i16 @test_reduce_v32i16_v8i16(<32 x i16> %a0) {
; X86-SSE2-LABEL: test_reduce_v32i16_v8i16:		; X86-SSE2-LABEL: test_reduce_v32i16_v8i16:
; X86-SSE2: ## %bb.0:		; X86-SSE2: ## %bb.0:
; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
; X86-SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; X86-SSE2-NEXT: psubusw %xmm0, %xmm1
; X86-SSE2-NEXT: pxor %xmm2, %xmm0		; X86-SSE2-NEXT: paddw %xmm0, %xmm1
; X86-SSE2-NEXT: pxor %xmm2, %xmm1
; X86-SSE2-NEXT: pmaxsw %xmm0, %xmm1
; X86-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; X86-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]
; X86-SSE2-NEXT: pmaxsw %xmm1, %xmm0		; X86-SSE2-NEXT: psubusw %xmm1, %xmm0
		; X86-SSE2-NEXT: paddw %xmm1, %xmm0
; X86-SSE2-NEXT: movdqa %xmm0, %xmm1		; X86-SSE2-NEXT: movdqa %xmm0, %xmm1
; X86-SSE2-NEXT: psrld $16, %xmm1		; X86-SSE2-NEXT: psrld $16, %xmm1
; X86-SSE2-NEXT: pmaxsw %xmm0, %xmm1		; X86-SSE2-NEXT: psubusw %xmm0, %xmm1
		; X86-SSE2-NEXT: paddw %xmm0, %xmm1
; X86-SSE2-NEXT: movd %xmm1, %eax		; X86-SSE2-NEXT: movd %xmm1, %eax
; X86-SSE2-NEXT: xorl $32768, %eax ## imm = 0x8000
; X86-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax		; X86-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax
; X86-SSE2-NEXT: retl		; X86-SSE2-NEXT: retl
;		;
; X86-SSE42-LABEL: test_reduce_v32i16_v8i16:		; X86-SSE42-LABEL: test_reduce_v32i16_v8i16:
; X86-SSE42: ## %bb.0:		; X86-SSE42: ## %bb.0:
; X86-SSE42-NEXT: pcmpeqd %xmm1, %xmm1		; X86-SSE42-NEXT: pcmpeqd %xmm1, %xmm1
; X86-SSE42-NEXT: pxor %xmm0, %xmm1		; X86-SSE42-NEXT: pxor %xmm0, %xmm1
; X86-SSE42-NEXT: phminposuw %xmm1, %xmm0		; X86-SSE42-NEXT: phminposuw %xmm1, %xmm0
Show All 11 Lines
; X86-AVX-NEXT: notl %eax		; X86-AVX-NEXT: notl %eax
; X86-AVX-NEXT: ## kill: def $ax killed $ax killed $eax		; X86-AVX-NEXT: ## kill: def $ax killed $ax killed $eax
; X86-AVX-NEXT: vzeroupper		; X86-AVX-NEXT: vzeroupper
; X86-AVX-NEXT: retl		; X86-AVX-NEXT: retl
;		;
; X64-SSE2-LABEL: test_reduce_v32i16_v8i16:		; X64-SSE2-LABEL: test_reduce_v32i16_v8i16:
; X64-SSE2: ## %bb.0:		; X64-SSE2: ## %bb.0:
; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
; X64-SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; X64-SSE2-NEXT: psubusw %xmm0, %xmm1
; X64-SSE2-NEXT: pxor %xmm2, %xmm0		; X64-SSE2-NEXT: paddw %xmm0, %xmm1
; X64-SSE2-NEXT: pxor %xmm2, %xmm1
; X64-SSE2-NEXT: pmaxsw %xmm0, %xmm1
; X64-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; X64-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]
; X64-SSE2-NEXT: pmaxsw %xmm1, %xmm0		; X64-SSE2-NEXT: psubusw %xmm1, %xmm0
		; X64-SSE2-NEXT: paddw %xmm1, %xmm0
; X64-SSE2-NEXT: movdqa %xmm0, %xmm1		; X64-SSE2-NEXT: movdqa %xmm0, %xmm1
; X64-SSE2-NEXT: psrld $16, %xmm1		; X64-SSE2-NEXT: psrld $16, %xmm1
; X64-SSE2-NEXT: pmaxsw %xmm0, %xmm1		; X64-SSE2-NEXT: psubusw %xmm0, %xmm1
		; X64-SSE2-NEXT: paddw %xmm0, %xmm1
; X64-SSE2-NEXT: movd %xmm1, %eax		; X64-SSE2-NEXT: movd %xmm1, %eax
; X64-SSE2-NEXT: xorl $32768, %eax ## imm = 0x8000
; X64-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax		; X64-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax
; X64-SSE2-NEXT: retq		; X64-SSE2-NEXT: retq
;		;
; X64-SSE42-LABEL: test_reduce_v32i16_v8i16:		; X64-SSE42-LABEL: test_reduce_v32i16_v8i16:
; X64-SSE42: ## %bb.0:		; X64-SSE42: ## %bb.0:
; X64-SSE42-NEXT: pcmpeqd %xmm1, %xmm1		; X64-SSE42-NEXT: pcmpeqd %xmm1, %xmm1
; X64-SSE42-NEXT: pxor %xmm0, %xmm1		; X64-SSE42-NEXT: pxor %xmm0, %xmm1
; X64-SSE42-NEXT: phminposuw %xmm1, %xmm0		; X64-SSE42-NEXT: phminposuw %xmm1, %xmm0
▲ Show 20 Lines • Show All 298 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/horizontal-reduce-umin.ll

Show First 20 Lines • Show All 235 Lines • ▼ Show 20 Lines	; X64-AVX-NEXT: retq
%7 = extractelement <4 x i32> %6, i32 0		%7 = extractelement <4 x i32> %6, i32 0
ret i32 %7		ret i32 %7
}		}

define i16 @test_reduce_v8i16(<8 x i16> %a0) {		define i16 @test_reduce_v8i16(<8 x i16> %a0) {
; X86-SSE2-LABEL: test_reduce_v8i16:		; X86-SSE2-LABEL: test_reduce_v8i16:
; X86-SSE2: ## %bb.0:		; X86-SSE2: ## %bb.0:
; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
; X86-SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; X86-SSE2-NEXT: movdqa %xmm0, %xmm2
; X86-SSE2-NEXT: pxor %xmm2, %xmm0		; X86-SSE2-NEXT: psubusw %xmm1, %xmm2
; X86-SSE2-NEXT: pxor %xmm2, %xmm1		; X86-SSE2-NEXT: psubw %xmm2, %xmm0
; X86-SSE2-NEXT: pminsw %xmm0, %xmm1		; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
; X86-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; X86-SSE2-NEXT: movdqa %xmm0, %xmm2
; X86-SSE2-NEXT: pminsw %xmm1, %xmm0		; X86-SSE2-NEXT: psubusw %xmm1, %xmm2
		; X86-SSE2-NEXT: psubw %xmm2, %xmm0
; X86-SSE2-NEXT: movdqa %xmm0, %xmm1		; X86-SSE2-NEXT: movdqa %xmm0, %xmm1
; X86-SSE2-NEXT: psrld $16, %xmm1		; X86-SSE2-NEXT: psrld $16, %xmm1
; X86-SSE2-NEXT: pminsw %xmm0, %xmm1		; X86-SSE2-NEXT: movdqa %xmm0, %xmm2
; X86-SSE2-NEXT: movd %xmm1, %eax		; X86-SSE2-NEXT: psubusw %xmm1, %xmm2
; X86-SSE2-NEXT: xorl $32768, %eax ## imm = 0x8000		; X86-SSE2-NEXT: psubw %xmm2, %xmm0
		; X86-SSE2-NEXT: movd %xmm0, %eax
; X86-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax		; X86-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax
; X86-SSE2-NEXT: retl		; X86-SSE2-NEXT: retl
;		;
; X86-SSE42-LABEL: test_reduce_v8i16:		; X86-SSE42-LABEL: test_reduce_v8i16:
; X86-SSE42: ## %bb.0:		; X86-SSE42: ## %bb.0:
; X86-SSE42-NEXT: phminposuw %xmm0, %xmm0		; X86-SSE42-NEXT: phminposuw %xmm0, %xmm0
; X86-SSE42-NEXT: movd %xmm0, %eax		; X86-SSE42-NEXT: movd %xmm0, %eax
; X86-SSE42-NEXT: ## kill: def $ax killed $ax killed $eax		; X86-SSE42-NEXT: ## kill: def $ax killed $ax killed $eax
; X86-SSE42-NEXT: retl		; X86-SSE42-NEXT: retl
;		;
; X86-AVX-LABEL: test_reduce_v8i16:		; X86-AVX-LABEL: test_reduce_v8i16:
; X86-AVX: ## %bb.0:		; X86-AVX: ## %bb.0:
; X86-AVX-NEXT: vphminposuw %xmm0, %xmm0		; X86-AVX-NEXT: vphminposuw %xmm0, %xmm0
; X86-AVX-NEXT: vmovd %xmm0, %eax		; X86-AVX-NEXT: vmovd %xmm0, %eax
; X86-AVX-NEXT: ## kill: def $ax killed $ax killed $eax		; X86-AVX-NEXT: ## kill: def $ax killed $ax killed $eax
; X86-AVX-NEXT: retl		; X86-AVX-NEXT: retl
;		;
; X64-SSE2-LABEL: test_reduce_v8i16:		; X64-SSE2-LABEL: test_reduce_v8i16:
; X64-SSE2: ## %bb.0:		; X64-SSE2: ## %bb.0:
; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
; X64-SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; X64-SSE2-NEXT: movdqa %xmm0, %xmm2
; X64-SSE2-NEXT: pxor %xmm2, %xmm0		; X64-SSE2-NEXT: psubusw %xmm1, %xmm2
; X64-SSE2-NEXT: pxor %xmm2, %xmm1		; X64-SSE2-NEXT: psubw %xmm2, %xmm0
; X64-SSE2-NEXT: pminsw %xmm0, %xmm1		; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
; X64-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; X64-SSE2-NEXT: movdqa %xmm0, %xmm2
; X64-SSE2-NEXT: pminsw %xmm1, %xmm0		; X64-SSE2-NEXT: psubusw %xmm1, %xmm2
		; X64-SSE2-NEXT: psubw %xmm2, %xmm0
; X64-SSE2-NEXT: movdqa %xmm0, %xmm1		; X64-SSE2-NEXT: movdqa %xmm0, %xmm1
; X64-SSE2-NEXT: psrld $16, %xmm1		; X64-SSE2-NEXT: psrld $16, %xmm1
; X64-SSE2-NEXT: pminsw %xmm0, %xmm1		; X64-SSE2-NEXT: movdqa %xmm0, %xmm2
; X64-SSE2-NEXT: movd %xmm1, %eax		; X64-SSE2-NEXT: psubusw %xmm1, %xmm2
; X64-SSE2-NEXT: xorl $32768, %eax ## imm = 0x8000		; X64-SSE2-NEXT: psubw %xmm2, %xmm0
		; X64-SSE2-NEXT: movd %xmm0, %eax
; X64-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax		; X64-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax
; X64-SSE2-NEXT: retq		; X64-SSE2-NEXT: retq
;		;
; X64-SSE42-LABEL: test_reduce_v8i16:		; X64-SSE42-LABEL: test_reduce_v8i16:
; X64-SSE42: ## %bb.0:		; X64-SSE42: ## %bb.0:
; X64-SSE42-NEXT: phminposuw %xmm0, %xmm0		; X64-SSE42-NEXT: phminposuw %xmm0, %xmm0
; X64-SSE42-NEXT: movd %xmm0, %eax		; X64-SSE42-NEXT: movd %xmm0, %eax
; X64-SSE42-NEXT: ## kill: def $ax killed $ax killed $eax		; X64-SSE42-NEXT: ## kill: def $ax killed $ax killed $eax
▲ Show 20 Lines • Show All 467 Lines • ▼ Show 20 Lines	; X64-AVX512-NEXT: retq
%9 = select <8 x i1> %8, <8 x i32> %6, <8 x i32> %7		%9 = select <8 x i1> %8, <8 x i32> %6, <8 x i32> %7
%10 = extractelement <8 x i32> %9, i32 0		%10 = extractelement <8 x i32> %9, i32 0
ret i32 %10		ret i32 %10
}		}

define i16 @test_reduce_v16i16(<16 x i16> %a0) {		define i16 @test_reduce_v16i16(<16 x i16> %a0) {
; X86-SSE2-LABEL: test_reduce_v16i16:		; X86-SSE2-LABEL: test_reduce_v16i16:
; X86-SSE2: ## %bb.0:		; X86-SSE2: ## %bb.0:
; X86-SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; X86-SSE2-NEXT: movdqa %xmm0, %xmm2
; X86-SSE2-NEXT: pxor %xmm2, %xmm1		; X86-SSE2-NEXT: psubusw %xmm1, %xmm2
; X86-SSE2-NEXT: pxor %xmm2, %xmm0		; X86-SSE2-NEXT: psubw %xmm2, %xmm0
; X86-SSE2-NEXT: pminsw %xmm1, %xmm0
; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
; X86-SSE2-NEXT: pminsw %xmm0, %xmm1		; X86-SSE2-NEXT: movdqa %xmm0, %xmm2
; X86-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; X86-SSE2-NEXT: psubusw %xmm1, %xmm2
; X86-SSE2-NEXT: pminsw %xmm1, %xmm0		; X86-SSE2-NEXT: psubw %xmm2, %xmm0
		; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
		; X86-SSE2-NEXT: movdqa %xmm0, %xmm2
		; X86-SSE2-NEXT: psubusw %xmm1, %xmm2
		; X86-SSE2-NEXT: psubw %xmm2, %xmm0
; X86-SSE2-NEXT: movdqa %xmm0, %xmm1		; X86-SSE2-NEXT: movdqa %xmm0, %xmm1
; X86-SSE2-NEXT: psrld $16, %xmm1		; X86-SSE2-NEXT: psrld $16, %xmm1
; X86-SSE2-NEXT: pminsw %xmm0, %xmm1		; X86-SSE2-NEXT: movdqa %xmm0, %xmm2
; X86-SSE2-NEXT: movd %xmm1, %eax		; X86-SSE2-NEXT: psubusw %xmm1, %xmm2
; X86-SSE2-NEXT: xorl $32768, %eax ## imm = 0x8000		; X86-SSE2-NEXT: psubw %xmm2, %xmm0
		; X86-SSE2-NEXT: movd %xmm0, %eax
; X86-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax		; X86-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax
; X86-SSE2-NEXT: retl		; X86-SSE2-NEXT: retl
;		;
; X86-SSE42-LABEL: test_reduce_v16i16:		; X86-SSE42-LABEL: test_reduce_v16i16:
; X86-SSE42: ## %bb.0:		; X86-SSE42: ## %bb.0:
; X86-SSE42-NEXT: pminuw %xmm1, %xmm0		; X86-SSE42-NEXT: pminuw %xmm1, %xmm0
; X86-SSE42-NEXT: phminposuw %xmm0, %xmm0		; X86-SSE42-NEXT: phminposuw %xmm0, %xmm0
; X86-SSE42-NEXT: movd %xmm0, %eax		; X86-SSE42-NEXT: movd %xmm0, %eax
Show All 17 Lines
; X86-AVX2-NEXT: vphminposuw %xmm0, %xmm0		; X86-AVX2-NEXT: vphminposuw %xmm0, %xmm0
; X86-AVX2-NEXT: vmovd %xmm0, %eax		; X86-AVX2-NEXT: vmovd %xmm0, %eax
; X86-AVX2-NEXT: ## kill: def $ax killed $ax killed $eax		; X86-AVX2-NEXT: ## kill: def $ax killed $ax killed $eax
; X86-AVX2-NEXT: vzeroupper		; X86-AVX2-NEXT: vzeroupper
; X86-AVX2-NEXT: retl		; X86-AVX2-NEXT: retl
;		;
; X64-SSE2-LABEL: test_reduce_v16i16:		; X64-SSE2-LABEL: test_reduce_v16i16:
; X64-SSE2: ## %bb.0:		; X64-SSE2: ## %bb.0:
; X64-SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; X64-SSE2-NEXT: movdqa %xmm0, %xmm2
; X64-SSE2-NEXT: pxor %xmm2, %xmm1		; X64-SSE2-NEXT: psubusw %xmm1, %xmm2
; X64-SSE2-NEXT: pxor %xmm2, %xmm0		; X64-SSE2-NEXT: psubw %xmm2, %xmm0
; X64-SSE2-NEXT: pminsw %xmm1, %xmm0
; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
; X64-SSE2-NEXT: pminsw %xmm0, %xmm1		; X64-SSE2-NEXT: movdqa %xmm0, %xmm2
; X64-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; X64-SSE2-NEXT: psubusw %xmm1, %xmm2
; X64-SSE2-NEXT: pminsw %xmm1, %xmm0		; X64-SSE2-NEXT: psubw %xmm2, %xmm0
		; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
		; X64-SSE2-NEXT: movdqa %xmm0, %xmm2
		; X64-SSE2-NEXT: psubusw %xmm1, %xmm2
		; X64-SSE2-NEXT: psubw %xmm2, %xmm0
; X64-SSE2-NEXT: movdqa %xmm0, %xmm1		; X64-SSE2-NEXT: movdqa %xmm0, %xmm1
; X64-SSE2-NEXT: psrld $16, %xmm1		; X64-SSE2-NEXT: psrld $16, %xmm1
; X64-SSE2-NEXT: pminsw %xmm0, %xmm1		; X64-SSE2-NEXT: movdqa %xmm0, %xmm2
; X64-SSE2-NEXT: movd %xmm1, %eax		; X64-SSE2-NEXT: psubusw %xmm1, %xmm2
; X64-SSE2-NEXT: xorl $32768, %eax ## imm = 0x8000		; X64-SSE2-NEXT: psubw %xmm2, %xmm0
		; X64-SSE2-NEXT: movd %xmm0, %eax
; X64-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax		; X64-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax
; X64-SSE2-NEXT: retq		; X64-SSE2-NEXT: retq
;		;
; X64-SSE42-LABEL: test_reduce_v16i16:		; X64-SSE42-LABEL: test_reduce_v16i16:
; X64-SSE42: ## %bb.0:		; X64-SSE42: ## %bb.0:
; X64-SSE42-NEXT: pminuw %xmm1, %xmm0		; X64-SSE42-NEXT: pminuw %xmm1, %xmm0
; X64-SSE42-NEXT: phminposuw %xmm0, %xmm0		; X64-SSE42-NEXT: phminposuw %xmm0, %xmm0
; X64-SSE42-NEXT: movd %xmm0, %eax		; X64-SSE42-NEXT: movd %xmm0, %eax
▲ Show 20 Lines • Show All 707 Lines • ▼ Show 20 Lines	; X64-AVX512-NEXT: retq
%12 = select <16 x i1> %11, <16 x i32> %9, <16 x i32> %10		%12 = select <16 x i1> %11, <16 x i32> %9, <16 x i32> %10
%13 = extractelement <16 x i32> %12, i32 0		%13 = extractelement <16 x i32> %12, i32 0
ret i32 %13		ret i32 %13
}		}

define i16 @test_reduce_v32i16(<32 x i16> %a0) {		define i16 @test_reduce_v32i16(<32 x i16> %a0) {
; X86-SSE2-LABEL: test_reduce_v32i16:		; X86-SSE2-LABEL: test_reduce_v32i16:
; X86-SSE2: ## %bb.0:		; X86-SSE2: ## %bb.0:
; X86-SSE2-NEXT: movdqa {{.*#+}} xmm4 = [32768,32768,32768,32768,32768,32768,32768,32768]		; X86-SSE2-NEXT: movdqa %xmm1, %xmm4
; X86-SSE2-NEXT: pxor %xmm4, %xmm3		; X86-SSE2-NEXT: psubusw %xmm3, %xmm4
; X86-SSE2-NEXT: pxor %xmm4, %xmm1		; X86-SSE2-NEXT: psubw %xmm4, %xmm1
; X86-SSE2-NEXT: pminsw %xmm3, %xmm1		; X86-SSE2-NEXT: movdqa %xmm0, %xmm3
; X86-SSE2-NEXT: pxor %xmm4, %xmm2		; X86-SSE2-NEXT: psubusw %xmm2, %xmm3
; X86-SSE2-NEXT: pminsw %xmm1, %xmm2		; X86-SSE2-NEXT: psubw %xmm3, %xmm0
; X86-SSE2-NEXT: pxor %xmm4, %xmm0		; X86-SSE2-NEXT: movdqa %xmm0, %xmm2
; X86-SSE2-NEXT: pminsw %xmm2, %xmm0		; X86-SSE2-NEXT: psubusw %xmm1, %xmm2
		; X86-SSE2-NEXT: psubw %xmm2, %xmm0
; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
; X86-SSE2-NEXT: pminsw %xmm0, %xmm1		; X86-SSE2-NEXT: movdqa %xmm0, %xmm2
; X86-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; X86-SSE2-NEXT: psubusw %xmm1, %xmm2
; X86-SSE2-NEXT: pminsw %xmm1, %xmm0		; X86-SSE2-NEXT: psubw %xmm2, %xmm0
		; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
		; X86-SSE2-NEXT: movdqa %xmm0, %xmm2
		; X86-SSE2-NEXT: psubusw %xmm1, %xmm2
		; X86-SSE2-NEXT: psubw %xmm2, %xmm0
; X86-SSE2-NEXT: movdqa %xmm0, %xmm1		; X86-SSE2-NEXT: movdqa %xmm0, %xmm1
; X86-SSE2-NEXT: psrld $16, %xmm1		; X86-SSE2-NEXT: psrld $16, %xmm1
; X86-SSE2-NEXT: pminsw %xmm0, %xmm1		; X86-SSE2-NEXT: movdqa %xmm0, %xmm2
; X86-SSE2-NEXT: movd %xmm1, %eax		; X86-SSE2-NEXT: psubusw %xmm1, %xmm2
; X86-SSE2-NEXT: xorl $32768, %eax ## imm = 0x8000		; X86-SSE2-NEXT: psubw %xmm2, %xmm0
		; X86-SSE2-NEXT: movd %xmm0, %eax
; X86-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax		; X86-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax
; X86-SSE2-NEXT: retl		; X86-SSE2-NEXT: retl
;		;
; X86-SSE42-LABEL: test_reduce_v32i16:		; X86-SSE42-LABEL: test_reduce_v32i16:
; X86-SSE42: ## %bb.0:		; X86-SSE42: ## %bb.0:
; X86-SSE42-NEXT: pminuw %xmm3, %xmm1		; X86-SSE42-NEXT: pminuw %xmm3, %xmm1
; X86-SSE42-NEXT: pminuw %xmm2, %xmm1		; X86-SSE42-NEXT: pminuw %xmm2, %xmm1
; X86-SSE42-NEXT: pminuw %xmm0, %xmm1		; X86-SSE42-NEXT: pminuw %xmm0, %xmm1
Show All 23 Lines
; X86-AVX2-NEXT: vphminposuw %xmm0, %xmm0		; X86-AVX2-NEXT: vphminposuw %xmm0, %xmm0
; X86-AVX2-NEXT: vmovd %xmm0, %eax		; X86-AVX2-NEXT: vmovd %xmm0, %eax
; X86-AVX2-NEXT: ## kill: def $ax killed $ax killed $eax		; X86-AVX2-NEXT: ## kill: def $ax killed $ax killed $eax
; X86-AVX2-NEXT: vzeroupper		; X86-AVX2-NEXT: vzeroupper
; X86-AVX2-NEXT: retl		; X86-AVX2-NEXT: retl
;		;
; X64-SSE2-LABEL: test_reduce_v32i16:		; X64-SSE2-LABEL: test_reduce_v32i16:
; X64-SSE2: ## %bb.0:		; X64-SSE2: ## %bb.0:
; X64-SSE2-NEXT: movdqa {{.*#+}} xmm4 = [32768,32768,32768,32768,32768,32768,32768,32768]		; X64-SSE2-NEXT: movdqa %xmm1, %xmm4
; X64-SSE2-NEXT: pxor %xmm4, %xmm3		; X64-SSE2-NEXT: psubusw %xmm3, %xmm4
; X64-SSE2-NEXT: pxor %xmm4, %xmm1		; X64-SSE2-NEXT: psubw %xmm4, %xmm1
; X64-SSE2-NEXT: pminsw %xmm3, %xmm1		; X64-SSE2-NEXT: movdqa %xmm0, %xmm3
; X64-SSE2-NEXT: pxor %xmm4, %xmm2		; X64-SSE2-NEXT: psubusw %xmm2, %xmm3
; X64-SSE2-NEXT: pminsw %xmm1, %xmm2		; X64-SSE2-NEXT: psubw %xmm3, %xmm0
; X64-SSE2-NEXT: pxor %xmm4, %xmm0		; X64-SSE2-NEXT: movdqa %xmm0, %xmm2
; X64-SSE2-NEXT: pminsw %xmm2, %xmm0		; X64-SSE2-NEXT: psubusw %xmm1, %xmm2
		; X64-SSE2-NEXT: psubw %xmm2, %xmm0
; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
; X64-SSE2-NEXT: pminsw %xmm0, %xmm1		; X64-SSE2-NEXT: movdqa %xmm0, %xmm2
; X64-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; X64-SSE2-NEXT: psubusw %xmm1, %xmm2
; X64-SSE2-NEXT: pminsw %xmm1, %xmm0		; X64-SSE2-NEXT: psubw %xmm2, %xmm0
		; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
		; X64-SSE2-NEXT: movdqa %xmm0, %xmm2
		; X64-SSE2-NEXT: psubusw %xmm1, %xmm2
		; X64-SSE2-NEXT: psubw %xmm2, %xmm0
; X64-SSE2-NEXT: movdqa %xmm0, %xmm1		; X64-SSE2-NEXT: movdqa %xmm0, %xmm1
; X64-SSE2-NEXT: psrld $16, %xmm1		; X64-SSE2-NEXT: psrld $16, %xmm1
; X64-SSE2-NEXT: pminsw %xmm0, %xmm1		; X64-SSE2-NEXT: movdqa %xmm0, %xmm2
; X64-SSE2-NEXT: movd %xmm1, %eax		; X64-SSE2-NEXT: psubusw %xmm1, %xmm2
; X64-SSE2-NEXT: xorl $32768, %eax ## imm = 0x8000		; X64-SSE2-NEXT: psubw %xmm2, %xmm0
		; X64-SSE2-NEXT: movd %xmm0, %eax
; X64-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax		; X64-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax
; X64-SSE2-NEXT: retq		; X64-SSE2-NEXT: retq
;		;
; X64-SSE42-LABEL: test_reduce_v32i16:		; X64-SSE42-LABEL: test_reduce_v32i16:
; X64-SSE42: ## %bb.0:		; X64-SSE42: ## %bb.0:
; X64-SSE42-NEXT: pminuw %xmm3, %xmm1		; X64-SSE42-NEXT: pminuw %xmm3, %xmm1
; X64-SSE42-NEXT: pminuw %xmm2, %xmm1		; X64-SSE42-NEXT: pminuw %xmm2, %xmm1
; X64-SSE42-NEXT: pminuw %xmm0, %xmm1		; X64-SSE42-NEXT: pminuw %xmm0, %xmm1
▲ Show 20 Lines • Show All 215 Lines • ▼ Show 20 Lines
;		;
; Partial Vector Reductions		; Partial Vector Reductions
;		;

define i16 @test_reduce_v16i16_v8i16(<16 x i16> %a0) {		define i16 @test_reduce_v16i16_v8i16(<16 x i16> %a0) {
; X86-SSE2-LABEL: test_reduce_v16i16_v8i16:		; X86-SSE2-LABEL: test_reduce_v16i16_v8i16:
; X86-SSE2: ## %bb.0:		; X86-SSE2: ## %bb.0:
; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
; X86-SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; X86-SSE2-NEXT: movdqa %xmm0, %xmm2
; X86-SSE2-NEXT: pxor %xmm2, %xmm0		; X86-SSE2-NEXT: psubusw %xmm1, %xmm2
; X86-SSE2-NEXT: pxor %xmm2, %xmm1		; X86-SSE2-NEXT: psubw %xmm2, %xmm0
; X86-SSE2-NEXT: pminsw %xmm0, %xmm1		; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
; X86-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; X86-SSE2-NEXT: movdqa %xmm0, %xmm2
; X86-SSE2-NEXT: pminsw %xmm1, %xmm0		; X86-SSE2-NEXT: psubusw %xmm1, %xmm2
		; X86-SSE2-NEXT: psubw %xmm2, %xmm0
; X86-SSE2-NEXT: movdqa %xmm0, %xmm1		; X86-SSE2-NEXT: movdqa %xmm0, %xmm1
; X86-SSE2-NEXT: psrld $16, %xmm1		; X86-SSE2-NEXT: psrld $16, %xmm1
; X86-SSE2-NEXT: pminsw %xmm0, %xmm1		; X86-SSE2-NEXT: movdqa %xmm0, %xmm2
; X86-SSE2-NEXT: movd %xmm1, %eax		; X86-SSE2-NEXT: psubusw %xmm1, %xmm2
; X86-SSE2-NEXT: xorl $32768, %eax ## imm = 0x8000		; X86-SSE2-NEXT: psubw %xmm2, %xmm0
		; X86-SSE2-NEXT: movd %xmm0, %eax
; X86-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax		; X86-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax
; X86-SSE2-NEXT: retl		; X86-SSE2-NEXT: retl
;		;
; X86-SSE42-LABEL: test_reduce_v16i16_v8i16:		; X86-SSE42-LABEL: test_reduce_v16i16_v8i16:
; X86-SSE42: ## %bb.0:		; X86-SSE42: ## %bb.0:
; X86-SSE42-NEXT: phminposuw %xmm0, %xmm0		; X86-SSE42-NEXT: phminposuw %xmm0, %xmm0
; X86-SSE42-NEXT: movd %xmm0, %eax		; X86-SSE42-NEXT: movd %xmm0, %eax
; X86-SSE42-NEXT: ## kill: def $ax killed $ax killed $eax		; X86-SSE42-NEXT: ## kill: def $ax killed $ax killed $eax
; X86-SSE42-NEXT: retl		; X86-SSE42-NEXT: retl
;		;
; X86-AVX-LABEL: test_reduce_v16i16_v8i16:		; X86-AVX-LABEL: test_reduce_v16i16_v8i16:
; X86-AVX: ## %bb.0:		; X86-AVX: ## %bb.0:
; X86-AVX-NEXT: vphminposuw %xmm0, %xmm0		; X86-AVX-NEXT: vphminposuw %xmm0, %xmm0
; X86-AVX-NEXT: vmovd %xmm0, %eax		; X86-AVX-NEXT: vmovd %xmm0, %eax
; X86-AVX-NEXT: ## kill: def $ax killed $ax killed $eax		; X86-AVX-NEXT: ## kill: def $ax killed $ax killed $eax
; X86-AVX-NEXT: vzeroupper		; X86-AVX-NEXT: vzeroupper
; X86-AVX-NEXT: retl		; X86-AVX-NEXT: retl
;		;
; X64-SSE2-LABEL: test_reduce_v16i16_v8i16:		; X64-SSE2-LABEL: test_reduce_v16i16_v8i16:
; X64-SSE2: ## %bb.0:		; X64-SSE2: ## %bb.0:
; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
; X64-SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; X64-SSE2-NEXT: movdqa %xmm0, %xmm2
; X64-SSE2-NEXT: pxor %xmm2, %xmm0		; X64-SSE2-NEXT: psubusw %xmm1, %xmm2
; X64-SSE2-NEXT: pxor %xmm2, %xmm1		; X64-SSE2-NEXT: psubw %xmm2, %xmm0
; X64-SSE2-NEXT: pminsw %xmm0, %xmm1		; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
; X64-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; X64-SSE2-NEXT: movdqa %xmm0, %xmm2
; X64-SSE2-NEXT: pminsw %xmm1, %xmm0		; X64-SSE2-NEXT: psubusw %xmm1, %xmm2
		; X64-SSE2-NEXT: psubw %xmm2, %xmm0
; X64-SSE2-NEXT: movdqa %xmm0, %xmm1		; X64-SSE2-NEXT: movdqa %xmm0, %xmm1
; X64-SSE2-NEXT: psrld $16, %xmm1		; X64-SSE2-NEXT: psrld $16, %xmm1
; X64-SSE2-NEXT: pminsw %xmm0, %xmm1		; X64-SSE2-NEXT: movdqa %xmm0, %xmm2
; X64-SSE2-NEXT: movd %xmm1, %eax		; X64-SSE2-NEXT: psubusw %xmm1, %xmm2
; X64-SSE2-NEXT: xorl $32768, %eax ## imm = 0x8000		; X64-SSE2-NEXT: psubw %xmm2, %xmm0
		; X64-SSE2-NEXT: movd %xmm0, %eax
; X64-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax		; X64-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax
; X64-SSE2-NEXT: retq		; X64-SSE2-NEXT: retq
;		;
; X64-SSE42-LABEL: test_reduce_v16i16_v8i16:		; X64-SSE42-LABEL: test_reduce_v16i16_v8i16:
; X64-SSE42: ## %bb.0:		; X64-SSE42: ## %bb.0:
; X64-SSE42-NEXT: phminposuw %xmm0, %xmm0		; X64-SSE42-NEXT: phminposuw %xmm0, %xmm0
; X64-SSE42-NEXT: movd %xmm0, %eax		; X64-SSE42-NEXT: movd %xmm0, %eax
; X64-SSE42-NEXT: ## kill: def $ax killed $ax killed $eax		; X64-SSE42-NEXT: ## kill: def $ax killed $ax killed $eax
Show All 18 Lines	; X64-AVX-NEXT: retq
%10 = extractelement <16 x i16> %9, i32 0		%10 = extractelement <16 x i16> %9, i32 0
ret i16 %10		ret i16 %10
}		}

define i16 @test_reduce_v32i16_v8i16(<32 x i16> %a0) {		define i16 @test_reduce_v32i16_v8i16(<32 x i16> %a0) {
; X86-SSE2-LABEL: test_reduce_v32i16_v8i16:		; X86-SSE2-LABEL: test_reduce_v32i16_v8i16:
; X86-SSE2: ## %bb.0:		; X86-SSE2: ## %bb.0:
; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
; X86-SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; X86-SSE2-NEXT: movdqa %xmm0, %xmm2
; X86-SSE2-NEXT: pxor %xmm2, %xmm0		; X86-SSE2-NEXT: psubusw %xmm1, %xmm2
; X86-SSE2-NEXT: pxor %xmm2, %xmm1		; X86-SSE2-NEXT: psubw %xmm2, %xmm0
; X86-SSE2-NEXT: pminsw %xmm0, %xmm1		; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
; X86-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; X86-SSE2-NEXT: movdqa %xmm0, %xmm2
; X86-SSE2-NEXT: pminsw %xmm1, %xmm0		; X86-SSE2-NEXT: psubusw %xmm1, %xmm2
		; X86-SSE2-NEXT: psubw %xmm2, %xmm0
; X86-SSE2-NEXT: movdqa %xmm0, %xmm1		; X86-SSE2-NEXT: movdqa %xmm0, %xmm1
; X86-SSE2-NEXT: psrld $16, %xmm1		; X86-SSE2-NEXT: psrld $16, %xmm1
; X86-SSE2-NEXT: pminsw %xmm0, %xmm1		; X86-SSE2-NEXT: movdqa %xmm0, %xmm2
; X86-SSE2-NEXT: movd %xmm1, %eax		; X86-SSE2-NEXT: psubusw %xmm1, %xmm2
; X86-SSE2-NEXT: xorl $32768, %eax ## imm = 0x8000		; X86-SSE2-NEXT: psubw %xmm2, %xmm0
		; X86-SSE2-NEXT: movd %xmm0, %eax
; X86-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax		; X86-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax
; X86-SSE2-NEXT: retl		; X86-SSE2-NEXT: retl
;		;
; X86-SSE42-LABEL: test_reduce_v32i16_v8i16:		; X86-SSE42-LABEL: test_reduce_v32i16_v8i16:
; X86-SSE42: ## %bb.0:		; X86-SSE42: ## %bb.0:
; X86-SSE42-NEXT: phminposuw %xmm0, %xmm0		; X86-SSE42-NEXT: phminposuw %xmm0, %xmm0
; X86-SSE42-NEXT: movd %xmm0, %eax		; X86-SSE42-NEXT: movd %xmm0, %eax
; X86-SSE42-NEXT: ## kill: def $ax killed $ax killed $eax		; X86-SSE42-NEXT: ## kill: def $ax killed $ax killed $eax
; X86-SSE42-NEXT: retl		; X86-SSE42-NEXT: retl
;		;
; X86-AVX-LABEL: test_reduce_v32i16_v8i16:		; X86-AVX-LABEL: test_reduce_v32i16_v8i16:
; X86-AVX: ## %bb.0:		; X86-AVX: ## %bb.0:
; X86-AVX-NEXT: vphminposuw %xmm0, %xmm0		; X86-AVX-NEXT: vphminposuw %xmm0, %xmm0
; X86-AVX-NEXT: vmovd %xmm0, %eax		; X86-AVX-NEXT: vmovd %xmm0, %eax
; X86-AVX-NEXT: ## kill: def $ax killed $ax killed $eax		; X86-AVX-NEXT: ## kill: def $ax killed $ax killed $eax
; X86-AVX-NEXT: vzeroupper		; X86-AVX-NEXT: vzeroupper
; X86-AVX-NEXT: retl		; X86-AVX-NEXT: retl
;		;
; X64-SSE2-LABEL: test_reduce_v32i16_v8i16:		; X64-SSE2-LABEL: test_reduce_v32i16_v8i16:
; X64-SSE2: ## %bb.0:		; X64-SSE2: ## %bb.0:
; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
; X64-SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; X64-SSE2-NEXT: movdqa %xmm0, %xmm2
; X64-SSE2-NEXT: pxor %xmm2, %xmm0		; X64-SSE2-NEXT: psubusw %xmm1, %xmm2
; X64-SSE2-NEXT: pxor %xmm2, %xmm1		; X64-SSE2-NEXT: psubw %xmm2, %xmm0
; X64-SSE2-NEXT: pminsw %xmm0, %xmm1		; X64-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
; X64-SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; X64-SSE2-NEXT: movdqa %xmm0, %xmm2
; X64-SSE2-NEXT: pminsw %xmm1, %xmm0		; X64-SSE2-NEXT: psubusw %xmm1, %xmm2
		; X64-SSE2-NEXT: psubw %xmm2, %xmm0
; X64-SSE2-NEXT: movdqa %xmm0, %xmm1		; X64-SSE2-NEXT: movdqa %xmm0, %xmm1
; X64-SSE2-NEXT: psrld $16, %xmm1		; X64-SSE2-NEXT: psrld $16, %xmm1
; X64-SSE2-NEXT: pminsw %xmm0, %xmm1		; X64-SSE2-NEXT: movdqa %xmm0, %xmm2
; X64-SSE2-NEXT: movd %xmm1, %eax		; X64-SSE2-NEXT: psubusw %xmm1, %xmm2
; X64-SSE2-NEXT: xorl $32768, %eax ## imm = 0x8000		; X64-SSE2-NEXT: psubw %xmm2, %xmm0
		; X64-SSE2-NEXT: movd %xmm0, %eax
; X64-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax		; X64-SSE2-NEXT: ## kill: def $ax killed $ax killed $eax
; X64-SSE2-NEXT: retq		; X64-SSE2-NEXT: retq
;		;
; X64-SSE42-LABEL: test_reduce_v32i16_v8i16:		; X64-SSE42-LABEL: test_reduce_v32i16_v8i16:
; X64-SSE42: ## %bb.0:		; X64-SSE42: ## %bb.0:
; X64-SSE42-NEXT: phminposuw %xmm0, %xmm0		; X64-SSE42-NEXT: phminposuw %xmm0, %xmm0
; X64-SSE42-NEXT: movd %xmm0, %eax		; X64-SSE42-NEXT: movd %xmm0, %eax
; X64-SSE42-NEXT: ## kill: def $ax killed $ax killed $eax		; X64-SSE42-NEXT: ## kill: def $ax killed $ax killed $eax
▲ Show 20 Lines • Show All 197 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/machine-combiner-int-vec.ll

Show First 20 Lines • Show All 321 Lines • ▼ Show 20 Lines	; AVX-NEXT: retq
%t4 = select <16 x i1> %t3, <16 x i8> %x3, <16 x i8> %t2		%t4 = select <16 x i1> %t3, <16 x i8> %x3, <16 x i8> %t2
ret <16 x i8> %t4		ret <16 x i8> %t4
}		}

define <8 x i16> @reassociate_umax_v8i16(<8 x i16> %x0, <8 x i16> %x1, <8 x i16> %x2, <8 x i16> %x3) {		define <8 x i16> @reassociate_umax_v8i16(<8 x i16> %x0, <8 x i16> %x1, <8 x i16> %x2, <8 x i16> %x3) {
; SSE-LABEL: reassociate_umax_v8i16:		; SSE-LABEL: reassociate_umax_v8i16:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: paddw %xmm1, %xmm0		; SSE-NEXT: paddw %xmm1, %xmm0
; SSE-NEXT: movdqa {{.*#+}} xmm1 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE-NEXT: psubusw %xmm2, %xmm0
; SSE-NEXT: pxor %xmm1, %xmm2		; SSE-NEXT: paddw %xmm2, %xmm0
; SSE-NEXT: pxor %xmm1, %xmm0		; SSE-NEXT: psubusw %xmm3, %xmm0
; SSE-NEXT: pmaxsw %xmm2, %xmm0		; SSE-NEXT: paddw %xmm3, %xmm0
; SSE-NEXT: pxor %xmm1, %xmm3
; SSE-NEXT: pmaxsw %xmm3, %xmm0
; SSE-NEXT: pxor %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: reassociate_umax_v8i16:		; AVX-LABEL: reassociate_umax_v8i16:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpaddw %xmm1, %xmm0, %xmm0		; AVX-NEXT: vpaddw %xmm1, %xmm0, %xmm0
; AVX-NEXT: vpmaxuw %xmm3, %xmm2, %xmm1		; AVX-NEXT: vpmaxuw %xmm3, %xmm2, %xmm1
; AVX-NEXT: vpmaxuw %xmm1, %xmm0, %xmm0		; AVX-NEXT: vpmaxuw %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
▲ Show 20 Lines • Show All 276 Lines • ▼ Show 20 Lines	; AVX-NEXT: retq
%t4 = select <16 x i1> %t3, <16 x i8> %x3, <16 x i8> %t2		%t4 = select <16 x i1> %t3, <16 x i8> %x3, <16 x i8> %t2
ret <16 x i8> %t4		ret <16 x i8> %t4
}		}

define <8 x i16> @reassociate_umin_v8i16(<8 x i16> %x0, <8 x i16> %x1, <8 x i16> %x2, <8 x i16> %x3) {		define <8 x i16> @reassociate_umin_v8i16(<8 x i16> %x0, <8 x i16> %x1, <8 x i16> %x2, <8 x i16> %x3) {
; SSE-LABEL: reassociate_umin_v8i16:		; SSE-LABEL: reassociate_umin_v8i16:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: paddw %xmm1, %xmm0		; SSE-NEXT: paddw %xmm1, %xmm0
; SSE-NEXT: movdqa {{.*#+}} xmm1 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE-NEXT: movdqa %xmm2, %xmm1
; SSE-NEXT: pxor %xmm1, %xmm2		; SSE-NEXT: psubusw %xmm0, %xmm1
; SSE-NEXT: pxor %xmm1, %xmm0		; SSE-NEXT: psubw %xmm1, %xmm2
; SSE-NEXT: pminsw %xmm2, %xmm0		; SSE-NEXT: movdqa %xmm3, %xmm0
; SSE-NEXT: pxor %xmm1, %xmm3		; SSE-NEXT: psubusw %xmm2, %xmm0
; SSE-NEXT: pminsw %xmm3, %xmm0		; SSE-NEXT: psubw %xmm0, %xmm3
; SSE-NEXT: pxor %xmm1, %xmm0		; SSE-NEXT: movdqa %xmm3, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: reassociate_umin_v8i16:		; AVX-LABEL: reassociate_umin_v8i16:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpaddw %xmm1, %xmm0, %xmm0		; AVX-NEXT: vpaddw %xmm1, %xmm0, %xmm0
; AVX-NEXT: vpminuw %xmm3, %xmm2, %xmm1		; AVX-NEXT: vpminuw %xmm3, %xmm2, %xmm1
; AVX-NEXT: vpminuw %xmm1, %xmm0, %xmm0		; AVX-NEXT: vpminuw %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
▲ Show 20 Lines • Show All 281 Lines • ▼ Show 20 Lines	; AVX-NEXT: retq
ret <32 x i8> %t4		ret <32 x i8> %t4
}		}

define <16 x i16> @reassociate_umax_v16i16(<16 x i16> %x0, <16 x i16> %x1, <16 x i16> %x2, <16 x i16> %x3) {		define <16 x i16> @reassociate_umax_v16i16(<16 x i16> %x0, <16 x i16> %x1, <16 x i16> %x2, <16 x i16> %x3) {
; SSE-LABEL: reassociate_umax_v16i16:		; SSE-LABEL: reassociate_umax_v16i16:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: paddw %xmm2, %xmm0		; SSE-NEXT: paddw %xmm2, %xmm0
; SSE-NEXT: paddw %xmm3, %xmm1		; SSE-NEXT: paddw %xmm3, %xmm1
; SSE-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE-NEXT: psubusw %xmm5, %xmm1
; SSE-NEXT: pxor %xmm2, %xmm5		; SSE-NEXT: paddw %xmm5, %xmm1
; SSE-NEXT: pxor %xmm2, %xmm1		; SSE-NEXT: psubusw %xmm4, %xmm0
; SSE-NEXT: pmaxsw %xmm5, %xmm1		; SSE-NEXT: paddw %xmm4, %xmm0
; SSE-NEXT: pxor %xmm2, %xmm4		; SSE-NEXT: psubusw %xmm6, %xmm0
; SSE-NEXT: pxor %xmm2, %xmm0		; SSE-NEXT: paddw %xmm6, %xmm0
; SSE-NEXT: pmaxsw %xmm4, %xmm0		; SSE-NEXT: psubusw %xmm7, %xmm1
; SSE-NEXT: pxor %xmm2, %xmm6		; SSE-NEXT: paddw %xmm7, %xmm1
; SSE-NEXT: pmaxsw %xmm6, %xmm0
; SSE-NEXT: pxor %xmm2, %xmm0
; SSE-NEXT: pxor %xmm2, %xmm7
; SSE-NEXT: pmaxsw %xmm7, %xmm1
; SSE-NEXT: pxor %xmm2, %xmm1
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: reassociate_umax_v16i16:		; AVX-LABEL: reassociate_umax_v16i16:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpaddw %ymm1, %ymm0, %ymm0		; AVX-NEXT: vpaddw %ymm1, %ymm0, %ymm0
; AVX-NEXT: vpmaxuw %ymm3, %ymm2, %ymm1		; AVX-NEXT: vpmaxuw %ymm3, %ymm2, %ymm1
; AVX-NEXT: vpmaxuw %ymm1, %ymm0, %ymm0		; AVX-NEXT: vpmaxuw %ymm1, %ymm0, %ymm0
; AVX-NEXT: retq		; AVX-NEXT: retq
▲ Show 20 Lines • Show All 384 Lines • ▼ Show 20 Lines	; AVX-NEXT: retq
ret <32 x i8> %t4		ret <32 x i8> %t4
}		}

define <16 x i16> @reassociate_umin_v16i16(<16 x i16> %x0, <16 x i16> %x1, <16 x i16> %x2, <16 x i16> %x3) {		define <16 x i16> @reassociate_umin_v16i16(<16 x i16> %x0, <16 x i16> %x1, <16 x i16> %x2, <16 x i16> %x3) {
; SSE-LABEL: reassociate_umin_v16i16:		; SSE-LABEL: reassociate_umin_v16i16:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: paddw %xmm2, %xmm0		; SSE-NEXT: paddw %xmm2, %xmm0
; SSE-NEXT: paddw %xmm3, %xmm1		; SSE-NEXT: paddw %xmm3, %xmm1
; SSE-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE-NEXT: movdqa %xmm5, %xmm2
; SSE-NEXT: pxor %xmm2, %xmm5		; SSE-NEXT: psubusw %xmm1, %xmm2
; SSE-NEXT: pxor %xmm2, %xmm1		; SSE-NEXT: psubw %xmm2, %xmm5
; SSE-NEXT: pminsw %xmm5, %xmm1		; SSE-NEXT: movdqa %xmm4, %xmm1
; SSE-NEXT: pxor %xmm2, %xmm4		; SSE-NEXT: psubusw %xmm0, %xmm1
; SSE-NEXT: pxor %xmm2, %xmm0		; SSE-NEXT: psubw %xmm1, %xmm4
; SSE-NEXT: pminsw %xmm4, %xmm0		; SSE-NEXT: movdqa %xmm6, %xmm0
; SSE-NEXT: pxor %xmm2, %xmm6		; SSE-NEXT: psubusw %xmm4, %xmm0
; SSE-NEXT: pminsw %xmm6, %xmm0		; SSE-NEXT: psubw %xmm0, %xmm6
; SSE-NEXT: pxor %xmm2, %xmm0		; SSE-NEXT: movdqa %xmm7, %xmm0
; SSE-NEXT: pxor %xmm2, %xmm7		; SSE-NEXT: psubusw %xmm5, %xmm0
; SSE-NEXT: pminsw %xmm7, %xmm1		; SSE-NEXT: psubw %xmm0, %xmm7
; SSE-NEXT: pxor %xmm2, %xmm1		; SSE-NEXT: movdqa %xmm6, %xmm0
		; SSE-NEXT: movdqa %xmm7, %xmm1
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: reassociate_umin_v16i16:		; AVX-LABEL: reassociate_umin_v16i16:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpaddw %ymm1, %ymm0, %ymm0		; AVX-NEXT: vpaddw %ymm1, %ymm0, %ymm0
; AVX-NEXT: vpminuw %ymm3, %ymm2, %ymm1		; AVX-NEXT: vpminuw %ymm3, %ymm2, %ymm1
; AVX-NEXT: vpminuw %ymm1, %ymm0, %ymm0		; AVX-NEXT: vpminuw %ymm1, %ymm0, %ymm0
; AVX-NEXT: retq		; AVX-NEXT: retq
▲ Show 20 Lines • Show All 399 Lines • ▼ Show 20 Lines	; AVX512-NEXT: retq
%t3 = icmp ugt <64 x i8> %x3, %t2		%t3 = icmp ugt <64 x i8> %x3, %t2
%t4 = select <64 x i1> %t3, <64 x i8> %x3, <64 x i8> %t2		%t4 = select <64 x i1> %t3, <64 x i8> %x3, <64 x i8> %t2
ret <64 x i8> %t4		ret <64 x i8> %t4
}		}

define <32 x i16> @reassociate_umax_v32i16(<32 x i16> %x0, <32 x i16> %x1, <32 x i16> %x2, <32 x i16> %x3) {		define <32 x i16> @reassociate_umax_v32i16(<32 x i16> %x0, <32 x i16> %x1, <32 x i16> %x2, <32 x i16> %x3) {
; SSE-LABEL: reassociate_umax_v32i16:		; SSE-LABEL: reassociate_umax_v32i16:
; SSE: # %bb.0:		; SSE: # %bb.0:
		; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm8
		; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm9
		; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm10
		; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm11
		; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm12
		; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm13
		; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm14
		; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm15
; SSE-NEXT: paddw %xmm4, %xmm0		; SSE-NEXT: paddw %xmm4, %xmm0
; SSE-NEXT: paddw %xmm5, %xmm1		; SSE-NEXT: paddw %xmm5, %xmm1
; SSE-NEXT: paddw %xmm6, %xmm2		; SSE-NEXT: paddw %xmm6, %xmm2
; SSE-NEXT: paddw %xmm7, %xmm3		; SSE-NEXT: paddw %xmm7, %xmm3
; SSE-NEXT: movdqa {{.*#+}} xmm4 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE-NEXT: psubusw %xmm15, %xmm3
; SSE-NEXT: pxor %xmm4, %xmm3		; SSE-NEXT: paddw %xmm15, %xmm3
; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm5		; SSE-NEXT: psubusw %xmm14, %xmm2
; SSE-NEXT: pxor %xmm4, %xmm5		; SSE-NEXT: paddw %xmm14, %xmm2
; SSE-NEXT: pmaxsw %xmm3, %xmm5		; SSE-NEXT: psubusw %xmm13, %xmm1
; SSE-NEXT: pxor %xmm4, %xmm2		; SSE-NEXT: paddw %xmm13, %xmm1
; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm3		; SSE-NEXT: psubusw %xmm12, %xmm0
; SSE-NEXT: pxor %xmm4, %xmm3		; SSE-NEXT: paddw %xmm12, %xmm0
; SSE-NEXT: pmaxsw %xmm2, %xmm3		; SSE-NEXT: psubusw %xmm11, %xmm0
; SSE-NEXT: pxor %xmm4, %xmm1		; SSE-NEXT: paddw %xmm11, %xmm0
; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm2		; SSE-NEXT: psubusw %xmm10, %xmm1
; SSE-NEXT: pxor %xmm4, %xmm2		; SSE-NEXT: paddw %xmm10, %xmm1
; SSE-NEXT: pmaxsw %xmm1, %xmm2		; SSE-NEXT: psubusw %xmm9, %xmm2
; SSE-NEXT: pxor %xmm4, %xmm0		; SSE-NEXT: paddw %xmm9, %xmm2
; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm1		; SSE-NEXT: psubusw %xmm8, %xmm3
; SSE-NEXT: pxor %xmm4, %xmm1		; SSE-NEXT: paddw %xmm8, %xmm3
; SSE-NEXT: pmaxsw %xmm0, %xmm1
; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm0
; SSE-NEXT: pxor %xmm4, %xmm0
; SSE-NEXT: pmaxsw %xmm1, %xmm0
; SSE-NEXT: pxor %xmm4, %xmm0
; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm1
; SSE-NEXT: pxor %xmm4, %xmm1
; SSE-NEXT: pmaxsw %xmm2, %xmm1
; SSE-NEXT: pxor %xmm4, %xmm1
; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm2
; SSE-NEXT: pxor %xmm4, %xmm2
; SSE-NEXT: pmaxsw %xmm3, %xmm2
; SSE-NEXT: pxor %xmm4, %xmm2
; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm3
; SSE-NEXT: pxor %xmm4, %xmm3
; SSE-NEXT: pmaxsw %xmm5, %xmm3
; SSE-NEXT: pxor %xmm4, %xmm3
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX2-LABEL: reassociate_umax_v32i16:		; AVX2-LABEL: reassociate_umax_v32i16:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpaddw %ymm2, %ymm0, %ymm0		; AVX2-NEXT: vpaddw %ymm2, %ymm0, %ymm0
; AVX2-NEXT: vpaddw %ymm3, %ymm1, %ymm1		; AVX2-NEXT: vpaddw %ymm3, %ymm1, %ymm1
; AVX2-NEXT: vpmaxuw %ymm6, %ymm4, %ymm2		; AVX2-NEXT: vpmaxuw %ymm6, %ymm4, %ymm2
; AVX2-NEXT: vpmaxuw %ymm2, %ymm0, %ymm0		; AVX2-NEXT: vpmaxuw %ymm2, %ymm0, %ymm0
▲ Show 20 Lines • Show All 712 Lines • ▼ Show 20 Lines	; AVX512-NEXT: retq
%t3 = icmp ult <64 x i8> %x3, %t2		%t3 = icmp ult <64 x i8> %x3, %t2
%t4 = select <64 x i1> %t3, <64 x i8> %x3, <64 x i8> %t2		%t4 = select <64 x i1> %t3, <64 x i8> %x3, <64 x i8> %t2
ret <64 x i8> %t4		ret <64 x i8> %t4
}		}

define <32 x i16> @reassociate_umin_v32i16(<32 x i16> %x0, <32 x i16> %x1, <32 x i16> %x2, <32 x i16> %x3) {		define <32 x i16> @reassociate_umin_v32i16(<32 x i16> %x0, <32 x i16> %x1, <32 x i16> %x2, <32 x i16> %x3) {
; SSE-LABEL: reassociate_umin_v32i16:		; SSE-LABEL: reassociate_umin_v32i16:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: paddw %xmm4, %xmm0		; SSE-NEXT: movdqa %xmm3, %xmm8
; SSE-NEXT: paddw %xmm5, %xmm1		; SSE-NEXT: movdqa %xmm2, %xmm9
; SSE-NEXT: paddw %xmm6, %xmm2		; SSE-NEXT: movdqa %xmm1, %xmm10
; SSE-NEXT: paddw %xmm7, %xmm3		; SSE-NEXT: movdqa %xmm0, %xmm11
; SSE-NEXT: movdqa {{.*#+}} xmm4 = [32768,32768,32768,32768,32768,32768,32768,32768]
; SSE-NEXT: pxor %xmm4, %xmm3
; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm5
; SSE-NEXT: pxor %xmm4, %xmm5
; SSE-NEXT: pminsw %xmm3, %xmm5
; SSE-NEXT: pxor %xmm4, %xmm2
; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm3		; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm3
; SSE-NEXT: pxor %xmm4, %xmm3
; SSE-NEXT: pminsw %xmm2, %xmm3
; SSE-NEXT: pxor %xmm4, %xmm1
; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm2		; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm2
; SSE-NEXT: pxor %xmm4, %xmm2
; SSE-NEXT: pminsw %xmm1, %xmm2
; SSE-NEXT: pxor %xmm4, %xmm0
; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm1		; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm1
; SSE-NEXT: pxor %xmm4, %xmm1
; SSE-NEXT: pminsw %xmm0, %xmm1
; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm0		; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm0
; SSE-NEXT: pxor %xmm4, %xmm0		; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm14
; SSE-NEXT: pminsw %xmm1, %xmm0		; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm15
; SSE-NEXT: pxor %xmm4, %xmm0		; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm13
; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm1		; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm12
; SSE-NEXT: pxor %xmm4, %xmm1		; SSE-NEXT: paddw %xmm4, %xmm11
; SSE-NEXT: pminsw %xmm2, %xmm1		; SSE-NEXT: paddw %xmm5, %xmm10
; SSE-NEXT: pxor %xmm4, %xmm1		; SSE-NEXT: paddw %xmm6, %xmm9
; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm2		; SSE-NEXT: paddw %xmm7, %xmm8
; SSE-NEXT: pxor %xmm4, %xmm2		; SSE-NEXT: movdqa %xmm12, %xmm4
; SSE-NEXT: pminsw %xmm3, %xmm2		; SSE-NEXT: psubusw %xmm8, %xmm4
; SSE-NEXT: pxor %xmm4, %xmm2		; SSE-NEXT: psubw %xmm4, %xmm12
; SSE-NEXT: movdqa {{[0-9]+}}(%rsp), %xmm3		; SSE-NEXT: movdqa %xmm13, %xmm4
; SSE-NEXT: pxor %xmm4, %xmm3		; SSE-NEXT: psubusw %xmm9, %xmm4
; SSE-NEXT: pminsw %xmm5, %xmm3		; SSE-NEXT: psubw %xmm4, %xmm13
; SSE-NEXT: pxor %xmm4, %xmm3		; SSE-NEXT: movdqa %xmm15, %xmm4
		; SSE-NEXT: psubusw %xmm10, %xmm4
		; SSE-NEXT: psubw %xmm4, %xmm15
		; SSE-NEXT: movdqa %xmm14, %xmm4
		; SSE-NEXT: psubusw %xmm11, %xmm4
		; SSE-NEXT: psubw %xmm4, %xmm14
		; SSE-NEXT: movdqa %xmm0, %xmm4
		; SSE-NEXT: psubusw %xmm14, %xmm4
		; SSE-NEXT: psubw %xmm4, %xmm0
		; SSE-NEXT: movdqa %xmm1, %xmm4
		; SSE-NEXT: psubusw %xmm15, %xmm4
		; SSE-NEXT: psubw %xmm4, %xmm1
		; SSE-NEXT: movdqa %xmm2, %xmm4
		; SSE-NEXT: psubusw %xmm13, %xmm4
		; SSE-NEXT: psubw %xmm4, %xmm2
		; SSE-NEXT: movdqa %xmm3, %xmm4
		; SSE-NEXT: psubusw %xmm12, %xmm4
		; SSE-NEXT: psubw %xmm4, %xmm3
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX2-LABEL: reassociate_umin_v32i16:		; AVX2-LABEL: reassociate_umin_v32i16:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpaddw %ymm2, %ymm0, %ymm0		; AVX2-NEXT: vpaddw %ymm2, %ymm0, %ymm0
; AVX2-NEXT: vpaddw %ymm3, %ymm1, %ymm1		; AVX2-NEXT: vpaddw %ymm3, %ymm1, %ymm1
; AVX2-NEXT: vpminuw %ymm6, %ymm4, %ymm2		; AVX2-NEXT: vpminuw %ymm6, %ymm4, %ymm2
; AVX2-NEXT: vpminuw %ymm2, %ymm0, %ymm0		; AVX2-NEXT: vpminuw %ymm2, %ymm0, %ymm0
▲ Show 20 Lines • Show All 671 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/masked_store_trunc_usat.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 5,182 Lines • ▼ Show 20 Lines	; AVX512BWVL-NEXT: retq
call void @llvm.masked.store.v4i8.p0v4i8(<4 x i8> %d, <4 x i8>* %p, i32 1, <4 x i1> %a)		call void @llvm.masked.store.v4i8.p0v4i8(<4 x i8> %d, <4 x i8>* %p, i32 1, <4 x i1> %a)
ret void		ret void
}		}

define void @truncstore_v32i16_v32i8(<32 x i16> %x, <32 x i8>* %p, <32 x i8> %mask) {		define void @truncstore_v32i16_v32i8(<32 x i16> %x, <32 x i8>* %p, <32 x i8> %mask) {
; SSE2-LABEL: truncstore_v32i16_v32i8:		; SSE2-LABEL: truncstore_v32i16_v32i8:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: pxor %xmm7, %xmm7		; SSE2-NEXT: pxor %xmm7, %xmm7
; SSE2-NEXT: movdqa {{.*#+}} xmm6 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa {{.*#+}} xmm8 = [255,255,255,255,255,255,255,255]
; SSE2-NEXT: pxor %xmm6, %xmm1		; SSE2-NEXT: movdqa %xmm1, %xmm6
; SSE2-NEXT: movdqa {{.*#+}} xmm8 = [33023,33023,33023,33023,33023,33023,33023,33023]		; SSE2-NEXT: psubusw %xmm8, %xmm6
; SSE2-NEXT: pminsw %xmm8, %xmm1		; SSE2-NEXT: psubw %xmm6, %xmm1
; SSE2-NEXT: pxor %xmm6, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm6
; SSE2-NEXT: pxor %xmm6, %xmm0		; SSE2-NEXT: psubusw %xmm8, %xmm6
; SSE2-NEXT: pminsw %xmm8, %xmm0		; SSE2-NEXT: psubw %xmm6, %xmm0
; SSE2-NEXT: pxor %xmm6, %xmm0
; SSE2-NEXT: packuswb %xmm1, %xmm0		; SSE2-NEXT: packuswb %xmm1, %xmm0
; SSE2-NEXT: pcmpeqb %xmm7, %xmm4		; SSE2-NEXT: pcmpeqb %xmm7, %xmm4
; SSE2-NEXT: pmovmskb %xmm4, %ecx		; SSE2-NEXT: pmovmskb %xmm4, %ecx
; SSE2-NEXT: xorl $65535, %ecx # imm = 0xFFFF		; SSE2-NEXT: xorl $65535, %ecx # imm = 0xFFFF
; SSE2-NEXT: pcmpeqb %xmm7, %xmm5		; SSE2-NEXT: pcmpeqb %xmm7, %xmm5
; SSE2-NEXT: pmovmskb %xmm5, %eax		; SSE2-NEXT: pmovmskb %xmm5, %eax
; SSE2-NEXT: notl %eax		; SSE2-NEXT: notl %eax
; SSE2-NEXT: shll $16, %eax		; SSE2-NEXT: shll $16, %eax
▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines
; SSE2-NEXT: # %bb.21: # %cond.store19		; SSE2-NEXT: # %bb.21: # %cond.store19
; SSE2-NEXT: movb %cl, 10(%rdi)		; SSE2-NEXT: movb %cl, 10(%rdi)
; SSE2-NEXT: .LBB15_22: # %else20		; SSE2-NEXT: .LBB15_22: # %else20
; SSE2-NEXT: testl $2048, %eax # imm = 0x800		; SSE2-NEXT: testl $2048, %eax # imm = 0x800
; SSE2-NEXT: je .LBB15_24		; SSE2-NEXT: je .LBB15_24
; SSE2-NEXT: # %bb.23: # %cond.store21		; SSE2-NEXT: # %bb.23: # %cond.store21
; SSE2-NEXT: movb %ch, 11(%rdi)		; SSE2-NEXT: movb %ch, 11(%rdi)
; SSE2-NEXT: .LBB15_24: # %else22		; SSE2-NEXT: .LBB15_24: # %else22
; SSE2-NEXT: pxor %xmm6, %xmm3
; SSE2-NEXT: pxor %xmm6, %xmm2
; SSE2-NEXT: testl $4096, %eax # imm = 0x1000		; SSE2-NEXT: testl $4096, %eax # imm = 0x1000
; SSE2-NEXT: pextrw $6, %xmm0, %ecx		; SSE2-NEXT: pextrw $6, %xmm0, %ecx
; SSE2-NEXT: je .LBB15_26		; SSE2-NEXT: je .LBB15_26
; SSE2-NEXT: # %bb.25: # %cond.store23		; SSE2-NEXT: # %bb.25: # %cond.store23
; SSE2-NEXT: movb %cl, 12(%rdi)		; SSE2-NEXT: movb %cl, 12(%rdi)
; SSE2-NEXT: .LBB15_26: # %else24		; SSE2-NEXT: .LBB15_26: # %else24
; SSE2-NEXT: pminsw %xmm8, %xmm3		; SSE2-NEXT: movdqa %xmm3, %xmm1
; SSE2-NEXT: pminsw %xmm8, %xmm2		; SSE2-NEXT: psubusw %xmm8, %xmm1
		; SSE2-NEXT: movdqa %xmm2, %xmm4
		; SSE2-NEXT: psubusw %xmm8, %xmm4
; SSE2-NEXT: testl $8192, %eax # imm = 0x2000		; SSE2-NEXT: testl $8192, %eax # imm = 0x2000
; SSE2-NEXT: je .LBB15_28		; SSE2-NEXT: je .LBB15_28
; SSE2-NEXT: # %bb.27: # %cond.store25		; SSE2-NEXT: # %bb.27: # %cond.store25
; SSE2-NEXT: movb %ch, 13(%rdi)		; SSE2-NEXT: movb %ch, 13(%rdi)
; SSE2-NEXT: .LBB15_28: # %else26		; SSE2-NEXT: .LBB15_28: # %else26
; SSE2-NEXT: pxor %xmm6, %xmm3		; SSE2-NEXT: psubw %xmm1, %xmm3
; SSE2-NEXT: pxor %xmm6, %xmm2		; SSE2-NEXT: psubw %xmm4, %xmm2
; SSE2-NEXT: testl $16384, %eax # imm = 0x4000		; SSE2-NEXT: testl $16384, %eax # imm = 0x4000
; SSE2-NEXT: pextrw $7, %xmm0, %ecx		; SSE2-NEXT: pextrw $7, %xmm0, %ecx
; SSE2-NEXT: je .LBB15_30		; SSE2-NEXT: je .LBB15_30
; SSE2-NEXT: # %bb.29: # %cond.store27		; SSE2-NEXT: # %bb.29: # %cond.store27
; SSE2-NEXT: movb %cl, 14(%rdi)		; SSE2-NEXT: movb %cl, 14(%rdi)
; SSE2-NEXT: .LBB15_30: # %else28		; SSE2-NEXT: .LBB15_30: # %else28
; SSE2-NEXT: packuswb %xmm3, %xmm2		; SSE2-NEXT: packuswb %xmm3, %xmm2
; SSE2-NEXT: testl $32768, %eax # imm = 0x8000		; SSE2-NEXT: testl $32768, %eax # imm = 0x8000
▲ Show 20 Lines • Show All 1,110 Lines • ▼ Show 20 Lines	; AVX512BWVL-NEXT: retq
call void @llvm.masked.store.v32i8.p0v32i8(<32 x i8> %d, <32 x i8>* %p, i32 1, <32 x i1> %a)		call void @llvm.masked.store.v32i8.p0v32i8(<32 x i8> %d, <32 x i8>* %p, i32 1, <32 x i1> %a)
ret void		ret void
}		}

define void @truncstore_v16i16_v16i8(<16 x i16> %x, <16 x i8>* %p, <16 x i8> %mask) {		define void @truncstore_v16i16_v16i8(<16 x i16> %x, <16 x i8>* %p, <16 x i8> %mask) {
; SSE2-LABEL: truncstore_v16i16_v16i8:		; SSE2-LABEL: truncstore_v16i16_v16i8:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: pxor %xmm3, %xmm3		; SSE2-NEXT: pxor %xmm3, %xmm3
; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [255,255,255,255,255,255,255,255]
; SSE2-NEXT: pxor %xmm4, %xmm1		; SSE2-NEXT: movdqa %xmm1, %xmm5
; SSE2-NEXT: movdqa {{.*#+}} xmm5 = [33023,33023,33023,33023,33023,33023,33023,33023]		; SSE2-NEXT: psubusw %xmm4, %xmm5
; SSE2-NEXT: pminsw %xmm5, %xmm1		; SSE2-NEXT: psubw %xmm5, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm5
; SSE2-NEXT: pxor %xmm4, %xmm0		; SSE2-NEXT: psubusw %xmm4, %xmm5
; SSE2-NEXT: pminsw %xmm5, %xmm0		; SSE2-NEXT: psubw %xmm5, %xmm0
; SSE2-NEXT: pxor %xmm4, %xmm0
; SSE2-NEXT: packuswb %xmm1, %xmm0		; SSE2-NEXT: packuswb %xmm1, %xmm0
; SSE2-NEXT: pcmpeqb %xmm2, %xmm3		; SSE2-NEXT: pcmpeqb %xmm2, %xmm3
; SSE2-NEXT: pmovmskb %xmm3, %eax		; SSE2-NEXT: pmovmskb %xmm3, %eax
; SSE2-NEXT: xorl $65535, %eax # imm = 0xFFFF		; SSE2-NEXT: xorl $65535, %eax # imm = 0xFFFF
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %al
; SSE2-NEXT: movd %xmm0, %ecx		; SSE2-NEXT: movd %xmm0, %ecx
; SSE2-NEXT: jne .LBB16_1		; SSE2-NEXT: jne .LBB16_1
; SSE2-NEXT: # %bb.2: # %else		; SSE2-NEXT: # %bb.2: # %else
▲ Show 20 Lines • Show All 617 Lines • ▼ Show 20 Lines	; AVX512BWVL-NEXT: retq
call void @llvm.masked.store.v16i8.p0v16i8(<16 x i8> %d, <16 x i8>* %p, i32 1, <16 x i1> %a)		call void @llvm.masked.store.v16i8.p0v16i8(<16 x i8> %d, <16 x i8>* %p, i32 1, <16 x i1> %a)
ret void		ret void
}		}

define void @truncstore_v8i16_v8i8(<8 x i16> %x, <8 x i8>* %p, <8 x i16> %mask) {		define void @truncstore_v8i16_v8i8(<8 x i16> %x, <8 x i8>* %p, <8 x i16> %mask) {
; SSE2-LABEL: truncstore_v8i16_v8i8:		; SSE2-LABEL: truncstore_v8i16_v8i8:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: pxor %xmm2, %xmm2		; SSE2-NEXT: pxor %xmm2, %xmm2
; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm3
; SSE2-NEXT: pxor %xmm3, %xmm0		; SSE2-NEXT: psubusw {{.*}}(%rip), %xmm3
; SSE2-NEXT: pminsw {{.*}}(%rip), %xmm0		; SSE2-NEXT: psubw %xmm3, %xmm0
; SSE2-NEXT: pxor %xmm3, %xmm0
; SSE2-NEXT: packuswb %xmm0, %xmm0		; SSE2-NEXT: packuswb %xmm0, %xmm0
; SSE2-NEXT: pcmpeqw %xmm1, %xmm2		; SSE2-NEXT: pcmpeqw %xmm1, %xmm2
; SSE2-NEXT: pcmpeqd %xmm1, %xmm1		; SSE2-NEXT: pcmpeqd %xmm1, %xmm1
; SSE2-NEXT: pxor %xmm2, %xmm1		; SSE2-NEXT: pxor %xmm2, %xmm1
; SSE2-NEXT: packsswb %xmm1, %xmm1		; SSE2-NEXT: packsswb %xmm1, %xmm1
; SSE2-NEXT: pmovmskb %xmm1, %eax		; SSE2-NEXT: pmovmskb %xmm1, %eax
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %al
; SSE2-NEXT: movd %xmm0, %ecx		; SSE2-NEXT: movd %xmm0, %ecx
▲ Show 20 Lines • Show All 297 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/midpoint-int-vec-128.ll

Show First 20 Lines • Show All 2,164 Lines • ▼ Show 20 Lines	; AVX512VLBW-NEXT: retq
%a10 = add nsw <8 x i16> %t9, %a1 ; signed		%a10 = add nsw <8 x i16> %t9, %a1 ; signed
ret <8 x i16> %a10		ret <8 x i16> %a10
}		}

define <8 x i16> @vec128_i16_unsigned_reg_reg(<8 x i16> %a1, <8 x i16> %a2) nounwind {		define <8 x i16> @vec128_i16_unsigned_reg_reg(<8 x i16> %a1, <8 x i16> %a2) nounwind {
; SSE2-LABEL: vec128_i16_unsigned_reg_reg:		; SSE2-LABEL: vec128_i16_unsigned_reg_reg:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [32768,32768,32768,32768,32768,32768,32768,32768]
; SSE2-NEXT: pxor %xmm3, %xmm1		; SSE2-NEXT: movdqa %xmm1, %xmm2
; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pxor %xmm3, %xmm2
; SSE2-NEXT: movdqa %xmm2, %xmm4
; SSE2-NEXT: pcmpgtw %xmm1, %xmm4
; SSE2-NEXT: por {{.*}}(%rip), %xmm4
; SSE2-NEXT: movdqa %xmm2, %xmm5
; SSE2-NEXT: pminsw %xmm1, %xmm5
; SSE2-NEXT: pxor %xmm3, %xmm5
; SSE2-NEXT: pmaxsw %xmm1, %xmm2
; SSE2-NEXT: pxor %xmm3, %xmm2		; SSE2-NEXT: pxor %xmm3, %xmm2
; SSE2-NEXT: psubw %xmm5, %xmm2		; SSE2-NEXT: pxor %xmm0, %xmm3
		; SSE2-NEXT: pcmpgtw %xmm2, %xmm3
		; SSE2-NEXT: por {{.*}}(%rip), %xmm3
		; SSE2-NEXT: movdqa %xmm0, %xmm2
		; SSE2-NEXT: psubusw %xmm1, %xmm2
		; SSE2-NEXT: psubusw %xmm0, %xmm1
		; SSE2-NEXT: psubw %xmm0, %xmm2
		; SSE2-NEXT: paddw %xmm0, %xmm2
		; SSE2-NEXT: paddw %xmm1, %xmm2
; SSE2-NEXT: psrlw $1, %xmm2		; SSE2-NEXT: psrlw $1, %xmm2
; SSE2-NEXT: pmullw %xmm4, %xmm2		; SSE2-NEXT: pmullw %xmm3, %xmm2
; SSE2-NEXT: paddw %xmm0, %xmm2		; SSE2-NEXT: paddw %xmm0, %xmm2
; SSE2-NEXT: movdqa %xmm2, %xmm0		; SSE2-NEXT: movdqa %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: vec128_i16_unsigned_reg_reg:		; SSE41-LABEL: vec128_i16_unsigned_reg_reg:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movdqa %xmm0, %xmm2		; SSE41-NEXT: movdqa %xmm0, %xmm2
; SSE41-NEXT: pminuw %xmm1, %xmm2		; SSE41-NEXT: pminuw %xmm1, %xmm2
▲ Show 20 Lines • Show All 1,771 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/sat-add.ll

Show First 20 Lines • Show All 389 Lines • ▼ Show 20 Lines	; ANY-NEXT: retq
%c = icmp ugt <16 x i8> %x, <i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43>		%c = icmp ugt <16 x i8> %x, <i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43, i8 -43>
%r = select <16 x i1> %c, <16 x i8> <i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1>, <16 x i8> %a		%r = select <16 x i1> %c, <16 x i8> <i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1>, <16 x i8> %a
ret <16 x i8> %r		ret <16 x i8> %r
}		}

define <8 x i16> @unsigned_sat_constant_v8i16_using_min(<8 x i16> %x) {		define <8 x i16> @unsigned_sat_constant_v8i16_using_min(<8 x i16> %x) {
; SSE2-LABEL: unsigned_sat_constant_v8i16_using_min:		; SSE2-LABEL: unsigned_sat_constant_v8i16_using_min:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm1
; SSE2-NEXT: pxor %xmm1, %xmm0		; SSE2-NEXT: psubusw {{.*}}(%rip), %xmm1
; SSE2-NEXT: pminsw {{.*}}(%rip), %xmm0		; SSE2-NEXT: psubw %xmm1, %xmm0
; SSE2-NEXT: pxor %xmm1, %xmm0
; SSE2-NEXT: paddw {{.*}}(%rip), %xmm0		; SSE2-NEXT: paddw {{.*}}(%rip), %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: unsigned_sat_constant_v8i16_using_min:		; SSE41-LABEL: unsigned_sat_constant_v8i16_using_min:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: pminuw {{.*}}(%rip), %xmm0		; SSE41-NEXT: pminuw {{.*}}(%rip), %xmm0
; SSE41-NEXT: paddw {{.*}}(%rip), %xmm0		; SSE41-NEXT: paddw {{.*}}(%rip), %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
▲ Show 20 Lines • Show All 262 Lines • ▼ Show 20 Lines	; ANY-NEXT: retq
%c = icmp ugt <16 x i8> %x, %noty		%c = icmp ugt <16 x i8> %x, %noty
%r = select <16 x i1> %c, <16 x i8> <i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1>, <16 x i8> %a		%r = select <16 x i1> %c, <16 x i8> <i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1>, <16 x i8> %a
ret <16 x i8> %r		ret <16 x i8> %r
}		}

define <8 x i16> @unsigned_sat_variable_v8i16_using_min(<8 x i16> %x, <8 x i16> %y) {		define <8 x i16> @unsigned_sat_variable_v8i16_using_min(<8 x i16> %x, <8 x i16> %y) {
; SSE2-LABEL: unsigned_sat_variable_v8i16_using_min:		; SSE2-LABEL: unsigned_sat_variable_v8i16_using_min:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: pcmpeqd %xmm2, %xmm2
; SSE2-NEXT: pxor %xmm2, %xmm0		; SSE2-NEXT: pxor %xmm1, %xmm2
; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [32767,32767,32767,32767,32767,32767,32767,32767]		; SSE2-NEXT: movdqa %xmm0, %xmm3
; SSE2-NEXT: pxor %xmm1, %xmm3		; SSE2-NEXT: psubusw %xmm2, %xmm3
; SSE2-NEXT: pminsw %xmm3, %xmm0		; SSE2-NEXT: psubw %xmm3, %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: paddw %xmm1, %xmm0		; SSE2-NEXT: paddw %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: unsigned_sat_variable_v8i16_using_min:		; SSE41-LABEL: unsigned_sat_variable_v8i16_using_min:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: pcmpeqd %xmm2, %xmm2		; SSE41-NEXT: pcmpeqd %xmm2, %xmm2
; SSE41-NEXT: pxor %xmm1, %xmm2		; SSE41-NEXT: pxor %xmm1, %xmm2
; SSE41-NEXT: pminuw %xmm2, %xmm0		; SSE41-NEXT: pminuw %xmm2, %xmm0
▲ Show 20 Lines • Show All 234 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/umax.ll

	Show First 20 Lines • Show All 451 Lines • ▼ Show 20 Lines
	; X86-NEXT: retl $4			; X86-NEXT: retl $4
	%r = call <8 x i32> @llvm.umax.v8i32(<8 x i32> %a, <8 x i32> %b)			%r = call <8 x i32> @llvm.umax.v8i32(<8 x i32> %a, <8 x i32> %b)
	ret <8 x i32> %r			ret <8 x i32> %r
	}			}

	define <8 x i16> @test_v8i16(<8 x i16> %a, <8 x i16> %b) nounwind {			define <8 x i16> @test_v8i16(<8 x i16> %a, <8 x i16> %b) nounwind {
	; SSE-LABEL: test_v8i16:			; SSE-LABEL: test_v8i16:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]			; SSE-NEXT: psubusw %xmm0, %xmm1
	; SSE-NEXT: pxor %xmm2, %xmm1			; SSE-NEXT: paddw %xmm1, %xmm0
	; SSE-NEXT: pxor %xmm2, %xmm0
	; SSE-NEXT: pmaxsw %xmm1, %xmm0
	; SSE-NEXT: pxor %xmm2, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v8i16:			; AVX-LABEL: test_v8i16:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpmaxuw %xmm1, %xmm0, %xmm0			; AVX-NEXT: vpmaxuw %xmm1, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; X86-LABEL: test_v8i16:			; X86-LABEL: test_v8i16:
	▲ Show 20 Lines • Show All 196 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/umin.ll

	Show First 20 Lines • Show All 450 Lines • ▼ Show 20 Lines
	; X86-NEXT: retl $4			; X86-NEXT: retl $4
	%r = call <8 x i32> @llvm.umin.v8i32(<8 x i32> %a, <8 x i32> %b)			%r = call <8 x i32> @llvm.umin.v8i32(<8 x i32> %a, <8 x i32> %b)
	ret <8 x i32> %r			ret <8 x i32> %r
	}			}

	define <8 x i16> @test_v8i16(<8 x i16> %a, <8 x i16> %b) nounwind {			define <8 x i16> @test_v8i16(<8 x i16> %a, <8 x i16> %b) nounwind {
	; SSE-LABEL: test_v8i16:			; SSE-LABEL: test_v8i16:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]			; SSE-NEXT: movdqa %xmm0, %xmm2
	; SSE-NEXT: pxor %xmm2, %xmm1			; SSE-NEXT: psubusw %xmm1, %xmm2
	; SSE-NEXT: pxor %xmm2, %xmm0			; SSE-NEXT: psubw %xmm2, %xmm0
	; SSE-NEXT: pminsw %xmm1, %xmm0
	; SSE-NEXT: pxor %xmm2, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v8i16:			; AVX-LABEL: test_v8i16:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpminuw %xmm1, %xmm0, %xmm0			; AVX-NEXT: vpminuw %xmm1, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; X86-LABEL: test_v8i16:			; X86-LABEL: test_v8i16:
	▲ Show 20 Lines • Show All 196 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vec_minmax_uint.ll

Show First 20 Lines • Show All 296 Lines • ▼ Show 20 Lines	; AVX512-NEXT: retq
%1 = icmp ugt <8 x i32> %a, %b		%1 = icmp ugt <8 x i32> %a, %b
%2 = select <8 x i1> %1, <8 x i32> %a, <8 x i32> %b		%2 = select <8 x i1> %1, <8 x i32> %a, <8 x i32> %b
ret <8 x i32> %2		ret <8 x i32> %2
}		}

define <8 x i16> @max_gt_v8i16(<8 x i16> %a, <8 x i16> %b) {		define <8 x i16> @max_gt_v8i16(<8 x i16> %a, <8 x i16> %b) {
; SSE2-LABEL: max_gt_v8i16:		; SSE2-LABEL: max_gt_v8i16:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: psubusw %xmm0, %xmm1
; SSE2-NEXT: pxor %xmm2, %xmm1		; SSE2-NEXT: paddw %xmm1, %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: pmaxsw %xmm1, %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: max_gt_v8i16:		; SSE41-LABEL: max_gt_v8i16:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: pmaxuw %xmm1, %xmm0		; SSE41-NEXT: pmaxuw %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; SSE42-LABEL: max_gt_v8i16:		; SSE42-LABEL: max_gt_v8i16:
; SSE42: # %bb.0:		; SSE42: # %bb.0:
; SSE42-NEXT: pmaxuw %xmm1, %xmm0		; SSE42-NEXT: pmaxuw %xmm1, %xmm0
; SSE42-NEXT: retq		; SSE42-NEXT: retq
;		;
; AVX-LABEL: max_gt_v8i16:		; AVX-LABEL: max_gt_v8i16:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpmaxuw %xmm1, %xmm0, %xmm0		; AVX-NEXT: vpmaxuw %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
%1 = icmp ugt <8 x i16> %a, %b		%1 = icmp ugt <8 x i16> %a, %b
%2 = select <8 x i1> %1, <8 x i16> %a, <8 x i16> %b		%2 = select <8 x i1> %1, <8 x i16> %a, <8 x i16> %b
ret <8 x i16> %2		ret <8 x i16> %2
}		}

define <16 x i16> @max_gt_v16i16(<16 x i16> %a, <16 x i16> %b) {		define <16 x i16> @max_gt_v16i16(<16 x i16> %a, <16 x i16> %b) {
; SSE2-LABEL: max_gt_v16i16:		; SSE2-LABEL: max_gt_v16i16:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: psubusw %xmm0, %xmm2
; SSE2-NEXT: pxor %xmm4, %xmm2		; SSE2-NEXT: paddw %xmm2, %xmm0
; SSE2-NEXT: pxor %xmm4, %xmm0		; SSE2-NEXT: psubusw %xmm1, %xmm3
; SSE2-NEXT: pmaxsw %xmm2, %xmm0		; SSE2-NEXT: paddw %xmm3, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm0
; SSE2-NEXT: pxor %xmm4, %xmm3
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: pmaxsw %xmm3, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: max_gt_v16i16:		; SSE41-LABEL: max_gt_v16i16:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: pmaxuw %xmm2, %xmm0		; SSE41-NEXT: pmaxuw %xmm2, %xmm0
; SSE41-NEXT: pmaxuw %xmm3, %xmm1		; SSE41-NEXT: pmaxuw %xmm3, %xmm1
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
▲ Show 20 Lines • Show All 361 Lines • ▼ Show 20 Lines	; AVX512-NEXT: retq
%1 = icmp uge <8 x i32> %a, %b		%1 = icmp uge <8 x i32> %a, %b
%2 = select <8 x i1> %1, <8 x i32> %a, <8 x i32> %b		%2 = select <8 x i1> %1, <8 x i32> %a, <8 x i32> %b
ret <8 x i32> %2		ret <8 x i32> %2
}		}

define <8 x i16> @max_ge_v8i16(<8 x i16> %a, <8 x i16> %b) {		define <8 x i16> @max_ge_v8i16(<8 x i16> %a, <8 x i16> %b) {
; SSE2-LABEL: max_ge_v8i16:		; SSE2-LABEL: max_ge_v8i16:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: psubusw %xmm0, %xmm1
; SSE2-NEXT: pxor %xmm2, %xmm1		; SSE2-NEXT: paddw %xmm1, %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: pmaxsw %xmm1, %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: max_ge_v8i16:		; SSE41-LABEL: max_ge_v8i16:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: pmaxuw %xmm1, %xmm0		; SSE41-NEXT: pmaxuw %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; SSE42-LABEL: max_ge_v8i16:		; SSE42-LABEL: max_ge_v8i16:
; SSE42: # %bb.0:		; SSE42: # %bb.0:
; SSE42-NEXT: pmaxuw %xmm1, %xmm0		; SSE42-NEXT: pmaxuw %xmm1, %xmm0
; SSE42-NEXT: retq		; SSE42-NEXT: retq
;		;
; AVX-LABEL: max_ge_v8i16:		; AVX-LABEL: max_ge_v8i16:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpmaxuw %xmm1, %xmm0, %xmm0		; AVX-NEXT: vpmaxuw %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
%1 = icmp uge <8 x i16> %a, %b		%1 = icmp uge <8 x i16> %a, %b
%2 = select <8 x i1> %1, <8 x i16> %a, <8 x i16> %b		%2 = select <8 x i1> %1, <8 x i16> %a, <8 x i16> %b
ret <8 x i16> %2		ret <8 x i16> %2
}		}

define <16 x i16> @max_ge_v16i16(<16 x i16> %a, <16 x i16> %b) {		define <16 x i16> @max_ge_v16i16(<16 x i16> %a, <16 x i16> %b) {
; SSE2-LABEL: max_ge_v16i16:		; SSE2-LABEL: max_ge_v16i16:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: psubusw %xmm0, %xmm2
; SSE2-NEXT: pxor %xmm4, %xmm2		; SSE2-NEXT: paddw %xmm2, %xmm0
; SSE2-NEXT: pxor %xmm4, %xmm0		; SSE2-NEXT: psubusw %xmm1, %xmm3
; SSE2-NEXT: pmaxsw %xmm2, %xmm0		; SSE2-NEXT: paddw %xmm3, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm0
; SSE2-NEXT: pxor %xmm4, %xmm3
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: pmaxsw %xmm3, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: max_ge_v16i16:		; SSE41-LABEL: max_ge_v16i16:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: pmaxuw %xmm2, %xmm0		; SSE41-NEXT: pmaxuw %xmm2, %xmm0
; SSE41-NEXT: pmaxuw %xmm3, %xmm1		; SSE41-NEXT: pmaxuw %xmm3, %xmm1
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
▲ Show 20 Lines • Show All 359 Lines • ▼ Show 20 Lines	; AVX512-NEXT: retq
%1 = icmp ult <8 x i32> %a, %b		%1 = icmp ult <8 x i32> %a, %b
%2 = select <8 x i1> %1, <8 x i32> %a, <8 x i32> %b		%2 = select <8 x i1> %1, <8 x i32> %a, <8 x i32> %b
ret <8 x i32> %2		ret <8 x i32> %2
}		}

define <8 x i16> @min_lt_v8i16(<8 x i16> %a, <8 x i16> %b) {		define <8 x i16> @min_lt_v8i16(<8 x i16> %a, <8 x i16> %b) {
; SSE2-LABEL: min_lt_v8i16:		; SSE2-LABEL: min_lt_v8i16:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pxor %xmm2, %xmm1		; SSE2-NEXT: psubusw %xmm1, %xmm2
; SSE2-NEXT: pxor %xmm2, %xmm0		; SSE2-NEXT: psubw %xmm2, %xmm0
; SSE2-NEXT: pminsw %xmm1, %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: min_lt_v8i16:		; SSE41-LABEL: min_lt_v8i16:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: pminuw %xmm1, %xmm0		; SSE41-NEXT: pminuw %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; SSE42-LABEL: min_lt_v8i16:		; SSE42-LABEL: min_lt_v8i16:
; SSE42: # %bb.0:		; SSE42: # %bb.0:
; SSE42-NEXT: pminuw %xmm1, %xmm0		; SSE42-NEXT: pminuw %xmm1, %xmm0
; SSE42-NEXT: retq		; SSE42-NEXT: retq
;		;
; AVX-LABEL: min_lt_v8i16:		; AVX-LABEL: min_lt_v8i16:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpminuw %xmm1, %xmm0, %xmm0		; AVX-NEXT: vpminuw %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
%1 = icmp ult <8 x i16> %a, %b		%1 = icmp ult <8 x i16> %a, %b
%2 = select <8 x i1> %1, <8 x i16> %a, <8 x i16> %b		%2 = select <8 x i1> %1, <8 x i16> %a, <8 x i16> %b
ret <8 x i16> %2		ret <8 x i16> %2
}		}

define <16 x i16> @min_lt_v16i16(<16 x i16> %a, <16 x i16> %b) {		define <16 x i16> @min_lt_v16i16(<16 x i16> %a, <16 x i16> %b) {
; SSE2-LABEL: min_lt_v16i16:		; SSE2-LABEL: min_lt_v16i16:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm4
; SSE2-NEXT: pxor %xmm4, %xmm2		; SSE2-NEXT: psubusw %xmm2, %xmm4
; SSE2-NEXT: pxor %xmm4, %xmm0		; SSE2-NEXT: psubw %xmm4, %xmm0
; SSE2-NEXT: pminsw %xmm2, %xmm0		; SSE2-NEXT: movdqa %xmm1, %xmm2
; SSE2-NEXT: pxor %xmm4, %xmm0		; SSE2-NEXT: psubusw %xmm3, %xmm2
; SSE2-NEXT: pxor %xmm4, %xmm3		; SSE2-NEXT: psubw %xmm2, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: pminsw %xmm3, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: min_lt_v16i16:		; SSE41-LABEL: min_lt_v16i16:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: pminuw %xmm2, %xmm0		; SSE41-NEXT: pminuw %xmm2, %xmm0
; SSE41-NEXT: pminuw %xmm3, %xmm1		; SSE41-NEXT: pminuw %xmm3, %xmm1
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
▲ Show 20 Lines • Show All 359 Lines • ▼ Show 20 Lines	; AVX512-NEXT: retq
%1 = icmp ule <8 x i32> %a, %b		%1 = icmp ule <8 x i32> %a, %b
%2 = select <8 x i1> %1, <8 x i32> %a, <8 x i32> %b		%2 = select <8 x i1> %1, <8 x i32> %a, <8 x i32> %b
ret <8 x i32> %2		ret <8 x i32> %2
}		}

define <8 x i16> @min_le_v8i16(<8 x i16> %a, <8 x i16> %b) {		define <8 x i16> @min_le_v8i16(<8 x i16> %a, <8 x i16> %b) {
; SSE2-LABEL: min_le_v8i16:		; SSE2-LABEL: min_le_v8i16:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pxor %xmm2, %xmm1		; SSE2-NEXT: psubusw %xmm1, %xmm2
; SSE2-NEXT: pxor %xmm2, %xmm0		; SSE2-NEXT: psubw %xmm2, %xmm0
; SSE2-NEXT: pminsw %xmm1, %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: min_le_v8i16:		; SSE41-LABEL: min_le_v8i16:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: pminuw %xmm1, %xmm0		; SSE41-NEXT: pminuw %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; SSE42-LABEL: min_le_v8i16:		; SSE42-LABEL: min_le_v8i16:
; SSE42: # %bb.0:		; SSE42: # %bb.0:
; SSE42-NEXT: pminuw %xmm1, %xmm0		; SSE42-NEXT: pminuw %xmm1, %xmm0
; SSE42-NEXT: retq		; SSE42-NEXT: retq
;		;
; AVX-LABEL: min_le_v8i16:		; AVX-LABEL: min_le_v8i16:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpminuw %xmm1, %xmm0, %xmm0		; AVX-NEXT: vpminuw %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
%1 = icmp ule <8 x i16> %a, %b		%1 = icmp ule <8 x i16> %a, %b
%2 = select <8 x i1> %1, <8 x i16> %a, <8 x i16> %b		%2 = select <8 x i1> %1, <8 x i16> %a, <8 x i16> %b
ret <8 x i16> %2		ret <8 x i16> %2
}		}

define <16 x i16> @min_le_v16i16(<16 x i16> %a, <16 x i16> %b) {		define <16 x i16> @min_le_v16i16(<16 x i16> %a, <16 x i16> %b) {
; SSE2-LABEL: min_le_v16i16:		; SSE2-LABEL: min_le_v16i16:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm4
; SSE2-NEXT: pxor %xmm4, %xmm2		; SSE2-NEXT: psubusw %xmm2, %xmm4
; SSE2-NEXT: pxor %xmm4, %xmm0		; SSE2-NEXT: psubw %xmm4, %xmm0
; SSE2-NEXT: pminsw %xmm2, %xmm0		; SSE2-NEXT: movdqa %xmm1, %xmm2
; SSE2-NEXT: pxor %xmm4, %xmm0		; SSE2-NEXT: psubusw %xmm3, %xmm2
; SSE2-NEXT: pxor %xmm4, %xmm3		; SSE2-NEXT: psubw %xmm2, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: pminsw %xmm3, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: min_le_v16i16:		; SSE41-LABEL: min_le_v16i16:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: pminuw %xmm2, %xmm0		; SSE41-NEXT: pminuw %xmm2, %xmm0
; SSE41-NEXT: pminuw %xmm3, %xmm1		; SSE41-NEXT: pminuw %xmm3, %xmm1
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
▲ Show 20 Lines • Show All 565 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-reduce-umax.ll

Show First 20 Lines • Show All 1,272 Lines • ▼ Show 20 Lines
; vXi16		; vXi16
;		;

define i16 @test_v2i16(<2 x i16> %a0) {		define i16 @test_v2i16(<2 x i16> %a0) {
; SSE2-LABEL: test_v2i16:		; SSE2-LABEL: test_v2i16:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm1
; SSE2-NEXT: psrld $16, %xmm1		; SSE2-NEXT: psrld $16, %xmm1
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: psubusw %xmm0, %xmm1
; SSE2-NEXT: pxor %xmm2, %xmm0		; SSE2-NEXT: paddw %xmm0, %xmm1
; SSE2-NEXT: pxor %xmm2, %xmm1
; SSE2-NEXT: pmaxsw %xmm0, %xmm1
; SSE2-NEXT: movd %xmm1, %eax		; SSE2-NEXT: movd %xmm1, %eax
; SSE2-NEXT: xorl $32768, %eax # imm = 0x8000
; SSE2-NEXT: # kill: def $ax killed $ax killed $eax		; SSE2-NEXT: # kill: def $ax killed $ax killed $eax
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test_v2i16:		; SSE4-LABEL: test_v2i16:
; SSE4: # %bb.0:		; SSE4: # %bb.0:
; SSE4-NEXT: movdqa %xmm0, %xmm1		; SSE4-NEXT: movdqa %xmm0, %xmm1
; SSE4-NEXT: psrld $16, %xmm1		; SSE4-NEXT: psrld $16, %xmm1
; SSE4-NEXT: pmaxuw %xmm0, %xmm1		; SSE4-NEXT: pmaxuw %xmm0, %xmm1
Show All 19 Lines	; AVX512-NEXT: retq
%1 = call i16 @llvm.vector.reduce.umax.v2i16(<2 x i16> %a0)		%1 = call i16 @llvm.vector.reduce.umax.v2i16(<2 x i16> %a0)
ret i16 %1		ret i16 %1
}		}

define i16 @test_v4i16(<4 x i16> %a0) {		define i16 @test_v4i16(<4 x i16> %a0) {
; SSE2-LABEL: test_v4i16:		; SSE2-LABEL: test_v4i16:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]		; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: psubusw %xmm0, %xmm1
; SSE2-NEXT: pxor %xmm2, %xmm0		; SSE2-NEXT: paddw %xmm0, %xmm1
; SSE2-NEXT: pxor %xmm2, %xmm1
; SSE2-NEXT: pmaxsw %xmm0, %xmm1
; SSE2-NEXT: movdqa %xmm1, %xmm0		; SSE2-NEXT: movdqa %xmm1, %xmm0
; SSE2-NEXT: psrld $16, %xmm0		; SSE2-NEXT: psrld $16, %xmm0
; SSE2-NEXT: pmaxsw %xmm1, %xmm0		; SSE2-NEXT: psubusw %xmm1, %xmm0
		; SSE2-NEXT: paddw %xmm1, %xmm0
; SSE2-NEXT: movd %xmm0, %eax		; SSE2-NEXT: movd %xmm0, %eax
; SSE2-NEXT: xorl $32768, %eax # imm = 0x8000
; SSE2-NEXT: # kill: def $ax killed $ax killed $eax		; SSE2-NEXT: # kill: def $ax killed $ax killed $eax
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test_v4i16:		; SSE4-LABEL: test_v4i16:
; SSE4: # %bb.0:		; SSE4: # %bb.0:
; SSE4-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]		; SSE4-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
; SSE4-NEXT: pmaxuw %xmm0, %xmm1		; SSE4-NEXT: pmaxuw %xmm0, %xmm1
; SSE4-NEXT: movdqa %xmm1, %xmm0		; SSE4-NEXT: movdqa %xmm1, %xmm0
Show All 25 Lines	; AVX512-NEXT: retq
%1 = call i16 @llvm.vector.reduce.umax.v4i16(<4 x i16> %a0)		%1 = call i16 @llvm.vector.reduce.umax.v4i16(<4 x i16> %a0)
ret i16 %1		ret i16 %1
}		}

define i16 @test_v8i16(<8 x i16> %a0) {		define i16 @test_v8i16(<8 x i16> %a0) {
; SSE2-LABEL: test_v8i16:		; SSE2-LABEL: test_v8i16:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: psubusw %xmm0, %xmm1
; SSE2-NEXT: pxor %xmm2, %xmm0		; SSE2-NEXT: paddw %xmm0, %xmm1
; SSE2-NEXT: pxor %xmm2, %xmm1
; SSE2-NEXT: pmaxsw %xmm0, %xmm1
; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]
; SSE2-NEXT: pmaxsw %xmm1, %xmm0		; SSE2-NEXT: psubusw %xmm1, %xmm0
		; SSE2-NEXT: paddw %xmm1, %xmm0
; SSE2-NEXT: movdqa %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm1
; SSE2-NEXT: psrld $16, %xmm1		; SSE2-NEXT: psrld $16, %xmm1
; SSE2-NEXT: pmaxsw %xmm0, %xmm1		; SSE2-NEXT: psubusw %xmm0, %xmm1
		; SSE2-NEXT: paddw %xmm0, %xmm1
; SSE2-NEXT: movd %xmm1, %eax		; SSE2-NEXT: movd %xmm1, %eax
; SSE2-NEXT: xorl $32768, %eax # imm = 0x8000
; SSE2-NEXT: # kill: def $ax killed $ax killed $eax		; SSE2-NEXT: # kill: def $ax killed $ax killed $eax
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test_v8i16:		; SSE4-LABEL: test_v8i16:
; SSE4: # %bb.0:		; SSE4: # %bb.0:
; SSE4-NEXT: pcmpeqd %xmm1, %xmm1		; SSE4-NEXT: pcmpeqd %xmm1, %xmm1
; SSE4-NEXT: pxor %xmm0, %xmm1		; SSE4-NEXT: pxor %xmm0, %xmm1
; SSE4-NEXT: phminposuw %xmm1, %xmm0		; SSE4-NEXT: phminposuw %xmm1, %xmm0
Show All 33 Lines
; AVX512VL-NEXT: retq		; AVX512VL-NEXT: retq
%1 = call i16 @llvm.vector.reduce.umax.v8i16(<8 x i16> %a0)		%1 = call i16 @llvm.vector.reduce.umax.v8i16(<8 x i16> %a0)
ret i16 %1		ret i16 %1
}		}

define i16 @test_v16i16(<16 x i16> %a0) {		define i16 @test_v16i16(<16 x i16> %a0) {
; SSE2-LABEL: test_v16i16:		; SSE2-LABEL: test_v16i16:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: psubusw %xmm0, %xmm1
; SSE2-NEXT: pxor %xmm2, %xmm1		; SSE2-NEXT: paddw %xmm0, %xmm1
; SSE2-NEXT: pxor %xmm2, %xmm0		; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[2,3,2,3]
; SSE2-NEXT: pmaxsw %xmm1, %xmm0		; SSE2-NEXT: psubusw %xmm1, %xmm0
; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; SSE2-NEXT: paddw %xmm1, %xmm0
; SSE2-NEXT: pmaxsw %xmm0, %xmm1		; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; SSE2-NEXT: psubusw %xmm0, %xmm1
; SSE2-NEXT: pmaxsw %xmm1, %xmm0		; SSE2-NEXT: paddw %xmm0, %xmm1
; SSE2-NEXT: movdqa %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm1, %xmm0
; SSE2-NEXT: psrld $16, %xmm1		; SSE2-NEXT: psrld $16, %xmm0
; SSE2-NEXT: pmaxsw %xmm0, %xmm1		; SSE2-NEXT: psubusw %xmm1, %xmm0
; SSE2-NEXT: movd %xmm1, %eax		; SSE2-NEXT: paddw %xmm1, %xmm0
; SSE2-NEXT: xorl $32768, %eax # imm = 0x8000		; SSE2-NEXT: movd %xmm0, %eax
; SSE2-NEXT: # kill: def $ax killed $ax killed $eax		; SSE2-NEXT: # kill: def $ax killed $ax killed $eax
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test_v16i16:		; SSE4-LABEL: test_v16i16:
; SSE4: # %bb.0:		; SSE4: # %bb.0:
; SSE4-NEXT: pmaxuw %xmm1, %xmm0		; SSE4-NEXT: pmaxuw %xmm1, %xmm0
; SSE4-NEXT: pcmpeqd %xmm1, %xmm1		; SSE4-NEXT: pcmpeqd %xmm1, %xmm1
; SSE4-NEXT: pxor %xmm0, %xmm1		; SSE4-NEXT: pxor %xmm0, %xmm1
▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
; AVX512VL-NEXT: retq		; AVX512VL-NEXT: retq
%1 = call i16 @llvm.vector.reduce.umax.v16i16(<16 x i16> %a0)		%1 = call i16 @llvm.vector.reduce.umax.v16i16(<16 x i16> %a0)
ret i16 %1		ret i16 %1
}		}

define i16 @test_v32i16(<32 x i16> %a0) {		define i16 @test_v32i16(<32 x i16> %a0) {
; SSE2-LABEL: test_v32i16:		; SSE2-LABEL: test_v32i16:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: psubusw %xmm0, %xmm2
; SSE2-NEXT: pxor %xmm4, %xmm3		; SSE2-NEXT: paddw %xmm0, %xmm2
; SSE2-NEXT: pxor %xmm4, %xmm1		; SSE2-NEXT: psubusw %xmm1, %xmm3
; SSE2-NEXT: pmaxsw %xmm3, %xmm1		; SSE2-NEXT: paddw %xmm1, %xmm3
; SSE2-NEXT: pxor %xmm4, %xmm2		; SSE2-NEXT: psubusw %xmm2, %xmm3
; SSE2-NEXT: pmaxsw %xmm1, %xmm2		; SSE2-NEXT: paddw %xmm2, %xmm3
; SSE2-NEXT: pxor %xmm4, %xmm0		; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm3[2,3,2,3]
; SSE2-NEXT: pmaxsw %xmm2, %xmm0		; SSE2-NEXT: psubusw %xmm3, %xmm0
; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; SSE2-NEXT: paddw %xmm3, %xmm0
; SSE2-NEXT: pmaxsw %xmm0, %xmm1		; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; SSE2-NEXT: psubusw %xmm0, %xmm1
; SSE2-NEXT: pmaxsw %xmm1, %xmm0		; SSE2-NEXT: paddw %xmm0, %xmm1
; SSE2-NEXT: movdqa %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm1, %xmm0
; SSE2-NEXT: psrld $16, %xmm1		; SSE2-NEXT: psrld $16, %xmm0
; SSE2-NEXT: pmaxsw %xmm0, %xmm1		; SSE2-NEXT: psubusw %xmm1, %xmm0
; SSE2-NEXT: movd %xmm1, %eax		; SSE2-NEXT: paddw %xmm1, %xmm0
; SSE2-NEXT: xorl $32768, %eax # imm = 0x8000		; SSE2-NEXT: movd %xmm0, %eax
; SSE2-NEXT: # kill: def $ax killed $ax killed $eax		; SSE2-NEXT: # kill: def $ax killed $ax killed $eax
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test_v32i16:		; SSE4-LABEL: test_v32i16:
; SSE4: # %bb.0:		; SSE4: # %bb.0:
; SSE4-NEXT: pmaxuw %xmm3, %xmm1		; SSE4-NEXT: pmaxuw %xmm3, %xmm1
; SSE4-NEXT: pmaxuw %xmm2, %xmm1		; SSE4-NEXT: pmaxuw %xmm2, %xmm1
; SSE4-NEXT: pmaxuw %xmm0, %xmm1		; SSE4-NEXT: pmaxuw %xmm0, %xmm1
▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
; AVX512VL-NEXT: retq		; AVX512VL-NEXT: retq
%1 = call i16 @llvm.vector.reduce.umax.v32i16(<32 x i16> %a0)		%1 = call i16 @llvm.vector.reduce.umax.v32i16(<32 x i16> %a0)
ret i16 %1		ret i16 %1
}		}

define i16 @test_v64i16(<64 x i16> %a0) {		define i16 @test_v64i16(<64 x i16> %a0) {
; SSE2-LABEL: test_v64i16:		; SSE2-LABEL: test_v64i16:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm8 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: psubusw %xmm1, %xmm5
; SSE2-NEXT: pxor %xmm8, %xmm6		; SSE2-NEXT: paddw %xmm1, %xmm5
; SSE2-NEXT: pxor %xmm8, %xmm2		; SSE2-NEXT: psubusw %xmm3, %xmm7
; SSE2-NEXT: pmaxsw %xmm6, %xmm2		; SSE2-NEXT: paddw %xmm3, %xmm7
; SSE2-NEXT: pxor %xmm8, %xmm4		; SSE2-NEXT: psubusw %xmm0, %xmm4
; SSE2-NEXT: pmaxsw %xmm2, %xmm4		; SSE2-NEXT: paddw %xmm0, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm0		; SSE2-NEXT: psubusw %xmm2, %xmm6
; SSE2-NEXT: pxor %xmm8, %xmm7		; SSE2-NEXT: paddw %xmm2, %xmm6
; SSE2-NEXT: pxor %xmm8, %xmm3		; SSE2-NEXT: psubusw %xmm4, %xmm6
; SSE2-NEXT: pmaxsw %xmm7, %xmm3		; SSE2-NEXT: paddw %xmm4, %xmm6
; SSE2-NEXT: pxor %xmm8, %xmm5		; SSE2-NEXT: psubusw %xmm5, %xmm7
; SSE2-NEXT: pmaxsw %xmm3, %xmm5		; SSE2-NEXT: paddw %xmm5, %xmm7
; SSE2-NEXT: pxor %xmm8, %xmm1		; SSE2-NEXT: psubusw %xmm6, %xmm7
; SSE2-NEXT: pmaxsw %xmm5, %xmm1		; SSE2-NEXT: paddw %xmm6, %xmm7
; SSE2-NEXT: pmaxsw %xmm4, %xmm1		; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm7[2,3,2,3]
; SSE2-NEXT: pmaxsw %xmm0, %xmm1		; SSE2-NEXT: psubusw %xmm7, %xmm0
; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[2,3,2,3]		; SSE2-NEXT: paddw %xmm7, %xmm0
; SSE2-NEXT: pmaxsw %xmm1, %xmm0
; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]		; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
; SSE2-NEXT: pmaxsw %xmm0, %xmm1		; SSE2-NEXT: psubusw %xmm0, %xmm1
		; SSE2-NEXT: paddw %xmm0, %xmm1
; SSE2-NEXT: movdqa %xmm1, %xmm0		; SSE2-NEXT: movdqa %xmm1, %xmm0
; SSE2-NEXT: psrld $16, %xmm0		; SSE2-NEXT: psrld $16, %xmm0
; SSE2-NEXT: pmaxsw %xmm1, %xmm0		; SSE2-NEXT: psubusw %xmm1, %xmm0
		; SSE2-NEXT: paddw %xmm1, %xmm0
; SSE2-NEXT: movd %xmm0, %eax		; SSE2-NEXT: movd %xmm0, %eax
; SSE2-NEXT: xorl $32768, %eax # imm = 0x8000
; SSE2-NEXT: # kill: def $ax killed $ax killed $eax		; SSE2-NEXT: # kill: def $ax killed $ax killed $eax
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test_v64i16:		; SSE4-LABEL: test_v64i16:
; SSE4: # %bb.0:		; SSE4: # %bb.0:
; SSE4-NEXT: pmaxuw %xmm7, %xmm3		; SSE4-NEXT: pmaxuw %xmm7, %xmm3
; SSE4-NEXT: pmaxuw %xmm5, %xmm3		; SSE4-NEXT: pmaxuw %xmm5, %xmm3
; SSE4-NEXT: pmaxuw %xmm1, %xmm3		; SSE4-NEXT: pmaxuw %xmm1, %xmm3
▲ Show 20 Lines • Show All 609 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-reduce-umin.ll

Show First 20 Lines • Show All 1,276 Lines • ▼ Show 20 Lines
; vXi16		; vXi16
;		;

define i16 @test_v2i16(<2 x i16> %a0) {		define i16 @test_v2i16(<2 x i16> %a0) {
; SSE2-LABEL: test_v2i16:		; SSE2-LABEL: test_v2i16:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm1
; SSE2-NEXT: psrld $16, %xmm1		; SSE2-NEXT: psrld $16, %xmm1
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pxor %xmm2, %xmm0		; SSE2-NEXT: psubusw %xmm1, %xmm2
; SSE2-NEXT: pxor %xmm2, %xmm1		; SSE2-NEXT: psubw %xmm2, %xmm0
; SSE2-NEXT: pminsw %xmm0, %xmm1		; SSE2-NEXT: movd %xmm0, %eax
; SSE2-NEXT: movd %xmm1, %eax
; SSE2-NEXT: xorl $32768, %eax # imm = 0x8000
; SSE2-NEXT: # kill: def $ax killed $ax killed $eax		; SSE2-NEXT: # kill: def $ax killed $ax killed $eax
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test_v2i16:		; SSE4-LABEL: test_v2i16:
; SSE4: # %bb.0:		; SSE4: # %bb.0:
; SSE4-NEXT: movdqa %xmm0, %xmm1		; SSE4-NEXT: movdqa %xmm0, %xmm1
; SSE4-NEXT: psrld $16, %xmm1		; SSE4-NEXT: psrld $16, %xmm1
; SSE4-NEXT: pminuw %xmm0, %xmm1		; SSE4-NEXT: pminuw %xmm0, %xmm1
Show All 19 Lines	; AVX512-NEXT: retq
%1 = call i16 @llvm.vector.reduce.umin.v2i16(<2 x i16> %a0)		%1 = call i16 @llvm.vector.reduce.umin.v2i16(<2 x i16> %a0)
ret i16 %1		ret i16 %1
}		}

define i16 @test_v4i16(<4 x i16> %a0) {		define i16 @test_v4i16(<4 x i16> %a0) {
; SSE2-LABEL: test_v4i16:		; SSE2-LABEL: test_v4i16:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]		; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pxor %xmm2, %xmm0		; SSE2-NEXT: psubusw %xmm1, %xmm2
; SSE2-NEXT: pxor %xmm2, %xmm1		; SSE2-NEXT: psubw %xmm2, %xmm0
; SSE2-NEXT: pminsw %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm1
; SSE2-NEXT: movdqa %xmm1, %xmm0		; SSE2-NEXT: psrld $16, %xmm1
; SSE2-NEXT: psrld $16, %xmm0		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pminsw %xmm1, %xmm0		; SSE2-NEXT: psubusw %xmm1, %xmm2
		; SSE2-NEXT: psubw %xmm2, %xmm0
; SSE2-NEXT: movd %xmm0, %eax		; SSE2-NEXT: movd %xmm0, %eax
; SSE2-NEXT: xorl $32768, %eax # imm = 0x8000
; SSE2-NEXT: # kill: def $ax killed $ax killed $eax		; SSE2-NEXT: # kill: def $ax killed $ax killed $eax
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test_v4i16:		; SSE4-LABEL: test_v4i16:
; SSE4: # %bb.0:		; SSE4: # %bb.0:
; SSE4-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]		; SSE4-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
; SSE4-NEXT: pminuw %xmm0, %xmm1		; SSE4-NEXT: pminuw %xmm0, %xmm1
; SSE4-NEXT: movdqa %xmm1, %xmm0		; SSE4-NEXT: movdqa %xmm1, %xmm0
Show All 25 Lines	; AVX512-NEXT: retq
%1 = call i16 @llvm.vector.reduce.umin.v4i16(<4 x i16> %a0)		%1 = call i16 @llvm.vector.reduce.umin.v4i16(<4 x i16> %a0)
ret i16 %1		ret i16 %1
}		}

define i16 @test_v8i16(<8 x i16> %a0) {		define i16 @test_v8i16(<8 x i16> %a0) {
; SSE2-LABEL: test_v8i16:		; SSE2-LABEL: test_v8i16:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pxor %xmm2, %xmm0		; SSE2-NEXT: psubusw %xmm1, %xmm2
; SSE2-NEXT: pxor %xmm2, %xmm1		; SSE2-NEXT: psubw %xmm2, %xmm0
; SSE2-NEXT: pminsw %xmm0, %xmm1		; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pminsw %xmm1, %xmm0		; SSE2-NEXT: psubusw %xmm1, %xmm2
		; SSE2-NEXT: psubw %xmm2, %xmm0
; SSE2-NEXT: movdqa %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm1
; SSE2-NEXT: psrld $16, %xmm1		; SSE2-NEXT: psrld $16, %xmm1
; SSE2-NEXT: pminsw %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: movd %xmm1, %eax		; SSE2-NEXT: psubusw %xmm1, %xmm2
; SSE2-NEXT: xorl $32768, %eax # imm = 0x8000		; SSE2-NEXT: psubw %xmm2, %xmm0
		; SSE2-NEXT: movd %xmm0, %eax
; SSE2-NEXT: # kill: def $ax killed $ax killed $eax		; SSE2-NEXT: # kill: def $ax killed $ax killed $eax
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test_v8i16:		; SSE4-LABEL: test_v8i16:
; SSE4: # %bb.0:		; SSE4: # %bb.0:
; SSE4-NEXT: phminposuw %xmm0, %xmm0		; SSE4-NEXT: phminposuw %xmm0, %xmm0
; SSE4-NEXT: movd %xmm0, %eax		; SSE4-NEXT: movd %xmm0, %eax
; SSE4-NEXT: # kill: def $ax killed $ax killed $eax		; SSE4-NEXT: # kill: def $ax killed $ax killed $eax
Show All 14 Lines
; AVX512-NEXT: retq		; AVX512-NEXT: retq
%1 = call i16 @llvm.vector.reduce.umin.v8i16(<8 x i16> %a0)		%1 = call i16 @llvm.vector.reduce.umin.v8i16(<8 x i16> %a0)
ret i16 %1		ret i16 %1
}		}

define i16 @test_v16i16(<16 x i16> %a0) {		define i16 @test_v16i16(<16 x i16> %a0) {
; SSE2-LABEL: test_v16i16:		; SSE2-LABEL: test_v16i16:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pxor %xmm2, %xmm1		; SSE2-NEXT: psubusw %xmm1, %xmm2
; SSE2-NEXT: pxor %xmm2, %xmm0		; SSE2-NEXT: psubw %xmm2, %xmm0
; SSE2-NEXT: pminsw %xmm1, %xmm0
; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
; SSE2-NEXT: pminsw %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; SSE2-NEXT: psubusw %xmm1, %xmm2
; SSE2-NEXT: pminsw %xmm1, %xmm0		; SSE2-NEXT: psubw %xmm2, %xmm0
		; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
		; SSE2-NEXT: movdqa %xmm0, %xmm2
		; SSE2-NEXT: psubusw %xmm1, %xmm2
		; SSE2-NEXT: psubw %xmm2, %xmm0
; SSE2-NEXT: movdqa %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm1
; SSE2-NEXT: psrld $16, %xmm1		; SSE2-NEXT: psrld $16, %xmm1
; SSE2-NEXT: pminsw %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: movd %xmm1, %eax		; SSE2-NEXT: psubusw %xmm1, %xmm2
; SSE2-NEXT: xorl $32768, %eax # imm = 0x8000		; SSE2-NEXT: psubw %xmm2, %xmm0
		; SSE2-NEXT: movd %xmm0, %eax
; SSE2-NEXT: # kill: def $ax killed $ax killed $eax		; SSE2-NEXT: # kill: def $ax killed $ax killed $eax
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test_v16i16:		; SSE4-LABEL: test_v16i16:
; SSE4: # %bb.0:		; SSE4: # %bb.0:
; SSE4-NEXT: pminuw %xmm1, %xmm0		; SSE4-NEXT: pminuw %xmm1, %xmm0
; SSE4-NEXT: phminposuw %xmm0, %xmm0		; SSE4-NEXT: phminposuw %xmm0, %xmm0
; SSE4-NEXT: movd %xmm0, %eax		; SSE4-NEXT: movd %xmm0, %eax
Show All 31 Lines
; AVX512-NEXT: retq		; AVX512-NEXT: retq
%1 = call i16 @llvm.vector.reduce.umin.v16i16(<16 x i16> %a0)		%1 = call i16 @llvm.vector.reduce.umin.v16i16(<16 x i16> %a0)
ret i16 %1		ret i16 %1
}		}

define i16 @test_v32i16(<32 x i16> %a0) {		define i16 @test_v32i16(<32 x i16> %a0) {
; SSE2-LABEL: test_v32i16:		; SSE2-LABEL: test_v32i16:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: pxor %xmm4, %xmm3		; SSE2-NEXT: psubusw %xmm3, %xmm4
; SSE2-NEXT: pxor %xmm4, %xmm1		; SSE2-NEXT: psubw %xmm4, %xmm1
; SSE2-NEXT: pminsw %xmm3, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm3
; SSE2-NEXT: pxor %xmm4, %xmm2		; SSE2-NEXT: psubusw %xmm2, %xmm3
; SSE2-NEXT: pminsw %xmm1, %xmm2		; SSE2-NEXT: psubw %xmm3, %xmm0
; SSE2-NEXT: pxor %xmm4, %xmm0		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pminsw %xmm2, %xmm0		; SSE2-NEXT: psubusw %xmm1, %xmm2
		; SSE2-NEXT: psubw %xmm2, %xmm0
; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]		; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
; SSE2-NEXT: pminsw %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,1,1]		; SSE2-NEXT: psubusw %xmm1, %xmm2
; SSE2-NEXT: pminsw %xmm1, %xmm0		; SSE2-NEXT: psubw %xmm2, %xmm0
		; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
		; SSE2-NEXT: movdqa %xmm0, %xmm2
		; SSE2-NEXT: psubusw %xmm1, %xmm2
		; SSE2-NEXT: psubw %xmm2, %xmm0
; SSE2-NEXT: movdqa %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm1
; SSE2-NEXT: psrld $16, %xmm1		; SSE2-NEXT: psrld $16, %xmm1
; SSE2-NEXT: pminsw %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: movd %xmm1, %eax		; SSE2-NEXT: psubusw %xmm1, %xmm2
; SSE2-NEXT: xorl $32768, %eax # imm = 0x8000		; SSE2-NEXT: psubw %xmm2, %xmm0
		; SSE2-NEXT: movd %xmm0, %eax
; SSE2-NEXT: # kill: def $ax killed $ax killed $eax		; SSE2-NEXT: # kill: def $ax killed $ax killed $eax
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test_v32i16:		; SSE4-LABEL: test_v32i16:
; SSE4: # %bb.0:		; SSE4: # %bb.0:
; SSE4-NEXT: pminuw %xmm3, %xmm1		; SSE4-NEXT: pminuw %xmm3, %xmm1
; SSE4-NEXT: pminuw %xmm2, %xmm1		; SSE4-NEXT: pminuw %xmm2, %xmm1
; SSE4-NEXT: pminuw %xmm0, %xmm1		; SSE4-NEXT: pminuw %xmm0, %xmm1
Show All 39 Lines
; AVX512-NEXT: retq		; AVX512-NEXT: retq
%1 = call i16 @llvm.vector.reduce.umin.v32i16(<32 x i16> %a0)		%1 = call i16 @llvm.vector.reduce.umin.v32i16(<32 x i16> %a0)
ret i16 %1		ret i16 %1
}		}

define i16 @test_v64i16(<64 x i16> %a0) {		define i16 @test_v64i16(<64 x i16> %a0) {
; SSE2-LABEL: test_v64i16:		; SSE2-LABEL: test_v64i16:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm8 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm2, %xmm8
; SSE2-NEXT: pxor %xmm8, %xmm6		; SSE2-NEXT: psubusw %xmm6, %xmm8
; SSE2-NEXT: pxor %xmm8, %xmm2		; SSE2-NEXT: psubw %xmm8, %xmm2
; SSE2-NEXT: pminsw %xmm6, %xmm2		; SSE2-NEXT: movdqa %xmm0, %xmm6
; SSE2-NEXT: pxor %xmm8, %xmm4		; SSE2-NEXT: psubusw %xmm4, %xmm6
; SSE2-NEXT: pminsw %xmm2, %xmm4		; SSE2-NEXT: psubw %xmm6, %xmm0
; SSE2-NEXT: pxor %xmm8, %xmm0		; SSE2-NEXT: movdqa %xmm3, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm7		; SSE2-NEXT: psubusw %xmm7, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm3		; SSE2-NEXT: psubw %xmm4, %xmm3
; SSE2-NEXT: pminsw %xmm7, %xmm3		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm5		; SSE2-NEXT: psubusw %xmm5, %xmm4
; SSE2-NEXT: pminsw %xmm3, %xmm5		; SSE2-NEXT: psubw %xmm4, %xmm1
; SSE2-NEXT: pxor %xmm8, %xmm1		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: pminsw %xmm5, %xmm1		; SSE2-NEXT: psubusw %xmm3, %xmm4
; SSE2-NEXT: pminsw %xmm4, %xmm1		; SSE2-NEXT: psubw %xmm4, %xmm1
; SSE2-NEXT: pminsw %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm3
; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[2,3,2,3]		; SSE2-NEXT: psubusw %xmm2, %xmm3
; SSE2-NEXT: pminsw %xmm1, %xmm0		; SSE2-NEXT: psubw %xmm3, %xmm0
		; SSE2-NEXT: movdqa %xmm0, %xmm2
		; SSE2-NEXT: psubusw %xmm1, %xmm2
		; SSE2-NEXT: psubw %xmm2, %xmm0
		; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,2,3]
		; SSE2-NEXT: movdqa %xmm0, %xmm2
		; SSE2-NEXT: psubusw %xmm1, %xmm2
		; SSE2-NEXT: psubw %xmm2, %xmm0
; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]		; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,1,1]
; SSE2-NEXT: pminsw %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: movdqa %xmm1, %xmm0		; SSE2-NEXT: psubusw %xmm1, %xmm2
; SSE2-NEXT: psrld $16, %xmm0		; SSE2-NEXT: psubw %xmm2, %xmm0
; SSE2-NEXT: pminsw %xmm1, %xmm0		; SSE2-NEXT: movdqa %xmm0, %xmm1
		; SSE2-NEXT: psrld $16, %xmm1
		; SSE2-NEXT: movdqa %xmm0, %xmm2
		; SSE2-NEXT: psubusw %xmm1, %xmm2
		; SSE2-NEXT: psubw %xmm2, %xmm0
; SSE2-NEXT: movd %xmm0, %eax		; SSE2-NEXT: movd %xmm0, %eax
; SSE2-NEXT: xorl $32768, %eax # imm = 0x8000
; SSE2-NEXT: # kill: def $ax killed $ax killed $eax		; SSE2-NEXT: # kill: def $ax killed $ax killed $eax
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test_v64i16:		; SSE4-LABEL: test_v64i16:
; SSE4: # %bb.0:		; SSE4: # %bb.0:
; SSE4-NEXT: pminuw %xmm7, %xmm3		; SSE4-NEXT: pminuw %xmm7, %xmm3
; SSE4-NEXT: pminuw %xmm5, %xmm3		; SSE4-NEXT: pminuw %xmm5, %xmm3
; SSE4-NEXT: pminuw %xmm1, %xmm3		; SSE4-NEXT: pminuw %xmm1, %xmm3
▲ Show 20 Lines • Show All 482 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-trunc-usat.ll

Show First 20 Lines • Show All 4,255 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq
%3 = trunc <16 x i32> %2 to <16 x i8>		%3 = trunc <16 x i32> %2 to <16 x i8>
store <16 x i8> %3, <16 x i8>* %p1		store <16 x i8> %3, <16 x i8>* %p1
ret void		ret void
}		}

define <8 x i8> @trunc_usat_v8i16_v8i8(<8 x i16> %a0) {		define <8 x i8> @trunc_usat_v8i16_v8i8(<8 x i16> %a0) {
; SSE2-LABEL: trunc_usat_v8i16_v8i8:		; SSE2-LABEL: trunc_usat_v8i16_v8i8:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm1
; SSE2-NEXT: pxor %xmm1, %xmm0		; SSE2-NEXT: psubusw {{.*}}(%rip), %xmm1
; SSE2-NEXT: pminsw {{.*}}(%rip), %xmm0		; SSE2-NEXT: psubw %xmm1, %xmm0
; SSE2-NEXT: pxor %xmm1, %xmm0
; SSE2-NEXT: packuswb %xmm0, %xmm0		; SSE2-NEXT: packuswb %xmm0, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSSE3-LABEL: trunc_usat_v8i16_v8i8:		; SSSE3-LABEL: trunc_usat_v8i16_v8i8:
; SSSE3: # %bb.0:		; SSSE3: # %bb.0:
; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSSE3-NEXT: movdqa %xmm0, %xmm1
; SSSE3-NEXT: pxor %xmm1, %xmm0		; SSSE3-NEXT: psubusw {{.*}}(%rip), %xmm1
; SSSE3-NEXT: pminsw {{.*}}(%rip), %xmm0		; SSSE3-NEXT: psubw %xmm1, %xmm0
; SSSE3-NEXT: pxor %xmm1, %xmm0
; SSSE3-NEXT: packuswb %xmm0, %xmm0		; SSSE3-NEXT: packuswb %xmm0, %xmm0
; SSSE3-NEXT: retq		; SSSE3-NEXT: retq
;		;
; SSE41-LABEL: trunc_usat_v8i16_v8i8:		; SSE41-LABEL: trunc_usat_v8i16_v8i8:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: pminuw {{.*}}(%rip), %xmm0		; SSE41-NEXT: pminuw {{.*}}(%rip), %xmm0
; SSE41-NEXT: packuswb %xmm0, %xmm0		; SSE41-NEXT: packuswb %xmm0, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
Show All 37 Lines	; SKX-NEXT: retq
%2 = select <8 x i1> %1, <8 x i16> %a0, <8 x i16> <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>		%2 = select <8 x i1> %1, <8 x i16> %a0, <8 x i16> <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>
%3 = trunc <8 x i16> %2 to <8 x i8>		%3 = trunc <8 x i16> %2 to <8 x i8>
ret <8 x i8> %3		ret <8 x i8> %3
}		}

define void @trunc_usat_v8i16_v8i8_store(<8 x i16> %a0, <8 x i8> *%p1) {		define void @trunc_usat_v8i16_v8i8_store(<8 x i16> %a0, <8 x i8> *%p1) {
; SSE2-LABEL: trunc_usat_v8i16_v8i8_store:		; SSE2-LABEL: trunc_usat_v8i16_v8i8_store:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm1
; SSE2-NEXT: pxor %xmm1, %xmm0		; SSE2-NEXT: psubusw {{.*}}(%rip), %xmm1
; SSE2-NEXT: pminsw {{.*}}(%rip), %xmm0		; SSE2-NEXT: psubw %xmm1, %xmm0
; SSE2-NEXT: pxor %xmm1, %xmm0
; SSE2-NEXT: packuswb %xmm0, %xmm0		; SSE2-NEXT: packuswb %xmm0, %xmm0
; SSE2-NEXT: movq %xmm0, (%rdi)		; SSE2-NEXT: movq %xmm0, (%rdi)
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSSE3-LABEL: trunc_usat_v8i16_v8i8_store:		; SSSE3-LABEL: trunc_usat_v8i16_v8i8_store:
; SSSE3: # %bb.0:		; SSSE3: # %bb.0:
; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSSE3-NEXT: movdqa %xmm0, %xmm1
; SSSE3-NEXT: pxor %xmm1, %xmm0		; SSSE3-NEXT: psubusw {{.*}}(%rip), %xmm1
; SSSE3-NEXT: pminsw {{.*}}(%rip), %xmm0		; SSSE3-NEXT: psubw %xmm1, %xmm0
; SSSE3-NEXT: pxor %xmm1, %xmm0
; SSSE3-NEXT: packuswb %xmm0, %xmm0		; SSSE3-NEXT: packuswb %xmm0, %xmm0
; SSSE3-NEXT: movq %xmm0, (%rdi)		; SSSE3-NEXT: movq %xmm0, (%rdi)
; SSSE3-NEXT: retq		; SSSE3-NEXT: retq
;		;
; SSE41-LABEL: trunc_usat_v8i16_v8i8_store:		; SSE41-LABEL: trunc_usat_v8i16_v8i8_store:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: pminuw {{.*}}(%rip), %xmm0		; SSE41-NEXT: pminuw {{.*}}(%rip), %xmm0
; SSE41-NEXT: packuswb %xmm0, %xmm0		; SSE41-NEXT: packuswb %xmm0, %xmm0
▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq
%3 = trunc <8 x i16> %2 to <8 x i8>		%3 = trunc <8 x i16> %2 to <8 x i8>
store <8 x i8> %3, <8 x i8> *%p1		store <8 x i8> %3, <8 x i8> *%p1
ret void		ret void
}		}

define <16 x i8> @trunc_usat_v16i16_v16i8(<16 x i16> %a0) {		define <16 x i8> @trunc_usat_v16i16_v16i8(<16 x i16> %a0) {
; SSE2-LABEL: trunc_usat_v16i16_v16i8:		; SSE2-LABEL: trunc_usat_v16i16_v16i8:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [255,255,255,255,255,255,255,255]
; SSE2-NEXT: pxor %xmm2, %xmm1		; SSE2-NEXT: movdqa %xmm1, %xmm3
; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [33023,33023,33023,33023,33023,33023,33023,33023]		; SSE2-NEXT: psubusw %xmm2, %xmm3
; SSE2-NEXT: pminsw %xmm3, %xmm1		; SSE2-NEXT: psubw %xmm3, %xmm1
; SSE2-NEXT: pxor %xmm2, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm3
; SSE2-NEXT: pxor %xmm2, %xmm0		; SSE2-NEXT: psubusw %xmm2, %xmm3
; SSE2-NEXT: pminsw %xmm3, %xmm0		; SSE2-NEXT: psubw %xmm3, %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: packuswb %xmm1, %xmm0		; SSE2-NEXT: packuswb %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSSE3-LABEL: trunc_usat_v16i16_v16i8:		; SSSE3-LABEL: trunc_usat_v16i16_v16i8:
; SSSE3: # %bb.0:		; SSSE3: # %bb.0:
; SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [255,255,255,255,255,255,255,255]
; SSSE3-NEXT: pxor %xmm2, %xmm1		; SSSE3-NEXT: movdqa %xmm1, %xmm3
; SSSE3-NEXT: movdqa {{.*#+}} xmm3 = [33023,33023,33023,33023,33023,33023,33023,33023]		; SSSE3-NEXT: psubusw %xmm2, %xmm3
; SSSE3-NEXT: pminsw %xmm3, %xmm1		; SSSE3-NEXT: psubw %xmm3, %xmm1
; SSSE3-NEXT: pxor %xmm2, %xmm1		; SSSE3-NEXT: movdqa %xmm0, %xmm3
; SSSE3-NEXT: pxor %xmm2, %xmm0		; SSSE3-NEXT: psubusw %xmm2, %xmm3
; SSSE3-NEXT: pminsw %xmm3, %xmm0		; SSSE3-NEXT: psubw %xmm3, %xmm0
; SSSE3-NEXT: pxor %xmm2, %xmm0
; SSSE3-NEXT: packuswb %xmm1, %xmm0		; SSSE3-NEXT: packuswb %xmm1, %xmm0
; SSSE3-NEXT: retq		; SSSE3-NEXT: retq
;		;
; SSE41-LABEL: trunc_usat_v16i16_v16i8:		; SSE41-LABEL: trunc_usat_v16i16_v16i8:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [255,255,255,255,255,255,255,255]		; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [255,255,255,255,255,255,255,255]
; SSE41-NEXT: pminuw %xmm2, %xmm1		; SSE41-NEXT: pminuw %xmm2, %xmm1
; SSE41-NEXT: pminuw %xmm2, %xmm0		; SSE41-NEXT: pminuw %xmm2, %xmm0
▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq
%2 = select <16 x i1> %1, <16 x i16> %a0, <16 x i16> <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>		%2 = select <16 x i1> %1, <16 x i16> %a0, <16 x i16> <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>
%3 = trunc <16 x i16> %2 to <16 x i8>		%3 = trunc <16 x i16> %2 to <16 x i8>
ret <16 x i8> %3		ret <16 x i8> %3
}		}

define <32 x i8> @trunc_usat_v32i16_v32i8(<32 x i16>* %p0) {		define <32 x i8> @trunc_usat_v32i16_v32i8(<32 x i16>* %p0) {
; SSE2-LABEL: trunc_usat_v32i16_v32i8:		; SSE2-LABEL: trunc_usat_v32i16_v32i8:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]
; SSE2-NEXT: movdqa 48(%rdi), %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [33023,33023,33023,33023,33023,33023,33023,33023]
; SSE2-NEXT: pminsw %xmm3, %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: movdqa 32(%rdi), %xmm1
; SSE2-NEXT: pxor %xmm2, %xmm1
; SSE2-NEXT: pminsw %xmm3, %xmm1
; SSE2-NEXT: pxor %xmm2, %xmm1
; SSE2-NEXT: packuswb %xmm0, %xmm1
; SSE2-NEXT: movdqa 16(%rdi), %xmm4
; SSE2-NEXT: pxor %xmm2, %xmm4
; SSE2-NEXT: pminsw %xmm3, %xmm4
; SSE2-NEXT: pxor %xmm2, %xmm4
; SSE2-NEXT: movdqa (%rdi), %xmm0		; SSE2-NEXT: movdqa (%rdi), %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm0		; SSE2-NEXT: movdqa 16(%rdi), %xmm2
; SSE2-NEXT: pminsw %xmm3, %xmm0		; SSE2-NEXT: movdqa 32(%rdi), %xmm1
; SSE2-NEXT: pxor %xmm2, %xmm0		; SSE2-NEXT: movdqa 48(%rdi), %xmm3
; SSE2-NEXT: packuswb %xmm4, %xmm0		; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [255,255,255,255,255,255,255,255]
		; SSE2-NEXT: movdqa %xmm3, %xmm5
		; SSE2-NEXT: psubusw %xmm4, %xmm5
		; SSE2-NEXT: psubw %xmm5, %xmm3
		; SSE2-NEXT: movdqa %xmm1, %xmm5
		; SSE2-NEXT: psubusw %xmm4, %xmm5
		; SSE2-NEXT: psubw %xmm5, %xmm1
		; SSE2-NEXT: packuswb %xmm3, %xmm1
		; SSE2-NEXT: movdqa %xmm2, %xmm3
		; SSE2-NEXT: psubusw %xmm4, %xmm3
		; SSE2-NEXT: psubw %xmm3, %xmm2
		; SSE2-NEXT: movdqa %xmm0, %xmm3
		; SSE2-NEXT: psubusw %xmm4, %xmm3
		; SSE2-NEXT: psubw %xmm3, %xmm0
		; SSE2-NEXT: packuswb %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSSE3-LABEL: trunc_usat_v32i16_v32i8:		; SSSE3-LABEL: trunc_usat_v32i16_v32i8:
; SSSE3: # %bb.0:		; SSSE3: # %bb.0:
; SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]
; SSSE3-NEXT: movdqa 48(%rdi), %xmm0
; SSSE3-NEXT: pxor %xmm2, %xmm0
; SSSE3-NEXT: movdqa {{.*#+}} xmm3 = [33023,33023,33023,33023,33023,33023,33023,33023]
; SSSE3-NEXT: pminsw %xmm3, %xmm0
; SSSE3-NEXT: pxor %xmm2, %xmm0
; SSSE3-NEXT: movdqa 32(%rdi), %xmm1
; SSSE3-NEXT: pxor %xmm2, %xmm1
; SSSE3-NEXT: pminsw %xmm3, %xmm1
; SSSE3-NEXT: pxor %xmm2, %xmm1
; SSSE3-NEXT: packuswb %xmm0, %xmm1
; SSSE3-NEXT: movdqa 16(%rdi), %xmm4
; SSSE3-NEXT: pxor %xmm2, %xmm4
; SSSE3-NEXT: pminsw %xmm3, %xmm4
; SSSE3-NEXT: pxor %xmm2, %xmm4
; SSSE3-NEXT: movdqa (%rdi), %xmm0		; SSSE3-NEXT: movdqa (%rdi), %xmm0
; SSSE3-NEXT: pxor %xmm2, %xmm0		; SSSE3-NEXT: movdqa 16(%rdi), %xmm2
; SSSE3-NEXT: pminsw %xmm3, %xmm0		; SSSE3-NEXT: movdqa 32(%rdi), %xmm1
; SSSE3-NEXT: pxor %xmm2, %xmm0		; SSSE3-NEXT: movdqa 48(%rdi), %xmm3
; SSSE3-NEXT: packuswb %xmm4, %xmm0		; SSSE3-NEXT: movdqa {{.*#+}} xmm4 = [255,255,255,255,255,255,255,255]
		; SSSE3-NEXT: movdqa %xmm3, %xmm5
		; SSSE3-NEXT: psubusw %xmm4, %xmm5
		; SSSE3-NEXT: psubw %xmm5, %xmm3
		; SSSE3-NEXT: movdqa %xmm1, %xmm5
		; SSSE3-NEXT: psubusw %xmm4, %xmm5
		; SSSE3-NEXT: psubw %xmm5, %xmm1
		; SSSE3-NEXT: packuswb %xmm3, %xmm1
		; SSSE3-NEXT: movdqa %xmm2, %xmm3
		; SSSE3-NEXT: psubusw %xmm4, %xmm3
		; SSSE3-NEXT: psubw %xmm3, %xmm2
		; SSSE3-NEXT: movdqa %xmm0, %xmm3
		; SSSE3-NEXT: psubusw %xmm4, %xmm3
		; SSSE3-NEXT: psubw %xmm3, %xmm0
		; SSSE3-NEXT: packuswb %xmm2, %xmm0
; SSSE3-NEXT: retq		; SSSE3-NEXT: retq
;		;
; SSE41-LABEL: trunc_usat_v32i16_v32i8:		; SSE41-LABEL: trunc_usat_v32i16_v32i8:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [255,255,255,255,255,255,255,255]		; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [255,255,255,255,255,255,255,255]
; SSE41-NEXT: movdqa 48(%rdi), %xmm2		; SSE41-NEXT: movdqa 48(%rdi), %xmm2
; SSE41-NEXT: pminuw %xmm0, %xmm2		; SSE41-NEXT: pminuw %xmm0, %xmm2
; SSE41-NEXT: movdqa 32(%rdi), %xmm1		; SSE41-NEXT: movdqa 32(%rdi), %xmm1
▲ Show 20 Lines • Show All 312 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vselect-minmax.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show All 11 Lines
; SSE2-NEXT: movdqa %xmm1, %xmm2		; SSE2-NEXT: movdqa %xmm1, %xmm2
; SSE2-NEXT: pcmpgtb %xmm0, %xmm2		; SSE2-NEXT: pcmpgtb %xmm0, %xmm2
; SSE2-NEXT: pand %xmm2, %xmm0		; SSE2-NEXT: pand %xmm2, %xmm0
; SSE2-NEXT: pandn %xmm1, %xmm2		; SSE2-NEXT: pandn %xmm1, %xmm2
; SSE2-NEXT: por %xmm2, %xmm0		; SSE2-NEXT: por %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test1:		; SSE4-LABEL: test1:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
		RKSimonUnsubmitted Done Reply Inline Actions Regressions? Increased instruction count (the movdqa rr on the other side is effectively free) + constant pool load. RKSimon: Regressions? Increased instruction count (the movdqa rr on the other side is effectively free)…
; SSE4-NEXT: pminsb %xmm1, %xmm0		; SSE4-NEXT: pminsb %xmm1, %xmm0
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
; AVX-LABEL: test1:		; AVX-LABEL: test1:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vpminsb %xmm1, %xmm0, %xmm0		; AVX-NEXT: vpminsb %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
entry:		entry:
▲ Show 20 Lines • Show All 205 Lines • ▼ Show 20 Lines	entry:
%cmp = icmp sge <8 x i16> %a, %b		%cmp = icmp sge <8 x i16> %a, %b
%sel = select <8 x i1> %cmp, <8 x i16> %a, <8 x i16> %b		%sel = select <8 x i1> %cmp, <8 x i16> %a, <8 x i16> %b
ret <8 x i16> %sel		ret <8 x i16> %sel
}		}

define <8 x i16> @test13(<8 x i16> %a, <8 x i16> %b) {		define <8 x i16> @test13(<8 x i16> %a, <8 x i16> %b) {
; SSE2-LABEL: test13:		; SSE2-LABEL: test13:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pxor %xmm2, %xmm1		; SSE2-NEXT: psubusw %xmm1, %xmm2
; SSE2-NEXT: pxor %xmm2, %xmm0		; SSE2-NEXT: psubw %xmm2, %xmm0
; SSE2-NEXT: pminsw %xmm1, %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test13:		; SSE4-LABEL: test13:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pminuw %xmm1, %xmm0		; SSE4-NEXT: pminuw %xmm1, %xmm0
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
; AVX-LABEL: test13:		; AVX-LABEL: test13:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vpminuw %xmm1, %xmm0, %xmm0		; AVX-NEXT: vpminuw %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
entry:		entry:
%cmp = icmp ult <8 x i16> %a, %b		%cmp = icmp ult <8 x i16> %a, %b
%sel = select <8 x i1> %cmp, <8 x i16> %a, <8 x i16> %b		%sel = select <8 x i1> %cmp, <8 x i16> %a, <8 x i16> %b
ret <8 x i16> %sel		ret <8 x i16> %sel
}		}

define <8 x i16> @test14(<8 x i16> %a, <8 x i16> %b) {		define <8 x i16> @test14(<8 x i16> %a, <8 x i16> %b) {
; SSE2-LABEL: test14:		; SSE2-LABEL: test14:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pxor %xmm2, %xmm1		; SSE2-NEXT: psubusw %xmm1, %xmm2
; SSE2-NEXT: pxor %xmm2, %xmm0		; SSE2-NEXT: psubw %xmm2, %xmm0
; SSE2-NEXT: pminsw %xmm1, %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test14:		; SSE4-LABEL: test14:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pminuw %xmm1, %xmm0		; SSE4-NEXT: pminuw %xmm1, %xmm0
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
; AVX-LABEL: test14:		; AVX-LABEL: test14:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vpminuw %xmm1, %xmm0, %xmm0		; AVX-NEXT: vpminuw %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
entry:		entry:
%cmp = icmp ule <8 x i16> %a, %b		%cmp = icmp ule <8 x i16> %a, %b
%sel = select <8 x i1> %cmp, <8 x i16> %a, <8 x i16> %b		%sel = select <8 x i1> %cmp, <8 x i16> %a, <8 x i16> %b
ret <8 x i16> %sel		ret <8 x i16> %sel
}		}

define <8 x i16> @test15(<8 x i16> %a, <8 x i16> %b) {		define <8 x i16> @test15(<8 x i16> %a, <8 x i16> %b) {
; SSE2-LABEL: test15:		; SSE2-LABEL: test15:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: psubusw %xmm0, %xmm1
; SSE2-NEXT: pxor %xmm2, %xmm1		; SSE2-NEXT: paddw %xmm1, %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: pmaxsw %xmm1, %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test15:		; SSE4-LABEL: test15:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxuw %xmm1, %xmm0		; SSE4-NEXT: pmaxuw %xmm1, %xmm0
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
; AVX-LABEL: test15:		; AVX-LABEL: test15:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vpmaxuw %xmm1, %xmm0, %xmm0		; AVX-NEXT: vpmaxuw %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
entry:		entry:
%cmp = icmp ugt <8 x i16> %a, %b		%cmp = icmp ugt <8 x i16> %a, %b
%sel = select <8 x i1> %cmp, <8 x i16> %a, <8 x i16> %b		%sel = select <8 x i1> %cmp, <8 x i16> %a, <8 x i16> %b
ret <8 x i16> %sel		ret <8 x i16> %sel
}		}

define <8 x i16> @test16(<8 x i16> %a, <8 x i16> %b) {		define <8 x i16> @test16(<8 x i16> %a, <8 x i16> %b) {
; SSE2-LABEL: test16:		; SSE2-LABEL: test16:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: psubusw %xmm0, %xmm1
; SSE2-NEXT: pxor %xmm2, %xmm1		; SSE2-NEXT: paddw %xmm1, %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: pmaxsw %xmm1, %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test16:		; SSE4-LABEL: test16:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxuw %xmm1, %xmm0		; SSE4-NEXT: pmaxuw %xmm1, %xmm0
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
; AVX-LABEL: test16:		; AVX-LABEL: test16:
▲ Show 20 Lines • Show All 650 Lines • ▼ Show 20 Lines	entry:
%cmp = icmp sge <16 x i16> %a, %b		%cmp = icmp sge <16 x i16> %a, %b
%sel = select <16 x i1> %cmp, <16 x i16> %a, <16 x i16> %b		%sel = select <16 x i1> %cmp, <16 x i16> %a, <16 x i16> %b
ret <16 x i16> %sel		ret <16 x i16> %sel
}		}

define <16 x i16> @test37(<16 x i16> %a, <16 x i16> %b) {		define <16 x i16> @test37(<16 x i16> %a, <16 x i16> %b) {
; SSE2-LABEL: test37:		; SSE2-LABEL: test37:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm4
; SSE2-NEXT: pxor %xmm4, %xmm2		; SSE2-NEXT: psubusw %xmm2, %xmm4
; SSE2-NEXT: pxor %xmm4, %xmm0		; SSE2-NEXT: psubw %xmm4, %xmm0
; SSE2-NEXT: pminsw %xmm2, %xmm0		; SSE2-NEXT: movdqa %xmm1, %xmm2
; SSE2-NEXT: pxor %xmm4, %xmm0		; SSE2-NEXT: psubusw %xmm3, %xmm2
; SSE2-NEXT: pxor %xmm4, %xmm3		; SSE2-NEXT: psubw %xmm2, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: pminsw %xmm3, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test37:		; SSE4-LABEL: test37:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pminuw %xmm2, %xmm0		; SSE4-NEXT: pminuw %xmm2, %xmm0
; SSE4-NEXT: pminuw %xmm3, %xmm1		; SSE4-NEXT: pminuw %xmm3, %xmm1
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
Show All 19 Lines	entry:
%cmp = icmp ult <16 x i16> %a, %b		%cmp = icmp ult <16 x i16> %a, %b
%sel = select <16 x i1> %cmp, <16 x i16> %a, <16 x i16> %b		%sel = select <16 x i1> %cmp, <16 x i16> %a, <16 x i16> %b
ret <16 x i16> %sel		ret <16 x i16> %sel
}		}

define <16 x i16> @test38(<16 x i16> %a, <16 x i16> %b) {		define <16 x i16> @test38(<16 x i16> %a, <16 x i16> %b) {
; SSE2-LABEL: test38:		; SSE2-LABEL: test38:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm4
; SSE2-NEXT: pxor %xmm4, %xmm2		; SSE2-NEXT: psubusw %xmm2, %xmm4
; SSE2-NEXT: pxor %xmm4, %xmm0		; SSE2-NEXT: psubw %xmm4, %xmm0
; SSE2-NEXT: pminsw %xmm2, %xmm0		; SSE2-NEXT: movdqa %xmm1, %xmm2
; SSE2-NEXT: pxor %xmm4, %xmm0		; SSE2-NEXT: psubusw %xmm3, %xmm2
; SSE2-NEXT: pxor %xmm4, %xmm3		; SSE2-NEXT: psubw %xmm2, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: pminsw %xmm3, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test38:		; SSE4-LABEL: test38:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pminuw %xmm2, %xmm0		; SSE4-NEXT: pminuw %xmm2, %xmm0
; SSE4-NEXT: pminuw %xmm3, %xmm1		; SSE4-NEXT: pminuw %xmm3, %xmm1
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
Show All 19 Lines	entry:
%cmp = icmp ule <16 x i16> %a, %b		%cmp = icmp ule <16 x i16> %a, %b
%sel = select <16 x i1> %cmp, <16 x i16> %a, <16 x i16> %b		%sel = select <16 x i1> %cmp, <16 x i16> %a, <16 x i16> %b
ret <16 x i16> %sel		ret <16 x i16> %sel
}		}

define <16 x i16> @test39(<16 x i16> %a, <16 x i16> %b) {		define <16 x i16> @test39(<16 x i16> %a, <16 x i16> %b) {
; SSE2-LABEL: test39:		; SSE2-LABEL: test39:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: psubusw %xmm0, %xmm2
; SSE2-NEXT: pxor %xmm4, %xmm2		; SSE2-NEXT: paddw %xmm2, %xmm0
; SSE2-NEXT: pxor %xmm4, %xmm0		; SSE2-NEXT: psubusw %xmm1, %xmm3
; SSE2-NEXT: pmaxsw %xmm2, %xmm0		; SSE2-NEXT: paddw %xmm3, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm0
; SSE2-NEXT: pxor %xmm4, %xmm3
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: pmaxsw %xmm3, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test39:		; SSE4-LABEL: test39:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxuw %xmm2, %xmm0		; SSE4-NEXT: pmaxuw %xmm2, %xmm0
; SSE4-NEXT: pmaxuw %xmm3, %xmm1		; SSE4-NEXT: pmaxuw %xmm3, %xmm1
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
Show All 19 Lines	entry:
%cmp = icmp ugt <16 x i16> %a, %b		%cmp = icmp ugt <16 x i16> %a, %b
%sel = select <16 x i1> %cmp, <16 x i16> %a, <16 x i16> %b		%sel = select <16 x i1> %cmp, <16 x i16> %a, <16 x i16> %b
ret <16 x i16> %sel		ret <16 x i16> %sel
}		}

define <16 x i16> @test40(<16 x i16> %a, <16 x i16> %b) {		define <16 x i16> @test40(<16 x i16> %a, <16 x i16> %b) {
; SSE2-LABEL: test40:		; SSE2-LABEL: test40:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: psubusw %xmm0, %xmm2
; SSE2-NEXT: pxor %xmm4, %xmm2		; SSE2-NEXT: paddw %xmm2, %xmm0
; SSE2-NEXT: pxor %xmm4, %xmm0		; SSE2-NEXT: psubusw %xmm1, %xmm3
; SSE2-NEXT: pmaxsw %xmm2, %xmm0		; SSE2-NEXT: paddw %xmm3, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm0
; SSE2-NEXT: pxor %xmm4, %xmm3
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: pmaxsw %xmm3, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test40:		; SSE4-LABEL: test40:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxuw %xmm2, %xmm0		; SSE4-NEXT: pmaxuw %xmm2, %xmm0
; SSE4-NEXT: pmaxuw %xmm3, %xmm1		; SSE4-NEXT: pmaxuw %xmm3, %xmm1
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
▲ Show 20 Lines • Show All 639 Lines • ▼ Show 20 Lines	entry:
%cmp = icmp sge <8 x i16> %a, %b		%cmp = icmp sge <8 x i16> %a, %b
%sel = select <8 x i1> %cmp, <8 x i16> %b, <8 x i16> %a		%sel = select <8 x i1> %cmp, <8 x i16> %b, <8 x i16> %a
ret <8 x i16> %sel		ret <8 x i16> %sel
}		}

define <8 x i16> @test61(<8 x i16> %a, <8 x i16> %b) {		define <8 x i16> @test61(<8 x i16> %a, <8 x i16> %b) {
; SSE2-LABEL: test61:		; SSE2-LABEL: test61:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: psubusw %xmm0, %xmm1
; SSE2-NEXT: pxor %xmm2, %xmm1		; SSE2-NEXT: paddw %xmm1, %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: pmaxsw %xmm1, %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test61:		; SSE4-LABEL: test61:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxuw %xmm1, %xmm0		; SSE4-NEXT: pmaxuw %xmm1, %xmm0
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
; AVX-LABEL: test61:		; AVX-LABEL: test61:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vpmaxuw %xmm1, %xmm0, %xmm0		; AVX-NEXT: vpmaxuw %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
entry:		entry:
%cmp = icmp ult <8 x i16> %a, %b		%cmp = icmp ult <8 x i16> %a, %b
%sel = select <8 x i1> %cmp, <8 x i16> %b, <8 x i16> %a		%sel = select <8 x i1> %cmp, <8 x i16> %b, <8 x i16> %a
ret <8 x i16> %sel		ret <8 x i16> %sel
}		}

define <8 x i16> @test62(<8 x i16> %a, <8 x i16> %b) {		define <8 x i16> @test62(<8 x i16> %a, <8 x i16> %b) {
; SSE2-LABEL: test62:		; SSE2-LABEL: test62:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: psubusw %xmm0, %xmm1
; SSE2-NEXT: pxor %xmm2, %xmm1		; SSE2-NEXT: paddw %xmm1, %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: pmaxsw %xmm1, %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test62:		; SSE4-LABEL: test62:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxuw %xmm1, %xmm0		; SSE4-NEXT: pmaxuw %xmm1, %xmm0
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
; AVX-LABEL: test62:		; AVX-LABEL: test62:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vpmaxuw %xmm1, %xmm0, %xmm0		; AVX-NEXT: vpmaxuw %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
entry:		entry:
%cmp = icmp ule <8 x i16> %a, %b		%cmp = icmp ule <8 x i16> %a, %b
%sel = select <8 x i1> %cmp, <8 x i16> %b, <8 x i16> %a		%sel = select <8 x i1> %cmp, <8 x i16> %b, <8 x i16> %a
ret <8 x i16> %sel		ret <8 x i16> %sel
}		}

define <8 x i16> @test63(<8 x i16> %a, <8 x i16> %b) {		define <8 x i16> @test63(<8 x i16> %a, <8 x i16> %b) {
; SSE2-LABEL: test63:		; SSE2-LABEL: test63:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pxor %xmm2, %xmm1		; SSE2-NEXT: psubusw %xmm1, %xmm2
; SSE2-NEXT: pxor %xmm2, %xmm0		; SSE2-NEXT: psubw %xmm2, %xmm0
; SSE2-NEXT: pminsw %xmm1, %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test63:		; SSE4-LABEL: test63:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pminuw %xmm1, %xmm0		; SSE4-NEXT: pminuw %xmm1, %xmm0
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
; AVX-LABEL: test63:		; AVX-LABEL: test63:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vpminuw %xmm1, %xmm0, %xmm0		; AVX-NEXT: vpminuw %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
entry:		entry:
%cmp = icmp ugt <8 x i16> %a, %b		%cmp = icmp ugt <8 x i16> %a, %b
%sel = select <8 x i1> %cmp, <8 x i16> %b, <8 x i16> %a		%sel = select <8 x i1> %cmp, <8 x i16> %b, <8 x i16> %a
ret <8 x i16> %sel		ret <8 x i16> %sel
}		}

define <8 x i16> @test64(<8 x i16> %a, <8 x i16> %b) {		define <8 x i16> @test64(<8 x i16> %a, <8 x i16> %b) {
; SSE2-LABEL: test64:		; SSE2-LABEL: test64:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pxor %xmm2, %xmm1		; SSE2-NEXT: psubusw %xmm1, %xmm2
; SSE2-NEXT: pxor %xmm2, %xmm0		; SSE2-NEXT: psubw %xmm2, %xmm0
; SSE2-NEXT: pminsw %xmm1, %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test64:		; SSE4-LABEL: test64:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pminuw %xmm1, %xmm0		; SSE4-NEXT: pminuw %xmm1, %xmm0
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
; AVX-LABEL: test64:		; AVX-LABEL: test64:
▲ Show 20 Lines • Show All 650 Lines • ▼ Show 20 Lines	entry:
%cmp = icmp sge <16 x i16> %a, %b		%cmp = icmp sge <16 x i16> %a, %b
%sel = select <16 x i1> %cmp, <16 x i16> %b, <16 x i16> %a		%sel = select <16 x i1> %cmp, <16 x i16> %b, <16 x i16> %a
ret <16 x i16> %sel		ret <16 x i16> %sel
}		}

define <16 x i16> @test85(<16 x i16> %a, <16 x i16> %b) {		define <16 x i16> @test85(<16 x i16> %a, <16 x i16> %b) {
; SSE2-LABEL: test85:		; SSE2-LABEL: test85:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: psubusw %xmm0, %xmm2
; SSE2-NEXT: pxor %xmm4, %xmm2		; SSE2-NEXT: paddw %xmm2, %xmm0
; SSE2-NEXT: pxor %xmm4, %xmm0		; SSE2-NEXT: psubusw %xmm1, %xmm3
; SSE2-NEXT: pmaxsw %xmm2, %xmm0		; SSE2-NEXT: paddw %xmm3, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm0
; SSE2-NEXT: pxor %xmm4, %xmm3
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: pmaxsw %xmm3, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test85:		; SSE4-LABEL: test85:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxuw %xmm2, %xmm0		; SSE4-NEXT: pmaxuw %xmm2, %xmm0
; SSE4-NEXT: pmaxuw %xmm3, %xmm1		; SSE4-NEXT: pmaxuw %xmm3, %xmm1
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
Show All 19 Lines	entry:
%cmp = icmp ult <16 x i16> %a, %b		%cmp = icmp ult <16 x i16> %a, %b
%sel = select <16 x i1> %cmp, <16 x i16> %b, <16 x i16> %a		%sel = select <16 x i1> %cmp, <16 x i16> %b, <16 x i16> %a
ret <16 x i16> %sel		ret <16 x i16> %sel
}		}

define <16 x i16> @test86(<16 x i16> %a, <16 x i16> %b) {		define <16 x i16> @test86(<16 x i16> %a, <16 x i16> %b) {
; SSE2-LABEL: test86:		; SSE2-LABEL: test86:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: psubusw %xmm0, %xmm2
; SSE2-NEXT: pxor %xmm4, %xmm2		; SSE2-NEXT: paddw %xmm2, %xmm0
; SSE2-NEXT: pxor %xmm4, %xmm0		; SSE2-NEXT: psubusw %xmm1, %xmm3
; SSE2-NEXT: pmaxsw %xmm2, %xmm0		; SSE2-NEXT: paddw %xmm3, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm0
; SSE2-NEXT: pxor %xmm4, %xmm3
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: pmaxsw %xmm3, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test86:		; SSE4-LABEL: test86:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxuw %xmm2, %xmm0		; SSE4-NEXT: pmaxuw %xmm2, %xmm0
; SSE4-NEXT: pmaxuw %xmm3, %xmm1		; SSE4-NEXT: pmaxuw %xmm3, %xmm1
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
Show All 19 Lines	entry:
%cmp = icmp ule <16 x i16> %a, %b		%cmp = icmp ule <16 x i16> %a, %b
%sel = select <16 x i1> %cmp, <16 x i16> %b, <16 x i16> %a		%sel = select <16 x i1> %cmp, <16 x i16> %b, <16 x i16> %a
ret <16 x i16> %sel		ret <16 x i16> %sel
}		}

define <16 x i16> @test87(<16 x i16> %a, <16 x i16> %b) {		define <16 x i16> @test87(<16 x i16> %a, <16 x i16> %b) {
; SSE2-LABEL: test87:		; SSE2-LABEL: test87:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm4
; SSE2-NEXT: pxor %xmm4, %xmm2		; SSE2-NEXT: psubusw %xmm2, %xmm4
; SSE2-NEXT: pxor %xmm4, %xmm0		; SSE2-NEXT: psubw %xmm4, %xmm0
; SSE2-NEXT: pminsw %xmm2, %xmm0		; SSE2-NEXT: movdqa %xmm1, %xmm2
; SSE2-NEXT: pxor %xmm4, %xmm0		; SSE2-NEXT: psubusw %xmm3, %xmm2
; SSE2-NEXT: pxor %xmm4, %xmm3		; SSE2-NEXT: psubw %xmm2, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: pminsw %xmm3, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test87:		; SSE4-LABEL: test87:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pminuw %xmm2, %xmm0		; SSE4-NEXT: pminuw %xmm2, %xmm0
; SSE4-NEXT: pminuw %xmm3, %xmm1		; SSE4-NEXT: pminuw %xmm3, %xmm1
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
Show All 19 Lines	entry:
%cmp = icmp ugt <16 x i16> %a, %b		%cmp = icmp ugt <16 x i16> %a, %b
%sel = select <16 x i1> %cmp, <16 x i16> %b, <16 x i16> %a		%sel = select <16 x i1> %cmp, <16 x i16> %b, <16 x i16> %a
ret <16 x i16> %sel		ret <16 x i16> %sel
}		}

define <16 x i16> @test88(<16 x i16> %a, <16 x i16> %b) {		define <16 x i16> @test88(<16 x i16> %a, <16 x i16> %b) {
; SSE2-LABEL: test88:		; SSE2-LABEL: test88:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm4
; SSE2-NEXT: pxor %xmm4, %xmm2		; SSE2-NEXT: psubusw %xmm2, %xmm4
; SSE2-NEXT: pxor %xmm4, %xmm0		; SSE2-NEXT: psubw %xmm4, %xmm0
; SSE2-NEXT: pminsw %xmm2, %xmm0		; SSE2-NEXT: movdqa %xmm1, %xmm2
; SSE2-NEXT: pxor %xmm4, %xmm0		; SSE2-NEXT: psubusw %xmm3, %xmm2
; SSE2-NEXT: pxor %xmm4, %xmm3		; SSE2-NEXT: psubw %xmm2, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: pminsw %xmm3, %xmm1
; SSE2-NEXT: pxor %xmm4, %xmm1
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test88:		; SSE4-LABEL: test88:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pminuw %xmm2, %xmm0		; SSE4-NEXT: pminuw %xmm2, %xmm0
; SSE4-NEXT: pminuw %xmm3, %xmm1		; SSE4-NEXT: pminuw %xmm3, %xmm1
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
▲ Show 20 Lines • Show All 983 Lines • ▼ Show 20 Lines	entry:
%cmp = icmp sge <32 x i16> %a, %b		%cmp = icmp sge <32 x i16> %a, %b
%sel = select <32 x i1> %cmp, <32 x i16> %a, <32 x i16> %b		%sel = select <32 x i1> %cmp, <32 x i16> %a, <32 x i16> %b
ret <32 x i16> %sel		ret <32 x i16> %sel
}		}

define <32 x i16> @test109(<32 x i16> %a, <32 x i16> %b) {		define <32 x i16> @test109(<32 x i16> %a, <32 x i16> %b) {
; SSE2-LABEL: test109:		; SSE2-LABEL: test109:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm8 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm8
; SSE2-NEXT: pxor %xmm8, %xmm4		; SSE2-NEXT: psubusw %xmm4, %xmm8
; SSE2-NEXT: pxor %xmm8, %xmm0		; SSE2-NEXT: psubw %xmm8, %xmm0
; SSE2-NEXT: pminsw %xmm4, %xmm0		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm0		; SSE2-NEXT: psubusw %xmm5, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm5		; SSE2-NEXT: psubw %xmm4, %xmm1
; SSE2-NEXT: pxor %xmm8, %xmm1		; SSE2-NEXT: movdqa %xmm2, %xmm4
; SSE2-NEXT: pminsw %xmm5, %xmm1		; SSE2-NEXT: psubusw %xmm6, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm1		; SSE2-NEXT: psubw %xmm4, %xmm2
; SSE2-NEXT: pxor %xmm8, %xmm6		; SSE2-NEXT: movdqa %xmm3, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm2		; SSE2-NEXT: psubusw %xmm7, %xmm4
; SSE2-NEXT: pminsw %xmm6, %xmm2		; SSE2-NEXT: psubw %xmm4, %xmm3
; SSE2-NEXT: pxor %xmm8, %xmm2
; SSE2-NEXT: pxor %xmm8, %xmm7
; SSE2-NEXT: pxor %xmm8, %xmm3
; SSE2-NEXT: pminsw %xmm7, %xmm3
; SSE2-NEXT: pxor %xmm8, %xmm3
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test109:		; SSE4-LABEL: test109:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pminuw %xmm4, %xmm0		; SSE4-NEXT: pminuw %xmm4, %xmm0
; SSE4-NEXT: pminuw %xmm5, %xmm1		; SSE4-NEXT: pminuw %xmm5, %xmm1
; SSE4-NEXT: pminuw %xmm6, %xmm2		; SSE4-NEXT: pminuw %xmm6, %xmm2
; SSE4-NEXT: pminuw %xmm7, %xmm3		; SSE4-NEXT: pminuw %xmm7, %xmm3
Show All 27 Lines	entry:
%cmp = icmp ult <32 x i16> %a, %b		%cmp = icmp ult <32 x i16> %a, %b
%sel = select <32 x i1> %cmp, <32 x i16> %a, <32 x i16> %b		%sel = select <32 x i1> %cmp, <32 x i16> %a, <32 x i16> %b
ret <32 x i16> %sel		ret <32 x i16> %sel
}		}

define <32 x i16> @test110(<32 x i16> %a, <32 x i16> %b) {		define <32 x i16> @test110(<32 x i16> %a, <32 x i16> %b) {
; SSE2-LABEL: test110:		; SSE2-LABEL: test110:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm8 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm8
; SSE2-NEXT: pxor %xmm8, %xmm4		; SSE2-NEXT: psubusw %xmm4, %xmm8
; SSE2-NEXT: pxor %xmm8, %xmm0		; SSE2-NEXT: psubw %xmm8, %xmm0
; SSE2-NEXT: pminsw %xmm4, %xmm0		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm0		; SSE2-NEXT: psubusw %xmm5, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm5		; SSE2-NEXT: psubw %xmm4, %xmm1
; SSE2-NEXT: pxor %xmm8, %xmm1		; SSE2-NEXT: movdqa %xmm2, %xmm4
; SSE2-NEXT: pminsw %xmm5, %xmm1		; SSE2-NEXT: psubusw %xmm6, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm1		; SSE2-NEXT: psubw %xmm4, %xmm2
; SSE2-NEXT: pxor %xmm8, %xmm6		; SSE2-NEXT: movdqa %xmm3, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm2		; SSE2-NEXT: psubusw %xmm7, %xmm4
; SSE2-NEXT: pminsw %xmm6, %xmm2		; SSE2-NEXT: psubw %xmm4, %xmm3
; SSE2-NEXT: pxor %xmm8, %xmm2
; SSE2-NEXT: pxor %xmm8, %xmm7
; SSE2-NEXT: pxor %xmm8, %xmm3
; SSE2-NEXT: pminsw %xmm7, %xmm3
; SSE2-NEXT: pxor %xmm8, %xmm3
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test110:		; SSE4-LABEL: test110:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pminuw %xmm4, %xmm0		; SSE4-NEXT: pminuw %xmm4, %xmm0
; SSE4-NEXT: pminuw %xmm5, %xmm1		; SSE4-NEXT: pminuw %xmm5, %xmm1
; SSE4-NEXT: pminuw %xmm6, %xmm2		; SSE4-NEXT: pminuw %xmm6, %xmm2
; SSE4-NEXT: pminuw %xmm7, %xmm3		; SSE4-NEXT: pminuw %xmm7, %xmm3
Show All 27 Lines	entry:
%cmp = icmp ule <32 x i16> %a, %b		%cmp = icmp ule <32 x i16> %a, %b
%sel = select <32 x i1> %cmp, <32 x i16> %a, <32 x i16> %b		%sel = select <32 x i1> %cmp, <32 x i16> %a, <32 x i16> %b
ret <32 x i16> %sel		ret <32 x i16> %sel
}		}

define <32 x i16> @test111(<32 x i16> %a, <32 x i16> %b) {		define <32 x i16> @test111(<32 x i16> %a, <32 x i16> %b) {
; SSE2-LABEL: test111:		; SSE2-LABEL: test111:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm8 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: psubusw %xmm0, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm4		; SSE2-NEXT: paddw %xmm4, %xmm0
; SSE2-NEXT: pxor %xmm8, %xmm0		; SSE2-NEXT: psubusw %xmm1, %xmm5
; SSE2-NEXT: pmaxsw %xmm4, %xmm0		; SSE2-NEXT: paddw %xmm5, %xmm1
; SSE2-NEXT: pxor %xmm8, %xmm0		; SSE2-NEXT: psubusw %xmm2, %xmm6
; SSE2-NEXT: pxor %xmm8, %xmm5		; SSE2-NEXT: paddw %xmm6, %xmm2
; SSE2-NEXT: pxor %xmm8, %xmm1		; SSE2-NEXT: psubusw %xmm3, %xmm7
; SSE2-NEXT: pmaxsw %xmm5, %xmm1		; SSE2-NEXT: paddw %xmm7, %xmm3
; SSE2-NEXT: pxor %xmm8, %xmm1
; SSE2-NEXT: pxor %xmm8, %xmm6
; SSE2-NEXT: pxor %xmm8, %xmm2
; SSE2-NEXT: pmaxsw %xmm6, %xmm2
; SSE2-NEXT: pxor %xmm8, %xmm2
; SSE2-NEXT: pxor %xmm8, %xmm7
; SSE2-NEXT: pxor %xmm8, %xmm3
; SSE2-NEXT: pmaxsw %xmm7, %xmm3
; SSE2-NEXT: pxor %xmm8, %xmm3
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test111:		; SSE4-LABEL: test111:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxuw %xmm4, %xmm0		; SSE4-NEXT: pmaxuw %xmm4, %xmm0
; SSE4-NEXT: pmaxuw %xmm5, %xmm1		; SSE4-NEXT: pmaxuw %xmm5, %xmm1
; SSE4-NEXT: pmaxuw %xmm6, %xmm2		; SSE4-NEXT: pmaxuw %xmm6, %xmm2
; SSE4-NEXT: pmaxuw %xmm7, %xmm3		; SSE4-NEXT: pmaxuw %xmm7, %xmm3
Show All 27 Lines	entry:
%cmp = icmp ugt <32 x i16> %a, %b		%cmp = icmp ugt <32 x i16> %a, %b
%sel = select <32 x i1> %cmp, <32 x i16> %a, <32 x i16> %b		%sel = select <32 x i1> %cmp, <32 x i16> %a, <32 x i16> %b
ret <32 x i16> %sel		ret <32 x i16> %sel
}		}

define <32 x i16> @test112(<32 x i16> %a, <32 x i16> %b) {		define <32 x i16> @test112(<32 x i16> %a, <32 x i16> %b) {
; SSE2-LABEL: test112:		; SSE2-LABEL: test112:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm8 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: psubusw %xmm0, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm4		; SSE2-NEXT: paddw %xmm4, %xmm0
; SSE2-NEXT: pxor %xmm8, %xmm0		; SSE2-NEXT: psubusw %xmm1, %xmm5
; SSE2-NEXT: pmaxsw %xmm4, %xmm0		; SSE2-NEXT: paddw %xmm5, %xmm1
; SSE2-NEXT: pxor %xmm8, %xmm0		; SSE2-NEXT: psubusw %xmm2, %xmm6
; SSE2-NEXT: pxor %xmm8, %xmm5		; SSE2-NEXT: paddw %xmm6, %xmm2
; SSE2-NEXT: pxor %xmm8, %xmm1		; SSE2-NEXT: psubusw %xmm3, %xmm7
; SSE2-NEXT: pmaxsw %xmm5, %xmm1		; SSE2-NEXT: paddw %xmm7, %xmm3
; SSE2-NEXT: pxor %xmm8, %xmm1
; SSE2-NEXT: pxor %xmm8, %xmm6
; SSE2-NEXT: pxor %xmm8, %xmm2
; SSE2-NEXT: pmaxsw %xmm6, %xmm2
; SSE2-NEXT: pxor %xmm8, %xmm2
; SSE2-NEXT: pxor %xmm8, %xmm7
; SSE2-NEXT: pxor %xmm8, %xmm3
; SSE2-NEXT: pmaxsw %xmm7, %xmm3
; SSE2-NEXT: pxor %xmm8, %xmm3
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test112:		; SSE4-LABEL: test112:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxuw %xmm4, %xmm0		; SSE4-NEXT: pmaxuw %xmm4, %xmm0
; SSE4-NEXT: pmaxuw %xmm5, %xmm1		; SSE4-NEXT: pmaxuw %xmm5, %xmm1
; SSE4-NEXT: pmaxuw %xmm6, %xmm2		; SSE4-NEXT: pmaxuw %xmm6, %xmm2
; SSE4-NEXT: pmaxuw %xmm7, %xmm3		; SSE4-NEXT: pmaxuw %xmm7, %xmm3
▲ Show 20 Lines • Show All 2,243 Lines • ▼ Show 20 Lines	entry:
%cmp = icmp sge <32 x i16> %a, %b		%cmp = icmp sge <32 x i16> %a, %b
%sel = select <32 x i1> %cmp, <32 x i16> %b, <32 x i16> %a		%sel = select <32 x i1> %cmp, <32 x i16> %b, <32 x i16> %a
ret <32 x i16> %sel		ret <32 x i16> %sel
}		}

define <32 x i16> @test141(<32 x i16> %a, <32 x i16> %b) {		define <32 x i16> @test141(<32 x i16> %a, <32 x i16> %b) {
; SSE2-LABEL: test141:		; SSE2-LABEL: test141:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm8 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: psubusw %xmm0, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm4		; SSE2-NEXT: paddw %xmm4, %xmm0
; SSE2-NEXT: pxor %xmm8, %xmm0		; SSE2-NEXT: psubusw %xmm1, %xmm5
; SSE2-NEXT: pmaxsw %xmm4, %xmm0		; SSE2-NEXT: paddw %xmm5, %xmm1
; SSE2-NEXT: pxor %xmm8, %xmm0		; SSE2-NEXT: psubusw %xmm2, %xmm6
; SSE2-NEXT: pxor %xmm8, %xmm5		; SSE2-NEXT: paddw %xmm6, %xmm2
; SSE2-NEXT: pxor %xmm8, %xmm1		; SSE2-NEXT: psubusw %xmm3, %xmm7
; SSE2-NEXT: pmaxsw %xmm5, %xmm1		; SSE2-NEXT: paddw %xmm7, %xmm3
; SSE2-NEXT: pxor %xmm8, %xmm1
; SSE2-NEXT: pxor %xmm8, %xmm6
; SSE2-NEXT: pxor %xmm8, %xmm2
; SSE2-NEXT: pmaxsw %xmm6, %xmm2
; SSE2-NEXT: pxor %xmm8, %xmm2
; SSE2-NEXT: pxor %xmm8, %xmm7
; SSE2-NEXT: pxor %xmm8, %xmm3
; SSE2-NEXT: pmaxsw %xmm7, %xmm3
; SSE2-NEXT: pxor %xmm8, %xmm3
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test141:		; SSE4-LABEL: test141:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxuw %xmm4, %xmm0		; SSE4-NEXT: pmaxuw %xmm4, %xmm0
; SSE4-NEXT: pmaxuw %xmm5, %xmm1		; SSE4-NEXT: pmaxuw %xmm5, %xmm1
; SSE4-NEXT: pmaxuw %xmm6, %xmm2		; SSE4-NEXT: pmaxuw %xmm6, %xmm2
; SSE4-NEXT: pmaxuw %xmm7, %xmm3		; SSE4-NEXT: pmaxuw %xmm7, %xmm3
Show All 27 Lines	entry:
%cmp = icmp ult <32 x i16> %a, %b		%cmp = icmp ult <32 x i16> %a, %b
%sel = select <32 x i1> %cmp, <32 x i16> %b, <32 x i16> %a		%sel = select <32 x i1> %cmp, <32 x i16> %b, <32 x i16> %a
ret <32 x i16> %sel		ret <32 x i16> %sel
}		}

define <32 x i16> @test142(<32 x i16> %a, <32 x i16> %b) {		define <32 x i16> @test142(<32 x i16> %a, <32 x i16> %b) {
; SSE2-LABEL: test142:		; SSE2-LABEL: test142:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm8 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: psubusw %xmm0, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm4		; SSE2-NEXT: paddw %xmm4, %xmm0
; SSE2-NEXT: pxor %xmm8, %xmm0		; SSE2-NEXT: psubusw %xmm1, %xmm5
; SSE2-NEXT: pmaxsw %xmm4, %xmm0		; SSE2-NEXT: paddw %xmm5, %xmm1
; SSE2-NEXT: pxor %xmm8, %xmm0		; SSE2-NEXT: psubusw %xmm2, %xmm6
; SSE2-NEXT: pxor %xmm8, %xmm5		; SSE2-NEXT: paddw %xmm6, %xmm2
; SSE2-NEXT: pxor %xmm8, %xmm1		; SSE2-NEXT: psubusw %xmm3, %xmm7
; SSE2-NEXT: pmaxsw %xmm5, %xmm1		; SSE2-NEXT: paddw %xmm7, %xmm3
; SSE2-NEXT: pxor %xmm8, %xmm1
; SSE2-NEXT: pxor %xmm8, %xmm6
; SSE2-NEXT: pxor %xmm8, %xmm2
; SSE2-NEXT: pmaxsw %xmm6, %xmm2
; SSE2-NEXT: pxor %xmm8, %xmm2
; SSE2-NEXT: pxor %xmm8, %xmm7
; SSE2-NEXT: pxor %xmm8, %xmm3
; SSE2-NEXT: pmaxsw %xmm7, %xmm3
; SSE2-NEXT: pxor %xmm8, %xmm3
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test142:		; SSE4-LABEL: test142:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxuw %xmm4, %xmm0		; SSE4-NEXT: pmaxuw %xmm4, %xmm0
; SSE4-NEXT: pmaxuw %xmm5, %xmm1		; SSE4-NEXT: pmaxuw %xmm5, %xmm1
; SSE4-NEXT: pmaxuw %xmm6, %xmm2		; SSE4-NEXT: pmaxuw %xmm6, %xmm2
; SSE4-NEXT: pmaxuw %xmm7, %xmm3		; SSE4-NEXT: pmaxuw %xmm7, %xmm3
Show All 27 Lines	entry:
%cmp = icmp ule <32 x i16> %a, %b		%cmp = icmp ule <32 x i16> %a, %b
%sel = select <32 x i1> %cmp, <32 x i16> %b, <32 x i16> %a		%sel = select <32 x i1> %cmp, <32 x i16> %b, <32 x i16> %a
ret <32 x i16> %sel		ret <32 x i16> %sel
}		}

define <32 x i16> @test143(<32 x i16> %a, <32 x i16> %b) {		define <32 x i16> @test143(<32 x i16> %a, <32 x i16> %b) {
; SSE2-LABEL: test143:		; SSE2-LABEL: test143:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm8 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm8
; SSE2-NEXT: pxor %xmm8, %xmm4		; SSE2-NEXT: psubusw %xmm4, %xmm8
; SSE2-NEXT: pxor %xmm8, %xmm0		; SSE2-NEXT: psubw %xmm8, %xmm0
; SSE2-NEXT: pminsw %xmm4, %xmm0		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm0		; SSE2-NEXT: psubusw %xmm5, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm5		; SSE2-NEXT: psubw %xmm4, %xmm1
; SSE2-NEXT: pxor %xmm8, %xmm1		; SSE2-NEXT: movdqa %xmm2, %xmm4
; SSE2-NEXT: pminsw %xmm5, %xmm1		; SSE2-NEXT: psubusw %xmm6, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm1		; SSE2-NEXT: psubw %xmm4, %xmm2
; SSE2-NEXT: pxor %xmm8, %xmm6		; SSE2-NEXT: movdqa %xmm3, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm2		; SSE2-NEXT: psubusw %xmm7, %xmm4
; SSE2-NEXT: pminsw %xmm6, %xmm2		; SSE2-NEXT: psubw %xmm4, %xmm3
; SSE2-NEXT: pxor %xmm8, %xmm2
; SSE2-NEXT: pxor %xmm8, %xmm7
; SSE2-NEXT: pxor %xmm8, %xmm3
; SSE2-NEXT: pminsw %xmm7, %xmm3
; SSE2-NEXT: pxor %xmm8, %xmm3
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test143:		; SSE4-LABEL: test143:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pminuw %xmm4, %xmm0		; SSE4-NEXT: pminuw %xmm4, %xmm0
; SSE4-NEXT: pminuw %xmm5, %xmm1		; SSE4-NEXT: pminuw %xmm5, %xmm1
; SSE4-NEXT: pminuw %xmm6, %xmm2		; SSE4-NEXT: pminuw %xmm6, %xmm2
; SSE4-NEXT: pminuw %xmm7, %xmm3		; SSE4-NEXT: pminuw %xmm7, %xmm3
Show All 27 Lines	entry:
%cmp = icmp ugt <32 x i16> %a, %b		%cmp = icmp ugt <32 x i16> %a, %b
%sel = select <32 x i1> %cmp, <32 x i16> %b, <32 x i16> %a		%sel = select <32 x i1> %cmp, <32 x i16> %b, <32 x i16> %a
ret <32 x i16> %sel		ret <32 x i16> %sel
}		}

define <32 x i16> @test144(<32 x i16> %a, <32 x i16> %b) {		define <32 x i16> @test144(<32 x i16> %a, <32 x i16> %b) {
; SSE2-LABEL: test144:		; SSE2-LABEL: test144:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm8 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa %xmm0, %xmm8
; SSE2-NEXT: pxor %xmm8, %xmm4		; SSE2-NEXT: psubusw %xmm4, %xmm8
; SSE2-NEXT: pxor %xmm8, %xmm0		; SSE2-NEXT: psubw %xmm8, %xmm0
; SSE2-NEXT: pminsw %xmm4, %xmm0		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm0		; SSE2-NEXT: psubusw %xmm5, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm5		; SSE2-NEXT: psubw %xmm4, %xmm1
; SSE2-NEXT: pxor %xmm8, %xmm1		; SSE2-NEXT: movdqa %xmm2, %xmm4
; SSE2-NEXT: pminsw %xmm5, %xmm1		; SSE2-NEXT: psubusw %xmm6, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm1		; SSE2-NEXT: psubw %xmm4, %xmm2
; SSE2-NEXT: pxor %xmm8, %xmm6		; SSE2-NEXT: movdqa %xmm3, %xmm4
; SSE2-NEXT: pxor %xmm8, %xmm2		; SSE2-NEXT: psubusw %xmm7, %xmm4
; SSE2-NEXT: pminsw %xmm6, %xmm2		; SSE2-NEXT: psubw %xmm4, %xmm3
; SSE2-NEXT: pxor %xmm8, %xmm2
; SSE2-NEXT: pxor %xmm8, %xmm7
; SSE2-NEXT: pxor %xmm8, %xmm3
; SSE2-NEXT: pminsw %xmm7, %xmm3
; SSE2-NEXT: pxor %xmm8, %xmm3
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test144:		; SSE4-LABEL: test144:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pminuw %xmm4, %xmm0		; SSE4-NEXT: pminuw %xmm4, %xmm0
; SSE4-NEXT: pminuw %xmm5, %xmm1		; SSE4-NEXT: pminuw %xmm5, %xmm1
; SSE4-NEXT: pminuw %xmm6, %xmm2		; SSE4-NEXT: pminuw %xmm6, %xmm2
; SSE4-NEXT: pminuw %xmm7, %xmm3		; SSE4-NEXT: pminuw %xmm7, %xmm3
▲ Show 20 Lines • Show All 3,587 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86][SSE2] Use smarter instruction patterns for lowering UMIN/UMAX with v8i16.
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 297454

llvm/lib/Target/X86/X86ISelLowering.cpp

llvm/lib/Target/X86/X86TargetTransformInfo.cpp

llvm/test/Analysis/CostModel/X86/arith-uminmax.ll

llvm/test/CodeGen/X86/horizontal-reduce-umax.ll

llvm/test/CodeGen/X86/horizontal-reduce-umin.ll

llvm/test/CodeGen/X86/machine-combiner-int-vec.ll

llvm/test/CodeGen/X86/masked_store_trunc_usat.ll

llvm/test/CodeGen/X86/midpoint-int-vec-128.ll

llvm/test/CodeGen/X86/sat-add.ll

llvm/test/CodeGen/X86/umax.ll

llvm/test/CodeGen/X86/umin.ll

llvm/test/CodeGen/X86/vec_minmax_uint.ll

llvm/test/CodeGen/X86/vector-reduce-umax.ll

llvm/test/CodeGen/X86/vector-reduce-umin.ll

llvm/test/CodeGen/X86/vector-trunc-usat.ll

llvm/test/CodeGen/X86/vselect-minmax.ll

This is an archive of the discontinued LLVM Phabricator instance.

[X86][SSE2] Use smarter instruction patterns for lowering UMIN/UMAX with v8i16.ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 297454

llvm/lib/Target/X86/X86ISelLowering.cpp

llvm/lib/Target/X86/X86TargetTransformInfo.cpp

llvm/test/Analysis/CostModel/X86/arith-uminmax.ll

llvm/test/CodeGen/X86/horizontal-reduce-umax.ll

llvm/test/CodeGen/X86/horizontal-reduce-umin.ll

llvm/test/CodeGen/X86/machine-combiner-int-vec.ll

llvm/test/CodeGen/X86/masked_store_trunc_usat.ll

llvm/test/CodeGen/X86/midpoint-int-vec-128.ll

llvm/test/CodeGen/X86/sat-add.ll

llvm/test/CodeGen/X86/umax.ll

llvm/test/CodeGen/X86/umin.ll

llvm/test/CodeGen/X86/vec_minmax_uint.ll

llvm/test/CodeGen/X86/vector-reduce-umax.ll

llvm/test/CodeGen/X86/vector-reduce-umin.ll

llvm/test/CodeGen/X86/vector-trunc-usat.ll

llvm/test/CodeGen/X86/vselect-minmax.ll

[X86][SSE2] Use smarter instruction patterns for lowering UMIN/UMAX with v8i16.
ClosedPublic