Diff 146775

llvm/trunk/lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 34,565 Lines • ▼ Show 20 Lines	static bool isSATValidOnAVX512Subtarget(EVT SrcVT, EVT DstVT,
EVT DstElVT = DstVT.getScalarType();		EVT DstElVT = DstVT.getScalarType();
if (DstElVT != MVT::i8 && DstElVT != MVT::i16 && DstElVT != MVT::i32)		if (DstElVT != MVT::i8 && DstElVT != MVT::i16 && DstElVT != MVT::i32)
return false;		return false;
if (SrcVT.is512BitVector() \|\| Subtarget.hasVLX())		if (SrcVT.is512BitVector() \|\| Subtarget.hasVLX())
return SrcElVT.getSizeInBits() >= 32 \|\| Subtarget.hasBWI();		return SrcElVT.getSizeInBits() >= 32 \|\| Subtarget.hasBWI();
return false;		return false;
}		}

/// Detect a pattern of truncation with unsigned saturation:		/// Detect patterns of truncation with unsigned saturation:
/// (truncate (umin (x, unsigned_max_of_dest_type)) to dest_type).		///
/// Return the source value to be truncated or SDValue() if the pattern was not		/// 1. (truncate (umin (x, unsigned_max_of_dest_type)) to dest_type).
/// matched.		/// Return the source value x to be truncated or SDValue() if the pattern was
static SDValue detectUSatPattern(SDValue In, EVT VT) {		/// not matched.
if (In.getOpcode() != ISD::UMIN)		///
return SDValue();		/// 2. (truncate (smin (smax (x, C1), C2)) to dest_type),
		/// where C1 >= 0 and C2 is unsigned max of destination type.
		///
		/// (truncate (smax (smin (x, C2), C1)) to dest_type)
		/// where C1 >= 0, C2 is unsigned max of destination type and C1 <= C2.
		///
		/// These two patterns are equivalent to:
		/// (truncate (umin (smax(x, C1), unsigned_max_of_dest_type)) to dest_type)
		/// So return the smax(x, C1) value to be truncated or SDValue() if the
		/// pattern was not matched.
		static SDValue detectUSatPattern(SDValue In, EVT VT, SelectionDAG &DAG,
		const SDLoc &DL) {
		EVT InVT = In.getValueType();

// Saturation with truncation. We truncate from InVT to VT.		// Saturation with truncation. We truncate from InVT to VT.
assert(In.getScalarValueSizeInBits() > VT.getScalarSizeInBits() &&		assert(InVT.getScalarSizeInBits() > VT.getScalarSizeInBits() &&
"Unexpected types for truncate operation");		"Unexpected types for truncate operation");

APInt C;		// Match min/max and return limit value as a parameter.
if (ISD::isConstantSplatVector(In.getOperand(1).getNode(), C)) {		auto MatchMinMax = [](SDValue V, unsigned Opcode, APInt &Limit) -> SDValue {
// C should be equal to UINT32_MAX / UINT16_MAX / UINT8_MAX according		if (V.getOpcode() == Opcode &&
		ISD::isConstantSplatVector(V.getOperand(1).getNode(), Limit))
		return V.getOperand(0);
		return SDValue();
		};

		APInt C1, C2;
		if (SDValue UMin = MatchMinMax(In, ISD::UMIN, C2))
		// C2 should be equal to UINT32_MAX / UINT16_MAX / UINT8_MAX according
// the element size of the destination type.		// the element size of the destination type.
return C.isMask(VT.getScalarSizeInBits()) ? In.getOperand(0) : SDValue();		if (C2.isMask(VT.getScalarSizeInBits()))
		return UMin;

		if (SDValue SMin = MatchMinMax(In, ISD::SMIN, C2))
		if (SDValue SMax = MatchMinMax(SMin, ISD::SMAX, C1))
		if (C1.isNonNegative() && C2.isMask(VT.getScalarSizeInBits()))
		return SMin;

		if (SDValue SMax = MatchMinMax(In, ISD::SMAX, C1))
		if (SDValue SMin = MatchMinMax(SMax, ISD::SMIN, C2))
		if (C1.isNonNegative() && C2.isMask(VT.getScalarSizeInBits()) &&
		C2.uge(C1)) {
		return DAG.getNode(ISD::SMAX, DL, InVT, SMin, In.getOperand(1));
}		}

return SDValue();		return SDValue();
}		}

/// Detect patterns of truncation with signed saturation:		/// Detect patterns of truncation with signed saturation:
/// (truncate (smin ((smax (x, signed_min_of_dest_type)),		/// (truncate (smin ((smax (x, signed_min_of_dest_type)),
/// signed_max_of_dest_type)) to dest_type)		/// signed_max_of_dest_type)) to dest_type)
/// or:		/// or:
/// (truncate (smax ((smin (x, signed_max_of_dest_type)),		/// (truncate (smax ((smin (x, signed_max_of_dest_type)),
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines	static SDValue detectAVX512SSatPattern(SDValue In, EVT VT,
return detectSSatPattern(In, VT);		return detectSSatPattern(In, VT);
}		}

/// Detect a pattern of truncation with saturation:		/// Detect a pattern of truncation with saturation:
/// (truncate (umin (x, unsigned_max_of_dest_type)) to dest_type).		/// (truncate (umin (x, unsigned_max_of_dest_type)) to dest_type).
/// The types should allow to use VPMOVUS* instruction on AVX512.		/// The types should allow to use VPMOVUS* instruction on AVX512.
/// Return the source value to be truncated or SDValue() if the pattern was not		/// Return the source value to be truncated or SDValue() if the pattern was not
/// matched.		/// matched.
static SDValue detectAVX512USatPattern(SDValue In, EVT VT,		static SDValue detectAVX512USatPattern(SDValue In, EVT VT, SelectionDAG &DAG,
		const SDLoc &DL,
const X86Subtarget &Subtarget,		const X86Subtarget &Subtarget,
const TargetLowering &TLI) {		const TargetLowering &TLI) {
if (!TLI.isTypeLegal(In.getValueType()))		if (!TLI.isTypeLegal(In.getValueType()))
return SDValue();		return SDValue();
if (!isSATValidOnAVX512Subtarget(In.getValueType(), VT, Subtarget))		if (!isSATValidOnAVX512Subtarget(In.getValueType(), VT, Subtarget))
return SDValue();		return SDValue();
return detectUSatPattern(In, VT);		return detectUSatPattern(In, VT, DAG, DL);
}		}

static SDValue combineTruncateWithSat(SDValue In, EVT VT, const SDLoc &DL,		static SDValue combineTruncateWithSat(SDValue In, EVT VT, const SDLoc &DL,
SelectionDAG &DAG,		SelectionDAG &DAG,
const X86Subtarget &Subtarget) {		const X86Subtarget &Subtarget) {
EVT SVT = VT.getScalarType();		EVT SVT = VT.getScalarType();
EVT InVT = In.getValueType();		EVT InVT = In.getValueType();
EVT InSVT = InVT.getScalarType();		EVT InSVT = InVT.getScalarType();
const TargetLowering &TLI = DAG.getTargetLoweringInfo();		const TargetLowering &TLI = DAG.getTargetLoweringInfo();
if (TLI.isTypeLegal(InVT) && TLI.isTypeLegal(VT) &&		if (TLI.isTypeLegal(InVT) && TLI.isTypeLegal(VT) &&
isSATValidOnAVX512Subtarget(InVT, VT, Subtarget)) {		isSATValidOnAVX512Subtarget(InVT, VT, Subtarget)) {
if (auto SSatVal = detectSSatPattern(In, VT))		if (auto SSatVal = detectSSatPattern(In, VT))
return DAG.getNode(X86ISD::VTRUNCS, DL, VT, SSatVal);		return DAG.getNode(X86ISD::VTRUNCS, DL, VT, SSatVal);
if (auto USatVal = detectUSatPattern(In, VT))		if (auto USatVal = detectUSatPattern(In, VT, DAG, DL))
return DAG.getNode(X86ISD::VTRUNCUS, DL, VT, USatVal);		return DAG.getNode(X86ISD::VTRUNCUS, DL, VT, USatVal);
}		}
if (VT.isVector() && isPowerOf2_32(VT.getVectorNumElements()) &&		if (VT.isVector() && isPowerOf2_32(VT.getVectorNumElements()) &&
(SVT == MVT::i8 \|\| SVT == MVT::i16) &&		(SVT == MVT::i8 \|\| SVT == MVT::i16) &&
(InSVT == MVT::i16 \|\| InSVT == MVT::i32)) {		(InSVT == MVT::i16 \|\| InSVT == MVT::i32)) {
if (auto SSatVal = detectSSatPattern(In, VT))		if (auto SSatVal = detectSSatPattern(In, VT))
return truncateVectorWithPACK(X86ISD::PACKSS, VT, SSatVal, DL, DAG,		return truncateVectorWithPACK(X86ISD::PACKSS, VT, SSatVal, DL, DAG,
Subtarget);		Subtarget);
▲ Show 20 Lines • Show All 658 Lines • ▼ Show 20 Lines	if (St->isTruncatingStore() && VT.isVector()) {

const TargetLowering &TLI = DAG.getTargetLoweringInfo();		const TargetLowering &TLI = DAG.getTargetLoweringInfo();
if (SDValue Val =		if (SDValue Val =
detectAVX512SSatPattern(St->getValue(), St->getMemoryVT(), Subtarget,		detectAVX512SSatPattern(St->getValue(), St->getMemoryVT(), Subtarget,
TLI))		TLI))
return EmitTruncSStore(true /* Signed saturation */, St->getChain(),		return EmitTruncSStore(true /* Signed saturation */, St->getChain(),
dl, Val, St->getBasePtr(),		dl, Val, St->getBasePtr(),
St->getMemoryVT(), St->getMemOperand(), DAG);		St->getMemoryVT(), St->getMemOperand(), DAG);
if (SDValue Val =		if (SDValue Val = detectAVX512USatPattern(St->getValue(), St->getMemoryVT(),
detectAVX512USatPattern(St->getValue(), St->getMemoryVT(), Subtarget,		DAG, dl, Subtarget, TLI))
TLI))
return EmitTruncSStore(false /* Unsigned saturation */, St->getChain(),		return EmitTruncSStore(false /* Unsigned saturation */, St->getChain(),
dl, Val, St->getBasePtr(),		dl, Val, St->getBasePtr(),
St->getMemoryVT(), St->getMemOperand(), DAG);		St->getMemoryVT(), St->getMemOperand(), DAG);

unsigned NumElems = VT.getVectorNumElements();		unsigned NumElems = VT.getVectorNumElements();
assert(StVT != VT && "Cannot truncate to the same type");		assert(StVT != VT && "Cannot truncate to the same type");
unsigned FromSz = VT.getScalarSizeInBits();		unsigned FromSz = VT.getScalarSizeInBits();
unsigned ToSz = StVT.getScalarSizeInBits();		unsigned ToSz = StVT.getScalarSizeInBits();
▲ Show 20 Lines • Show All 4,427 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/avx512-trunc.ll

Show First 20 Lines • Show All 784 Lines • ▼ Show 20 Lines
; KNL-NEXT: vpmovdb %zmm0, (%rdi)		; KNL-NEXT: vpmovdb %zmm0, (%rdi)
; KNL-NEXT: vzeroupper		; KNL-NEXT: vzeroupper
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: smax_usat_trunc_wb_256_mem1:		; SKX-LABEL: smax_usat_trunc_wb_256_mem1:
; SKX: ## %bb.0:		; SKX: ## %bb.0:
; SKX-NEXT: vpxor %xmm1, %xmm1, %xmm1		; SKX-NEXT: vpxor %xmm1, %xmm1, %xmm1
; SKX-NEXT: vpmaxsw %ymm1, %ymm0, %ymm0		; SKX-NEXT: vpmaxsw %ymm1, %ymm0, %ymm0
; SKX-NEXT: vpminsw {{.*}}(%rip), %ymm0, %ymm0		; SKX-NEXT: vpmovuswb %ymm0, (%rdi)
; SKX-NEXT: vpmovwb %ymm0, (%rdi)
; SKX-NEXT: vzeroupper		; SKX-NEXT: vzeroupper
; SKX-NEXT: retq		; SKX-NEXT: retq
%x1 = icmp sgt <16 x i16> %i, <i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0>		%x1 = icmp sgt <16 x i16> %i, <i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0>
%x2 = select <16 x i1> %x1, <16 x i16> %i, <16 x i16> <i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0>		%x2 = select <16 x i1> %x1, <16 x i16> %i, <16 x i16> <i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0>
%x3 = icmp slt <16 x i16> %x2, <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>		%x3 = icmp slt <16 x i16> %x2, <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>
%x5 = select <16 x i1> %x3, <16 x i16> %x2, <16 x i16> <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>		%x5 = select <16 x i1> %x3, <16 x i16> %x2, <16 x i16> <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>
%x6 = trunc <16 x i16> %x5 to <16 x i8>		%x6 = trunc <16 x i16> %x5 to <16 x i8>
store <16 x i8> %x6, <16 x i8>* %res, align 1		store <16 x i8> %x6, <16 x i8>* %res, align 1
Show All 9 Lines
; KNL-NEXT: vpmaxsw %ymm1, %ymm0, %ymm0		; KNL-NEXT: vpmaxsw %ymm1, %ymm0, %ymm0
; KNL-NEXT: vpmovsxwd %ymm0, %zmm0		; KNL-NEXT: vpmovsxwd %ymm0, %zmm0
; KNL-NEXT: vpmovdb %zmm0, (%rdi)		; KNL-NEXT: vpmovdb %zmm0, (%rdi)
; KNL-NEXT: vzeroupper		; KNL-NEXT: vzeroupper
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: smax_usat_trunc_wb_256_mem2:		; SKX-LABEL: smax_usat_trunc_wb_256_mem2:
; SKX: ## %bb.0:		; SKX: ## %bb.0:
; SKX-NEXT: vpminsw {{.*}}(%rip), %ymm0, %ymm0
; SKX-NEXT: vpxor %xmm1, %xmm1, %xmm1		; SKX-NEXT: vpxor %xmm1, %xmm1, %xmm1
; SKX-NEXT: vpmaxsw %ymm1, %ymm0, %ymm0		; SKX-NEXT: vpmaxsw %ymm1, %ymm0, %ymm0
; SKX-NEXT: vpmovwb %ymm0, (%rdi)		; SKX-NEXT: vpmovuswb %ymm0, (%rdi)
; SKX-NEXT: vzeroupper		; SKX-NEXT: vzeroupper
; SKX-NEXT: retq		; SKX-NEXT: retq
%x1 = icmp slt <16 x i16> %i, <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>		%x1 = icmp slt <16 x i16> %i, <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>
%x2 = select <16 x i1> %x1, <16 x i16> %i, <16 x i16> <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>		%x2 = select <16 x i1> %x1, <16 x i16> %i, <16 x i16> <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>
%x3 = icmp sgt <16 x i16> %x2, <i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0>		%x3 = icmp sgt <16 x i16> %x2, <i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0>
%x5 = select <16 x i1> %x3, <16 x i16> %x2, <16 x i16> <i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0>		%x5 = select <16 x i1> %x3, <16 x i16> %x2, <16 x i16> <i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0>
%x6 = trunc <16 x i16> %x5 to <16 x i8>		%x6 = trunc <16 x i16> %x5 to <16 x i8>
store <16 x i8> %x6, <16 x i8>* %res, align 1		store <16 x i8> %x6, <16 x i8>* %res, align 1
Show All 10 Lines
; KNL-NEXT: vpmovdb %zmm0, %xmm0		; KNL-NEXT: vpmovdb %zmm0, %xmm0
; KNL-NEXT: vzeroupper		; KNL-NEXT: vzeroupper
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: smax_usat_trunc_wb_256:		; SKX-LABEL: smax_usat_trunc_wb_256:
; SKX: ## %bb.0:		; SKX: ## %bb.0:
; SKX-NEXT: vpxor %xmm1, %xmm1, %xmm1		; SKX-NEXT: vpxor %xmm1, %xmm1, %xmm1
; SKX-NEXT: vpmaxsw %ymm1, %ymm0, %ymm0		; SKX-NEXT: vpmaxsw %ymm1, %ymm0, %ymm0
; SKX-NEXT: vpminsw {{.*}}(%rip), %ymm0, %ymm0		; SKX-NEXT: vpmovuswb %ymm0, %xmm0
; SKX-NEXT: vpmovwb %ymm0, %xmm0
; SKX-NEXT: vzeroupper		; SKX-NEXT: vzeroupper
; SKX-NEXT: retq		; SKX-NEXT: retq
%x1 = icmp sgt <16 x i16> %i, <i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0>		%x1 = icmp sgt <16 x i16> %i, <i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0>
%x2 = select <16 x i1> %x1, <16 x i16> %i, <16 x i16> <i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0>		%x2 = select <16 x i1> %x1, <16 x i16> %i, <16 x i16> <i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0>
%x3 = icmp slt <16 x i16> %x2, <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>		%x3 = icmp slt <16 x i16> %x2, <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>
%x5 = select <16 x i1> %x3, <16 x i16> %x2, <16 x i16> <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>		%x5 = select <16 x i1> %x3, <16 x i16> %x2, <16 x i16> <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>
%x6 = trunc <16 x i16> %x5 to <16 x i8>		%x6 = trunc <16 x i16> %x5 to <16 x i8>
ret <16 x i8> %x6		ret <16 x i8> %x6
}		}

define void @smax_usat_trunc_wb_128_mem(<8 x i16> %i, <8 x i8>* %res) {		define void @smax_usat_trunc_wb_128_mem(<8 x i16> %i, <8 x i8>* %res) {
; KNL-LABEL: smax_usat_trunc_wb_128_mem:		; KNL-LABEL: smax_usat_trunc_wb_128_mem:
; KNL: ## %bb.0:		; KNL: ## %bb.0:
; KNL-NEXT: vpxor %xmm1, %xmm1, %xmm1		; KNL-NEXT: vpxor %xmm1, %xmm1, %xmm1
; KNL-NEXT: vpmaxsw %xmm1, %xmm0, %xmm0		; KNL-NEXT: vpmaxsw %xmm1, %xmm0, %xmm0
; KNL-NEXT: vpminsw {{.*}}(%rip), %xmm0, %xmm0		; KNL-NEXT: vpminsw {{.*}}(%rip), %xmm0, %xmm0
; KNL-NEXT: vpackuswb %xmm0, %xmm0, %xmm0		; KNL-NEXT: vpackuswb %xmm0, %xmm0, %xmm0
; KNL-NEXT: vmovq %xmm0, (%rdi)		; KNL-NEXT: vmovq %xmm0, (%rdi)
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: smax_usat_trunc_wb_128_mem:		; SKX-LABEL: smax_usat_trunc_wb_128_mem:
; SKX: ## %bb.0:		; SKX: ## %bb.0:
; SKX-NEXT: vpxor %xmm1, %xmm1, %xmm1		; SKX-NEXT: vpxor %xmm1, %xmm1, %xmm1
; SKX-NEXT: vpmaxsw %xmm1, %xmm0, %xmm0		; SKX-NEXT: vpmaxsw %xmm1, %xmm0, %xmm0
; SKX-NEXT: vpminsw {{.*}}(%rip), %xmm0, %xmm0		; SKX-NEXT: vpmovuswb %xmm0, (%rdi)
; SKX-NEXT: vpmovwb %xmm0, (%rdi)
; SKX-NEXT: retq		; SKX-NEXT: retq
%x1 = icmp sgt <8 x i16> %i, <i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0>		%x1 = icmp sgt <8 x i16> %i, <i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0>
%x2 = select <8 x i1> %x1, <8 x i16> %i, <8 x i16> <i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0>		%x2 = select <8 x i1> %x1, <8 x i16> %i, <8 x i16> <i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0, i16 0>
%x3 = icmp slt <8 x i16> %x2, <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>		%x3 = icmp slt <8 x i16> %x2, <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>
%x5 = select <8 x i1> %x3, <8 x i16> %x2, <8 x i16> <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>		%x5 = select <8 x i1> %x3, <8 x i16> %x2, <8 x i16> <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>
%x6 = trunc <8 x i16> %x5 to <8 x i8>		%x6 = trunc <8 x i16> %x5 to <8 x i8>
store <8 x i8> %x6, <8 x i8>* %res, align 1		store <8 x i8> %x6, <8 x i8>* %res, align 1
ret void		ret void
}		}

define void @smax_usat_trunc_db_512_mem(<16 x i32> %i, <16 x i8>* %res) {		define void @smax_usat_trunc_db_512_mem(<16 x i32> %i, <16 x i8>* %res) {
; ALL-LABEL: smax_usat_trunc_db_512_mem:		; ALL-LABEL: smax_usat_trunc_db_512_mem:
; ALL: ## %bb.0:		; ALL: ## %bb.0:
; ALL-NEXT: vpxor %xmm1, %xmm1, %xmm1		; ALL-NEXT: vpxor %xmm1, %xmm1, %xmm1
; ALL-NEXT: vpmaxsd %zmm1, %zmm0, %zmm0		; ALL-NEXT: vpmaxsd %zmm1, %zmm0, %zmm0
; ALL-NEXT: vpminsd {{.*}}(%rip){1to16}, %zmm0, %zmm0		; ALL-NEXT: vpmovusdb %zmm0, (%rdi)
; ALL-NEXT: vpmovdb %zmm0, (%rdi)
; ALL-NEXT: vzeroupper		; ALL-NEXT: vzeroupper
; ALL-NEXT: retq		; ALL-NEXT: retq
%x1 = icmp sgt <16 x i32> %i, <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>		%x1 = icmp sgt <16 x i32> %i, <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
%x2 = select <16 x i1> %x1, <16 x i32> %i, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>		%x2 = select <16 x i1> %x1, <16 x i32> %i, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
%x3 = icmp slt <16 x i32> %x2, <i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255>		%x3 = icmp slt <16 x i32> %x2, <i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255>
%x5 = select <16 x i1> %x3, <16 x i32> %x2, <16 x i32> <i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255>		%x5 = select <16 x i1> %x3, <16 x i32> %x2, <16 x i32> <i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255>
%x6 = trunc <16 x i32> %x5 to <16 x i8>		%x6 = trunc <16 x i32> %x5 to <16 x i8>
store <16 x i8> %x6, <16 x i8>* %res, align 1		store <16 x i8> %x6, <16 x i8>* %res, align 1
ret void		ret void
}		}

define void @smax_usat_trunc_qb_512_mem(<8 x i64> %i, <8 x i8>* %res) {		define void @smax_usat_trunc_qb_512_mem(<8 x i64> %i, <8 x i8>* %res) {
; ALL-LABEL: smax_usat_trunc_qb_512_mem:		; ALL-LABEL: smax_usat_trunc_qb_512_mem:
; ALL: ## %bb.0:		; ALL: ## %bb.0:
; ALL-NEXT: vpxor %xmm1, %xmm1, %xmm1		; ALL-NEXT: vpxor %xmm1, %xmm1, %xmm1
; ALL-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0		; ALL-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0
; ALL-NEXT: vpminsq {{.*}}(%rip){1to8}, %zmm0, %zmm0		; ALL-NEXT: vpmovusqb %zmm0, (%rdi)
; ALL-NEXT: vpmovqb %zmm0, (%rdi)
; ALL-NEXT: vzeroupper		; ALL-NEXT: vzeroupper
; ALL-NEXT: retq		; ALL-NEXT: retq
%x1 = icmp sgt <8 x i64> %i, <i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0>		%x1 = icmp sgt <8 x i64> %i, <i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0>
%x2 = select <8 x i1> %x1, <8 x i64> %i, <8 x i64> <i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0>		%x2 = select <8 x i1> %x1, <8 x i64> %i, <8 x i64> <i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0>
%x3 = icmp slt <8 x i64> %x2, <i64 255, i64 255, i64 255, i64 255, i64 255, i64 255, i64 255, i64 255>		%x3 = icmp slt <8 x i64> %x2, <i64 255, i64 255, i64 255, i64 255, i64 255, i64 255, i64 255, i64 255>
%x5 = select <8 x i1> %x3, <8 x i64> %x2, <8 x i64> <i64 255, i64 255, i64 255, i64 255, i64 255, i64 255, i64 255, i64 255>		%x5 = select <8 x i1> %x3, <8 x i64> %x2, <8 x i64> <i64 255, i64 255, i64 255, i64 255, i64 255, i64 255, i64 255, i64 255>
%x6 = trunc <8 x i64> %x5 to <8 x i8>		%x6 = trunc <8 x i64> %x5 to <8 x i8>
store <8 x i8> %x6, <8 x i8>* %res, align 1		store <8 x i8> %x6, <8 x i8>* %res, align 1
ret void		ret void
}		}

define void @smax_usat_trunc_qd_512_mem(<8 x i64> %i, <8 x i32>* %res) {		define void @smax_usat_trunc_qd_512_mem(<8 x i64> %i, <8 x i32>* %res) {
; ALL-LABEL: smax_usat_trunc_qd_512_mem:		; ALL-LABEL: smax_usat_trunc_qd_512_mem:
; ALL: ## %bb.0:		; ALL: ## %bb.0:
; ALL-NEXT: vpxor %xmm1, %xmm1, %xmm1		; ALL-NEXT: vpxor %xmm1, %xmm1, %xmm1
; ALL-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0		; ALL-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0
; ALL-NEXT: vpminsq {{.*}}(%rip){1to8}, %zmm0, %zmm0		; ALL-NEXT: vpmovusqd %zmm0, (%rdi)
; ALL-NEXT: vpmovqd %zmm0, (%rdi)
; ALL-NEXT: vzeroupper		; ALL-NEXT: vzeroupper
; ALL-NEXT: retq		; ALL-NEXT: retq
%x1 = icmp sgt <8 x i64> %i, <i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0>		%x1 = icmp sgt <8 x i64> %i, <i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0>
%x2 = select <8 x i1> %x1, <8 x i64> %i, <8 x i64> <i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0>		%x2 = select <8 x i1> %x1, <8 x i64> %i, <8 x i64> <i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0>
%x3 = icmp slt <8 x i64> %x2, <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>		%x3 = icmp slt <8 x i64> %x2, <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>
%x5 = select <8 x i1> %x3, <8 x i64> %x2, <8 x i64> <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>		%x5 = select <8 x i1> %x3, <8 x i64> %x2, <8 x i64> <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>
%x6 = trunc <8 x i64> %x5 to <8 x i32>		%x6 = trunc <8 x i64> %x5 to <8 x i32>
store <8 x i32> %x6, <8 x i32>* %res, align 1		store <8 x i32> %x6, <8 x i32>* %res, align 1
ret void		ret void
}		}

define void @smax_usat_trunc_qw_512_mem(<8 x i64> %i, <8 x i16>* %res) {		define void @smax_usat_trunc_qw_512_mem(<8 x i64> %i, <8 x i16>* %res) {
; ALL-LABEL: smax_usat_trunc_qw_512_mem:		; ALL-LABEL: smax_usat_trunc_qw_512_mem:
; ALL: ## %bb.0:		; ALL: ## %bb.0:
; ALL-NEXT: vpxor %xmm1, %xmm1, %xmm1		; ALL-NEXT: vpxor %xmm1, %xmm1, %xmm1
; ALL-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0		; ALL-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0
; ALL-NEXT: vpminsq {{.*}}(%rip){1to8}, %zmm0, %zmm0		; ALL-NEXT: vpmovusqw %zmm0, (%rdi)
; ALL-NEXT: vpmovqw %zmm0, (%rdi)
; ALL-NEXT: vzeroupper		; ALL-NEXT: vzeroupper
; ALL-NEXT: retq		; ALL-NEXT: retq
%x1 = icmp sgt <8 x i64> %i, <i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0>		%x1 = icmp sgt <8 x i64> %i, <i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0>
%x2 = select <8 x i1> %x1, <8 x i64> %i, <8 x i64> <i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0>		%x2 = select <8 x i1> %x1, <8 x i64> %i, <8 x i64> <i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0, i64 0>
%x3 = icmp slt <8 x i64> %x2, <i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535>		%x3 = icmp slt <8 x i64> %x2, <i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535>
%x5 = select <8 x i1> %x3, <8 x i64> %x2, <8 x i64> <i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535>		%x5 = select <8 x i1> %x3, <8 x i64> %x2, <8 x i64> <i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535>
%x6 = trunc <8 x i64> %x5 to <8 x i16>		%x6 = trunc <8 x i64> %x5 to <8 x i16>
store <8 x i16> %x6, <8 x i16>* %res, align 1		store <8 x i16> %x6, <8 x i16>* %res, align 1
ret void		ret void
}		}

define <32 x i8> @smax_usat_trunc_db_1024(<32 x i32> %i) {		define <32 x i8> @smax_usat_trunc_db_1024(<32 x i32> %i) {
; KNL-LABEL: smax_usat_trunc_db_1024:		; KNL-LABEL: smax_usat_trunc_db_1024:
; KNL: ## %bb.0:		; KNL: ## %bb.0:
; KNL-NEXT: vpxor %xmm2, %xmm2, %xmm2		; KNL-NEXT: vpxor %xmm2, %xmm2, %xmm2
; KNL-NEXT: vpmaxsd %zmm2, %zmm0, %zmm0
; KNL-NEXT: vpmaxsd %zmm2, %zmm1, %zmm1		; KNL-NEXT: vpmaxsd %zmm2, %zmm1, %zmm1
; KNL-NEXT: vpbroadcastd {{.*#+}} zmm2 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]		; KNL-NEXT: vpmaxsd %zmm2, %zmm0, %zmm0
; KNL-NEXT: vpminsd %zmm2, %zmm1, %zmm1		; KNL-NEXT: vpmovusdb %zmm0, %xmm0
; KNL-NEXT: vpminsd %zmm2, %zmm0, %zmm0		; KNL-NEXT: vpmovusdb %zmm1, %xmm1
; KNL-NEXT: vpmovdb %zmm0, %xmm0
; KNL-NEXT: vpmovdb %zmm1, %xmm1
; KNL-NEXT: vinserti128 $1, %xmm1, %ymm0, %ymm0		; KNL-NEXT: vinserti128 $1, %xmm1, %ymm0, %ymm0
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: smax_usat_trunc_db_1024:		; SKX-LABEL: smax_usat_trunc_db_1024:
; SKX: ## %bb.0:		; SKX: ## %bb.0:
; SKX-NEXT: vpxor %xmm2, %xmm2, %xmm2		; SKX-NEXT: vpxor %xmm2, %xmm2, %xmm2
; SKX-NEXT: vpmaxsd %zmm2, %zmm0, %zmm0		; SKX-NEXT: vpmaxsd %zmm2, %zmm0, %zmm0
; SKX-NEXT: vpmaxsd %zmm2, %zmm1, %zmm1		; SKX-NEXT: vpmaxsd %zmm2, %zmm1, %zmm1
Show All 12 Lines	; SKX-NEXT: retq
%x6 = trunc <32 x i32> %x5 to <32 x i8>		%x6 = trunc <32 x i32> %x5 to <32 x i8>
ret <32 x i8> %x6		ret <32 x i8> %x6
}		}

define void @smax_usat_trunc_db_1024_mem(<32 x i32> %i, <32 x i8>* %p) {		define void @smax_usat_trunc_db_1024_mem(<32 x i32> %i, <32 x i8>* %p) {
; KNL-LABEL: smax_usat_trunc_db_1024_mem:		; KNL-LABEL: smax_usat_trunc_db_1024_mem:
; KNL: ## %bb.0:		; KNL: ## %bb.0:
; KNL-NEXT: vpxor %xmm2, %xmm2, %xmm2		; KNL-NEXT: vpxor %xmm2, %xmm2, %xmm2
; KNL-NEXT: vpmaxsd %zmm2, %zmm0, %zmm0
; KNL-NEXT: vpmaxsd %zmm2, %zmm1, %zmm1		; KNL-NEXT: vpmaxsd %zmm2, %zmm1, %zmm1
; KNL-NEXT: vpbroadcastd {{.*#+}} zmm2 = [255,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]		; KNL-NEXT: vpmaxsd %zmm2, %zmm0, %zmm0
; KNL-NEXT: vpminsd %zmm2, %zmm1, %zmm1		; KNL-NEXT: vpmovusdb %zmm0, %xmm0
; KNL-NEXT: vpminsd %zmm2, %zmm0, %zmm0		; KNL-NEXT: vpmovusdb %zmm1, %xmm1
; KNL-NEXT: vpmovdb %zmm0, %xmm0
; KNL-NEXT: vpmovdb %zmm1, %xmm1
; KNL-NEXT: vinserti128 $1, %xmm1, %ymm0, %ymm0		; KNL-NEXT: vinserti128 $1, %xmm1, %ymm0, %ymm0
; KNL-NEXT: vmovdqu %ymm0, (%rdi)		; KNL-NEXT: vmovdqu %ymm0, (%rdi)
; KNL-NEXT: vzeroupper		; KNL-NEXT: vzeroupper
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: smax_usat_trunc_db_1024_mem:		; SKX-LABEL: smax_usat_trunc_db_1024_mem:
; SKX: ## %bb.0:		; SKX: ## %bb.0:
; SKX-NEXT: vpxor %xmm2, %xmm2, %xmm2		; SKX-NEXT: vpxor %xmm2, %xmm2, %xmm2
Show All 17 Lines	; SKX-NEXT: retq
ret void		ret void
}		}

define <16 x i16> @smax_usat_trunc_dw_512(<16 x i32> %i) {		define <16 x i16> @smax_usat_trunc_dw_512(<16 x i32> %i) {
; ALL-LABEL: smax_usat_trunc_dw_512:		; ALL-LABEL: smax_usat_trunc_dw_512:
; ALL: ## %bb.0:		; ALL: ## %bb.0:
; ALL-NEXT: vpxor %xmm1, %xmm1, %xmm1		; ALL-NEXT: vpxor %xmm1, %xmm1, %xmm1
; ALL-NEXT: vpmaxsd %zmm1, %zmm0, %zmm0		; ALL-NEXT: vpmaxsd %zmm1, %zmm0, %zmm0
; ALL-NEXT: vpminsd {{.*}}(%rip){1to16}, %zmm0, %zmm0		; ALL-NEXT: vpmovusdw %zmm0, %ymm0
; ALL-NEXT: vpmovdw %zmm0, %ymm0
; ALL-NEXT: retq		; ALL-NEXT: retq
%x1 = icmp sgt <16 x i32> %i, <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>		%x1 = icmp sgt <16 x i32> %i, <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
%x2 = select <16 x i1> %x1, <16 x i32> %i, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>		%x2 = select <16 x i1> %x1, <16 x i32> %i, <16 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
%x3 = icmp slt <16 x i32> %x2, <i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535>		%x3 = icmp slt <16 x i32> %x2, <i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535>
%x5 = select <16 x i1> %x3, <16 x i32> %x2, <16 x i32> <i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535>		%x5 = select <16 x i1> %x3, <16 x i32> %x2, <16 x i32> <i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535>
%x6 = trunc <16 x i32> %x5 to <16 x i16>		%x6 = trunc <16 x i32> %x5 to <16 x i16>
ret <16 x i16> %x6		ret <16 x i16> %x6
}		}
▲ Show 20 Lines • Show All 56 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vector-trunc-packus.ll

	Show First 20 Lines • Show All 238 Lines • ▼ Show 20 Lines
	; AVX512F-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0			; AVX512F-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0
	; AVX512F-NEXT: vpmovqd %zmm0, %ymm0			; AVX512F-NEXT: vpmovqd %zmm0, %ymm0
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: trunc_packus_v4i64_v4i32:			; AVX512VL-LABEL: trunc_packus_v4i64_v4i32:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vpminsq {{.*}}(%rip){1to4}, %ymm0, %ymm0
	; AVX512VL-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512VL-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512VL-NEXT: vpmaxsq %ymm1, %ymm0, %ymm0			; AVX512VL-NEXT: vpmaxsq %ymm1, %ymm0, %ymm0
	; AVX512VL-NEXT: vpmovqd %ymm0, %xmm0			; AVX512VL-NEXT: vpmovusqd %ymm0, %xmm0
	; AVX512VL-NEXT: vzeroupper			; AVX512VL-NEXT: vzeroupper
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	;			;
	; AVX512BW-LABEL: trunc_packus_v4i64_v4i32:			; AVX512BW-LABEL: trunc_packus_v4i64_v4i32:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0			; AVX512BW-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0
	; AVX512BW-NEXT: vpbroadcastq {{.*#+}} ymm1 = [4294967295,4294967295,4294967295,4294967295]			; AVX512BW-NEXT: vpbroadcastq {{.*#+}} ymm1 = [4294967295,4294967295,4294967295,4294967295]
	; AVX512BW-NEXT: vpminsq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vpminsq %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512BW-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512BW-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpmovqd %zmm0, %ymm0			; AVX512BW-NEXT: vpmovqd %zmm0, %ymm0
	; AVX512BW-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0			; AVX512BW-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0
	; AVX512BW-NEXT: vzeroupper			; AVX512BW-NEXT: vzeroupper
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512BWVL-LABEL: trunc_packus_v4i64_v4i32:			; AVX512BWVL-LABEL: trunc_packus_v4i64_v4i32:
	; AVX512BWVL: # %bb.0:			; AVX512BWVL: # %bb.0:
	; AVX512BWVL-NEXT: vpminsq {{.*}}(%rip){1to4}, %ymm0, %ymm0
	; AVX512BWVL-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512BWVL-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512BWVL-NEXT: vpmaxsq %ymm1, %ymm0, %ymm0			; AVX512BWVL-NEXT: vpmaxsq %ymm1, %ymm0, %ymm0
	; AVX512BWVL-NEXT: vpmovqd %ymm0, %xmm0			; AVX512BWVL-NEXT: vpmovusqd %ymm0, %xmm0
	; AVX512BWVL-NEXT: vzeroupper			; AVX512BWVL-NEXT: vzeroupper
	; AVX512BWVL-NEXT: retq			; AVX512BWVL-NEXT: retq
	%1 = icmp slt <4 x i64> %a0, <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>			%1 = icmp slt <4 x i64> %a0, <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>
	%2 = select <4 x i1> %1, <4 x i64> %a0, <4 x i64> <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>			%2 = select <4 x i1> %1, <4 x i64> %a0, <4 x i64> <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>
	%3 = icmp sgt <4 x i64> %2, zeroinitializer			%3 = icmp sgt <4 x i64> %2, zeroinitializer
	%4 = select <4 x i1> %3, <4 x i64> %2, <4 x i64> zeroinitializer			%4 = select <4 x i1> %3, <4 x i64> %2, <4 x i64> zeroinitializer
	%5 = trunc <4 x i64> %4 to <4 x i32>			%5 = trunc <4 x i64> %4 to <4 x i32>
	ret <4 x i32> %5			ret <4 x i32> %5
	▲ Show 20 Lines • Show All 380 Lines • ▼ Show 20 Lines
	; AVX2-FAST-NEXT: vmovdqa {{.*#+}} ymm2 = [0,2,4,6,4,6,6,7]			; AVX2-FAST-NEXT: vmovdqa {{.*#+}} ymm2 = [0,2,4,6,4,6,6,7]
	; AVX2-FAST-NEXT: vpermd %ymm0, %ymm2, %ymm0			; AVX2-FAST-NEXT: vpermd %ymm0, %ymm2, %ymm0
	; AVX2-FAST-NEXT: vpermd %ymm1, %ymm2, %ymm1			; AVX2-FAST-NEXT: vpermd %ymm1, %ymm2, %ymm1
	; AVX2-FAST-NEXT: vinserti128 $1, %xmm1, %ymm0, %ymm0			; AVX2-FAST-NEXT: vinserti128 $1, %xmm1, %ymm0, %ymm0
	; AVX2-FAST-NEXT: retq			; AVX2-FAST-NEXT: retq
	;			;
	; AVX512-LABEL: trunc_packus_v8i64_v8i32:			; AVX512-LABEL: trunc_packus_v8i64_v8i32:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpminsq {{.*}}(%rip){1to8}, %zmm0, %zmm0
	; AVX512-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpmovqd %zmm0, %ymm0			; AVX512-NEXT: vpmovusqd %zmm0, %ymm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = icmp slt <8 x i64> %a0, <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>			%1 = icmp slt <8 x i64> %a0, <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>
	%2 = select <8 x i1> %1, <8 x i64> %a0, <8 x i64> <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>			%2 = select <8 x i1> %1, <8 x i64> %a0, <8 x i64> <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>
	%3 = icmp sgt <8 x i64> %2, zeroinitializer			%3 = icmp sgt <8 x i64> %2, zeroinitializer
	%4 = select <8 x i1> %3, <8 x i64> %2, <8 x i64> zeroinitializer			%4 = select <8 x i1> %3, <8 x i64> %2, <8 x i64> zeroinitializer
	%5 = trunc <8 x i64> %4 to <8 x i32>			%5 = trunc <8 x i64> %4 to <8 x i32>
	ret <8 x i32> %5			ret <8 x i32> %5
	}			}
	▲ Show 20 Lines • Show All 385 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,1,3]			; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,1,3]
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpackusdw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpackusdw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: trunc_packus_v8i64_v8i16:			; AVX512-LABEL: trunc_packus_v8i64_v8i16:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpminsq {{.*}}(%rip){1to8}, %zmm0, %zmm0
	; AVX512-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpmovqw %zmm0, %xmm0			; AVX512-NEXT: vpmovusqw %zmm0, %xmm0
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = icmp slt <8 x i64> %a0, <i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535>			%1 = icmp slt <8 x i64> %a0, <i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535>
	%2 = select <8 x i1> %1, <8 x i64> %a0, <8 x i64> <i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535>			%2 = select <8 x i1> %1, <8 x i64> %a0, <8 x i64> <i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535, i64 65535>
	%3 = icmp sgt <8 x i64> %2, zeroinitializer			%3 = icmp sgt <8 x i64> %2, zeroinitializer
	%4 = select <8 x i1> %3, <8 x i64> %2, <8 x i64> zeroinitializer			%4 = select <8 x i1> %3, <8 x i64> %2, <8 x i64> zeroinitializer
	%5 = trunc <8 x i64> %4 to <8 x i16>			%5 = trunc <8 x i64> %4 to <8 x i16>
	ret <8 x i16> %5			ret <8 x i16> %5
	▲ Show 20 Lines • Show All 80 Lines • ▼ Show 20 Lines
	; AVX512F-NEXT: vpmaxsd %ymm1, %ymm0, %ymm0			; AVX512F-NEXT: vpmaxsd %ymm1, %ymm0, %ymm0
	; AVX512F-NEXT: vpmovdw %zmm0, %ymm0			; AVX512F-NEXT: vpmovdw %zmm0, %ymm0
	; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: trunc_packus_v8i32_v8i16:			; AVX512VL-LABEL: trunc_packus_v8i32_v8i16:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vpminsd {{.*}}(%rip){1to8}, %ymm0, %ymm0
	; AVX512VL-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512VL-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512VL-NEXT: vpmaxsd %ymm1, %ymm0, %ymm0			; AVX512VL-NEXT: vpmaxsd %ymm1, %ymm0, %ymm0
	; AVX512VL-NEXT: vpmovdw %ymm0, %xmm0			; AVX512VL-NEXT: vpmovusdw %ymm0, %xmm0
	; AVX512VL-NEXT: vzeroupper			; AVX512VL-NEXT: vzeroupper
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	;			;
	; AVX512BW-LABEL: trunc_packus_v8i32_v8i16:			; AVX512BW-LABEL: trunc_packus_v8i32_v8i16:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vpbroadcastd {{.*#+}} ymm1 = [65535,65535,65535,65535,65535,65535,65535,65535]			; AVX512BW-NEXT: vpbroadcastd {{.*#+}} ymm1 = [65535,65535,65535,65535,65535,65535,65535,65535]
	; AVX512BW-NEXT: vpminsd %ymm1, %ymm0, %ymm0			; AVX512BW-NEXT: vpminsd %ymm1, %ymm0, %ymm0
	; AVX512BW-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512BW-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512BW-NEXT: vpmaxsd %ymm1, %ymm0, %ymm0			; AVX512BW-NEXT: vpmaxsd %ymm1, %ymm0, %ymm0
	; AVX512BW-NEXT: vpmovdw %zmm0, %ymm0			; AVX512BW-NEXT: vpmovdw %zmm0, %ymm0
	; AVX512BW-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0			; AVX512BW-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0
	; AVX512BW-NEXT: vzeroupper			; AVX512BW-NEXT: vzeroupper
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512BWVL-LABEL: trunc_packus_v8i32_v8i16:			; AVX512BWVL-LABEL: trunc_packus_v8i32_v8i16:
	; AVX512BWVL: # %bb.0:			; AVX512BWVL: # %bb.0:
	; AVX512BWVL-NEXT: vpminsd {{.*}}(%rip){1to8}, %ymm0, %ymm0
	; AVX512BWVL-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512BWVL-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512BWVL-NEXT: vpmaxsd %ymm1, %ymm0, %ymm0			; AVX512BWVL-NEXT: vpmaxsd %ymm1, %ymm0, %ymm0
	; AVX512BWVL-NEXT: vpmovdw %ymm0, %xmm0			; AVX512BWVL-NEXT: vpmovusdw %ymm0, %xmm0
	; AVX512BWVL-NEXT: vzeroupper			; AVX512BWVL-NEXT: vzeroupper
	; AVX512BWVL-NEXT: retq			; AVX512BWVL-NEXT: retq
	%1 = icmp slt <8 x i32> %a0, <i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535>			%1 = icmp slt <8 x i32> %a0, <i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535>
	%2 = select <8 x i1> %1, <8 x i32> %a0, <8 x i32> <i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535>			%2 = select <8 x i1> %1, <8 x i32> %a0, <8 x i32> <i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535>
	%3 = icmp sgt <8 x i32> %2, zeroinitializer			%3 = icmp sgt <8 x i32> %2, zeroinitializer
	%4 = select <8 x i1> %3, <8 x i32> %2, <8 x i32> zeroinitializer			%4 = select <8 x i1> %3, <8 x i32> %2, <8 x i32> zeroinitializer
	%5 = trunc <8 x i32> %4 to <8 x i16>			%5 = trunc <8 x i32> %4 to <8 x i16>
	ret <8 x i16> %5			ret <8 x i16> %5
	▲ Show 20 Lines • Show All 115 Lines • ▼ Show 20 Lines
	; AVX2-LABEL: trunc_packus_v16i32_v16i16:			; AVX2-LABEL: trunc_packus_v16i32_v16i16:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpackusdw %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpackusdw %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,1,3]			; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,1,3]
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: trunc_packus_v16i32_v16i16:			; AVX512-LABEL: trunc_packus_v16i32_v16i16:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpminsd {{.*}}(%rip){1to16}, %zmm0, %zmm0
	; AVX512-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512-NEXT: vpmaxsd %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpmaxsd %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpmovdw %zmm0, %ymm0			; AVX512-NEXT: vpmovusdw %zmm0, %ymm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = icmp slt <16 x i32> %a0, <i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535>			%1 = icmp slt <16 x i32> %a0, <i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535>
	%2 = select <16 x i1> %1, <16 x i32> %a0, <16 x i32> <i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535>			%2 = select <16 x i1> %1, <16 x i32> %a0, <16 x i32> <i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535>
	%3 = icmp sgt <16 x i32> %2, zeroinitializer			%3 = icmp sgt <16 x i32> %2, zeroinitializer
	%4 = select <16 x i1> %3, <16 x i32> %2, <16 x i32> zeroinitializer			%4 = select <16 x i1> %3, <16 x i32> %2, <16 x i32> zeroinitializer
	%5 = trunc <16 x i32> %4 to <16 x i16>			%5 = trunc <16 x i32> %4 to <16 x i16>
	ret <16 x i16> %5			ret <16 x i16> %5
	}			}
	▲ Show 20 Lines • Show All 785 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]			; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
	; AVX2-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,2,4,6,8,10,12,14,u,u,u,u,u,u,u,u]			; AVX2-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,2,4,6,8,10,12,14,u,u,u,u,u,u,u,u]
	; AVX2-NEXT: vmovq %xmm0, (%rdi)			; AVX2-NEXT: vmovq %xmm0, (%rdi)
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: trunc_packus_v8i64_v8i8_store:			; AVX512-LABEL: trunc_packus_v8i64_v8i8_store:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpminsq {{.*}}(%rip){1to8}, %zmm0, %zmm0
	; AVX512-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpmaxsq %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpmovqb %zmm0, (%rdi)			; AVX512-NEXT: vpmovusqb %zmm0, (%rdi)
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = icmp slt <8 x i64> %a0, <i64 255, i64 255, i64 255, i64 255, i64 255, i64 255, i64 255, i64 255>			%1 = icmp slt <8 x i64> %a0, <i64 255, i64 255, i64 255, i64 255, i64 255, i64 255, i64 255, i64 255>
	%2 = select <8 x i1> %1, <8 x i64> %a0, <8 x i64> <i64 255, i64 255, i64 255, i64 255, i64 255, i64 255, i64 255, i64 255>			%2 = select <8 x i1> %1, <8 x i64> %a0, <8 x i64> <i64 255, i64 255, i64 255, i64 255, i64 255, i64 255, i64 255, i64 255>
	%3 = icmp sgt <8 x i64> %2, zeroinitializer			%3 = icmp sgt <8 x i64> %2, zeroinitializer
	%4 = select <8 x i1> %3, <8 x i64> %2, <8 x i64> zeroinitializer			%4 = select <8 x i1> %3, <8 x i64> %2, <8 x i64> zeroinitializer
	%5 = trunc <8 x i64> %4 to <8 x i8>			%5 = trunc <8 x i64> %4 to <8 x i8>
	store <8 x i8> %5, <8 x i8> *%p1			store <8 x i8> %5, <8 x i8> *%p1
	▲ Show 20 Lines • Show All 892 Lines • ▼ Show 20 Lines
	; AVX512F-NEXT: vpmovdw %zmm0, %ymm0			; AVX512F-NEXT: vpmovdw %zmm0, %ymm0
	; AVX512F-NEXT: vpackuswb %xmm0, %xmm0, %xmm0			; AVX512F-NEXT: vpackuswb %xmm0, %xmm0, %xmm0
	; AVX512F-NEXT: vmovq %xmm0, (%rdi)			; AVX512F-NEXT: vmovq %xmm0, (%rdi)
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: trunc_packus_v8i32_v8i8_store:			; AVX512VL-LABEL: trunc_packus_v8i32_v8i8_store:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vpminsd {{.*}}(%rip){1to8}, %ymm0, %ymm0
	; AVX512VL-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512VL-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512VL-NEXT: vpmaxsd %ymm1, %ymm0, %ymm0			; AVX512VL-NEXT: vpmaxsd %ymm1, %ymm0, %ymm0
	; AVX512VL-NEXT: vpmovdb %ymm0, (%rdi)			; AVX512VL-NEXT: vpmovusdb %ymm0, (%rdi)
	; AVX512VL-NEXT: vzeroupper			; AVX512VL-NEXT: vzeroupper
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	;			;
	; AVX512BW-LABEL: trunc_packus_v8i32_v8i8_store:			; AVX512BW-LABEL: trunc_packus_v8i32_v8i8_store:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vpbroadcastd {{.*#+}} ymm1 = [255,255,255,255,255,255,255,255]			; AVX512BW-NEXT: vpbroadcastd {{.*#+}} ymm1 = [255,255,255,255,255,255,255,255]
	; AVX512BW-NEXT: vpminsd %ymm1, %ymm0, %ymm0			; AVX512BW-NEXT: vpminsd %ymm1, %ymm0, %ymm0
	; AVX512BW-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512BW-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512BW-NEXT: vpmaxsd %ymm1, %ymm0, %ymm0			; AVX512BW-NEXT: vpmaxsd %ymm1, %ymm0, %ymm0
	; AVX512BW-NEXT: vpmovdw %zmm0, %ymm0			; AVX512BW-NEXT: vpmovdw %zmm0, %ymm0
	; AVX512BW-NEXT: vpackuswb %xmm0, %xmm0, %xmm0			; AVX512BW-NEXT: vpackuswb %xmm0, %xmm0, %xmm0
	; AVX512BW-NEXT: vmovq %xmm0, (%rdi)			; AVX512BW-NEXT: vmovq %xmm0, (%rdi)
	; AVX512BW-NEXT: vzeroupper			; AVX512BW-NEXT: vzeroupper
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512BWVL-LABEL: trunc_packus_v8i32_v8i8_store:			; AVX512BWVL-LABEL: trunc_packus_v8i32_v8i8_store:
	; AVX512BWVL: # %bb.0:			; AVX512BWVL: # %bb.0:
	; AVX512BWVL-NEXT: vpminsd {{.*}}(%rip){1to8}, %ymm0, %ymm0
	; AVX512BWVL-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512BWVL-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512BWVL-NEXT: vpmaxsd %ymm1, %ymm0, %ymm0			; AVX512BWVL-NEXT: vpmaxsd %ymm1, %ymm0, %ymm0
	; AVX512BWVL-NEXT: vpmovdb %ymm0, (%rdi)			; AVX512BWVL-NEXT: vpmovusdb %ymm0, (%rdi)
	; AVX512BWVL-NEXT: vzeroupper			; AVX512BWVL-NEXT: vzeroupper
	; AVX512BWVL-NEXT: retq			; AVX512BWVL-NEXT: retq
	%1 = icmp slt <8 x i32> %a0, <i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255>			%1 = icmp slt <8 x i32> %a0, <i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255>
	%2 = select <8 x i1> %1, <8 x i32> %a0, <8 x i32> <i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255>			%2 = select <8 x i1> %1, <8 x i32> %a0, <8 x i32> <i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255>
	%3 = icmp sgt <8 x i32> %2, zeroinitializer			%3 = icmp sgt <8 x i32> %2, zeroinitializer
	%4 = select <8 x i1> %3, <8 x i32> %2, <8 x i32> zeroinitializer			%4 = select <8 x i1> %3, <8 x i32> %2, <8 x i32> zeroinitializer
	%5 = trunc <8 x i32> %4 to <8 x i8>			%5 = trunc <8 x i32> %4 to <8 x i8>
	store <8 x i8> %5, <8 x i8> *%p1			store <8 x i8> %5, <8 x i8> *%p1
	Show All 24 Lines
	; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,1,3]			; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,1,3]
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpackuswb %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpackuswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: trunc_packus_v16i32_v16i8:			; AVX512-LABEL: trunc_packus_v16i32_v16i8:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpminsd {{.*}}(%rip){1to16}, %zmm0, %zmm0
	; AVX512-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512-NEXT: vpmaxsd %zmm1, %zmm0, %zmm0			; AVX512-NEXT: vpmaxsd %zmm1, %zmm0, %zmm0
	; AVX512-NEXT: vpmovdb %zmm0, %xmm0			; AVX512-NEXT: vpmovusdb %zmm0, %xmm0
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = icmp slt <16 x i32> %a0, <i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255>			%1 = icmp slt <16 x i32> %a0, <i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255>
	%2 = select <16 x i1> %1, <16 x i32> %a0, <16 x i32> <i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255>			%2 = select <16 x i1> %1, <16 x i32> %a0, <16 x i32> <i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255, i32 255>
	%3 = icmp sgt <16 x i32> %2, zeroinitializer			%3 = icmp sgt <16 x i32> %2, zeroinitializer
	%4 = select <16 x i1> %3, <16 x i32> %2, <16 x i32> zeroinitializer			%4 = select <16 x i1> %3, <16 x i32> %2, <16 x i32> zeroinitializer
	%5 = trunc <16 x i32> %4 to <16 x i8>			%5 = trunc <16 x i32> %4 to <16 x i8>
	ret <16 x i8> %5			ret <16 x i8> %5
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; AVX512BW-NEXT: vpmaxsw %ymm1, %ymm0, %ymm0			; AVX512BW-NEXT: vpmaxsw %ymm1, %ymm0, %ymm0
	; AVX512BW-NEXT: vpmovwb %zmm0, %ymm0			; AVX512BW-NEXT: vpmovwb %zmm0, %ymm0
	; AVX512BW-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0			; AVX512BW-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0
	; AVX512BW-NEXT: vzeroupper			; AVX512BW-NEXT: vzeroupper
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512BWVL-LABEL: trunc_packus_v16i16_v16i8:			; AVX512BWVL-LABEL: trunc_packus_v16i16_v16i8:
	; AVX512BWVL: # %bb.0:			; AVX512BWVL: # %bb.0:
	; AVX512BWVL-NEXT: vpminsw {{.*}}(%rip), %ymm0, %ymm0
	; AVX512BWVL-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512BWVL-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512BWVL-NEXT: vpmaxsw %ymm1, %ymm0, %ymm0			; AVX512BWVL-NEXT: vpmaxsw %ymm1, %ymm0, %ymm0
	; AVX512BWVL-NEXT: vpmovwb %ymm0, %xmm0			; AVX512BWVL-NEXT: vpmovuswb %ymm0, %xmm0
	; AVX512BWVL-NEXT: vzeroupper			; AVX512BWVL-NEXT: vzeroupper
	; AVX512BWVL-NEXT: retq			; AVX512BWVL-NEXT: retq
	%1 = icmp slt <16 x i16> %a0, <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>			%1 = icmp slt <16 x i16> %a0, <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>
	%2 = select <16 x i1> %1, <16 x i16> %a0, <16 x i16> <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>			%2 = select <16 x i1> %1, <16 x i16> %a0, <16 x i16> <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>
	%3 = icmp sgt <16 x i16> %2, zeroinitializer			%3 = icmp sgt <16 x i16> %2, zeroinitializer
	%4 = select <16 x i1> %3, <16 x i16> %2, <16 x i16> zeroinitializer			%4 = select <16 x i1> %3, <16 x i16> %2, <16 x i16> zeroinitializer
	%5 = trunc <16 x i16> %4 to <16 x i8>			%5 = trunc <16 x i16> %4 to <16 x i8>
	ret <16 x i8> %5			ret <16 x i8> %5
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; AVX512VL-NEXT: vpmovdb %zmm0, %xmm0			; AVX512VL-NEXT: vpmovdb %zmm0, %xmm0
	; AVX512VL-NEXT: vpmovsxwd %ymm1, %zmm1			; AVX512VL-NEXT: vpmovsxwd %ymm1, %zmm1
	; AVX512VL-NEXT: vpmovdb %zmm1, %xmm1			; AVX512VL-NEXT: vpmovdb %zmm1, %xmm1
	; AVX512VL-NEXT: vinserti128 $1, %xmm1, %ymm0, %ymm0			; AVX512VL-NEXT: vinserti128 $1, %xmm1, %ymm0, %ymm0
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	;			;
	; AVX512BW-LABEL: trunc_packus_v32i16_v32i8:			; AVX512BW-LABEL: trunc_packus_v32i16_v32i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vpminsw {{.*}}(%rip), %zmm0, %zmm0
	; AVX512BW-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512BW-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512BW-NEXT: vpmaxsw %zmm1, %zmm0, %zmm0			; AVX512BW-NEXT: vpmaxsw %zmm1, %zmm0, %zmm0
	; AVX512BW-NEXT: vpmovwb %zmm0, %ymm0			; AVX512BW-NEXT: vpmovuswb %zmm0, %ymm0
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512BWVL-LABEL: trunc_packus_v32i16_v32i8:			; AVX512BWVL-LABEL: trunc_packus_v32i16_v32i8:
	; AVX512BWVL: # %bb.0:			; AVX512BWVL: # %bb.0:
	; AVX512BWVL-NEXT: vpminsw {{.*}}(%rip), %zmm0, %zmm0
	; AVX512BWVL-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512BWVL-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512BWVL-NEXT: vpmaxsw %zmm1, %zmm0, %zmm0			; AVX512BWVL-NEXT: vpmaxsw %zmm1, %zmm0, %zmm0
	; AVX512BWVL-NEXT: vpmovwb %zmm0, %ymm0			; AVX512BWVL-NEXT: vpmovuswb %zmm0, %ymm0
	; AVX512BWVL-NEXT: retq			; AVX512BWVL-NEXT: retq
	%1 = icmp slt <32 x i16> %a0, <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>			%1 = icmp slt <32 x i16> %a0, <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>
	%2 = select <32 x i1> %1, <32 x i16> %a0, <32 x i16> <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>			%2 = select <32 x i1> %1, <32 x i16> %a0, <32 x i16> <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>
	%3 = icmp sgt <32 x i16> %2, zeroinitializer			%3 = icmp sgt <32 x i16> %2, zeroinitializer
	%4 = select <32 x i1> %3, <32 x i16> %2, <32 x i16> zeroinitializer			%4 = select <32 x i1> %3, <32 x i16> %2, <32 x i16> zeroinitializer
	%5 = trunc <32 x i16> %4 to <32 x i8>			%5 = trunc <32 x i16> %4 to <32 x i8>
	ret <32 x i8> %5			ret <32 x i8> %5
	}			}

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Improve unsigned saturation downconvert detection.
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 146775

llvm/trunk/lib/Target/X86/X86ISelLowering.cpp

llvm/trunk/test/CodeGen/X86/avx512-trunc.ll

llvm/trunk/test/CodeGen/X86/vector-trunc-packus.ll

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Improve unsigned saturation downconvert detection.ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 146775

llvm/trunk/lib/Target/X86/X86ISelLowering.cpp

llvm/trunk/test/CodeGen/X86/avx512-trunc.ll

llvm/trunk/test/CodeGen/X86/vector-trunc-packus.ll

[X86] Improve unsigned saturation downconvert detection.
ClosedPublic