Diff 34190

llvm/trunk/lib/Target/X86/Utils/X86ShuffleDecode.h

	Show First 20 Lines • Show All 102 Lines • ▼ Show 20 Lines

	/// \brief Decode a SSE4A EXTRQ instruction as a v16i8 shuffle mask.			/// \brief Decode a SSE4A EXTRQ instruction as a v16i8 shuffle mask.
	void DecodeEXTRQIMask(int Len, int Idx,			void DecodeEXTRQIMask(int Len, int Idx,
	SmallVectorImpl<int> &ShuffleMask);			SmallVectorImpl<int> &ShuffleMask);

	/// \brief Decode a SSE4A INSERTQ instruction as a v16i8 shuffle mask.			/// \brief Decode a SSE4A INSERTQ instruction as a v16i8 shuffle mask.
	void DecodeINSERTQIMask(int Len, int Idx,			void DecodeINSERTQIMask(int Len, int Idx,
	SmallVectorImpl<int> &ShuffleMask);			SmallVectorImpl<int> &ShuffleMask);

				/// \brief Decode a VPERM W/D/Q/PS/PD mask from an IR-level vector constant.
				void DecodeVPERMVMask(const Constant *C, MVT VT,
				SmallVectorImpl<int> &ShuffleMask);

				/// \brief Decode a VPERM W/D/Q/PS/PD mask from a raw array of constants.
				void DecodeVPERMVMask(ArrayRef<uint64_t> RawMask,
				SmallVectorImpl<int> &ShuffleMask);

				/// \brief Decode a VPERMT2 W/D/Q/PS/PD mask from an IR-level vector constant.
				void DecodeVPERMV3Mask(const Constant *C, MVT VT,
				SmallVectorImpl<int> &ShuffleMask);

				/// \brief Decode a VPERMT2 W/D/Q/PS/PD mask from a raw array of constants.
				void DecodeVPERMV3Mask(ArrayRef<uint64_t> RawMask,
				SmallVectorImpl<int> &ShuffleMask);
	} // llvm namespace			} // llvm namespace

	#endif			#endif

llvm/trunk/lib/Target/X86/Utils/X86ShuffleDecode.cpp

Show First 20 Lines • Show All 497 Lines • ▼ Show 20 Lines	void DecodeINSERTQIMask(int Len, int Idx,
for (int i = 0; i != Len; ++i)		for (int i = 0; i != Len; ++i)
ShuffleMask.push_back(i + 16);		ShuffleMask.push_back(i + 16);
for (int i = Idx + Len; i != 8; ++i)		for (int i = Idx + Len; i != 8; ++i)
ShuffleMask.push_back(i);		ShuffleMask.push_back(i);
for (int i = 8; i != 16; ++i)		for (int i = 8; i != 16; ++i)
ShuffleMask.push_back(SM_SentinelUndef);		ShuffleMask.push_back(SM_SentinelUndef);
}		}

		void DecodeVPERMVMask(ArrayRef<uint64_t> RawMask,
		SmallVectorImpl<int> &ShuffleMask) {
		for (int i = 0, e = RawMask.size(); i < e; ++i) {
		uint64_t M = RawMask[i];
		ShuffleMask.push_back((int)M);
		}
		}

		void DecodeVPERMV3Mask(ArrayRef<uint64_t> RawMask,
		SmallVectorImpl<int> &ShuffleMask) {
		for (int i = 0, e = RawMask.size(); i < e; ++i) {
		uint64_t M = RawMask[i];
		ShuffleMask.push_back((int)M);
		}
		}

		void DecodeVPERMVMask(const Constant *C, MVT VT,
		SmallVectorImpl<int> &ShuffleMask) {
		Type *MaskTy = C->getType();
		if (MaskTy->isVectorTy()) {
		unsigned NumElements = MaskTy->getVectorNumElements();
		if (NumElements == VT.getVectorNumElements()) {
		for (unsigned i = 0; i < NumElements; ++i) {
		Constant *COp = C->getAggregateElement(i);
		if (!COp \|\| (!isa<UndefValue>(COp) && !isa<ConstantInt>(COp))) {
		ShuffleMask.clear();
		return;
		}
		if (isa<UndefValue>(COp))
		ShuffleMask.push_back(SM_SentinelUndef);
		else {
		uint64_t Element = cast<ConstantInt>(COp)->getZExtValue();
		Element &= (1 << NumElements) - 1;
		ShuffleMask.push_back(Element);
		}
		}
		}
		return;
		}
		// Scalar value; just broadcast it
		if (!isa<ConstantInt>(C))
		return;
		uint64_t Element = cast<ConstantInt>(C)->getZExtValue();
		int NumElements = VT.getVectorNumElements();
		Element &= (1 << NumElements) - 1;
		for (int i = 0; i < NumElements; ++i)
		ShuffleMask.push_back(Element);
		}

		void DecodeVPERMV3Mask(const Constant *C, MVT VT,
		SmallVectorImpl<int> &ShuffleMask) {
		Type *MaskTy = C->getType();
		unsigned NumElements = MaskTy->getVectorNumElements();
		if (NumElements == VT.getVectorNumElements()) {
		for (unsigned i = 0; i < NumElements; ++i) {
		Constant *COp = C->getAggregateElement(i);
		if (!COp) {
		ShuffleMask.clear();
		return;
		}
		if (isa<UndefValue>(COp))
		ShuffleMask.push_back(SM_SentinelUndef);
		else {
		uint64_t Element = cast<ConstantInt>(COp)->getZExtValue();
		Element &= (1 << NumElements*2) - 1;
		ShuffleMask.push_back(Element);
		}
		}
		}
		}
} // llvm namespace		} // llvm namespace

llvm/trunk/lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 1,584 Lines • ▼ Show 20 Lines	if (!Subtarget->useSoftFloat() && Subtarget->hasBWI()) {
setOperationAction(ISD::INSERT_SUBVECTOR, MVT::v32i1, Custom);		setOperationAction(ISD::INSERT_SUBVECTOR, MVT::v32i1, Custom);
setOperationAction(ISD::INSERT_SUBVECTOR, MVT::v64i1, Custom);		setOperationAction(ISD::INSERT_SUBVECTOR, MVT::v64i1, Custom);
setOperationAction(ISD::SELECT, MVT::v32i1, Custom);		setOperationAction(ISD::SELECT, MVT::v32i1, Custom);
setOperationAction(ISD::SELECT, MVT::v64i1, Custom);		setOperationAction(ISD::SELECT, MVT::v64i1, Custom);
setOperationAction(ISD::SIGN_EXTEND, MVT::v32i8, Custom);		setOperationAction(ISD::SIGN_EXTEND, MVT::v32i8, Custom);
setOperationAction(ISD::ZERO_EXTEND, MVT::v32i8, Custom);		setOperationAction(ISD::ZERO_EXTEND, MVT::v32i8, Custom);
setOperationAction(ISD::SIGN_EXTEND, MVT::v32i16, Custom);		setOperationAction(ISD::SIGN_EXTEND, MVT::v32i16, Custom);
setOperationAction(ISD::ZERO_EXTEND, MVT::v32i16, Custom);		setOperationAction(ISD::ZERO_EXTEND, MVT::v32i16, Custom);
		setOperationAction(ISD::VECTOR_SHUFFLE, MVT::v32i16, Custom);
setOperationAction(ISD::SIGN_EXTEND, MVT::v64i8, Custom);		setOperationAction(ISD::SIGN_EXTEND, MVT::v64i8, Custom);
setOperationAction(ISD::ZERO_EXTEND, MVT::v64i8, Custom);		setOperationAction(ISD::ZERO_EXTEND, MVT::v64i8, Custom);
setOperationAction(ISD::INSERT_VECTOR_ELT, MVT::v32i1, Custom);		setOperationAction(ISD::INSERT_VECTOR_ELT, MVT::v32i1, Custom);
setOperationAction(ISD::INSERT_VECTOR_ELT, MVT::v64i1, Custom);		setOperationAction(ISD::INSERT_VECTOR_ELT, MVT::v64i1, Custom);
setOperationAction(ISD::VSELECT, MVT::v32i16, Legal);		setOperationAction(ISD::VSELECT, MVT::v32i16, Legal);
setOperationAction(ISD::VSELECT, MVT::v64i8, Legal);		setOperationAction(ISD::VSELECT, MVT::v64i8, Legal);
setOperationAction(ISD::TRUNCATE, MVT::v32i1, Custom);		setOperationAction(ISD::TRUNCATE, MVT::v32i1, Custom);
setOperationAction(ISD::TRUNCATE, MVT::v64i1, Custom);		setOperationAction(ISD::TRUNCATE, MVT::v64i1, Custom);
▲ Show 20 Lines • Show All 2,188 Lines • ▼ Show 20 Lines	static bool isTargetShuffle(unsigned Opcode) {
case X86ISD::MOVDDUP:		case X86ISD::MOVDDUP:
case X86ISD::MOVSS:		case X86ISD::MOVSS:
case X86ISD::MOVSD:		case X86ISD::MOVSD:
case X86ISD::UNPCKL:		case X86ISD::UNPCKL:
case X86ISD::UNPCKH:		case X86ISD::UNPCKH:
case X86ISD::VPERMILPI:		case X86ISD::VPERMILPI:
case X86ISD::VPERM2X128:		case X86ISD::VPERM2X128:
case X86ISD::VPERMI:		case X86ISD::VPERMI:
		case X86ISD::VPERMV:
		case X86ISD::VPERMV3:
return true;		return true;
}		}
}		}

static SDValue getTargetShuffleNode(unsigned Opc, SDLoc dl, EVT VT,		static SDValue getTargetShuffleNode(unsigned Opc, SDLoc dl, EVT VT,
SDValue V1, unsigned TargetMask,		SDValue V1, unsigned TargetMask,
SelectionDAG &DAG) {		SelectionDAG &DAG) {
switch(Opc) {		switch(Opc) {
▲ Show 20 Lines • Show All 848 Lines • ▼ Show 20 Lines	case X86ISD::MOVDDUP:
DecodeMOVDDUPMask(VT, Mask);		DecodeMOVDDUPMask(VT, Mask);
IsUnary = true;		IsUnary = true;
break;		break;
case X86ISD::MOVLHPD:		case X86ISD::MOVLHPD:
case X86ISD::MOVLPD:		case X86ISD::MOVLPD:
case X86ISD::MOVLPS:		case X86ISD::MOVLPS:
// Not yet implemented		// Not yet implemented
return false;		return false;
		case X86ISD::VPERMV: {
		IsUnary = true;
		SDValue MaskNode = N->getOperand(0);
		while (MaskNode->getOpcode() == ISD::BITCAST)
		MaskNode = MaskNode->getOperand(0);

		unsigned MaskLoBits = Log2_64(VT.getVectorNumElements());
		SmallVector<uint64_t, 32> RawMask;
		if (MaskNode->getOpcode() == ISD::BUILD_VECTOR) {
		// If we have a build-vector, then things are easy.
		EVT MaskVT = MaskNode.getValueType();
		assert(MaskVT.isInteger() &&
		MaskVT.getVectorNumElements() == VT.getVectorNumElements());

		for (unsigned i = 0; i < MaskNode->getNumOperands(); ++i) {
		SDValue Op = MaskNode->getOperand(i);
		if (Op->getOpcode() == ISD::UNDEF)
		RawMask.push_back((uint64_t)SM_SentinelUndef);
		else if (isa<ConstantSDNode>(Op)) {
		APInt MaskElement = cast<ConstantSDNode>(Op)->getAPIntValue();
		RawMask.push_back(MaskElement.getLoBits(MaskLoBits).getZExtValue());
		} else
		return false;
		}
		DecodeVPERMVMask(RawMask, Mask);
		break;
		}
		if (MaskNode->getOpcode() == X86ISD::VBROADCAST) {
		unsigned NumEltsInMask = MaskNode->getNumOperands();
		MaskNode = MaskNode->getOperand(0);
		auto *CN = dyn_cast<ConstantSDNode>(MaskNode);
		if (CN) {
		APInt MaskEltValue = CN->getAPIntValue();
		for (unsigned i = 0; i < NumEltsInMask; ++i)
		RawMask.push_back(MaskEltValue.getLoBits(MaskLoBits).getZExtValue());
		DecodeVPERMVMask(RawMask, Mask);
		break;
		}
		// It may be a scalar load
		}

		auto *MaskLoad = dyn_cast<LoadSDNode>(MaskNode);
		if (!MaskLoad)
		return false;

		SDValue Ptr = MaskLoad->getBasePtr();
		if (Ptr->getOpcode() == X86ISD::Wrapper \|\|
		Ptr->getOpcode() == X86ISD::WrapperRIP)
		Ptr = Ptr->getOperand(0);

		auto *MaskCP = dyn_cast<ConstantPoolSDNode>(Ptr);
		if (!MaskCP \|\| MaskCP->isMachineConstantPoolEntry())
		return false;

		auto *C = dyn_cast<Constant>(MaskCP->getConstVal());
		if (C) {
		DecodeVPERMVMask(C, VT, Mask);
		if (Mask.empty())
		return false;
		break;
		}
		return false;
		}
		case X86ISD::VPERMV3: {
		IsUnary = false;
		SDValue MaskNode = N->getOperand(1);
		while (MaskNode->getOpcode() == ISD::BITCAST)
		MaskNode = MaskNode->getOperand(1);

		if (MaskNode->getOpcode() == ISD::BUILD_VECTOR) {
		// If we have a build-vector, then things are easy.
		EVT MaskVT = MaskNode.getValueType();
		assert(MaskVT.isInteger() &&
		MaskVT.getVectorNumElements() == VT.getVectorNumElements());

		SmallVector<uint64_t, 32> RawMask;
		unsigned MaskLoBits = Log2_64(VT.getVectorNumElements()*2);

		for (unsigned i = 0; i < MaskNode->getNumOperands(); ++i) {
		SDValue Op = MaskNode->getOperand(i);
		if (Op->getOpcode() == ISD::UNDEF)
		RawMask.push_back((uint64_t)SM_SentinelUndef);
		else {
		auto *CN = dyn_cast<ConstantSDNode>(Op.getNode());
		if (!CN)
		return false;
		APInt MaskElement = CN->getAPIntValue();
		RawMask.push_back(MaskElement.getLoBits(MaskLoBits).getZExtValue());
		}
		}
		DecodeVPERMV3Mask(RawMask, Mask);
		break;
		}

		auto *MaskLoad = dyn_cast<LoadSDNode>(MaskNode);
		if (!MaskLoad)
		return false;

		SDValue Ptr = MaskLoad->getBasePtr();
		if (Ptr->getOpcode() == X86ISD::Wrapper \|\|
		Ptr->getOpcode() == X86ISD::WrapperRIP)
		Ptr = Ptr->getOperand(0);

		auto *MaskCP = dyn_cast<ConstantPoolSDNode>(Ptr);
		if (!MaskCP \|\| MaskCP->isMachineConstantPoolEntry())
		return false;

		auto *C = dyn_cast<Constant>(MaskCP->getConstVal());
		if (C) {
		DecodeVPERMV3Mask(C, VT, Mask);
		if (Mask.empty())
		return false;
		break;
		}
		return false;
		}
default: llvm_unreachable("unknown target shuffle node");		default: llvm_unreachable("unknown target shuffle node");
}		}

// If we have a fake unary shuffle, the shuffle mask is spread across two		// If we have a fake unary shuffle, the shuffle mask is spread across two
// inputs that are actually the same node. Re-map the mask to always point		// inputs that are actually the same node. Re-map the mask to always point
// into the first input.		// into the first input.
if (IsFakeUnary)		if (IsFakeUnary)
for (int &M : Mask)		for (int &M : Mask)
▲ Show 20 Lines • Show All 5,771 Lines • ▼ Show 20 Lines	static SDValue lower256BitVectorShuffle(SDValue Op, SDValue V1, SDValue V2,
case MVT::v32i8:		case MVT::v32i8:
return lowerV32I8VectorShuffle(Op, V1, V2, Subtarget, DAG);		return lowerV32I8VectorShuffle(Op, V1, V2, Subtarget, DAG);

default:		default:
llvm_unreachable("Not a valid 256-bit x86 vector type!");		llvm_unreachable("Not a valid 256-bit x86 vector type!");
}		}
}		}

		static SDValue lowerVectorShuffleWithPERMV(SDLoc DL, MVT VT,
		ArrayRef<int> Mask, SDValue V1,
		SDValue V2, SelectionDAG &DAG) {

		assert(VT.getScalarSizeInBits() >= 16 && "Unexpected data type for PERMV");

		MVT MaskEltVT = MVT::getIntegerVT(VT.getScalarSizeInBits());
		MVT MaskVecVT = MVT::getVectorVT(MaskEltVT, VT.getVectorNumElements());

		SmallVector<SDValue, 32> VPermMask;
		for (unsigned i = 0; i < VT.getVectorNumElements(); ++i)
		VPermMask.push_back(Mask[i] < 0 ? DAG.getUNDEF(MaskEltVT) :
		DAG.getConstant(Mask[i], DL, MaskEltVT));
		SDValue MaskNode = DAG.getNode(ISD::BUILD_VECTOR, DL, MaskVecVT,
		VPermMask);
		if (isSingleInputShuffleMask(Mask))
		return DAG.getNode(X86ISD::VPERMV, DL, VT, MaskNode, V1);

		return DAG.getNode(X86ISD::VPERMV3, DL, VT, V1, MaskNode, V2);
		}

		// X86 has dedicated unpack instructions that can handle specific blend
		// operations: UNPCKH and UNPCKL.
		static SDValue lowerVectorShuffleWithUNPCK(SDLoc DL, MVT VT,
		ArrayRef<int> Mask, SDValue V1,
		SDValue V2, SelectionDAG &DAG) {
		int NumElts = VT.getVectorNumElements();
		bool Unpckl = true;
		bool Unpckh = true;
		bool UnpcklSwapped = true;
		bool UnpckhSwapped = true;
		int NumEltsInLane = 128 / VT.getScalarSizeInBits();

		for (int i = 0; i < NumElts ; ++i) {
		unsigned LaneStart = (i / NumEltsInLane) * NumEltsInLane;

		int LoPos = (i % NumEltsInLane) / 2 + LaneStart + NumElts * (i % 2);
		int HiPos = LoPos + NumEltsInLane / 2;
		int LoPosSwapped = (LoPos + NumElts) % (NumElts * 2);
		int HiPosSwapped = (HiPos + NumElts) % (NumElts * 2);

		if (Mask[i] == -1)
		continue;
		if (Mask[i] != LoPos)
		Unpckl = false;
		if (Mask[i] != HiPos)
		Unpckh = false;
		if (Mask[i] != LoPosSwapped)
		UnpcklSwapped = false;
		if (Mask[i] != HiPosSwapped)
		UnpckhSwapped = false;
		if (!Unpckl && !Unpckh && !UnpcklSwapped && !UnpckhSwapped)
		return SDValue();
		}
		if (Unpckl)
		return DAG.getNode(X86ISD::UNPCKL, DL, VT, V1, V2);
		if (Unpckh)
		return DAG.getNode(X86ISD::UNPCKH, DL, VT, V1, V2);
		if (UnpcklSwapped)
		return DAG.getNode(X86ISD::UNPCKL, DL, VT, V2, V1);
		if (UnpckhSwapped)
		return DAG.getNode(X86ISD::UNPCKH, DL, VT, V2, V1);

		llvm_unreachable("Unexpected result of UNPCK mask analysis");
		return SDValue();
		}

/// \brief Handle lowering of 8-lane 64-bit floating point shuffles.		/// \brief Handle lowering of 8-lane 64-bit floating point shuffles.
static SDValue lowerV8F64VectorShuffle(SDValue Op, SDValue V1, SDValue V2,		static SDValue lowerV8F64VectorShuffle(SDValue Op, SDValue V1, SDValue V2,
const X86Subtarget *Subtarget,		const X86Subtarget *Subtarget,
SelectionDAG &DAG) {		SelectionDAG &DAG) {
SDLoc DL(Op);		SDLoc DL(Op);
assert(V1.getSimpleValueType() == MVT::v8f64 && "Bad operand type!");		assert(V1.getSimpleValueType() == MVT::v8f64 && "Bad operand type!");
assert(V2.getSimpleValueType() == MVT::v8f64 && "Bad operand type!");		assert(V2.getSimpleValueType() == MVT::v8f64 && "Bad operand type!");
ShuffleVectorSDNode *SVOp = cast<ShuffleVectorSDNode>(Op);		ShuffleVectorSDNode *SVOp = cast<ShuffleVectorSDNode>(Op);
ArrayRef<int> Mask = SVOp->getMask();		ArrayRef<int> Mask = SVOp->getMask();
assert(Mask.size() == 8 && "Unexpected mask size for v8 shuffle!");		assert(Mask.size() == 8 && "Unexpected mask size for v8 shuffle!");

// X86 has dedicated unpack instructions that can handle specific blend		SDValue UnpckNode =
// operations: UNPCKH and UNPCKL.		lowerVectorShuffleWithUNPCK(DL, MVT::v8f64, Mask, V1, V2, DAG);
if (isShuffleEquivalent(V1, V2, Mask, {0, 8, 2, 10, 4, 12, 6, 14}))		if (UnpckNode)
return DAG.getNode(X86ISD::UNPCKL, DL, MVT::v8f64, V1, V2);		return UnpckNode;
if (isShuffleEquivalent(V1, V2, Mask, {1, 9, 3, 11, 5, 13, 7, 15}))
return DAG.getNode(X86ISD::UNPCKH, DL, MVT::v8f64, V1, V2);

// FIXME: Implement direct support for this type!		return lowerVectorShuffleWithPERMV(DL, MVT::v8f64, Mask, V1, V2, DAG);
return splitAndLowerVectorShuffle(DL, MVT::v8f64, V1, V2, Mask, DAG);
}		}

/// \brief Handle lowering of 16-lane 32-bit floating point shuffles.		/// \brief Handle lowering of 16-lane 32-bit floating point shuffles.
static SDValue lowerV16F32VectorShuffle(SDValue Op, SDValue V1, SDValue V2,		static SDValue lowerV16F32VectorShuffle(SDValue Op, SDValue V1, SDValue V2,
const X86Subtarget *Subtarget,		const X86Subtarget *Subtarget,
SelectionDAG &DAG) {		SelectionDAG &DAG) {
SDLoc DL(Op);		SDLoc DL(Op);
assert(V1.getSimpleValueType() == MVT::v16f32 && "Bad operand type!");		assert(V1.getSimpleValueType() == MVT::v16f32 && "Bad operand type!");
assert(V2.getSimpleValueType() == MVT::v16f32 && "Bad operand type!");		assert(V2.getSimpleValueType() == MVT::v16f32 && "Bad operand type!");
ShuffleVectorSDNode *SVOp = cast<ShuffleVectorSDNode>(Op);		ShuffleVectorSDNode *SVOp = cast<ShuffleVectorSDNode>(Op);
ArrayRef<int> Mask = SVOp->getMask();		ArrayRef<int> Mask = SVOp->getMask();
assert(Mask.size() == 16 && "Unexpected mask size for v16 shuffle!");		assert(Mask.size() == 16 && "Unexpected mask size for v16 shuffle!");

// Use dedicated unpack instructions for masks that match their pattern.		SDValue UnpckNode =
if (isShuffleEquivalent(V1, V2, Mask,		lowerVectorShuffleWithUNPCK(DL, MVT::v16f32, Mask, V1, V2, DAG);
{// First 128-bit lane.		if (UnpckNode)
0, 16, 1, 17, 4, 20, 5, 21,		return UnpckNode;
// Second 128-bit lane.
8, 24, 9, 25, 12, 28, 13, 29}))
return DAG.getNode(X86ISD::UNPCKL, DL, MVT::v16f32, V1, V2);
if (isShuffleEquivalent(V1, V2, Mask,
{// First 128-bit lane.
2, 18, 3, 19, 6, 22, 7, 23,
// Second 128-bit lane.
10, 26, 11, 27, 14, 30, 15, 31}))
return DAG.getNode(X86ISD::UNPCKH, DL, MVT::v16f32, V1, V2);

// FIXME: Implement direct support for this type!		return lowerVectorShuffleWithPERMV(DL, MVT::v16f32, Mask, V1, V2, DAG);
return splitAndLowerVectorShuffle(DL, MVT::v16f32, V1, V2, Mask, DAG);
}		}

/// \brief Handle lowering of 8-lane 64-bit integer shuffles.		/// \brief Handle lowering of 8-lane 64-bit integer shuffles.
static SDValue lowerV8I64VectorShuffle(SDValue Op, SDValue V1, SDValue V2,		static SDValue lowerV8I64VectorShuffle(SDValue Op, SDValue V1, SDValue V2,
const X86Subtarget *Subtarget,		const X86Subtarget *Subtarget,
SelectionDAG &DAG) {		SelectionDAG &DAG) {
SDLoc DL(Op);		SDLoc DL(Op);
assert(V1.getSimpleValueType() == MVT::v8i64 && "Bad operand type!");		assert(V1.getSimpleValueType() == MVT::v8i64 && "Bad operand type!");
assert(V2.getSimpleValueType() == MVT::v8i64 && "Bad operand type!");		assert(V2.getSimpleValueType() == MVT::v8i64 && "Bad operand type!");
ShuffleVectorSDNode *SVOp = cast<ShuffleVectorSDNode>(Op);		ShuffleVectorSDNode *SVOp = cast<ShuffleVectorSDNode>(Op);
ArrayRef<int> Mask = SVOp->getMask();		ArrayRef<int> Mask = SVOp->getMask();
assert(Mask.size() == 8 && "Unexpected mask size for v8 shuffle!");		assert(Mask.size() == 8 && "Unexpected mask size for v8 shuffle!");

// X86 has dedicated unpack instructions that can handle specific blend		SDValue UnpckNode =
// operations: UNPCKH and UNPCKL.		lowerVectorShuffleWithUNPCK(DL, MVT::v8i64, Mask, V1, V2, DAG);
if (isShuffleEquivalent(V1, V2, Mask, {0, 8, 2, 10, 4, 12, 6, 14}))		if (UnpckNode)
return DAG.getNode(X86ISD::UNPCKL, DL, MVT::v8i64, V1, V2);		return UnpckNode;
if (isShuffleEquivalent(V1, V2, Mask, {1, 9, 3, 11, 5, 13, 7, 15}))
return DAG.getNode(X86ISD::UNPCKH, DL, MVT::v8i64, V1, V2);

// FIXME: Implement direct support for this type!		return lowerVectorShuffleWithPERMV(DL, MVT::v8i64, Mask, V1, V2, DAG);
return splitAndLowerVectorShuffle(DL, MVT::v8i64, V1, V2, Mask, DAG);
}		}

/// \brief Handle lowering of 16-lane 32-bit integer shuffles.		/// \brief Handle lowering of 16-lane 32-bit integer shuffles.
static SDValue lowerV16I32VectorShuffle(SDValue Op, SDValue V1, SDValue V2,		static SDValue lowerV16I32VectorShuffle(SDValue Op, SDValue V1, SDValue V2,
const X86Subtarget *Subtarget,		const X86Subtarget *Subtarget,
SelectionDAG &DAG) {		SelectionDAG &DAG) {
SDLoc DL(Op);		SDLoc DL(Op);
assert(V1.getSimpleValueType() == MVT::v16i32 && "Bad operand type!");		assert(V1.getSimpleValueType() == MVT::v16i32 && "Bad operand type!");
assert(V2.getSimpleValueType() == MVT::v16i32 && "Bad operand type!");		assert(V2.getSimpleValueType() == MVT::v16i32 && "Bad operand type!");
ShuffleVectorSDNode *SVOp = cast<ShuffleVectorSDNode>(Op);		ShuffleVectorSDNode *SVOp = cast<ShuffleVectorSDNode>(Op);
ArrayRef<int> Mask = SVOp->getMask();		ArrayRef<int> Mask = SVOp->getMask();
assert(Mask.size() == 16 && "Unexpected mask size for v16 shuffle!");		assert(Mask.size() == 16 && "Unexpected mask size for v16 shuffle!");

// Use dedicated unpack instructions for masks that match their pattern.		SDValue UnpckNode =
if (isShuffleEquivalent(V1, V2, Mask,		lowerVectorShuffleWithUNPCK(DL, MVT::v16i32, Mask, V1, V2, DAG);
{// First 128-bit lane.		if (UnpckNode)
0, 16, 1, 17, 4, 20, 5, 21,		return UnpckNode;
// Second 128-bit lane.
8, 24, 9, 25, 12, 28, 13, 29}))
return DAG.getNode(X86ISD::UNPCKL, DL, MVT::v16i32, V1, V2);
if (isShuffleEquivalent(V1, V2, Mask,
{// First 128-bit lane.
2, 18, 3, 19, 6, 22, 7, 23,
// Second 128-bit lane.
10, 26, 11, 27, 14, 30, 15, 31}))
return DAG.getNode(X86ISD::UNPCKH, DL, MVT::v16i32, V1, V2);

// FIXME: Implement direct support for this type!		return lowerVectorShuffleWithPERMV(DL, MVT::v16i32, Mask, V1, V2, DAG);
return splitAndLowerVectorShuffle(DL, MVT::v16i32, V1, V2, Mask, DAG);
}		}

/// \brief Handle lowering of 32-lane 16-bit integer shuffles.		/// \brief Handle lowering of 32-lane 16-bit integer shuffles.
static SDValue lowerV32I16VectorShuffle(SDValue Op, SDValue V1, SDValue V2,		static SDValue lowerV32I16VectorShuffle(SDValue Op, SDValue V1, SDValue V2,
const X86Subtarget *Subtarget,		const X86Subtarget *Subtarget,
SelectionDAG &DAG) {		SelectionDAG &DAG) {
SDLoc DL(Op);		SDLoc DL(Op);
assert(V1.getSimpleValueType() == MVT::v32i16 && "Bad operand type!");		assert(V1.getSimpleValueType() == MVT::v32i16 && "Bad operand type!");
assert(V2.getSimpleValueType() == MVT::v32i16 && "Bad operand type!");		assert(V2.getSimpleValueType() == MVT::v32i16 && "Bad operand type!");
ShuffleVectorSDNode *SVOp = cast<ShuffleVectorSDNode>(Op);		ShuffleVectorSDNode *SVOp = cast<ShuffleVectorSDNode>(Op);
ArrayRef<int> Mask = SVOp->getMask();		ArrayRef<int> Mask = SVOp->getMask();
assert(Mask.size() == 32 && "Unexpected mask size for v32 shuffle!");		assert(Mask.size() == 32 && "Unexpected mask size for v32 shuffle!");
assert(Subtarget->hasBWI() && "We can only lower v32i16 with AVX-512-BWI!");		assert(Subtarget->hasBWI() && "We can only lower v32i16 with AVX-512-BWI!");

// FIXME: Implement direct support for this type!		return lowerVectorShuffleWithPERMV(DL, MVT::v32i16, Mask, V1, V2, DAG);
return splitAndLowerVectorShuffle(DL, MVT::v32i16, V1, V2, Mask, DAG);
}		}

/// \brief Handle lowering of 64-lane 8-bit integer shuffles.		/// \brief Handle lowering of 64-lane 8-bit integer shuffles.
static SDValue lowerV64I8VectorShuffle(SDValue Op, SDValue V1, SDValue V2,		static SDValue lowerV64I8VectorShuffle(SDValue Op, SDValue V1, SDValue V2,
const X86Subtarget *Subtarget,		const X86Subtarget *Subtarget,
SelectionDAG &DAG) {		SelectionDAG &DAG) {
SDLoc DL(Op);		SDLoc DL(Op);
assert(V1.getSimpleValueType() == MVT::v64i8 && "Bad operand type!");		assert(V1.getSimpleValueType() == MVT::v64i8 && "Bad operand type!");
▲ Show 20 Lines • Show All 16,121 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/X86/X86MCInstLower.cpp

Show First 20 Lines • Show All 1,263 Lines • ▼ Show 20 Lines	if (auto C = getConstantFromPool(MI, MaskOp)) {
SmallVector<int, 16> Mask;		SmallVector<int, 16> Mask;
DecodeVPERMILPMask(C, Mask);		DecodeVPERMILPMask(C, Mask);
if (!Mask.empty())		if (!Mask.empty())
OutStreamer->AddComment(getShuffleComment(DstOp, SrcOp, Mask));		OutStreamer->AddComment(getShuffleComment(DstOp, SrcOp, Mask));
}		}
break;		break;
}		}

		#define MOV_CASE(Prefix, Suffix) \
		case X86::Prefix##MOVAPD##Suffix##rm: \
		case X86::Prefix##MOVAPS##Suffix##rm: \
		case X86::Prefix##MOVUPD##Suffix##rm: \
		case X86::Prefix##MOVUPS##Suffix##rm: \
		case X86::Prefix##MOVDQA##Suffix##rm: \
		case X86::Prefix##MOVDQU##Suffix##rm:

		#define MOV_AVX512_CASE(Suffix) \
		case X86::VMOVDQA64##Suffix##rm: \
		case X86::VMOVDQA32##Suffix##rm: \
		case X86::VMOVDQU64##Suffix##rm: \
		case X86::VMOVDQU32##Suffix##rm: \
		case X86::VMOVDQU16##Suffix##rm: \
		case X86::VMOVDQU8##Suffix##rm: \
		case X86::VMOVAPS##Suffix##rm: \
		case X86::VMOVAPD##Suffix##rm: \
		case X86::VMOVUPS##Suffix##rm: \
		case X86::VMOVUPD##Suffix##rm:

		#define CASE_ALL_MOV_RM() \
		MOV_CASE(, ) /* SSE */ \
		MOV_CASE(V, ) /* AVX-128 */ \
		MOV_CASE(V, Y) /* AVX-256 */ \
		MOV_AVX512_CASE(Z) \
		MOV_AVX512_CASE(Z256) \
		MOV_AVX512_CASE(Z128)

// For loads from a constant pool to a vector register, print the constant		// For loads from a constant pool to a vector register, print the constant
// loaded.		// loaded.
case X86::MOVAPDrm:		CASE_ALL_MOV_RM()
case X86::VMOVAPDrm:
case X86::VMOVAPDYrm:
case X86::MOVUPDrm:
case X86::VMOVUPDrm:
case X86::VMOVUPDYrm:
case X86::MOVAPSrm:
case X86::VMOVAPSrm:
case X86::VMOVAPSYrm:
case X86::MOVUPSrm:
case X86::VMOVUPSrm:
case X86::VMOVUPSYrm:
case X86::MOVDQArm:
case X86::VMOVDQArm:
case X86::VMOVDQAYrm:
case X86::MOVDQUrm:
case X86::VMOVDQUrm:
case X86::VMOVDQUYrm:
if (!OutStreamer->isVerboseAsm())		if (!OutStreamer->isVerboseAsm())
break;		break;
if (MI->getNumOperands() > 4)		if (MI->getNumOperands() > 4)
if (auto C = getConstantFromPool(MI, MI->getOperand(4))) {		if (auto C = getConstantFromPool(MI, MI->getOperand(4))) {
std::string Comment;		std::string Comment;
raw_string_ostream CS(Comment);		raw_string_ostream CS(Comment);
const MachineOperand &DstOp = MI->getOperand(0);		const MachineOperand &DstOp = MI->getOperand(0);
CS << X86ATTInstPrinter::getRegisterName(DstOp.getReg()) << " = ";		CS << X86ATTInstPrinter::getRegisterName(DstOp.getReg()) << " = ";
▲ Show 20 Lines • Show All 61 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vector-shuffle-512-v16.ll

	; RUN: llc < %s -mcpu=x86-64 -mattr=+avx512f \| FileCheck %s --check-prefix=ALL --check-prefix=AVX512 --check-prefix=AVX512F			; RUN: llc < %s -mcpu=x86-64 -mattr=+avx512f \| FileCheck %s --check-prefix=ALL --check-prefix=AVX512 --check-prefix=AVX512F
	; RUN: llc < %s -mcpu=x86-64 -mattr=+avx512bw \| FileCheck %s --check-prefix=ALL --check-prefix=AVX512 --check-prefix=AVX512BW			; RUN: llc < %s -mcpu=x86-64 -mattr=+avx512bw \| FileCheck %s --check-prefix=ALL --check-prefix=AVX512 --check-prefix=AVX512BW

	target triple = "x86_64-unknown-unknown"			target triple = "x86_64-unknown-unknown"

	define <16 x float> @shuffle_v16f32_00_10_01_11_04_14_05_15_08_18_09_19_0c_1c_0d_1d(<16 x float> %a, <16 x float> %b) {			define <16 x float> @shuffle_v16f32_00_10_01_11_04_14_05_15_08_18_09_19_0c_1c_0d_1d(<16 x float> %a, <16 x float> %b) {
	; ALL-LABEL: shuffle_v16f32_00_10_01_11_04_14_05_15_08_18_09_19_0c_1c_0d_1d:			; ALL-LABEL: shuffle_v16f32_00_10_01_11_04_14_05_15_08_18_09_19_0c_1c_0d_1d:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vunpcklps {{.*#+}} zmm0 = zmm0[0],zmm1[0],zmm0[1],zmm1[1],zmm0[4],zmm1[4],zmm0[5],zmm1[5],zmm0[8],zmm1[8],zmm0[9],zmm1[9],zmm0[12],zmm1[12],zmm0[13],zmm1[13]			; ALL-NEXT: vunpcklps {{.*#+}} zmm0 = zmm0[0],zmm1[0],zmm0[1],zmm1[1],zmm0[4],zmm1[4],zmm0[5],zmm1[5],zmm0[8],zmm1[8],zmm0[9],zmm1[9],zmm0[12],zmm1[12],zmm0[13],zmm1[13]
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <16 x float> %a, <16 x float> %b, <16 x i32><i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>			%shuffle = shufflevector <16 x float> %a, <16 x float> %b, <16 x i32><i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>
	ret <16 x float> %shuffle			ret <16 x float> %shuffle
	}			}

				define <16 x float> @shuffle_v16f32_vunpcklps_swap(<16 x float> %a, <16 x float> %b) {
				; ALL-LABEL: shuffle_v16f32_vunpcklps_swap:
				; ALL: # BB#0:
				; ALL-NEXT: vunpcklps {{.*#+}} zmm0 = zmm1[0],zmm0[0],zmm1[1],zmm0[1],zmm1[4],zmm0[4],zmm1[5],zmm0[5],zmm1[8],zmm0[8],zmm1[9],zmm0[9],zmm1[12],zmm0[12],zmm1[13],zmm0[13]
				; ALL-NEXT: retq
				%shuffle = shufflevector <16 x float> %a, <16 x float> %b, <16 x i32> <i32 16, i32 0, i32 17, i32 1, i32 20, i32 4, i32 21, i32 5, i32 24, i32 8, i32 25, i32 9, i32 28, i32 12, i32 29, i32 13>
				ret <16 x float> %shuffle
				}

	define <16 x i32> @shuffle_v16i32_00_10_01_11_04_14_05_15_08_18_09_19_0c_1c_0d_1d(<16 x i32> %a, <16 x i32> %b) {			define <16 x i32> @shuffle_v16i32_00_10_01_11_04_14_05_15_08_18_09_19_0c_1c_0d_1d(<16 x i32> %a, <16 x i32> %b) {
	; ALL-LABEL: shuffle_v16i32_00_10_01_11_04_14_05_15_08_18_09_19_0c_1c_0d_1d:			; ALL-LABEL: shuffle_v16i32_00_10_01_11_04_14_05_15_08_18_09_19_0c_1c_0d_1d:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpunpckldq {{.*#+}} zmm0 = zmm0[0],zmm1[0],zmm0[1],zmm1[1],zmm0[4],zmm1[4],zmm0[5],zmm1[5],zmm0[8],zmm1[8],zmm0[9],zmm1[9],zmm0[12],zmm1[12],zmm0[13],zmm1[13]			; ALL-NEXT: vpunpckldq {{.*#+}} zmm0 = zmm0[0],zmm1[0],zmm0[1],zmm1[1],zmm0[4],zmm1[4],zmm0[5],zmm1[5],zmm0[8],zmm1[8],zmm0[9],zmm1[9],zmm0[12],zmm1[12],zmm0[13],zmm1[13]
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <16 x i32> %a, <16 x i32> %b, <16 x i32><i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>			%shuffle = shufflevector <16 x i32> %a, <16 x i32> %b, <16 x i32><i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>
	ret <16 x i32> %shuffle			ret <16 x i32> %shuffle
	}			}
	Show All 10 Lines
	define <16 x i32> @shuffle_v16i32_02_12_03_13_06_16_07_17_0a_1a_0b_1b_0e_1e_0f_1f(<16 x i32> %a, <16 x i32> %b) {			define <16 x i32> @shuffle_v16i32_02_12_03_13_06_16_07_17_0a_1a_0b_1b_0e_1e_0f_1f(<16 x i32> %a, <16 x i32> %b) {
	; ALL-LABEL: shuffle_v16i32_02_12_03_13_06_16_07_17_0a_1a_0b_1b_0e_1e_0f_1f:			; ALL-LABEL: shuffle_v16i32_02_12_03_13_06_16_07_17_0a_1a_0b_1b_0e_1e_0f_1f:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpunpckhdq {{.*#+}} zmm0 = zmm0[2],zmm1[2],zmm0[3],zmm1[3],zmm0[6],zmm1[6],zmm0[7],zmm1[7],zmm0[10],zmm1[10],zmm0[11],zmm1[11],zmm0[14],zmm1[14],zmm0[15],zmm1[15]			; ALL-NEXT: vpunpckhdq {{.*#+}} zmm0 = zmm0[2],zmm1[2],zmm0[3],zmm1[3],zmm0[6],zmm1[6],zmm0[7],zmm1[7],zmm0[10],zmm1[10],zmm0[11],zmm1[11],zmm0[14],zmm1[14],zmm0[15],zmm1[15]
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <16 x i32> %a, <16 x i32> %b, <16 x i32><i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>			%shuffle = shufflevector <16 x i32> %a, <16 x i32> %b, <16 x i32><i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>
	ret <16 x i32> %shuffle			ret <16 x i32> %shuffle
	}			}

				define <16 x float> @shuffle_v16f32_02_05_u_u_07_u_0a_01_00_05_u_04_07_u_0a_01(<16 x float> %a) {
				; ALL-LABEL: shuffle_v16f32_02_05_u_u_07_u_0a_01_00_05_u_04_07_u_0a_01:
				; ALL: # BB#0:
				; ALL-NEXT: vmovdqa32 {{.*#+}} zmm1 = <2,5,u,u,7,u,10,1,0,5,u,4,7,u,10,1>
				; ALL-NEXT: vpermps %zmm0, %zmm1, %zmm0
				; ALL-NEXT: retq
				%c = shufflevector <16 x float> %a, <16 x float> undef, <16 x i32> <i32 2, i32 5, i32 undef, i32 undef, i32 7, i32 undef, i32 10, i32 1, i32 0, i32 5, i32 undef, i32 4, i32 7, i32 undef, i32 10, i32 1>
				ret <16 x float> %c
				}

				define <16 x i32> @shuffle_v16i32_02_05_u_u_07_u_0a_01_00_05_u_04_07_u_0a_01(<16 x i32> %a) {
				; ALL-LABEL: shuffle_v16i32_02_05_u_u_07_u_0a_01_00_05_u_04_07_u_0a_01:
				; ALL: # BB#0:
				; ALL-NEXT: vmovdqa32 {{.*#+}} zmm1 = <2,5,u,u,7,u,10,1,0,5,u,4,7,u,10,1>
				; ALL-NEXT: vpermd %zmm0, %zmm1, %zmm0
				; ALL-NEXT: retq
				%c = shufflevector <16 x i32> %a, <16 x i32> undef, <16 x i32> <i32 2, i32 5, i32 undef, i32 undef, i32 7, i32 undef, i32 10, i32 1, i32 0, i32 5, i32 undef, i32 4, i32 7, i32 undef, i32 10, i32 1>
				ret <16 x i32> %c
				}

				define <16 x i32> @shuffle_v16i32_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18(<16 x i32> %a, <16 x i32> %b) {
				; ALL-LABEL: shuffle_v16i32_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18:
				; ALL: # BB#0:
				; ALL-NEXT: vmovdqa32 {{.*#+}} zmm2 = [15,31,14,22,13,29,4,28,11,27,10,26,9,25,8,24]
				; ALL-NEXT: vpermt2d %zmm1, %zmm2, %zmm0
				; ALL-NEXT: retq
				%c = shufflevector <16 x i32> %a, <16 x i32> %b, <16 x i32> <i32 15, i32 31, i32 14, i32 22, i32 13, i32 29, i32 4, i32 28, i32 11, i32 27, i32 10, i32 26, i32 9, i32 25, i32 8, i32 24>
				ret <16 x i32> %c
				}

				define <16 x float> @shuffle_v16f32_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18(<16 x float> %a, <16 x float> %b) {
				; ALL-LABEL: shuffle_v16f32_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18:
				; ALL: # BB#0:
				; ALL-NEXT: vmovdqa32 {{.*#+}} zmm2 = [15,31,14,22,13,29,4,28,11,27,10,26,9,25,8,24]
				; ALL-NEXT: vpermt2ps %zmm1, %zmm2, %zmm0
				; ALL-NEXT: retq
				%c = shufflevector <16 x float> %a, <16 x float> %b, <16 x i32> <i32 15, i32 31, i32 14, i32 22, i32 13, i32 29, i32 4, i32 28, i32 11, i32 27, i32 10, i32 26, i32 9, i32 25, i32 8, i32 24>
				ret <16 x float> %c
				}

				define <16 x float> @shuffle_v16f32_load_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18(<16 x float> %a, <16 x float>* %b) {
				; ALL-LABEL: shuffle_v16f32_load_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18:
				; ALL: # BB#0:
				; ALL-NEXT: vmovdqa32 {{.*#+}} zmm1 = [15,31,14,22,13,29,4,28,11,27,10,26,9,25,8,24]
				; ALL-NEXT: vpermt2ps (%rdi), %zmm1, %zmm0
				; ALL-NEXT: retq
				%c = load <16 x float>, <16 x float>* %b
				%d = shufflevector <16 x float> %a, <16 x float> %c, <16 x i32> <i32 15, i32 31, i32 14, i32 22, i32 13, i32 29, i32 4, i32 28, i32 11, i32 27, i32 10, i32 26, i32 9, i32 25, i32 8, i32 24>
				ret <16 x float> %d
				}

				define <16 x i32> @shuffle_v16i32_load_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18(<16 x i32> %a, <16 x i32>* %b) {
				; ALL-LABEL: shuffle_v16i32_load_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18:
				; ALL: # BB#0:
				; ALL-NEXT: vmovdqa32 {{.*#+}} zmm1 = [15,31,14,22,13,29,4,28,11,27,10,26,9,25,8,24]
				; ALL-NEXT: vpermt2d (%rdi), %zmm1, %zmm0
				; ALL-NEXT: retq
				%c = load <16 x i32>, <16 x i32>* %b
				%d = shufflevector <16 x i32> %a, <16 x i32> %c, <16 x i32> <i32 15, i32 31, i32 14, i32 22, i32 13, i32 29, i32 4, i32 28, i32 11, i32 27, i32 10, i32 26, i32 9, i32 25, i32 8, i32 24>
				ret <16 x i32> %d
				}

				define <16 x i32> @shuffle_v16i32_0_1_2_13_u_u_u_u_u_u_u_u_u_u_u_u(<16 x i32> %a, <16 x i32> %b) {
				; ALL-LABEL: shuffle_v16i32_0_1_2_13_u_u_u_u_u_u_u_u_u_u_u_u:
				; ALL: # BB#0:
				; ALL-NEXT: vmovdqa32 {{.*#+}} zmm2 = <0,1,2,19,u,u,u,u,u,u,u,u,u,u,u,u>
				; ALL-NEXT: vpermt2d %zmm1, %zmm2, %zmm0
				; ALL-NEXT: retq
				%c = shufflevector <16 x i32> %a, <16 x i32> %b, <16 x i32> <i32 0, i32 1, i32 2, i32 19, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
				ret <16 x i32> %c
				}

llvm/trunk/test/CodeGen/X86/vector-shuffle-512-v32.ll

				; RUN: llc < %s -mcpu=x86-64 -mattr=+avx512f -mattr=+avx512bw \| FileCheck %s --check-prefix=ALL --check-prefix=AVX512 --check-prefix=AVX512BW

				target triple = "x86_64-unknown-unknown"

				define <32 x i16> @shuffle_v32i16_02_05_u_u_07_u_0a_01_00_05_u_04_07_u_0a_01_02_05_u_u_07_u_0a_01_00_05_u_04_07_u_0a_1f(<32 x i16> %a) {
				; ALL-LABEL: shuffle_v32i16_02_05_u_u_07_u_0a_01_00_05_u_04_07_u_0a_01_02_05_u_u_07_u_0a_01_00_05_u_04_07_u_0a_1f:
				; ALL: # BB#0:
				; ALL-NEXT: vmovdqu16 {{.*#+}} zmm1 = <2,5,u,u,7,u,10,1,0,5,u,4,7,u,10,1,2,5,u,u,7,u,10,1,0,5,u,4,7,u,10,31>
				; ALL-NEXT: vpermw %zmm0, %zmm1, %zmm0
				; ALL-NEXT: retq
				%c = shufflevector <32 x i16> %a, <32 x i16> undef, <32 x i32> <i32 2, i32 5, i32 undef, i32 undef, i32 7, i32 undef, i32 10, i32 1, i32 0, i32 5, i32 undef, i32 4, i32 7, i32 undef, i32 10, i32 1, i32 2, i32 5, i32 undef, i32 undef, i32 7, i32 undef, i32 10, i32 1, i32 0, i32 5, i32 undef, i32 4, i32 7, i32 undef, i32 10, i32 31>
				ret <32 x i16> %c
				}

				define <32 x i16> @shuffle_v32i16_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_38(<32 x i16> %a, <32 x i16> %b) {
				; ALL-LABEL: shuffle_v32i16_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_38:
				; ALL: # BB#0:
				; ALL-NEXT: vmovdqu16 {{.*#+}} zmm2 = [15,31,14,22,13,29,4,28,11,27,10,26,9,25,8,24,15,31,14,22,13,29,4,28,11,27,10,26,9,25,8,56]
				; ALL-NEXT: vpermt2w %zmm1, %zmm2, %zmm0
				; ALL-NEXT: retq
				%c = shufflevector <32 x i16> %a, <32 x i16> %b, <32 x i32> <i32 15, i32 31, i32 14, i32 22, i32 13, i32 29, i32 4, i32 28, i32 11, i32 27, i32 10, i32 26, i32 9, i32 25, i32 8, i32 24, i32 15, i32 31, i32 14, i32 22, i32 13, i32 29, i32 4, i32 28, i32 11, i32 27, i32 10, i32 26, i32 9, i32 25, i32 8, i32 56>
				ret <32 x i16> %c
				}

				define <32 x i16> @shuffle_v16i32_0_32_1_33_2_34_3_35_8_40_9_41_u_u_u_u(<32 x i16> %a, <32 x i16> %b) {
				; ALL-LABEL: shuffle_v16i32_0_32_1_33_2_34_3_35_8_40_9_41_u_u_u_u:
				; ALL: # BB#0:
				; ALL-NEXT: vmovdqu16 {{.*#+}} zmm2 = <0,32,1,33,2,34,3,35,8,40,9,41,u,u,u,u,u,u,u,u,u,u,u,u,u,u,u,u,u,u,u,u>
				; ALL-NEXT: vpermt2w %zmm1, %zmm2, %zmm0
				; ALL-NEXT: retq
				%c = shufflevector <32 x i16> %a, <32 x i16> %b, <32 x i32> <i32 0, i32 32, i32 1, i32 33, i32 2, i32 34, i32 3, i32 35, i32 8, i32 40, i32 9, i32 41, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
				ret <32 x i16> %c
				}

				define <32 x i16> @shuffle_v16i32_4_36_5_37_6_38_7_39_12_44_13_45_u_u_u_u(<32 x i16> %a, <32 x i16> %b) {
				; ALL-LABEL: shuffle_v16i32_4_36_5_37_6_38_7_39_12_44_13_45_u_u_u_u:
				; ALL: # BB#0:
				; ALL-NEXT: vmovdqu16 {{.*#+}} zmm2 = <4,36,5,37,6,38,7,39,12,44,13,45,u,u,u,u,u,u,u,u,u,u,u,u,u,u,u,u,u,u,u,u>
				; ALL-NEXT: vpermt2w %zmm1, %zmm2, %zmm0
				; ALL-NEXT: retq
				%c = shufflevector <32 x i16> %a, <32 x i16> %b, <32 x i32> <i32 4, i32 36, i32 5, i32 37, i32 6, i32 38, i32 7, i32 39, i32 12, i32 44, i32 13, i32 45, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
				ret <32 x i16> %c
				}

llvm/trunk/test/CodeGen/X86/vector-shuffle-512-v8.ll

	Show All 9 Lines
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00000010(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00000010(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00000010:			; ALL-LABEL: shuffle_v8f64_00000010:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vbroadcastsd %xmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,0,0,0,0,1,0]
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,0,1,0]			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 1, i32 0>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 1, i32 0>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00000200(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00000200(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00000200:			; ALL-LABEL: shuffle_v8f64_00000200:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vbroadcastsd %xmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,0,0,0,2,0,0]
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,2,0,0]			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 2, i32 0, i32 0>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 2, i32 0, i32 0>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00003000(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00003000(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00003000:			; ALL-LABEL: shuffle_v8f64_00003000:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vbroadcastsd %xmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,0,0,3,0,0,0]
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[3,0,0,0]			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 3, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 3, i32 0, i32 0, i32 0>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00040000(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00040000(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00040000:			; ALL-LABEL: shuffle_v8f64_00040000:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,0,4,0,0,0,0]
	; ALL-NEXT: vbroadcastsd %xmm1, %ymm1			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vbroadcastsd %xmm0, %ymm0
	; ALL-NEXT: vblendpd {{.*#+}} ymm1 = ymm0[0,1,2],ymm1[3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 4, i32 0, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 4, i32 0, i32 0, i32 0, i32 0>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00500000(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00500000(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00500000:			; ALL-LABEL: shuffle_v8f64_00500000:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,5,0,0,0,0,0]
	; ALL-NEXT: vblendpd {{.*#+}} ymm1 = ymm0[0],ymm1[1],ymm0[2,3]			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm1[0,0,1,0]
	; ALL-NEXT: vbroadcastsd %xmm0, %ymm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 5, i32 0, i32 0, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 5, i32 0, i32 0, i32 0, i32 0, i32 0>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_06000000(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_06000000(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_06000000:			; ALL-LABEL: shuffle_v8f64_06000000:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,6,0,0,0,0,0,0]
	; ALL-NEXT: vblendpd {{.*#+}} ymm1 = ymm0[0,1],ymm1[2],ymm0[3]			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm1[0,2,0,0]
	; ALL-NEXT: vbroadcastsd %xmm0, %ymm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 6, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 6, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_70000000(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_70000000(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_70000000:			; ALL-LABEL: shuffle_v8f64_70000000:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vpxord %zmm1, %zmm1, %zmm1
	; ALL-NEXT: vblendpd {{.*#+}} ymm1 = ymm0[0,1,2],ymm1[3]			; ALL-NEXT: movl $7, %eax
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm1[3,0,0,0]			; ALL-NEXT: vpinsrq $0, %rax, %xmm1, %xmm2
	; ALL-NEXT: vbroadcastsd %xmm0, %ymm0			; ALL-NEXT: vinserti32x4 $0, %xmm2, %zmm1, %zmm1
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 7, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 7, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_01014545(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_01014545(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_01014545:			; ALL-LABEL: shuffle_v8f64_01014545:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,1,0,1,4,5,4,5]
	; ALL-NEXT: vinsertf128 $1, %xmm1, %ymm1, %ymm1			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm1, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 1, i32 0, i32 1, i32 4, i32 5, i32 4, i32 5>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 1, i32 0, i32 1, i32 4, i32 5, i32 4, i32 5>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00112233(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00112233(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00112233:			; ALL-LABEL: shuffle_v8f64_00112233:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[0,0,1,1]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,1,1,2,2,3,3]
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[2,2,3,3]			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 1, i32 1, i32 2, i32 2, i32 3, i32 3>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 1, i32 1, i32 2, i32 2, i32 3, i32 3>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00001111(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00001111(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00001111:			; ALL-LABEL: shuffle_v8f64_00001111:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vbroadcastsd %xmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,0,0,1,1,1,1]
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[1,1,1,1]			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 1, i32 1, i32 1, i32 1>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 1, i32 1, i32 1, i32 1>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_81a3c5e7(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_81a3c5e7(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_81a3c5e7:			; ALL-LABEL: shuffle_v8f64_81a3c5e7:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm2			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,9,2,11,4,13,6,15]
	; ALL-NEXT: vextractf64x4 $1, %zmm1, %ymm3			; ALL-NEXT: vpermt2pd %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vblendpd {{.*#+}} ymm2 = ymm3[0],ymm2[1],ymm3[2],ymm2[3]			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm1[0],ymm0[1],ymm1[2],ymm0[3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 8, i32 1, i32 10, i32 3, i32 12, i32 5, i32 14, i32 7>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 8, i32 1, i32 10, i32 3, i32 12, i32 5, i32 14, i32 7>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_08080808(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_08080808(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_08080808:			; ALL-LABEL: shuffle_v8f64_08080808:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,0,8,0,8,0,8]
	; ALL-NEXT: vbroadcastsd %xmm1, %ymm1			; ALL-NEXT: vpermt2pd %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],ymm1[1],ymm0[2],ymm1[3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 8, i32 0, i32 8, i32 0, i32 8, i32 0, i32 8>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 8, i32 0, i32 8, i32 0, i32 8, i32 0, i32 8>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_08084c4c(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_08084c4c(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_08084c4c:			; ALL-LABEL: shuffle_v8f64_08084c4c:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm2			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,0,8,4,12,4,12]
	; ALL-NEXT: vinsertf128 $1, %xmm2, %ymm2, %ymm2			; ALL-NEXT: vpermt2pd %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vextractf64x4 $1, %zmm1, %ymm3
	; ALL-NEXT: vbroadcastsd %xmm3, %ymm3
	; ALL-NEXT: vblendpd {{.*#+}} ymm2 = ymm2[0],ymm3[1],ymm2[2],ymm3[3]
	; ALL-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0
	; ALL-NEXT: vbroadcastsd %xmm1, %ymm1
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],ymm1[1],ymm0[2],ymm1[3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 8, i32 0, i32 8, i32 4, i32 12, i32 4, i32 12>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 8, i32 0, i32 8, i32 4, i32 12, i32 4, i32 12>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_8823cc67(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_8823cc67(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_8823cc67:			; ALL-LABEL: shuffle_v8f64_8823cc67:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm2			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,0,10,11,4,4,14,15]
	; ALL-NEXT: vextractf64x4 $1, %zmm1, %ymm3			; ALL-NEXT: vpermt2pd %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vbroadcastsd %xmm3, %ymm3			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vblendpd {{.*#+}} ymm2 = ymm3[0,1],ymm2[2,3]
	; ALL-NEXT: vbroadcastsd %xmm1, %ymm1
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm1[0,1],ymm0[2,3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 8, i32 8, i32 2, i32 3, i32 12, i32 12, i32 6, i32 7>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 8, i32 8, i32 2, i32 3, i32 12, i32 12, i32 6, i32 7>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_9832dc76(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_9832dc76(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_9832dc76:			; ALL-LABEL: shuffle_v8f64_9832dc76:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vblendpd {{.*#+}} ymm2 = ymm1[0,1],ymm0[2,3]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [1,0,11,10,5,4,15,14]
	; ALL-NEXT: vpermilpd {{.*#+}} ymm2 = ymm2[1,0,3,2]			; ALL-NEXT: vpermt2pd %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vextractf64x4 $1, %zmm1, %ymm1
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm1[0,1],ymm0[2,3]
	; ALL-NEXT: vpermilpd {{.*#+}} ymm0 = ymm0[1,0,3,2]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm2, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 9, i32 8, i32 3, i32 2, i32 13, i32 12, i32 7, i32 6>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 9, i32 8, i32 3, i32 2, i32 13, i32 12, i32 7, i32 6>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_9810dc54(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_9810dc54(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_9810dc54:			; ALL-LABEL: shuffle_v8f64_9810dc54:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm2			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [1,0,9,8,5,4,13,12]
	; ALL-NEXT: vpermilpd {{.*#+}} ymm2 = ymm2[1,0,3,2]			; ALL-NEXT: vpermt2pd %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm1, %ymm1			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0
	; ALL-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
	; ALL-NEXT: vpermilpd {{.*#+}} ymm0 = ymm0[1,0,3,2]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm2, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 9, i32 8, i32 1, i32 0, i32 13, i32 12, i32 5, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 9, i32 8, i32 1, i32 0, i32 13, i32 12, i32 5, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_08194c5d(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_08194c5d(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_08194c5d:			; ALL-LABEL: shuffle_v8f64_08194c5d:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm1, %ymm2			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,1,9,4,12,5,13]
	; ALL-NEXT: vpermpd {{.*#+}} ymm2 = ymm2[0,0,2,1]			; ALL-NEXT: vpermt2pd %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm3
	; ALL-NEXT: vpermpd {{.*#+}} ymm3 = ymm3[0,1,1,3]
	; ALL-NEXT: vblendpd {{.*#+}} ymm2 = ymm3[0],ymm2[1],ymm3[2],ymm2[3]
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm1[0,0,2,1]
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,1,1,3]
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],ymm1[1],ymm0[2],ymm1[3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_2a3b6e7f(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_2a3b6e7f(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_2a3b6e7f:			; ALL-LABEL: shuffle_v8f64_2a3b6e7f:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm1, %ymm2			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [2,10,3,11,6,14,7,15]
	; ALL-NEXT: vpermpd {{.*#+}} ymm2 = ymm2[0,2,2,3]			; ALL-NEXT: vpermt2pd %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm3
	; ALL-NEXT: vpermpd {{.*#+}} ymm3 = ymm3[2,1,3,3]
	; ALL-NEXT: vblendpd {{.*#+}} ymm2 = ymm3[0],ymm2[1],ymm3[2],ymm2[3]
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm1[0,2,2,3]
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[2,1,3,3]
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],ymm1[1],ymm0[2],ymm1[3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_08192a3b(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_08192a3b(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_08192a3b:			; ALL-LABEL: shuffle_v8f64_08192a3b:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm2 = ymm1[0,2,2,3]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,1,9,2,10,3,11]
	; ALL-NEXT: vpermpd {{.*#+}} ymm3 = ymm0[2,1,3,3]			; ALL-NEXT: vpermt2pd %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vblendpd {{.*#+}} ymm2 = ymm3[0],ymm2[1],ymm3[2],ymm2[3]
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm1[0,0,2,1]
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,1,1,3]
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],ymm1[1],ymm0[2],ymm1[3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 2, i32 10, i32 3, i32 11>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 2, i32 10, i32 3, i32 11>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_08991abb(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_08991abb(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_08991abb:			; ALL-LABEL: shuffle_v8f64_08991abb:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm2 = ymm1[0,0,1,1]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [8,0,1,1,9,2,3,3]
	; ALL-NEXT: vblendpd {{.*#+}} ymm2 = ymm0[0],ymm2[1,2,3]			; ALL-NEXT: vpermt2pd %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm1[0],ymm0[1],ymm1[2,3]			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[1,2,3,3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm2, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 8, i32 9, i32 9, i32 1, i32 10, i32 11, i32 11>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 8, i32 9, i32 9, i32 1, i32 10, i32 11, i32 11>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_091b2d3f(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_091b2d3f(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_091b2d3f:			; ALL-LABEL: shuffle_v8f64_091b2d3f:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm1, %ymm2			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,9,1,11,2,13,3,15]
	; ALL-NEXT: vpermpd {{.*#+}} ymm3 = ymm0[2,1,3,3]			; ALL-NEXT: vpermt2pd %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vblendpd {{.*#+}} ymm2 = ymm3[0],ymm2[1],ymm3[2],ymm2[3]
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,1,1,3]
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],ymm1[1],ymm0[2],ymm1[3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 9, i32 1, i32 11, i32 2, i32 13, i32 3, i32 15>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 9, i32 1, i32 11, i32 2, i32 13, i32 3, i32 15>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_09ab1def(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_09ab1def(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_09ab1def:			; ALL-LABEL: shuffle_v8f64_09ab1def:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm1, %ymm2			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [8,1,2,3,9,5,6,7]
	; ALL-NEXT: vpermilpd {{.*#+}} ymm3 = ymm0[1,0,2,2]			; ALL-NEXT: vpermt2pd %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vblendpd {{.*#+}} ymm2 = ymm3[0],ymm2[1,2,3]			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],ymm1[1,2,3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 9, i32 10, i32 11, i32 1, i32 13, i32 14, i32 15>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 9, i32 10, i32 11, i32 1, i32 13, i32 14, i32 15>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00014445(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00014445(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00014445:			; ALL-LABEL: shuffle_v8f64_00014445:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[0,0,0,1]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,0,1,4,4,4,5]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,0,0,1]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 1, i32 4, i32 4, i32 4, i32 5>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 1, i32 4, i32 4, i32 4, i32 5>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00204464(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00204464(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00204464:			; ALL-LABEL: shuffle_v8f64_00204464:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[0,0,2,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,2,0,4,4,6,4]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,0,2,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 0, i32 4, i32 4, i32 6, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 0, i32 4, i32 4, i32 6, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_03004744(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_03004744(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_03004744:			; ALL-LABEL: shuffle_v8f64_03004744:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[0,3,0,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,3,0,0,4,7,4,4]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,3,0,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 3, i32 0, i32 0, i32 4, i32 7, i32 4, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 3, i32 0, i32 0, i32 4, i32 7, i32 4, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_10005444(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_10005444(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_10005444:			; ALL-LABEL: shuffle_v8f64_10005444:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[1,0,0,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [1,0,0,0,5,4,4,4]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[1,0,0,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 0, i32 0, i32 5, i32 4, i32 4, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 0, i32 0, i32 5, i32 4, i32 4, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_22006644(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_22006644(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_22006644:			; ALL-LABEL: shuffle_v8f64_22006644:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[2,2,0,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [2,2,0,0,6,6,4,4]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[2,2,0,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 2, i32 2, i32 0, i32 0, i32 6, i32 6, i32 4, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 2, i32 2, i32 0, i32 0, i32 6, i32 6, i32 4, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_33307774(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_33307774(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_33307774:			; ALL-LABEL: shuffle_v8f64_33307774:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[3,3,3,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [3,3,3,0,7,7,7,4]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[3,3,3,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 3, i32 3, i32 3, i32 0, i32 7, i32 7, i32 7, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 3, i32 3, i32 3, i32 0, i32 7, i32 7, i32 7, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_32107654(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_32107654(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_32107654:			; ALL-LABEL: shuffle_v8f64_32107654:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[3,2,1,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [3,2,1,0,7,6,5,4]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[3,2,1,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 3, i32 2, i32 1, i32 0, i32 7, i32 6, i32 5, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 3, i32 2, i32 1, i32 0, i32 7, i32 6, i32 5, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00234467(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00234467(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00234467:			; ALL-LABEL: shuffle_v8f64_00234467:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm0[0,0,2,3]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,2,3,4,4,6,7]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermilpd {{.*#+}} ymm0 = ymm0[0,0,2,3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 3, i32 4, i32 4, i32 6, i32 7>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 3, i32 4, i32 4, i32 6, i32 7>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00224466(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00224466(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00224466:			; ALL-LABEL: shuffle_v8f64_00224466:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vmovddup {{.*#+}} ymm1 = ymm0[0,0,2,2]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,2,2,4,4,6,6]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vmovddup {{.*#+}} ymm0 = ymm0[0,0,2,2]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 2, i32 4, i32 4, i32 6, i32 6>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 2, i32 4, i32 4, i32 6, i32 6>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_10325476(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_10325476(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_10325476:			; ALL-LABEL: shuffle_v8f64_10325476:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm0[1,0,3,2]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [1,0,3,2,5,4,7,6]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermilpd {{.*#+}} ymm0 = ymm0[1,0,3,2]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 5, i32 4, i32 7, i32 6>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 5, i32 4, i32 7, i32 6>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_11335577(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_11335577(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_11335577:			; ALL-LABEL: shuffle_v8f64_11335577:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm0[1,1,3,3]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [1,1,3,3,5,5,7,7]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermilpd {{.*#+}} ymm0 = ymm0[1,1,3,3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 5, i32 5, i32 7, i32 7>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 5, i32 5, i32 7, i32 7>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_10235467(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_10235467(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_10235467:			; ALL-LABEL: shuffle_v8f64_10235467:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm0[1,0,2,3]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [1,0,2,3,5,4,6,7]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermilpd {{.*#+}} ymm0 = ymm0[1,0,2,3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 2, i32 3, i32 5, i32 4, i32 6, i32 7>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 2, i32 3, i32 5, i32 4, i32 6, i32 7>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_10225466(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_10225466(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_10225466:			; ALL-LABEL: shuffle_v8f64_10225466:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm0[1,0,2,2]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [1,0,2,2,5,4,6,6]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermilpd {{.*#+}} ymm0 = ymm0[1,0,2,2]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 2, i32 2, i32 5, i32 4, i32 6, i32 6>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 2, i32 2, i32 5, i32 4, i32 6, i32 6>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00015444(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00015444(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00015444:			; ALL-LABEL: shuffle_v8f64_00015444:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[0,0,0,1]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,0,1,5,4,4,4]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[1,0,0,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 1, i32 5, i32 4, i32 4, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 1, i32 5, i32 4, i32 4, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00204644(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00204644(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00204644:			; ALL-LABEL: shuffle_v8f64_00204644:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[0,0,2,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,2,0,4,6,4,4]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,2,0,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 0, i32 4, i32 6, i32 4, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 0, i32 4, i32 6, i32 4, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_03004474(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_03004474(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_03004474:			; ALL-LABEL: shuffle_v8f64_03004474:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[0,3,0,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,3,0,0,4,4,7,4]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,0,3,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 3, i32 0, i32 0, i32 4, i32 4, i32 7, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 3, i32 0, i32 0, i32 4, i32 4, i32 7, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_10004444(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_10004444(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_10004444:			; ALL-LABEL: shuffle_v8f64_10004444:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[1,0,0,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [1,0,0,0,4,4,4,4]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vbroadcastsd %xmm0, %ymm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 0, i32 0, i32 4, i32 4, i32 4, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 0, i32 0, i32 4, i32 4, i32 4, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_22006446(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_22006446(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_22006446:			; ALL-LABEL: shuffle_v8f64_22006446:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[2,2,0,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [2,2,0,0,6,4,4,6]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[2,0,0,2]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 2, i32 2, i32 0, i32 0, i32 6, i32 4, i32 4, i32 6>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 2, i32 2, i32 0, i32 0, i32 6, i32 4, i32 4, i32 6>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_33307474(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_33307474(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_33307474:			; ALL-LABEL: shuffle_v8f64_33307474:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[3,3,3,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [3,3,3,0,7,4,7,4]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[3,0,3,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 3, i32 3, i32 3, i32 0, i32 7, i32 4, i32 7, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 3, i32 3, i32 3, i32 0, i32 7, i32 4, i32 7, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_32104567(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_32104567(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_32104567:			; ALL-LABEL: shuffle_v8f64_32104567:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[3,2,1,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [3,2,1,0,4,5,6,7]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 3, i32 2, i32 1, i32 0, i32 4, i32 5, i32 6, i32 7>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 3, i32 2, i32 1, i32 0, i32 4, i32 5, i32 6, i32 7>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00236744(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00236744(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00236744:			; ALL-LABEL: shuffle_v8f64_00236744:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm0[0,0,2,3]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,2,3,6,7,4,4]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[2,3,0,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 3, i32 6, i32 7, i32 4, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 3, i32 6, i32 7, i32 4, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00226644(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00226644(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00226644:			; ALL-LABEL: shuffle_v8f64_00226644:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vmovddup {{.*#+}} ymm1 = ymm0[0,0,2,2]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,2,2,6,6,4,4]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[2,2,0,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 2, i32 6, i32 6, i32 4, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 2, i32 6, i32 6, i32 4, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_10324567(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_10324567(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_10324567:			; ALL-LABEL: shuffle_v8f64_10324567:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm0[1,0,3,2]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [1,0,3,2,4,5,6,7]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 4, i32 5, i32 6, i32 7>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 4, i32 5, i32 6, i32 7>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_11334567(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_11334567(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_11334567:			; ALL-LABEL: shuffle_v8f64_11334567:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm0[1,1,3,3]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [1,1,3,3,4,5,6,7]
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 4, i32 5, i32 6, i32 7>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 4, i32 5, i32 6, i32 7>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_01235467(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_01235467(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_01235467:			; ALL-LABEL: shuffle_v8f64_01235467:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,1,2,3,5,4,6,7]
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm1[1,0,2,3]			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm1, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 4, i32 6, i32 7>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 4, i32 6, i32 7>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_01235466(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_01235466(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_01235466:			; ALL-LABEL: shuffle_v8f64_01235466:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,1,2,3,5,4,6,6]
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm1[1,0,2,2]			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm1, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 4, i32 6, i32 6>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 4, i32 6, i32 6>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_002u6u44(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_002u6u44(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_002u6u44:			; ALL-LABEL: shuffle_v8f64_002u6u44:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vmovddup {{.*#+}} ymm1 = ymm0[0,0,2,2]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = <0,0,2,u,6,u,4,4>
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[2,1,0,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 undef, i32 6, i32 undef, i32 4, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 undef, i32 6, i32 undef, i32 4, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00uu66uu(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00uu66uu(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00uu66uu:			; ALL-LABEL: shuffle_v8f64_00uu66uu:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vbroadcastsd %xmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = <0,0,u,u,6,6,u,u>
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[2,2,2,3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 undef, i32 undef, i32 6, i32 6, i32 undef, i32 undef>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 undef, i32 undef, i32 6, i32 6, i32 undef, i32 undef>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_103245uu(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_103245uu(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_103245uu:			; ALL-LABEL: shuffle_v8f64_103245uu:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm0[1,0,3,2]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = <1,0,3,2,4,5,u,u>
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 4, i32 5, i32 undef, i32 undef>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 4, i32 5, i32 undef, i32 undef>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_1133uu67(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_1133uu67(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_1133uu67:			; ALL-LABEL: shuffle_v8f64_1133uu67:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm0[1,1,3,3]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = <1,1,3,3,u,u,6,7>
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 undef, i32 undef, i32 6, i32 7>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 undef, i32 undef, i32 6, i32 7>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_0uu354uu(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_0uu354uu(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_0uu354uu:			; ALL-LABEL: shuffle_v8f64_0uu354uu:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = <0,u,u,3,5,4,u,u>
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm1[1,0,2,2]			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm1, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 undef, i32 undef, i32 3, i32 5, i32 4, i32 undef, i32 undef>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 undef, i32 undef, i32 3, i32 5, i32 4, i32 undef, i32 undef>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_uuu3uu66(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_uuu3uu66(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_uuu3uu66:			; ALL-LABEL: shuffle_v8f64_uuu3uu66:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = <u,u,u,3,u,u,6,6>
	; ALL-NEXT: vmovddup {{.*#+}} ymm1 = ymm1[0,0,2,2]			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm1, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 undef, i32 undef, i32 undef, i32 3, i32 undef, i32 undef, i32 6, i32 6>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 undef, i32 undef, i32 undef, i32 3, i32 undef, i32 undef, i32 6, i32 6>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_c348cda0(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_c348cda0(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_c348cda0:			; ALL-LABEL: shuffle_v8f64_c348cda0:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm2			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [4,11,12,0,4,5,2,8]
	; ALL-NEXT: vperm2f128 {{.*#+}} ymm2 = ymm0[2,3],ymm2[0,1]			; ALL-NEXT: vpermt2pd %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm1, %ymm3			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vbroadcastsd %xmm1, %ymm4
	; ALL-NEXT: vblendpd {{.*#+}} ymm4 = ymm3[0,1,2],ymm4[3]
	; ALL-NEXT: vblendpd {{.*#+}} ymm2 = ymm4[0],ymm2[1,2],ymm4[3]
	; ALL-NEXT: vblendpd {{.*#+}} ymm1 = ymm3[0,1],ymm1[2],ymm3[3]
	; ALL-NEXT: vbroadcastsd %xmm0, %ymm0
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm1[0,1,2],ymm0[3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm2, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 12, i32 3, i32 4, i32 8, i32 12, i32 13, i32 10, i32 0>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 12, i32 3, i32 4, i32 8, i32 12, i32 13, i32 10, i32 0>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_f511235a(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_f511235a(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_f511235a:			; ALL-LABEL: shuffle_v8f64_f511235a:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm2			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [15,5,1,1,2,3,5,10]
	; ALL-NEXT: vblendpd {{.*#+}} ymm3 = ymm0[0],ymm2[1],ymm0[2,3]			; ALL-NEXT: vpermt2pd %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm3 = ymm3[2,3,1,3]
	; ALL-NEXT: vmovddup {{.*#+}} ymm4 = ymm1[0,0,2,2]
	; ALL-NEXT: vblendpd {{.*#+}} ymm3 = ymm3[0,1,2],ymm4[3]
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,1,1,1]
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],ymm2[1],ymm0[2,3]
	; ALL-NEXT: vextractf64x4 $1, %zmm1, %ymm1
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm1[3,1,2,3]
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm1[0],ymm0[1,2,3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm3, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 15, i32 5, i32 1, i32 1, i32 2, i32 3, i32 5, i32 10>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 15, i32 5, i32 1, i32 1, i32 2, i32 3, i32 5, i32 10>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00000000(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00000000(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00000000:			; ALL-LABEL: shuffle_v8i64_00000000:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpbroadcastq %xmm0, %zmm0			; ALL-NEXT: vpbroadcastq %xmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00000010(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00000010(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00000010:			; ALL-LABEL: shuffle_v8i64_00000010:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpbroadcastq %xmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,0,0,0,0,1,0]
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,0,1,0]			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 1, i32 0>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 1, i32 0>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00000200(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00000200(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00000200:			; ALL-LABEL: shuffle_v8i64_00000200:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpbroadcastq %xmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,0,0,0,2,0,0]
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,0,0]			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 2, i32 0, i32 0>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 2, i32 0, i32 0>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00003000(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00003000(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00003000:			; ALL-LABEL: shuffle_v8i64_00003000:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpbroadcastq %xmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,0,0,3,0,0,0]
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[3,0,0,0]			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 3, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 3, i32 0, i32 0, i32 0>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00040000(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00040000(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00040000:			; ALL-LABEL: shuffle_v8i64_00040000:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,0,4,0,0,0,0]
	; ALL-NEXT: vpbroadcastq %xmm1, %ymm1			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpbroadcastq %xmm0, %ymm0
	; ALL-NEXT: vpblendd {{.*#+}} ymm1 = ymm0[0,1,2,3,4,5],ymm1[6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 4, i32 0, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 4, i32 0, i32 0, i32 0, i32 0>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00500000(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00500000(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00500000:			; ALL-LABEL: shuffle_v8i64_00500000:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,5,0,0,0,0,0]
	; ALL-NEXT: vpblendd {{.*#+}} ymm1 = ymm0[0,1],ymm1[2,3],ymm0[4,5,6,7]			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm1[0,0,1,0]
	; ALL-NEXT: vpbroadcastq %xmm0, %ymm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 5, i32 0, i32 0, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 5, i32 0, i32 0, i32 0, i32 0, i32 0>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_06000000(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_06000000(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_06000000:			; ALL-LABEL: shuffle_v8i64_06000000:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,6,0,0,0,0,0,0]
	; ALL-NEXT: vpblendd {{.*#+}} ymm1 = ymm0[0,1,2,3],ymm1[4,5],ymm0[6,7]			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm1[0,2,0,0]
	; ALL-NEXT: vpbroadcastq %xmm0, %ymm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 6, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 6, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_70000000(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_70000000(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_70000000:			; ALL-LABEL: shuffle_v8i64_70000000:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vpxord %zmm1, %zmm1, %zmm1
	; ALL-NEXT: vpblendd {{.*#+}} ymm1 = ymm0[0,1,2,3,4,5],ymm1[6,7]			; ALL-NEXT: movl $7, %eax
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm1[3,0,0,0]			; ALL-NEXT: vpinsrq $0, %rax, %xmm1, %xmm2
	; ALL-NEXT: vpbroadcastq %xmm0, %ymm0			; ALL-NEXT: vinserti32x4 $0, %xmm2, %zmm1, %zmm1
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 7, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 7, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_01014545(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_01014545(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_01014545:			; ALL-LABEL: shuffle_v8i64_01014545:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,1,0,1,4,5,4,5]
	; ALL-NEXT: vinserti128 $1, %xmm1, %ymm1, %ymm1			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0
	; ALL-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 1, i32 0, i32 1, i32 4, i32 5, i32 4, i32 5>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 1, i32 0, i32 1, i32 4, i32 5, i32 4, i32 5>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00112233(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00112233(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00112233:			; ALL-LABEL: shuffle_v8i64_00112233:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[0,0,1,1]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,1,1,2,2,3,3]
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[2,2,3,3]			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 1, i32 1, i32 2, i32 2, i32 3, i32 3>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 1, i32 1, i32 2, i32 2, i32 3, i32 3>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00001111(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00001111(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00001111:			; ALL-LABEL: shuffle_v8i64_00001111:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpbroadcastq %xmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,0,0,1,1,1,1]
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[1,1,1,1]			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 1, i32 1, i32 1, i32 1>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 1, i32 1, i32 1, i32 1>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_81a3c5e7(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_81a3c5e7(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_81a3c5e7:			; ALL-LABEL: shuffle_v8i64_81a3c5e7:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm2			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,9,2,11,4,13,6,15]
	; ALL-NEXT: vextracti64x4 $1, %zmm1, %ymm3			; ALL-NEXT: vpermt2q %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vpblendd {{.*#+}} ymm2 = ymm3[0,1],ymm2[2,3],ymm3[4,5],ymm2[6,7]			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm1[0,1],ymm0[2,3],ymm1[4,5],ymm0[6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 8, i32 1, i32 10, i32 3, i32 12, i32 5, i32 14, i32 7>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 8, i32 1, i32 10, i32 3, i32 12, i32 5, i32 14, i32 7>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_08080808(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_08080808(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_08080808:			; ALL-LABEL: shuffle_v8i64_08080808:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,0,8,0,8,0,8]
	; ALL-NEXT: vpbroadcastq %xmm1, %ymm1			; ALL-NEXT: vpermt2q %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm0[0,1],ymm1[2,3],ymm0[4,5],ymm1[6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 8, i32 0, i32 8, i32 0, i32 8, i32 0, i32 8>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 8, i32 0, i32 8, i32 0, i32 8, i32 0, i32 8>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_08084c4c(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_08084c4c(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_08084c4c:			; ALL-LABEL: shuffle_v8i64_08084c4c:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm2			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,0,8,4,12,4,12]
	; ALL-NEXT: vinserti128 $1, %xmm2, %ymm2, %ymm2			; ALL-NEXT: vpermt2q %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vextracti64x4 $1, %zmm1, %ymm3
	; ALL-NEXT: vpbroadcastq %xmm3, %ymm3
	; ALL-NEXT: vpblendd {{.*#+}} ymm2 = ymm2[0,1],ymm3[2,3],ymm2[4,5],ymm3[6,7]
	; ALL-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0
	; ALL-NEXT: vpbroadcastq %xmm1, %ymm1
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm0[0,1],ymm1[2,3],ymm0[4,5],ymm1[6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 8, i32 0, i32 8, i32 4, i32 12, i32 4, i32 12>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 8, i32 0, i32 8, i32 4, i32 12, i32 4, i32 12>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_8823cc67(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_8823cc67(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_8823cc67:			; ALL-LABEL: shuffle_v8i64_8823cc67:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm2			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,0,10,11,4,4,14,15]
	; ALL-NEXT: vextracti64x4 $1, %zmm1, %ymm3			; ALL-NEXT: vpermt2q %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vpbroadcastq %xmm3, %ymm3			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vpblendd {{.*#+}} ymm2 = ymm3[0,1,2,3],ymm2[4,5,6,7]
	; ALL-NEXT: vpbroadcastq %xmm1, %ymm1
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm1[0,1,2,3],ymm0[4,5,6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 8, i32 8, i32 2, i32 3, i32 12, i32 12, i32 6, i32 7>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 8, i32 8, i32 2, i32 3, i32 12, i32 12, i32 6, i32 7>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_9832dc76(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_9832dc76(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_9832dc76:			; ALL-LABEL: shuffle_v8i64_9832dc76:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpblendd {{.*#+}} ymm2 = ymm1[0,1,2,3],ymm0[4,5,6,7]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [1,0,11,10,5,4,15,14]
	; ALL-NEXT: vpshufd {{.*#+}} ymm2 = ymm2[2,3,0,1,6,7,4,5]			; ALL-NEXT: vpermt2q %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vextracti64x4 $1, %zmm1, %ymm1
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm1[0,1,2,3],ymm0[4,5,6,7]
	; ALL-NEXT: vpshufd {{.*#+}} ymm0 = ymm0[2,3,0,1,6,7,4,5]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm2, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 9, i32 8, i32 3, i32 2, i32 13, i32 12, i32 7, i32 6>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 9, i32 8, i32 3, i32 2, i32 13, i32 12, i32 7, i32 6>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_9810dc54(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_9810dc54(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_9810dc54:			; ALL-LABEL: shuffle_v8i64_9810dc54:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vinserti128 $1, %xmm0, %ymm1, %ymm2			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [1,0,9,8,5,4,13,12]
	; ALL-NEXT: vpshufd {{.*#+}} ymm2 = ymm2[2,3,0,1,6,7,4,5]			; ALL-NEXT: vpermt2q %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm1, %ymm1			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0
	; ALL-NEXT: vinserti128 $1, %xmm0, %ymm1, %ymm0
	; ALL-NEXT: vpshufd {{.*#+}} ymm0 = ymm0[2,3,0,1,6,7,4,5]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm2, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 9, i32 8, i32 1, i32 0, i32 13, i32 12, i32 5, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 9, i32 8, i32 1, i32 0, i32 13, i32 12, i32 5, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_08194c5d(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_08194c5d(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_08194c5d:			; ALL-LABEL: shuffle_v8i64_08194c5d:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm1, %ymm2			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,1,9,4,12,5,13]
	; ALL-NEXT: vpermq {{.*#+}} ymm2 = ymm2[0,0,2,1]			; ALL-NEXT: vpermt2q %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm3
	; ALL-NEXT: vpermq {{.*#+}} ymm3 = ymm3[0,1,1,3]
	; ALL-NEXT: vpblendd {{.*#+}} ymm2 = ymm3[0,1],ymm2[2,3],ymm3[4,5],ymm2[6,7]
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm1[0,0,2,1]
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,1,1,3]
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm0[0,1],ymm1[2,3],ymm0[4,5],ymm1[6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_2a3b6e7f(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_2a3b6e7f(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_2a3b6e7f:			; ALL-LABEL: shuffle_v8i64_2a3b6e7f:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm1, %ymm2			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [2,10,3,11,6,14,7,15]
	; ALL-NEXT: vpermq {{.*#+}} ymm2 = ymm2[0,2,2,3]			; ALL-NEXT: vpermt2q %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm3
	; ALL-NEXT: vpermq {{.*#+}} ymm3 = ymm3[2,1,3,3]
	; ALL-NEXT: vpblendd {{.*#+}} ymm2 = ymm3[0,1],ymm2[2,3],ymm3[4,5],ymm2[6,7]
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm1[0,2,2,3]
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[2,1,3,3]
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm0[0,1],ymm1[2,3],ymm0[4,5],ymm1[6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_08192a3b(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_08192a3b(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_08192a3b:			; ALL-LABEL: shuffle_v8i64_08192a3b:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm2 = ymm1[0,2,2,3]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,8,1,9,2,10,3,11]
	; ALL-NEXT: vpermq {{.*#+}} ymm3 = ymm0[2,1,3,3]			; ALL-NEXT: vpermt2q %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vpblendd {{.*#+}} ymm2 = ymm3[0,1],ymm2[2,3],ymm3[4,5],ymm2[6,7]
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm1[0,0,2,1]
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,1,1,3]
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm0[0,1],ymm1[2,3],ymm0[4,5],ymm1[6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 2, i32 10, i32 3, i32 11>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 2, i32 10, i32 3, i32 11>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_08991abb(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_08991abb(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_08991abb:			; ALL-LABEL: shuffle_v8i64_08991abb:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm2 = ymm1[0,0,1,1]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [8,0,1,1,9,2,3,3]
	; ALL-NEXT: vpblendd {{.*#+}} ymm2 = ymm0[0,1],ymm2[2,3,4,5,6,7]			; ALL-NEXT: vpermt2q %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm1[0,1],ymm0[2,3],ymm1[4,5,6,7]			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[1,2,3,3]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm2, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 8, i32 9, i32 9, i32 1, i32 10, i32 11, i32 11>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 8, i32 9, i32 9, i32 1, i32 10, i32 11, i32 11>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_091b2d3f(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_091b2d3f(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_091b2d3f:			; ALL-LABEL: shuffle_v8i64_091b2d3f:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm1, %ymm2			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,9,1,11,2,13,3,15]
	; ALL-NEXT: vpermq {{.*#+}} ymm3 = ymm0[2,1,3,3]			; ALL-NEXT: vpermt2q %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vpblendd {{.*#+}} ymm2 = ymm3[0,1],ymm2[2,3],ymm3[4,5],ymm2[6,7]
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,1,1,3]
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm0[0,1],ymm1[2,3],ymm0[4,5],ymm1[6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 9, i32 1, i32 11, i32 2, i32 13, i32 3, i32 15>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 9, i32 1, i32 11, i32 2, i32 13, i32 3, i32 15>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_09ab1def(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_09ab1def(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_09ab1def:			; ALL-LABEL: shuffle_v8i64_09ab1def:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm1, %ymm2			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [8,1,2,3,9,5,6,7]
	; ALL-NEXT: vpshufd {{.*#+}} ymm3 = ymm0[2,3,2,3,6,7,6,7]			; ALL-NEXT: vpermt2q %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vpblendd {{.*#+}} ymm2 = ymm3[0,1],ymm2[2,3,4,5,6,7]			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm0[0,1],ymm1[2,3,4,5,6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 9, i32 10, i32 11, i32 1, i32 13, i32 14, i32 15>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 9, i32 10, i32 11, i32 1, i32 13, i32 14, i32 15>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00014445(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00014445(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00014445:			; ALL-LABEL: shuffle_v8i64_00014445:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[0,0,0,1]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,0,1,4,4,4,5]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,0,0,1]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 1, i32 4, i32 4, i32 4, i32 5>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 1, i32 4, i32 4, i32 4, i32 5>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00204464(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00204464(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00204464:			; ALL-LABEL: shuffle_v8i64_00204464:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[0,0,2,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,2,0,4,4,6,4]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,0,2,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 0, i32 4, i32 4, i32 6, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 0, i32 4, i32 4, i32 6, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_03004744(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_03004744(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_03004744:			; ALL-LABEL: shuffle_v8i64_03004744:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[0,3,0,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,3,0,0,4,7,4,4]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,3,0,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 3, i32 0, i32 0, i32 4, i32 7, i32 4, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 3, i32 0, i32 0, i32 4, i32 7, i32 4, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_10005444(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_10005444(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_10005444:			; ALL-LABEL: shuffle_v8i64_10005444:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[1,0,0,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [1,0,0,0,5,4,4,4]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[1,0,0,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 0, i32 0, i32 5, i32 4, i32 4, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 0, i32 0, i32 5, i32 4, i32 4, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_22006644(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_22006644(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_22006644:			; ALL-LABEL: shuffle_v8i64_22006644:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[2,2,0,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [2,2,0,0,6,6,4,4]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[2,2,0,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 2, i32 2, i32 0, i32 0, i32 6, i32 6, i32 4, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 2, i32 2, i32 0, i32 0, i32 6, i32 6, i32 4, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_33307774(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_33307774(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_33307774:			; ALL-LABEL: shuffle_v8i64_33307774:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[3,3,3,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [3,3,3,0,7,7,7,4]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[3,3,3,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 3, i32 3, i32 3, i32 0, i32 7, i32 7, i32 7, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 3, i32 3, i32 3, i32 0, i32 7, i32 7, i32 7, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_32107654(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_32107654(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_32107654:			; ALL-LABEL: shuffle_v8i64_32107654:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[3,2,1,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [3,2,1,0,7,6,5,4]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[3,2,1,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 3, i32 2, i32 1, i32 0, i32 7, i32 6, i32 5, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 3, i32 2, i32 1, i32 0, i32 7, i32 6, i32 5, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00234467(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00234467(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00234467:			; ALL-LABEL: shuffle_v8i64_00234467:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[0,0,2,3]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,2,3,4,4,6,7]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,0,2,3]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 3, i32 4, i32 4, i32 6, i32 7>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 3, i32 4, i32 4, i32 6, i32 7>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00224466(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00224466(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00224466:			; ALL-LABEL: shuffle_v8i64_00224466:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm0[0,1,0,1,4,5,4,5]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,2,2,4,4,6,6]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpshufd {{.*#+}} ymm0 = ymm0[0,1,0,1,4,5,4,5]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 2, i32 4, i32 4, i32 6, i32 6>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 2, i32 4, i32 4, i32 6, i32 6>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_10325476(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_10325476(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_10325476:			; ALL-LABEL: shuffle_v8i64_10325476:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm0[2,3,0,1,6,7,4,5]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [1,0,3,2,5,4,7,6]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpshufd {{.*#+}} ymm0 = ymm0[2,3,0,1,6,7,4,5]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 5, i32 4, i32 7, i32 6>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 5, i32 4, i32 7, i32 6>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_11335577(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_11335577(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_11335577:			; ALL-LABEL: shuffle_v8i64_11335577:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm0[2,3,2,3,6,7,6,7]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [1,1,3,3,5,5,7,7]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpshufd {{.*#+}} ymm0 = ymm0[2,3,2,3,6,7,6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 5, i32 5, i32 7, i32 7>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 5, i32 5, i32 7, i32 7>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_10235467(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_10235467(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_10235467:			; ALL-LABEL: shuffle_v8i64_10235467:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[1,0,2,3]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [1,0,2,3,5,4,6,7]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[1,0,2,3]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 2, i32 3, i32 5, i32 4, i32 6, i32 7>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 2, i32 3, i32 5, i32 4, i32 6, i32 7>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_10225466(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_10225466(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_10225466:			; ALL-LABEL: shuffle_v8i64_10225466:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[1,0,2,2]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [1,0,2,2,5,4,6,6]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[1,0,2,2]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 2, i32 2, i32 5, i32 4, i32 6, i32 6>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 2, i32 2, i32 5, i32 4, i32 6, i32 6>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00015444(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00015444(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00015444:			; ALL-LABEL: shuffle_v8i64_00015444:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[0,0,0,1]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,0,1,5,4,4,4]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[1,0,0,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 1, i32 5, i32 4, i32 4, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 1, i32 5, i32 4, i32 4, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00204644(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00204644(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00204644:			; ALL-LABEL: shuffle_v8i64_00204644:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[0,0,2,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,2,0,4,6,4,4]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,0,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 0, i32 4, i32 6, i32 4, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 0, i32 4, i32 6, i32 4, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_03004474(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_03004474(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_03004474:			; ALL-LABEL: shuffle_v8i64_03004474:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[0,3,0,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,3,0,0,4,4,7,4]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,0,3,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 3, i32 0, i32 0, i32 4, i32 4, i32 7, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 3, i32 0, i32 0, i32 4, i32 4, i32 7, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_10004444(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_10004444(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_10004444:			; ALL-LABEL: shuffle_v8i64_10004444:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[1,0,0,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [1,0,0,0,4,4,4,4]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpbroadcastq %xmm0, %ymm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 0, i32 0, i32 4, i32 4, i32 4, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 0, i32 0, i32 4, i32 4, i32 4, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_22006446(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_22006446(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_22006446:			; ALL-LABEL: shuffle_v8i64_22006446:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[2,2,0,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [2,2,0,0,6,4,4,6]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[2,0,0,2]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 2, i32 2, i32 0, i32 0, i32 6, i32 4, i32 4, i32 6>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 2, i32 2, i32 0, i32 0, i32 6, i32 4, i32 4, i32 6>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_33307474(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_33307474(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_33307474:			; ALL-LABEL: shuffle_v8i64_33307474:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[3,3,3,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [3,3,3,0,7,4,7,4]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[3,0,3,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 3, i32 3, i32 3, i32 0, i32 7, i32 4, i32 7, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 3, i32 3, i32 3, i32 0, i32 7, i32 4, i32 7, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_32104567(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_32104567(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_32104567:			; ALL-LABEL: shuffle_v8i64_32104567:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[3,2,1,0]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [3,2,1,0,4,5,6,7]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 3, i32 2, i32 1, i32 0, i32 4, i32 5, i32 6, i32 7>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 3, i32 2, i32 1, i32 0, i32 4, i32 5, i32 6, i32 7>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00236744(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00236744(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00236744:			; ALL-LABEL: shuffle_v8i64_00236744:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[0,0,2,3]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,2,3,6,7,4,4]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[2,3,0,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 3, i32 6, i32 7, i32 4, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 3, i32 6, i32 7, i32 4, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00226644(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00226644(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00226644:			; ALL-LABEL: shuffle_v8i64_00226644:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm0[0,1,0,1,4,5,4,5]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,0,2,2,6,6,4,4]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[2,2,0,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 2, i32 6, i32 6, i32 4, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 2, i32 6, i32 6, i32 4, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_10324567(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_10324567(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_10324567:			; ALL-LABEL: shuffle_v8i64_10324567:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm0[2,3,0,1,6,7,4,5]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [1,0,3,2,4,5,6,7]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 4, i32 5, i32 6, i32 7>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 4, i32 5, i32 6, i32 7>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_11334567(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_11334567(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_11334567:			; ALL-LABEL: shuffle_v8i64_11334567:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm0[2,3,2,3,6,7,6,7]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [1,1,3,3,4,5,6,7]
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 4, i32 5, i32 6, i32 7>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 4, i32 5, i32 6, i32 7>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_01235467(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_01235467(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_01235467:			; ALL-LABEL: shuffle_v8i64_01235467:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,1,2,3,5,4,6,7]
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm1[1,0,2,3]			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 4, i32 6, i32 7>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 4, i32 6, i32 7>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_01235466(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_01235466(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_01235466:			; ALL-LABEL: shuffle_v8i64_01235466:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,1,2,3,5,4,6,6]
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm1[1,0,2,2]			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 4, i32 6, i32 6>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 4, i32 6, i32 6>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_002u6u44(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_002u6u44(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_002u6u44:			; ALL-LABEL: shuffle_v8i64_002u6u44:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm0[0,1,0,1,4,5,4,5]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = <0,0,2,u,6,u,4,4>
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[2,1,0,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 undef, i32 6, i32 undef, i32 4, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 undef, i32 6, i32 undef, i32 4, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00uu66uu(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00uu66uu(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00uu66uu:			; ALL-LABEL: shuffle_v8i64_00uu66uu:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpbroadcastq %xmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = <0,0,u,u,6,6,u,u>
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[2,2,2,3]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 undef, i32 undef, i32 6, i32 6, i32 undef, i32 undef>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 undef, i32 undef, i32 6, i32 6, i32 undef, i32 undef>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_103245uu(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_103245uu(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_103245uu:			; ALL-LABEL: shuffle_v8i64_103245uu:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm0[2,3,0,1,6,7,4,5]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = <1,0,3,2,4,5,u,u>
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 4, i32 5, i32 undef, i32 undef>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 4, i32 5, i32 undef, i32 undef>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_1133uu67(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_1133uu67(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_1133uu67:			; ALL-LABEL: shuffle_v8i64_1133uu67:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm0[2,3,2,3,6,7,6,7]			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = <1,1,3,3,u,u,6,7>
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 undef, i32 undef, i32 6, i32 7>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 undef, i32 undef, i32 6, i32 7>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_0uu354uu(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_0uu354uu(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_0uu354uu:			; ALL-LABEL: shuffle_v8i64_0uu354uu:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = <0,u,u,3,5,4,u,u>
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm1[2,3,0,1,6,7,4,5]			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 undef, i32 undef, i32 3, i32 5, i32 4, i32 undef, i32 undef>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 undef, i32 undef, i32 3, i32 5, i32 4, i32 undef, i32 undef>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_uuu3uu66(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_uuu3uu66(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_uuu3uu66:			; ALL-LABEL: shuffle_v8i64_uuu3uu66:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm1 = <u,u,u,3,u,u,6,6>
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm1[0,1,0,1,4,5,4,5]			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 undef, i32 undef, i32 undef, i32 3, i32 undef, i32 undef, i32 6, i32 6>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 undef, i32 undef, i32 undef, i32 3, i32 undef, i32 undef, i32 6, i32 6>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_6caa87e5(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_6caa87e5(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_6caa87e5:			; ALL-LABEL: shuffle_v8i64_6caa87e5:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vmovdqa64 {{.*#+}} zmm2 = [14,4,2,2,0,15,6,13]
	; ALL-NEXT: vperm2i128 {{.*#+}} ymm0 = ymm0[2,3,0,1]			; ALL-NEXT: vpermt2q %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm1, %ymm2			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vpblendd {{.*#+}} ymm3 = ymm1[0,1,2,3],ymm2[4,5],ymm1[6,7]
	; ALL-NEXT: vpblendd {{.*#+}} ymm3 = ymm3[0,1],ymm0[2,3],ymm3[4,5],ymm0[6,7]
	; ALL-NEXT: vpblendd {{.*#+}} ymm1 = ymm2[0,1,2,3],ymm1[4,5,6,7]
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm1[0,1,0,1,4,5,4,5]
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm0[0,1],ymm1[2,3,4,5,6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm3, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 6, i32 12, i32 10, i32 10, i32 8, i32 7, i32 14, i32 5>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 6, i32 12, i32 10, i32 10, i32 8, i32 7, i32 14, i32 5>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_082a4c6e(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_082a4c6e(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_082a4c6e:			; ALL-LABEL: shuffle_v8f64_082a4c6e:
	; ALL: # BB#0:			; ALL: # BB#0:
	Show All 32 Lines

This is an archive of the discontinued LLVM Phabricator instance.

AVX-512 vector shuffle lowering
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 34190

llvm/trunk/lib/Target/X86/Utils/X86ShuffleDecode.h

llvm/trunk/lib/Target/X86/Utils/X86ShuffleDecode.cpp

llvm/trunk/lib/Target/X86/X86ISelLowering.cpp

llvm/trunk/lib/Target/X86/X86MCInstLower.cpp

llvm/trunk/test/CodeGen/X86/vector-shuffle-512-v16.ll

llvm/trunk/test/CodeGen/X86/vector-shuffle-512-v32.ll

llvm/trunk/test/CodeGen/X86/vector-shuffle-512-v8.ll

This is an archive of the discontinued LLVM Phabricator instance.

AVX-512 vector shuffle loweringClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 34190

llvm/trunk/lib/Target/X86/Utils/X86ShuffleDecode.h

llvm/trunk/lib/Target/X86/Utils/X86ShuffleDecode.cpp

llvm/trunk/lib/Target/X86/X86ISelLowering.cpp

llvm/trunk/lib/Target/X86/X86MCInstLower.cpp

llvm/trunk/test/CodeGen/X86/vector-shuffle-512-v16.ll

llvm/trunk/test/CodeGen/X86/vector-shuffle-512-v32.ll

llvm/trunk/test/CodeGen/X86/vector-shuffle-512-v8.ll

AVX-512 vector shuffle lowering
ClosedPublic