Diff 28322

lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 1,477 Lines • ▼ Show 20 Lines	if (!Subtarget->useSoftFloat() && Subtarget->hasBWI()) {
setOperationAction(ISD::INSERT_SUBVECTOR, MVT::v32i1, Custom);		setOperationAction(ISD::INSERT_SUBVECTOR, MVT::v32i1, Custom);
setOperationAction(ISD::INSERT_SUBVECTOR, MVT::v64i1, Custom);		setOperationAction(ISD::INSERT_SUBVECTOR, MVT::v64i1, Custom);
setOperationAction(ISD::SELECT, MVT::v32i1, Custom);		setOperationAction(ISD::SELECT, MVT::v32i1, Custom);
setOperationAction(ISD::SELECT, MVT::v64i1, Custom);		setOperationAction(ISD::SELECT, MVT::v64i1, Custom);
setOperationAction(ISD::SIGN_EXTEND, MVT::v32i8, Custom);		setOperationAction(ISD::SIGN_EXTEND, MVT::v32i8, Custom);
setOperationAction(ISD::ZERO_EXTEND, MVT::v32i8, Custom);		setOperationAction(ISD::ZERO_EXTEND, MVT::v32i8, Custom);
setOperationAction(ISD::SIGN_EXTEND, MVT::v32i16, Custom);		setOperationAction(ISD::SIGN_EXTEND, MVT::v32i16, Custom);
setOperationAction(ISD::ZERO_EXTEND, MVT::v32i16, Custom);		setOperationAction(ISD::ZERO_EXTEND, MVT::v32i16, Custom);
		setOperationAction(ISD::VECTOR_SHUFFLE, MVT::v32i16, Custom);
setOperationAction(ISD::SIGN_EXTEND, MVT::v64i8, Custom);		setOperationAction(ISD::SIGN_EXTEND, MVT::v64i8, Custom);
setOperationAction(ISD::ZERO_EXTEND, MVT::v64i8, Custom);		setOperationAction(ISD::ZERO_EXTEND, MVT::v64i8, Custom);
setOperationAction(ISD::INSERT_VECTOR_ELT, MVT::v32i1, Custom);		setOperationAction(ISD::INSERT_VECTOR_ELT, MVT::v32i1, Custom);
setOperationAction(ISD::INSERT_VECTOR_ELT, MVT::v64i1, Custom);		setOperationAction(ISD::INSERT_VECTOR_ELT, MVT::v64i1, Custom);
setOperationAction(ISD::VSELECT, MVT::v32i16, Legal);		setOperationAction(ISD::VSELECT, MVT::v32i16, Legal);
setOperationAction(ISD::VSELECT, MVT::v64i8, Legal);		setOperationAction(ISD::VSELECT, MVT::v64i8, Legal);
setOperationAction(ISD::TRUNCATE, MVT::v32i1, Custom);		setOperationAction(ISD::TRUNCATE, MVT::v32i1, Custom);
setOperationAction(ISD::TRUNCATE, MVT::v64i1, Custom);		setOperationAction(ISD::TRUNCATE, MVT::v64i1, Custom);
▲ Show 20 Lines • Show All 2,970 Lines • ▼ Show 20 Lines	case X86ISD::MOVDDUP:
DecodeMOVDDUPMask(VT, Mask);		DecodeMOVDDUPMask(VT, Mask);
IsUnary = true;		IsUnary = true;
break;		break;
case X86ISD::MOVLHPD:		case X86ISD::MOVLHPD:
case X86ISD::MOVLPD:		case X86ISD::MOVLPD:
case X86ISD::MOVLPS:		case X86ISD::MOVLPS:
// Not yet implemented		// Not yet implemented
return false;		return false;
default: llvm_unreachable("unknown target shuffle node");		default: llvm_unreachable("unknown target shuffle node");
		RKSimonUnsubmitted Not Done Reply Inline Actions All this code looks very similar to the X86ISD::PSHUFB implementation - is there anyway that they can be merged? RKSimon: All this code looks very similar to the X86ISD::PSHUFB implementation - is there anyway that…
		delenaAuthorUnsubmitted Not Done Reply Inline Actions PSHUFB case has some differences, NumBytesPerElement, for example. And a call DecodePSHUFBMask(). And broadcast analysis in VPEMV I don't want to merge PSHUFB and VPEMV. VPERMV and VPERMV3 have more in common. But they also different. I don't want to merge them. delena: PSHUFB case has some differences, NumBytesPerElement, for example. And a call DecodePSHUFBMask…
}		}

// If we have a fake unary shuffle, the shuffle mask is spread across two		// If we have a fake unary shuffle, the shuffle mask is spread across two
// inputs that are actually the same node. Re-map the mask to always point		// inputs that are actually the same node. Re-map the mask to always point
// into the first input.		// into the first input.
if (IsFakeUnary)		if (IsFakeUnary)
for (int &M : Mask)		for (int &M : Mask)
if (M >= (int)Mask.size())		if (M >= (int)Mask.size())
▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines	return getShuffleScalarElt(NewV.getNode(), Elt % NumElems, DAG,
Depth+1);		Depth+1);
}		}

// Actual nodes that may contain scalar elements		// Actual nodes that may contain scalar elements
if (Opcode == ISD::BITCAST) {		if (Opcode == ISD::BITCAST) {
V = V.getOperand(0);		V = V.getOperand(0);
EVT SrcVT = V.getValueType();		EVT SrcVT = V.getValueType();
unsigned NumElems = VT.getVectorNumElements();		unsigned NumElems = VT.getVectorNumElements();

		RKSimonUnsubmitted Not Done Reply Inline Actions All this code looks very similar to the X86ISD::PSHUFB implementation - is there anyway that they can be merged? RKSimon: All this code looks very similar to the X86ISD::PSHUFB implementation - is there anyway that…
if (!SrcVT.isVector() \|\| SrcVT.getVectorNumElements() != NumElems)		if (!SrcVT.isVector() \|\| SrcVT.getVectorNumElements() != NumElems)
return SDValue();		return SDValue();
}		}

if (V.getOpcode() == ISD::SCALAR_TO_VECTOR)		if (V.getOpcode() == ISD::SCALAR_TO_VECTOR)
return (Index == 0) ? V.getOperand(0)		return (Index == 0) ? V.getOperand(0)
: DAG.getUNDEF(VT.getVectorElementType());		: DAG.getUNDEF(VT.getVectorElementType());

▲ Show 20 Lines • Show All 5,519 Lines • ▼ Show 20 Lines	static SDValue lower256BitVectorShuffle(SDValue Op, SDValue V1, SDValue V2,
case MVT::v32i8:		case MVT::v32i8:
return lowerV32I8VectorShuffle(Op, V1, V2, Subtarget, DAG);		return lowerV32I8VectorShuffle(Op, V1, V2, Subtarget, DAG);

default:		default:
llvm_unreachable("Not a valid 256-bit x86 vector type!");		llvm_unreachable("Not a valid 256-bit x86 vector type!");
}		}
}		}

/// \brief Handle lowering of 8-lane 64-bit floating point shuffles.		static SDValue lowerVectorShuffleWithPERMV(SDLoc DL, MVT VT,
static SDValue lowerV8F64VectorShuffle(SDValue Op, SDValue V1, SDValue V2,		ArrayRef<int> Mask, SDValue V1,
const X86Subtarget *Subtarget,		SDValue V2, SelectionDAG &DAG) {
SelectionDAG &DAG) {
SDLoc DL(Op);
assert(V1.getSimpleValueType() == MVT::v8f64 && "Bad operand type!");
assert(V2.getSimpleValueType() == MVT::v8f64 && "Bad operand type!");
ShuffleVectorSDNode *SVOp = cast<ShuffleVectorSDNode>(Op);
ArrayRef<int> Mask = SVOp->getMask();
assert(Mask.size() == 8 && "Unexpected mask size for v8 shuffle!");

// X86 has dedicated unpack instructions that can handle specific blend
// operations: UNPCKH and UNPCKL.
if (isShuffleEquivalent(V1, V2, Mask, {0, 8, 2, 10, 4, 12, 6, 14}))
return DAG.getNode(X86ISD::UNPCKL, DL, MVT::v8f64, V1, V2);
if (isShuffleEquivalent(V1, V2, Mask, {1, 9, 3, 11, 5, 13, 7, 15}))
return DAG.getNode(X86ISD::UNPCKH, DL, MVT::v8f64, V1, V2);

// FIXME: Implement direct support for this type!		assert(VT.getScalarSizeInBits() >= 16 && "Unexpected data type for PERMV");
return splitAndLowerVectorShuffle(DL, MVT::v8f64, V1, V2, Mask, DAG);
}

/// \brief Handle lowering of 16-lane 32-bit floating point shuffles.		MVT MaskEltVT = MVT::getIntegerVT(VT.getScalarSizeInBits());
static SDValue lowerV16F32VectorShuffle(SDValue Op, SDValue V1, SDValue V2,		MVT MaskVecVT = MVT::getVectorVT(MaskEltVT, VT.getVectorNumElements());
const X86Subtarget *Subtarget,
SelectionDAG &DAG) {
SDLoc DL(Op);
assert(V1.getSimpleValueType() == MVT::v16f32 && "Bad operand type!");
assert(V2.getSimpleValueType() == MVT::v16f32 && "Bad operand type!");
ShuffleVectorSDNode *SVOp = cast<ShuffleVectorSDNode>(Op);
ArrayRef<int> Mask = SVOp->getMask();
assert(Mask.size() == 16 && "Unexpected mask size for v16 shuffle!");

// Use dedicated unpack instructions for masks that match their pattern.		SmallVector<SDValue, 32> VPermMask;
if (isShuffleEquivalent(V1, V2, Mask,		for (unsigned i = 0; i < VT.getVectorNumElements(); ++i)
{// First 128-bit lane.		VPermMask.push_back(Mask[i] < 0 ? DAG.getUNDEF(MaskEltVT) :
0, 16, 1, 17, 4, 20, 5, 21,		DAG.getConstant(Mask[i], DL,MaskEltVT));
		AyalUnsubmitted Not Done Reply Inline Actions Missing space "DL,MaskEltVT" Ayal: Missing space "DL,MaskEltVT"
// Second 128-bit lane.		SDValue MaskNode = DAG.getNode(ISD::BUILD_VECTOR, DL, MaskVecVT,
8, 24, 9, 25, 12, 28, 13, 29}))		VPermMask);
return DAG.getNode(X86ISD::UNPCKL, DL, MVT::v16f32, V1, V2);		if (isSingleInputShuffleMask(Mask))
if (isShuffleEquivalent(V1, V2, Mask,		return DAG.getNode(X86ISD::VPERMV, DL, VT, MaskNode, V1);
{// First 128-bit lane.
2, 18, 3, 19, 6, 22, 7, 23,
// Second 128-bit lane.
10, 26, 11, 27, 14, 30, 15, 31}))
return DAG.getNode(X86ISD::UNPCKH, DL, MVT::v16f32, V1, V2);

// FIXME: Implement direct support for this type!		return DAG.getNode(X86ISD::VPERMV3, DL, VT, V1, MaskNode, V2);
return splitAndLowerVectorShuffle(DL, MVT::v16f32, V1, V2, Mask, DAG);
}		}

/// \brief Handle lowering of 8-lane 64-bit integer shuffles.		/// \brief Handle lowering of 8-lane 64-bit integer and floating point shuffles.
static SDValue lowerV8I64VectorShuffle(SDValue Op, SDValue V1, SDValue V2,		static SDValue lowerV8X64VectorShuffle(SDValue Op, SDValue V1, SDValue V2,
const X86Subtarget *Subtarget,		const X86Subtarget *Subtarget,
SelectionDAG &DAG) {		SelectionDAG &DAG) {
SDLoc DL(Op);		SDLoc DL(Op);
assert(V1.getSimpleValueType() == MVT::v8i64 && "Bad operand type!");		MVT VT = Op.getSimpleValueType();
assert(V2.getSimpleValueType() == MVT::v8i64 && "Bad operand type!");		assert((V1.getSimpleValueType() == MVT::v8f64 \|\|
		V1.getSimpleValueType() == MVT::v8i64) && "Bad operand type!");
		assert((V2.getSimpleValueType() == MVT::v8f64 \|\|
		V2.getSimpleValueType() == MVT::v8i64) && "Bad operand type!");
ShuffleVectorSDNode *SVOp = cast<ShuffleVectorSDNode>(Op);		ShuffleVectorSDNode *SVOp = cast<ShuffleVectorSDNode>(Op);
ArrayRef<int> Mask = SVOp->getMask();		ArrayRef<int> Mask = SVOp->getMask();
assert(Mask.size() == 8 && "Unexpected mask size for v8 shuffle!");		assert(Mask.size() == 8 && "Unexpected mask size for v8 shuffle!");

// X86 has dedicated unpack instructions that can handle specific blend		// X86 has dedicated unpack instructions that can handle specific blend
// operations: UNPCKH and UNPCKL.		// operations: UNPCKH and UNPCKL.
if (isShuffleEquivalent(V1, V2, Mask, {0, 8, 2, 10, 4, 12, 6, 14}))		if (isShuffleEquivalent(V1, V2, Mask, {0, 8, 2, 10, 4, 12, 6, 14}))
return DAG.getNode(X86ISD::UNPCKL, DL, MVT::v8i64, V1, V2);		return DAG.getNode(X86ISD::UNPCKL, DL, VT, V1, V2);
if (isShuffleEquivalent(V1, V2, Mask, {1, 9, 3, 11, 5, 13, 7, 15}))		if (isShuffleEquivalent(V1, V2, Mask, {1, 9, 3, 11, 5, 13, 7, 15}))
return DAG.getNode(X86ISD::UNPCKH, DL, MVT::v8i64, V1, V2);		return DAG.getNode(X86ISD::UNPCKH, DL, VT, V1, V2);

		AyalUnsubmitted Not Done Reply Inline Actions You may want to check isSingleInputShuffleMask() here, and call either lowerVectorShuffleWithPERMV() or lowerVectorShuffleWithPERMV3(?) accordingly. Ayal: You may want to check isSingleInputShuffleMask() here, and call either…
		RKSimonUnsubmitted Not Done Reply Inline Actions Can we take into account duplicated inputs here? What about matching the inputs if they were swapped? RKSimon: Can we take into account duplicated inputs here? What about matching the inputs if they were…
		delenaAuthorUnsubmitted Not Done Reply Inline Actions I added the "swap" case (in the new patch). As far as duplicated input, it is not AVX-512 specific. It should be a part of common shuffle simplification. delena: I added the "swap" case (in the new patch). As far as duplicated input, it is not AVX-512…
// FIXME: Implement direct support for this type!		return lowerVectorShuffleWithPERMV(DL, VT, Mask, V1, V2, DAG);
return splitAndLowerVectorShuffle(DL, MVT::v8i64, V1, V2, Mask, DAG);
}		}

/// \brief Handle lowering of 16-lane 32-bit integer shuffles.		/// \brief Handle lowering of 16-lane 32-bit integer and floating point shuffles.
static SDValue lowerV16I32VectorShuffle(SDValue Op, SDValue V1, SDValue V2,		static SDValue lowerV16X32VectorShuffle(SDValue Op, SDValue V1, SDValue V2,
const X86Subtarget *Subtarget,		const X86Subtarget *Subtarget,
		RKSimonUnsubmitted Not Done Reply Inline Actions Could you put lowerVectorShuffleWithUNPCK earlier in the source file so we can use it for the 128/256 bit shuffle lowering functions? You don't have to fix the other uses in this patch if you want to keep it focussed on AVX512. RKSimon: Could you put lowerVectorShuffleWithUNPCK earlier in the source file so we can use it for the…
SelectionDAG &DAG) {		SelectionDAG &DAG) {
		MVT VT = Op.getSimpleValueType();
SDLoc DL(Op);		SDLoc DL(Op);
assert(V1.getSimpleValueType() == MVT::v16i32 && "Bad operand type!");		assert((V1.getSimpleValueType() == MVT::v16i32 \|\|
assert(V2.getSimpleValueType() == MVT::v16i32 && "Bad operand type!");		V1.getSimpleValueType() == MVT::v16f32) && "Bad operand type!");
		assert((V2.getSimpleValueType() == MVT::v16i32 \|\|
		V2.getSimpleValueType() == MVT::v16f32) && "Bad operand type!");
ShuffleVectorSDNode *SVOp = cast<ShuffleVectorSDNode>(Op);		ShuffleVectorSDNode *SVOp = cast<ShuffleVectorSDNode>(Op);
ArrayRef<int> Mask = SVOp->getMask();		ArrayRef<int> Mask = SVOp->getMask();
assert(Mask.size() == 16 && "Unexpected mask size for v16 shuffle!");		assert(Mask.size() == 16 && "Unexpected mask size for v16 shuffle!");

// Use dedicated unpack instructions for masks that match their pattern.		// Use dedicated unpack instructions for masks that match their pattern.
if (isShuffleEquivalent(V1, V2, Mask,		if (isShuffleEquivalent(V1, V2, Mask,
{// First 128-bit lane.		{// First 128-bit lane.
0, 16, 1, 17, 4, 20, 5, 21,		0, 16, 1, 17, 4, 20, 5, 21,
// Second 128-bit lane.		// Second 128-bit lane.
8, 24, 9, 25, 12, 28, 13, 29}))		8, 24, 9, 25, 12, 28, 13, 29}))
return DAG.getNode(X86ISD::UNPCKL, DL, MVT::v16i32, V1, V2);		return DAG.getNode(X86ISD::UNPCKL, DL, VT, V1, V2);
if (isShuffleEquivalent(V1, V2, Mask,		if (isShuffleEquivalent(V1, V2, Mask,
{// First 128-bit lane.		{// First 128-bit lane.
2, 18, 3, 19, 6, 22, 7, 23,		2, 18, 3, 19, 6, 22, 7, 23,
// Second 128-bit lane.		// Second 128-bit lane.
10, 26, 11, 27, 14, 30, 15, 31}))		10, 26, 11, 27, 14, 30, 15, 31}))
return DAG.getNode(X86ISD::UNPCKH, DL, MVT::v16i32, V1, V2);		return DAG.getNode(X86ISD::UNPCKH, DL, VT, V1, V2);

// FIXME: Implement direct support for this type!		return lowerVectorShuffleWithPERMV(DL, VT, Mask, V1, V2, DAG);
return splitAndLowerVectorShuffle(DL, MVT::v16i32, V1, V2, Mask, DAG);
}		}

/// \brief Handle lowering of 32-lane 16-bit integer shuffles.		/// \brief Handle lowering of 32-lane 16-bit integer shuffles.
static SDValue lowerV32I16VectorShuffle(SDValue Op, SDValue V1, SDValue V2,		static SDValue lowerV32I16VectorShuffle(SDValue Op, SDValue V1, SDValue V2,
const X86Subtarget *Subtarget,		const X86Subtarget *Subtarget,
SelectionDAG &DAG) {		SelectionDAG &DAG) {
SDLoc DL(Op);		SDLoc DL(Op);
assert(V1.getSimpleValueType() == MVT::v32i16 && "Bad operand type!");		assert(V1.getSimpleValueType() == MVT::v32i16 && "Bad operand type!");
assert(V2.getSimpleValueType() == MVT::v32i16 && "Bad operand type!");		assert(V2.getSimpleValueType() == MVT::v32i16 && "Bad operand type!");
ShuffleVectorSDNode *SVOp = cast<ShuffleVectorSDNode>(Op);		ShuffleVectorSDNode *SVOp = cast<ShuffleVectorSDNode>(Op);
ArrayRef<int> Mask = SVOp->getMask();		ArrayRef<int> Mask = SVOp->getMask();
assert(Mask.size() == 32 && "Unexpected mask size for v32 shuffle!");		assert(Mask.size() == 32 && "Unexpected mask size for v32 shuffle!");
assert(Subtarget->hasBWI() && "We can only lower v32i16 with AVX-512-BWI!");		assert(Subtarget->hasBWI() && "We can only lower v32i16 with AVX-512-BWI!");

// FIXME: Implement direct support for this type!		return lowerVectorShuffleWithPERMV(DL, MVT::v32i16, Mask, V1, V2, DAG);
return splitAndLowerVectorShuffle(DL, MVT::v32i16, V1, V2, Mask, DAG);
}		}

/// \brief Handle lowering of 64-lane 8-bit integer shuffles.		/// \brief Handle lowering of 64-lane 8-bit integer shuffles.
static SDValue lowerV64I8VectorShuffle(SDValue Op, SDValue V1, SDValue V2,		static SDValue lowerV64I8VectorShuffle(SDValue Op, SDValue V1, SDValue V2,
const X86Subtarget *Subtarget,		const X86Subtarget *Subtarget,
SelectionDAG &DAG) {		SelectionDAG &DAG) {
SDLoc DL(Op);		SDLoc DL(Op);
assert(V1.getSimpleValueType() == MVT::v64i8 && "Bad operand type!");		assert(V1.getSimpleValueType() == MVT::v64i8 && "Bad operand type!");
Show All 21 Lines	static SDValue lower512BitVectorShuffle(SDValue Op, SDValue V1, SDValue V2,
assert(Subtarget->hasAVX512() &&		assert(Subtarget->hasAVX512() &&
"Cannot lower 512-bit vectors w/ basic ISA!");		"Cannot lower 512-bit vectors w/ basic ISA!");

// Check for being able to broadcast a single element.		// Check for being able to broadcast a single element.
if (SDValue Broadcast =		if (SDValue Broadcast =
lowerVectorShuffleAsBroadcast(DL, VT, V1, Mask, Subtarget, DAG))		lowerVectorShuffleAsBroadcast(DL, VT, V1, Mask, Subtarget, DAG))
return Broadcast;		return Broadcast;

// Dispatch to each element type for lowering. If we don't have supprot for		// Dispatch to each element type for lowering. If we don't have supprot for
		AyalUnsubmitted Not Done Reply Inline Actions typo in original code: supprot Ayal: typo in original code: supprot
// specific element type shuffles at 512 bits, immediately split them and		// specific element type shuffles at 512 bits, immediately split them and
// lower them. Each lowering routine of a given type is allowed to assume that		// lower them. Each lowering routine of a given type is allowed to assume that
// the requisite ISA extensions for that element type are available.		// the requisite ISA extensions for that element type are available.
switch (VT.SimpleTy) {		switch (VT.SimpleTy) {
case MVT::v8f64:		case MVT::v8f64:
return lowerV8F64VectorShuffle(Op, V1, V2, Subtarget, DAG);
case MVT::v16f32:
return lowerV16F32VectorShuffle(Op, V1, V2, Subtarget, DAG);
case MVT::v8i64:		case MVT::v8i64:
return lowerV8I64VectorShuffle(Op, V1, V2, Subtarget, DAG);		return lowerV8X64VectorShuffle(Op, V1, V2, Subtarget, DAG);
		case MVT::v16f32:
case MVT::v16i32:		case MVT::v16i32:
return lowerV16I32VectorShuffle(Op, V1, V2, Subtarget, DAG);		return lowerV16X32VectorShuffle(Op, V1, V2, Subtarget, DAG);
case MVT::v32i16:		case MVT::v32i16:
if (Subtarget->hasBWI())		if (Subtarget->hasBWI())
return lowerV32I16VectorShuffle(Op, V1, V2, Subtarget, DAG);		return lowerV32I16VectorShuffle(Op, V1, V2, Subtarget, DAG);
break;		break;
case MVT::v64i8:		case MVT::v64i8:
if (Subtarget->hasBWI())		if (Subtarget->hasBWI())
return lowerV64I8VectorShuffle(Op, V1, V2, Subtarget, DAG);		return lowerV64I8VectorShuffle(Op, V1, V2, Subtarget, DAG);
break;		break;
▲ Show 20 Lines • Show All 15,413 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-shuffle-512-v16.ll

	Show All 32 Lines
	define <16 x i32> @shuffle_v16i32_02_12_03_13_06_16_07_17_0a_1a_0b_1b_0e_1e_0f_1f(<16 x i32> %a, <16 x i32> %b) {			define <16 x i32> @shuffle_v16i32_02_12_03_13_06_16_07_17_0a_1a_0b_1b_0e_1e_0f_1f(<16 x i32> %a, <16 x i32> %b) {
	; ALL-LABEL: shuffle_v16i32_02_12_03_13_06_16_07_17_0a_1a_0b_1b_0e_1e_0f_1f:			; ALL-LABEL: shuffle_v16i32_02_12_03_13_06_16_07_17_0a_1a_0b_1b_0e_1e_0f_1f:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpunpckhdq {{.*#+}} zmm0 = zmm0[2],zmm1[2],zmm0[3],zmm1[3],zmm0[6],zmm1[6],zmm0[7],zmm1[7],zmm0[10],zmm1[10],zmm0[11],zmm1[11],zmm0[14],zmm1[14],zmm0[15],zmm1[15]			; ALL-NEXT: vpunpckhdq {{.*#+}} zmm0 = zmm0[2],zmm1[2],zmm0[3],zmm1[3],zmm0[6],zmm1[6],zmm0[7],zmm1[7],zmm0[10],zmm1[10],zmm0[11],zmm1[11],zmm0[14],zmm1[14],zmm0[15],zmm1[15]
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <16 x i32> %a, <16 x i32> %b, <16 x i32><i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>			%shuffle = shufflevector <16 x i32> %a, <16 x i32> %b, <16 x i32><i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>
	ret <16 x i32> %shuffle			ret <16 x i32> %shuffle
	}			}

				define <16 x float> @shuffle_v16f32_02_05_u_u_07_u_0a_01_00_05_u_04_07_u_0a_01(<16 x float> %a) {
				; ALL-LABEL: shuffle_v16f32_02_05_u_u_07_u_0a_01_00_05_u_04_07_u_0a_01:
				; ALL: # BB#0:
				; ALL-NEXT: vmovdqa32 {{.*}}(%rip), %zmm1
				; ALL-NEXT: vpermps %zmm0, %zmm1, %zmm0
				; ALL-NEXT: retq
				%c = shufflevector <16 x float> %a, <16 x float> undef, <16 x i32> <i32 2, i32 5, i32 undef, i32 undef, i32 7, i32 undef, i32 10, i32 1, i32 0, i32 5, i32 undef, i32 4, i32 7, i32 undef, i32 10, i32 1>
				ret <16 x float> %c
				}

				define <16 x i32> @shuffle_v16i32_02_05_u_u_07_u_0a_01_00_05_u_04_07_u_0a_01(<16 x i32> %a) {
				; ALL-LABEL: shuffle_v16i32_02_05_u_u_07_u_0a_01_00_05_u_04_07_u_0a_01:
				; ALL: # BB#0:
				; ALL-NEXT: vmovdqa32 {{.*}}(%rip), %zmm1
				; ALL-NEXT: vpermd %zmm0, %zmm1, %zmm0
				; ALL-NEXT: retq
				%c = shufflevector <16 x i32> %a, <16 x i32> undef, <16 x i32> <i32 2, i32 5, i32 undef, i32 undef, i32 7, i32 undef, i32 10, i32 1, i32 0, i32 5, i32 undef, i32 4, i32 7, i32 undef, i32 10, i32 1>
				ret <16 x i32> %c
				}

				define <16 x i32> @shuffle_v16i32_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18(<16 x i32> %a, <16 x i32> %b) {
				; ALL-LABEL: shuffle_v16i32_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18:
				; ALL: # BB#0:
				; ALL-NEXT: vmovdqa32 {{.*}}(%rip), %zmm2
				; ALL-NEXT: vpermt2d %zmm1, %zmm2, %zmm0
				; ALL-NEXT: retq
				%c = shufflevector <16 x i32> %a, <16 x i32> %b, <16 x i32> <i32 15, i32 31, i32 14, i32 22, i32 13, i32 29, i32 4, i32 28, i32 11, i32 27, i32 10, i32 26, i32 9, i32 25, i32 8, i32 24>
				ret <16 x i32> %c
				}

				define <16 x float> @shuffle_v16f32_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18(<16 x float> %a, <16 x float> %b) {
				; ALL-LABEL: shuffle_v16f32_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18:
				; ALL: # BB#0:
				; ALL-NEXT: vmovdqa32 {{.*}}(%rip), %zmm2
				; ALL-NEXT: vpermt2ps %zmm1, %zmm2, %zmm0
				; ALL-NEXT: retq
				%c = shufflevector <16 x float> %a, <16 x float> %b, <16 x i32> <i32 15, i32 31, i32 14, i32 22, i32 13, i32 29, i32 4, i32 28, i32 11, i32 27, i32 10, i32 26, i32 9, i32 25, i32 8, i32 24>
				ret <16 x float> %c
				}

				define <16 x float> @shuffle_v16f32_load_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18(<16 x float> %a, <16 x float>* %b) {
				; ALL-LABEL: shuffle_v16f32_load_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18:
				; ALL: # BB#0:
				; ALL-NEXT: vmovdqa32 {{.*}}(%rip), %zmm1
				; ALL-NEXT: vpermt2ps (%rdi), %zmm1, %zmm0
				; ALL-NEXT: retq
				%c = load <16 x float>, <16 x float>* %b
				%d = shufflevector <16 x float> %a, <16 x float> %c, <16 x i32> <i32 15, i32 31, i32 14, i32 22, i32 13, i32 29, i32 4, i32 28, i32 11, i32 27, i32 10, i32 26, i32 9, i32 25, i32 8, i32 24>
				ret <16 x float> %d
				}

				define <16 x i32> @shuffle_v16i32_load_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18(<16 x i32> %a, <16 x i32>* %b) {
				; ALL-LABEL: shuffle_v16i32_load_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18:
				; ALL: # BB#0:
				; ALL-NEXT: vmovdqa32 {{.*}}(%rip), %zmm1
				; ALL-NEXT: vpermt2d (%rdi), %zmm1, %zmm0
				; ALL-NEXT: retq
				%c = load <16 x i32>, <16 x i32>* %b
				%d = shufflevector <16 x i32> %a, <16 x i32> %c, <16 x i32> <i32 15, i32 31, i32 14, i32 22, i32 13, i32 29, i32 4, i32 28, i32 11, i32 27, i32 10, i32 26, i32 9, i32 25, i32 8, i32 24>
				ret <16 x i32> %d
				}

				define <16 x i32> @shuffle_v16i32_0_1_2_13_u_u_u_u_u_u_u_u_u_u_u_u(<16 x i32> %a, <16 x i32> %b) {
				; ALL-LABEL: shuffle_v16i32_0_1_2_13_u_u_u_u_u_u_u_u_u_u_u_u:
				; ALL: # BB#0:
				; ALL-NEXT: vmovdqa32 {{.*}}(%rip), %zmm2
				; ALL-NEXT: vpermt2d %zmm1, %zmm2, %zmm0
				; ALL-NEXT: retq
				%c = shufflevector <16 x i32> %a, <16 x i32> %b, <16 x i32> <i32 0, i32 1, i32 2, i32 19, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
				ret <16 x i32> %c
				}

test/CodeGen/X86/vector-shuffle-512-v32.ll

				; RUN: llc < %s -mcpu=x86-64 -mattr=+avx512f -mattr=+avx512bw \| FileCheck %s --check-prefix=ALL --check-prefix=AVX512 --check-prefix=AVX512BW

				target triple = "x86_64-unknown-unknown"

				define <32 x i16> @shuffle_v32i16_02_05_u_u_07_u_0a_01_00_05_u_04_07_u_0a_01_02_05_u_u_07_u_0a_01_00_05_u_04_07_u_0a_1f(<32 x i16> %a) {
				; ALL-LABEL: shuffle_v32i16_02_05_u_u_07_u_0a_01_00_05_u_04_07_u_0a_01_02_05_u_u_07_u_0a_01_00_05_u_04_07_u_0a_1f:
				; ALL: # BB#0:
				; ALL-NEXT: vmovdqu16 {{.*}}(%rip), %zmm1
				; ALL-NEXT: vpermw %zmm0, %zmm1, %zmm0
				; ALL-NEXT: retq
				%c = shufflevector <32 x i16> %a, <32 x i16> undef, <32 x i32> <i32 2, i32 5, i32 undef, i32 undef, i32 7, i32 undef, i32 10, i32 1, i32 0, i32 5, i32 undef, i32 4, i32 7, i32 undef, i32 10, i32 1, i32 2, i32 5, i32 undef, i32 undef, i32 7, i32 undef, i32 10, i32 1, i32 0, i32 5, i32 undef, i32 4, i32 7, i32 undef, i32 10, i32 31>
				ret <32 x i16> %c
				}

				define <32 x i16> @shuffle_v32i16_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_38(<32 x i16> %a, <32 x i16> %b) {
				; ALL-LABEL: shuffle_v32i16_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_18_0f_1f_0e_16_0d_1d_04_1e_0b_1b_0a_1a_09_19_08_38:
				; ALL: # BB#0:
				; ALL-NEXT: vmovdqu16 {{.*}}(%rip), %zmm2
				; ALL-NEXT: vpermt2w %zmm1, %zmm2, %zmm0
				; ALL-NEXT: retq
				%c = shufflevector <32 x i16> %a, <32 x i16> %b, <32 x i32> <i32 15, i32 31, i32 14, i32 22, i32 13, i32 29, i32 4, i32 28, i32 11, i32 27, i32 10, i32 26, i32 9, i32 25, i32 8, i32 24, i32 15, i32 31, i32 14, i32 22, i32 13, i32 29, i32 4, i32 28, i32 11, i32 27, i32 10, i32 26, i32 9, i32 25, i32 8, i32 56>
				ret <32 x i16> %c
				}

test/CodeGen/X86/vector-shuffle-512-v8.ll

	Show All 9 Lines
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00000010(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00000010(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00000010:			; ALL-LABEL: shuffle_v8f64_00000010:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vbroadcastsd %xmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,0,1,0]			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 1, i32 0>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 1, i32 0>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00000200(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00000200(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00000200:			; ALL-LABEL: shuffle_v8f64_00000200:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vbroadcastsd %xmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,2,0,0]			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 2, i32 0, i32 0>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 2, i32 0, i32 0>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00003000(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00003000(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00003000:			; ALL-LABEL: shuffle_v8f64_00003000:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vbroadcastsd %xmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[3,0,0,0]			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 3, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 3, i32 0, i32 0, i32 0>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00040000(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00040000(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00040000:			; ALL-LABEL: shuffle_v8f64_00040000:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vbroadcastsd %xmm1, %ymm1			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vbroadcastsd %xmm0, %ymm0
	; ALL-NEXT: vblendpd {{.*#+}} ymm1 = ymm0[0,1,2],ymm1[3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 4, i32 0, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 4, i32 0, i32 0, i32 0, i32 0>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00500000(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00500000(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00500000:			; ALL-LABEL: shuffle_v8f64_00500000:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vblendpd {{.*#+}} ymm1 = ymm0[0],ymm1[1],ymm0[2,3]			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm1[0,0,1,0]
	; ALL-NEXT: vbroadcastsd %xmm0, %ymm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 5, i32 0, i32 0, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 5, i32 0, i32 0, i32 0, i32 0, i32 0>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_06000000(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_06000000(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_06000000:			; ALL-LABEL: shuffle_v8f64_06000000:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vblendpd {{.*#+}} ymm1 = ymm0[0,1],ymm1[2],ymm0[3]			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm1[0,2,0,0]
	; ALL-NEXT: vbroadcastsd %xmm0, %ymm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 6, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 6, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_70000000(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_70000000(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_70000000:			; ALL-LABEL: shuffle_v8f64_70000000:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vpxord %zmm1, %zmm1, %zmm1
	; ALL-NEXT: vblendpd {{.*#+}} ymm1 = ymm0[0,1,2],ymm1[3]			; ALL-NEXT: movl $7, %eax
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm1[3,0,0,0]			; ALL-NEXT: vpinsrq $0, %rax, %xmm1, %xmm2
	; ALL-NEXT: vbroadcastsd %xmm0, %ymm0			; ALL-NEXT: vinserti32x4 $0, %xmm2, %zmm1, %zmm1
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 7, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 7, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_01014545(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_01014545(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_01014545:			; ALL-LABEL: shuffle_v8f64_01014545:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vinsertf128 $1, %xmm1, %ymm1, %ymm1			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm1, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 1, i32 0, i32 1, i32 4, i32 5, i32 4, i32 5>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 1, i32 0, i32 1, i32 4, i32 5, i32 4, i32 5>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00112233(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00112233(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00112233:			; ALL-LABEL: shuffle_v8f64_00112233:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[0,0,1,1]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[2,2,3,3]			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 1, i32 1, i32 2, i32 2, i32 3, i32 3>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 1, i32 1, i32 2, i32 2, i32 3, i32 3>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00001111(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00001111(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00001111:			; ALL-LABEL: shuffle_v8f64_00001111:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vbroadcastsd %xmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[1,1,1,1]			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 1, i32 1, i32 1, i32 1>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 1, i32 1, i32 1, i32 1>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_81a3c5e7(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_81a3c5e7(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_81a3c5e7:			; ALL-LABEL: shuffle_v8f64_81a3c5e7:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm2			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vextractf64x4 $1, %zmm1, %ymm3			; ALL-NEXT: vpermt2pd %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vblendpd {{.*#+}} ymm2 = ymm3[0],ymm2[1],ymm3[2],ymm2[3]			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm1[0],ymm0[1],ymm1[2],ymm0[3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 8, i32 1, i32 10, i32 3, i32 12, i32 5, i32 14, i32 7>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 8, i32 1, i32 10, i32 3, i32 12, i32 5, i32 14, i32 7>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_08080808(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_08080808(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_08080808:			; ALL-LABEL: shuffle_v8f64_08080808:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vbroadcastsd %xmm1, %ymm1			; ALL-NEXT: vpermt2pd %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],ymm1[1],ymm0[2],ymm1[3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 8, i32 0, i32 8, i32 0, i32 8, i32 0, i32 8>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 8, i32 0, i32 8, i32 0, i32 8, i32 0, i32 8>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_08084c4c(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_08084c4c(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_08084c4c:			; ALL-LABEL: shuffle_v8f64_08084c4c:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm2			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vinsertf128 $1, %xmm2, %ymm2, %ymm2			; ALL-NEXT: vpermt2pd %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vextractf64x4 $1, %zmm1, %ymm3
	; ALL-NEXT: vbroadcastsd %xmm3, %ymm3
	; ALL-NEXT: vblendpd {{.*#+}} ymm2 = ymm2[0],ymm3[1],ymm2[2],ymm3[3]
	; ALL-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0
	; ALL-NEXT: vbroadcastsd %xmm1, %ymm1
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],ymm1[1],ymm0[2],ymm1[3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 8, i32 0, i32 8, i32 4, i32 12, i32 4, i32 12>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 8, i32 0, i32 8, i32 4, i32 12, i32 4, i32 12>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_8823cc67(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_8823cc67(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_8823cc67:			; ALL-LABEL: shuffle_v8f64_8823cc67:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm2			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vextractf64x4 $1, %zmm1, %ymm3			; ALL-NEXT: vpermt2pd %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vbroadcastsd %xmm3, %ymm3			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vblendpd {{.*#+}} ymm2 = ymm3[0,1],ymm2[2,3]
	; ALL-NEXT: vbroadcastsd %xmm1, %ymm1
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm1[0,1],ymm0[2,3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 8, i32 8, i32 2, i32 3, i32 12, i32 12, i32 6, i32 7>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 8, i32 8, i32 2, i32 3, i32 12, i32 12, i32 6, i32 7>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_9832dc76(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_9832dc76(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_9832dc76:			; ALL-LABEL: shuffle_v8f64_9832dc76:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vblendpd {{.*#+}} ymm2 = ymm1[0,1],ymm0[2,3]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vpermilpd {{.*#+}} ymm2 = ymm2[1,0,3,2]			; ALL-NEXT: vpermt2pd %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vextractf64x4 $1, %zmm1, %ymm1
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm1[0,1],ymm0[2,3]
	; ALL-NEXT: vpermilpd {{.*#+}} ymm0 = ymm0[1,0,3,2]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm2, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 9, i32 8, i32 3, i32 2, i32 13, i32 12, i32 7, i32 6>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 9, i32 8, i32 3, i32 2, i32 13, i32 12, i32 7, i32 6>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_9810dc54(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_9810dc54(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_9810dc54:			; ALL-LABEL: shuffle_v8f64_9810dc54:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm2			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vpermilpd {{.*#+}} ymm2 = ymm2[1,0,3,2]			; ALL-NEXT: vpermt2pd %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm1, %ymm1			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0
	; ALL-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
	; ALL-NEXT: vpermilpd {{.*#+}} ymm0 = ymm0[1,0,3,2]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm2, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 9, i32 8, i32 1, i32 0, i32 13, i32 12, i32 5, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 9, i32 8, i32 1, i32 0, i32 13, i32 12, i32 5, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_08194c5d(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_08194c5d(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_08194c5d:			; ALL-LABEL: shuffle_v8f64_08194c5d:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm1, %ymm2			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vpermpd {{.*#+}} ymm2 = ymm2[0,0,2,1]			; ALL-NEXT: vpermt2pd %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm3
	; ALL-NEXT: vpermpd {{.*#+}} ymm3 = ymm3[0,1,1,3]
	; ALL-NEXT: vblendpd {{.*#+}} ymm2 = ymm3[0],ymm2[1],ymm3[2],ymm2[3]
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm1[0,0,2,1]
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,1,1,3]
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],ymm1[1],ymm0[2],ymm1[3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_2a3b6e7f(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_2a3b6e7f(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_2a3b6e7f:			; ALL-LABEL: shuffle_v8f64_2a3b6e7f:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm1, %ymm2			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vpermpd {{.*#+}} ymm2 = ymm2[0,2,2,3]			; ALL-NEXT: vpermt2pd %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm3
	; ALL-NEXT: vpermpd {{.*#+}} ymm3 = ymm3[2,1,3,3]
	; ALL-NEXT: vblendpd {{.*#+}} ymm2 = ymm3[0],ymm2[1],ymm3[2],ymm2[3]
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm1[0,2,2,3]
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[2,1,3,3]
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],ymm1[1],ymm0[2],ymm1[3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_08192a3b(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_08192a3b(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_08192a3b:			; ALL-LABEL: shuffle_v8f64_08192a3b:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm2 = ymm1[0,2,2,3]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vpermpd {{.*#+}} ymm3 = ymm0[2,1,3,3]			; ALL-NEXT: vpermt2pd %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vblendpd {{.*#+}} ymm2 = ymm3[0],ymm2[1],ymm3[2],ymm2[3]
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm1[0,0,2,1]
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,1,1,3]
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],ymm1[1],ymm0[2],ymm1[3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 2, i32 10, i32 3, i32 11>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 2, i32 10, i32 3, i32 11>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_08991abb(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_08991abb(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_08991abb:			; ALL-LABEL: shuffle_v8f64_08991abb:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm2 = ymm1[0,0,1,1]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vblendpd {{.*#+}} ymm2 = ymm0[0],ymm2[1,2,3]			; ALL-NEXT: vpermt2pd %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm1[0],ymm0[1],ymm1[2,3]			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[1,2,3,3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm2, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 8, i32 9, i32 9, i32 1, i32 10, i32 11, i32 11>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 8, i32 9, i32 9, i32 1, i32 10, i32 11, i32 11>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_091b2d3f(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_091b2d3f(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_091b2d3f:			; ALL-LABEL: shuffle_v8f64_091b2d3f:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm1, %ymm2			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vpermpd {{.*#+}} ymm3 = ymm0[2,1,3,3]			; ALL-NEXT: vpermt2pd %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vblendpd {{.*#+}} ymm2 = ymm3[0],ymm2[1],ymm3[2],ymm2[3]
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,1,1,3]
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],ymm1[1],ymm0[2],ymm1[3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 9, i32 1, i32 11, i32 2, i32 13, i32 3, i32 15>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 9, i32 1, i32 11, i32 2, i32 13, i32 3, i32 15>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_09ab1def(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_09ab1def(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_09ab1def:			; ALL-LABEL: shuffle_v8f64_09ab1def:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm1, %ymm2			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vpermilpd {{.*#+}} ymm3 = ymm0[1,0,2,2]			; ALL-NEXT: vpermt2pd %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vblendpd {{.*#+}} ymm2 = ymm3[0],ymm2[1,2,3]			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],ymm1[1,2,3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 9, i32 10, i32 11, i32 1, i32 13, i32 14, i32 15>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 9, i32 10, i32 11, i32 1, i32 13, i32 14, i32 15>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00014445(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00014445(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00014445:			; ALL-LABEL: shuffle_v8f64_00014445:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[0,0,0,1]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,0,0,1]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 1, i32 4, i32 4, i32 4, i32 5>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 1, i32 4, i32 4, i32 4, i32 5>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00204464(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00204464(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00204464:			; ALL-LABEL: shuffle_v8f64_00204464:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[0,0,2,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,0,2,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 0, i32 4, i32 4, i32 6, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 0, i32 4, i32 4, i32 6, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_03004744(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_03004744(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_03004744:			; ALL-LABEL: shuffle_v8f64_03004744:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[0,3,0,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,3,0,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 3, i32 0, i32 0, i32 4, i32 7, i32 4, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 3, i32 0, i32 0, i32 4, i32 7, i32 4, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_10005444(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_10005444(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_10005444:			; ALL-LABEL: shuffle_v8f64_10005444:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[1,0,0,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[1,0,0,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 0, i32 0, i32 5, i32 4, i32 4, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 0, i32 0, i32 5, i32 4, i32 4, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_22006644(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_22006644(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_22006644:			; ALL-LABEL: shuffle_v8f64_22006644:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[2,2,0,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[2,2,0,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 2, i32 2, i32 0, i32 0, i32 6, i32 6, i32 4, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 2, i32 2, i32 0, i32 0, i32 6, i32 6, i32 4, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_33307774(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_33307774(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_33307774:			; ALL-LABEL: shuffle_v8f64_33307774:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[3,3,3,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[3,3,3,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 3, i32 3, i32 3, i32 0, i32 7, i32 7, i32 7, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 3, i32 3, i32 3, i32 0, i32 7, i32 7, i32 7, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_32107654(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_32107654(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_32107654:			; ALL-LABEL: shuffle_v8f64_32107654:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[3,2,1,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[3,2,1,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 3, i32 2, i32 1, i32 0, i32 7, i32 6, i32 5, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 3, i32 2, i32 1, i32 0, i32 7, i32 6, i32 5, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00234467(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00234467(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00234467:			; ALL-LABEL: shuffle_v8f64_00234467:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm0[0,0,2,3]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermilpd {{.*#+}} ymm0 = ymm0[0,0,2,3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 3, i32 4, i32 4, i32 6, i32 7>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 3, i32 4, i32 4, i32 6, i32 7>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00224466(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00224466(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00224466:			; ALL-LABEL: shuffle_v8f64_00224466:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vmovddup {{.*#+}} ymm1 = ymm0[0,0,2,2]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vmovddup {{.*#+}} ymm0 = ymm0[0,0,2,2]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 2, i32 4, i32 4, i32 6, i32 6>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 2, i32 4, i32 4, i32 6, i32 6>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_10325476(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_10325476(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_10325476:			; ALL-LABEL: shuffle_v8f64_10325476:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm0[1,0,3,2]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermilpd {{.*#+}} ymm0 = ymm0[1,0,3,2]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 5, i32 4, i32 7, i32 6>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 5, i32 4, i32 7, i32 6>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_11335577(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_11335577(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_11335577:			; ALL-LABEL: shuffle_v8f64_11335577:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm0[1,1,3,3]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermilpd {{.*#+}} ymm0 = ymm0[1,1,3,3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 5, i32 5, i32 7, i32 7>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 5, i32 5, i32 7, i32 7>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_10235467(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_10235467(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_10235467:			; ALL-LABEL: shuffle_v8f64_10235467:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm0[1,0,2,3]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermilpd {{.*#+}} ymm0 = ymm0[1,0,2,3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 2, i32 3, i32 5, i32 4, i32 6, i32 7>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 2, i32 3, i32 5, i32 4, i32 6, i32 7>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_10225466(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_10225466(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_10225466:			; ALL-LABEL: shuffle_v8f64_10225466:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm0[1,0,2,2]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermilpd {{.*#+}} ymm0 = ymm0[1,0,2,2]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 2, i32 2, i32 5, i32 4, i32 6, i32 6>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 2, i32 2, i32 5, i32 4, i32 6, i32 6>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00015444(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00015444(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00015444:			; ALL-LABEL: shuffle_v8f64_00015444:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[0,0,0,1]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[1,0,0,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 1, i32 5, i32 4, i32 4, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 1, i32 5, i32 4, i32 4, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00204644(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00204644(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00204644:			; ALL-LABEL: shuffle_v8f64_00204644:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[0,0,2,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,2,0,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 0, i32 4, i32 6, i32 4, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 0, i32 4, i32 6, i32 4, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_03004474(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_03004474(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_03004474:			; ALL-LABEL: shuffle_v8f64_03004474:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[0,3,0,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,0,3,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 3, i32 0, i32 0, i32 4, i32 4, i32 7, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 3, i32 0, i32 0, i32 4, i32 4, i32 7, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_10004444(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_10004444(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_10004444:			; ALL-LABEL: shuffle_v8f64_10004444:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[1,0,0,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vbroadcastsd %xmm0, %ymm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 0, i32 0, i32 4, i32 4, i32 4, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 0, i32 0, i32 4, i32 4, i32 4, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_22006446(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_22006446(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_22006446:			; ALL-LABEL: shuffle_v8f64_22006446:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[2,2,0,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[2,0,0,2]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 2, i32 2, i32 0, i32 0, i32 6, i32 4, i32 4, i32 6>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 2, i32 2, i32 0, i32 0, i32 6, i32 4, i32 4, i32 6>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_33307474(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_33307474(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_33307474:			; ALL-LABEL: shuffle_v8f64_33307474:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[3,3,3,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[3,0,3,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 3, i32 3, i32 3, i32 0, i32 7, i32 4, i32 7, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 3, i32 3, i32 3, i32 0, i32 7, i32 4, i32 7, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_32104567(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_32104567(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_32104567:			; ALL-LABEL: shuffle_v8f64_32104567:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm0[3,2,1,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 3, i32 2, i32 1, i32 0, i32 4, i32 5, i32 6, i32 7>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 3, i32 2, i32 1, i32 0, i32 4, i32 5, i32 6, i32 7>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00236744(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00236744(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00236744:			; ALL-LABEL: shuffle_v8f64_00236744:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm0[0,0,2,3]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[2,3,0,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 3, i32 6, i32 7, i32 4, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 3, i32 6, i32 7, i32 4, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00226644(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00226644(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00226644:			; ALL-LABEL: shuffle_v8f64_00226644:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vmovddup {{.*#+}} ymm1 = ymm0[0,0,2,2]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[2,2,0,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 2, i32 6, i32 6, i32 4, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 2, i32 6, i32 6, i32 4, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_10324567(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_10324567(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_10324567:			; ALL-LABEL: shuffle_v8f64_10324567:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm0[1,0,3,2]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 4, i32 5, i32 6, i32 7>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 4, i32 5, i32 6, i32 7>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_11334567(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_11334567(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_11334567:			; ALL-LABEL: shuffle_v8f64_11334567:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm0[1,1,3,3]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 4, i32 5, i32 6, i32 7>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 4, i32 5, i32 6, i32 7>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_01235467(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_01235467(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_01235467:			; ALL-LABEL: shuffle_v8f64_01235467:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm1[1,0,2,3]			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm1, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 4, i32 6, i32 7>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 4, i32 6, i32 7>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_01235466(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_01235466(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_01235466:			; ALL-LABEL: shuffle_v8f64_01235466:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm1[1,0,2,2]			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm1, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 4, i32 6, i32 6>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 4, i32 6, i32 6>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_002u6u44(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_002u6u44(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_002u6u44:			; ALL-LABEL: shuffle_v8f64_002u6u44:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vmovddup {{.*#+}} ymm1 = ymm0[0,0,2,2]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[2,1,0,0]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 undef, i32 6, i32 undef, i32 4, i32 4>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 undef, i32 6, i32 undef, i32 4, i32 4>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_00uu66uu(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_00uu66uu(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_00uu66uu:			; ALL-LABEL: shuffle_v8f64_00uu66uu:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vbroadcastsd %xmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[2,2,2,3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 undef, i32 undef, i32 6, i32 6, i32 undef, i32 undef>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 0, i32 undef, i32 undef, i32 6, i32 6, i32 undef, i32 undef>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_103245uu(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_103245uu(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_103245uu:			; ALL-LABEL: shuffle_v8f64_103245uu:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm0[1,0,3,2]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 4, i32 5, i32 undef, i32 undef>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 4, i32 5, i32 undef, i32 undef>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_1133uu67(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_1133uu67(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_1133uu67:			; ALL-LABEL: shuffle_v8f64_1133uu67:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm0[1,1,3,3]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 undef, i32 undef, i32 6, i32 7>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 undef, i32 undef, i32 6, i32 7>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_0uu354uu(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_0uu354uu(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_0uu354uu:			; ALL-LABEL: shuffle_v8f64_0uu354uu:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vpermilpd {{.*#+}} ymm1 = ymm1[1,0,2,2]			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm1, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 undef, i32 undef, i32 3, i32 5, i32 4, i32 undef, i32 undef>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 0, i32 undef, i32 undef, i32 3, i32 5, i32 4, i32 undef, i32 undef>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_uuu3uu66(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_uuu3uu66(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_uuu3uu66:			; ALL-LABEL: shuffle_v8f64_uuu3uu66:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vmovddup {{.*#+}} ymm1 = ymm1[0,0,2,2]			; ALL-NEXT: vpermpd %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinsertf64x4 $1, %ymm1, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 undef, i32 undef, i32 undef, i32 3, i32 undef, i32 undef, i32 6, i32 6>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 undef, i32 undef, i32 undef, i32 3, i32 undef, i32 undef, i32 6, i32 6>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_c348cda0(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_c348cda0(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_c348cda0:			; ALL-LABEL: shuffle_v8f64_c348cda0:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm2			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vperm2f128 {{.*#+}} ymm2 = ymm0[2,3],ymm2[0,1]			; ALL-NEXT: vpermt2pd %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vextractf64x4 $1, %zmm1, %ymm3			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vbroadcastsd %xmm1, %ymm4
	; ALL-NEXT: vblendpd {{.*#+}} ymm4 = ymm3[0,1,2],ymm4[3]
	; ALL-NEXT: vblendpd {{.*#+}} ymm2 = ymm4[0],ymm2[1,2],ymm4[3]
	; ALL-NEXT: vblendpd {{.*#+}} ymm1 = ymm3[0,1],ymm1[2],ymm3[3]
	; ALL-NEXT: vbroadcastsd %xmm0, %ymm0
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm1[0,1,2],ymm0[3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm0, %zmm2, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 12, i32 3, i32 4, i32 8, i32 12, i32 13, i32 10, i32 0>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 12, i32 3, i32 4, i32 8, i32 12, i32 13, i32 10, i32 0>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_f511235a(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_f511235a(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_f511235a:			; ALL-LABEL: shuffle_v8f64_f511235a:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextractf64x4 $1, %zmm0, %ymm2			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vblendpd {{.*#+}} ymm3 = ymm0[0],ymm2[1],ymm0[2,3]			; ALL-NEXT: vpermt2pd %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vpermpd {{.*#+}} ymm3 = ymm3[2,3,1,3]
	; ALL-NEXT: vmovddup {{.*#+}} ymm4 = ymm1[0,0,2,2]
	; ALL-NEXT: vblendpd {{.*#+}} ymm3 = ymm3[0,1,2],ymm4[3]
	; ALL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,1,1,1]
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm0[0],ymm2[1],ymm0[2,3]
	; ALL-NEXT: vextractf64x4 $1, %zmm1, %ymm1
	; ALL-NEXT: vpermpd {{.*#+}} ymm1 = ymm1[3,1,2,3]
	; ALL-NEXT: vblendpd {{.*#+}} ymm0 = ymm1[0],ymm0[1,2,3]
	; ALL-NEXT: vinsertf64x4 $1, %ymm3, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 15, i32 5, i32 1, i32 1, i32 2, i32 3, i32 5, i32 10>			%shuffle = shufflevector <8 x double> %a, <8 x double> %b, <8 x i32> <i32 15, i32 5, i32 1, i32 1, i32 2, i32 3, i32 5, i32 10>
	ret <8 x double> %shuffle			ret <8 x double> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00000000(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00000000(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00000000:			; ALL-LABEL: shuffle_v8i64_00000000:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpbroadcastq %xmm0, %zmm0			; ALL-NEXT: vpbroadcastq %xmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00000010(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00000010(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00000010:			; ALL-LABEL: shuffle_v8i64_00000010:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpbroadcastq %xmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,0,1,0]			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 1, i32 0>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 1, i32 0>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00000200(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00000200(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00000200:			; ALL-LABEL: shuffle_v8i64_00000200:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpbroadcastq %xmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,0,0]			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 2, i32 0, i32 0>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 2, i32 0, i32 0>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00003000(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00003000(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00003000:			; ALL-LABEL: shuffle_v8i64_00003000:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpbroadcastq %xmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[3,0,0,0]			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 3, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 3, i32 0, i32 0, i32 0>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00040000(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00040000(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00040000:			; ALL-LABEL: shuffle_v8i64_00040000:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vpbroadcastq %xmm1, %ymm1			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpbroadcastq %xmm0, %ymm0
	; ALL-NEXT: vpblendd {{.*#+}} ymm1 = ymm0[0,1,2,3,4,5],ymm1[6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 4, i32 0, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 4, i32 0, i32 0, i32 0, i32 0>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00500000(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00500000(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00500000:			; ALL-LABEL: shuffle_v8i64_00500000:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vpblendd {{.*#+}} ymm1 = ymm0[0,1],ymm1[2,3],ymm0[4,5,6,7]			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm1[0,0,1,0]
	; ALL-NEXT: vpbroadcastq %xmm0, %ymm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 5, i32 0, i32 0, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 5, i32 0, i32 0, i32 0, i32 0, i32 0>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_06000000(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_06000000(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_06000000:			; ALL-LABEL: shuffle_v8i64_06000000:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vpblendd {{.*#+}} ymm1 = ymm0[0,1,2,3],ymm1[4,5],ymm0[6,7]			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm1[0,2,0,0]
	; ALL-NEXT: vpbroadcastq %xmm0, %ymm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 6, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 6, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_70000000(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_70000000(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_70000000:			; ALL-LABEL: shuffle_v8i64_70000000:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vpxord %zmm1, %zmm1, %zmm1
	; ALL-NEXT: vpblendd {{.*#+}} ymm1 = ymm0[0,1,2,3,4,5],ymm1[6,7]			; ALL-NEXT: movl $7, %eax
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm1[3,0,0,0]			; ALL-NEXT: vpinsrq $0, %rax, %xmm1, %xmm2
	; ALL-NEXT: vpbroadcastq %xmm0, %ymm0			; ALL-NEXT: vinserti32x4 $0, %xmm2, %zmm1, %zmm1
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 7, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 7, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_01014545(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_01014545(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_01014545:			; ALL-LABEL: shuffle_v8i64_01014545:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vinserti128 $1, %xmm1, %ymm1, %ymm1			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0
	; ALL-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 1, i32 0, i32 1, i32 4, i32 5, i32 4, i32 5>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 1, i32 0, i32 1, i32 4, i32 5, i32 4, i32 5>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00112233(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00112233(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00112233:			; ALL-LABEL: shuffle_v8i64_00112233:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[0,0,1,1]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[2,2,3,3]			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 1, i32 1, i32 2, i32 2, i32 3, i32 3>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 1, i32 1, i32 2, i32 2, i32 3, i32 3>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00001111(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00001111(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00001111:			; ALL-LABEL: shuffle_v8i64_00001111:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpbroadcastq %xmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[1,1,1,1]			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 1, i32 1, i32 1, i32 1>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 1, i32 1, i32 1, i32 1>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_81a3c5e7(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_81a3c5e7(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_81a3c5e7:			; ALL-LABEL: shuffle_v8i64_81a3c5e7:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm2			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vextracti64x4 $1, %zmm1, %ymm3			; ALL-NEXT: vpermt2q %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vpblendd {{.*#+}} ymm2 = ymm3[0,1],ymm2[2,3],ymm3[4,5],ymm2[6,7]			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm1[0,1],ymm0[2,3],ymm1[4,5],ymm0[6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 8, i32 1, i32 10, i32 3, i32 12, i32 5, i32 14, i32 7>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 8, i32 1, i32 10, i32 3, i32 12, i32 5, i32 14, i32 7>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_08080808(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_08080808(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_08080808:			; ALL-LABEL: shuffle_v8i64_08080808:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vpbroadcastq %xmm1, %ymm1			; ALL-NEXT: vpermt2q %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm0[0,1],ymm1[2,3],ymm0[4,5],ymm1[6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 8, i32 0, i32 8, i32 0, i32 8, i32 0, i32 8>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 8, i32 0, i32 8, i32 0, i32 8, i32 0, i32 8>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_08084c4c(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_08084c4c(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_08084c4c:			; ALL-LABEL: shuffle_v8i64_08084c4c:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm2			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vinserti128 $1, %xmm2, %ymm2, %ymm2			; ALL-NEXT: vpermt2q %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vextracti64x4 $1, %zmm1, %ymm3
	; ALL-NEXT: vpbroadcastq %xmm3, %ymm3
	; ALL-NEXT: vpblendd {{.*#+}} ymm2 = ymm2[0,1],ymm3[2,3],ymm2[4,5],ymm3[6,7]
	; ALL-NEXT: vinserti128 $1, %xmm0, %ymm0, %ymm0
	; ALL-NEXT: vpbroadcastq %xmm1, %ymm1
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm0[0,1],ymm1[2,3],ymm0[4,5],ymm1[6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 8, i32 0, i32 8, i32 4, i32 12, i32 4, i32 12>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 8, i32 0, i32 8, i32 4, i32 12, i32 4, i32 12>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_8823cc67(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_8823cc67(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_8823cc67:			; ALL-LABEL: shuffle_v8i64_8823cc67:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm2			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vextracti64x4 $1, %zmm1, %ymm3			; ALL-NEXT: vpermt2q %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vpbroadcastq %xmm3, %ymm3			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vpblendd {{.*#+}} ymm2 = ymm3[0,1,2,3],ymm2[4,5,6,7]
	; ALL-NEXT: vpbroadcastq %xmm1, %ymm1
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm1[0,1,2,3],ymm0[4,5,6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 8, i32 8, i32 2, i32 3, i32 12, i32 12, i32 6, i32 7>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 8, i32 8, i32 2, i32 3, i32 12, i32 12, i32 6, i32 7>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_9832dc76(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_9832dc76(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_9832dc76:			; ALL-LABEL: shuffle_v8i64_9832dc76:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpblendd {{.*#+}} ymm2 = ymm1[0,1,2,3],ymm0[4,5,6,7]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vpshufd {{.*#+}} ymm2 = ymm2[2,3,0,1,6,7,4,5]			; ALL-NEXT: vpermt2q %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vextracti64x4 $1, %zmm1, %ymm1
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm1[0,1,2,3],ymm0[4,5,6,7]
	; ALL-NEXT: vpshufd {{.*#+}} ymm0 = ymm0[2,3,0,1,6,7,4,5]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm2, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 9, i32 8, i32 3, i32 2, i32 13, i32 12, i32 7, i32 6>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 9, i32 8, i32 3, i32 2, i32 13, i32 12, i32 7, i32 6>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_9810dc54(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_9810dc54(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_9810dc54:			; ALL-LABEL: shuffle_v8i64_9810dc54:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vinserti128 $1, %xmm0, %ymm1, %ymm2			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vpshufd {{.*#+}} ymm2 = ymm2[2,3,0,1,6,7,4,5]			; ALL-NEXT: vpermt2q %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm1, %ymm1			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0
	; ALL-NEXT: vinserti128 $1, %xmm0, %ymm1, %ymm0
	; ALL-NEXT: vpshufd {{.*#+}} ymm0 = ymm0[2,3,0,1,6,7,4,5]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm2, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 9, i32 8, i32 1, i32 0, i32 13, i32 12, i32 5, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 9, i32 8, i32 1, i32 0, i32 13, i32 12, i32 5, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_08194c5d(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_08194c5d(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_08194c5d:			; ALL-LABEL: shuffle_v8i64_08194c5d:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm1, %ymm2			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vpermq {{.*#+}} ymm2 = ymm2[0,0,2,1]			; ALL-NEXT: vpermt2q %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm3
	; ALL-NEXT: vpermq {{.*#+}} ymm3 = ymm3[0,1,1,3]
	; ALL-NEXT: vpblendd {{.*#+}} ymm2 = ymm3[0,1],ymm2[2,3],ymm3[4,5],ymm2[6,7]
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm1[0,0,2,1]
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,1,1,3]
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm0[0,1],ymm1[2,3],ymm0[4,5],ymm1[6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_2a3b6e7f(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_2a3b6e7f(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_2a3b6e7f:			; ALL-LABEL: shuffle_v8i64_2a3b6e7f:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm1, %ymm2			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vpermq {{.*#+}} ymm2 = ymm2[0,2,2,3]			; ALL-NEXT: vpermt2q %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm3
	; ALL-NEXT: vpermq {{.*#+}} ymm3 = ymm3[2,1,3,3]
	; ALL-NEXT: vpblendd {{.*#+}} ymm2 = ymm3[0,1],ymm2[2,3],ymm3[4,5],ymm2[6,7]
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm1[0,2,2,3]
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[2,1,3,3]
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm0[0,1],ymm1[2,3],ymm0[4,5],ymm1[6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_08192a3b(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_08192a3b(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_08192a3b:			; ALL-LABEL: shuffle_v8i64_08192a3b:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm2 = ymm1[0,2,2,3]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vpermq {{.*#+}} ymm3 = ymm0[2,1,3,3]			; ALL-NEXT: vpermt2q %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vpblendd {{.*#+}} ymm2 = ymm3[0,1],ymm2[2,3],ymm3[4,5],ymm2[6,7]
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm1[0,0,2,1]
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,1,1,3]
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm0[0,1],ymm1[2,3],ymm0[4,5],ymm1[6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 2, i32 10, i32 3, i32 11>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 2, i32 10, i32 3, i32 11>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_08991abb(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_08991abb(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_08991abb:			; ALL-LABEL: shuffle_v8i64_08991abb:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm2 = ymm1[0,0,1,1]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vpblendd {{.*#+}} ymm2 = ymm0[0,1],ymm2[2,3,4,5,6,7]			; ALL-NEXT: vpermt2q %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm1[0,1],ymm0[2,3],ymm1[4,5,6,7]			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[1,2,3,3]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm2, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 8, i32 9, i32 9, i32 1, i32 10, i32 11, i32 11>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 8, i32 9, i32 9, i32 1, i32 10, i32 11, i32 11>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_091b2d3f(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_091b2d3f(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_091b2d3f:			; ALL-LABEL: shuffle_v8i64_091b2d3f:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm1, %ymm2			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vpermq {{.*#+}} ymm3 = ymm0[2,1,3,3]			; ALL-NEXT: vpermt2q %zmm1, %zmm2, %zmm0
	; ALL-NEXT: vpblendd {{.*#+}} ymm2 = ymm3[0,1],ymm2[2,3],ymm3[4,5],ymm2[6,7]
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,1,1,3]
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm0[0,1],ymm1[2,3],ymm0[4,5],ymm1[6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 9, i32 1, i32 11, i32 2, i32 13, i32 3, i32 15>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 9, i32 1, i32 11, i32 2, i32 13, i32 3, i32 15>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_09ab1def(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_09ab1def(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_09ab1def:			; ALL-LABEL: shuffle_v8i64_09ab1def:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm1, %ymm2			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vpshufd {{.*#+}} ymm3 = ymm0[2,3,2,3,6,7,6,7]			; ALL-NEXT: vpermt2q %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vpblendd {{.*#+}} ymm2 = ymm3[0,1],ymm2[2,3,4,5,6,7]			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm0[0,1],ymm1[2,3,4,5,6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm2, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 9, i32 10, i32 11, i32 1, i32 13, i32 14, i32 15>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 9, i32 10, i32 11, i32 1, i32 13, i32 14, i32 15>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00014445(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00014445(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00014445:			; ALL-LABEL: shuffle_v8i64_00014445:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[0,0,0,1]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,0,0,1]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 1, i32 4, i32 4, i32 4, i32 5>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 1, i32 4, i32 4, i32 4, i32 5>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00204464(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00204464(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00204464:			; ALL-LABEL: shuffle_v8i64_00204464:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[0,0,2,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,0,2,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 0, i32 4, i32 4, i32 6, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 0, i32 4, i32 4, i32 6, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_03004744(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_03004744(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_03004744:			; ALL-LABEL: shuffle_v8i64_03004744:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[0,3,0,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,3,0,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 3, i32 0, i32 0, i32 4, i32 7, i32 4, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 3, i32 0, i32 0, i32 4, i32 7, i32 4, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_10005444(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_10005444(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_10005444:			; ALL-LABEL: shuffle_v8i64_10005444:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[1,0,0,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[1,0,0,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 0, i32 0, i32 5, i32 4, i32 4, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 0, i32 0, i32 5, i32 4, i32 4, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_22006644(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_22006644(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_22006644:			; ALL-LABEL: shuffle_v8i64_22006644:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[2,2,0,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[2,2,0,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 2, i32 2, i32 0, i32 0, i32 6, i32 6, i32 4, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 2, i32 2, i32 0, i32 0, i32 6, i32 6, i32 4, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_33307774(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_33307774(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_33307774:			; ALL-LABEL: shuffle_v8i64_33307774:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[3,3,3,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[3,3,3,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 3, i32 3, i32 3, i32 0, i32 7, i32 7, i32 7, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 3, i32 3, i32 3, i32 0, i32 7, i32 7, i32 7, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_32107654(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_32107654(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_32107654:			; ALL-LABEL: shuffle_v8i64_32107654:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[3,2,1,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[3,2,1,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 3, i32 2, i32 1, i32 0, i32 7, i32 6, i32 5, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 3, i32 2, i32 1, i32 0, i32 7, i32 6, i32 5, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00234467(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00234467(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00234467:			; ALL-LABEL: shuffle_v8i64_00234467:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[0,0,2,3]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,0,2,3]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 3, i32 4, i32 4, i32 6, i32 7>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 3, i32 4, i32 4, i32 6, i32 7>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00224466(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00224466(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00224466:			; ALL-LABEL: shuffle_v8i64_00224466:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm0[0,1,0,1,4,5,4,5]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpshufd {{.*#+}} ymm0 = ymm0[0,1,0,1,4,5,4,5]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 2, i32 4, i32 4, i32 6, i32 6>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 2, i32 4, i32 4, i32 6, i32 6>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_10325476(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_10325476(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_10325476:			; ALL-LABEL: shuffle_v8i64_10325476:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm0[2,3,0,1,6,7,4,5]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpshufd {{.*#+}} ymm0 = ymm0[2,3,0,1,6,7,4,5]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 5, i32 4, i32 7, i32 6>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 5, i32 4, i32 7, i32 6>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_11335577(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_11335577(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_11335577:			; ALL-LABEL: shuffle_v8i64_11335577:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm0[2,3,2,3,6,7,6,7]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpshufd {{.*#+}} ymm0 = ymm0[2,3,2,3,6,7,6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 5, i32 5, i32 7, i32 7>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 5, i32 5, i32 7, i32 7>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_10235467(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_10235467(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_10235467:			; ALL-LABEL: shuffle_v8i64_10235467:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[1,0,2,3]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[1,0,2,3]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 2, i32 3, i32 5, i32 4, i32 6, i32 7>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 2, i32 3, i32 5, i32 4, i32 6, i32 7>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_10225466(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_10225466(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_10225466:			; ALL-LABEL: shuffle_v8i64_10225466:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[1,0,2,2]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[1,0,2,2]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 2, i32 2, i32 5, i32 4, i32 6, i32 6>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 2, i32 2, i32 5, i32 4, i32 6, i32 6>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00015444(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00015444(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00015444:			; ALL-LABEL: shuffle_v8i64_00015444:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[0,0,0,1]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[1,0,0,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 1, i32 5, i32 4, i32 4, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 1, i32 5, i32 4, i32 4, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00204644(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00204644(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00204644:			; ALL-LABEL: shuffle_v8i64_00204644:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[0,0,2,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,0,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 0, i32 4, i32 6, i32 4, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 0, i32 4, i32 6, i32 4, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_03004474(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_03004474(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_03004474:			; ALL-LABEL: shuffle_v8i64_03004474:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[0,3,0,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,0,3,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 3, i32 0, i32 0, i32 4, i32 4, i32 7, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 3, i32 0, i32 0, i32 4, i32 4, i32 7, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_10004444(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_10004444(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_10004444:			; ALL-LABEL: shuffle_v8i64_10004444:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[1,0,0,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpbroadcastq %xmm0, %ymm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 0, i32 0, i32 4, i32 4, i32 4, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 0, i32 0, i32 4, i32 4, i32 4, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_22006446(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_22006446(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_22006446:			; ALL-LABEL: shuffle_v8i64_22006446:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[2,2,0,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[2,0,0,2]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 2, i32 2, i32 0, i32 0, i32 6, i32 4, i32 4, i32 6>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 2, i32 2, i32 0, i32 0, i32 6, i32 4, i32 4, i32 6>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_33307474(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_33307474(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_33307474:			; ALL-LABEL: shuffle_v8i64_33307474:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[3,3,3,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[3,0,3,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 3, i32 3, i32 3, i32 0, i32 7, i32 4, i32 7, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 3, i32 3, i32 3, i32 0, i32 7, i32 4, i32 7, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_32104567(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_32104567(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_32104567:			; ALL-LABEL: shuffle_v8i64_32104567:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[3,2,1,0]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 3, i32 2, i32 1, i32 0, i32 4, i32 5, i32 6, i32 7>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 3, i32 2, i32 1, i32 0, i32 4, i32 5, i32 6, i32 7>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00236744(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00236744(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00236744:			; ALL-LABEL: shuffle_v8i64_00236744:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm0[0,0,2,3]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[2,3,0,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 3, i32 6, i32 7, i32 4, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 3, i32 6, i32 7, i32 4, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00226644(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00226644(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00226644:			; ALL-LABEL: shuffle_v8i64_00226644:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm0[0,1,0,1,4,5,4,5]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[2,2,0,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 2, i32 6, i32 6, i32 4, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 2, i32 6, i32 6, i32 4, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_10324567(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_10324567(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_10324567:			; ALL-LABEL: shuffle_v8i64_10324567:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm0[2,3,0,1,6,7,4,5]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 4, i32 5, i32 6, i32 7>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 4, i32 5, i32 6, i32 7>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_11334567(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_11334567(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_11334567:			; ALL-LABEL: shuffle_v8i64_11334567:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm0[2,3,2,3,6,7,6,7]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 4, i32 5, i32 6, i32 7>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 4, i32 5, i32 6, i32 7>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_01235467(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_01235467(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_01235467:			; ALL-LABEL: shuffle_v8i64_01235467:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm1[1,0,2,3]			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 4, i32 6, i32 7>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 4, i32 6, i32 7>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_01235466(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_01235466(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_01235466:			; ALL-LABEL: shuffle_v8i64_01235466:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vpermq {{.*#+}} ymm1 = ymm1[1,0,2,2]			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 4, i32 6, i32 6>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 4, i32 6, i32 6>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_002u6u44(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_002u6u44(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_002u6u44:			; ALL-LABEL: shuffle_v8i64_002u6u44:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm0[0,1,0,1,4,5,4,5]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[2,1,0,0]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 undef, i32 6, i32 undef, i32 4, i32 4>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 undef, i32 6, i32 undef, i32 4, i32 4>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_00uu66uu(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_00uu66uu(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_00uu66uu:			; ALL-LABEL: shuffle_v8i64_00uu66uu:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpbroadcastq %xmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[2,2,2,3]
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 undef, i32 undef, i32 6, i32 6, i32 undef, i32 undef>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 0, i32 undef, i32 undef, i32 6, i32 6, i32 undef, i32 undef>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_103245uu(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_103245uu(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_103245uu:			; ALL-LABEL: shuffle_v8i64_103245uu:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm0[2,3,0,1,6,7,4,5]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 4, i32 5, i32 undef, i32 undef>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 4, i32 5, i32 undef, i32 undef>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_1133uu67(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_1133uu67(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_1133uu67:			; ALL-LABEL: shuffle_v8i64_1133uu67:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm0[2,3,2,3,6,7,6,7]			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm0, %zmm1, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 undef, i32 undef, i32 6, i32 7>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 undef, i32 undef, i32 6, i32 7>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_0uu354uu(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_0uu354uu(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_0uu354uu:			; ALL-LABEL: shuffle_v8i64_0uu354uu:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm1[2,3,0,1,6,7,4,5]			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 undef, i32 undef, i32 3, i32 5, i32 4, i32 undef, i32 undef>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 0, i32 undef, i32 undef, i32 3, i32 5, i32 4, i32 undef, i32 undef>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_uuu3uu66(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_uuu3uu66(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_uuu3uu66:			; ALL-LABEL: shuffle_v8i64_uuu3uu66:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm1			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm1
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm1[0,1,0,1,4,5,4,5]			; ALL-NEXT: vpermq %zmm0, %zmm1, %zmm0
	; ALL-NEXT: vinserti64x4 $1, %ymm1, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 undef, i32 undef, i32 undef, i32 3, i32 undef, i32 undef, i32 6, i32 6>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 undef, i32 undef, i32 undef, i32 3, i32 undef, i32 undef, i32 6, i32 6>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x i64> @shuffle_v8i64_6caa87e5(<8 x i64> %a, <8 x i64> %b) {			define <8 x i64> @shuffle_v8i64_6caa87e5(<8 x i64> %a, <8 x i64> %b) {
	; ALL-LABEL: shuffle_v8i64_6caa87e5:			; ALL-LABEL: shuffle_v8i64_6caa87e5:
	; ALL: # BB#0:			; ALL: # BB#0:
	; ALL-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; ALL-NEXT: vmovdqa64 {{.*}}(%rip), %zmm2
	; ALL-NEXT: vperm2i128 {{.*#+}} ymm0 = ymm0[2,3,0,1]			; ALL-NEXT: vpermt2q %zmm0, %zmm2, %zmm1
	; ALL-NEXT: vextracti64x4 $1, %zmm1, %ymm2			; ALL-NEXT: vmovaps %zmm1, %zmm0
	; ALL-NEXT: vpblendd {{.*#+}} ymm3 = ymm1[0,1,2,3],ymm2[4,5],ymm1[6,7]
	; ALL-NEXT: vpblendd {{.*#+}} ymm3 = ymm3[0,1],ymm0[2,3],ymm3[4,5],ymm0[6,7]
	; ALL-NEXT: vpblendd {{.*#+}} ymm1 = ymm2[0,1,2,3],ymm1[4,5,6,7]
	; ALL-NEXT: vpshufd {{.*#+}} ymm1 = ymm1[0,1,0,1,4,5,4,5]
	; ALL-NEXT: vpblendd {{.*#+}} ymm0 = ymm0[0,1],ymm1[2,3,4,5,6,7]
	; ALL-NEXT: vinserti64x4 $1, %ymm3, %zmm0, %zmm0
	; ALL-NEXT: retq			; ALL-NEXT: retq
	%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 6, i32 12, i32 10, i32 10, i32 8, i32 7, i32 14, i32 5>			%shuffle = shufflevector <8 x i64> %a, <8 x i64> %b, <8 x i32> <i32 6, i32 12, i32 10, i32 10, i32 8, i32 7, i32 14, i32 5>
	ret <8 x i64> %shuffle			ret <8 x i64> %shuffle
	}			}

	define <8 x double> @shuffle_v8f64_082a4c6e(<8 x double> %a, <8 x double> %b) {			define <8 x double> @shuffle_v8f64_082a4c6e(<8 x double> %a, <8 x double> %b) {
	; ALL-LABEL: shuffle_v8f64_082a4c6e:			; ALL-LABEL: shuffle_v8f64_082a4c6e:
	; ALL: # BB#0:			; ALL: # BB#0:
	Show All 32 Lines

This is an archive of the discontinued LLVM Phabricator instance.

AVX-512 vector shuffle lowering
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 28322

lib/Target/X86/X86ISelLowering.cpp

test/CodeGen/X86/vector-shuffle-512-v16.ll

test/CodeGen/X86/vector-shuffle-512-v32.ll

test/CodeGen/X86/vector-shuffle-512-v8.ll

This is an archive of the discontinued LLVM Phabricator instance.

AVX-512 vector shuffle loweringClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 28322

lib/Target/X86/X86ISelLowering.cpp

test/CodeGen/X86/vector-shuffle-512-v16.ll

test/CodeGen/X86/vector-shuffle-512-v32.ll

test/CodeGen/X86/vector-shuffle-512-v8.ll

AVX-512 vector shuffle lowering
ClosedPublic