This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
lib/Target/X86/
-
Target/
-
X86/
-
X86ISelDAGToDAG.cpp
-
X86ISelLowering.cpp
-
X86InstrAVX512.td
-
X86InstrFragmentsSIMD.td
-
X86InstrSSE.td
-
X86InstrXOP.td
-
test/CodeGen/X86/
-
CodeGen/
-
X86/
-
avx-vperm2x128.ll
1
oddshuffles.ll
1
pshufb-mask-comments.ll
-
vector-extend-inreg.ll
-
vector-idiv-v2i32.ll
3
widened-broadcast.ll

Differential D53306

[X86] Stop promoting integer loads to vXi64
ClosedPublic

Authored by craig.topper on Oct 15 2018, 4:48 PM.

Download Raw Diff

Details

Reviewers

RKSimon
spatel
sanjoy

Commits

rGc8e183f9ee36: Recommit r344877 "[X86] Stop promoting integer loads to vXi64"
rG321df5b0d43b: [X86] Stop promoting integer loads to vXi64
rL344965: Recommit r344877 "[X86] Stop promoting integer loads to vXi64"
rL344877: [X86] Stop promoting integer loads to vXi64

Summary

Theoretically this was done to simplify the amount of isel patterns that were needed. But it also meant a substantial number of our isel patterns have to match an explicit bitcast. By making the vXi32/vXi16/vXi8 types legal for loads, DAG combiner should be able to change the load type to remove the bitcast.

I had to add some additional plain load instruction patterns and a few other special cases, but overall the isel table has reduced in size by ~12000 bytes. So it looks like this promotion was hurting us more than helping.

I still have one crash in vector-trunc.ll that I'm hoping @RKSimon can help with. It seems to relate to using getTargetConstantFromNode on a load that was shrunk due to an extract_subvector combine after the constant pool entry was created. So we end up decoding more mask elements than the load size.

I'm hoping this patch will simplify the number of patterns needed to remove the and/or/xor promotion.

Diff Detail

Event Timeline

craig.topper created this revision.Oct 15 2018, 4:48 PM

craig.topper added inline comments.Oct 15 2018, 4:54 PM

test/CodeGen/X86/oddshuffles.ll
1633	Looks like we're now reusing something we previously reloaded.
test/CodeGen/X86/pshufb-mask-comments.ll
60	This changed because the loads and stores in the test all use undef pointers. And previously the two loads combined because the promotion gave them the same type. Now they will always have different types.
test/CodeGen/X86/widened-broadcast.ll
124	Looks like matching broadcast from shuffles is a little weak in avx1. This test regressed but the load_splat_8i32_8i32_01010101 case improved.
242	Similar to load_splat_8i32_4i32_01010101
449	Similar to load_splat_8i32_4i32_01010101

craig.topper added a child revision: D53268: [X86] Stop promoting and/or/xor/andn to vXi64..Oct 16 2018, 10:09 PM

Add a hack to prevent the crash in vector-trunc. Though now we miss a combine.

Harbormaster completed remote builds in B23972: Diff 170329.Oct 20 2018, 11:24 PM

RKSimon added inline comments.Oct 21 2018, 3:40 AM

test/CodeGen/X86/vector-trunc.ll
1926 ↗	(On Diff #170329)	I think you're going to need to add a similar size test to the get constant code in X86MCInstLower.cpp

RKSimon mentioned this in rL344867: [X86] Only extract constant pool shuffle mask data with zero offsets.Oct 21 2018, 4:58 AM

Thread expected width into the constant pool shuffle decoders so we don't over decode the constant.

Harbormaster completed remote builds in B23978: Diff 170345.Oct 21 2018, 11:21 AM

LGTM - thanks.

PR33399 should already cover the missed AVX1 broadcasts

This revision is now accepted and ready to land.Oct 21 2018, 11:33 AM

Closed by commit rL344877: [X86] Stop promoting integer loads to vXi64 (authored by ctopper). · Explain WhyOct 21 2018, 2:32 PM

This revision was automatically updated to reflect the committed changes.

This broke our continuous integration, it appears to cause miscompiles in tensorflow/compiler when running on X86 CPU:

Specifically the PoolGradTest.testMaxPool test here: https://github.com/tensorflow/tensorflow/blob/master/tensorflow/compiler/tests/pooling_ops_test.py#L545

Unfortunately I'm not familiar enough with the LLVM backend nor tensorflow/XLA to work out how to reproduce/reduce this.

@sammccall I've reverted the change in r344921. Is there anything you can do to help narrow this down? Ideally providing the LLVM IR for the failing case.

sammccall added a reviewer: sanjoy.Oct 22 2018, 10:22 AM

In D53306#1270947, @craig.topper wrote:

@sammccall I've reverted the change in r344921. Is there anything you can do to help narrow this down? Ideally providing the LLVM IR for the failing case.

Thanks Craig!
I've looped in @sanjoy who knows way more about this than I do, and has access to our internal continuous integration.
(I bet it's reproducible in the upstream TensorFlow repo too, but I don't have a build environment for that).

Hi Craig,

+CC My work email

I've attached the IR that I think is miscompiled after this patch
(this is the post-optimization IR, after LLVM IR opts have run). The
miscompile happens on broadwell at least, but may also happen on other
archs.

Let me know if there's anything I can do to help you diagnose this.

Sanjoy
- ir.ll42 KBDownload

@sanjoy @sammccall I've recommitted this in r344965 with a fix for the miscompile. I believe DAGCombiner::ForwardStoreValueToDirectLoad was forwarding a v4i64 store to a v4i32 load by replacing them with a truncate which doesn't work for vectors. We would need an extract_subvector+bitcast. I've put in a qualification to only forward scalars if the types don't match. Please let me know if you see any more issues.

Revision Contents

Path

Size

lib/

Target/

X86/

X86ISelDAGToDAG.cpp

28 lines

X86ISelLowering.cpp

14 lines

X86InstrAVX512.td

243 lines

X86InstrFragmentsSIMD.td

54 lines

X86InstrSSE.td

627 lines

X86InstrXOP.td

75 lines

test/

CodeGen/

X86/

avx-vperm2x128.ll

2 lines

oddshuffles.ll

24 lines

pshufb-mask-comments.ll

6 lines

vector-extend-inreg.ll

2 lines

vector-idiv-v2i32.ll

18 lines

widened-broadcast.ll

95 lines

Diff 169771

lib/Target/X86/X86ISelDAGToDAG.cpp

Show First 20 Lines • Show All 2,803 Lines • ▼ Show 20 Lines	MachineSDNode *X86DAGToDAGISel::emitPCMPISTR(unsigned ROpc, unsigned MOpc,
bool MayFoldLoad, const SDLoc &dl,		bool MayFoldLoad, const SDLoc &dl,
MVT VT, SDNode *Node) {		MVT VT, SDNode *Node) {
SDValue N0 = Node->getOperand(0);		SDValue N0 = Node->getOperand(0);
SDValue N1 = Node->getOperand(1);		SDValue N1 = Node->getOperand(1);
SDValue Imm = Node->getOperand(2);		SDValue Imm = Node->getOperand(2);
const ConstantInt *Val = cast<ConstantSDNode>(Imm)->getConstantIntValue();		const ConstantInt *Val = cast<ConstantSDNode>(Imm)->getConstantIntValue();
Imm = CurDAG->getTargetConstant(*Val, SDLoc(Node), Imm.getValueType());		Imm = CurDAG->getTargetConstant(*Val, SDLoc(Node), Imm.getValueType());

// If there is a load, it will be behind a bitcast. We don't need to check		// Try to fold a load. No need to check alignment.
// alignment on this load.
SDValue Tmp0, Tmp1, Tmp2, Tmp3, Tmp4;		SDValue Tmp0, Tmp1, Tmp2, Tmp3, Tmp4;
if (MayFoldLoad && N1->getOpcode() == ISD::BITCAST && N1->hasOneUse() &&		if (MayFoldLoad && tryFoldLoad(Node, N1, Tmp0, Tmp1, Tmp2, Tmp3, Tmp4)) {
tryFoldLoad(Node, N1.getNode(), N1.getOperand(0), Tmp0, Tmp1, Tmp2,
Tmp3, Tmp4)) {
SDValue Load = N1.getOperand(0);
SDValue Ops[] = { N0, Tmp0, Tmp1, Tmp2, Tmp3, Tmp4, Imm,		SDValue Ops[] = { N0, Tmp0, Tmp1, Tmp2, Tmp3, Tmp4, Imm,
Load.getOperand(0) };		N1.getOperand(0) };
SDVTList VTs = CurDAG->getVTList(VT, MVT::i32, MVT::Other);		SDVTList VTs = CurDAG->getVTList(VT, MVT::i32, MVT::Other);
MachineSDNode *CNode = CurDAG->getMachineNode(MOpc, dl, VTs, Ops);		MachineSDNode *CNode = CurDAG->getMachineNode(MOpc, dl, VTs, Ops);
// Update the chain.		// Update the chain.
ReplaceUses(Load.getValue(1), SDValue(CNode, 2));		ReplaceUses(N1.getValue(1), SDValue(CNode, 2));
// Record the mem-refs		// Record the mem-refs
CurDAG->setNodeMemRefs(CNode, {cast<LoadSDNode>(Load)->getMemOperand()});		CurDAG->setNodeMemRefs(CNode, {cast<LoadSDNode>(N1)->getMemOperand()});
return CNode;		return CNode;
}		}

SDValue Ops[] = { N0, N1, Imm };		SDValue Ops[] = { N0, N1, Imm };
SDVTList VTs = CurDAG->getVTList(VT, MVT::i32);		SDVTList VTs = CurDAG->getVTList(VT, MVT::i32);
MachineSDNode *CNode = CurDAG->getMachineNode(ROpc, dl, VTs, Ops);		MachineSDNode *CNode = CurDAG->getMachineNode(ROpc, dl, VTs, Ops);
return CNode;		return CNode;
}		}

// Emit a PCMESTR(I/M) instruction. Also return the Glue result in case we need		// Emit a PCMESTR(I/M) instruction. Also return the Glue result in case we need
// to emit a second instruction after this one. This is needed since we have two		// to emit a second instruction after this one. This is needed since we have two
// copyToReg nodes glued before this and we need to continue that glue through.		// copyToReg nodes glued before this and we need to continue that glue through.
MachineSDNode *X86DAGToDAGISel::emitPCMPESTR(unsigned ROpc, unsigned MOpc,		MachineSDNode *X86DAGToDAGISel::emitPCMPESTR(unsigned ROpc, unsigned MOpc,
bool MayFoldLoad, const SDLoc &dl,		bool MayFoldLoad, const SDLoc &dl,
MVT VT, SDNode *Node,		MVT VT, SDNode *Node,
SDValue &InFlag) {		SDValue &InFlag) {
SDValue N0 = Node->getOperand(0);		SDValue N0 = Node->getOperand(0);
SDValue N2 = Node->getOperand(2);		SDValue N2 = Node->getOperand(2);
SDValue Imm = Node->getOperand(4);		SDValue Imm = Node->getOperand(4);
const ConstantInt *Val = cast<ConstantSDNode>(Imm)->getConstantIntValue();		const ConstantInt *Val = cast<ConstantSDNode>(Imm)->getConstantIntValue();
Imm = CurDAG->getTargetConstant(*Val, SDLoc(Node), Imm.getValueType());		Imm = CurDAG->getTargetConstant(*Val, SDLoc(Node), Imm.getValueType());

// If there is a load, it will be behind a bitcast. We don't need to check		// Try to fold a load. No need to check alignment.
// alignment on this load.
SDValue Tmp0, Tmp1, Tmp2, Tmp3, Tmp4;		SDValue Tmp0, Tmp1, Tmp2, Tmp3, Tmp4;
if (MayFoldLoad && N2->getOpcode() == ISD::BITCAST && N2->hasOneUse() &&		if (MayFoldLoad && tryFoldLoad(Node, N2, Tmp0, Tmp1, Tmp2, Tmp3, Tmp4)) {
tryFoldLoad(Node, N2.getNode(), N2.getOperand(0), Tmp0, Tmp1, Tmp2,
Tmp3, Tmp4)) {
SDValue Load = N2.getOperand(0);
SDValue Ops[] = { N0, Tmp0, Tmp1, Tmp2, Tmp3, Tmp4, Imm,		SDValue Ops[] = { N0, Tmp0, Tmp1, Tmp2, Tmp3, Tmp4, Imm,
Load.getOperand(0), InFlag };		N2.getOperand(0), InFlag };
SDVTList VTs = CurDAG->getVTList(VT, MVT::i32, MVT::Other, MVT::Glue);		SDVTList VTs = CurDAG->getVTList(VT, MVT::i32, MVT::Other, MVT::Glue);
MachineSDNode *CNode = CurDAG->getMachineNode(MOpc, dl, VTs, Ops);		MachineSDNode *CNode = CurDAG->getMachineNode(MOpc, dl, VTs, Ops);
InFlag = SDValue(CNode, 3);		InFlag = SDValue(CNode, 3);
// Update the chain.		// Update the chain.
ReplaceUses(Load.getValue(1), SDValue(CNode, 2));		ReplaceUses(N2.getValue(1), SDValue(CNode, 2));
// Record the mem-refs		// Record the mem-refs
CurDAG->setNodeMemRefs(CNode, {cast<LoadSDNode>(Load)->getMemOperand()});		CurDAG->setNodeMemRefs(CNode, {cast<LoadSDNode>(N2)->getMemOperand()});
return CNode;		return CNode;
}		}

SDValue Ops[] = { N0, N2, Imm, InFlag };		SDValue Ops[] = { N0, N2, Imm, InFlag };
SDVTList VTs = CurDAG->getVTList(VT, MVT::i32, MVT::Glue);		SDVTList VTs = CurDAG->getVTList(VT, MVT::i32, MVT::Glue);
MachineSDNode *CNode = CurDAG->getMachineNode(ROpc, dl, VTs, Ops);		MachineSDNode *CNode = CurDAG->getMachineNode(ROpc, dl, VTs, Ops);
InFlag = SDValue(CNode, 2);		InFlag = SDValue(CNode, 2);
return CNode;		return CNode;
▲ Show 20 Lines • Show All 881 Lines • Show Last 20 Lines

lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 863 Lines • ▼ Show 20 Lines	for (auto VT : { MVT::v2f64, MVT::v2i64 }) {

if (VT == MVT::v2i64 && !Subtarget.is64Bit())		if (VT == MVT::v2i64 && !Subtarget.is64Bit())
continue;		continue;

setOperationAction(ISD::INSERT_VECTOR_ELT, VT, Custom);		setOperationAction(ISD::INSERT_VECTOR_ELT, VT, Custom);
setOperationAction(ISD::EXTRACT_VECTOR_ELT, VT, Custom);		setOperationAction(ISD::EXTRACT_VECTOR_ELT, VT, Custom);
}		}

// Promote v16i8, v8i16, v4i32 load, select, and, or, xor to v2i64.
for (auto VT : { MVT::v16i8, MVT::v8i16, MVT::v4i32 }) {
setOperationPromotedToType(ISD::LOAD, VT, MVT::v2i64);
}

// Custom lower v2i64 and v2f64 selects.		// Custom lower v2i64 and v2f64 selects.
setOperationAction(ISD::SELECT, MVT::v2f64, Custom);		setOperationAction(ISD::SELECT, MVT::v2f64, Custom);
setOperationAction(ISD::SELECT, MVT::v2i64, Custom);		setOperationAction(ISD::SELECT, MVT::v2i64, Custom);
setOperationAction(ISD::SELECT, MVT::v4i32, Custom);		setOperationAction(ISD::SELECT, MVT::v4i32, Custom);
setOperationAction(ISD::SELECT, MVT::v8i16, Custom);		setOperationAction(ISD::SELECT, MVT::v8i16, Custom);
setOperationAction(ISD::SELECT, MVT::v16i8, Custom);		setOperationAction(ISD::SELECT, MVT::v16i8, Custom);

setOperationAction(ISD::FP_TO_SINT, MVT::v4i32, Legal);		setOperationAction(ISD::FP_TO_SINT, MVT::v4i32, Legal);
▲ Show 20 Lines • Show All 288 Lines • ▼ Show 20 Lines	for (MVT VT : { MVT::v32i8, MVT::v16i16, MVT::v8i32, MVT::v4i64,
setOperationAction(ISD::SCALAR_TO_VECTOR, VT, Custom);		setOperationAction(ISD::SCALAR_TO_VECTOR, VT, Custom);
setOperationAction(ISD::INSERT_SUBVECTOR, VT, Legal);		setOperationAction(ISD::INSERT_SUBVECTOR, VT, Legal);
setOperationAction(ISD::CONCAT_VECTORS, VT, Custom);		setOperationAction(ISD::CONCAT_VECTORS, VT, Custom);
}		}

if (HasInt256)		if (HasInt256)
setOperationAction(ISD::VSELECT, MVT::v32i8, Legal);		setOperationAction(ISD::VSELECT, MVT::v32i8, Legal);

// Promote v32i8, v16i16, v8i32 select, and, or, xor to v4i64.
for (auto VT : { MVT::v32i8, MVT::v16i16, MVT::v8i32 }) {
setOperationPromotedToType(ISD::LOAD, VT, MVT::v4i64);
}

if (HasInt256) {		if (HasInt256) {
// Custom legalize 2x32 to get a little better code.		// Custom legalize 2x32 to get a little better code.
setOperationAction(ISD::MGATHER, MVT::v2f32, Custom);		setOperationAction(ISD::MGATHER, MVT::v2f32, Custom);
setOperationAction(ISD::MGATHER, MVT::v2i32, Custom);		setOperationAction(ISD::MGATHER, MVT::v2i32, Custom);

for (auto VT : { MVT::v4i32, MVT::v8i32, MVT::v2i64, MVT::v4i64,		for (auto VT : { MVT::v4i32, MVT::v8i32, MVT::v2i64, MVT::v4i64,
MVT::v4f32, MVT::v8f32, MVT::v2f64, MVT::v4f64 })		MVT::v4f32, MVT::v8f32, MVT::v2f64, MVT::v4f64 })
setOperationAction(ISD::MGATHER, VT, Custom);		setOperationAction(ISD::MGATHER, VT, Custom);
▲ Show 20 Lines • Show All 220 Lines • ▼ Show 20 Lines	for (auto VT : { MVT::v16i32, MVT::v8i64, MVT::v16f32, MVT::v8f64 }) {
setOperationAction(ISD::EXTRACT_VECTOR_ELT, VT, Custom);		setOperationAction(ISD::EXTRACT_VECTOR_ELT, VT, Custom);
setOperationAction(ISD::SCALAR_TO_VECTOR, VT, Custom);		setOperationAction(ISD::SCALAR_TO_VECTOR, VT, Custom);
setOperationAction(ISD::INSERT_SUBVECTOR, VT, Legal);		setOperationAction(ISD::INSERT_SUBVECTOR, VT, Legal);
setOperationAction(ISD::MLOAD, VT, Legal);		setOperationAction(ISD::MLOAD, VT, Legal);
setOperationAction(ISD::MSTORE, VT, Legal);		setOperationAction(ISD::MSTORE, VT, Legal);
setOperationAction(ISD::MGATHER, VT, Custom);		setOperationAction(ISD::MGATHER, VT, Custom);
setOperationAction(ISD::MSCATTER, VT, Custom);		setOperationAction(ISD::MSCATTER, VT, Custom);
}		}
for (auto VT : { MVT::v64i8, MVT::v32i16, MVT::v16i32 }) {
setOperationPromotedToType(ISD::LOAD, VT, MVT::v8i64);
}

// Need to custom split v32i16/v64i8 bitcasts.		// Need to custom split v32i16/v64i8 bitcasts.
if (!Subtarget.hasBWI()) {		if (!Subtarget.hasBWI()) {
setOperationAction(ISD::BITCAST, MVT::v32i16, Custom);		setOperationAction(ISD::BITCAST, MVT::v32i16, Custom);
setOperationAction(ISD::BITCAST, MVT::v64i8, Custom);		setOperationAction(ISD::BITCAST, MVT::v64i8, Custom);
}		}
}// has AVX-512		}// has AVX-512

// This block controls legalization for operations that don't have		// This block controls legalization for operations that don't have
▲ Show 20 Lines • Show All 40,250 Lines • Show Last 20 Lines

lib/Target/X86/X86InstrAVX512.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 60 Lines • ▼ Show 20 Lines	class X86VectorVTInfo<int numelts, ValueType eltvt, RegisterClass rc,
// The corresponding memory operand, e.g. i512mem for VR512.		// The corresponding memory operand, e.g. i512mem for VR512.
X86MemOperand MemOp = !cast<X86MemOperand>(TypeVariantName # Size # "mem");		X86MemOperand MemOp = !cast<X86MemOperand>(TypeVariantName # Size # "mem");
X86MemOperand ScalarMemOp = !cast<X86MemOperand>(EltVT # "mem");		X86MemOperand ScalarMemOp = !cast<X86MemOperand>(EltVT # "mem");
// FP scalar memory operand for intrinsics - ssmem/sdmem.		// FP scalar memory operand for intrinsics - ssmem/sdmem.
Operand IntScalarMemOp = !if (!eq (EltTypeName, "f32"), !cast<Operand>("ssmem"),		Operand IntScalarMemOp = !if (!eq (EltTypeName, "f32"), !cast<Operand>("ssmem"),
!if (!eq (EltTypeName, "f64"), !cast<Operand>("sdmem"), ?));		!if (!eq (EltTypeName, "f64"), !cast<Operand>("sdmem"), ?));

// Load patterns		// Load patterns
// Note: For 128/256-bit integer VT we choose loadv2i64/loadv4i64		PatFrag LdFrag = !cast<PatFrag>("load" # VTName);
// due to load promotion during legalization
PatFrag LdFrag = !cast<PatFrag>("load" #
!if (!eq (TypeVariantName, "i"),
!if (!eq (Size, 128), "v2i64",
!if (!eq (Size, 256), "v4i64",
!if (!eq (Size, 512), "v8i64",
VTName))), VTName));

PatFrag AlignedLdFrag = !cast<PatFrag>("alignedload" #		PatFrag i64LdFrag = !cast<PatFrag>("load" #
!if (!eq (TypeVariantName, "i"),		!if (!eq (TypeVariantName, "i"),
!if (!eq (Size, 128), "v2i64",		!if (!eq (Size, 128), "v2i64",
!if (!eq (Size, 256), "v4i64",		!if (!eq (Size, 256), "v4i64",
!if (!eq (Size, 512), "v8i64",		!if (!eq (Size, 512), "v8i64",
VTName))), VTName));		VTName))), VTName));

		PatFrag AlignedLdFrag = !cast<PatFrag>("alignedload" # VTName);

PatFrag ScalarLdFrag = !cast<PatFrag>("load" # EltVT);		PatFrag ScalarLdFrag = !cast<PatFrag>("load" # EltVT);

ComplexPattern ScalarIntMemCPat = !if (!eq (EltTypeName, "f32"),		ComplexPattern ScalarIntMemCPat = !if (!eq (EltTypeName, "f32"),
!cast<ComplexPattern>("sse_load_f32"),		!cast<ComplexPattern>("sse_load_f32"),
!if (!eq (EltTypeName, "f64"),		!if (!eq (EltTypeName, "f64"),
!cast<ComplexPattern>("sse_load_f64"),		!cast<ComplexPattern>("sse_load_f64"),
?));		?));

▲ Show 20 Lines • Show All 420 Lines • ▼ Show 20 Lines	defm rr : AVX512_maskable_split<Opcode, MRMSrcReg, To, (outs To.RC:$dst),
(iPTR imm))>,		(iPTR imm))>,
AVX512AIi8Base, EVEX_4V, Sched<[sched]>;		AVX512AIi8Base, EVEX_4V, Sched<[sched]>;
let mayLoad = 1 in		let mayLoad = 1 in
defm rm : AVX512_maskable_split<Opcode, MRMSrcMem, To, (outs To.RC:$dst),		defm rm : AVX512_maskable_split<Opcode, MRMSrcMem, To, (outs To.RC:$dst),
(ins To.RC:$src1, From.MemOp:$src2, u8imm:$src3),		(ins To.RC:$src1, From.MemOp:$src2, u8imm:$src3),
"vinsert" # From.EltTypeName # "x" # From.NumElts,		"vinsert" # From.EltTypeName # "x" # From.NumElts,
"$src3, $src2, $src1", "$src1, $src2, $src3",		"$src3, $src2, $src1", "$src1, $src2, $src3",
(vinsert_insert:$src3 (To.VT To.RC:$src1),		(vinsert_insert:$src3 (To.VT To.RC:$src1),
(From.VT (bitconvert (From.LdFrag addr:$src2))),		(From.VT (From.LdFrag addr:$src2)),
(iPTR imm)),		(iPTR imm)),
(vinsert_for_mask:$src3 (To.VT To.RC:$src1),		(vinsert_for_mask:$src3 (To.VT To.RC:$src1),
(From.VT (bitconvert (From.LdFrag addr:$src2))),		(From.VT (From.LdFrag addr:$src2)),
(iPTR imm))>, AVX512AIi8Base, EVEX_4V,		(iPTR imm))>, AVX512AIi8Base, EVEX_4V,
EVEX_CD8<From.EltSize, From.CD8TupleForm>,		EVEX_CD8<From.EltSize, From.CD8TupleForm>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

// Passes the same pattern operator for masked and unmasked ops.		// Passes the same pattern operator for masked and unmasked ops.
multiclass vinsert_for_size<int Opcode, X86VectorVTInfo From,		multiclass vinsert_for_size<int Opcode, X86VectorVTInfo From,
Show All 9 Lines	let Predicates = p in {
def : Pat<(vinsert_insert:$ins		def : Pat<(vinsert_insert:$ins
(To.VT To.RC:$src1), (From.VT From.RC:$src2), (iPTR imm)),		(To.VT To.RC:$src1), (From.VT From.RC:$src2), (iPTR imm)),
(To.VT (!cast<Instruction>(InstrStr#"rr")		(To.VT (!cast<Instruction>(InstrStr#"rr")
To.RC:$src1, From.RC:$src2,		To.RC:$src1, From.RC:$src2,
(INSERT_get_vinsert_imm To.RC:$ins)))>;		(INSERT_get_vinsert_imm To.RC:$ins)))>;

def : Pat<(vinsert_insert:$ins		def : Pat<(vinsert_insert:$ins
(To.VT To.RC:$src1),		(To.VT To.RC:$src1),
(From.VT (bitconvert (From.LdFrag addr:$src2))),		(From.VT (From.LdFrag addr:$src2)),
(iPTR imm)),		(iPTR imm)),
(To.VT (!cast<Instruction>(InstrStr#"rm")		(To.VT (!cast<Instruction>(InstrStr#"rm")
To.RC:$src1, addr:$src2,		To.RC:$src1, addr:$src2,
(INSERT_get_vinsert_imm To.RC:$ins)))>;		(INSERT_get_vinsert_imm To.RC:$ins)))>;
}		}
}		}

multiclass vinsert_for_type<ValueType EltVT32, int Opcode128,		multiclass vinsert_for_type<ValueType EltVT32, int Opcode128,
▲ Show 20 Lines • Show All 116 Lines • ▼ Show 20 Lines	def : Pat<(Cast.VT
Cast.ImmAllZerosV)),		Cast.ImmAllZerosV)),
(!cast<Instruction>(InstrStr#"rrkz")		(!cast<Instruction>(InstrStr#"rrkz")
Cast.KRCWM:$mask, To.RC:$src1, From.RC:$src2,		Cast.KRCWM:$mask, To.RC:$src1, From.RC:$src2,
(INSERT_get_vinsert_imm To.RC:$ins))>;		(INSERT_get_vinsert_imm To.RC:$ins))>;
def : Pat<(Cast.VT		def : Pat<(Cast.VT
(vselect Cast.KRCWM:$mask,		(vselect Cast.KRCWM:$mask,
(bitconvert		(bitconvert
(vinsert_insert:$ins (To.VT To.RC:$src1),		(vinsert_insert:$ins (To.VT To.RC:$src1),
(From.VT		(From.VT (From.LdFrag addr:$src2)),
(bitconvert
(From.LdFrag addr:$src2))),
(iPTR imm))),		(iPTR imm))),
Cast.ImmAllZerosV)),		Cast.ImmAllZerosV)),
(!cast<Instruction>(InstrStr#"rmkz")		(!cast<Instruction>(InstrStr#"rmkz")
Cast.KRCWM:$mask, To.RC:$src1, addr:$src2,		Cast.KRCWM:$mask, To.RC:$src1, addr:$src2,
(INSERT_get_vinsert_imm To.RC:$ins))>;		(INSERT_get_vinsert_imm To.RC:$ins))>;
}		}
}		}

▲ Show 20 Lines • Show All 675 Lines • ▼ Show 20 Lines
defm VPBROADCASTQ : avx512_int_broadcast_rm_vl<0x59, "vpbroadcastq",		defm VPBROADCASTQ : avx512_int_broadcast_rm_vl<0x59, "vpbroadcastq",
avx512vl_i64_info, HasAVX512>, VEX_W1X;		avx512vl_i64_info, HasAVX512>, VEX_W1X;

multiclass avx512_subvec_broadcast_rm<bits<8> opc, string OpcodeStr,		multiclass avx512_subvec_broadcast_rm<bits<8> opc, string OpcodeStr,
X86VectorVTInfo _Dst, X86VectorVTInfo _Src> {		X86VectorVTInfo _Dst, X86VectorVTInfo _Src> {
defm rm : AVX512_maskable<opc, MRMSrcMem, _Dst, (outs _Dst.RC:$dst),		defm rm : AVX512_maskable<opc, MRMSrcMem, _Dst, (outs _Dst.RC:$dst),
(ins _Src.MemOp:$src), OpcodeStr, "$src", "$src",		(ins _Src.MemOp:$src), OpcodeStr, "$src", "$src",
(_Dst.VT (X86SubVBroadcast		(_Dst.VT (X86SubVBroadcast
(_Src.VT (bitconvert (_Src.LdFrag addr:$src)))))>,		(_Src.VT (_Src.LdFrag addr:$src))))>,
Sched<[SchedWriteShuffle.YMM.Folded]>,		Sched<[SchedWriteShuffle.YMM.Folded]>,
AVX5128IBase, EVEX;		AVX5128IBase, EVEX;
}		}

// This should be used for the AVX512DQ broadcast instructions. It disables		// This should be used for the AVX512DQ broadcast instructions. It disables
// the unmasked patterns so that we only use the DQ instructions when masking		// the unmasked patterns so that we only use the DQ instructions when masking
// is requested.		// is requested.
multiclass avx512_subvec_broadcast_rm_dq<bits<8> opc, string OpcodeStr,		multiclass avx512_subvec_broadcast_rm_dq<bits<8> opc, string OpcodeStr,
X86VectorVTInfo _Dst, X86VectorVTInfo _Src> {		X86VectorVTInfo _Dst, X86VectorVTInfo _Src> {
let hasSideEffects = 0, mayLoad = 1 in		let hasSideEffects = 0, mayLoad = 1 in
defm rm : AVX512_maskable_split<opc, MRMSrcMem, _Dst, (outs _Dst.RC:$dst),		defm rm : AVX512_maskable_split<opc, MRMSrcMem, _Dst, (outs _Dst.RC:$dst),
(ins _Src.MemOp:$src), OpcodeStr, "$src", "$src",		(ins _Src.MemOp:$src), OpcodeStr, "$src", "$src",
(null_frag),		(null_frag),
(_Dst.VT (X86SubVBroadcast		(_Dst.VT (X86SubVBroadcast
(_Src.VT (bitconvert (_Src.LdFrag addr:$src)))))>,		(_Src.VT (_Src.LdFrag addr:$src))))>,
Sched<[SchedWriteShuffle.YMM.Folded]>,		Sched<[SchedWriteShuffle.YMM.Folded]>,
AVX5128IBase, EVEX;		AVX5128IBase, EVEX;
}		}

let Predicates = [HasAVX512] in {		let Predicates = [HasAVX512] in {
// 32-bit targets will fail to load a i64 directly but can use ZEXT_LOAD.		// 32-bit targets will fail to load a i64 directly but can use ZEXT_LOAD.
def : Pat<(v8i64 (X86VBroadcast (v8i64 (X86vzload addr:$src)))),		def : Pat<(v8i64 (X86VBroadcast (v8i64 (X86vzload addr:$src)))),
(VPBROADCASTQZm addr:$src)>;		(VPBROADCASTQZm addr:$src)>;
Show All 36 Lines	defm VBROADCASTI64X4 : avx512_subvec_broadcast_rm<0x5b, "vbroadcasti64x4",
EVEX_V512, EVEX_CD8<64, CD8VT4>;		EVEX_V512, EVEX_CD8<64, CD8VT4>;
defm VBROADCASTF64X4 : avx512_subvec_broadcast_rm<0x1b, "vbroadcastf64x4",		defm VBROADCASTF64X4 : avx512_subvec_broadcast_rm<0x1b, "vbroadcastf64x4",
v8f64_info, v4f64x_info>, VEX_W,		v8f64_info, v4f64x_info>, VEX_W,
EVEX_V512, EVEX_CD8<64, CD8VT4>;		EVEX_V512, EVEX_CD8<64, CD8VT4>;

let Predicates = [HasAVX512] in {		let Predicates = [HasAVX512] in {
def : Pat<(v16f32 (X86SubVBroadcast (loadv8f32 addr:$src))),		def : Pat<(v16f32 (X86SubVBroadcast (loadv8f32 addr:$src))),
(VBROADCASTF64X4rm addr:$src)>;		(VBROADCASTF64X4rm addr:$src)>;
def : Pat<(v16i32 (X86SubVBroadcast (bc_v8i32 (loadv4i64 addr:$src)))),		def : Pat<(v16i32 (X86SubVBroadcast (loadv8i32 addr:$src))),
(VBROADCASTI64X4rm addr:$src)>;		(VBROADCASTI64X4rm addr:$src)>;
def : Pat<(v32i16 (X86SubVBroadcast (bc_v16i16 (loadv4i64 addr:$src)))),		def : Pat<(v32i16 (X86SubVBroadcast (loadv16i16 addr:$src))),
(VBROADCASTI64X4rm addr:$src)>;		(VBROADCASTI64X4rm addr:$src)>;
def : Pat<(v64i8 (X86SubVBroadcast (bc_v32i8 (loadv4i64 addr:$src)))),		def : Pat<(v64i8 (X86SubVBroadcast (loadv32i8 addr:$src))),
(VBROADCASTI64X4rm addr:$src)>;		(VBROADCASTI64X4rm addr:$src)>;

// Provide fallback in case the load node that is used in the patterns above		// Provide fallback in case the load node that is used in the patterns above
// is used by additional users, which prevents the pattern selection.		// is used by additional users, which prevents the pattern selection.
def : Pat<(v8f64 (X86SubVBroadcast (v4f64 VR256X:$src))),		def : Pat<(v8f64 (X86SubVBroadcast (v4f64 VR256X:$src))),
(VINSERTF64x4Zrr (INSERT_SUBREG (v8f64 (IMPLICIT_DEF)), VR256X:$src, sub_ymm),		(VINSERTF64x4Zrr (INSERT_SUBREG (v8f64 (IMPLICIT_DEF)), VR256X:$src, sub_ymm),
(v4f64 VR256X:$src), 1)>;		(v4f64 VR256X:$src), 1)>;
def : Pat<(v16f32 (X86SubVBroadcast (v8f32 VR256X:$src))),		def : Pat<(v16f32 (X86SubVBroadcast (v8f32 VR256X:$src))),
Show All 11 Lines
def : Pat<(v64i8 (X86SubVBroadcast (v32i8 VR256X:$src))),		def : Pat<(v64i8 (X86SubVBroadcast (v32i8 VR256X:$src))),
(VINSERTI64x4Zrr (INSERT_SUBREG (v64i8 (IMPLICIT_DEF)), VR256X:$src, sub_ymm),		(VINSERTI64x4Zrr (INSERT_SUBREG (v64i8 (IMPLICIT_DEF)), VR256X:$src, sub_ymm),
(v32i8 VR256X:$src), 1)>;		(v32i8 VR256X:$src), 1)>;

def : Pat<(v8f64 (X86SubVBroadcast (loadv2f64 addr:$src))),		def : Pat<(v8f64 (X86SubVBroadcast (loadv2f64 addr:$src))),
(VBROADCASTF32X4rm addr:$src)>;		(VBROADCASTF32X4rm addr:$src)>;
def : Pat<(v8i64 (X86SubVBroadcast (loadv2i64 addr:$src))),		def : Pat<(v8i64 (X86SubVBroadcast (loadv2i64 addr:$src))),
(VBROADCASTI32X4rm addr:$src)>;		(VBROADCASTI32X4rm addr:$src)>;
def : Pat<(v32i16 (X86SubVBroadcast (bc_v8i16 (loadv2i64 addr:$src)))),		def : Pat<(v32i16 (X86SubVBroadcast (loadv8i16 addr:$src))),
(VBROADCASTI32X4rm addr:$src)>;		(VBROADCASTI32X4rm addr:$src)>;
def : Pat<(v64i8 (X86SubVBroadcast (bc_v16i8 (loadv2i64 addr:$src)))),		def : Pat<(v64i8 (X86SubVBroadcast (loadv16i8 addr:$src))),
(VBROADCASTI32X4rm addr:$src)>;		(VBROADCASTI32X4rm addr:$src)>;

// Patterns for selects of bitcasted operations.		// Patterns for selects of bitcasted operations.
def : Pat<(vselect VK16WM:$mask,		def : Pat<(vselect VK16WM:$mask,
(bc_v16f32 (v8f64 (X86SubVBroadcast (loadv2f64 addr:$src)))),		(bc_v16f32 (v8f64 (X86SubVBroadcast (loadv2f64 addr:$src)))),
(bc_v16f32 (v16i32 immAllZerosV))),		(bc_v16f32 (v16i32 immAllZerosV))),
(VBROADCASTF32X4rmkz VK16WM:$mask, addr:$src)>;		(VBROADCASTF32X4rmkz VK16WM:$mask, addr:$src)>;
def : Pat<(vselect VK16WM:$mask,		def : Pat<(vselect VK16WM:$mask,
Show All 13 Lines	def : Pat<(vselect VK8WM:$mask,
(bc_v8f64 (v16f32 (X86SubVBroadcast (loadv8f32 addr:$src)))),		(bc_v8f64 (v16f32 (X86SubVBroadcast (loadv8f32 addr:$src)))),
(bc_v8f64 (v16i32 immAllZerosV))),		(bc_v8f64 (v16i32 immAllZerosV))),
(VBROADCASTF64X4rmkz VK8WM:$mask, addr:$src)>;		(VBROADCASTF64X4rmkz VK8WM:$mask, addr:$src)>;
def : Pat<(vselect VK8WM:$mask,		def : Pat<(vselect VK8WM:$mask,
(bc_v8f64 (v16f32 (X86SubVBroadcast (loadv8f32 addr:$src)))),		(bc_v8f64 (v16f32 (X86SubVBroadcast (loadv8f32 addr:$src)))),
VR512:$src0),		VR512:$src0),
(VBROADCASTF64X4rmk VR512:$src0, VK8WM:$mask, addr:$src)>;		(VBROADCASTF64X4rmk VR512:$src0, VK8WM:$mask, addr:$src)>;
def : Pat<(vselect VK8WM:$mask,		def : Pat<(vselect VK8WM:$mask,
(bc_v8i64 (v16i32 (X86SubVBroadcast (bc_v8i32 (loadv4i64 addr:$src))))),		(bc_v8i64 (v16i32 (X86SubVBroadcast (loadv8i32 addr:$src)))),
(bc_v8i64 (v16i32 immAllZerosV))),		(bc_v8i64 (v16i32 immAllZerosV))),
(VBROADCASTI64X4rmkz VK8WM:$mask, addr:$src)>;		(VBROADCASTI64X4rmkz VK8WM:$mask, addr:$src)>;
def : Pat<(vselect VK8WM:$mask,		def : Pat<(vselect VK8WM:$mask,
(bc_v8i64 (v16i32 (X86SubVBroadcast (bc_v8i32 (loadv4i64 addr:$src))))),		(bc_v8i64 (v16i32 (X86SubVBroadcast (loadv8i32 addr:$src)))),
VR512:$src0),		VR512:$src0),
(VBROADCASTI64X4rmk VR512:$src0, VK8WM:$mask, addr:$src)>;		(VBROADCASTI64X4rmk VR512:$src0, VK8WM:$mask, addr:$src)>;
}		}

let Predicates = [HasVLX] in {		let Predicates = [HasVLX] in {
defm VBROADCASTI32X4Z256 : avx512_subvec_broadcast_rm<0x5a, "vbroadcasti32x4",		defm VBROADCASTI32X4Z256 : avx512_subvec_broadcast_rm<0x5a, "vbroadcasti32x4",
v8i32x_info, v4i32x_info>,		v8i32x_info, v4i32x_info>,
EVEX_V256, EVEX_CD8<32, CD8VT4>;		EVEX_V256, EVEX_CD8<32, CD8VT4>;
defm VBROADCASTF32X4Z256 : avx512_subvec_broadcast_rm<0x1a, "vbroadcastf32x4",		defm VBROADCASTF32X4Z256 : avx512_subvec_broadcast_rm<0x1a, "vbroadcastf32x4",
v8f32x_info, v4f32x_info>,		v8f32x_info, v4f32x_info>,
EVEX_V256, EVEX_CD8<32, CD8VT4>;		EVEX_V256, EVEX_CD8<32, CD8VT4>;

def : Pat<(v4f64 (X86SubVBroadcast (loadv2f64 addr:$src))),		def : Pat<(v4f64 (X86SubVBroadcast (loadv2f64 addr:$src))),
(VBROADCASTF32X4Z256rm addr:$src)>;		(VBROADCASTF32X4Z256rm addr:$src)>;
def : Pat<(v4i64 (X86SubVBroadcast (loadv2i64 addr:$src))),		def : Pat<(v4i64 (X86SubVBroadcast (loadv2i64 addr:$src))),
(VBROADCASTI32X4Z256rm addr:$src)>;		(VBROADCASTI32X4Z256rm addr:$src)>;
def : Pat<(v16i16 (X86SubVBroadcast (bc_v8i16 (loadv2i64 addr:$src)))),		def : Pat<(v16i16 (X86SubVBroadcast (loadv8i16 addr:$src))),
(VBROADCASTI32X4Z256rm addr:$src)>;		(VBROADCASTI32X4Z256rm addr:$src)>;
def : Pat<(v32i8 (X86SubVBroadcast (bc_v16i8 (loadv2i64 addr:$src)))),		def : Pat<(v32i8 (X86SubVBroadcast (loadv16i8 addr:$src))),
(VBROADCASTI32X4Z256rm addr:$src)>;		(VBROADCASTI32X4Z256rm addr:$src)>;

// Patterns for selects of bitcasted operations.		// Patterns for selects of bitcasted operations.
def : Pat<(vselect VK8WM:$mask,		def : Pat<(vselect VK8WM:$mask,
(bc_v8f32 (v4f64 (X86SubVBroadcast (loadv2f64 addr:$src)))),		(bc_v8f32 (v4f64 (X86SubVBroadcast (loadv2f64 addr:$src)))),
(bc_v8f32 (v8i32 immAllZerosV))),		(bc_v8f32 (v8i32 immAllZerosV))),
(VBROADCASTF32X4Z256rmkz VK8WM:$mask, addr:$src)>;		(VBROADCASTF32X4Z256rmkz VK8WM:$mask, addr:$src)>;
def : Pat<(vselect VK8WM:$mask,		def : Pat<(vselect VK8WM:$mask,
▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines	def : Pat<(vselect VK4WM:$mask,
(bc_v4f64 (v8f32 (X86SubVBroadcast (loadv4f32 addr:$src)))),		(bc_v4f64 (v8f32 (X86SubVBroadcast (loadv4f32 addr:$src)))),
(bc_v4f64 (v8i32 immAllZerosV))),		(bc_v4f64 (v8i32 immAllZerosV))),
(VBROADCASTF64X2Z128rmkz VK4WM:$mask, addr:$src)>;		(VBROADCASTF64X2Z128rmkz VK4WM:$mask, addr:$src)>;
def : Pat<(vselect VK4WM:$mask,		def : Pat<(vselect VK4WM:$mask,
(bc_v4f64 (v8f32 (X86SubVBroadcast (loadv4f32 addr:$src)))),		(bc_v4f64 (v8f32 (X86SubVBroadcast (loadv4f32 addr:$src)))),
VR256X:$src0),		VR256X:$src0),
(VBROADCASTF64X2Z128rmk VR256X:$src0, VK4WM:$mask, addr:$src)>;		(VBROADCASTF64X2Z128rmk VR256X:$src0, VK4WM:$mask, addr:$src)>;
def : Pat<(vselect VK4WM:$mask,		def : Pat<(vselect VK4WM:$mask,
(bc_v4i64 (v8i32 (X86SubVBroadcast (bc_v4i32 (loadv2i64 addr:$src))))),		(bc_v4i64 (v8i32 (X86SubVBroadcast (loadv4i32 addr:$src)))),
(bc_v4i64 (v8i32 immAllZerosV))),		(bc_v4i64 (v8i32 immAllZerosV))),
(VBROADCASTI64X2Z128rmkz VK4WM:$mask, addr:$src)>;		(VBROADCASTI64X2Z128rmkz VK4WM:$mask, addr:$src)>;
def : Pat<(vselect VK4WM:$mask,		def : Pat<(vselect VK4WM:$mask,
(bc_v4i64 (v8i32 (X86SubVBroadcast (bc_v4i32 (loadv2i64 addr:$src))))),		(bc_v4i64 (v8i32 (X86SubVBroadcast (loadv4i32 addr:$src)))),
VR256X:$src0),		VR256X:$src0),
(VBROADCASTI64X2Z128rmk VR256X:$src0, VK4WM:$mask, addr:$src)>;		(VBROADCASTI64X2Z128rmk VR256X:$src0, VK4WM:$mask, addr:$src)>;
}		}

let Predicates = [HasDQI] in {		let Predicates = [HasDQI] in {
defm VBROADCASTI64X2 : avx512_subvec_broadcast_rm_dq<0x5a, "vbroadcasti64x2",		defm VBROADCASTI64X2 : avx512_subvec_broadcast_rm_dq<0x5a, "vbroadcasti64x2",
v8i64_info, v2i64x_info>, VEX_W,		v8i64_info, v2i64x_info>, VEX_W,
EVEX_V512, EVEX_CD8<64, CD8VT2>;		EVEX_V512, EVEX_CD8<64, CD8VT2>;
Show All 29 Lines	def : Pat<(vselect VK8WM:$mask,
(bc_v8f64 (v16f32 (X86SubVBroadcast (loadv4f32 addr:$src)))),		(bc_v8f64 (v16f32 (X86SubVBroadcast (loadv4f32 addr:$src)))),
(bc_v8f64 (v16i32 immAllZerosV))),		(bc_v8f64 (v16i32 immAllZerosV))),
(VBROADCASTF64X2rmkz VK8WM:$mask, addr:$src)>;		(VBROADCASTF64X2rmkz VK8WM:$mask, addr:$src)>;
def : Pat<(vselect VK8WM:$mask,		def : Pat<(vselect VK8WM:$mask,
(bc_v8f64 (v16f32 (X86SubVBroadcast (loadv4f32 addr:$src)))),		(bc_v8f64 (v16f32 (X86SubVBroadcast (loadv4f32 addr:$src)))),
VR512:$src0),		VR512:$src0),
(VBROADCASTF64X2rmk VR512:$src0, VK8WM:$mask, addr:$src)>;		(VBROADCASTF64X2rmk VR512:$src0, VK8WM:$mask, addr:$src)>;
def : Pat<(vselect VK8WM:$mask,		def : Pat<(vselect VK8WM:$mask,
(bc_v8i64 (v16i32 (X86SubVBroadcast (bc_v4i32 (loadv2i64 addr:$src))))),		(bc_v8i64 (v16i32 (X86SubVBroadcast (loadv4i32 addr:$src)))),
(bc_v8i64 (v16i32 immAllZerosV))),		(bc_v8i64 (v16i32 immAllZerosV))),
(VBROADCASTI64X2rmkz VK8WM:$mask, addr:$src)>;		(VBROADCASTI64X2rmkz VK8WM:$mask, addr:$src)>;
def : Pat<(vselect VK8WM:$mask,		def : Pat<(vselect VK8WM:$mask,
(bc_v8i64 (v16i32 (X86SubVBroadcast (bc_v4i32 (loadv2i64 addr:$src))))),		(bc_v8i64 (v16i32 (X86SubVBroadcast (loadv4i32 addr:$src)))),
VR512:$src0),		VR512:$src0),
(VBROADCASTI64X2rmk VR512:$src0, VK8WM:$mask, addr:$src)>;		(VBROADCASTI64X2rmk VR512:$src0, VK8WM:$mask, addr:$src)>;
}		}

multiclass avx512_common_broadcast_32x2<bits<8> opc, string OpcodeStr,		multiclass avx512_common_broadcast_32x2<bits<8> opc, string OpcodeStr,
AVX512VLVectorVTInfo _Dst, AVX512VLVectorVTInfo _Src> {		AVX512VLVectorVTInfo _Dst, AVX512VLVectorVTInfo _Src> {
let Predicates = [HasDQI] in		let Predicates = [HasDQI] in
defm Z : avx512_broadcast_rm_split<opc, OpcodeStr, NAME, WriteShuffle256,		defm Z : avx512_broadcast_rm_split<opc, OpcodeStr, NAME, WriteShuffle256,
▲ Show 20 Lines • Show All 79 Lines • ▼ Show 20 Lines	defm rr: AVX512_maskable_3src_cast<opc, MRMSrcReg, _, IdxVT, (outs _.RC:$dst),
(_.VT (X86VPermt2 _.RC:$src2, IdxVT.RC:$src1, _.RC:$src3)), 1>,		(_.VT (X86VPermt2 _.RC:$src2, IdxVT.RC:$src1, _.RC:$src3)), 1>,
EVEX_4V, AVX5128IBase, Sched<[sched]>;		EVEX_4V, AVX5128IBase, Sched<[sched]>;

let mayLoad = 1 in		let mayLoad = 1 in
defm rm: AVX512_maskable_3src_cast<opc, MRMSrcMem, _, IdxVT, (outs _.RC:$dst),		defm rm: AVX512_maskable_3src_cast<opc, MRMSrcMem, _, IdxVT, (outs _.RC:$dst),
(ins _.RC:$src2, _.MemOp:$src3),		(ins _.RC:$src2, _.MemOp:$src3),
OpcodeStr, "$src3, $src2", "$src2, $src3",		OpcodeStr, "$src3, $src2", "$src2, $src3",
(_.VT (X86VPermt2 _.RC:$src2, IdxVT.RC:$src1,		(_.VT (X86VPermt2 _.RC:$src2, IdxVT.RC:$src1,
(_.VT (bitconvert (_.LdFrag addr:$src3))))), 1>,		(_.VT (_.LdFrag addr:$src3)))), 1>,
EVEX_4V, AVX5128IBase, Sched<[sched.Folded, sched.ReadAfterFold]>;		EVEX_4V, AVX5128IBase, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

multiclass avx512_perm_i_mb<bits<8> opc, string OpcodeStr,		multiclass avx512_perm_i_mb<bits<8> opc, string OpcodeStr,
X86FoldableSchedWrite sched,		X86FoldableSchedWrite sched,
X86VectorVTInfo _, X86VectorVTInfo IdxVT> {		X86VectorVTInfo _, X86VectorVTInfo IdxVT> {
let Constraints = "$src1 = $dst", ExeDomain = _.ExeDomain,		let Constraints = "$src1 = $dst", ExeDomain = _.ExeDomain,
▲ Show 20 Lines • Show All 101 Lines • ▼ Show 20 Lines	defm rr: AVX512_maskable_3src<opc, MRMSrcReg, _, (outs _.RC:$dst),
OpcodeStr, "$src3, $src2", "$src2, $src3",		OpcodeStr, "$src3, $src2", "$src2, $src3",
(_.VT (X86VPermt2 _.RC:$src1, IdxVT.RC:$src2, _.RC:$src3)), 1>,		(_.VT (X86VPermt2 _.RC:$src1, IdxVT.RC:$src2, _.RC:$src3)), 1>,
EVEX_4V, AVX5128IBase, Sched<[sched]>;		EVEX_4V, AVX5128IBase, Sched<[sched]>;

defm rm: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rm: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins IdxVT.RC:$src2, _.MemOp:$src3),		(ins IdxVT.RC:$src2, _.MemOp:$src3),
OpcodeStr, "$src3, $src2", "$src2, $src3",		OpcodeStr, "$src3, $src2", "$src2, $src3",
(_.VT (X86VPermt2 _.RC:$src1, IdxVT.RC:$src2,		(_.VT (X86VPermt2 _.RC:$src1, IdxVT.RC:$src2,
(bitconvert (_.LdFrag addr:$src3)))), 1>,		(_.LdFrag addr:$src3))), 1>,
EVEX_4V, AVX5128IBase, Sched<[sched.Folded, sched.ReadAfterFold]>;		EVEX_4V, AVX5128IBase, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}
multiclass avx512_perm_t_mb<bits<8> opc, string OpcodeStr,		multiclass avx512_perm_t_mb<bits<8> opc, string OpcodeStr,
X86FoldableSchedWrite sched,		X86FoldableSchedWrite sched,
X86VectorVTInfo _, X86VectorVTInfo IdxVT> {		X86VectorVTInfo _, X86VectorVTInfo IdxVT> {
let Constraints = "$src1 = $dst", ExeDomain = _.ExeDomain in		let Constraints = "$src1 = $dst", ExeDomain = _.ExeDomain in
defm rmb: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmb: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),
▲ Show 20 Lines • Show All 273 Lines • ▼ Show 20 Lines	def rr : AVX512BI<opc, MRMSrcReg,
(outs _.KRC:$dst), (ins _.RC:$src1, _.RC:$src2),		(outs _.KRC:$dst), (ins _.RC:$src1, _.RC:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set _.KRC:$dst, (OpNode (_.VT _.RC:$src1), (_.VT _.RC:$src2)))]>,		[(set _.KRC:$dst, (OpNode (_.VT _.RC:$src1), (_.VT _.RC:$src2)))]>,
EVEX_4V, Sched<[sched]>;		EVEX_4V, Sched<[sched]>;
def rm : AVX512BI<opc, MRMSrcMem,		def rm : AVX512BI<opc, MRMSrcMem,
(outs _.KRC:$dst), (ins _.RC:$src1, _.MemOp:$src2),		(outs _.KRC:$dst), (ins _.RC:$src1, _.MemOp:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set _.KRC:$dst, (OpNode (_.VT _.RC:$src1),		[(set _.KRC:$dst, (OpNode (_.VT _.RC:$src1),
(_.VT (bitconvert (_.LdFrag addr:$src2)))))]>,		(_.VT (_.LdFrag addr:$src2))))]>,
EVEX_4V, Sched<[sched.Folded, sched.ReadAfterFold]>;		EVEX_4V, Sched<[sched.Folded, sched.ReadAfterFold]>;
let isCommutable = IsCommutable in		let isCommutable = IsCommutable in
def rrk : AVX512BI<opc, MRMSrcReg,		def rrk : AVX512BI<opc, MRMSrcReg,
(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1, _.RC:$src2),		(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1, _.RC:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst {${mask}}\|",		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst {${mask}}\|",
"$dst {${mask}}, $src1, $src2}"),		"$dst {${mask}}, $src1, $src2}"),
[(set _.KRC:$dst, (and _.KRCWM:$mask,		[(set _.KRC:$dst, (and _.KRCWM:$mask,
(OpNode (_.VT _.RC:$src1), (_.VT _.RC:$src2))))]>,		(OpNode (_.VT _.RC:$src1), (_.VT _.RC:$src2))))]>,
EVEX_4V, EVEX_K, Sched<[sched]>;		EVEX_4V, EVEX_K, Sched<[sched]>;
def rmk : AVX512BI<opc, MRMSrcMem,		def rmk : AVX512BI<opc, MRMSrcMem,
(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1, _.MemOp:$src2),		(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1, _.MemOp:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst {${mask}}\|",		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst {${mask}}\|",
"$dst {${mask}}, $src1, $src2}"),		"$dst {${mask}}, $src1, $src2}"),
[(set _.KRC:$dst, (and _.KRCWM:$mask,		[(set _.KRC:$dst, (and _.KRCWM:$mask,
(OpNode (_.VT _.RC:$src1),		(OpNode (_.VT _.RC:$src1),
(_.VT (bitconvert		(_.VT (_.LdFrag addr:$src2)))))]>,
(_.LdFrag addr:$src2))))))]>,
EVEX_4V, EVEX_K, Sched<[sched.Folded, sched.ReadAfterFold]>;		EVEX_4V, EVEX_K, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass avx512_icmp_packed_rmb<bits<8> opc, string OpcodeStr, PatFrag OpNode,		multiclass avx512_icmp_packed_rmb<bits<8> opc, string OpcodeStr, PatFrag OpNode,
X86FoldableSchedWrite sched, X86VectorVTInfo _,		X86FoldableSchedWrite sched, X86VectorVTInfo _,
bit IsCommutable> :		bit IsCommutable> :
avx512_icmp_packed<opc, OpcodeStr, OpNode, sched, _, IsCommutable> {		avx512_icmp_packed<opc, OpcodeStr, OpNode, sched, _, IsCommutable> {
def rmb : AVX512BI<opc, MRMSrcMem,		def rmb : AVX512BI<opc, MRMSrcMem,
▲ Show 20 Lines • Show All 108 Lines • ▼ Show 20 Lines	def rri : AVX512AIi8<opc, MRMSrcReg,
EVEX_4V, Sched<[sched]>;		EVEX_4V, Sched<[sched]>;
def rmi : AVX512AIi8<opc, MRMSrcMem,		def rmi : AVX512AIi8<opc, MRMSrcMem,
(outs _.KRC:$dst), (ins _.RC:$src1, _.MemOp:$src2, AVX512ICC:$cc),		(outs _.KRC:$dst), (ins _.RC:$src1, _.MemOp:$src2, AVX512ICC:$cc),
!strconcat("vpcmp${cc}", Suffix,		!strconcat("vpcmp${cc}", Suffix,
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set _.KRC:$dst, (_.KVT		[(set _.KRC:$dst, (_.KVT
(Frag:$cc		(Frag:$cc
(_.VT _.RC:$src1),		(_.VT _.RC:$src1),
(_.VT (bitconvert (_.LdFrag addr:$src2))),		(_.VT (_.LdFrag addr:$src2)),
cond)))]>,		cond)))]>,
EVEX_4V, Sched<[sched.Folded, sched.ReadAfterFold]>;		EVEX_4V, Sched<[sched.Folded, sched.ReadAfterFold]>;
let isCommutable = 1 in		let isCommutable = 1 in
def rrik : AVX512AIi8<opc, MRMSrcReg,		def rrik : AVX512AIi8<opc, MRMSrcReg,
(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1, _.RC:$src2,		(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1, _.RC:$src2,
AVX512ICC:$cc),		AVX512ICC:$cc),
!strconcat("vpcmp${cc}", Suffix,		!strconcat("vpcmp${cc}", Suffix,
"\t{$src2, $src1, $dst {${mask}}\|",		"\t{$src2, $src1, $dst {${mask}}\|",
"$dst {${mask}}, $src1, $src2}"),		"$dst {${mask}}, $src1, $src2}"),
[(set _.KRC:$dst, (and _.KRCWM:$mask,		[(set _.KRC:$dst, (and _.KRCWM:$mask,
(_.KVT (Frag:$cc (_.VT _.RC:$src1),		(_.KVT (Frag:$cc (_.VT _.RC:$src1),
(_.VT _.RC:$src2),		(_.VT _.RC:$src2),
cond))))]>,		cond))))]>,
EVEX_4V, EVEX_K, Sched<[sched]>;		EVEX_4V, EVEX_K, Sched<[sched]>;
def rmik : AVX512AIi8<opc, MRMSrcMem,		def rmik : AVX512AIi8<opc, MRMSrcMem,
(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1, _.MemOp:$src2,		(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1, _.MemOp:$src2,
AVX512ICC:$cc),		AVX512ICC:$cc),
!strconcat("vpcmp${cc}", Suffix,		!strconcat("vpcmp${cc}", Suffix,
"\t{$src2, $src1, $dst {${mask}}\|",		"\t{$src2, $src1, $dst {${mask}}\|",
"$dst {${mask}}, $src1, $src2}"),		"$dst {${mask}}, $src1, $src2}"),
[(set _.KRC:$dst, (and _.KRCWM:$mask,		[(set _.KRC:$dst, (and _.KRCWM:$mask,
(_.KVT		(_.KVT
(Frag:$cc		(Frag:$cc
(_.VT _.RC:$src1),		(_.VT _.RC:$src1),
(_.VT (bitconvert		(_.VT (_.LdFrag addr:$src2)),
(_.LdFrag addr:$src2))),
cond))))]>,		cond))))]>,
EVEX_4V, EVEX_K, Sched<[sched.Folded, sched.ReadAfterFold]>;		EVEX_4V, EVEX_K, Sched<[sched.Folded, sched.ReadAfterFold]>;

// Accept explicit immediate argument form instead of comparison code.		// Accept explicit immediate argument form instead of comparison code.
let isAsmParserOnly = 1, hasSideEffects = 0 in {		let isAsmParserOnly = 1, hasSideEffects = 0 in {
def rri_alt : AVX512AIi8<opc, MRMSrcReg,		def rri_alt : AVX512AIi8<opc, MRMSrcReg,
(outs _.KRC:$dst), (ins _.RC:$src1, _.RC:$src2, u8imm:$cc),		(outs _.KRC:$dst), (ins _.RC:$src1, _.RC:$src2, u8imm:$cc),
!strconcat("vpcmp", Suffix, "\t{$cc, $src2, $src1, $dst\|",		!strconcat("vpcmp", Suffix, "\t{$cc, $src2, $src1, $dst\|",
Show All 18 Lines	def rmik_alt : AVX512AIi8<opc, MRMSrcMem,
u8imm:$cc),		u8imm:$cc),
!strconcat("vpcmp", Suffix,		!strconcat("vpcmp", Suffix,
"\t{$cc, $src2, $src1, $dst {${mask}}\|",		"\t{$cc, $src2, $src1, $dst {${mask}}\|",
"$dst {${mask}}, $src1, $src2, $cc}"), []>,		"$dst {${mask}}, $src1, $src2, $cc}"), []>,
EVEX_4V, EVEX_K, Sched<[sched.Folded, sched.ReadAfterFold]>,		EVEX_4V, EVEX_K, Sched<[sched.Folded, sched.ReadAfterFold]>,
NotMemoryFoldable;		NotMemoryFoldable;
}		}

def : Pat<(_.KVT (CommFrag:$cc (bitconvert (_.LdFrag addr:$src2)),		def : Pat<(_.KVT (CommFrag:$cc (_.LdFrag addr:$src2),
(_.VT _.RC:$src1), cond)),		(_.VT _.RC:$src1), cond)),
(!cast<Instruction>(Name#_.ZSuffix#"rmi")		(!cast<Instruction>(Name#_.ZSuffix#"rmi")
_.RC:$src1, addr:$src2, (CommFrag.OperandTransform $cc))>;		_.RC:$src1, addr:$src2, (CommFrag.OperandTransform $cc))>;

def : Pat<(and _.KRCWM:$mask,		def : Pat<(and _.KRCWM:$mask,
(_.KVT (CommFrag:$cc (bitconvert (_.LdFrag addr:$src2)),		(_.KVT (CommFrag:$cc (_.LdFrag addr:$src2),
(_.VT _.RC:$src1), cond))),		(_.VT _.RC:$src1), cond))),
(!cast<Instruction>(Name#_.ZSuffix#"rmik")		(!cast<Instruction>(Name#_.ZSuffix#"rmik")
_.KRCWM:$mask, _.RC:$src1, addr:$src2,		_.KRCWM:$mask, _.RC:$src1, addr:$src2,
(CommFrag.OperandTransform $cc))>;		(CommFrag.OperandTransform $cc))>;
}		}

multiclass avx512_icmp_cc_rmb<bits<8> opc, string Suffix, PatFrag Frag,		multiclass avx512_icmp_cc_rmb<bits<8> opc, string Suffix, PatFrag Frag,
PatFrag CommFrag, X86FoldableSchedWrite sched,		PatFrag CommFrag, X86FoldableSchedWrite sched,
▲ Show 20 Lines • Show All 169 Lines • ▼ Show 20 Lines	defm rri : AVX512_maskable_cmp<0xC2, MRMSrcReg, _,
imm:$cc), 1>,		imm:$cc), 1>,
Sched<[sched]>;		Sched<[sched]>;

defm rmi : AVX512_maskable_cmp<0xC2, MRMSrcMem, _,		defm rmi : AVX512_maskable_cmp<0xC2, MRMSrcMem, _,
(outs _.KRC:$dst),(ins _.RC:$src1, _.MemOp:$src2, AVXCC:$cc),		(outs _.KRC:$dst),(ins _.RC:$src1, _.MemOp:$src2, AVXCC:$cc),
"vcmp${cc}"#_.Suffix,		"vcmp${cc}"#_.Suffix,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(X86cmpm (_.VT _.RC:$src1),		(X86cmpm (_.VT _.RC:$src1),
(_.VT (bitconvert (_.LdFrag addr:$src2))),		(_.VT (_.LdFrag addr:$src2)),
imm:$cc)>,		imm:$cc)>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;

defm rmbi : AVX512_maskable_cmp<0xC2, MRMSrcMem, _,		defm rmbi : AVX512_maskable_cmp<0xC2, MRMSrcMem, _,
(outs _.KRC:$dst),		(outs _.KRC:$dst),
(ins _.RC:$src1, _.ScalarMemOp:$src2, AVXCC:$cc),		(ins _.RC:$src1, _.ScalarMemOp:$src2, AVXCC:$cc),
"vcmp${cc}"#_.Suffix,		"vcmp${cc}"#_.Suffix,
"${src2}"##_.BroadcastStr##", $src1",		"${src2}"##_.BroadcastStr##", $src1",
▲ Show 20 Lines • Show All 171 Lines • ▼ Show 20 Lines	def rrk : AVX512<opc, MRMSrcReg, (outs _.KRC:$dst),
(OpNode (_.VT _.RC:$src1),		(OpNode (_.VT _.RC:$src1),
(i32 imm:$src2))))]>,		(i32 imm:$src2))))]>,
EVEX_K, Sched<[sched]>;		EVEX_K, Sched<[sched]>;
def rm : AVX512<opc, MRMSrcMem, (outs _.KRC:$dst),		def rm : AVX512<opc, MRMSrcMem, (outs _.KRC:$dst),
(ins _.MemOp:$src1, i32u8imm:$src2),		(ins _.MemOp:$src1, i32u8imm:$src2),
OpcodeStr##_.Suffix##mem#		OpcodeStr##_.Suffix##mem#
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
[(set _.KRC:$dst,(OpNode		[(set _.KRC:$dst,(OpNode
(_.VT (bitconvert (_.LdFrag addr:$src1))),		(_.VT (_.LdFrag addr:$src1)),
(i32 imm:$src2)))]>,		(i32 imm:$src2)))]>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
def rmk : AVX512<opc, MRMSrcMem, (outs _.KRC:$dst),		def rmk : AVX512<opc, MRMSrcMem, (outs _.KRC:$dst),
(ins _.KRCWM:$mask, _.MemOp:$src1, i32u8imm:$src2),		(ins _.KRCWM:$mask, _.MemOp:$src1, i32u8imm:$src2),
OpcodeStr##_.Suffix##mem#		OpcodeStr##_.Suffix##mem#
"\t{$src2, $src1, $dst {${mask}}\|$dst {${mask}}, $src1, $src2}",		"\t{$src2, $src1, $dst {${mask}}\|$dst {${mask}}, $src1, $src2}",
[(set _.KRC:$dst, (and _.KRCWM:$mask, (OpNode		[(set _.KRC:$dst, (and _.KRCWM:$mask, (OpNode
(_.VT (bitconvert (_.LdFrag addr:$src1))),		(_.VT (_.LdFrag addr:$src1)),
(i32 imm:$src2))))]>,		(i32 imm:$src2))))]>,
EVEX_K, Sched<[sched.Folded, sched.ReadAfterFold]>;		EVEX_K, Sched<[sched.Folded, sched.ReadAfterFold]>;
def rmb : AVX512<opc, MRMSrcMem, (outs _.KRC:$dst),		def rmb : AVX512<opc, MRMSrcMem, (outs _.KRC:$dst),
(ins _.ScalarMemOp:$src1, i32u8imm:$src2),		(ins _.ScalarMemOp:$src1, i32u8imm:$src2),
OpcodeStr##_.Suffix##broadcast##"\t{$src2, ${src1}"##		OpcodeStr##_.Suffix##broadcast##"\t{$src2, ${src1}"##
_.BroadcastStr##", $dst\|$dst, ${src1}"		_.BroadcastStr##", $dst\|$dst, ${src1}"
##_.BroadcastStr##", $src2}",		##_.BroadcastStr##", $src2}",
[(set _.KRC:$dst,(OpNode		[(set _.KRC:$dst,(OpNode
▲ Show 20 Lines • Show All 596 Lines • ▼ Show 20 Lines	def rrkz : AVX512PI<opc, MRMSrcReg, (outs _.RC:$dst),
_.ImmAllZerosV)))], _.ExeDomain>,		_.ImmAllZerosV)))], _.ExeDomain>,
EVEX, EVEX_KZ, Sched<[Sched.RR]>;		EVEX, EVEX_KZ, Sched<[Sched.RR]>;

let mayLoad = 1, canFoldAsLoad = 1, isReMaterializable = 1 in		let mayLoad = 1, canFoldAsLoad = 1, isReMaterializable = 1 in
def rm : AVX512PI<opc, MRMSrcMem, (outs _.RC:$dst), (ins _.MemOp:$src),		def rm : AVX512PI<opc, MRMSrcMem, (outs _.RC:$dst), (ins _.MemOp:$src),
!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),		!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),
!if(NoRMPattern, [],		!if(NoRMPattern, [],
[(set _.RC:$dst,		[(set _.RC:$dst,
(_.VT (bitconvert (ld_frag addr:$src))))]),		(_.VT (ld_frag addr:$src)))]),
_.ExeDomain>, EVEX, Sched<[Sched.RM]>,		_.ExeDomain>, EVEX, Sched<[Sched.RM]>,
EVEX2VEXOverride<EVEX2VEXOvrd#"rm">;		EVEX2VEXOverride<EVEX2VEXOvrd#"rm">;

let Constraints = "$src0 = $dst", isConvertibleToThreeAddress = 1 in {		let Constraints = "$src0 = $dst", isConvertibleToThreeAddress = 1 in {
def rrk : AVX512PI<opc, MRMSrcReg, (outs _.RC:$dst),		def rrk : AVX512PI<opc, MRMSrcReg, (outs _.RC:$dst),
(ins _.RC:$src0, _.KRCWM:$mask, _.RC:$src1),		(ins _.RC:$src0, _.KRCWM:$mask, _.RC:$src1),
!strconcat(OpcodeStr, "\t{$src1, ${dst} {${mask}}\|",		!strconcat(OpcodeStr, "\t{$src1, ${dst} {${mask}}\|",
"${dst} {${mask}}, $src1}"),		"${dst} {${mask}}, $src1}"),
[(set _.RC:$dst, (_.VT (SelectOprr _.KRCWM:$mask,		[(set _.RC:$dst, (_.VT (SelectOprr _.KRCWM:$mask,
(_.VT _.RC:$src1),		(_.VT _.RC:$src1),
(_.VT _.RC:$src0))))], _.ExeDomain>,		(_.VT _.RC:$src0))))], _.ExeDomain>,
EVEX, EVEX_K, Sched<[Sched.RR]>;		EVEX, EVEX_K, Sched<[Sched.RR]>;
def rmk : AVX512PI<opc, MRMSrcMem, (outs _.RC:$dst),		def rmk : AVX512PI<opc, MRMSrcMem, (outs _.RC:$dst),
(ins _.RC:$src0, _.KRCWM:$mask, _.MemOp:$src1),		(ins _.RC:$src0, _.KRCWM:$mask, _.MemOp:$src1),
!strconcat(OpcodeStr, "\t{$src1, ${dst} {${mask}}\|",		!strconcat(OpcodeStr, "\t{$src1, ${dst} {${mask}}\|",
"${dst} {${mask}}, $src1}"),		"${dst} {${mask}}, $src1}"),
[(set _.RC:$dst, (_.VT		[(set _.RC:$dst, (_.VT
(vselect _.KRCWM:$mask,		(vselect _.KRCWM:$mask,
(_.VT (bitconvert (ld_frag addr:$src1))),		(_.VT (ld_frag addr:$src1)),
(_.VT _.RC:$src0))))], _.ExeDomain>,		(_.VT _.RC:$src0))))], _.ExeDomain>,
EVEX, EVEX_K, Sched<[Sched.RM]>;		EVEX, EVEX_K, Sched<[Sched.RM]>;
}		}
def rmkz : AVX512PI<opc, MRMSrcMem, (outs _.RC:$dst),		def rmkz : AVX512PI<opc, MRMSrcMem, (outs _.RC:$dst),
(ins _.KRCWM:$mask, _.MemOp:$src),		(ins _.KRCWM:$mask, _.MemOp:$src),
OpcodeStr #"\t{$src, ${dst} {${mask}} {z}\|"#		OpcodeStr #"\t{$src, ${dst} {${mask}} {z}\|"#
"${dst} {${mask}} {z}, $src}",		"${dst} {${mask}} {z}, $src}",
[(set _.RC:$dst, (_.VT (vselect _.KRCWM:$mask,		[(set _.RC:$dst, (_.VT (vselect _.KRCWM:$mask,
(_.VT (bitconvert (ld_frag addr:$src))), _.ImmAllZerosV)))],		(_.VT (ld_frag addr:$src)), _.ImmAllZerosV)))],
_.ExeDomain>, EVEX, EVEX_KZ, Sched<[Sched.RM]>;		_.ExeDomain>, EVEX, EVEX_KZ, Sched<[Sched.RM]>;
}		}
def : Pat<(_.VT (mload addr:$ptr, _.KRCWM:$mask, undef)),		def : Pat<(_.VT (mload addr:$ptr, _.KRCWM:$mask, undef)),
(!cast<Instruction>(Name#_.ZSuffix##rmkz) _.KRCWM:$mask, addr:$ptr)>;		(!cast<Instruction>(Name#_.ZSuffix##rmkz) _.KRCWM:$mask, addr:$ptr)>;

def : Pat<(_.VT (mload addr:$ptr, _.KRCWM:$mask, _.ImmAllZerosV)),		def : Pat<(_.VT (mload addr:$ptr, _.KRCWM:$mask, _.ImmAllZerosV)),
(!cast<Instruction>(Name#_.ZSuffix##rmkz) _.KRCWM:$mask, addr:$ptr)>;		(!cast<Instruction>(Name#_.ZSuffix##rmkz) _.KRCWM:$mask, addr:$ptr)>;

▲ Show 20 Lines • Show All 283 Lines • ▼ Show 20 Lines	let Predicates = [HasBWI, NoVLX] in {
defm : mask_move_lowering<"VMOVDQU8Z", v16i8x_info, v64i8_info>;		defm : mask_move_lowering<"VMOVDQU8Z", v16i8x_info, v64i8_info>;
defm : mask_move_lowering<"VMOVDQU8Z", v32i8x_info, v64i8_info>;		defm : mask_move_lowering<"VMOVDQU8Z", v32i8x_info, v64i8_info>;

defm : mask_move_lowering<"VMOVDQU16Z", v8i16x_info, v32i16_info>;		defm : mask_move_lowering<"VMOVDQU16Z", v8i16x_info, v32i16_info>;
defm : mask_move_lowering<"VMOVDQU16Z", v16i16x_info, v32i16_info>;		defm : mask_move_lowering<"VMOVDQU16Z", v16i16x_info, v32i16_info>;
}		}

let Predicates = [HasAVX512] in {		let Predicates = [HasAVX512] in {
		// 512-bit load.
		def : Pat<(alignedloadv16i32 addr:$src),
		(VMOVDQA64Zrm addr:$src)>;
		def : Pat<(alignedloadv32i16 addr:$src),
		(VMOVDQA64Zrm addr:$src)>;
		def : Pat<(alignedloadv64i8 addr:$src),
		(VMOVDQA64Zrm addr:$src)>;
		def : Pat<(loadv16i32 addr:$src),
		(VMOVDQU64Zrm addr:$src)>;
		def : Pat<(loadv32i16 addr:$src),
		(VMOVDQU64Zrm addr:$src)>;
		def : Pat<(loadv64i8 addr:$src),
		(VMOVDQU64Zrm addr:$src)>;

// 512-bit store.		// 512-bit store.
def : Pat<(alignedstore (v16i32 VR512:$src), addr:$dst),		def : Pat<(alignedstore (v16i32 VR512:$src), addr:$dst),
(VMOVDQA64Zmr addr:$dst, VR512:$src)>;		(VMOVDQA64Zmr addr:$dst, VR512:$src)>;
def : Pat<(alignedstore (v32i16 VR512:$src), addr:$dst),		def : Pat<(alignedstore (v32i16 VR512:$src), addr:$dst),
(VMOVDQA64Zmr addr:$dst, VR512:$src)>;		(VMOVDQA64Zmr addr:$dst, VR512:$src)>;
def : Pat<(alignedstore (v64i8 VR512:$src), addr:$dst),		def : Pat<(alignedstore (v64i8 VR512:$src), addr:$dst),
(VMOVDQA64Zmr addr:$dst, VR512:$src)>;		(VMOVDQA64Zmr addr:$dst, VR512:$src)>;
def : Pat<(store (v16i32 VR512:$src), addr:$dst),		def : Pat<(store (v16i32 VR512:$src), addr:$dst),
(VMOVDQU64Zmr addr:$dst, VR512:$src)>;		(VMOVDQU64Zmr addr:$dst, VR512:$src)>;
def : Pat<(store (v32i16 VR512:$src), addr:$dst),		def : Pat<(store (v32i16 VR512:$src), addr:$dst),
(VMOVDQU64Zmr addr:$dst, VR512:$src)>;		(VMOVDQU64Zmr addr:$dst, VR512:$src)>;
def : Pat<(store (v64i8 VR512:$src), addr:$dst),		def : Pat<(store (v64i8 VR512:$src), addr:$dst),
(VMOVDQU64Zmr addr:$dst, VR512:$src)>;		(VMOVDQU64Zmr addr:$dst, VR512:$src)>;
}		}

let Predicates = [HasVLX] in {		let Predicates = [HasVLX] in {
		// 128-bit load.
		def : Pat<(alignedloadv4i32 addr:$src),
		(VMOVDQA64Z128rm addr:$src)>;
		def : Pat<(alignedloadv8i16 addr:$src),
		(VMOVDQA64Z128rm addr:$src)>;
		def : Pat<(alignedloadv16i8 addr:$src),
		(VMOVDQA64Z128rm addr:$src)>;
		def : Pat<(loadv4i32 addr:$src),
		(VMOVDQU64Z128rm addr:$src)>;
		def : Pat<(loadv8i16 addr:$src),
		(VMOVDQU64Z128rm addr:$src)>;
		def : Pat<(loadv16i8 addr:$src),
		(VMOVDQU64Z128rm addr:$src)>;

// 128-bit store.		// 128-bit store.
def : Pat<(alignedstore (v4i32 VR128X:$src), addr:$dst),		def : Pat<(alignedstore (v4i32 VR128X:$src), addr:$dst),
(VMOVDQA64Z128mr addr:$dst, VR128X:$src)>;		(VMOVDQA64Z128mr addr:$dst, VR128X:$src)>;
def : Pat<(alignedstore (v8i16 VR128X:$src), addr:$dst),		def : Pat<(alignedstore (v8i16 VR128X:$src), addr:$dst),
(VMOVDQA64Z128mr addr:$dst, VR128X:$src)>;		(VMOVDQA64Z128mr addr:$dst, VR128X:$src)>;
def : Pat<(alignedstore (v16i8 VR128X:$src), addr:$dst),		def : Pat<(alignedstore (v16i8 VR128X:$src), addr:$dst),
(VMOVDQA64Z128mr addr:$dst, VR128X:$src)>;		(VMOVDQA64Z128mr addr:$dst, VR128X:$src)>;
def : Pat<(store (v4i32 VR128X:$src), addr:$dst),		def : Pat<(store (v4i32 VR128X:$src), addr:$dst),
(VMOVDQU64Z128mr addr:$dst, VR128X:$src)>;		(VMOVDQU64Z128mr addr:$dst, VR128X:$src)>;
def : Pat<(store (v8i16 VR128X:$src), addr:$dst),		def : Pat<(store (v8i16 VR128X:$src), addr:$dst),
(VMOVDQU64Z128mr addr:$dst, VR128X:$src)>;		(VMOVDQU64Z128mr addr:$dst, VR128X:$src)>;
def : Pat<(store (v16i8 VR128X:$src), addr:$dst),		def : Pat<(store (v16i8 VR128X:$src), addr:$dst),
(VMOVDQU64Z128mr addr:$dst, VR128X:$src)>;		(VMOVDQU64Z128mr addr:$dst, VR128X:$src)>;

		// 256-bit load.
		def : Pat<(alignedloadv8i32 addr:$src),
		(VMOVDQA64Z256rm addr:$src)>;
		def : Pat<(alignedloadv16i16 addr:$src),
		(VMOVDQA64Z256rm addr:$src)>;
		def : Pat<(alignedloadv32i8 addr:$src),
		(VMOVDQA64Z256rm addr:$src)>;
		def : Pat<(loadv8i32 addr:$src),
		(VMOVDQU64Z256rm addr:$src)>;
		def : Pat<(loadv16i16 addr:$src),
		(VMOVDQU64Z256rm addr:$src)>;
		def : Pat<(loadv32i8 addr:$src),
		(VMOVDQU64Z256rm addr:$src)>;

// 256-bit store.		// 256-bit store.
def : Pat<(alignedstore (v8i32 VR256X:$src), addr:$dst),		def : Pat<(alignedstore (v8i32 VR256X:$src), addr:$dst),
(VMOVDQA64Z256mr addr:$dst, VR256X:$src)>;		(VMOVDQA64Z256mr addr:$dst, VR256X:$src)>;
def : Pat<(alignedstore (v16i16 VR256X:$src), addr:$dst),		def : Pat<(alignedstore (v16i16 VR256X:$src), addr:$dst),
(VMOVDQA64Z256mr addr:$dst, VR256X:$src)>;		(VMOVDQA64Z256mr addr:$dst, VR256X:$src)>;
def : Pat<(alignedstore (v32i8 VR256X:$src), addr:$dst),		def : Pat<(alignedstore (v32i8 VR256X:$src), addr:$dst),
(VMOVDQA64Z256mr addr:$dst, VR256X:$src)>;		(VMOVDQA64Z256mr addr:$dst, VR256X:$src)>;
def : Pat<(store (v8i32 VR256X:$src), addr:$dst),		def : Pat<(store (v8i32 VR256X:$src), addr:$dst),
▲ Show 20 Lines • Show All 768 Lines • ▼ Show 20 Lines	def : Pat<(v8i64 (X86vzmovl (insert_subvector undef,
(v2i64 (scalar_to_vector GR64:$src)),(iPTR 0)))),		(v2i64 (scalar_to_vector GR64:$src)),(iPTR 0)))),
(SUBREG_TO_REG (i64 0), (v2i64 (VMOV64toPQIZrr GR64:$src)), sub_xmm)>;		(SUBREG_TO_REG (i64 0), (v2i64 (VMOV64toPQIZrr GR64:$src)), sub_xmm)>;

// AVX 128-bit movd/movq instruction write zeros in the high 128-bit part.		// AVX 128-bit movd/movq instruction write zeros in the high 128-bit part.
def : Pat<(v2i64 (X86vzmovl (v2i64 (scalar_to_vector (zextloadi64i32 addr:$src))))),		def : Pat<(v2i64 (X86vzmovl (v2i64 (scalar_to_vector (zextloadi64i32 addr:$src))))),
(VMOVDI2PDIZrm addr:$src)>;		(VMOVDI2PDIZrm addr:$src)>;
def : Pat<(v4i32 (X86vzmovl (v4i32 (scalar_to_vector (loadi32 addr:$src))))),		def : Pat<(v4i32 (X86vzmovl (v4i32 (scalar_to_vector (loadi32 addr:$src))))),
(VMOVDI2PDIZrm addr:$src)>;		(VMOVDI2PDIZrm addr:$src)>;
def : Pat<(v4i32 (X86vzmovl (bc_v4i32 (loadv2i64 addr:$src)))),		def : Pat<(v4i32 (X86vzmovl (loadv4i32 addr:$src))),
(VMOVDI2PDIZrm addr:$src)>;		(VMOVDI2PDIZrm addr:$src)>;
def : Pat<(v4i32 (X86vzload addr:$src)),		def : Pat<(v4i32 (X86vzload addr:$src)),
(VMOVDI2PDIZrm addr:$src)>;		(VMOVDI2PDIZrm addr:$src)>;
def : Pat<(v8i32 (X86vzload addr:$src)),		def : Pat<(v8i32 (X86vzload addr:$src)),
(SUBREG_TO_REG (i32 0), (v4i32 (VMOVDI2PDIZrm addr:$src)), sub_xmm)>;		(SUBREG_TO_REG (i32 0), (v4i32 (VMOVDI2PDIZrm addr:$src)), sub_xmm)>;
def : Pat<(v2i64 (X86vzmovl (loadv2i64 addr:$src))),		def : Pat<(v2i64 (X86vzmovl (loadv2i64 addr:$src))),
(VMOVQI2PQIZrm addr:$src)>;		(VMOVQI2PQIZrm addr:$src)>;
def : Pat<(v2f64 (X86vzmovl (v2f64 VR128X:$src))),		def : Pat<(v2f64 (X86vzmovl (v2f64 VR128X:$src))),
▲ Show 20 Lines • Show All 79 Lines • ▼ Show 20 Lines	def : Pat<(alignednontemporalstore (v64i8 VR512:$src), addr:$dst),
(VMOVNTDQZmr addr:$dst, VR512:$src)>;		(VMOVNTDQZmr addr:$dst, VR512:$src)>;

def : Pat<(v8f64 (alignednontemporalload addr:$src)),		def : Pat<(v8f64 (alignednontemporalload addr:$src)),
(VMOVNTDQAZrm addr:$src)>;		(VMOVNTDQAZrm addr:$src)>;
def : Pat<(v16f32 (alignednontemporalload addr:$src)),		def : Pat<(v16f32 (alignednontemporalload addr:$src)),
(VMOVNTDQAZrm addr:$src)>;		(VMOVNTDQAZrm addr:$src)>;
def : Pat<(v8i64 (alignednontemporalload addr:$src)),		def : Pat<(v8i64 (alignednontemporalload addr:$src)),
(VMOVNTDQAZrm addr:$src)>;		(VMOVNTDQAZrm addr:$src)>;
		def : Pat<(v16i32 (alignednontemporalload addr:$src)),
		(VMOVNTDQAZrm addr:$src)>;
		def : Pat<(v32i16 (alignednontemporalload addr:$src)),
		(VMOVNTDQAZrm addr:$src)>;
		def : Pat<(v64i8 (alignednontemporalload addr:$src)),
		(VMOVNTDQAZrm addr:$src)>;
}		}

let Predicates = [HasVLX], AddedComplexity = 400 in {		let Predicates = [HasVLX], AddedComplexity = 400 in {
def : Pat<(alignednontemporalstore (v8i32 VR256X:$src), addr:$dst),		def : Pat<(alignednontemporalstore (v8i32 VR256X:$src), addr:$dst),
(VMOVNTDQZ256mr addr:$dst, VR256X:$src)>;		(VMOVNTDQZ256mr addr:$dst, VR256X:$src)>;
def : Pat<(alignednontemporalstore (v16i16 VR256X:$src), addr:$dst),		def : Pat<(alignednontemporalstore (v16i16 VR256X:$src), addr:$dst),
(VMOVNTDQZ256mr addr:$dst, VR256X:$src)>;		(VMOVNTDQZ256mr addr:$dst, VR256X:$src)>;
def : Pat<(alignednontemporalstore (v32i8 VR256X:$src), addr:$dst),		def : Pat<(alignednontemporalstore (v32i8 VR256X:$src), addr:$dst),
(VMOVNTDQZ256mr addr:$dst, VR256X:$src)>;		(VMOVNTDQZ256mr addr:$dst, VR256X:$src)>;

def : Pat<(v4f64 (alignednontemporalload addr:$src)),		def : Pat<(v4f64 (alignednontemporalload addr:$src)),
(VMOVNTDQAZ256rm addr:$src)>;		(VMOVNTDQAZ256rm addr:$src)>;
def : Pat<(v8f32 (alignednontemporalload addr:$src)),		def : Pat<(v8f32 (alignednontemporalload addr:$src)),
(VMOVNTDQAZ256rm addr:$src)>;		(VMOVNTDQAZ256rm addr:$src)>;
def : Pat<(v4i64 (alignednontemporalload addr:$src)),		def : Pat<(v4i64 (alignednontemporalload addr:$src)),
(VMOVNTDQAZ256rm addr:$src)>;		(VMOVNTDQAZ256rm addr:$src)>;
		def : Pat<(v8i32 (alignednontemporalload addr:$src)),
		(VMOVNTDQAZ256rm addr:$src)>;
		def : Pat<(v16i16 (alignednontemporalload addr:$src)),
		(VMOVNTDQAZ256rm addr:$src)>;
		def : Pat<(v32i8 (alignednontemporalload addr:$src)),
		(VMOVNTDQAZ256rm addr:$src)>;

def : Pat<(alignednontemporalstore (v4i32 VR128X:$src), addr:$dst),		def : Pat<(alignednontemporalstore (v4i32 VR128X:$src), addr:$dst),
(VMOVNTDQZ128mr addr:$dst, VR128X:$src)>;		(VMOVNTDQZ128mr addr:$dst, VR128X:$src)>;
def : Pat<(alignednontemporalstore (v8i16 VR128X:$src), addr:$dst),		def : Pat<(alignednontemporalstore (v8i16 VR128X:$src), addr:$dst),
(VMOVNTDQZ128mr addr:$dst, VR128X:$src)>;		(VMOVNTDQZ128mr addr:$dst, VR128X:$src)>;
def : Pat<(alignednontemporalstore (v16i8 VR128X:$src), addr:$dst),		def : Pat<(alignednontemporalstore (v16i8 VR128X:$src), addr:$dst),
(VMOVNTDQZ128mr addr:$dst, VR128X:$src)>;		(VMOVNTDQZ128mr addr:$dst, VR128X:$src)>;

def : Pat<(v2f64 (alignednontemporalload addr:$src)),		def : Pat<(v2f64 (alignednontemporalload addr:$src)),
(VMOVNTDQAZ128rm addr:$src)>;		(VMOVNTDQAZ128rm addr:$src)>;
def : Pat<(v4f32 (alignednontemporalload addr:$src)),		def : Pat<(v4f32 (alignednontemporalload addr:$src)),
(VMOVNTDQAZ128rm addr:$src)>;		(VMOVNTDQAZ128rm addr:$src)>;
def : Pat<(v2i64 (alignednontemporalload addr:$src)),		def : Pat<(v2i64 (alignednontemporalload addr:$src)),
(VMOVNTDQAZ128rm addr:$src)>;		(VMOVNTDQAZ128rm addr:$src)>;
		def : Pat<(v4i32 (alignednontemporalload addr:$src)),
		(VMOVNTDQAZ128rm addr:$src)>;
		def : Pat<(v8i16 (alignednontemporalload addr:$src)),
		(VMOVNTDQAZ128rm addr:$src)>;
		def : Pat<(v16i8 (alignednontemporalload addr:$src)),
		(VMOVNTDQAZ128rm addr:$src)>;
}		}

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// AVX-512 - Integer arithmetic		// AVX-512 - Integer arithmetic
//		//
multiclass avx512_binop_rm<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass avx512_binop_rm<bits<8> opc, string OpcodeStr, SDNode OpNode,
X86VectorVTInfo _, X86FoldableSchedWrite sched,		X86VectorVTInfo _, X86FoldableSchedWrite sched,
bit IsCommutable = 0> {		bit IsCommutable = 0> {
defm rr : AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),		defm rr : AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.RC:$src2), OpcodeStr,		(ins _.RC:$src1, _.RC:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_.VT (OpNode _.RC:$src1, _.RC:$src2)),		(_.VT (OpNode _.RC:$src1, _.RC:$src2)),
IsCommutable>, AVX512BIBase, EVEX_4V,		IsCommutable>, AVX512BIBase, EVEX_4V,
Sched<[sched]>;		Sched<[sched]>;

defm rm : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rm : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.MemOp:$src2), OpcodeStr,		(ins _.RC:$src1, _.MemOp:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_.VT (OpNode _.RC:$src1,		(_.VT (OpNode _.RC:$src1, (_.LdFrag addr:$src2)))>,
(bitconvert (_.LdFrag addr:$src2))))>,
AVX512BIBase, EVEX_4V,		AVX512BIBase, EVEX_4V,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass avx512_binop_rmb<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass avx512_binop_rmb<bits<8> opc, string OpcodeStr, SDNode OpNode,
X86VectorVTInfo _, X86FoldableSchedWrite sched,		X86VectorVTInfo _, X86FoldableSchedWrite sched,
bit IsCommutable = 0> :		bit IsCommutable = 0> :
avx512_binop_rm<opc, OpcodeStr, OpNode, _, sched, IsCommutable> {		avx512_binop_rm<opc, OpcodeStr, OpNode, _, sched, IsCommutable> {
▲ Show 20 Lines • Show All 114 Lines • ▼ Show 20 Lines	defm rr : AVX512_maskable<opc, MRMSrcReg, _Dst, (outs _Dst.RC:$dst),
(_Src.VT _Src.RC:$src1),		(_Src.VT _Src.RC:$src1),
(_Src.VT _Src.RC:$src2))),		(_Src.VT _Src.RC:$src2))),
IsCommutable>,		IsCommutable>,
AVX512BIBase, EVEX_4V, Sched<[sched]>;		AVX512BIBase, EVEX_4V, Sched<[sched]>;
defm rm : AVX512_maskable<opc, MRMSrcMem, _Dst, (outs _Dst.RC:$dst),		defm rm : AVX512_maskable<opc, MRMSrcMem, _Dst, (outs _Dst.RC:$dst),
(ins _Src.RC:$src1, _Src.MemOp:$src2), OpcodeStr,		(ins _Src.RC:$src1, _Src.MemOp:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_Dst.VT (OpNode (_Src.VT _Src.RC:$src1),		(_Dst.VT (OpNode (_Src.VT _Src.RC:$src1),
(bitconvert (_Src.LdFrag addr:$src2))))>,		(_Src.LdFrag addr:$src2)))>,
AVX512BIBase, EVEX_4V,		AVX512BIBase, EVEX_4V,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;

defm rmb : AVX512_maskable<opc, MRMSrcMem, _Dst, (outs _Dst.RC:$dst),		defm rmb : AVX512_maskable<opc, MRMSrcMem, _Dst, (outs _Dst.RC:$dst),
(ins _Src.RC:$src1, _Brdct.ScalarMemOp:$src2),		(ins _Src.RC:$src1, _Brdct.ScalarMemOp:$src2),
OpcodeStr,		OpcodeStr,
"${src2}"##_Brdct.BroadcastStr##", $src1",		"${src2}"##_Brdct.BroadcastStr##", $src1",
"$src1, ${src2}"##_Brdct.BroadcastStr,		"$src1, ${src2}"##_Brdct.BroadcastStr,
▲ Show 20 Lines • Show All 88 Lines • ▼ Show 20 Lines	defm rr : AVX512_maskable<opc, MRMSrcReg, _Dst, (outs _Dst.RC:$dst),
(_Src.VT _Src.RC:$src1),		(_Src.VT _Src.RC:$src1),
(_Src.VT _Src.RC:$src2))),		(_Src.VT _Src.RC:$src2))),
IsCommutable>,		IsCommutable>,
EVEX_CD8<_Src.EltSize, CD8VF>, EVEX_4V, Sched<[sched]>;		EVEX_CD8<_Src.EltSize, CD8VF>, EVEX_4V, Sched<[sched]>;
defm rm : AVX512_maskable<opc, MRMSrcMem, _Dst, (outs _Dst.RC:$dst),		defm rm : AVX512_maskable<opc, MRMSrcMem, _Dst, (outs _Dst.RC:$dst),
(ins _Src.RC:$src1, _Src.MemOp:$src2), OpcodeStr,		(ins _Src.RC:$src1, _Src.MemOp:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_Dst.VT (OpNode (_Src.VT _Src.RC:$src1),		(_Dst.VT (OpNode (_Src.VT _Src.RC:$src1),
(bitconvert (_Src.LdFrag addr:$src2))))>,		(_Src.LdFrag addr:$src2)))>,
EVEX_4V, EVEX_CD8<_Src.EltSize, CD8VF>,		EVEX_4V, EVEX_CD8<_Src.EltSize, CD8VF>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass avx512_packs_all_i32_i16<bits<8> opc, string OpcodeStr,		multiclass avx512_packs_all_i32_i16<bits<8> opc, string OpcodeStr,
SDNode OpNode> {		SDNode OpNode> {
let Predicates = [HasBWI] in		let Predicates = [HasBWI] in
defm NAME#Z : avx512_packs_rm<opc, OpcodeStr, OpNode, v16i32_info,		defm NAME#Z : avx512_packs_rm<opc, OpcodeStr, OpNode, v16i32_info,
▲ Show 20 Lines • Show All 175 Lines • ▼ Show 20 Lines	multiclass avx512_logic_rm<bits<8> opc, string OpcodeStr,

let hasSideEffects = 0, mayLoad = 1 in		let hasSideEffects = 0, mayLoad = 1 in
defm rm : AVX512_maskable_logic<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rm : AVX512_maskable_logic<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.MemOp:$src2), OpcodeStr,		(ins _.RC:$src1, _.MemOp:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_.i64VT (OpNode (bitconvert (_.VT _.RC:$src1)),		(_.i64VT (OpNode (bitconvert (_.VT _.RC:$src1)),
(bitconvert (_.LdFrag addr:$src2)))),		(bitconvert (_.LdFrag addr:$src2)))),
(_.VT (bitconvert (_.i64VT (OpNodeMsk _.RC:$src1,		(_.VT (bitconvert (_.i64VT (OpNodeMsk _.RC:$src1,
(bitconvert (_.LdFrag addr:$src2))))))>,		(_.i64LdFrag addr:$src2)))))>,
AVX512BIBase, EVEX_4V,		AVX512BIBase, EVEX_4V,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

// OpNodeMsk is the OpNode to use where element size is important. So use		// OpNodeMsk is the OpNode to use where element size is important. So use
// for all of the broadcast patterns.		// for all of the broadcast patterns.
multiclass avx512_logic_rmb<bits<8> opc, string OpcodeStr,		multiclass avx512_logic_rmb<bits<8> opc, string OpcodeStr,
SDPatternOperator OpNode,		SDPatternOperator OpNode,
▲ Show 20 Lines • Show All 556 Lines • ▼ Show 20 Lines	defm rr : AVX512_maskable_cmp<opc, MRMSrcReg, _, (outs _.KRC:$dst),
(OpNode (bitconvert (_.i64VT (and _.RC:$src1, _.RC:$src2))),		(OpNode (bitconvert (_.i64VT (and _.RC:$src1, _.RC:$src2))),
_.ImmAllZerosV)>,		_.ImmAllZerosV)>,
EVEX_4V, Sched<[sched]>;		EVEX_4V, Sched<[sched]>;
defm rm : AVX512_maskable_cmp<opc, MRMSrcMem, _, (outs _.KRC:$dst),		defm rm : AVX512_maskable_cmp<opc, MRMSrcMem, _, (outs _.KRC:$dst),
(ins _.RC:$src1, _.MemOp:$src2), OpcodeStr,		(ins _.RC:$src1, _.MemOp:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(OpNode (bitconvert		(OpNode (bitconvert
(_.i64VT (and _.RC:$src1,		(_.i64VT (and _.RC:$src1,
(bitconvert (_.LdFrag addr:$src2))))),		(_.i64LdFrag addr:$src2)))),
_.ImmAllZerosV)>,		_.ImmAllZerosV)>,
EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,		EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

// Patterns for compare with 0 that just use the same source twice.		// Patterns for compare with 0 that just use the same source twice.
def : Pat<(_.KVT (OpNode _.RC:$src, _.ImmAllZerosV)),		def : Pat<(_.KVT (OpNode _.RC:$src, _.ImmAllZerosV)),
(_.KVT (!cast<Instruction>(Name # _.ZSuffix # "rr")		(_.KVT (!cast<Instruction>(Name # _.ZSuffix # "rr")
▲ Show 20 Lines • Show All 147 Lines • ▼ Show 20 Lines	multiclass avx512_shift_rmi<bits<8> opc, Format ImmFormR, Format ImmFormM,
defm ri : AVX512_maskable<opc, ImmFormR, _, (outs _.RC:$dst),		defm ri : AVX512_maskable<opc, ImmFormR, _, (outs _.RC:$dst),
(ins _.RC:$src1, u8imm:$src2), OpcodeStr,		(ins _.RC:$src1, u8imm:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_.VT (OpNode _.RC:$src1, (i8 imm:$src2)))>,		(_.VT (OpNode _.RC:$src1, (i8 imm:$src2)))>,
Sched<[sched]>;		Sched<[sched]>;
defm mi : AVX512_maskable<opc, ImmFormM, _, (outs _.RC:$dst),		defm mi : AVX512_maskable<opc, ImmFormM, _, (outs _.RC:$dst),
(ins _.MemOp:$src1, u8imm:$src2), OpcodeStr,		(ins _.MemOp:$src1, u8imm:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_.VT (OpNode (_.VT (bitconvert (_.LdFrag addr:$src1))),		(_.VT (OpNode (_.VT (_.LdFrag addr:$src1)),
(i8 imm:$src2)))>,		(i8 imm:$src2)))>,
Sched<[sched.Folded]>;		Sched<[sched.Folded]>;
}		}
}		}

multiclass avx512_shift_rmbi<bits<8> opc, Format ImmFormM,		multiclass avx512_shift_rmbi<bits<8> opc, Format ImmFormM,
string OpcodeStr, SDNode OpNode,		string OpcodeStr, SDNode OpNode,
X86FoldableSchedWrite sched, X86VectorVTInfo _> {		X86FoldableSchedWrite sched, X86VectorVTInfo _> {
Show All 13 Lines	multiclass avx512_shift_rrm<bits<8> opc, string OpcodeStr, SDNode OpNode,
defm rr : AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),		defm rr : AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),
(ins _.RC:$src1, VR128X:$src2), OpcodeStr,		(ins _.RC:$src1, VR128X:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_.VT (OpNode _.RC:$src1, (SrcVT VR128X:$src2)))>,		(_.VT (OpNode _.RC:$src1, (SrcVT VR128X:$src2)))>,
AVX512BIBase, EVEX_4V, Sched<[sched]>;		AVX512BIBase, EVEX_4V, Sched<[sched]>;
defm rm : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rm : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, i128mem:$src2), OpcodeStr,		(ins _.RC:$src1, i128mem:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_.VT (OpNode _.RC:$src1,		(_.VT (OpNode _.RC:$src1, (SrcVT (load addr:$src2))))>,
(SrcVT (bitconvert (loadv2i64 addr:$src2)))))>,
AVX512BIBase,		AVX512BIBase,
EVEX_4V, Sched<[sched.Folded, sched.ReadAfterFold]>;		EVEX_4V, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

multiclass avx512_shift_sizes<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass avx512_shift_sizes<bits<8> opc, string OpcodeStr, SDNode OpNode,
X86SchedWriteWidths sched, ValueType SrcVT,		X86SchedWriteWidths sched, ValueType SrcVT,
AVX512VLVectorVTInfo VTInfo,		AVX512VLVectorVTInfo VTInfo,
▲ Show 20 Lines • Show All 137 Lines • ▼ Show 20 Lines	defm rr : AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.RC:$src2), OpcodeStr,		(ins _.RC:$src1, _.RC:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_.VT (OpNode _.RC:$src1, (_.VT _.RC:$src2)))>,		(_.VT (OpNode _.RC:$src1, (_.VT _.RC:$src2)))>,
AVX5128IBase, EVEX_4V, Sched<[sched]>;		AVX5128IBase, EVEX_4V, Sched<[sched]>;
defm rm : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rm : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.MemOp:$src2), OpcodeStr,		(ins _.RC:$src1, _.MemOp:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_.VT (OpNode _.RC:$src1,		(_.VT (OpNode _.RC:$src1,
(_.VT (bitconvert (_.LdFrag addr:$src2)))))>,		(_.VT (_.LdFrag addr:$src2))))>,
AVX5128IBase, EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,		AVX5128IBase, EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

multiclass avx512_var_shift_mb<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass avx512_var_shift_mb<bits<8> opc, string OpcodeStr, SDNode OpNode,
X86FoldableSchedWrite sched, X86VectorVTInfo _> {		X86FoldableSchedWrite sched, X86VectorVTInfo _> {
let ExeDomain = _.ExeDomain in		let ExeDomain = _.ExeDomain in
▲ Show 20 Lines • Show All 83 Lines • ▼ Show 20 Lines

// Special handing for handling VPSRAV intrinsics.		// Special handing for handling VPSRAV intrinsics.
multiclass avx512_var_shift_int_lowering<string InstrStr, X86VectorVTInfo _,		multiclass avx512_var_shift_int_lowering<string InstrStr, X86VectorVTInfo _,
list<Predicate> p> {		list<Predicate> p> {
let Predicates = p in {		let Predicates = p in {
def : Pat<(_.VT (X86vsrav _.RC:$src1, _.RC:$src2)),		def : Pat<(_.VT (X86vsrav _.RC:$src1, _.RC:$src2)),
(!cast<Instruction>(InstrStr#_.ZSuffix#rr) _.RC:$src1,		(!cast<Instruction>(InstrStr#_.ZSuffix#rr) _.RC:$src1,
_.RC:$src2)>;		_.RC:$src2)>;
def : Pat<(_.VT (X86vsrav _.RC:$src1, (bitconvert (_.LdFrag addr:$src2)))),		def : Pat<(_.VT (X86vsrav _.RC:$src1, (_.LdFrag addr:$src2))),
(!cast<Instruction>(InstrStr#_.ZSuffix##rm)		(!cast<Instruction>(InstrStr#_.ZSuffix##rm)
_.RC:$src1, addr:$src2)>;		_.RC:$src1, addr:$src2)>;
def : Pat<(_.VT (vselect _.KRCWM:$mask,		def : Pat<(_.VT (vselect _.KRCWM:$mask,
(X86vsrav _.RC:$src1, _.RC:$src2), _.RC:$src0)),		(X86vsrav _.RC:$src1, _.RC:$src2), _.RC:$src0)),
(!cast<Instruction>(InstrStr#_.ZSuffix#rrk) _.RC:$src0,		(!cast<Instruction>(InstrStr#_.ZSuffix#rrk) _.RC:$src0,
_.KRC:$mask, _.RC:$src1, _.RC:$src2)>;		_.KRC:$mask, _.RC:$src1, _.RC:$src2)>;
def : Pat<(_.VT (vselect _.KRCWM:$mask,		def : Pat<(_.VT (vselect _.KRCWM:$mask,
(X86vsrav _.RC:$src1, (bitconvert (_.LdFrag addr:$src2))),		(X86vsrav _.RC:$src1, (_.LdFrag addr:$src2)),
_.RC:$src0)),		_.RC:$src0)),
(!cast<Instruction>(InstrStr#_.ZSuffix##rmk) _.RC:$src0,		(!cast<Instruction>(InstrStr#_.ZSuffix##rmk) _.RC:$src0,
_.KRC:$mask, _.RC:$src1, addr:$src2)>;		_.KRC:$mask, _.RC:$src1, addr:$src2)>;
def : Pat<(_.VT (vselect _.KRCWM:$mask,		def : Pat<(_.VT (vselect _.KRCWM:$mask,
(X86vsrav _.RC:$src1, _.RC:$src2), _.ImmAllZerosV)),		(X86vsrav _.RC:$src1, _.RC:$src2), _.ImmAllZerosV)),
(!cast<Instruction>(InstrStr#_.ZSuffix#rrkz) _.KRC:$mask,		(!cast<Instruction>(InstrStr#_.ZSuffix#rrkz) _.KRC:$mask,
_.RC:$src1, _.RC:$src2)>;		_.RC:$src1, _.RC:$src2)>;
def : Pat<(_.VT (vselect _.KRCWM:$mask,		def : Pat<(_.VT (vselect _.KRCWM:$mask,
(X86vsrav _.RC:$src1, (bitconvert (_.LdFrag addr:$src2))),		(X86vsrav _.RC:$src1, (_.LdFrag addr:$src2)),
_.ImmAllZerosV)),		_.ImmAllZerosV)),
(!cast<Instruction>(InstrStr#_.ZSuffix##rmkz) _.KRC:$mask,		(!cast<Instruction>(InstrStr#_.ZSuffix##rmkz) _.KRC:$mask,
_.RC:$src1, addr:$src2)>;		_.RC:$src1, addr:$src2)>;
}		}
}		}

multiclass avx512_var_shift_int_lowering_mb<string InstrStr, X86VectorVTInfo _,		multiclass avx512_var_shift_int_lowering_mb<string InstrStr, X86VectorVTInfo _,
list<Predicate> p> :		list<Predicate> p> :
▲ Show 20 Lines • Show All 208 Lines • ▼ Show 20 Lines	defm rr: AVX512_maskable<OpcVar, MRMSrcReg, _, (outs _.RC:$dst),
(_.VT (OpNode _.RC:$src1,		(_.VT (OpNode _.RC:$src1,
(Ctrl.VT Ctrl.RC:$src2)))>,		(Ctrl.VT Ctrl.RC:$src2)))>,
T8PD, EVEX_4V, Sched<[sched]>;		T8PD, EVEX_4V, Sched<[sched]>;
defm rm: AVX512_maskable<OpcVar, MRMSrcMem, _, (outs _.RC:$dst),		defm rm: AVX512_maskable<OpcVar, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, Ctrl.MemOp:$src2), OpcodeStr,		(ins _.RC:$src1, Ctrl.MemOp:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_.VT (OpNode		(_.VT (OpNode
_.RC:$src1,		_.RC:$src1,
(Ctrl.VT (bitconvert(Ctrl.LdFrag addr:$src2)))))>,		(Ctrl.VT (Ctrl.LdFrag addr:$src2))))>,
T8PD, EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,		T8PD, EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
defm rmb: AVX512_maskable<OpcVar, MRMSrcMem, _, (outs _.RC:$dst),		defm rmb: AVX512_maskable<OpcVar, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.ScalarMemOp:$src2), OpcodeStr,		(ins _.RC:$src1, _.ScalarMemOp:$src2), OpcodeStr,
"${src2}"##_.BroadcastStr##", $src1",		"${src2}"##_.BroadcastStr##", $src1",
"$src1, ${src2}"##_.BroadcastStr,		"$src1, ${src2}"##_.BroadcastStr,
(_.VT (OpNode		(_.VT (OpNode
_.RC:$src1,		_.RC:$src1,
▲ Show 20 Lines • Show All 1,269 Lines • ▼ Show 20 Lines	multiclass avx512_vcvt_fp<bits<8> opc, string OpcodeStr, X86VectorVTInfo _,
defm rr : AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),		defm rr : AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),
(ins _Src.RC:$src), OpcodeStr, "$src", "$src",		(ins _Src.RC:$src), OpcodeStr, "$src", "$src",
(_.VT (OpNode (_Src.VT _Src.RC:$src)))>,		(_.VT (OpNode (_Src.VT _Src.RC:$src)))>,
EVEX, Sched<[sched]>;		EVEX, Sched<[sched]>;

defm rm : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rm : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins MemOp:$src), OpcodeStr#Alias, "$src", "$src",		(ins MemOp:$src), OpcodeStr#Alias, "$src", "$src",
(_.VT (OpNode (_Src.VT		(_.VT (OpNode (_Src.VT
(bitconvert (_Src.LdFrag addr:$src)))))>,		(_Src.LdFrag addr:$src))))>,
EVEX, Sched<[sched.Folded]>;		EVEX, Sched<[sched.Folded]>;

defm rmb : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmb : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _Src.ScalarMemOp:$src), OpcodeStr,		(ins _Src.ScalarMemOp:$src), OpcodeStr,
"${src}"##Broadcast, "${src}"##Broadcast,		"${src}"##Broadcast, "${src}"##Broadcast,
(_.VT (OpNode (_Src.VT		(_.VT (OpNode (_Src.VT
(X86VBroadcast (_Src.ScalarLdFrag addr:$src)))		(X86VBroadcast (_Src.ScalarLdFrag addr:$src)))
))>, EVEX, EVEX_B,		))>, EVEX, EVEX_B,
▲ Show 20 Lines • Show All 690 Lines • ▼ Show 20 Lines	multiclass avx512_cvtph2ps<X86VectorVTInfo _dest, X86VectorVTInfo _src,
X86FoldableSchedWrite sched> {		X86FoldableSchedWrite sched> {
defm rr : AVX512_maskable<0x13, MRMSrcReg, _dest ,(outs _dest.RC:$dst),		defm rr : AVX512_maskable<0x13, MRMSrcReg, _dest ,(outs _dest.RC:$dst),
(ins _src.RC:$src), "vcvtph2ps", "$src", "$src",		(ins _src.RC:$src), "vcvtph2ps", "$src", "$src",
(X86cvtph2ps (_src.VT _src.RC:$src))>,		(X86cvtph2ps (_src.VT _src.RC:$src))>,
T8PD, Sched<[sched]>;		T8PD, Sched<[sched]>;
defm rm : AVX512_maskable<0x13, MRMSrcMem, _dest, (outs _dest.RC:$dst),		defm rm : AVX512_maskable<0x13, MRMSrcMem, _dest, (outs _dest.RC:$dst),
(ins x86memop:$src), "vcvtph2ps", "$src", "$src",		(ins x86memop:$src), "vcvtph2ps", "$src", "$src",
(X86cvtph2ps (_src.VT		(X86cvtph2ps (_src.VT
(bitconvert		(ld_frag addr:$src)))>,
(ld_frag addr:$src))))>,
T8PD, Sched<[sched.Folded]>;		T8PD, Sched<[sched.Folded]>;
}		}

multiclass avx512_cvtph2ps_sae<X86VectorVTInfo _dest, X86VectorVTInfo _src,		multiclass avx512_cvtph2ps_sae<X86VectorVTInfo _dest, X86VectorVTInfo _src,
X86FoldableSchedWrite sched> {		X86FoldableSchedWrite sched> {
defm rrb : AVX512_maskable<0x13, MRMSrcReg, _dest, (outs _dest.RC:$dst),		defm rrb : AVX512_maskable<0x13, MRMSrcReg, _dest, (outs _dest.RC:$dst),
(ins _src.RC:$src), "vcvtph2ps",		(ins _src.RC:$src), "vcvtph2ps",
"{sae}, $src", "$src, {sae}",		"{sae}, $src", "$src, {sae}",
(X86cvtph2psRnd (_src.VT _src.RC:$src),		(X86cvtph2psRnd (_src.VT _src.RC:$src),
(i32 FROUND_NO_EXC))>,		(i32 FROUND_NO_EXC))>,
T8PD, EVEX_B, Sched<[sched]>;		T8PD, EVEX_B, Sched<[sched]>;
}		}

let Predicates = [HasAVX512] in		let Predicates = [HasAVX512] in
defm VCVTPH2PSZ : avx512_cvtph2ps<v16f32_info, v16i16x_info, f256mem, loadv4i64,		defm VCVTPH2PSZ : avx512_cvtph2ps<v16f32_info, v16i16x_info, f256mem, load,
WriteCvtPH2PSZ>,		WriteCvtPH2PSZ>,
avx512_cvtph2ps_sae<v16f32_info, v16i16x_info, WriteCvtPH2PSZ>,		avx512_cvtph2ps_sae<v16f32_info, v16i16x_info, WriteCvtPH2PSZ>,
EVEX, EVEX_V512, EVEX_CD8<32, CD8VH>;		EVEX, EVEX_V512, EVEX_CD8<32, CD8VH>;

let Predicates = [HasVLX] in {		let Predicates = [HasVLX] in {
defm VCVTPH2PSZ256 : avx512_cvtph2ps<v8f32x_info, v8i16x_info, f128mem,		defm VCVTPH2PSZ256 : avx512_cvtph2ps<v8f32x_info, v8i16x_info, f128mem,
loadv2i64, WriteCvtPH2PSY>, EVEX, EVEX_V256,		load, WriteCvtPH2PSY>, EVEX, EVEX_V256,
EVEX_CD8<32, CD8VH>;		EVEX_CD8<32, CD8VH>;
defm VCVTPH2PSZ128 : avx512_cvtph2ps<v4f32x_info, v8i16x_info, f64mem,		defm VCVTPH2PSZ128 : avx512_cvtph2ps<v4f32x_info, v8i16x_info, f64mem,
loadv2i64, WriteCvtPH2PS>, EVEX, EVEX_V128,		load, WriteCvtPH2PS>, EVEX, EVEX_V128,
EVEX_CD8<32, CD8VH>;		EVEX_CD8<32, CD8VH>;

// Pattern match vcvtph2ps of a scalar i64 load.		// Pattern match vcvtph2ps of a scalar i64 load.
def : Pat<(v4f32 (X86cvtph2ps (v8i16 (vzmovl_v2i64 addr:$src)))),		def : Pat<(v4f32 (X86cvtph2ps (v8i16 (vzmovl_v2i64 addr:$src)))),
(VCVTPH2PSZ128rm addr:$src)>;		(VCVTPH2PSZ128rm addr:$src)>;
def : Pat<(v4f32 (X86cvtph2ps (v8i16 (vzload_v2i64 addr:$src)))),		def : Pat<(v4f32 (X86cvtph2ps (v8i16 (vzload_v2i64 addr:$src)))),
(VCVTPH2PSZ128rm addr:$src)>;		(VCVTPH2PSZ128rm addr:$src)>;
def : Pat<(v4f32 (X86cvtph2ps (v8i16 (bitconvert		def : Pat<(v4f32 (X86cvtph2ps (v8i16 (bitconvert
▲ Show 20 Lines • Show All 927 Lines • ▼ Show 20 Lines	multiclass AVX512_pmovx_patterns<string OpcPrefix, SDNode ExtOp,
def : Pat<(v8i16 (InVecOp (bc_v16i8 (v2i64 (scalar_to_vector (loadi64 addr:$src)))))),		def : Pat<(v8i16 (InVecOp (bc_v16i8 (v2i64 (scalar_to_vector (loadi64 addr:$src)))))),
(!cast<I>(OpcPrefix#BWZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#BWZ128rm) addr:$src)>;
def : Pat<(v8i16 (InVecOp (bc_v16i8 (v2f64 (scalar_to_vector (loadf64 addr:$src)))))),		def : Pat<(v8i16 (InVecOp (bc_v16i8 (v2f64 (scalar_to_vector (loadf64 addr:$src)))))),
(!cast<I>(OpcPrefix#BWZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#BWZ128rm) addr:$src)>;
def : Pat<(v8i16 (InVecOp (v16i8 (vzmovl_v2i64 addr:$src)))),		def : Pat<(v8i16 (InVecOp (v16i8 (vzmovl_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#BWZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#BWZ128rm) addr:$src)>;
def : Pat<(v8i16 (InVecOp (v16i8 (vzload_v2i64 addr:$src)))),		def : Pat<(v8i16 (InVecOp (v16i8 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#BWZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#BWZ128rm) addr:$src)>;
def : Pat<(v8i16 (InVecOp (bc_v16i8 (loadv2i64 addr:$src)))),		def : Pat<(v8i16 (InVecOp (loadv16i8 addr:$src))),
(!cast<I>(OpcPrefix#BWZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#BWZ128rm) addr:$src)>;
}		}
let Predicates = [HasVLX] in {		let Predicates = [HasVLX] in {
def : Pat<(v4i32 (InVecOp (bc_v16i8 (v4i32 (scalar_to_vector (loadi32 addr:$src)))))),		def : Pat<(v4i32 (InVecOp (bc_v16i8 (v4i32 (scalar_to_vector (loadi32 addr:$src)))))),
(!cast<I>(OpcPrefix#BDZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#BDZ128rm) addr:$src)>;
def : Pat<(v4i32 (InVecOp (v16i8 (vzmovl_v4i32 addr:$src)))),		def : Pat<(v4i32 (InVecOp (v16i8 (vzmovl_v4i32 addr:$src)))),
(!cast<I>(OpcPrefix#BDZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#BDZ128rm) addr:$src)>;
def : Pat<(v4i32 (InVecOp (v16i8 (vzload_v2i64 addr:$src)))),		def : Pat<(v4i32 (InVecOp (v16i8 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#BDZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#BDZ128rm) addr:$src)>;
def : Pat<(v4i32 (InVecOp (bc_v16i8 (loadv2i64 addr:$src)))),		def : Pat<(v4i32 (InVecOp (loadv16i8 addr:$src))),
(!cast<I>(OpcPrefix#BDZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#BDZ128rm) addr:$src)>;

def : Pat<(v2i64 (InVecOp (bc_v16i8 (v4i32 (scalar_to_vector (extloadi32i16 addr:$src)))))),		def : Pat<(v2i64 (InVecOp (bc_v16i8 (v4i32 (scalar_to_vector (extloadi32i16 addr:$src)))))),
(!cast<I>(OpcPrefix#BQZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#BQZ128rm) addr:$src)>;
def : Pat<(v2i64 (InVecOp (v16i8 (vzmovl_v4i32 addr:$src)))),		def : Pat<(v2i64 (InVecOp (v16i8 (vzmovl_v4i32 addr:$src)))),
(!cast<I>(OpcPrefix#BQZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#BQZ128rm) addr:$src)>;
def : Pat<(v2i64 (InVecOp (v16i8 (vzload_v2i64 addr:$src)))),		def : Pat<(v2i64 (InVecOp (v16i8 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#BQZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#BQZ128rm) addr:$src)>;
def : Pat<(v2i64 (InVecOp (bc_v16i8 (loadv2i64 addr:$src)))),		def : Pat<(v2i64 (InVecOp (loadv16i8 addr:$src))),
(!cast<I>(OpcPrefix#BQZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#BQZ128rm) addr:$src)>;

def : Pat<(v4i32 (InVecOp (bc_v8i16 (v2i64 (scalar_to_vector (loadi64 addr:$src)))))),		def : Pat<(v4i32 (InVecOp (bc_v8i16 (v2i64 (scalar_to_vector (loadi64 addr:$src)))))),
(!cast<I>(OpcPrefix#WDZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#WDZ128rm) addr:$src)>;
def : Pat<(v4i32 (InVecOp (bc_v8i16 (v2f64 (scalar_to_vector (loadf64 addr:$src)))))),		def : Pat<(v4i32 (InVecOp (bc_v8i16 (v2f64 (scalar_to_vector (loadf64 addr:$src)))))),
(!cast<I>(OpcPrefix#WDZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#WDZ128rm) addr:$src)>;
def : Pat<(v4i32 (InVecOp (v8i16 (vzmovl_v2i64 addr:$src)))),		def : Pat<(v4i32 (InVecOp (v8i16 (vzmovl_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#WDZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#WDZ128rm) addr:$src)>;
def : Pat<(v4i32 (InVecOp (v8i16 (vzload_v2i64 addr:$src)))),		def : Pat<(v4i32 (InVecOp (v8i16 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#WDZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#WDZ128rm) addr:$src)>;
def : Pat<(v4i32 (InVecOp (bc_v8i16 (loadv2i64 addr:$src)))),		def : Pat<(v4i32 (InVecOp (loadv8i16 addr:$src))),
(!cast<I>(OpcPrefix#WDZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#WDZ128rm) addr:$src)>;

def : Pat<(v2i64 (InVecOp (bc_v8i16 (v4i32 (scalar_to_vector (loadi32 addr:$src)))))),		def : Pat<(v2i64 (InVecOp (bc_v8i16 (v4i32 (scalar_to_vector (loadi32 addr:$src)))))),
(!cast<I>(OpcPrefix#WQZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#WQZ128rm) addr:$src)>;
def : Pat<(v2i64 (InVecOp (v8i16 (vzmovl_v4i32 addr:$src)))),		def : Pat<(v2i64 (InVecOp (v8i16 (vzmovl_v4i32 addr:$src)))),
(!cast<I>(OpcPrefix#WQZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#WQZ128rm) addr:$src)>;
def : Pat<(v2i64 (InVecOp (v8i16 (vzload_v2i64 addr:$src)))),		def : Pat<(v2i64 (InVecOp (v8i16 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#WQZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#WQZ128rm) addr:$src)>;
def : Pat<(v2i64 (InVecOp (bc_v8i16 (loadv2i64 addr:$src)))),		def : Pat<(v2i64 (InVecOp (loadv8i16 addr:$src))),
(!cast<I>(OpcPrefix#WQZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#WQZ128rm) addr:$src)>;

def : Pat<(v2i64 (InVecOp (bc_v4i32 (v2i64 (scalar_to_vector (loadi64 addr:$src)))))),		def : Pat<(v2i64 (InVecOp (bc_v4i32 (v2i64 (scalar_to_vector (loadi64 addr:$src)))))),
(!cast<I>(OpcPrefix#DQZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#DQZ128rm) addr:$src)>;
def : Pat<(v2i64 (InVecOp (bc_v4i32 (v2f64 (scalar_to_vector (loadf64 addr:$src)))))),		def : Pat<(v2i64 (InVecOp (bc_v4i32 (v2f64 (scalar_to_vector (loadf64 addr:$src)))))),
(!cast<I>(OpcPrefix#DQZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#DQZ128rm) addr:$src)>;
def : Pat<(v2i64 (InVecOp (v4i32 (vzmovl_v2i64 addr:$src)))),		def : Pat<(v2i64 (InVecOp (v4i32 (vzmovl_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#DQZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#DQZ128rm) addr:$src)>;
def : Pat<(v2i64 (InVecOp (v4i32 (vzload_v2i64 addr:$src)))),		def : Pat<(v2i64 (InVecOp (v4i32 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#DQZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#DQZ128rm) addr:$src)>;
def : Pat<(v2i64 (InVecOp (bc_v4i32 (loadv2i64 addr:$src)))),		def : Pat<(v2i64 (InVecOp (loadv4i32 addr:$src))),
(!cast<I>(OpcPrefix#DQZ128rm) addr:$src)>;		(!cast<I>(OpcPrefix#DQZ128rm) addr:$src)>;
}		}
// 256-bit patterns		// 256-bit patterns
let Predicates = [HasVLX, HasBWI] in {		let Predicates = [HasVLX, HasBWI] in {
def : Pat<(v16i16 (ExtOp (bc_v16i8 (loadv2i64 addr:$src)))),		def : Pat<(v16i16 (ExtOp (loadv16i8 addr:$src))),
(!cast<I>(OpcPrefix#BWZ256rm) addr:$src)>;		(!cast<I>(OpcPrefix#BWZ256rm) addr:$src)>;
def : Pat<(v16i16 (ExtOp (v16i8 (vzmovl_v2i64 addr:$src)))),		def : Pat<(v16i16 (ExtOp (v16i8 (vzmovl_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#BWZ256rm) addr:$src)>;		(!cast<I>(OpcPrefix#BWZ256rm) addr:$src)>;
def : Pat<(v16i16 (ExtOp (v16i8 (vzload_v2i64 addr:$src)))),		def : Pat<(v16i16 (ExtOp (v16i8 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#BWZ256rm) addr:$src)>;		(!cast<I>(OpcPrefix#BWZ256rm) addr:$src)>;
}		}
let Predicates = [HasVLX] in {		let Predicates = [HasVLX] in {
def : Pat<(v8i32 (ExtOp (bc_v16i8 (v2i64 (scalar_to_vector (loadi64 addr:$src)))))),		def : Pat<(v8i32 (ExtOp (bc_v16i8 (v2i64 (scalar_to_vector (loadi64 addr:$src)))))),
(!cast<I>(OpcPrefix#BDZ256rm) addr:$src)>;		(!cast<I>(OpcPrefix#BDZ256rm) addr:$src)>;
def : Pat<(v8i32 (ExtOp (v16i8 (vzmovl_v2i64 addr:$src)))),		def : Pat<(v8i32 (ExtOp (v16i8 (vzmovl_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#BDZ256rm) addr:$src)>;		(!cast<I>(OpcPrefix#BDZ256rm) addr:$src)>;
def : Pat<(v8i32 (ExtOp (v16i8 (vzload_v2i64 addr:$src)))),		def : Pat<(v8i32 (ExtOp (v16i8 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#BDZ256rm) addr:$src)>;		(!cast<I>(OpcPrefix#BDZ256rm) addr:$src)>;
def : Pat<(v8i32 (ExtOp (bc_v16i8 (loadv2i64 addr:$src)))),		def : Pat<(v8i32 (ExtOp (loadv16i8 addr:$src))),
(!cast<I>(OpcPrefix#BDZ256rm) addr:$src)>;		(!cast<I>(OpcPrefix#BDZ256rm) addr:$src)>;

def : Pat<(v4i64 (ExtOp (bc_v16i8 (v4i32 (scalar_to_vector (loadi32 addr:$src)))))),		def : Pat<(v4i64 (ExtOp (bc_v16i8 (v4i32 (scalar_to_vector (loadi32 addr:$src)))))),
(!cast<I>(OpcPrefix#BQZ256rm) addr:$src)>;		(!cast<I>(OpcPrefix#BQZ256rm) addr:$src)>;
def : Pat<(v4i64 (ExtOp (v16i8 (vzmovl_v4i32 addr:$src)))),		def : Pat<(v4i64 (ExtOp (v16i8 (vzmovl_v4i32 addr:$src)))),
(!cast<I>(OpcPrefix#BQZ256rm) addr:$src)>;		(!cast<I>(OpcPrefix#BQZ256rm) addr:$src)>;
def : Pat<(v4i64 (ExtOp (v16i8 (vzload_v2i64 addr:$src)))),		def : Pat<(v4i64 (ExtOp (v16i8 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#BQZ256rm) addr:$src)>;		(!cast<I>(OpcPrefix#BQZ256rm) addr:$src)>;
def : Pat<(v4i64 (ExtOp (bc_v16i8 (loadv2i64 addr:$src)))),		def : Pat<(v4i64 (ExtOp (loadv16i8 addr:$src))),
(!cast<I>(OpcPrefix#BQZ256rm) addr:$src)>;		(!cast<I>(OpcPrefix#BQZ256rm) addr:$src)>;

def : Pat<(v8i32 (ExtOp (bc_v8i16 (loadv2i64 addr:$src)))),		def : Pat<(v8i32 (ExtOp (loadv8i16 addr:$src))),
(!cast<I>(OpcPrefix#WDZ256rm) addr:$src)>;		(!cast<I>(OpcPrefix#WDZ256rm) addr:$src)>;
def : Pat<(v8i32 (ExtOp (v8i16 (vzmovl_v2i64 addr:$src)))),		def : Pat<(v8i32 (ExtOp (v8i16 (vzmovl_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#WDZ256rm) addr:$src)>;		(!cast<I>(OpcPrefix#WDZ256rm) addr:$src)>;
def : Pat<(v8i32 (ExtOp (v8i16 (vzload_v2i64 addr:$src)))),		def : Pat<(v8i32 (ExtOp (v8i16 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#WDZ256rm) addr:$src)>;		(!cast<I>(OpcPrefix#WDZ256rm) addr:$src)>;

def : Pat<(v4i64 (ExtOp (bc_v8i16 (v2i64 (scalar_to_vector (loadi64 addr:$src)))))),		def : Pat<(v4i64 (ExtOp (bc_v8i16 (v2i64 (scalar_to_vector (loadi64 addr:$src)))))),
(!cast<I>(OpcPrefix#WQZ256rm) addr:$src)>;		(!cast<I>(OpcPrefix#WQZ256rm) addr:$src)>;
def : Pat<(v4i64 (ExtOp (v8i16 (vzmovl_v2i64 addr:$src)))),		def : Pat<(v4i64 (ExtOp (v8i16 (vzmovl_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#WQZ256rm) addr:$src)>;		(!cast<I>(OpcPrefix#WQZ256rm) addr:$src)>;
def : Pat<(v4i64 (ExtOp (v8i16 (vzload_v2i64 addr:$src)))),		def : Pat<(v4i64 (ExtOp (v8i16 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#WQZ256rm) addr:$src)>;		(!cast<I>(OpcPrefix#WQZ256rm) addr:$src)>;
def : Pat<(v4i64 (ExtOp (bc_v8i16 (loadv2i64 addr:$src)))),		def : Pat<(v4i64 (ExtOp (loadv8i16 addr:$src))),
(!cast<I>(OpcPrefix#WQZ256rm) addr:$src)>;		(!cast<I>(OpcPrefix#WQZ256rm) addr:$src)>;

def : Pat<(v4i64 (ExtOp (bc_v4i32 (loadv2i64 addr:$src)))),		def : Pat<(v4i64 (ExtOp (loadv4i32 addr:$src))),
(!cast<I>(OpcPrefix#DQZ256rm) addr:$src)>;		(!cast<I>(OpcPrefix#DQZ256rm) addr:$src)>;
def : Pat<(v4i64 (ExtOp (v4i32 (vzmovl_v2i64 addr:$src)))),		def : Pat<(v4i64 (ExtOp (v4i32 (vzmovl_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#DQZ256rm) addr:$src)>;		(!cast<I>(OpcPrefix#DQZ256rm) addr:$src)>;
def : Pat<(v4i64 (ExtOp (v4i32 (vzload_v2i64 addr:$src)))),		def : Pat<(v4i64 (ExtOp (v4i32 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#DQZ256rm) addr:$src)>;		(!cast<I>(OpcPrefix#DQZ256rm) addr:$src)>;
}		}
// 512-bit patterns		// 512-bit patterns
let Predicates = [HasBWI] in {		let Predicates = [HasBWI] in {
def : Pat<(v32i16 (ExtOp (bc_v32i8 (loadv4i64 addr:$src)))),		def : Pat<(v32i16 (ExtOp (loadv32i8 addr:$src))),
(!cast<I>(OpcPrefix#BWZrm) addr:$src)>;		(!cast<I>(OpcPrefix#BWZrm) addr:$src)>;
}		}
let Predicates = [HasAVX512] in {		let Predicates = [HasAVX512] in {
def : Pat<(v16i32 (ExtOp (bc_v16i8 (loadv2i64 addr:$src)))),		def : Pat<(v16i32 (ExtOp (loadv16i8 addr:$src))),
(!cast<I>(OpcPrefix#BDZrm) addr:$src)>;		(!cast<I>(OpcPrefix#BDZrm) addr:$src)>;

def : Pat<(v8i64 (ExtOp (bc_v16i8 (v2i64 (scalar_to_vector (loadi64 addr:$src)))))),		def : Pat<(v8i64 (ExtOp (bc_v16i8 (v2i64 (scalar_to_vector (loadi64 addr:$src)))))),
(!cast<I>(OpcPrefix#BQZrm) addr:$src)>;		(!cast<I>(OpcPrefix#BQZrm) addr:$src)>;
def : Pat<(v8i64 (ExtOp (bc_v16i8 (loadv2i64 addr:$src)))),		def : Pat<(v8i64 (ExtOp (loadv16i8 addr:$src))),
(!cast<I>(OpcPrefix#BQZrm) addr:$src)>;		(!cast<I>(OpcPrefix#BQZrm) addr:$src)>;

def : Pat<(v16i32 (ExtOp (bc_v16i16 (loadv4i64 addr:$src)))),		def : Pat<(v16i32 (ExtOp (loadv16i16 addr:$src))),
(!cast<I>(OpcPrefix#WDZrm) addr:$src)>;		(!cast<I>(OpcPrefix#WDZrm) addr:$src)>;

def : Pat<(v8i64 (ExtOp (bc_v8i16 (loadv2i64 addr:$src)))),		def : Pat<(v8i64 (ExtOp (loadv8i16 addr:$src))),
(!cast<I>(OpcPrefix#WQZrm) addr:$src)>;		(!cast<I>(OpcPrefix#WQZrm) addr:$src)>;

def : Pat<(v8i64 (ExtOp (bc_v8i32 (loadv4i64 addr:$src)))),		def : Pat<(v8i64 (ExtOp (loadv8i32 addr:$src))),
(!cast<I>(OpcPrefix#DQZrm) addr:$src)>;		(!cast<I>(OpcPrefix#DQZrm) addr:$src)>;
}		}
}		}

defm : AVX512_pmovx_patterns<"VPMOVSX", X86vsext, sext_invec>;		defm : AVX512_pmovx_patterns<"VPMOVSX", X86vsext, sext_invec>;
defm : AVX512_pmovx_patterns<"VPMOVZX", X86vzext, zext_invec>;		defm : AVX512_pmovx_patterns<"VPMOVZX", X86vzext, zext_invec>;

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
▲ Show 20 Lines • Show All 888 Lines • ▼ Show 20 Lines	defm rri : AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),
(i8 imm:$src3)))))>,		(i8 imm:$src3)))))>,
Sched<[sched]>, EVEX2VEXOverride<EVEX2VEXOvrd#"rr">;		Sched<[sched]>, EVEX2VEXOverride<EVEX2VEXOvrd#"rr">;
defm rmi : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmi : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.MemOp:$src2, u8imm:$src3),		(ins _.RC:$src1, _.MemOp:$src2, u8imm:$src3),
OpcodeStr, "$src3, $src2, $src1", "$src1, $src2, $src3",		OpcodeStr, "$src3, $src2, $src1", "$src1, $src2, $src3",
(_.VT		(_.VT
(bitconvert		(bitconvert
(CastInfo.VT (X86Shuf128 _.RC:$src1,		(CastInfo.VT (X86Shuf128 _.RC:$src1,
(bitconvert (_.LdFrag addr:$src2)),		(CastInfo.LdFrag addr:$src2),
(i8 imm:$src3)))))>,		(i8 imm:$src3)))))>,
Sched<[sched.Folded, sched.ReadAfterFold]>,		Sched<[sched.Folded, sched.ReadAfterFold]>,
EVEX2VEXOverride<EVEX2VEXOvrd#"rm">;		EVEX2VEXOverride<EVEX2VEXOvrd#"rm">;
defm rmbi : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmbi : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.ScalarMemOp:$src2, u8imm:$src3),		(ins _.RC:$src1, _.ScalarMemOp:$src2, u8imm:$src3),
OpcodeStr, "$src3, ${src2}"##_.BroadcastStr##", $src1",		OpcodeStr, "$src3, ${src2}"##_.BroadcastStr##", $src1",
"$src1, ${src2}"##_.BroadcastStr##", $src3",		"$src1, ${src2}"##_.BroadcastStr##", $src3",
(_.VT		(_.VT
▲ Show 20 Lines • Show All 149 Lines • ▼ Show 20 Lines	def : Pat<(To.VT (vselect To.KRCWM:$mask,
To.ImmAllZerosV)),		To.ImmAllZerosV)),
(!cast<Instruction>(OpcodeStr#"rrikz") To.KRCWM:$mask,		(!cast<Instruction>(OpcodeStr#"rrikz") To.KRCWM:$mask,
To.RC:$src1, To.RC:$src2,		To.RC:$src1, To.RC:$src2,
(ImmXForm imm:$src3))>;		(ImmXForm imm:$src3))>;

def : Pat<(To.VT (vselect To.KRCWM:$mask,		def : Pat<(To.VT (vselect To.KRCWM:$mask,
(bitconvert		(bitconvert
(From.VT (OpNode From.RC:$src1,		(From.VT (OpNode From.RC:$src1,
(bitconvert (To.LdFrag addr:$src2)),		(From.LdFrag addr:$src2),
imm:$src3))),		imm:$src3))),
To.RC:$src0)),		To.RC:$src0)),
(!cast<Instruction>(OpcodeStr#"rmik") To.RC:$src0, To.KRCWM:$mask,		(!cast<Instruction>(OpcodeStr#"rmik") To.RC:$src0, To.KRCWM:$mask,
To.RC:$src1, addr:$src2,		To.RC:$src1, addr:$src2,
(ImmXForm imm:$src3))>;		(ImmXForm imm:$src3))>;

def : Pat<(To.VT (vselect To.KRCWM:$mask,		def : Pat<(To.VT (vselect To.KRCWM:$mask,
(bitconvert		(bitconvert
(From.VT (OpNode From.RC:$src1,		(From.VT (OpNode From.RC:$src1,
(bitconvert (To.LdFrag addr:$src2)),		(From.LdFrag addr:$src2),
imm:$src3))),		imm:$src3))),
To.ImmAllZerosV)),		To.ImmAllZerosV)),
(!cast<Instruction>(OpcodeStr#"rmikz") To.KRCWM:$mask,		(!cast<Instruction>(OpcodeStr#"rmikz") To.KRCWM:$mask,
To.RC:$src1, addr:$src2,		To.RC:$src1, addr:$src2,
(ImmXForm imm:$src3))>;		(ImmXForm imm:$src3))>;
}		}

multiclass avx512_vpalign_mask_lowering_mb<string OpcodeStr, SDNode OpNode,		multiclass avx512_vpalign_mask_lowering_mb<string OpcodeStr, SDNode OpNode,
▲ Show 20 Lines • Show All 1,127 Lines • ▼ Show 20 Lines	defm r: AVX512_maskable_3src<Op, MRMSrcReg, VTI, (outs VTI.RC:$dst),
(ins VTI.RC:$src2, VTI.RC:$src3), OpStr,		(ins VTI.RC:$src2, VTI.RC:$src3), OpStr,
"$src3, $src2", "$src2, $src3",		"$src3, $src2", "$src2, $src3",
(VTI.VT (OpNode VTI.RC:$src1, VTI.RC:$src2, VTI.RC:$src3))>,		(VTI.VT (OpNode VTI.RC:$src1, VTI.RC:$src2, VTI.RC:$src3))>,
AVX512FMA3Base, Sched<[sched]>;		AVX512FMA3Base, Sched<[sched]>;
defm m: AVX512_maskable_3src<Op, MRMSrcMem, VTI, (outs VTI.RC:$dst),		defm m: AVX512_maskable_3src<Op, MRMSrcMem, VTI, (outs VTI.RC:$dst),
(ins VTI.RC:$src2, VTI.MemOp:$src3), OpStr,		(ins VTI.RC:$src2, VTI.MemOp:$src3), OpStr,
"$src3, $src2", "$src2, $src3",		"$src3, $src2", "$src2, $src3",
(VTI.VT (OpNode VTI.RC:$src1, VTI.RC:$src2,		(VTI.VT (OpNode VTI.RC:$src1, VTI.RC:$src2,
(VTI.VT (bitconvert (VTI.LdFrag addr:$src3)))))>,		(VTI.VT (VTI.LdFrag addr:$src3))))>,
AVX512FMA3Base,		AVX512FMA3Base,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

multiclass VBMI2_shift_var_rmb<bits<8> Op, string OpStr, SDNode OpNode,		multiclass VBMI2_shift_var_rmb<bits<8> Op, string OpStr, SDNode OpNode,
X86FoldableSchedWrite sched, X86VectorVTInfo VTI>		X86FoldableSchedWrite sched, X86VectorVTInfo VTI>
: VBMI2_shift_var_rm<Op, OpStr, OpNode, sched, VTI> {		: VBMI2_shift_var_rm<Op, OpStr, OpNode, sched, VTI> {
▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines	defm r : AVX512_maskable_3src<Op, MRMSrcReg, VTI, (outs VTI.RC:$dst),
"$src3, $src2", "$src2, $src3",		"$src3, $src2", "$src2, $src3",
(VTI.VT (OpNode VTI.RC:$src1,		(VTI.VT (OpNode VTI.RC:$src1,
VTI.RC:$src2, VTI.RC:$src3))>,		VTI.RC:$src2, VTI.RC:$src3))>,
EVEX_4V, T8PD, Sched<[sched]>;		EVEX_4V, T8PD, Sched<[sched]>;
defm m : AVX512_maskable_3src<Op, MRMSrcMem, VTI, (outs VTI.RC:$dst),		defm m : AVX512_maskable_3src<Op, MRMSrcMem, VTI, (outs VTI.RC:$dst),
(ins VTI.RC:$src2, VTI.MemOp:$src3), OpStr,		(ins VTI.RC:$src2, VTI.MemOp:$src3), OpStr,
"$src3, $src2", "$src2, $src3",		"$src3, $src2", "$src2, $src3",
(VTI.VT (OpNode VTI.RC:$src1, VTI.RC:$src2,		(VTI.VT (OpNode VTI.RC:$src1, VTI.RC:$src2,
(VTI.VT (bitconvert		(VTI.VT (VTI.LdFrag addr:$src3))))>,
(VTI.LdFrag addr:$src3)))))>,
EVEX_4V, EVEX_CD8<32, CD8VF>, T8PD,		EVEX_4V, EVEX_CD8<32, CD8VF>, T8PD,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
defm mb : AVX512_maskable_3src<Op, MRMSrcMem, VTI, (outs VTI.RC:$dst),		defm mb : AVX512_maskable_3src<Op, MRMSrcMem, VTI, (outs VTI.RC:$dst),
(ins VTI.RC:$src2, VTI.ScalarMemOp:$src3),		(ins VTI.RC:$src2, VTI.ScalarMemOp:$src3),
OpStr, "${src3}"##VTI.BroadcastStr##", $src2",		OpStr, "${src3}"##VTI.BroadcastStr##", $src2",
"$src2, ${src3}"##VTI.BroadcastStr,		"$src2, ${src3}"##VTI.BroadcastStr,
(OpNode VTI.RC:$src1, VTI.RC:$src2,		(OpNode VTI.RC:$src1, VTI.RC:$src2,
(VTI.VT (X86VBroadcast		(VTI.VT (X86VBroadcast
Show All 39 Lines	defm rr : AVX512_maskable_cmp<0x8F, MRMSrcReg, VTI, (outs VTI.KRC:$dst),
(X86Vpshufbitqmb (VTI.VT VTI.RC:$src1),		(X86Vpshufbitqmb (VTI.VT VTI.RC:$src1),
(VTI.VT VTI.RC:$src2))>, EVEX_4V, T8PD,		(VTI.VT VTI.RC:$src2))>, EVEX_4V, T8PD,
Sched<[sched]>;		Sched<[sched]>;
defm rm : AVX512_maskable_cmp<0x8F, MRMSrcMem, VTI, (outs VTI.KRC:$dst),		defm rm : AVX512_maskable_cmp<0x8F, MRMSrcMem, VTI, (outs VTI.KRC:$dst),
(ins VTI.RC:$src1, VTI.MemOp:$src2),		(ins VTI.RC:$src1, VTI.MemOp:$src2),
"vpshufbitqmb",		"vpshufbitqmb",
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(X86Vpshufbitqmb (VTI.VT VTI.RC:$src1),		(X86Vpshufbitqmb (VTI.VT VTI.RC:$src1),
(VTI.VT (bitconvert (VTI.LdFrag addr:$src2))))>,		(VTI.VT (VTI.LdFrag addr:$src2)))>,
EVEX_4V, EVEX_CD8<8, CD8VF>, T8PD,		EVEX_4V, EVEX_CD8<8, CD8VF>, T8PD,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass VPSHUFBITQMB_common<X86SchedWriteWidths sched, AVX512VLVectorVTInfo VTI> {		multiclass VPSHUFBITQMB_common<X86SchedWriteWidths sched, AVX512VLVectorVTInfo VTI> {
let Predicates = [HasBITALG] in		let Predicates = [HasBITALG] in
defm Z : VPSHUFBITQMB_rm<sched.ZMM, VTI.info512>, EVEX_V512;		defm Z : VPSHUFBITQMB_rm<sched.ZMM, VTI.info512>, EVEX_V512;
let Predicates = [HasBITALG, HasVLX] in {		let Predicates = [HasBITALG, HasVLX] in {
▲ Show 20 Lines • Show All 115 Lines • Show Last 20 Lines

lib/Target/X86/X86InstrFragmentsSIMD.td

Show First 20 Lines • Show All 642 Lines • ▼ Show 20 Lines	def sdmem : Operand<v2f64> {
let OperandType = "OPERAND_MEMORY";		let OperandType = "OPERAND_MEMORY";
}		}

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// SSE pattern fragments		// SSE pattern fragments
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

// 128-bit load pattern fragments		// 128-bit load pattern fragments
// NOTE: all 128-bit integer vector loads are promoted to v2i64
def loadv4f32 : PatFrag<(ops node:$ptr), (v4f32 (load node:$ptr))>;		def loadv4f32 : PatFrag<(ops node:$ptr), (v4f32 (load node:$ptr))>;
def loadv2f64 : PatFrag<(ops node:$ptr), (v2f64 (load node:$ptr))>;		def loadv2f64 : PatFrag<(ops node:$ptr), (v2f64 (load node:$ptr))>;
def loadv2i64 : PatFrag<(ops node:$ptr), (v2i64 (load node:$ptr))>;		def loadv2i64 : PatFrag<(ops node:$ptr), (v2i64 (load node:$ptr))>;
		def loadv4i32 : PatFrag<(ops node:$ptr), (v4i32 (load node:$ptr))>;
		def loadv8i16 : PatFrag<(ops node:$ptr), (v8i16 (load node:$ptr))>;
		def loadv16i8 : PatFrag<(ops node:$ptr), (v16i8 (load node:$ptr))>;

// 256-bit load pattern fragments		// 256-bit load pattern fragments
// NOTE: all 256-bit integer vector loads are promoted to v4i64
def loadv8f32 : PatFrag<(ops node:$ptr), (v8f32 (load node:$ptr))>;		def loadv8f32 : PatFrag<(ops node:$ptr), (v8f32 (load node:$ptr))>;
def loadv4f64 : PatFrag<(ops node:$ptr), (v4f64 (load node:$ptr))>;		def loadv4f64 : PatFrag<(ops node:$ptr), (v4f64 (load node:$ptr))>;
def loadv4i64 : PatFrag<(ops node:$ptr), (v4i64 (load node:$ptr))>;		def loadv4i64 : PatFrag<(ops node:$ptr), (v4i64 (load node:$ptr))>;
		def loadv8i32 : PatFrag<(ops node:$ptr), (v8i32 (load node:$ptr))>;
		def loadv16i16 : PatFrag<(ops node:$ptr), (v16i16 (load node:$ptr))>;
		def loadv32i8 : PatFrag<(ops node:$ptr), (v32i8 (load node:$ptr))>;

// 512-bit load pattern fragments		// 512-bit load pattern fragments
def loadv16f32 : PatFrag<(ops node:$ptr), (v16f32 (load node:$ptr))>;		def loadv16f32 : PatFrag<(ops node:$ptr), (v16f32 (load node:$ptr))>;
def loadv8f64 : PatFrag<(ops node:$ptr), (v8f64 (load node:$ptr))>;		def loadv8f64 : PatFrag<(ops node:$ptr), (v8f64 (load node:$ptr))>;
def loadv8i64 : PatFrag<(ops node:$ptr), (v8i64 (load node:$ptr))>;		def loadv8i64 : PatFrag<(ops node:$ptr), (v8i64 (load node:$ptr))>;
		def loadv16i32 : PatFrag<(ops node:$ptr), (v16i32 (load node:$ptr))>;
		def loadv32i16 : PatFrag<(ops node:$ptr), (v32i16 (load node:$ptr))>;
		def loadv64i8 : PatFrag<(ops node:$ptr), (v64i8 (load node:$ptr))>;

// 128-/256-/512-bit extload pattern fragments		// 128-/256-/512-bit extload pattern fragments
def extloadv2f32 : PatFrag<(ops node:$ptr), (v2f64 (extloadvf32 node:$ptr))>;		def extloadv2f32 : PatFrag<(ops node:$ptr), (v2f64 (extloadvf32 node:$ptr))>;
def extloadv4f32 : PatFrag<(ops node:$ptr), (v4f64 (extloadvf32 node:$ptr))>;		def extloadv4f32 : PatFrag<(ops node:$ptr), (v4f64 (extloadvf32 node:$ptr))>;
def extloadv8f32 : PatFrag<(ops node:$ptr), (v8f64 (extloadvf32 node:$ptr))>;		def extloadv8f32 : PatFrag<(ops node:$ptr), (v8f64 (extloadvf32 node:$ptr))>;

// Like 'store', but always requires vector size alignment.		// Like 'store', but always requires vector size alignment.
def alignedstore : PatFrag<(ops node:$val, node:$ptr),		def alignedstore : PatFrag<(ops node:$val, node:$ptr),
Show All 11 Lines
// 128-bit aligned load pattern fragments		// 128-bit aligned load pattern fragments
// NOTE: all 128-bit integer vector loads are promoted to v2i64		// NOTE: all 128-bit integer vector loads are promoted to v2i64
def alignedloadv4f32 : PatFrag<(ops node:$ptr),		def alignedloadv4f32 : PatFrag<(ops node:$ptr),
(v4f32 (alignedload node:$ptr))>;		(v4f32 (alignedload node:$ptr))>;
def alignedloadv2f64 : PatFrag<(ops node:$ptr),		def alignedloadv2f64 : PatFrag<(ops node:$ptr),
(v2f64 (alignedload node:$ptr))>;		(v2f64 (alignedload node:$ptr))>;
def alignedloadv2i64 : PatFrag<(ops node:$ptr),		def alignedloadv2i64 : PatFrag<(ops node:$ptr),
(v2i64 (alignedload node:$ptr))>;		(v2i64 (alignedload node:$ptr))>;
		def alignedloadv4i32 : PatFrag<(ops node:$ptr),
		(v4i32 (alignedload node:$ptr))>;
		def alignedloadv8i16 : PatFrag<(ops node:$ptr),
		(v8i16 (alignedload node:$ptr))>;
		def alignedloadv16i8 : PatFrag<(ops node:$ptr),
		(v16i8 (alignedload node:$ptr))>;

// 256-bit aligned load pattern fragments		// 256-bit aligned load pattern fragments
// NOTE: all 256-bit integer vector loads are promoted to v4i64		// NOTE: all 256-bit integer vector loads are promoted to v4i64
def alignedloadv8f32 : PatFrag<(ops node:$ptr),		def alignedloadv8f32 : PatFrag<(ops node:$ptr),
(v8f32 (alignedload node:$ptr))>;		(v8f32 (alignedload node:$ptr))>;
def alignedloadv4f64 : PatFrag<(ops node:$ptr),		def alignedloadv4f64 : PatFrag<(ops node:$ptr),
(v4f64 (alignedload node:$ptr))>;		(v4f64 (alignedload node:$ptr))>;
def alignedloadv4i64 : PatFrag<(ops node:$ptr),		def alignedloadv4i64 : PatFrag<(ops node:$ptr),
(v4i64 (alignedload node:$ptr))>;		(v4i64 (alignedload node:$ptr))>;
		def alignedloadv8i32 : PatFrag<(ops node:$ptr),
		(v8i32 (alignedload node:$ptr))>;
		def alignedloadv16i16 : PatFrag<(ops node:$ptr),
		(v16i16 (alignedload node:$ptr))>;
		def alignedloadv32i8 : PatFrag<(ops node:$ptr),
		(v32i8 (alignedload node:$ptr))>;

// 512-bit aligned load pattern fragments		// 512-bit aligned load pattern fragments
def alignedloadv16f32 : PatFrag<(ops node:$ptr),		def alignedloadv16f32 : PatFrag<(ops node:$ptr),
(v16f32 (alignedload node:$ptr))>;		(v16f32 (alignedload node:$ptr))>;
def alignedloadv8f64 : PatFrag<(ops node:$ptr),		def alignedloadv8f64 : PatFrag<(ops node:$ptr),
(v8f64 (alignedload node:$ptr))>;		(v8f64 (alignedload node:$ptr))>;
def alignedloadv8i64 : PatFrag<(ops node:$ptr),		def alignedloadv8i64 : PatFrag<(ops node:$ptr),
(v8i64 (alignedload node:$ptr))>;		(v8i64 (alignedload node:$ptr))>;
		def alignedloadv16i32 : PatFrag<(ops node:$ptr),
		(v16i32 (alignedload node:$ptr))>;
		def alignedloadv32i16 : PatFrag<(ops node:$ptr),
		(v32i16 (alignedload node:$ptr))>;
		def alignedloadv64i8 : PatFrag<(ops node:$ptr),
		(v64i8 (alignedload node:$ptr))>;

// Like 'load', but uses special alignment checks suitable for use in		// Like 'load', but uses special alignment checks suitable for use in
// memory operands in most SSE instructions, which are required to		// memory operands in most SSE instructions, which are required to
// be naturally aligned on some targets but not on others. If the subtarget		// be naturally aligned on some targets but not on others. If the subtarget
// allows unaligned accesses, match any load, though this may require		// allows unaligned accesses, match any load, though this may require
// setting a feature bit in the processor (on startup, for example).		// setting a feature bit in the processor (on startup, for example).
// Opteron 10h and later implement such a feature.		// Opteron 10h and later implement such a feature.
def memop : PatFrag<(ops node:$ptr), (load node:$ptr), [{		def memop : PatFrag<(ops node:$ptr), (load node:$ptr), [{
auto *Ld = cast<LoadSDNode>(N);		auto *Ld = cast<LoadSDNode>(N);
return Subtarget->hasSSEUnalignedMem() \|\|		return Subtarget->hasSSEUnalignedMem() \|\|
Ld->getAlignment() >= Ld->getMemoryVT().getStoreSize();		Ld->getAlignment() >= Ld->getMemoryVT().getStoreSize();
}]>;		}]>;

// 128-bit memop pattern fragments		// 128-bit memop pattern fragments
// NOTE: all 128-bit integer vector loads are promoted to v2i64		// NOTE: all 128-bit integer vector loads are promoted to v2i64
def memopv4f32 : PatFrag<(ops node:$ptr), (v4f32 (memop node:$ptr))>;		def memopv4f32 : PatFrag<(ops node:$ptr), (v4f32 (memop node:$ptr))>;
def memopv2f64 : PatFrag<(ops node:$ptr), (v2f64 (memop node:$ptr))>;		def memopv2f64 : PatFrag<(ops node:$ptr), (v2f64 (memop node:$ptr))>;
def memopv2i64 : PatFrag<(ops node:$ptr), (v2i64 (memop node:$ptr))>;		def memopv2i64 : PatFrag<(ops node:$ptr), (v2i64 (memop node:$ptr))>;
		def memopv4i32 : PatFrag<(ops node:$ptr), (v4i32 (memop node:$ptr))>;
		def memopv8i16 : PatFrag<(ops node:$ptr), (v8i16 (memop node:$ptr))>;
		def memopv16i8 : PatFrag<(ops node:$ptr), (v16i8 (memop node:$ptr))>;

def X86masked_gather : SDNode<"X86ISD::MGATHER",		def X86masked_gather : SDNode<"X86ISD::MGATHER",
SDTypeProfile<2, 3, [SDTCisVec<0>,		SDTypeProfile<2, 3, [SDTCisVec<0>,
SDTCisVec<1>, SDTCisInt<1>,		SDTCisVec<1>, SDTCisInt<1>,
SDTCisSameAs<0, 2>,		SDTCisSameAs<0, 2>,
SDTCisSameAs<1, 3>,		SDTCisSameAs<1, 3>,
SDTCisPtrTy<4>]>,		SDTCisPtrTy<4>]>,
[SDNPHasChain, SDNPMayLoad, SDNPMemOperand]>;		[SDNPHasChain, SDNPMayLoad, SDNPMemOperand]>;
▲ Show 20 Lines • Show All 339 Lines • Show Last 20 Lines

lib/Target/X86/X86InstrSSE.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 583 Lines • ▼ Show 20 Lines	def : InstAlias<"movupd.s\t{$src, $dst\|$dst, $src}",
(MOVUPDrr_REV VR128:$dst, VR128:$src), 0>;		(MOVUPDrr_REV VR128:$dst, VR128:$src), 0>;

let Predicates = [HasAVX, NoVLX] in {		let Predicates = [HasAVX, NoVLX] in {
// 256-bit load/store need to use floating point load/store in case we don't		// 256-bit load/store need to use floating point load/store in case we don't
// have AVX2. Execution domain fixing will convert to integer if AVX2 is		// have AVX2. Execution domain fixing will convert to integer if AVX2 is
// available and changing the domain is beneficial.		// available and changing the domain is beneficial.
def : Pat<(alignedloadv4i64 addr:$src),		def : Pat<(alignedloadv4i64 addr:$src),
(VMOVAPSYrm addr:$src)>;		(VMOVAPSYrm addr:$src)>;
		def : Pat<(alignedloadv8i32 addr:$src),
		(VMOVAPSYrm addr:$src)>;
		def : Pat<(alignedloadv16i16 addr:$src),
		(VMOVAPSYrm addr:$src)>;
		def : Pat<(alignedloadv32i8 addr:$src),
		(VMOVAPSYrm addr:$src)>;
def : Pat<(loadv4i64 addr:$src),		def : Pat<(loadv4i64 addr:$src),
(VMOVUPSYrm addr:$src)>;		(VMOVUPSYrm addr:$src)>;
		def : Pat<(loadv8i32 addr:$src),
		(VMOVUPSYrm addr:$src)>;
		def : Pat<(loadv16i16 addr:$src),
		(VMOVUPSYrm addr:$src)>;
		def : Pat<(loadv32i8 addr:$src),
		(VMOVUPSYrm addr:$src)>;

def : Pat<(alignedstore (v4i64 VR256:$src), addr:$dst),		def : Pat<(alignedstore (v4i64 VR256:$src), addr:$dst),
(VMOVAPSYmr addr:$dst, VR256:$src)>;		(VMOVAPSYmr addr:$dst, VR256:$src)>;
def : Pat<(alignedstore (v8i32 VR256:$src), addr:$dst),		def : Pat<(alignedstore (v8i32 VR256:$src), addr:$dst),
(VMOVAPSYmr addr:$dst, VR256:$src)>;		(VMOVAPSYmr addr:$dst, VR256:$src)>;
def : Pat<(alignedstore (v16i16 VR256:$src), addr:$dst),		def : Pat<(alignedstore (v16i16 VR256:$src), addr:$dst),
(VMOVAPSYmr addr:$dst, VR256:$src)>;		(VMOVAPSYmr addr:$dst, VR256:$src)>;
def : Pat<(alignedstore (v32i8 VR256:$src), addr:$dst),		def : Pat<(alignedstore (v32i8 VR256:$src), addr:$dst),
(VMOVAPSYmr addr:$dst, VR256:$src)>;		(VMOVAPSYmr addr:$dst, VR256:$src)>;
def : Pat<(store (v4i64 VR256:$src), addr:$dst),		def : Pat<(store (v4i64 VR256:$src), addr:$dst),
(VMOVUPSYmr addr:$dst, VR256:$src)>;		(VMOVUPSYmr addr:$dst, VR256:$src)>;
def : Pat<(store (v8i32 VR256:$src), addr:$dst),		def : Pat<(store (v8i32 VR256:$src), addr:$dst),
(VMOVUPSYmr addr:$dst, VR256:$src)>;		(VMOVUPSYmr addr:$dst, VR256:$src)>;
def : Pat<(store (v16i16 VR256:$src), addr:$dst),		def : Pat<(store (v16i16 VR256:$src), addr:$dst),
(VMOVUPSYmr addr:$dst, VR256:$src)>;		(VMOVUPSYmr addr:$dst, VR256:$src)>;
def : Pat<(store (v32i8 VR256:$src), addr:$dst),		def : Pat<(store (v32i8 VR256:$src), addr:$dst),
(VMOVUPSYmr addr:$dst, VR256:$src)>;		(VMOVUPSYmr addr:$dst, VR256:$src)>;
}		}

// Use movaps / movups for SSE integer load / store (one byte shorter).		// Use movaps / movups for SSE integer load / store (one byte shorter).
// The instructions selected below are then converted to MOVDQA/MOVDQU		// The instructions selected below are then converted to MOVDQA/MOVDQU
// during the SSE domain pass.		// during the SSE domain pass.
let Predicates = [UseSSE1] in {		let Predicates = [UseSSE1] in {
def : Pat<(alignedloadv2i64 addr:$src),		def : Pat<(alignedloadv2i64 addr:$src),
(MOVAPSrm addr:$src)>;		(MOVAPSrm addr:$src)>;
		def : Pat<(alignedloadv4i32 addr:$src),
		(MOVAPSrm addr:$src)>;
		def : Pat<(alignedloadv8i16 addr:$src),
		(MOVAPSrm addr:$src)>;
		def : Pat<(alignedloadv16i8 addr:$src),
		(MOVAPSrm addr:$src)>;
def : Pat<(loadv2i64 addr:$src),		def : Pat<(loadv2i64 addr:$src),
(MOVUPSrm addr:$src)>;		(MOVUPSrm addr:$src)>;
		def : Pat<(loadv4i32 addr:$src),
		(MOVUPSrm addr:$src)>;
		def : Pat<(loadv8i16 addr:$src),
		(MOVUPSrm addr:$src)>;
		def : Pat<(loadv16i8 addr:$src),
		(MOVUPSrm addr:$src)>;

def : Pat<(alignedstore (v2i64 VR128:$src), addr:$dst),		def : Pat<(alignedstore (v2i64 VR128:$src), addr:$dst),
(MOVAPSmr addr:$dst, VR128:$src)>;		(MOVAPSmr addr:$dst, VR128:$src)>;
def : Pat<(alignedstore (v4i32 VR128:$src), addr:$dst),		def : Pat<(alignedstore (v4i32 VR128:$src), addr:$dst),
(MOVAPSmr addr:$dst, VR128:$src)>;		(MOVAPSmr addr:$dst, VR128:$src)>;
def : Pat<(alignedstore (v8i16 VR128:$src), addr:$dst),		def : Pat<(alignedstore (v8i16 VR128:$src), addr:$dst),
(MOVAPSmr addr:$dst, VR128:$src)>;		(MOVAPSmr addr:$dst, VR128:$src)>;
def : Pat<(alignedstore (v16i8 VR128:$src), addr:$dst),		def : Pat<(alignedstore (v16i8 VR128:$src), addr:$dst),
▲ Show 20 Lines • Show All 208 Lines • ▼ Show 20 Lines	multiclass sse12_cvt_p<bits<8> opc, RegisterClass RC, X86MemOperand x86memop,
string asm, Domain d, X86FoldableSchedWrite sched> {		string asm, Domain d, X86FoldableSchedWrite sched> {
let hasSideEffects = 0 in {		let hasSideEffects = 0 in {
def rr : I<opc, MRMSrcReg, (outs RC:$dst), (ins RC:$src), asm,		def rr : I<opc, MRMSrcReg, (outs RC:$dst), (ins RC:$src), asm,
[(set RC:$dst, (DstTy (sint_to_fp (SrcTy RC:$src))))], d>,		[(set RC:$dst, (DstTy (sint_to_fp (SrcTy RC:$src))))], d>,
Sched<[sched]>;		Sched<[sched]>;
let mayLoad = 1 in		let mayLoad = 1 in
def rm : I<opc, MRMSrcMem, (outs RC:$dst), (ins x86memop:$src), asm,		def rm : I<opc, MRMSrcMem, (outs RC:$dst), (ins x86memop:$src), asm,
[(set RC:$dst, (DstTy (sint_to_fp		[(set RC:$dst, (DstTy (sint_to_fp
(SrcTy (bitconvert (ld_frag addr:$src))))))], d>,		(SrcTy (ld_frag addr:$src)))))], d>,
Sched<[sched.Folded]>;		Sched<[sched.Folded]>;
}		}
}		}

multiclass sse12_vcvt_avx<bits<8> opc, RegisterClass SrcRC, RegisterClass DstRC,		multiclass sse12_vcvt_avx<bits<8> opc, RegisterClass SrcRC, RegisterClass DstRC,
X86MemOperand x86memop, string asm,		X86MemOperand x86memop, string asm,
X86FoldableSchedWrite sched> {		X86FoldableSchedWrite sched> {
let hasSideEffects = 0, Predicates = [UseAVX] in {		let hasSideEffects = 0, Predicates = [UseAVX] in {
▲ Show 20 Lines • Show All 246 Lines • ▼ Show 20 Lines
}		}
defm CVTSS2SI : sse12_cvt_sint<0x2D, VR128, GR32, i32, v4f32, X86cvts2si,		defm CVTSS2SI : sse12_cvt_sint<0x2D, VR128, GR32, i32, v4f32, X86cvts2si,
ssmem, sse_load_f32, "cvtss2si",		ssmem, sse_load_f32, "cvtss2si",
WriteCvtSS2I>, XS;		WriteCvtSS2I>, XS;
defm CVTSS2SI64 : sse12_cvt_sint<0x2D, VR128, GR64, i64, v4f32, X86cvts2si,		defm CVTSS2SI64 : sse12_cvt_sint<0x2D, VR128, GR64, i64, v4f32, X86cvts2si,
ssmem, sse_load_f32, "cvtss2si",		ssmem, sse_load_f32, "cvtss2si",
WriteCvtSS2I>, XS, REX_W;		WriteCvtSS2I>, XS, REX_W;

defm VCVTDQ2PS : sse12_cvt_p<0x5B, VR128, i128mem, v4f32, v4i32, loadv2i64,		defm VCVTDQ2PS : sse12_cvt_p<0x5B, VR128, i128mem, v4f32, v4i32, load,
"vcvtdq2ps\t{$src, $dst\|$dst, $src}",		"vcvtdq2ps\t{$src, $dst\|$dst, $src}",
SSEPackedSingle, WriteCvtI2PS>,		SSEPackedSingle, WriteCvtI2PS>,
PS, VEX, Requires<[HasAVX, NoVLX]>, VEX_WIG;		PS, VEX, Requires<[HasAVX, NoVLX]>, VEX_WIG;
defm VCVTDQ2PSY : sse12_cvt_p<0x5B, VR256, i256mem, v8f32, v8i32, loadv4i64,		defm VCVTDQ2PSY : sse12_cvt_p<0x5B, VR256, i256mem, v8f32, v8i32, load,
"vcvtdq2ps\t{$src, $dst\|$dst, $src}",		"vcvtdq2ps\t{$src, $dst\|$dst, $src}",
SSEPackedSingle, WriteCvtI2PSY>,		SSEPackedSingle, WriteCvtI2PSY>,
PS, VEX, VEX_L, Requires<[HasAVX, NoVLX]>, VEX_WIG;		PS, VEX, VEX_L, Requires<[HasAVX, NoVLX]>, VEX_WIG;

defm CVTDQ2PS : sse12_cvt_p<0x5B, VR128, i128mem, v4f32, v4i32, memopv2i64,		defm CVTDQ2PS : sse12_cvt_p<0x5B, VR128, i128mem, v4f32, v4i32, memop,
"cvtdq2ps\t{$src, $dst\|$dst, $src}",		"cvtdq2ps\t{$src, $dst\|$dst, $src}",
SSEPackedSingle, WriteCvtI2PS>,		SSEPackedSingle, WriteCvtI2PS>,
PS, Requires<[UseSSE2]>;		PS, Requires<[UseSSE2]>;

let Predicates = [UseAVX] in {		let Predicates = [UseAVX] in {
def : InstAlias<"vcvtss2si{l}\t{$src, $dst\|$dst, $src}",		def : InstAlias<"vcvtss2si{l}\t{$src, $dst\|$dst, $src}",
(VCVTSS2SIrr_Int GR32:$dst, VR128:$src), 0, "att">;		(VCVTSS2SIrr_Int GR32:$dst, VR128:$src), 0, "att">;
def : InstAlias<"vcvtss2si{l}\t{$src, $dst\|$dst, $src}",		def : InstAlias<"vcvtss2si{l}\t{$src, $dst\|$dst, $src}",
▲ Show 20 Lines • Show All 542 Lines • ▼ Show 20 Lines
}		}

// Convert Packed DW Integers to Packed Double FP		// Convert Packed DW Integers to Packed Double FP
let Predicates = [HasAVX, NoVLX] in {		let Predicates = [HasAVX, NoVLX] in {
let hasSideEffects = 0, mayLoad = 1 in		let hasSideEffects = 0, mayLoad = 1 in
def VCVTDQ2PDrm : S2SI<0xE6, MRMSrcMem, (outs VR128:$dst), (ins i64mem:$src),		def VCVTDQ2PDrm : S2SI<0xE6, MRMSrcMem, (outs VR128:$dst), (ins i64mem:$src),
"vcvtdq2pd\t{$src, $dst\|$dst, $src}",		"vcvtdq2pd\t{$src, $dst\|$dst, $src}",
[(set VR128:$dst,		[(set VR128:$dst,
(v2f64 (X86VSintToFP (bc_v4i32 (loadv2i64 addr:$src)))))]>,		(v2f64 (X86VSintToFP (loadv4i32 addr:$src))))]>,
VEX, Sched<[WriteCvtI2PDLd]>, VEX_WIG;		VEX, Sched<[WriteCvtI2PDLd]>, VEX_WIG;
def VCVTDQ2PDrr : S2SI<0xE6, MRMSrcReg, (outs VR128:$dst), (ins VR128:$src),		def VCVTDQ2PDrr : S2SI<0xE6, MRMSrcReg, (outs VR128:$dst), (ins VR128:$src),
"vcvtdq2pd\t{$src, $dst\|$dst, $src}",		"vcvtdq2pd\t{$src, $dst\|$dst, $src}",
[(set VR128:$dst,		[(set VR128:$dst,
(v2f64 (X86VSintToFP (v4i32 VR128:$src))))]>,		(v2f64 (X86VSintToFP (v4i32 VR128:$src))))]>,
VEX, Sched<[WriteCvtI2PD]>, VEX_WIG;		VEX, Sched<[WriteCvtI2PD]>, VEX_WIG;
def VCVTDQ2PDYrm : S2SI<0xE6, MRMSrcMem, (outs VR256:$dst), (ins i128mem:$src),		def VCVTDQ2PDYrm : S2SI<0xE6, MRMSrcMem, (outs VR256:$dst), (ins i128mem:$src),
"vcvtdq2pd\t{$src, $dst\|$dst, $src}",		"vcvtdq2pd\t{$src, $dst\|$dst, $src}",
[(set VR256:$dst,		[(set VR256:$dst,
(v4f64 (sint_to_fp (bc_v4i32 (loadv2i64 addr:$src)))))]>,		(v4f64 (sint_to_fp (loadv4i32 addr:$src))))]>,
VEX, VEX_L, Sched<[WriteCvtI2PDYLd]>,		VEX, VEX_L, Sched<[WriteCvtI2PDYLd]>,
VEX_WIG;		VEX_WIG;
def VCVTDQ2PDYrr : S2SI<0xE6, MRMSrcReg, (outs VR256:$dst), (ins VR128:$src),		def VCVTDQ2PDYrr : S2SI<0xE6, MRMSrcReg, (outs VR256:$dst), (ins VR128:$src),
"vcvtdq2pd\t{$src, $dst\|$dst, $src}",		"vcvtdq2pd\t{$src, $dst\|$dst, $src}",
[(set VR256:$dst,		[(set VR256:$dst,
(v4f64 (sint_to_fp (v4i32 VR128:$src))))]>,		(v4f64 (sint_to_fp (v4i32 VR128:$src))))]>,
VEX, VEX_L, Sched<[WriteCvtI2PDY]>, VEX_WIG;		VEX, VEX_L, Sched<[WriteCvtI2PDY]>, VEX_WIG;
}		}

let hasSideEffects = 0, mayLoad = 1 in		let hasSideEffects = 0, mayLoad = 1 in
def CVTDQ2PDrm : S2SI<0xE6, MRMSrcMem, (outs VR128:$dst), (ins i64mem:$src),		def CVTDQ2PDrm : S2SI<0xE6, MRMSrcMem, (outs VR128:$dst), (ins i64mem:$src),
"cvtdq2pd\t{$src, $dst\|$dst, $src}",		"cvtdq2pd\t{$src, $dst\|$dst, $src}",
[(set VR128:$dst,		[(set VR128:$dst,
(v2f64 (X86VSintToFP (bc_v4i32 (loadv2i64 addr:$src)))))]>,		(v2f64 (X86VSintToFP (loadv4i32 addr:$src))))]>,
Sched<[WriteCvtI2PDLd]>;		Sched<[WriteCvtI2PDLd]>;
def CVTDQ2PDrr : S2SI<0xE6, MRMSrcReg, (outs VR128:$dst), (ins VR128:$src),		def CVTDQ2PDrr : S2SI<0xE6, MRMSrcReg, (outs VR128:$dst), (ins VR128:$src),
"cvtdq2pd\t{$src, $dst\|$dst, $src}",		"cvtdq2pd\t{$src, $dst\|$dst, $src}",
[(set VR128:$dst,		[(set VR128:$dst,
(v2f64 (X86VSintToFP (v4i32 VR128:$src))))]>,		(v2f64 (X86VSintToFP (v4i32 VR128:$src))))]>,
Sched<[WriteCvtI2PD]>;		Sched<[WriteCvtI2PD]>;

// AVX register conversion intrinsics		// AVX register conversion intrinsics
▲ Show 20 Lines • Show All 438 Lines • ▼ Show 20 Lines	def rm : PI<opc, MRMSrcMem,
(outs RC:$dst), (ins RC:$src1, x86memop:$src2),		(outs RC:$dst), (ins RC:$src1, x86memop:$src2),
asm, [(set RC:$dst,		asm, [(set RC:$dst,
(vt (OpNode RC:$src1,		(vt (OpNode RC:$src1,
(mem_frag addr:$src2))))], d>,		(mem_frag addr:$src2))))], d>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let Predicates = [HasAVX, NoVLX] in {		let Predicates = [HasAVX, NoVLX] in {
defm VUNPCKHPS: sse12_unpack_interleave<0x15, X86Unpckh, v4f32, loadv4f32,		defm VUNPCKHPS: sse12_unpack_interleave<0x15, X86Unpckh, v4f32, load,
VR128, f128mem, "unpckhps\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		VR128, f128mem, "unpckhps\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
SchedWriteFShuffle.XMM, SSEPackedSingle>, PS, VEX_4V, VEX_WIG;		SchedWriteFShuffle.XMM, SSEPackedSingle>, PS, VEX_4V, VEX_WIG;
defm VUNPCKHPD: sse12_unpack_interleave<0x15, X86Unpckh, v2f64, loadv2f64,		defm VUNPCKHPD: sse12_unpack_interleave<0x15, X86Unpckh, v2f64, load,
VR128, f128mem, "unpckhpd\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		VR128, f128mem, "unpckhpd\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
SchedWriteFShuffle.XMM, SSEPackedDouble, 1>, PD, VEX_4V, VEX_WIG;		SchedWriteFShuffle.XMM, SSEPackedDouble, 1>, PD, VEX_4V, VEX_WIG;
defm VUNPCKLPS: sse12_unpack_interleave<0x14, X86Unpckl, v4f32, loadv4f32,		defm VUNPCKLPS: sse12_unpack_interleave<0x14, X86Unpckl, v4f32, load,
VR128, f128mem, "unpcklps\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		VR128, f128mem, "unpcklps\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
SchedWriteFShuffle.XMM, SSEPackedSingle>, PS, VEX_4V, VEX_WIG;		SchedWriteFShuffle.XMM, SSEPackedSingle>, PS, VEX_4V, VEX_WIG;
defm VUNPCKLPD: sse12_unpack_interleave<0x14, X86Unpckl, v2f64, loadv2f64,		defm VUNPCKLPD: sse12_unpack_interleave<0x14, X86Unpckl, v2f64, load,
VR128, f128mem, "unpcklpd\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		VR128, f128mem, "unpcklpd\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
SchedWriteFShuffle.XMM, SSEPackedDouble>, PD, VEX_4V, VEX_WIG;		SchedWriteFShuffle.XMM, SSEPackedDouble>, PD, VEX_4V, VEX_WIG;

defm VUNPCKHPSY: sse12_unpack_interleave<0x15, X86Unpckh, v8f32, loadv8f32,		defm VUNPCKHPSY: sse12_unpack_interleave<0x15, X86Unpckh, v8f32, load,
VR256, f256mem, "unpckhps\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		VR256, f256mem, "unpckhps\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
SchedWriteFShuffle.YMM, SSEPackedSingle>, PS, VEX_4V, VEX_L, VEX_WIG;		SchedWriteFShuffle.YMM, SSEPackedSingle>, PS, VEX_4V, VEX_L, VEX_WIG;
defm VUNPCKHPDY: sse12_unpack_interleave<0x15, X86Unpckh, v4f64, loadv4f64,		defm VUNPCKHPDY: sse12_unpack_interleave<0x15, X86Unpckh, v4f64, load,
VR256, f256mem, "unpckhpd\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		VR256, f256mem, "unpckhpd\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
SchedWriteFShuffle.YMM, SSEPackedDouble>, PD, VEX_4V, VEX_L, VEX_WIG;		SchedWriteFShuffle.YMM, SSEPackedDouble>, PD, VEX_4V, VEX_L, VEX_WIG;
defm VUNPCKLPSY: sse12_unpack_interleave<0x14, X86Unpckl, v8f32, loadv8f32,		defm VUNPCKLPSY: sse12_unpack_interleave<0x14, X86Unpckl, v8f32, load,
VR256, f256mem, "unpcklps\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		VR256, f256mem, "unpcklps\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
SchedWriteFShuffle.YMM, SSEPackedSingle>, PS, VEX_4V, VEX_L, VEX_WIG;		SchedWriteFShuffle.YMM, SSEPackedSingle>, PS, VEX_4V, VEX_L, VEX_WIG;
defm VUNPCKLPDY: sse12_unpack_interleave<0x14, X86Unpckl, v4f64, loadv4f64,		defm VUNPCKLPDY: sse12_unpack_interleave<0x14, X86Unpckl, v4f64, load,
VR256, f256mem, "unpcklpd\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		VR256, f256mem, "unpcklpd\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
SchedWriteFShuffle.YMM, SSEPackedDouble>, PD, VEX_4V, VEX_L, VEX_WIG;		SchedWriteFShuffle.YMM, SSEPackedDouble>, PD, VEX_4V, VEX_L, VEX_WIG;
}// Predicates = [HasAVX, NoVLX]		}// Predicates = [HasAVX, NoVLX]

let Constraints = "$src1 = $dst" in {		let Constraints = "$src1 = $dst" in {
defm UNPCKHPS: sse12_unpack_interleave<0x15, X86Unpckh, v4f32, memopv4f32,		defm UNPCKHPS: sse12_unpack_interleave<0x15, X86Unpckh, v4f32, memop,
VR128, f128mem, "unpckhps\t{$src2, $dst\|$dst, $src2}",		VR128, f128mem, "unpckhps\t{$src2, $dst\|$dst, $src2}",
SchedWriteFShuffle.XMM, SSEPackedSingle>, PS;		SchedWriteFShuffle.XMM, SSEPackedSingle>, PS;
defm UNPCKHPD: sse12_unpack_interleave<0x15, X86Unpckh, v2f64, memopv2f64,		defm UNPCKHPD: sse12_unpack_interleave<0x15, X86Unpckh, v2f64, memop,
VR128, f128mem, "unpckhpd\t{$src2, $dst\|$dst, $src2}",		VR128, f128mem, "unpckhpd\t{$src2, $dst\|$dst, $src2}",
SchedWriteFShuffle.XMM, SSEPackedDouble, 1>, PD;		SchedWriteFShuffle.XMM, SSEPackedDouble, 1>, PD;
defm UNPCKLPS: sse12_unpack_interleave<0x14, X86Unpckl, v4f32, memopv4f32,		defm UNPCKLPS: sse12_unpack_interleave<0x14, X86Unpckl, v4f32, memop,
VR128, f128mem, "unpcklps\t{$src2, $dst\|$dst, $src2}",		VR128, f128mem, "unpcklps\t{$src2, $dst\|$dst, $src2}",
SchedWriteFShuffle.XMM, SSEPackedSingle>, PS;		SchedWriteFShuffle.XMM, SSEPackedSingle>, PS;
defm UNPCKLPD: sse12_unpack_interleave<0x14, X86Unpckl, v2f64, memopv2f64,		defm UNPCKLPD: sse12_unpack_interleave<0x14, X86Unpckl, v2f64, memop,
VR128, f128mem, "unpcklpd\t{$src2, $dst\|$dst, $src2}",		VR128, f128mem, "unpcklpd\t{$src2, $dst\|$dst, $src2}",
SchedWriteFShuffle.XMM, SSEPackedDouble>, PD;		SchedWriteFShuffle.XMM, SSEPackedDouble>, PD;
} // Constraints = "$src1 = $dst"		} // Constraints = "$src1 = $dst"

let Predicates = [HasAVX1Only] in {		let Predicates = [HasAVX1Only] in {
def : Pat<(v8i32 (X86Unpckl VR256:$src1, (bc_v8i32 (loadv4i64 addr:$src2)))),		def : Pat<(v8i32 (X86Unpckl VR256:$src1, (loadv8i32 addr:$src2))),
(VUNPCKLPSYrm VR256:$src1, addr:$src2)>;		(VUNPCKLPSYrm VR256:$src1, addr:$src2)>;
def : Pat<(v8i32 (X86Unpckl VR256:$src1, VR256:$src2)),		def : Pat<(v8i32 (X86Unpckl VR256:$src1, VR256:$src2)),
(VUNPCKLPSYrr VR256:$src1, VR256:$src2)>;		(VUNPCKLPSYrr VR256:$src1, VR256:$src2)>;
def : Pat<(v8i32 (X86Unpckh VR256:$src1, (bc_v8i32 (loadv4i64 addr:$src2)))),		def : Pat<(v8i32 (X86Unpckh VR256:$src1, (loadv8i32 addr:$src2))),
(VUNPCKHPSYrm VR256:$src1, addr:$src2)>;		(VUNPCKHPSYrm VR256:$src1, addr:$src2)>;
def : Pat<(v8i32 (X86Unpckh VR256:$src1, VR256:$src2)),		def : Pat<(v8i32 (X86Unpckh VR256:$src1, VR256:$src2)),
(VUNPCKHPSYrr VR256:$src1, VR256:$src2)>;		(VUNPCKHPSYrr VR256:$src1, VR256:$src2)>;

def : Pat<(v4i64 (X86Unpckl VR256:$src1, (loadv4i64 addr:$src2))),		def : Pat<(v4i64 (X86Unpckl VR256:$src1, (loadv4i64 addr:$src2))),
(VUNPCKLPDYrm VR256:$src1, addr:$src2)>;		(VUNPCKLPDYrm VR256:$src1, addr:$src2)>;
def : Pat<(v4i64 (X86Unpckl VR256:$src1, VR256:$src2)),		def : Pat<(v4i64 (X86Unpckl VR256:$src1, VR256:$src2)),
(VUNPCKLPDYrr VR256:$src1, VR256:$src2)>;		(VUNPCKLPDYrr VR256:$src1, VR256:$src2)>;
▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines	def rr : PDI<opc, MRMSrcReg, (outs RC:$dst),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst, (OpVT (OpNode RC:$src1, RC:$src2)))]>,		[(set RC:$dst, (OpVT (OpNode RC:$src1, RC:$src2)))]>,
Sched<[sched]>;		Sched<[sched]>;
def rm : PDI<opc, MRMSrcMem, (outs RC:$dst),		def rm : PDI<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop:$src2),		(ins RC:$src1, x86memop:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst, (OpVT (OpNode RC:$src1,		[(set RC:$dst, (OpVT (OpNode RC:$src1, (memop_frag addr:$src2))))]>,
(bitconvert (memop_frag addr:$src2)))))]>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
} // ExeDomain = SSEPackedInt		} // ExeDomain = SSEPackedInt

multiclass PDI_binop_all<bits<8> opc, string OpcodeStr, SDNode Opcode,		multiclass PDI_binop_all<bits<8> opc, string OpcodeStr, SDNode Opcode,
ValueType OpVT128, ValueType OpVT256,		ValueType OpVT128, ValueType OpVT256,
X86SchedWriteWidths sched, bit IsCommutable,		X86SchedWriteWidths sched, bit IsCommutable,
Predicate prd> {		Predicate prd> {
let Predicates = [HasAVX, prd] in		let Predicates = [HasAVX, prd] in
defm V#NAME : PDI_binop_rm<opc, !strconcat("v", OpcodeStr), Opcode, OpVT128,		defm V#NAME : PDI_binop_rm<opc, !strconcat("v", OpcodeStr), Opcode, OpVT128,
VR128, loadv2i64, i128mem, sched.XMM,		VR128, load, i128mem, sched.XMM,
IsCommutable, 0>, VEX_4V, VEX_WIG;		IsCommutable, 0>, VEX_4V, VEX_WIG;

let Constraints = "$src1 = $dst" in		let Constraints = "$src1 = $dst" in
defm NAME : PDI_binop_rm<opc, OpcodeStr, Opcode, OpVT128, VR128,		defm NAME : PDI_binop_rm<opc, OpcodeStr, Opcode, OpVT128, VR128,
memopv2i64, i128mem, sched.XMM, IsCommutable, 1>;		memop, i128mem, sched.XMM, IsCommutable, 1>;

let Predicates = [HasAVX2, prd] in		let Predicates = [HasAVX2, prd] in
defm V#NAME#Y : PDI_binop_rm<opc, !strconcat("v", OpcodeStr), Opcode,		defm V#NAME#Y : PDI_binop_rm<opc, !strconcat("v", OpcodeStr), Opcode,
OpVT256, VR256, loadv4i64, i256mem, sched.YMM,		OpVT256, VR256, load, i256mem, sched.YMM,
IsCommutable, 0>, VEX_4V, VEX_L, VEX_WIG;		IsCommutable, 0>, VEX_4V, VEX_L, VEX_WIG;
}		}

// These are ordered here for pattern ordering requirements with the fp versions		// These are ordered here for pattern ordering requirements with the fp versions

defm PAND : PDI_binop_all<0xDB, "pand", and, v2i64, v4i64,		defm PAND : PDI_binop_all<0xDB, "pand", and, v2i64, v4i64,
SchedWriteVecLogic, 1, NoVLX>;		SchedWriteVecLogic, 1, NoVLX>;
defm POR : PDI_binop_all<0xEB, "por", or, v2i64, v4i64,		defm POR : PDI_binop_all<0xEB, "por", or, v2i64, v4i64,
▲ Show 20 Lines • Show All 984 Lines • ▼ Show 20 Lines
// Reversed version with ".s" suffix for GAS compatibility.		// Reversed version with ".s" suffix for GAS compatibility.
def : InstAlias<"movdqa.s\t{$src, $dst\|$dst, $src}",		def : InstAlias<"movdqa.s\t{$src, $dst\|$dst, $src}",
(MOVDQArr_REV VR128:$dst, VR128:$src), 0>;		(MOVDQArr_REV VR128:$dst, VR128:$src), 0>;
def : InstAlias<"movdqu.s\t{$src, $dst\|$dst, $src}",		def : InstAlias<"movdqu.s\t{$src, $dst\|$dst, $src}",
(MOVDQUrr_REV VR128:$dst, VR128:$src), 0>;		(MOVDQUrr_REV VR128:$dst, VR128:$src), 0>;

let Predicates = [HasAVX, NoVLX] in {		let Predicates = [HasAVX, NoVLX] in {
// Additional patterns for other integer sizes.		// Additional patterns for other integer sizes.
		def : Pat<(alignedloadv4i32 addr:$src),
		(VMOVDQArm addr:$src)>;
		def : Pat<(alignedloadv8i16 addr:$src),
		(VMOVDQArm addr:$src)>;
		def : Pat<(alignedloadv16i8 addr:$src),
		(VMOVDQArm addr:$src)>;
		def : Pat<(loadv4i32 addr:$src),
		(VMOVDQUrm addr:$src)>;
		def : Pat<(loadv8i16 addr:$src),
		(VMOVDQUrm addr:$src)>;
		def : Pat<(loadv16i8 addr:$src),
		(VMOVDQUrm addr:$src)>;

def : Pat<(alignedstore (v4i32 VR128:$src), addr:$dst),		def : Pat<(alignedstore (v4i32 VR128:$src), addr:$dst),
(VMOVDQAmr addr:$dst, VR128:$src)>;		(VMOVDQAmr addr:$dst, VR128:$src)>;
def : Pat<(alignedstore (v8i16 VR128:$src), addr:$dst),		def : Pat<(alignedstore (v8i16 VR128:$src), addr:$dst),
(VMOVDQAmr addr:$dst, VR128:$src)>;		(VMOVDQAmr addr:$dst, VR128:$src)>;
def : Pat<(alignedstore (v16i8 VR128:$src), addr:$dst),		def : Pat<(alignedstore (v16i8 VR128:$src), addr:$dst),
(VMOVDQAmr addr:$dst, VR128:$src)>;		(VMOVDQAmr addr:$dst, VR128:$src)>;
def : Pat<(store (v4i32 VR128:$src), addr:$dst),		def : Pat<(store (v4i32 VR128:$src), addr:$dst),
(VMOVDQUmr addr:$dst, VR128:$src)>;		(VMOVDQUmr addr:$dst, VR128:$src)>;
Show All 23 Lines	def rr : PDI<opc, MRMSrcReg, (outs RC:$dst),
[(set RC:$dst, (DstVT (OpNode (SrcVT RC:$src1), RC:$src2)))]>,		[(set RC:$dst, (DstVT (OpNode (SrcVT RC:$src1), RC:$src2)))]>,
Sched<[sched]>;		Sched<[sched]>;
def rm : PDI<opc, MRMSrcMem, (outs RC:$dst),		def rm : PDI<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop:$src2),		(ins RC:$src1, x86memop:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst, (DstVT (OpNode (SrcVT RC:$src1),		[(set RC:$dst, (DstVT (OpNode (SrcVT RC:$src1),
(bitconvert (memop_frag addr:$src2)))))]>,		(memop_frag addr:$src2))))]>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
} // ExeDomain = SSEPackedInt		} // ExeDomain = SSEPackedInt

defm PADDB : PDI_binop_all<0xFC, "paddb", add, v16i8, v32i8,		defm PADDB : PDI_binop_all<0xFC, "paddb", add, v16i8, v32i8,
SchedWriteVecALU, 1, NoVLX_Or_NoBWI>;		SchedWriteVecALU, 1, NoVLX_Or_NoBWI>;
defm PADDW : PDI_binop_all<0xFD, "paddw", add, v8i16, v16i16,		defm PADDW : PDI_binop_all<0xFD, "paddw", add, v8i16, v16i16,
SchedWriteVecALU, 1, NoVLX_Or_NoBWI>;		SchedWriteVecALU, 1, NoVLX_Or_NoBWI>;
▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines	defm PAVGB : PDI_binop_all<0xE0, "pavgb", X86avg, v16i8, v32i8,
SchedWriteVecALU, 1, NoVLX_Or_NoBWI>;		SchedWriteVecALU, 1, NoVLX_Or_NoBWI>;
defm PAVGW : PDI_binop_all<0xE3, "pavgw", X86avg, v8i16, v16i16,		defm PAVGW : PDI_binop_all<0xE3, "pavgw", X86avg, v8i16, v16i16,
SchedWriteVecALU, 1, NoVLX_Or_NoBWI>;		SchedWriteVecALU, 1, NoVLX_Or_NoBWI>;
defm PMULUDQ : PDI_binop_all<0xF4, "pmuludq", X86pmuludq, v2i64, v4i64,		defm PMULUDQ : PDI_binop_all<0xF4, "pmuludq", X86pmuludq, v2i64, v4i64,
SchedWriteVecIMul, 1, NoVLX>;		SchedWriteVecIMul, 1, NoVLX>;

let Predicates = [HasAVX, NoVLX_Or_NoBWI] in		let Predicates = [HasAVX, NoVLX_Or_NoBWI] in
defm VPMADDWD : PDI_binop_rm2<0xF5, "vpmaddwd", X86vpmaddwd, v4i32, v8i16, VR128,		defm VPMADDWD : PDI_binop_rm2<0xF5, "vpmaddwd", X86vpmaddwd, v4i32, v8i16, VR128,
loadv2i64, i128mem, SchedWriteVecIMul.XMM, 0>,		load, i128mem, SchedWriteVecIMul.XMM, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;

let Predicates = [HasAVX2, NoVLX_Or_NoBWI] in		let Predicates = [HasAVX2, NoVLX_Or_NoBWI] in
defm VPMADDWDY : PDI_binop_rm2<0xF5, "vpmaddwd", X86vpmaddwd, v8i32, v16i16,		defm VPMADDWDY : PDI_binop_rm2<0xF5, "vpmaddwd", X86vpmaddwd, v8i32, v16i16,
VR256, loadv4i64, i256mem, SchedWriteVecIMul.YMM,		VR256, load, i256mem, SchedWriteVecIMul.YMM,
0>, VEX_4V, VEX_L, VEX_WIG;		0>, VEX_4V, VEX_L, VEX_WIG;
let Constraints = "$src1 = $dst" in		let Constraints = "$src1 = $dst" in
defm PMADDWD : PDI_binop_rm2<0xF5, "pmaddwd", X86vpmaddwd, v4i32, v8i16, VR128,		defm PMADDWD : PDI_binop_rm2<0xF5, "pmaddwd", X86vpmaddwd, v4i32, v8i16, VR128,
memopv2i64, i128mem, SchedWriteVecIMul.XMM>;		memop, i128mem, SchedWriteVecIMul.XMM>;

let Predicates = [HasAVX, NoVLX_Or_NoBWI] in		let Predicates = [HasAVX, NoVLX_Or_NoBWI] in
defm VPSADBW : PDI_binop_rm2<0xF6, "vpsadbw", X86psadbw, v2i64, v16i8, VR128,		defm VPSADBW : PDI_binop_rm2<0xF6, "vpsadbw", X86psadbw, v2i64, v16i8, VR128,
loadv2i64, i128mem, SchedWritePSADBW.XMM, 0>,		load, i128mem, SchedWritePSADBW.XMM, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
let Predicates = [HasAVX2, NoVLX_Or_NoBWI] in		let Predicates = [HasAVX2, NoVLX_Or_NoBWI] in
defm VPSADBWY : PDI_binop_rm2<0xF6, "vpsadbw", X86psadbw, v4i64, v32i8, VR256,		defm VPSADBWY : PDI_binop_rm2<0xF6, "vpsadbw", X86psadbw, v4i64, v32i8, VR256,
loadv4i64, i256mem, SchedWritePSADBW.YMM, 0>,		load, i256mem, SchedWritePSADBW.YMM, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
let Constraints = "$src1 = $dst" in		let Constraints = "$src1 = $dst" in
defm PSADBW : PDI_binop_rm2<0xF6, "psadbw", X86psadbw, v2i64, v16i8, VR128,		defm PSADBW : PDI_binop_rm2<0xF6, "psadbw", X86psadbw, v2i64, v16i8, VR128,
memopv2i64, i128mem, SchedWritePSADBW.XMM>;		memop, i128mem, SchedWritePSADBW.XMM>;

//===---------------------------------------------------------------------===//		//===---------------------------------------------------------------------===//
// SSE2 - Packed Integer Logical Instructions		// SSE2 - Packed Integer Logical Instructions
//===---------------------------------------------------------------------===//		//===---------------------------------------------------------------------===//

multiclass PDI_binop_rmi<bits<8> opc, bits<8> opc2, Format ImmForm,		multiclass PDI_binop_rmi<bits<8> opc, bits<8> opc2, Format ImmForm,
string OpcodeStr, SDNode OpNode,		string OpcodeStr, SDNode OpNode,
SDNode OpNode2, RegisterClass RC,		SDNode OpNode2, RegisterClass RC,
Show All 10 Lines	def rr : PDI<opc, MRMSrcReg, (outs RC:$dst),
[(set RC:$dst, (DstVT (OpNode RC:$src1, (SrcVT VR128:$src2))))]>,		[(set RC:$dst, (DstVT (OpNode RC:$src1, (SrcVT VR128:$src2))))]>,
Sched<[sched]>;		Sched<[sched]>;
def rm : PDI<opc, MRMSrcMem, (outs RC:$dst),		def rm : PDI<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, i128mem:$src2),		(ins RC:$src1, i128mem:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst, (DstVT (OpNode RC:$src1,		[(set RC:$dst, (DstVT (OpNode RC:$src1,
(SrcVT (bitconvert (ld_frag addr:$src2))))))]>,		(SrcVT (ld_frag addr:$src2)))))]>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
def ri : PDIi8<opc2, ImmForm, (outs RC:$dst),		def ri : PDIi8<opc2, ImmForm, (outs RC:$dst),
(ins RC:$src1, u8imm:$src2),		(ins RC:$src1, u8imm:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst, (DstVT (OpNode2 RC:$src1, (i8 imm:$src2))))]>,		[(set RC:$dst, (DstVT (OpNode2 RC:$src1, (i8 imm:$src2))))]>,
Sched<[schedImm]>;		Sched<[schedImm]>;
}		}

multiclass PDI_binop_rmi_all<bits<8> opc, bits<8> opc2, Format ImmForm,		multiclass PDI_binop_rmi_all<bits<8> opc, bits<8> opc2, Format ImmForm,
string OpcodeStr, SDNode OpNode,		string OpcodeStr, SDNode OpNode,
SDNode OpNode2, ValueType DstVT128,		SDNode OpNode2, ValueType DstVT128,
ValueType DstVT256, ValueType SrcVT,		ValueType DstVT256, ValueType SrcVT,
X86SchedWriteWidths sched,		X86SchedWriteWidths sched,
X86SchedWriteWidths schedImm, Predicate prd> {		X86SchedWriteWidths schedImm, Predicate prd> {
let Predicates = [HasAVX, prd] in		let Predicates = [HasAVX, prd] in
defm V#NAME : PDI_binop_rmi<opc, opc2, ImmForm, !strconcat("v", OpcodeStr),		defm V#NAME : PDI_binop_rmi<opc, opc2, ImmForm, !strconcat("v", OpcodeStr),
OpNode, OpNode2, VR128, sched.XMM, schedImm.XMM,		OpNode, OpNode2, VR128, sched.XMM, schedImm.XMM,
DstVT128, SrcVT, loadv2i64, 0>, VEX_4V, VEX_WIG;		DstVT128, SrcVT, load, 0>, VEX_4V, VEX_WIG;
let Predicates = [HasAVX2, prd] in		let Predicates = [HasAVX2, prd] in
defm V#NAME#Y : PDI_binop_rmi<opc, opc2, ImmForm, !strconcat("v", OpcodeStr),		defm V#NAME#Y : PDI_binop_rmi<opc, opc2, ImmForm, !strconcat("v", OpcodeStr),
OpNode, OpNode2, VR256, sched.YMM, schedImm.YMM,		OpNode, OpNode2, VR256, sched.YMM, schedImm.YMM,
DstVT256, SrcVT, loadv2i64, 0>, VEX_4V, VEX_L,		DstVT256, SrcVT, load, 0>, VEX_4V, VEX_L,
VEX_WIG;		VEX_WIG;
let Constraints = "$src1 = $dst" in		let Constraints = "$src1 = $dst" in
defm NAME : PDI_binop_rmi<opc, opc2, ImmForm, OpcodeStr, OpNode, OpNode2,		defm NAME : PDI_binop_rmi<opc, opc2, ImmForm, OpcodeStr, OpNode, OpNode2,
VR128, sched.XMM, schedImm.XMM, DstVT128, SrcVT,		VR128, sched.XMM, schedImm.XMM, DstVT128, SrcVT,
memopv2i64>;		memop>;
}		}

multiclass PDI_binop_ri<bits<8> opc, Format ImmForm, string OpcodeStr,		multiclass PDI_binop_ri<bits<8> opc, Format ImmForm, string OpcodeStr,
SDNode OpNode, RegisterClass RC, ValueType VT,		SDNode OpNode, RegisterClass RC, ValueType VT,
X86FoldableSchedWrite sched, bit Is2Addr = 1> {		X86FoldableSchedWrite sched, bit Is2Addr = 1> {
def ri : PDIi8<opc, ImmForm, (outs RC:$dst), (ins RC:$src1, u8imm:$src2),		def ri : PDIi8<opc, ImmForm, (outs RC:$dst), (ins RC:$src1, u8imm:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
▲ Show 20 Lines • Show All 83 Lines • ▼ Show 20 Lines	def V#NAME#ri : Ii8<0x70, MRMSrcReg, (outs VR128:$dst),
[(set VR128:$dst,		[(set VR128:$dst,
(vt128 (OpNode VR128:$src1, (i8 imm:$src2))))]>,		(vt128 (OpNode VR128:$src1, (i8 imm:$src2))))]>,
VEX, Sched<[sched.XMM]>, VEX_WIG;		VEX, Sched<[sched.XMM]>, VEX_WIG;
def V#NAME#mi : Ii8<0x70, MRMSrcMem, (outs VR128:$dst),		def V#NAME#mi : Ii8<0x70, MRMSrcMem, (outs VR128:$dst),
(ins i128mem:$src1, u8imm:$src2),		(ins i128mem:$src1, u8imm:$src2),
!strconcat("v", OpcodeStr,		!strconcat("v", OpcodeStr,
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR128:$dst,		[(set VR128:$dst,
(vt128 (OpNode (bitconvert (loadv2i64 addr:$src1)),		(vt128 (OpNode (load addr:$src1),
(i8 imm:$src2))))]>, VEX,		(i8 imm:$src2))))]>, VEX,
Sched<[sched.XMM.Folded]>, VEX_WIG;		Sched<[sched.XMM.Folded]>, VEX_WIG;
}		}

let Predicates = [HasAVX2, prd] in {		let Predicates = [HasAVX2, prd] in {
def V#NAME#Yri : Ii8<0x70, MRMSrcReg, (outs VR256:$dst),		def V#NAME#Yri : Ii8<0x70, MRMSrcReg, (outs VR256:$dst),
(ins VR256:$src1, u8imm:$src2),		(ins VR256:$src1, u8imm:$src2),
!strconcat("v", OpcodeStr,		!strconcat("v", OpcodeStr,
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR256:$dst,		[(set VR256:$dst,
(vt256 (OpNode VR256:$src1, (i8 imm:$src2))))]>,		(vt256 (OpNode VR256:$src1, (i8 imm:$src2))))]>,
VEX, VEX_L, Sched<[sched.YMM]>, VEX_WIG;		VEX, VEX_L, Sched<[sched.YMM]>, VEX_WIG;
def V#NAME#Ymi : Ii8<0x70, MRMSrcMem, (outs VR256:$dst),		def V#NAME#Ymi : Ii8<0x70, MRMSrcMem, (outs VR256:$dst),
(ins i256mem:$src1, u8imm:$src2),		(ins i256mem:$src1, u8imm:$src2),
!strconcat("v", OpcodeStr,		!strconcat("v", OpcodeStr,
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR256:$dst,		[(set VR256:$dst,
(vt256 (OpNode (bitconvert (loadv4i64 addr:$src1)),		(vt256 (OpNode (load addr:$src1),
(i8 imm:$src2))))]>, VEX, VEX_L,		(i8 imm:$src2))))]>, VEX, VEX_L,
Sched<[sched.YMM.Folded]>, VEX_WIG;		Sched<[sched.YMM.Folded]>, VEX_WIG;
}		}

let Predicates = [UseSSE2] in {		let Predicates = [UseSSE2] in {
def ri : Ii8<0x70, MRMSrcReg,		def ri : Ii8<0x70, MRMSrcReg,
(outs VR128:$dst), (ins VR128:$src1, u8imm:$src2),		(outs VR128:$dst), (ins VR128:$src1, u8imm:$src2),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR128:$dst,		[(set VR128:$dst,
(vt128 (OpNode VR128:$src1, (i8 imm:$src2))))]>,		(vt128 (OpNode VR128:$src1, (i8 imm:$src2))))]>,
Sched<[sched.XMM]>;		Sched<[sched.XMM]>;
def mi : Ii8<0x70, MRMSrcMem,		def mi : Ii8<0x70, MRMSrcMem,
(outs VR128:$dst), (ins i128mem:$src1, u8imm:$src2),		(outs VR128:$dst), (ins i128mem:$src1, u8imm:$src2),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR128:$dst,		[(set VR128:$dst,
(vt128 (OpNode (bitconvert (memopv2i64 addr:$src1)),		(vt128 (OpNode (memop addr:$src1),
(i8 imm:$src2))))]>,		(i8 imm:$src2))))]>,
Sched<[sched.XMM.Folded]>;		Sched<[sched.XMM.Folded]>;
}		}
}		}
} // ExeDomain = SSEPackedInt		} // ExeDomain = SSEPackedInt

defm PSHUFD : sse2_pshuffle<"pshufd", v4i32, v8i32, X86PShufd,		defm PSHUFD : sse2_pshuffle<"pshufd", v4i32, v8i32, X86PShufd,
SchedWriteShuffle, NoVLX>, PD;		SchedWriteShuffle, NoVLX>, PD;
Show All 23 Lines	multiclass sse2_pack<bits<8> opc, string OpcodeStr, ValueType OutVT,
def rm : PDI<opc, MRMSrcMem,		def rm : PDI<opc, MRMSrcMem,
(outs RC:$dst), (ins RC:$src1, x86memop:$src2),		(outs RC:$dst), (ins RC:$src1, x86memop:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst,		[(set RC:$dst,
(OutVT (OpNode (ArgVT RC:$src1),		(OutVT (OpNode (ArgVT RC:$src1),
(bitconvert (ld_frag addr:$src2)))))]>,		(ld_frag addr:$src2))))]>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass sse4_pack<bits<8> opc, string OpcodeStr, ValueType OutVT,		multiclass sse4_pack<bits<8> opc, string OpcodeStr, ValueType OutVT,
ValueType ArgVT, SDNode OpNode, RegisterClass RC,		ValueType ArgVT, SDNode OpNode, RegisterClass RC,
X86MemOperand x86memop, X86FoldableSchedWrite sched,		X86MemOperand x86memop, X86FoldableSchedWrite sched,
PatFrag ld_frag, bit Is2Addr = 1> {		PatFrag ld_frag, bit Is2Addr = 1> {
def rr : SS48I<opc, MRMSrcReg,		def rr : SS48I<opc, MRMSrcReg,
(outs RC:$dst), (ins RC:$src1, RC:$src2),		(outs RC:$dst), (ins RC:$src1, RC:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst,		[(set RC:$dst,
(OutVT (OpNode (ArgVT RC:$src1), RC:$src2)))]>,		(OutVT (OpNode (ArgVT RC:$src1), RC:$src2)))]>,
Sched<[sched]>;		Sched<[sched]>;
def rm : SS48I<opc, MRMSrcMem,		def rm : SS48I<opc, MRMSrcMem,
(outs RC:$dst), (ins RC:$src1, x86memop:$src2),		(outs RC:$dst), (ins RC:$src1, x86memop:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst,		[(set RC:$dst,
(OutVT (OpNode (ArgVT RC:$src1),		(OutVT (OpNode (ArgVT RC:$src1),
(bitconvert (ld_frag addr:$src2)))))]>,		(ld_frag addr:$src2))))]>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let Predicates = [HasAVX, NoVLX_Or_NoBWI] in {		let Predicates = [HasAVX, NoVLX_Or_NoBWI] in {
defm VPACKSSWB : sse2_pack<0x63, "vpacksswb", v16i8, v8i16, X86Packss, VR128,		defm VPACKSSWB : sse2_pack<0x63, "vpacksswb", v16i8, v8i16, X86Packss, VR128,
i128mem, SchedWriteShuffle.XMM, loadv2i64, 0>,		i128mem, SchedWriteShuffle.XMM, load, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
defm VPACKSSDW : sse2_pack<0x6B, "vpackssdw", v8i16, v4i32, X86Packss, VR128,		defm VPACKSSDW : sse2_pack<0x6B, "vpackssdw", v8i16, v4i32, X86Packss, VR128,
i128mem, SchedWriteShuffle.XMM, loadv2i64, 0>,		i128mem, SchedWriteShuffle.XMM, load, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;

defm VPACKUSWB : sse2_pack<0x67, "vpackuswb", v16i8, v8i16, X86Packus, VR128,		defm VPACKUSWB : sse2_pack<0x67, "vpackuswb", v16i8, v8i16, X86Packus, VR128,
i128mem, SchedWriteShuffle.XMM, loadv2i64, 0>,		i128mem, SchedWriteShuffle.XMM, load, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
defm VPACKUSDW : sse4_pack<0x2B, "vpackusdw", v8i16, v4i32, X86Packus, VR128,		defm VPACKUSDW : sse4_pack<0x2B, "vpackusdw", v8i16, v4i32, X86Packus, VR128,
i128mem, SchedWriteShuffle.XMM, loadv2i64, 0>,		i128mem, SchedWriteShuffle.XMM, load, 0>,
VEX_4V;		VEX_4V;
}		}

let Predicates = [HasAVX2, NoVLX_Or_NoBWI] in {		let Predicates = [HasAVX2, NoVLX_Or_NoBWI] in {
defm VPACKSSWBY : sse2_pack<0x63, "vpacksswb", v32i8, v16i16, X86Packss, VR256,		defm VPACKSSWBY : sse2_pack<0x63, "vpacksswb", v32i8, v16i16, X86Packss, VR256,
i256mem, SchedWriteShuffle.YMM, loadv4i64, 0>,		i256mem, SchedWriteShuffle.YMM, load, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
defm VPACKSSDWY : sse2_pack<0x6B, "vpackssdw", v16i16, v8i32, X86Packss, VR256,		defm VPACKSSDWY : sse2_pack<0x6B, "vpackssdw", v16i16, v8i32, X86Packss, VR256,
i256mem, SchedWriteShuffle.YMM, loadv4i64, 0>,		i256mem, SchedWriteShuffle.YMM, load, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;

defm VPACKUSWBY : sse2_pack<0x67, "vpackuswb", v32i8, v16i16, X86Packus, VR256,		defm VPACKUSWBY : sse2_pack<0x67, "vpackuswb", v32i8, v16i16, X86Packus, VR256,
i256mem, SchedWriteShuffle.YMM, loadv4i64, 0>,		i256mem, SchedWriteShuffle.YMM, load, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
defm VPACKUSDWY : sse4_pack<0x2B, "vpackusdw", v16i16, v8i32, X86Packus, VR256,		defm VPACKUSDWY : sse4_pack<0x2B, "vpackusdw", v16i16, v8i32, X86Packus, VR256,
i256mem, SchedWriteShuffle.YMM, loadv4i64, 0>,		i256mem, SchedWriteShuffle.YMM, load, 0>,
VEX_4V, VEX_L;		VEX_4V, VEX_L;
}		}

let Constraints = "$src1 = $dst" in {		let Constraints = "$src1 = $dst" in {
defm PACKSSWB : sse2_pack<0x63, "packsswb", v16i8, v8i16, X86Packss, VR128,		defm PACKSSWB : sse2_pack<0x63, "packsswb", v16i8, v8i16, X86Packss, VR128,
i128mem, SchedWriteShuffle.XMM, memopv2i64>;		i128mem, SchedWriteShuffle.XMM, memop>;
defm PACKSSDW : sse2_pack<0x6B, "packssdw", v8i16, v4i32, X86Packss, VR128,		defm PACKSSDW : sse2_pack<0x6B, "packssdw", v8i16, v4i32, X86Packss, VR128,
i128mem, SchedWriteShuffle.XMM, memopv2i64>;		i128mem, SchedWriteShuffle.XMM, memop>;

defm PACKUSWB : sse2_pack<0x67, "packuswb", v16i8, v8i16, X86Packus, VR128,		defm PACKUSWB : sse2_pack<0x67, "packuswb", v16i8, v8i16, X86Packus, VR128,
i128mem, SchedWriteShuffle.XMM, memopv2i64>;		i128mem, SchedWriteShuffle.XMM, memop>;

defm PACKUSDW : sse4_pack<0x2B, "packusdw", v8i16, v4i32, X86Packus, VR128,		defm PACKUSDW : sse4_pack<0x2B, "packusdw", v8i16, v4i32, X86Packus, VR128,
i128mem, SchedWriteShuffle.XMM, memopv2i64>;		i128mem, SchedWriteShuffle.XMM, memop>;
}		}
} // ExeDomain = SSEPackedInt		} // ExeDomain = SSEPackedInt

//===---------------------------------------------------------------------===//		//===---------------------------------------------------------------------===//
// SSE2 - Packed Integer Unpack Instructions		// SSE2 - Packed Integer Unpack Instructions
//===---------------------------------------------------------------------===//		//===---------------------------------------------------------------------===//

let ExeDomain = SSEPackedInt in {		let ExeDomain = SSEPackedInt in {
multiclass sse2_unpack<bits<8> opc, string OpcodeStr, ValueType vt,		multiclass sse2_unpack<bits<8> opc, string OpcodeStr, ValueType vt,
SDNode OpNode, RegisterClass RC, X86MemOperand x86memop,		SDNode OpNode, RegisterClass RC, X86MemOperand x86memop,
X86FoldableSchedWrite sched, PatFrag ld_frag,		X86FoldableSchedWrite sched, PatFrag ld_frag,
bit Is2Addr = 1> {		bit Is2Addr = 1> {
def rr : PDI<opc, MRMSrcReg,		def rr : PDI<opc, MRMSrcReg,
(outs RC:$dst), (ins RC:$src1, RC:$src2),		(outs RC:$dst), (ins RC:$src1, RC:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr,"\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr,"\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr,"\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr,"\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst, (vt (OpNode RC:$src1, RC:$src2)))]>,		[(set RC:$dst, (vt (OpNode RC:$src1, RC:$src2)))]>,
Sched<[sched]>;		Sched<[sched]>;
def rm : PDI<opc, MRMSrcMem,		def rm : PDI<opc, MRMSrcMem,
(outs RC:$dst), (ins RC:$src1, x86memop:$src2),		(outs RC:$dst), (ins RC:$src1, x86memop:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr,"\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr,"\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr,"\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr,"\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst, (vt (OpNode RC:$src1,		[(set RC:$dst, (vt (OpNode RC:$src1, (ld_frag addr:$src2))))]>,
(bitconvert (ld_frag addr:$src2)))))]>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let Predicates = [HasAVX, NoVLX_Or_NoBWI] in {		let Predicates = [HasAVX, NoVLX_Or_NoBWI] in {
defm VPUNPCKLBW : sse2_unpack<0x60, "vpunpcklbw", v16i8, X86Unpckl, VR128,		defm VPUNPCKLBW : sse2_unpack<0x60, "vpunpcklbw", v16i8, X86Unpckl, VR128,
i128mem, SchedWriteShuffle.XMM, loadv2i64, 0>,		i128mem, SchedWriteShuffle.XMM, load, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
defm VPUNPCKLWD : sse2_unpack<0x61, "vpunpcklwd", v8i16, X86Unpckl, VR128,		defm VPUNPCKLWD : sse2_unpack<0x61, "vpunpcklwd", v8i16, X86Unpckl, VR128,
i128mem, SchedWriteShuffle.XMM, loadv2i64, 0>,		i128mem, SchedWriteShuffle.XMM, load, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
defm VPUNPCKHBW : sse2_unpack<0x68, "vpunpckhbw", v16i8, X86Unpckh, VR128,		defm VPUNPCKHBW : sse2_unpack<0x68, "vpunpckhbw", v16i8, X86Unpckh, VR128,
i128mem, SchedWriteShuffle.XMM, loadv2i64, 0>,		i128mem, SchedWriteShuffle.XMM, load, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
defm VPUNPCKHWD : sse2_unpack<0x69, "vpunpckhwd", v8i16, X86Unpckh, VR128,		defm VPUNPCKHWD : sse2_unpack<0x69, "vpunpckhwd", v8i16, X86Unpckh, VR128,
i128mem, SchedWriteShuffle.XMM, loadv2i64, 0>,		i128mem, SchedWriteShuffle.XMM, load, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
}		}

let Predicates = [HasAVX, NoVLX] in {		let Predicates = [HasAVX, NoVLX] in {
defm VPUNPCKLDQ : sse2_unpack<0x62, "vpunpckldq", v4i32, X86Unpckl, VR128,		defm VPUNPCKLDQ : sse2_unpack<0x62, "vpunpckldq", v4i32, X86Unpckl, VR128,
i128mem, SchedWriteShuffle.XMM, loadv2i64, 0>,		i128mem, SchedWriteShuffle.XMM, load, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
defm VPUNPCKLQDQ : sse2_unpack<0x6C, "vpunpcklqdq", v2i64, X86Unpckl, VR128,		defm VPUNPCKLQDQ : sse2_unpack<0x6C, "vpunpcklqdq", v2i64, X86Unpckl, VR128,
i128mem, SchedWriteShuffle.XMM, loadv2i64, 0>,		i128mem, SchedWriteShuffle.XMM, load, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
defm VPUNPCKHDQ : sse2_unpack<0x6A, "vpunpckhdq", v4i32, X86Unpckh, VR128,		defm VPUNPCKHDQ : sse2_unpack<0x6A, "vpunpckhdq", v4i32, X86Unpckh, VR128,
i128mem, SchedWriteShuffle.XMM, loadv2i64, 0>,		i128mem, SchedWriteShuffle.XMM, load, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
defm VPUNPCKHQDQ : sse2_unpack<0x6D, "vpunpckhqdq", v2i64, X86Unpckh, VR128,		defm VPUNPCKHQDQ : sse2_unpack<0x6D, "vpunpckhqdq", v2i64, X86Unpckh, VR128,
i128mem, SchedWriteShuffle.XMM, loadv2i64, 0>,		i128mem, SchedWriteShuffle.XMM, load, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
}		}

let Predicates = [HasAVX2, NoVLX_Or_NoBWI] in {		let Predicates = [HasAVX2, NoVLX_Or_NoBWI] in {
defm VPUNPCKLBWY : sse2_unpack<0x60, "vpunpcklbw", v32i8, X86Unpckl, VR256,		defm VPUNPCKLBWY : sse2_unpack<0x60, "vpunpcklbw", v32i8, X86Unpckl, VR256,
i256mem, SchedWriteShuffle.YMM, loadv4i64, 0>,		i256mem, SchedWriteShuffle.YMM, load, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
defm VPUNPCKLWDY : sse2_unpack<0x61, "vpunpcklwd", v16i16, X86Unpckl, VR256,		defm VPUNPCKLWDY : sse2_unpack<0x61, "vpunpcklwd", v16i16, X86Unpckl, VR256,
i256mem, SchedWriteShuffle.YMM, loadv4i64, 0>,		i256mem, SchedWriteShuffle.YMM, load, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
defm VPUNPCKHBWY : sse2_unpack<0x68, "vpunpckhbw", v32i8, X86Unpckh, VR256,		defm VPUNPCKHBWY : sse2_unpack<0x68, "vpunpckhbw", v32i8, X86Unpckh, VR256,
i256mem, SchedWriteShuffle.YMM, loadv4i64, 0>,		i256mem, SchedWriteShuffle.YMM, load, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
defm VPUNPCKHWDY : sse2_unpack<0x69, "vpunpckhwd", v16i16, X86Unpckh, VR256,		defm VPUNPCKHWDY : sse2_unpack<0x69, "vpunpckhwd", v16i16, X86Unpckh, VR256,
i256mem, SchedWriteShuffle.YMM, loadv4i64, 0>,		i256mem, SchedWriteShuffle.YMM, load, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
}		}

let Predicates = [HasAVX2, NoVLX] in {		let Predicates = [HasAVX2, NoVLX] in {
defm VPUNPCKLDQY : sse2_unpack<0x62, "vpunpckldq", v8i32, X86Unpckl, VR256,		defm VPUNPCKLDQY : sse2_unpack<0x62, "vpunpckldq", v8i32, X86Unpckl, VR256,
i256mem, SchedWriteShuffle.YMM, loadv4i64, 0>,		i256mem, SchedWriteShuffle.YMM, load, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
defm VPUNPCKLQDQY : sse2_unpack<0x6C, "vpunpcklqdq", v4i64, X86Unpckl, VR256,		defm VPUNPCKLQDQY : sse2_unpack<0x6C, "vpunpcklqdq", v4i64, X86Unpckl, VR256,
i256mem, SchedWriteShuffle.YMM, loadv4i64, 0>,		i256mem, SchedWriteShuffle.YMM, load, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
defm VPUNPCKHDQY : sse2_unpack<0x6A, "vpunpckhdq", v8i32, X86Unpckh, VR256,		defm VPUNPCKHDQY : sse2_unpack<0x6A, "vpunpckhdq", v8i32, X86Unpckh, VR256,
i256mem, SchedWriteShuffle.YMM, loadv4i64, 0>,		i256mem, SchedWriteShuffle.YMM, load, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
defm VPUNPCKHQDQY : sse2_unpack<0x6D, "vpunpckhqdq", v4i64, X86Unpckh, VR256,		defm VPUNPCKHQDQY : sse2_unpack<0x6D, "vpunpckhqdq", v4i64, X86Unpckh, VR256,
i256mem, SchedWriteShuffle.YMM, loadv4i64, 0>,		i256mem, SchedWriteShuffle.YMM, load, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
}		}

let Constraints = "$src1 = $dst" in {		let Constraints = "$src1 = $dst" in {
defm PUNPCKLBW : sse2_unpack<0x60, "punpcklbw", v16i8, X86Unpckl, VR128,		defm PUNPCKLBW : sse2_unpack<0x60, "punpcklbw", v16i8, X86Unpckl, VR128,
i128mem, SchedWriteShuffle.XMM, memopv2i64>;		i128mem, SchedWriteShuffle.XMM, memop>;
defm PUNPCKLWD : sse2_unpack<0x61, "punpcklwd", v8i16, X86Unpckl, VR128,		defm PUNPCKLWD : sse2_unpack<0x61, "punpcklwd", v8i16, X86Unpckl, VR128,
i128mem, SchedWriteShuffle.XMM, memopv2i64>;		i128mem, SchedWriteShuffle.XMM, memop>;
defm PUNPCKLDQ : sse2_unpack<0x62, "punpckldq", v4i32, X86Unpckl, VR128,		defm PUNPCKLDQ : sse2_unpack<0x62, "punpckldq", v4i32, X86Unpckl, VR128,
i128mem, SchedWriteShuffle.XMM, memopv2i64>;		i128mem, SchedWriteShuffle.XMM, memop>;
defm PUNPCKLQDQ : sse2_unpack<0x6C, "punpcklqdq", v2i64, X86Unpckl, VR128,		defm PUNPCKLQDQ : sse2_unpack<0x6C, "punpcklqdq", v2i64, X86Unpckl, VR128,
i128mem, SchedWriteShuffle.XMM, memopv2i64>;		i128mem, SchedWriteShuffle.XMM, memop>;

defm PUNPCKHBW : sse2_unpack<0x68, "punpckhbw", v16i8, X86Unpckh, VR128,		defm PUNPCKHBW : sse2_unpack<0x68, "punpckhbw", v16i8, X86Unpckh, VR128,
i128mem, SchedWriteShuffle.XMM, memopv2i64>;		i128mem, SchedWriteShuffle.XMM, memop>;
defm PUNPCKHWD : sse2_unpack<0x69, "punpckhwd", v8i16, X86Unpckh, VR128,		defm PUNPCKHWD : sse2_unpack<0x69, "punpckhwd", v8i16, X86Unpckh, VR128,
i128mem, SchedWriteShuffle.XMM, memopv2i64>;		i128mem, SchedWriteShuffle.XMM, memop>;
defm PUNPCKHDQ : sse2_unpack<0x6A, "punpckhdq", v4i32, X86Unpckh, VR128,		defm PUNPCKHDQ : sse2_unpack<0x6A, "punpckhdq", v4i32, X86Unpckh, VR128,
i128mem, SchedWriteShuffle.XMM, memopv2i64>;		i128mem, SchedWriteShuffle.XMM, memop>;
defm PUNPCKHQDQ : sse2_unpack<0x6D, "punpckhqdq", v2i64, X86Unpckh, VR128,		defm PUNPCKHQDQ : sse2_unpack<0x6D, "punpckhqdq", v2i64, X86Unpckh, VR128,
i128mem, SchedWriteShuffle.XMM, memopv2i64>;		i128mem, SchedWriteShuffle.XMM, memop>;
}		}
} // ExeDomain = SSEPackedInt		} // ExeDomain = SSEPackedInt

//===---------------------------------------------------------------------===//		//===---------------------------------------------------------------------===//
// SSE2 - Packed Integer Extract and Insert		// SSE2 - Packed Integer Extract and Insert
//===---------------------------------------------------------------------===//		//===---------------------------------------------------------------------===//

let ExeDomain = SSEPackedInt in {		let ExeDomain = SSEPackedInt in {
▲ Show 20 Lines • Show All 302 Lines • ▼ Show 20 Lines	def : Pat<(v4i64 (X86vzmovl (insert_subvector undef,
(v2i64 (scalar_to_vector GR64:$src)),(iPTR 0)))),		(v2i64 (scalar_to_vector GR64:$src)),(iPTR 0)))),
(SUBREG_TO_REG (i64 0), (v2i64 (VMOV64toPQIrr GR64:$src)), sub_xmm)>;		(SUBREG_TO_REG (i64 0), (v2i64 (VMOV64toPQIrr GR64:$src)), sub_xmm)>;
// AVX 128-bit movd/movq instructions write zeros in the high 128-bit part.		// AVX 128-bit movd/movq instructions write zeros in the high 128-bit part.
// These instructions also write zeros in the high part of a 256-bit register.		// These instructions also write zeros in the high part of a 256-bit register.
def : Pat<(v2i64 (X86vzmovl (v2i64 (scalar_to_vector (zextloadi64i32 addr:$src))))),		def : Pat<(v2i64 (X86vzmovl (v2i64 (scalar_to_vector (zextloadi64i32 addr:$src))))),
(VMOVDI2PDIrm addr:$src)>;		(VMOVDI2PDIrm addr:$src)>;
def : Pat<(v4i32 (X86vzmovl (v4i32 (scalar_to_vector (loadi32 addr:$src))))),		def : Pat<(v4i32 (X86vzmovl (v4i32 (scalar_to_vector (loadi32 addr:$src))))),
(VMOVDI2PDIrm addr:$src)>;		(VMOVDI2PDIrm addr:$src)>;
def : Pat<(v4i32 (X86vzmovl (bc_v4i32 (loadv2i64 addr:$src)))),		def : Pat<(v4i32 (X86vzmovl (loadv4i32 addr:$src))),
(VMOVDI2PDIrm addr:$src)>;		(VMOVDI2PDIrm addr:$src)>;
def : Pat<(v4i32 (X86vzload addr:$src)),		def : Pat<(v4i32 (X86vzload addr:$src)),
(VMOVDI2PDIrm addr:$src)>;		(VMOVDI2PDIrm addr:$src)>;
def : Pat<(v8i32 (X86vzmovl (insert_subvector undef,		def : Pat<(v8i32 (X86vzmovl (insert_subvector undef,
(v4i32 (scalar_to_vector (loadi32 addr:$src))), (iPTR 0)))),		(v4i32 (scalar_to_vector (loadi32 addr:$src))), (iPTR 0)))),
(SUBREG_TO_REG (i32 0), (v4i32 (VMOVDI2PDIrm addr:$src)), sub_xmm)>;		(SUBREG_TO_REG (i32 0), (v4i32 (VMOVDI2PDIrm addr:$src)), sub_xmm)>;
def : Pat<(v8i32 (X86vzload addr:$src)),		def : Pat<(v8i32 (X86vzload addr:$src)),
(SUBREG_TO_REG (i64 0), (v4i32 (VMOVDI2PDIrm addr:$src)), sub_xmm)>;		(SUBREG_TO_REG (i64 0), (v4i32 (VMOVDI2PDIrm addr:$src)), sub_xmm)>;
// Use regular 128-bit instructions to match 256-bit scalar_to_vec+zext.		// Use regular 128-bit instructions to match 256-bit scalar_to_vec+zext.
def : Pat<(v8i32 (X86vzmovl (insert_subvector undef,		def : Pat<(v8i32 (X86vzmovl (insert_subvector undef,
(v4i32 (scalar_to_vector GR32:$src)),(iPTR 0)))),		(v4i32 (scalar_to_vector GR32:$src)),(iPTR 0)))),
(SUBREG_TO_REG (i32 0), (v4i32 (VMOVDI2PDIrr GR32:$src)), sub_xmm)>;		(SUBREG_TO_REG (i32 0), (v4i32 (VMOVDI2PDIrr GR32:$src)), sub_xmm)>;
}		}

let Predicates = [UseSSE2] in {		let Predicates = [UseSSE2] in {
def : Pat<(v4i32 (X86vzmovl (v4i32 (scalar_to_vector GR32:$src)))),		def : Pat<(v4i32 (X86vzmovl (v4i32 (scalar_to_vector GR32:$src)))),
(MOVDI2PDIrr GR32:$src)>;		(MOVDI2PDIrr GR32:$src)>;

def : Pat<(v2i64 (X86vzmovl (v2i64 (scalar_to_vector GR64:$src)))),		def : Pat<(v2i64 (X86vzmovl (v2i64 (scalar_to_vector GR64:$src)))),
(MOV64toPQIrr GR64:$src)>;		(MOV64toPQIrr GR64:$src)>;
def : Pat<(v2i64 (X86vzmovl (v2i64 (scalar_to_vector (zextloadi64i32 addr:$src))))),		def : Pat<(v2i64 (X86vzmovl (v2i64 (scalar_to_vector (zextloadi64i32 addr:$src))))),
(MOVDI2PDIrm addr:$src)>;		(MOVDI2PDIrm addr:$src)>;
def : Pat<(v4i32 (X86vzmovl (v4i32 (scalar_to_vector (loadi32 addr:$src))))),		def : Pat<(v4i32 (X86vzmovl (v4i32 (scalar_to_vector (loadi32 addr:$src))))),
(MOVDI2PDIrm addr:$src)>;		(MOVDI2PDIrm addr:$src)>;
def : Pat<(v4i32 (X86vzmovl (bc_v4i32 (loadv2i64 addr:$src)))),		def : Pat<(v4i32 (X86vzmovl (loadv4i32 addr:$src))),
(MOVDI2PDIrm addr:$src)>;		(MOVDI2PDIrm addr:$src)>;
def : Pat<(v4i32 (X86vzload addr:$src)),		def : Pat<(v4i32 (X86vzload addr:$src)),
(MOVDI2PDIrm addr:$src)>;		(MOVDI2PDIrm addr:$src)>;
}		}

// Before the MC layer of LLVM existed, clang emitted "movd" assembly instead of		// Before the MC layer of LLVM existed, clang emitted "movd" assembly instead of
// "movq" due to MacOS parsing limitation. In order to parse old assembly, we add		// "movq" due to MacOS parsing limitation. In order to parse old assembly, we add
// these aliases.		// these aliases.
▲ Show 20 Lines • Show All 138 Lines • ▼ Show 20 Lines
defm MOVSHDUP : sse3_replicate_sfp<0x16, X86Movshdup, "movshdup", v4f32, VR128,		defm MOVSHDUP : sse3_replicate_sfp<0x16, X86Movshdup, "movshdup", v4f32, VR128,
memopv4f32, f128mem, SchedWriteFShuffle.XMM>;		memopv4f32, f128mem, SchedWriteFShuffle.XMM>;
defm MOVSLDUP : sse3_replicate_sfp<0x12, X86Movsldup, "movsldup", v4f32, VR128,		defm MOVSLDUP : sse3_replicate_sfp<0x12, X86Movsldup, "movsldup", v4f32, VR128,
memopv4f32, f128mem, SchedWriteFShuffle.XMM>;		memopv4f32, f128mem, SchedWriteFShuffle.XMM>;

let Predicates = [HasAVX, NoVLX] in {		let Predicates = [HasAVX, NoVLX] in {
def : Pat<(v4i32 (X86Movshdup VR128:$src)),		def : Pat<(v4i32 (X86Movshdup VR128:$src)),
(VMOVSHDUPrr VR128:$src)>;		(VMOVSHDUPrr VR128:$src)>;
def : Pat<(v4i32 (X86Movshdup (bc_v4i32 (loadv2i64 addr:$src)))),		def : Pat<(v4i32 (X86Movshdup (load addr:$src))),
(VMOVSHDUPrm addr:$src)>;		(VMOVSHDUPrm addr:$src)>;
def : Pat<(v4i32 (X86Movsldup VR128:$src)),		def : Pat<(v4i32 (X86Movsldup VR128:$src)),
(VMOVSLDUPrr VR128:$src)>;		(VMOVSLDUPrr VR128:$src)>;
def : Pat<(v4i32 (X86Movsldup (bc_v4i32 (loadv2i64 addr:$src)))),		def : Pat<(v4i32 (X86Movsldup (load addr:$src))),
(VMOVSLDUPrm addr:$src)>;		(VMOVSLDUPrm addr:$src)>;
def : Pat<(v8i32 (X86Movshdup VR256:$src)),		def : Pat<(v8i32 (X86Movshdup VR256:$src)),
(VMOVSHDUPYrr VR256:$src)>;		(VMOVSHDUPYrr VR256:$src)>;
def : Pat<(v8i32 (X86Movshdup (bc_v8i32 (loadv4i64 addr:$src)))),		def : Pat<(v8i32 (X86Movshdup (load addr:$src))),
(VMOVSHDUPYrm addr:$src)>;		(VMOVSHDUPYrm addr:$src)>;
def : Pat<(v8i32 (X86Movsldup VR256:$src)),		def : Pat<(v8i32 (X86Movsldup VR256:$src)),
(VMOVSLDUPYrr VR256:$src)>;		(VMOVSLDUPYrr VR256:$src)>;
def : Pat<(v8i32 (X86Movsldup (bc_v8i32 (loadv4i64 addr:$src)))),		def : Pat<(v8i32 (X86Movsldup (load addr:$src))),
(VMOVSLDUPYrm addr:$src)>;		(VMOVSLDUPYrm addr:$src)>;
}		}

let Predicates = [UseSSE3] in {		let Predicates = [UseSSE3] in {
def : Pat<(v4i32 (X86Movshdup VR128:$src)),		def : Pat<(v4i32 (X86Movshdup VR128:$src)),
(MOVSHDUPrr VR128:$src)>;		(MOVSHDUPrr VR128:$src)>;
def : Pat<(v4i32 (X86Movshdup (bc_v4i32 (memopv2i64 addr:$src)))),		def : Pat<(v4i32 (X86Movshdup (memop addr:$src))),
(MOVSHDUPrm addr:$src)>;		(MOVSHDUPrm addr:$src)>;
def : Pat<(v4i32 (X86Movsldup VR128:$src)),		def : Pat<(v4i32 (X86Movsldup VR128:$src)),
(MOVSLDUPrr VR128:$src)>;		(MOVSLDUPrr VR128:$src)>;
def : Pat<(v4i32 (X86Movsldup (bc_v4i32 (memopv2i64 addr:$src)))),		def : Pat<(v4i32 (X86Movsldup (memop addr:$src))),
(MOVSLDUPrm addr:$src)>;		(MOVSLDUPrm addr:$src)>;
}		}

//===---------------------------------------------------------------------===//		//===---------------------------------------------------------------------===//
// SSE3 - Replicate Double FP - MOVDDUP		// SSE3 - Replicate Double FP - MOVDDUP
//===---------------------------------------------------------------------===//		//===---------------------------------------------------------------------===//

multiclass sse3_replicate_dfp<string OpcodeStr, X86SchedWriteWidths sched> {		multiclass sse3_replicate_dfp<string OpcodeStr, X86SchedWriteWidths sched> {
▲ Show 20 Lines • Show All 205 Lines • ▼ Show 20 Lines	def rr : SS38I<opc, MRMSrcReg, (outs VR128:$dst),
!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),		!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),
[(set VR128:$dst, (vt (OpNode VR128:$src)))]>,		[(set VR128:$dst, (vt (OpNode VR128:$src)))]>,
Sched<[sched.XMM]>;		Sched<[sched.XMM]>;

def rm : SS38I<opc, MRMSrcMem, (outs VR128:$dst),		def rm : SS38I<opc, MRMSrcMem, (outs VR128:$dst),
(ins i128mem:$src),		(ins i128mem:$src),
!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),		!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),
[(set VR128:$dst,		[(set VR128:$dst,
(vt (OpNode (bitconvert (ld_frag addr:$src)))))]>,		(vt (OpNode (ld_frag addr:$src))))]>,
Sched<[sched.XMM.Folded]>;		Sched<[sched.XMM.Folded]>;
}		}

/// SS3I_unop_rm_int_y - Simple SSSE3 unary op whose type can be v*{i8,i16,i32}.		/// SS3I_unop_rm_int_y - Simple SSSE3 unary op whose type can be v*{i8,i16,i32}.
multiclass SS3I_unop_rm_y<bits<8> opc, string OpcodeStr, ValueType vt,		multiclass SS3I_unop_rm_y<bits<8> opc, string OpcodeStr, ValueType vt,
SDNode OpNode, X86SchedWriteWidths sched> {		SDNode OpNode, X86SchedWriteWidths sched> {
def Yrr : SS38I<opc, MRMSrcReg, (outs VR256:$dst),		def Yrr : SS38I<opc, MRMSrcReg, (outs VR256:$dst),
(ins VR256:$src),		(ins VR256:$src),
!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),		!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),
[(set VR256:$dst, (vt (OpNode VR256:$src)))]>,		[(set VR256:$dst, (vt (OpNode VR256:$src)))]>,
Sched<[sched.YMM]>;		Sched<[sched.YMM]>;

def Yrm : SS38I<opc, MRMSrcMem, (outs VR256:$dst),		def Yrm : SS38I<opc, MRMSrcMem, (outs VR256:$dst),
(ins i256mem:$src),		(ins i256mem:$src),
!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),		!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),
[(set VR256:$dst,		[(set VR256:$dst,
(vt (OpNode (bitconvert (loadv4i64 addr:$src)))))]>,		(vt (OpNode (load addr:$src))))]>,
Sched<[sched.YMM.Folded]>;		Sched<[sched.YMM.Folded]>;
}		}

let Predicates = [HasAVX, NoVLX_Or_NoBWI] in {		let Predicates = [HasAVX, NoVLX_Or_NoBWI] in {
defm VPABSB : SS3I_unop_rm<0x1C, "vpabsb", v16i8, abs, SchedWriteVecALU,		defm VPABSB : SS3I_unop_rm<0x1C, "vpabsb", v16i8, abs, SchedWriteVecALU,
loadv2i64>, VEX, VEX_WIG;		load>, VEX, VEX_WIG;
defm VPABSW : SS3I_unop_rm<0x1D, "vpabsw", v8i16, abs, SchedWriteVecALU,		defm VPABSW : SS3I_unop_rm<0x1D, "vpabsw", v8i16, abs, SchedWriteVecALU,
loadv2i64>, VEX, VEX_WIG;		load>, VEX, VEX_WIG;
}		}
let Predicates = [HasAVX, NoVLX] in {		let Predicates = [HasAVX, NoVLX] in {
defm VPABSD : SS3I_unop_rm<0x1E, "vpabsd", v4i32, abs, SchedWriteVecALU,		defm VPABSD : SS3I_unop_rm<0x1E, "vpabsd", v4i32, abs, SchedWriteVecALU,
loadv2i64>, VEX, VEX_WIG;		load>, VEX, VEX_WIG;
}		}
let Predicates = [HasAVX2, NoVLX_Or_NoBWI] in {		let Predicates = [HasAVX2, NoVLX_Or_NoBWI] in {
defm VPABSB : SS3I_unop_rm_y<0x1C, "vpabsb", v32i8, abs, SchedWriteVecALU>,		defm VPABSB : SS3I_unop_rm_y<0x1C, "vpabsb", v32i8, abs, SchedWriteVecALU>,
VEX, VEX_L, VEX_WIG;		VEX, VEX_L, VEX_WIG;
defm VPABSW : SS3I_unop_rm_y<0x1D, "vpabsw", v16i16, abs, SchedWriteVecALU>,		defm VPABSW : SS3I_unop_rm_y<0x1D, "vpabsw", v16i16, abs, SchedWriteVecALU>,
VEX, VEX_L, VEX_WIG;		VEX, VEX_L, VEX_WIG;
}		}
let Predicates = [HasAVX2, NoVLX] in {		let Predicates = [HasAVX2, NoVLX] in {
defm VPABSD : SS3I_unop_rm_y<0x1E, "vpabsd", v8i32, abs, SchedWriteVecALU>,		defm VPABSD : SS3I_unop_rm_y<0x1E, "vpabsd", v8i32, abs, SchedWriteVecALU>,
VEX, VEX_L, VEX_WIG;		VEX, VEX_L, VEX_WIG;
}		}

defm PABSB : SS3I_unop_rm<0x1C, "pabsb", v16i8, abs, SchedWriteVecALU,		defm PABSB : SS3I_unop_rm<0x1C, "pabsb", v16i8, abs, SchedWriteVecALU,
memopv2i64>;		memop>;
defm PABSW : SS3I_unop_rm<0x1D, "pabsw", v8i16, abs, SchedWriteVecALU,		defm PABSW : SS3I_unop_rm<0x1D, "pabsw", v8i16, abs, SchedWriteVecALU,
memopv2i64>;		memop>;
defm PABSD : SS3I_unop_rm<0x1E, "pabsd", v4i32, abs, SchedWriteVecALU,		defm PABSD : SS3I_unop_rm<0x1E, "pabsd", v4i32, abs, SchedWriteVecALU,
memopv2i64>;		memop>;

//===---------------------------------------------------------------------===//		//===---------------------------------------------------------------------===//
// SSSE3 - Packed Binary Operator Instructions		// SSSE3 - Packed Binary Operator Instructions
//===---------------------------------------------------------------------===//		//===---------------------------------------------------------------------===//

/// SS3I_binop_rm - Simple SSSE3 bin op		/// SS3I_binop_rm - Simple SSSE3 bin op
multiclass SS3I_binop_rm<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass SS3I_binop_rm<bits<8> opc, string OpcodeStr, SDNode OpNode,
ValueType DstVT, ValueType OpVT, RegisterClass RC,		ValueType DstVT, ValueType OpVT, RegisterClass RC,
PatFrag memop_frag, X86MemOperand x86memop,		PatFrag memop_frag, X86MemOperand x86memop,
X86FoldableSchedWrite sched, bit Is2Addr = 1> {		X86FoldableSchedWrite sched, bit Is2Addr = 1> {
let isCommutable = 1 in		let isCommutable = 1 in
def rr : SS38I<opc, MRMSrcReg, (outs RC:$dst),		def rr : SS38I<opc, MRMSrcReg, (outs RC:$dst),
(ins RC:$src1, RC:$src2),		(ins RC:$src1, RC:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst, (DstVT (OpNode (OpVT RC:$src1), RC:$src2)))]>,		[(set RC:$dst, (DstVT (OpNode (OpVT RC:$src1), RC:$src2)))]>,
Sched<[sched]>;		Sched<[sched]>;
def rm : SS38I<opc, MRMSrcMem, (outs RC:$dst),		def rm : SS38I<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop:$src2),		(ins RC:$src1, x86memop:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst,		[(set RC:$dst,
(DstVT (OpNode (OpVT RC:$src1),		(DstVT (OpNode (OpVT RC:$src1), (memop_frag addr:$src2))))]>,
(bitconvert (memop_frag addr:$src2)))))]>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

/// SS3I_binop_rm_int - Simple SSSE3 bin op whose type can be v*{i8,i16,i32}.		/// SS3I_binop_rm_int - Simple SSSE3 bin op whose type can be v*{i8,i16,i32}.
multiclass SS3I_binop_rm_int<bits<8> opc, string OpcodeStr,		multiclass SS3I_binop_rm_int<bits<8> opc, string OpcodeStr,
Intrinsic IntId128, X86FoldableSchedWrite sched,		Intrinsic IntId128, X86FoldableSchedWrite sched,
PatFrag ld_frag, bit Is2Addr = 1> {		PatFrag ld_frag, bit Is2Addr = 1> {
let isCommutable = 1 in		let isCommutable = 1 in
def rr : SS38I<opc, MRMSrcReg, (outs VR128:$dst),		def rr : SS38I<opc, MRMSrcReg, (outs VR128:$dst),
(ins VR128:$src1, VR128:$src2),		(ins VR128:$src1, VR128:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set VR128:$dst, (IntId128 VR128:$src1, VR128:$src2))]>,		[(set VR128:$dst, (IntId128 VR128:$src1, VR128:$src2))]>,
Sched<[sched]>;		Sched<[sched]>;
def rm : SS38I<opc, MRMSrcMem, (outs VR128:$dst),		def rm : SS38I<opc, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, i128mem:$src2),		(ins VR128:$src1, i128mem:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set VR128:$dst,		[(set VR128:$dst,
(IntId128 VR128:$src1,		(IntId128 VR128:$src1, (ld_frag addr:$src2)))]>,
(bitconvert (ld_frag addr:$src2))))]>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass SS3I_binop_rm_int_y<bits<8> opc, string OpcodeStr,		multiclass SS3I_binop_rm_int_y<bits<8> opc, string OpcodeStr,
Intrinsic IntId256,		Intrinsic IntId256,
X86FoldableSchedWrite sched> {		X86FoldableSchedWrite sched> {
let isCommutable = 1 in		let isCommutable = 1 in
def Yrr : SS38I<opc, MRMSrcReg, (outs VR256:$dst),		def Yrr : SS38I<opc, MRMSrcReg, (outs VR256:$dst),
(ins VR256:$src1, VR256:$src2),		(ins VR256:$src1, VR256:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR256:$dst, (IntId256 VR256:$src1, VR256:$src2))]>,		[(set VR256:$dst, (IntId256 VR256:$src1, VR256:$src2))]>,
Sched<[sched]>;		Sched<[sched]>;
def Yrm : SS38I<opc, MRMSrcMem, (outs VR256:$dst),		def Yrm : SS38I<opc, MRMSrcMem, (outs VR256:$dst),
(ins VR256:$src1, i256mem:$src2),		(ins VR256:$src1, i256mem:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR256:$dst,		[(set VR256:$dst,
(IntId256 VR256:$src1, (bitconvert (loadv4i64 addr:$src2))))]>,		(IntId256 VR256:$src1, (load addr:$src2)))]>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let ImmT = NoImm, Predicates = [HasAVX, NoVLX_Or_NoBWI] in {		let ImmT = NoImm, Predicates = [HasAVX, NoVLX_Or_NoBWI] in {
let isCommutable = 0 in {		let isCommutable = 0 in {
defm VPSHUFB : SS3I_binop_rm<0x00, "vpshufb", X86pshufb, v16i8, v16i8,		defm VPSHUFB : SS3I_binop_rm<0x00, "vpshufb", X86pshufb, v16i8, v16i8,
VR128, loadv2i64, i128mem,		VR128, load, i128mem,
SchedWriteVarShuffle.XMM, 0>, VEX_4V, VEX_WIG;		SchedWriteVarShuffle.XMM, 0>, VEX_4V, VEX_WIG;
defm VPMADDUBSW : SS3I_binop_rm<0x04, "vpmaddubsw", X86vpmaddubsw, v8i16,		defm VPMADDUBSW : SS3I_binop_rm<0x04, "vpmaddubsw", X86vpmaddubsw, v8i16,
v16i8, VR128, loadv2i64, i128mem,		v16i8, VR128, load, i128mem,
SchedWriteVecIMul.XMM, 0>, VEX_4V, VEX_WIG;		SchedWriteVecIMul.XMM, 0>, VEX_4V, VEX_WIG;
}		}
defm VPMULHRSW : SS3I_binop_rm<0x0B, "vpmulhrsw", X86mulhrs, v8i16, v8i16,		defm VPMULHRSW : SS3I_binop_rm<0x0B, "vpmulhrsw", X86mulhrs, v8i16, v8i16,
VR128, loadv2i64, i128mem,		VR128, load, i128mem,
SchedWriteVecIMul.XMM, 0>, VEX_4V, VEX_WIG;		SchedWriteVecIMul.XMM, 0>, VEX_4V, VEX_WIG;
}		}

let ImmT = NoImm, Predicates = [HasAVX] in {		let ImmT = NoImm, Predicates = [HasAVX] in {
let isCommutable = 0 in {		let isCommutable = 0 in {
defm VPHADDW : SS3I_binop_rm<0x01, "vphaddw", X86hadd, v8i16, v8i16, VR128,		defm VPHADDW : SS3I_binop_rm<0x01, "vphaddw", X86hadd, v8i16, v8i16, VR128,
loadv2i64, i128mem,		load, i128mem,
SchedWritePHAdd.XMM, 0>, VEX_4V, VEX_WIG;		SchedWritePHAdd.XMM, 0>, VEX_4V, VEX_WIG;
defm VPHADDD : SS3I_binop_rm<0x02, "vphaddd", X86hadd, v4i32, v4i32, VR128,		defm VPHADDD : SS3I_binop_rm<0x02, "vphaddd", X86hadd, v4i32, v4i32, VR128,
loadv2i64, i128mem,		load, i128mem,
SchedWritePHAdd.XMM, 0>, VEX_4V, VEX_WIG;		SchedWritePHAdd.XMM, 0>, VEX_4V, VEX_WIG;
defm VPHSUBW : SS3I_binop_rm<0x05, "vphsubw", X86hsub, v8i16, v8i16, VR128,		defm VPHSUBW : SS3I_binop_rm<0x05, "vphsubw", X86hsub, v8i16, v8i16, VR128,
loadv2i64, i128mem,		load, i128mem,
SchedWritePHAdd.XMM, 0>, VEX_4V, VEX_WIG;		SchedWritePHAdd.XMM, 0>, VEX_4V, VEX_WIG;
defm VPHSUBD : SS3I_binop_rm<0x06, "vphsubd", X86hsub, v4i32, v4i32, VR128,		defm VPHSUBD : SS3I_binop_rm<0x06, "vphsubd", X86hsub, v4i32, v4i32, VR128,
loadv2i64, i128mem,		load, i128mem,
SchedWritePHAdd.XMM, 0>, VEX_4V;		SchedWritePHAdd.XMM, 0>, VEX_4V;
defm VPSIGNB : SS3I_binop_rm_int<0x08, "vpsignb",		defm VPSIGNB : SS3I_binop_rm_int<0x08, "vpsignb",
int_x86_ssse3_psign_b_128,		int_x86_ssse3_psign_b_128,
SchedWriteVecALU.XMM, loadv2i64, 0>, VEX_4V, VEX_WIG;		SchedWriteVecALU.XMM, load, 0>, VEX_4V, VEX_WIG;
defm VPSIGNW : SS3I_binop_rm_int<0x09, "vpsignw",		defm VPSIGNW : SS3I_binop_rm_int<0x09, "vpsignw",
int_x86_ssse3_psign_w_128,		int_x86_ssse3_psign_w_128,
SchedWriteVecALU.XMM, loadv2i64, 0>, VEX_4V, VEX_WIG;		SchedWriteVecALU.XMM, load, 0>, VEX_4V, VEX_WIG;
defm VPSIGND : SS3I_binop_rm_int<0x0A, "vpsignd",		defm VPSIGND : SS3I_binop_rm_int<0x0A, "vpsignd",
int_x86_ssse3_psign_d_128,		int_x86_ssse3_psign_d_128,
SchedWriteVecALU.XMM, loadv2i64, 0>, VEX_4V, VEX_WIG;		SchedWriteVecALU.XMM, load, 0>, VEX_4V, VEX_WIG;
defm VPHADDSW : SS3I_binop_rm_int<0x03, "vphaddsw",		defm VPHADDSW : SS3I_binop_rm_int<0x03, "vphaddsw",
int_x86_ssse3_phadd_sw_128,		int_x86_ssse3_phadd_sw_128,
SchedWritePHAdd.XMM, loadv2i64, 0>, VEX_4V, VEX_WIG;		SchedWritePHAdd.XMM, load, 0>, VEX_4V, VEX_WIG;
defm VPHSUBSW : SS3I_binop_rm_int<0x07, "vphsubsw",		defm VPHSUBSW : SS3I_binop_rm_int<0x07, "vphsubsw",
int_x86_ssse3_phsub_sw_128,		int_x86_ssse3_phsub_sw_128,
SchedWritePHAdd.XMM, loadv2i64, 0>, VEX_4V, VEX_WIG;		SchedWritePHAdd.XMM, load, 0>, VEX_4V, VEX_WIG;
}		}
}		}

let ImmT = NoImm, Predicates = [HasAVX2, NoVLX_Or_NoBWI] in {		let ImmT = NoImm, Predicates = [HasAVX2, NoVLX_Or_NoBWI] in {
let isCommutable = 0 in {		let isCommutable = 0 in {
defm VPSHUFBY : SS3I_binop_rm<0x00, "vpshufb", X86pshufb, v32i8, v32i8,		defm VPSHUFBY : SS3I_binop_rm<0x00, "vpshufb", X86pshufb, v32i8, v32i8,
VR256, loadv4i64, i256mem,		VR256, load, i256mem,
SchedWriteVarShuffle.YMM, 0>, VEX_4V, VEX_L, VEX_WIG;		SchedWriteVarShuffle.YMM, 0>, VEX_4V, VEX_L, VEX_WIG;
defm VPMADDUBSWY : SS3I_binop_rm<0x04, "vpmaddubsw", X86vpmaddubsw, v16i16,		defm VPMADDUBSWY : SS3I_binop_rm<0x04, "vpmaddubsw", X86vpmaddubsw, v16i16,
v32i8, VR256, loadv4i64, i256mem,		v32i8, VR256, load, i256mem,
SchedWriteVecIMul.YMM, 0>, VEX_4V, VEX_L, VEX_WIG;		SchedWriteVecIMul.YMM, 0>, VEX_4V, VEX_L, VEX_WIG;
}		}
defm VPMULHRSWY : SS3I_binop_rm<0x0B, "vpmulhrsw", X86mulhrs, v16i16, v16i16,		defm VPMULHRSWY : SS3I_binop_rm<0x0B, "vpmulhrsw", X86mulhrs, v16i16, v16i16,
VR256, loadv4i64, i256mem,		VR256, load, i256mem,
SchedWriteVecIMul.YMM, 0>, VEX_4V, VEX_L, VEX_WIG;		SchedWriteVecIMul.YMM, 0>, VEX_4V, VEX_L, VEX_WIG;
}		}

let ImmT = NoImm, Predicates = [HasAVX2] in {		let ImmT = NoImm, Predicates = [HasAVX2] in {
let isCommutable = 0 in {		let isCommutable = 0 in {
defm VPHADDWY : SS3I_binop_rm<0x01, "vphaddw", X86hadd, v16i16, v16i16,		defm VPHADDWY : SS3I_binop_rm<0x01, "vphaddw", X86hadd, v16i16, v16i16,
VR256, loadv4i64, i256mem,		VR256, load, i256mem,
SchedWritePHAdd.YMM, 0>, VEX_4V, VEX_L, VEX_WIG;		SchedWritePHAdd.YMM, 0>, VEX_4V, VEX_L, VEX_WIG;
defm VPHADDDY : SS3I_binop_rm<0x02, "vphaddd", X86hadd, v8i32, v8i32, VR256,		defm VPHADDDY : SS3I_binop_rm<0x02, "vphaddd", X86hadd, v8i32, v8i32, VR256,
loadv4i64, i256mem,		load, i256mem,
SchedWritePHAdd.YMM, 0>, VEX_4V, VEX_L, VEX_WIG;		SchedWritePHAdd.YMM, 0>, VEX_4V, VEX_L, VEX_WIG;
defm VPHSUBWY : SS3I_binop_rm<0x05, "vphsubw", X86hsub, v16i16, v16i16,		defm VPHSUBWY : SS3I_binop_rm<0x05, "vphsubw", X86hsub, v16i16, v16i16,
VR256, loadv4i64, i256mem,		VR256, load, i256mem,
SchedWritePHAdd.YMM, 0>, VEX_4V, VEX_L, VEX_WIG;		SchedWritePHAdd.YMM, 0>, VEX_4V, VEX_L, VEX_WIG;
defm VPHSUBDY : SS3I_binop_rm<0x06, "vphsubd", X86hsub, v8i32, v8i32, VR256,		defm VPHSUBDY : SS3I_binop_rm<0x06, "vphsubd", X86hsub, v8i32, v8i32, VR256,
loadv4i64, i256mem,		load, i256mem,
SchedWritePHAdd.YMM, 0>, VEX_4V, VEX_L;		SchedWritePHAdd.YMM, 0>, VEX_4V, VEX_L;
defm VPSIGNB : SS3I_binop_rm_int_y<0x08, "vpsignb", int_x86_avx2_psign_b,		defm VPSIGNB : SS3I_binop_rm_int_y<0x08, "vpsignb", int_x86_avx2_psign_b,
SchedWriteVecALU.YMM>, VEX_4V, VEX_L, VEX_WIG;		SchedWriteVecALU.YMM>, VEX_4V, VEX_L, VEX_WIG;
defm VPSIGNW : SS3I_binop_rm_int_y<0x09, "vpsignw", int_x86_avx2_psign_w,		defm VPSIGNW : SS3I_binop_rm_int_y<0x09, "vpsignw", int_x86_avx2_psign_w,
SchedWriteVecALU.YMM>, VEX_4V, VEX_L, VEX_WIG;		SchedWriteVecALU.YMM>, VEX_4V, VEX_L, VEX_WIG;
defm VPSIGND : SS3I_binop_rm_int_y<0x0A, "vpsignd", int_x86_avx2_psign_d,		defm VPSIGND : SS3I_binop_rm_int_y<0x0A, "vpsignd", int_x86_avx2_psign_d,
SchedWriteVecALU.YMM>, VEX_4V, VEX_L, VEX_WIG;		SchedWriteVecALU.YMM>, VEX_4V, VEX_L, VEX_WIG;
defm VPHADDSW : SS3I_binop_rm_int_y<0x03, "vphaddsw",		defm VPHADDSW : SS3I_binop_rm_int_y<0x03, "vphaddsw",
int_x86_avx2_phadd_sw,		int_x86_avx2_phadd_sw,
SchedWritePHAdd.YMM>, VEX_4V, VEX_L, VEX_WIG;		SchedWritePHAdd.YMM>, VEX_4V, VEX_L, VEX_WIG;
defm VPHSUBSW : SS3I_binop_rm_int_y<0x07, "vphsubsw",		defm VPHSUBSW : SS3I_binop_rm_int_y<0x07, "vphsubsw",
int_x86_avx2_phsub_sw,		int_x86_avx2_phsub_sw,
SchedWritePHAdd.YMM>, VEX_4V, VEX_L, VEX_WIG;		SchedWritePHAdd.YMM>, VEX_4V, VEX_L, VEX_WIG;
}		}
}		}

// None of these have i8 immediate fields.		// None of these have i8 immediate fields.
let ImmT = NoImm, Constraints = "$src1 = $dst" in {		let ImmT = NoImm, Constraints = "$src1 = $dst" in {
let isCommutable = 0 in {		let isCommutable = 0 in {
defm PHADDW : SS3I_binop_rm<0x01, "phaddw", X86hadd, v8i16, v8i16, VR128,		defm PHADDW : SS3I_binop_rm<0x01, "phaddw", X86hadd, v8i16, v8i16, VR128,
memopv2i64, i128mem, SchedWritePHAdd.XMM>;		memop, i128mem, SchedWritePHAdd.XMM>;
defm PHADDD : SS3I_binop_rm<0x02, "phaddd", X86hadd, v4i32, v4i32, VR128,		defm PHADDD : SS3I_binop_rm<0x02, "phaddd", X86hadd, v4i32, v4i32, VR128,
memopv2i64, i128mem, SchedWritePHAdd.XMM>;		memop, i128mem, SchedWritePHAdd.XMM>;
defm PHSUBW : SS3I_binop_rm<0x05, "phsubw", X86hsub, v8i16, v8i16, VR128,		defm PHSUBW : SS3I_binop_rm<0x05, "phsubw", X86hsub, v8i16, v8i16, VR128,
memopv2i64, i128mem, SchedWritePHAdd.XMM>;		memop, i128mem, SchedWritePHAdd.XMM>;
defm PHSUBD : SS3I_binop_rm<0x06, "phsubd", X86hsub, v4i32, v4i32, VR128,		defm PHSUBD : SS3I_binop_rm<0x06, "phsubd", X86hsub, v4i32, v4i32, VR128,
memopv2i64, i128mem, SchedWritePHAdd.XMM>;		memop, i128mem, SchedWritePHAdd.XMM>;
defm PSIGNB : SS3I_binop_rm_int<0x08, "psignb", int_x86_ssse3_psign_b_128,		defm PSIGNB : SS3I_binop_rm_int<0x08, "psignb", int_x86_ssse3_psign_b_128,
SchedWriteVecALU.XMM, memopv2i64>;		SchedWriteVecALU.XMM, memop>;
defm PSIGNW : SS3I_binop_rm_int<0x09, "psignw", int_x86_ssse3_psign_w_128,		defm PSIGNW : SS3I_binop_rm_int<0x09, "psignw", int_x86_ssse3_psign_w_128,
SchedWriteVecALU.XMM, memopv2i64>;		SchedWriteVecALU.XMM, memop>;
defm PSIGND : SS3I_binop_rm_int<0x0A, "psignd", int_x86_ssse3_psign_d_128,		defm PSIGND : SS3I_binop_rm_int<0x0A, "psignd", int_x86_ssse3_psign_d_128,
SchedWriteVecALU.XMM, memopv2i64>;		SchedWriteVecALU.XMM, memop>;
defm PSHUFB : SS3I_binop_rm<0x00, "pshufb", X86pshufb, v16i8, v16i8, VR128,		defm PSHUFB : SS3I_binop_rm<0x00, "pshufb", X86pshufb, v16i8, v16i8, VR128,
memopv2i64, i128mem, SchedWriteVarShuffle.XMM>;		memop, i128mem, SchedWriteVarShuffle.XMM>;
defm PHADDSW : SS3I_binop_rm_int<0x03, "phaddsw",		defm PHADDSW : SS3I_binop_rm_int<0x03, "phaddsw",
int_x86_ssse3_phadd_sw_128,		int_x86_ssse3_phadd_sw_128,
SchedWritePHAdd.XMM, memopv2i64>;		SchedWritePHAdd.XMM, memop>;
defm PHSUBSW : SS3I_binop_rm_int<0x07, "phsubsw",		defm PHSUBSW : SS3I_binop_rm_int<0x07, "phsubsw",
int_x86_ssse3_phsub_sw_128,		int_x86_ssse3_phsub_sw_128,
SchedWritePHAdd.XMM, memopv2i64>;		SchedWritePHAdd.XMM, memop>;
defm PMADDUBSW : SS3I_binop_rm<0x04, "pmaddubsw", X86vpmaddubsw, v8i16,		defm PMADDUBSW : SS3I_binop_rm<0x04, "pmaddubsw", X86vpmaddubsw, v8i16,
v16i8, VR128, memopv2i64, i128mem,		v16i8, VR128, memop, i128mem,
SchedWriteVecIMul.XMM>;		SchedWriteVecIMul.XMM>;
}		}
defm PMULHRSW : SS3I_binop_rm<0x0B, "pmulhrsw", X86mulhrs, v8i16, v8i16,		defm PMULHRSW : SS3I_binop_rm<0x0B, "pmulhrsw", X86mulhrs, v8i16, v8i16,
VR128, memopv2i64, i128mem, SchedWriteVecIMul.XMM>;		VR128, memop, i128mem, SchedWriteVecIMul.XMM>;
}		}

//===---------------------------------------------------------------------===//		//===---------------------------------------------------------------------===//
// SSSE3 - Packed Align Instruction Patterns		// SSSE3 - Packed Align Instruction Patterns
//===---------------------------------------------------------------------===//		//===---------------------------------------------------------------------===//

multiclass ssse3_palignr<string asm, ValueType VT, RegisterClass RC,		multiclass ssse3_palignr<string asm, ValueType VT, RegisterClass RC,
PatFrag memop_frag, X86MemOperand x86memop,		PatFrag memop_frag, X86MemOperand x86memop,
Show All 10 Lines	multiclass ssse3_palignr<string asm, ValueType VT, RegisterClass RC,
let mayLoad = 1 in		let mayLoad = 1 in
def rmi : SS3AI<0x0F, MRMSrcMem, (outs RC:$dst),		def rmi : SS3AI<0x0F, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop:$src2, u8imm:$src3),		(ins RC:$src1, x86memop:$src2, u8imm:$src3),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(asm, "\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		!strconcat(asm, "\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
!strconcat(asm,		!strconcat(asm,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),
[(set RC:$dst, (VT (X86PAlignr RC:$src1,		[(set RC:$dst, (VT (X86PAlignr RC:$src1,
(bitconvert (memop_frag addr:$src2)),		(memop_frag addr:$src2),
(i8 imm:$src3))))]>,		(i8 imm:$src3))))]>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

let Predicates = [HasAVX, NoVLX_Or_NoBWI] in		let Predicates = [HasAVX, NoVLX_Or_NoBWI] in
defm VPALIGNR : ssse3_palignr<"vpalignr", v16i8, VR128, loadv2i64, i128mem,		defm VPALIGNR : ssse3_palignr<"vpalignr", v16i8, VR128, load, i128mem,
SchedWriteShuffle.XMM, 0>, VEX_4V, VEX_WIG;		SchedWriteShuffle.XMM, 0>, VEX_4V, VEX_WIG;
let Predicates = [HasAVX2, NoVLX_Or_NoBWI] in		let Predicates = [HasAVX2, NoVLX_Or_NoBWI] in
defm VPALIGNRY : ssse3_palignr<"vpalignr", v32i8, VR256, loadv4i64, i256mem,		defm VPALIGNRY : ssse3_palignr<"vpalignr", v32i8, VR256, load, i256mem,
SchedWriteShuffle.YMM, 0>, VEX_4V, VEX_L, VEX_WIG;		SchedWriteShuffle.YMM, 0>, VEX_4V, VEX_L, VEX_WIG;
let Constraints = "$src1 = $dst", Predicates = [UseSSSE3] in		let Constraints = "$src1 = $dst", Predicates = [UseSSSE3] in
defm PALIGNR : ssse3_palignr<"palignr", v16i8, VR128, memopv2i64, i128mem,		defm PALIGNR : ssse3_palignr<"palignr", v16i8, VR128, memop, i128mem,
SchedWriteShuffle.XMM>;		SchedWriteShuffle.XMM>;

//===---------------------------------------------------------------------===//		//===---------------------------------------------------------------------===//
// SSSE3 - Thread synchronization		// SSSE3 - Thread synchronization
//===---------------------------------------------------------------------===//		//===---------------------------------------------------------------------===//

let SchedRW = [WriteSystem] in {		let SchedRW = [WriteSystem] in {
let usesCustomInserter = 1 in {		let usesCustomInserter = 1 in {
▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines	def : Pat<(v4i64 (!cast<PatFrag>(ExtTy#"extloadvi16") addr:$src)),
(!cast<I>(OpcPrefix#WQYrm) addr:$src)>;		(!cast<I>(OpcPrefix#WQYrm) addr:$src)>;

def : Pat<(v4i64 (!cast<PatFrag>(ExtTy#"extloadvi32") addr:$src)),		def : Pat<(v4i64 (!cast<PatFrag>(ExtTy#"extloadvi32") addr:$src)),
(!cast<I>(OpcPrefix#DQYrm) addr:$src)>;		(!cast<I>(OpcPrefix#DQYrm) addr:$src)>;
}		}

// AVX2 Register-Memory patterns		// AVX2 Register-Memory patterns
let Predicates = [HasAVX, NoVLX_Or_NoBWI] in {		let Predicates = [HasAVX, NoVLX_Or_NoBWI] in {
def : Pat<(v16i16 (ExtOp (bc_v16i8 (loadv2i64 addr:$src)))),		def : Pat<(v16i16 (ExtOp (loadv16i8 addr:$src))),
(!cast<I>(OpcPrefix#BWYrm) addr:$src)>;		(!cast<I>(OpcPrefix#BWYrm) addr:$src)>;
def : Pat<(v16i16 (ExtOp (v16i8 (vzmovl_v2i64 addr:$src)))),		def : Pat<(v16i16 (ExtOp (v16i8 (vzmovl_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#BWYrm) addr:$src)>;		(!cast<I>(OpcPrefix#BWYrm) addr:$src)>;
def : Pat<(v16i16 (ExtOp (v16i8 (vzload_v2i64 addr:$src)))),		def : Pat<(v16i16 (ExtOp (v16i8 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#BWYrm) addr:$src)>;		(!cast<I>(OpcPrefix#BWYrm) addr:$src)>;
}		}
let Predicates = [HasAVX, NoVLX] in {		let Predicates = [HasAVX, NoVLX] in {
def : Pat<(v8i32 (ExtOp (bc_v16i8 (v2i64 (scalar_to_vector (loadi64 addr:$src)))))),		def : Pat<(v8i32 (ExtOp (bc_v16i8 (v2i64 (scalar_to_vector (loadi64 addr:$src)))))),
(!cast<I>(OpcPrefix#BDYrm) addr:$src)>;		(!cast<I>(OpcPrefix#BDYrm) addr:$src)>;
def : Pat<(v8i32 (ExtOp (v16i8 (vzmovl_v2i64 addr:$src)))),		def : Pat<(v8i32 (ExtOp (v16i8 (vzmovl_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#BDYrm) addr:$src)>;		(!cast<I>(OpcPrefix#BDYrm) addr:$src)>;
def : Pat<(v8i32 (ExtOp (v16i8 (vzload_v2i64 addr:$src)))),		def : Pat<(v8i32 (ExtOp (v16i8 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#BDYrm) addr:$src)>;		(!cast<I>(OpcPrefix#BDYrm) addr:$src)>;
def : Pat<(v8i32 (ExtOp (bc_v16i8 (loadv2i64 addr:$src)))),		def : Pat<(v8i32 (ExtOp (loadv16i8 addr:$src))),
(!cast<I>(OpcPrefix#BDYrm) addr:$src)>;		(!cast<I>(OpcPrefix#BDYrm) addr:$src)>;

def : Pat<(v4i64 (ExtOp (bc_v16i8 (v4i32 (scalar_to_vector (loadi32 addr:$src)))))),		def : Pat<(v4i64 (ExtOp (bc_v16i8 (v4i32 (scalar_to_vector (loadi32 addr:$src)))))),
(!cast<I>(OpcPrefix#BQYrm) addr:$src)>;		(!cast<I>(OpcPrefix#BQYrm) addr:$src)>;
def : Pat<(v4i64 (ExtOp (v16i8 (vzmovl_v4i32 addr:$src)))),		def : Pat<(v4i64 (ExtOp (v16i8 (vzmovl_v4i32 addr:$src)))),
(!cast<I>(OpcPrefix#BQYrm) addr:$src)>;		(!cast<I>(OpcPrefix#BQYrm) addr:$src)>;
def : Pat<(v4i64 (ExtOp (v16i8 (vzload_v2i64 addr:$src)))),		def : Pat<(v4i64 (ExtOp (v16i8 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#BQYrm) addr:$src)>;		(!cast<I>(OpcPrefix#BQYrm) addr:$src)>;
def : Pat<(v4i64 (ExtOp (bc_v16i8 (loadv2i64 addr:$src)))),		def : Pat<(v4i64 (ExtOp (loadv16i8 addr:$src))),
(!cast<I>(OpcPrefix#BQYrm) addr:$src)>;		(!cast<I>(OpcPrefix#BQYrm) addr:$src)>;

def : Pat<(v8i32 (ExtOp (bc_v8i16 (loadv2i64 addr:$src)))),		def : Pat<(v8i32 (ExtOp (loadv8i16 addr:$src))),
(!cast<I>(OpcPrefix#WDYrm) addr:$src)>;		(!cast<I>(OpcPrefix#WDYrm) addr:$src)>;
def : Pat<(v8i32 (ExtOp (v8i16 (vzmovl_v2i64 addr:$src)))),		def : Pat<(v8i32 (ExtOp (v8i16 (vzmovl_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#WDYrm) addr:$src)>;		(!cast<I>(OpcPrefix#WDYrm) addr:$src)>;
def : Pat<(v8i32 (ExtOp (v8i16 (vzload_v2i64 addr:$src)))),		def : Pat<(v8i32 (ExtOp (v8i16 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#WDYrm) addr:$src)>;		(!cast<I>(OpcPrefix#WDYrm) addr:$src)>;

def : Pat<(v4i64 (ExtOp (bc_v8i16 (v2i64 (scalar_to_vector (loadi64 addr:$src)))))),		def : Pat<(v4i64 (ExtOp (bc_v8i16 (v2i64 (scalar_to_vector (loadi64 addr:$src)))))),
(!cast<I>(OpcPrefix#WQYrm) addr:$src)>;		(!cast<I>(OpcPrefix#WQYrm) addr:$src)>;
def : Pat<(v4i64 (ExtOp (v8i16 (vzmovl_v2i64 addr:$src)))),		def : Pat<(v4i64 (ExtOp (v8i16 (vzmovl_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#WQYrm) addr:$src)>;		(!cast<I>(OpcPrefix#WQYrm) addr:$src)>;
def : Pat<(v4i64 (ExtOp (v8i16 (vzload_v2i64 addr:$src)))),		def : Pat<(v4i64 (ExtOp (v8i16 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#WQYrm) addr:$src)>;		(!cast<I>(OpcPrefix#WQYrm) addr:$src)>;
def : Pat<(v4i64 (ExtOp (bc_v8i16 (loadv2i64 addr:$src)))),		def : Pat<(v4i64 (ExtOp (loadv8i16 addr:$src))),
(!cast<I>(OpcPrefix#WQYrm) addr:$src)>;		(!cast<I>(OpcPrefix#WQYrm) addr:$src)>;

def : Pat<(v4i64 (ExtOp (bc_v4i32 (loadv2i64 addr:$src)))),		def : Pat<(v4i64 (ExtOp (loadv4i32 addr:$src))),
(!cast<I>(OpcPrefix#DQYrm) addr:$src)>;		(!cast<I>(OpcPrefix#DQYrm) addr:$src)>;
def : Pat<(v4i64 (ExtOp (v4i32 (vzmovl_v2i64 addr:$src)))),		def : Pat<(v4i64 (ExtOp (v4i32 (vzmovl_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#DQYrm) addr:$src)>;		(!cast<I>(OpcPrefix#DQYrm) addr:$src)>;
def : Pat<(v4i64 (ExtOp (v4i32 (vzload_v2i64 addr:$src)))),		def : Pat<(v4i64 (ExtOp (v4i32 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#DQYrm) addr:$src)>;		(!cast<I>(OpcPrefix#DQYrm) addr:$src)>;
}		}
}		}

▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines	multiclass SS41I_pmovx_patterns<string OpcPrefix, string ExtTy,
def : Pat<(v8i16 (ExtOp (bc_v16i8 (v2i64 (scalar_to_vector (loadi64 addr:$src)))))),		def : Pat<(v8i16 (ExtOp (bc_v16i8 (v2i64 (scalar_to_vector (loadi64 addr:$src)))))),
(!cast<I>(OpcPrefix#BWrm) addr:$src)>;		(!cast<I>(OpcPrefix#BWrm) addr:$src)>;
def : Pat<(v8i16 (ExtOp (bc_v16i8 (v2f64 (scalar_to_vector (loadf64 addr:$src)))))),		def : Pat<(v8i16 (ExtOp (bc_v16i8 (v2f64 (scalar_to_vector (loadf64 addr:$src)))))),
(!cast<I>(OpcPrefix#BWrm) addr:$src)>;		(!cast<I>(OpcPrefix#BWrm) addr:$src)>;
def : Pat<(v8i16 (ExtOp (v16i8 (vzmovl_v2i64 addr:$src)))),		def : Pat<(v8i16 (ExtOp (v16i8 (vzmovl_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#BWrm) addr:$src)>;		(!cast<I>(OpcPrefix#BWrm) addr:$src)>;
def : Pat<(v8i16 (ExtOp (v16i8 (vzload_v2i64 addr:$src)))),		def : Pat<(v8i16 (ExtOp (v16i8 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#BWrm) addr:$src)>;		(!cast<I>(OpcPrefix#BWrm) addr:$src)>;
def : Pat<(v8i16 (ExtOp (bc_v16i8 (loadv2i64 addr:$src)))),		def : Pat<(v8i16 (ExtOp (loadv16i8 addr:$src))),
(!cast<I>(OpcPrefix#BWrm) addr:$src)>;		(!cast<I>(OpcPrefix#BWrm) addr:$src)>;
}		}
let Predicates = [HasAVX, NoVLX] in {		let Predicates = [HasAVX, NoVLX] in {
def : Pat<(v4i32 (ExtOp (bc_v16i8 (v4i32 (scalar_to_vector (loadi32 addr:$src)))))),		def : Pat<(v4i32 (ExtOp (bc_v16i8 (v4i32 (scalar_to_vector (loadi32 addr:$src)))))),
(!cast<I>(OpcPrefix#BDrm) addr:$src)>;		(!cast<I>(OpcPrefix#BDrm) addr:$src)>;
def : Pat<(v4i32 (ExtOp (v16i8 (vzmovl_v4i32 addr:$src)))),		def : Pat<(v4i32 (ExtOp (v16i8 (vzmovl_v4i32 addr:$src)))),
(!cast<I>(OpcPrefix#BDrm) addr:$src)>;		(!cast<I>(OpcPrefix#BDrm) addr:$src)>;
def : Pat<(v4i32 (ExtOp (v16i8 (vzload_v2i64 addr:$src)))),		def : Pat<(v4i32 (ExtOp (v16i8 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#BDrm) addr:$src)>;		(!cast<I>(OpcPrefix#BDrm) addr:$src)>;
def : Pat<(v4i32 (ExtOp (bc_v16i8 (loadv2i64 addr:$src)))),		def : Pat<(v4i32 (ExtOp (loadv16i8 addr:$src))),
(!cast<I>(OpcPrefix#BDrm) addr:$src)>;		(!cast<I>(OpcPrefix#BDrm) addr:$src)>;

def : Pat<(v2i64 (ExtOp (bc_v16i8 (v4i32 (scalar_to_vector (extloadi32i16 addr:$src)))))),		def : Pat<(v2i64 (ExtOp (bc_v16i8 (v4i32 (scalar_to_vector (extloadi32i16 addr:$src)))))),
(!cast<I>(OpcPrefix#BQrm) addr:$src)>;		(!cast<I>(OpcPrefix#BQrm) addr:$src)>;
def : Pat<(v2i64 (ExtOp (v16i8 (vzmovl_v4i32 addr:$src)))),		def : Pat<(v2i64 (ExtOp (v16i8 (vzmovl_v4i32 addr:$src)))),
(!cast<I>(OpcPrefix#BQrm) addr:$src)>;		(!cast<I>(OpcPrefix#BQrm) addr:$src)>;
def : Pat<(v2i64 (ExtOp (v16i8 (vzload_v2i64 addr:$src)))),		def : Pat<(v2i64 (ExtOp (v16i8 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#BQrm) addr:$src)>;		(!cast<I>(OpcPrefix#BQrm) addr:$src)>;
def : Pat<(v2i64 (ExtOp (bc_v16i8 (loadv2i64 addr:$src)))),		def : Pat<(v2i64 (ExtOp (loadv16i8 addr:$src))),
(!cast<I>(OpcPrefix#BQrm) addr:$src)>;		(!cast<I>(OpcPrefix#BQrm) addr:$src)>;

def : Pat<(v4i32 (ExtOp (bc_v8i16 (v2i64 (scalar_to_vector (loadi64 addr:$src)))))),		def : Pat<(v4i32 (ExtOp (bc_v8i16 (v2i64 (scalar_to_vector (loadi64 addr:$src)))))),
(!cast<I>(OpcPrefix#WDrm) addr:$src)>;		(!cast<I>(OpcPrefix#WDrm) addr:$src)>;
def : Pat<(v4i32 (ExtOp (bc_v8i16 (v2f64 (scalar_to_vector (loadf64 addr:$src)))))),		def : Pat<(v4i32 (ExtOp (bc_v8i16 (v2f64 (scalar_to_vector (loadf64 addr:$src)))))),
(!cast<I>(OpcPrefix#WDrm) addr:$src)>;		(!cast<I>(OpcPrefix#WDrm) addr:$src)>;
def : Pat<(v4i32 (ExtOp (v8i16 (vzmovl_v2i64 addr:$src)))),		def : Pat<(v4i32 (ExtOp (v8i16 (vzmovl_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#WDrm) addr:$src)>;		(!cast<I>(OpcPrefix#WDrm) addr:$src)>;
def : Pat<(v4i32 (ExtOp (v8i16 (vzload_v2i64 addr:$src)))),		def : Pat<(v4i32 (ExtOp (v8i16 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#WDrm) addr:$src)>;		(!cast<I>(OpcPrefix#WDrm) addr:$src)>;
def : Pat<(v4i32 (ExtOp (bc_v8i16 (loadv2i64 addr:$src)))),		def : Pat<(v4i32 (ExtOp (loadv8i16 addr:$src))),
(!cast<I>(OpcPrefix#WDrm) addr:$src)>;		(!cast<I>(OpcPrefix#WDrm) addr:$src)>;

def : Pat<(v2i64 (ExtOp (bc_v8i16 (v4i32 (scalar_to_vector (loadi32 addr:$src)))))),		def : Pat<(v2i64 (ExtOp (bc_v8i16 (v4i32 (scalar_to_vector (loadi32 addr:$src)))))),
(!cast<I>(OpcPrefix#WQrm) addr:$src)>;		(!cast<I>(OpcPrefix#WQrm) addr:$src)>;
def : Pat<(v2i64 (ExtOp (v8i16 (vzmovl_v4i32 addr:$src)))),		def : Pat<(v2i64 (ExtOp (v8i16 (vzmovl_v4i32 addr:$src)))),
(!cast<I>(OpcPrefix#WQrm) addr:$src)>;		(!cast<I>(OpcPrefix#WQrm) addr:$src)>;
def : Pat<(v2i64 (ExtOp (v8i16 (vzload_v2i64 addr:$src)))),		def : Pat<(v2i64 (ExtOp (v8i16 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#WQrm) addr:$src)>;		(!cast<I>(OpcPrefix#WQrm) addr:$src)>;
def : Pat<(v2i64 (ExtOp (bc_v8i16 (loadv2i64 addr:$src)))),		def : Pat<(v2i64 (ExtOp (loadv8i16 addr:$src))),
(!cast<I>(OpcPrefix#WQrm) addr:$src)>;		(!cast<I>(OpcPrefix#WQrm) addr:$src)>;

def : Pat<(v2i64 (ExtOp (bc_v4i32 (v2i64 (scalar_to_vector (loadi64 addr:$src)))))),		def : Pat<(v2i64 (ExtOp (bc_v4i32 (v2i64 (scalar_to_vector (loadi64 addr:$src)))))),
(!cast<I>(OpcPrefix#DQrm) addr:$src)>;		(!cast<I>(OpcPrefix#DQrm) addr:$src)>;
def : Pat<(v2i64 (ExtOp (bc_v4i32 (v2f64 (scalar_to_vector (loadf64 addr:$src)))))),		def : Pat<(v2i64 (ExtOp (bc_v4i32 (v2f64 (scalar_to_vector (loadf64 addr:$src)))))),
(!cast<I>(OpcPrefix#DQrm) addr:$src)>;		(!cast<I>(OpcPrefix#DQrm) addr:$src)>;
def : Pat<(v2i64 (ExtOp (v4i32 (vzmovl_v2i64 addr:$src)))),		def : Pat<(v2i64 (ExtOp (v4i32 (vzmovl_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#DQrm) addr:$src)>;		(!cast<I>(OpcPrefix#DQrm) addr:$src)>;
def : Pat<(v2i64 (ExtOp (v4i32 (vzload_v2i64 addr:$src)))),		def : Pat<(v2i64 (ExtOp (v4i32 (vzload_v2i64 addr:$src)))),
(!cast<I>(OpcPrefix#DQrm) addr:$src)>;		(!cast<I>(OpcPrefix#DQrm) addr:$src)>;
def : Pat<(v2i64 (ExtOp (bc_v4i32 (loadv2i64 addr:$src)))),		def : Pat<(v2i64 (ExtOp (loadv4i32 addr:$src))),
(!cast<I>(OpcPrefix#DQrm) addr:$src)>;		(!cast<I>(OpcPrefix#DQrm) addr:$src)>;
}		}
}		}

defm : SS41I_pmovx_patterns<"VPMOVSX", "s", sext_invec>;		defm : SS41I_pmovx_patterns<"VPMOVSX", "s", sext_invec>;
defm : SS41I_pmovx_patterns<"VPMOVZX", "z", zext_invec>;		defm : SS41I_pmovx_patterns<"VPMOVZX", "z", zext_invec>;

let Predicates = [UseSSE41] in {		let Predicates = [UseSSE41] in {
▲ Show 20 Lines • Show All 801 Lines • ▼ Show 20 Lines	def rr : SS48I<opc, MRMSrcReg, (outs VR128:$dst),
(ins VR128:$src),		(ins VR128:$src),
!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),		!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),
[(set VR128:$dst, (v8i16 (OpNode (v8i16 VR128:$src))))]>,		[(set VR128:$dst, (v8i16 (OpNode (v8i16 VR128:$src))))]>,
Sched<[Sched]>;		Sched<[Sched]>;
def rm : SS48I<opc, MRMSrcMem, (outs VR128:$dst),		def rm : SS48I<opc, MRMSrcMem, (outs VR128:$dst),
(ins i128mem:$src),		(ins i128mem:$src),
!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),		!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),
[(set VR128:$dst,		[(set VR128:$dst,
(v8i16 (OpNode (v8i16 (bitconvert (ld_frag addr:$src))))))]>,		(v8i16 (OpNode (ld_frag addr:$src))))]>,
Sched<[Sched.Folded]>;		Sched<[Sched.Folded]>;
}		}

// PHMIN has the same profile as PSAD, thus we use the same scheduling		// PHMIN has the same profile as PSAD, thus we use the same scheduling
// model, although the naming is misleading.		// model, although the naming is misleading.
let Predicates = [HasAVX] in		let Predicates = [HasAVX] in
defm VPHMINPOSUW : SS41I_unop_rm_int_v16<0x41, "vphminposuw",		defm VPHMINPOSUW : SS41I_unop_rm_int_v16<0x41, "vphminposuw",
X86phminpos, loadv2i64,		X86phminpos, load,
WritePHMINPOS>, VEX, VEX_WIG;		WritePHMINPOS>, VEX, VEX_WIG;
defm PHMINPOSUW : SS41I_unop_rm_int_v16<0x41, "phminposuw",		defm PHMINPOSUW : SS41I_unop_rm_int_v16<0x41, "phminposuw",
X86phminpos, memopv2i64,		X86phminpos, memop,
WritePHMINPOS>;		WritePHMINPOS>;

/// SS48I_binop_rm - Simple SSE41 binary operator.		/// SS48I_binop_rm - Simple SSE41 binary operator.
multiclass SS48I_binop_rm<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass SS48I_binop_rm<bits<8> opc, string OpcodeStr, SDNode OpNode,
ValueType OpVT, RegisterClass RC, PatFrag memop_frag,		ValueType OpVT, RegisterClass RC, PatFrag memop_frag,
X86MemOperand x86memop, X86FoldableSchedWrite sched,		X86MemOperand x86memop, X86FoldableSchedWrite sched,
bit Is2Addr = 1> {		bit Is2Addr = 1> {
let isCommutable = 1 in		let isCommutable = 1 in
def rr : SS48I<opc, MRMSrcReg, (outs RC:$dst),		def rr : SS48I<opc, MRMSrcReg, (outs RC:$dst),
(ins RC:$src1, RC:$src2),		(ins RC:$src1, RC:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst, (OpVT (OpNode RC:$src1, RC:$src2)))]>,		[(set RC:$dst, (OpVT (OpNode RC:$src1, RC:$src2)))]>,
Sched<[sched]>;		Sched<[sched]>;
def rm : SS48I<opc, MRMSrcMem, (outs RC:$dst),		def rm : SS48I<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop:$src2),		(ins RC:$src1, x86memop:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst,		[(set RC:$dst,
(OpVT (OpNode RC:$src1, (bitconvert (memop_frag addr:$src2)))))]>,		(OpVT (OpNode RC:$src1, (memop_frag addr:$src2))))]>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let Predicates = [HasAVX, NoVLX] in {		let Predicates = [HasAVX, NoVLX] in {
defm VPMINSD : SS48I_binop_rm<0x39, "vpminsd", smin, v4i32, VR128,		defm VPMINSD : SS48I_binop_rm<0x39, "vpminsd", smin, v4i32, VR128,
loadv2i64, i128mem, SchedWriteVecALU.XMM, 0>,		load, i128mem, SchedWriteVecALU.XMM, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
defm VPMINUD : SS48I_binop_rm<0x3B, "vpminud", umin, v4i32, VR128,		defm VPMINUD : SS48I_binop_rm<0x3B, "vpminud", umin, v4i32, VR128,
loadv2i64, i128mem, SchedWriteVecALU.XMM, 0>,		load, i128mem, SchedWriteVecALU.XMM, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
defm VPMAXSD : SS48I_binop_rm<0x3D, "vpmaxsd", smax, v4i32, VR128,		defm VPMAXSD : SS48I_binop_rm<0x3D, "vpmaxsd", smax, v4i32, VR128,
loadv2i64, i128mem, SchedWriteVecALU.XMM, 0>,		load, i128mem, SchedWriteVecALU.XMM, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
defm VPMAXUD : SS48I_binop_rm<0x3F, "vpmaxud", umax, v4i32, VR128,		defm VPMAXUD : SS48I_binop_rm<0x3F, "vpmaxud", umax, v4i32, VR128,
loadv2i64, i128mem, SchedWriteVecALU.XMM, 0>,		load, i128mem, SchedWriteVecALU.XMM, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
defm VPMULDQ : SS48I_binop_rm<0x28, "vpmuldq", X86pmuldq, v2i64, VR128,		defm VPMULDQ : SS48I_binop_rm<0x28, "vpmuldq", X86pmuldq, v2i64, VR128,
loadv2i64, i128mem, SchedWriteVecIMul.XMM, 0>,		load, i128mem, SchedWriteVecIMul.XMM, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
}		}
let Predicates = [HasAVX, NoVLX_Or_NoBWI] in {		let Predicates = [HasAVX, NoVLX_Or_NoBWI] in {
defm VPMINSB : SS48I_binop_rm<0x38, "vpminsb", smin, v16i8, VR128,		defm VPMINSB : SS48I_binop_rm<0x38, "vpminsb", smin, v16i8, VR128,
loadv2i64, i128mem, SchedWriteVecALU.XMM, 0>,		load, i128mem, SchedWriteVecALU.XMM, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
defm VPMINUW : SS48I_binop_rm<0x3A, "vpminuw", umin, v8i16, VR128,		defm VPMINUW : SS48I_binop_rm<0x3A, "vpminuw", umin, v8i16, VR128,
loadv2i64, i128mem, SchedWriteVecALU.XMM, 0>,		load, i128mem, SchedWriteVecALU.XMM, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
defm VPMAXSB : SS48I_binop_rm<0x3C, "vpmaxsb", smax, v16i8, VR128,		defm VPMAXSB : SS48I_binop_rm<0x3C, "vpmaxsb", smax, v16i8, VR128,
loadv2i64, i128mem, SchedWriteVecALU.XMM, 0>,		load, i128mem, SchedWriteVecALU.XMM, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
defm VPMAXUW : SS48I_binop_rm<0x3E, "vpmaxuw", umax, v8i16, VR128,		defm VPMAXUW : SS48I_binop_rm<0x3E, "vpmaxuw", umax, v8i16, VR128,
loadv2i64, i128mem, SchedWriteVecALU.XMM, 0>,		load, i128mem, SchedWriteVecALU.XMM, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
}		}

let Predicates = [HasAVX2, NoVLX] in {		let Predicates = [HasAVX2, NoVLX] in {
defm VPMINSDY : SS48I_binop_rm<0x39, "vpminsd", smin, v8i32, VR256,		defm VPMINSDY : SS48I_binop_rm<0x39, "vpminsd", smin, v8i32, VR256,
loadv4i64, i256mem, SchedWriteVecALU.YMM, 0>,		load, i256mem, SchedWriteVecALU.YMM, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
defm VPMINUDY : SS48I_binop_rm<0x3B, "vpminud", umin, v8i32, VR256,		defm VPMINUDY : SS48I_binop_rm<0x3B, "vpminud", umin, v8i32, VR256,
loadv4i64, i256mem, SchedWriteVecALU.YMM, 0>,		load, i256mem, SchedWriteVecALU.YMM, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
defm VPMAXSDY : SS48I_binop_rm<0x3D, "vpmaxsd", smax, v8i32, VR256,		defm VPMAXSDY : SS48I_binop_rm<0x3D, "vpmaxsd", smax, v8i32, VR256,
loadv4i64, i256mem, SchedWriteVecALU.YMM, 0>,		load, i256mem, SchedWriteVecALU.YMM, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
defm VPMAXUDY : SS48I_binop_rm<0x3F, "vpmaxud", umax, v8i32, VR256,		defm VPMAXUDY : SS48I_binop_rm<0x3F, "vpmaxud", umax, v8i32, VR256,
loadv4i64, i256mem, SchedWriteVecALU.YMM, 0>,		load, i256mem, SchedWriteVecALU.YMM, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
defm VPMULDQY : SS48I_binop_rm<0x28, "vpmuldq", X86pmuldq, v4i64, VR256,		defm VPMULDQY : SS48I_binop_rm<0x28, "vpmuldq", X86pmuldq, v4i64, VR256,
loadv4i64, i256mem, SchedWriteVecIMul.YMM, 0>,		load, i256mem, SchedWriteVecIMul.YMM, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
}		}
let Predicates = [HasAVX2, NoVLX_Or_NoBWI] in {		let Predicates = [HasAVX2, NoVLX_Or_NoBWI] in {
defm VPMINSBY : SS48I_binop_rm<0x38, "vpminsb", smin, v32i8, VR256,		defm VPMINSBY : SS48I_binop_rm<0x38, "vpminsb", smin, v32i8, VR256,
loadv4i64, i256mem, SchedWriteVecALU.YMM, 0>,		load, i256mem, SchedWriteVecALU.YMM, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
defm VPMINUWY : SS48I_binop_rm<0x3A, "vpminuw", umin, v16i16, VR256,		defm VPMINUWY : SS48I_binop_rm<0x3A, "vpminuw", umin, v16i16, VR256,
loadv4i64, i256mem, SchedWriteVecALU.YMM, 0>,		load, i256mem, SchedWriteVecALU.YMM, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
defm VPMAXSBY : SS48I_binop_rm<0x3C, "vpmaxsb", smax, v32i8, VR256,		defm VPMAXSBY : SS48I_binop_rm<0x3C, "vpmaxsb", smax, v32i8, VR256,
loadv4i64, i256mem, SchedWriteVecALU.YMM, 0>,		load, i256mem, SchedWriteVecALU.YMM, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
defm VPMAXUWY : SS48I_binop_rm<0x3E, "vpmaxuw", umax, v16i16, VR256,		defm VPMAXUWY : SS48I_binop_rm<0x3E, "vpmaxuw", umax, v16i16, VR256,
loadv4i64, i256mem, SchedWriteVecALU.YMM, 0>,		load, i256mem, SchedWriteVecALU.YMM, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
}		}

let Constraints = "$src1 = $dst" in {		let Constraints = "$src1 = $dst" in {
defm PMINSB : SS48I_binop_rm<0x38, "pminsb", smin, v16i8, VR128,		defm PMINSB : SS48I_binop_rm<0x38, "pminsb", smin, v16i8, VR128,
memopv2i64, i128mem, SchedWriteVecALU.XMM, 1>;		memop, i128mem, SchedWriteVecALU.XMM, 1>;
defm PMINSD : SS48I_binop_rm<0x39, "pminsd", smin, v4i32, VR128,		defm PMINSD : SS48I_binop_rm<0x39, "pminsd", smin, v4i32, VR128,
memopv2i64, i128mem, SchedWriteVecALU.XMM, 1>;		memop, i128mem, SchedWriteVecALU.XMM, 1>;
defm PMINUD : SS48I_binop_rm<0x3B, "pminud", umin, v4i32, VR128,		defm PMINUD : SS48I_binop_rm<0x3B, "pminud", umin, v4i32, VR128,
memopv2i64, i128mem, SchedWriteVecALU.XMM, 1>;		memop, i128mem, SchedWriteVecALU.XMM, 1>;
defm PMINUW : SS48I_binop_rm<0x3A, "pminuw", umin, v8i16, VR128,		defm PMINUW : SS48I_binop_rm<0x3A, "pminuw", umin, v8i16, VR128,
memopv2i64, i128mem, SchedWriteVecALU.XMM, 1>;		memop, i128mem, SchedWriteVecALU.XMM, 1>;
defm PMAXSB : SS48I_binop_rm<0x3C, "pmaxsb", smax, v16i8, VR128,		defm PMAXSB : SS48I_binop_rm<0x3C, "pmaxsb", smax, v16i8, VR128,
memopv2i64, i128mem, SchedWriteVecALU.XMM, 1>;		memop, i128mem, SchedWriteVecALU.XMM, 1>;
defm PMAXSD : SS48I_binop_rm<0x3D, "pmaxsd", smax, v4i32, VR128,		defm PMAXSD : SS48I_binop_rm<0x3D, "pmaxsd", smax, v4i32, VR128,
memopv2i64, i128mem, SchedWriteVecALU.XMM, 1>;		memop, i128mem, SchedWriteVecALU.XMM, 1>;
defm PMAXUD : SS48I_binop_rm<0x3F, "pmaxud", umax, v4i32, VR128,		defm PMAXUD : SS48I_binop_rm<0x3F, "pmaxud", umax, v4i32, VR128,
memopv2i64, i128mem, SchedWriteVecALU.XMM, 1>;		memop, i128mem, SchedWriteVecALU.XMM, 1>;
defm PMAXUW : SS48I_binop_rm<0x3E, "pmaxuw", umax, v8i16, VR128,		defm PMAXUW : SS48I_binop_rm<0x3E, "pmaxuw", umax, v8i16, VR128,
memopv2i64, i128mem, SchedWriteVecALU.XMM, 1>;		memop, i128mem, SchedWriteVecALU.XMM, 1>;
defm PMULDQ : SS48I_binop_rm<0x28, "pmuldq", X86pmuldq, v2i64, VR128,		defm PMULDQ : SS48I_binop_rm<0x28, "pmuldq", X86pmuldq, v2i64, VR128,
memopv2i64, i128mem, SchedWriteVecIMul.XMM, 1>;		memop, i128mem, SchedWriteVecIMul.XMM, 1>;
}		}

let Predicates = [HasAVX, NoVLX] in		let Predicates = [HasAVX, NoVLX] in
defm VPMULLD : SS48I_binop_rm<0x40, "vpmulld", mul, v4i32, VR128,		defm VPMULLD : SS48I_binop_rm<0x40, "vpmulld", mul, v4i32, VR128,
loadv2i64, i128mem, SchedWritePMULLD.XMM, 0>,		load, i128mem, SchedWritePMULLD.XMM, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
let Predicates = [HasAVX] in		let Predicates = [HasAVX] in
defm VPCMPEQQ : SS48I_binop_rm<0x29, "vpcmpeqq", X86pcmpeq, v2i64, VR128,		defm VPCMPEQQ : SS48I_binop_rm<0x29, "vpcmpeqq", X86pcmpeq, v2i64, VR128,
loadv2i64, i128mem, SchedWriteVecALU.XMM, 0>,		load, i128mem, SchedWriteVecALU.XMM, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;

let Predicates = [HasAVX2, NoVLX] in		let Predicates = [HasAVX2, NoVLX] in
defm VPMULLDY : SS48I_binop_rm<0x40, "vpmulld", mul, v8i32, VR256,		defm VPMULLDY : SS48I_binop_rm<0x40, "vpmulld", mul, v8i32, VR256,
loadv4i64, i256mem, SchedWritePMULLD.YMM, 0>,		load, i256mem, SchedWritePMULLD.YMM, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
let Predicates = [HasAVX2] in		let Predicates = [HasAVX2] in
defm VPCMPEQQY : SS48I_binop_rm<0x29, "vpcmpeqq", X86pcmpeq, v4i64, VR256,		defm VPCMPEQQY : SS48I_binop_rm<0x29, "vpcmpeqq", X86pcmpeq, v4i64, VR256,
loadv4i64, i256mem, SchedWriteVecALU.YMM, 0>,		load, i256mem, SchedWriteVecALU.YMM, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;

let Constraints = "$src1 = $dst" in {		let Constraints = "$src1 = $dst" in {
defm PMULLD : SS48I_binop_rm<0x40, "pmulld", mul, v4i32, VR128,		defm PMULLD : SS48I_binop_rm<0x40, "pmulld", mul, v4i32, VR128,
memopv2i64, i128mem, SchedWritePMULLD.XMM, 1>;		memop, i128mem, SchedWritePMULLD.XMM, 1>;
defm PCMPEQQ : SS48I_binop_rm<0x29, "pcmpeqq", X86pcmpeq, v2i64, VR128,		defm PCMPEQQ : SS48I_binop_rm<0x29, "pcmpeqq", X86pcmpeq, v2i64, VR128,
memopv2i64, i128mem, SchedWriteVecALU.XMM, 1>;		memop, i128mem, SchedWriteVecALU.XMM, 1>;
}		}

/// SS41I_binop_rmi_int - SSE 4.1 binary operator with 8-bit immediate		/// SS41I_binop_rmi_int - SSE 4.1 binary operator with 8-bit immediate
multiclass SS41I_binop_rmi_int<bits<8> opc, string OpcodeStr,		multiclass SS41I_binop_rmi_int<bits<8> opc, string OpcodeStr,
Intrinsic IntId, RegisterClass RC, PatFrag memop_frag,		Intrinsic IntId, RegisterClass RC, PatFrag memop_frag,
X86MemOperand x86memop, bit Is2Addr,		X86MemOperand x86memop, bit Is2Addr,
X86FoldableSchedWrite sched> {		X86FoldableSchedWrite sched> {
let isCommutable = 1 in		let isCommutable = 1 in
Show All 9 Lines	multiclass SS41I_binop_rmi_int<bits<8> opc, string OpcodeStr,
def rmi : SS4AIi8<opc, MRMSrcMem, (outs RC:$dst),		def rmi : SS4AIi8<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop:$src2, u8imm:$src3),		(ins RC:$src1, x86memop:$src2, u8imm:$src3),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),
[(set RC:$dst,		[(set RC:$dst,
(IntId RC:$src1,		(IntId RC:$src1, (memop_frag addr:$src2), imm:$src3))]>,
(bitconvert (memop_frag addr:$src2)), imm:$src3))]>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

/// SS41I_binop_rmi - SSE 4.1 binary operator with 8-bit immediate		/// SS41I_binop_rmi - SSE 4.1 binary operator with 8-bit immediate
multiclass SS41I_binop_rmi<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass SS41I_binop_rmi<bits<8> opc, string OpcodeStr, SDNode OpNode,
ValueType OpVT, RegisterClass RC, PatFrag memop_frag,		ValueType OpVT, RegisterClass RC, PatFrag memop_frag,
X86MemOperand x86memop, bit Is2Addr,		X86MemOperand x86memop, bit Is2Addr,
X86FoldableSchedWrite sched> {		X86FoldableSchedWrite sched> {
Show All 10 Lines	multiclass SS41I_binop_rmi<bits<8> opc, string OpcodeStr, SDNode OpNode,
def rmi : SS4AIi8<opc, MRMSrcMem, (outs RC:$dst),		def rmi : SS4AIi8<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop:$src2, u8imm:$src3),		(ins RC:$src1, x86memop:$src2, u8imm:$src3),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),
[(set RC:$dst,		[(set RC:$dst,
(OpVT (OpNode RC:$src1,		(OpVT (OpNode RC:$src1, (memop_frag addr:$src2), imm:$src3)))]>,
(bitconvert (memop_frag addr:$src2)), imm:$src3)))]>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

def BlendCommuteImm2 : SDNodeXForm<imm, [{		def BlendCommuteImm2 : SDNodeXForm<imm, [{
uint8_t Imm = N->getZExtValue() & 0x03;		uint8_t Imm = N->getZExtValue() & 0x03;
return getI8Imm(Imm ^ 0x03, SDLoc(N));		return getI8Imm(Imm ^ 0x03, SDLoc(N));
}]>;		}]>;

def BlendCommuteImm4 : SDNodeXForm<imm, [{		def BlendCommuteImm4 : SDNodeXForm<imm, [{
uint8_t Imm = N->getZExtValue() & 0x0f;		uint8_t Imm = N->getZExtValue() & 0x0f;
return getI8Imm(Imm ^ 0x0f, SDLoc(N));		return getI8Imm(Imm ^ 0x0f, SDLoc(N));
}]>;		}]>;

def BlendCommuteImm8 : SDNodeXForm<imm, [{		def BlendCommuteImm8 : SDNodeXForm<imm, [{
uint8_t Imm = N->getZExtValue() & 0xff;		uint8_t Imm = N->getZExtValue() & 0xff;
return getI8Imm(Imm ^ 0xff, SDLoc(N));		return getI8Imm(Imm ^ 0xff, SDLoc(N));
}]>;		}]>;

let Predicates = [HasAVX] in {		let Predicates = [HasAVX] in {
let isCommutable = 0 in {		let isCommutable = 0 in {
defm VMPSADBW : SS41I_binop_rmi_int<0x42, "vmpsadbw", int_x86_sse41_mpsadbw,		defm VMPSADBW : SS41I_binop_rmi_int<0x42, "vmpsadbw", int_x86_sse41_mpsadbw,
VR128, loadv2i64, i128mem, 0,		VR128, load, i128mem, 0,
SchedWriteMPSAD.XMM>, VEX_4V, VEX_WIG;		SchedWriteMPSAD.XMM>, VEX_4V, VEX_WIG;
}		}

let ExeDomain = SSEPackedSingle in		let ExeDomain = SSEPackedSingle in
defm VDPPS : SS41I_binop_rmi_int<0x40, "vdpps", int_x86_sse41_dpps,		defm VDPPS : SS41I_binop_rmi_int<0x40, "vdpps", int_x86_sse41_dpps,
VR128, loadv4f32, f128mem, 0,		VR128, load, f128mem, 0,
SchedWriteDPPS.XMM>, VEX_4V, VEX_WIG;		SchedWriteDPPS.XMM>, VEX_4V, VEX_WIG;
let ExeDomain = SSEPackedDouble in		let ExeDomain = SSEPackedDouble in
defm VDPPD : SS41I_binop_rmi_int<0x41, "vdppd", int_x86_sse41_dppd,		defm VDPPD : SS41I_binop_rmi_int<0x41, "vdppd", int_x86_sse41_dppd,
VR128, loadv2f64, f128mem, 0,		VR128, load, f128mem, 0,
SchedWriteDPPD.XMM>, VEX_4V, VEX_WIG;		SchedWriteDPPD.XMM>, VEX_4V, VEX_WIG;
let ExeDomain = SSEPackedSingle in		let ExeDomain = SSEPackedSingle in
defm VDPPSY : SS41I_binop_rmi_int<0x40, "vdpps", int_x86_avx_dp_ps_256,		defm VDPPSY : SS41I_binop_rmi_int<0x40, "vdpps", int_x86_avx_dp_ps_256,
VR256, loadv8f32, i256mem, 0,		VR256, load, i256mem, 0,
SchedWriteDPPS.YMM>, VEX_4V, VEX_L, VEX_WIG;		SchedWriteDPPS.YMM>, VEX_4V, VEX_L, VEX_WIG;
}		}

let Predicates = [HasAVX2] in {		let Predicates = [HasAVX2] in {
let isCommutable = 0 in {		let isCommutable = 0 in {
defm VMPSADBWY : SS41I_binop_rmi_int<0x42, "vmpsadbw", int_x86_avx2_mpsadbw,		defm VMPSADBWY : SS41I_binop_rmi_int<0x42, "vmpsadbw", int_x86_avx2_mpsadbw,
VR256, loadv4i64, i256mem, 0,		VR256, load, i256mem, 0,
SchedWriteMPSAD.YMM>, VEX_4V, VEX_L, VEX_WIG;		SchedWriteMPSAD.YMM>, VEX_4V, VEX_L, VEX_WIG;
}		}
}		}

let Constraints = "$src1 = $dst" in {		let Constraints = "$src1 = $dst" in {
let isCommutable = 0 in {		let isCommutable = 0 in {
defm MPSADBW : SS41I_binop_rmi_int<0x42, "mpsadbw", int_x86_sse41_mpsadbw,		defm MPSADBW : SS41I_binop_rmi_int<0x42, "mpsadbw", int_x86_sse41_mpsadbw,
VR128, memopv2i64, i128mem, 1,		VR128, memop, i128mem, 1,
SchedWriteMPSAD.XMM>;		SchedWriteMPSAD.XMM>;
}		}

let ExeDomain = SSEPackedSingle in		let ExeDomain = SSEPackedSingle in
defm DPPS : SS41I_binop_rmi_int<0x40, "dpps", int_x86_sse41_dpps,		defm DPPS : SS41I_binop_rmi_int<0x40, "dpps", int_x86_sse41_dpps,
VR128, memopv4f32, f128mem, 1,		VR128, memop, f128mem, 1,
SchedWriteDPPS.XMM>;		SchedWriteDPPS.XMM>;
let ExeDomain = SSEPackedDouble in		let ExeDomain = SSEPackedDouble in
defm DPPD : SS41I_binop_rmi_int<0x41, "dppd", int_x86_sse41_dppd,		defm DPPD : SS41I_binop_rmi_int<0x41, "dppd", int_x86_sse41_dppd,
VR128, memopv2f64, f128mem, 1,		VR128, memop, f128mem, 1,
SchedWriteDPPD.XMM>;		SchedWriteDPPD.XMM>;
}		}

/// SS41I_blend_rmi - SSE 4.1 blend with 8-bit immediate		/// SS41I_blend_rmi - SSE 4.1 blend with 8-bit immediate
multiclass SS41I_blend_rmi<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass SS41I_blend_rmi<bits<8> opc, string OpcodeStr, SDNode OpNode,
ValueType OpVT, RegisterClass RC, PatFrag memop_frag,		ValueType OpVT, RegisterClass RC, PatFrag memop_frag,
X86MemOperand x86memop, bit Is2Addr, Domain d,		X86MemOperand x86memop, bit Is2Addr, Domain d,
X86FoldableSchedWrite sched, SDNodeXForm commuteXForm> {		X86FoldableSchedWrite sched, SDNodeXForm commuteXForm> {
Show All 11 Lines	let ExeDomain = d, Constraints = !if(Is2Addr, "$src1 = $dst", "") in {
def rmi : SS4AIi8<opc, MRMSrcMem, (outs RC:$dst),		def rmi : SS4AIi8<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop:$src2, u8imm:$src3),		(ins RC:$src1, x86memop:$src2, u8imm:$src3),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),
[(set RC:$dst,		[(set RC:$dst,
(OpVT (OpNode RC:$src1,		(OpVT (OpNode RC:$src1, (memop_frag addr:$src2), imm:$src3)))]>,
(bitconvert (memop_frag addr:$src2)), imm:$src3)))]>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

// Pattern to commute if load is in first source.		// Pattern to commute if load is in first source.
def : Pat<(OpVT (OpNode (bitconvert (memop_frag addr:$src2)),		def : Pat<(OpVT (OpNode (memop_frag addr:$src2), RC:$src1, imm:$src3)),
RC:$src1, imm:$src3)),
(!cast<Instruction>(NAME#"rmi") RC:$src1, addr:$src2,		(!cast<Instruction>(NAME#"rmi") RC:$src1, addr:$src2,
(commuteXForm imm:$src3))>;		(commuteXForm imm:$src3))>;
}		}

let Predicates = [HasAVX] in {		let Predicates = [HasAVX] in {
defm VBLENDPS : SS41I_blend_rmi<0x0C, "vblendps", X86Blendi, v4f32,		defm VBLENDPS : SS41I_blend_rmi<0x0C, "vblendps", X86Blendi, v4f32,
VR128, loadv4f32, f128mem, 0, SSEPackedSingle,		VR128, load, f128mem, 0, SSEPackedSingle,
SchedWriteFBlend.XMM, BlendCommuteImm4>,		SchedWriteFBlend.XMM, BlendCommuteImm4>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
defm VBLENDPSY : SS41I_blend_rmi<0x0C, "vblendps", X86Blendi, v8f32,		defm VBLENDPSY : SS41I_blend_rmi<0x0C, "vblendps", X86Blendi, v8f32,
VR256, loadv8f32, f256mem, 0, SSEPackedSingle,		VR256, load, f256mem, 0, SSEPackedSingle,
SchedWriteFBlend.YMM, BlendCommuteImm8>,		SchedWriteFBlend.YMM, BlendCommuteImm8>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
defm VBLENDPD : SS41I_blend_rmi<0x0D, "vblendpd", X86Blendi, v2f64,		defm VBLENDPD : SS41I_blend_rmi<0x0D, "vblendpd", X86Blendi, v2f64,
VR128, loadv2f64, f128mem, 0, SSEPackedDouble,		VR128, load, f128mem, 0, SSEPackedDouble,
SchedWriteFBlend.XMM, BlendCommuteImm2>,		SchedWriteFBlend.XMM, BlendCommuteImm2>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
defm VBLENDPDY : SS41I_blend_rmi<0x0D, "vblendpd", X86Blendi, v4f64,		defm VBLENDPDY : SS41I_blend_rmi<0x0D, "vblendpd", X86Blendi, v4f64,
VR256, loadv4f64, f256mem, 0, SSEPackedDouble,		VR256, load, f256mem, 0, SSEPackedDouble,
SchedWriteFBlend.YMM, BlendCommuteImm4>,		SchedWriteFBlend.YMM, BlendCommuteImm4>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
defm VPBLENDW : SS41I_blend_rmi<0x0E, "vpblendw", X86Blendi, v8i16,		defm VPBLENDW : SS41I_blend_rmi<0x0E, "vpblendw", X86Blendi, v8i16,
VR128, loadv2i64, i128mem, 0, SSEPackedInt,		VR128, load, i128mem, 0, SSEPackedInt,
SchedWriteBlend.XMM, BlendCommuteImm8>,		SchedWriteBlend.XMM, BlendCommuteImm8>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
}		}

let Predicates = [HasAVX2] in {		let Predicates = [HasAVX2] in {
defm VPBLENDWY : SS41I_blend_rmi<0x0E, "vpblendw", X86Blendi, v16i16,		defm VPBLENDWY : SS41I_blend_rmi<0x0E, "vpblendw", X86Blendi, v16i16,
VR256, loadv4i64, i256mem, 0, SSEPackedInt,		VR256, load, i256mem, 0, SSEPackedInt,
SchedWriteBlend.YMM, BlendCommuteImm8>,		SchedWriteBlend.YMM, BlendCommuteImm8>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;
}		}

defm BLENDPS : SS41I_blend_rmi<0x0C, "blendps", X86Blendi, v4f32,		defm BLENDPS : SS41I_blend_rmi<0x0C, "blendps", X86Blendi, v4f32,
VR128, memopv4f32, f128mem, 1, SSEPackedSingle,		VR128, memop, f128mem, 1, SSEPackedSingle,
SchedWriteFBlend.XMM, BlendCommuteImm4>;		SchedWriteFBlend.XMM, BlendCommuteImm4>;
defm BLENDPD : SS41I_blend_rmi<0x0D, "blendpd", X86Blendi, v2f64,		defm BLENDPD : SS41I_blend_rmi<0x0D, "blendpd", X86Blendi, v2f64,
VR128, memopv2f64, f128mem, 1, SSEPackedDouble,		VR128, memop, f128mem, 1, SSEPackedDouble,
SchedWriteFBlend.XMM, BlendCommuteImm2>;		SchedWriteFBlend.XMM, BlendCommuteImm2>;
defm PBLENDW : SS41I_blend_rmi<0x0E, "pblendw", X86Blendi, v8i16,		defm PBLENDW : SS41I_blend_rmi<0x0E, "pblendw", X86Blendi, v8i16,
VR128, memopv2i64, i128mem, 1, SSEPackedInt,		VR128, memop, i128mem, 1, SSEPackedInt,
SchedWriteBlend.XMM, BlendCommuteImm8>;		SchedWriteBlend.XMM, BlendCommuteImm8>;

// For insertion into the zero index (low half) of a 256-bit vector, it is		// For insertion into the zero index (low half) of a 256-bit vector, it is
// more efficient to generate a blend with immediate instead of an insert*128.		// more efficient to generate a blend with immediate instead of an insert*128.
let Predicates = [HasAVX] in {		let Predicates = [HasAVX] in {
def : Pat<(insert_subvector (v4f64 VR256:$src1), (v2f64 VR128:$src2), (iPTR 0)),		def : Pat<(insert_subvector (v4f64 VR256:$src1), (v2f64 VR128:$src2), (iPTR 0)),
(VBLENDPDYrri VR256:$src1,		(VBLENDPDYrri VR256:$src1,
(INSERT_SUBREG (v4f64 (IMPLICIT_DEF)),		(INSERT_SUBREG (v4f64 (IMPLICIT_DEF)),
Show All 17 Lines	def rr : Ii8Reg<opc, MRMSrcReg, (outs RC:$dst),
SSEPackedInt>, TAPD, VEX_4V,		SSEPackedInt>, TAPD, VEX_4V,
Sched<[sched]>;		Sched<[sched]>;

def rm : Ii8Reg<opc, MRMSrcMem, (outs RC:$dst),		def rm : Ii8Reg<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop:$src2, RC:$src3),		(ins RC:$src1, x86memop:$src2, RC:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[(set RC:$dst,		[(set RC:$dst,
(IntId RC:$src1, (bitconvert (mem_frag addr:$src2)),		(IntId RC:$src1, (mem_frag addr:$src2),
RC:$src3))], SSEPackedInt>, TAPD, VEX_4V,		RC:$src3))], SSEPackedInt>, TAPD, VEX_4V,
Sched<[sched.Folded, sched.ReadAfterFold,		Sched<[sched.Folded, sched.ReadAfterFold,
// x86memop:$src2		// x86memop:$src2
ReadDefault, ReadDefault, ReadDefault, ReadDefault,		ReadDefault, ReadDefault, ReadDefault, ReadDefault,
ReadDefault,		ReadDefault,
// RC::$src3		// RC::$src3
sched.ReadAfterFold]>;		sched.ReadAfterFold]>;
}		}

let Predicates = [HasAVX] in {		let Predicates = [HasAVX] in {
let ExeDomain = SSEPackedDouble in {		let ExeDomain = SSEPackedDouble in {
defm VBLENDVPD : SS41I_quaternary_int_avx<0x4B, "vblendvpd", VR128, f128mem,		defm VBLENDVPD : SS41I_quaternary_int_avx<0x4B, "vblendvpd", VR128, f128mem,
loadv2f64, int_x86_sse41_blendvpd,		load, int_x86_sse41_blendvpd,
SchedWriteFVarBlend.XMM>;		SchedWriteFVarBlend.XMM>;
defm VBLENDVPDY : SS41I_quaternary_int_avx<0x4B, "vblendvpd", VR256, f256mem,		defm VBLENDVPDY : SS41I_quaternary_int_avx<0x4B, "vblendvpd", VR256, f256mem,
loadv4f64, int_x86_avx_blendv_pd_256,		loadv4f64, int_x86_avx_blendv_pd_256,
SchedWriteFVarBlend.YMM>, VEX_L;		SchedWriteFVarBlend.YMM>, VEX_L;
} // ExeDomain = SSEPackedDouble		} // ExeDomain = SSEPackedDouble
let ExeDomain = SSEPackedSingle in {		let ExeDomain = SSEPackedSingle in {
defm VBLENDVPS : SS41I_quaternary_int_avx<0x4A, "vblendvps", VR128, f128mem,		defm VBLENDVPS : SS41I_quaternary_int_avx<0x4A, "vblendvps", VR128, f128mem,
loadv4f32, int_x86_sse41_blendvps,		load, int_x86_sse41_blendvps,
SchedWriteFVarBlend.XMM>;		SchedWriteFVarBlend.XMM>;
defm VBLENDVPSY : SS41I_quaternary_int_avx<0x4A, "vblendvps", VR256, f256mem,		defm VBLENDVPSY : SS41I_quaternary_int_avx<0x4A, "vblendvps", VR256, f256mem,
loadv8f32, int_x86_avx_blendv_ps_256,		loadv8f32, int_x86_avx_blendv_ps_256,
SchedWriteFVarBlend.YMM>, VEX_L;		SchedWriteFVarBlend.YMM>, VEX_L;
} // ExeDomain = SSEPackedSingle		} // ExeDomain = SSEPackedSingle
defm VPBLENDVB : SS41I_quaternary_int_avx<0x4C, "vpblendvb", VR128, i128mem,		defm VPBLENDVB : SS41I_quaternary_int_avx<0x4C, "vpblendvb", VR128, i128mem,
loadv2i64, int_x86_sse41_pblendvb,		load, int_x86_sse41_pblendvb,
SchedWriteVarBlend.XMM>;		SchedWriteVarBlend.XMM>;
}		}

let Predicates = [HasAVX2] in {		let Predicates = [HasAVX2] in {
defm VPBLENDVBY : SS41I_quaternary_int_avx<0x4C, "vpblendvb", VR256, i256mem,		defm VPBLENDVBY : SS41I_quaternary_int_avx<0x4C, "vpblendvb", VR256, i256mem,
loadv4i64, int_x86_avx2_pblendvb,		load, int_x86_avx2_pblendvb,
SchedWriteVarBlend.YMM>, VEX_L;		SchedWriteVarBlend.YMM>, VEX_L;
}		}

let Predicates = [HasAVX] in {		let Predicates = [HasAVX] in {
def : Pat<(v16i8 (vselect (v16i8 VR128:$mask), (v16i8 VR128:$src1),		def : Pat<(v16i8 (vselect (v16i8 VR128:$mask), (v16i8 VR128:$src1),
(v16i8 VR128:$src2))),		(v16i8 VR128:$src2))),
(VPBLENDVBrr VR128:$src2, VR128:$src1, VR128:$mask)>;		(VPBLENDVBrr VR128:$src2, VR128:$src1, VR128:$mask)>;
def : Pat<(v4i32 (vselect (v4i32 VR128:$mask), (v4i32 VR128:$src1),		def : Pat<(v4i32 (vselect (v4i32 VR128:$mask), (v4i32 VR128:$src1),
▲ Show 20 Lines • Show All 114 Lines • ▼ Show 20 Lines	def rr0 : SS48I<opc, MRMSrcReg, (outs VR128:$dst),
Sched<[sched]>;		Sched<[sched]>;

def rm0 : SS48I<opc, MRMSrcMem, (outs VR128:$dst),		def rm0 : SS48I<opc, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, x86memop:$src2),		(ins VR128:$src1, x86memop:$src2),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{%xmm0, $src2, $dst\|$dst, $src2, xmm0}"),		"\t{%xmm0, $src2, $dst\|$dst, $src2, xmm0}"),
[(set VR128:$dst,		[(set VR128:$dst,
(IntId VR128:$src1,		(IntId VR128:$src1,
(bitconvert (mem_frag addr:$src2)), XMM0))]>,		(mem_frag addr:$src2), XMM0))]>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

let ExeDomain = SSEPackedDouble in		let ExeDomain = SSEPackedDouble in
defm BLENDVPD : SS41I_ternary_int<0x15, "blendvpd", memopv2f64, f128mem,		defm BLENDVPD : SS41I_ternary_int<0x15, "blendvpd", memop, f128mem,
int_x86_sse41_blendvpd, SchedWriteFVarBlend.XMM>;		int_x86_sse41_blendvpd, SchedWriteFVarBlend.XMM>;
let ExeDomain = SSEPackedSingle in		let ExeDomain = SSEPackedSingle in
defm BLENDVPS : SS41I_ternary_int<0x14, "blendvps", memopv4f32, f128mem,		defm BLENDVPS : SS41I_ternary_int<0x14, "blendvps", memop, f128mem,
int_x86_sse41_blendvps, SchedWriteFVarBlend.XMM>;		int_x86_sse41_blendvps, SchedWriteFVarBlend.XMM>;
defm PBLENDVB : SS41I_ternary_int<0x10, "pblendvb", memopv2i64, i128mem,		defm PBLENDVB : SS41I_ternary_int<0x10, "pblendvb", memop, i128mem,
int_x86_sse41_pblendvb, SchedWriteVarBlend.XMM>;		int_x86_sse41_pblendvb, SchedWriteVarBlend.XMM>;

// Aliases with the implicit xmm0 argument		// Aliases with the implicit xmm0 argument
def : InstAlias<"blendvpd\t{$src2, $dst\|$dst, $src2}",		def : InstAlias<"blendvpd\t{$src2, $dst\|$dst, $src2}",
(BLENDVPDrr0 VR128:$dst, VR128:$src2), 0>;		(BLENDVPDrr0 VR128:$dst, VR128:$src2), 0>;
def : InstAlias<"blendvpd\t{$src2, $dst\|$dst, $src2}",		def : InstAlias<"blendvpd\t{$src2, $dst\|$dst, $src2}",
(BLENDVPDrm0 VR128:$dst, f128mem:$src2), 0>;		(BLENDVPDrm0 VR128:$dst, f128mem:$src2), 0>;
def : InstAlias<"blendvps\t{$src2, $dst\|$dst, $src2}",		def : InstAlias<"blendvps\t{$src2, $dst\|$dst, $src2}",
Show All 39 Lines

let Predicates = [HasAVX2, NoVLX] in {		let Predicates = [HasAVX2, NoVLX] in {
def : Pat<(v8f32 (alignednontemporalload addr:$src)),		def : Pat<(v8f32 (alignednontemporalload addr:$src)),
(VMOVNTDQAYrm addr:$src)>;		(VMOVNTDQAYrm addr:$src)>;
def : Pat<(v4f64 (alignednontemporalload addr:$src)),		def : Pat<(v4f64 (alignednontemporalload addr:$src)),
(VMOVNTDQAYrm addr:$src)>;		(VMOVNTDQAYrm addr:$src)>;
def : Pat<(v4i64 (alignednontemporalload addr:$src)),		def : Pat<(v4i64 (alignednontemporalload addr:$src)),
(VMOVNTDQAYrm addr:$src)>;		(VMOVNTDQAYrm addr:$src)>;
		def : Pat<(v8i32 (alignednontemporalload addr:$src)),
		(VMOVNTDQAYrm addr:$src)>;
		def : Pat<(v16i16 (alignednontemporalload addr:$src)),
		(VMOVNTDQAYrm addr:$src)>;
		def : Pat<(v32i8 (alignednontemporalload addr:$src)),
		(VMOVNTDQAYrm addr:$src)>;
}		}

let Predicates = [HasAVX, NoVLX] in {		let Predicates = [HasAVX, NoVLX] in {
def : Pat<(v4f32 (alignednontemporalload addr:$src)),		def : Pat<(v4f32 (alignednontemporalload addr:$src)),
(VMOVNTDQArm addr:$src)>;		(VMOVNTDQArm addr:$src)>;
def : Pat<(v2f64 (alignednontemporalload addr:$src)),		def : Pat<(v2f64 (alignednontemporalload addr:$src)),
(VMOVNTDQArm addr:$src)>;		(VMOVNTDQArm addr:$src)>;
def : Pat<(v2i64 (alignednontemporalload addr:$src)),		def : Pat<(v2i64 (alignednontemporalload addr:$src)),
(VMOVNTDQArm addr:$src)>;		(VMOVNTDQArm addr:$src)>;
		def : Pat<(v4i32 (alignednontemporalload addr:$src)),
		(VMOVNTDQArm addr:$src)>;
		def : Pat<(v8i16 (alignednontemporalload addr:$src)),
		(VMOVNTDQArm addr:$src)>;
		def : Pat<(v16i8 (alignednontemporalload addr:$src)),
		(VMOVNTDQArm addr:$src)>;
}		}

let Predicates = [UseSSE41] in {		let Predicates = [UseSSE41] in {
def : Pat<(v4f32 (alignednontemporalload addr:$src)),		def : Pat<(v4f32 (alignednontemporalload addr:$src)),
(MOVNTDQArm addr:$src)>;		(MOVNTDQArm addr:$src)>;
def : Pat<(v2f64 (alignednontemporalload addr:$src)),		def : Pat<(v2f64 (alignednontemporalload addr:$src)),
(MOVNTDQArm addr:$src)>;		(MOVNTDQArm addr:$src)>;
def : Pat<(v2i64 (alignednontemporalload addr:$src)),		def : Pat<(v2i64 (alignednontemporalload addr:$src)),
(MOVNTDQArm addr:$src)>;		(MOVNTDQArm addr:$src)>;
		def : Pat<(v4i32 (alignednontemporalload addr:$src)),
		(MOVNTDQArm addr:$src)>;
		def : Pat<(v8i16 (alignednontemporalload addr:$src)),
		(MOVNTDQArm addr:$src)>;
		def : Pat<(v16i8 (alignednontemporalload addr:$src)),
		(MOVNTDQArm addr:$src)>;
}		}

} // AddedComplexity		} // AddedComplexity

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// SSE4.2 - Compare Instructions		// SSE4.2 - Compare Instructions
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

Show All 16 Lines	def rm : SS428I<opc, MRMSrcMem, (outs RC:$dst),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst,		[(set RC:$dst,
(OpVT (OpNode RC:$src1, (memop_frag addr:$src2))))]>,		(OpVT (OpNode RC:$src1, (memop_frag addr:$src2))))]>,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let Predicates = [HasAVX] in		let Predicates = [HasAVX] in
defm VPCMPGTQ : SS42I_binop_rm<0x37, "vpcmpgtq", X86pcmpgt, v2i64, VR128,		defm VPCMPGTQ : SS42I_binop_rm<0x37, "vpcmpgtq", X86pcmpgt, v2i64, VR128,
loadv2i64, i128mem, SchedWriteVecALU.XMM, 0>,		load, i128mem, SchedWriteVecALU.XMM, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;

let Predicates = [HasAVX2] in		let Predicates = [HasAVX2] in
defm VPCMPGTQY : SS42I_binop_rm<0x37, "vpcmpgtq", X86pcmpgt, v4i64, VR256,		defm VPCMPGTQY : SS42I_binop_rm<0x37, "vpcmpgtq", X86pcmpgt, v4i64, VR256,
loadv4i64, i256mem, SchedWriteVecALU.YMM, 0>,		load, i256mem, SchedWriteVecALU.YMM, 0>,
VEX_4V, VEX_L, VEX_WIG;		VEX_4V, VEX_L, VEX_WIG;

let Constraints = "$src1 = $dst" in		let Constraints = "$src1 = $dst" in
defm PCMPGTQ : SS42I_binop_rm<0x37, "pcmpgtq", X86pcmpgt, v2i64, VR128,		defm PCMPGTQ : SS42I_binop_rm<0x37, "pcmpgtq", X86pcmpgt, v2i64, VR128,
memopv2i64, i128mem, SchedWriteVecALU.XMM>;		memop, i128mem, SchedWriteVecALU.XMM>;

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// SSE4.2 - String/text Processing Instructions		// SSE4.2 - String/text Processing Instructions
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

multiclass pcmpistrm_SS42AI<string asm> {		multiclass pcmpistrm_SS42AI<string asm> {
def rr : SS42AI<0x62, MRMSrcReg, (outs),		def rr : SS42AI<0x62, MRMSrcReg, (outs),
(ins VR128:$src1, VR128:$src2, u8imm:$src3),		(ins VR128:$src1, VR128:$src2, u8imm:$src3),
▲ Show 20 Lines • Show All 134 Lines • ▼ Show 20 Lines	multiclass SHAI_binop<bits<8> Opc, string OpcodeStr, Intrinsic IntId,

def rm : I<Opc, MRMSrcMem, (outs VR128:$dst),		def rm : I<Opc, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, i128mem:$src2),		(ins VR128:$src1, i128mem:$src2),
!if(UsesXMM0,		!if(UsesXMM0,
!strconcat(OpcodeStr, "\t{%xmm0, $src2, $dst\|$dst, $src2, xmm0}"),		!strconcat(OpcodeStr, "\t{%xmm0, $src2, $dst\|$dst, $src2, xmm0}"),
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}")),
[!if(UsesXMM0,		[!if(UsesXMM0,
(set VR128:$dst, (IntId VR128:$src1,		(set VR128:$dst, (IntId VR128:$src1,
(bc_v4i32 (memopv2i64 addr:$src2)), XMM0)),		(memop addr:$src2), XMM0)),
(set VR128:$dst, (IntId VR128:$src1,		(set VR128:$dst, (IntId VR128:$src1,
(bc_v4i32 (memopv2i64 addr:$src2)))))]>, T8,		(memop addr:$src2))))]>, T8,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let Constraints = "$src1 = $dst", Predicates = [HasSHA] in {		let Constraints = "$src1 = $dst", Predicates = [HasSHA] in {
def SHA1RNDS4rri : Ii8<0xCC, MRMSrcReg, (outs VR128:$dst),		def SHA1RNDS4rri : Ii8<0xCC, MRMSrcReg, (outs VR128:$dst),
(ins VR128:$src1, VR128:$src2, u8imm:$src3),		(ins VR128:$src1, VR128:$src2, u8imm:$src3),
"sha1rnds4\t{$src3, $src2, $dst\|$dst, $src2, $src3}",		"sha1rnds4\t{$src3, $src2, $dst\|$dst, $src2, $src3}",
[(set VR128:$dst,		[(set VR128:$dst,
(int_x86_sha1rnds4 VR128:$src1, VR128:$src2,		(int_x86_sha1rnds4 VR128:$src1, VR128:$src2,
(i8 imm:$src3)))]>, TA,		(i8 imm:$src3)))]>, TA,
Sched<[SchedWriteVecIMul.XMM]>;		Sched<[SchedWriteVecIMul.XMM]>;
def SHA1RNDS4rmi : Ii8<0xCC, MRMSrcMem, (outs VR128:$dst),		def SHA1RNDS4rmi : Ii8<0xCC, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, i128mem:$src2, u8imm:$src3),		(ins VR128:$src1, i128mem:$src2, u8imm:$src3),
"sha1rnds4\t{$src3, $src2, $dst\|$dst, $src2, $src3}",		"sha1rnds4\t{$src3, $src2, $dst\|$dst, $src2, $src3}",
[(set VR128:$dst,		[(set VR128:$dst,
(int_x86_sha1rnds4 VR128:$src1,		(int_x86_sha1rnds4 VR128:$src1,
(bc_v4i32 (memopv2i64 addr:$src2)),		(memop addr:$src2),
(i8 imm:$src3)))]>, TA,		(i8 imm:$src3)))]>, TA,
Sched<[SchedWriteVecIMul.XMM.Folded,		Sched<[SchedWriteVecIMul.XMM.Folded,
SchedWriteVecIMul.XMM.ReadAfterFold]>;		SchedWriteVecIMul.XMM.ReadAfterFold]>;

defm SHA1NEXTE : SHAI_binop<0xC8, "sha1nexte", int_x86_sha1nexte,		defm SHA1NEXTE : SHAI_binop<0xC8, "sha1nexte", int_x86_sha1nexte,
SchedWriteVecIMul.XMM>;		SchedWriteVecIMul.XMM>;
defm SHA1MSG1 : SHAI_binop<0xC9, "sha1msg1", int_x86_sha1msg1,		defm SHA1MSG1 : SHAI_binop<0xC9, "sha1msg1", int_x86_sha1msg1,
SchedWriteVecIMul.XMM>;		SchedWriteVecIMul.XMM>;
Show All 36 Lines	def rm : AES8I<opc, MRMSrcMem, (outs RC:$dst),
[(set RC:$dst, (IntId RC:$src1, (ld_frag addr:$src2)))]>,		[(set RC:$dst, (IntId RC:$src1, (ld_frag addr:$src2)))]>,
Sched<[WriteAESDecEnc.Folded, WriteAESDecEnc.ReadAfterFold]>;		Sched<[WriteAESDecEnc.Folded, WriteAESDecEnc.ReadAfterFold]>;
}		}
}		}

// Perform One Round of an AES Encryption/Decryption Flow		// Perform One Round of an AES Encryption/Decryption Flow
let Predicates = [HasAVX, NoVLX_Or_NoVAES, HasAES] in {		let Predicates = [HasAVX, NoVLX_Or_NoVAES, HasAES] in {
defm VAESENC : AESI_binop_rm_int<0xDC, "vaesenc",		defm VAESENC : AESI_binop_rm_int<0xDC, "vaesenc",
int_x86_aesni_aesenc, loadv2i64>, VEX_4V, VEX_WIG;		int_x86_aesni_aesenc, load>, VEX_4V, VEX_WIG;
defm VAESENCLAST : AESI_binop_rm_int<0xDD, "vaesenclast",		defm VAESENCLAST : AESI_binop_rm_int<0xDD, "vaesenclast",
int_x86_aesni_aesenclast, loadv2i64>, VEX_4V, VEX_WIG;		int_x86_aesni_aesenclast, load>, VEX_4V, VEX_WIG;
defm VAESDEC : AESI_binop_rm_int<0xDE, "vaesdec",		defm VAESDEC : AESI_binop_rm_int<0xDE, "vaesdec",
int_x86_aesni_aesdec, loadv2i64>, VEX_4V, VEX_WIG;		int_x86_aesni_aesdec, load>, VEX_4V, VEX_WIG;
defm VAESDECLAST : AESI_binop_rm_int<0xDF, "vaesdeclast",		defm VAESDECLAST : AESI_binop_rm_int<0xDF, "vaesdeclast",
int_x86_aesni_aesdeclast, loadv2i64>, VEX_4V, VEX_WIG;		int_x86_aesni_aesdeclast, load>, VEX_4V, VEX_WIG;
}		}

let Predicates = [NoVLX, HasVAES] in {		let Predicates = [NoVLX, HasVAES] in {
defm VAESENCY : AESI_binop_rm_int<0xDC, "vaesenc",		defm VAESENCY : AESI_binop_rm_int<0xDC, "vaesenc",
int_x86_aesni_aesenc_256, loadv4i64, 0, VR256,		int_x86_aesni_aesenc_256, load, 0, VR256,
i256mem>, VEX_4V, VEX_L, VEX_WIG;		i256mem>, VEX_4V, VEX_L, VEX_WIG;
defm VAESENCLASTY : AESI_binop_rm_int<0xDD, "vaesenclast",		defm VAESENCLASTY : AESI_binop_rm_int<0xDD, "vaesenclast",
int_x86_aesni_aesenclast_256, loadv4i64, 0, VR256,		int_x86_aesni_aesenclast_256, load, 0, VR256,
i256mem>, VEX_4V, VEX_L, VEX_WIG;		i256mem>, VEX_4V, VEX_L, VEX_WIG;
defm VAESDECY : AESI_binop_rm_int<0xDE, "vaesdec",		defm VAESDECY : AESI_binop_rm_int<0xDE, "vaesdec",
int_x86_aesni_aesdec_256, loadv4i64, 0, VR256,		int_x86_aesni_aesdec_256, load, 0, VR256,
i256mem>, VEX_4V, VEX_L, VEX_WIG;		i256mem>, VEX_4V, VEX_L, VEX_WIG;
defm VAESDECLASTY : AESI_binop_rm_int<0xDF, "vaesdeclast",		defm VAESDECLASTY : AESI_binop_rm_int<0xDF, "vaesdeclast",
int_x86_aesni_aesdeclast_256, loadv4i64, 0, VR256,		int_x86_aesni_aesdeclast_256, load, 0, VR256,
i256mem>, VEX_4V, VEX_L, VEX_WIG;		i256mem>, VEX_4V, VEX_L, VEX_WIG;
}		}

let Constraints = "$src1 = $dst" in {		let Constraints = "$src1 = $dst" in {
defm AESENC : AESI_binop_rm_int<0xDC, "aesenc",		defm AESENC : AESI_binop_rm_int<0xDC, "aesenc",
int_x86_aesni_aesenc, memopv2i64, 1>;		int_x86_aesni_aesenc, memop, 1>;
defm AESENCLAST : AESI_binop_rm_int<0xDD, "aesenclast",		defm AESENCLAST : AESI_binop_rm_int<0xDD, "aesenclast",
int_x86_aesni_aesenclast, memopv2i64, 1>;		int_x86_aesni_aesenclast, memop, 1>;
defm AESDEC : AESI_binop_rm_int<0xDE, "aesdec",		defm AESDEC : AESI_binop_rm_int<0xDE, "aesdec",
int_x86_aesni_aesdec, memopv2i64, 1>;		int_x86_aesni_aesdec, memop, 1>;
defm AESDECLAST : AESI_binop_rm_int<0xDF, "aesdeclast",		defm AESDECLAST : AESI_binop_rm_int<0xDF, "aesdeclast",
int_x86_aesni_aesdeclast, memopv2i64, 1>;		int_x86_aesni_aesdeclast, memop, 1>;
}		}

// Perform the AES InvMixColumn Transformation		// Perform the AES InvMixColumn Transformation
let Predicates = [HasAVX, HasAES] in {		let Predicates = [HasAVX, HasAES] in {
def VAESIMCrr : AES8I<0xDB, MRMSrcReg, (outs VR128:$dst),		def VAESIMCrr : AES8I<0xDB, MRMSrcReg, (outs VR128:$dst),
(ins VR128:$src1),		(ins VR128:$src1),
"vaesimc\t{$src1, $dst\|$dst, $src1}",		"vaesimc\t{$src1, $dst\|$dst, $src1}",
[(set VR128:$dst,		[(set VR128:$dst,
(int_x86_aesni_aesimc VR128:$src1))]>, Sched<[WriteAESIMC]>,		(int_x86_aesni_aesimc VR128:$src1))]>, Sched<[WriteAESIMC]>,
VEX, VEX_WIG;		VEX, VEX_WIG;
def VAESIMCrm : AES8I<0xDB, MRMSrcMem, (outs VR128:$dst),		def VAESIMCrm : AES8I<0xDB, MRMSrcMem, (outs VR128:$dst),
(ins i128mem:$src1),		(ins i128mem:$src1),
"vaesimc\t{$src1, $dst\|$dst, $src1}",		"vaesimc\t{$src1, $dst\|$dst, $src1}",
[(set VR128:$dst, (int_x86_aesni_aesimc (loadv2i64 addr:$src1)))]>,		[(set VR128:$dst, (int_x86_aesni_aesimc (load addr:$src1)))]>,
Sched<[WriteAESIMC.Folded]>, VEX, VEX_WIG;		Sched<[WriteAESIMC.Folded]>, VEX, VEX_WIG;
}		}
def AESIMCrr : AES8I<0xDB, MRMSrcReg, (outs VR128:$dst),		def AESIMCrr : AES8I<0xDB, MRMSrcReg, (outs VR128:$dst),
(ins VR128:$src1),		(ins VR128:$src1),
"aesimc\t{$src1, $dst\|$dst, $src1}",		"aesimc\t{$src1, $dst\|$dst, $src1}",
[(set VR128:$dst,		[(set VR128:$dst,
(int_x86_aesni_aesimc VR128:$src1))]>, Sched<[WriteAESIMC]>;		(int_x86_aesni_aesimc VR128:$src1))]>, Sched<[WriteAESIMC]>;
def AESIMCrm : AES8I<0xDB, MRMSrcMem, (outs VR128:$dst),		def AESIMCrm : AES8I<0xDB, MRMSrcMem, (outs VR128:$dst),
(ins i128mem:$src1),		(ins i128mem:$src1),
"aesimc\t{$src1, $dst\|$dst, $src1}",		"aesimc\t{$src1, $dst\|$dst, $src1}",
[(set VR128:$dst, (int_x86_aesni_aesimc (memopv2i64 addr:$src1)))]>,		[(set VR128:$dst, (int_x86_aesni_aesimc (memop addr:$src1)))]>,
Sched<[WriteAESIMC.Folded]>;		Sched<[WriteAESIMC.Folded]>;

// AES Round Key Generation Assist		// AES Round Key Generation Assist
let Predicates = [HasAVX, HasAES] in {		let Predicates = [HasAVX, HasAES] in {
def VAESKEYGENASSIST128rr : AESAI<0xDF, MRMSrcReg, (outs VR128:$dst),		def VAESKEYGENASSIST128rr : AESAI<0xDF, MRMSrcReg, (outs VR128:$dst),
(ins VR128:$src1, u8imm:$src2),		(ins VR128:$src1, u8imm:$src2),
"vaeskeygenassist\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		"vaeskeygenassist\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
[(set VR128:$dst,		[(set VR128:$dst,
(int_x86_aesni_aeskeygenassist VR128:$src1, imm:$src2))]>,		(int_x86_aesni_aeskeygenassist VR128:$src1, imm:$src2))]>,
Sched<[WriteAESKeyGen]>, VEX, VEX_WIG;		Sched<[WriteAESKeyGen]>, VEX, VEX_WIG;
def VAESKEYGENASSIST128rm : AESAI<0xDF, MRMSrcMem, (outs VR128:$dst),		def VAESKEYGENASSIST128rm : AESAI<0xDF, MRMSrcMem, (outs VR128:$dst),
(ins i128mem:$src1, u8imm:$src2),		(ins i128mem:$src1, u8imm:$src2),
"vaeskeygenassist\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		"vaeskeygenassist\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
[(set VR128:$dst,		[(set VR128:$dst,
(int_x86_aesni_aeskeygenassist (loadv2i64 addr:$src1), imm:$src2))]>,		(int_x86_aesni_aeskeygenassist (load addr:$src1), imm:$src2))]>,
Sched<[WriteAESKeyGen.Folded]>, VEX, VEX_WIG;		Sched<[WriteAESKeyGen.Folded]>, VEX, VEX_WIG;
}		}
def AESKEYGENASSIST128rr : AESAI<0xDF, MRMSrcReg, (outs VR128:$dst),		def AESKEYGENASSIST128rr : AESAI<0xDF, MRMSrcReg, (outs VR128:$dst),
(ins VR128:$src1, u8imm:$src2),		(ins VR128:$src1, u8imm:$src2),
"aeskeygenassist\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		"aeskeygenassist\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
[(set VR128:$dst,		[(set VR128:$dst,
(int_x86_aesni_aeskeygenassist VR128:$src1, imm:$src2))]>,		(int_x86_aesni_aeskeygenassist VR128:$src1, imm:$src2))]>,
Sched<[WriteAESKeyGen]>;		Sched<[WriteAESKeyGen]>;
def AESKEYGENASSIST128rm : AESAI<0xDF, MRMSrcMem, (outs VR128:$dst),		def AESKEYGENASSIST128rm : AESAI<0xDF, MRMSrcMem, (outs VR128:$dst),
(ins i128mem:$src1, u8imm:$src2),		(ins i128mem:$src1, u8imm:$src2),
"aeskeygenassist\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		"aeskeygenassist\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
[(set VR128:$dst,		[(set VR128:$dst,
(int_x86_aesni_aeskeygenassist (memopv2i64 addr:$src1), imm:$src2))]>,		(int_x86_aesni_aeskeygenassist (memop addr:$src1), imm:$src2))]>,
Sched<[WriteAESKeyGen.Folded]>;		Sched<[WriteAESKeyGen.Folded]>;

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// PCLMUL Instructions		// PCLMUL Instructions
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

// Immediate transform to help with commuting.		// Immediate transform to help with commuting.
def PCLMULCommuteImm : SDNodeXForm<imm, [{		def PCLMULCommuteImm : SDNodeXForm<imm, [{
Show All 11 Lines	def PCLMULQDQrr : PCLMULIi8<0x44, MRMSrcReg, (outs VR128:$dst),
[(set VR128:$dst,		[(set VR128:$dst,
(int_x86_pclmulqdq VR128:$src1, VR128:$src2, imm:$src3))]>,		(int_x86_pclmulqdq VR128:$src1, VR128:$src2, imm:$src3))]>,
Sched<[WriteCLMul]>;		Sched<[WriteCLMul]>;

def PCLMULQDQrm : PCLMULIi8<0x44, MRMSrcMem, (outs VR128:$dst),		def PCLMULQDQrm : PCLMULIi8<0x44, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, i128mem:$src2, u8imm:$src3),		(ins VR128:$src1, i128mem:$src2, u8imm:$src3),
"pclmulqdq\t{$src3, $src2, $dst\|$dst, $src2, $src3}",		"pclmulqdq\t{$src3, $src2, $dst\|$dst, $src2, $src3}",
[(set VR128:$dst,		[(set VR128:$dst,
(int_x86_pclmulqdq VR128:$src1, (memopv2i64 addr:$src2),		(int_x86_pclmulqdq VR128:$src1, (memop addr:$src2),
imm:$src3))]>,		imm:$src3))]>,
Sched<[WriteCLMul.Folded, WriteCLMul.ReadAfterFold]>;		Sched<[WriteCLMul.Folded, WriteCLMul.ReadAfterFold]>;
} // Constraints = "$src1 = $dst"		} // Constraints = "$src1 = $dst"

def : Pat<(int_x86_pclmulqdq (memopv2i64 addr:$src2), VR128:$src1,		def : Pat<(int_x86_pclmulqdq (memop addr:$src2), VR128:$src1,
(i8 imm:$src3)),		(i8 imm:$src3)),
(PCLMULQDQrm VR128:$src1, addr:$src2,		(PCLMULQDQrm VR128:$src1, addr:$src2,
(PCLMULCommuteImm imm:$src3))>;		(PCLMULCommuteImm imm:$src3))>;
} // Predicates = [NoAVX, HasPCLMUL]		} // Predicates = [NoAVX, HasPCLMUL]

// SSE aliases		// SSE aliases
foreach HI = ["hq","lq"] in		foreach HI = ["hq","lq"] in
foreach LO = ["hq","lq"] in {		foreach LO = ["hq","lq"] in {
Show All 26 Lines	multiclass vpclmulqdq<RegisterClass RC, X86MemOperand MemOp,
// We can commute a load in the first operand by swapping the sources and		// We can commute a load in the first operand by swapping the sources and
// rotating the immediate.		// rotating the immediate.
def : Pat<(IntId (LdFrag addr:$src2), RC:$src1, (i8 imm:$src3)),		def : Pat<(IntId (LdFrag addr:$src2), RC:$src1, (i8 imm:$src3)),
(!cast<Instruction>(NAME#"rm") RC:$src1, addr:$src2,		(!cast<Instruction>(NAME#"rm") RC:$src1, addr:$src2,
(PCLMULCommuteImm imm:$src3))>;		(PCLMULCommuteImm imm:$src3))>;
}		}

let Predicates = [HasAVX, NoVLX_Or_NoVPCLMULQDQ, HasPCLMUL] in		let Predicates = [HasAVX, NoVLX_Or_NoVPCLMULQDQ, HasPCLMUL] in
defm VPCLMULQDQ : vpclmulqdq<VR128, i128mem, loadv2i64,		defm VPCLMULQDQ : vpclmulqdq<VR128, i128mem, load,
int_x86_pclmulqdq>, VEX_4V, VEX_WIG;		int_x86_pclmulqdq>, VEX_4V, VEX_WIG;

let Predicates = [NoVLX, HasVPCLMULQDQ] in		let Predicates = [NoVLX, HasVPCLMULQDQ] in
defm VPCLMULQDQY : vpclmulqdq<VR256, i256mem, loadv4i64,		defm VPCLMULQDQY : vpclmulqdq<VR256, i256mem, load,
int_x86_pclmulqdq_256>, VEX_4V, VEX_L, VEX_WIG;		int_x86_pclmulqdq_256>, VEX_4V, VEX_L, VEX_WIG;

multiclass vpclmulqdq_aliases_impl<string InstStr, RegisterClass RC,		multiclass vpclmulqdq_aliases_impl<string InstStr, RegisterClass RC,
X86MemOperand MemOp, string Hi, string Lo> {		X86MemOperand MemOp, string Hi, string Lo> {
def : InstAlias<"vpclmul"##Hi##Lo##"dq\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		def : InstAlias<"vpclmul"##Hi##Lo##"dq\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
(!cast<Instruction>(InstStr # "rr") RC:$dst, RC:$src1, RC:$src2,		(!cast<Instruction>(InstStr # "rr") RC:$dst, RC:$src1, RC:$src2,
!add(!shl(!eq(Lo,"hq"),4),!eq(Hi,"hq"))), 0>;		!add(!shl(!eq(Lo,"hq"),4),!eq(Hi,"hq"))), 0>;
def : InstAlias<"vpclmul"##Hi##Lo##"dq\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		def : InstAlias<"vpclmul"##Hi##Lo##"dq\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
▲ Show 20 Lines • Show All 139 Lines • ▼ Show 20 Lines
def VBROADCASTF128 : AVX8I<0x1A, MRMSrcMem, (outs VR256:$dst),		def VBROADCASTF128 : AVX8I<0x1A, MRMSrcMem, (outs VR256:$dst),
(ins f128mem:$src),		(ins f128mem:$src),
"vbroadcastf128\t{$src, $dst\|$dst, $src}", []>,		"vbroadcastf128\t{$src, $dst\|$dst, $src}", []>,
Sched<[SchedWriteFShuffle.XMM.Folded]>, VEX, VEX_L;		Sched<[SchedWriteFShuffle.XMM.Folded]>, VEX, VEX_L;

let Predicates = [HasAVX2, NoVLX] in {		let Predicates = [HasAVX2, NoVLX] in {
def : Pat<(v4i64 (X86SubVBroadcast (loadv2i64 addr:$src))),		def : Pat<(v4i64 (X86SubVBroadcast (loadv2i64 addr:$src))),
(VBROADCASTI128 addr:$src)>;		(VBROADCASTI128 addr:$src)>;
def : Pat<(v8i32 (X86SubVBroadcast (bc_v4i32 (loadv2i64 addr:$src)))),		def : Pat<(v8i32 (X86SubVBroadcast (loadv4i32 addr:$src))),
(VBROADCASTI128 addr:$src)>;		(VBROADCASTI128 addr:$src)>;
def : Pat<(v16i16 (X86SubVBroadcast (bc_v8i16 (loadv2i64 addr:$src)))),		def : Pat<(v16i16 (X86SubVBroadcast (loadv8i16 addr:$src))),
(VBROADCASTI128 addr:$src)>;		(VBROADCASTI128 addr:$src)>;
def : Pat<(v32i8 (X86SubVBroadcast (bc_v16i8 (loadv2i64 addr:$src)))),		def : Pat<(v32i8 (X86SubVBroadcast (loadv16i8 addr:$src))),
(VBROADCASTI128 addr:$src)>;		(VBROADCASTI128 addr:$src)>;
}		}

let Predicates = [HasAVX, NoVLX] in {		let Predicates = [HasAVX, NoVLX] in {
def : Pat<(v4f64 (X86SubVBroadcast (loadv2f64 addr:$src))),		def : Pat<(v4f64 (X86SubVBroadcast (loadv2f64 addr:$src))),
(VBROADCASTF128 addr:$src)>;		(VBROADCASTF128 addr:$src)>;
def : Pat<(v8f32 (X86SubVBroadcast (loadv4f32 addr:$src))),		def : Pat<(v8f32 (X86SubVBroadcast (loadv4f32 addr:$src))),
(VBROADCASTF128 addr:$src)>;		(VBROADCASTF128 addr:$src)>;
}		}

let Predicates = [HasAVX1Only] in {		let Predicates = [HasAVX1Only] in {
def : Pat<(v4i64 (X86SubVBroadcast (loadv2i64 addr:$src))),		def : Pat<(v4i64 (X86SubVBroadcast (loadv2i64 addr:$src))),
(VBROADCASTF128 addr:$src)>;		(VBROADCASTF128 addr:$src)>;
def : Pat<(v8i32 (X86SubVBroadcast (bc_v4i32 (loadv2i64 addr:$src)))),		def : Pat<(v8i32 (X86SubVBroadcast (loadv4i32 addr:$src))),
(VBROADCASTF128 addr:$src)>;		(VBROADCASTF128 addr:$src)>;
def : Pat<(v16i16 (X86SubVBroadcast (bc_v8i16 (loadv2i64 addr:$src)))),		def : Pat<(v16i16 (X86SubVBroadcast (loadv8i16 addr:$src))),
(VBROADCASTF128 addr:$src)>;		(VBROADCASTF128 addr:$src)>;
def : Pat<(v32i8 (X86SubVBroadcast (bc_v16i8 (loadv2i64 addr:$src)))),		def : Pat<(v32i8 (X86SubVBroadcast (loadv16i8 addr:$src))),
(VBROADCASTF128 addr:$src)>;		(VBROADCASTF128 addr:$src)>;
}		}

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// VINSERTF128 - Insert packed floating-point values		// VINSERTF128 - Insert packed floating-point values
//		//
let hasSideEffects = 0, ExeDomain = SSEPackedSingle in {		let hasSideEffects = 0, ExeDomain = SSEPackedSingle in {
def VINSERTF128rr : AVXAIi8<0x18, MRMSrcReg, (outs VR256:$dst),		def VINSERTF128rr : AVXAIi8<0x18, MRMSrcReg, (outs VR256:$dst),
Show All 16 Lines

multiclass vinsert_lowering<string InstrStr, ValueType From, ValueType To,		multiclass vinsert_lowering<string InstrStr, ValueType From, ValueType To,
PatFrag memop_frag> {		PatFrag memop_frag> {
def : Pat<(vinsert128_insert:$ins (To VR256:$src1), (From VR128:$src2),		def : Pat<(vinsert128_insert:$ins (To VR256:$src1), (From VR128:$src2),
(iPTR imm)),		(iPTR imm)),
(!cast<Instruction>(InstrStr#rr) VR256:$src1, VR128:$src2,		(!cast<Instruction>(InstrStr#rr) VR256:$src1, VR128:$src2,
(INSERT_get_vinsert128_imm VR256:$ins))>;		(INSERT_get_vinsert128_imm VR256:$ins))>;
def : Pat<(vinsert128_insert:$ins (To VR256:$src1),		def : Pat<(vinsert128_insert:$ins (To VR256:$src1),
(From (bitconvert (memop_frag addr:$src2))),		(From (memop_frag addr:$src2)),
(iPTR imm)),		(iPTR imm)),
(!cast<Instruction>(InstrStr#rm) VR256:$src1, addr:$src2,		(!cast<Instruction>(InstrStr#rm) VR256:$src1, addr:$src2,
(INSERT_get_vinsert128_imm VR256:$ins))>;		(INSERT_get_vinsert128_imm VR256:$ins))>;
}		}

let Predicates = [HasAVX, NoVLX] in {		let Predicates = [HasAVX, NoVLX] in {
defm : vinsert_lowering<"VINSERTF128", v4f32, v8f32, loadv4f32>;		defm : vinsert_lowering<"VINSERTF128", v4f32, v8f32, loadv4f32>;
defm : vinsert_lowering<"VINSERTF128", v2f64, v4f64, loadv2f64>;		defm : vinsert_lowering<"VINSERTF128", v2f64, v4f64, loadv2f64>;
}		}

let Predicates = [HasAVX1Only] in {		let Predicates = [HasAVX1Only] in {
defm : vinsert_lowering<"VINSERTF128", v2i64, v4i64, loadv2i64>;		defm : vinsert_lowering<"VINSERTF128", v2i64, v4i64, loadv2i64>;
defm : vinsert_lowering<"VINSERTF128", v4i32, v8i32, loadv2i64>;		defm : vinsert_lowering<"VINSERTF128", v4i32, v8i32, loadv4i32>;
defm : vinsert_lowering<"VINSERTF128", v8i16, v16i16, loadv2i64>;		defm : vinsert_lowering<"VINSERTF128", v8i16, v16i16, loadv8i16>;
defm : vinsert_lowering<"VINSERTF128", v16i8, v32i8, loadv2i64>;		defm : vinsert_lowering<"VINSERTF128", v16i8, v32i8, loadv16i8>;
}		}

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// VEXTRACTF128 - Extract packed floating-point values		// VEXTRACTF128 - Extract packed floating-point values
//		//
let hasSideEffects = 0, ExeDomain = SSEPackedSingle in {		let hasSideEffects = 0, ExeDomain = SSEPackedSingle in {
def VEXTRACTF128rr : AVXAIi8<0x19, MRMDestReg, (outs VR128:$dst),		def VEXTRACTF128rr : AVXAIi8<0x19, MRMDestReg, (outs VR128:$dst),
(ins VR256:$src1, u8imm:$src2),		(ins VR256:$src1, u8imm:$src2),
▲ Show 20 Lines • Show All 72 Lines • ▼ Show 20 Lines	defm VMASKMOVPD : avx_movmask_rm<0x2D, 0x2F, "vmaskmovpd",
int_x86_avx_maskstore_pd_256>;		int_x86_avx_maskstore_pd_256>;

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// VPERMIL - Permute Single and Double Floating-Point Values		// VPERMIL - Permute Single and Double Floating-Point Values
//		//

multiclass avx_permil<bits<8> opc_rm, bits<8> opc_rmi, string OpcodeStr,		multiclass avx_permil<bits<8> opc_rm, bits<8> opc_rmi, string OpcodeStr,
RegisterClass RC, X86MemOperand x86memop_f,		RegisterClass RC, X86MemOperand x86memop_f,
X86MemOperand x86memop_i, PatFrag i_frag,		X86MemOperand x86memop_i,
ValueType f_vt, ValueType i_vt,		ValueType f_vt, ValueType i_vt,
X86FoldableSchedWrite sched,		X86FoldableSchedWrite sched,
X86FoldableSchedWrite varsched> {		X86FoldableSchedWrite varsched> {
let Predicates = [HasAVX, NoVLX] in {		let Predicates = [HasAVX, NoVLX] in {
def rr : AVX8I<opc_rm, MRMSrcReg, (outs RC:$dst),		def rr : AVX8I<opc_rm, MRMSrcReg, (outs RC:$dst),
(ins RC:$src1, RC:$src2),		(ins RC:$src1, RC:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set RC:$dst, (f_vt (X86VPermilpv RC:$src1, (i_vt RC:$src2))))]>, VEX_4V,		[(set RC:$dst, (f_vt (X86VPermilpv RC:$src1, (i_vt RC:$src2))))]>, VEX_4V,
Sched<[varsched]>;		Sched<[varsched]>;
def rm : AVX8I<opc_rm, MRMSrcMem, (outs RC:$dst),		def rm : AVX8I<opc_rm, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop_i:$src2),		(ins RC:$src1, x86memop_i:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set RC:$dst, (f_vt (X86VPermilpv RC:$src1,		[(set RC:$dst, (f_vt (X86VPermilpv RC:$src1,
(i_vt (bitconvert (i_frag addr:$src2))))))]>, VEX_4V,		(i_vt (load addr:$src2)))))]>, VEX_4V,
Sched<[varsched.Folded, sched.ReadAfterFold]>;		Sched<[varsched.Folded, sched.ReadAfterFold]>;

def ri : AVXAIi8<opc_rmi, MRMSrcReg, (outs RC:$dst),		def ri : AVXAIi8<opc_rmi, MRMSrcReg, (outs RC:$dst),
(ins RC:$src1, u8imm:$src2),		(ins RC:$src1, u8imm:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set RC:$dst, (f_vt (X86VPermilpi RC:$src1, (i8 imm:$src2))))]>, VEX,		[(set RC:$dst, (f_vt (X86VPermilpi RC:$src1, (i8 imm:$src2))))]>, VEX,
Sched<[sched]>;		Sched<[sched]>;
def mi : AVXAIi8<opc_rmi, MRMSrcMem, (outs RC:$dst),		def mi : AVXAIi8<opc_rmi, MRMSrcMem, (outs RC:$dst),
(ins x86memop_f:$src1, u8imm:$src2),		(ins x86memop_f:$src1, u8imm:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set RC:$dst,		[(set RC:$dst,
(f_vt (X86VPermilpi (load addr:$src1), (i8 imm:$src2))))]>, VEX,		(f_vt (X86VPermilpi (load addr:$src1), (i8 imm:$src2))))]>, VEX,
Sched<[sched.Folded]>;		Sched<[sched.Folded]>;
}// Predicates = [HasAVX, NoVLX]		}// Predicates = [HasAVX, NoVLX]
}		}

let ExeDomain = SSEPackedSingle in {		let ExeDomain = SSEPackedSingle in {
defm VPERMILPS : avx_permil<0x0C, 0x04, "vpermilps", VR128, f128mem, i128mem,		defm VPERMILPS : avx_permil<0x0C, 0x04, "vpermilps", VR128, f128mem, i128mem,
loadv2i64, v4f32, v4i32, SchedWriteFShuffle.XMM,		v4f32, v4i32, SchedWriteFShuffle.XMM,
SchedWriteFVarShuffle.XMM>;		SchedWriteFVarShuffle.XMM>;
defm VPERMILPSY : avx_permil<0x0C, 0x04, "vpermilps", VR256, f256mem, i256mem,		defm VPERMILPSY : avx_permil<0x0C, 0x04, "vpermilps", VR256, f256mem, i256mem,
loadv4i64, v8f32, v8i32, SchedWriteFShuffle.YMM,		v8f32, v8i32, SchedWriteFShuffle.YMM,
SchedWriteFVarShuffle.YMM>, VEX_L;		SchedWriteFVarShuffle.YMM>, VEX_L;
}		}
let ExeDomain = SSEPackedDouble in {		let ExeDomain = SSEPackedDouble in {
defm VPERMILPD : avx_permil<0x0D, 0x05, "vpermilpd", VR128, f128mem, i128mem,		defm VPERMILPD : avx_permil<0x0D, 0x05, "vpermilpd", VR128, f128mem, i128mem,
loadv2i64, v2f64, v2i64, SchedWriteFShuffle.XMM,		v2f64, v2i64, SchedWriteFShuffle.XMM,
SchedWriteFVarShuffle.XMM>;		SchedWriteFVarShuffle.XMM>;
defm VPERMILPDY : avx_permil<0x0D, 0x05, "vpermilpd", VR256, f256mem, i256mem,		defm VPERMILPDY : avx_permil<0x0D, 0x05, "vpermilpd", VR256, f256mem, i256mem,
loadv4i64, v4f64, v4i64, SchedWriteFShuffle.YMM,		v4f64, v4i64, SchedWriteFShuffle.YMM,
SchedWriteFVarShuffle.YMM>, VEX_L;		SchedWriteFVarShuffle.YMM>, VEX_L;
}		}

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// VPERM2F128 - Permute Floating-Point Values in 128-bit chunks		// VPERM2F128 - Permute Floating-Point Values in 128-bit chunks
//		//

let ExeDomain = SSEPackedSingle in {		let ExeDomain = SSEPackedSingle in {
▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines	multiclass f16c_ph2ps<RegisterClass RC, X86MemOperand x86memop,
X86FoldableSchedWrite sched> {		X86FoldableSchedWrite sched> {
def rr : I<0x13, MRMSrcReg, (outs RC:$dst), (ins VR128:$src),		def rr : I<0x13, MRMSrcReg, (outs RC:$dst), (ins VR128:$src),
"vcvtph2ps\t{$src, $dst\|$dst, $src}",		"vcvtph2ps\t{$src, $dst\|$dst, $src}",
[(set RC:$dst, (X86cvtph2ps VR128:$src))]>,		[(set RC:$dst, (X86cvtph2ps VR128:$src))]>,
T8PD, VEX, Sched<[sched]>;		T8PD, VEX, Sched<[sched]>;
let hasSideEffects = 0, mayLoad = 1 in		let hasSideEffects = 0, mayLoad = 1 in
def rm : I<0x13, MRMSrcMem, (outs RC:$dst), (ins x86memop:$src),		def rm : I<0x13, MRMSrcMem, (outs RC:$dst), (ins x86memop:$src),
"vcvtph2ps\t{$src, $dst\|$dst, $src}",		"vcvtph2ps\t{$src, $dst\|$dst, $src}",
[(set RC:$dst, (X86cvtph2ps (bc_v8i16		[(set RC:$dst, (X86cvtph2ps (loadv8i16 addr:$src)))]>,
(loadv2i64 addr:$src))))]>,
T8PD, VEX, Sched<[sched.Folded]>;		T8PD, VEX, Sched<[sched.Folded]>;
}		}

multiclass f16c_ps2ph<RegisterClass RC, X86MemOperand x86memop,		multiclass f16c_ps2ph<RegisterClass RC, X86MemOperand x86memop,
SchedWrite RR, SchedWrite MR> {		SchedWrite RR, SchedWrite MR> {
def rr : Ii8<0x1D, MRMDestReg, (outs VR128:$dst),		def rr : Ii8<0x1D, MRMDestReg, (outs VR128:$dst),
(ins RC:$src1, i32u8imm:$src2),		(ins RC:$src1, i32u8imm:$src2),
"vcvtps2ph\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		"vcvtps2ph\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// AVX2 Instructions		// AVX2 Instructions
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

/// AVX2_blend_rmi - AVX2 blend with 8-bit immediate		/// AVX2_blend_rmi - AVX2 blend with 8-bit immediate
multiclass AVX2_blend_rmi<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass AVX2_blend_rmi<bits<8> opc, string OpcodeStr, SDNode OpNode,
ValueType OpVT, X86FoldableSchedWrite sched,		ValueType OpVT, X86FoldableSchedWrite sched,
RegisterClass RC, PatFrag memop_frag,		RegisterClass RC,
X86MemOperand x86memop, SDNodeXForm commuteXForm> {		X86MemOperand x86memop, SDNodeXForm commuteXForm> {
let isCommutable = 1 in		let isCommutable = 1 in
def rri : AVX2AIi8<opc, MRMSrcReg, (outs RC:$dst),		def rri : AVX2AIi8<opc, MRMSrcReg, (outs RC:$dst),
(ins RC:$src1, RC:$src2, u8imm:$src3),		(ins RC:$src1, RC:$src2, u8imm:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[(set RC:$dst, (OpVT (OpNode RC:$src1, RC:$src2, imm:$src3)))]>,		[(set RC:$dst, (OpVT (OpNode RC:$src1, RC:$src2, imm:$src3)))]>,
Sched<[sched]>, VEX_4V;		Sched<[sched]>, VEX_4V;
def rmi : AVX2AIi8<opc, MRMSrcMem, (outs RC:$dst),		def rmi : AVX2AIi8<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop:$src2, u8imm:$src3),		(ins RC:$src1, x86memop:$src2, u8imm:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[(set RC:$dst,		[(set RC:$dst,
(OpVT (OpNode RC:$src1,		(OpVT (OpNode RC:$src1, (load addr:$src2), imm:$src3)))]>,
(bitconvert (memop_frag addr:$src2)), imm:$src3)))]>,
Sched<[sched.Folded, sched.ReadAfterFold]>, VEX_4V;		Sched<[sched.Folded, sched.ReadAfterFold]>, VEX_4V;

// Pattern to commute if load is in first source.		// Pattern to commute if load is in first source.
def : Pat<(OpVT (OpNode (bitconvert (memop_frag addr:$src2)),		def : Pat<(OpVT (OpNode (load addr:$src2), RC:$src1, imm:$src3)),
RC:$src1, imm:$src3)),
(!cast<Instruction>(NAME#"rmi") RC:$src1, addr:$src2,		(!cast<Instruction>(NAME#"rmi") RC:$src1, addr:$src2,
(commuteXForm imm:$src3))>;		(commuteXForm imm:$src3))>;
}		}

defm VPBLENDD : AVX2_blend_rmi<0x02, "vpblendd", X86Blendi, v4i32,		defm VPBLENDD : AVX2_blend_rmi<0x02, "vpblendd", X86Blendi, v4i32,
SchedWriteBlend.XMM, VR128, loadv2i64, i128mem,		SchedWriteBlend.XMM, VR128, i128mem,
BlendCommuteImm4>;		BlendCommuteImm4>;
defm VPBLENDDY : AVX2_blend_rmi<0x02, "vpblendd", X86Blendi, v8i32,		defm VPBLENDDY : AVX2_blend_rmi<0x02, "vpblendd", X86Blendi, v8i32,
SchedWriteBlend.YMM, VR256, loadv4i64, i256mem,		SchedWriteBlend.YMM, VR256, i256mem,
BlendCommuteImm8>, VEX_L;		BlendCommuteImm8>, VEX_L;

// For insertion into the zero index (low half) of a 256-bit vector, it is		// For insertion into the zero index (low half) of a 256-bit vector, it is
// more efficient to generate a blend with immediate instead of an insert*128.		// more efficient to generate a blend with immediate instead of an insert*128.
let Predicates = [HasAVX2] in {		let Predicates = [HasAVX2] in {
def : Pat<(insert_subvector (v8i32 VR256:$src1), (v4i32 VR128:$src2), (iPTR 0)),		def : Pat<(insert_subvector (v8i32 VR256:$src1), (v4i32 VR128:$src2), (iPTR 0)),
(VPBLENDDYrri VR256:$src1,		(VPBLENDDYrri VR256:$src1,
(INSERT_SUBREG (v8i32 (IMPLICIT_DEF)),		(INSERT_SUBREG (v8i32 (IMPLICIT_DEF)),
▲ Show 20 Lines • Show All 217 Lines • ▼ Show 20 Lines	let Predicates = [HasAVX1Only] in {
def : Pat<(v2i64 (X86VBroadcast (loadi64 addr:$src))),		def : Pat<(v2i64 (X86VBroadcast (loadi64 addr:$src))),
(VMOVDDUPrm addr:$src)>;		(VMOVDDUPrm addr:$src)>;
}		}

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// VPERM - Permute instructions		// VPERM - Permute instructions
//		//

multiclass avx2_perm<bits<8> opc, string OpcodeStr, PatFrag mem_frag,		multiclass avx2_perm<bits<8> opc, string OpcodeStr,
ValueType OpVT, X86FoldableSchedWrite Sched,		ValueType OpVT, X86FoldableSchedWrite Sched,
X86MemOperand memOp> {		X86MemOperand memOp> {
let Predicates = [HasAVX2, NoVLX] in {		let Predicates = [HasAVX2, NoVLX] in {
def Yrr : AVX28I<opc, MRMSrcReg, (outs VR256:$dst),		def Yrr : AVX28I<opc, MRMSrcReg, (outs VR256:$dst),
(ins VR256:$src1, VR256:$src2),		(ins VR256:$src1, VR256:$src2),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR256:$dst,		[(set VR256:$dst,
(OpVT (X86VPermv VR256:$src1, VR256:$src2)))]>,		(OpVT (X86VPermv VR256:$src1, VR256:$src2)))]>,
Sched<[Sched]>, VEX_4V, VEX_L;		Sched<[Sched]>, VEX_4V, VEX_L;
def Yrm : AVX28I<opc, MRMSrcMem, (outs VR256:$dst),		def Yrm : AVX28I<opc, MRMSrcMem, (outs VR256:$dst),
(ins VR256:$src1, memOp:$src2),		(ins VR256:$src1, memOp:$src2),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR256:$dst,		[(set VR256:$dst,
(OpVT (X86VPermv VR256:$src1,		(OpVT (X86VPermv VR256:$src1,
(bitconvert (mem_frag addr:$src2)))))]>,		(load addr:$src2))))]>,
Sched<[Sched.Folded, Sched.ReadAfterFold]>, VEX_4V, VEX_L;		Sched<[Sched.Folded, Sched.ReadAfterFold]>, VEX_4V, VEX_L;
}		}
}		}

defm VPERMD : avx2_perm<0x36, "vpermd", loadv4i64, v8i32, WriteVarShuffle256,		defm VPERMD : avx2_perm<0x36, "vpermd", v8i32, WriteVarShuffle256, i256mem>;
i256mem>;
let ExeDomain = SSEPackedSingle in		let ExeDomain = SSEPackedSingle in
defm VPERMPS : avx2_perm<0x16, "vpermps", loadv8f32, v8f32, WriteFVarShuffle256,		defm VPERMPS : avx2_perm<0x16, "vpermps", v8f32, WriteFVarShuffle256, f256mem>;
f256mem>;

multiclass avx2_perm_imm<bits<8> opc, string OpcodeStr, PatFrag mem_frag,		multiclass avx2_perm_imm<bits<8> opc, string OpcodeStr, PatFrag mem_frag,
ValueType OpVT, X86FoldableSchedWrite Sched,		ValueType OpVT, X86FoldableSchedWrite Sched,
X86MemOperand memOp> {		X86MemOperand memOp> {
let Predicates = [HasAVX2, NoVLX] in {		let Predicates = [HasAVX2, NoVLX] in {
def Yri : AVX2AIi8<opc, MRMSrcReg, (outs VR256:$dst),		def Yri : AVX2AIi8<opc, MRMSrcReg, (outs VR256:$dst),
(ins VR256:$src1, u8imm:$src2),		(ins VR256:$src1, u8imm:$src2),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines
def VINSERTI128rm : AVX2AIi8<0x38, MRMSrcMem, (outs VR256:$dst),		def VINSERTI128rm : AVX2AIi8<0x38, MRMSrcMem, (outs VR256:$dst),
(ins VR256:$src1, i128mem:$src2, u8imm:$src3),		(ins VR256:$src1, i128mem:$src2, u8imm:$src3),
"vinserti128\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",		"vinserti128\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",
[]>, Sched<[WriteShuffle256.Folded, WriteShuffle256.ReadAfterFold]>, VEX_4V, VEX_L;		[]>, Sched<[WriteShuffle256.Folded, WriteShuffle256.ReadAfterFold]>, VEX_4V, VEX_L;
}		}

let Predicates = [HasAVX2, NoVLX] in {		let Predicates = [HasAVX2, NoVLX] in {
defm : vinsert_lowering<"VINSERTI128", v2i64, v4i64, loadv2i64>;		defm : vinsert_lowering<"VINSERTI128", v2i64, v4i64, loadv2i64>;
defm : vinsert_lowering<"VINSERTI128", v4i32, v8i32, loadv2i64>;		defm : vinsert_lowering<"VINSERTI128", v4i32, v8i32, loadv4i32>;
defm : vinsert_lowering<"VINSERTI128", v8i16, v16i16, loadv2i64>;		defm : vinsert_lowering<"VINSERTI128", v8i16, v16i16, loadv8i16>;
defm : vinsert_lowering<"VINSERTI128", v16i8, v32i8, loadv2i64>;		defm : vinsert_lowering<"VINSERTI128", v16i8, v32i8, loadv16i8>;
}		}

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// VEXTRACTI128 - Extract packed integer values		// VEXTRACTI128 - Extract packed integer values
//		//
def VEXTRACTI128rr : AVX2AIi8<0x39, MRMDestReg, (outs VR128:$dst),		def VEXTRACTI128rr : AVX2AIi8<0x39, MRMDestReg, (outs VR128:$dst),
(ins VR256:$src1, u8imm:$src2),		(ins VR256:$src1, u8imm:$src2),
"vextracti128\t{$src2, $src1, $dst\|$dst, $src1, $src2}", []>,		"vextracti128\t{$src2, $src1, $dst\|$dst, $src1, $src2}", []>,
▲ Show 20 Lines • Show All 142 Lines • ▼ Show 20 Lines	def rr : AVX28I<opc, MRMSrcReg, (outs VR128:$dst),
[(set VR128:$dst,		[(set VR128:$dst,
(vt128 (OpNode VR128:$src1, (vt128 VR128:$src2))))]>,		(vt128 (OpNode VR128:$src1, (vt128 VR128:$src2))))]>,
VEX_4V, Sched<[SchedWriteVarVecShift.XMM]>;		VEX_4V, Sched<[SchedWriteVarVecShift.XMM]>;
def rm : AVX28I<opc, MRMSrcMem, (outs VR128:$dst),		def rm : AVX28I<opc, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, i128mem:$src2),		(ins VR128:$src1, i128mem:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR128:$dst,		[(set VR128:$dst,
(vt128 (OpNode VR128:$src1,		(vt128 (OpNode VR128:$src1,
(vt128 (bitconvert (loadv2i64 addr:$src2))))))]>,		(vt128 (load addr:$src2)))))]>,
VEX_4V, Sched<[SchedWriteVarVecShift.XMM.Folded,		VEX_4V, Sched<[SchedWriteVarVecShift.XMM.Folded,
SchedWriteVarVecShift.XMM.ReadAfterFold]>;		SchedWriteVarVecShift.XMM.ReadAfterFold]>;
def Yrr : AVX28I<opc, MRMSrcReg, (outs VR256:$dst),		def Yrr : AVX28I<opc, MRMSrcReg, (outs VR256:$dst),
(ins VR256:$src1, VR256:$src2),		(ins VR256:$src1, VR256:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR256:$dst,		[(set VR256:$dst,
(vt256 (OpNode VR256:$src1, (vt256 VR256:$src2))))]>,		(vt256 (OpNode VR256:$src1, (vt256 VR256:$src2))))]>,
VEX_4V, VEX_L, Sched<[SchedWriteVarVecShift.YMM]>;		VEX_4V, VEX_L, Sched<[SchedWriteVarVecShift.YMM]>;
def Yrm : AVX28I<opc, MRMSrcMem, (outs VR256:$dst),		def Yrm : AVX28I<opc, MRMSrcMem, (outs VR256:$dst),
(ins VR256:$src1, i256mem:$src2),		(ins VR256:$src1, i256mem:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR256:$dst,		[(set VR256:$dst,
(vt256 (OpNode VR256:$src1,		(vt256 (OpNode VR256:$src1,
(vt256 (bitconvert (loadv4i64 addr:$src2))))))]>,		(vt256 (load addr:$src2)))))]>,
VEX_4V, VEX_L, Sched<[SchedWriteVarVecShift.YMM.Folded,		VEX_4V, VEX_L, Sched<[SchedWriteVarVecShift.YMM.Folded,
SchedWriteVarVecShift.YMM.ReadAfterFold]>;		SchedWriteVarVecShift.YMM.ReadAfterFold]>;
}		}

let Predicates = [HasAVX2, NoVLX] in {		let Predicates = [HasAVX2, NoVLX] in {
defm VPSLLVD : avx2_var_shift<0x47, "vpsllvd", shl, v4i32, v8i32>;		defm VPSLLVD : avx2_var_shift<0x47, "vpsllvd", shl, v4i32, v8i32>;
defm VPSLLVQ : avx2_var_shift<0x47, "vpsllvq", shl, v2i64, v4i64>, VEX_W;		defm VPSLLVQ : avx2_var_shift<0x47, "vpsllvq", shl, v2i64, v4i64>, VEX_W;
defm VPSRLVD : avx2_var_shift<0x45, "vpsrlvd", srl, v4i32, v8i32>;		defm VPSRLVD : avx2_var_shift<0x45, "vpsrlvd", srl, v4i32, v8i32>;
defm VPSRLVQ : avx2_var_shift<0x45, "vpsrlvq", srl, v2i64, v4i64>, VEX_W;		defm VPSRLVQ : avx2_var_shift<0x45, "vpsrlvq", srl, v2i64, v4i64>, VEX_W;
defm VPSRAVD : avx2_var_shift<0x46, "vpsravd", sra, v4i32, v8i32>;		defm VPSRAVD : avx2_var_shift<0x46, "vpsravd", sra, v4i32, v8i32>;

def : Pat<(v4i32 (X86vsrav VR128:$src1, VR128:$src2)),		def : Pat<(v4i32 (X86vsrav VR128:$src1, VR128:$src2)),
(VPSRAVDrr VR128:$src1, VR128:$src2)>;		(VPSRAVDrr VR128:$src1, VR128:$src2)>;
def : Pat<(v4i32 (X86vsrav VR128:$src1,		def : Pat<(v4i32 (X86vsrav VR128:$src1, (load addr:$src2))),
(bitconvert (loadv2i64 addr:$src2)))),
(VPSRAVDrm VR128:$src1, addr:$src2)>;		(VPSRAVDrm VR128:$src1, addr:$src2)>;
def : Pat<(v8i32 (X86vsrav VR256:$src1, VR256:$src2)),		def : Pat<(v8i32 (X86vsrav VR256:$src1, VR256:$src2)),
(VPSRAVDYrr VR256:$src1, VR256:$src2)>;		(VPSRAVDYrr VR256:$src1, VR256:$src2)>;
def : Pat<(v8i32 (X86vsrav VR256:$src1,		def : Pat<(v8i32 (X86vsrav VR256:$src1, (load addr:$src2))),
(bitconvert (loadv4i64 addr:$src2)))),
(VPSRAVDYrm VR256:$src1, addr:$src2)>;		(VPSRAVDYrm VR256:$src1, addr:$src2)>;
}		}

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// VGATHER - GATHER Operations		// VGATHER - GATHER Operations

// FIXME: Improve scheduling of gather instructions.		// FIXME: Improve scheduling of gather instructions.
multiclass avx2_gather<bits<8> opc, string OpcodeStr, ValueType VTx,		multiclass avx2_gather<bits<8> opc, string OpcodeStr, ValueType VTx,
▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines	let ExeDomain = SSEPackedInt,
OpcodeStr##"\t{$src2, $src1, $dst\|$dst, $src1, $src2}") in {		OpcodeStr##"\t{$src2, $src1, $dst\|$dst, $src1, $src2}") in {
let isCommutable = 1 in		let isCommutable = 1 in
def rr : PDI<0xCF, MRMSrcReg, (outs RC:$dst), (ins RC:$src1, RC:$src2), "",		def rr : PDI<0xCF, MRMSrcReg, (outs RC:$dst), (ins RC:$src1, RC:$src2), "",
[(set RC:$dst, (OpVT (X86GF2P8mulb RC:$src1, RC:$src2)))]>,		[(set RC:$dst, (OpVT (X86GF2P8mulb RC:$src1, RC:$src2)))]>,
Sched<[SchedWriteVecALU.XMM]>, T8PD;		Sched<[SchedWriteVecALU.XMM]>, T8PD;

def rm : PDI<0xCF, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, X86MemOp:$src2), "",		def rm : PDI<0xCF, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, X86MemOp:$src2), "",
[(set RC:$dst, (OpVT (X86GF2P8mulb RC:$src1,		[(set RC:$dst, (OpVT (X86GF2P8mulb RC:$src1,
(bitconvert (MemOpFrag addr:$src2)))))]>,		(MemOpFrag addr:$src2))))]>,
Sched<[SchedWriteVecALU.XMM.Folded, SchedWriteVecALU.XMM.ReadAfterFold]>, T8PD;		Sched<[SchedWriteVecALU.XMM.Folded, SchedWriteVecALU.XMM.ReadAfterFold]>, T8PD;
}		}
}		}

multiclass GF2P8AFFINE_rmi<bits<8> Op, string OpStr, ValueType OpVT,		multiclass GF2P8AFFINE_rmi<bits<8> Op, string OpStr, ValueType OpVT,
SDNode OpNode, RegisterClass RC, PatFrag MemOpFrag,		SDNode OpNode, RegisterClass RC, PatFrag MemOpFrag,
X86MemOperand X86MemOp, bit Is2Addr = 0> {		X86MemOperand X86MemOp, bit Is2Addr = 0> {
let AsmString = !if(Is2Addr,		let AsmString = !if(Is2Addr,
OpStr##"\t{$src3, $src2, $dst\|$dst, $src2, $src3}",		OpStr##"\t{$src3, $src2, $dst\|$dst, $src2, $src3}",
OpStr##"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}") in {		OpStr##"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}") in {
def rri : Ii8<Op, MRMSrcReg, (outs RC:$dst),		def rri : Ii8<Op, MRMSrcReg, (outs RC:$dst),
(ins RC:$src1, RC:$src2, u8imm:$src3), "",		(ins RC:$src1, RC:$src2, u8imm:$src3), "",
[(set RC:$dst, (OpVT (OpNode RC:$src1, RC:$src2, imm:$src3)))],		[(set RC:$dst, (OpVT (OpNode RC:$src1, RC:$src2, imm:$src3)))],
SSEPackedInt>, Sched<[SchedWriteVecALU.XMM]>;		SSEPackedInt>, Sched<[SchedWriteVecALU.XMM]>;
def rmi : Ii8<Op, MRMSrcMem, (outs RC:$dst),		def rmi : Ii8<Op, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, X86MemOp:$src2, u8imm:$src3), "",		(ins RC:$src1, X86MemOp:$src2, u8imm:$src3), "",
[(set RC:$dst, (OpVT (OpNode RC:$src1,		[(set RC:$dst, (OpVT (OpNode RC:$src1,
(bitconvert (MemOpFrag addr:$src2)),		(MemOpFrag addr:$src2),
imm:$src3)))], SSEPackedInt>,		imm:$src3)))], SSEPackedInt>,
Sched<[SchedWriteVecALU.XMM.Folded, SchedWriteVecALU.XMM.ReadAfterFold]>;		Sched<[SchedWriteVecALU.XMM.Folded, SchedWriteVecALU.XMM.ReadAfterFold]>;
}		}
}		}

multiclass GF2P8AFFINE_common<bits<8> Op, string OpStr, SDNode OpNode> {		multiclass GF2P8AFFINE_common<bits<8> Op, string OpStr, SDNode OpNode> {
let Constraints = "$src1 = $dst",		let Constraints = "$src1 = $dst",
Predicates = [HasGFNI, UseSSE2] in		Predicates = [HasGFNI, UseSSE2] in
defm NAME : GF2P8AFFINE_rmi<Op, OpStr, v16i8, OpNode,		defm NAME : GF2P8AFFINE_rmi<Op, OpStr, v16i8, OpNode,
VR128, loadv2i64, i128mem, 1>;		VR128, load, i128mem, 1>;
let Predicates = [HasGFNI, HasAVX, NoVLX_Or_NoBWI] in {		let Predicates = [HasGFNI, HasAVX, NoVLX_Or_NoBWI] in {
defm V##NAME : GF2P8AFFINE_rmi<Op, "v"##OpStr, v16i8, OpNode, VR128,		defm V##NAME : GF2P8AFFINE_rmi<Op, "v"##OpStr, v16i8, OpNode, VR128,
loadv2i64, i128mem>, VEX_4V, VEX_W;		load, i128mem>, VEX_4V, VEX_W;
defm V##NAME##Y : GF2P8AFFINE_rmi<Op, "v"##OpStr, v32i8, OpNode, VR256,		defm V##NAME##Y : GF2P8AFFINE_rmi<Op, "v"##OpStr, v32i8, OpNode, VR256,
loadv4i64, i256mem>, VEX_4V, VEX_L, VEX_W;		load, i256mem>, VEX_4V, VEX_L, VEX_W;
}		}
}		}

// GF2P8MULB		// GF2P8MULB
let Constraints = "$src1 = $dst",		let Constraints = "$src1 = $dst",
Predicates = [HasGFNI, UseSSE2] in		Predicates = [HasGFNI, UseSSE2] in
defm GF2P8MULB : GF2P8MULB_rm<"gf2p8mulb", v16i8, VR128, memopv2i64,		defm GF2P8MULB : GF2P8MULB_rm<"gf2p8mulb", v16i8, VR128, memop,
i128mem, 1>;		i128mem, 1>;
let Predicates = [HasGFNI, HasAVX, NoVLX_Or_NoBWI] in {		let Predicates = [HasGFNI, HasAVX, NoVLX_Or_NoBWI] in {
defm VGF2P8MULB : GF2P8MULB_rm<"vgf2p8mulb", v16i8, VR128, loadv2i64,		defm VGF2P8MULB : GF2P8MULB_rm<"vgf2p8mulb", v16i8, VR128, load,
i128mem>, VEX_4V;		i128mem>, VEX_4V;
defm VGF2P8MULBY : GF2P8MULB_rm<"vgf2p8mulb", v32i8, VR256, loadv4i64,		defm VGF2P8MULBY : GF2P8MULB_rm<"vgf2p8mulb", v32i8, VR256, load,
i256mem>, VEX_4V, VEX_L;		i256mem>, VEX_4V, VEX_L;
}		}
// GF2P8AFFINEINVQB, GF2P8AFFINEQB		// GF2P8AFFINEINVQB, GF2P8AFFINEQB
let isCommutable = 0 in {		let isCommutable = 0 in {
defm GF2P8AFFINEINVQB : GF2P8AFFINE_common<0xCF, "gf2p8affineinvqb",		defm GF2P8AFFINEINVQB : GF2P8AFFINE_common<0xCF, "gf2p8affineinvqb",
X86GF2P8affineinvqb>, TAPD;		X86GF2P8affineinvqb>, TAPD;
defm GF2P8AFFINEQB : GF2P8AFFINE_common<0xCE, "gf2p8affineqb",		defm GF2P8AFFINEQB : GF2P8AFFINE_common<0xCE, "gf2p8affineqb",
X86GF2P8affineqb>, TAPD;		X86GF2P8affineqb>, TAPD;
}		}

lib/Target/X86/X86InstrXOP.td

//===-- X86InstrXOP.td - XOP Instruction Set ---------------- tablegen --===//		//===-- X86InstrXOP.td - XOP Instruction Set ---------------- tablegen --===//
//		//
// The LLVM Compiler Infrastructure		// The LLVM Compiler Infrastructure
//		//
// This file is distributed under the University of Illinois Open Source		// This file is distributed under the University of Illinois Open Source
// License. See LICENSE.TXT for details.		// License. See LICENSE.TXT for details.
//		//
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
//		//
// This file describes XOP (eXtended OPerations)		// This file describes XOP (eXtended OPerations)
//		//
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

multiclass xop2op<bits<8> opc, string OpcodeStr, Intrinsic Int, PatFrag memop> {		multiclass xop2op<bits<8> opc, string OpcodeStr, Intrinsic Int> {
def rr : IXOP<opc, MRMSrcReg, (outs VR128:$dst), (ins VR128:$src),		def rr : IXOP<opc, MRMSrcReg, (outs VR128:$dst), (ins VR128:$src),
!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),		!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),
[(set VR128:$dst, (Int VR128:$src))]>, XOP, Sched<[SchedWritePHAdd.XMM]>;		[(set VR128:$dst, (Int VR128:$src))]>, XOP, Sched<[SchedWritePHAdd.XMM]>;
def rm : IXOP<opc, MRMSrcMem, (outs VR128:$dst), (ins i128mem:$src),		def rm : IXOP<opc, MRMSrcMem, (outs VR128:$dst), (ins i128mem:$src),
!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),		!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),
[(set VR128:$dst, (Int (bitconvert (memop addr:$src))))]>, XOP,		[(set VR128:$dst, (Int (load addr:$src)))]>, XOP,
Sched<[SchedWritePHAdd.XMM.Folded, SchedWritePHAdd.XMM.ReadAfterFold]>;		Sched<[SchedWritePHAdd.XMM.Folded, SchedWritePHAdd.XMM.ReadAfterFold]>;
}		}

let ExeDomain = SSEPackedInt in {		let ExeDomain = SSEPackedInt in {
defm VPHSUBWD : xop2op<0xE2, "vphsubwd", int_x86_xop_vphsubwd, loadv2i64>;		defm VPHSUBWD : xop2op<0xE2, "vphsubwd", int_x86_xop_vphsubwd>;
defm VPHSUBDQ : xop2op<0xE3, "vphsubdq", int_x86_xop_vphsubdq, loadv2i64>;		defm VPHSUBDQ : xop2op<0xE3, "vphsubdq", int_x86_xop_vphsubdq>;
defm VPHSUBBW : xop2op<0xE1, "vphsubbw", int_x86_xop_vphsubbw, loadv2i64>;		defm VPHSUBBW : xop2op<0xE1, "vphsubbw", int_x86_xop_vphsubbw>;
defm VPHADDWQ : xop2op<0xC7, "vphaddwq", int_x86_xop_vphaddwq, loadv2i64>;		defm VPHADDWQ : xop2op<0xC7, "vphaddwq", int_x86_xop_vphaddwq>;
defm VPHADDWD : xop2op<0xC6, "vphaddwd", int_x86_xop_vphaddwd, loadv2i64>;		defm VPHADDWD : xop2op<0xC6, "vphaddwd", int_x86_xop_vphaddwd>;
defm VPHADDUWQ : xop2op<0xD7, "vphadduwq", int_x86_xop_vphadduwq, loadv2i64>;		defm VPHADDUWQ : xop2op<0xD7, "vphadduwq", int_x86_xop_vphadduwq>;
defm VPHADDUWD : xop2op<0xD6, "vphadduwd", int_x86_xop_vphadduwd, loadv2i64>;		defm VPHADDUWD : xop2op<0xD6, "vphadduwd", int_x86_xop_vphadduwd>;
defm VPHADDUDQ : xop2op<0xDB, "vphaddudq", int_x86_xop_vphaddudq, loadv2i64>;		defm VPHADDUDQ : xop2op<0xDB, "vphaddudq", int_x86_xop_vphaddudq>;
defm VPHADDUBW : xop2op<0xD1, "vphaddubw", int_x86_xop_vphaddubw, loadv2i64>;		defm VPHADDUBW : xop2op<0xD1, "vphaddubw", int_x86_xop_vphaddubw>;
defm VPHADDUBQ : xop2op<0xD3, "vphaddubq", int_x86_xop_vphaddubq, loadv2i64>;		defm VPHADDUBQ : xop2op<0xD3, "vphaddubq", int_x86_xop_vphaddubq>;
defm VPHADDUBD : xop2op<0xD2, "vphaddubd", int_x86_xop_vphaddubd, loadv2i64>;		defm VPHADDUBD : xop2op<0xD2, "vphaddubd", int_x86_xop_vphaddubd>;
defm VPHADDDQ : xop2op<0xCB, "vphadddq", int_x86_xop_vphadddq, loadv2i64>;		defm VPHADDDQ : xop2op<0xCB, "vphadddq", int_x86_xop_vphadddq>;
defm VPHADDBW : xop2op<0xC1, "vphaddbw", int_x86_xop_vphaddbw, loadv2i64>;		defm VPHADDBW : xop2op<0xC1, "vphaddbw", int_x86_xop_vphaddbw>;
defm VPHADDBQ : xop2op<0xC3, "vphaddbq", int_x86_xop_vphaddbq, loadv2i64>;		defm VPHADDBQ : xop2op<0xC3, "vphaddbq", int_x86_xop_vphaddbq>;
defm VPHADDBD : xop2op<0xC2, "vphaddbd", int_x86_xop_vphaddbd, loadv2i64>;		defm VPHADDBD : xop2op<0xC2, "vphaddbd", int_x86_xop_vphaddbd>;
}		}

// Scalar load 2 addr operand instructions		// Scalar load 2 addr operand instructions
multiclass xop2opsld<bits<8> opc, string OpcodeStr, Intrinsic Int,		multiclass xop2opsld<bits<8> opc, string OpcodeStr, Intrinsic Int,
Operand memop, ComplexPattern mem_cpat,		Operand memop, ComplexPattern mem_cpat,
X86FoldableSchedWrite sched> {		X86FoldableSchedWrite sched> {
def rr : IXOP<opc, MRMSrcReg, (outs VR128:$dst), (ins VR128:$src),		def rr : IXOP<opc, MRMSrcReg, (outs VR128:$dst), (ins VR128:$src),
!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),		!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),
[(set VR128:$dst, (Int VR128:$src))]>, XOP, Sched<[sched]>;		[(set VR128:$dst, (Int VR128:$src))]>, XOP, Sched<[sched]>;
def rm : IXOP<opc, MRMSrcMem, (outs VR128:$dst), (ins memop:$src),		def rm : IXOP<opc, MRMSrcMem, (outs VR128:$dst), (ins memop:$src),
!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),		!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),
[(set VR128:$dst, (Int (bitconvert mem_cpat:$src)))]>, XOP,		[(set VR128:$dst, (Int mem_cpat:$src))]>, XOP,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass xop2op128<bits<8> opc, string OpcodeStr, Intrinsic Int,		multiclass xop2op128<bits<8> opc, string OpcodeStr, Intrinsic Int,
PatFrag memop, X86FoldableSchedWrite sched> {		X86FoldableSchedWrite sched> {
def rr : IXOP<opc, MRMSrcReg, (outs VR128:$dst), (ins VR128:$src),		def rr : IXOP<opc, MRMSrcReg, (outs VR128:$dst), (ins VR128:$src),
!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),		!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),
[(set VR128:$dst, (Int VR128:$src))]>, XOP, Sched<[sched]>;		[(set VR128:$dst, (Int VR128:$src))]>, XOP, Sched<[sched]>;
def rm : IXOP<opc, MRMSrcMem, (outs VR128:$dst), (ins f128mem:$src),		def rm : IXOP<opc, MRMSrcMem, (outs VR128:$dst), (ins f128mem:$src),
!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),		!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),
[(set VR128:$dst, (Int (bitconvert (memop addr:$src))))]>, XOP,		[(set VR128:$dst, (Int (load addr:$src)))]>, XOP,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass xop2op256<bits<8> opc, string OpcodeStr, Intrinsic Int,		multiclass xop2op256<bits<8> opc, string OpcodeStr, Intrinsic Int,
PatFrag memop, X86FoldableSchedWrite sched> {		X86FoldableSchedWrite sched> {
def Yrr : IXOP<opc, MRMSrcReg, (outs VR256:$dst), (ins VR256:$src),		def Yrr : IXOP<opc, MRMSrcReg, (outs VR256:$dst), (ins VR256:$src),
!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),		!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),
[(set VR256:$dst, (Int VR256:$src))]>, XOP, VEX_L, Sched<[sched]>;		[(set VR256:$dst, (Int VR256:$src))]>, XOP, VEX_L, Sched<[sched]>;
def Yrm : IXOP<opc, MRMSrcMem, (outs VR256:$dst), (ins f256mem:$src),		def Yrm : IXOP<opc, MRMSrcMem, (outs VR256:$dst), (ins f256mem:$src),
!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),		!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),
[(set VR256:$dst, (Int (bitconvert (memop addr:$src))))]>, XOP, VEX_L,		[(set VR256:$dst, (Int (load addr:$src)))]>, XOP, VEX_L,
Sched<[sched.Folded, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let ExeDomain = SSEPackedSingle in {		let ExeDomain = SSEPackedSingle in {
defm VFRCZSS : xop2opsld<0x82, "vfrczss", int_x86_xop_vfrcz_ss,		defm VFRCZSS : xop2opsld<0x82, "vfrczss", int_x86_xop_vfrcz_ss,
ssmem, sse_load_f32, SchedWriteFRnd.Scl>;		ssmem, sse_load_f32, SchedWriteFRnd.Scl>;
defm VFRCZPS : xop2op128<0x80, "vfrczps", int_x86_xop_vfrcz_ps, loadv4f32,		defm VFRCZPS : xop2op128<0x80, "vfrczps", int_x86_xop_vfrcz_ps,
SchedWriteFRnd.XMM>;		SchedWriteFRnd.XMM>;
defm VFRCZPS : xop2op256<0x80, "vfrczps", int_x86_xop_vfrcz_ps_256, loadv8f32,		defm VFRCZPS : xop2op256<0x80, "vfrczps", int_x86_xop_vfrcz_ps_256,
SchedWriteFRnd.YMM>;		SchedWriteFRnd.YMM>;
}		}

let ExeDomain = SSEPackedDouble in {		let ExeDomain = SSEPackedDouble in {
defm VFRCZSD : xop2opsld<0x83, "vfrczsd", int_x86_xop_vfrcz_sd,		defm VFRCZSD : xop2opsld<0x83, "vfrczsd", int_x86_xop_vfrcz_sd,
sdmem, sse_load_f64, SchedWriteFRnd.Scl>;		sdmem, sse_load_f64, SchedWriteFRnd.Scl>;
defm VFRCZPD : xop2op128<0x81, "vfrczpd", int_x86_xop_vfrcz_pd, loadv2f64,		defm VFRCZPD : xop2op128<0x81, "vfrczpd", int_x86_xop_vfrcz_pd,
SchedWriteFRnd.XMM>;		SchedWriteFRnd.XMM>;
defm VFRCZPD : xop2op256<0x81, "vfrczpd", int_x86_xop_vfrcz_pd_256, loadv4f64,		defm VFRCZPD : xop2op256<0x81, "vfrczpd", int_x86_xop_vfrcz_pd_256,
SchedWriteFRnd.YMM>;		SchedWriteFRnd.YMM>;
}		}

multiclass xop3op<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass xop3op<bits<8> opc, string OpcodeStr, SDNode OpNode,
ValueType vt128, X86FoldableSchedWrite sched> {		ValueType vt128, X86FoldableSchedWrite sched> {
def rr : IXOP<opc, MRMSrcReg4VOp3, (outs VR128:$dst),		def rr : IXOP<opc, MRMSrcReg4VOp3, (outs VR128:$dst),
(ins VR128:$src1, VR128:$src2),		(ins VR128:$src1, VR128:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR128:$dst,		[(set VR128:$dst,
(vt128 (OpNode (vt128 VR128:$src1), (vt128 VR128:$src2))))]>,		(vt128 (OpNode (vt128 VR128:$src1), (vt128 VR128:$src2))))]>,
XOP, Sched<[sched]>;		XOP, Sched<[sched]>;
def rm : IXOP<opc, MRMSrcMem, (outs VR128:$dst),		def rm : IXOP<opc, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, i128mem:$src2),		(ins VR128:$src1, i128mem:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR128:$dst,		[(set VR128:$dst,
(vt128 (OpNode (vt128 VR128:$src1),		(vt128 (OpNode (vt128 VR128:$src1),
(vt128 (bitconvert (loadv2i64 addr:$src2))))))]>,		(vt128 (load addr:$src2)))))]>,
XOP_4V, VEX_W, Sched<[sched.Folded, sched.ReadAfterFold]>;		XOP_4V, VEX_W, Sched<[sched.Folded, sched.ReadAfterFold]>;
def mr : IXOP<opc, MRMSrcMem4VOp3, (outs VR128:$dst),		def mr : IXOP<opc, MRMSrcMem4VOp3, (outs VR128:$dst),
(ins i128mem:$src1, VR128:$src2),		(ins i128mem:$src1, VR128:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR128:$dst,		[(set VR128:$dst,
(vt128 (OpNode (vt128 (bitconvert (loadv2i64 addr:$src1))),		(vt128 (OpNode (vt128 (load addr:$src1)),
(vt128 VR128:$src2))))]>,		(vt128 VR128:$src2))))]>,
XOP, Sched<[sched.Folded, sched.ReadAfterFold]>;		XOP, Sched<[sched.Folded, sched.ReadAfterFold]>;
// For disassembler		// For disassembler
let isCodeGenOnly = 1, ForceDisassemble = 1, hasSideEffects = 0 in		let isCodeGenOnly = 1, ForceDisassemble = 1, hasSideEffects = 0 in
def rr_REV : IXOP<opc, MRMSrcReg, (outs VR128:$dst),		def rr_REV : IXOP<opc, MRMSrcReg, (outs VR128:$dst),
(ins VR128:$src1, VR128:$src2),		(ins VR128:$src1, VR128:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[]>,		[]>,
Show All 22 Lines	def ri : IXOPi8<opc, MRMSrcReg, (outs VR128:$dst),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR128:$dst,		[(set VR128:$dst,
(vt128 (OpNode (vt128 VR128:$src1), imm:$src2)))]>,		(vt128 (OpNode (vt128 VR128:$src1), imm:$src2)))]>,
XOP, Sched<[sched]>;		XOP, Sched<[sched]>;
def mi : IXOPi8<opc, MRMSrcMem, (outs VR128:$dst),		def mi : IXOPi8<opc, MRMSrcMem, (outs VR128:$dst),
(ins i128mem:$src1, u8imm:$src2),		(ins i128mem:$src1, u8imm:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR128:$dst,		[(set VR128:$dst,
(vt128 (OpNode (vt128 (bitconvert (loadv2i64 addr:$src1))), imm:$src2)))]>,		(vt128 (OpNode (vt128 (load addr:$src1)), imm:$src2)))]>,
XOP, Sched<[sched.Folded, sched.ReadAfterFold]>;		XOP, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let ExeDomain = SSEPackedInt in {		let ExeDomain = SSEPackedInt in {
defm VPROTB : xop3opimm<0xC0, "vprotb", X86vrotli, v16i8,		defm VPROTB : xop3opimm<0xC0, "vprotb", X86vrotli, v16i8,
SchedWriteVecShiftImm.XMM>;		SchedWriteVecShiftImm.XMM>;
defm VPROTD : xop3opimm<0xC2, "vprotd", X86vrotli, v4i32,		defm VPROTD : xop3opimm<0xC2, "vprotd", X86vrotli, v4i32,
SchedWriteVecShiftImm.XMM>;		SchedWriteVecShiftImm.XMM>;
Show All 14 Lines	def rr : IXOPi8Reg<opc, MRMSrcReg, (outs VR128:$dst),
[(set VR128:$dst,		[(set VR128:$dst,
(Int VR128:$src1, VR128:$src2, VR128:$src3))]>, XOP_4V,		(Int VR128:$src1, VR128:$src2, VR128:$src3))]>, XOP_4V,
Sched<[sched]>;		Sched<[sched]>;
def rm : IXOPi8Reg<opc, MRMSrcMem, (outs VR128:$dst),		def rm : IXOPi8Reg<opc, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, i128mem:$src2, VR128:$src3),		(ins VR128:$src1, i128mem:$src2, VR128:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[(set VR128:$dst,		[(set VR128:$dst,
(Int VR128:$src1, (bitconvert (loadv2i64 addr:$src2)),		(Int VR128:$src1, (load addr:$src2),
VR128:$src3))]>, XOP_4V, Sched<[sched.Folded, sched.ReadAfterFold]>;		VR128:$src3))]>, XOP_4V, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let ExeDomain = SSEPackedInt in {		let ExeDomain = SSEPackedInt in {
defm VPMADCSWD : xop4opm2<0xB6, "vpmadcswd",		defm VPMADCSWD : xop4opm2<0xB6, "vpmadcswd",
int_x86_xop_vpmadcswd, SchedWriteVecIMul.XMM>;		int_x86_xop_vpmadcswd, SchedWriteVecIMul.XMM>;
defm VPMADCSSWD : xop4opm2<0xA6, "vpmadcsswd",		defm VPMADCSSWD : xop4opm2<0xA6, "vpmadcsswd",
int_x86_xop_vpmadcsswd, SchedWriteVecIMul.XMM>;		int_x86_xop_vpmadcsswd, SchedWriteVecIMul.XMM>;
▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines	def ri : IXOPi8<opc, MRMSrcReg, (outs VR128:$dst),
imm:$cc)))]>,		imm:$cc)))]>,
XOP_4V, Sched<[sched]>;		XOP_4V, Sched<[sched]>;
def mi : IXOPi8<opc, MRMSrcMem, (outs VR128:$dst),		def mi : IXOPi8<opc, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, i128mem:$src2, XOPCC:$cc),		(ins VR128:$src1, i128mem:$src2, XOPCC:$cc),
!strconcat("vpcom${cc}", Suffix,		!strconcat("vpcom${cc}", Suffix,
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR128:$dst,		[(set VR128:$dst,
(vt128 (OpNode (vt128 VR128:$src1),		(vt128 (OpNode (vt128 VR128:$src1),
(vt128 (bitconvert (loadv2i64 addr:$src2))),		(vt128 (load addr:$src2)),
imm:$cc)))]>,		imm:$cc)))]>,
XOP_4V, Sched<[sched.Folded, sched.ReadAfterFold]>;		XOP_4V, Sched<[sched.Folded, sched.ReadAfterFold]>;
let isAsmParserOnly = 1, hasSideEffects = 0 in {		let isAsmParserOnly = 1, hasSideEffects = 0 in {
def ri_alt : IXOPi8<opc, MRMSrcReg, (outs VR128:$dst),		def ri_alt : IXOPi8<opc, MRMSrcReg, (outs VR128:$dst),
(ins VR128:$src1, VR128:$src2, u8imm:$src3),		(ins VR128:$src1, VR128:$src2, u8imm:$src3),
!strconcat("vpcom", Suffix,		!strconcat("vpcom", Suffix,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[]>, XOP_4V, Sched<[sched]>, NotMemoryFoldable;		[]>, XOP_4V, Sched<[sched]>, NotMemoryFoldable;
let mayLoad = 1 in		let mayLoad = 1 in
def mi_alt : IXOPi8<opc, MRMSrcMem, (outs VR128:$dst),		def mi_alt : IXOPi8<opc, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, i128mem:$src2, u8imm:$src3),		(ins VR128:$src1, i128mem:$src2, u8imm:$src3),
!strconcat("vpcom", Suffix,		!strconcat("vpcom", Suffix,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[]>, XOP_4V, Sched<[sched.Folded, sched.ReadAfterFold]>,		[]>, XOP_4V, Sched<[sched.Folded, sched.ReadAfterFold]>,
NotMemoryFoldable;		NotMemoryFoldable;
}		}
}		}

def : Pat<(OpNode (bitconvert (loadv2i64 addr:$src2)),		def : Pat<(OpNode (load addr:$src2),
(vt128 VR128:$src1), imm:$cc),		(vt128 VR128:$src1), imm:$cc),
(!cast<Instruction>(NAME#"mi") VR128:$src1, addr:$src2,		(!cast<Instruction>(NAME#"mi") VR128:$src1, addr:$src2,
(CommuteVPCOMCC imm:$cc))>;		(CommuteVPCOMCC imm:$cc))>;
}		}

defm VPCOMB : xopvpcom<0xCC, "b", X86vpcom, v16i8, SchedWriteVecALU.XMM>;		defm VPCOMB : xopvpcom<0xCC, "b", X86vpcom, v16i8, SchedWriteVecALU.XMM>;
defm VPCOMW : xopvpcom<0xCD, "w", X86vpcom, v8i16, SchedWriteVecALU.XMM>;		defm VPCOMW : xopvpcom<0xCD, "w", X86vpcom, v8i16, SchedWriteVecALU.XMM>;
defm VPCOMD : xopvpcom<0xCE, "d", X86vpcom, v4i32, SchedWriteVecALU.XMM>;		defm VPCOMD : xopvpcom<0xCE, "d", X86vpcom, v4i32, SchedWriteVecALU.XMM>;
Show All 14 Lines	def rrr : IXOPi8Reg<opc, MRMSrcReg, (outs VR128:$dst),
(vt128 VR128:$src3))))]>,		(vt128 VR128:$src3))))]>,
XOP_4V, Sched<[sched]>;		XOP_4V, Sched<[sched]>;
def rrm : IXOPi8Reg<opc, MRMSrcMemOp4, (outs VR128:$dst),		def rrm : IXOPi8Reg<opc, MRMSrcMemOp4, (outs VR128:$dst),
(ins VR128:$src1, VR128:$src2, i128mem:$src3),		(ins VR128:$src1, VR128:$src2, i128mem:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[(set VR128:$dst,		[(set VR128:$dst,
(vt128 (OpNode (vt128 VR128:$src1), (vt128 VR128:$src2),		(vt128 (OpNode (vt128 VR128:$src1), (vt128 VR128:$src2),
(vt128 (bitconvert (loadv2i64 addr:$src3))))))]>,		(vt128 (load addr:$src3)))))]>,
XOP_4V, VEX_W, Sched<[sched.Folded, sched.ReadAfterFold, sched.ReadAfterFold]>;		XOP_4V, VEX_W, Sched<[sched.Folded, sched.ReadAfterFold, sched.ReadAfterFold]>;
def rmr : IXOPi8Reg<opc, MRMSrcMem, (outs VR128:$dst),		def rmr : IXOPi8Reg<opc, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, i128mem:$src2, VR128:$src3),		(ins VR128:$src1, i128mem:$src2, VR128:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[(set VR128:$dst,		[(set VR128:$dst,
(v16i8 (OpNode (vt128 VR128:$src1), (vt128 (bitconvert (loadv2i64 addr:$src2))),		(v16i8 (OpNode (vt128 VR128:$src1), (vt128 (load addr:$src2)),
(vt128 VR128:$src3))))]>,		(vt128 VR128:$src3))))]>,
XOP_4V, Sched<[sched.Folded, sched.ReadAfterFold,		XOP_4V, Sched<[sched.Folded, sched.ReadAfterFold,
// 128mem:$src2		// 128mem:$src2
ReadDefault, ReadDefault, ReadDefault, ReadDefault,		ReadDefault, ReadDefault, ReadDefault, ReadDefault,
ReadDefault,		ReadDefault,
// VR128:$src3		// VR128:$src3
sched.ReadAfterFold]>;		sched.ReadAfterFold]>;
// For disassembler		// For disassembler
▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines	def rr : IXOP5<Opc, MRMSrcReg, (outs RC:$dst),
[(set RC:$dst,		[(set RC:$dst,
(VT (X86vpermil2 RC:$src1, RC:$src2, RC:$src3, (i8 imm:$src4))))]>,		(VT (X86vpermil2 RC:$src1, RC:$src2, RC:$src3, (i8 imm:$src4))))]>,
Sched<[sched]>;		Sched<[sched]>;
def rm : IXOP5<Opc, MRMSrcMemOp4, (outs RC:$dst),		def rm : IXOP5<Opc, MRMSrcMemOp4, (outs RC:$dst),
(ins RC:$src1, RC:$src2, intmemop:$src3, u8imm:$src4),		(ins RC:$src1, RC:$src2, intmemop:$src3, u8imm:$src4),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src4, $src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3, $src4}"),		"\t{$src4, $src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3, $src4}"),
[(set RC:$dst,		[(set RC:$dst,
(VT (X86vpermil2 RC:$src1, RC:$src2,		(VT (X86vpermil2 RC:$src1, RC:$src2, (IntLdFrag addr:$src3),
(bitconvert (IntLdFrag addr:$src3)),
(i8 imm:$src4))))]>, VEX_W,		(i8 imm:$src4))))]>, VEX_W,
Sched<[sched.Folded, sched.ReadAfterFold, sched.ReadAfterFold]>;		Sched<[sched.Folded, sched.ReadAfterFold, sched.ReadAfterFold]>;
def mr : IXOP5<Opc, MRMSrcMem, (outs RC:$dst),		def mr : IXOP5<Opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, fpmemop:$src2, RC:$src3, u8imm:$src4),		(ins RC:$src1, fpmemop:$src2, RC:$src3, u8imm:$src4),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src4, $src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3, $src4}"),		"\t{$src4, $src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3, $src4}"),
[(set RC:$dst,		[(set RC:$dst,
(VT (X86vpermil2 RC:$src1, (FPLdFrag addr:$src2),		(VT (X86vpermil2 RC:$src1, (FPLdFrag addr:$src2),
Show All 18 Lines	defm VPERMIL2PD : xop_vpermil2<0x49, "vpermil2pd", VR128, i128mem, f128mem,
SchedWriteFVarShuffle.XMM>;		SchedWriteFVarShuffle.XMM>;
defm VPERMIL2PDY : xop_vpermil2<0x49, "vpermil2pd", VR256, i256mem, f256mem,		defm VPERMIL2PDY : xop_vpermil2<0x49, "vpermil2pd", VR256, i256mem, f256mem,
v4f64, loadv4f64, loadv4i64,		v4f64, loadv4f64, loadv4i64,
SchedWriteFVarShuffle.YMM>, VEX_L;		SchedWriteFVarShuffle.YMM>, VEX_L;
}		}

let ExeDomain = SSEPackedSingle in {		let ExeDomain = SSEPackedSingle in {
defm VPERMIL2PS : xop_vpermil2<0x48, "vpermil2ps", VR128, i128mem, f128mem,		defm VPERMIL2PS : xop_vpermil2<0x48, "vpermil2ps", VR128, i128mem, f128mem,
v4f32, loadv4f32, loadv2i64,		v4f32, loadv4f32, loadv4i32,
SchedWriteFVarShuffle.XMM>;		SchedWriteFVarShuffle.XMM>;
defm VPERMIL2PSY : xop_vpermil2<0x48, "vpermil2ps", VR256, i256mem, f256mem,		defm VPERMIL2PSY : xop_vpermil2<0x48, "vpermil2ps", VR256, i256mem, f256mem,
v8f32, loadv8f32, loadv4i64,		v8f32, loadv8f32, loadv8i32,
SchedWriteFVarShuffle.YMM>, VEX_L;		SchedWriteFVarShuffle.YMM>, VEX_L;
}		}

test/CodeGen/X86/avx-vperm2x128.ll

Show First 20 Lines • Show All 218 Lines • ▼ Show 20 Lines	entry:
%a2 = add <16 x i16> %a, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>		%a2 = add <16 x i16> %a, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>
%shuffle = shufflevector <16 x i16> %a2, <16 x i16> %b, <16 x i32> <i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>		%shuffle = shufflevector <16 x i16> %a2, <16 x i16> %b, <16 x i32> <i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>
ret <16 x i16> %shuffle		ret <16 x i16> %shuffle
}		}

define <16 x i16> @shuffle_v16i16_4501_mem(<16 x i16>* %a, <16 x i16>* %b) nounwind uwtable readnone ssp {		define <16 x i16> @shuffle_v16i16_4501_mem(<16 x i16>* %a, <16 x i16>* %b) nounwind uwtable readnone ssp {
; AVX1-LABEL: shuffle_v16i16_4501_mem:		; AVX1-LABEL: shuffle_v16i16_4501_mem:
; AVX1: # %bb.0: # %entry		; AVX1: # %bb.0: # %entry
; AVX1-NEXT: vmovdqa (%rdi), %ymm0		; AVX1-NEXT: vmovdqa (%rdi), %xmm0
; AVX1-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1		; AVX1-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
; AVX1-NEXT: vpsubw %xmm1, %xmm0, %xmm0		; AVX1-NEXT: vpsubw %xmm1, %xmm0, %xmm0
; AVX1-NEXT: vperm2f128 {{.*#+}} ymm0 = mem[0,1],ymm0[0,1]		; AVX1-NEXT: vperm2f128 {{.*#+}} ymm0 = mem[0,1],ymm0[0,1]
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: shuffle_v16i16_4501_mem:		; AVX2-LABEL: shuffle_v16i16_4501_mem:
; AVX2: # %bb.0: # %entry		; AVX2: # %bb.0: # %entry
; AVX2-NEXT: vmovdqa (%rdi), %ymm0		; AVX2-NEXT: vmovdqa (%rdi), %ymm0
▲ Show 20 Lines • Show All 458 Lines • Show Last 20 Lines

test/CodeGen/X86/oddshuffles.ll

	Show First 20 Lines • Show All 1,624 Lines • ▼ Show 20 Lines
	; AVX2-SLOW-NEXT: vpermpd {{.*#+}} ymm4 = ymm0[0,0,2,1]			; AVX2-SLOW-NEXT: vpermpd {{.*#+}} ymm4 = ymm0[0,0,2,1]
	; AVX2-SLOW-NEXT: vblendps {{.*#+}} ymm3 = ymm4[0],ymm3[1],ymm4[2,3],ymm3[4],ymm4[5,6],ymm3[7]			; AVX2-SLOW-NEXT: vblendps {{.*#+}} ymm3 = ymm4[0],ymm3[1],ymm4[2,3],ymm3[4],ymm4[5,6],ymm3[7]
	; AVX2-SLOW-NEXT: vbroadcastsd %xmm2, %ymm4			; AVX2-SLOW-NEXT: vbroadcastsd %xmm2, %ymm4
	; AVX2-SLOW-NEXT: vblendps {{.*#+}} ymm3 = ymm3[0,1],ymm4[2],ymm3[3,4],ymm4[5],ymm3[6,7]			; AVX2-SLOW-NEXT: vblendps {{.*#+}} ymm3 = ymm3[0,1],ymm4[2],ymm3[3,4],ymm4[5],ymm3[6,7]
	; AVX2-SLOW-NEXT: vpermpd {{.*#+}} ymm4 = ymm2[2,1,3,3]			; AVX2-SLOW-NEXT: vpermpd {{.*#+}} ymm4 = ymm2[2,1,3,3]
	; AVX2-SLOW-NEXT: vpermilps {{.*#+}} ymm5 = ymm1[1,2,3,3,5,6,7,7]			; AVX2-SLOW-NEXT: vpermilps {{.*#+}} ymm5 = ymm1[1,2,3,3,5,6,7,7]
	; AVX2-SLOW-NEXT: vpermpd {{.*#+}} ymm5 = ymm5[2,2,2,3]			; AVX2-SLOW-NEXT: vpermpd {{.*#+}} ymm5 = ymm5[2,2,2,3]
	; AVX2-SLOW-NEXT: vblendps {{.*#+}} ymm4 = ymm5[0],ymm4[1],ymm5[2,3],ymm4[4],ymm5[5,6],ymm4[7]			; AVX2-SLOW-NEXT: vblendps {{.*#+}} ymm4 = ymm5[0],ymm4[1],ymm5[2,3],ymm4[4],ymm5[5,6],ymm4[7]
	; AVX2-SLOW-NEXT: vbroadcastsd 24(%rsi), %ymm5			; AVX2-SLOW-NEXT: vpermpd {{.*#+}} ymm5 = ymm0[0,3,3,3]
				craig.topperAuthorUnsubmitted Not Done Reply Inline Actions Looks like we're now reusing something we previously reloaded. craig.topper: Looks like we're now reusing something we previously reloaded.
	; AVX2-SLOW-NEXT: vblendps {{.*#+}} ymm4 = ymm4[0,1],ymm5[2],ymm4[3,4],ymm5[5],ymm4[6,7]			; AVX2-SLOW-NEXT: vblendps {{.*#+}} ymm4 = ymm4[0,1],ymm5[2],ymm4[3,4],ymm5[5],ymm4[6,7]
	; AVX2-SLOW-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[1,1,2,2]			; AVX2-SLOW-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[1,1,2,2]
	; AVX2-SLOW-NEXT: vpermpd {{.*#+}} ymm2 = ymm2[1,1,2,2]			; AVX2-SLOW-NEXT: vpermpd {{.*#+}} ymm2 = ymm2[1,1,2,2]
	; AVX2-SLOW-NEXT: vblendps {{.*#+}} ymm0 = ymm2[0],ymm0[1],ymm2[2,3],ymm0[4],ymm2[5,6],ymm0[7]			; AVX2-SLOW-NEXT: vblendps {{.*#+}} ymm0 = ymm2[0],ymm0[1],ymm2[2,3],ymm0[4],ymm2[5,6],ymm0[7]
	; AVX2-SLOW-NEXT: vpermilps {{.*#+}} ymm1 = ymm1[0,0,3,3,4,4,7,7]			; AVX2-SLOW-NEXT: vpermilps {{.*#+}} ymm1 = ymm1[0,0,3,3,4,4,7,7]
	; AVX2-SLOW-NEXT: vblendps {{.*#+}} ymm0 = ymm0[0,1],ymm1[2],ymm0[3,4],ymm1[5],ymm0[6,7]			; AVX2-SLOW-NEXT: vblendps {{.*#+}} ymm0 = ymm0[0,1],ymm1[2],ymm0[3,4],ymm1[5],ymm0[6,7]
	; AVX2-SLOW-NEXT: vmovups %ymm0, 32(%rdi)			; AVX2-SLOW-NEXT: vmovups %ymm0, 32(%rdi)
	; AVX2-SLOW-NEXT: vmovups %ymm4, 64(%rdi)			; AVX2-SLOW-NEXT: vmovups %ymm4, 64(%rdi)
	; AVX2-SLOW-NEXT: vmovups %ymm3, (%rdi)			; AVX2-SLOW-NEXT: vmovups %ymm3, (%rdi)
	; AVX2-SLOW-NEXT: vzeroupper			; AVX2-SLOW-NEXT: vzeroupper
	; AVX2-SLOW-NEXT: retq			; AVX2-SLOW-NEXT: retq
	;			;
	; AVX2-FAST-LABEL: interleave_24i32_in:			; AVX2-FAST-LABEL: interleave_24i32_in:
	; AVX2-FAST: # %bb.0:			; AVX2-FAST: # %bb.0:
	; AVX2-FAST-NEXT: vmovups (%rsi), %ymm0			; AVX2-FAST-NEXT: vmovups (%rsi), %ymm0
	; AVX2-FAST-NEXT: vmovups (%rdx), %ymm1			; AVX2-FAST-NEXT: vmovups (%rdx), %ymm1
	; AVX2-FAST-NEXT: vmovups (%rcx), %ymm2			; AVX2-FAST-NEXT: vmovups (%rcx), %ymm2
	; AVX2-FAST-NEXT: vmovaps {{.*#+}} ymm3 = [1,0,2,2,1,0,2,2]			; AVX2-FAST-NEXT: vmovaps {{.*#+}} ymm3 = [1,0,2,2,1,0,2,2]
	; AVX2-FAST-NEXT: vpermps %ymm1, %ymm3, %ymm3			; AVX2-FAST-NEXT: vpermps %ymm1, %ymm3, %ymm3
	; AVX2-FAST-NEXT: vpermpd {{.*#+}} ymm4 = ymm0[0,0,2,1]			; AVX2-FAST-NEXT: vpermpd {{.*#+}} ymm4 = ymm0[0,0,2,1]
	; AVX2-FAST-NEXT: vblendps {{.*#+}} ymm3 = ymm4[0],ymm3[1],ymm4[2,3],ymm3[4],ymm4[5,6],ymm3[7]			; AVX2-FAST-NEXT: vblendps {{.*#+}} ymm3 = ymm4[0],ymm3[1],ymm4[2,3],ymm3[4],ymm4[5,6],ymm3[7]
	; AVX2-FAST-NEXT: vbroadcastsd %xmm2, %ymm4			; AVX2-FAST-NEXT: vbroadcastsd %xmm2, %ymm4
	; AVX2-FAST-NEXT: vblendps {{.*#+}} ymm3 = ymm3[0,1],ymm4[2],ymm3[3,4],ymm4[5],ymm3[6,7]			; AVX2-FAST-NEXT: vblendps {{.*#+}} ymm3 = ymm3[0,1],ymm4[2],ymm3[3,4],ymm4[5],ymm3[6,7]
	; AVX2-FAST-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[1,1,2,2]			; AVX2-FAST-NEXT: vpermpd {{.*#+}} ymm4 = ymm0[1,1,2,2]
	; AVX2-FAST-NEXT: vpermpd {{.*#+}} ymm4 = ymm2[1,1,2,2]			; AVX2-FAST-NEXT: vpermpd {{.*#+}} ymm5 = ymm2[1,1,2,2]
	; AVX2-FAST-NEXT: vblendps {{.*#+}} ymm0 = ymm4[0],ymm0[1],ymm4[2,3],ymm0[4],ymm4[5,6],ymm0[7]			; AVX2-FAST-NEXT: vblendps {{.*#+}} ymm4 = ymm5[0],ymm4[1],ymm5[2,3],ymm4[4],ymm5[5,6],ymm4[7]
	; AVX2-FAST-NEXT: vpermilps {{.*#+}} ymm4 = ymm1[0,0,3,3,4,4,7,7]			; AVX2-FAST-NEXT: vpermilps {{.*#+}} ymm5 = ymm1[0,0,3,3,4,4,7,7]
	; AVX2-FAST-NEXT: vblendps {{.*#+}} ymm0 = ymm0[0,1],ymm4[2],ymm0[3,4],ymm4[5],ymm0[6,7]			; AVX2-FAST-NEXT: vblendps {{.*#+}} ymm4 = ymm4[0,1],ymm5[2],ymm4[3,4],ymm5[5],ymm4[6,7]
	; AVX2-FAST-NEXT: vmovaps {{.*#+}} ymm4 = [5,6,5,6,5,6,7,7]			; AVX2-FAST-NEXT: vmovaps {{.*#+}} ymm5 = [5,6,5,6,5,6,7,7]
	; AVX2-FAST-NEXT: vpermps %ymm1, %ymm4, %ymm1			; AVX2-FAST-NEXT: vpermps %ymm1, %ymm5, %ymm1
	; AVX2-FAST-NEXT: vpermpd {{.*#+}} ymm2 = ymm2[2,1,3,3]			; AVX2-FAST-NEXT: vpermpd {{.*#+}} ymm2 = ymm2[2,1,3,3]
	; AVX2-FAST-NEXT: vblendps {{.*#+}} ymm1 = ymm1[0],ymm2[1],ymm1[2,3],ymm2[4],ymm1[5,6],ymm2[7]			; AVX2-FAST-NEXT: vblendps {{.*#+}} ymm1 = ymm1[0],ymm2[1],ymm1[2,3],ymm2[4],ymm1[5,6],ymm2[7]
	; AVX2-FAST-NEXT: vbroadcastsd 24(%rsi), %ymm2			; AVX2-FAST-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[0,3,3,3]
	; AVX2-FAST-NEXT: vblendps {{.*#+}} ymm1 = ymm1[0,1],ymm2[2],ymm1[3,4],ymm2[5],ymm1[6,7]			; AVX2-FAST-NEXT: vblendps {{.*#+}} ymm0 = ymm1[0,1],ymm0[2],ymm1[3,4],ymm0[5],ymm1[6,7]
	; AVX2-FAST-NEXT: vmovups %ymm1, 64(%rdi)			; AVX2-FAST-NEXT: vmovups %ymm0, 64(%rdi)
	; AVX2-FAST-NEXT: vmovups %ymm0, 32(%rdi)			; AVX2-FAST-NEXT: vmovups %ymm4, 32(%rdi)
	; AVX2-FAST-NEXT: vmovups %ymm3, (%rdi)			; AVX2-FAST-NEXT: vmovups %ymm3, (%rdi)
	; AVX2-FAST-NEXT: vzeroupper			; AVX2-FAST-NEXT: vzeroupper
	; AVX2-FAST-NEXT: retq			; AVX2-FAST-NEXT: retq
	;			;
	; XOP-LABEL: interleave_24i32_in:			; XOP-LABEL: interleave_24i32_in:
	; XOP: # %bb.0:			; XOP: # %bb.0:
	; XOP-NEXT: vmovups (%rsi), %ymm0			; XOP-NEXT: vmovups (%rsi), %ymm0
	; XOP-NEXT: vmovups (%rdx), %ymm1			; XOP-NEXT: vmovups (%rdx), %ymm1
	▲ Show 20 Lines • Show All 92 Lines • Show Last 20 Lines

test/CodeGen/X86/pshufb-mask-comments.ll

	Show First 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	}			}

	define <16 x i8> @test5(<16 x i8> %V) {			define <16 x i8> @test5(<16 x i8> %V) {
	; CHECK-LABEL: test5:			; CHECK-LABEL: test5:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: movl $1, %eax			; CHECK-NEXT: movl $1, %eax
	; CHECK-NEXT: movq %rax, %xmm1			; CHECK-NEXT: movq %rax, %xmm1
	; CHECK-NEXT: movdqa %xmm1, (%rax)			; CHECK-NEXT: movdqa %xmm1, (%rax)
	; CHECK-NEXT: movdqa {{.*#+}} xmm1 = [1,1]			; CHECK-NEXT: movaps {{.*#+}} xmm1 = [1,1]
				craig.topperAuthorUnsubmitted Not Done Reply Inline Actions This changed because the loads and stores in the test all use undef pointers. And previously the two loads combined because the promotion gave them the same type. Now they will always have different types. craig.topper: This changed because the loads and stores in the test all use undef pointers. And previously…
	; CHECK-NEXT: movdqa %xmm1, (%rax)			; CHECK-NEXT: movaps %xmm1, (%rax)
	; CHECK-NEXT: pshufb %xmm1, %xmm0			; CHECK-NEXT: pshufb (%rax), %xmm0
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	store <2 x i64> <i64 1, i64 0>, <2 x i64>* undef, align 16			store <2 x i64> <i64 1, i64 0>, <2 x i64>* undef, align 16
	%l = load <2 x i64>, <2 x i64>* undef, align 16			%l = load <2 x i64>, <2 x i64>* undef, align 16
	%shuffle = shufflevector <2 x i64> %l, <2 x i64> undef, <2 x i32> zeroinitializer			%shuffle = shufflevector <2 x i64> %l, <2 x i64> undef, <2 x i32> zeroinitializer
	store <2 x i64> %shuffle, <2 x i64>* undef, align 16			store <2 x i64> %shuffle, <2 x i64>* undef, align 16
	%1 = load <16 x i8>, <16 x i8>* undef, align 16			%1 = load <16 x i8>, <16 x i8>* undef, align 16
	%2 = call <16 x i8> @llvm.x86.ssse3.pshuf.b.128(<16 x i8> %V, <16 x i8> %1)			%2 = call <16 x i8> @llvm.x86.ssse3.pshuf.b.128(<16 x i8> %V, <16 x i8> %1)
	ret <16 x i8> %2			ret <16 x i8> %2
	Show All 20 Lines

test/CodeGen/X86/vector-extend-inreg.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=+sse2 \| FileCheck %s --check-prefix=ALL --check-prefix=X32-SSE			; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=+sse2 \| FileCheck %s --check-prefix=ALL --check-prefix=X32-SSE
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse2 \| FileCheck %s --check-prefix=ALL --check-prefix=X64-SSE			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse2 \| FileCheck %s --check-prefix=ALL --check-prefix=X64-SSE
	; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=ALL --check-prefix=X32-AVX			; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=ALL --check-prefix=X32-AVX
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=ALL --check-prefix=X64-AVX			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=ALL --check-prefix=X64-AVX

	define i64 @extract_any_extend_vector_inreg_v16i64(<16 x i64> %a0, i32 %a1) nounwind {			define i64 @extract_any_extend_vector_inreg_v16i64(<16 x i64> %a0, i32 %a1) nounwind {
	; X32-SSE-LABEL: extract_any_extend_vector_inreg_v16i64:			; X32-SSE-LABEL: extract_any_extend_vector_inreg_v16i64:
	; X32-SSE: # %bb.0:			; X32-SSE: # %bb.0:
	; X32-SSE-NEXT: pushl %ebp			; X32-SSE-NEXT: pushl %ebp
	; X32-SSE-NEXT: movl %esp, %ebp			; X32-SSE-NEXT: movl %esp, %ebp
	; X32-SSE-NEXT: andl $-128, %esp			; X32-SSE-NEXT: andl $-128, %esp
	; X32-SSE-NEXT: subl $384, %esp # imm = 0x180			; X32-SSE-NEXT: subl $384, %esp # imm = 0x180
	; X32-SSE-NEXT: movl 88(%ebp), %ecx			; X32-SSE-NEXT: movl 88(%ebp), %ecx
	; X32-SSE-NEXT: movdqa 72(%ebp), %xmm0			; X32-SSE-NEXT: movdqa 72(%ebp), %xmm0
				; X32-SSE-NEXT: psrldq {{.*#+}} xmm0 = xmm0[8,9,10,11,12,13,14,15],zero,zero,zero,zero,zero,zero,zero,zero
	; X32-SSE-NEXT: xorps %xmm1, %xmm1			; X32-SSE-NEXT: xorps %xmm1, %xmm1
	; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)			; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)
	; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)			; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)
	; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)			; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)
	; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)			; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)
	; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)			; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)
	; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)			; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)
	; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)			; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)
	; X32-SSE-NEXT: psrldq {{.*#+}} xmm0 = xmm0[8,9,10,11,12,13,14,15],zero,zero,zero,zero,zero,zero,zero,zero
	; X32-SSE-NEXT: movdqa %xmm0, {{[0-9]+}}(%esp)			; X32-SSE-NEXT: movdqa %xmm0, {{[0-9]+}}(%esp)
	; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)			; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)
	; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)			; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)
	; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)			; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)
	; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)			; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)
	; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)			; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)
	; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)			; X32-SSE-NEXT: movaps %xmm1, {{[0-9]+}}(%esp)
	; X32-SSE-NEXT: movaps %xmm1, (%esp)			; X32-SSE-NEXT: movaps %xmm1, (%esp)
	▲ Show 20 Lines • Show All 90 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-idiv-v2i32.ll

	Show First 20 Lines • Show All 687 Lines • ▼ Show 20 Lines
	; X86-NEXT: movq {{.*#+}} xmm0 = mem[0],zero			; X86-NEXT: movq {{.*#+}} xmm0 = mem[0],zero
	; X86-NEXT: pxor %xmm1, %xmm1			; X86-NEXT: pxor %xmm1, %xmm1
	; X86-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]			; X86-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
	; X86-NEXT: psrad $31, %xmm1			; X86-NEXT: psrad $31, %xmm1
	; X86-NEXT: pshufd {{.*#+}} xmm2 = xmm1[1,3,2,3]			; X86-NEXT: pshufd {{.*#+}} xmm2 = xmm1[1,3,2,3]
	; X86-NEXT: movdqa %xmm0, %xmm1			; X86-NEXT: movdqa %xmm0, %xmm1
	; X86-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm2[0],xmm1[1],xmm2[1]			; X86-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm2[0],xmm1[1],xmm2[1]
	; X86-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,1,1,3]			; X86-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,1,1,3]
	; X86-NEXT: movdqa {{.*#+}} xmm2 = [0,2147483648,0,2147483648]			; X86-NEXT: movdqa {{.*#+}} xmm2 = [31,0,31,0]
	; X86-NEXT: movdqa {{.*#+}} xmm3 = [31,0,31,0]			; X86-NEXT: movdqa {{.*#+}} xmm3 = [0,2147483648,0,2147483648]
	; X86-NEXT: movdqa %xmm2, %xmm4			; X86-NEXT: movdqa %xmm3, %xmm4
	; X86-NEXT: psrlq %xmm3, %xmm4			; X86-NEXT: psrlq %xmm2, %xmm4
	; X86-NEXT: movl $31, %ecx			; X86-NEXT: movl $31, %ecx
	; X86-NEXT: movd %ecx, %xmm5			; X86-NEXT: movd %ecx, %xmm5
	; X86-NEXT: psrlq %xmm5, %xmm2			; X86-NEXT: psrlq %xmm5, %xmm3
	; X86-NEXT: movsd {{.*#+}} xmm2 = xmm4[0],xmm2[1]			; X86-NEXT: movsd {{.*#+}} xmm3 = xmm4[0],xmm3[1]
	; X86-NEXT: movdqa %xmm1, %xmm4			; X86-NEXT: movdqa %xmm1, %xmm4
	; X86-NEXT: psrlq %xmm3, %xmm4			; X86-NEXT: psrlq %xmm2, %xmm4
	; X86-NEXT: psrlq %xmm5, %xmm1			; X86-NEXT: psrlq %xmm5, %xmm1
	; X86-NEXT: movsd {{.*#+}} xmm1 = xmm4[0],xmm1[1]			; X86-NEXT: movsd {{.*#+}} xmm1 = xmm4[0],xmm1[1]
	; X86-NEXT: xorpd %xmm2, %xmm1			; X86-NEXT: xorpd %xmm3, %xmm1
	; X86-NEXT: psubq %xmm2, %xmm1			; X86-NEXT: psubq %xmm3, %xmm1
	; X86-NEXT: pand {{\.LCPI.*}}, %xmm1			; X86-NEXT: pand {{\.LCPI.*}}, %xmm1
	; X86-NEXT: psrlq $29, %xmm1			; X86-NEXT: psrlq $29, %xmm1
	; X86-NEXT: paddq %xmm0, %xmm1			; X86-NEXT: paddq %xmm0, %xmm1
	; X86-NEXT: psllq $32, %xmm1			; X86-NEXT: psllq $32, %xmm1
	; X86-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,3,2,3]			; X86-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,3,2,3]
	; X86-NEXT: psrad $31, %xmm1			; X86-NEXT: psrad $31, %xmm1
	; X86-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,3,2,3]			; X86-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,3,2,3]
	; X86-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]			; X86-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
	▲ Show 20 Lines • Show All 497 Lines • Show Last 20 Lines

test/CodeGen/X86/widened-broadcast.ll

	Show First 20 Lines • Show All 115 Lines • ▼ Show 20 Lines

	define <8 x i32> @load_splat_8i32_4i32_01010101(<4 x i32>* %ptr) nounwind uwtable readnone ssp {			define <8 x i32> @load_splat_8i32_4i32_01010101(<4 x i32>* %ptr) nounwind uwtable readnone ssp {
	; SSE-LABEL: load_splat_8i32_4i32_01010101:			; SSE-LABEL: load_splat_8i32_4i32_01010101:
	; SSE: # %bb.0: # %entry			; SSE: # %bb.0: # %entry
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = mem[0,1,0,1]			; SSE-NEXT: pshufd {{.*#+}} xmm0 = mem[0,1,0,1]
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE-NEXT: movdqa %xmm0, %xmm1
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: load_splat_8i32_4i32_01010101:			; AVX1-LABEL: load_splat_8i32_4i32_01010101:
				craig.topperAuthorUnsubmitted Not Done Reply Inline Actions Looks like matching broadcast from shuffles is a little weak in avx1. This test regressed but the load_splat_8i32_8i32_01010101 case improved. craig.topper: Looks like matching broadcast from shuffles is a little weak in avx1. This test regressed but…
	; AVX: # %bb.0: # %entry			; AVX1: # %bb.0: # %entry
	; AVX-NEXT: vbroadcastsd (%rdi), %ymm0			; AVX1-NEXT: vpermilps {{.*#+}} xmm0 = mem[0,1,0,1]
	; AVX-NEXT: retq			; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0
				; AVX1-NEXT: retq
				;
				; AVX2-LABEL: load_splat_8i32_4i32_01010101:
				; AVX2: # %bb.0: # %entry
				; AVX2-NEXT: vbroadcastsd (%rdi), %ymm0
				; AVX2-NEXT: retq
				;
				; AVX512-LABEL: load_splat_8i32_4i32_01010101:
				; AVX512: # %bb.0: # %entry
				; AVX512-NEXT: vbroadcastsd (%rdi), %ymm0
				; AVX512-NEXT: retq
	entry:			entry:
	%ld = load <4 x i32>, <4 x i32>* %ptr			%ld = load <4 x i32>, <4 x i32>* %ptr
	%ret = shufflevector <4 x i32> %ld, <4 x i32> undef, <8 x i32> <i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1>			%ret = shufflevector <4 x i32> %ld, <4 x i32> undef, <8 x i32> <i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1>
	ret <8 x i32> %ret			ret <8 x i32> %ret
	}			}

	define <8 x i32> @load_splat_8i32_8i32_01010101(<8 x i32>* %ptr) nounwind uwtable readnone ssp {			define <8 x i32> @load_splat_8i32_8i32_01010101(<8 x i32>* %ptr) nounwind uwtable readnone ssp {
	; SSE-LABEL: load_splat_8i32_8i32_01010101:			; SSE-LABEL: load_splat_8i32_8i32_01010101:
	; SSE: # %bb.0: # %entry			; SSE: # %bb.0: # %entry
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = mem[0,1,0,1]			; SSE-NEXT: pshufd {{.*#+}} xmm0 = mem[0,1,0,1]
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE-NEXT: movdqa %xmm0, %xmm1
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-LABEL: load_splat_8i32_8i32_01010101:			; AVX-LABEL: load_splat_8i32_8i32_01010101:
	; AVX1: # %bb.0: # %entry			; AVX: # %bb.0: # %entry
	; AVX1-NEXT: vmovddup {{.*#+}} xmm0 = mem[0,0]			; AVX-NEXT: vbroadcastsd (%rdi), %ymm0
	; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; AVX-NEXT: retq
	; AVX1-NEXT: retq
	;
	; AVX2-LABEL: load_splat_8i32_8i32_01010101:
	; AVX2: # %bb.0: # %entry
	; AVX2-NEXT: vbroadcastsd (%rdi), %ymm0
	; AVX2-NEXT: retq
	;
	; AVX512-LABEL: load_splat_8i32_8i32_01010101:
	; AVX512: # %bb.0: # %entry
	; AVX512-NEXT: vbroadcastsd (%rdi), %ymm0
	; AVX512-NEXT: retq
	entry:			entry:
	%ld = load <8 x i32>, <8 x i32>* %ptr			%ld = load <8 x i32>, <8 x i32>* %ptr
	%ret = shufflevector <8 x i32> %ld, <8 x i32> undef, <8 x i32> <i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1>			%ret = shufflevector <8 x i32> %ld, <8 x i32> undef, <8 x i32> <i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1>
	ret <8 x i32> %ret			ret <8 x i32> %ret
	}			}

	define <8 x i16> @load_splat_8i16_8i16_01010101(<8 x i16>* %ptr) nounwind uwtable readnone ssp {			define <8 x i16> @load_splat_8i16_8i16_01010101(<8 x i16>* %ptr) nounwind uwtable readnone ssp {
	; SSE-LABEL: load_splat_8i16_8i16_01010101:			; SSE-LABEL: load_splat_8i16_8i16_01010101:
	▲ Show 20 Lines • Show All 70 Lines • ▼ Show 20 Lines
	; AVX512-NEXT: vbroadcastss (%rdi), %ymm0			; AVX512-NEXT: vbroadcastss (%rdi), %ymm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	entry:			entry:
	%ld = load <8 x i16>, <8 x i16>* %ptr			%ld = load <8 x i16>, <8 x i16>* %ptr
	%ret = shufflevector <8 x i16> %ld, <8 x i16> undef, <16 x i32> <i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1>			%ret = shufflevector <8 x i16> %ld, <8 x i16> undef, <16 x i32> <i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1>
	ret <16 x i16> %ret			ret <16 x i16> %ret
	}			}

	define <16 x i16> @load_splat_16i16_8i16_0123012301230123(<8 x i16>* %ptr) nounwind uwtable readnone ssp {			define <16 x i16> @load_splat_16i16_8i16_0123012301230123(<8 x i16>* %ptr) nounwind uwtable readnone ssp {
				craig.topperAuthorUnsubmitted Not Done Reply Inline Actions Similar to load_splat_8i32_4i32_01010101 craig.topper: Similar to load_splat_8i32_4i32_01010101
	; SSE-LABEL: load_splat_16i16_8i16_0123012301230123:			; SSE-LABEL: load_splat_16i16_8i16_0123012301230123:
	; SSE: # %bb.0: # %entry			; SSE: # %bb.0: # %entry
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = mem[0,1,0,1]			; SSE-NEXT: pshufd {{.*#+}} xmm0 = mem[0,1,0,1]
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE-NEXT: movdqa %xmm0, %xmm1
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: load_splat_16i16_8i16_0123012301230123:			; AVX1-LABEL: load_splat_16i16_8i16_0123012301230123:
	; AVX: # %bb.0: # %entry			; AVX1: # %bb.0: # %entry
	; AVX-NEXT: vbroadcastsd (%rdi), %ymm0			; AVX1-NEXT: vpermilps {{.*#+}} xmm0 = mem[0,1,0,1]
	; AVX-NEXT: retq			; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0
				; AVX1-NEXT: retq
				;
				; AVX2-LABEL: load_splat_16i16_8i16_0123012301230123:
				; AVX2: # %bb.0: # %entry
				; AVX2-NEXT: vbroadcastsd (%rdi), %ymm0
				; AVX2-NEXT: retq
				;
				; AVX512-LABEL: load_splat_16i16_8i16_0123012301230123:
				; AVX512: # %bb.0: # %entry
				; AVX512-NEXT: vbroadcastsd (%rdi), %ymm0
				; AVX512-NEXT: retq
	entry:			entry:
	%ld = load <8 x i16>, <8 x i16>* %ptr			%ld = load <8 x i16>, <8 x i16>* %ptr
	%ret = shufflevector <8 x i16> %ld, <8 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3,i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3>			%ret = shufflevector <8 x i16> %ld, <8 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3,i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3>
	ret <16 x i16> %ret			ret <16 x i16> %ret
	}			}

	define <16 x i16> @load_splat_16i16_16i16_0101010101010101(<16 x i16>* %ptr) nounwind uwtable readnone ssp {			define <16 x i16> @load_splat_16i16_16i16_0101010101010101(<16 x i16>* %ptr) nounwind uwtable readnone ssp {
	; SSE-LABEL: load_splat_16i16_16i16_0101010101010101:			; SSE-LABEL: load_splat_16i16_16i16_0101010101010101:
	; SSE: # %bb.0: # %entry			; SSE: # %bb.0: # %entry
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = mem[0,0,0,0]			; SSE-NEXT: pshufd {{.*#+}} xmm0 = mem[0,0,0,0]
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE-NEXT: movdqa %xmm0, %xmm1
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-LABEL: load_splat_16i16_16i16_0101010101010101:			; AVX-LABEL: load_splat_16i16_16i16_0101010101010101:
	; AVX1: # %bb.0: # %entry			; AVX: # %bb.0: # %entry
	; AVX1-NEXT: vpermilps {{.*#+}} xmm0 = mem[0,0,0,0]			; AVX-NEXT: vbroadcastss (%rdi), %ymm0
	; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; AVX-NEXT: retq
	; AVX1-NEXT: retq
	;
	; AVX2-LABEL: load_splat_16i16_16i16_0101010101010101:
	; AVX2: # %bb.0: # %entry
	; AVX2-NEXT: vbroadcastss (%rdi), %ymm0
	; AVX2-NEXT: retq
	;
	; AVX512-LABEL: load_splat_16i16_16i16_0101010101010101:
	; AVX512: # %bb.0: # %entry
	; AVX512-NEXT: vbroadcastss (%rdi), %ymm0
	; AVX512-NEXT: retq
	entry:			entry:
	%ld = load <16 x i16>, <16 x i16>* %ptr			%ld = load <16 x i16>, <16 x i16>* %ptr
	%ret = shufflevector <16 x i16> %ld, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1>			%ret = shufflevector <16 x i16> %ld, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1, i32 0, i32 1>
	ret <16 x i16> %ret			ret <16 x i16> %ret
	}			}

	define <16 x i16> @load_splat_16i16_16i16_0123012301230123(<16 x i16>* %ptr) nounwind uwtable readnone ssp {			define <16 x i16> @load_splat_16i16_16i16_0123012301230123(<16 x i16>* %ptr) nounwind uwtable readnone ssp {
	; SSE-LABEL: load_splat_16i16_16i16_0123012301230123:			; SSE-LABEL: load_splat_16i16_16i16_0123012301230123:
	▲ Show 20 Lines • Show All 152 Lines • ▼ Show 20 Lines

	define <32 x i8> @load_splat_32i8_16i8_01234567012345670123456701234567(<16 x i8>* %ptr) nounwind uwtable readnone ssp {			define <32 x i8> @load_splat_32i8_16i8_01234567012345670123456701234567(<16 x i8>* %ptr) nounwind uwtable readnone ssp {
	; SSE-LABEL: load_splat_32i8_16i8_01234567012345670123456701234567:			; SSE-LABEL: load_splat_32i8_16i8_01234567012345670123456701234567:
	; SSE: # %bb.0: # %entry			; SSE: # %bb.0: # %entry
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = mem[0,1,0,1]			; SSE-NEXT: pshufd {{.*#+}} xmm0 = mem[0,1,0,1]
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE-NEXT: movdqa %xmm0, %xmm1
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: load_splat_32i8_16i8_01234567012345670123456701234567:			; AVX1-LABEL: load_splat_32i8_16i8_01234567012345670123456701234567:
				craig.topperAuthorUnsubmitted Not Done Reply Inline Actions Similar to load_splat_8i32_4i32_01010101 craig.topper: Similar to load_splat_8i32_4i32_01010101
	; AVX: # %bb.0: # %entry			; AVX1: # %bb.0: # %entry
	; AVX-NEXT: vbroadcastsd (%rdi), %ymm0			; AVX1-NEXT: vpermilps {{.*#+}} xmm0 = mem[0,1,0,1]
	; AVX-NEXT: retq			; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0
				; AVX1-NEXT: retq
				;
				; AVX2-LABEL: load_splat_32i8_16i8_01234567012345670123456701234567:
				; AVX2: # %bb.0: # %entry
				; AVX2-NEXT: vbroadcastsd (%rdi), %ymm0
				; AVX2-NEXT: retq
				;
				; AVX512-LABEL: load_splat_32i8_16i8_01234567012345670123456701234567:
				; AVX512: # %bb.0: # %entry
				; AVX512-NEXT: vbroadcastsd (%rdi), %ymm0
				; AVX512-NEXT: retq
	entry:			entry:
	%ld = load <16 x i8>, <16 x i8>* %ptr			%ld = load <16 x i8>, <16 x i8>* %ptr
	%ret = shufflevector <16 x i8> %ld, <16 x i8> undef, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>			%ret = shufflevector <16 x i8> %ld, <16 x i8> undef, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>
	ret <32 x i8> %ret			ret <32 x i8> %ret
	}			}

	define <32 x i8> @load_splat_32i8_32i8_01010101010101010101010101010101(<32 x i8>* %ptr) nounwind uwtable readnone ssp {			define <32 x i8> @load_splat_32i8_32i8_01010101010101010101010101010101(<32 x i8>* %ptr) nounwind uwtable readnone ssp {
	; SSE-LABEL: load_splat_32i8_32i8_01010101010101010101010101010101:			; SSE-LABEL: load_splat_32i8_32i8_01010101010101010101010101010101:
	▲ Show 20 Lines • Show All 194 Lines • Show Last 20 Lines