This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
lib/Target/X86/
-
Target/
-
X86/
-
X86Instr3DNow.td
-
X86InstrAVX512.td
-
X86InstrArithmetic.td
-
X86InstrCMovSetCC.td
-
X86InstrFMA.td
-
X86InstrInfo.td
-
X86InstrMMX.td
-
X86InstrSSE.td
-
X86InstrShiftRotate.td
-
X86InstrXOP.td
4
X86SchedBroadwell.td
-
X86SchedHaswell.td
1
X86SchedSandyBridge.td
-
X86SchedSkylakeClient.td
3
X86SchedSkylakeServer.td
-
X86Schedule.td
-
X86ScheduleAtom.td
-
X86ScheduleBtVer2.td
-
X86ScheduleSLM.td
-
X86ScheduleZnver1.td
-
test/tools/llvm-mca/X86/
-
tools/
-
llvm-mca/
-
X86/
-
read-after-ld-1.s
-
read-after-ld-2.s

Differential D52886

[X86] Move ReadAfterLd functionality into X86FoldableSchedWrite (PR36957)
ClosedPublic

Authored by RKSimon on Oct 4 2018, 7:05 AM.

Download Raw Diff

Details

Reviewers

andreadb
craig.topper
courbet
gchatelet
lebedev.ri
spatel

Commits

rGf09fc3bc126f: [X86] Move ReadAfterLd functionality into X86FoldableSchedWrite (PR36957)
rL343868: [X86] Move ReadAfterLd functionality into X86FoldableSchedWrite (PR36957)

Summary

Currently we hardcode instructions with ReadAfterLd if the register operands don't need to be available until the folded load has completed. This doesn't take into account the different load latencies of different memory operands (PR36957).

This patch adds a ReadAfterFold def into X86FoldableSchedWrite to replace ReadAfterLd, allowing us to specify the load latency at a scheduler class level.

I've added ReadAfterVec*Ld classes that match the XMM/Scl, XMM and YMM/ZMM WriteVecLoad classes that we currently use.

Diff Detail

Repository: rL LLVM

Event Timeline

RKSimon created this revision.Oct 4 2018, 7:05 AM

Herald added a subscriber: gbedwell. · View Herald TranscriptOct 4 2018, 7:05 AM

Thanks Simon!

I am happy to see how this fixes the issue with read-advance being set to 3cy instead of 5cy for vector loads in BtVer2.

I also like the overall design (i.e. how the SchedRead is set).
I let Clement and Craig comment on the changes to the Intel models.
From my point of view, this patch looks good.

-Andrea

craig.topper added inline comments.Oct 4 2018, 10:37 AM

lib/Target/X86/X86SchedBroadwell.td
79	The load latencies on BDW seem weird given that HSW and SKL, the CPUs immediately before and after are the same.
lib/Target/X86/X86SchedSkylakeServer.td
74	Why this comment only changed in this model? The same comment existing in SNB, HSW, BDW, and SKLClient.

RKSimon added inline comments.Oct 4 2018, 10:42 AM

lib/Target/X86/X86SchedBroadwell.td
79	They're the same as BDW's load latencies - can we confirm if they are correct or not? I think this question has come up several times in the past....
lib/Target/X86/X86SchedSkylakeServer.td
74	Because my copy+paste skills are below average.

courbet added inline comments.Oct 5 2018, 4:58 AM

lib/Target/X86/X86SchedBroadwell.td

llvm-exegesis does not currently fully automate measurement of latency operations, nevertheless we can do:

echo -e 'mov (%rdi),%rax\n mov %rax, 1(%rdi)' | ./bin/llvm-exegesis -mode=latency -snippets-file=-
echo -e 'vmovups (%rdi),%xmm0\n vmovups %xmm0, 1(%rdi)' | ./bin/llvm-exegesis -mode=latency -snippets-file=-
echo -e 'vmovups (%rdi),%ymm0\n vmovups %ymm0, 1(%rdi)' | ./bin/llvm-exegesis -mode=latency -snippets-file=-

(with store-to-load forwarding)

echo -e 'mov (%rdi),%rax\n mov %rax, 1(%rdi)' | ./bin/llvm-exegesis -mode=latency -snippets-file=-
echo -e 'vmovups (%rdi),%xmm0\n vmovups %xmm0, 1(%rdi)' | ./bin/llvm-exegesis -mode=latency -snippets-file=-
echo -e 'vmovups (%rdi),%ymm0\n vmovups %ymm0, 1(%rdi)' | ./bin/llvm-exegesis -mode=latency -snippets-file=-

(without store-to-load forwarding)

On Haswell, this gives 5/6/7-15/16/17.
On Broadwell, this gives 5/6/7-15/16/17.

So they should be the same (5/6/7).

courbet added inline comments.Oct 5 2018, 5:05 AM

lib/Target/X86/X86SchedBroadwell.td
79	`echo -e 'mov (%rdi),%rax\n mov %rax, 1(%rdi)' \| ./bin/llvm-exegesis -mode=latency -snippets-file=-` This was supposed to be: `echo -e 'mov (%rdi),%rax\n mov %rax, (%rdi)' \| ./bin/llvm-exegesis -mode=latency -snippets-file=-`

courbet added inline comments.Oct 5 2018, 5:25 AM

lib/Target/X86/X86SchedSandyBridge.td
78	Looks good, except that store-to-load forwarding seems to incur an extra cycle in the `ymm` case.
lib/Target/X86/X86SchedSkylakeServer.td
78	I'm seeing 4.5(??)/5/6-15/15/16 here.

I've raised https://bugs.llvm.org/show_bug.cgi?id=39188 to discuss what to do about the broadwell load latencies - changing them would involve a notable update to the model and I'd be a lot more comfortable if we had (llvm-exegesis?) data to confirm them

In D52886#1256458, @RKSimon wrote:

I've raised https://bugs.llvm.org/show_bug.cgi?id=39188 to discuss what to do about the broadwell load latencies - changing them would involve a notable update to the model and I'd be a lot more comfortable if we had (llvm-exegesis?) data to confirm them

What's wrong with the data I gave above ? :)

In D52886#1256461, @courbet wrote:

In D52886#1256458, @RKSimon wrote:

I've raised https://bugs.llvm.org/show_bug.cgi?id=39188 to discuss what to do about the broadwell load latencies - changing them would involve a notable update to the model and I'd be a lot more comfortable if we had (llvm-exegesis?) data to confirm them

What's wrong with the data I gave above ? :)

:) I started creating a patch and realised how much of a diff it was going to cause - and that was before I'd altered any of the InstRW overrides..... I've CC'd you on PR39188, we can continue work on it there.

PR36957 is actually a problem for us (both llvm-mca accuracy and codegen scheduling), and I'd like to concentrate fixing this first.

Refreshed comments

LGTM. I agree we should deal with broadwell separately.

This revision is now accepted and ready to land.Oct 5 2018, 10:09 AM

Closed by commit rL343868: [X86] Move ReadAfterLd functionality into X86FoldableSchedWrite (PR36957) (authored by RKSimon). · Explain WhyOct 5 2018, 10:59 AM

This revision was automatically updated to reflect the committed changes.

RKSimon mentioned this in rG184817d0df00: [X86] Add missing ReadAfterFold attributes from CVTSD2SSrm/CVTSS2SDrm to match….Nov 5 2022, 5:22 AM

Revision Contents

Path

Size

lib/

Target/

X86/

	X86Instr3DNow.td
	X86Instr3DNow.td (revision 343845)

4 lines

	X86InstrAVX512.td
	X86InstrAVX512.td (revision 343845)

238 lines

	X86InstrArithmetic.td
	X86InstrArithmetic.td (revision 343845)

58 lines

	X86InstrCMovSetCC.td
	X86InstrCMovSetCC.td (revision 343845)

2 lines

	X86InstrFMA.td
	X86InstrFMA.td (revision 343845)

38 lines

	X86InstrInfo.td
	X86InstrInfo.td (revision 343845)

6 lines

	X86InstrMMX.td
	X86InstrMMX.td (revision 343845)

10 lines

	X86InstrSSE.td
	X86InstrSSE.td (revision 343845)

177 lines

	X86InstrShiftRotate.td
	X86InstrShiftRotate.td (revision 343845)

4 lines

	X86InstrXOP.td
	X86InstrXOP.td (revision 343845)

38 lines

	X86SchedBroadwell.td
	X86SchedBroadwell.td (revision 343845)

8 lines

	X86SchedHaswell.td
	X86SchedHaswell.td (revision 343845)

8 lines

	X86SchedSandyBridge.td
	X86SchedSandyBridge.td (revision 343845)

8 lines

	X86SchedSkylakeClient.td
	X86SchedSkylakeClient.td (revision 343845)

8 lines

	X86SchedSkylakeServer.td
	X86SchedSkylakeServer.td (revision 343845)

8 lines

	X86Schedule.td
	X86Schedule.td (revision 343845)

377 lines

	X86ScheduleAtom.td
	X86ScheduleAtom.td (revision 343845)

3 lines

	X86ScheduleBtVer2.td
	X86ScheduleBtVer2.td (revision 343845)

6 lines

	X86ScheduleSLM.td
	X86ScheduleSLM.td (revision 343845)

3 lines

	X86ScheduleZnver1.td
	X86ScheduleZnver1.td (revision 343845)

7 lines

test/

tools/

llvm-mca/

X86/

	read-after-ld-1.s
	read-after-ld-1.s (revision 343845)

66 lines

	read-after-ld-2.s
	read-after-ld-2.s (revision 343845)

296 lines

Diff 168464

lib/Target/X86/X86Instr3DNow.td

Show All 32 Lines	multiclass I3DNow_binop_rm_int<bits<8> opc, string Mn,
def rr : I3DNow_binop<opc, MRMSrcReg, (ins VR64:$src1, VR64:$src2), Mn,		def rr : I3DNow_binop<opc, MRMSrcReg, (ins VR64:$src1, VR64:$src2), Mn,
[(set VR64:$dst, (!cast<Intrinsic>(		[(set VR64:$dst, (!cast<Intrinsic>(
!strconcat("int_x86_3dnow", Ver, "_", Mn)) VR64:$src1, VR64:$src2))]>,		!strconcat("int_x86_3dnow", Ver, "_", Mn)) VR64:$src1, VR64:$src2))]>,
Sched<[sched]>;		Sched<[sched]>;
def rm : I3DNow_binop<opc, MRMSrcMem, (ins VR64:$src1, i64mem:$src2), Mn,		def rm : I3DNow_binop<opc, MRMSrcMem, (ins VR64:$src1, i64mem:$src2), Mn,
[(set VR64:$dst, (!cast<Intrinsic>(		[(set VR64:$dst, (!cast<Intrinsic>(
!strconcat("int_x86_3dnow", Ver, "_", Mn)) VR64:$src1,		!strconcat("int_x86_3dnow", Ver, "_", Mn)) VR64:$src1,
(bitconvert (load_mmx addr:$src2))))]>,		(bitconvert (load_mmx addr:$src2))))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass I3DNow_conv_rm_int<bits<8> opc, string Mn,		multiclass I3DNow_conv_rm_int<bits<8> opc, string Mn,
X86FoldableSchedWrite sched, string Ver = ""> {		X86FoldableSchedWrite sched, string Ver = ""> {
def rr : I3DNow_conv<opc, MRMSrcReg, (ins VR64:$src), Mn,		def rr : I3DNow_conv<opc, MRMSrcReg, (ins VR64:$src), Mn,
[(set VR64:$dst, (!cast<Intrinsic>(		[(set VR64:$dst, (!cast<Intrinsic>(
!strconcat("int_x86_3dnow", Ver, "_", Mn)) VR64:$src))]>,		!strconcat("int_x86_3dnow", Ver, "_", Mn)) VR64:$src))]>,
Sched<[sched]>;		Sched<[sched]>;
def rm : I3DNow_conv<opc, MRMSrcMem, (ins i64mem:$src), Mn,		def rm : I3DNow_conv<opc, MRMSrcMem, (ins i64mem:$src), Mn,
[(set VR64:$dst, (!cast<Intrinsic>(		[(set VR64:$dst, (!cast<Intrinsic>(
!strconcat("int_x86_3dnow", Ver, "_", Mn))		!strconcat("int_x86_3dnow", Ver, "_", Mn))
(bitconvert (load_mmx addr:$src))))]>,		(bitconvert (load_mmx addr:$src))))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

defm PAVGUSB : I3DNow_binop_rm_int<0xBF, "pavgusb", SchedWriteVecALU.MMX, 1>;		defm PAVGUSB : I3DNow_binop_rm_int<0xBF, "pavgusb", SchedWriteVecALU.MMX, 1>;
defm PF2ID : I3DNow_conv_rm_int<0x1D, "pf2id", WriteCvtPS2I>;		defm PF2ID : I3DNow_conv_rm_int<0x1D, "pf2id", WriteCvtPS2I>;
defm PFACC : I3DNow_binop_rm_int<0xAE, "pfacc", WriteFAdd>;		defm PFACC : I3DNow_binop_rm_int<0xAE, "pfacc", WriteFAdd>;
defm PFADD : I3DNow_binop_rm_int<0x9E, "pfadd", WriteFAdd, 1>;		defm PFADD : I3DNow_binop_rm_int<0x9E, "pfadd", WriteFAdd, 1>;
defm PFCMPEQ : I3DNow_binop_rm_int<0xB0, "pfcmpeq", WriteFAdd, 1>;		defm PFCMPEQ : I3DNow_binop_rm_int<0xB0, "pfcmpeq", WriteFAdd, 1>;
defm PFCMPGE : I3DNow_binop_rm_int<0x90, "pfcmpge", WriteFAdd>;		defm PFCMPGE : I3DNow_binop_rm_int<0x90, "pfcmpge", WriteFAdd>;
▲ Show 20 Lines • Show All 49 Lines • Show Last 20 Lines

lib/Target/X86/X86InstrAVX512.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 518 Lines • ▼ Show 20 Lines	defm rm : AVX512_maskable_split<Opcode, MRMSrcMem, To, (outs To.RC:$dst),
"$src3, $src2, $src1", "$src1, $src2, $src3",		"$src3, $src2, $src1", "$src1, $src2, $src3",
(vinsert_insert:$src3 (To.VT To.RC:$src1),		(vinsert_insert:$src3 (To.VT To.RC:$src1),
(From.VT (bitconvert (From.LdFrag addr:$src2))),		(From.VT (bitconvert (From.LdFrag addr:$src2))),
(iPTR imm)),		(iPTR imm)),
(vinsert_for_mask:$src3 (To.VT To.RC:$src1),		(vinsert_for_mask:$src3 (To.VT To.RC:$src1),
(From.VT (bitconvert (From.LdFrag addr:$src2))),		(From.VT (bitconvert (From.LdFrag addr:$src2))),
(iPTR imm))>, AVX512AIi8Base, EVEX_4V,		(iPTR imm))>, AVX512AIi8Base, EVEX_4V,
EVEX_CD8<From.EltSize, From.CD8TupleForm>,		EVEX_CD8<From.EltSize, From.CD8TupleForm>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

// Passes the same pattern operator for masked and unmasked ops.		// Passes the same pattern operator for masked and unmasked ops.
multiclass vinsert_for_size<int Opcode, X86VectorVTInfo From,		multiclass vinsert_for_size<int Opcode, X86VectorVTInfo From,
X86VectorVTInfo To,		X86VectorVTInfo To,
SDPatternOperator vinsert_insert,		SDPatternOperator vinsert_insert,
X86FoldableSchedWrite sched> :		X86FoldableSchedWrite sched> :
▲ Show 20 Lines • Show All 242 Lines • ▼ Show 20 Lines	def VINSERTPSZrr : AVX512AIi8<0x21, MRMSrcReg, (outs VR128X:$dst),
EVEX_4V, Sched<[SchedWriteFShuffle.XMM]>;		EVEX_4V, Sched<[SchedWriteFShuffle.XMM]>;
def VINSERTPSZrm: AVX512AIi8<0x21, MRMSrcMem, (outs VR128X:$dst),		def VINSERTPSZrm: AVX512AIi8<0x21, MRMSrcMem, (outs VR128X:$dst),
(ins VR128X:$src1, f32mem:$src2, u8imm:$src3),		(ins VR128X:$src1, f32mem:$src2, u8imm:$src3),
"vinsertps\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",		"vinsertps\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",
[(set VR128X:$dst, (X86insertps VR128X:$src1,		[(set VR128X:$dst, (X86insertps VR128X:$src1,
(v4f32 (scalar_to_vector (loadf32 addr:$src2))),		(v4f32 (scalar_to_vector (loadf32 addr:$src2))),
imm:$src3))]>,		imm:$src3))]>,
EVEX_4V, EVEX_CD8<32, CD8VT1>,		EVEX_4V, EVEX_CD8<32, CD8VT1>,
Sched<[SchedWriteFShuffle.XMM.Folded, ReadAfterLd]>;		Sched<[SchedWriteFShuffle.XMM.Folded, SchedWriteFShuffle.XMM.ReadAfterFold]>;
}		}

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// AVX-512 VECTOR EXTRACT		// AVX-512 VECTOR EXTRACT
//---		//---

// Supports two different pattern operators for mask and unmasked ops. Allows		// Supports two different pattern operators for mask and unmasked ops. Allows
// null_frag to be passed for one.		// null_frag to be passed for one.
▲ Show 20 Lines • Show All 942 Lines • ▼ Show 20 Lines	defm rr: AVX512_maskable_3src_cast<opc, MRMSrcReg, _, IdxVT, (outs _.RC:$dst),
EVEX_4V, AVX5128IBase, Sched<[sched]>;		EVEX_4V, AVX5128IBase, Sched<[sched]>;

let mayLoad = 1 in		let mayLoad = 1 in
defm rm: AVX512_maskable_3src_cast<opc, MRMSrcMem, _, IdxVT, (outs _.RC:$dst),		defm rm: AVX512_maskable_3src_cast<opc, MRMSrcMem, _, IdxVT, (outs _.RC:$dst),
(ins _.RC:$src2, _.MemOp:$src3),		(ins _.RC:$src2, _.MemOp:$src3),
OpcodeStr, "$src3, $src2", "$src2, $src3",		OpcodeStr, "$src3, $src2", "$src2, $src3",
(_.VT (X86VPermt2 _.RC:$src2, IdxVT.RC:$src1,		(_.VT (X86VPermt2 _.RC:$src2, IdxVT.RC:$src1,
(_.VT (bitconvert (_.LdFrag addr:$src3))))), 1>,		(_.VT (bitconvert (_.LdFrag addr:$src3))))), 1>,
EVEX_4V, AVX5128IBase, Sched<[sched.Folded, ReadAfterLd]>;		EVEX_4V, AVX5128IBase, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

multiclass avx512_perm_i_mb<bits<8> opc, string OpcodeStr,		multiclass avx512_perm_i_mb<bits<8> opc, string OpcodeStr,
X86FoldableSchedWrite sched,		X86FoldableSchedWrite sched,
X86VectorVTInfo _, X86VectorVTInfo IdxVT> {		X86VectorVTInfo _, X86VectorVTInfo IdxVT> {
let Constraints = "$src1 = $dst", ExeDomain = _.ExeDomain,		let Constraints = "$src1 = $dst", ExeDomain = _.ExeDomain,
hasSideEffects = 0, mayLoad = 1 in		hasSideEffects = 0, mayLoad = 1 in
defm rmb: AVX512_maskable_3src_cast<opc, MRMSrcMem, _, IdxVT, (outs _.RC:$dst),		defm rmb: AVX512_maskable_3src_cast<opc, MRMSrcMem, _, IdxVT, (outs _.RC:$dst),
(ins _.RC:$src2, _.ScalarMemOp:$src3),		(ins _.RC:$src2, _.ScalarMemOp:$src3),
OpcodeStr, !strconcat("${src3}", _.BroadcastStr,", $src2"),		OpcodeStr, !strconcat("${src3}", _.BroadcastStr,", $src2"),
!strconcat("$src2, ${src3}", _.BroadcastStr ),		!strconcat("$src2, ${src3}", _.BroadcastStr ),
(_.VT (X86VPermt2 _.RC:$src2,		(_.VT (X86VPermt2 _.RC:$src2,
IdxVT.RC:$src1,(_.VT (X86VBroadcast (_.ScalarLdFrag addr:$src3))))), 1>,		IdxVT.RC:$src1,(_.VT (X86VBroadcast (_.ScalarLdFrag addr:$src3))))), 1>,
AVX5128IBase, EVEX_4V, EVEX_B,		AVX5128IBase, EVEX_4V, EVEX_B,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass avx512_perm_i_sizes<bits<8> opc, string OpcodeStr,		multiclass avx512_perm_i_sizes<bits<8> opc, string OpcodeStr,
X86FoldableSchedWrite sched,		X86FoldableSchedWrite sched,
AVX512VLVectorVTInfo VTInfo,		AVX512VLVectorVTInfo VTInfo,
AVX512VLVectorVTInfo ShuffleMask> {		AVX512VLVectorVTInfo ShuffleMask> {
defm NAME: avx512_perm_i<opc, OpcodeStr, sched, VTInfo.info512,		defm NAME: avx512_perm_i<opc, OpcodeStr, sched, VTInfo.info512,
ShuffleMask.info512>,		ShuffleMask.info512>,
▲ Show 20 Lines • Show All 85 Lines • ▼ Show 20 Lines	defm rr: AVX512_maskable_3src<opc, MRMSrcReg, _, (outs _.RC:$dst),
(_.VT (X86VPermt2 _.RC:$src1, IdxVT.RC:$src2, _.RC:$src3)), 1>,		(_.VT (X86VPermt2 _.RC:$src1, IdxVT.RC:$src2, _.RC:$src3)), 1>,
EVEX_4V, AVX5128IBase, Sched<[sched]>;		EVEX_4V, AVX5128IBase, Sched<[sched]>;

defm rm: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rm: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins IdxVT.RC:$src2, _.MemOp:$src3),		(ins IdxVT.RC:$src2, _.MemOp:$src3),
OpcodeStr, "$src3, $src2", "$src2, $src3",		OpcodeStr, "$src3, $src2", "$src2, $src3",
(_.VT (X86VPermt2 _.RC:$src1, IdxVT.RC:$src2,		(_.VT (X86VPermt2 _.RC:$src1, IdxVT.RC:$src2,
(bitconvert (_.LdFrag addr:$src3)))), 1>,		(bitconvert (_.LdFrag addr:$src3)))), 1>,
EVEX_4V, AVX5128IBase, Sched<[sched.Folded, ReadAfterLd]>;		EVEX_4V, AVX5128IBase, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}
multiclass avx512_perm_t_mb<bits<8> opc, string OpcodeStr,		multiclass avx512_perm_t_mb<bits<8> opc, string OpcodeStr,
X86FoldableSchedWrite sched,		X86FoldableSchedWrite sched,
X86VectorVTInfo _, X86VectorVTInfo IdxVT> {		X86VectorVTInfo _, X86VectorVTInfo IdxVT> {
let Constraints = "$src1 = $dst", ExeDomain = _.ExeDomain in		let Constraints = "$src1 = $dst", ExeDomain = _.ExeDomain in
defm rmb: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmb: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins IdxVT.RC:$src2, _.ScalarMemOp:$src3),		(ins IdxVT.RC:$src2, _.ScalarMemOp:$src3),
OpcodeStr, !strconcat("${src3}", _.BroadcastStr,", $src2"),		OpcodeStr, !strconcat("${src3}", _.BroadcastStr,", $src2"),
!strconcat("$src2, ${src3}", _.BroadcastStr ),		!strconcat("$src2, ${src3}", _.BroadcastStr ),
(_.VT (X86VPermt2 _.RC:$src1,		(_.VT (X86VPermt2 _.RC:$src1,
IdxVT.RC:$src2,(_.VT (X86VBroadcast (_.ScalarLdFrag addr:$src3))))), 1>,		IdxVT.RC:$src2,(_.VT (X86VBroadcast (_.ScalarLdFrag addr:$src3))))), 1>,
AVX5128IBase, EVEX_4V, EVEX_B,		AVX5128IBase, EVEX_4V, EVEX_B,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass avx512_perm_t_sizes<bits<8> opc, string OpcodeStr,		multiclass avx512_perm_t_sizes<bits<8> opc, string OpcodeStr,
X86FoldableSchedWrite sched,		X86FoldableSchedWrite sched,
AVX512VLVectorVTInfo VTInfo,		AVX512VLVectorVTInfo VTInfo,
AVX512VLVectorVTInfo ShuffleMask> {		AVX512VLVectorVTInfo ShuffleMask> {
defm NAME: avx512_perm_t<opc, OpcodeStr, sched, VTInfo.info512,		defm NAME: avx512_perm_t<opc, OpcodeStr, sched, VTInfo.info512,
ShuffleMask.info512>,		ShuffleMask.info512>,
▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines	def rrkz : AVX5128I<opc, MRMSrcReg, (outs _.RC:$dst),
"\t{$src2, $src1, ${dst} {${mask}} {z}\|${dst} {${mask}} {z}, $src1, $src2}"),		"\t{$src2, $src1, ${dst} {${mask}} {z}\|${dst} {${mask}} {z}, $src1, $src2}"),
[]>, EVEX_4V, EVEX_KZ, Sched<[sched]>, NotMemoryFoldable;		[]>, EVEX_4V, EVEX_KZ, Sched<[sched]>, NotMemoryFoldable;
let mayLoad = 1 in {		let mayLoad = 1 in {
def rm : AVX5128I<opc, MRMSrcMem, (outs _.RC:$dst),		def rm : AVX5128I<opc, MRMSrcMem, (outs _.RC:$dst),
(ins _.RC:$src1, _.MemOp:$src2),		(ins _.RC:$src1, _.MemOp:$src2),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src2, $src1, ${dst}\|${dst}, $src1, $src2}"),		"\t{$src2, $src1, ${dst}\|${dst}, $src1, $src2}"),
[]>, EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,		[]>, EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
def rmk : AVX5128I<opc, MRMSrcMem, (outs _.RC:$dst),		def rmk : AVX5128I<opc, MRMSrcMem, (outs _.RC:$dst),
(ins _.KRCWM:$mask, _.RC:$src1, _.MemOp:$src2),		(ins _.KRCWM:$mask, _.RC:$src1, _.MemOp:$src2),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src2, $src1, ${dst} {${mask}}\|${dst} {${mask}}, $src1, $src2}"),		"\t{$src2, $src1, ${dst} {${mask}}\|${dst} {${mask}}, $src1, $src2}"),
[]>, EVEX_4V, EVEX_K, EVEX_CD8<_.EltSize, CD8VF>,		[]>, EVEX_4V, EVEX_K, EVEX_CD8<_.EltSize, CD8VF>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
def rmkz : AVX5128I<opc, MRMSrcMem, (outs _.RC:$dst),		def rmkz : AVX5128I<opc, MRMSrcMem, (outs _.RC:$dst),
(ins _.KRCWM:$mask, _.RC:$src1, _.MemOp:$src2),		(ins _.KRCWM:$mask, _.RC:$src1, _.MemOp:$src2),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src2, $src1, ${dst} {${mask}} {z}\|${dst} {${mask}} {z}, $src1, $src2}"),		"\t{$src2, $src1, ${dst} {${mask}} {z}\|${dst} {${mask}} {z}, $src1, $src2}"),
[]>, EVEX_4V, EVEX_KZ, EVEX_CD8<_.EltSize, CD8VF>,		[]>, EVEX_4V, EVEX_KZ, EVEX_CD8<_.EltSize, CD8VF>,
Sched<[sched.Folded, ReadAfterLd]>, NotMemoryFoldable;		Sched<[sched.Folded, sched.ReadAfterFold]>, NotMemoryFoldable;
}		}
}		}
}		}
multiclass WriteFVarBlendask_rmb<bits<8> opc, string OpcodeStr,		multiclass WriteFVarBlendask_rmb<bits<8> opc, string OpcodeStr,
X86FoldableSchedWrite sched, X86VectorVTInfo _> {		X86FoldableSchedWrite sched, X86VectorVTInfo _> {
let mayLoad = 1, hasSideEffects = 0 in {		let mayLoad = 1, hasSideEffects = 0 in {
def rmbk : AVX5128I<opc, MRMSrcMem, (outs _.RC:$dst),		def rmbk : AVX5128I<opc, MRMSrcMem, (outs _.RC:$dst),
(ins _.KRCWM:$mask, _.RC:$src1, _.ScalarMemOp:$src2),		(ins _.KRCWM:$mask, _.RC:$src1, _.ScalarMemOp:$src2),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{${src2}", _.BroadcastStr, ", $src1, $dst {${mask}}\|",		"\t{${src2}", _.BroadcastStr, ", $src1, $dst {${mask}}\|",
"$dst {${mask}}, $src1, ${src2}", _.BroadcastStr, "}"), []>,		"$dst {${mask}}, $src1, ${src2}", _.BroadcastStr, "}"), []>,
EVEX_4V, EVEX_K, EVEX_B, EVEX_CD8<_.EltSize, CD8VF>,		EVEX_4V, EVEX_K, EVEX_B, EVEX_CD8<_.EltSize, CD8VF>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;

def rmbkz : AVX5128I<opc, MRMSrcMem, (outs _.RC:$dst),		def rmbkz : AVX5128I<opc, MRMSrcMem, (outs _.RC:$dst),
(ins _.KRCWM:$mask, _.RC:$src1, _.ScalarMemOp:$src2),		(ins _.KRCWM:$mask, _.RC:$src1, _.ScalarMemOp:$src2),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{${src2}", _.BroadcastStr, ", $src1, $dst {${mask}} {z}\|",		"\t{${src2}", _.BroadcastStr, ", $src1, $dst {${mask}} {z}\|",
"$dst {${mask}} {z}, $src1, ${src2}", _.BroadcastStr, "}"), []>,		"$dst {${mask}} {z}, $src1, ${src2}", _.BroadcastStr, "}"), []>,
EVEX_4V, EVEX_KZ, EVEX_B, EVEX_CD8<_.EltSize, CD8VF>,		EVEX_4V, EVEX_KZ, EVEX_B, EVEX_CD8<_.EltSize, CD8VF>,
Sched<[sched.Folded, ReadAfterLd]>, NotMemoryFoldable;		Sched<[sched.Folded, sched.ReadAfterFold]>, NotMemoryFoldable;

def rmb : AVX5128I<opc, MRMSrcMem, (outs _.RC:$dst),		def rmb : AVX5128I<opc, MRMSrcMem, (outs _.RC:$dst),
(ins _.RC:$src1, _.ScalarMemOp:$src2),		(ins _.RC:$src1, _.ScalarMemOp:$src2),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{${src2}", _.BroadcastStr, ", $src1, $dst\|",		"\t{${src2}", _.BroadcastStr, ", $src1, $dst\|",
"$dst, $src1, ${src2}", _.BroadcastStr, "}"), []>,		"$dst, $src1, ${src2}", _.BroadcastStr, "}"), []>,
EVEX_4V, EVEX_B, EVEX_CD8<_.EltSize, CD8VF>,		EVEX_4V, EVEX_B, EVEX_CD8<_.EltSize, CD8VF>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

multiclass blendmask_dq<bits<8> opc, string OpcodeStr, X86SchedWriteWidths sched,		multiclass blendmask_dq<bits<8> opc, string OpcodeStr, X86SchedWriteWidths sched,
AVX512VLVectorVTInfo VTInfo> {		AVX512VLVectorVTInfo VTInfo> {
defm Z : WriteFVarBlendask<opc, OpcodeStr, sched.ZMM, VTInfo.info512>,		defm Z : WriteFVarBlendask<opc, OpcodeStr, sched.ZMM, VTInfo.info512>,
WriteFVarBlendask_rmb<opc, OpcodeStr, sched.ZMM, VTInfo.info512>,		WriteFVarBlendask_rmb<opc, OpcodeStr, sched.ZMM, VTInfo.info512>,
EVEX_V512;		EVEX_V512;
▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines	multiclass avx512_cmp_scalar<X86VectorVTInfo _, SDNode OpNode, SDNode OpNodeRnd,
let mayLoad = 1 in		let mayLoad = 1 in
defm rm_Int : AVX512_maskable_cmp<0xC2, MRMSrcMem, _,		defm rm_Int : AVX512_maskable_cmp<0xC2, MRMSrcMem, _,
(outs _.KRC:$dst),		(outs _.KRC:$dst),
(ins _.RC:$src1, _.IntScalarMemOp:$src2, AVXCC:$cc),		(ins _.RC:$src1, _.IntScalarMemOp:$src2, AVXCC:$cc),
"vcmp${cc}"#_.Suffix,		"vcmp${cc}"#_.Suffix,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(OpNode (_.VT _.RC:$src1), _.ScalarIntMemCPat:$src2,		(OpNode (_.VT _.RC:$src1), _.ScalarIntMemCPat:$src2,
imm:$cc)>, EVEX_4V, EVEX_CD8<_.EltSize, CD8VT1>,		imm:$cc)>, EVEX_4V, EVEX_CD8<_.EltSize, CD8VT1>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;

defm rrb_Int : AVX512_maskable_cmp<0xC2, MRMSrcReg, _,		defm rrb_Int : AVX512_maskable_cmp<0xC2, MRMSrcReg, _,
(outs _.KRC:$dst),		(outs _.KRC:$dst),
(ins _.RC:$src1, _.RC:$src2, AVXCC:$cc),		(ins _.RC:$src1, _.RC:$src2, AVXCC:$cc),
"vcmp${cc}"#_.Suffix,		"vcmp${cc}"#_.Suffix,
"{sae}, $src2, $src1", "$src1, $src2, {sae}",		"{sae}, $src2, $src1", "$src1, $src2, {sae}",
(OpNodeRnd (_.VT _.RC:$src1),		(OpNodeRnd (_.VT _.RC:$src1),
(_.VT _.RC:$src2),		(_.VT _.RC:$src2),
Show All 10 Lines	defm rri_alt : AVX512_maskable_cmp_alt<0xC2, MRMSrcReg, _,
Sched<[sched]>, NotMemoryFoldable;		Sched<[sched]>, NotMemoryFoldable;
let mayLoad = 1 in		let mayLoad = 1 in
defm rmi_alt : AVX512_maskable_cmp_alt<0xC2, MRMSrcMem, _,		defm rmi_alt : AVX512_maskable_cmp_alt<0xC2, MRMSrcMem, _,
(outs _.KRC:$dst),		(outs _.KRC:$dst),
(ins _.RC:$src1, _.ScalarMemOp:$src2, u8imm:$cc),		(ins _.RC:$src1, _.ScalarMemOp:$src2, u8imm:$cc),
"vcmp"#_.Suffix,		"vcmp"#_.Suffix,
"$cc, $src2, $src1", "$src1, $src2, $cc">,		"$cc, $src2, $src1", "$src1, $src2, $cc">,
EVEX_4V, EVEX_CD8<_.EltSize, CD8VT1>,		EVEX_4V, EVEX_CD8<_.EltSize, CD8VT1>,
Sched<[sched.Folded, ReadAfterLd]>, NotMemoryFoldable;		Sched<[sched.Folded, sched.ReadAfterFold]>, NotMemoryFoldable;

defm rrb_alt : AVX512_maskable_cmp_alt<0xC2, MRMSrcReg, _,		defm rrb_alt : AVX512_maskable_cmp_alt<0xC2, MRMSrcReg, _,
(outs _.KRC:$dst),		(outs _.KRC:$dst),
(ins _.RC:$src1, _.RC:$src2, u8imm:$cc),		(ins _.RC:$src1, _.RC:$src2, u8imm:$cc),
"vcmp"#_.Suffix,		"vcmp"#_.Suffix,
"$cc, {sae}, $src2, $src1","$src1, $src2, {sae}, $cc">,		"$cc, {sae}, $src2, $src1","$src1, $src2, {sae}, $cc">,
EVEX_4V, EVEX_B, Sched<[sched]>, NotMemoryFoldable;		EVEX_4V, EVEX_B, Sched<[sched]>, NotMemoryFoldable;
}// let isAsmParserOnly = 1, hasSideEffects = 0		}// let isAsmParserOnly = 1, hasSideEffects = 0
Show All 12 Lines	def rm : AVX512Ii8<0xC2, MRMSrcMem,
(outs _.KRC:$dst),		(outs _.KRC:$dst),
(ins _.FRC:$src1, _.ScalarMemOp:$src2, AVXCC:$cc),		(ins _.FRC:$src1, _.ScalarMemOp:$src2, AVXCC:$cc),
!strconcat("vcmp${cc}", _.Suffix,		!strconcat("vcmp${cc}", _.Suffix,
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set _.KRC:$dst, (OpNode _.FRC:$src1,		[(set _.KRC:$dst, (OpNode _.FRC:$src1,
(_.ScalarLdFrag addr:$src2),		(_.ScalarLdFrag addr:$src2),
imm:$cc))]>,		imm:$cc))]>,
EVEX_4V, EVEX_CD8<_.EltSize, CD8VT1>,		EVEX_4V, EVEX_CD8<_.EltSize, CD8VT1>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

let Predicates = [HasAVX512] in {		let Predicates = [HasAVX512] in {
let ExeDomain = SSEPackedSingle in		let ExeDomain = SSEPackedSingle in
defm VCMPSSZ : avx512_cmp_scalar<f32x_info, X86cmpms, X86cmpmsRnd,		defm VCMPSSZ : avx512_cmp_scalar<f32x_info, X86cmpms, X86cmpmsRnd,
SchedWriteFCmp.Scl>, AVX512XSIi8Base;		SchedWriteFCmp.Scl>, AVX512XSIi8Base;
let ExeDomain = SSEPackedDouble in		let ExeDomain = SSEPackedDouble in
Show All 10 Lines	def rr : AVX512BI<opc, MRMSrcReg,
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set _.KRC:$dst, (OpNode (_.VT _.RC:$src1), (_.VT _.RC:$src2)))]>,		[(set _.KRC:$dst, (OpNode (_.VT _.RC:$src1), (_.VT _.RC:$src2)))]>,
EVEX_4V, Sched<[sched]>;		EVEX_4V, Sched<[sched]>;
def rm : AVX512BI<opc, MRMSrcMem,		def rm : AVX512BI<opc, MRMSrcMem,
(outs _.KRC:$dst), (ins _.RC:$src1, _.MemOp:$src2),		(outs _.KRC:$dst), (ins _.RC:$src1, _.MemOp:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set _.KRC:$dst, (OpNode (_.VT _.RC:$src1),		[(set _.KRC:$dst, (OpNode (_.VT _.RC:$src1),
(_.VT (bitconvert (_.LdFrag addr:$src2)))))]>,		(_.VT (bitconvert (_.LdFrag addr:$src2)))))]>,
EVEX_4V, Sched<[sched.Folded, ReadAfterLd]>;		EVEX_4V, Sched<[sched.Folded, sched.ReadAfterFold]>;
let isCommutable = IsCommutable in		let isCommutable = IsCommutable in
def rrk : AVX512BI<opc, MRMSrcReg,		def rrk : AVX512BI<opc, MRMSrcReg,
(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1, _.RC:$src2),		(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1, _.RC:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst {${mask}}\|",		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst {${mask}}\|",
"$dst {${mask}}, $src1, $src2}"),		"$dst {${mask}}, $src1, $src2}"),
[(set _.KRC:$dst, (and _.KRCWM:$mask,		[(set _.KRC:$dst, (and _.KRCWM:$mask,
(OpNode (_.VT _.RC:$src1), (_.VT _.RC:$src2))))]>,		(OpNode (_.VT _.RC:$src1), (_.VT _.RC:$src2))))]>,
EVEX_4V, EVEX_K, Sched<[sched]>;		EVEX_4V, EVEX_K, Sched<[sched]>;
def rmk : AVX512BI<opc, MRMSrcMem,		def rmk : AVX512BI<opc, MRMSrcMem,
(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1, _.MemOp:$src2),		(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1, _.MemOp:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst {${mask}}\|",		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst {${mask}}\|",
"$dst {${mask}}, $src1, $src2}"),		"$dst {${mask}}, $src1, $src2}"),
[(set _.KRC:$dst, (and _.KRCWM:$mask,		[(set _.KRC:$dst, (and _.KRCWM:$mask,
(OpNode (_.VT _.RC:$src1),		(OpNode (_.VT _.RC:$src1),
(_.VT (bitconvert		(_.VT (bitconvert
(_.LdFrag addr:$src2))))))]>,		(_.LdFrag addr:$src2))))))]>,
EVEX_4V, EVEX_K, Sched<[sched.Folded, ReadAfterLd]>;		EVEX_4V, EVEX_K, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass avx512_icmp_packed_rmb<bits<8> opc, string OpcodeStr, PatFrag OpNode,		multiclass avx512_icmp_packed_rmb<bits<8> opc, string OpcodeStr, PatFrag OpNode,
X86FoldableSchedWrite sched, X86VectorVTInfo _,		X86FoldableSchedWrite sched, X86VectorVTInfo _,
bit IsCommutable> :		bit IsCommutable> :
avx512_icmp_packed<opc, OpcodeStr, OpNode, sched, _, IsCommutable> {		avx512_icmp_packed<opc, OpcodeStr, OpNode, sched, _, IsCommutable> {
def rmb : AVX512BI<opc, MRMSrcMem,		def rmb : AVX512BI<opc, MRMSrcMem,
(outs _.KRC:$dst), (ins _.RC:$src1, _.ScalarMemOp:$src2),		(outs _.KRC:$dst), (ins _.RC:$src1, _.ScalarMemOp:$src2),
!strconcat(OpcodeStr, "\t{${src2}", _.BroadcastStr, ", $src1, $dst",		!strconcat(OpcodeStr, "\t{${src2}", _.BroadcastStr, ", $src1, $dst",
"\|$dst, $src1, ${src2}", _.BroadcastStr, "}"),		"\|$dst, $src1, ${src2}", _.BroadcastStr, "}"),
[(set _.KRC:$dst, (OpNode (_.VT _.RC:$src1),		[(set _.KRC:$dst, (OpNode (_.VT _.RC:$src1),
(X86VBroadcast (_.ScalarLdFrag addr:$src2))))]>,		(X86VBroadcast (_.ScalarLdFrag addr:$src2))))]>,
EVEX_4V, EVEX_B, Sched<[sched.Folded, ReadAfterLd]>;		EVEX_4V, EVEX_B, Sched<[sched.Folded, sched.ReadAfterFold]>;
def rmbk : AVX512BI<opc, MRMSrcMem,		def rmbk : AVX512BI<opc, MRMSrcMem,
(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1,		(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1,
_.ScalarMemOp:$src2),		_.ScalarMemOp:$src2),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{${src2}", _.BroadcastStr, ", $src1, $dst {${mask}}\|",		"\t{${src2}", _.BroadcastStr, ", $src1, $dst {${mask}}\|",
"$dst {${mask}}, $src1, ${src2}", _.BroadcastStr, "}"),		"$dst {${mask}}, $src1, ${src2}", _.BroadcastStr, "}"),
[(set _.KRC:$dst, (and _.KRCWM:$mask,		[(set _.KRC:$dst, (and _.KRCWM:$mask,
(OpNode (_.VT _.RC:$src1),		(OpNode (_.VT _.RC:$src1),
(X86VBroadcast		(X86VBroadcast
(_.ScalarLdFrag addr:$src2)))))]>,		(_.ScalarLdFrag addr:$src2)))))]>,
EVEX_4V, EVEX_K, EVEX_B,		EVEX_4V, EVEX_K, EVEX_B,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass avx512_icmp_packed_vl<bits<8> opc, string OpcodeStr, PatFrag OpNode,		multiclass avx512_icmp_packed_vl<bits<8> opc, string OpcodeStr, PatFrag OpNode,
X86SchedWriteWidths sched,		X86SchedWriteWidths sched,
AVX512VLVectorVTInfo VTInfo, Predicate prd,		AVX512VLVectorVTInfo VTInfo, Predicate prd,
bit IsCommutable = 0> {		bit IsCommutable = 0> {
let Predicates = [prd] in		let Predicates = [prd] in
defm Z : avx512_icmp_packed<opc, OpcodeStr, OpNode, sched.ZMM,		defm Z : avx512_icmp_packed<opc, OpcodeStr, OpNode, sched.ZMM,
▲ Show 20 Lines • Show All 84 Lines • ▼ Show 20 Lines	def rmi : AVX512AIi8<opc, MRMSrcMem,
(outs _.KRC:$dst), (ins _.RC:$src1, _.MemOp:$src2, AVX512ICC:$cc),		(outs _.KRC:$dst), (ins _.RC:$src1, _.MemOp:$src2, AVX512ICC:$cc),
!strconcat("vpcmp${cc}", Suffix,		!strconcat("vpcmp${cc}", Suffix,
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set _.KRC:$dst, (_.KVT		[(set _.KRC:$dst, (_.KVT
(Frag:$cc		(Frag:$cc
(_.VT _.RC:$src1),		(_.VT _.RC:$src1),
(_.VT (bitconvert (_.LdFrag addr:$src2))),		(_.VT (bitconvert (_.LdFrag addr:$src2))),
cond)))]>,		cond)))]>,
EVEX_4V, Sched<[sched.Folded, ReadAfterLd]>;		EVEX_4V, Sched<[sched.Folded, sched.ReadAfterFold]>;
let isCommutable = 1 in		let isCommutable = 1 in
def rrik : AVX512AIi8<opc, MRMSrcReg,		def rrik : AVX512AIi8<opc, MRMSrcReg,
(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1, _.RC:$src2,		(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1, _.RC:$src2,
AVX512ICC:$cc),		AVX512ICC:$cc),
!strconcat("vpcmp${cc}", Suffix,		!strconcat("vpcmp${cc}", Suffix,
"\t{$src2, $src1, $dst {${mask}}\|",		"\t{$src2, $src1, $dst {${mask}}\|",
"$dst {${mask}}, $src1, $src2}"),		"$dst {${mask}}, $src1, $src2}"),
[(set _.KRC:$dst, (and _.KRCWM:$mask,		[(set _.KRC:$dst, (and _.KRCWM:$mask,
Show All 9 Lines	def rmik : AVX512AIi8<opc, MRMSrcMem,
"$dst {${mask}}, $src1, $src2}"),		"$dst {${mask}}, $src1, $src2}"),
[(set _.KRC:$dst, (and _.KRCWM:$mask,		[(set _.KRC:$dst, (and _.KRCWM:$mask,
(_.KVT		(_.KVT
(Frag:$cc		(Frag:$cc
(_.VT _.RC:$src1),		(_.VT _.RC:$src1),
(_.VT (bitconvert		(_.VT (bitconvert
(_.LdFrag addr:$src2))),		(_.LdFrag addr:$src2))),
cond))))]>,		cond))))]>,
EVEX_4V, EVEX_K, Sched<[sched.Folded, ReadAfterLd]>;		EVEX_4V, EVEX_K, Sched<[sched.Folded, sched.ReadAfterFold]>;

// Accept explicit immediate argument form instead of comparison code.		// Accept explicit immediate argument form instead of comparison code.
let isAsmParserOnly = 1, hasSideEffects = 0 in {		let isAsmParserOnly = 1, hasSideEffects = 0 in {
def rri_alt : AVX512AIi8<opc, MRMSrcReg,		def rri_alt : AVX512AIi8<opc, MRMSrcReg,
(outs _.KRC:$dst), (ins _.RC:$src1, _.RC:$src2, u8imm:$cc),		(outs _.KRC:$dst), (ins _.RC:$src1, _.RC:$src2, u8imm:$cc),
!strconcat("vpcmp", Suffix, "\t{$cc, $src2, $src1, $dst\|",		!strconcat("vpcmp", Suffix, "\t{$cc, $src2, $src1, $dst\|",
"$dst, $src1, $src2, $cc}"), []>,		"$dst, $src1, $src2, $cc}"), []>,
EVEX_4V, Sched<[sched]>, NotMemoryFoldable;		EVEX_4V, Sched<[sched]>, NotMemoryFoldable;
let mayLoad = 1 in		let mayLoad = 1 in
def rmi_alt : AVX512AIi8<opc, MRMSrcMem,		def rmi_alt : AVX512AIi8<opc, MRMSrcMem,
(outs _.KRC:$dst), (ins _.RC:$src1, _.MemOp:$src2, u8imm:$cc),		(outs _.KRC:$dst), (ins _.RC:$src1, _.MemOp:$src2, u8imm:$cc),
!strconcat("vpcmp", Suffix, "\t{$cc, $src2, $src1, $dst\|",		!strconcat("vpcmp", Suffix, "\t{$cc, $src2, $src1, $dst\|",
"$dst, $src1, $src2, $cc}"), []>,		"$dst, $src1, $src2, $cc}"), []>,
EVEX_4V, Sched<[sched.Folded, ReadAfterLd]>, NotMemoryFoldable;		EVEX_4V, Sched<[sched.Folded, sched.ReadAfterFold]>, NotMemoryFoldable;
def rrik_alt : AVX512AIi8<opc, MRMSrcReg,		def rrik_alt : AVX512AIi8<opc, MRMSrcReg,
(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1, _.RC:$src2,		(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1, _.RC:$src2,
u8imm:$cc),		u8imm:$cc),
!strconcat("vpcmp", Suffix,		!strconcat("vpcmp", Suffix,
"\t{$cc, $src2, $src1, $dst {${mask}}\|",		"\t{$cc, $src2, $src1, $dst {${mask}}\|",
"$dst {${mask}}, $src1, $src2, $cc}"), []>,		"$dst {${mask}}, $src1, $src2, $cc}"), []>,
EVEX_4V, EVEX_K, Sched<[sched]>, NotMemoryFoldable;		EVEX_4V, EVEX_K, Sched<[sched]>, NotMemoryFoldable;
let mayLoad = 1 in		let mayLoad = 1 in
def rmik_alt : AVX512AIi8<opc, MRMSrcMem,		def rmik_alt : AVX512AIi8<opc, MRMSrcMem,
(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1, _.MemOp:$src2,		(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1, _.MemOp:$src2,
u8imm:$cc),		u8imm:$cc),
!strconcat("vpcmp", Suffix,		!strconcat("vpcmp", Suffix,
"\t{$cc, $src2, $src1, $dst {${mask}}\|",		"\t{$cc, $src2, $src1, $dst {${mask}}\|",
"$dst {${mask}}, $src1, $src2, $cc}"), []>,		"$dst {${mask}}, $src1, $src2, $cc}"), []>,
EVEX_4V, EVEX_K, Sched<[sched.Folded, ReadAfterLd]>,		EVEX_4V, EVEX_K, Sched<[sched.Folded, sched.ReadAfterFold]>,
NotMemoryFoldable;		NotMemoryFoldable;
}		}

def : Pat<(_.KVT (CommFrag:$cc (bitconvert (_.LdFrag addr:$src2)),		def : Pat<(_.KVT (CommFrag:$cc (bitconvert (_.LdFrag addr:$src2)),
(_.VT _.RC:$src1), cond)),		(_.VT _.RC:$src1), cond)),
(!cast<Instruction>(Name#_.ZSuffix#"rmi")		(!cast<Instruction>(Name#_.ZSuffix#"rmi")
_.RC:$src1, addr:$src2, (CommFrag.OperandTransform $cc))>;		_.RC:$src1, addr:$src2, (CommFrag.OperandTransform $cc))>;

Show All 15 Lines	def rmib : AVX512AIi8<opc, MRMSrcMem,
!strconcat("vpcmp${cc}", Suffix,		!strconcat("vpcmp${cc}", Suffix,
"\t{${src2}", _.BroadcastStr, ", $src1, $dst\|",		"\t{${src2}", _.BroadcastStr, ", $src1, $dst\|",
"$dst, $src1, ${src2}", _.BroadcastStr, "}"),		"$dst, $src1, ${src2}", _.BroadcastStr, "}"),
[(set _.KRC:$dst, (_.KVT (Frag:$cc		[(set _.KRC:$dst, (_.KVT (Frag:$cc
(_.VT _.RC:$src1),		(_.VT _.RC:$src1),
(X86VBroadcast		(X86VBroadcast
(_.ScalarLdFrag addr:$src2)),		(_.ScalarLdFrag addr:$src2)),
cond)))]>,		cond)))]>,
EVEX_4V, EVEX_B, Sched<[sched.Folded, ReadAfterLd]>;		EVEX_4V, EVEX_B, Sched<[sched.Folded, sched.ReadAfterFold]>;
def rmibk : AVX512AIi8<opc, MRMSrcMem,		def rmibk : AVX512AIi8<opc, MRMSrcMem,
(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1,		(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1,
_.ScalarMemOp:$src2, AVX512ICC:$cc),		_.ScalarMemOp:$src2, AVX512ICC:$cc),
!strconcat("vpcmp${cc}", Suffix,		!strconcat("vpcmp${cc}", Suffix,
"\t{${src2}", _.BroadcastStr, ", $src1, $dst {${mask}}\|",		"\t{${src2}", _.BroadcastStr, ", $src1, $dst {${mask}}\|",
"$dst {${mask}}, $src1, ${src2}", _.BroadcastStr, "}"),		"$dst {${mask}}, $src1, ${src2}", _.BroadcastStr, "}"),
[(set _.KRC:$dst, (and _.KRCWM:$mask,		[(set _.KRC:$dst, (and _.KRCWM:$mask,
(_.KVT (Frag:$cc		(_.KVT (Frag:$cc
(_.VT _.RC:$src1),		(_.VT _.RC:$src1),
(X86VBroadcast		(X86VBroadcast
(_.ScalarLdFrag addr:$src2)),		(_.ScalarLdFrag addr:$src2)),
cond))))]>,		cond))))]>,
EVEX_4V, EVEX_K, EVEX_B, Sched<[sched.Folded, ReadAfterLd]>;		EVEX_4V, EVEX_K, EVEX_B, Sched<[sched.Folded, sched.ReadAfterFold]>;

// Accept explicit immediate argument form instead of comparison code.		// Accept explicit immediate argument form instead of comparison code.
let isAsmParserOnly = 1, hasSideEffects = 0, mayLoad = 1 in {		let isAsmParserOnly = 1, hasSideEffects = 0, mayLoad = 1 in {
def rmib_alt : AVX512AIi8<opc, MRMSrcMem,		def rmib_alt : AVX512AIi8<opc, MRMSrcMem,
(outs _.KRC:$dst), (ins _.RC:$src1, _.ScalarMemOp:$src2,		(outs _.KRC:$dst), (ins _.RC:$src1, _.ScalarMemOp:$src2,
u8imm:$cc),		u8imm:$cc),
!strconcat("vpcmp", Suffix,		!strconcat("vpcmp", Suffix,
"\t{$cc, ${src2}", _.BroadcastStr, ", $src1, $dst\|",		"\t{$cc, ${src2}", _.BroadcastStr, ", $src1, $dst\|",
"$dst, $src1, ${src2}", _.BroadcastStr, ", $cc}"), []>,		"$dst, $src1, ${src2}", _.BroadcastStr, ", $cc}"), []>,
EVEX_4V, EVEX_B, Sched<[sched.Folded, ReadAfterLd]>,		EVEX_4V, EVEX_B, Sched<[sched.Folded, sched.ReadAfterFold]>,
NotMemoryFoldable;		NotMemoryFoldable;
def rmibk_alt : AVX512AIi8<opc, MRMSrcMem,		def rmibk_alt : AVX512AIi8<opc, MRMSrcMem,
(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1,		(outs _.KRC:$dst), (ins _.KRCWM:$mask, _.RC:$src1,
_.ScalarMemOp:$src2, u8imm:$cc),		_.ScalarMemOp:$src2, u8imm:$cc),
!strconcat("vpcmp", Suffix,		!strconcat("vpcmp", Suffix,
"\t{$cc, ${src2}", _.BroadcastStr, ", $src1, $dst {${mask}}\|",		"\t{$cc, ${src2}", _.BroadcastStr, ", $src1, $dst {${mask}}\|",
"$dst {${mask}}, $src1, ${src2}", _.BroadcastStr, ", $cc}"), []>,		"$dst {${mask}}, $src1, ${src2}", _.BroadcastStr, ", $cc}"), []>,
EVEX_4V, EVEX_K, EVEX_B, Sched<[sched.Folded, ReadAfterLd]>,		EVEX_4V, EVEX_K, EVEX_B, Sched<[sched.Folded, sched.ReadAfterFold]>,
NotMemoryFoldable;		NotMemoryFoldable;
}		}

def : Pat<(_.KVT (CommFrag:$cc (X86VBroadcast (_.ScalarLdFrag addr:$src2)),		def : Pat<(_.KVT (CommFrag:$cc (X86VBroadcast (_.ScalarLdFrag addr:$src2)),
(_.VT _.RC:$src1), cond)),		(_.VT _.RC:$src1), cond)),
(!cast<Instruction>(Name#_.ZSuffix#"rmib")		(!cast<Instruction>(Name#_.ZSuffix#"rmib")
_.RC:$src1, addr:$src2, (CommFrag.OperandTransform $cc))>;		_.RC:$src1, addr:$src2, (CommFrag.OperandTransform $cc))>;

▲ Show 20 Lines • Show All 118 Lines • ▼ Show 20 Lines	multiclass avx512_vcmp_common<X86FoldableSchedWrite sched, X86VectorVTInfo _,

defm rmi : AVX512_maskable_cmp<0xC2, MRMSrcMem, _,		defm rmi : AVX512_maskable_cmp<0xC2, MRMSrcMem, _,
(outs _.KRC:$dst),(ins _.RC:$src1, _.MemOp:$src2, AVXCC:$cc),		(outs _.KRC:$dst),(ins _.RC:$src1, _.MemOp:$src2, AVXCC:$cc),
"vcmp${cc}"#_.Suffix,		"vcmp${cc}"#_.Suffix,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(X86cmpm (_.VT _.RC:$src1),		(X86cmpm (_.VT _.RC:$src1),
(_.VT (bitconvert (_.LdFrag addr:$src2))),		(_.VT (bitconvert (_.LdFrag addr:$src2))),
imm:$cc)>,		imm:$cc)>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;

defm rmbi : AVX512_maskable_cmp<0xC2, MRMSrcMem, _,		defm rmbi : AVX512_maskable_cmp<0xC2, MRMSrcMem, _,
(outs _.KRC:$dst),		(outs _.KRC:$dst),
(ins _.RC:$src1, _.ScalarMemOp:$src2, AVXCC:$cc),		(ins _.RC:$src1, _.ScalarMemOp:$src2, AVXCC:$cc),
"vcmp${cc}"#_.Suffix,		"vcmp${cc}"#_.Suffix,
"${src2}"##_.BroadcastStr##", $src1",		"${src2}"##_.BroadcastStr##", $src1",
"$src1, ${src2}"##_.BroadcastStr,		"$src1, ${src2}"##_.BroadcastStr,
(X86cmpm (_.VT _.RC:$src1),		(X86cmpm (_.VT _.RC:$src1),
(_.VT (X86VBroadcast(_.ScalarLdFrag addr:$src2))),		(_.VT (X86VBroadcast(_.ScalarLdFrag addr:$src2))),
imm:$cc)>,		imm:$cc)>,
EVEX_B, Sched<[sched.Folded, ReadAfterLd]>;		EVEX_B, Sched<[sched.Folded, sched.ReadAfterFold]>;
// Accept explicit immediate argument form instead of comparison code.		// Accept explicit immediate argument form instead of comparison code.
let isAsmParserOnly = 1, hasSideEffects = 0 in {		let isAsmParserOnly = 1, hasSideEffects = 0 in {
defm rri_alt : AVX512_maskable_cmp_alt<0xC2, MRMSrcReg, _,		defm rri_alt : AVX512_maskable_cmp_alt<0xC2, MRMSrcReg, _,
(outs _.KRC:$dst),		(outs _.KRC:$dst),
(ins _.RC:$src1, _.RC:$src2, u8imm:$cc),		(ins _.RC:$src1, _.RC:$src2, u8imm:$cc),
"vcmp"#_.Suffix,		"vcmp"#_.Suffix,
"$cc, $src2, $src1", "$src1, $src2, $cc">,		"$cc, $src2, $src1", "$src1, $src2, $cc">,
Sched<[sched]>, NotMemoryFoldable;		Sched<[sched]>, NotMemoryFoldable;

let mayLoad = 1 in {		let mayLoad = 1 in {
defm rmi_alt : AVX512_maskable_cmp_alt<0xC2, MRMSrcMem, _,		defm rmi_alt : AVX512_maskable_cmp_alt<0xC2, MRMSrcMem, _,
(outs _.KRC:$dst),		(outs _.KRC:$dst),
(ins _.RC:$src1, _.MemOp:$src2, u8imm:$cc),		(ins _.RC:$src1, _.MemOp:$src2, u8imm:$cc),
"vcmp"#_.Suffix,		"vcmp"#_.Suffix,
"$cc, $src2, $src1", "$src1, $src2, $cc">,		"$cc, $src2, $src1", "$src1, $src2, $cc">,
Sched<[sched.Folded, ReadAfterLd]>,		Sched<[sched.Folded, sched.ReadAfterFold]>,
NotMemoryFoldable;		NotMemoryFoldable;

defm rmbi_alt : AVX512_maskable_cmp_alt<0xC2, MRMSrcMem, _,		defm rmbi_alt : AVX512_maskable_cmp_alt<0xC2, MRMSrcMem, _,
(outs _.KRC:$dst),		(outs _.KRC:$dst),
(ins _.RC:$src1, _.ScalarMemOp:$src2, u8imm:$cc),		(ins _.RC:$src1, _.ScalarMemOp:$src2, u8imm:$cc),
"vcmp"#_.Suffix,		"vcmp"#_.Suffix,
"$cc, ${src2}"##_.BroadcastStr##", $src1",		"$cc, ${src2}"##_.BroadcastStr##", $src1",
"$src1, ${src2}"##_.BroadcastStr##", $cc">,		"$src1, ${src2}"##_.BroadcastStr##", $cc">,
EVEX_B, Sched<[sched.Folded, ReadAfterLd]>,		EVEX_B, Sched<[sched.Folded, sched.ReadAfterFold]>,
NotMemoryFoldable;		NotMemoryFoldable;
}		}
}		}

// Patterns for selecting with loads in other operand.		// Patterns for selecting with loads in other operand.
def : Pat<(X86cmpm (_.LdFrag addr:$src2), (_.VT _.RC:$src1),		def : Pat<(X86cmpm (_.LdFrag addr:$src2), (_.VT _.RC:$src1),
CommutableCMPCC:$cc),		CommutableCMPCC:$cc),
(!cast<Instruction>(Name#_.ZSuffix#"rmi") _.RC:$src1, addr:$src2,		(!cast<Instruction>(Name#_.ZSuffix#"rmi") _.RC:$src1, addr:$src2,
▲ Show 20 Lines • Show All 95 Lines • ▼ Show 20 Lines	let Predicates = [prd], ExeDomain = _.ExeDomain in {
EVEX_K, Sched<[sched]>;		EVEX_K, Sched<[sched]>;
def rm : AVX512<opc, MRMSrcMem, (outs _.KRC:$dst),		def rm : AVX512<opc, MRMSrcMem, (outs _.KRC:$dst),
(ins _.IntScalarMemOp:$src1, i32u8imm:$src2),		(ins _.IntScalarMemOp:$src1, i32u8imm:$src2),
OpcodeStr##_.Suffix##		OpcodeStr##_.Suffix##
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
[(set _.KRC:$dst,		[(set _.KRC:$dst,
(OpNode _.ScalarIntMemCPat:$src1,		(OpNode _.ScalarIntMemCPat:$src1,
(i32 imm:$src2)))]>,		(i32 imm:$src2)))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
def rmk : AVX512<opc, MRMSrcMem, (outs _.KRC:$dst),		def rmk : AVX512<opc, MRMSrcMem, (outs _.KRC:$dst),
(ins _.KRCWM:$mask, _.IntScalarMemOp:$src1, i32u8imm:$src2),		(ins _.KRCWM:$mask, _.IntScalarMemOp:$src1, i32u8imm:$src2),
OpcodeStr##_.Suffix##		OpcodeStr##_.Suffix##
"\t{$src2, $src1, $dst {${mask}}\|$dst {${mask}}, $src1, $src2}",		"\t{$src2, $src1, $dst {${mask}}\|$dst {${mask}}, $src1, $src2}",
[(set _.KRC:$dst,(and _.KRCWM:$mask,		[(set _.KRC:$dst,(and _.KRCWM:$mask,
(OpNode _.ScalarIntMemCPat:$src1,		(OpNode _.ScalarIntMemCPat:$src1,
(i32 imm:$src2))))]>,		(i32 imm:$src2))))]>,
EVEX_K, Sched<[sched.Folded, ReadAfterLd]>;		EVEX_K, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

//handle fpclass instruction mask = fpclass(reg_vec, reg_vec, imm)		//handle fpclass instruction mask = fpclass(reg_vec, reg_vec, imm)
// fpclass(reg_vec, mem_vec, imm)		// fpclass(reg_vec, mem_vec, imm)
// fpclass(reg_vec, broadcast(eltVt), imm)		// fpclass(reg_vec, broadcast(eltVt), imm)
multiclass avx512_vector_fpclass<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass avx512_vector_fpclass<bits<8> opc, string OpcodeStr, SDNode OpNode,
X86FoldableSchedWrite sched, X86VectorVTInfo _,		X86FoldableSchedWrite sched, X86VectorVTInfo _,
Show All 15 Lines	def rrk : AVX512<opc, MRMSrcReg, (outs _.KRC:$dst),
EVEX_K, Sched<[sched]>;		EVEX_K, Sched<[sched]>;
def rm : AVX512<opc, MRMSrcMem, (outs _.KRC:$dst),		def rm : AVX512<opc, MRMSrcMem, (outs _.KRC:$dst),
(ins _.MemOp:$src1, i32u8imm:$src2),		(ins _.MemOp:$src1, i32u8imm:$src2),
OpcodeStr##_.Suffix##mem#		OpcodeStr##_.Suffix##mem#
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
[(set _.KRC:$dst,(OpNode		[(set _.KRC:$dst,(OpNode
(_.VT (bitconvert (_.LdFrag addr:$src1))),		(_.VT (bitconvert (_.LdFrag addr:$src1))),
(i32 imm:$src2)))]>,		(i32 imm:$src2)))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
def rmk : AVX512<opc, MRMSrcMem, (outs _.KRC:$dst),		def rmk : AVX512<opc, MRMSrcMem, (outs _.KRC:$dst),
(ins _.KRCWM:$mask, _.MemOp:$src1, i32u8imm:$src2),		(ins _.KRCWM:$mask, _.MemOp:$src1, i32u8imm:$src2),
OpcodeStr##_.Suffix##mem#		OpcodeStr##_.Suffix##mem#
"\t{$src2, $src1, $dst {${mask}}\|$dst {${mask}}, $src1, $src2}",		"\t{$src2, $src1, $dst {${mask}}\|$dst {${mask}}, $src1, $src2}",
[(set _.KRC:$dst, (and _.KRCWM:$mask, (OpNode		[(set _.KRC:$dst, (and _.KRCWM:$mask, (OpNode
(_.VT (bitconvert (_.LdFrag addr:$src1))),		(_.VT (bitconvert (_.LdFrag addr:$src1))),
(i32 imm:$src2))))]>,		(i32 imm:$src2))))]>,
EVEX_K, Sched<[sched.Folded, ReadAfterLd]>;		EVEX_K, Sched<[sched.Folded, sched.ReadAfterFold]>;
def rmb : AVX512<opc, MRMSrcMem, (outs _.KRC:$dst),		def rmb : AVX512<opc, MRMSrcMem, (outs _.KRC:$dst),
(ins _.ScalarMemOp:$src1, i32u8imm:$src2),		(ins _.ScalarMemOp:$src1, i32u8imm:$src2),
OpcodeStr##_.Suffix##broadcast##"\t{$src2, ${src1}"##		OpcodeStr##_.Suffix##broadcast##"\t{$src2, ${src1}"##
_.BroadcastStr##", $dst\|$dst, ${src1}"		_.BroadcastStr##", $dst\|$dst, ${src1}"
##_.BroadcastStr##", $src2}",		##_.BroadcastStr##", $src2}",
[(set _.KRC:$dst,(OpNode		[(set _.KRC:$dst,(OpNode
(_.VT (X86VBroadcast		(_.VT (X86VBroadcast
(_.ScalarLdFrag addr:$src1))),		(_.ScalarLdFrag addr:$src1))),
(i32 imm:$src2)))]>,		(i32 imm:$src2)))]>,
EVEX_B, Sched<[sched.Folded, ReadAfterLd]>;		EVEX_B, Sched<[sched.Folded, sched.ReadAfterFold]>;
def rmbk : AVX512<opc, MRMSrcMem, (outs _.KRC:$dst),		def rmbk : AVX512<opc, MRMSrcMem, (outs _.KRC:$dst),
(ins _.KRCWM:$mask, _.ScalarMemOp:$src1, i32u8imm:$src2),		(ins _.KRCWM:$mask, _.ScalarMemOp:$src1, i32u8imm:$src2),
OpcodeStr##_.Suffix##broadcast##"\t{$src2, ${src1}"##		OpcodeStr##_.Suffix##broadcast##"\t{$src2, ${src1}"##
_.BroadcastStr##", $dst {${mask}}\|$dst {${mask}}, ${src1}"##		_.BroadcastStr##", $dst {${mask}}\|$dst {${mask}}, ${src1}"##
_.BroadcastStr##", $src2}",		_.BroadcastStr##", $src2}",
[(set _.KRC:$dst,(and _.KRCWM:$mask, (OpNode		[(set _.KRC:$dst,(and _.KRCWM:$mask, (OpNode
(_.VT (X86VBroadcast		(_.VT (X86VBroadcast
(_.ScalarLdFrag addr:$src1))),		(_.ScalarLdFrag addr:$src1))),
(i32 imm:$src2))))]>,		(i32 imm:$src2))))]>,
EVEX_B, EVEX_K, Sched<[sched.Folded, ReadAfterLd]>;		EVEX_B, EVEX_K, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

multiclass avx512_vector_fpclass_all<string OpcodeStr, AVX512VLVectorVTInfo _,		multiclass avx512_vector_fpclass_all<string OpcodeStr, AVX512VLVectorVTInfo _,
bits<8> opc, SDNode OpNode,		bits<8> opc, SDNode OpNode,
X86SchedWriteWidths sched, Predicate prd,		X86SchedWriteWidths sched, Predicate prd,
string broadcast>{		string broadcast>{
let Predicates = [prd] in {		let Predicates = [prd] in {
▲ Show 20 Lines • Show All 1,865 Lines • ▼ Show 20 Lines	defm rr : AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),
Sched<[sched]>;		Sched<[sched]>;

defm rm : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rm : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.MemOp:$src2), OpcodeStr,		(ins _.RC:$src1, _.MemOp:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_.VT (OpNode _.RC:$src1,		(_.VT (OpNode _.RC:$src1,
(bitconvert (_.LdFrag addr:$src2))))>,		(bitconvert (_.LdFrag addr:$src2))))>,
AVX512BIBase, EVEX_4V,		AVX512BIBase, EVEX_4V,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass avx512_binop_rmb<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass avx512_binop_rmb<bits<8> opc, string OpcodeStr, SDNode OpNode,
X86VectorVTInfo _, X86FoldableSchedWrite sched,		X86VectorVTInfo _, X86FoldableSchedWrite sched,
bit IsCommutable = 0> :		bit IsCommutable = 0> :
avx512_binop_rm<opc, OpcodeStr, OpNode, _, sched, IsCommutable> {		avx512_binop_rm<opc, OpcodeStr, OpNode, _, sched, IsCommutable> {
defm rmb : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmb : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.ScalarMemOp:$src2), OpcodeStr,		(ins _.RC:$src1, _.ScalarMemOp:$src2), OpcodeStr,
"${src2}"##_.BroadcastStr##", $src1",		"${src2}"##_.BroadcastStr##", $src1",
"$src1, ${src2}"##_.BroadcastStr,		"$src1, ${src2}"##_.BroadcastStr,
(_.VT (OpNode _.RC:$src1,		(_.VT (OpNode _.RC:$src1,
(X86VBroadcast		(X86VBroadcast
(_.ScalarLdFrag addr:$src2))))>,		(_.ScalarLdFrag addr:$src2))))>,
AVX512BIBase, EVEX_4V, EVEX_B,		AVX512BIBase, EVEX_4V, EVEX_B,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass avx512_binop_rm_vl<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass avx512_binop_rm_vl<bits<8> opc, string OpcodeStr, SDNode OpNode,
AVX512VLVectorVTInfo VTInfo,		AVX512VLVectorVTInfo VTInfo,
X86SchedWriteWidths sched, Predicate prd,		X86SchedWriteWidths sched, Predicate prd,
bit IsCommutable = 0> {		bit IsCommutable = 0> {
let Predicates = [prd] in		let Predicates = [prd] in
defm Z : avx512_binop_rm<opc, OpcodeStr, OpNode, VTInfo.info512, sched.ZMM,		defm Z : avx512_binop_rm<opc, OpcodeStr, OpNode, VTInfo.info512, sched.ZMM,
▲ Show 20 Lines • Show All 99 Lines • ▼ Show 20 Lines	defm rr : AVX512_maskable<opc, MRMSrcReg, _Dst, (outs _Dst.RC:$dst),
IsCommutable>,		IsCommutable>,
AVX512BIBase, EVEX_4V, Sched<[sched]>;		AVX512BIBase, EVEX_4V, Sched<[sched]>;
defm rm : AVX512_maskable<opc, MRMSrcMem, _Dst, (outs _Dst.RC:$dst),		defm rm : AVX512_maskable<opc, MRMSrcMem, _Dst, (outs _Dst.RC:$dst),
(ins _Src.RC:$src1, _Src.MemOp:$src2), OpcodeStr,		(ins _Src.RC:$src1, _Src.MemOp:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_Dst.VT (OpNode (_Src.VT _Src.RC:$src1),		(_Dst.VT (OpNode (_Src.VT _Src.RC:$src1),
(bitconvert (_Src.LdFrag addr:$src2))))>,		(bitconvert (_Src.LdFrag addr:$src2))))>,
AVX512BIBase, EVEX_4V,		AVX512BIBase, EVEX_4V,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;

defm rmb : AVX512_maskable<opc, MRMSrcMem, _Dst, (outs _Dst.RC:$dst),		defm rmb : AVX512_maskable<opc, MRMSrcMem, _Dst, (outs _Dst.RC:$dst),
(ins _Src.RC:$src1, _Brdct.ScalarMemOp:$src2),		(ins _Src.RC:$src1, _Brdct.ScalarMemOp:$src2),
OpcodeStr,		OpcodeStr,
"${src2}"##_Brdct.BroadcastStr##", $src1",		"${src2}"##_Brdct.BroadcastStr##", $src1",
"$src1, ${src2}"##_Brdct.BroadcastStr,		"$src1, ${src2}"##_Brdct.BroadcastStr,
(_Dst.VT (OpNode (_Src.VT _Src.RC:$src1), (bitconvert		(_Dst.VT (OpNode (_Src.VT _Src.RC:$src1), (bitconvert
(_Brdct.VT (X86VBroadcast		(_Brdct.VT (X86VBroadcast
(_Brdct.ScalarLdFrag addr:$src2))))))>,		(_Brdct.ScalarLdFrag addr:$src2))))))>,
AVX512BIBase, EVEX_4V, EVEX_B,		AVX512BIBase, EVEX_4V, EVEX_B,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

defm VPADD : avx512_binop_rm_vl_all<0xFC, 0xFD, 0xFE, 0xD4, "vpadd", add,		defm VPADD : avx512_binop_rm_vl_all<0xFC, 0xFD, 0xFE, 0xD4, "vpadd", add,
SchedWriteVecALU, 1>;		SchedWriteVecALU, 1>;
defm VPSUB : avx512_binop_rm_vl_all<0xF8, 0xF9, 0xFA, 0xFB, "vpsub", sub,		defm VPSUB : avx512_binop_rm_vl_all<0xF8, 0xF9, 0xFA, 0xFB, "vpsub", sub,
SchedWriteVecALU, 0>;		SchedWriteVecALU, 0>;
defm VPADDS : avx512_binop_rm_vl_bw<0xEC, 0xED, "vpadds", X86adds,		defm VPADDS : avx512_binop_rm_vl_bw<0xEC, 0xED, "vpadds", X86adds,
SchedWriteVecALU, HasBWI, 1>;		SchedWriteVecALU, HasBWI, 1>;
▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines	defm rmb : AVX512_maskable<opc, MRMSrcMem, _Dst, (outs _Dst.RC:$dst),
(ins _Src.RC:$src1, _Src.ScalarMemOp:$src2),		(ins _Src.RC:$src1, _Src.ScalarMemOp:$src2),
OpcodeStr,		OpcodeStr,
"${src2}"##_Src.BroadcastStr##", $src1",		"${src2}"##_Src.BroadcastStr##", $src1",
"$src1, ${src2}"##_Src.BroadcastStr,		"$src1, ${src2}"##_Src.BroadcastStr,
(_Dst.VT (OpNode (_Src.VT _Src.RC:$src1), (bitconvert		(_Dst.VT (OpNode (_Src.VT _Src.RC:$src1), (bitconvert
(_Src.VT (X86VBroadcast		(_Src.VT (X86VBroadcast
(_Src.ScalarLdFrag addr:$src2))))))>,		(_Src.ScalarLdFrag addr:$src2))))))>,
EVEX_4V, EVEX_B, EVEX_CD8<_Src.EltSize, CD8VF>,		EVEX_4V, EVEX_B, EVEX_CD8<_Src.EltSize, CD8VF>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass avx512_packs_rm<bits<8> opc, string OpcodeStr,		multiclass avx512_packs_rm<bits<8> opc, string OpcodeStr,
SDNode OpNode,X86VectorVTInfo _Src,		SDNode OpNode,X86VectorVTInfo _Src,
X86VectorVTInfo _Dst, X86FoldableSchedWrite sched,		X86VectorVTInfo _Dst, X86FoldableSchedWrite sched,
bit IsCommutable = 0> {		bit IsCommutable = 0> {
defm rr : AVX512_maskable<opc, MRMSrcReg, _Dst, (outs _Dst.RC:$dst),		defm rr : AVX512_maskable<opc, MRMSrcReg, _Dst, (outs _Dst.RC:$dst),
(ins _Src.RC:$src1, _Src.RC:$src2), OpcodeStr,		(ins _Src.RC:$src1, _Src.RC:$src2), OpcodeStr,
"$src2, $src1","$src1, $src2",		"$src2, $src1","$src1, $src2",
(_Dst.VT (OpNode		(_Dst.VT (OpNode
(_Src.VT _Src.RC:$src1),		(_Src.VT _Src.RC:$src1),
(_Src.VT _Src.RC:$src2))),		(_Src.VT _Src.RC:$src2))),
IsCommutable>,		IsCommutable>,
EVEX_CD8<_Src.EltSize, CD8VF>, EVEX_4V, Sched<[sched]>;		EVEX_CD8<_Src.EltSize, CD8VF>, EVEX_4V, Sched<[sched]>;
defm rm : AVX512_maskable<opc, MRMSrcMem, _Dst, (outs _Dst.RC:$dst),		defm rm : AVX512_maskable<opc, MRMSrcMem, _Dst, (outs _Dst.RC:$dst),
(ins _Src.RC:$src1, _Src.MemOp:$src2), OpcodeStr,		(ins _Src.RC:$src1, _Src.MemOp:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_Dst.VT (OpNode (_Src.VT _Src.RC:$src1),		(_Dst.VT (OpNode (_Src.VT _Src.RC:$src1),
(bitconvert (_Src.LdFrag addr:$src2))))>,		(bitconvert (_Src.LdFrag addr:$src2))))>,
EVEX_4V, EVEX_CD8<_Src.EltSize, CD8VF>,		EVEX_4V, EVEX_CD8<_Src.EltSize, CD8VF>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass avx512_packs_all_i32_i16<bits<8> opc, string OpcodeStr,		multiclass avx512_packs_all_i32_i16<bits<8> opc, string OpcodeStr,
SDNode OpNode> {		SDNode OpNode> {
let Predicates = [HasBWI] in		let Predicates = [HasBWI] in
defm NAME#Z : avx512_packs_rm<opc, OpcodeStr, OpNode, v16i32_info,		defm NAME#Z : avx512_packs_rm<opc, OpcodeStr, OpNode, v16i32_info,
v32i16_info, SchedWriteShuffle.ZMM>,		v32i16_info, SchedWriteShuffle.ZMM>,
avx512_packs_rmb<opc, OpcodeStr, OpNode, v16i32_info,		avx512_packs_rmb<opc, OpcodeStr, OpNode, v16i32_info,
▲ Show 20 Lines • Show All 175 Lines • ▼ Show 20 Lines	multiclass avx512_logic_rm<bits<8> opc, string OpcodeStr,
defm rm : AVX512_maskable_logic<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rm : AVX512_maskable_logic<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.MemOp:$src2), OpcodeStr,		(ins _.RC:$src1, _.MemOp:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_.i64VT (OpNode (bitconvert (_.VT _.RC:$src1)),		(_.i64VT (OpNode (bitconvert (_.VT _.RC:$src1)),
(bitconvert (_.LdFrag addr:$src2)))),		(bitconvert (_.LdFrag addr:$src2)))),
(_.VT (bitconvert (_.i64VT (OpNodeMsk _.RC:$src1,		(_.VT (bitconvert (_.i64VT (OpNodeMsk _.RC:$src1,
(bitconvert (_.LdFrag addr:$src2))))))>,		(bitconvert (_.LdFrag addr:$src2))))))>,
AVX512BIBase, EVEX_4V,		AVX512BIBase, EVEX_4V,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

// OpNodeMsk is the OpNode to use where element size is important. So use		// OpNodeMsk is the OpNode to use where element size is important. So use
// for all of the broadcast patterns.		// for all of the broadcast patterns.
multiclass avx512_logic_rmb<bits<8> opc, string OpcodeStr,		multiclass avx512_logic_rmb<bits<8> opc, string OpcodeStr,
SDPatternOperator OpNode,		SDPatternOperator OpNode,
SDNode OpNodeMsk, X86FoldableSchedWrite sched, X86VectorVTInfo _,		SDNode OpNodeMsk, X86FoldableSchedWrite sched, X86VectorVTInfo _,
bit IsCommutable = 0> :		bit IsCommutable = 0> :
avx512_logic_rm<opc, OpcodeStr, OpNode, OpNodeMsk, sched, _,		avx512_logic_rm<opc, OpcodeStr, OpNode, OpNodeMsk, sched, _,
IsCommutable> {		IsCommutable> {
defm rmb : AVX512_maskable_logic<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmb : AVX512_maskable_logic<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.ScalarMemOp:$src2), OpcodeStr,		(ins _.RC:$src1, _.ScalarMemOp:$src2), OpcodeStr,
"${src2}"##_.BroadcastStr##", $src1",		"${src2}"##_.BroadcastStr##", $src1",
"$src1, ${src2}"##_.BroadcastStr,		"$src1, ${src2}"##_.BroadcastStr,
(_.i64VT (OpNodeMsk _.RC:$src1,		(_.i64VT (OpNodeMsk _.RC:$src1,
(bitconvert		(bitconvert
(_.VT (X86VBroadcast		(_.VT (X86VBroadcast
(_.ScalarLdFrag addr:$src2)))))),		(_.ScalarLdFrag addr:$src2)))))),
(_.VT (bitconvert (_.i64VT (OpNodeMsk _.RC:$src1,		(_.VT (bitconvert (_.i64VT (OpNodeMsk _.RC:$src1,
(bitconvert		(bitconvert
(_.VT (X86VBroadcast		(_.VT (X86VBroadcast
(_.ScalarLdFrag addr:$src2))))))))>,		(_.ScalarLdFrag addr:$src2))))))))>,
AVX512BIBase, EVEX_4V, EVEX_B,		AVX512BIBase, EVEX_4V, EVEX_B,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass avx512_logic_rmb_vl<bits<8> opc, string OpcodeStr,		multiclass avx512_logic_rmb_vl<bits<8> opc, string OpcodeStr,
SDPatternOperator OpNode,		SDPatternOperator OpNode,
SDNode OpNodeMsk, X86SchedWriteWidths sched,		SDNode OpNodeMsk, X86SchedWriteWidths sched,
AVX512VLVectorVTInfo VTInfo,		AVX512VLVectorVTInfo VTInfo,
bit IsCommutable = 0> {		bit IsCommutable = 0> {
let Predicates = [HasAVX512] in		let Predicates = [HasAVX512] in
▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines	defm rr_Int : AVX512_maskable_scalar<opc, MRMSrcReg, _, (outs _.RC:$dst),
Sched<[sched]>;		Sched<[sched]>;

defm rm_Int : AVX512_maskable_scalar<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rm_Int : AVX512_maskable_scalar<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.IntScalarMemOp:$src2), OpcodeStr,		(ins _.RC:$src1, _.IntScalarMemOp:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_.VT (VecNode _.RC:$src1,		(_.VT (VecNode _.RC:$src1,
_.ScalarIntMemCPat:$src2,		_.ScalarIntMemCPat:$src2,
(i32 FROUND_CURRENT)))>,		(i32 FROUND_CURRENT)))>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
let isCodeGenOnly = 1, Predicates = [HasAVX512] in {		let isCodeGenOnly = 1, Predicates = [HasAVX512] in {
def rr : I< opc, MRMSrcReg, (outs _.FRC:$dst),		def rr : I< opc, MRMSrcReg, (outs _.FRC:$dst),
(ins _.FRC:$src1, _.FRC:$src2),		(ins _.FRC:$src1, _.FRC:$src2),
OpcodeStr#"\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		OpcodeStr#"\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
[(set _.FRC:$dst, (OpNode _.FRC:$src1, _.FRC:$src2))]>,		[(set _.FRC:$dst, (OpNode _.FRC:$src1, _.FRC:$src2))]>,
Sched<[sched]> {		Sched<[sched]> {
let isCommutable = IsCommutable;		let isCommutable = IsCommutable;
}		}
def rm : I< opc, MRMSrcMem, (outs _.FRC:$dst),		def rm : I< opc, MRMSrcMem, (outs _.FRC:$dst),
(ins _.FRC:$src1, _.ScalarMemOp:$src2),		(ins _.FRC:$src1, _.ScalarMemOp:$src2),
OpcodeStr#"\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		OpcodeStr#"\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
[(set _.FRC:$dst, (OpNode _.FRC:$src1,		[(set _.FRC:$dst, (OpNode _.FRC:$src1,
(_.ScalarLdFrag addr:$src2)))]>,		(_.ScalarLdFrag addr:$src2)))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}
}		}

multiclass avx512_fp_scalar_round<bits<8> opc, string OpcodeStr,X86VectorVTInfo _,		multiclass avx512_fp_scalar_round<bits<8> opc, string OpcodeStr,X86VectorVTInfo _,
SDNode VecNode, X86FoldableSchedWrite sched,		SDNode VecNode, X86FoldableSchedWrite sched,
bit IsCommutable = 0> {		bit IsCommutable = 0> {
let ExeDomain = _.ExeDomain in		let ExeDomain = _.ExeDomain in
Show All 14 Lines	defm rr_Int : AVX512_maskable_scalar<opc, MRMSrcReg, _, (outs _.RC:$dst),
(_.VT (VecNode _.RC:$src1, _.RC:$src2))>,		(_.VT (VecNode _.RC:$src1, _.RC:$src2))>,
Sched<[sched]>;		Sched<[sched]>;

defm rm_Int : AVX512_maskable_scalar<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rm_Int : AVX512_maskable_scalar<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.IntScalarMemOp:$src2), OpcodeStr,		(ins _.RC:$src1, _.IntScalarMemOp:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_.VT (VecNode _.RC:$src1,		(_.VT (VecNode _.RC:$src1,
_.ScalarIntMemCPat:$src2))>,		_.ScalarIntMemCPat:$src2))>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;

let isCodeGenOnly = 1, Predicates = [HasAVX512] in {		let isCodeGenOnly = 1, Predicates = [HasAVX512] in {
def rr : I< opc, MRMSrcReg, (outs _.FRC:$dst),		def rr : I< opc, MRMSrcReg, (outs _.FRC:$dst),
(ins _.FRC:$src1, _.FRC:$src2),		(ins _.FRC:$src1, _.FRC:$src2),
OpcodeStr#"\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		OpcodeStr#"\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
[(set _.FRC:$dst, (OpNode _.FRC:$src1, _.FRC:$src2))]>,		[(set _.FRC:$dst, (OpNode _.FRC:$src1, _.FRC:$src2))]>,
Sched<[sched]> {		Sched<[sched]> {
let isCommutable = IsCommutable;		let isCommutable = IsCommutable;
}		}
def rm : I< opc, MRMSrcMem, (outs _.FRC:$dst),		def rm : I< opc, MRMSrcMem, (outs _.FRC:$dst),
(ins _.FRC:$src1, _.ScalarMemOp:$src2),		(ins _.FRC:$src1, _.ScalarMemOp:$src2),
OpcodeStr#"\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		OpcodeStr#"\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
[(set _.FRC:$dst, (OpNode _.FRC:$src1,		[(set _.FRC:$dst, (OpNode _.FRC:$src1,
(_.ScalarLdFrag addr:$src2)))]>,		(_.ScalarLdFrag addr:$src2)))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

defm rrb_Int : AVX512_maskable_scalar<opc, MRMSrcReg, _, (outs _.RC:$dst),		defm rrb_Int : AVX512_maskable_scalar<opc, MRMSrcReg, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.RC:$src2), OpcodeStr,		(ins _.RC:$src1, _.RC:$src2), OpcodeStr,
"{sae}, $src2, $src1", "$src1, $src2, {sae}",		"{sae}, $src2, $src1", "$src1, $src2, {sae}",
(SaeNode (_.VT _.RC:$src1), (_.VT _.RC:$src2),		(SaeNode (_.VT _.RC:$src1), (_.VT _.RC:$src2),
(i32 FROUND_NO_EXC))>, EVEX_B,		(i32 FROUND_NO_EXC))>, EVEX_B,
Sched<[sched]>;		Sched<[sched]>;
▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines	def rr : I< opc, MRMSrcReg, (outs _.FRC:$dst),
Sched<[sched]> {		Sched<[sched]> {
let isCommutable = 1;		let isCommutable = 1;
}		}
def rm : I< opc, MRMSrcMem, (outs _.FRC:$dst),		def rm : I< opc, MRMSrcMem, (outs _.FRC:$dst),
(ins _.FRC:$src1, _.ScalarMemOp:$src2),		(ins _.FRC:$src1, _.ScalarMemOp:$src2),
OpcodeStr#"\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		OpcodeStr#"\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
[(set _.FRC:$dst, (OpNode _.FRC:$src1,		[(set _.FRC:$dst, (OpNode _.FRC:$src1,
(_.ScalarLdFrag addr:$src2)))]>,		(_.ScalarLdFrag addr:$src2)))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}
defm VMINCSSZ : avx512_comutable_binop_s<0x5D, "vminss", f32x_info, X86fminc,		defm VMINCSSZ : avx512_comutable_binop_s<0x5D, "vminss", f32x_info, X86fminc,
SchedWriteFCmp.Scl>, XS, EVEX_4V,		SchedWriteFCmp.Scl>, XS, EVEX_4V,
VEX_LIG, EVEX_CD8<32, CD8VT1>;		VEX_LIG, EVEX_CD8<32, CD8VT1>;

defm VMINCSDZ : avx512_comutable_binop_s<0x5D, "vminsd", f64x_info, X86fminc,		defm VMINCSDZ : avx512_comutable_binop_s<0x5D, "vminsd", f64x_info, X86fminc,
SchedWriteFCmp.Scl>, XD, VEX_W, EVEX_4V,		SchedWriteFCmp.Scl>, XD, VEX_W, EVEX_4V,
Show All 18 Lines	defm rr: AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),
(_.VT (OpNode _.RC:$src1, _.RC:$src2)), IsCommutable, 0,		(_.VT (OpNode _.RC:$src1, _.RC:$src2)), IsCommutable, 0,
IsKZCommutable>,		IsKZCommutable>,
EVEX_4V, Sched<[sched]>;		EVEX_4V, Sched<[sched]>;
let mayLoad = 1 in {		let mayLoad = 1 in {
defm rm: AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rm: AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.MemOp:$src2), OpcodeStr##_.Suffix,		(ins _.RC:$src1, _.MemOp:$src2), OpcodeStr##_.Suffix,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(OpNode _.RC:$src1, (_.LdFrag addr:$src2))>,		(OpNode _.RC:$src1, (_.LdFrag addr:$src2))>,
EVEX_4V, Sched<[sched.Folded, ReadAfterLd]>;		EVEX_4V, Sched<[sched.Folded, sched.ReadAfterFold]>;
defm rmb: AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmb: AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.ScalarMemOp:$src2), OpcodeStr##_.Suffix,		(ins _.RC:$src1, _.ScalarMemOp:$src2), OpcodeStr##_.Suffix,
"${src2}"##_.BroadcastStr##", $src1",		"${src2}"##_.BroadcastStr##", $src1",
"$src1, ${src2}"##_.BroadcastStr,		"$src1, ${src2}"##_.BroadcastStr,
(OpNode _.RC:$src1, (_.VT (X86VBroadcast		(OpNode _.RC:$src1, (_.VT (X86VBroadcast
(_.ScalarLdFrag addr:$src2))))>,		(_.ScalarLdFrag addr:$src2))))>,
EVEX_4V, EVEX_B,		EVEX_4V, EVEX_B,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}
}		}

multiclass avx512_fp_round_packed<bits<8> opc, string OpcodeStr,		multiclass avx512_fp_round_packed<bits<8> opc, string OpcodeStr,
SDPatternOperator OpNodeRnd,		SDPatternOperator OpNodeRnd,
X86FoldableSchedWrite sched, X86VectorVTInfo _> {		X86FoldableSchedWrite sched, X86VectorVTInfo _> {
let ExeDomain = _.ExeDomain in		let ExeDomain = _.ExeDomain in
▲ Show 20 Lines • Show All 218 Lines • ▼ Show 20 Lines	defm rr: AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.RC:$src2), OpcodeStr##_.Suffix,		(ins _.RC:$src1, _.RC:$src2), OpcodeStr##_.Suffix,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_.VT (OpNode _.RC:$src1, _.RC:$src2, (i32 FROUND_CURRENT)))>,		(_.VT (OpNode _.RC:$src1, _.RC:$src2, (i32 FROUND_CURRENT)))>,
EVEX_4V, Sched<[sched]>;		EVEX_4V, Sched<[sched]>;
defm rm: AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rm: AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.MemOp:$src2), OpcodeStr##_.Suffix,		(ins _.RC:$src1, _.MemOp:$src2), OpcodeStr##_.Suffix,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(OpNode _.RC:$src1, (_.LdFrag addr:$src2), (i32 FROUND_CURRENT))>,		(OpNode _.RC:$src1, (_.LdFrag addr:$src2), (i32 FROUND_CURRENT))>,
EVEX_4V, Sched<[sched.Folded, ReadAfterLd]>;		EVEX_4V, Sched<[sched.Folded, sched.ReadAfterFold]>;
defm rmb: AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmb: AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.ScalarMemOp:$src2), OpcodeStr##_.Suffix,		(ins _.RC:$src1, _.ScalarMemOp:$src2), OpcodeStr##_.Suffix,
"${src2}"##_.BroadcastStr##", $src1",		"${src2}"##_.BroadcastStr##", $src1",
"$src1, ${src2}"##_.BroadcastStr,		"$src1, ${src2}"##_.BroadcastStr,
(OpNode _.RC:$src1, (_.VT (X86VBroadcast		(OpNode _.RC:$src1, (_.VT (X86VBroadcast
(_.ScalarLdFrag addr:$src2))),		(_.ScalarLdFrag addr:$src2))),
(i32 FROUND_CURRENT))>,		(i32 FROUND_CURRENT))>,
EVEX_4V, EVEX_B, Sched<[sched.Folded, ReadAfterLd]>;		EVEX_4V, EVEX_B, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

multiclass avx512_fp_scalef_scalar<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass avx512_fp_scalef_scalar<bits<8> opc, string OpcodeStr, SDNode OpNode,
X86FoldableSchedWrite sched, X86VectorVTInfo _> {		X86FoldableSchedWrite sched, X86VectorVTInfo _> {
let ExeDomain = _.ExeDomain in {		let ExeDomain = _.ExeDomain in {
defm rr: AVX512_maskable_scalar<opc, MRMSrcReg, _, (outs _.RC:$dst),		defm rr: AVX512_maskable_scalar<opc, MRMSrcReg, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.RC:$src2), OpcodeStr##_.Suffix,		(ins _.RC:$src1, _.RC:$src2), OpcodeStr##_.Suffix,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_.VT (OpNode _.RC:$src1, _.RC:$src2, (i32 FROUND_CURRENT)))>,		(_.VT (OpNode _.RC:$src1, _.RC:$src2, (i32 FROUND_CURRENT)))>,
Sched<[sched]>;		Sched<[sched]>;
defm rm: AVX512_maskable_scalar<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rm: AVX512_maskable_scalar<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.IntScalarMemOp:$src2), OpcodeStr##_.Suffix,		(ins _.RC:$src1, _.IntScalarMemOp:$src2), OpcodeStr##_.Suffix,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(OpNode _.RC:$src1, _.ScalarIntMemCPat:$src2,		(OpNode _.RC:$src1, _.ScalarIntMemCPat:$src2,
(i32 FROUND_CURRENT))>,		(i32 FROUND_CURRENT))>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

multiclass avx512_fp_scalef_all<bits<8> opc, bits<8> opcScaler, string OpcodeStr,		multiclass avx512_fp_scalef_all<bits<8> opc, bits<8> opcScaler, string OpcodeStr,
SDNode OpNode, SDNode OpNodeScal,		SDNode OpNode, SDNode OpNodeScal,
X86SchedWriteWidths sched> {		X86SchedWriteWidths sched> {
defm PSZ : avx512_fp_scalef_p<opc, OpcodeStr, OpNode, sched.ZMM, v16f32_info>,		defm PSZ : avx512_fp_scalef_p<opc, OpcodeStr, OpNode, sched.ZMM, v16f32_info>,
avx512_fp_round_packed<opc, OpcodeStr, OpNode, sched.ZMM, v16f32_info>,		avx512_fp_round_packed<opc, OpcodeStr, OpNode, sched.ZMM, v16f32_info>,
▲ Show 20 Lines • Show All 41 Lines • ▼ Show 20 Lines	multiclass avx512_vptest<bits<8> opc, string OpcodeStr, PatFrag OpNode,
defm rm : AVX512_maskable_cmp<opc, MRMSrcMem, _, (outs _.KRC:$dst),		defm rm : AVX512_maskable_cmp<opc, MRMSrcMem, _, (outs _.KRC:$dst),
(ins _.RC:$src1, _.MemOp:$src2), OpcodeStr,		(ins _.RC:$src1, _.MemOp:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(OpNode (bitconvert		(OpNode (bitconvert
(_.i64VT (and _.RC:$src1,		(_.i64VT (and _.RC:$src1,
(bitconvert (_.LdFrag addr:$src2))))),		(bitconvert (_.LdFrag addr:$src2))))),
_.ImmAllZerosV)>,		_.ImmAllZerosV)>,
EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,		EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

// Patterns for compare with 0 that just use the same source twice.		// Patterns for compare with 0 that just use the same source twice.
def : Pat<(_.KVT (OpNode _.RC:$src, _.ImmAllZerosV)),		def : Pat<(_.KVT (OpNode _.RC:$src, _.ImmAllZerosV)),
(_.KVT (!cast<Instruction>(Name # _.ZSuffix # "rr")		(_.KVT (!cast<Instruction>(Name # _.ZSuffix # "rr")
_.RC:$src, _.RC:$src))>;		_.RC:$src, _.RC:$src))>;

def : Pat<(_.KVT (and _.KRC:$mask, (OpNode _.RC:$src, _.ImmAllZerosV))),		def : Pat<(_.KVT (and _.KRC:$mask, (OpNode _.RC:$src, _.ImmAllZerosV))),
(_.KVT (!cast<Instruction>(Name # _.ZSuffix # "rrk")		(_.KVT (!cast<Instruction>(Name # _.ZSuffix # "rrk")
_.KRC:$mask, _.RC:$src, _.RC:$src))>;		_.KRC:$mask, _.RC:$src, _.RC:$src))>;
}		}

multiclass avx512_vptest_mb<bits<8> opc, string OpcodeStr, PatFrag OpNode,		multiclass avx512_vptest_mb<bits<8> opc, string OpcodeStr, PatFrag OpNode,
X86FoldableSchedWrite sched, X86VectorVTInfo _> {		X86FoldableSchedWrite sched, X86VectorVTInfo _> {
let ExeDomain = _.ExeDomain in		let ExeDomain = _.ExeDomain in
defm rmb : AVX512_maskable_cmp<opc, MRMSrcMem, _, (outs _.KRC:$dst),		defm rmb : AVX512_maskable_cmp<opc, MRMSrcMem, _, (outs _.KRC:$dst),
(ins _.RC:$src1, _.ScalarMemOp:$src2), OpcodeStr,		(ins _.RC:$src1, _.ScalarMemOp:$src2), OpcodeStr,
"${src2}"##_.BroadcastStr##", $src1",		"${src2}"##_.BroadcastStr##", $src1",
"$src1, ${src2}"##_.BroadcastStr,		"$src1, ${src2}"##_.BroadcastStr,
(OpNode (and _.RC:$src1,		(OpNode (and _.RC:$src1,
(X86VBroadcast		(X86VBroadcast
(_.ScalarLdFrag addr:$src2))),		(_.ScalarLdFrag addr:$src2))),
_.ImmAllZerosV)>,		_.ImmAllZerosV)>,
EVEX_B, EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,		EVEX_B, EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

// Use 512bit version to implement 128/256 bit in case NoVLX.		// Use 512bit version to implement 128/256 bit in case NoVLX.
multiclass avx512_vptest_lowering<PatFrag OpNode, X86VectorVTInfo ExtendInfo,		multiclass avx512_vptest_lowering<PatFrag OpNode, X86VectorVTInfo ExtendInfo,
X86VectorVTInfo _, string Name> {		X86VectorVTInfo _, string Name> {
def : Pat<(_.KVT (OpNode (bitconvert (_.i64VT (and _.RC:$src1, _.RC:$src2))),		def : Pat<(_.KVT (OpNode (bitconvert (_.i64VT (and _.RC:$src1, _.RC:$src2))),
_.ImmAllZerosV)),		_.ImmAllZerosV)),
(_.KVT (COPY_TO_REGCLASS		(_.KVT (COPY_TO_REGCLASS
▲ Show 20 Lines • Show All 151 Lines • ▼ Show 20 Lines	defm rr : AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_.VT (OpNode _.RC:$src1, (SrcVT VR128X:$src2)))>,		(_.VT (OpNode _.RC:$src1, (SrcVT VR128X:$src2)))>,
AVX512BIBase, EVEX_4V, Sched<[sched]>;		AVX512BIBase, EVEX_4V, Sched<[sched]>;
defm rm : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rm : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, i128mem:$src2), OpcodeStr,		(ins _.RC:$src1, i128mem:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_.VT (OpNode _.RC:$src1, (bc_frag (loadv2i64 addr:$src2))))>,		(_.VT (OpNode _.RC:$src1, (bc_frag (loadv2i64 addr:$src2))))>,
AVX512BIBase,		AVX512BIBase,
EVEX_4V, Sched<[sched.Folded, ReadAfterLd]>;		EVEX_4V, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

multiclass avx512_shift_sizes<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass avx512_shift_sizes<bits<8> opc, string OpcodeStr, SDNode OpNode,
X86SchedWriteWidths sched, ValueType SrcVT,		X86SchedWriteWidths sched, ValueType SrcVT,
PatFrag bc_frag, AVX512VLVectorVTInfo VTInfo,		PatFrag bc_frag, AVX512VLVectorVTInfo VTInfo,
Predicate prd> {		Predicate prd> {
let Predicates = [prd] in		let Predicates = [prd] in
▲ Show 20 Lines • Show All 137 Lines • ▼ Show 20 Lines	defm rr : AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),
(_.VT (OpNode _.RC:$src1, (_.VT _.RC:$src2)))>,		(_.VT (OpNode _.RC:$src1, (_.VT _.RC:$src2)))>,
AVX5128IBase, EVEX_4V, Sched<[sched]>;		AVX5128IBase, EVEX_4V, Sched<[sched]>;
defm rm : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rm : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.MemOp:$src2), OpcodeStr,		(ins _.RC:$src1, _.MemOp:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_.VT (OpNode _.RC:$src1,		(_.VT (OpNode _.RC:$src1,
(_.VT (bitconvert (_.LdFrag addr:$src2)))))>,		(_.VT (bitconvert (_.LdFrag addr:$src2)))))>,
AVX5128IBase, EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,		AVX5128IBase, EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

multiclass avx512_var_shift_mb<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass avx512_var_shift_mb<bits<8> opc, string OpcodeStr, SDNode OpNode,
X86FoldableSchedWrite sched, X86VectorVTInfo _> {		X86FoldableSchedWrite sched, X86VectorVTInfo _> {
let ExeDomain = _.ExeDomain in		let ExeDomain = _.ExeDomain in
defm rmb : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmb : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.ScalarMemOp:$src2), OpcodeStr,		(ins _.RC:$src1, _.ScalarMemOp:$src2), OpcodeStr,
"${src2}"##_.BroadcastStr##", $src1",		"${src2}"##_.BroadcastStr##", $src1",
"$src1, ${src2}"##_.BroadcastStr,		"$src1, ${src2}"##_.BroadcastStr,
(_.VT (OpNode _.RC:$src1, (_.VT (X86VBroadcast		(_.VT (OpNode _.RC:$src1, (_.VT (X86VBroadcast
(_.ScalarLdFrag addr:$src2)))))>,		(_.ScalarLdFrag addr:$src2)))))>,
AVX5128IBase, EVEX_B, EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,		AVX5128IBase, EVEX_B, EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass avx512_var_shift_sizes<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass avx512_var_shift_sizes<bits<8> opc, string OpcodeStr, SDNode OpNode,
X86SchedWriteWidths sched, AVX512VLVectorVTInfo _> {		X86SchedWriteWidths sched, AVX512VLVectorVTInfo _> {
let Predicates = [HasAVX512] in		let Predicates = [HasAVX512] in
defm Z : avx512_var_shift<opc, OpcodeStr, OpNode, sched.ZMM, _.info512>,		defm Z : avx512_var_shift<opc, OpcodeStr, OpNode, sched.ZMM, _.info512>,
avx512_var_shift_mb<opc, OpcodeStr, OpNode, sched.ZMM, _.info512>, EVEX_V512;		avx512_var_shift_mb<opc, OpcodeStr, OpNode, sched.ZMM, _.info512>, EVEX_V512;

▲ Show 20 Lines • Show All 311 Lines • ▼ Show 20 Lines	defm rr: AVX512_maskable<OpcVar, MRMSrcReg, _, (outs _.RC:$dst),
T8PD, EVEX_4V, Sched<[sched]>;		T8PD, EVEX_4V, Sched<[sched]>;
defm rm: AVX512_maskable<OpcVar, MRMSrcMem, _, (outs _.RC:$dst),		defm rm: AVX512_maskable<OpcVar, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, Ctrl.MemOp:$src2), OpcodeStr,		(ins _.RC:$src1, Ctrl.MemOp:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_.VT (OpNode		(_.VT (OpNode
_.RC:$src1,		_.RC:$src1,
(Ctrl.VT (bitconvert(Ctrl.LdFrag addr:$src2)))))>,		(Ctrl.VT (bitconvert(Ctrl.LdFrag addr:$src2)))))>,
T8PD, EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,		T8PD, EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
defm rmb: AVX512_maskable<OpcVar, MRMSrcMem, _, (outs _.RC:$dst),		defm rmb: AVX512_maskable<OpcVar, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.ScalarMemOp:$src2), OpcodeStr,		(ins _.RC:$src1, _.ScalarMemOp:$src2), OpcodeStr,
"${src2}"##_.BroadcastStr##", $src1",		"${src2}"##_.BroadcastStr##", $src1",
"$src1, ${src2}"##_.BroadcastStr,		"$src1, ${src2}"##_.BroadcastStr,
(_.VT (OpNode		(_.VT (OpNode
_.RC:$src1,		_.RC:$src1,
(Ctrl.VT (X86VBroadcast		(Ctrl.VT (X86VBroadcast
(Ctrl.ScalarLdFrag addr:$src2)))))>,		(Ctrl.ScalarLdFrag addr:$src2)))))>,
T8PD, EVEX_4V, EVEX_B, EVEX_CD8<_.EltSize, CD8VF>,		T8PD, EVEX_4V, EVEX_B, EVEX_CD8<_.EltSize, CD8VF>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass avx512_permil_vec_common<string OpcodeStr, bits<8> OpcVar,		multiclass avx512_permil_vec_common<string OpcodeStr, bits<8> OpcVar,
X86SchedWriteWidths sched,		X86SchedWriteWidths sched,
AVX512VLVectorVTInfo _,		AVX512VLVectorVTInfo _,
AVX512VLVectorVTInfo Ctrl> {		AVX512VLVectorVTInfo Ctrl> {
let Predicates = [HasAVX512] in {		let Predicates = [HasAVX512] in {
defm Z : avx512_permil_vec<OpcVar, OpcodeStr, X86VPermilpv, sched.ZMM,		defm Z : avx512_permil_vec<OpcVar, OpcodeStr, X86VPermilpv, sched.ZMM,
▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines	multiclass avx512_mov_hilo_packed<bits<8> opc, string OpcodeStr,
def rm : AVX512<opc, MRMSrcMem, (outs _.RC:$dst),		def rm : AVX512<opc, MRMSrcMem, (outs _.RC:$dst),
(ins _.RC:$src1, f64mem:$src2),		(ins _.RC:$src1, f64mem:$src2),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set _.RC:$dst,		[(set _.RC:$dst,
(OpNode _.RC:$src1,		(OpNode _.RC:$src1,
(_.VT (bitconvert		(_.VT (bitconvert
(v2f64 (scalar_to_vector (loadf64 addr:$src2)))))))]>,		(v2f64 (scalar_to_vector (loadf64 addr:$src2)))))))]>,
Sched<[SchedWriteFShuffle.XMM.Folded, ReadAfterLd]>, EVEX_4V;		Sched<[SchedWriteFShuffle.XMM.Folded, SchedWriteFShuffle.XMM.ReadAfterFold]>, EVEX_4V;
}		}

// No patterns for MOVLPS/MOVHPS as the Movlhps node should only be created in		// No patterns for MOVLPS/MOVHPS as the Movlhps node should only be created in
// SSE1. And MOVLPS pattern is even more complex.		// SSE1. And MOVLPS pattern is even more complex.
defm VMOVHPSZ128 : avx512_mov_hilo_packed<0x16, "vmovhps", null_frag,		defm VMOVHPSZ128 : avx512_mov_hilo_packed<0x16, "vmovhps", null_frag,
v4f32x_info>, EVEX_CD8<32, CD8VT2>, PS;		v4f32x_info>, EVEX_CD8<32, CD8VT2>, PS;
defm VMOVHPDZ128 : avx512_mov_hilo_packed<0x16, "vmovhpd", X86Unpckl,		defm VMOVHPDZ128 : avx512_mov_hilo_packed<0x16, "vmovhpd", X86Unpckl,
v2f64x_info>, EVEX_CD8<64, CD8VT1>, PD, VEX_W;		v2f64x_info>, EVEX_CD8<64, CD8VT1>, PD, VEX_W;
▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines	defm r: AVX512_maskable_3src<opc, MRMSrcReg, _, (outs _.RC:$dst),
OpcodeStr, "$src3, $src2", "$src2, $src3",		OpcodeStr, "$src3, $src2", "$src2, $src3",
(_.VT (OpNode _.RC:$src2, _.RC:$src1, _.RC:$src3)), 1, 1>,		(_.VT (OpNode _.RC:$src2, _.RC:$src1, _.RC:$src3)), 1, 1>,
AVX512FMA3Base, Sched<[sched]>;		AVX512FMA3Base, Sched<[sched]>;

defm m: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm m: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src2, _.MemOp:$src3),		(ins _.RC:$src2, _.MemOp:$src3),
OpcodeStr, "$src3, $src2", "$src2, $src3",		OpcodeStr, "$src3, $src2", "$src2, $src3",
(_.VT (OpNode _.RC:$src2, _.RC:$src1, (_.LdFrag addr:$src3))), 1, 0>,		(_.VT (OpNode _.RC:$src2, _.RC:$src1, (_.LdFrag addr:$src3))), 1, 0>,
AVX512FMA3Base, Sched<[sched.Folded, ReadAfterLd]>;		AVX512FMA3Base, Sched<[sched.Folded, sched.ReadAfterFold]>;

defm mb: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm mb: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src2, _.ScalarMemOp:$src3),		(ins _.RC:$src2, _.ScalarMemOp:$src3),
OpcodeStr, !strconcat("${src3}", _.BroadcastStr,", $src2"),		OpcodeStr, !strconcat("${src3}", _.BroadcastStr,", $src2"),
!strconcat("$src2, ${src3}", _.BroadcastStr ),		!strconcat("$src2, ${src3}", _.BroadcastStr ),
(OpNode _.RC:$src2,		(OpNode _.RC:$src2,
_.RC:$src1,(_.VT (X86VBroadcast (_.ScalarLdFrag addr:$src3)))), 1, 0>,		_.RC:$src1,(_.VT (X86VBroadcast (_.ScalarLdFrag addr:$src3)))), 1, 0>,
AVX512FMA3Base, EVEX_B, Sched<[sched.Folded, ReadAfterLd]>;		AVX512FMA3Base, EVEX_B, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

multiclass avx512_fma3_213_round<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass avx512_fma3_213_round<bits<8> opc, string OpcodeStr, SDNode OpNode,
X86FoldableSchedWrite sched,		X86FoldableSchedWrite sched,
X86VectorVTInfo _, string Suff> {		X86VectorVTInfo _, string Suff> {
let Constraints = "$src1 = $dst", ExeDomain = _.ExeDomain, hasSideEffects = 0 in		let Constraints = "$src1 = $dst", ExeDomain = _.ExeDomain, hasSideEffects = 0 in
defm rb: AVX512_maskable_3src<opc, MRMSrcReg, _, (outs _.RC:$dst),		defm rb: AVX512_maskable_3src<opc, MRMSrcReg, _, (outs _.RC:$dst),
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines	defm r: AVX512_maskable_3src<opc, MRMSrcReg, _, (outs _.RC:$dst),
OpcodeStr, "$src3, $src2", "$src2, $src3",		OpcodeStr, "$src3, $src2", "$src2, $src3",
(_.VT (OpNode _.RC:$src2, _.RC:$src3, _.RC:$src1)), 1, 1,		(_.VT (OpNode _.RC:$src2, _.RC:$src3, _.RC:$src1)), 1, 1,
vselect, 1>, AVX512FMA3Base, Sched<[sched]>;		vselect, 1>, AVX512FMA3Base, Sched<[sched]>;

defm m: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm m: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src2, _.MemOp:$src3),		(ins _.RC:$src2, _.MemOp:$src3),
OpcodeStr, "$src3, $src2", "$src2, $src3",		OpcodeStr, "$src3, $src2", "$src2, $src3",
(_.VT (OpNode _.RC:$src2, (_.LdFrag addr:$src3), _.RC:$src1)), 1, 0>,		(_.VT (OpNode _.RC:$src2, (_.LdFrag addr:$src3), _.RC:$src1)), 1, 0>,
AVX512FMA3Base, Sched<[sched.Folded, ReadAfterLd]>;		AVX512FMA3Base, Sched<[sched.Folded, sched.ReadAfterFold]>;

defm mb: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm mb: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src2, _.ScalarMemOp:$src3),		(ins _.RC:$src2, _.ScalarMemOp:$src3),
OpcodeStr, "${src3}"##_.BroadcastStr##", $src2",		OpcodeStr, "${src3}"##_.BroadcastStr##", $src2",
"$src2, ${src3}"##_.BroadcastStr,		"$src2, ${src3}"##_.BroadcastStr,
(_.VT (OpNode _.RC:$src2,		(_.VT (OpNode _.RC:$src2,
(_.VT (X86VBroadcast(_.ScalarLdFrag addr:$src3))),		(_.VT (X86VBroadcast(_.ScalarLdFrag addr:$src3))),
_.RC:$src1)), 1, 0>, AVX512FMA3Base, EVEX_B,		_.RC:$src1)), 1, 0>, AVX512FMA3Base, EVEX_B,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

multiclass avx512_fma3_231_round<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass avx512_fma3_231_round<bits<8> opc, string OpcodeStr, SDNode OpNode,
X86FoldableSchedWrite sched,		X86FoldableSchedWrite sched,
X86VectorVTInfo _, string Suff> {		X86VectorVTInfo _, string Suff> {
let Constraints = "$src1 = $dst", ExeDomain = _.ExeDomain, hasSideEffects = 0 in		let Constraints = "$src1 = $dst", ExeDomain = _.ExeDomain, hasSideEffects = 0 in
defm rb: AVX512_maskable_3src<opc, MRMSrcReg, _, (outs _.RC:$dst),		defm rb: AVX512_maskable_3src<opc, MRMSrcReg, _, (outs _.RC:$dst),
▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines	defm r: AVX512_maskable_3src<opc, MRMSrcReg, _, (outs _.RC:$dst),
AVX512FMA3Base, Sched<[sched]>;		AVX512FMA3Base, Sched<[sched]>;

// Pattern is 312 order so that the load is in a different place from the		// Pattern is 312 order so that the load is in a different place from the
// 213 and 231 patterns this helps tablegen's duplicate pattern detection.		// 213 and 231 patterns this helps tablegen's duplicate pattern detection.
defm m: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm m: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src2, _.MemOp:$src3),		(ins _.RC:$src2, _.MemOp:$src3),
OpcodeStr, "$src3, $src2", "$src2, $src3",		OpcodeStr, "$src3, $src2", "$src2, $src3",
(_.VT (OpNode (_.LdFrag addr:$src3), _.RC:$src1, _.RC:$src2)), 1, 0>,		(_.VT (OpNode (_.LdFrag addr:$src3), _.RC:$src1, _.RC:$src2)), 1, 0>,
AVX512FMA3Base, Sched<[sched.Folded, ReadAfterLd]>;		AVX512FMA3Base, Sched<[sched.Folded, sched.ReadAfterFold]>;

// Pattern is 312 order so that the load is in a different place from the		// Pattern is 312 order so that the load is in a different place from the
// 213 and 231 patterns this helps tablegen's duplicate pattern detection.		// 213 and 231 patterns this helps tablegen's duplicate pattern detection.
defm mb: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm mb: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src2, _.ScalarMemOp:$src3),		(ins _.RC:$src2, _.ScalarMemOp:$src3),
OpcodeStr, "${src3}"##_.BroadcastStr##", $src2",		OpcodeStr, "${src3}"##_.BroadcastStr##", $src2",
"$src2, ${src3}"##_.BroadcastStr,		"$src2, ${src3}"##_.BroadcastStr,
(_.VT (OpNode (_.VT (X86VBroadcast(_.ScalarLdFrag addr:$src3))),		(_.VT (OpNode (_.VT (X86VBroadcast(_.ScalarLdFrag addr:$src3))),
_.RC:$src1, _.RC:$src2)), 1, 0>,		_.RC:$src1, _.RC:$src2)), 1, 0>,
AVX512FMA3Base, EVEX_B, Sched<[sched.Folded, ReadAfterLd]>;		AVX512FMA3Base, EVEX_B, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

multiclass avx512_fma3_132_round<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass avx512_fma3_132_round<bits<8> opc, string OpcodeStr, SDNode OpNode,
X86FoldableSchedWrite sched,		X86FoldableSchedWrite sched,
X86VectorVTInfo _, string Suff> {		X86VectorVTInfo _, string Suff> {
let Constraints = "$src1 = $dst", ExeDomain = _.ExeDomain, hasSideEffects = 0 in		let Constraints = "$src1 = $dst", ExeDomain = _.ExeDomain, hasSideEffects = 0 in
defm rb: AVX512_maskable_3src<opc, MRMSrcReg, _, (outs _.RC:$dst),		defm rb: AVX512_maskable_3src<opc, MRMSrcReg, _, (outs _.RC:$dst),
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	defm r_Int: AVX512_maskable_3src_scalar<opc, MRMSrcReg, _, (outs _.RC:$dst),
(ins _.RC:$src2, _.RC:$src3), OpcodeStr,		(ins _.RC:$src2, _.RC:$src3), OpcodeStr,
"$src3, $src2", "$src2, $src3", (null_frag), 1, 1>,		"$src3, $src2", "$src2, $src3", (null_frag), 1, 1>,
AVX512FMA3Base, Sched<[SchedWriteFMA.Scl]>;		AVX512FMA3Base, Sched<[SchedWriteFMA.Scl]>;

let mayLoad = 1 in		let mayLoad = 1 in
defm m_Int: AVX512_maskable_3src_scalar<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm m_Int: AVX512_maskable_3src_scalar<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src2, _.IntScalarMemOp:$src3), OpcodeStr,		(ins _.RC:$src2, _.IntScalarMemOp:$src3), OpcodeStr,
"$src3, $src2", "$src2, $src3", (null_frag), 1, 1>,		"$src3, $src2", "$src2, $src3", (null_frag), 1, 1>,
AVX512FMA3Base, Sched<[SchedWriteFMA.Scl.Folded, ReadAfterLd]>;		AVX512FMA3Base, Sched<[SchedWriteFMA.Scl.Folded, SchedWriteFMA.Scl.ReadAfterFold]>;

defm rb_Int: AVX512_maskable_3src_scalar<opc, MRMSrcReg, _, (outs _.RC:$dst),		defm rb_Int: AVX512_maskable_3src_scalar<opc, MRMSrcReg, _, (outs _.RC:$dst),
(ins _.RC:$src2, _.RC:$src3, AVX512RC:$rc),		(ins _.RC:$src2, _.RC:$src3, AVX512RC:$rc),
OpcodeStr, "$rc, $src3, $src2", "$src2, $src3, $rc", (null_frag), 1, 1>,		OpcodeStr, "$rc, $src3, $src2", "$src2, $src3, $rc", (null_frag), 1, 1>,
AVX512FMA3Base, EVEX_B, EVEX_RC, Sched<[SchedWriteFMA.Scl]>;		AVX512FMA3Base, EVEX_B, EVEX_RC, Sched<[SchedWriteFMA.Scl]>;

let isCodeGenOnly = 1, isCommutable = 1 in {		let isCodeGenOnly = 1, isCommutable = 1 in {
def r : AVX512FMA3S<opc, MRMSrcReg, (outs _.FRC:$dst),		def r : AVX512FMA3S<opc, MRMSrcReg, (outs _.FRC:$dst),
(ins _.FRC:$src1, _.FRC:$src2, _.FRC:$src3),		(ins _.FRC:$src1, _.FRC:$src2, _.FRC:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
!if(MaskOnlyReg, [], [RHS_r])>, Sched<[SchedWriteFMA.Scl]>;		!if(MaskOnlyReg, [], [RHS_r])>, Sched<[SchedWriteFMA.Scl]>;
def m : AVX512FMA3S<opc, MRMSrcMem, (outs _.FRC:$dst),		def m : AVX512FMA3S<opc, MRMSrcMem, (outs _.FRC:$dst),
(ins _.FRC:$src1, _.FRC:$src2, _.ScalarMemOp:$src3),		(ins _.FRC:$src1, _.FRC:$src2, _.ScalarMemOp:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
[RHS_m]>, Sched<[SchedWriteFMA.Scl.Folded, ReadAfterLd]>;		[RHS_m]>, Sched<[SchedWriteFMA.Scl.Folded, SchedWriteFMA.Scl.ReadAfterFold]>;

def rb : AVX512FMA3S<opc, MRMSrcReg, (outs _.FRC:$dst),		def rb : AVX512FMA3S<opc, MRMSrcReg, (outs _.FRC:$dst),
(ins _.FRC:$src1, _.FRC:$src2, _.FRC:$src3, AVX512RC:$rc),		(ins _.FRC:$src1, _.FRC:$src2, _.FRC:$src3, AVX512RC:$rc),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
!if(MaskOnlyReg, [], [RHS_b])>, EVEX_B, EVEX_RC,		!if(MaskOnlyReg, [], [RHS_b])>, EVEX_B, EVEX_RC,
Sched<[SchedWriteFMA.Scl]>;		Sched<[SchedWriteFMA.Scl]>;
}// isCodeGenOnly = 1		}// isCodeGenOnly = 1
▲ Show 20 Lines • Show All 285 Lines • ▼ Show 20 Lines	defm r: AVX512_maskable_3src<opc, MRMSrcReg, _, (outs _.RC:$dst),
OpcodeStr, "$src3, $src2", "$src2, $src3",		OpcodeStr, "$src3, $src2", "$src2, $src3",
(_.VT (OpNode _.RC:$src2, _.RC:$src3, _.RC:$src1)), 1, 1>,		(_.VT (OpNode _.RC:$src2, _.RC:$src3, _.RC:$src1)), 1, 1>,
AVX512FMA3Base, Sched<[sched]>;		AVX512FMA3Base, Sched<[sched]>;

defm m: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm m: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src2, _.MemOp:$src3),		(ins _.RC:$src2, _.MemOp:$src3),
OpcodeStr, "$src3, $src2", "$src2, $src3",		OpcodeStr, "$src3, $src2", "$src2, $src3",
(_.VT (OpNode _.RC:$src2, (_.LdFrag addr:$src3), _.RC:$src1))>,		(_.VT (OpNode _.RC:$src2, (_.LdFrag addr:$src3), _.RC:$src1))>,
AVX512FMA3Base, Sched<[sched.Folded, ReadAfterLd]>;		AVX512FMA3Base, Sched<[sched.Folded, sched.ReadAfterFold]>;

defm mb: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm mb: AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src2, _.ScalarMemOp:$src3),		(ins _.RC:$src2, _.ScalarMemOp:$src3),
OpcodeStr, !strconcat("${src3}", _.BroadcastStr,", $src2"),		OpcodeStr, !strconcat("${src3}", _.BroadcastStr,", $src2"),
!strconcat("$src2, ${src3}", _.BroadcastStr ),		!strconcat("$src2, ${src3}", _.BroadcastStr ),
(OpNode _.RC:$src2,		(OpNode _.RC:$src2,
(_.VT (X86VBroadcast (_.ScalarLdFrag addr:$src3))),		(_.VT (X86VBroadcast (_.ScalarLdFrag addr:$src3))),
_.RC:$src1)>,		_.RC:$src1)>,
AVX512FMA3Base, EVEX_B, Sched<[sched.Folded, ReadAfterLd]>;		AVX512FMA3Base, EVEX_B, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}
} // Constraints = "$src1 = $dst"		} // Constraints = "$src1 = $dst"

multiclass avx512_pmadd52_common<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass avx512_pmadd52_common<bits<8> opc, string OpcodeStr, SDNode OpNode,
X86SchedWriteWidths sched, AVX512VLVectorVTInfo _> {		X86SchedWriteWidths sched, AVX512VLVectorVTInfo _> {
let Predicates = [HasIFMA] in {		let Predicates = [HasIFMA] in {
defm Z : avx512_pmadd52_rm<opc, OpcodeStr, OpNode, sched.ZMM, _.info512>,		defm Z : avx512_pmadd52_rm<opc, OpcodeStr, OpNode, sched.ZMM, _.info512>,
Show All 25 Lines	let hasSideEffects = 0 in {
def rr : SI<opc, MRMSrcReg, (outs DstVT.FRC:$dst),		def rr : SI<opc, MRMSrcReg, (outs DstVT.FRC:$dst),
(ins DstVT.FRC:$src1, SrcRC:$src),		(ins DstVT.FRC:$src1, SrcRC:$src),
!strconcat(asm,"\t{$src, $src1, $dst\|$dst, $src1, $src}"), []>,		!strconcat(asm,"\t{$src, $src1, $dst\|$dst, $src1, $src}"), []>,
EVEX_4V, Sched<[sched]>;		EVEX_4V, Sched<[sched]>;
let mayLoad = 1 in		let mayLoad = 1 in
def rm : SI<opc, MRMSrcMem, (outs DstVT.FRC:$dst),		def rm : SI<opc, MRMSrcMem, (outs DstVT.FRC:$dst),
(ins DstVT.FRC:$src1, x86memop:$src),		(ins DstVT.FRC:$src1, x86memop:$src),
!strconcat(asm,"\t{$src, $src1, $dst\|$dst, $src1, $src}"), []>,		!strconcat(asm,"\t{$src, $src1, $dst\|$dst, $src1, $src}"), []>,
EVEX_4V, Sched<[sched.Folded, ReadAfterLd]>;		EVEX_4V, Sched<[sched.Folded, sched.ReadAfterFold]>;
} // hasSideEffects = 0		} // hasSideEffects = 0
let isCodeGenOnly = 1 in {		let isCodeGenOnly = 1 in {
def rr_Int : SI<opc, MRMSrcReg, (outs DstVT.RC:$dst),		def rr_Int : SI<opc, MRMSrcReg, (outs DstVT.RC:$dst),
(ins DstVT.RC:$src1, SrcRC:$src2),		(ins DstVT.RC:$src1, SrcRC:$src2),
!strconcat(asm,"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(asm,"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set DstVT.RC:$dst,		[(set DstVT.RC:$dst,
(OpNode (DstVT.VT DstVT.RC:$src1),		(OpNode (DstVT.VT DstVT.RC:$src1),
SrcRC:$src2,		SrcRC:$src2,
(i32 FROUND_CURRENT)))]>,		(i32 FROUND_CURRENT)))]>,
EVEX_4V, Sched<[sched]>;		EVEX_4V, Sched<[sched]>;

def rm_Int : SI<opc, MRMSrcMem, (outs DstVT.RC:$dst),		def rm_Int : SI<opc, MRMSrcMem, (outs DstVT.RC:$dst),
(ins DstVT.RC:$src1, x86memop:$src2),		(ins DstVT.RC:$src1, x86memop:$src2),
!strconcat(asm,"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(asm,"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set DstVT.RC:$dst,		[(set DstVT.RC:$dst,
(OpNode (DstVT.VT DstVT.RC:$src1),		(OpNode (DstVT.VT DstVT.RC:$src1),
(ld_frag addr:$src2),		(ld_frag addr:$src2),
(i32 FROUND_CURRENT)))]>,		(i32 FROUND_CURRENT)))]>,
EVEX_4V, Sched<[sched.Folded, ReadAfterLd]>;		EVEX_4V, Sched<[sched.Folded, sched.ReadAfterFold]>;
}//isCodeGenOnly = 1		}//isCodeGenOnly = 1
}		}

multiclass avx512_vcvtsi_round<bits<8> opc, SDNode OpNode,		multiclass avx512_vcvtsi_round<bits<8> opc, SDNode OpNode,
X86FoldableSchedWrite sched, RegisterClass SrcRC,		X86FoldableSchedWrite sched, RegisterClass SrcRC,
X86VectorVTInfo DstVT, string asm> {		X86VectorVTInfo DstVT, string asm> {
def rrb_Int : SI<opc, MRMSrcReg, (outs DstVT.RC:$dst),		def rrb_Int : SI<opc, MRMSrcReg, (outs DstVT.RC:$dst),
(ins DstVT.RC:$src1, SrcRC:$src2, AVX512RC:$rc),		(ins DstVT.RC:$src1, SrcRC:$src2, AVX512RC:$rc),
▲ Show 20 Lines • Show All 109 Lines • ▼ Show 20 Lines	def rrb_Int : SI<opc, MRMSrcReg, (outs DstVT.RC:$dst), (ins SrcVT.RC:$src, AVX512RC:$rc),
[(set DstVT.RC:$dst, (OpNodeRnd (SrcVT.VT SrcVT.RC:$src),(i32 imm:$rc)))]>,		[(set DstVT.RC:$dst, (OpNodeRnd (SrcVT.VT SrcVT.RC:$src),(i32 imm:$rc)))]>,
EVEX, VEX_LIG, EVEX_B, EVEX_RC,		EVEX, VEX_LIG, EVEX_B, EVEX_RC,
Sched<[sched]>;		Sched<[sched]>;
let isCodeGenOnly = CodeGenOnly, ForceDisassemble = CodeGenOnly in		let isCodeGenOnly = CodeGenOnly, ForceDisassemble = CodeGenOnly in
def rm_Int : SI<opc, MRMSrcMem, (outs DstVT.RC:$dst), (ins SrcVT.IntScalarMemOp:$src),		def rm_Int : SI<opc, MRMSrcMem, (outs DstVT.RC:$dst), (ins SrcVT.IntScalarMemOp:$src),
!strconcat(asm,"\t{$src, $dst\|$dst, $src}"),		!strconcat(asm,"\t{$src, $dst\|$dst, $src}"),
[(set DstVT.RC:$dst, (OpNode		[(set DstVT.RC:$dst, (OpNode
(SrcVT.VT SrcVT.ScalarIntMemCPat:$src)))]>,		(SrcVT.VT SrcVT.ScalarIntMemCPat:$src)))]>,
EVEX, VEX_LIG, Sched<[sched.Folded, ReadAfterLd]>;		EVEX, VEX_LIG, Sched<[sched.Folded, sched.ReadAfterFold]>;

def : InstAlias<"v" # asm # aliasStr # "\t{$src, $dst\|$dst, $src}",		def : InstAlias<"v" # asm # aliasStr # "\t{$src, $dst\|$dst, $src}",
(!cast<Instruction>(NAME # "rr_Int") DstVT.RC:$dst, SrcVT.RC:$src), 0, "att">;		(!cast<Instruction>(NAME # "rr_Int") DstVT.RC:$dst, SrcVT.RC:$src), 0, "att">;
def : InstAlias<"v" # asm # aliasStr # "\t{$rc, $src, $dst\|$dst, $src, $rc}",		def : InstAlias<"v" # asm # aliasStr # "\t{$rc, $src, $dst\|$dst, $src, $rc}",
(!cast<Instruction>(NAME # "rrb_Int") DstVT.RC:$dst, SrcVT.RC:$src, AVX512RC:$rc), 0, "att">;		(!cast<Instruction>(NAME # "rrb_Int") DstVT.RC:$dst, SrcVT.RC:$src, AVX512RC:$rc), 0, "att">;
} // Predicates = [HasAVX512]		} // Predicates = [HasAVX512]
}		}

▲ Show 20 Lines • Show All 130 Lines • ▼ Show 20 Lines	let Predicates = [HasAVX512] in {
let isCodeGenOnly = 1 in {		let isCodeGenOnly = 1 in {
def rr : AVX512<opc, MRMSrcReg, (outs _DstRC.RC:$dst), (ins _SrcRC.FRC:$src),		def rr : AVX512<opc, MRMSrcReg, (outs _DstRC.RC:$dst), (ins _SrcRC.FRC:$src),
!strconcat(asm,"\t{$src, $dst\|$dst, $src}"),		!strconcat(asm,"\t{$src, $dst\|$dst, $src}"),
[(set _DstRC.RC:$dst, (OpNode _SrcRC.FRC:$src))]>,		[(set _DstRC.RC:$dst, (OpNode _SrcRC.FRC:$src))]>,
EVEX, Sched<[sched]>;		EVEX, Sched<[sched]>;
def rm : AVX512<opc, MRMSrcMem, (outs _DstRC.RC:$dst), (ins _SrcRC.ScalarMemOp:$src),		def rm : AVX512<opc, MRMSrcMem, (outs _DstRC.RC:$dst), (ins _SrcRC.ScalarMemOp:$src),
!strconcat(asm,"\t{$src, $dst\|$dst, $src}"),		!strconcat(asm,"\t{$src, $dst\|$dst, $src}"),
[(set _DstRC.RC:$dst, (OpNode (_SrcRC.ScalarLdFrag addr:$src)))]>,		[(set _DstRC.RC:$dst, (OpNode (_SrcRC.ScalarLdFrag addr:$src)))]>,
EVEX, Sched<[sched.Folded, ReadAfterLd]>;		EVEX, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

def rr_Int : AVX512<opc, MRMSrcReg, (outs _DstRC.RC:$dst), (ins _SrcRC.RC:$src),		def rr_Int : AVX512<opc, MRMSrcReg, (outs _DstRC.RC:$dst), (ins _SrcRC.RC:$src),
!strconcat(asm,"\t{$src, $dst\|$dst, $src}"),		!strconcat(asm,"\t{$src, $dst\|$dst, $src}"),
[(set _DstRC.RC:$dst, (OpNodeInt (_SrcRC.VT _SrcRC.RC:$src)))]>,		[(set _DstRC.RC:$dst, (OpNodeInt (_SrcRC.VT _SrcRC.RC:$src)))]>,
EVEX, VEX_LIG, Sched<[sched]>;		EVEX, VEX_LIG, Sched<[sched]>;
def rrb_Int : AVX512<opc, MRMSrcReg, (outs _DstRC.RC:$dst), (ins _SrcRC.RC:$src),		def rrb_Int : AVX512<opc, MRMSrcReg, (outs _DstRC.RC:$dst), (ins _SrcRC.RC:$src),
!strconcat(asm,"\t{{sae}, $src, $dst\|$dst, $src, {sae}}"),		!strconcat(asm,"\t{{sae}, $src, $dst\|$dst, $src, {sae}}"),
[(set _DstRC.RC:$dst, (OpNodeRnd (_SrcRC.VT _SrcRC.RC:$src),		[(set _DstRC.RC:$dst, (OpNodeRnd (_SrcRC.VT _SrcRC.RC:$src),
(i32 FROUND_NO_EXC)))]>,		(i32 FROUND_NO_EXC)))]>,
EVEX,VEX_LIG , EVEX_B, Sched<[sched]>;		EVEX,VEX_LIG , EVEX_B, Sched<[sched]>;
let isCodeGenOnly = CodeGenOnly, ForceDisassemble = CodeGenOnly in		let isCodeGenOnly = CodeGenOnly, ForceDisassemble = CodeGenOnly in
def rm_Int : AVX512<opc, MRMSrcMem, (outs _DstRC.RC:$dst),		def rm_Int : AVX512<opc, MRMSrcMem, (outs _DstRC.RC:$dst),
(ins _SrcRC.IntScalarMemOp:$src),		(ins _SrcRC.IntScalarMemOp:$src),
!strconcat(asm,"\t{$src, $dst\|$dst, $src}"),		!strconcat(asm,"\t{$src, $dst\|$dst, $src}"),
[(set _DstRC.RC:$dst,		[(set _DstRC.RC:$dst,
(OpNodeInt (_SrcRC.VT _SrcRC.ScalarIntMemCPat:$src)))]>,		(OpNodeInt (_SrcRC.VT _SrcRC.ScalarIntMemCPat:$src)))]>,
EVEX, VEX_LIG, Sched<[sched.Folded, ReadAfterLd]>;		EVEX, VEX_LIG, Sched<[sched.Folded, sched.ReadAfterFold]>;

def : InstAlias<asm # aliasStr # "\t{$src, $dst\|$dst, $src}",		def : InstAlias<asm # aliasStr # "\t{$src, $dst\|$dst, $src}",
(!cast<Instruction>(NAME # "rr_Int") _DstRC.RC:$dst, _SrcRC.RC:$src), 0, "att">;		(!cast<Instruction>(NAME # "rr_Int") _DstRC.RC:$dst, _SrcRC.RC:$src), 0, "att">;
def : InstAlias<asm # aliasStr # "\t{{sae}, $src, $dst\|$dst, $src, {sae}}",		def : InstAlias<asm # aliasStr # "\t{{sae}, $src, $dst\|$dst, $src, {sae}}",
(!cast<Instruction>(NAME # "rrb_Int") _DstRC.RC:$dst, _SrcRC.RC:$src), 0, "att">;		(!cast<Instruction>(NAME # "rrb_Int") _DstRC.RC:$dst, _SrcRC.RC:$src), 0, "att">;
} //HasAVX512		} //HasAVX512
}		}

▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines	defm rr_Int : AVX512_maskable_scalar<opc, MRMSrcReg, _, (outs _.RC:$dst),
EVEX_4V, VEX_LIG, Sched<[sched]>;		EVEX_4V, VEX_LIG, Sched<[sched]>;
defm rm_Int : AVX512_maskable_scalar<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rm_Int : AVX512_maskable_scalar<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _Src.IntScalarMemOp:$src2), OpcodeStr,		(ins _.RC:$src1, _Src.IntScalarMemOp:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(_.VT (OpNode (_.VT _.RC:$src1),		(_.VT (OpNode (_.VT _.RC:$src1),
(_Src.VT _Src.ScalarIntMemCPat:$src2),		(_Src.VT _Src.ScalarIntMemCPat:$src2),
(i32 FROUND_CURRENT)))>,		(i32 FROUND_CURRENT)))>,
EVEX_4V, VEX_LIG,		EVEX_4V, VEX_LIG,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;

let isCodeGenOnly = 1, hasSideEffects = 0 in {		let isCodeGenOnly = 1, hasSideEffects = 0 in {
def rr : I<opc, MRMSrcReg, (outs _.FRC:$dst),		def rr : I<opc, MRMSrcReg, (outs _.FRC:$dst),
(ins _.FRC:$src1, _Src.FRC:$src2),		(ins _.FRC:$src1, _Src.FRC:$src2),
OpcodeStr#"\t{$src2, $src1, $dst\|$dst, $src1, $src2}", []>,		OpcodeStr#"\t{$src2, $src1, $dst\|$dst, $src1, $src2}", []>,
EVEX_4V, VEX_LIG, Sched<[sched]>;		EVEX_4V, VEX_LIG, Sched<[sched]>;
let mayLoad = 1 in		let mayLoad = 1 in
def rm : I<opc, MRMSrcMem, (outs _.FRC:$dst),		def rm : I<opc, MRMSrcMem, (outs _.FRC:$dst),
(ins _.FRC:$src1, _Src.ScalarMemOp:$src2),		(ins _.FRC:$src1, _Src.ScalarMemOp:$src2),
OpcodeStr#"\t{$src2, $src1, $dst\|$dst, $src1, $src2}", []>,		OpcodeStr#"\t{$src2, $src1, $dst\|$dst, $src1, $src2}", []>,
EVEX_4V, VEX_LIG, Sched<[sched.Folded, ReadAfterLd]>;		EVEX_4V, VEX_LIG, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

// Scalar Coversion with SAE - suppress all exceptions		// Scalar Coversion with SAE - suppress all exceptions
multiclass avx512_cvt_fp_sae_scalar<bits<8> opc, string OpcodeStr, X86VectorVTInfo _,		multiclass avx512_cvt_fp_sae_scalar<bits<8> opc, string OpcodeStr, X86VectorVTInfo _,
X86VectorVTInfo _Src, SDNode OpNodeRnd,		X86VectorVTInfo _Src, SDNode OpNodeRnd,
X86FoldableSchedWrite sched> {		X86FoldableSchedWrite sched> {
defm rrb_Int : AVX512_maskable_scalar<opc, MRMSrcReg, _, (outs _.RC:$dst),		defm rrb_Int : AVX512_maskable_scalar<opc, MRMSrcReg, _, (outs _.RC:$dst),
▲ Show 20 Lines • Show All 981 Lines • ▼ Show 20 Lines	defm rr : AVX512_maskable_scalar<opc, MRMSrcReg, _, (outs _.RC:$dst),
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(OpNode (_.VT _.RC:$src1), (_.VT _.RC:$src2))>,		(OpNode (_.VT _.RC:$src1), (_.VT _.RC:$src2))>,
EVEX_4V, Sched<[sched]>;		EVEX_4V, Sched<[sched]>;
defm rm : AVX512_maskable_scalar<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rm : AVX512_maskable_scalar<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.IntScalarMemOp:$src2), OpcodeStr,		(ins _.RC:$src1, _.IntScalarMemOp:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(OpNode (_.VT _.RC:$src1),		(OpNode (_.VT _.RC:$src1),
_.ScalarIntMemCPat:$src2)>, EVEX_4V,		_.ScalarIntMemCPat:$src2)>, EVEX_4V,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

defm VRCP14SSZ : avx512_fp14_s<0x4D, "vrcp14ss", X86rcp14s, SchedWriteFRcp.Scl,		defm VRCP14SSZ : avx512_fp14_s<0x4D, "vrcp14ss", X86rcp14s, SchedWriteFRcp.Scl,
f32x_info>, EVEX_CD8<32, CD8VT1>,		f32x_info>, EVEX_CD8<32, CD8VT1>,
T8PD;		T8PD;
defm VRCP14SDZ : avx512_fp14_s<0x4D, "vrcp14sd", X86rcp14s, SchedWriteFRcp.Scl,		defm VRCP14SDZ : avx512_fp14_s<0x4D, "vrcp14sd", X86rcp14s, SchedWriteFRcp.Scl,
f64x_info>, VEX_W, EVEX_CD8<64, CD8VT1>,		f64x_info>, VEX_W, EVEX_CD8<64, CD8VT1>,
Show All 12 Lines	multiclass avx512_fp14_p<bits<8> opc, string OpcodeStr, SDNode OpNode,
defm r: AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),		defm r: AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),
(ins _.RC:$src), OpcodeStr, "$src", "$src",		(ins _.RC:$src), OpcodeStr, "$src", "$src",
(_.VT (OpNode _.RC:$src))>, EVEX, T8PD,		(_.VT (OpNode _.RC:$src))>, EVEX, T8PD,
Sched<[sched]>;		Sched<[sched]>;
defm m: AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm m: AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.MemOp:$src), OpcodeStr, "$src", "$src",		(ins _.MemOp:$src), OpcodeStr, "$src", "$src",
(OpNode (_.VT		(OpNode (_.VT
(bitconvert (_.LdFrag addr:$src))))>, EVEX, T8PD,		(bitconvert (_.LdFrag addr:$src))))>, EVEX, T8PD,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
defm mb: AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm mb: AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.ScalarMemOp:$src), OpcodeStr,		(ins _.ScalarMemOp:$src), OpcodeStr,
"${src}"##_.BroadcastStr, "${src}"##_.BroadcastStr,		"${src}"##_.BroadcastStr, "${src}"##_.BroadcastStr,
(OpNode (_.VT		(OpNode (_.VT
(X86VBroadcast (_.ScalarLdFrag addr:$src))))>,		(X86VBroadcast (_.ScalarLdFrag addr:$src))))>,
EVEX, T8PD, EVEX_B, Sched<[sched.Folded, ReadAfterLd]>;		EVEX, T8PD, EVEX_B, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

multiclass avx512_fp14_p_vl_all<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass avx512_fp14_p_vl_all<bits<8> opc, string OpcodeStr, SDNode OpNode,
X86SchedWriteWidths sched> {		X86SchedWriteWidths sched> {
defm PSZ : avx512_fp14_p<opc, !strconcat(OpcodeStr, "ps"), OpNode, sched.ZMM,		defm PSZ : avx512_fp14_p<opc, !strconcat(OpcodeStr, "ps"), OpNode, sched.ZMM,
v16f32_info>, EVEX_V512, EVEX_CD8<32, CD8VF>;		v16f32_info>, EVEX_V512, EVEX_CD8<32, CD8VF>;
defm PDZ : avx512_fp14_p<opc, !strconcat(OpcodeStr, "pd"), OpNode, sched.ZMM,		defm PDZ : avx512_fp14_p<opc, !strconcat(OpcodeStr, "pd"), OpNode, sched.ZMM,
Show All 37 Lines	defm rb : AVX512_maskable_scalar<opc, MRMSrcReg, _, (outs _.RC:$dst),
(i32 FROUND_NO_EXC))>, EVEX_B,		(i32 FROUND_NO_EXC))>, EVEX_B,
Sched<[sched]>;		Sched<[sched]>;

defm m : AVX512_maskable_scalar<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm m : AVX512_maskable_scalar<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.IntScalarMemOp:$src2), OpcodeStr,		(ins _.RC:$src1, _.IntScalarMemOp:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(OpNode (_.VT _.RC:$src1), _.ScalarIntMemCPat:$src2,		(OpNode (_.VT _.RC:$src1), _.ScalarIntMemCPat:$src2,
(i32 FROUND_CURRENT))>,		(i32 FROUND_CURRENT))>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

multiclass avx512_eri_s<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass avx512_eri_s<bits<8> opc, string OpcodeStr, SDNode OpNode,
X86FoldableSchedWrite sched> {		X86FoldableSchedWrite sched> {
defm SSZ : avx512_fp28_s<opc, OpcodeStr#"ss", f32x_info, OpNode, sched>,		defm SSZ : avx512_fp28_s<opc, OpcodeStr#"ss", f32x_info, OpNode, sched>,
EVEX_CD8<32, CD8VT1>;		EVEX_CD8<32, CD8VT1>;
defm SDZ : avx512_fp28_s<opc, OpcodeStr#"sd", f64x_info, OpNode, sched>,		defm SDZ : avx512_fp28_s<opc, OpcodeStr#"sd", f64x_info, OpNode, sched>,
Show All 19 Lines	defm r : AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),
(OpNode (_.VT _.RC:$src), (i32 FROUND_CURRENT))>,		(OpNode (_.VT _.RC:$src), (i32 FROUND_CURRENT))>,
Sched<[sched]>;		Sched<[sched]>;

defm m : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm m : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.MemOp:$src), OpcodeStr, "$src", "$src",		(ins _.MemOp:$src), OpcodeStr, "$src", "$src",
(OpNode (_.VT		(OpNode (_.VT
(bitconvert (_.LdFrag addr:$src))),		(bitconvert (_.LdFrag addr:$src))),
(i32 FROUND_CURRENT))>,		(i32 FROUND_CURRENT))>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;

defm mb : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm mb : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.ScalarMemOp:$src), OpcodeStr,		(ins _.ScalarMemOp:$src), OpcodeStr,
"${src}"##_.BroadcastStr, "${src}"##_.BroadcastStr,		"${src}"##_.BroadcastStr, "${src}"##_.BroadcastStr,
(OpNode (_.VT		(OpNode (_.VT
(X86VBroadcast (_.ScalarLdFrag addr:$src))),		(X86VBroadcast (_.ScalarLdFrag addr:$src))),
(i32 FROUND_CURRENT))>, EVEX_B,		(i32 FROUND_CURRENT))>, EVEX_B,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}
multiclass avx512_fp28_p_round<bits<8> opc, string OpcodeStr, X86VectorVTInfo _,		multiclass avx512_fp28_p_round<bits<8> opc, string OpcodeStr, X86VectorVTInfo _,
SDNode OpNode, X86FoldableSchedWrite sched> {		SDNode OpNode, X86FoldableSchedWrite sched> {
let ExeDomain = _.ExeDomain in		let ExeDomain = _.ExeDomain in
defm rb : AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),		defm rb : AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),
(ins _.RC:$src), OpcodeStr,		(ins _.RC:$src), OpcodeStr,
"{sae}, $src", "$src, {sae}",		"{sae}, $src", "$src, {sae}",
▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines	multiclass avx512_sqrt_packed<bits<8> opc, string OpcodeStr,
defm r: AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),		defm r: AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),
(ins _.RC:$src), OpcodeStr, "$src", "$src",		(ins _.RC:$src), OpcodeStr, "$src", "$src",
(_.VT (fsqrt _.RC:$src))>, EVEX,		(_.VT (fsqrt _.RC:$src))>, EVEX,
Sched<[sched]>;		Sched<[sched]>;
defm m: AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm m: AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.MemOp:$src), OpcodeStr, "$src", "$src",		(ins _.MemOp:$src), OpcodeStr, "$src", "$src",
(fsqrt (_.VT		(fsqrt (_.VT
(bitconvert (_.LdFrag addr:$src))))>, EVEX,		(bitconvert (_.LdFrag addr:$src))))>, EVEX,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
defm mb: AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm mb: AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.ScalarMemOp:$src), OpcodeStr,		(ins _.ScalarMemOp:$src), OpcodeStr,
"${src}"##_.BroadcastStr, "${src}"##_.BroadcastStr,		"${src}"##_.BroadcastStr, "${src}"##_.BroadcastStr,
(fsqrt (_.VT		(fsqrt (_.VT
(X86VBroadcast (_.ScalarLdFrag addr:$src))))>,		(X86VBroadcast (_.ScalarLdFrag addr:$src))))>,
EVEX, EVEX_B, Sched<[sched.Folded, ReadAfterLd]>;		EVEX, EVEX_B, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

multiclass avx512_sqrt_packed_all<bits<8> opc, string OpcodeStr,		multiclass avx512_sqrt_packed_all<bits<8> opc, string OpcodeStr,
X86SchedWriteSizes sched> {		X86SchedWriteSizes sched> {
defm PSZ : avx512_sqrt_packed<opc, !strconcat(OpcodeStr, "ps"),		defm PSZ : avx512_sqrt_packed<opc, !strconcat(OpcodeStr, "ps"),
sched.PS.ZMM, v16f32_info>,		sched.PS.ZMM, v16f32_info>,
EVEX_V512, PS, EVEX_CD8<32, CD8VF>;		EVEX_V512, PS, EVEX_CD8<32, CD8VF>;
Show All 38 Lines	defm r_Int : AVX512_maskable_scalar<opc, MRMSrcReg, _, (outs _.RC:$dst),
(i32 FROUND_CURRENT))>,		(i32 FROUND_CURRENT))>,
Sched<[sched]>;		Sched<[sched]>;
defm m_Int : AVX512_maskable_scalar<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm m_Int : AVX512_maskable_scalar<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.IntScalarMemOp:$src2), OpcodeStr,		(ins _.RC:$src1, _.IntScalarMemOp:$src2), OpcodeStr,
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(X86fsqrtRnds (_.VT _.RC:$src1),		(X86fsqrtRnds (_.VT _.RC:$src1),
_.ScalarIntMemCPat:$src2,		_.ScalarIntMemCPat:$src2,
(i32 FROUND_CURRENT))>,		(i32 FROUND_CURRENT))>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
defm rb_Int : AVX512_maskable_scalar<opc, MRMSrcReg, _, (outs _.RC:$dst),		defm rb_Int : AVX512_maskable_scalar<opc, MRMSrcReg, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.RC:$src2, AVX512RC:$rc), OpcodeStr,		(ins _.RC:$src1, _.RC:$src2, AVX512RC:$rc), OpcodeStr,
"$rc, $src2, $src1", "$src1, $src2, $rc",		"$rc, $src2, $src1", "$src1, $src2, $rc",
(X86fsqrtRnds (_.VT _.RC:$src1),		(X86fsqrtRnds (_.VT _.RC:$src1),
(_.VT _.RC:$src2),		(_.VT _.RC:$src2),
(i32 imm:$rc))>,		(i32 imm:$rc))>,
EVEX_B, EVEX_RC, Sched<[sched]>;		EVEX_B, EVEX_RC, Sched<[sched]>;

let isCodeGenOnly = 1, hasSideEffects = 0, Predicates=[HasAVX512] in {		let isCodeGenOnly = 1, hasSideEffects = 0, Predicates=[HasAVX512] in {
def r : I<opc, MRMSrcReg, (outs _.FRC:$dst),		def r : I<opc, MRMSrcReg, (outs _.FRC:$dst),
(ins _.FRC:$src1, _.FRC:$src2),		(ins _.FRC:$src1, _.FRC:$src2),
OpcodeStr#"\t{$src2, $src1, $dst\|$dst, $src1, $src2}", []>,		OpcodeStr#"\t{$src2, $src1, $dst\|$dst, $src1, $src2}", []>,
Sched<[sched]>;		Sched<[sched]>;
let mayLoad = 1 in		let mayLoad = 1 in
def m : I<opc, MRMSrcMem, (outs _.FRC:$dst),		def m : I<opc, MRMSrcMem, (outs _.FRC:$dst),
(ins _.FRC:$src1, _.ScalarMemOp:$src2),		(ins _.FRC:$src1, _.ScalarMemOp:$src2),
OpcodeStr#"\t{$src2, $src1, $dst\|$dst, $src1, $src2}", []>,		OpcodeStr#"\t{$src2, $src1, $dst\|$dst, $src1, $src2}", []>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

let Predicates = [HasAVX512] in {		let Predicates = [HasAVX512] in {
def : Pat<(_.EltVT (fsqrt _.FRC:$src)),		def : Pat<(_.EltVT (fsqrt _.FRC:$src)),
(!cast<Instruction>(Name#Zr)		(!cast<Instruction>(Name#Zr)
(_.EltVT (IMPLICIT_DEF)), _.FRC:$src)>;		(_.EltVT (IMPLICIT_DEF)), _.FRC:$src)>;
}		}
Show All 36 Lines	defm rb_Int : AVX512_maskable_scalar<opc, MRMSrcReg, _, (outs _.RC:$dst),
Sched<[sched]>;		Sched<[sched]>;

defm m_Int : AVX512_maskable_scalar<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm m_Int : AVX512_maskable_scalar<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.IntScalarMemOp:$src2, i32u8imm:$src3),		(ins _.RC:$src1, _.IntScalarMemOp:$src2, i32u8imm:$src3),
OpcodeStr,		OpcodeStr,
"$src3, $src2, $src1", "$src1, $src2, $src3",		"$src3, $src2, $src1", "$src1, $src2, $src3",
(_.VT (X86RndScales _.RC:$src1,		(_.VT (X86RndScales _.RC:$src1,
_.ScalarIntMemCPat:$src2, (i32 imm:$src3)))>,		_.ScalarIntMemCPat:$src2, (i32 imm:$src3)))>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;

let isCodeGenOnly = 1, hasSideEffects = 0, Predicates = [HasAVX512] in {		let isCodeGenOnly = 1, hasSideEffects = 0, Predicates = [HasAVX512] in {
def r : I<opc, MRMSrcReg, (outs _.FRC:$dst),		def r : I<opc, MRMSrcReg, (outs _.FRC:$dst),
(ins _.FRC:$src1, _.FRC:$src2, i32u8imm:$src3),		(ins _.FRC:$src1, _.FRC:$src2, i32u8imm:$src3),
OpcodeStr#"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",		OpcodeStr#"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",
[]>, Sched<[sched]>;		[]>, Sched<[sched]>;

let mayLoad = 1 in		let mayLoad = 1 in
def m : I<opc, MRMSrcMem, (outs _.FRC:$dst),		def m : I<opc, MRMSrcMem, (outs _.FRC:$dst),
(ins _.FRC:$src1, _.ScalarMemOp:$src2, i32u8imm:$src3),		(ins _.FRC:$src1, _.ScalarMemOp:$src2, i32u8imm:$src3),
OpcodeStr#"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",		OpcodeStr#"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",
[]>, Sched<[sched.Folded, ReadAfterLd]>;		[]>, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

let Predicates = [HasAVX512] in {		let Predicates = [HasAVX512] in {
def : Pat<(ffloor _.FRC:$src),		def : Pat<(ffloor _.FRC:$src),
(_.EltVT (!cast<Instruction>(NAME##r) (_.EltVT (IMPLICIT_DEF)),		(_.EltVT (!cast<Instruction>(NAME##r) (_.EltVT (IMPLICIT_DEF)),
_.FRC:$src, (i32 0x9)))>;		_.FRC:$src, (i32 0x9)))>;
def : Pat<(fceil _.FRC:$src),		def : Pat<(fceil _.FRC:$src),
▲ Show 20 Lines • Show All 892 Lines • ▼ Show 20 Lines	defm rr : AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),
(_.VT (X86expand _.RC:$src1))>, AVX5128IBase,		(_.VT (X86expand _.RC:$src1))>, AVX5128IBase,
Sched<[sched]>;		Sched<[sched]>;

defm rm : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rm : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.MemOp:$src1), OpcodeStr, "$src1", "$src1",		(ins _.MemOp:$src1), OpcodeStr, "$src1", "$src1",
(_.VT (X86expand (_.VT (bitconvert		(_.VT (X86expand (_.VT (bitconvert
(_.LdFrag addr:$src1)))))>,		(_.LdFrag addr:$src1)))))>,
AVX5128IBase, EVEX_CD8<_.EltSize, CD8VT1>,		AVX5128IBase, EVEX_CD8<_.EltSize, CD8VT1>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass expand_by_vec_width_lowering<X86VectorVTInfo _, string Name> {		multiclass expand_by_vec_width_lowering<X86VectorVTInfo _, string Name> {

def : Pat<(_.VT (X86mExpandingLoad addr:$src, _.KRCWM:$mask, undef)),		def : Pat<(_.VT (X86mExpandingLoad addr:$src, _.KRCWM:$mask, undef)),
(!cast<Instruction>(Name#_.ZSuffix##rmkz)		(!cast<Instruction>(Name#_.ZSuffix##rmkz)
_.KRCWM:$mask, addr:$src)>;		_.KRCWM:$mask, addr:$src)>;

▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines	defm rri : AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),
OpcodeStr##_.Suffix, "$src2, $src1", "$src1, $src2",		OpcodeStr##_.Suffix, "$src2, $src1", "$src1, $src2",
(OpNode (_.VT _.RC:$src1),		(OpNode (_.VT _.RC:$src1),
(i32 imm:$src2))>, Sched<[sched]>;		(i32 imm:$src2))>, Sched<[sched]>;
defm rmi : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmi : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.MemOp:$src1, i32u8imm:$src2),		(ins _.MemOp:$src1, i32u8imm:$src2),
OpcodeStr##_.Suffix, "$src2, $src1", "$src1, $src2",		OpcodeStr##_.Suffix, "$src2, $src1", "$src1, $src2",
(OpNode (_.VT (bitconvert (_.LdFrag addr:$src1))),		(OpNode (_.VT (bitconvert (_.LdFrag addr:$src1))),
(i32 imm:$src2))>,		(i32 imm:$src2))>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
defm rmbi : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmbi : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.ScalarMemOp:$src1, i32u8imm:$src2),		(ins _.ScalarMemOp:$src1, i32u8imm:$src2),
OpcodeStr##_.Suffix, "$src2, ${src1}"##_.BroadcastStr,		OpcodeStr##_.Suffix, "$src2, ${src1}"##_.BroadcastStr,
"${src1}"##_.BroadcastStr##", $src2",		"${src1}"##_.BroadcastStr##", $src2",
(OpNode (_.VT (X86VBroadcast(_.ScalarLdFrag addr:$src1))),		(OpNode (_.VT (X86VBroadcast(_.ScalarLdFrag addr:$src1))),
(i32 imm:$src2))>, EVEX_B,		(i32 imm:$src2))>, EVEX_B,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

//handle instruction reg_vec1 = op(reg_vec2,reg_vec3,imm),{sae}		//handle instruction reg_vec1 = op(reg_vec2,reg_vec3,imm),{sae}
multiclass avx512_unary_fp_sae_packed_imm<bits<8> opc, string OpcodeStr,		multiclass avx512_unary_fp_sae_packed_imm<bits<8> opc, string OpcodeStr,
SDNode OpNode, X86FoldableSchedWrite sched,		SDNode OpNode, X86FoldableSchedWrite sched,
X86VectorVTInfo _> {		X86VectorVTInfo _> {
let ExeDomain = _.ExeDomain in		let ExeDomain = _.ExeDomain in
Show All 39 Lines	defm rri : AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),
(i32 imm:$src3))>,		(i32 imm:$src3))>,
Sched<[sched]>;		Sched<[sched]>;
defm rmi : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmi : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.MemOp:$src2, i32u8imm:$src3),		(ins _.RC:$src1, _.MemOp:$src2, i32u8imm:$src3),
OpcodeStr, "$src3, $src2, $src1", "$src1, $src2, $src3",		OpcodeStr, "$src3, $src2, $src1", "$src1, $src2, $src3",
(OpNode (_.VT _.RC:$src1),		(OpNode (_.VT _.RC:$src1),
(_.VT (bitconvert (_.LdFrag addr:$src2))),		(_.VT (bitconvert (_.LdFrag addr:$src2))),
(i32 imm:$src3))>,		(i32 imm:$src3))>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
defm rmbi : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmbi : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.ScalarMemOp:$src2, i32u8imm:$src3),		(ins _.RC:$src1, _.ScalarMemOp:$src2, i32u8imm:$src3),
OpcodeStr, "$src3, ${src2}"##_.BroadcastStr##", $src1",		OpcodeStr, "$src3, ${src2}"##_.BroadcastStr##", $src1",
"$src1, ${src2}"##_.BroadcastStr##", $src3",		"$src1, ${src2}"##_.BroadcastStr##", $src3",
(OpNode (_.VT _.RC:$src1),		(OpNode (_.VT _.RC:$src1),
(_.VT (X86VBroadcast(_.ScalarLdFrag addr:$src2))),		(_.VT (X86VBroadcast(_.ScalarLdFrag addr:$src2))),
(i32 imm:$src3))>, EVEX_B,		(i32 imm:$src3))>, EVEX_B,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

//handle instruction reg_vec1 = op(reg_vec2,reg_vec3,imm)		//handle instruction reg_vec1 = op(reg_vec2,reg_vec3,imm)
// op(reg_vec2,mem_vec,imm)		// op(reg_vec2,mem_vec,imm)
multiclass avx512_3Op_rm_imm8<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass avx512_3Op_rm_imm8<bits<8> opc, string OpcodeStr, SDNode OpNode,
X86FoldableSchedWrite sched, X86VectorVTInfo DestInfo,		X86FoldableSchedWrite sched, X86VectorVTInfo DestInfo,
X86VectorVTInfo SrcInfo>{		X86VectorVTInfo SrcInfo>{
let ExeDomain = DestInfo.ExeDomain in {		let ExeDomain = DestInfo.ExeDomain in {
defm rri : AVX512_maskable<opc, MRMSrcReg, DestInfo, (outs DestInfo.RC:$dst),		defm rri : AVX512_maskable<opc, MRMSrcReg, DestInfo, (outs DestInfo.RC:$dst),
(ins SrcInfo.RC:$src1, SrcInfo.RC:$src2, u8imm:$src3),		(ins SrcInfo.RC:$src1, SrcInfo.RC:$src2, u8imm:$src3),
OpcodeStr, "$src3, $src2, $src1", "$src1, $src2, $src3",		OpcodeStr, "$src3, $src2, $src1", "$src1, $src2, $src3",
(DestInfo.VT (OpNode (SrcInfo.VT SrcInfo.RC:$src1),		(DestInfo.VT (OpNode (SrcInfo.VT SrcInfo.RC:$src1),
(SrcInfo.VT SrcInfo.RC:$src2),		(SrcInfo.VT SrcInfo.RC:$src2),
(i8 imm:$src3)))>,		(i8 imm:$src3)))>,
Sched<[sched]>;		Sched<[sched]>;
defm rmi : AVX512_maskable<opc, MRMSrcMem, DestInfo, (outs DestInfo.RC:$dst),		defm rmi : AVX512_maskable<opc, MRMSrcMem, DestInfo, (outs DestInfo.RC:$dst),
(ins SrcInfo.RC:$src1, SrcInfo.MemOp:$src2, u8imm:$src3),		(ins SrcInfo.RC:$src1, SrcInfo.MemOp:$src2, u8imm:$src3),
OpcodeStr, "$src3, $src2, $src1", "$src1, $src2, $src3",		OpcodeStr, "$src3, $src2, $src1", "$src1, $src2, $src3",
(DestInfo.VT (OpNode (SrcInfo.VT SrcInfo.RC:$src1),		(DestInfo.VT (OpNode (SrcInfo.VT SrcInfo.RC:$src1),
(SrcInfo.VT (bitconvert		(SrcInfo.VT (bitconvert
(SrcInfo.LdFrag addr:$src2))),		(SrcInfo.LdFrag addr:$src2))),
(i8 imm:$src3)))>,		(i8 imm:$src3)))>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

//handle instruction reg_vec1 = op(reg_vec2,reg_vec3,imm)		//handle instruction reg_vec1 = op(reg_vec2,reg_vec3,imm)
// op(reg_vec2,mem_vec,imm)		// op(reg_vec2,mem_vec,imm)
// op(reg_vec2,broadcast(eltVt),imm)		// op(reg_vec2,broadcast(eltVt),imm)
multiclass avx512_3Op_imm8<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass avx512_3Op_imm8<bits<8> opc, string OpcodeStr, SDNode OpNode,
X86FoldableSchedWrite sched, X86VectorVTInfo _>:		X86FoldableSchedWrite sched, X86VectorVTInfo _>:
avx512_3Op_rm_imm8<opc, OpcodeStr, OpNode, sched, _, _>{		avx512_3Op_rm_imm8<opc, OpcodeStr, OpNode, sched, _, _>{

let ExeDomain = _.ExeDomain in		let ExeDomain = _.ExeDomain in
defm rmbi : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmbi : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.ScalarMemOp:$src2, u8imm:$src3),		(ins _.RC:$src1, _.ScalarMemOp:$src2, u8imm:$src3),
OpcodeStr, "$src3, ${src2}"##_.BroadcastStr##", $src1",		OpcodeStr, "$src3, ${src2}"##_.BroadcastStr##", $src1",
"$src1, ${src2}"##_.BroadcastStr##", $src3",		"$src1, ${src2}"##_.BroadcastStr##", $src3",
(OpNode (_.VT _.RC:$src1),		(OpNode (_.VT _.RC:$src1),
(_.VT (X86VBroadcast(_.ScalarLdFrag addr:$src2))),		(_.VT (X86VBroadcast(_.ScalarLdFrag addr:$src2))),
(i8 imm:$src3))>, EVEX_B,		(i8 imm:$src3))>, EVEX_B,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

//handle scalar instruction reg_vec1 = op(reg_vec2,reg_vec3,imm)		//handle scalar instruction reg_vec1 = op(reg_vec2,reg_vec3,imm)
// op(reg_vec2,mem_scalar,imm)		// op(reg_vec2,mem_scalar,imm)
multiclass avx512_fp_scalar_imm<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass avx512_fp_scalar_imm<bits<8> opc, string OpcodeStr, SDNode OpNode,
X86FoldableSchedWrite sched, X86VectorVTInfo _> {		X86FoldableSchedWrite sched, X86VectorVTInfo _> {
let ExeDomain = _.ExeDomain in {		let ExeDomain = _.ExeDomain in {
defm rri : AVX512_maskable_scalar<opc, MRMSrcReg, _, (outs _.RC:$dst),		defm rri : AVX512_maskable_scalar<opc, MRMSrcReg, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.RC:$src2, i32u8imm:$src3),		(ins _.RC:$src1, _.RC:$src2, i32u8imm:$src3),
OpcodeStr, "$src3, $src2, $src1", "$src1, $src2, $src3",		OpcodeStr, "$src3, $src2, $src1", "$src1, $src2, $src3",
(OpNode (_.VT _.RC:$src1),		(OpNode (_.VT _.RC:$src1),
(_.VT _.RC:$src2),		(_.VT _.RC:$src2),
(i32 imm:$src3))>,		(i32 imm:$src3))>,
Sched<[sched]>;		Sched<[sched]>;
defm rmi : AVX512_maskable_scalar<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmi : AVX512_maskable_scalar<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.ScalarMemOp:$src2, i32u8imm:$src3),		(ins _.RC:$src1, _.ScalarMemOp:$src2, i32u8imm:$src3),
OpcodeStr, "$src3, $src2, $src1", "$src1, $src2, $src3",		OpcodeStr, "$src3, $src2, $src1", "$src1, $src2, $src3",
(OpNode (_.VT _.RC:$src1),		(OpNode (_.VT _.RC:$src1),
(_.VT (scalar_to_vector		(_.VT (scalar_to_vector
(_.ScalarLdFrag addr:$src2))),		(_.ScalarLdFrag addr:$src2))),
(i32 imm:$src3))>,		(i32 imm:$src3))>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

//handle instruction reg_vec1 = op(reg_vec2,reg_vec3,imm),{sae}		//handle instruction reg_vec1 = op(reg_vec2,reg_vec3,imm),{sae}
multiclass avx512_fp_sae_packed_imm<bits<8> opc, string OpcodeStr,		multiclass avx512_fp_sae_packed_imm<bits<8> opc, string OpcodeStr,
SDNode OpNode, X86FoldableSchedWrite sched,		SDNode OpNode, X86FoldableSchedWrite sched,
X86VectorVTInfo _> {		X86VectorVTInfo _> {
let ExeDomain = _.ExeDomain in		let ExeDomain = _.ExeDomain in
▲ Show 20 Lines • Show All 349 Lines • ▼ Show 20 Lines	multiclass avx512_shuff_packed_128_common<bits<8> opc, string OpcodeStr,
defm rmi : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmi : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.MemOp:$src2, u8imm:$src3),		(ins _.RC:$src1, _.MemOp:$src2, u8imm:$src3),
OpcodeStr, "$src3, $src2, $src1", "$src1, $src2, $src3",		OpcodeStr, "$src3, $src2, $src1", "$src1, $src2, $src3",
(_.VT		(_.VT
(bitconvert		(bitconvert
(CastInfo.VT (X86Shuf128 _.RC:$src1,		(CastInfo.VT (X86Shuf128 _.RC:$src1,
(bitconvert (_.LdFrag addr:$src2)),		(bitconvert (_.LdFrag addr:$src2)),
(i8 imm:$src3)))))>,		(i8 imm:$src3)))))>,
Sched<[sched.Folded, ReadAfterLd]>,		Sched<[sched.Folded, sched.ReadAfterFold]>,
EVEX2VEXOverride<EVEX2VEXOvrd#"rm">;		EVEX2VEXOverride<EVEX2VEXOvrd#"rm">;
defm rmbi : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmbi : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.ScalarMemOp:$src2, u8imm:$src3),		(ins _.RC:$src1, _.ScalarMemOp:$src2, u8imm:$src3),
OpcodeStr, "$src3, ${src2}"##_.BroadcastStr##", $src1",		OpcodeStr, "$src3, ${src2}"##_.BroadcastStr##", $src1",
"$src1, ${src2}"##_.BroadcastStr##", $src3",		"$src1, ${src2}"##_.BroadcastStr##", $src3",
(_.VT		(_.VT
(bitconvert		(bitconvert
(CastInfo.VT		(CastInfo.VT
(X86Shuf128 _.RC:$src1,		(X86Shuf128 _.RC:$src1,
(X86VBroadcast (_.ScalarLdFrag addr:$src2)),		(X86VBroadcast (_.ScalarLdFrag addr:$src2)),
(i8 imm:$src3)))))>, EVEX_B,		(i8 imm:$src3)))))>, EVEX_B,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

multiclass avx512_shuff_packed_128<string OpcodeStr, X86FoldableSchedWrite sched,		multiclass avx512_shuff_packed_128<string OpcodeStr, X86FoldableSchedWrite sched,
AVX512VLVectorVTInfo _,		AVX512VLVectorVTInfo _,
AVX512VLVectorVTInfo CastInfo, bits<8> opc,		AVX512VLVectorVTInfo CastInfo, bits<8> opc,
string EVEX2VEXOvrd>{		string EVEX2VEXOvrd>{
let Predicates = [HasAVX512] in		let Predicates = [HasAVX512] in
▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines	defm rri : AVX512_maskable<opc, MRMSrcReg, _, (outs _.RC:$dst),
(_.VT (X86VAlign _.RC:$src1, _.RC:$src2, (i8 imm:$src3)))>,		(_.VT (X86VAlign _.RC:$src1, _.RC:$src2, (i8 imm:$src3)))>,
Sched<[sched]>, EVEX2VEXOverride<"VPALIGNRrri">;		Sched<[sched]>, EVEX2VEXOverride<"VPALIGNRrri">;
defm rmi : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmi : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.MemOp:$src2, u8imm:$src3),		(ins _.RC:$src1, _.MemOp:$src2, u8imm:$src3),
OpcodeStr, "$src3, $src2, $src1", "$src1, $src2, $src3",		OpcodeStr, "$src3, $src2, $src1", "$src1, $src2, $src3",
(_.VT (X86VAlign _.RC:$src1,		(_.VT (X86VAlign _.RC:$src1,
(bitconvert (_.LdFrag addr:$src2)),		(bitconvert (_.LdFrag addr:$src2)),
(i8 imm:$src3)))>,		(i8 imm:$src3)))>,
Sched<[sched.Folded, ReadAfterLd]>,		Sched<[sched.Folded, sched.ReadAfterFold]>,
EVEX2VEXOverride<"VPALIGNRrmi">;		EVEX2VEXOverride<"VPALIGNRrmi">;

defm rmbi : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmbi : AVX512_maskable<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src1, _.ScalarMemOp:$src2, u8imm:$src3),		(ins _.RC:$src1, _.ScalarMemOp:$src2, u8imm:$src3),
OpcodeStr, "$src3, ${src2}"##_.BroadcastStr##", $src1",		OpcodeStr, "$src3, ${src2}"##_.BroadcastStr##", $src1",
"$src1, ${src2}"##_.BroadcastStr##", $src3",		"$src1, ${src2}"##_.BroadcastStr##", $src3",
(X86VAlign _.RC:$src1,		(X86VAlign _.RC:$src1,
(_.VT (X86VBroadcast(_.ScalarLdFrag addr:$src2))),		(_.VT (X86VBroadcast(_.ScalarLdFrag addr:$src2))),
(i8 imm:$src3))>, EVEX_B,		(i8 imm:$src3))>, EVEX_B,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

multiclass avx512_valign_common<string OpcodeStr, X86SchedWriteWidths sched,		multiclass avx512_valign_common<string OpcodeStr, X86SchedWriteWidths sched,
AVX512VLVectorVTInfo _> {		AVX512VLVectorVTInfo _> {
let Predicates = [HasAVX512] in {		let Predicates = [HasAVX512] in {
defm Z : avx512_valign<0x03, OpcodeStr, sched.ZMM, _.info512>,		defm Z : avx512_valign<0x03, OpcodeStr, sched.ZMM, _.info512>,
AVX512AIi8Base, EVEX_4V, EVEX_V512;		AVX512AIi8Base, EVEX_4V, EVEX_V512;
▲ Show 20 Lines • Show All 477 Lines • ▼ Show 20 Lines

multiclass avx512_insert_elt_m<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass avx512_insert_elt_m<bits<8> opc, string OpcodeStr, SDNode OpNode,
X86VectorVTInfo _, PatFrag LdFrag> {		X86VectorVTInfo _, PatFrag LdFrag> {
def rm : AVX512Ii8<opc, MRMSrcMem, (outs _.RC:$dst),		def rm : AVX512Ii8<opc, MRMSrcMem, (outs _.RC:$dst),
(ins _.RC:$src1, _.ScalarMemOp:$src2, u8imm:$src3),		(ins _.RC:$src1, _.ScalarMemOp:$src2, u8imm:$src3),
OpcodeStr#"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",		OpcodeStr#"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",
[(set _.RC:$dst,		[(set _.RC:$dst,
(_.VT (OpNode _.RC:$src1, (LdFrag addr:$src2), imm:$src3)))]>,		(_.VT (OpNode _.RC:$src1, (LdFrag addr:$src2), imm:$src3)))]>,
EVEX_4V, EVEX_CD8<_.EltSize, CD8VT1>, Sched<[WriteVecInsertLd, ReadAfterLd]>;		EVEX_4V, EVEX_CD8<_.EltSize, CD8VT1>, Sched<[WriteVecInsert.Folded, WriteVecInsert.ReadAfterFold]>;
}		}

multiclass avx512_insert_elt_bw<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass avx512_insert_elt_bw<bits<8> opc, string OpcodeStr, SDNode OpNode,
X86VectorVTInfo _, PatFrag LdFrag> {		X86VectorVTInfo _, PatFrag LdFrag> {
let Predicates = [HasBWI] in {		let Predicates = [HasBWI] in {
def rr : AVX512Ii8<opc, MRMSrcReg, (outs _.RC:$dst),		def rr : AVX512Ii8<opc, MRMSrcReg, (outs _.RC:$dst),
(ins _.RC:$src1, GR32orGR64:$src2, u8imm:$src3),		(ins _.RC:$src1, GR32orGR64:$src2, u8imm:$src3),
OpcodeStr#"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",		OpcodeStr#"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",
▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines	def rr : AVX512<opc, MRMr,
[(set _.RC:$dst,(_.VT (OpNode _.RC:$src1, (i8 imm:$src2))))]>,		[(set _.RC:$dst,(_.VT (OpNode _.RC:$src1, (i8 imm:$src2))))]>,
Sched<[sched]>;		Sched<[sched]>;
def rm : AVX512<opc, MRMm,		def rm : AVX512<opc, MRMm,
(outs _.RC:$dst), (ins _.MemOp:$src1, u8imm:$src2),		(outs _.RC:$dst), (ins _.MemOp:$src1, u8imm:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set _.RC:$dst,(_.VT (OpNode		[(set _.RC:$dst,(_.VT (OpNode
(_.VT (bitconvert (_.LdFrag addr:$src1))),		(_.VT (bitconvert (_.LdFrag addr:$src1))),
(i8 imm:$src2))))]>,		(i8 imm:$src2))))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass avx512_shift_packed_all<bits<8> opc, SDNode OpNode, Format MRMr,		multiclass avx512_shift_packed_all<bits<8> opc, SDNode OpNode, Format MRMr,
Format MRMm, string OpcodeStr,		Format MRMm, string OpcodeStr,
X86SchedWriteWidths sched, Predicate prd>{		X86SchedWriteWidths sched, Predicate prd>{
let Predicates = [prd] in		let Predicates = [prd] in
defm Z : avx512_shift_packed<opc, OpNode, MRMr, MRMm, OpcodeStr,		defm Z : avx512_shift_packed<opc, OpNode, MRMr, MRMm, OpcodeStr,
sched.ZMM, v64i8_info>, EVEX_V512;		sched.ZMM, v64i8_info>, EVEX_V512;
Show All 23 Lines	def rr : AVX512BI<opc, MRMSrcReg,
Sched<[sched]>;		Sched<[sched]>;
def rm : AVX512BI<opc, MRMSrcMem,		def rm : AVX512BI<opc, MRMSrcMem,
(outs _dst.RC:$dst), (ins _src.RC:$src1, _src.MemOp:$src2),		(outs _dst.RC:$dst), (ins _src.RC:$src1, _src.MemOp:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set _dst.RC:$dst,(_dst.VT		[(set _dst.RC:$dst,(_dst.VT
(OpNode (_src.VT _src.RC:$src1),		(OpNode (_src.VT _src.RC:$src1),
(_src.VT (bitconvert		(_src.VT (bitconvert
(_src.LdFrag addr:$src2))))))]>,		(_src.LdFrag addr:$src2))))))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass avx512_psadbw_packed_all<bits<8> opc, SDNode OpNode,		multiclass avx512_psadbw_packed_all<bits<8> opc, SDNode OpNode,
string OpcodeStr, X86SchedWriteWidths sched,		string OpcodeStr, X86SchedWriteWidths sched,
Predicate prd> {		Predicate prd> {
let Predicates = [prd] in		let Predicates = [prd] in
defm Z : avx512_psadbw_packed<opc, OpNode, OpcodeStr, sched.ZMM,		defm Z : avx512_psadbw_packed<opc, OpNode, OpcodeStr, sched.ZMM,
v8i64_info, v64i8_info>, EVEX_V512;		v8i64_info, v64i8_info>, EVEX_V512;
▲ Show 20 Lines • Show All 85 Lines • ▼ Show 20 Lines	multiclass avx512_ternlog<bits<8> opc, string OpcodeStr, SDNode OpNode,
defm rmi : AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmi : AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src2, _.MemOp:$src3, u8imm:$src4),		(ins _.RC:$src2, _.MemOp:$src3, u8imm:$src4),
OpcodeStr, "$src4, $src3, $src2", "$src2, $src3, $src4",		OpcodeStr, "$src4, $src3, $src2", "$src2, $src3, $src4",
(OpNode (_.VT _.RC:$src1),		(OpNode (_.VT _.RC:$src1),
(_.VT _.RC:$src2),		(_.VT _.RC:$src2),
(_.VT (bitconvert (_.LdFrag addr:$src3))),		(_.VT (bitconvert (_.LdFrag addr:$src3))),
(i8 imm:$src4)), 1, 0>,		(i8 imm:$src4)), 1, 0>,
AVX512AIi8Base, EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,		AVX512AIi8Base, EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
defm rmbi : AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmbi : AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src2, _.ScalarMemOp:$src3, u8imm:$src4),		(ins _.RC:$src2, _.ScalarMemOp:$src3, u8imm:$src4),
OpcodeStr, "$src4, ${src3}"##_.BroadcastStr##", $src2",		OpcodeStr, "$src4, ${src3}"##_.BroadcastStr##", $src2",
"$src2, ${src3}"##_.BroadcastStr##", $src4",		"$src2, ${src3}"##_.BroadcastStr##", $src4",
(OpNode (_.VT _.RC:$src1),		(OpNode (_.VT _.RC:$src1),
(_.VT _.RC:$src2),		(_.VT _.RC:$src2),
(_.VT (X86VBroadcast(_.ScalarLdFrag addr:$src3))),		(_.VT (X86VBroadcast(_.ScalarLdFrag addr:$src3))),
(i8 imm:$src4)), 1, 0>, EVEX_B,		(i8 imm:$src4)), 1, 0>, EVEX_B,
AVX512AIi8Base, EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,		AVX512AIi8Base, EVEX_4V, EVEX_CD8<_.EltSize, CD8VF>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}// Constraints = "$src1 = $dst"		}// Constraints = "$src1 = $dst"

// Additional patterns for matching passthru operand in other positions.		// Additional patterns for matching passthru operand in other positions.
def : Pat<(_.VT (vselect _.KRCWM:$mask,		def : Pat<(_.VT (vselect _.KRCWM:$mask,
(OpNode _.RC:$src3, _.RC:$src2, _.RC:$src1, (i8 imm:$src4)),		(OpNode _.RC:$src3, _.RC:$src2, _.RC:$src1, (i8 imm:$src4)),
_.RC:$src1)),		_.RC:$src1)),
(!cast<Instruction>(Name#_.ZSuffix#rrik) _.RC:$src1, _.KRCWM:$mask,		(!cast<Instruction>(Name#_.ZSuffix#rrik) _.RC:$src1, _.KRCWM:$mask,
_.RC:$src2, _.RC:$src3, (VPTERNLOG321_imm8 imm:$src4))>;		_.RC:$src2, _.RC:$src3, (VPTERNLOG321_imm8 imm:$src4))>;
▲ Show 20 Lines • Show All 199 Lines • ▼ Show 20 Lines	let Constraints = "$src1 = $dst", ExeDomain = _.ExeDomain in {
defm rmi : AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmi : AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src2, _.MemOp:$src3, i32u8imm:$src4),		(ins _.RC:$src2, _.MemOp:$src3, i32u8imm:$src4),
OpcodeStr##_.Suffix, "$src4, $src3, $src2", "$src2, $src3, $src4",		OpcodeStr##_.Suffix, "$src4, $src3, $src2", "$src2, $src3, $src4",
(OpNode (_.VT _.RC:$src1),		(OpNode (_.VT _.RC:$src1),
(_.VT _.RC:$src2),		(_.VT _.RC:$src2),
(TblVT.VT (bitconvert (TblVT.LdFrag addr:$src3))),		(TblVT.VT (bitconvert (TblVT.LdFrag addr:$src3))),
(i32 imm:$src4),		(i32 imm:$src4),
(i32 FROUND_CURRENT))>,		(i32 FROUND_CURRENT))>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
defm rmbi : AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmbi : AVX512_maskable_3src<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src2, _.ScalarMemOp:$src3, i32u8imm:$src4),		(ins _.RC:$src2, _.ScalarMemOp:$src3, i32u8imm:$src4),
OpcodeStr##_.Suffix, "$src4, ${src3}"##_.BroadcastStr##", $src2",		OpcodeStr##_.Suffix, "$src4, ${src3}"##_.BroadcastStr##", $src2",
"$src2, ${src3}"##_.BroadcastStr##", $src4",		"$src2, ${src3}"##_.BroadcastStr##", $src4",
(OpNode (_.VT _.RC:$src1),		(OpNode (_.VT _.RC:$src1),
(_.VT _.RC:$src2),		(_.VT _.RC:$src2),
(TblVT.VT (X86VBroadcast(TblVT.ScalarLdFrag addr:$src3))),		(TblVT.VT (X86VBroadcast(TblVT.ScalarLdFrag addr:$src3))),
(i32 imm:$src4),		(i32 imm:$src4),
(i32 FROUND_CURRENT))>,		(i32 FROUND_CURRENT))>,
EVEX_B, Sched<[sched.Folded, ReadAfterLd]>;		EVEX_B, Sched<[sched.Folded, sched.ReadAfterFold]>;
} // Constraints = "$src1 = $dst"		} // Constraints = "$src1 = $dst"
}		}

multiclass avx512_fixupimm_packed_sae<bits<8> opc, string OpcodeStr,		multiclass avx512_fixupimm_packed_sae<bits<8> opc, string OpcodeStr,
SDNode OpNode, X86FoldableSchedWrite sched,		SDNode OpNode, X86FoldableSchedWrite sched,
X86VectorVTInfo _, X86VectorVTInfo TblVT>{		X86VectorVTInfo _, X86VectorVTInfo TblVT>{
let Constraints = "$src1 = $dst", ExeDomain = _.ExeDomain in {		let Constraints = "$src1 = $dst", ExeDomain = _.ExeDomain in {
defm rrib : AVX512_maskable_3src<opc, MRMSrcReg, _, (outs _.RC:$dst),		defm rrib : AVX512_maskable_3src<opc, MRMSrcReg, _, (outs _.RC:$dst),
Show All 26 Lines	defm rrib : AVX512_maskable_3src_scalar<opc, MRMSrcReg, _, (outs _.RC:$dst),
(ins _.RC:$src2, _.RC:$src3, i32u8imm:$src4),		(ins _.RC:$src2, _.RC:$src3, i32u8imm:$src4),
OpcodeStr##_.Suffix, "$src4, {sae}, $src3, $src2",		OpcodeStr##_.Suffix, "$src4, {sae}, $src3, $src2",
"$src2, $src3, {sae}, $src4",		"$src2, $src3, {sae}, $src4",
(OpNode (_.VT _.RC:$src1),		(OpNode (_.VT _.RC:$src1),
(_.VT _.RC:$src2),		(_.VT _.RC:$src2),
(_src3VT.VT _src3VT.RC:$src3),		(_src3VT.VT _src3VT.RC:$src3),
(i32 imm:$src4),		(i32 imm:$src4),
(i32 FROUND_NO_EXC))>,		(i32 FROUND_NO_EXC))>,
EVEX_B, Sched<[sched.Folded, ReadAfterLd]>;		EVEX_B, Sched<[sched.Folded, sched.ReadAfterFold]>;
defm rmi : AVX512_maskable_3src_scalar<opc, MRMSrcMem, _, (outs _.RC:$dst),		defm rmi : AVX512_maskable_3src_scalar<opc, MRMSrcMem, _, (outs _.RC:$dst),
(ins _.RC:$src2, _.ScalarMemOp:$src3, i32u8imm:$src4),		(ins _.RC:$src2, _.ScalarMemOp:$src3, i32u8imm:$src4),
OpcodeStr##_.Suffix, "$src4, $src3, $src2", "$src2, $src3, $src4",		OpcodeStr##_.Suffix, "$src4, $src3, $src2", "$src2, $src3, $src4",
(OpNode (_.VT _.RC:$src1),		(OpNode (_.VT _.RC:$src1),
(_.VT _.RC:$src2),		(_.VT _.RC:$src2),
(_src3VT.VT (scalar_to_vector		(_src3VT.VT (scalar_to_vector
(_src3VT.ScalarLdFrag addr:$src3))),		(_src3VT.ScalarLdFrag addr:$src3))),
(i32 imm:$src4),		(i32 imm:$src4),
(i32 FROUND_CURRENT))>,		(i32 FROUND_CURRENT))>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

multiclass avx512_fixupimm_packed_all<X86SchedWriteWidths sched,		multiclass avx512_fixupimm_packed_all<X86SchedWriteWidths sched,
AVX512VLVectorVTInfo _Vec,		AVX512VLVectorVTInfo _Vec,
AVX512VLVectorVTInfo _Tbl> {		AVX512VLVectorVTInfo _Tbl> {
let Predicates = [HasAVX512] in		let Predicates = [HasAVX512] in
defm Z : avx512_fixupimm_packed<0x54, "vfixupimm", X86VFixupimm, sched.ZMM,		defm Z : avx512_fixupimm_packed<0x54, "vfixupimm", X86VFixupimm, sched.ZMM,
▲ Show 20 Lines • Show All 207 Lines • ▼ Show 20 Lines	defm r: AVX512_maskable_3src<Op, MRMSrcReg, VTI, (outs VTI.RC:$dst),
(VTI.VT (OpNode VTI.RC:$src1, VTI.RC:$src2, VTI.RC:$src3))>,		(VTI.VT (OpNode VTI.RC:$src1, VTI.RC:$src2, VTI.RC:$src3))>,
AVX512FMA3Base, Sched<[sched]>;		AVX512FMA3Base, Sched<[sched]>;
defm m: AVX512_maskable_3src<Op, MRMSrcMem, VTI, (outs VTI.RC:$dst),		defm m: AVX512_maskable_3src<Op, MRMSrcMem, VTI, (outs VTI.RC:$dst),
(ins VTI.RC:$src2, VTI.MemOp:$src3), OpStr,		(ins VTI.RC:$src2, VTI.MemOp:$src3), OpStr,
"$src3, $src2", "$src2, $src3",		"$src3, $src2", "$src2, $src3",
(VTI.VT (OpNode VTI.RC:$src1, VTI.RC:$src2,		(VTI.VT (OpNode VTI.RC:$src1, VTI.RC:$src2,
(VTI.VT (bitconvert (VTI.LdFrag addr:$src3)))))>,		(VTI.VT (bitconvert (VTI.LdFrag addr:$src3)))))>,
AVX512FMA3Base,		AVX512FMA3Base,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

multiclass VBMI2_shift_var_rmb<bits<8> Op, string OpStr, SDNode OpNode,		multiclass VBMI2_shift_var_rmb<bits<8> Op, string OpStr, SDNode OpNode,
X86FoldableSchedWrite sched, X86VectorVTInfo VTI>		X86FoldableSchedWrite sched, X86VectorVTInfo VTI>
: VBMI2_shift_var_rm<Op, OpStr, OpNode, sched, VTI> {		: VBMI2_shift_var_rm<Op, OpStr, OpNode, sched, VTI> {
let Constraints = "$src1 = $dst",		let Constraints = "$src1 = $dst",
ExeDomain = VTI.ExeDomain in		ExeDomain = VTI.ExeDomain in
defm mb: AVX512_maskable_3src<Op, MRMSrcMem, VTI, (outs VTI.RC:$dst),		defm mb: AVX512_maskable_3src<Op, MRMSrcMem, VTI, (outs VTI.RC:$dst),
(ins VTI.RC:$src2, VTI.ScalarMemOp:$src3), OpStr,		(ins VTI.RC:$src2, VTI.ScalarMemOp:$src3), OpStr,
"${src3}"##VTI.BroadcastStr##", $src2",		"${src3}"##VTI.BroadcastStr##", $src2",
"$src2, ${src3}"##VTI.BroadcastStr,		"$src2, ${src3}"##VTI.BroadcastStr,
(OpNode VTI.RC:$src1, VTI.RC:$src2,		(OpNode VTI.RC:$src1, VTI.RC:$src2,
(VTI.VT (X86VBroadcast (VTI.ScalarLdFrag addr:$src3))))>,		(VTI.VT (X86VBroadcast (VTI.ScalarLdFrag addr:$src3))))>,
AVX512FMA3Base, EVEX_B,		AVX512FMA3Base, EVEX_B,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass VBMI2_shift_var_rm_common<bits<8> Op, string OpStr, SDNode OpNode,		multiclass VBMI2_shift_var_rm_common<bits<8> Op, string OpStr, SDNode OpNode,
X86SchedWriteWidths sched, AVX512VLVectorVTInfo VTI> {		X86SchedWriteWidths sched, AVX512VLVectorVTInfo VTI> {
let Predicates = [HasVBMI2] in		let Predicates = [HasVBMI2] in
defm Z : VBMI2_shift_var_rm<Op, OpStr, OpNode, sched.ZMM, VTI.info512>,		defm Z : VBMI2_shift_var_rm<Op, OpStr, OpNode, sched.ZMM, VTI.info512>,
EVEX_V512;		EVEX_V512;
let Predicates = [HasVBMI2, HasVLX] in {		let Predicates = [HasVBMI2, HasVLX] in {
▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines	defm r : AVX512_maskable_3src<Op, MRMSrcReg, VTI, (outs VTI.RC:$dst),
EVEX_4V, T8PD, Sched<[sched]>;		EVEX_4V, T8PD, Sched<[sched]>;
defm m : AVX512_maskable_3src<Op, MRMSrcMem, VTI, (outs VTI.RC:$dst),		defm m : AVX512_maskable_3src<Op, MRMSrcMem, VTI, (outs VTI.RC:$dst),
(ins VTI.RC:$src2, VTI.MemOp:$src3), OpStr,		(ins VTI.RC:$src2, VTI.MemOp:$src3), OpStr,
"$src3, $src2", "$src2, $src3",		"$src3, $src2", "$src2, $src3",
(VTI.VT (OpNode VTI.RC:$src1, VTI.RC:$src2,		(VTI.VT (OpNode VTI.RC:$src1, VTI.RC:$src2,
(VTI.VT (bitconvert		(VTI.VT (bitconvert
(VTI.LdFrag addr:$src3)))))>,		(VTI.LdFrag addr:$src3)))))>,
EVEX_4V, EVEX_CD8<32, CD8VF>, T8PD,		EVEX_4V, EVEX_CD8<32, CD8VF>, T8PD,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
defm mb : AVX512_maskable_3src<Op, MRMSrcMem, VTI, (outs VTI.RC:$dst),		defm mb : AVX512_maskable_3src<Op, MRMSrcMem, VTI, (outs VTI.RC:$dst),
(ins VTI.RC:$src2, VTI.ScalarMemOp:$src3),		(ins VTI.RC:$src2, VTI.ScalarMemOp:$src3),
OpStr, "${src3}"##VTI.BroadcastStr##", $src2",		OpStr, "${src3}"##VTI.BroadcastStr##", $src2",
"$src2, ${src3}"##VTI.BroadcastStr,		"$src2, ${src3}"##VTI.BroadcastStr,
(OpNode VTI.RC:$src1, VTI.RC:$src2,		(OpNode VTI.RC:$src1, VTI.RC:$src2,
(VTI.VT (X86VBroadcast		(VTI.VT (X86VBroadcast
(VTI.ScalarLdFrag addr:$src3))))>,		(VTI.ScalarLdFrag addr:$src3))))>,
EVEX_4V, EVEX_CD8<32, CD8VF>, EVEX_B,		EVEX_4V, EVEX_CD8<32, CD8VF>, EVEX_B,
T8PD, Sched<[sched.Folded, ReadAfterLd]>;		T8PD, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass VNNI_common<bits<8> Op, string OpStr, SDNode OpNode,		multiclass VNNI_common<bits<8> Op, string OpStr, SDNode OpNode,
X86SchedWriteWidths sched> {		X86SchedWriteWidths sched> {
let Predicates = [HasVNNI] in		let Predicates = [HasVNNI] in
defm Z : VNNI_rmb<Op, OpStr, OpNode, sched.ZMM, v16i32_info>, EVEX_V512;		defm Z : VNNI_rmb<Op, OpStr, OpNode, sched.ZMM, v16i32_info>, EVEX_V512;
let Predicates = [HasVNNI, HasVLX] in {		let Predicates = [HasVNNI, HasVLX] in {
defm Z256 : VNNI_rmb<Op, OpStr, OpNode, sched.YMM, v8i32x_info>, EVEX_V256;		defm Z256 : VNNI_rmb<Op, OpStr, OpNode, sched.YMM, v8i32x_info>, EVEX_V256;
Show All 30 Lines	defm rr : AVX512_maskable_cmp<0x8F, MRMSrcReg, VTI, (outs VTI.KRC:$dst),
Sched<[sched]>;		Sched<[sched]>;
defm rm : AVX512_maskable_cmp<0x8F, MRMSrcMem, VTI, (outs VTI.KRC:$dst),		defm rm : AVX512_maskable_cmp<0x8F, MRMSrcMem, VTI, (outs VTI.KRC:$dst),
(ins VTI.RC:$src1, VTI.MemOp:$src2),		(ins VTI.RC:$src1, VTI.MemOp:$src2),
"vpshufbitqmb",		"vpshufbitqmb",
"$src2, $src1", "$src1, $src2",		"$src2, $src1", "$src1, $src2",
(X86Vpshufbitqmb (VTI.VT VTI.RC:$src1),		(X86Vpshufbitqmb (VTI.VT VTI.RC:$src1),
(VTI.VT (bitconvert (VTI.LdFrag addr:$src2))))>,		(VTI.VT (bitconvert (VTI.LdFrag addr:$src2))))>,
EVEX_4V, EVEX_CD8<8, CD8VF>, T8PD,		EVEX_4V, EVEX_CD8<8, CD8VF>, T8PD,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass VPSHUFBITQMB_common<X86SchedWriteWidths sched, AVX512VLVectorVTInfo VTI> {		multiclass VPSHUFBITQMB_common<X86SchedWriteWidths sched, AVX512VLVectorVTInfo VTI> {
let Predicates = [HasBITALG] in		let Predicates = [HasBITALG] in
defm Z : VPSHUFBITQMB_rm<sched.ZMM, VTI.info512>, EVEX_V512;		defm Z : VPSHUFBITQMB_rm<sched.ZMM, VTI.info512>, EVEX_V512;
let Predicates = [HasBITALG, HasVLX] in {		let Predicates = [HasBITALG, HasVLX] in {
defm Z256 : VPSHUFBITQMB_rm<sched.YMM, VTI.info256>, EVEX_V256;		defm Z256 : VPSHUFBITQMB_rm<sched.YMM, VTI.info256>, EVEX_V256;
defm Z128 : VPSHUFBITQMB_rm<sched.XMM, VTI.info128>, EVEX_V128;		defm Z128 : VPSHUFBITQMB_rm<sched.XMM, VTI.info128>, EVEX_V128;
Show All 31 Lines	multiclass GF2P8AFFINE_avx512_rmb_imm<bits<8> Op, string OpStr, SDNode OpNode,
let ExeDomain = VTI.ExeDomain in		let ExeDomain = VTI.ExeDomain in
defm rmbi : AVX512_maskable<Op, MRMSrcMem, VTI, (outs VTI.RC:$dst),		defm rmbi : AVX512_maskable<Op, MRMSrcMem, VTI, (outs VTI.RC:$dst),
(ins VTI.RC:$src1, VTI.ScalarMemOp:$src2, u8imm:$src3),		(ins VTI.RC:$src1, VTI.ScalarMemOp:$src2, u8imm:$src3),
OpStr, "$src3, ${src2}"##BcstVTI.BroadcastStr##", $src1",		OpStr, "$src3, ${src2}"##BcstVTI.BroadcastStr##", $src1",
"$src1, ${src2}"##BcstVTI.BroadcastStr##", $src3",		"$src1, ${src2}"##BcstVTI.BroadcastStr##", $src3",
(OpNode (VTI.VT VTI.RC:$src1),		(OpNode (VTI.VT VTI.RC:$src1),
(bitconvert (BcstVTI.VT (X86VBroadcast (loadi64 addr:$src2)))),		(bitconvert (BcstVTI.VT (X86VBroadcast (loadi64 addr:$src2)))),
(i8 imm:$src3))>, EVEX_B,		(i8 imm:$src3))>, EVEX_B,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass GF2P8AFFINE_avx512_common<bits<8> Op, string OpStr, SDNode OpNode,		multiclass GF2P8AFFINE_avx512_common<bits<8> Op, string OpStr, SDNode OpNode,
X86SchedWriteWidths sched> {		X86SchedWriteWidths sched> {
let Predicates = [HasGFNI, HasAVX512, HasBWI] in		let Predicates = [HasGFNI, HasAVX512, HasBWI] in
defm Z : GF2P8AFFINE_avx512_rmb_imm<Op, OpStr, OpNode, sched.ZMM,		defm Z : GF2P8AFFINE_avx512_rmb_imm<Op, OpStr, OpNode, sched.ZMM,
v64i8_info, v8i64_info>, EVEX_V512;		v64i8_info, v8i64_info>, EVEX_V512;
let Predicates = [HasGFNI, HasVLX, HasBWI] in {		let Predicates = [HasGFNI, HasVLX, HasBWI] in {
▲ Show 20 Lines • Show All 65 Lines • Show Last 20 Lines

lib/Target/X86/X86InstrArithmetic.td

Show All 40 Lines
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// Fixed-Register Multiplication and Division Instructions.		// Fixed-Register Multiplication and Division Instructions.
//		//

// SchedModel info for instruction that loads one value and gets the second		// SchedModel info for instruction that loads one value and gets the second
// (and possibly third) value from a register.		// (and possibly third) value from a register.
// This is used for instructions that put the memory operands before other		// This is used for instructions that put the memory operands before other
// uses.		// uses.
class SchedLoadReg<SchedWrite SW> : Sched<[SW,		class SchedLoadReg<X86FoldableSchedWrite Sched> : Sched<[Sched.Folded,
// Memory operand.		// Memory operand.
ReadDefault, ReadDefault, ReadDefault, ReadDefault, ReadDefault,		ReadDefault, ReadDefault, ReadDefault, ReadDefault, ReadDefault,
// Register reads (implicit or explicit).		// Register reads (implicit or explicit).
ReadAfterLd, ReadAfterLd]>;		Sched.ReadAfterFold, Sched.ReadAfterFold]>;

// Extra precision multiplication		// Extra precision multiplication

// AL is really implied by AX, but the registers in Defs must match the		// AL is really implied by AX, but the registers in Defs must match the
// SDNode results (i8, i32).		// SDNode results (i8, i32).
// AL,AH = AL*GR8		// AL,AH = AL*GR8
let Defs = [AL,EFLAGS,AX], Uses = [AL] in		let Defs = [AL,EFLAGS,AX], Uses = [AL] in
def MUL8r : I<0xF6, MRM4r, (outs), (ins GR8:$src), "mul{b}\t$src",		def MUL8r : I<0xF6, MRM4r, (outs), (ins GR8:$src), "mul{b}\t$src",
Show All 22 Lines
// AL,AH = AL*[mem8]		// AL,AH = AL*[mem8]
let Defs = [AL,EFLAGS,AX], Uses = [AL] in		let Defs = [AL,EFLAGS,AX], Uses = [AL] in
def MUL8m : I<0xF6, MRM4m, (outs), (ins i8mem :$src),		def MUL8m : I<0xF6, MRM4m, (outs), (ins i8mem :$src),
"mul{b}\t$src",		"mul{b}\t$src",
// FIXME: Used for 8-bit mul, ignore result upper 8 bits.		// FIXME: Used for 8-bit mul, ignore result upper 8 bits.
// This probably ought to be moved to a def : Pat<> if the		// This probably ought to be moved to a def : Pat<> if the
// syntax can be accepted.		// syntax can be accepted.
[(set AL, (mul AL, (loadi8 addr:$src))),		[(set AL, (mul AL, (loadi8 addr:$src))),
(implicit EFLAGS)]>, SchedLoadReg<WriteIMul8.Folded>;		(implicit EFLAGS)]>, SchedLoadReg<WriteIMul8>;
// AX,DX = AX*[mem16]		// AX,DX = AX*[mem16]
let mayLoad = 1, hasSideEffects = 0 in {		let mayLoad = 1, hasSideEffects = 0 in {
let Defs = [AX,DX,EFLAGS], Uses = [AX] in		let Defs = [AX,DX,EFLAGS], Uses = [AX] in
def MUL16m : I<0xF7, MRM4m, (outs), (ins i16mem:$src),		def MUL16m : I<0xF7, MRM4m, (outs), (ins i16mem:$src),
"mul{w}\t$src", []>, OpSize16, SchedLoadReg<WriteIMul16.Folded>;		"mul{w}\t$src", []>, OpSize16, SchedLoadReg<WriteIMul16>;
// EAX,EDX = EAX*[mem32]		// EAX,EDX = EAX*[mem32]
let Defs = [EAX,EDX,EFLAGS], Uses = [EAX] in		let Defs = [EAX,EDX,EFLAGS], Uses = [EAX] in
def MUL32m : I<0xF7, MRM4m, (outs), (ins i32mem:$src),		def MUL32m : I<0xF7, MRM4m, (outs), (ins i32mem:$src),
"mul{l}\t$src", []>, OpSize32, SchedLoadReg<WriteIMul32.Folded>;		"mul{l}\t$src", []>, OpSize32, SchedLoadReg<WriteIMul32>;
// RAX,RDX = RAX*[mem64]		// RAX,RDX = RAX*[mem64]
let Defs = [RAX,RDX,EFLAGS], Uses = [RAX] in		let Defs = [RAX,RDX,EFLAGS], Uses = [RAX] in
def MUL64m : RI<0xF7, MRM4m, (outs), (ins i64mem:$src),		def MUL64m : RI<0xF7, MRM4m, (outs), (ins i64mem:$src),
"mul{q}\t$src", []>, SchedLoadReg<WriteIMul64.Folded>,		"mul{q}\t$src", []>, SchedLoadReg<WriteIMul64>,
Requires<[In64BitMode]>;		Requires<[In64BitMode]>;
}		}

let hasSideEffects = 0 in {		let hasSideEffects = 0 in {
// AL,AH = AL*GR8		// AL,AH = AL*GR8
let Defs = [AL,EFLAGS,AX], Uses = [AL] in		let Defs = [AL,EFLAGS,AX], Uses = [AL] in
def IMUL8r : I<0xF6, MRM5r, (outs), (ins GR8:$src), "imul{b}\t$src", []>,		def IMUL8r : I<0xF6, MRM5r, (outs), (ins GR8:$src), "imul{b}\t$src", []>,
Sched<[WriteIMul8]>;		Sched<[WriteIMul8]>;
Show All 9 Lines
let Defs = [RAX,RDX,EFLAGS], Uses = [RAX] in		let Defs = [RAX,RDX,EFLAGS], Uses = [RAX] in
def IMUL64r : RI<0xF7, MRM5r, (outs), (ins GR64:$src), "imul{q}\t$src", []>,		def IMUL64r : RI<0xF7, MRM5r, (outs), (ins GR64:$src), "imul{q}\t$src", []>,
Sched<[WriteIMul64]>;		Sched<[WriteIMul64]>;

let mayLoad = 1 in {		let mayLoad = 1 in {
// AL,AH = AL*[mem8]		// AL,AH = AL*[mem8]
let Defs = [AL,EFLAGS,AX], Uses = [AL] in		let Defs = [AL,EFLAGS,AX], Uses = [AL] in
def IMUL8m : I<0xF6, MRM5m, (outs), (ins i8mem :$src),		def IMUL8m : I<0xF6, MRM5m, (outs), (ins i8mem :$src),
"imul{b}\t$src", []>, SchedLoadReg<WriteIMul8.Folded>;		"imul{b}\t$src", []>, SchedLoadReg<WriteIMul8>;
// AX,DX = AX*[mem16]		// AX,DX = AX*[mem16]
let Defs = [AX,DX,EFLAGS], Uses = [AX] in		let Defs = [AX,DX,EFLAGS], Uses = [AX] in
def IMUL16m : I<0xF7, MRM5m, (outs), (ins i16mem:$src),		def IMUL16m : I<0xF7, MRM5m, (outs), (ins i16mem:$src),
"imul{w}\t$src", []>, OpSize16, SchedLoadReg<WriteIMul16.Folded>;		"imul{w}\t$src", []>, OpSize16, SchedLoadReg<WriteIMul16>;
// EAX,EDX = EAX*[mem32]		// EAX,EDX = EAX*[mem32]
let Defs = [EAX,EDX,EFLAGS], Uses = [EAX] in		let Defs = [EAX,EDX,EFLAGS], Uses = [EAX] in
def IMUL32m : I<0xF7, MRM5m, (outs), (ins i32mem:$src),		def IMUL32m : I<0xF7, MRM5m, (outs), (ins i32mem:$src),
"imul{l}\t$src", []>, OpSize32, SchedLoadReg<WriteIMul32.Folded>;		"imul{l}\t$src", []>, OpSize32, SchedLoadReg<WriteIMul32>;
// RAX,RDX = RAX*[mem64]		// RAX,RDX = RAX*[mem64]
let Defs = [RAX,RDX,EFLAGS], Uses = [RAX] in		let Defs = [RAX,RDX,EFLAGS], Uses = [RAX] in
def IMUL64m : RI<0xF7, MRM5m, (outs), (ins i64mem:$src),		def IMUL64m : RI<0xF7, MRM5m, (outs), (ins i64mem:$src),
"imul{q}\t$src", []>, SchedLoadReg<WriteIMul64.Folded>,		"imul{q}\t$src", []>, SchedLoadReg<WriteIMul64>,
Requires<[In64BitMode]>;		Requires<[In64BitMode]>;
}		}
} // hasSideEffects		} // hasSideEffects


let Defs = [EFLAGS] in {		let Defs = [EFLAGS] in {
let Constraints = "$src1 = $dst" in {		let Constraints = "$src1 = $dst" in {

Show All 19 Lines
} // isCommutable		} // isCommutable

// Register-Memory Signed Integer Multiply		// Register-Memory Signed Integer Multiply
def IMUL16rm : I<0xAF, MRMSrcMem, (outs GR16:$dst),		def IMUL16rm : I<0xAF, MRMSrcMem, (outs GR16:$dst),
(ins GR16:$src1, i16mem:$src2),		(ins GR16:$src1, i16mem:$src2),
"imul{w}\t{$src2, $dst\|$dst, $src2}",		"imul{w}\t{$src2, $dst\|$dst, $src2}",
[(set GR16:$dst, EFLAGS,		[(set GR16:$dst, EFLAGS,
(X86smul_flag GR16:$src1, (loadi16 addr:$src2)))]>,		(X86smul_flag GR16:$src1, (loadi16 addr:$src2)))]>,
Sched<[WriteIMul16Reg.Folded, ReadAfterLd]>, TB, OpSize16;		Sched<[WriteIMul16Reg.Folded, WriteIMul16Reg.ReadAfterFold]>, TB, OpSize16;
def IMUL32rm : I<0xAF, MRMSrcMem, (outs GR32:$dst),		def IMUL32rm : I<0xAF, MRMSrcMem, (outs GR32:$dst),
(ins GR32:$src1, i32mem:$src2),		(ins GR32:$src1, i32mem:$src2),
"imul{l}\t{$src2, $dst\|$dst, $src2}",		"imul{l}\t{$src2, $dst\|$dst, $src2}",
[(set GR32:$dst, EFLAGS,		[(set GR32:$dst, EFLAGS,
(X86smul_flag GR32:$src1, (loadi32 addr:$src2)))]>,		(X86smul_flag GR32:$src1, (loadi32 addr:$src2)))]>,
Sched<[WriteIMul32Reg.Folded, ReadAfterLd]>, TB, OpSize32;		Sched<[WriteIMul32Reg.Folded, WriteIMul32Reg.ReadAfterFold]>, TB, OpSize32;
def IMUL64rm : RI<0xAF, MRMSrcMem, (outs GR64:$dst),		def IMUL64rm : RI<0xAF, MRMSrcMem, (outs GR64:$dst),
(ins GR64:$src1, i64mem:$src2),		(ins GR64:$src1, i64mem:$src2),
"imul{q}\t{$src2, $dst\|$dst, $src2}",		"imul{q}\t{$src2, $dst\|$dst, $src2}",
[(set GR64:$dst, EFLAGS,		[(set GR64:$dst, EFLAGS,
(X86smul_flag GR64:$src1, (loadi64 addr:$src2)))]>,		(X86smul_flag GR64:$src1, (loadi64 addr:$src2)))]>,
Sched<[WriteIMul64Reg.Folded, ReadAfterLd]>, TB;		Sched<[WriteIMul64Reg.Folded, WriteIMul32Reg.ReadAfterFold]>, TB;
} // Constraints = "$src1 = $dst"		} // Constraints = "$src1 = $dst"

} // Defs = [EFLAGS]		} // Defs = [EFLAGS]

// Surprisingly enough, these are not two address instructions!		// Surprisingly enough, these are not two address instructions!
let Defs = [EFLAGS] in {		let Defs = [EFLAGS] in {
// Register-Integer Signed Integer Multiply		// Register-Integer Signed Integer Multiply
def IMUL16rri : Ii16<0x69, MRMSrcReg, // GR16 = GR16*I16		def IMUL16rri : Ii16<0x69, MRMSrcReg, // GR16 = GR16*I16
▲ Show 20 Lines • Show All 90 Lines • ▼ Show 20 Lines
// RDX:RAX/r64 = RAX,RDX		// RDX:RAX/r64 = RAX,RDX
let Defs = [RAX,RDX,EFLAGS], Uses = [RAX,RDX] in		let Defs = [RAX,RDX,EFLAGS], Uses = [RAX,RDX] in
def DIV64r : RI<0xF7, MRM6r, (outs), (ins GR64:$src),		def DIV64r : RI<0xF7, MRM6r, (outs), (ins GR64:$src),
"div{q}\t$src", []>, Sched<[WriteDiv64]>;		"div{q}\t$src", []>, Sched<[WriteDiv64]>;

let mayLoad = 1 in {		let mayLoad = 1 in {
let Defs = [AL,AH,EFLAGS], Uses = [AX] in		let Defs = [AL,AH,EFLAGS], Uses = [AX] in
def DIV8m : I<0xF6, MRM6m, (outs), (ins i8mem:$src), // AX/[mem8] = AL,AH		def DIV8m : I<0xF6, MRM6m, (outs), (ins i8mem:$src), // AX/[mem8] = AL,AH
"div{b}\t$src", []>, SchedLoadReg<WriteDiv8.Folded>;		"div{b}\t$src", []>, SchedLoadReg<WriteDiv8>;
let Defs = [AX,DX,EFLAGS], Uses = [AX,DX] in		let Defs = [AX,DX,EFLAGS], Uses = [AX,DX] in
def DIV16m : I<0xF7, MRM6m, (outs), (ins i16mem:$src), // DX:AX/[mem16] = AX,DX		def DIV16m : I<0xF7, MRM6m, (outs), (ins i16mem:$src), // DX:AX/[mem16] = AX,DX
"div{w}\t$src", []>, OpSize16, SchedLoadReg<WriteDiv16.Folded>;		"div{w}\t$src", []>, OpSize16, SchedLoadReg<WriteDiv16>;
let Defs = [EAX,EDX,EFLAGS], Uses = [EAX,EDX] in // EDX:EAX/[mem32] = EAX,EDX		let Defs = [EAX,EDX,EFLAGS], Uses = [EAX,EDX] in // EDX:EAX/[mem32] = EAX,EDX
def DIV32m : I<0xF7, MRM6m, (outs), (ins i32mem:$src),		def DIV32m : I<0xF7, MRM6m, (outs), (ins i32mem:$src),
"div{l}\t$src", []>, SchedLoadReg<WriteDiv32.Folded>, OpSize32;		"div{l}\t$src", []>, SchedLoadReg<WriteDiv32>, OpSize32;
// RDX:RAX/[mem64] = RAX,RDX		// RDX:RAX/[mem64] = RAX,RDX
let Defs = [RAX,RDX,EFLAGS], Uses = [RAX,RDX] in		let Defs = [RAX,RDX,EFLAGS], Uses = [RAX,RDX] in
def DIV64m : RI<0xF7, MRM6m, (outs), (ins i64mem:$src),		def DIV64m : RI<0xF7, MRM6m, (outs), (ins i64mem:$src),
"div{q}\t$src", []>, SchedLoadReg<WriteDiv64.Folded>,		"div{q}\t$src", []>, SchedLoadReg<WriteDiv64>,
Requires<[In64BitMode]>;		Requires<[In64BitMode]>;
}		}

// Signed division/remainder.		// Signed division/remainder.
let Defs = [AL,AH,EFLAGS], Uses = [AX] in		let Defs = [AL,AH,EFLAGS], Uses = [AX] in
def IDIV8r : I<0xF6, MRM7r, (outs), (ins GR8:$src), // AX/r8 = AL,AH		def IDIV8r : I<0xF6, MRM7r, (outs), (ins GR8:$src), // AX/r8 = AL,AH
"idiv{b}\t$src", []>, Sched<[WriteIDiv8]>;		"idiv{b}\t$src", []>, Sched<[WriteIDiv8]>;
let Defs = [AX,DX,EFLAGS], Uses = [AX,DX] in		let Defs = [AX,DX,EFLAGS], Uses = [AX,DX] in
def IDIV16r: I<0xF7, MRM7r, (outs), (ins GR16:$src), // DX:AX/r16 = AX,DX		def IDIV16r: I<0xF7, MRM7r, (outs), (ins GR16:$src), // DX:AX/r16 = AX,DX
"idiv{w}\t$src", []>, Sched<[WriteIDiv16]>, OpSize16;		"idiv{w}\t$src", []>, Sched<[WriteIDiv16]>, OpSize16;
let Defs = [EAX,EDX,EFLAGS], Uses = [EAX,EDX] in		let Defs = [EAX,EDX,EFLAGS], Uses = [EAX,EDX] in
def IDIV32r: I<0xF7, MRM7r, (outs), (ins GR32:$src), // EDX:EAX/r32 = EAX,EDX		def IDIV32r: I<0xF7, MRM7r, (outs), (ins GR32:$src), // EDX:EAX/r32 = EAX,EDX
"idiv{l}\t$src", []>, Sched<[WriteIDiv32]>, OpSize32;		"idiv{l}\t$src", []>, Sched<[WriteIDiv32]>, OpSize32;
// RDX:RAX/r64 = RAX,RDX		// RDX:RAX/r64 = RAX,RDX
let Defs = [RAX,RDX,EFLAGS], Uses = [RAX,RDX] in		let Defs = [RAX,RDX,EFLAGS], Uses = [RAX,RDX] in
def IDIV64r: RI<0xF7, MRM7r, (outs), (ins GR64:$src),		def IDIV64r: RI<0xF7, MRM7r, (outs), (ins GR64:$src),
"idiv{q}\t$src", []>, Sched<[WriteIDiv64]>;		"idiv{q}\t$src", []>, Sched<[WriteIDiv64]>;

let mayLoad = 1 in {		let mayLoad = 1 in {
let Defs = [AL,AH,EFLAGS], Uses = [AX] in		let Defs = [AL,AH,EFLAGS], Uses = [AX] in
def IDIV8m : I<0xF6, MRM7m, (outs), (ins i8mem:$src), // AX/[mem8] = AL,AH		def IDIV8m : I<0xF6, MRM7m, (outs), (ins i8mem:$src), // AX/[mem8] = AL,AH
"idiv{b}\t$src", []>, SchedLoadReg<WriteIDiv8.Folded>;		"idiv{b}\t$src", []>, SchedLoadReg<WriteIDiv8>;
let Defs = [AX,DX,EFLAGS], Uses = [AX,DX] in		let Defs = [AX,DX,EFLAGS], Uses = [AX,DX] in
def IDIV16m: I<0xF7, MRM7m, (outs), (ins i16mem:$src), // DX:AX/[mem16] = AX,DX		def IDIV16m: I<0xF7, MRM7m, (outs), (ins i16mem:$src), // DX:AX/[mem16] = AX,DX
"idiv{w}\t$src", []>, OpSize16, SchedLoadReg<WriteIDiv16.Folded>;		"idiv{w}\t$src", []>, OpSize16, SchedLoadReg<WriteIDiv16>;
let Defs = [EAX,EDX,EFLAGS], Uses = [EAX,EDX] in // EDX:EAX/[mem32] = EAX,EDX		let Defs = [EAX,EDX,EFLAGS], Uses = [EAX,EDX] in // EDX:EAX/[mem32] = EAX,EDX
def IDIV32m: I<0xF7, MRM7m, (outs), (ins i32mem:$src),		def IDIV32m: I<0xF7, MRM7m, (outs), (ins i32mem:$src),
"idiv{l}\t$src", []>, OpSize32, SchedLoadReg<WriteIDiv32.Folded>;		"idiv{l}\t$src", []>, OpSize32, SchedLoadReg<WriteIDiv32>;
let Defs = [RAX,RDX,EFLAGS], Uses = [RAX,RDX] in // RDX:RAX/[mem64] = RAX,RDX		let Defs = [RAX,RDX,EFLAGS], Uses = [RAX,RDX] in // RDX:RAX/[mem64] = RAX,RDX
def IDIV64m: RI<0xF7, MRM7m, (outs), (ins i64mem:$src),		def IDIV64m: RI<0xF7, MRM7m, (outs), (ins i64mem:$src),
"idiv{q}\t$src", []>, SchedLoadReg<WriteIDiv64.Folded>,		"idiv{q}\t$src", []>, SchedLoadReg<WriteIDiv64>,
Requires<[In64BitMode]>;		Requires<[In64BitMode]>;
}		}
} // hasSideEffects = 0		} // hasSideEffects = 0

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// Two address Instructions.		// Two address Instructions.
//		//

▲ Show 20 Lines • Show All 338 Lines • ▼ Show 20 Lines
}		}

// BinOpRM - Instructions like "add reg, reg, [mem]".		// BinOpRM - Instructions like "add reg, reg, [mem]".
class BinOpRM<bits<8> opcode, string mnemonic, X86TypeInfo typeinfo,		class BinOpRM<bits<8> opcode, string mnemonic, X86TypeInfo typeinfo,
dag outlist, X86FoldableSchedWrite sched, list<dag> pattern>		dag outlist, X86FoldableSchedWrite sched, list<dag> pattern>
: ITy<opcode, MRMSrcMem, typeinfo, outlist,		: ITy<opcode, MRMSrcMem, typeinfo, outlist,
(ins typeinfo.RegClass:$src1, typeinfo.MemOperand:$src2),		(ins typeinfo.RegClass:$src1, typeinfo.MemOperand:$src2),
mnemonic, "{$src2, $src1\|$src1, $src2}", pattern>,		mnemonic, "{$src2, $src1\|$src1, $src2}", pattern>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;

// BinOpRM_F - Instructions like "cmp reg, [mem]".		// BinOpRM_F - Instructions like "cmp reg, [mem]".
class BinOpRM_F<bits<8> opcode, string mnemonic, X86TypeInfo typeinfo,		class BinOpRM_F<bits<8> opcode, string mnemonic, X86TypeInfo typeinfo,
SDNode opnode>		SDNode opnode>
: BinOpRM<opcode, mnemonic, typeinfo, (outs), WriteALU,		: BinOpRM<opcode, mnemonic, typeinfo, (outs), WriteALU,
[(set EFLAGS,		[(set EFLAGS,
(opnode typeinfo.RegClass:$src1, (typeinfo.LoadNode addr:$src2)))]>;		(opnode typeinfo.RegClass:$src1, (typeinfo.LoadNode addr:$src2)))]>;

▲ Show 20 Lines • Show All 98 Lines • ▼ Show 20 Lines	: BinOpMR<opcode, mnemonic, typeinfo,
(implicit EFLAGS)]>, Sched<[WriteADCRMW]>;		(implicit EFLAGS)]>, Sched<[WriteADCRMW]>;

// BinOpMR_F - Instructions like "cmp [mem], reg".		// BinOpMR_F - Instructions like "cmp [mem], reg".
class BinOpMR_F<bits<8> opcode, string mnemonic, X86TypeInfo typeinfo,		class BinOpMR_F<bits<8> opcode, string mnemonic, X86TypeInfo typeinfo,
SDPatternOperator opnode>		SDPatternOperator opnode>
: BinOpMR<opcode, mnemonic, typeinfo,		: BinOpMR<opcode, mnemonic, typeinfo,
[(set EFLAGS, (opnode (typeinfo.LoadNode addr:$dst),		[(set EFLAGS, (opnode (typeinfo.LoadNode addr:$dst),
typeinfo.RegClass:$src))]>,		typeinfo.RegClass:$src))]>,
Sched<[WriteALULd, ReadDefault, ReadDefault, ReadDefault,		Sched<[WriteALU.Folded, ReadDefault, ReadDefault, ReadDefault,
ReadDefault, ReadDefault, ReadAfterLd]>;		ReadDefault, ReadDefault, WriteALU.ReadAfterFold]>;

// BinOpMI - Instructions like "add [mem], imm".		// BinOpMI - Instructions like "add [mem], imm".
class BinOpMI<bits<8> opcode, string mnemonic, X86TypeInfo typeinfo,		class BinOpMI<bits<8> opcode, string mnemonic, X86TypeInfo typeinfo,
Format f, list<dag> pattern>		Format f, list<dag> pattern>
: ITy<opcode, f, typeinfo,		: ITy<opcode, f, typeinfo,
(outs), (ins typeinfo.MemOperand:$dst, typeinfo.ImmOperand:$src),		(outs), (ins typeinfo.MemOperand:$dst, typeinfo.ImmOperand:$src),
mnemonic, "{$src, $dst\|$dst, $src}", pattern> {		mnemonic, "{$src, $dst\|$dst, $src}", pattern> {
let ImmT = typeinfo.ImmEncoding;		let ImmT = typeinfo.ImmEncoding;
Show All 15 Lines	: BinOpMI<opcode, mnemonic, typeinfo, f,
(implicit EFLAGS)]>, Sched<[WriteADCRMW]>;		(implicit EFLAGS)]>, Sched<[WriteADCRMW]>;

// BinOpMI_F - Instructions like "cmp [mem], imm".		// BinOpMI_F - Instructions like "cmp [mem], imm".
class BinOpMI_F<bits<8> opcode, string mnemonic, X86TypeInfo typeinfo,		class BinOpMI_F<bits<8> opcode, string mnemonic, X86TypeInfo typeinfo,
SDPatternOperator opnode, Format f>		SDPatternOperator opnode, Format f>
: BinOpMI<opcode, mnemonic, typeinfo, f,		: BinOpMI<opcode, mnemonic, typeinfo, f,
[(set EFLAGS, (opnode (typeinfo.LoadNode addr:$dst),		[(set EFLAGS, (opnode (typeinfo.LoadNode addr:$dst),
typeinfo.ImmOperator:$src))]>,		typeinfo.ImmOperator:$src))]>,
Sched<[WriteALULd]>;		Sched<[WriteALU.Folded]>;

// BinOpMI8 - Instructions like "add [mem], imm8".		// BinOpMI8 - Instructions like "add [mem], imm8".
class BinOpMI8<string mnemonic, X86TypeInfo typeinfo,		class BinOpMI8<string mnemonic, X86TypeInfo typeinfo,
Format f, list<dag> pattern>		Format f, list<dag> pattern>
: ITy<0x82, f, typeinfo,		: ITy<0x82, f, typeinfo,
(outs), (ins typeinfo.MemOperand:$dst, typeinfo.Imm8Operand:$src),		(outs), (ins typeinfo.MemOperand:$dst, typeinfo.Imm8Operand:$src),
mnemonic, "{$src, $dst\|$dst, $src}", pattern> {		mnemonic, "{$src, $dst\|$dst, $src}", pattern> {
let ImmT = Imm8; // Always 8-bit immediate.		let ImmT = Imm8; // Always 8-bit immediate.
Show All 16 Lines	: BinOpMI8<mnemonic, typeinfo, f,
(implicit EFLAGS)]>, Sched<[WriteADCRMW]>;		(implicit EFLAGS)]>, Sched<[WriteADCRMW]>;

// BinOpMI8_F - Instructions like "cmp [mem], imm8".		// BinOpMI8_F - Instructions like "cmp [mem], imm8".
class BinOpMI8_F<string mnemonic, X86TypeInfo typeinfo,		class BinOpMI8_F<string mnemonic, X86TypeInfo typeinfo,
SDPatternOperator opnode, Format f>		SDPatternOperator opnode, Format f>
: BinOpMI8<mnemonic, typeinfo, f,		: BinOpMI8<mnemonic, typeinfo, f,
[(set EFLAGS, (opnode (typeinfo.LoadNode addr:$dst),		[(set EFLAGS, (opnode (typeinfo.LoadNode addr:$dst),
typeinfo.Imm8Operator:$src))]>,		typeinfo.Imm8Operator:$src))]>,
Sched<[WriteALULd]>;		Sched<[WriteALU.Folded]>;

// BinOpAI - Instructions like "add %eax, %eax, imm", that imp-def EFLAGS.		// BinOpAI - Instructions like "add %eax, %eax, imm", that imp-def EFLAGS.
class BinOpAI<bits<8> opcode, string mnemonic, X86TypeInfo typeinfo,		class BinOpAI<bits<8> opcode, string mnemonic, X86TypeInfo typeinfo,
Register areg, string operands, X86FoldableSchedWrite sched = WriteALU>		Register areg, string operands, X86FoldableSchedWrite sched = WriteALU>
: ITy<opcode, RawFrm, typeinfo,		: ITy<opcode, RawFrm, typeinfo,
(outs), (ins typeinfo.ImmOperand:$src),		(outs), (ins typeinfo.ImmOperand:$src),
mnemonic, operands, []>, Sched<[sched]> {		mnemonic, operands, []>, Sched<[sched]> {
let ImmT = typeinfo.ImmEncoding;		let ImmT = typeinfo.ImmEncoding;
▲ Show 20 Lines • Show All 370 Lines • ▼ Show 20 Lines	multiclass bmi_andn<string mnemonic, RegisterClass RC, X86MemOperand x86memop,
def rr : I<0xF2, MRMSrcReg, (outs RC:$dst), (ins RC:$src1, RC:$src2),		def rr : I<0xF2, MRMSrcReg, (outs RC:$dst), (ins RC:$src1, RC:$src2),
!strconcat(mnemonic, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(mnemonic, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set RC:$dst, EFLAGS, (X86and_flag (not RC:$src1), RC:$src2))]>,		[(set RC:$dst, EFLAGS, (X86and_flag (not RC:$src1), RC:$src2))]>,
Sched<[WriteALU]>;		Sched<[WriteALU]>;
def rm : I<0xF2, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, x86memop:$src2),		def rm : I<0xF2, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, x86memop:$src2),
!strconcat(mnemonic, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(mnemonic, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set RC:$dst, EFLAGS,		[(set RC:$dst, EFLAGS,
(X86and_flag (not RC:$src1), (ld_frag addr:$src2)))]>,		(X86and_flag (not RC:$src1), (ld_frag addr:$src2)))]>,
Sched<[WriteALULd, ReadAfterLd]>;		Sched<[WriteALU.Folded, WriteALU.ReadAfterFold]>;
}		}

// Complexity is reduced to give and with immediate a chance to match first.		// Complexity is reduced to give and with immediate a chance to match first.
let Predicates = [HasBMI], Defs = [EFLAGS], AddedComplexity = -6 in {		let Predicates = [HasBMI], Defs = [EFLAGS], AddedComplexity = -6 in {
defm ANDN32 : bmi_andn<"andn{l}", GR32, i32mem, loadi32>, T8PS, VEX_4V;		defm ANDN32 : bmi_andn<"andn{l}", GR32, i32mem, loadi32>, T8PS, VEX_4V;
defm ANDN64 : bmi_andn<"andn{q}", GR64, i64mem, loadi64>, T8PS, VEX_4V, VEX_W;		defm ANDN64 : bmi_andn<"andn{q}", GR64, i64mem, loadi64>, T8PS, VEX_4V, VEX_W;
}		}

▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines	def ADOX32rr : I<0xF6, MRMSrcReg, (outs GR32:$dst),
(ins GR32:$src1, GR32:$src2),		(ins GR32:$src1, GR32:$src2),
"adox{l}\t{$src2, $dst\|$dst, $src2}", []>, T8XS;		"adox{l}\t{$src2, $dst\|$dst, $src2}", []>, T8XS;

def ADOX64rr : RI<0xF6, MRMSrcReg, (outs GR64:$dst),		def ADOX64rr : RI<0xF6, MRMSrcReg, (outs GR64:$dst),
(ins GR64:$src1, GR64:$src2),		(ins GR64:$src1, GR64:$src2),
"adox{q}\t{$src2, $dst\|$dst, $src2}", []>, T8XS;		"adox{q}\t{$src2, $dst\|$dst, $src2}", []>, T8XS;
} // SchedRW		} // SchedRW

let mayLoad = 1, SchedRW = [WriteADCLd, ReadAfterLd] in {		let mayLoad = 1, SchedRW = [WriteADC.Folded, WriteADC.ReadAfterFold] in {
def ADCX32rm : I<0xF6, MRMSrcMem, (outs GR32:$dst),		def ADCX32rm : I<0xF6, MRMSrcMem, (outs GR32:$dst),
(ins GR32:$src1, i32mem:$src2),		(ins GR32:$src1, i32mem:$src2),
"adcx{l}\t{$src2, $dst\|$dst, $src2}", []>, T8PD;		"adcx{l}\t{$src2, $dst\|$dst, $src2}", []>, T8PD;

def ADCX64rm : RI<0xF6, MRMSrcMem, (outs GR64:$dst),		def ADCX64rm : RI<0xF6, MRMSrcMem, (outs GR64:$dst),
(ins GR64:$src1, i64mem:$src2),		(ins GR64:$src1, i64mem:$src2),
"adcx{q}\t{$src2, $dst\|$dst, $src2}", []>, T8PD;		"adcx{q}\t{$src2, $dst\|$dst, $src2}", []>, T8PD;

def ADOX32rm : I<0xF6, MRMSrcMem, (outs GR32:$dst),		def ADOX32rm : I<0xF6, MRMSrcMem, (outs GR32:$dst),
(ins GR32:$src1, i32mem:$src2),		(ins GR32:$src1, i32mem:$src2),
"adox{l}\t{$src2, $dst\|$dst, $src2}", []>, T8XS;		"adox{l}\t{$src2, $dst\|$dst, $src2}", []>, T8XS;

def ADOX64rm : RI<0xF6, MRMSrcMem, (outs GR64:$dst),		def ADOX64rm : RI<0xF6, MRMSrcMem, (outs GR64:$dst),
(ins GR64:$src1, i64mem:$src2),		(ins GR64:$src1, i64mem:$src2),
"adox{q}\t{$src2, $dst\|$dst, $src2}", []>, T8XS;		"adox{q}\t{$src2, $dst\|$dst, $src2}", []>, T8XS;
} // mayLoad = 1, SchedRW = [WriteADCLd]		} // mayLoad, SchedRW
}		}

lib/Target/X86/X86InstrCMovSetCC.td

Show All 32 Lines	let Uses = [EFLAGS], Predicates = [HasCMov], Constraints = "$src1 = $dst",
def NAME#64rr		def NAME#64rr
:RI<opc, MRMSrcReg, (outs GR64:$dst), (ins GR64:$src1, GR64:$src2),		:RI<opc, MRMSrcReg, (outs GR64:$dst), (ins GR64:$src1, GR64:$src2),
!strconcat(Mnemonic, "{q}\t{$src2, $dst\|$dst, $src2}"),		!strconcat(Mnemonic, "{q}\t{$src2, $dst\|$dst, $src2}"),
[(set GR64:$dst,		[(set GR64:$dst,
(X86cmov GR64:$src1, GR64:$src2, CondNode, EFLAGS))]>, TB;		(X86cmov GR64:$src1, GR64:$src2, CondNode, EFLAGS))]>, TB;
}		}

let Uses = [EFLAGS], Predicates = [HasCMov], Constraints = "$src1 = $dst",		let Uses = [EFLAGS], Predicates = [HasCMov], Constraints = "$src1 = $dst",
SchedRW = [Sched.Folded, ReadAfterLd] in {		SchedRW = [Sched.Folded, Sched.ReadAfterFold] in {
def NAME#16rm		def NAME#16rm
: I<opc, MRMSrcMem, (outs GR16:$dst), (ins GR16:$src1, i16mem:$src2),		: I<opc, MRMSrcMem, (outs GR16:$dst), (ins GR16:$src1, i16mem:$src2),
!strconcat(Mnemonic, "{w}\t{$src2, $dst\|$dst, $src2}"),		!strconcat(Mnemonic, "{w}\t{$src2, $dst\|$dst, $src2}"),
[(set GR16:$dst, (X86cmov GR16:$src1, (loadi16 addr:$src2),		[(set GR16:$dst, (X86cmov GR16:$src1, (loadi16 addr:$src2),
CondNode, EFLAGS))]>, TB, OpSize16;		CondNode, EFLAGS))]>, TB, OpSize16;
def NAME#32rm		def NAME#32rm
: I<opc, MRMSrcMem, (outs GR32:$dst), (ins GR32:$src1, i32mem:$src2),		: I<opc, MRMSrcMem, (outs GR32:$dst), (ins GR32:$src1, i32mem:$src2),
!strconcat(Mnemonic, "{l}\t{$src2, $dst\|$dst, $src2}"),		!strconcat(Mnemonic, "{l}\t{$src2, $dst\|$dst, $src2}"),
▲ Show 20 Lines • Show All 67 Lines • Show Last 20 Lines

lib/Target/X86/X86InstrFMA.td

Show First 20 Lines • Show All 45 Lines • ▼ Show 20 Lines	multiclass fma3p_rm_213<bits<8> opc, string OpcodeStr, RegisterClass RC,

let mayLoad = 1 in		let mayLoad = 1 in
def m : FMA3<opc, MRMSrcMem, (outs RC:$dst),		def m : FMA3<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, RC:$src2, x86memop:$src3),		(ins RC:$src1, RC:$src2, x86memop:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
[(set RC:$dst, (VT (Op RC:$src2, RC:$src1,		[(set RC:$dst, (VT (Op RC:$src2, RC:$src1,
(MemFrag addr:$src3))))]>,		(MemFrag addr:$src3))))]>,
Sched<[sched.Folded, ReadAfterLd, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold, sched.ReadAfterFold]>;
}		}

multiclass fma3p_rm_231<bits<8> opc, string OpcodeStr, RegisterClass RC,		multiclass fma3p_rm_231<bits<8> opc, string OpcodeStr, RegisterClass RC,
ValueType VT, X86MemOperand x86memop, PatFrag MemFrag,		ValueType VT, X86MemOperand x86memop, PatFrag MemFrag,
SDNode Op, X86FoldableSchedWrite sched> {		SDNode Op, X86FoldableSchedWrite sched> {
let hasSideEffects = 0 in		let hasSideEffects = 0 in
def r : FMA3<opc, MRMSrcReg, (outs RC:$dst),		def r : FMA3<opc, MRMSrcReg, (outs RC:$dst),
(ins RC:$src1, RC:$src2, RC:$src3),		(ins RC:$src1, RC:$src2, RC:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
[]>, Sched<[sched]>;		[]>, Sched<[sched]>;

let mayLoad = 1 in		let mayLoad = 1 in
def m : FMA3<opc, MRMSrcMem, (outs RC:$dst),		def m : FMA3<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, RC:$src2, x86memop:$src3),		(ins RC:$src1, RC:$src2, x86memop:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
[(set RC:$dst, (VT (Op RC:$src2, (MemFrag addr:$src3),		[(set RC:$dst, (VT (Op RC:$src2, (MemFrag addr:$src3),
RC:$src1)))]>,		RC:$src1)))]>,
Sched<[sched.Folded, ReadAfterLd, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold, sched.ReadAfterFold]>;
}		}

multiclass fma3p_rm_132<bits<8> opc, string OpcodeStr, RegisterClass RC,		multiclass fma3p_rm_132<bits<8> opc, string OpcodeStr, RegisterClass RC,
ValueType VT, X86MemOperand x86memop, PatFrag MemFrag,		ValueType VT, X86MemOperand x86memop, PatFrag MemFrag,
SDNode Op, X86FoldableSchedWrite sched> {		SDNode Op, X86FoldableSchedWrite sched> {
let hasSideEffects = 0 in		let hasSideEffects = 0 in
def r : FMA3<opc, MRMSrcReg, (outs RC:$dst),		def r : FMA3<opc, MRMSrcReg, (outs RC:$dst),
(ins RC:$src1, RC:$src2, RC:$src3),		(ins RC:$src1, RC:$src2, RC:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
[]>, Sched<[sched]>;		[]>, Sched<[sched]>;

// Pattern is 312 order so that the load is in a different place from the		// Pattern is 312 order so that the load is in a different place from the
// 213 and 231 patterns this helps tablegen's duplicate pattern detection.		// 213 and 231 patterns this helps tablegen's duplicate pattern detection.
let mayLoad = 1 in		let mayLoad = 1 in
def m : FMA3<opc, MRMSrcMem, (outs RC:$dst),		def m : FMA3<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, RC:$src2, x86memop:$src3),		(ins RC:$src1, RC:$src2, x86memop:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
[(set RC:$dst, (VT (Op (MemFrag addr:$src3), RC:$src1,		[(set RC:$dst, (VT (Op (MemFrag addr:$src3), RC:$src1,
RC:$src2)))]>,		RC:$src2)))]>,
Sched<[sched.Folded, ReadAfterLd, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold, sched.ReadAfterFold]>;
}		}

let Constraints = "$src1 = $dst", hasSideEffects = 0, isCommutable = 1 in		let Constraints = "$src1 = $dst", hasSideEffects = 0, isCommutable = 1 in
multiclass fma3p_forms<bits<8> opc132, bits<8> opc213, bits<8> opc231,		multiclass fma3p_forms<bits<8> opc132, bits<8> opc213, bits<8> opc231,
string OpcodeStr, string PackTy, string Suff,		string OpcodeStr, string PackTy, string Suff,
PatFrag MemFrag128, PatFrag MemFrag256,		PatFrag MemFrag128, PatFrag MemFrag256,
SDNode Op, ValueType OpTy128, ValueType OpTy256,		SDNode Op, ValueType OpTy128, ValueType OpTy256,
X86SchedWriteWidths sched> {		X86SchedWriteWidths sched> {
▲ Show 20 Lines • Show All 82 Lines • ▼ Show 20 Lines	multiclass fma3s_rm_213<bits<8> opc, string OpcodeStr,

let mayLoad = 1 in		let mayLoad = 1 in
def m : FMA3S<opc, MRMSrcMem, (outs RC:$dst),		def m : FMA3S<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, RC:$src2, x86memop:$src3),		(ins RC:$src1, RC:$src2, x86memop:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
[(set RC:$dst,		[(set RC:$dst,
(OpNode RC:$src2, RC:$src1, (load addr:$src3)))]>,		(OpNode RC:$src2, RC:$src1, (load addr:$src3)))]>,
Sched<[sched.Folded, ReadAfterLd, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold, sched.ReadAfterFold]>;
}		}

multiclass fma3s_rm_231<bits<8> opc, string OpcodeStr,		multiclass fma3s_rm_231<bits<8> opc, string OpcodeStr,
X86MemOperand x86memop, RegisterClass RC,		X86MemOperand x86memop, RegisterClass RC,
SDPatternOperator OpNode, X86FoldableSchedWrite sched> {		SDPatternOperator OpNode, X86FoldableSchedWrite sched> {
let hasSideEffects = 0 in		let hasSideEffects = 0 in
def r : FMA3S<opc, MRMSrcReg, (outs RC:$dst),		def r : FMA3S<opc, MRMSrcReg, (outs RC:$dst),
(ins RC:$src1, RC:$src2, RC:$src3),		(ins RC:$src1, RC:$src2, RC:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
[]>, Sched<[sched]>;		[]>, Sched<[sched]>;

let mayLoad = 1 in		let mayLoad = 1 in
def m : FMA3S<opc, MRMSrcMem, (outs RC:$dst),		def m : FMA3S<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, RC:$src2, x86memop:$src3),		(ins RC:$src1, RC:$src2, x86memop:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
[(set RC:$dst,		[(set RC:$dst,
(OpNode RC:$src2, (load addr:$src3), RC:$src1))]>,		(OpNode RC:$src2, (load addr:$src3), RC:$src1))]>,
Sched<[sched.Folded, ReadAfterLd, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold, sched.ReadAfterFold]>;
}		}

multiclass fma3s_rm_132<bits<8> opc, string OpcodeStr,		multiclass fma3s_rm_132<bits<8> opc, string OpcodeStr,
X86MemOperand x86memop, RegisterClass RC,		X86MemOperand x86memop, RegisterClass RC,
SDPatternOperator OpNode, X86FoldableSchedWrite sched> {		SDPatternOperator OpNode, X86FoldableSchedWrite sched> {
let hasSideEffects = 0 in		let hasSideEffects = 0 in
def r : FMA3S<opc, MRMSrcReg, (outs RC:$dst),		def r : FMA3S<opc, MRMSrcReg, (outs RC:$dst),
(ins RC:$src1, RC:$src2, RC:$src3),		(ins RC:$src1, RC:$src2, RC:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
[]>, Sched<[sched]>;		[]>, Sched<[sched]>;

// Pattern is 312 order so that the load is in a different place from the		// Pattern is 312 order so that the load is in a different place from the
// 213 and 231 patterns this helps tablegen's duplicate pattern detection.		// 213 and 231 patterns this helps tablegen's duplicate pattern detection.
let mayLoad = 1 in		let mayLoad = 1 in
def m : FMA3S<opc, MRMSrcMem, (outs RC:$dst),		def m : FMA3S<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, RC:$src2, x86memop:$src3),		(ins RC:$src1, RC:$src2, x86memop:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
[(set RC:$dst,		[(set RC:$dst,
(OpNode (load addr:$src3), RC:$src1, RC:$src2))]>,		(OpNode (load addr:$src3), RC:$src1, RC:$src2))]>,
Sched<[sched.Folded, ReadAfterLd, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold, sched.ReadAfterFold]>;
}		}

let Constraints = "$src1 = $dst", isCommutable = 1, hasSideEffects = 0 in		let Constraints = "$src1 = $dst", isCommutable = 1, hasSideEffects = 0 in
multiclass fma3s_forms<bits<8> opc132, bits<8> opc213, bits<8> opc231,		multiclass fma3s_forms<bits<8> opc132, bits<8> opc213, bits<8> opc231,
string OpStr, string PackTy, string Suff,		string OpStr, string PackTy, string Suff,
SDNode OpNode, RegisterClass RC,		SDNode OpNode, RegisterClass RC,
X86MemOperand x86memop, X86FoldableSchedWrite sched> {		X86MemOperand x86memop, X86FoldableSchedWrite sched> {
defm NAME#213#Suff : fma3s_rm_213<opc213, !strconcat(OpStr, "213", PackTy),		defm NAME#213#Suff : fma3s_rm_213<opc213, !strconcat(OpStr, "213", PackTy),
Show All 28 Lines	def r_Int : FMA3S_Int<opc, MRMSrcReg, (outs RC:$dst),
"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
[]>, Sched<[sched]>;		[]>, Sched<[sched]>;

let mayLoad = 1 in		let mayLoad = 1 in
def m_Int : FMA3S_Int<opc, MRMSrcMem, (outs RC:$dst),		def m_Int : FMA3S_Int<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, RC:$src2, memopr:$src3),		(ins RC:$src1, RC:$src2, memopr:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
[]>, Sched<[sched.Folded, ReadAfterLd, ReadAfterLd]>;		[]>, Sched<[sched.Folded, sched.ReadAfterFold, sched.ReadAfterFold]>;
}		}

// The FMA 213 form is created for lowering of scalar FMA intrinscis		// The FMA 213 form is created for lowering of scalar FMA intrinscis
// to machine instructions.		// to machine instructions.
// The FMA 132 form can trivially be get by commuting the 2nd and 3rd operands		// The FMA 132 form can trivially be get by commuting the 2nd and 3rd operands
// of FMA 213 form.		// of FMA 213 form.
// The FMA 231 form can be get only by commuting the 1st operand of 213 or 132		// The FMA 231 form can be get only by commuting the 1st operand of 213 or 132
// forms and is possible only after special analysis of all uses of the initial		// forms and is possible only after special analysis of all uses of the initial
▲ Show 20 Lines • Show All 106 Lines • ▼ Show 20 Lines	def rr : FMA4S<opc, MRMSrcRegOp4, (outs RC:$dst),
(OpVT (OpNode RC:$src1, RC:$src2, RC:$src3)))]>, VEX_W, VEX_LIG,		(OpVT (OpNode RC:$src1, RC:$src2, RC:$src3)))]>, VEX_W, VEX_LIG,
Sched<[sched]>;		Sched<[sched]>;
def rm : FMA4S<opc, MRMSrcMemOp4, (outs RC:$dst),		def rm : FMA4S<opc, MRMSrcMemOp4, (outs RC:$dst),
(ins RC:$src1, RC:$src2, x86memop:$src3),		(ins RC:$src1, RC:$src2, x86memop:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[(set RC:$dst, (OpNode RC:$src1, RC:$src2,		[(set RC:$dst, (OpNode RC:$src1, RC:$src2,
(mem_frag addr:$src3)))]>, VEX_W, VEX_LIG,		(mem_frag addr:$src3)))]>, VEX_W, VEX_LIG,
Sched<[sched.Folded, ReadAfterLd, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold, sched.ReadAfterFold]>;
def mr : FMA4S<opc, MRMSrcMem, (outs RC:$dst),		def mr : FMA4S<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop:$src2, RC:$src3),		(ins RC:$src1, x86memop:$src2, RC:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[(set RC:$dst,		[(set RC:$dst,
(OpNode RC:$src1, (mem_frag addr:$src2), RC:$src3))]>, VEX_LIG,		(OpNode RC:$src1, (mem_frag addr:$src2), RC:$src3))]>, VEX_LIG,
Sched<[sched.Folded, ReadAfterLd,		Sched<[sched.Folded, sched.ReadAfterFold,
// x86memop:$src2		// x86memop:$src2
ReadDefault, ReadDefault, ReadDefault, ReadDefault,		ReadDefault, ReadDefault, ReadDefault, ReadDefault,
ReadDefault,		ReadDefault,
// RC:$src3		// RC:$src3
ReadAfterLd]>;		sched.ReadAfterFold]>;
// For disassembler		// For disassembler
let isCodeGenOnly = 1, ForceDisassemble = 1, hasSideEffects = 0 in		let isCodeGenOnly = 1, ForceDisassemble = 1, hasSideEffects = 0 in
def rr_REV : FMA4S<opc, MRMSrcReg, (outs RC:$dst),		def rr_REV : FMA4S<opc, MRMSrcReg, (outs RC:$dst),
(ins RC:$src1, RC:$src2, RC:$src3),		(ins RC:$src1, RC:$src2, RC:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"), []>,		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"), []>,
VEX_LIG, FoldGenData<NAME#rr>, Sched<[sched]>;		VEX_LIG, FoldGenData<NAME#rr>, Sched<[sched]>;
}		}

multiclass fma4s_int<bits<8> opc, string OpcodeStr, Operand memop,		multiclass fma4s_int<bits<8> opc, string OpcodeStr, Operand memop,
ValueType VT, X86FoldableSchedWrite sched> {		ValueType VT, X86FoldableSchedWrite sched> {
let isCodeGenOnly = 1, hasSideEffects = 0 in {		let isCodeGenOnly = 1, hasSideEffects = 0 in {
def rr_Int : FMA4S_Int<opc, MRMSrcRegOp4, (outs VR128:$dst),		def rr_Int : FMA4S_Int<opc, MRMSrcRegOp4, (outs VR128:$dst),
(ins VR128:$src1, VR128:$src2, VR128:$src3),		(ins VR128:$src1, VR128:$src2, VR128:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[]>, VEX_W, VEX_LIG, Sched<[sched]>;		[]>, VEX_W, VEX_LIG, Sched<[sched]>;
let mayLoad = 1 in		let mayLoad = 1 in
def rm_Int : FMA4S_Int<opc, MRMSrcMemOp4, (outs VR128:$dst),		def rm_Int : FMA4S_Int<opc, MRMSrcMemOp4, (outs VR128:$dst),
(ins VR128:$src1, VR128:$src2, memop:$src3),		(ins VR128:$src1, VR128:$src2, memop:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[]>, VEX_W, VEX_LIG,		[]>, VEX_W, VEX_LIG,
Sched<[sched.Folded, ReadAfterLd, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold, sched.ReadAfterFold]>;
let mayLoad = 1 in		let mayLoad = 1 in
def mr_Int : FMA4S_Int<opc, MRMSrcMem, (outs VR128:$dst),		def mr_Int : FMA4S_Int<opc, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, memop:$src2, VR128:$src3),		(ins VR128:$src1, memop:$src2, VR128:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[]>,		[]>,
VEX_LIG, Sched<[sched.Folded, ReadAfterLd,		VEX_LIG, Sched<[sched.Folded, sched.ReadAfterFold,
// memop:$src2		// memop:$src2
ReadDefault, ReadDefault, ReadDefault,		ReadDefault, ReadDefault, ReadDefault,
ReadDefault, ReadDefault,		ReadDefault, ReadDefault,
// VR128::$src3		// VR128::$src3
ReadAfterLd]>;		sched.ReadAfterFold]>;
def rr_Int_REV : FMA4S_Int<opc, MRMSrcReg, (outs VR128:$dst),		def rr_Int_REV : FMA4S_Int<opc, MRMSrcReg, (outs VR128:$dst),
(ins VR128:$src1, VR128:$src2, VR128:$src3),		(ins VR128:$src1, VR128:$src2, VR128:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[]>, VEX_LIG, FoldGenData<NAME#rr_Int>, Sched<[sched]>;		[]>, VEX_LIG, FoldGenData<NAME#rr_Int>, Sched<[sched]>;
} // isCodeGenOnly = 1		} // isCodeGenOnly = 1
}		}

Show All 10 Lines	def rr : FMA4<opc, MRMSrcRegOp4, (outs VR128:$dst),
(OpVT128 (OpNode VR128:$src1, VR128:$src2, VR128:$src3)))]>,		(OpVT128 (OpNode VR128:$src1, VR128:$src2, VR128:$src3)))]>,
VEX_W, Sched<[sched.XMM]>;		VEX_W, Sched<[sched.XMM]>;
def rm : FMA4<opc, MRMSrcMemOp4, (outs VR128:$dst),		def rm : FMA4<opc, MRMSrcMemOp4, (outs VR128:$dst),
(ins VR128:$src1, VR128:$src2, f128mem:$src3),		(ins VR128:$src1, VR128:$src2, f128mem:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[(set VR128:$dst, (OpNode VR128:$src1, VR128:$src2,		[(set VR128:$dst, (OpNode VR128:$src1, VR128:$src2,
(ld_frag128 addr:$src3)))]>, VEX_W,		(ld_frag128 addr:$src3)))]>, VEX_W,
Sched<[sched.XMM.Folded, ReadAfterLd, ReadAfterLd]>;		Sched<[sched.XMM.Folded, sched.XMM.ReadAfterFold, sched.XMM.ReadAfterFold]>;
def mr : FMA4<opc, MRMSrcMem, (outs VR128:$dst),		def mr : FMA4<opc, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, f128mem:$src2, VR128:$src3),		(ins VR128:$src1, f128mem:$src2, VR128:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[(set VR128:$dst,		[(set VR128:$dst,
(OpNode VR128:$src1, (ld_frag128 addr:$src2), VR128:$src3))]>,		(OpNode VR128:$src1, (ld_frag128 addr:$src2), VR128:$src3))]>,
Sched<[sched.XMM.Folded, ReadAfterLd,		Sched<[sched.XMM.Folded, sched.XMM.ReadAfterFold,
// f128mem:$src2		// f128mem:$src2
ReadDefault, ReadDefault, ReadDefault, ReadDefault,		ReadDefault, ReadDefault, ReadDefault, ReadDefault,
ReadDefault,		ReadDefault,
// VR128::$src3		// VR128::$src3
ReadAfterLd]>;		sched.XMM.ReadAfterFold]>;
let isCommutable = 1 in		let isCommutable = 1 in
def Yrr : FMA4<opc, MRMSrcRegOp4, (outs VR256:$dst),		def Yrr : FMA4<opc, MRMSrcRegOp4, (outs VR256:$dst),
(ins VR256:$src1, VR256:$src2, VR256:$src3),		(ins VR256:$src1, VR256:$src2, VR256:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[(set VR256:$dst,		[(set VR256:$dst,
(OpVT256 (OpNode VR256:$src1, VR256:$src2, VR256:$src3)))]>,		(OpVT256 (OpNode VR256:$src1, VR256:$src2, VR256:$src3)))]>,
VEX_W, VEX_L, Sched<[sched.YMM]>;		VEX_W, VEX_L, Sched<[sched.YMM]>;
def Yrm : FMA4<opc, MRMSrcMemOp4, (outs VR256:$dst),		def Yrm : FMA4<opc, MRMSrcMemOp4, (outs VR256:$dst),
(ins VR256:$src1, VR256:$src2, f256mem:$src3),		(ins VR256:$src1, VR256:$src2, f256mem:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[(set VR256:$dst, (OpNode VR256:$src1, VR256:$src2,		[(set VR256:$dst, (OpNode VR256:$src1, VR256:$src2,
(ld_frag256 addr:$src3)))]>, VEX_W, VEX_L,		(ld_frag256 addr:$src3)))]>, VEX_W, VEX_L,
Sched<[sched.YMM.Folded, ReadAfterLd, ReadAfterLd]>;		Sched<[sched.YMM.Folded, sched.YMM.ReadAfterFold, sched.YMM.ReadAfterFold]>;
def Ymr : FMA4<opc, MRMSrcMem, (outs VR256:$dst),		def Ymr : FMA4<opc, MRMSrcMem, (outs VR256:$dst),
(ins VR256:$src1, f256mem:$src2, VR256:$src3),		(ins VR256:$src1, f256mem:$src2, VR256:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[(set VR256:$dst, (OpNode VR256:$src1,		[(set VR256:$dst, (OpNode VR256:$src1,
(ld_frag256 addr:$src2), VR256:$src3))]>, VEX_L,		(ld_frag256 addr:$src2), VR256:$src3))]>, VEX_L,
Sched<[sched.YMM.Folded, ReadAfterLd,		Sched<[sched.YMM.Folded, sched.YMM.ReadAfterFold,
// f256mem:$src2		// f256mem:$src2
ReadDefault, ReadDefault, ReadDefault, ReadDefault,		ReadDefault, ReadDefault, ReadDefault, ReadDefault,
ReadDefault,		ReadDefault,
// VR256::$src3		// VR256::$src3
ReadAfterLd]>;		sched.YMM.ReadAfterFold]>;
// For disassembler		// For disassembler
let isCodeGenOnly = 1, ForceDisassemble = 1, hasSideEffects = 0 in {		let isCodeGenOnly = 1, ForceDisassemble = 1, hasSideEffects = 0 in {
def rr_REV : FMA4<opc, MRMSrcReg, (outs VR128:$dst),		def rr_REV : FMA4<opc, MRMSrcReg, (outs VR128:$dst),
(ins VR128:$src1, VR128:$src2, VR128:$src3),		(ins VR128:$src1, VR128:$src2, VR128:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"), []>,		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"), []>,
Sched<[sched.XMM]>, FoldGenData<NAME#rr>;		Sched<[sched.XMM]>, FoldGenData<NAME#rr>;
def Yrr_REV : FMA4<opc, MRMSrcReg, (outs VR256:$dst),		def Yrr_REV : FMA4<opc, MRMSrcReg, (outs VR256:$dst),
▲ Show 20 Lines • Show All 109 Lines • Show Last 20 Lines

lib/Target/X86/X86InstrInfo.td

Show First 20 Lines • Show All 2,417 Lines • ▼ Show 20 Lines	def rm : I<opc, MRMSrcMem4VOp3, (outs RC:$dst), (ins x86memop:$src1, RC:$src2),
!strconcat(mnemonic, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(mnemonic, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set RC:$dst, (OpNode (ld_frag addr:$src1), RC:$src2)),		[(set RC:$dst, (OpNode (ld_frag addr:$src1), RC:$src2)),
(implicit EFLAGS)]>, T8PS, VEX,		(implicit EFLAGS)]>, T8PS, VEX,
Sched<[Sched.Folded,		Sched<[Sched.Folded,
// x86memop:$src1		// x86memop:$src1
ReadDefault, ReadDefault, ReadDefault, ReadDefault,		ReadDefault, ReadDefault, ReadDefault, ReadDefault,
ReadDefault,		ReadDefault,
// RC:$src2		// RC:$src2
ReadAfterLd]>;		Sched.ReadAfterFold]>;
}		}

let Predicates = [HasBMI], Defs = [EFLAGS] in {		let Predicates = [HasBMI], Defs = [EFLAGS] in {
defm BEXTR32 : bmi_bextr<0xF7, "bextr{l}", GR32, i32mem,		defm BEXTR32 : bmi_bextr<0xF7, "bextr{l}", GR32, i32mem,
X86bextr, loadi32, WriteBEXTR>;		X86bextr, loadi32, WriteBEXTR>;
defm BEXTR64 : bmi_bextr<0xF7, "bextr{q}", GR64, i64mem,		defm BEXTR64 : bmi_bextr<0xF7, "bextr{q}", GR64, i64mem,
X86bextr, loadi64, WriteBEXTR>, VEX_W;		X86bextr, loadi64, WriteBEXTR>, VEX_W;
}		}
Show All 9 Lines	def rm : I<opc, MRMSrcMem4VOp3, (outs RC:$dst), (ins x86memop:$src1, RC:$src2),
!strconcat(mnemonic, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(mnemonic, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set RC:$dst, (Int (ld_frag addr:$src1), RC:$src2)),		[(set RC:$dst, (Int (ld_frag addr:$src1), RC:$src2)),
(implicit EFLAGS)]>, T8PS, VEX,		(implicit EFLAGS)]>, T8PS, VEX,
Sched<[Sched.Folded,		Sched<[Sched.Folded,
// x86memop:$src1		// x86memop:$src1
ReadDefault, ReadDefault, ReadDefault, ReadDefault,		ReadDefault, ReadDefault, ReadDefault, ReadDefault,
ReadDefault,		ReadDefault,
// RC:$src2		// RC:$src2
ReadAfterLd]>;		Sched.ReadAfterFold]>;
}		}

let Predicates = [HasBMI2], Defs = [EFLAGS] in {		let Predicates = [HasBMI2], Defs = [EFLAGS] in {
defm BZHI32 : bmi_bzhi<0xF5, "bzhi{l}", GR32, i32mem,		defm BZHI32 : bmi_bzhi<0xF5, "bzhi{l}", GR32, i32mem,
int_x86_bmi_bzhi_32, loadi32, WriteBZHI>;		int_x86_bmi_bzhi_32, loadi32, WriteBZHI>;
defm BZHI64 : bmi_bzhi<0xF5, "bzhi{q}", GR64, i64mem,		defm BZHI64 : bmi_bzhi<0xF5, "bzhi{q}", GR64, i64mem,
int_x86_bmi_bzhi_64, loadi64, WriteBZHI>, VEX_W;		int_x86_bmi_bzhi_64, loadi64, WriteBZHI>, VEX_W;
}		}
▲ Show 20 Lines • Show All 119 Lines • ▼ Show 20 Lines	multiclass bmi_pdep_pext<string mnemonic, RegisterClass RC,
PatFrag ld_frag> {		PatFrag ld_frag> {
def rr : I<0xF5, MRMSrcReg, (outs RC:$dst), (ins RC:$src1, RC:$src2),		def rr : I<0xF5, MRMSrcReg, (outs RC:$dst), (ins RC:$src1, RC:$src2),
!strconcat(mnemonic, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(mnemonic, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set RC:$dst, (Int RC:$src1, RC:$src2))]>,		[(set RC:$dst, (Int RC:$src1, RC:$src2))]>,
VEX_4V, Sched<[WriteALU]>;		VEX_4V, Sched<[WriteALU]>;
def rm : I<0xF5, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, x86memop:$src2),		def rm : I<0xF5, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, x86memop:$src2),
!strconcat(mnemonic, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(mnemonic, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set RC:$dst, (Int RC:$src1, (ld_frag addr:$src2)))]>,		[(set RC:$dst, (Int RC:$src1, (ld_frag addr:$src2)))]>,
VEX_4V, Sched<[WriteALULd, ReadAfterLd]>;		VEX_4V, Sched<[WriteALU.Folded, WriteALU.ReadAfterFold]>;
}		}

let Predicates = [HasBMI2] in {		let Predicates = [HasBMI2] in {
defm PDEP32 : bmi_pdep_pext<"pdep{l}", GR32, i32mem,		defm PDEP32 : bmi_pdep_pext<"pdep{l}", GR32, i32mem,
int_x86_bmi_pdep_32, loadi32>, T8XD;		int_x86_bmi_pdep_32, loadi32>, T8XD;
defm PDEP64 : bmi_pdep_pext<"pdep{q}", GR64, i64mem,		defm PDEP64 : bmi_pdep_pext<"pdep{q}", GR64, i64mem,
int_x86_bmi_pdep_64, loadi64>, T8XD, VEX_W;		int_x86_bmi_pdep_64, loadi64>, T8XD, VEX_W;
defm PEXT32 : bmi_pdep_pext<"pext{l}", GR32, i32mem,		defm PEXT32 : bmi_pdep_pext<"pext{l}", GR32, i32mem,
▲ Show 20 Lines • Show All 906 Lines • Show Last 20 Lines

lib/Target/X86/X86InstrMMX.td

Show First 20 Lines • Show All 41 Lines • ▼ Show 20 Lines	def irr : MMXI<opc, MRMSrcReg, (outs VR64:$dst),
Sched<[sched]> {		Sched<[sched]> {
let isCommutable = Commutable;		let isCommutable = Commutable;
}		}
def irm : MMXI<opc, MRMSrcMem, (outs VR64:$dst),		def irm : MMXI<opc, MRMSrcMem, (outs VR64:$dst),
(ins VR64:$src1, OType:$src2),		(ins VR64:$src1, OType:$src2),
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
[(set VR64:$dst, (IntId VR64:$src1,		[(set VR64:$dst, (IntId VR64:$src1,
(bitconvert (load_mmx addr:$src2))))]>,		(bitconvert (load_mmx addr:$src2))))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass MMXI_binop_rmi_int<bits<8> opc, bits<8> opc2, Format ImmForm,		multiclass MMXI_binop_rmi_int<bits<8> opc, bits<8> opc2, Format ImmForm,
string OpcodeStr, Intrinsic IntId,		string OpcodeStr, Intrinsic IntId,
Intrinsic IntId2, X86FoldableSchedWrite sched,		Intrinsic IntId2, X86FoldableSchedWrite sched,
X86FoldableSchedWrite schedImm> {		X86FoldableSchedWrite schedImm> {
def rr : MMXI<opc, MRMSrcReg, (outs VR64:$dst),		def rr : MMXI<opc, MRMSrcReg, (outs VR64:$dst),
(ins VR64:$src1, VR64:$src2),		(ins VR64:$src1, VR64:$src2),
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
[(set VR64:$dst, (IntId VR64:$src1, VR64:$src2))]>,		[(set VR64:$dst, (IntId VR64:$src1, VR64:$src2))]>,
Sched<[sched]>;		Sched<[sched]>;
def rm : MMXI<opc, MRMSrcMem, (outs VR64:$dst),		def rm : MMXI<opc, MRMSrcMem, (outs VR64:$dst),
(ins VR64:$src1, i64mem:$src2),		(ins VR64:$src1, i64mem:$src2),
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
[(set VR64:$dst, (IntId VR64:$src1,		[(set VR64:$dst, (IntId VR64:$src1,
(bitconvert (load_mmx addr:$src2))))]>,		(bitconvert (load_mmx addr:$src2))))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
def ri : MMXIi8<opc2, ImmForm, (outs VR64:$dst),		def ri : MMXIi8<opc2, ImmForm, (outs VR64:$dst),
(ins VR64:$src1, i32u8imm:$src2),		(ins VR64:$src1, i32u8imm:$src2),
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
[(set VR64:$dst, (IntId2 VR64:$src1, imm:$src2))]>,		[(set VR64:$dst, (IntId2 VR64:$src1, imm:$src2))]>,
Sched<[schedImm]>;		Sched<[schedImm]>;
}		}
}		}

Show All 24 Lines	def rr : MMXSS38I<opc, MRMSrcReg, (outs VR64:$dst),
[(set VR64:$dst, (IntId64 VR64:$src1, VR64:$src2))]>,		[(set VR64:$dst, (IntId64 VR64:$src1, VR64:$src2))]>,
Sched<[sched]>;		Sched<[sched]>;
def rm : MMXSS38I<opc, MRMSrcMem, (outs VR64:$dst),		def rm : MMXSS38I<opc, MRMSrcMem, (outs VR64:$dst),
(ins VR64:$src1, i64mem:$src2),		(ins VR64:$src1, i64mem:$src2),
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
[(set VR64:$dst,		[(set VR64:$dst,
(IntId64 VR64:$src1,		(IntId64 VR64:$src1,
(bitconvert (load_mmx addr:$src2))))]>,		(bitconvert (load_mmx addr:$src2))))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

/// PALIGN MMX instructions (require SSSE3).		/// PALIGN MMX instructions (require SSSE3).
multiclass ssse3_palign_mm<string asm, Intrinsic IntId,		multiclass ssse3_palign_mm<string asm, Intrinsic IntId,
X86FoldableSchedWrite sched> {		X86FoldableSchedWrite sched> {
def rri : MMXSS3AI<0x0F, MRMSrcReg, (outs VR64:$dst),		def rri : MMXSS3AI<0x0F, MRMSrcReg, (outs VR64:$dst),
(ins VR64:$src1, VR64:$src2, u8imm:$src3),		(ins VR64:$src1, VR64:$src2, u8imm:$src3),
!strconcat(asm, "\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		!strconcat(asm, "\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
[(set VR64:$dst, (IntId VR64:$src1, VR64:$src2, (i8 imm:$src3)))]>,		[(set VR64:$dst, (IntId VR64:$src1, VR64:$src2, (i8 imm:$src3)))]>,
Sched<[sched]>;		Sched<[sched]>;
def rmi : MMXSS3AI<0x0F, MRMSrcMem, (outs VR64:$dst),		def rmi : MMXSS3AI<0x0F, MRMSrcMem, (outs VR64:$dst),
(ins VR64:$src1, i64mem:$src2, u8imm:$src3),		(ins VR64:$src1, i64mem:$src2, u8imm:$src3),
!strconcat(asm, "\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		!strconcat(asm, "\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
[(set VR64:$dst, (IntId VR64:$src1,		[(set VR64:$dst, (IntId VR64:$src1,
(bitconvert (load_mmx addr:$src2)), (i8 imm:$src3)))]>,		(bitconvert (load_mmx addr:$src2)), (i8 imm:$src3)))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass sse12_cvt_pint<bits<8> opc, RegisterClass SrcRC, RegisterClass DstRC,		multiclass sse12_cvt_pint<bits<8> opc, RegisterClass SrcRC, RegisterClass DstRC,
Intrinsic Int, X86MemOperand x86memop, PatFrag ld_frag,		Intrinsic Int, X86MemOperand x86memop, PatFrag ld_frag,
string asm, X86FoldableSchedWrite sched, Domain d> {		string asm, X86FoldableSchedWrite sched, Domain d> {
def irr : MMXPI<opc, MRMSrcReg, (outs DstRC:$dst), (ins SrcRC:$src), asm,		def irr : MMXPI<opc, MRMSrcReg, (outs DstRC:$dst), (ins SrcRC:$src), asm,
[(set DstRC:$dst, (Int SrcRC:$src))], d>,		[(set DstRC:$dst, (Int SrcRC:$src))], d>,
Sched<[sched]>;		Sched<[sched]>;
▲ Show 20 Lines • Show All 414 Lines • ▼ Show 20 Lines	let Predicates = [HasMMX, HasSSE1] in {

def MMX_PINSRWrm : MMXIi8<0xC4, MRMSrcMem,		def MMX_PINSRWrm : MMXIi8<0xC4, MRMSrcMem,
(outs VR64:$dst),		(outs VR64:$dst),
(ins VR64:$src1, i16mem:$src2, i32u8imm:$src3),		(ins VR64:$src1, i16mem:$src2, i32u8imm:$src3),
"pinsrw\t{$src3, $src2, $dst\|$dst, $src2, $src3}",		"pinsrw\t{$src3, $src2, $dst\|$dst, $src2, $src3}",
[(set VR64:$dst, (int_x86_mmx_pinsr_w VR64:$src1,		[(set VR64:$dst, (int_x86_mmx_pinsr_w VR64:$src1,
(i32 (anyext (loadi16 addr:$src2))),		(i32 (anyext (loadi16 addr:$src2))),
imm:$src3))]>,		imm:$src3))]>,
Sched<[WriteVecInsertLd, ReadAfterLd]>;		Sched<[WriteVecInsert.Folded, WriteVecInsert.ReadAfterFold]>;
}		}
}		}

// Mask creation		// Mask creation
let Predicates = [HasMMX, HasSSE1] in		let Predicates = [HasMMX, HasSSE1] in
def MMX_PMOVMSKBrr : MMXI<0xD7, MRMSrcReg, (outs GR32orGR64:$dst),		def MMX_PMOVMSKBrr : MMXI<0xD7, MRMSrcReg, (outs GR32orGR64:$dst),
(ins VR64:$src),		(ins VR64:$src),
"pmovmskb\t{$src, $dst\|$dst, $src}",		"pmovmskb\t{$src, $dst\|$dst, $src}",
▲ Show 20 Lines • Show All 48 Lines • Show Last 20 Lines

lib/Target/X86/X86InstrSSE.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show All 29 Lines	def rr : SI<opc, MRMSrcReg, (outs RC:$dst), (ins RC:$src1, RC:$src2),
[(set RC:$dst, (OpNode RC:$src1, RC:$src2))], d>,		[(set RC:$dst, (OpNode RC:$src1, RC:$src2))], d>,
Sched<[sched]>;		Sched<[sched]>;
}		}
def rm : SI<opc, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, x86memop:$src2),		def rm : SI<opc, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, x86memop:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst, (OpNode RC:$src1, (load addr:$src2)))], d>,		[(set RC:$dst, (OpNode RC:$src1, (load addr:$src2)))], d>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

/// sse12_fp_scalar_int - SSE 1 & 2 scalar instructions intrinsics class		/// sse12_fp_scalar_int - SSE 1 & 2 scalar instructions intrinsics class
multiclass sse12_fp_scalar_int<bits<8> opc, string OpcodeStr,		multiclass sse12_fp_scalar_int<bits<8> opc, string OpcodeStr,
SDPatternOperator OpNode, RegisterClass RC,		SDPatternOperator OpNode, RegisterClass RC,
ValueType VT, string asm, Operand memopr,		ValueType VT, string asm, Operand memopr,
ComplexPattern mem_cpat, Domain d,		ComplexPattern mem_cpat, Domain d,
X86FoldableSchedWrite sched, bit Is2Addr = 1> {		X86FoldableSchedWrite sched, bit Is2Addr = 1> {
let isCodeGenOnly = 1, hasSideEffects = 0 in {		let isCodeGenOnly = 1, hasSideEffects = 0 in {
def rr_Int : SI_Int<opc, MRMSrcReg, (outs RC:$dst), (ins RC:$src1, RC:$src2),		def rr_Int : SI_Int<opc, MRMSrcReg, (outs RC:$dst), (ins RC:$src1, RC:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(asm, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(asm, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(asm, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(asm, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst, (VT (OpNode RC:$src1, RC:$src2)))], d>,		[(set RC:$dst, (VT (OpNode RC:$src1, RC:$src2)))], d>,
Sched<[sched]>;		Sched<[sched]>;
let mayLoad = 1 in		let mayLoad = 1 in
def rm_Int : SI_Int<opc, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, memopr:$src2),		def rm_Int : SI_Int<opc, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, memopr:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(asm, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(asm, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(asm, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(asm, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst, (VT (OpNode RC:$src1, mem_cpat:$src2)))], d>,		[(set RC:$dst, (VT (OpNode RC:$src1, mem_cpat:$src2)))], d>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

/// sse12_fp_packed - SSE 1 & 2 packed instructions class		/// sse12_fp_packed - SSE 1 & 2 packed instructions class
multiclass sse12_fp_packed<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass sse12_fp_packed<bits<8> opc, string OpcodeStr, SDNode OpNode,
RegisterClass RC, ValueType vt,		RegisterClass RC, ValueType vt,
X86MemOperand x86memop, PatFrag mem_frag,		X86MemOperand x86memop, PatFrag mem_frag,
Domain d, X86FoldableSchedWrite sched,		Domain d, X86FoldableSchedWrite sched,
bit Is2Addr = 1> {		bit Is2Addr = 1> {
let isCommutable = 1 in		let isCommutable = 1 in
def rr : PI<opc, MRMSrcReg, (outs RC:$dst), (ins RC:$src1, RC:$src2),		def rr : PI<opc, MRMSrcReg, (outs RC:$dst), (ins RC:$src1, RC:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst, (vt (OpNode RC:$src1, RC:$src2)))], d>,		[(set RC:$dst, (vt (OpNode RC:$src1, RC:$src2)))], d>,
Sched<[sched]>;		Sched<[sched]>;
let mayLoad = 1 in		let mayLoad = 1 in
def rm : PI<opc, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, x86memop:$src2),		def rm : PI<opc, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, x86memop:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst, (OpNode RC:$src1, (mem_frag addr:$src2)))],		[(set RC:$dst, (OpNode RC:$src1, (mem_frag addr:$src2)))],
d>,		d>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

/// sse12_fp_packed_logical_rm - SSE 1 & 2 packed instructions class		/// sse12_fp_packed_logical_rm - SSE 1 & 2 packed instructions class
multiclass sse12_fp_packed_logical_rm<bits<8> opc, RegisterClass RC, Domain d,		multiclass sse12_fp_packed_logical_rm<bits<8> opc, RegisterClass RC, Domain d,
string OpcodeStr, X86MemOperand x86memop,		string OpcodeStr, X86MemOperand x86memop,
X86FoldableSchedWrite sched,		X86FoldableSchedWrite sched,
list<dag> pat_rr, list<dag> pat_rm,		list<dag> pat_rr, list<dag> pat_rm,
bit Is2Addr = 1> {		bit Is2Addr = 1> {
let isCommutable = 1, hasSideEffects = 0 in		let isCommutable = 1, hasSideEffects = 0 in
def rr : PI<opc, MRMSrcReg, (outs RC:$dst), (ins RC:$src1, RC:$src2),		def rr : PI<opc, MRMSrcReg, (outs RC:$dst), (ins RC:$src1, RC:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
pat_rr, d>,		pat_rr, d>,
Sched<[sched]>;		Sched<[sched]>;
let hasSideEffects = 0, mayLoad = 1 in		let hasSideEffects = 0, mayLoad = 1 in
def rm : PI<opc, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, x86memop:$src2),		def rm : PI<opc, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, x86memop:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
pat_rm, d>,		pat_rm, d>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}


// Alias instructions that map fld0 to xorps for sse or vxorps for avx.		// Alias instructions that map fld0 to xorps for sse or vxorps for avx.
// This is expanded by ExpandPostRAPseudos.		// This is expanded by ExpandPostRAPseudos.
let isReMaterializable = 1, isAsCheapAsAMove = 1, canFoldAsLoad = 1,		let isReMaterializable = 1, isAsCheapAsAMove = 1, canFoldAsLoad = 1,
isPseudo = 1, SchedRW = [WriteZero] in {		isPseudo = 1, SchedRW = [WriteZero] in {
def FsFLD0SS : I<0, Pseudo, (outs FR32:$dst), (ins), "",		def FsFLD0SS : I<0, Pseudo, (outs FR32:$dst), (ins), "",
▲ Show 20 Lines • Show All 532 Lines • ▼ Show 20 Lines
multiclass sse12_mov_hilo_packed_base<bits<8>opc, SDNode pdnode,		multiclass sse12_mov_hilo_packed_base<bits<8>opc, SDNode pdnode,
string base_opc, string asm_opr> {		string base_opc, string asm_opr> {
// No pattern as they need be special cased between high and low.		// No pattern as they need be special cased between high and low.
let hasSideEffects = 0, mayLoad = 1 in		let hasSideEffects = 0, mayLoad = 1 in
def PSrm : PI<opc, MRMSrcMem,		def PSrm : PI<opc, MRMSrcMem,
(outs VR128:$dst), (ins VR128:$src1, f64mem:$src2),		(outs VR128:$dst), (ins VR128:$src1, f64mem:$src2),
!strconcat(base_opc, "s", asm_opr),		!strconcat(base_opc, "s", asm_opr),
[], SSEPackedSingle>, PS,		[], SSEPackedSingle>, PS,
Sched<[SchedWriteFShuffle.XMM.Folded, ReadAfterLd]>;		Sched<[SchedWriteFShuffle.XMM.Folded, SchedWriteFShuffle.XMM.ReadAfterFold]>;

def PDrm : PI<opc, MRMSrcMem,		def PDrm : PI<opc, MRMSrcMem,
(outs VR128:$dst), (ins VR128:$src1, f64mem:$src2),		(outs VR128:$dst), (ins VR128:$src1, f64mem:$src2),
!strconcat(base_opc, "d", asm_opr),		!strconcat(base_opc, "d", asm_opr),
[(set VR128:$dst, (v2f64 (pdnode VR128:$src1,		[(set VR128:$dst, (v2f64 (pdnode VR128:$src1,
(scalar_to_vector (loadf64 addr:$src2)))))],		(scalar_to_vector (loadf64 addr:$src2)))))],
SSEPackedDouble>, PD,		SSEPackedDouble>, PD,
Sched<[SchedWriteFShuffle.XMM.Folded, ReadAfterLd]>;		Sched<[SchedWriteFShuffle.XMM.Folded, SchedWriteFShuffle.XMM.ReadAfterFold]>;
}		}

multiclass sse12_mov_hilo_packed<bits<8>opc, SDPatternOperator pdnode,		multiclass sse12_mov_hilo_packed<bits<8>opc, SDPatternOperator pdnode,
string base_opc> {		string base_opc> {
let Predicates = [UseAVX] in		let Predicates = [UseAVX] in
defm V#NAME : sse12_mov_hilo_packed_base<opc, pdnode, base_opc,		defm V#NAME : sse12_mov_hilo_packed_base<opc, pdnode, base_opc,
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}">,		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}">,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
▲ Show 20 Lines • Show All 184 Lines • ▼ Show 20 Lines
let hasSideEffects = 0, Predicates = [UseAVX] in {		let hasSideEffects = 0, Predicates = [UseAVX] in {
def rr : SI<opc, MRMSrcReg, (outs DstRC:$dst), (ins DstRC:$src1, SrcRC:$src),		def rr : SI<opc, MRMSrcReg, (outs DstRC:$dst), (ins DstRC:$src1, SrcRC:$src),
!strconcat(asm,"\t{$src, $src1, $dst\|$dst, $src1, $src}"), []>,		!strconcat(asm,"\t{$src, $src1, $dst\|$dst, $src1, $src}"), []>,
Sched<[sched]>;		Sched<[sched]>;
let mayLoad = 1 in		let mayLoad = 1 in
def rm : SI<opc, MRMSrcMem, (outs DstRC:$dst),		def rm : SI<opc, MRMSrcMem, (outs DstRC:$dst),
(ins DstRC:$src1, x86memop:$src),		(ins DstRC:$src1, x86memop:$src),
!strconcat(asm,"\t{$src, $src1, $dst\|$dst, $src1, $src}"), []>,		!strconcat(asm,"\t{$src, $src1, $dst\|$dst, $src1, $src}"), []>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
} // hasSideEffects = 0		} // hasSideEffects = 0
}		}

let Predicates = [UseAVX] in {		let Predicates = [UseAVX] in {
defm VCVTTSS2SI : sse12_cvt_s<0x2C, FR32, GR32, fp_to_sint, f32mem, loadf32,		defm VCVTTSS2SI : sse12_cvt_s<0x2C, FR32, GR32, fp_to_sint, f32mem, loadf32,
"cvttss2si\t{$src, $dst\|$dst, $src}",		"cvttss2si\t{$src, $dst\|$dst, $src}",
WriteCvtSS2I>,		WriteCvtSS2I>,
XS, VEX, VEX_LIG;		XS, VEX, VEX_LIG;
▲ Show 20 Lines • Show All 140 Lines • ▼ Show 20 Lines	def rr_Int : SI<opc, MRMSrcReg, (outs DstRC:$dst), (ins DstRC:$src1, SrcRC:$src2),
!strconcat(asm, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(asm, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[]>, Sched<[sched]>;		[]>, Sched<[sched]>;
let mayLoad = 1 in		let mayLoad = 1 in
def rm_Int : SI<opc, MRMSrcMem, (outs DstRC:$dst),		def rm_Int : SI<opc, MRMSrcMem, (outs DstRC:$dst),
(ins DstRC:$src1, x86memop:$src2),		(ins DstRC:$src1, x86memop:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(asm, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(asm, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(asm, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(asm, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[]>, Sched<[sched.Folded, ReadAfterLd]>;		[]>, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

let Predicates = [UseAVX] in {		let Predicates = [UseAVX] in {
defm VCVTSD2SI : sse12_cvt_sint<0x2D, VR128, GR32, i32, v2f64,		defm VCVTSD2SI : sse12_cvt_sint<0x2D, VR128, GR32, i32, v2f64,
X86cvts2si, sdmem, sse_load_f64, "cvtsd2si",		X86cvts2si, sdmem, sse_load_f64, "cvtsd2si",
WriteCvtSD2I>, XD, VEX, VEX_LIG;		WriteCvtSD2I>, XD, VEX, VEX_LIG;
defm VCVTSD2SI64 : sse12_cvt_sint<0x2D, VR128, GR64, i64, v2f64,		defm VCVTSD2SI64 : sse12_cvt_sint<0x2D, VR128, GR64, i64, v2f64,
▲ Show 20 Lines • Show All 137 Lines • ▼ Show 20 Lines	def VCVTSD2SSrr : VSDI<0x5A, MRMSrcReg, (outs FR32:$dst),
"cvtsd2ss\t{$src2, $src1, $dst\|$dst, $src1, $src2}", []>,		"cvtsd2ss\t{$src2, $src1, $dst\|$dst, $src1, $src2}", []>,
VEX_4V, VEX_LIG, VEX_WIG,		VEX_4V, VEX_LIG, VEX_WIG,
Sched<[WriteCvtSD2SS]>;		Sched<[WriteCvtSD2SS]>;
let mayLoad = 1 in		let mayLoad = 1 in
def VCVTSD2SSrm : I<0x5A, MRMSrcMem, (outs FR32:$dst),		def VCVTSD2SSrm : I<0x5A, MRMSrcMem, (outs FR32:$dst),
(ins FR32:$src1, f64mem:$src2),		(ins FR32:$src1, f64mem:$src2),
"vcvtsd2ss\t{$src2, $src1, $dst\|$dst, $src1, $src2}", []>,		"vcvtsd2ss\t{$src2, $src1, $dst\|$dst, $src1, $src2}", []>,
XD, VEX_4V, VEX_LIG, VEX_WIG,		XD, VEX_4V, VEX_LIG, VEX_WIG,
Sched<[WriteCvtSD2SS.Folded, ReadAfterLd]>;		Sched<[WriteCvtSD2SS.Folded, WriteCvtSD2SS.ReadAfterFold]>;
}		}

def : Pat<(f32 (fpround FR64:$src)),		def : Pat<(f32 (fpround FR64:$src)),
(VCVTSD2SSrr (f32 (IMPLICIT_DEF)), FR64:$src)>,		(VCVTSD2SSrr (f32 (IMPLICIT_DEF)), FR64:$src)>,
Requires<[UseAVX]>;		Requires<[UseAVX]>;

def CVTSD2SSrr : SDI<0x5A, MRMSrcReg, (outs FR32:$dst), (ins FR64:$src),		def CVTSD2SSrr : SDI<0x5A, MRMSrcReg, (outs FR32:$dst), (ins FR64:$src),
"cvtsd2ss\t{$src, $dst\|$dst, $src}",		"cvtsd2ss\t{$src, $dst\|$dst, $src}",
Show All 14 Lines	def VCVTSD2SSrr_Int: I<0x5A, MRMSrcReg,
XD, VEX_4V, VEX_WIG, Requires<[HasAVX]>,		XD, VEX_4V, VEX_WIG, Requires<[HasAVX]>,
Sched<[WriteCvtSD2SS]>;		Sched<[WriteCvtSD2SS]>;
def VCVTSD2SSrm_Int: I<0x5A, MRMSrcMem,		def VCVTSD2SSrm_Int: I<0x5A, MRMSrcMem,
(outs VR128:$dst), (ins VR128:$src1, sdmem:$src2),		(outs VR128:$dst), (ins VR128:$src1, sdmem:$src2),
"vcvtsd2ss\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		"vcvtsd2ss\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
[(set VR128:$dst, (int_x86_sse2_cvtsd2ss		[(set VR128:$dst, (int_x86_sse2_cvtsd2ss
VR128:$src1, sse_load_f64:$src2))]>,		VR128:$src1, sse_load_f64:$src2))]>,
XD, VEX_4V, VEX_WIG, Requires<[HasAVX]>,		XD, VEX_4V, VEX_WIG, Requires<[HasAVX]>,
Sched<[WriteCvtSD2SS.Folded, ReadAfterLd]>;		Sched<[WriteCvtSD2SS.Folded, WriteCvtSD2SS.ReadAfterFold]>;
let Constraints = "$src1 = $dst" in {		let Constraints = "$src1 = $dst" in {
def CVTSD2SSrr_Int: I<0x5A, MRMSrcReg,		def CVTSD2SSrr_Int: I<0x5A, MRMSrcReg,
(outs VR128:$dst), (ins VR128:$src1, VR128:$src2),		(outs VR128:$dst), (ins VR128:$src1, VR128:$src2),
"cvtsd2ss\t{$src2, $dst\|$dst, $src2}",		"cvtsd2ss\t{$src2, $dst\|$dst, $src2}",
[(set VR128:$dst,		[(set VR128:$dst,
(int_x86_sse2_cvtsd2ss VR128:$src1, VR128:$src2))]>,		(int_x86_sse2_cvtsd2ss VR128:$src1, VR128:$src2))]>,
XD, Requires<[UseSSE2]>, Sched<[WriteCvtSD2SS]>;		XD, Requires<[UseSSE2]>, Sched<[WriteCvtSD2SS]>;
def CVTSD2SSrm_Int: I<0x5A, MRMSrcMem,		def CVTSD2SSrm_Int: I<0x5A, MRMSrcMem,
(outs VR128:$dst), (ins VR128:$src1, sdmem:$src2),		(outs VR128:$dst), (ins VR128:$src1, sdmem:$src2),
"cvtsd2ss\t{$src2, $dst\|$dst, $src2}",		"cvtsd2ss\t{$src2, $dst\|$dst, $src2}",
[(set VR128:$dst, (int_x86_sse2_cvtsd2ss		[(set VR128:$dst, (int_x86_sse2_cvtsd2ss
VR128:$src1, sse_load_f64:$src2))]>,		VR128:$src1, sse_load_f64:$src2))]>,
XD, Requires<[UseSSE2]>,		XD, Requires<[UseSSE2]>,
Sched<[WriteCvtSD2SS.Folded, ReadAfterLd]>;		Sched<[WriteCvtSD2SS.Folded, WriteCvtSD2SS.ReadAfterFold]>;
}		}
} // isCodeGenOnly = 1		} // isCodeGenOnly = 1

// Convert scalar single to scalar double		// Convert scalar single to scalar double
// SSE2 instructions with XS prefix		// SSE2 instructions with XS prefix
let hasSideEffects = 0 in {		let hasSideEffects = 0 in {
def VCVTSS2SDrr : I<0x5A, MRMSrcReg, (outs FR64:$dst),		def VCVTSS2SDrr : I<0x5A, MRMSrcReg, (outs FR64:$dst),
(ins FR64:$src1, FR32:$src2),		(ins FR64:$src1, FR32:$src2),
"vcvtss2sd\t{$src2, $src1, $dst\|$dst, $src1, $src2}", []>,		"vcvtss2sd\t{$src2, $src1, $dst\|$dst, $src1, $src2}", []>,
XS, VEX_4V, VEX_LIG, VEX_WIG,		XS, VEX_4V, VEX_LIG, VEX_WIG,
Sched<[WriteCvtSS2SD]>, Requires<[UseAVX]>;		Sched<[WriteCvtSS2SD]>, Requires<[UseAVX]>;
let mayLoad = 1 in		let mayLoad = 1 in
def VCVTSS2SDrm : I<0x5A, MRMSrcMem, (outs FR64:$dst),		def VCVTSS2SDrm : I<0x5A, MRMSrcMem, (outs FR64:$dst),
(ins FR64:$src1, f32mem:$src2),		(ins FR64:$src1, f32mem:$src2),
"vcvtss2sd\t{$src2, $src1, $dst\|$dst, $src1, $src2}", []>,		"vcvtss2sd\t{$src2, $src1, $dst\|$dst, $src1, $src2}", []>,
XS, VEX_4V, VEX_LIG, VEX_WIG,		XS, VEX_4V, VEX_LIG, VEX_WIG,
Sched<[WriteCvtSS2SD.Folded, ReadAfterLd]>,		Sched<[WriteCvtSS2SD.Folded, WriteCvtSS2SD.ReadAfterFold]>,
Requires<[UseAVX, OptForSize]>;		Requires<[UseAVX, OptForSize]>;
}		}

def : Pat<(f64 (fpextend FR32:$src)),		def : Pat<(f64 (fpextend FR32:$src)),
(VCVTSS2SDrr (f64 (IMPLICIT_DEF)), FR32:$src)>, Requires<[UseAVX]>;		(VCVTSS2SDrr (f64 (IMPLICIT_DEF)), FR32:$src)>, Requires<[UseAVX]>;
def : Pat<(fpextend (loadf32 addr:$src)),		def : Pat<(fpextend (loadf32 addr:$src)),
(VCVTSS2SDrm (f64 (IMPLICIT_DEF)), addr:$src)>, Requires<[UseAVX, OptForSize]>;		(VCVTSS2SDrm (f64 (IMPLICIT_DEF)), addr:$src)>, Requires<[UseAVX, OptForSize]>;

Show All 30 Lines	def VCVTSS2SDrr_Int: I<0x5A, MRMSrcReg,
"vcvtss2sd\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		"vcvtss2sd\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
[]>, XS, VEX_4V, VEX_WIG,		[]>, XS, VEX_4V, VEX_WIG,
Requires<[HasAVX]>, Sched<[WriteCvtSS2SD]>;		Requires<[HasAVX]>, Sched<[WriteCvtSS2SD]>;
let mayLoad = 1 in		let mayLoad = 1 in
def VCVTSS2SDrm_Int: I<0x5A, MRMSrcMem,		def VCVTSS2SDrm_Int: I<0x5A, MRMSrcMem,
(outs VR128:$dst), (ins VR128:$src1, ssmem:$src2),		(outs VR128:$dst), (ins VR128:$src1, ssmem:$src2),
"vcvtss2sd\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		"vcvtss2sd\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
[]>, XS, VEX_4V, VEX_WIG, Requires<[HasAVX]>,		[]>, XS, VEX_4V, VEX_WIG, Requires<[HasAVX]>,
Sched<[WriteCvtSS2SD.Folded, ReadAfterLd]>;		Sched<[WriteCvtSS2SD.Folded, WriteCvtSS2SD.ReadAfterFold]>;
let Constraints = "$src1 = $dst" in { // SSE2 instructions with XS prefix		let Constraints = "$src1 = $dst" in { // SSE2 instructions with XS prefix
def CVTSS2SDrr_Int: I<0x5A, MRMSrcReg,		def CVTSS2SDrr_Int: I<0x5A, MRMSrcReg,
(outs VR128:$dst), (ins VR128:$src1, VR128:$src2),		(outs VR128:$dst), (ins VR128:$src1, VR128:$src2),
"cvtss2sd\t{$src2, $dst\|$dst, $src2}",		"cvtss2sd\t{$src2, $dst\|$dst, $src2}",
[]>, XS, Requires<[UseSSE2]>,		[]>, XS, Requires<[UseSSE2]>,
Sched<[WriteCvtSS2SD]>;		Sched<[WriteCvtSS2SD]>;
let mayLoad = 1 in		let mayLoad = 1 in
def CVTSS2SDrm_Int: I<0x5A, MRMSrcMem,		def CVTSS2SDrm_Int: I<0x5A, MRMSrcMem,
(outs VR128:$dst), (ins VR128:$src1, ssmem:$src2),		(outs VR128:$dst), (ins VR128:$src1, ssmem:$src2),
"cvtss2sd\t{$src2, $dst\|$dst, $src2}",		"cvtss2sd\t{$src2, $dst\|$dst, $src2}",
[]>, XS, Requires<[UseSSE2]>,		[]>, XS, Requires<[UseSSE2]>,
Sched<[WriteCvtSS2SD.Folded, ReadAfterLd]>;		Sched<[WriteCvtSS2SD.Folded, WriteCvtSS2SD.ReadAfterFold]>;
}		}
} // isCodeGenOnly = 1		} // isCodeGenOnly = 1

// Patterns used for matching (v)cvtsi2ss, (v)cvtsi2sd, (v)cvtsd2ss and		// Patterns used for matching (v)cvtsi2ss, (v)cvtsi2sd, (v)cvtsd2ss and
// (v)cvtss2sd intrinsic sequences from clang which produce unnecessary		// (v)cvtss2sd intrinsic sequences from clang which produce unnecessary
// vmovs{s,d} instructions		// vmovs{s,d} instructions
let Predicates = [UseAVX] in {		let Predicates = [UseAVX] in {
def : Pat<(v4f32 (X86Movss		def : Pat<(v4f32 (X86Movss
▲ Show 20 Lines • Show All 502 Lines • ▼ Show 20 Lines	multiclass sse12_cmp_scalar<RegisterClass RC, X86MemOperand x86memop,
def rr : SIi8<0xC2, MRMSrcReg,		def rr : SIi8<0xC2, MRMSrcReg,
(outs RC:$dst), (ins RC:$src1, RC:$src2, CC:$cc), asm,		(outs RC:$dst), (ins RC:$src1, RC:$src2, CC:$cc), asm,
[(set RC:$dst, (OpNode (VT RC:$src1), RC:$src2, imm:$cc))]>,		[(set RC:$dst, (OpNode (VT RC:$src1), RC:$src2, imm:$cc))]>,
Sched<[sched]>;		Sched<[sched]>;
def rm : SIi8<0xC2, MRMSrcMem,		def rm : SIi8<0xC2, MRMSrcMem,
(outs RC:$dst), (ins RC:$src1, x86memop:$src2, CC:$cc), asm,		(outs RC:$dst), (ins RC:$src1, x86memop:$src2, CC:$cc), asm,
[(set RC:$dst, (OpNode (VT RC:$src1),		[(set RC:$dst, (OpNode (VT RC:$src1),
(ld_frag addr:$src2), imm:$cc))]>,		(ld_frag addr:$src2), imm:$cc))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;

// Accept explicit immediate argument form instead of comparison code.		// Accept explicit immediate argument form instead of comparison code.
let isAsmParserOnly = 1, hasSideEffects = 0 in {		let isAsmParserOnly = 1, hasSideEffects = 0 in {
def rr_alt : SIi8<0xC2, MRMSrcReg, (outs RC:$dst),		def rr_alt : SIi8<0xC2, MRMSrcReg, (outs RC:$dst),
(ins RC:$src1, RC:$src2, u8imm:$cc), asm_alt, []>,		(ins RC:$src1, RC:$src2, u8imm:$cc), asm_alt, []>,
Sched<[sched]>, NotMemoryFoldable;		Sched<[sched]>, NotMemoryFoldable;
let mayLoad = 1 in		let mayLoad = 1 in
def rm_alt : SIi8<0xC2, MRMSrcMem, (outs RC:$dst),		def rm_alt : SIi8<0xC2, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop:$src2, u8imm:$cc), asm_alt, []>,		(ins RC:$src1, x86memop:$src2, u8imm:$cc), asm_alt, []>,
Sched<[sched.Folded, ReadAfterLd]>, NotMemoryFoldable;		Sched<[sched.Folded, sched.ReadAfterFold]>, NotMemoryFoldable;
}		}
}		}

let ExeDomain = SSEPackedSingle in		let ExeDomain = SSEPackedSingle in
defm VCMPSS : sse12_cmp_scalar<FR32, f32mem, AVXCC, X86cmps, f32, loadf32,		defm VCMPSS : sse12_cmp_scalar<FR32, f32mem, AVXCC, X86cmps, f32, loadf32,
"cmp${cc}ss\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		"cmp${cc}ss\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
"cmpss\t{$cc, $src2, $src1, $dst\|$dst, $src1, $src2, $cc}",		"cmpss\t{$cc, $src2, $src1, $dst\|$dst, $src1, $src2, $cc}",
SchedWriteFCmpSizes.PS.Scl>, XS, VEX_4V, VEX_LIG, VEX_WIG;		SchedWriteFCmpSizes.PS.Scl>, XS, VEX_4V, VEX_LIG, VEX_WIG;
Show All 25 Lines	def rr_Int : SIi8<0xC2, MRMSrcReg, (outs VR128:$dst),
[(set VR128:$dst, (Int VR128:$src1,		[(set VR128:$dst, (Int VR128:$src1,
VR128:$src, imm:$cc))]>,		VR128:$src, imm:$cc))]>,
Sched<[sched]>;		Sched<[sched]>;
let mayLoad = 1 in		let mayLoad = 1 in
def rm_Int : SIi8<0xC2, MRMSrcMem, (outs VR128:$dst),		def rm_Int : SIi8<0xC2, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, memop:$src, CC:$cc), asm,		(ins VR128:$src1, memop:$src, CC:$cc), asm,
[(set VR128:$dst, (Int VR128:$src1,		[(set VR128:$dst, (Int VR128:$src1,
mem_cpat:$src, imm:$cc))]>,		mem_cpat:$src, imm:$cc))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let isCodeGenOnly = 1 in {		let isCodeGenOnly = 1 in {
// Aliases to match intrinsics which expect XMM operand(s).		// Aliases to match intrinsics which expect XMM operand(s).
let ExeDomain = SSEPackedSingle in		let ExeDomain = SSEPackedSingle in
defm VCMPSS : sse12_cmp_scalar_int<ssmem, AVXCC, int_x86_sse_cmp_ss,		defm VCMPSS : sse12_cmp_scalar_int<ssmem, AVXCC, int_x86_sse_cmp_ss,
"cmp${cc}ss\t{$src, $src1, $dst\|$dst, $src1, $src}",		"cmp${cc}ss\t{$src, $src1, $dst\|$dst, $src1, $src}",
SchedWriteFCmpSizes.PS.Scl, sse_load_f32>, XS, VEX_4V;		SchedWriteFCmpSizes.PS.Scl, sse_load_f32>, XS, VEX_4V;
Show All 25 Lines	def rr: SI<opc, MRMSrcReg, (outs), (ins RC:$src1, RC:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1\|$src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1\|$src1, $src2}"),
[(set EFLAGS, (OpNode (vt RC:$src1), RC:$src2))]>,		[(set EFLAGS, (OpNode (vt RC:$src1), RC:$src2))]>,
Sched<[sched]>;		Sched<[sched]>;
let mayLoad = 1 in		let mayLoad = 1 in
def rm: SI<opc, MRMSrcMem, (outs), (ins RC:$src1, x86memop:$src2),		def rm: SI<opc, MRMSrcMem, (outs), (ins RC:$src1, x86memop:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1\|$src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1\|$src1, $src2}"),
[(set EFLAGS, (OpNode (vt RC:$src1),		[(set EFLAGS, (OpNode (vt RC:$src1),
(ld_frag addr:$src2)))]>,		(ld_frag addr:$src2)))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

// sse12_ord_cmp_int - Intrinsic version of sse12_ord_cmp		// sse12_ord_cmp_int - Intrinsic version of sse12_ord_cmp
multiclass sse12_ord_cmp_int<bits<8> opc, RegisterClass RC, SDNode OpNode,		multiclass sse12_ord_cmp_int<bits<8> opc, RegisterClass RC, SDNode OpNode,
ValueType vt, Operand memop,		ValueType vt, Operand memop,
ComplexPattern mem_cpat, string OpcodeStr,		ComplexPattern mem_cpat, string OpcodeStr,
X86FoldableSchedWrite sched> {		X86FoldableSchedWrite sched> {
def rr_Int: SI<opc, MRMSrcReg, (outs), (ins RC:$src1, RC:$src2),		def rr_Int: SI<opc, MRMSrcReg, (outs), (ins RC:$src1, RC:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1\|$src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1\|$src1, $src2}"),
[(set EFLAGS, (OpNode (vt RC:$src1), RC:$src2))]>,		[(set EFLAGS, (OpNode (vt RC:$src1), RC:$src2))]>,
Sched<[sched]>;		Sched<[sched]>;
let mayLoad = 1 in		let mayLoad = 1 in
def rm_Int: SI<opc, MRMSrcMem, (outs), (ins RC:$src1, memop:$src2),		def rm_Int: SI<opc, MRMSrcMem, (outs), (ins RC:$src1, memop:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1\|$src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1\|$src1, $src2}"),
[(set EFLAGS, (OpNode (vt RC:$src1),		[(set EFLAGS, (OpNode (vt RC:$src1),
mem_cpat:$src2))]>,		mem_cpat:$src2))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let Defs = [EFLAGS] in {		let Defs = [EFLAGS] in {
defm VUCOMISS : sse12_ord_cmp<0x2E, FR32, X86cmp, f32, f32mem, loadf32,		defm VUCOMISS : sse12_ord_cmp<0x2E, FR32, X86cmp, f32, f32mem, loadf32,
"ucomiss", WriteFCom>, PS, VEX, VEX_LIG, VEX_WIG;		"ucomiss", WriteFCom>, PS, VEX, VEX_LIG, VEX_WIG;
defm VUCOMISD : sse12_ord_cmp<0x2E, FR64, X86cmp, f64, f64mem, loadf64,		defm VUCOMISD : sse12_ord_cmp<0x2E, FR64, X86cmp, f64, f64mem, loadf64,
"ucomisd", WriteFCom>, PD, VEX, VEX_LIG, VEX_WIG;		"ucomisd", WriteFCom>, PD, VEX, VEX_LIG, VEX_WIG;
let Pattern = []<dag> in {		let Pattern = []<dag> in {
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	multiclass sse12_cmp_packed<RegisterClass RC, X86MemOperand x86memop,
def rri : PIi8<0xC2, MRMSrcReg,		def rri : PIi8<0xC2, MRMSrcReg,
(outs RC:$dst), (ins RC:$src1, RC:$src2, CC:$cc), asm,		(outs RC:$dst), (ins RC:$src1, RC:$src2, CC:$cc), asm,
[(set RC:$dst, (VT (X86cmpp RC:$src1, RC:$src2, imm:$cc)))], d>,		[(set RC:$dst, (VT (X86cmpp RC:$src1, RC:$src2, imm:$cc)))], d>,
Sched<[sched]>;		Sched<[sched]>;
def rmi : PIi8<0xC2, MRMSrcMem,		def rmi : PIi8<0xC2, MRMSrcMem,
(outs RC:$dst), (ins RC:$src1, x86memop:$src2, CC:$cc), asm,		(outs RC:$dst), (ins RC:$src1, x86memop:$src2, CC:$cc), asm,
[(set RC:$dst,		[(set RC:$dst,
(VT (X86cmpp RC:$src1, (ld_frag addr:$src2), imm:$cc)))], d>,		(VT (X86cmpp RC:$src1, (ld_frag addr:$src2), imm:$cc)))], d>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;

// Accept explicit immediate argument form instead of comparison code.		// Accept explicit immediate argument form instead of comparison code.
let isAsmParserOnly = 1, hasSideEffects = 0 in {		let isAsmParserOnly = 1, hasSideEffects = 0 in {
def rri_alt : PIi8<0xC2, MRMSrcReg,		def rri_alt : PIi8<0xC2, MRMSrcReg,
(outs RC:$dst), (ins RC:$src1, RC:$src2, u8imm:$cc),		(outs RC:$dst), (ins RC:$src1, RC:$src2, u8imm:$cc),
asm_alt, [], d>, Sched<[sched]>, NotMemoryFoldable;		asm_alt, [], d>, Sched<[sched]>, NotMemoryFoldable;
let mayLoad = 1 in		let mayLoad = 1 in
def rmi_alt : PIi8<0xC2, MRMSrcMem,		def rmi_alt : PIi8<0xC2, MRMSrcMem,
(outs RC:$dst), (ins RC:$src1, x86memop:$src2, u8imm:$cc),		(outs RC:$dst), (ins RC:$src1, x86memop:$src2, u8imm:$cc),
asm_alt, [], d>, Sched<[sched.Folded, ReadAfterLd]>,		asm_alt, [], d>, Sched<[sched.Folded, sched.ReadAfterFold]>,
NotMemoryFoldable;		NotMemoryFoldable;
}		}
}		}

defm VCMPPS : sse12_cmp_packed<VR128, f128mem, AVXCC, v4f32,		defm VCMPPS : sse12_cmp_packed<VR128, f128mem, AVXCC, v4f32,
"cmp${cc}ps\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		"cmp${cc}ps\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
"cmpps\t{$cc, $src2, $src1, $dst\|$dst, $src1, $src2, $cc}",		"cmpps\t{$cc, $src2, $src1, $dst\|$dst, $src1, $src2, $cc}",
SchedWriteFCmpSizes.PS.XMM, SSEPackedSingle, loadv4f32>, PS, VEX_4V, VEX_WIG;		SchedWriteFCmpSizes.PS.XMM, SSEPackedSingle, loadv4f32>, PS, VEX_4V, VEX_WIG;
▲ Show 20 Lines • Show All 79 Lines • ▼ Show 20 Lines
/// sse12_shuffle - sse 1 & 2 fp shuffle instructions		/// sse12_shuffle - sse 1 & 2 fp shuffle instructions
multiclass sse12_shuffle<RegisterClass RC, X86MemOperand x86memop,		multiclass sse12_shuffle<RegisterClass RC, X86MemOperand x86memop,
ValueType vt, string asm, PatFrag mem_frag,		ValueType vt, string asm, PatFrag mem_frag,
X86FoldableSchedWrite sched, Domain d> {		X86FoldableSchedWrite sched, Domain d> {
def rmi : PIi8<0xC6, MRMSrcMem, (outs RC:$dst),		def rmi : PIi8<0xC6, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop:$src2, u8imm:$src3), asm,		(ins RC:$src1, x86memop:$src2, u8imm:$src3), asm,
[(set RC:$dst, (vt (X86Shufp RC:$src1, (mem_frag addr:$src2),		[(set RC:$dst, (vt (X86Shufp RC:$src1, (mem_frag addr:$src2),
(i8 imm:$src3))))], d>,		(i8 imm:$src3))))], d>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
def rri : PIi8<0xC6, MRMSrcReg, (outs RC:$dst),		def rri : PIi8<0xC6, MRMSrcReg, (outs RC:$dst),
(ins RC:$src1, RC:$src2, u8imm:$src3), asm,		(ins RC:$src1, RC:$src2, u8imm:$src3), asm,
[(set RC:$dst, (vt (X86Shufp RC:$src1, RC:$src2,		[(set RC:$dst, (vt (X86Shufp RC:$src1, RC:$src2,
(i8 imm:$src3))))], d>,		(i8 imm:$src3))))], d>,
Sched<[sched]>;		Sched<[sched]>;
}		}

let Predicates = [HasAVX, NoVLX] in {		let Predicates = [HasAVX, NoVLX] in {
Show All 39 Lines	def rr : PI<opc, MRMSrcReg,
asm, [(set RC:$dst,		asm, [(set RC:$dst,
(vt (OpNode RC:$src1, RC:$src2)))], d>,		(vt (OpNode RC:$src1, RC:$src2)))], d>,
Sched<[sched]>;		Sched<[sched]>;
def rm : PI<opc, MRMSrcMem,		def rm : PI<opc, MRMSrcMem,
(outs RC:$dst), (ins RC:$src1, x86memop:$src2),		(outs RC:$dst), (ins RC:$src1, x86memop:$src2),
asm, [(set RC:$dst,		asm, [(set RC:$dst,
(vt (OpNode RC:$src1,		(vt (OpNode RC:$src1,
(mem_frag addr:$src2))))], d>,		(mem_frag addr:$src2))))], d>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let Predicates = [HasAVX, NoVLX] in {		let Predicates = [HasAVX, NoVLX] in {
defm VUNPCKHPS: sse12_unpack_interleave<0x15, X86Unpckh, v4f32, loadv4f32,		defm VUNPCKHPS: sse12_unpack_interleave<0x15, X86Unpckh, v4f32, loadv4f32,
VR128, f128mem, "unpckhps\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		VR128, f128mem, "unpckhps\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
SchedWriteFShuffle.XMM, SSEPackedSingle>, PS, VEX_4V, VEX_WIG;		SchedWriteFShuffle.XMM, SSEPackedSingle>, PS, VEX_4V, VEX_WIG;
defm VUNPCKHPD: sse12_unpack_interleave<0x15, X86Unpckh, v2f64, loadv2f64,		defm VUNPCKHPD: sse12_unpack_interleave<0x15, X86Unpckh, v2f64, loadv2f64,
VR128, f128mem, "unpckhpd\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		VR128, f128mem, "unpckhpd\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
▲ Show 20 Lines • Show All 122 Lines • ▼ Show 20 Lines	def rr : PDI<opc, MRMSrcReg, (outs RC:$dst),
Sched<[sched]>;		Sched<[sched]>;
def rm : PDI<opc, MRMSrcMem, (outs RC:$dst),		def rm : PDI<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop:$src2),		(ins RC:$src1, x86memop:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst, (OpVT (OpNode RC:$src1,		[(set RC:$dst, (OpVT (OpNode RC:$src1,
(bitconvert (memop_frag addr:$src2)))))]>,		(bitconvert (memop_frag addr:$src2)))))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
} // ExeDomain = SSEPackedInt		} // ExeDomain = SSEPackedInt

multiclass PDI_binop_all<bits<8> opc, string OpcodeStr, SDNode Opcode,		multiclass PDI_binop_all<bits<8> opc, string OpcodeStr, SDNode Opcode,
ValueType OpVT128, ValueType OpVT256,		ValueType OpVT128, ValueType OpVT256,
X86SchedWriteWidths sched, bit IsCommutable,		X86SchedWriteWidths sched, bit IsCommutable,
Predicate prd> {		Predicate prd> {
let Predicates = [HasAVX, prd] in		let Predicates = [HasAVX, prd] in
▲ Show 20 Lines • Show All 420 Lines • ▼ Show 20 Lines	multiclass sse_fp_unop_s<bits<8> opc, string OpcodeStr, RegisterClass RC,

let isCodeGenOnly = 1, Constraints = "$src1 = $dst", ExeDomain = d in {		let isCodeGenOnly = 1, Constraints = "$src1 = $dst", ExeDomain = d in {
def r_Int : I<opc, MRMSrcReg, (outs VR128:$dst), (ins VR128:$src1, VR128:$src2),		def r_Int : I<opc, MRMSrcReg, (outs VR128:$dst), (ins VR128:$src1, VR128:$src2),
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"), []>,		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"), []>,
Sched<[sched]>;		Sched<[sched]>;
let mayLoad = 1 in		let mayLoad = 1 in
def m_Int : I<opc, MRMSrcMem, (outs VR128:$dst), (ins VR128:$src1, intmemop:$src2),		def m_Int : I<opc, MRMSrcMem, (outs VR128:$dst), (ins VR128:$src1, intmemop:$src2),
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"), []>,		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"), []>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

}		}

multiclass sse_fp_unop_s_intr<RegisterClass RC, ValueType vt,		multiclass sse_fp_unop_s_intr<RegisterClass RC, ValueType vt,
ComplexPattern int_cpat, Intrinsic Intr,		ComplexPattern int_cpat, Intrinsic Intr,
Predicate target, string Suffix> {		Predicate target, string Suffix> {
Show All 37 Lines	multiclass avx_fp_unop_s<bits<8> opc, string OpcodeStr, RegisterClass RC,
X86FoldableSchedWrite sched, Predicate target> {		X86FoldableSchedWrite sched, Predicate target> {
let hasSideEffects = 0 in {		let hasSideEffects = 0 in {
def r : I<opc, MRMSrcReg, (outs RC:$dst), (ins RC:$src1, RC:$src2),		def r : I<opc, MRMSrcReg, (outs RC:$dst), (ins RC:$src1, RC:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[], d>, Sched<[sched]>;		[], d>, Sched<[sched]>;
let mayLoad = 1 in		let mayLoad = 1 in
def m : I<opc, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, x86memop:$src2),		def m : I<opc, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, x86memop:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[], d>, Sched<[sched.Folded, ReadAfterLd]>;		[], d>, Sched<[sched.Folded, sched.ReadAfterFold]>;
let isCodeGenOnly = 1, ExeDomain = d in {		let isCodeGenOnly = 1, ExeDomain = d in {
def r_Int : I<opc, MRMSrcReg, (outs VR128:$dst),		def r_Int : I<opc, MRMSrcReg, (outs VR128:$dst),
(ins VR128:$src1, VR128:$src2),		(ins VR128:$src1, VR128:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[]>, Sched<[sched]>;		[]>, Sched<[sched]>;
let mayLoad = 1 in		let mayLoad = 1 in
def m_Int : I<opc, MRMSrcMem, (outs VR128:$dst),		def m_Int : I<opc, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, intmemop:$src2),		(ins VR128:$src1, intmemop:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[]>, Sched<[sched.Folded, ReadAfterLd]>;		[]>, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

// We don't want to fold scalar loads into these instructions unless		// We don't want to fold scalar loads into these instructions unless
// optimizing for size. This is because the folded instruction will have a		// optimizing for size. This is because the folded instruction will have a
// partial register update, while the unfolded sequence will not, e.g.		// partial register update, while the unfolded sequence will not, e.g.
// vmovss mem, %xmm0		// vmovss mem, %xmm0
// vrcpss %xmm0, %xmm0, %xmm0		// vrcpss %xmm0, %xmm0, %xmm0
▲ Show 20 Lines • Show All 542 Lines • ▼ Show 20 Lines	def rr : PDI<opc, MRMSrcReg, (outs RC:$dst),
Sched<[sched]>;		Sched<[sched]>;
def rm : PDI<opc, MRMSrcMem, (outs RC:$dst),		def rm : PDI<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop:$src2),		(ins RC:$src1, x86memop:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst, (DstVT (OpNode (SrcVT RC:$src1),		[(set RC:$dst, (DstVT (OpNode (SrcVT RC:$src1),
(bitconvert (memop_frag addr:$src2)))))]>,		(bitconvert (memop_frag addr:$src2)))))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
} // ExeDomain = SSEPackedInt		} // ExeDomain = SSEPackedInt

defm PADDB : PDI_binop_all<0xFC, "paddb", add, v16i8, v32i8,		defm PADDB : PDI_binop_all<0xFC, "paddb", add, v16i8, v32i8,
SchedWriteVecALU, 1, NoVLX_Or_NoBWI>;		SchedWriteVecALU, 1, NoVLX_Or_NoBWI>;
defm PADDW : PDI_binop_all<0xFD, "paddw", add, v8i16, v16i16,		defm PADDW : PDI_binop_all<0xFD, "paddw", add, v8i16, v16i16,
SchedWriteVecALU, 1, NoVLX_Or_NoBWI>;		SchedWriteVecALU, 1, NoVLX_Or_NoBWI>;
defm PADDD : PDI_binop_all<0xFE, "paddd", add, v4i32, v8i32,		defm PADDD : PDI_binop_all<0xFE, "paddd", add, v4i32, v8i32,
▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines	def rr : PDI<opc, MRMSrcReg, (outs RC:$dst),
Sched<[sched]>;		Sched<[sched]>;
def rm : PDI<opc, MRMSrcMem, (outs RC:$dst),		def rm : PDI<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, i128mem:$src2),		(ins RC:$src1, i128mem:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst, (DstVT (OpNode RC:$src1,		[(set RC:$dst, (DstVT (OpNode RC:$src1,
(SrcVT (bitconvert (ld_frag addr:$src2))))))]>,		(SrcVT (bitconvert (ld_frag addr:$src2))))))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
def ri : PDIi8<opc2, ImmForm, (outs RC:$dst),		def ri : PDIi8<opc2, ImmForm, (outs RC:$dst),
(ins RC:$src1, u8imm:$src2),		(ins RC:$src1, u8imm:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst, (DstVT (OpNode2 RC:$src1, (i8 imm:$src2))))]>,		[(set RC:$dst, (DstVT (OpNode2 RC:$src1, (i8 imm:$src2))))]>,
Sched<[schedImm]>;		Sched<[schedImm]>;
}		}
▲ Show 20 Lines • Show All 188 Lines • ▼ Show 20 Lines	def rm : PDI<opc, MRMSrcMem,
(outs RC:$dst), (ins RC:$src1, x86memop:$src2),		(outs RC:$dst), (ins RC:$src1, x86memop:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst,		[(set RC:$dst,
(OutVT (OpNode (ArgVT RC:$src1),		(OutVT (OpNode (ArgVT RC:$src1),
(bitconvert (ld_frag addr:$src2)))))]>,		(bitconvert (ld_frag addr:$src2)))))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass sse4_pack<bits<8> opc, string OpcodeStr, ValueType OutVT,		multiclass sse4_pack<bits<8> opc, string OpcodeStr, ValueType OutVT,
ValueType ArgVT, SDNode OpNode, RegisterClass RC,		ValueType ArgVT, SDNode OpNode, RegisterClass RC,
X86MemOperand x86memop, X86FoldableSchedWrite sched,		X86MemOperand x86memop, X86FoldableSchedWrite sched,
PatFrag ld_frag, bit Is2Addr = 1> {		PatFrag ld_frag, bit Is2Addr = 1> {
def rr : SS48I<opc, MRMSrcReg,		def rr : SS48I<opc, MRMSrcReg,
(outs RC:$dst), (ins RC:$src1, RC:$src2),		(outs RC:$dst), (ins RC:$src1, RC:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst,		[(set RC:$dst,
(OutVT (OpNode (ArgVT RC:$src1), RC:$src2)))]>,		(OutVT (OpNode (ArgVT RC:$src1), RC:$src2)))]>,
Sched<[sched]>;		Sched<[sched]>;
def rm : SS48I<opc, MRMSrcMem,		def rm : SS48I<opc, MRMSrcMem,
(outs RC:$dst), (ins RC:$src1, x86memop:$src2),		(outs RC:$dst), (ins RC:$src1, x86memop:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst,		[(set RC:$dst,
(OutVT (OpNode (ArgVT RC:$src1),		(OutVT (OpNode (ArgVT RC:$src1),
(bitconvert (ld_frag addr:$src2)))))]>,		(bitconvert (ld_frag addr:$src2)))))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let Predicates = [HasAVX, NoVLX_Or_NoBWI] in {		let Predicates = [HasAVX, NoVLX_Or_NoBWI] in {
defm VPACKSSWB : sse2_pack<0x63, "vpacksswb", v16i8, v8i16, X86Packss, VR128,		defm VPACKSSWB : sse2_pack<0x63, "vpacksswb", v16i8, v8i16, X86Packss, VR128,
i128mem, SchedWriteShuffle.XMM, loadv2i64, 0>,		i128mem, SchedWriteShuffle.XMM, loadv2i64, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
defm VPACKSSDW : sse2_pack<0x6B, "vpackssdw", v8i16, v4i32, X86Packss, VR128,		defm VPACKSSDW : sse2_pack<0x6B, "vpackssdw", v8i16, v4i32, X86Packss, VR128,
i128mem, SchedWriteShuffle.XMM, loadv2i64, 0>,		i128mem, SchedWriteShuffle.XMM, loadv2i64, 0>,
▲ Show 20 Lines • Show All 55 Lines • ▼ Show 20 Lines	def rr : PDI<opc, MRMSrcReg,
Sched<[sched]>;		Sched<[sched]>;
def rm : PDI<opc, MRMSrcMem,		def rm : PDI<opc, MRMSrcMem,
(outs RC:$dst), (ins RC:$src1, x86memop:$src2),		(outs RC:$dst), (ins RC:$src1, x86memop:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr,"\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr,"\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr,"\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr,"\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst, (vt (OpNode RC:$src1,		[(set RC:$dst, (vt (OpNode RC:$src1,
(bitconvert (ld_frag addr:$src2)))))]>,		(bitconvert (ld_frag addr:$src2)))))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let Predicates = [HasAVX, NoVLX_Or_NoBWI] in {		let Predicates = [HasAVX, NoVLX_Or_NoBWI] in {
defm VPUNPCKLBW : sse2_unpack<0x60, "vpunpcklbw", v16i8, X86Unpckl, VR128,		defm VPUNPCKLBW : sse2_unpack<0x60, "vpunpcklbw", v16i8, X86Unpckl, VR128,
i128mem, SchedWriteShuffle.XMM, loadv2i64, 0>,		i128mem, SchedWriteShuffle.XMM, loadv2i64, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
defm VPUNPCKLWD : sse2_unpack<0x61, "vpunpcklwd", v8i16, X86Unpckl, VR128,		defm VPUNPCKLWD : sse2_unpack<0x61, "vpunpcklwd", v8i16, X86Unpckl, VR128,
i128mem, SchedWriteShuffle.XMM, loadv2i64, 0>,		i128mem, SchedWriteShuffle.XMM, loadv2i64, 0>,
▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines	def rm : Ii8<0xC4, MRMSrcMem,
(outs VR128:$dst), (ins VR128:$src1,		(outs VR128:$dst), (ins VR128:$src1,
i16mem:$src2, u8imm:$src3),		i16mem:$src2, u8imm:$src3),
!if(Is2Addr,		!if(Is2Addr,
"pinsrw\t{$src3, $src2, $dst\|$dst, $src2, $src3}",		"pinsrw\t{$src3, $src2, $dst\|$dst, $src2, $src3}",
"vpinsrw\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"vpinsrw\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[(set VR128:$dst,		[(set VR128:$dst,
(X86pinsrw VR128:$src1, (extloadi16 addr:$src2),		(X86pinsrw VR128:$src1, (extloadi16 addr:$src2),
imm:$src3))]>,		imm:$src3))]>,
Sched<[WriteVecInsertLd, ReadAfterLd]>;		Sched<[WriteVecInsert.Folded, WriteVecInsert.ReadAfterFold]>;
}		}

// Extract		// Extract
let Predicates = [HasAVX, NoBWI] in		let Predicates = [HasAVX, NoBWI] in
def VPEXTRWrr : Ii8<0xC5, MRMSrcReg,		def VPEXTRWrr : Ii8<0xC5, MRMSrcReg,
(outs GR32orGR64:$dst), (ins VR128:$src1, u8imm:$src2),		(outs GR32orGR64:$dst), (ins VR128:$src1, u8imm:$src2),
"vpextrw\t{$src2, $src1, $dst\|$dst, $src1, $src2}",		"vpextrw\t{$src2, $src1, $dst\|$dst, $src1, $src2}",
[(set GR32orGR64:$dst, (X86pextrw (v8i16 VR128:$src1),		[(set GR32orGR64:$dst, (X86pextrw (v8i16 VR128:$src1),
▲ Show 20 Lines • Show All 572 Lines • ▼ Show 20 Lines	def rr : I<0xD0, MRMSrcReg,
[(set RC:$dst, (vt (X86Addsub RC:$src1, RC:$src2)))]>,		[(set RC:$dst, (vt (X86Addsub RC:$src1, RC:$src2)))]>,
Sched<[sched]>;		Sched<[sched]>;
def rm : I<0xD0, MRMSrcMem,		def rm : I<0xD0, MRMSrcMem,
(outs RC:$dst), (ins RC:$src1, x86memop:$src2),		(outs RC:$dst), (ins RC:$src1, x86memop:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst, (vt (X86Addsub RC:$src1, (ld_frag addr:$src2))))]>,		[(set RC:$dst, (vt (X86Addsub RC:$src1, (ld_frag addr:$src2))))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let Predicates = [HasAVX] in {		let Predicates = [HasAVX] in {
let ExeDomain = SSEPackedSingle in {		let ExeDomain = SSEPackedSingle in {
defm VADDSUBPS : sse3_addsub<"vaddsubps", v4f32, VR128, f128mem,		defm VADDSUBPS : sse3_addsub<"vaddsubps", v4f32, VR128, f128mem,
SchedWriteFAddSizes.PS.XMM, loadv4f32, 0>,		SchedWriteFAddSizes.PS.XMM, loadv4f32, 0>,
XD, VEX_4V, VEX_WIG;		XD, VEX_4V, VEX_WIG;
defm VADDSUBPSY : sse3_addsub<"vaddsubps", v8f32, VR256, f256mem,		defm VADDSUBPSY : sse3_addsub<"vaddsubps", v8f32, VR256, f256mem,
Show All 34 Lines	def rr : S3DI<o, MRMSrcReg, (outs RC:$dst), (ins RC:$src1, RC:$src2),
[(set RC:$dst, (vt (OpNode RC:$src1, RC:$src2)))]>,		[(set RC:$dst, (vt (OpNode RC:$src1, RC:$src2)))]>,
Sched<[sched]>;		Sched<[sched]>;

def rm : S3DI<o, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, x86memop:$src2),		def rm : S3DI<o, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, x86memop:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst, (vt (OpNode RC:$src1, (ld_frag addr:$src2))))]>,		[(set RC:$dst, (vt (OpNode RC:$src1, (ld_frag addr:$src2))))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
multiclass S3_Int<bits<8> o, string OpcodeStr, ValueType vt, RegisterClass RC,		multiclass S3_Int<bits<8> o, string OpcodeStr, ValueType vt, RegisterClass RC,
X86MemOperand x86memop, SDNode OpNode,		X86MemOperand x86memop, SDNode OpNode,
X86FoldableSchedWrite sched, PatFrag ld_frag,		X86FoldableSchedWrite sched, PatFrag ld_frag,
bit Is2Addr = 1> {		bit Is2Addr = 1> {
def rr : S3I<o, MRMSrcReg, (outs RC:$dst), (ins RC:$src1, RC:$src2),		def rr : S3I<o, MRMSrcReg, (outs RC:$dst), (ins RC:$src1, RC:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst, (vt (OpNode RC:$src1, RC:$src2)))]>,		[(set RC:$dst, (vt (OpNode RC:$src1, RC:$src2)))]>,
Sched<[sched]>;		Sched<[sched]>;

def rm : S3I<o, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, x86memop:$src2),		def rm : S3I<o, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, x86memop:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst, (vt (OpNode RC:$src1, (ld_frag addr:$src2))))]>,		[(set RC:$dst, (vt (OpNode RC:$src1, (ld_frag addr:$src2))))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let Predicates = [HasAVX] in {		let Predicates = [HasAVX] in {
let ExeDomain = SSEPackedSingle in {		let ExeDomain = SSEPackedSingle in {
defm VHADDPS : S3D_Int<0x7C, "vhaddps", v4f32, VR128, f128mem,		defm VHADDPS : S3D_Int<0x7C, "vhaddps", v4f32, VR128, f128mem,
X86fhadd, WriteFHAdd, loadv4f32, 0>, VEX_4V, VEX_WIG;		X86fhadd, WriteFHAdd, loadv4f32, 0>, VEX_4V, VEX_WIG;
defm VHSUBPS : S3D_Int<0x7D, "vhsubps", v4f32, VR128, f128mem,		defm VHSUBPS : S3D_Int<0x7D, "vhsubps", v4f32, VR128, f128mem,
X86fhsub, WriteFHAdd, loadv4f32, 0>, VEX_4V, VEX_WIG;		X86fhsub, WriteFHAdd, loadv4f32, 0>, VEX_4V, VEX_WIG;
▲ Show 20 Lines • Show All 115 Lines • ▼ Show 20 Lines	multiclass SS3I_binop_rm<bits<8> opc, string OpcodeStr, SDNode OpNode,
def rm : SS38I<opc, MRMSrcMem, (outs RC:$dst),		def rm : SS38I<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop:$src2),		(ins RC:$src1, x86memop:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst,		[(set RC:$dst,
(DstVT (OpNode (OpVT RC:$src1),		(DstVT (OpNode (OpVT RC:$src1),
(bitconvert (memop_frag addr:$src2)))))]>,		(bitconvert (memop_frag addr:$src2)))))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

/// SS3I_binop_rm_int - Simple SSSE3 bin op whose type can be v*{i8,i16,i32}.		/// SS3I_binop_rm_int - Simple SSSE3 bin op whose type can be v*{i8,i16,i32}.
multiclass SS3I_binop_rm_int<bits<8> opc, string OpcodeStr,		multiclass SS3I_binop_rm_int<bits<8> opc, string OpcodeStr,
Intrinsic IntId128, X86FoldableSchedWrite sched,		Intrinsic IntId128, X86FoldableSchedWrite sched,
PatFrag ld_frag, bit Is2Addr = 1> {		PatFrag ld_frag, bit Is2Addr = 1> {
let isCommutable = 1 in		let isCommutable = 1 in
def rr : SS38I<opc, MRMSrcReg, (outs VR128:$dst),		def rr : SS38I<opc, MRMSrcReg, (outs VR128:$dst),
(ins VR128:$src1, VR128:$src2),		(ins VR128:$src1, VR128:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set VR128:$dst, (IntId128 VR128:$src1, VR128:$src2))]>,		[(set VR128:$dst, (IntId128 VR128:$src1, VR128:$src2))]>,
Sched<[sched]>;		Sched<[sched]>;
def rm : SS38I<opc, MRMSrcMem, (outs VR128:$dst),		def rm : SS38I<opc, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, i128mem:$src2),		(ins VR128:$src1, i128mem:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set VR128:$dst,		[(set VR128:$dst,
(IntId128 VR128:$src1,		(IntId128 VR128:$src1,
(bitconvert (ld_frag addr:$src2))))]>,		(bitconvert (ld_frag addr:$src2))))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass SS3I_binop_rm_int_y<bits<8> opc, string OpcodeStr,		multiclass SS3I_binop_rm_int_y<bits<8> opc, string OpcodeStr,
Intrinsic IntId256,		Intrinsic IntId256,
X86FoldableSchedWrite sched> {		X86FoldableSchedWrite sched> {
let isCommutable = 1 in		let isCommutable = 1 in
def Yrr : SS38I<opc, MRMSrcReg, (outs VR256:$dst),		def Yrr : SS38I<opc, MRMSrcReg, (outs VR256:$dst),
(ins VR256:$src1, VR256:$src2),		(ins VR256:$src1, VR256:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR256:$dst, (IntId256 VR256:$src1, VR256:$src2))]>,		[(set VR256:$dst, (IntId256 VR256:$src1, VR256:$src2))]>,
Sched<[sched]>;		Sched<[sched]>;
def Yrm : SS38I<opc, MRMSrcMem, (outs VR256:$dst),		def Yrm : SS38I<opc, MRMSrcMem, (outs VR256:$dst),
(ins VR256:$src1, i256mem:$src2),		(ins VR256:$src1, i256mem:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR256:$dst,		[(set VR256:$dst,
(IntId256 VR256:$src1, (bitconvert (loadv4i64 addr:$src2))))]>,		(IntId256 VR256:$src1, (bitconvert (loadv4i64 addr:$src2))))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let ImmT = NoImm, Predicates = [HasAVX, NoVLX_Or_NoBWI] in {		let ImmT = NoImm, Predicates = [HasAVX, NoVLX_Or_NoBWI] in {
let isCommutable = 0 in {		let isCommutable = 0 in {
defm VPSHUFB : SS3I_binop_rm<0x00, "vpshufb", X86pshufb, v16i8, v16i8,		defm VPSHUFB : SS3I_binop_rm<0x00, "vpshufb", X86pshufb, v16i8, v16i8,
VR128, loadv2i64, i128mem,		VR128, loadv2i64, i128mem,
SchedWriteVarShuffle.XMM, 0>, VEX_4V, VEX_WIG;		SchedWriteVarShuffle.XMM, 0>, VEX_4V, VEX_WIG;
defm VPMADDUBSW : SS3I_binop_rm<0x04, "vpmaddubsw", X86vpmaddubsw, v8i16,		defm VPMADDUBSW : SS3I_binop_rm<0x04, "vpmaddubsw", X86vpmaddubsw, v8i16,
▲ Show 20 Lines • Show All 134 Lines • ▼ Show 20 Lines	def rmi : SS3AI<0x0F, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop:$src2, u8imm:$src3),		(ins RC:$src1, x86memop:$src2, u8imm:$src3),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(asm, "\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		!strconcat(asm, "\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
!strconcat(asm,		!strconcat(asm,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),
[(set RC:$dst, (VT (X86PAlignr RC:$src1,		[(set RC:$dst, (VT (X86PAlignr RC:$src1,
(bitconvert (memop_frag addr:$src2)),		(bitconvert (memop_frag addr:$src2)),
(i8 imm:$src3))))]>,		(i8 imm:$src3))))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

let Predicates = [HasAVX, NoVLX_Or_NoBWI] in		let Predicates = [HasAVX, NoVLX_Or_NoBWI] in
defm VPALIGNR : ssse3_palignr<"vpalignr", v16i8, VR128, loadv2i64, i128mem,		defm VPALIGNR : ssse3_palignr<"vpalignr", v16i8, VR128, loadv2i64, i128mem,
SchedWriteShuffle.XMM, 0>, VEX_4V, VEX_WIG;		SchedWriteShuffle.XMM, 0>, VEX_4V, VEX_WIG;
let Predicates = [HasAVX2, NoVLX_Or_NoBWI] in		let Predicates = [HasAVX2, NoVLX_Or_NoBWI] in
defm VPALIGNRY : ssse3_palignr<"vpalignr", v32i8, VR256, loadv4i64, i256mem,		defm VPALIGNRY : ssse3_palignr<"vpalignr", v32i8, VR256, loadv4i64, i256mem,
▲ Show 20 Lines • Show All 436 Lines • ▼ Show 20 Lines	def rr : SS4AIi8<opc, MRMSrcReg, (outs VR128:$dst),
Sched<[WriteVecInsert]>;		Sched<[WriteVecInsert]>;
def rm : SS4AIi8<opc, MRMSrcMem, (outs VR128:$dst),		def rm : SS4AIi8<opc, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, i8mem:$src2, u8imm:$src3),		(ins VR128:$src1, i8mem:$src2, u8imm:$src3),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(asm, "\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		!strconcat(asm, "\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
!strconcat(asm,		!strconcat(asm,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),
[(set VR128:$dst,		[(set VR128:$dst,
(X86pinsrb VR128:$src1, (extloadi8 addr:$src2),		(X86pinsrb VR128:$src1, (extloadi8 addr:$src2), imm:$src3))]>,
imm:$src3))]>, Sched<[WriteVecInsertLd, ReadAfterLd]>;		Sched<[WriteVecInsert.Folded, WriteVecInsert.ReadAfterFold]>;
}		}

let Predicates = [HasAVX, NoBWI] in		let Predicates = [HasAVX, NoBWI] in
defm VPINSRB : SS41I_insert8<0x20, "vpinsrb", 0>, VEX_4V;		defm VPINSRB : SS41I_insert8<0x20, "vpinsrb", 0>, VEX_4V;
let Constraints = "$src1 = $dst" in		let Constraints = "$src1 = $dst" in
defm PINSRB : SS41I_insert8<0x20, "pinsrb">;		defm PINSRB : SS41I_insert8<0x20, "pinsrb">;

multiclass SS41I_insert32<bits<8> opc, string asm, bit Is2Addr = 1> {		multiclass SS41I_insert32<bits<8> opc, string asm, bit Is2Addr = 1> {
def rr : SS4AIi8<opc, MRMSrcReg, (outs VR128:$dst),		def rr : SS4AIi8<opc, MRMSrcReg, (outs VR128:$dst),
(ins VR128:$src1, GR32:$src2, u8imm:$src3),		(ins VR128:$src1, GR32:$src2, u8imm:$src3),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(asm, "\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		!strconcat(asm, "\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
!strconcat(asm,		!strconcat(asm,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),
[(set VR128:$dst,		[(set VR128:$dst,
(v4i32 (insertelt VR128:$src1, GR32:$src2, imm:$src3)))]>,		(v4i32 (insertelt VR128:$src1, GR32:$src2, imm:$src3)))]>,
Sched<[WriteVecInsert]>;		Sched<[WriteVecInsert]>;
def rm : SS4AIi8<opc, MRMSrcMem, (outs VR128:$dst),		def rm : SS4AIi8<opc, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, i32mem:$src2, u8imm:$src3),		(ins VR128:$src1, i32mem:$src2, u8imm:$src3),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(asm, "\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		!strconcat(asm, "\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
!strconcat(asm,		!strconcat(asm,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),
[(set VR128:$dst,		[(set VR128:$dst,
(v4i32 (insertelt VR128:$src1, (loadi32 addr:$src2),		(v4i32 (insertelt VR128:$src1, (loadi32 addr:$src2), imm:$src3)))]>,
imm:$src3)))]>, Sched<[WriteVecInsertLd, ReadAfterLd]>;		Sched<[WriteVecInsert.Folded, WriteVecInsert.ReadAfterFold]>;
}		}

let Predicates = [HasAVX, NoDQI] in		let Predicates = [HasAVX, NoDQI] in
defm VPINSRD : SS41I_insert32<0x22, "vpinsrd", 0>, VEX_4V;		defm VPINSRD : SS41I_insert32<0x22, "vpinsrd", 0>, VEX_4V;
let Constraints = "$src1 = $dst" in		let Constraints = "$src1 = $dst" in
defm PINSRD : SS41I_insert32<0x22, "pinsrd">;		defm PINSRD : SS41I_insert32<0x22, "pinsrd">;

multiclass SS41I_insert64<bits<8> opc, string asm, bit Is2Addr = 1> {		multiclass SS41I_insert64<bits<8> opc, string asm, bit Is2Addr = 1> {
def rr : SS4AIi8<opc, MRMSrcReg, (outs VR128:$dst),		def rr : SS4AIi8<opc, MRMSrcReg, (outs VR128:$dst),
(ins VR128:$src1, GR64:$src2, u8imm:$src3),		(ins VR128:$src1, GR64:$src2, u8imm:$src3),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(asm, "\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		!strconcat(asm, "\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
!strconcat(asm,		!strconcat(asm,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),
[(set VR128:$dst,		[(set VR128:$dst,
(v2i64 (insertelt VR128:$src1, GR64:$src2, imm:$src3)))]>,		(v2i64 (insertelt VR128:$src1, GR64:$src2, imm:$src3)))]>,
Sched<[WriteVecInsert]>;		Sched<[WriteVecInsert]>;
def rm : SS4AIi8<opc, MRMSrcMem, (outs VR128:$dst),		def rm : SS4AIi8<opc, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, i64mem:$src2, u8imm:$src3),		(ins VR128:$src1, i64mem:$src2, u8imm:$src3),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(asm, "\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		!strconcat(asm, "\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
!strconcat(asm,		!strconcat(asm,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),
[(set VR128:$dst,		[(set VR128:$dst,
(v2i64 (insertelt VR128:$src1, (loadi64 addr:$src2),		(v2i64 (insertelt VR128:$src1, (loadi64 addr:$src2), imm:$src3)))]>,
imm:$src3)))]>, Sched<[WriteVecInsertLd, ReadAfterLd]>;		Sched<[WriteVecInsert.Folded, WriteVecInsert.ReadAfterFold]>;
}		}

let Predicates = [HasAVX, NoDQI] in		let Predicates = [HasAVX, NoDQI] in
defm VPINSRQ : SS41I_insert64<0x22, "vpinsrq", 0>, VEX_4V, VEX_W;		defm VPINSRQ : SS41I_insert64<0x22, "vpinsrq", 0>, VEX_4V, VEX_W;
let Constraints = "$src1 = $dst" in		let Constraints = "$src1 = $dst" in
defm PINSRQ : SS41I_insert64<0x22, "pinsrq">, REX_W;		defm PINSRQ : SS41I_insert64<0x22, "pinsrq">, REX_W;

// insertps has a few different modes, there's the first two here below which		// insertps has a few different modes, there's the first two here below which
Show All 15 Lines	def rm : SS4AIi8<opc, MRMSrcMem, (outs VR128:$dst),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(asm, "\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		!strconcat(asm, "\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
!strconcat(asm,		!strconcat(asm,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),
[(set VR128:$dst,		[(set VR128:$dst,
(X86insertps VR128:$src1,		(X86insertps VR128:$src1,
(v4f32 (scalar_to_vector (loadf32 addr:$src2))),		(v4f32 (scalar_to_vector (loadf32 addr:$src2))),
imm:$src3))]>,		imm:$src3))]>,
Sched<[SchedWriteFShuffle.XMM.Folded, ReadAfterLd]>;		Sched<[SchedWriteFShuffle.XMM.Folded, SchedWriteFShuffle.XMM.ReadAfterFold]>;
}		}

let ExeDomain = SSEPackedSingle in {		let ExeDomain = SSEPackedSingle in {
let Predicates = [UseAVX] in		let Predicates = [UseAVX] in
defm VINSERTPS : SS41I_insertf32<0x21, "vinsertps", 0>,		defm VINSERTPS : SS41I_insertf32<0x21, "vinsertps", 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
let Constraints = "$src1 = $dst" in		let Constraints = "$src1 = $dst" in
defm INSERTPS : SS41I_insertf32<0x21, "insertps", 1>;		defm INSERTPS : SS41I_insertf32<0x21, "insertps", 1>;
▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines	def SSr : SS4AIi8<opcss, MRMSrcReg,
"ss\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"ss\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[]>, Sched<[sched]>;		[]>, Sched<[sched]>;

let mayLoad = 1 in		let mayLoad = 1 in
def SSm : SS4AIi8<opcss, MRMSrcMem,		def SSm : SS4AIi8<opcss, MRMSrcMem,
(outs FR32:$dst), (ins FR32:$src1, f32mem:$src2, i32u8imm:$src3),		(outs FR32:$dst), (ins FR32:$src1, f32mem:$src2, i32u8imm:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"ss\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"ss\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[]>, Sched<[sched.Folded, ReadAfterLd]>;		[]>, Sched<[sched.Folded, sched.ReadAfterFold]>;
} // ExeDomain = SSEPackedSingle, hasSideEffects = 0		} // ExeDomain = SSEPackedSingle, hasSideEffects = 0

let ExeDomain = SSEPackedDouble, hasSideEffects = 0 in {		let ExeDomain = SSEPackedDouble, hasSideEffects = 0 in {
def SDr : SS4AIi8<opcsd, MRMSrcReg,		def SDr : SS4AIi8<opcsd, MRMSrcReg,
(outs FR64:$dst), (ins FR64:$src1, FR64:$src2, i32u8imm:$src3),		(outs FR64:$dst), (ins FR64:$src1, FR64:$src2, i32u8imm:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"sd\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"sd\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[]>, Sched<[sched]>;		[]>, Sched<[sched]>;

let mayLoad = 1 in		let mayLoad = 1 in
def SDm : SS4AIi8<opcsd, MRMSrcMem,		def SDm : SS4AIi8<opcsd, MRMSrcMem,
(outs FR64:$dst), (ins FR64:$src1, f64mem:$src2, i32u8imm:$src3),		(outs FR64:$dst), (ins FR64:$src1, f64mem:$src2, i32u8imm:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"sd\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"sd\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[]>, Sched<[sched.Folded, ReadAfterLd]>;		[]>, Sched<[sched.Folded, sched.ReadAfterFold]>;
} // ExeDomain = SSEPackedDouble, hasSideEffects = 0		} // ExeDomain = SSEPackedDouble, hasSideEffects = 0
}		}

multiclass sse41_fp_unop_s<bits<8> opcss, bits<8> opcsd,		multiclass sse41_fp_unop_s<bits<8> opcss, bits<8> opcsd,
string OpcodeStr, X86FoldableSchedWrite sched> {		string OpcodeStr, X86FoldableSchedWrite sched> {
let ExeDomain = SSEPackedSingle, hasSideEffects = 0 in {		let ExeDomain = SSEPackedSingle, hasSideEffects = 0 in {
def SSr : SS4AIi8<opcss, MRMSrcReg,		def SSr : SS4AIi8<opcss, MRMSrcReg,
(outs FR32:$dst), (ins FR32:$src1, i32u8imm:$src2),		(outs FR32:$dst), (ins FR32:$src1, i32u8imm:$src2),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"ss\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		"ss\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[]>, Sched<[sched]>;		[]>, Sched<[sched]>;

let mayLoad = 1 in		let mayLoad = 1 in
def SSm : SS4AIi8<opcss, MRMSrcMem,		def SSm : SS4AIi8<opcss, MRMSrcMem,
(outs FR32:$dst), (ins f32mem:$src1, i32u8imm:$src2),		(outs FR32:$dst), (ins f32mem:$src1, i32u8imm:$src2),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"ss\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		"ss\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[]>, Sched<[sched.Folded, ReadAfterLd]>;		[]>, Sched<[sched.Folded, sched.ReadAfterFold]>;
} // ExeDomain = SSEPackedSingle, hasSideEffects = 0		} // ExeDomain = SSEPackedSingle, hasSideEffects = 0

let ExeDomain = SSEPackedDouble, hasSideEffects = 0 in {		let ExeDomain = SSEPackedDouble, hasSideEffects = 0 in {
def SDr : SS4AIi8<opcsd, MRMSrcReg,		def SDr : SS4AIi8<opcsd, MRMSrcReg,
(outs FR64:$dst), (ins FR64:$src1, i32u8imm:$src2),		(outs FR64:$dst), (ins FR64:$src1, i32u8imm:$src2),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"sd\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		"sd\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[]>, Sched<[sched]>;		[]>, Sched<[sched]>;

let mayLoad = 1 in		let mayLoad = 1 in
def SDm : SS4AIi8<opcsd, MRMSrcMem,		def SDm : SS4AIi8<opcsd, MRMSrcMem,
(outs FR64:$dst), (ins f64mem:$src1, i32u8imm:$src2),		(outs FR64:$dst), (ins f64mem:$src1, i32u8imm:$src2),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"sd\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		"sd\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[]>, Sched<[sched.Folded, ReadAfterLd]>;		[]>, Sched<[sched.Folded, sched.ReadAfterFold]>;
} // ExeDomain = SSEPackedDouble, hasSideEffects = 0		} // ExeDomain = SSEPackedDouble, hasSideEffects = 0
}		}

multiclass sse41_fp_binop_s<bits<8> opcss, bits<8> opcsd,		multiclass sse41_fp_binop_s<bits<8> opcss, bits<8> opcsd,
string OpcodeStr, X86FoldableSchedWrite sched,		string OpcodeStr, X86FoldableSchedWrite sched,
ValueType VT32, ValueType VT64,		ValueType VT32, ValueType VT64,
SDNode OpNode, bit Is2Addr = 1> {		SDNode OpNode, bit Is2Addr = 1> {
let ExeDomain = SSEPackedSingle, isCodeGenOnly = 1 in {		let ExeDomain = SSEPackedSingle, isCodeGenOnly = 1 in {
Show All 11 Lines	def SSm_Int : SS4AIi8<opcss, MRMSrcMem,
(outs VR128:$dst), (ins VR128:$src1, ssmem:$src2, i32u8imm:$src3),		(outs VR128:$dst), (ins VR128:$src1, ssmem:$src2, i32u8imm:$src3),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"ss\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"ss\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"ss\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),		"ss\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),
[(set VR128:$dst,		[(set VR128:$dst,
(OpNode VR128:$src1, sse_load_f32:$src2, imm:$src3))]>,		(OpNode VR128:$src1, sse_load_f32:$src2, imm:$src3))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
} // ExeDomain = SSEPackedSingle, isCodeGenOnly = 1		} // ExeDomain = SSEPackedSingle, isCodeGenOnly = 1

let ExeDomain = SSEPackedDouble, isCodeGenOnly = 1 in {		let ExeDomain = SSEPackedDouble, isCodeGenOnly = 1 in {
def SDr_Int : SS4AIi8<opcsd, MRMSrcReg,		def SDr_Int : SS4AIi8<opcsd, MRMSrcReg,
(outs VR128:$dst), (ins VR128:$src1, VR128:$src2, i32u8imm:$src3),		(outs VR128:$dst), (ins VR128:$src1, VR128:$src2, i32u8imm:$src3),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"sd\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"sd\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"sd\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),		"sd\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),
[(set VR128:$dst, (VT64 (OpNode VR128:$src1, VR128:$src2, imm:$src3)))]>,		[(set VR128:$dst, (VT64 (OpNode VR128:$src1, VR128:$src2, imm:$src3)))]>,
Sched<[sched]>;		Sched<[sched]>;

def SDm_Int : SS4AIi8<opcsd, MRMSrcMem,		def SDm_Int : SS4AIi8<opcsd, MRMSrcMem,
(outs VR128:$dst), (ins VR128:$src1, sdmem:$src2, i32u8imm:$src3),		(outs VR128:$dst), (ins VR128:$src1, sdmem:$src2, i32u8imm:$src3),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"sd\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"sd\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"sd\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),		"sd\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),
[(set VR128:$dst,		[(set VR128:$dst,
(OpNode VR128:$src1, sse_load_f64:$src2, imm:$src3))]>,		(OpNode VR128:$src1, sse_load_f64:$src2, imm:$src3))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
} // ExeDomain = SSEPackedDouble, isCodeGenOnly = 1		} // ExeDomain = SSEPackedDouble, isCodeGenOnly = 1
}		}

// FP round - roundss, roundps, roundsd, roundpd		// FP round - roundss, roundps, roundsd, roundpd
let Predicates = [HasAVX, NoVLX] in {		let Predicates = [HasAVX, NoVLX] in {
let ExeDomain = SSEPackedSingle in {		let ExeDomain = SSEPackedSingle in {
// Intrinsic form		// Intrinsic form
defm VROUNDPS : sse41_fp_unop_p<0x08, "vroundps", f128mem, VR128, v4f32,		defm VROUNDPS : sse41_fp_unop_p<0x08, "vroundps", f128mem, VR128, v4f32,
▲ Show 20 Lines • Show All 284 Lines • ▼ Show 20 Lines
let Defs = [EFLAGS], Predicates = [HasAVX] in {		let Defs = [EFLAGS], Predicates = [HasAVX] in {
def VPTESTrr : SS48I<0x17, MRMSrcReg, (outs), (ins VR128:$src1, VR128:$src2),		def VPTESTrr : SS48I<0x17, MRMSrcReg, (outs), (ins VR128:$src1, VR128:$src2),
"vptest\t{$src2, $src1\|$src1, $src2}",		"vptest\t{$src2, $src1\|$src1, $src2}",
[(set EFLAGS, (X86ptest VR128:$src1, (v2i64 VR128:$src2)))]>,		[(set EFLAGS, (X86ptest VR128:$src1, (v2i64 VR128:$src2)))]>,
Sched<[SchedWriteVecTest.XMM]>, VEX, VEX_WIG;		Sched<[SchedWriteVecTest.XMM]>, VEX, VEX_WIG;
def VPTESTrm : SS48I<0x17, MRMSrcMem, (outs), (ins VR128:$src1, f128mem:$src2),		def VPTESTrm : SS48I<0x17, MRMSrcMem, (outs), (ins VR128:$src1, f128mem:$src2),
"vptest\t{$src2, $src1\|$src1, $src2}",		"vptest\t{$src2, $src1\|$src1, $src2}",
[(set EFLAGS,(X86ptest VR128:$src1, (loadv2i64 addr:$src2)))]>,		[(set EFLAGS,(X86ptest VR128:$src1, (loadv2i64 addr:$src2)))]>,
Sched<[SchedWriteVecTest.XMM.Folded, ReadAfterLd]>,		Sched<[SchedWriteVecTest.XMM.Folded, SchedWriteVecTest.XMM.ReadAfterFold]>,
VEX, VEX_WIG;		VEX, VEX_WIG;

def VPTESTYrr : SS48I<0x17, MRMSrcReg, (outs), (ins VR256:$src1, VR256:$src2),		def VPTESTYrr : SS48I<0x17, MRMSrcReg, (outs), (ins VR256:$src1, VR256:$src2),
"vptest\t{$src2, $src1\|$src1, $src2}",		"vptest\t{$src2, $src1\|$src1, $src2}",
[(set EFLAGS, (X86ptest VR256:$src1, (v4i64 VR256:$src2)))]>,		[(set EFLAGS, (X86ptest VR256:$src1, (v4i64 VR256:$src2)))]>,
Sched<[SchedWriteVecTest.YMM]>, VEX, VEX_L, VEX_WIG;		Sched<[SchedWriteVecTest.YMM]>, VEX, VEX_L, VEX_WIG;
def VPTESTYrm : SS48I<0x17, MRMSrcMem, (outs), (ins VR256:$src1, i256mem:$src2),		def VPTESTYrm : SS48I<0x17, MRMSrcMem, (outs), (ins VR256:$src1, i256mem:$src2),
"vptest\t{$src2, $src1\|$src1, $src2}",		"vptest\t{$src2, $src1\|$src1, $src2}",
[(set EFLAGS,(X86ptest VR256:$src1, (loadv4i64 addr:$src2)))]>,		[(set EFLAGS,(X86ptest VR256:$src1, (loadv4i64 addr:$src2)))]>,
Sched<[SchedWriteVecTest.YMM.Folded, ReadAfterLd]>,		Sched<[SchedWriteVecTest.YMM.Folded, SchedWriteVecTest.YMM.ReadAfterFold]>,
VEX, VEX_L, VEX_WIG;		VEX, VEX_L, VEX_WIG;
}		}

let Defs = [EFLAGS] in {		let Defs = [EFLAGS] in {
def PTESTrr : SS48I<0x17, MRMSrcReg, (outs), (ins VR128:$src1, VR128:$src2),		def PTESTrr : SS48I<0x17, MRMSrcReg, (outs), (ins VR128:$src1, VR128:$src2),
"ptest\t{$src2, $src1\|$src1, $src2}",		"ptest\t{$src2, $src1\|$src1, $src2}",
[(set EFLAGS, (X86ptest VR128:$src1, (v2i64 VR128:$src2)))]>,		[(set EFLAGS, (X86ptest VR128:$src1, (v2i64 VR128:$src2)))]>,
Sched<[SchedWriteVecTest.XMM]>;		Sched<[SchedWriteVecTest.XMM]>;
def PTESTrm : SS48I<0x17, MRMSrcMem, (outs), (ins VR128:$src1, f128mem:$src2),		def PTESTrm : SS48I<0x17, MRMSrcMem, (outs), (ins VR128:$src1, f128mem:$src2),
"ptest\t{$src2, $src1\|$src1, $src2}",		"ptest\t{$src2, $src1\|$src1, $src2}",
[(set EFLAGS, (X86ptest VR128:$src1, (memopv2i64 addr:$src2)))]>,		[(set EFLAGS, (X86ptest VR128:$src1, (memopv2i64 addr:$src2)))]>,
Sched<[SchedWriteVecTest.XMM.Folded, ReadAfterLd]>;		Sched<[SchedWriteVecTest.XMM.Folded, SchedWriteVecTest.XMM.ReadAfterFold]>;
}		}

// The bit test instructions below are AVX only		// The bit test instructions below are AVX only
multiclass avx_bittest<bits<8> opc, string OpcodeStr, RegisterClass RC,		multiclass avx_bittest<bits<8> opc, string OpcodeStr, RegisterClass RC,
X86MemOperand x86memop, PatFrag mem_frag, ValueType vt,		X86MemOperand x86memop, PatFrag mem_frag, ValueType vt,
X86FoldableSchedWrite sched> {		X86FoldableSchedWrite sched> {
def rr : SS48I<opc, MRMSrcReg, (outs), (ins RC:$src1, RC:$src2),		def rr : SS48I<opc, MRMSrcReg, (outs), (ins RC:$src1, RC:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1\|$src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1\|$src1, $src2}"),
[(set EFLAGS, (X86testp RC:$src1, (vt RC:$src2)))]>,		[(set EFLAGS, (X86testp RC:$src1, (vt RC:$src2)))]>,
Sched<[sched]>, VEX;		Sched<[sched]>, VEX;
def rm : SS48I<opc, MRMSrcMem, (outs), (ins RC:$src1, x86memop:$src2),		def rm : SS48I<opc, MRMSrcMem, (outs), (ins RC:$src1, x86memop:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1\|$src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1\|$src1, $src2}"),
[(set EFLAGS, (X86testp RC:$src1, (mem_frag addr:$src2)))]>,		[(set EFLAGS, (X86testp RC:$src1, (mem_frag addr:$src2)))]>,
Sched<[sched.Folded, ReadAfterLd]>, VEX;		Sched<[sched.Folded, sched.ReadAfterFold]>, VEX;
}		}

let Defs = [EFLAGS], Predicates = [HasAVX] in {		let Defs = [EFLAGS], Predicates = [HasAVX] in {
let ExeDomain = SSEPackedSingle in {		let ExeDomain = SSEPackedSingle in {
defm VTESTPS : avx_bittest<0x0E, "vtestps", VR128, f128mem, loadv4f32, v4f32,		defm VTESTPS : avx_bittest<0x0E, "vtestps", VR128, f128mem, loadv4f32, v4f32,
SchedWriteFTest.XMM>;		SchedWriteFTest.XMM>;
defm VTESTPSY : avx_bittest<0x0E, "vtestps", VR256, f256mem, loadv8f32, v8f32,		defm VTESTPSY : avx_bittest<0x0E, "vtestps", VR256, f256mem, loadv8f32, v8f32,
SchedWriteFTest.YMM>, VEX_L;		SchedWriteFTest.YMM>, VEX_L;
▲ Show 20 Lines • Show All 85 Lines • ▼ Show 20 Lines	def rr : SS48I<opc, MRMSrcReg, (outs RC:$dst),
Sched<[sched]>;		Sched<[sched]>;
def rm : SS48I<opc, MRMSrcMem, (outs RC:$dst),		def rm : SS48I<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop:$src2),		(ins RC:$src1, x86memop:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst,		[(set RC:$dst,
(OpVT (OpNode RC:$src1, (bitconvert (memop_frag addr:$src2)))))]>,		(OpVT (OpNode RC:$src1, (bitconvert (memop_frag addr:$src2)))))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let Predicates = [HasAVX, NoVLX] in {		let Predicates = [HasAVX, NoVLX] in {
defm VPMINSD : SS48I_binop_rm<0x39, "vpminsd", smin, v4i32, VR128,		defm VPMINSD : SS48I_binop_rm<0x39, "vpminsd", smin, v4i32, VR128,
loadv2i64, i128mem, SchedWriteVecALU.XMM, 0>,		loadv2i64, i128mem, SchedWriteVecALU.XMM, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;
defm VPMINUD : SS48I_binop_rm<0x3B, "vpminud", umin, v4i32, VR128,		defm VPMINUD : SS48I_binop_rm<0x3B, "vpminud", umin, v4i32, VR128,
loadv2i64, i128mem, SchedWriteVecALU.XMM, 0>,		loadv2i64, i128mem, SchedWriteVecALU.XMM, 0>,
▲ Show 20 Lines • Show All 121 Lines • ▼ Show 20 Lines	def rmi : SS4AIi8<opc, MRMSrcMem, (outs RC:$dst),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),
[(set RC:$dst,		[(set RC:$dst,
(IntId RC:$src1,		(IntId RC:$src1,
(bitconvert (memop_frag addr:$src2)), imm:$src3))]>,		(bitconvert (memop_frag addr:$src2)), imm:$src3))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

/// SS41I_binop_rmi - SSE 4.1 binary operator with 8-bit immediate		/// SS41I_binop_rmi - SSE 4.1 binary operator with 8-bit immediate
multiclass SS41I_binop_rmi<bits<8> opc, string OpcodeStr, SDNode OpNode,		multiclass SS41I_binop_rmi<bits<8> opc, string OpcodeStr, SDNode OpNode,
ValueType OpVT, RegisterClass RC, PatFrag memop_frag,		ValueType OpVT, RegisterClass RC, PatFrag memop_frag,
X86MemOperand x86memop, bit Is2Addr,		X86MemOperand x86memop, bit Is2Addr,
X86FoldableSchedWrite sched> {		X86FoldableSchedWrite sched> {
let isCommutable = 1 in		let isCommutable = 1 in
Show All 11 Lines	def rmi : SS4AIi8<opc, MRMSrcMem, (outs RC:$dst),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),
[(set RC:$dst,		[(set RC:$dst,
(OpVT (OpNode RC:$src1,		(OpVT (OpNode RC:$src1,
(bitconvert (memop_frag addr:$src2)), imm:$src3)))]>,		(bitconvert (memop_frag addr:$src2)), imm:$src3)))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

def BlendCommuteImm2 : SDNodeXForm<imm, [{		def BlendCommuteImm2 : SDNodeXForm<imm, [{
uint8_t Imm = N->getZExtValue() & 0x03;		uint8_t Imm = N->getZExtValue() & 0x03;
return getI8Imm(Imm ^ 0x03, SDLoc(N));		return getI8Imm(Imm ^ 0x03, SDLoc(N));
}]>;		}]>;

def BlendCommuteImm4 : SDNodeXForm<imm, [{		def BlendCommuteImm4 : SDNodeXForm<imm, [{
▲ Show 20 Lines • Show All 73 Lines • ▼ Show 20 Lines	def rmi : SS4AIi8<opc, MRMSrcMem, (outs RC:$dst),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),		"\t{$src3, $src2, $dst\|$dst, $src2, $src3}"),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}")),
[(set RC:$dst,		[(set RC:$dst,
(OpVT (OpNode RC:$src1,		(OpVT (OpNode RC:$src1,
(bitconvert (memop_frag addr:$src2)), imm:$src3)))]>,		(bitconvert (memop_frag addr:$src2)), imm:$src3)))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

// Pattern to commute if load is in first source.		// Pattern to commute if load is in first source.
def : Pat<(OpVT (OpNode (bitconvert (memop_frag addr:$src2)),		def : Pat<(OpVT (OpNode (bitconvert (memop_frag addr:$src2)),
RC:$src1, imm:$src3)),		RC:$src1, imm:$src3)),
(!cast<Instruction>(NAME#"rmi") RC:$src1, addr:$src2,		(!cast<Instruction>(NAME#"rmi") RC:$src1, addr:$src2,
(commuteXForm imm:$src3))>;		(commuteXForm imm:$src3))>;
}		}
▲ Show 20 Lines • Show All 66 Lines • ▼ Show 20 Lines	multiclass SS41I_quaternary_int_avx<bits<8> opc, string OpcodeStr,

def rm : Ii8Reg<opc, MRMSrcMem, (outs RC:$dst),		def rm : Ii8Reg<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop:$src2, RC:$src3),		(ins RC:$src1, x86memop:$src2, RC:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[(set RC:$dst,		[(set RC:$dst,
(IntId RC:$src1, (bitconvert (mem_frag addr:$src2)),		(IntId RC:$src1, (bitconvert (mem_frag addr:$src2)),
RC:$src3))], SSEPackedInt>, TAPD, VEX_4V,		RC:$src3))], SSEPackedInt>, TAPD, VEX_4V,
Sched<[sched.Folded, ReadAfterLd,		Sched<[sched.Folded, sched.ReadAfterFold,
// x86memop:$src2		// x86memop:$src2
ReadDefault, ReadDefault, ReadDefault, ReadDefault,		ReadDefault, ReadDefault, ReadDefault, ReadDefault,
ReadDefault,		ReadDefault,
// RC::$src3		// RC::$src3
ReadAfterLd]>;		sched.ReadAfterFold]>;
}		}

let Predicates = [HasAVX] in {		let Predicates = [HasAVX] in {
let ExeDomain = SSEPackedDouble in {		let ExeDomain = SSEPackedDouble in {
defm VBLENDVPD : SS41I_quaternary_int_avx<0x4B, "vblendvpd", VR128, f128mem,		defm VBLENDVPD : SS41I_quaternary_int_avx<0x4B, "vblendvpd", VR128, f128mem,
loadv2f64, int_x86_sse41_blendvpd,		loadv2f64, int_x86_sse41_blendvpd,
SchedWriteFVarBlend.XMM>;		SchedWriteFVarBlend.XMM>;
defm VBLENDVPDY : SS41I_quaternary_int_avx<0x4B, "vblendvpd", VR256, f256mem,		defm VBLENDVPDY : SS41I_quaternary_int_avx<0x4B, "vblendvpd", VR256, f256mem,
▲ Show 20 Lines • Show All 142 Lines • ▼ Show 20 Lines	multiclass SS41I_ternary_int<bits<8> opc, string OpcodeStr, PatFrag mem_frag,

def rm0 : SS48I<opc, MRMSrcMem, (outs VR128:$dst),		def rm0 : SS48I<opc, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, x86memop:$src2),		(ins VR128:$src1, x86memop:$src2),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{%xmm0, $src2, $dst\|$dst, $src2, xmm0}"),		"\t{%xmm0, $src2, $dst\|$dst, $src2, xmm0}"),
[(set VR128:$dst,		[(set VR128:$dst,
(IntId VR128:$src1,		(IntId VR128:$src1,
(bitconvert (mem_frag addr:$src2)), XMM0))]>,		(bitconvert (mem_frag addr:$src2)), XMM0))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}
}		}

let ExeDomain = SSEPackedDouble in		let ExeDomain = SSEPackedDouble in
defm BLENDVPD : SS41I_ternary_int<0x15, "blendvpd", memopv2f64, f128mem,		defm BLENDVPD : SS41I_ternary_int<0x15, "blendvpd", memopv2f64, f128mem,
int_x86_sse41_blendvpd, SchedWriteFVarBlend.XMM>;		int_x86_sse41_blendvpd, SchedWriteFVarBlend.XMM>;
let ExeDomain = SSEPackedSingle in		let ExeDomain = SSEPackedSingle in
defm BLENDVPS : SS41I_ternary_int<0x14, "blendvps", memopv4f32, f128mem,		defm BLENDVPS : SS41I_ternary_int<0x14, "blendvps", memopv4f32, f128mem,
▲ Show 20 Lines • Show All 94 Lines • ▼ Show 20 Lines	def rr : SS428I<opc, MRMSrcReg, (outs RC:$dst),
Sched<[sched]>;		Sched<[sched]>;
def rm : SS428I<opc, MRMSrcMem, (outs RC:$dst),		def rm : SS428I<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop:$src2),		(ins RC:$src1, x86memop:$src2),
!if(Is2Addr,		!if(Is2Addr,
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}"),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}")),
[(set RC:$dst,		[(set RC:$dst,
(OpVT (OpNode RC:$src1, (memop_frag addr:$src2))))]>,		(OpVT (OpNode RC:$src1, (memop_frag addr:$src2))))]>,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let Predicates = [HasAVX] in		let Predicates = [HasAVX] in
defm VPCMPGTQ : SS42I_binop_rm<0x37, "vpcmpgtq", X86pcmpgt, v2i64, VR128,		defm VPCMPGTQ : SS42I_binop_rm<0x37, "vpcmpgtq", X86pcmpgt, v2i64, VR128,
loadv2i64, i128mem, SchedWriteVecALU.XMM, 0>,		loadv2i64, i128mem, SchedWriteVecALU.XMM, 0>,
VEX_4V, VEX_WIG;		VEX_4V, VEX_WIG;

let Predicates = [HasAVX2] in		let Predicates = [HasAVX2] in
Show All 13 Lines	multiclass pcmpistrm_SS42AI<string asm> {
def rr : SS42AI<0x62, MRMSrcReg, (outs),		def rr : SS42AI<0x62, MRMSrcReg, (outs),
(ins VR128:$src1, VR128:$src2, u8imm:$src3),		(ins VR128:$src1, VR128:$src2, u8imm:$src3),
!strconcat(asm, "\t{$src3, $src2, $src1\|$src1, $src2, $src3}"),		!strconcat(asm, "\t{$src3, $src2, $src1\|$src1, $src2, $src3}"),
[]>, Sched<[WritePCmpIStrM]>;		[]>, Sched<[WritePCmpIStrM]>;
let mayLoad = 1 in		let mayLoad = 1 in
def rm :SS42AI<0x62, MRMSrcMem, (outs),		def rm :SS42AI<0x62, MRMSrcMem, (outs),
(ins VR128:$src1, i128mem:$src2, u8imm:$src3),		(ins VR128:$src1, i128mem:$src2, u8imm:$src3),
!strconcat(asm, "\t{$src3, $src2, $src1\|$src1, $src2, $src3}"),		!strconcat(asm, "\t{$src3, $src2, $src1\|$src1, $src2, $src3}"),
[]>, Sched<[WritePCmpIStrM.Folded, ReadAfterLd]>;		[]>, Sched<[WritePCmpIStrM.Folded, WritePCmpIStrM.ReadAfterFold]>;
}		}

let Defs = [XMM0, EFLAGS], hasSideEffects = 0 in {		let Defs = [XMM0, EFLAGS], hasSideEffects = 0 in {
let Predicates = [HasAVX] in		let Predicates = [HasAVX] in
defm VPCMPISTRM : pcmpistrm_SS42AI<"vpcmpistrm">, VEX;		defm VPCMPISTRM : pcmpistrm_SS42AI<"vpcmpistrm">, VEX;
defm PCMPISTRM : pcmpistrm_SS42AI<"pcmpistrm"> ;		defm PCMPISTRM : pcmpistrm_SS42AI<"pcmpistrm"> ;
}		}

multiclass SS42AI_pcmpestrm<string asm> {		multiclass SS42AI_pcmpestrm<string asm> {
def rr : SS42AI<0x60, MRMSrcReg, (outs),		def rr : SS42AI<0x60, MRMSrcReg, (outs),
(ins VR128:$src1, VR128:$src3, u8imm:$src5),		(ins VR128:$src1, VR128:$src3, u8imm:$src5),
!strconcat(asm, "\t{$src5, $src3, $src1\|$src1, $src3, $src5}"),		!strconcat(asm, "\t{$src5, $src3, $src1\|$src1, $src3, $src5}"),
[]>, Sched<[WritePCmpEStrM]>;		[]>, Sched<[WritePCmpEStrM]>;
let mayLoad = 1 in		let mayLoad = 1 in
def rm : SS42AI<0x60, MRMSrcMem, (outs),		def rm : SS42AI<0x60, MRMSrcMem, (outs),
(ins VR128:$src1, i128mem:$src3, u8imm:$src5),		(ins VR128:$src1, i128mem:$src3, u8imm:$src5),
!strconcat(asm, "\t{$src5, $src3, $src1\|$src1, $src3, $src5}"),		!strconcat(asm, "\t{$src5, $src3, $src1\|$src1, $src3, $src5}"),
[]>, Sched<[WritePCmpEStrM.Folded, ReadAfterLd]>;		[]>, Sched<[WritePCmpEStrM.Folded, WritePCmpEStrM.ReadAfterFold]>;
}		}

let Defs = [XMM0, EFLAGS], Uses = [EAX, EDX], hasSideEffects = 0 in {		let Defs = [XMM0, EFLAGS], Uses = [EAX, EDX], hasSideEffects = 0 in {
let Predicates = [HasAVX] in		let Predicates = [HasAVX] in
defm VPCMPESTRM : SS42AI_pcmpestrm<"vpcmpestrm">, VEX;		defm VPCMPESTRM : SS42AI_pcmpestrm<"vpcmpestrm">, VEX;
defm PCMPESTRM : SS42AI_pcmpestrm<"pcmpestrm">;		defm PCMPESTRM : SS42AI_pcmpestrm<"pcmpestrm">;
}		}

multiclass SS42AI_pcmpistri<string asm> {		multiclass SS42AI_pcmpistri<string asm> {
def rr : SS42AI<0x63, MRMSrcReg, (outs),		def rr : SS42AI<0x63, MRMSrcReg, (outs),
(ins VR128:$src1, VR128:$src2, u8imm:$src3),		(ins VR128:$src1, VR128:$src2, u8imm:$src3),
!strconcat(asm, "\t{$src3, $src2, $src1\|$src1, $src2, $src3}"),		!strconcat(asm, "\t{$src3, $src2, $src1\|$src1, $src2, $src3}"),
[]>, Sched<[WritePCmpIStrI]>;		[]>, Sched<[WritePCmpIStrI]>;
let mayLoad = 1 in		let mayLoad = 1 in
def rm : SS42AI<0x63, MRMSrcMem, (outs),		def rm : SS42AI<0x63, MRMSrcMem, (outs),
(ins VR128:$src1, i128mem:$src2, u8imm:$src3),		(ins VR128:$src1, i128mem:$src2, u8imm:$src3),
!strconcat(asm, "\t{$src3, $src2, $src1\|$src1, $src2, $src3}"),		!strconcat(asm, "\t{$src3, $src2, $src1\|$src1, $src2, $src3}"),
[]>, Sched<[WritePCmpIStrI.Folded, ReadAfterLd]>;		[]>, Sched<[WritePCmpIStrI.Folded, WritePCmpIStrI.ReadAfterFold]>;
}		}

let Defs = [ECX, EFLAGS], hasSideEffects = 0 in {		let Defs = [ECX, EFLAGS], hasSideEffects = 0 in {
let Predicates = [HasAVX] in		let Predicates = [HasAVX] in
defm VPCMPISTRI : SS42AI_pcmpistri<"vpcmpistri">, VEX;		defm VPCMPISTRI : SS42AI_pcmpistri<"vpcmpistri">, VEX;
defm PCMPISTRI : SS42AI_pcmpistri<"pcmpistri">;		defm PCMPISTRI : SS42AI_pcmpistri<"pcmpistri">;
}		}

multiclass SS42AI_pcmpestri<string asm> {		multiclass SS42AI_pcmpestri<string asm> {
def rr : SS42AI<0x61, MRMSrcReg, (outs),		def rr : SS42AI<0x61, MRMSrcReg, (outs),
(ins VR128:$src1, VR128:$src3, u8imm:$src5),		(ins VR128:$src1, VR128:$src3, u8imm:$src5),
!strconcat(asm, "\t{$src5, $src3, $src1\|$src1, $src3, $src5}"),		!strconcat(asm, "\t{$src5, $src3, $src1\|$src1, $src3, $src5}"),
[]>, Sched<[WritePCmpEStrI]>;		[]>, Sched<[WritePCmpEStrI]>;
let mayLoad = 1 in		let mayLoad = 1 in
def rm : SS42AI<0x61, MRMSrcMem, (outs),		def rm : SS42AI<0x61, MRMSrcMem, (outs),
(ins VR128:$src1, i128mem:$src3, u8imm:$src5),		(ins VR128:$src1, i128mem:$src3, u8imm:$src5),
!strconcat(asm, "\t{$src5, $src3, $src1\|$src1, $src3, $src5}"),		!strconcat(asm, "\t{$src5, $src3, $src1\|$src1, $src3, $src5}"),
[]>, Sched<[WritePCmpEStrI.Folded, ReadAfterLd]>;		[]>, Sched<[WritePCmpEStrI.Folded, WritePCmpEStrI.ReadAfterFold]>;
}		}

let Defs = [ECX, EFLAGS], Uses = [EAX, EDX], hasSideEffects = 0 in {		let Defs = [ECX, EFLAGS], Uses = [EAX, EDX], hasSideEffects = 0 in {
let Predicates = [HasAVX] in		let Predicates = [HasAVX] in
defm VPCMPESTRI : SS42AI_pcmpestri<"vpcmpestri">, VEX;		defm VPCMPESTRI : SS42AI_pcmpestri<"vpcmpestri">, VEX;
defm PCMPESTRI : SS42AI_pcmpestri<"pcmpestri">;		defm PCMPESTRI : SS42AI_pcmpestri<"pcmpestri">;
}		}

Show All 13 Lines	SS42FI<opc, MRMSrcReg, (outs RCOut:$dst), (ins RCOut:$src1, RCIn:$src2),
[(set RCOut:$dst, (Int RCOut:$src1, RCIn:$src2))]>,		[(set RCOut:$dst, (Int RCOut:$src1, RCIn:$src2))]>,
Sched<[WriteCRC32]>;		Sched<[WriteCRC32]>;

class SS42I_crc32m<bits<8> opc, string asm, RegisterClass RCOut,		class SS42I_crc32m<bits<8> opc, string asm, RegisterClass RCOut,
X86MemOperand x86memop, SDPatternOperator Int> :		X86MemOperand x86memop, SDPatternOperator Int> :
SS42FI<opc, MRMSrcMem, (outs RCOut:$dst), (ins RCOut:$src1, x86memop:$src2),		SS42FI<opc, MRMSrcMem, (outs RCOut:$dst), (ins RCOut:$src1, x86memop:$src2),
!strconcat(asm, "\t{$src2, $src1\|$src1, $src2}"),		!strconcat(asm, "\t{$src2, $src1\|$src1, $src2}"),
[(set RCOut:$dst, (Int RCOut:$src1, (load addr:$src2)))]>,		[(set RCOut:$dst, (Int RCOut:$src1, (load addr:$src2)))]>,
Sched<[WriteCRC32.Folded, ReadAfterLd]>;		Sched<[WriteCRC32.Folded, WriteCRC32.ReadAfterFold]>;

let Constraints = "$src1 = $dst" in {		let Constraints = "$src1 = $dst" in {
def CRC32r32m8 : SS42I_crc32m<0xF0, "crc32{b}", GR32, i8mem,		def CRC32r32m8 : SS42I_crc32m<0xF0, "crc32{b}", GR32, i8mem,
int_x86_sse42_crc32_32_8>;		int_x86_sse42_crc32_32_8>;
def CRC32r32r8 : SS42I_crc32r<0xF0, "crc32{b}", GR32, GR8,		def CRC32r32r8 : SS42I_crc32r<0xF0, "crc32{b}", GR32, GR8,
int_x86_sse42_crc32_32_8>;		int_x86_sse42_crc32_32_8>;
def CRC32r32m16 : SS42I_crc32m<0xF1, "crc32{w}", GR32, i16mem,		def CRC32r32m16 : SS42I_crc32m<0xF1, "crc32{w}", GR32, i16mem,
int_x86_sse42_crc32_32_16>, OpSize16;		int_x86_sse42_crc32_32_16>, OpSize16;
Show All 38 Lines	def rm : I<Opc, MRMSrcMem, (outs VR128:$dst),
!if(UsesXMM0,		!if(UsesXMM0,
!strconcat(OpcodeStr, "\t{%xmm0, $src2, $dst\|$dst, $src2, xmm0}"),		!strconcat(OpcodeStr, "\t{%xmm0, $src2, $dst\|$dst, $src2, xmm0}"),
!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}")),		!strconcat(OpcodeStr, "\t{$src2, $dst\|$dst, $src2}")),
[!if(UsesXMM0,		[!if(UsesXMM0,
(set VR128:$dst, (IntId VR128:$src1,		(set VR128:$dst, (IntId VR128:$src1,
(bc_v4i32 (memopv2i64 addr:$src2)), XMM0)),		(bc_v4i32 (memopv2i64 addr:$src2)), XMM0)),
(set VR128:$dst, (IntId VR128:$src1,		(set VR128:$dst, (IntId VR128:$src1,
(bc_v4i32 (memopv2i64 addr:$src2)))))]>, T8,		(bc_v4i32 (memopv2i64 addr:$src2)))))]>, T8,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let Constraints = "$src1 = $dst", Predicates = [HasSHA] in {		let Constraints = "$src1 = $dst", Predicates = [HasSHA] in {
def SHA1RNDS4rri : Ii8<0xCC, MRMSrcReg, (outs VR128:$dst),		def SHA1RNDS4rri : Ii8<0xCC, MRMSrcReg, (outs VR128:$dst),
(ins VR128:$src1, VR128:$src2, u8imm:$src3),		(ins VR128:$src1, VR128:$src2, u8imm:$src3),
"sha1rnds4\t{$src3, $src2, $dst\|$dst, $src2, $src3}",		"sha1rnds4\t{$src3, $src2, $dst\|$dst, $src2, $src3}",
[(set VR128:$dst,		[(set VR128:$dst,
(int_x86_sha1rnds4 VR128:$src1, VR128:$src2,		(int_x86_sha1rnds4 VR128:$src1, VR128:$src2,
(i8 imm:$src3)))]>, TA,		(i8 imm:$src3)))]>, TA,
Sched<[SchedWriteVecIMul.XMM]>;		Sched<[SchedWriteVecIMul.XMM]>;
def SHA1RNDS4rmi : Ii8<0xCC, MRMSrcMem, (outs VR128:$dst),		def SHA1RNDS4rmi : Ii8<0xCC, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, i128mem:$src2, u8imm:$src3),		(ins VR128:$src1, i128mem:$src2, u8imm:$src3),
"sha1rnds4\t{$src3, $src2, $dst\|$dst, $src2, $src3}",		"sha1rnds4\t{$src3, $src2, $dst\|$dst, $src2, $src3}",
[(set VR128:$dst,		[(set VR128:$dst,
(int_x86_sha1rnds4 VR128:$src1,		(int_x86_sha1rnds4 VR128:$src1,
(bc_v4i32 (memopv2i64 addr:$src2)),		(bc_v4i32 (memopv2i64 addr:$src2)),
(i8 imm:$src3)))]>, TA,		(i8 imm:$src3)))]>, TA,
Sched<[SchedWriteVecIMul.XMM.Folded, ReadAfterLd]>;		Sched<[SchedWriteVecIMul.XMM.Folded,
		SchedWriteVecIMul.XMM.ReadAfterFold]>;

defm SHA1NEXTE : SHAI_binop<0xC8, "sha1nexte", int_x86_sha1nexte,		defm SHA1NEXTE : SHAI_binop<0xC8, "sha1nexte", int_x86_sha1nexte,
SchedWriteVecIMul.XMM>;		SchedWriteVecIMul.XMM>;
defm SHA1MSG1 : SHAI_binop<0xC9, "sha1msg1", int_x86_sha1msg1,		defm SHA1MSG1 : SHAI_binop<0xC9, "sha1msg1", int_x86_sha1msg1,
SchedWriteVecIMul.XMM>;		SchedWriteVecIMul.XMM>;
defm SHA1MSG2 : SHAI_binop<0xCA, "sha1msg2", int_x86_sha1msg2,		defm SHA1MSG2 : SHAI_binop<0xCA, "sha1msg2", int_x86_sha1msg2,
SchedWriteVecIMul.XMM>;		SchedWriteVecIMul.XMM>;

Show All 26 Lines	let AsmString = OpcodeStr##
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}") in {		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}") in {
def rr : AES8I<opc, MRMSrcReg, (outs RC:$dst),		def rr : AES8I<opc, MRMSrcReg, (outs RC:$dst),
(ins RC:$src1, RC:$src2), "",		(ins RC:$src1, RC:$src2), "",
[(set RC:$dst, (IntId RC:$src1, RC:$src2))]>,		[(set RC:$dst, (IntId RC:$src1, RC:$src2))]>,
Sched<[WriteAESDecEnc]>;		Sched<[WriteAESDecEnc]>;
def rm : AES8I<opc, MRMSrcMem, (outs RC:$dst),		def rm : AES8I<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, MemOp:$src2), "",		(ins RC:$src1, MemOp:$src2), "",
[(set RC:$dst, (IntId RC:$src1, (ld_frag addr:$src2)))]>,		[(set RC:$dst, (IntId RC:$src1, (ld_frag addr:$src2)))]>,
Sched<[WriteAESDecEnc.Folded, ReadAfterLd]>;		Sched<[WriteAESDecEnc.Folded, WriteAESDecEnc.ReadAfterFold]>;
}		}
}		}

// Perform One Round of an AES Encryption/Decryption Flow		// Perform One Round of an AES Encryption/Decryption Flow
let Predicates = [HasAVX, NoVLX_Or_NoVAES, HasAES] in {		let Predicates = [HasAVX, NoVLX_Or_NoVAES, HasAES] in {
defm VAESENC : AESI_binop_rm_int<0xDC, "vaesenc",		defm VAESENC : AESI_binop_rm_int<0xDC, "vaesenc",
int_x86_aesni_aesenc, loadv2i64>, VEX_4V, VEX_WIG;		int_x86_aesni_aesenc, loadv2i64>, VEX_4V, VEX_WIG;
defm VAESENCLAST : AESI_binop_rm_int<0xDD, "vaesenclast",		defm VAESENCLAST : AESI_binop_rm_int<0xDD, "vaesenclast",
▲ Show 20 Lines • Show All 105 Lines • ▼ Show 20 Lines	def PCLMULQDQrr : PCLMULIi8<0x44, MRMSrcReg, (outs VR128:$dst),
Sched<[WriteCLMul]>;		Sched<[WriteCLMul]>;

def PCLMULQDQrm : PCLMULIi8<0x44, MRMSrcMem, (outs VR128:$dst),		def PCLMULQDQrm : PCLMULIi8<0x44, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, i128mem:$src2, u8imm:$src3),		(ins VR128:$src1, i128mem:$src2, u8imm:$src3),
"pclmulqdq\t{$src3, $src2, $dst\|$dst, $src2, $src3}",		"pclmulqdq\t{$src3, $src2, $dst\|$dst, $src2, $src3}",
[(set VR128:$dst,		[(set VR128:$dst,
(int_x86_pclmulqdq VR128:$src1, (memopv2i64 addr:$src2),		(int_x86_pclmulqdq VR128:$src1, (memopv2i64 addr:$src2),
imm:$src3))]>,		imm:$src3))]>,
Sched<[WriteCLMul.Folded, ReadAfterLd]>;		Sched<[WriteCLMul.Folded, WriteCLMul.ReadAfterFold]>;
} // Constraints = "$src1 = $dst"		} // Constraints = "$src1 = $dst"

def : Pat<(int_x86_pclmulqdq (memopv2i64 addr:$src2), VR128:$src1,		def : Pat<(int_x86_pclmulqdq (memopv2i64 addr:$src2), VR128:$src1,
(i8 imm:$src3)),		(i8 imm:$src3)),
(PCLMULQDQrm VR128:$src1, addr:$src2,		(PCLMULQDQrm VR128:$src1, addr:$src2,
(PCLMULCommuteImm imm:$src3))>;		(PCLMULCommuteImm imm:$src3))>;
} // Predicates = [NoAVX, HasPCLMUL]		} // Predicates = [NoAVX, HasPCLMUL]

Show All 19 Lines	def rr : PCLMULIi8<0x44, MRMSrcReg, (outs RC:$dst),
(IntId RC:$src1, RC:$src2, imm:$src3))]>,		(IntId RC:$src1, RC:$src2, imm:$src3))]>,
Sched<[WriteCLMul]>;		Sched<[WriteCLMul]>;

def rm : PCLMULIi8<0x44, MRMSrcMem, (outs RC:$dst),		def rm : PCLMULIi8<0x44, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, MemOp:$src2, u8imm:$src3),		(ins RC:$src1, MemOp:$src2, u8imm:$src3),
"vpclmulqdq\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",		"vpclmulqdq\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",
[(set RC:$dst,		[(set RC:$dst,
(IntId RC:$src1, (LdFrag addr:$src2), imm:$src3))]>,		(IntId RC:$src1, (LdFrag addr:$src2), imm:$src3))]>,
Sched<[WriteCLMul.Folded, ReadAfterLd]>;		Sched<[WriteCLMul.Folded, WriteCLMul.ReadAfterFold]>;

// We can commute a load in the first operand by swapping the sources and		// We can commute a load in the first operand by swapping the sources and
// rotating the immediate.		// rotating the immediate.
def : Pat<(IntId (LdFrag addr:$src2), RC:$src1, (i8 imm:$src3)),		def : Pat<(IntId (LdFrag addr:$src2), RC:$src1, (i8 imm:$src3)),
(!cast<Instruction>(NAME#"rm") RC:$src1, addr:$src2,		(!cast<Instruction>(NAME#"rm") RC:$src1, addr:$src2,
(PCLMULCommuteImm imm:$src3))>;		(PCLMULCommuteImm imm:$src3))>;
}		}

▲ Show 20 Lines • Show All 191 Lines • ▼ Show 20 Lines
def VINSERTF128rr : AVXAIi8<0x18, MRMSrcReg, (outs VR256:$dst),		def VINSERTF128rr : AVXAIi8<0x18, MRMSrcReg, (outs VR256:$dst),
(ins VR256:$src1, VR128:$src2, u8imm:$src3),		(ins VR256:$src1, VR128:$src2, u8imm:$src3),
"vinsertf128\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",		"vinsertf128\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",
[]>, Sched<[WriteFShuffle256]>, VEX_4V, VEX_L;		[]>, Sched<[WriteFShuffle256]>, VEX_4V, VEX_L;
let mayLoad = 1 in		let mayLoad = 1 in
def VINSERTF128rm : AVXAIi8<0x18, MRMSrcMem, (outs VR256:$dst),		def VINSERTF128rm : AVXAIi8<0x18, MRMSrcMem, (outs VR256:$dst),
(ins VR256:$src1, f128mem:$src2, u8imm:$src3),		(ins VR256:$src1, f128mem:$src2, u8imm:$src3),
"vinsertf128\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",		"vinsertf128\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",
[]>, Sched<[WriteFShuffle256Ld, ReadAfterLd]>, VEX_4V, VEX_L;		[]>, Sched<[WriteFShuffle256.Folded, WriteFShuffle256.ReadAfterFold]>, VEX_4V, VEX_L;
}		}

// To create a 256-bit all ones value, we should produce VCMPTRUEPS		// To create a 256-bit all ones value, we should produce VCMPTRUEPS
// with YMM register containing zero.		// with YMM register containing zero.
// FIXME: Avoid producing vxorps to clear the fake inputs.		// FIXME: Avoid producing vxorps to clear the fake inputs.
let Predicates = [HasAVX1Only] in {		let Predicates = [HasAVX1Only] in {
def : Pat<(v8i32 immAllOnesV), (VCMPPSYrri (AVX_SET0), (AVX_SET0), 0xf)>;		def : Pat<(v8i32 immAllOnesV), (VCMPPSYrri (AVX_SET0), (AVX_SET0), 0xf)>;
}		}
▲ Show 20 Lines • Show All 119 Lines • ▼ Show 20 Lines	def rr : AVX8I<opc_rm, MRMSrcReg, (outs RC:$dst),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set RC:$dst, (f_vt (X86VPermilpv RC:$src1, (i_vt RC:$src2))))]>, VEX_4V,		[(set RC:$dst, (f_vt (X86VPermilpv RC:$src1, (i_vt RC:$src2))))]>, VEX_4V,
Sched<[varsched]>;		Sched<[varsched]>;
def rm : AVX8I<opc_rm, MRMSrcMem, (outs RC:$dst),		def rm : AVX8I<opc_rm, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop_i:$src2),		(ins RC:$src1, x86memop_i:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set RC:$dst, (f_vt (X86VPermilpv RC:$src1,		[(set RC:$dst, (f_vt (X86VPermilpv RC:$src1,
(i_vt (bitconvert (i_frag addr:$src2))))))]>, VEX_4V,		(i_vt (bitconvert (i_frag addr:$src2))))))]>, VEX_4V,
Sched<[varsched.Folded, ReadAfterLd]>;		Sched<[varsched.Folded, sched.ReadAfterFold]>;

def ri : AVXAIi8<opc_rmi, MRMSrcReg, (outs RC:$dst),		def ri : AVXAIi8<opc_rmi, MRMSrcReg, (outs RC:$dst),
(ins RC:$src1, u8imm:$src2),		(ins RC:$src1, u8imm:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set RC:$dst, (f_vt (X86VPermilpi RC:$src1, (i8 imm:$src2))))]>, VEX,		[(set RC:$dst, (f_vt (X86VPermilpi RC:$src1, (i8 imm:$src2))))]>, VEX,
Sched<[sched]>;		Sched<[sched]>;
def mi : AVXAIi8<opc_rmi, MRMSrcMem, (outs RC:$dst),		def mi : AVXAIi8<opc_rmi, MRMSrcMem, (outs RC:$dst),
(ins x86memop_f:$src1, u8imm:$src2),		(ins x86memop_f:$src1, u8imm:$src2),
Show All 33 Lines	def VPERM2F128rr : AVXAIi8<0x06, MRMSrcReg, (outs VR256:$dst),
[(set VR256:$dst, (v4f64 (X86VPerm2x128 VR256:$src1, VR256:$src2,		[(set VR256:$dst, (v4f64 (X86VPerm2x128 VR256:$src1, VR256:$src2,
(i8 imm:$src3))))]>, VEX_4V, VEX_L,		(i8 imm:$src3))))]>, VEX_4V, VEX_L,
Sched<[WriteFShuffle256]>;		Sched<[WriteFShuffle256]>;
def VPERM2F128rm : AVXAIi8<0x06, MRMSrcMem, (outs VR256:$dst),		def VPERM2F128rm : AVXAIi8<0x06, MRMSrcMem, (outs VR256:$dst),
(ins VR256:$src1, f256mem:$src2, u8imm:$src3),		(ins VR256:$src1, f256mem:$src2, u8imm:$src3),
"vperm2f128\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",		"vperm2f128\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",
[(set VR256:$dst, (X86VPerm2x128 VR256:$src1, (loadv4f64 addr:$src2),		[(set VR256:$dst, (X86VPerm2x128 VR256:$src1, (loadv4f64 addr:$src2),
(i8 imm:$src3)))]>, VEX_4V, VEX_L,		(i8 imm:$src3)))]>, VEX_4V, VEX_L,
Sched<[WriteFShuffle256Ld, ReadAfterLd]>;		Sched<[WriteFShuffle256.Folded, WriteFShuffle256.ReadAfterFold]>;
}		}

// Immediate transform to help with commuting.		// Immediate transform to help with commuting.
def Perm2XCommuteImm : SDNodeXForm<imm, [{		def Perm2XCommuteImm : SDNodeXForm<imm, [{
return getI8Imm(N->getZExtValue() ^ 0x22, SDLoc(N));		return getI8Imm(N->getZExtValue() ^ 0x22, SDLoc(N));
}]>;		}]>;

let Predicates = [HasAVX] in {		let Predicates = [HasAVX] in {
▲ Show 20 Lines • Show All 134 Lines • ▼ Show 20 Lines	def rri : AVX2AIi8<opc, MRMSrcReg, (outs RC:$dst),
Sched<[sched]>, VEX_4V;		Sched<[sched]>, VEX_4V;
def rmi : AVX2AIi8<opc, MRMSrcMem, (outs RC:$dst),		def rmi : AVX2AIi8<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop:$src2, u8imm:$src3),		(ins RC:$src1, x86memop:$src2, u8imm:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[(set RC:$dst,		[(set RC:$dst,
(OpVT (OpNode RC:$src1,		(OpVT (OpNode RC:$src1,
(bitconvert (memop_frag addr:$src2)), imm:$src3)))]>,		(bitconvert (memop_frag addr:$src2)), imm:$src3)))]>,
Sched<[sched.Folded, ReadAfterLd]>, VEX_4V;		Sched<[sched.Folded, sched.ReadAfterFold]>, VEX_4V;

// Pattern to commute if load is in first source.		// Pattern to commute if load is in first source.
def : Pat<(OpVT (OpNode (bitconvert (memop_frag addr:$src2)),		def : Pat<(OpVT (OpNode (bitconvert (memop_frag addr:$src2)),
RC:$src1, imm:$src3)),		RC:$src1, imm:$src3)),
(!cast<Instruction>(NAME#"rmi") RC:$src1, addr:$src2,		(!cast<Instruction>(NAME#"rmi") RC:$src1, addr:$src2,
(commuteXForm imm:$src3))>;		(commuteXForm imm:$src3))>;
}		}

▲ Show 20 Lines • Show All 248 Lines • ▼ Show 20 Lines	def Yrr : AVX28I<opc, MRMSrcReg, (outs VR256:$dst),
Sched<[Sched]>, VEX_4V, VEX_L;		Sched<[Sched]>, VEX_4V, VEX_L;
def Yrm : AVX28I<opc, MRMSrcMem, (outs VR256:$dst),		def Yrm : AVX28I<opc, MRMSrcMem, (outs VR256:$dst),
(ins VR256:$src1, memOp:$src2),		(ins VR256:$src1, memOp:$src2),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR256:$dst,		[(set VR256:$dst,
(OpVT (X86VPermv VR256:$src1,		(OpVT (X86VPermv VR256:$src1,
(bitconvert (mem_frag addr:$src2)))))]>,		(bitconvert (mem_frag addr:$src2)))))]>,
Sched<[Sched.Folded, ReadAfterLd]>, VEX_4V, VEX_L;		Sched<[Sched.Folded, Sched.ReadAfterFold]>, VEX_4V, VEX_L;
}		}
}		}

defm VPERMD : avx2_perm<0x36, "vpermd", loadv4i64, v8i32, WriteVarShuffle256,		defm VPERMD : avx2_perm<0x36, "vpermd", loadv4i64, v8i32, WriteVarShuffle256,
i256mem>;		i256mem>;
let ExeDomain = SSEPackedSingle in		let ExeDomain = SSEPackedSingle in
defm VPERMPS : avx2_perm<0x16, "vpermps", loadv8f32, v8f32, WriteFVarShuffle256,		defm VPERMPS : avx2_perm<0x16, "vpermps", loadv8f32, v8f32, WriteFVarShuffle256,
f256mem>;		f256mem>;
Show All 11 Lines	def Yri : AVX2AIi8<opc, MRMSrcReg, (outs VR256:$dst),
Sched<[Sched]>, VEX, VEX_L;		Sched<[Sched]>, VEX, VEX_L;
def Ymi : AVX2AIi8<opc, MRMSrcMem, (outs VR256:$dst),		def Ymi : AVX2AIi8<opc, MRMSrcMem, (outs VR256:$dst),
(ins memOp:$src1, u8imm:$src2),		(ins memOp:$src1, u8imm:$src2),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR256:$dst,		[(set VR256:$dst,
(OpVT (X86VPermi (mem_frag addr:$src1),		(OpVT (X86VPermi (mem_frag addr:$src1),
(i8 imm:$src2))))]>,		(i8 imm:$src2))))]>,
Sched<[Sched.Folded, ReadAfterLd]>, VEX, VEX_L;		Sched<[Sched.Folded, Sched.ReadAfterFold]>, VEX, VEX_L;
}		}
}		}

defm VPERMQ : avx2_perm_imm<0x00, "vpermq", loadv4i64, v4i64,		defm VPERMQ : avx2_perm_imm<0x00, "vpermq", loadv4i64, v4i64,
WriteShuffle256, i256mem>, VEX_W;		WriteShuffle256, i256mem>, VEX_W;
let ExeDomain = SSEPackedDouble in		let ExeDomain = SSEPackedDouble in
defm VPERMPD : avx2_perm_imm<0x01, "vpermpd", loadv4f64, v4f64,		defm VPERMPD : avx2_perm_imm<0x01, "vpermpd", loadv4f64, v4f64,
WriteFShuffle256, f256mem>, VEX_W;		WriteFShuffle256, f256mem>, VEX_W;

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// VPERM2I128 - Permute Floating-Point Values in 128-bit chunks		// VPERM2I128 - Permute Floating-Point Values in 128-bit chunks
//		//
let isCommutable = 1 in		let isCommutable = 1 in
def VPERM2I128rr : AVX2AIi8<0x46, MRMSrcReg, (outs VR256:$dst),		def VPERM2I128rr : AVX2AIi8<0x46, MRMSrcReg, (outs VR256:$dst),
(ins VR256:$src1, VR256:$src2, u8imm:$src3),		(ins VR256:$src1, VR256:$src2, u8imm:$src3),
"vperm2i128\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",		"vperm2i128\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",
[(set VR256:$dst, (v4i64 (X86VPerm2x128 VR256:$src1, VR256:$src2,		[(set VR256:$dst, (v4i64 (X86VPerm2x128 VR256:$src1, VR256:$src2,
(i8 imm:$src3))))]>, Sched<[WriteShuffle256]>,		(i8 imm:$src3))))]>, Sched<[WriteShuffle256]>,
VEX_4V, VEX_L;		VEX_4V, VEX_L;
def VPERM2I128rm : AVX2AIi8<0x46, MRMSrcMem, (outs VR256:$dst),		def VPERM2I128rm : AVX2AIi8<0x46, MRMSrcMem, (outs VR256:$dst),
(ins VR256:$src1, f256mem:$src2, u8imm:$src3),		(ins VR256:$src1, f256mem:$src2, u8imm:$src3),
"vperm2i128\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",		"vperm2i128\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",
[(set VR256:$dst, (X86VPerm2x128 VR256:$src1, (loadv4i64 addr:$src2),		[(set VR256:$dst, (X86VPerm2x128 VR256:$src1, (loadv4i64 addr:$src2),
(i8 imm:$src3)))]>,		(i8 imm:$src3)))]>,
Sched<[WriteShuffle256Ld, ReadAfterLd]>, VEX_4V, VEX_L;		Sched<[WriteShuffle256.Folded, WriteShuffle256.ReadAfterFold]>, VEX_4V, VEX_L;

let Predicates = [HasAVX2] in		let Predicates = [HasAVX2] in
def : Pat<(v4i64 (X86VPerm2x128 (loadv4i64 addr:$src2),		def : Pat<(v4i64 (X86VPerm2x128 (loadv4i64 addr:$src2),
VR256:$src1, (i8 imm:$imm))),		VR256:$src1, (i8 imm:$imm))),
(VPERM2I128rm VR256:$src1, addr:$src2, (Perm2XCommuteImm imm:$imm))>;		(VPERM2I128rm VR256:$src1, addr:$src2, (Perm2XCommuteImm imm:$imm))>;


//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// VINSERTI128 - Insert packed integer values		// VINSERTI128 - Insert packed integer values
//		//
let hasSideEffects = 0 in {		let hasSideEffects = 0 in {
def VINSERTI128rr : AVX2AIi8<0x38, MRMSrcReg, (outs VR256:$dst),		def VINSERTI128rr : AVX2AIi8<0x38, MRMSrcReg, (outs VR256:$dst),
(ins VR256:$src1, VR128:$src2, u8imm:$src3),		(ins VR256:$src1, VR128:$src2, u8imm:$src3),
"vinserti128\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",		"vinserti128\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",
[]>, Sched<[WriteShuffle256]>, VEX_4V, VEX_L;		[]>, Sched<[WriteShuffle256]>, VEX_4V, VEX_L;
let mayLoad = 1 in		let mayLoad = 1 in
def VINSERTI128rm : AVX2AIi8<0x38, MRMSrcMem, (outs VR256:$dst),		def VINSERTI128rm : AVX2AIi8<0x38, MRMSrcMem, (outs VR256:$dst),
(ins VR256:$src1, i128mem:$src2, u8imm:$src3),		(ins VR256:$src1, i128mem:$src2, u8imm:$src3),
"vinserti128\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",		"vinserti128\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",
[]>, Sched<[WriteShuffle256Ld, ReadAfterLd]>, VEX_4V, VEX_L;		[]>, Sched<[WriteShuffle256.Folded, WriteShuffle256.ReadAfterFold]>, VEX_4V, VEX_L;
}		}

let Predicates = [HasAVX2, NoVLX] in {		let Predicates = [HasAVX2, NoVLX] in {
defm : vinsert_lowering<"VINSERTI128", v2i64, v4i64, loadv2i64>;		defm : vinsert_lowering<"VINSERTI128", v2i64, v4i64, loadv2i64>;
defm : vinsert_lowering<"VINSERTI128", v4i32, v8i32, loadv2i64>;		defm : vinsert_lowering<"VINSERTI128", v4i32, v8i32, loadv2i64>;
defm : vinsert_lowering<"VINSERTI128", v8i16, v16i16, loadv2i64>;		defm : vinsert_lowering<"VINSERTI128", v8i16, v16i16, loadv2i64>;
defm : vinsert_lowering<"VINSERTI128", v16i8, v32i8, loadv2i64>;		defm : vinsert_lowering<"VINSERTI128", v16i8, v32i8, loadv2i64>;
}		}
▲ Show 20 Lines • Show All 150 Lines • ▼ Show 20 Lines	def rr : AVX28I<opc, MRMSrcReg, (outs VR128:$dst),
(vt128 (OpNode VR128:$src1, (vt128 VR128:$src2))))]>,		(vt128 (OpNode VR128:$src1, (vt128 VR128:$src2))))]>,
VEX_4V, Sched<[SchedWriteVarVecShift.XMM]>;		VEX_4V, Sched<[SchedWriteVarVecShift.XMM]>;
def rm : AVX28I<opc, MRMSrcMem, (outs VR128:$dst),		def rm : AVX28I<opc, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, i128mem:$src2),		(ins VR128:$src1, i128mem:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR128:$dst,		[(set VR128:$dst,
(vt128 (OpNode VR128:$src1,		(vt128 (OpNode VR128:$src1,
(vt128 (bitconvert (loadv2i64 addr:$src2))))))]>,		(vt128 (bitconvert (loadv2i64 addr:$src2))))))]>,
VEX_4V, Sched<[SchedWriteVarVecShift.XMM.Folded, ReadAfterLd]>;		VEX_4V, Sched<[SchedWriteVarVecShift.XMM.Folded,
		SchedWriteVarVecShift.XMM.ReadAfterFold]>;
def Yrr : AVX28I<opc, MRMSrcReg, (outs VR256:$dst),		def Yrr : AVX28I<opc, MRMSrcReg, (outs VR256:$dst),
(ins VR256:$src1, VR256:$src2),		(ins VR256:$src1, VR256:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR256:$dst,		[(set VR256:$dst,
(vt256 (OpNode VR256:$src1, (vt256 VR256:$src2))))]>,		(vt256 (OpNode VR256:$src1, (vt256 VR256:$src2))))]>,
VEX_4V, VEX_L, Sched<[SchedWriteVarVecShift.YMM]>;		VEX_4V, VEX_L, Sched<[SchedWriteVarVecShift.YMM]>;
def Yrm : AVX28I<opc, MRMSrcMem, (outs VR256:$dst),		def Yrm : AVX28I<opc, MRMSrcMem, (outs VR256:$dst),
(ins VR256:$src1, i256mem:$src2),		(ins VR256:$src1, i256mem:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR256:$dst,		[(set VR256:$dst,
(vt256 (OpNode VR256:$src1,		(vt256 (OpNode VR256:$src1,
(vt256 (bitconvert (loadv4i64 addr:$src2))))))]>,		(vt256 (bitconvert (loadv4i64 addr:$src2))))))]>,
VEX_4V, VEX_L, Sched<[SchedWriteVarVecShift.YMM.Folded, ReadAfterLd]>;		VEX_4V, VEX_L, Sched<[SchedWriteVarVecShift.YMM.Folded,
		SchedWriteVarVecShift.YMM.ReadAfterFold]>;
}		}

let Predicates = [HasAVX2, NoVLX] in {		let Predicates = [HasAVX2, NoVLX] in {
defm VPSLLVD : avx2_var_shift<0x47, "vpsllvd", shl, v4i32, v8i32>;		defm VPSLLVD : avx2_var_shift<0x47, "vpsllvd", shl, v4i32, v8i32>;
defm VPSLLVQ : avx2_var_shift<0x47, "vpsllvq", shl, v2i64, v4i64>, VEX_W;		defm VPSLLVQ : avx2_var_shift<0x47, "vpsllvq", shl, v2i64, v4i64>, VEX_W;
defm VPSRLVD : avx2_var_shift<0x45, "vpsrlvd", srl, v4i32, v8i32>;		defm VPSRLVD : avx2_var_shift<0x45, "vpsrlvd", srl, v4i32, v8i32>;
defm VPSRLVQ : avx2_var_shift<0x45, "vpsrlvq", srl, v2i64, v4i64>, VEX_W;		defm VPSRLVQ : avx2_var_shift<0x45, "vpsrlvq", srl, v2i64, v4i64>, VEX_W;
defm VPSRAVD : avx2_var_shift<0x46, "vpsravd", sra, v4i32, v8i32>;		defm VPSRAVD : avx2_var_shift<0x46, "vpsravd", sra, v4i32, v8i32>;
▲ Show 20 Lines • Show All 84 Lines • ▼ Show 20 Lines	let ExeDomain = SSEPackedInt,
let isCommutable = 1 in		let isCommutable = 1 in
def rr : PDI<0xCF, MRMSrcReg, (outs RC:$dst), (ins RC:$src1, RC:$src2), "",		def rr : PDI<0xCF, MRMSrcReg, (outs RC:$dst), (ins RC:$src1, RC:$src2), "",
[(set RC:$dst, (OpVT (X86GF2P8mulb RC:$src1, RC:$src2)))]>,		[(set RC:$dst, (OpVT (X86GF2P8mulb RC:$src1, RC:$src2)))]>,
Sched<[SchedWriteVecALU.XMM]>, T8PD;		Sched<[SchedWriteVecALU.XMM]>, T8PD;

def rm : PDI<0xCF, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, X86MemOp:$src2), "",		def rm : PDI<0xCF, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, X86MemOp:$src2), "",
[(set RC:$dst, (OpVT (X86GF2P8mulb RC:$src1,		[(set RC:$dst, (OpVT (X86GF2P8mulb RC:$src1,
(bitconvert (MemOpFrag addr:$src2)))))]>,		(bitconvert (MemOpFrag addr:$src2)))))]>,
Sched<[SchedWriteVecALU.XMM.Folded, ReadAfterLd]>, T8PD;		Sched<[SchedWriteVecALU.XMM.Folded, SchedWriteVecALU.XMM.ReadAfterFold]>, T8PD;
}		}
}		}

multiclass GF2P8AFFINE_rmi<bits<8> Op, string OpStr, ValueType OpVT,		multiclass GF2P8AFFINE_rmi<bits<8> Op, string OpStr, ValueType OpVT,
SDNode OpNode, RegisterClass RC, PatFrag MemOpFrag,		SDNode OpNode, RegisterClass RC, PatFrag MemOpFrag,
X86MemOperand X86MemOp, bit Is2Addr = 0> {		X86MemOperand X86MemOp, bit Is2Addr = 0> {
let AsmString = !if(Is2Addr,		let AsmString = !if(Is2Addr,
OpStr##"\t{$src3, $src2, $dst\|$dst, $src2, $src3}",		OpStr##"\t{$src3, $src2, $dst\|$dst, $src2, $src3}",
OpStr##"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}") in {		OpStr##"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}") in {
def rri : Ii8<Op, MRMSrcReg, (outs RC:$dst),		def rri : Ii8<Op, MRMSrcReg, (outs RC:$dst),
(ins RC:$src1, RC:$src2, u8imm:$src3), "",		(ins RC:$src1, RC:$src2, u8imm:$src3), "",
[(set RC:$dst, (OpVT (OpNode RC:$src1, RC:$src2, imm:$src3)))],		[(set RC:$dst, (OpVT (OpNode RC:$src1, RC:$src2, imm:$src3)))],
SSEPackedInt>, Sched<[SchedWriteVecALU.XMM]>;		SSEPackedInt>, Sched<[SchedWriteVecALU.XMM]>;
def rmi : Ii8<Op, MRMSrcMem, (outs RC:$dst),		def rmi : Ii8<Op, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, X86MemOp:$src2, u8imm:$src3), "",		(ins RC:$src1, X86MemOp:$src2, u8imm:$src3), "",
[(set RC:$dst, (OpVT (OpNode RC:$src1,		[(set RC:$dst, (OpVT (OpNode RC:$src1,
(bitconvert (MemOpFrag addr:$src2)),		(bitconvert (MemOpFrag addr:$src2)),
imm:$src3)))], SSEPackedInt>,		imm:$src3)))], SSEPackedInt>,
Sched<[SchedWriteVecALU.XMM.Folded, ReadAfterLd]>;		Sched<[SchedWriteVecALU.XMM.Folded, SchedWriteVecALU.XMM.ReadAfterFold]>;
}		}
}		}

multiclass GF2P8AFFINE_common<bits<8> Op, string OpStr, SDNode OpNode> {		multiclass GF2P8AFFINE_common<bits<8> Op, string OpStr, SDNode OpNode> {
let Constraints = "$src1 = $dst",		let Constraints = "$src1 = $dst",
Predicates = [HasGFNI, UseSSE2] in		Predicates = [HasGFNI, UseSSE2] in
defm NAME : GF2P8AFFINE_rmi<Op, OpStr, v16i8, OpNode,		defm NAME : GF2P8AFFINE_rmi<Op, OpStr, v16i8, OpNode,
VR128, loadv2i64, i128mem, 1>;		VR128, loadv2i64, i128mem, 1>;
Show All 27 Lines

lib/Target/X86/X86InstrShiftRotate.td

	Show First 20 Lines • Show All 844 Lines • ▼ Show 20 Lines
	let hasSideEffects = 0 in {			let hasSideEffects = 0 in {
	def rr : I<0xF7, MRMSrcReg4VOp3, (outs RC:$dst), (ins RC:$src1, RC:$src2),			def rr : I<0xF7, MRMSrcReg4VOp3, (outs RC:$dst), (ins RC:$src1, RC:$src2),
	!strconcat(asm, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"), []>,			!strconcat(asm, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"), []>,
	VEX, Sched<[WriteShift]>;			VEX, Sched<[WriteShift]>;
	let mayLoad = 1 in			let mayLoad = 1 in
	def rm : I<0xF7, MRMSrcMem4VOp3,			def rm : I<0xF7, MRMSrcMem4VOp3,
	(outs RC:$dst), (ins x86memop:$src1, RC:$src2),			(outs RC:$dst), (ins x86memop:$src1, RC:$src2),
	!strconcat(asm, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"), []>,			!strconcat(asm, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"), []>,
	VEX, Sched<[WriteShiftLd,			VEX, Sched<[WriteShift.Folded,
	// x86memop:$src1			// x86memop:$src1
	ReadDefault, ReadDefault, ReadDefault, ReadDefault,			ReadDefault, ReadDefault, ReadDefault, ReadDefault,
	ReadDefault,			ReadDefault,
	// RC:$src2			// RC:$src2
	ReadAfterLd]>;			WriteShift.ReadAfterFold]>;
	}			}
	}			}

	let Predicates = [HasBMI2] in {			let Predicates = [HasBMI2] in {
	defm RORX32 : bmi_rotate<"rorx{l}", GR32, i32mem>;			defm RORX32 : bmi_rotate<"rorx{l}", GR32, i32mem>;
	defm RORX64 : bmi_rotate<"rorx{q}", GR64, i64mem>, VEX_W;			defm RORX64 : bmi_rotate<"rorx{q}", GR64, i64mem>, VEX_W;
	defm SARX32 : bmi_shift<"sarx{l}", GR32, i32mem>, T8XS;			defm SARX32 : bmi_shift<"sarx{l}", GR32, i32mem>, T8XS;
	defm SARX64 : bmi_shift<"sarx{q}", GR64, i64mem>, T8XS, VEX_W;			defm SARX64 : bmi_shift<"sarx{q}", GR64, i64mem>, T8XS, VEX_W;
	▲ Show 20 Lines • Show All 97 Lines • Show Last 20 Lines

lib/Target/X86/X86InstrXOP.td

Show All 12 Lines

multiclass xop2op<bits<8> opc, string OpcodeStr, Intrinsic Int, PatFrag memop> {		multiclass xop2op<bits<8> opc, string OpcodeStr, Intrinsic Int, PatFrag memop> {
def rr : IXOP<opc, MRMSrcReg, (outs VR128:$dst), (ins VR128:$src),		def rr : IXOP<opc, MRMSrcReg, (outs VR128:$dst), (ins VR128:$src),
!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),		!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),
[(set VR128:$dst, (Int VR128:$src))]>, XOP, Sched<[SchedWritePHAdd.XMM]>;		[(set VR128:$dst, (Int VR128:$src))]>, XOP, Sched<[SchedWritePHAdd.XMM]>;
def rm : IXOP<opc, MRMSrcMem, (outs VR128:$dst), (ins i128mem:$src),		def rm : IXOP<opc, MRMSrcMem, (outs VR128:$dst), (ins i128mem:$src),
!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),		!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),
[(set VR128:$dst, (Int (bitconvert (memop addr:$src))))]>, XOP,		[(set VR128:$dst, (Int (bitconvert (memop addr:$src))))]>, XOP,
Sched<[SchedWritePHAdd.XMM.Folded, ReadAfterLd]>;		Sched<[SchedWritePHAdd.XMM.Folded, SchedWritePHAdd.XMM.ReadAfterFold]>;
}		}

let ExeDomain = SSEPackedInt in {		let ExeDomain = SSEPackedInt in {
defm VPHSUBWD : xop2op<0xE2, "vphsubwd", int_x86_xop_vphsubwd, loadv2i64>;		defm VPHSUBWD : xop2op<0xE2, "vphsubwd", int_x86_xop_vphsubwd, loadv2i64>;
defm VPHSUBDQ : xop2op<0xE3, "vphsubdq", int_x86_xop_vphsubdq, loadv2i64>;		defm VPHSUBDQ : xop2op<0xE3, "vphsubdq", int_x86_xop_vphsubdq, loadv2i64>;
defm VPHSUBBW : xop2op<0xE1, "vphsubbw", int_x86_xop_vphsubbw, loadv2i64>;		defm VPHSUBBW : xop2op<0xE1, "vphsubbw", int_x86_xop_vphsubbw, loadv2i64>;
defm VPHADDWQ : xop2op<0xC7, "vphaddwq", int_x86_xop_vphaddwq, loadv2i64>;		defm VPHADDWQ : xop2op<0xC7, "vphaddwq", int_x86_xop_vphaddwq, loadv2i64>;
defm VPHADDWD : xop2op<0xC6, "vphaddwd", int_x86_xop_vphaddwd, loadv2i64>;		defm VPHADDWD : xop2op<0xC6, "vphaddwd", int_x86_xop_vphaddwd, loadv2i64>;
Show All 14 Lines	multiclass xop2opsld<bits<8> opc, string OpcodeStr, Intrinsic Int,
Operand memop, ComplexPattern mem_cpat,		Operand memop, ComplexPattern mem_cpat,
X86FoldableSchedWrite sched> {		X86FoldableSchedWrite sched> {
def rr : IXOP<opc, MRMSrcReg, (outs VR128:$dst), (ins VR128:$src),		def rr : IXOP<opc, MRMSrcReg, (outs VR128:$dst), (ins VR128:$src),
!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),		!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),
[(set VR128:$dst, (Int VR128:$src))]>, XOP, Sched<[sched]>;		[(set VR128:$dst, (Int VR128:$src))]>, XOP, Sched<[sched]>;
def rm : IXOP<opc, MRMSrcMem, (outs VR128:$dst), (ins memop:$src),		def rm : IXOP<opc, MRMSrcMem, (outs VR128:$dst), (ins memop:$src),
!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),		!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),
[(set VR128:$dst, (Int (bitconvert mem_cpat:$src)))]>, XOP,		[(set VR128:$dst, (Int (bitconvert mem_cpat:$src)))]>, XOP,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass xop2op128<bits<8> opc, string OpcodeStr, Intrinsic Int,		multiclass xop2op128<bits<8> opc, string OpcodeStr, Intrinsic Int,
PatFrag memop, X86FoldableSchedWrite sched> {		PatFrag memop, X86FoldableSchedWrite sched> {
def rr : IXOP<opc, MRMSrcReg, (outs VR128:$dst), (ins VR128:$src),		def rr : IXOP<opc, MRMSrcReg, (outs VR128:$dst), (ins VR128:$src),
!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),		!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),
[(set VR128:$dst, (Int VR128:$src))]>, XOP, Sched<[sched]>;		[(set VR128:$dst, (Int VR128:$src))]>, XOP, Sched<[sched]>;
def rm : IXOP<opc, MRMSrcMem, (outs VR128:$dst), (ins f128mem:$src),		def rm : IXOP<opc, MRMSrcMem, (outs VR128:$dst), (ins f128mem:$src),
!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),		!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),
[(set VR128:$dst, (Int (bitconvert (memop addr:$src))))]>, XOP,		[(set VR128:$dst, (Int (bitconvert (memop addr:$src))))]>, XOP,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

multiclass xop2op256<bits<8> opc, string OpcodeStr, Intrinsic Int,		multiclass xop2op256<bits<8> opc, string OpcodeStr, Intrinsic Int,
PatFrag memop, X86FoldableSchedWrite sched> {		PatFrag memop, X86FoldableSchedWrite sched> {
def Yrr : IXOP<opc, MRMSrcReg, (outs VR256:$dst), (ins VR256:$src),		def Yrr : IXOP<opc, MRMSrcReg, (outs VR256:$dst), (ins VR256:$src),
!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),		!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),
[(set VR256:$dst, (Int VR256:$src))]>, XOP, VEX_L, Sched<[sched]>;		[(set VR256:$dst, (Int VR256:$src))]>, XOP, VEX_L, Sched<[sched]>;
def Yrm : IXOP<opc, MRMSrcMem, (outs VR256:$dst), (ins f256mem:$src),		def Yrm : IXOP<opc, MRMSrcMem, (outs VR256:$dst), (ins f256mem:$src),
!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),		!strconcat(OpcodeStr, "\t{$src, $dst\|$dst, $src}"),
[(set VR256:$dst, (Int (bitconvert (memop addr:$src))))]>, XOP, VEX_L,		[(set VR256:$dst, (Int (bitconvert (memop addr:$src))))]>, XOP, VEX_L,
Sched<[sched.Folded, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let ExeDomain = SSEPackedSingle in {		let ExeDomain = SSEPackedSingle in {
defm VFRCZSS : xop2opsld<0x82, "vfrczss", int_x86_xop_vfrcz_ss,		defm VFRCZSS : xop2opsld<0x82, "vfrczss", int_x86_xop_vfrcz_ss,
ssmem, sse_load_f32, SchedWriteFRnd.Scl>;		ssmem, sse_load_f32, SchedWriteFRnd.Scl>;
defm VFRCZPS : xop2op128<0x80, "vfrczps", int_x86_xop_vfrcz_ps, loadv4f32,		defm VFRCZPS : xop2op128<0x80, "vfrczps", int_x86_xop_vfrcz_ps, loadv4f32,
SchedWriteFRnd.XMM>;		SchedWriteFRnd.XMM>;
defm VFRCZPS : xop2op256<0x80, "vfrczps", int_x86_xop_vfrcz_ps_256, loadv8f32,		defm VFRCZPS : xop2op256<0x80, "vfrczps", int_x86_xop_vfrcz_ps_256, loadv8f32,
Show All 18 Lines	def rr : IXOP<opc, MRMSrcReg4VOp3, (outs VR128:$dst),
(vt128 (OpNode (vt128 VR128:$src1), (vt128 VR128:$src2))))]>,		(vt128 (OpNode (vt128 VR128:$src1), (vt128 VR128:$src2))))]>,
XOP, Sched<[sched]>;		XOP, Sched<[sched]>;
def rm : IXOP<opc, MRMSrcMem, (outs VR128:$dst),		def rm : IXOP<opc, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, i128mem:$src2),		(ins VR128:$src1, i128mem:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR128:$dst,		[(set VR128:$dst,
(vt128 (OpNode (vt128 VR128:$src1),		(vt128 (OpNode (vt128 VR128:$src1),
(vt128 (bitconvert (loadv2i64 addr:$src2))))))]>,		(vt128 (bitconvert (loadv2i64 addr:$src2))))))]>,
XOP_4V, VEX_W, Sched<[sched.Folded, ReadAfterLd]>;		XOP_4V, VEX_W, Sched<[sched.Folded, sched.ReadAfterFold]>;
def mr : IXOP<opc, MRMSrcMem4VOp3, (outs VR128:$dst),		def mr : IXOP<opc, MRMSrcMem4VOp3, (outs VR128:$dst),
(ins i128mem:$src1, VR128:$src2),		(ins i128mem:$src1, VR128:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR128:$dst,		[(set VR128:$dst,
(vt128 (OpNode (vt128 (bitconvert (loadv2i64 addr:$src1))),		(vt128 (OpNode (vt128 (bitconvert (loadv2i64 addr:$src1))),
(vt128 VR128:$src2))))]>,		(vt128 VR128:$src2))))]>,
XOP, Sched<[sched.Folded, ReadAfterLd]>;		XOP, Sched<[sched.Folded, sched.ReadAfterFold]>;
// For disassembler		// For disassembler
let isCodeGenOnly = 1, ForceDisassemble = 1, hasSideEffects = 0 in		let isCodeGenOnly = 1, ForceDisassemble = 1, hasSideEffects = 0 in
def rr_REV : IXOP<opc, MRMSrcReg, (outs VR128:$dst),		def rr_REV : IXOP<opc, MRMSrcReg, (outs VR128:$dst),
(ins VR128:$src1, VR128:$src2),		(ins VR128:$src1, VR128:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[]>,		[]>,
XOP_4V, VEX_W, Sched<[sched]>, FoldGenData<NAME#rr>;		XOP_4V, VEX_W, Sched<[sched]>, FoldGenData<NAME#rr>;
}		}
Show All 21 Lines	def ri : IXOPi8<opc, MRMSrcReg, (outs VR128:$dst),
[(set VR128:$dst,		[(set VR128:$dst,
(vt128 (OpNode (vt128 VR128:$src1), imm:$src2)))]>,		(vt128 (OpNode (vt128 VR128:$src1), imm:$src2)))]>,
XOP, Sched<[sched]>;		XOP, Sched<[sched]>;
def mi : IXOPi8<opc, MRMSrcMem, (outs VR128:$dst),		def mi : IXOPi8<opc, MRMSrcMem, (outs VR128:$dst),
(ins i128mem:$src1, u8imm:$src2),		(ins i128mem:$src1, u8imm:$src2),
!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		!strconcat(OpcodeStr, "\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR128:$dst,		[(set VR128:$dst,
(vt128 (OpNode (vt128 (bitconvert (loadv2i64 addr:$src1))), imm:$src2)))]>,		(vt128 (OpNode (vt128 (bitconvert (loadv2i64 addr:$src1))), imm:$src2)))]>,
XOP, Sched<[sched.Folded, ReadAfterLd]>;		XOP, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let ExeDomain = SSEPackedInt in {		let ExeDomain = SSEPackedInt in {
defm VPROTB : xop3opimm<0xC0, "vprotb", X86vrotli, v16i8,		defm VPROTB : xop3opimm<0xC0, "vprotb", X86vrotli, v16i8,
SchedWriteVecShiftImm.XMM>;		SchedWriteVecShiftImm.XMM>;
defm VPROTD : xop3opimm<0xC2, "vprotd", X86vrotli, v4i32,		defm VPROTD : xop3opimm<0xC2, "vprotd", X86vrotli, v4i32,
SchedWriteVecShiftImm.XMM>;		SchedWriteVecShiftImm.XMM>;
defm VPROTQ : xop3opimm<0xC3, "vprotq", X86vrotli, v2i64,		defm VPROTQ : xop3opimm<0xC3, "vprotq", X86vrotli, v2i64,
Show All 14 Lines	def rr : IXOPi8Reg<opc, MRMSrcReg, (outs VR128:$dst),
(Int VR128:$src1, VR128:$src2, VR128:$src3))]>, XOP_4V,		(Int VR128:$src1, VR128:$src2, VR128:$src3))]>, XOP_4V,
Sched<[sched]>;		Sched<[sched]>;
def rm : IXOPi8Reg<opc, MRMSrcMem, (outs VR128:$dst),		def rm : IXOPi8Reg<opc, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, i128mem:$src2, VR128:$src3),		(ins VR128:$src1, i128mem:$src2, VR128:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[(set VR128:$dst,		[(set VR128:$dst,
(Int VR128:$src1, (bitconvert (loadv2i64 addr:$src2)),		(Int VR128:$src1, (bitconvert (loadv2i64 addr:$src2)),
VR128:$src3))]>, XOP_4V, Sched<[sched.Folded, ReadAfterLd]>;		VR128:$src3))]>, XOP_4V, Sched<[sched.Folded, sched.ReadAfterFold]>;
}		}

let ExeDomain = SSEPackedInt in {		let ExeDomain = SSEPackedInt in {
defm VPMADCSWD : xop4opm2<0xB6, "vpmadcswd",		defm VPMADCSWD : xop4opm2<0xB6, "vpmadcswd",
int_x86_xop_vpmadcswd, SchedWriteVecIMul.XMM>;		int_x86_xop_vpmadcswd, SchedWriteVecIMul.XMM>;
defm VPMADCSSWD : xop4opm2<0xA6, "vpmadcsswd",		defm VPMADCSSWD : xop4opm2<0xA6, "vpmadcsswd",
int_x86_xop_vpmadcsswd, SchedWriteVecIMul.XMM>;		int_x86_xop_vpmadcsswd, SchedWriteVecIMul.XMM>;
defm VPMACSWW : xop4opm2<0x95, "vpmacsww",		defm VPMACSWW : xop4opm2<0x95, "vpmacsww",
▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines	let ExeDomain = SSEPackedInt in { // SSE integer instructions
def mi : IXOPi8<opc, MRMSrcMem, (outs VR128:$dst),		def mi : IXOPi8<opc, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, i128mem:$src2, XOPCC:$cc),		(ins VR128:$src1, i128mem:$src2, XOPCC:$cc),
!strconcat("vpcom${cc}", Suffix,		!strconcat("vpcom${cc}", Suffix,
"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),		"\t{$src2, $src1, $dst\|$dst, $src1, $src2}"),
[(set VR128:$dst,		[(set VR128:$dst,
(vt128 (OpNode (vt128 VR128:$src1),		(vt128 (OpNode (vt128 VR128:$src1),
(vt128 (bitconvert (loadv2i64 addr:$src2))),		(vt128 (bitconvert (loadv2i64 addr:$src2))),
imm:$cc)))]>,		imm:$cc)))]>,
XOP_4V, Sched<[sched.Folded, ReadAfterLd]>;		XOP_4V, Sched<[sched.Folded, sched.ReadAfterFold]>;
let isAsmParserOnly = 1, hasSideEffects = 0 in {		let isAsmParserOnly = 1, hasSideEffects = 0 in {
def ri_alt : IXOPi8<opc, MRMSrcReg, (outs VR128:$dst),		def ri_alt : IXOPi8<opc, MRMSrcReg, (outs VR128:$dst),
(ins VR128:$src1, VR128:$src2, u8imm:$src3),		(ins VR128:$src1, VR128:$src2, u8imm:$src3),
!strconcat("vpcom", Suffix,		!strconcat("vpcom", Suffix,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[]>, XOP_4V, Sched<[sched]>, NotMemoryFoldable;		[]>, XOP_4V, Sched<[sched]>, NotMemoryFoldable;
let mayLoad = 1 in		let mayLoad = 1 in
def mi_alt : IXOPi8<opc, MRMSrcMem, (outs VR128:$dst),		def mi_alt : IXOPi8<opc, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, i128mem:$src2, u8imm:$src3),		(ins VR128:$src1, i128mem:$src2, u8imm:$src3),
!strconcat("vpcom", Suffix,		!strconcat("vpcom", Suffix,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[]>, XOP_4V, Sched<[sched.Folded, ReadAfterLd]>,		[]>, XOP_4V, Sched<[sched.Folded, sched.ReadAfterFold]>,
NotMemoryFoldable;		NotMemoryFoldable;
}		}
}		}

def : Pat<(OpNode (bitconvert (loadv2i64 addr:$src2)),		def : Pat<(OpNode (bitconvert (loadv2i64 addr:$src2)),
(vt128 VR128:$src1), imm:$cc),		(vt128 VR128:$src1), imm:$cc),
(!cast<Instruction>(NAME#"mi") VR128:$src1, addr:$src2,		(!cast<Instruction>(NAME#"mi") VR128:$src1, addr:$src2,
(CommuteVPCOMCC imm:$cc))>;		(CommuteVPCOMCC imm:$cc))>;
Show All 20 Lines	def rrr : IXOPi8Reg<opc, MRMSrcReg, (outs VR128:$dst),
XOP_4V, Sched<[sched]>;		XOP_4V, Sched<[sched]>;
def rrm : IXOPi8Reg<opc, MRMSrcMemOp4, (outs VR128:$dst),		def rrm : IXOPi8Reg<opc, MRMSrcMemOp4, (outs VR128:$dst),
(ins VR128:$src1, VR128:$src2, i128mem:$src3),		(ins VR128:$src1, VR128:$src2, i128mem:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[(set VR128:$dst,		[(set VR128:$dst,
(vt128 (OpNode (vt128 VR128:$src1), (vt128 VR128:$src2),		(vt128 (OpNode (vt128 VR128:$src1), (vt128 VR128:$src2),
(vt128 (bitconvert (loadv2i64 addr:$src3))))))]>,		(vt128 (bitconvert (loadv2i64 addr:$src3))))))]>,
XOP_4V, VEX_W, Sched<[sched.Folded, ReadAfterLd, ReadAfterLd]>;		XOP_4V, VEX_W, Sched<[sched.Folded, sched.ReadAfterFold, sched.ReadAfterFold]>;
def rmr : IXOPi8Reg<opc, MRMSrcMem, (outs VR128:$dst),		def rmr : IXOPi8Reg<opc, MRMSrcMem, (outs VR128:$dst),
(ins VR128:$src1, i128mem:$src2, VR128:$src3),		(ins VR128:$src1, i128mem:$src2, VR128:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[(set VR128:$dst,		[(set VR128:$dst,
(v16i8 (OpNode (vt128 VR128:$src1), (vt128 (bitconvert (loadv2i64 addr:$src2))),		(v16i8 (OpNode (vt128 VR128:$src1), (vt128 (bitconvert (loadv2i64 addr:$src2))),
(vt128 VR128:$src3))))]>,		(vt128 VR128:$src3))))]>,
XOP_4V, Sched<[sched.Folded, ReadAfterLd,		XOP_4V, Sched<[sched.Folded, sched.ReadAfterFold,
// 128mem:$src2		// 128mem:$src2
ReadDefault, ReadDefault, ReadDefault, ReadDefault,		ReadDefault, ReadDefault, ReadDefault, ReadDefault,
ReadDefault,		ReadDefault,
// VR128:$src3		// VR128:$src3
ReadAfterLd]>;		sched.ReadAfterFold]>;
// For disassembler		// For disassembler
let isCodeGenOnly = 1, ForceDisassemble = 1, hasSideEffects = 0 in		let isCodeGenOnly = 1, ForceDisassemble = 1, hasSideEffects = 0 in
def rrr_REV : IXOPi8Reg<opc, MRMSrcRegOp4, (outs VR128:$dst),		def rrr_REV : IXOPi8Reg<opc, MRMSrcRegOp4, (outs VR128:$dst),
(ins VR128:$src1, VR128:$src2, VR128:$src3),		(ins VR128:$src1, VR128:$src2, VR128:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[]>, XOP_4V, VEX_W, Sched<[sched]>, FoldGenData<NAME#rrr>;		[]>, XOP_4V, VEX_W, Sched<[sched]>, FoldGenData<NAME#rrr>;
}		}
Show All 15 Lines	def rrr : IXOPi8Reg<opc, MRMSrcReg, (outs RC:$dst),
(X86andnp RC:$src3, RC:$src2))))]>, XOP_4V,		(X86andnp RC:$src3, RC:$src2))))]>, XOP_4V,
Sched<[sched]>;		Sched<[sched]>;
def rrm : IXOPi8Reg<opc, MRMSrcMemOp4, (outs RC:$dst),		def rrm : IXOPi8Reg<opc, MRMSrcMemOp4, (outs RC:$dst),
(ins RC:$src1, RC:$src2, x86memop:$src3),		(ins RC:$src1, RC:$src2, x86memop:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[(set RC:$dst, (VT (or (and (load addr:$src3), RC:$src1),		[(set RC:$dst, (VT (or (and (load addr:$src3), RC:$src1),
(X86andnp (load addr:$src3), RC:$src2))))]>,		(X86andnp (load addr:$src3), RC:$src2))))]>,
XOP_4V, VEX_W, Sched<[sched.Folded, ReadAfterLd, ReadAfterLd]>;		XOP_4V, VEX_W, Sched<[sched.Folded, sched.ReadAfterFold, sched.ReadAfterFold]>;
def rmr : IXOPi8Reg<opc, MRMSrcMem, (outs RC:$dst),		def rmr : IXOPi8Reg<opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, x86memop:$src2, RC:$src3),		(ins RC:$src1, x86memop:$src2, RC:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[(set RC:$dst, (VT (or (and RC:$src3, RC:$src1),		[(set RC:$dst, (VT (or (and RC:$src3, RC:$src1),
(X86andnp RC:$src3, (load addr:$src2)))))]>,		(X86andnp RC:$src3, (load addr:$src2)))))]>,
XOP_4V, Sched<[sched.Folded, ReadAfterLd,		XOP_4V, Sched<[sched.Folded, sched.ReadAfterFold,
// x86memop:$src2		// x86memop:$src2
ReadDefault, ReadDefault, ReadDefault, ReadDefault,		ReadDefault, ReadDefault, ReadDefault, ReadDefault,
ReadDefault,		ReadDefault,
// RC::$src3		// RC::$src3
ReadAfterLd]>;		sched.ReadAfterFold]>;
// For disassembler		// For disassembler
let isCodeGenOnly = 1, ForceDisassemble = 1, hasSideEffects = 0 in		let isCodeGenOnly = 1, ForceDisassemble = 1, hasSideEffects = 0 in
def rrr_REV : IXOPi8Reg<opc, MRMSrcRegOp4, (outs RC:$dst),		def rrr_REV : IXOPi8Reg<opc, MRMSrcRegOp4, (outs RC:$dst),
(ins RC:$src1, RC:$src2, RC:$src3),		(ins RC:$src1, RC:$src2, RC:$src3),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),		"\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}"),
[]>, XOP_4V, VEX_W, Sched<[sched]>, FoldGenData<NAME#rrr>;		[]>, XOP_4V, VEX_W, Sched<[sched]>, FoldGenData<NAME#rrr>;
}		}
Show All 19 Lines	multiclass xop_vpermil2<bits<8> Opc, string OpcodeStr, RegisterClass RC,
def rm : IXOP5<Opc, MRMSrcMemOp4, (outs RC:$dst),		def rm : IXOP5<Opc, MRMSrcMemOp4, (outs RC:$dst),
(ins RC:$src1, RC:$src2, intmemop:$src3, u8imm:$src4),		(ins RC:$src1, RC:$src2, intmemop:$src3, u8imm:$src4),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src4, $src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3, $src4}"),		"\t{$src4, $src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3, $src4}"),
[(set RC:$dst,		[(set RC:$dst,
(VT (X86vpermil2 RC:$src1, RC:$src2,		(VT (X86vpermil2 RC:$src1, RC:$src2,
(bitconvert (IntLdFrag addr:$src3)),		(bitconvert (IntLdFrag addr:$src3)),
(i8 imm:$src4))))]>, VEX_W,		(i8 imm:$src4))))]>, VEX_W,
Sched<[sched.Folded, ReadAfterLd, ReadAfterLd]>;		Sched<[sched.Folded, sched.ReadAfterFold, sched.ReadAfterFold]>;
def mr : IXOP5<Opc, MRMSrcMem, (outs RC:$dst),		def mr : IXOP5<Opc, MRMSrcMem, (outs RC:$dst),
(ins RC:$src1, fpmemop:$src2, RC:$src3, u8imm:$src4),		(ins RC:$src1, fpmemop:$src2, RC:$src3, u8imm:$src4),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src4, $src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3, $src4}"),		"\t{$src4, $src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3, $src4}"),
[(set RC:$dst,		[(set RC:$dst,
(VT (X86vpermil2 RC:$src1, (FPLdFrag addr:$src2),		(VT (X86vpermil2 RC:$src1, (FPLdFrag addr:$src2),
RC:$src3, (i8 imm:$src4))))]>,		RC:$src3, (i8 imm:$src4))))]>,
Sched<[sched.Folded, ReadAfterLd,		Sched<[sched.Folded, sched.ReadAfterFold,
// fpmemop:$src2		// fpmemop:$src2
ReadDefault, ReadDefault, ReadDefault, ReadDefault, ReadDefault,		ReadDefault, ReadDefault, ReadDefault, ReadDefault, ReadDefault,
// RC:$src3		// RC:$src3
ReadAfterLd]>;		sched.ReadAfterFold]>;
// For disassembler		// For disassembler
let isCodeGenOnly = 1, ForceDisassemble = 1, hasSideEffects = 0 in		let isCodeGenOnly = 1, ForceDisassemble = 1, hasSideEffects = 0 in
def rr_REV : IXOP5<Opc, MRMSrcRegOp4, (outs RC:$dst),		def rr_REV : IXOP5<Opc, MRMSrcRegOp4, (outs RC:$dst),
(ins RC:$src1, RC:$src2, RC:$src3, u8imm:$src4),		(ins RC:$src1, RC:$src2, RC:$src3, u8imm:$src4),
!strconcat(OpcodeStr,		!strconcat(OpcodeStr,
"\t{$src4, $src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3, $src4}"),		"\t{$src4, $src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3, $src4}"),
[]>, VEX_W, Sched<[sched]>, FoldGenData<NAME#rr>;		[]>, VEX_W, Sched<[sched]>, FoldGenData<NAME#rr>;
}		}
Show All 19 Lines

lib/Target/X86/X86SchedBroadwell.td

Show First 20 Lines • Show All 66 Lines • ▼ Show 20 Lines	def BWPortAny : ProcResGroup<[BWPort0, BWPort1, BWPort2, BWPort3, BWPort4,
let BufferSize=60;		let BufferSize=60;
}		}

// Integer division issued on port 0.		// Integer division issued on port 0.
def BWDivider : ProcResource<1>;		def BWDivider : ProcResource<1>;
// FP division and sqrt on port 0.		// FP division and sqrt on port 0.
def BWFPDivider : ProcResource<1>;		def BWFPDivider : ProcResource<1>;

// Loads are 5 cycles, so ReadAfterLd registers needn't be available until 5		// Integer loads are 5 cycles, so ReadAfterLd registers needn't be available until 5
// cycles after the memory operand.		// cycles after the memory operand.
def : ReadAdvance<ReadAfterLd, 5>;		def : ReadAdvance<ReadAfterLd, 5>;

		// Vector loads are 5/5/6 cycles, so ReadAfterVec*Ld registers needn't be available
		craig.topperUnsubmitted Not Done Reply Inline Actions The load latencies on BDW seem weird given that HSW and SKL, the CPUs immediately before and after are the same. craig.topper: The load latencies on BDW seem weird given that HSW and SKL, the CPUs immediately before and…
		RKSimonAuthorUnsubmitted Not Done Reply Inline Actions They're the same as BDW's load latencies - can we confirm if they are correct or not? I think this question has come up several times in the past.... RKSimon: They're the same as BDW's load latencies - can we confirm if they are correct or not? I think…
		courbetUnsubmitted Not Done Reply Inline Actions llvm-exegesis does not currently fully automate measurement of latency operations, nevertheless we can do: echo -e 'mov (%rdi),%rax\n mov %rax, 1(%rdi)' \| ./bin/llvm-exegesis -mode=latency -snippets-file=- echo -e 'vmovups (%rdi),%xmm0\n vmovups %xmm0, 1(%rdi)' \| ./bin/llvm-exegesis -mode=latency -snippets-file=- echo -e 'vmovups (%rdi),%ymm0\n vmovups %ymm0, 1(%rdi)' \| ./bin/llvm-exegesis -mode=latency -snippets-file=- (with store-to-load forwarding) echo -e 'mov (%rdi),%rax\n mov %rax, 1(%rdi)' \| ./bin/llvm-exegesis -mode=latency -snippets-file=- echo -e 'vmovups (%rdi),%xmm0\n vmovups %xmm0, 1(%rdi)' \| ./bin/llvm-exegesis -mode=latency -snippets-file=- echo -e 'vmovups (%rdi),%ymm0\n vmovups %ymm0, 1(%rdi)' \| ./bin/llvm-exegesis -mode=latency -snippets-file=- (without store-to-load forwarding) On Haswell, this gives 5/6/7-15/16/17. On Broadwell, this gives 5/6/7-15/16/17. So they should be the same (5/6/7). courbet: llvm-exegesis does not currently fully automate measurement of latency operations, nevertheless…
		courbetUnsubmitted Not Done Reply Inline Actions `echo -e 'mov (%rdi),%rax\n mov %rax, 1(%rdi)' \| ./bin/llvm-exegesis -mode=latency -snippets-file=-` This was supposed to be: `echo -e 'mov (%rdi),%rax\n mov %rax, (%rdi)' \| ./bin/llvm-exegesis -mode=latency -snippets-file=-` courbet: > `echo -e 'mov (%rdi),%rax\n mov %rax, 1(%rdi)' \| ./bin/llvm-exegesis -mode=latency -snippets…
		// until 5/5/6 cycles after the memory operand.
		def : ReadAdvance<ReadAfterVecLd, 5>;
		def : ReadAdvance<ReadAfterVecXLd, 5>;
		def : ReadAdvance<ReadAfterVecYLd, 6>;

// Many SchedWrites are defined in pairs with and without a folded load.		// Many SchedWrites are defined in pairs with and without a folded load.
// Instructions with folded loads are usually micro-fused, so they only appear		// Instructions with folded loads are usually micro-fused, so they only appear
// as two micro-ops when queued in the reservation station.		// as two micro-ops when queued in the reservation station.
// This multiclass defines the resource usage for variants with and without		// This multiclass defines the resource usage for variants with and without
// folded loads.		// folded loads.
multiclass BWWriteResPair<X86FoldableSchedWrite SchedRW,		multiclass BWWriteResPair<X86FoldableSchedWrite SchedRW,
list<ProcResourceKind> ExePorts,		list<ProcResourceKind> ExePorts,
int Lat, list<int> Res = [1], int UOps = 1,		int Lat, list<int> Res = [1], int UOps = 1,
▲ Show 20 Lines • Show All 1,503 Lines • Show Last 20 Lines

lib/Target/X86/X86SchedHaswell.td

Show First 20 Lines • Show All 71 Lines • ▼ Show 20 Lines	def HWPortAny : ProcResGroup<[HWPort0, HWPort1, HWPort2, HWPort3, HWPort4,
let BufferSize=60;		let BufferSize=60;
}		}

// Integer division issued on port 0.		// Integer division issued on port 0.
def HWDivider : ProcResource<1>;		def HWDivider : ProcResource<1>;
// FP division and sqrt on port 0.		// FP division and sqrt on port 0.
def HWFPDivider : ProcResource<1>;		def HWFPDivider : ProcResource<1>;

// Loads are 5 cycles, so ReadAfterLd registers needn't be available until 5		// Integer loads are 5 cycles, so ReadAfterLd registers needn't be available until 5
// cycles after the memory operand.		// cycles after the memory operand.
def : ReadAdvance<ReadAfterLd, 5>;		def : ReadAdvance<ReadAfterLd, 5>;

		// Vector loads are 5/6/7 cycles, so ReadAfterVec*Ld registers needn't be available
		// until 5/6/7 cycles after the memory operand.
		def : ReadAdvance<ReadAfterVecLd, 5>;
		def : ReadAdvance<ReadAfterVecXLd, 6>;
		def : ReadAdvance<ReadAfterVecYLd, 7>;

// Many SchedWrites are defined in pairs with and without a folded load.		// Many SchedWrites are defined in pairs with and without a folded load.
// Instructions with folded loads are usually micro-fused, so they only appear		// Instructions with folded loads are usually micro-fused, so they only appear
// as two micro-ops when queued in the reservation station.		// as two micro-ops when queued in the reservation station.
// This multiclass defines the resource usage for variants with and without		// This multiclass defines the resource usage for variants with and without
// folded loads.		// folded loads.
multiclass HWWriteResPair<X86FoldableSchedWrite SchedRW,		multiclass HWWriteResPair<X86FoldableSchedWrite SchedRW,
list<ProcResourceKind> ExePorts,		list<ProcResourceKind> ExePorts,
int Lat, list<int> Res = [1], int UOps = 1,		int Lat, list<int> Res = [1], int UOps = 1,
▲ Show 20 Lines • Show All 1,753 Lines • Show Last 20 Lines

lib/Target/X86/X86SchedSandyBridge.td

Show First 20 Lines • Show All 61 Lines • ▼ Show 20 Lines	def SBPortAny : ProcResGroup<[SBPort0, SBPort1, SBPort23, SBPort4, SBPort5]> {
let BufferSize=54;		let BufferSize=54;
}		}

// Integer division issued on port 0.		// Integer division issued on port 0.
def SBDivider : ProcResource<1>;		def SBDivider : ProcResource<1>;
// FP division and sqrt on port 0.		// FP division and sqrt on port 0.
def SBFPDivider : ProcResource<1>;		def SBFPDivider : ProcResource<1>;

// Loads are 5 cycles, so ReadAfterLd registers needn't be available until 5		// Integer loads are 5 cycles, so ReadAfterLd registers needn't be available until 5
// cycles after the memory operand.		// cycles after the memory operand.
def : ReadAdvance<ReadAfterLd, 5>;		def : ReadAdvance<ReadAfterLd, 5>;

		// Vector loads are 5/6/7 cycles, so ReadAfterVec*Ld registers needn't be available
		// until 5/6/7 cycles after the memory operand.
		def : ReadAdvance<ReadAfterVecLd, 5>;
		def : ReadAdvance<ReadAfterVecXLd, 6>;
		def : ReadAdvance<ReadAfterVecYLd, 7>;
		courbetUnsubmitted Not Done Reply Inline Actions Looks good, except that store-to-load forwarding seems to incur an extra cycle in the `ymm` case. courbet: Looks good, except that store-to-load forwarding seems to incur an extra cycle in the `ymm`…

// Many SchedWrites are defined in pairs with and without a folded load.		// Many SchedWrites are defined in pairs with and without a folded load.
// Instructions with folded loads are usually micro-fused, so they only appear		// Instructions with folded loads are usually micro-fused, so they only appear
// as two micro-ops when queued in the reservation station.		// as two micro-ops when queued in the reservation station.
// This multiclass defines the resource usage for variants with and without		// This multiclass defines the resource usage for variants with and without
// folded loads.		// folded loads.
multiclass SBWriteResPair<X86FoldableSchedWrite SchedRW,		multiclass SBWriteResPair<X86FoldableSchedWrite SchedRW,
list<ProcResourceKind> ExePorts,		list<ProcResourceKind> ExePorts,
int Lat, list<int> Res = [1], int UOps = 1,		int Lat, list<int> Res = [1], int UOps = 1,
▲ Show 20 Lines • Show All 1,081 Lines • Show Last 20 Lines

lib/Target/X86/X86SchedSkylakeClient.td

	Show First 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	def SKLFPDivider : ProcResource<1>;			def SKLFPDivider : ProcResource<1>;

	// 60 Entry Unified Scheduler			// 60 Entry Unified Scheduler
	def SKLPortAny : ProcResGroup<[SKLPort0, SKLPort1, SKLPort2, SKLPort3, SKLPort4,			def SKLPortAny : ProcResGroup<[SKLPort0, SKLPort1, SKLPort2, SKLPort3, SKLPort4,
	SKLPort5, SKLPort6, SKLPort7]> {			SKLPort5, SKLPort6, SKLPort7]> {
	let BufferSize=60;			let BufferSize=60;
	}			}

	// Loads are 5 cycles, so ReadAfterLd registers needn't be available until 5			// Integer loads are 5 cycles, so ReadAfterLd registers needn't be available until 5
	// cycles after the memory operand.			// cycles after the memory operand.
	def : ReadAdvance<ReadAfterLd, 5>;			def : ReadAdvance<ReadAfterLd, 5>;

				// Vector loads are 5/6/7 cycles, so ReadAfterVec*Ld registers needn't be available
				// until 5/6/7 cycles after the memory operand.
				def : ReadAdvance<ReadAfterVecLd, 5>;
				def : ReadAdvance<ReadAfterVecXLd, 6>;
				def : ReadAdvance<ReadAfterVecYLd, 7>;

	// Many SchedWrites are defined in pairs with and without a folded load.			// Many SchedWrites are defined in pairs with and without a folded load.
	// Instructions with folded loads are usually micro-fused, so they only appear			// Instructions with folded loads are usually micro-fused, so they only appear
	// as two micro-ops when queued in the reservation station.			// as two micro-ops when queued in the reservation station.
	// This multiclass defines the resource usage for variants with and without			// This multiclass defines the resource usage for variants with and without
	// folded loads.			// folded loads.
	multiclass SKLWriteResPair<X86FoldableSchedWrite SchedRW,			multiclass SKLWriteResPair<X86FoldableSchedWrite SchedRW,
	list<ProcResourceKind> ExePorts,			list<ProcResourceKind> ExePorts,
	int Lat, list<int> Res = [1], int UOps = 1,			int Lat, list<int> Res = [1], int UOps = 1,
	▲ Show 20 Lines • Show All 1,657 Lines • Show Last 20 Lines

lib/Target/X86/X86SchedSkylakeServer.td

	Show First 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	def SKXFPDivider : ProcResource<1>;			def SKXFPDivider : ProcResource<1>;

	// 60 Entry Unified Scheduler			// 60 Entry Unified Scheduler
	def SKXPortAny : ProcResGroup<[SKXPort0, SKXPort1, SKXPort2, SKXPort3, SKXPort4,			def SKXPortAny : ProcResGroup<[SKXPort0, SKXPort1, SKXPort2, SKXPort3, SKXPort4,
	SKXPort5, SKXPort6, SKXPort7]> {			SKXPort5, SKXPort6, SKXPort7]> {
	let BufferSize=60;			let BufferSize=60;
	}			}

	// Loads are 5 cycles, so ReadAfterLd registers needn't be available until 5			// Integer loads are 5 cycles, so ReadAfterLd registers needn't be available until 5
				craig.topperUnsubmitted Not Done Reply Inline Actions Why this comment only changed in this model? The same comment existing in SNB, HSW, BDW, and SKLClient. craig.topper: Why this comment only changed in this model? The same comment existing in SNB, HSW, BDW, and…
				RKSimonAuthorUnsubmitted Not Done Reply Inline Actions Because my copy+paste skills are below average. RKSimon: Because my copy+paste skills are below average.
	// cycles after the memory operand.			// cycles after the memory operand.
	def : ReadAdvance<ReadAfterLd, 5>;			def : ReadAdvance<ReadAfterLd, 5>;

				// Vector loads are 5/6/7 cycles, so ReadAfterVec*Ld registers needn't be available
				courbetUnsubmitted Not Done Reply Inline Actions I'm seeing 4.5(??)/5/6-15/15/16 here. courbet: I'm seeing 4.5(??)/5/6-15/15/16 here.
				// until 5/6/7 cycles after the memory operand.
				def : ReadAdvance<ReadAfterVecLd, 5>;
				def : ReadAdvance<ReadAfterVecXLd, 6>;
				def : ReadAdvance<ReadAfterVecYLd, 7>;

	// Many SchedWrites are defined in pairs with and without a folded load.			// Many SchedWrites are defined in pairs with and without a folded load.
	// Instructions with folded loads are usually micro-fused, so they only appear			// Instructions with folded loads are usually micro-fused, so they only appear
	// as two micro-ops when queued in the reservation station.			// as two micro-ops when queued in the reservation station.
	// This multiclass defines the resource usage for variants with and without			// This multiclass defines the resource usage for variants with and without
	// folded loads.			// folded loads.
	multiclass SKXWriteResPair<X86FoldableSchedWrite SchedRW,			multiclass SKXWriteResPair<X86FoldableSchedWrite SchedRW,
	list<ProcResourceKind> ExePorts,			list<ProcResourceKind> ExePorts,
	int Lat, list<int> Res = [1], int UOps = 1,			int Lat, list<int> Res = [1], int UOps = 1,
	▲ Show 20 Lines • Show All 2,373 Lines • Show Last 20 Lines

lib/Target/X86/X86Schedule.td

	//===-- X86Schedule.td - X86 Scheduling Definitions --------- tablegen --===//			//===-- X86Schedule.td - X86 Scheduling Definitions --------- tablegen --===//
	//			//
	// The LLVM Compiler Infrastructure			// The LLVM Compiler Infrastructure
	//			//
	// This file is distributed under the University of Illinois Open Source			// This file is distributed under the University of Illinois Open Source
	// License. See LICENSE.TXT for details.			// License. See LICENSE.TXT for details.
	//			//
	//===----------------------------------------------------------------------===//			//===----------------------------------------------------------------------===//

	//===----------------------------------------------------------------------===//			//===----------------------------------------------------------------------===//
	// InstrSchedModel annotations for out-of-order CPUs.			// InstrSchedModel annotations for out-of-order CPUs.

	// Instructions with folded loads need to read the memory operand immediately,			// Instructions with folded loads need to read the memory operand immediately,
	// but other register operands don't have to be read until the load is ready.			// but other register operands don't have to be read until the load is ready.
	// These operands are marked with ReadAfterLd.			// These operands are marked with ReadAfterLd.
	def ReadAfterLd : SchedRead;			def ReadAfterLd : SchedRead;
				def ReadAfterVecLd : SchedRead;
				def ReadAfterVecXLd : SchedRead;
				def ReadAfterVecYLd : SchedRead;

	// Instructions with both a load and a store folded are modeled as a folded			// Instructions with both a load and a store folded are modeled as a folded
	// load + WriteRMW.			// load + WriteRMW.
	def WriteRMW : SchedWrite;			def WriteRMW : SchedWrite;

	// Helper to set SchedWrite ExePorts/Latency/ResourceCycles/NumMicroOps.			// Helper to set SchedWrite ExePorts/Latency/ResourceCycles/NumMicroOps.
	multiclass X86WriteRes<SchedWrite SchedRW,			multiclass X86WriteRes<SchedWrite SchedRW,
	list<ProcResourceKind> ExePorts,			list<ProcResourceKind> ExePorts,
	int Lat, list<int> Res, int UOps> {			int Lat, list<int> Res, int UOps> {
	def : WriteRes<SchedRW, ExePorts> {			def : WriteRes<SchedRW, ExePorts> {
	let Latency = Lat;			let Latency = Lat;
	let ResourceCycles = Res;			let ResourceCycles = Res;
	let NumMicroOps = UOps;			let NumMicroOps = UOps;
	}			}
	}			}

	// Most instructions can fold loads, so almost every SchedWrite comes in two			// Most instructions can fold loads, so almost every SchedWrite comes in two
	// variants: With and without a folded load.			// variants: With and without a folded load.
	// An X86FoldableSchedWrite holds a reference to the corresponding SchedWrite			// An X86FoldableSchedWrite holds a reference to the corresponding SchedWrite
	// with a folded load.			// with a folded load.
	class X86FoldableSchedWrite : SchedWrite {			class X86FoldableSchedWrite : SchedWrite {
	// The SchedWrite to use when a load is folded into the instruction.			// The SchedWrite to use when a load is folded into the instruction.
	SchedWrite Folded;			SchedWrite Folded;
				// The SchedRead to tag register operands than don't need to be ready
				// until the folded load has completed.
				SchedRead ReadAfterFold;
	}			}

	// Multiclass that produces a linked pair of SchedWrites.			// Multiclass that produces a linked pair of SchedWrites.
	multiclass X86SchedWritePair {			multiclass X86SchedWritePair<SchedRead ReadAfter = ReadAfterLd> {
	// Register-Memory operation.			// Register-Memory operation.
	def Ld : SchedWrite;			def Ld : SchedWrite;
	// Register-Register operation.			// Register-Register operation.
	def NAME : X86FoldableSchedWrite {			def NAME : X86FoldableSchedWrite {
	let Folded = !cast<SchedWrite>(NAME#"Ld");			let Folded = !cast<SchedWrite>(NAME#"Ld");
				let ReadAfterFold = ReadAfter;
	}			}
	}			}

	// Helpers to mark SchedWrites as unsupported.			// Helpers to mark SchedWrites as unsupported.
	multiclass X86WriteResUnsupported<SchedWrite SchedRW> {			multiclass X86WriteResUnsupported<SchedWrite SchedRW> {
	let Unsupported = 1 in {			let Unsupported = 1 in {
	def : WriteRes<SchedRW, []>;			def : WriteRes<SchedRW, []>;
	}			}
	▲ Show 20 Lines • Show All 151 Lines • ▼ Show 20 Lines
	def WriteFStoreNTX : SchedWrite;			def WriteFStoreNTX : SchedWrite;
	def WriteFStoreNTY : SchedWrite;			def WriteFStoreNTY : SchedWrite;
	def WriteFMaskedStore : SchedWrite;			def WriteFMaskedStore : SchedWrite;
	def WriteFMaskedStoreY : SchedWrite;			def WriteFMaskedStoreY : SchedWrite;
	def WriteFMove : SchedWrite;			def WriteFMove : SchedWrite;
	def WriteFMoveX : SchedWrite;			def WriteFMoveX : SchedWrite;
	def WriteFMoveY : SchedWrite;			def WriteFMoveY : SchedWrite;

	defm WriteFAdd : X86SchedWritePair; // Floating point add/sub.			defm WriteFAdd : X86SchedWritePair<ReadAfterVecLd>; // Floating point add/sub.
	defm WriteFAddX : X86SchedWritePair; // Floating point add/sub (XMM).			defm WriteFAddX : X86SchedWritePair<ReadAfterVecXLd>; // Floating point add/sub (XMM).
	defm WriteFAddY : X86SchedWritePair; // Floating point add/sub (YMM).			defm WriteFAddY : X86SchedWritePair<ReadAfterVecYLd>; // Floating point add/sub (YMM).
	defm WriteFAddZ : X86SchedWritePair; // Floating point add/sub (ZMM).			defm WriteFAddZ : X86SchedWritePair<ReadAfterVecYLd>; // Floating point add/sub (ZMM).
	defm WriteFAdd64 : X86SchedWritePair; // Floating point double add/sub.			defm WriteFAdd64 : X86SchedWritePair<ReadAfterVecLd>; // Floating point double add/sub.
	defm WriteFAdd64X : X86SchedWritePair; // Floating point double add/sub (XMM).			defm WriteFAdd64X : X86SchedWritePair<ReadAfterVecXLd>; // Floating point double add/sub (XMM).
	defm WriteFAdd64Y : X86SchedWritePair; // Floating point double add/sub (YMM).			defm WriteFAdd64Y : X86SchedWritePair<ReadAfterVecYLd>; // Floating point double add/sub (YMM).
	defm WriteFAdd64Z : X86SchedWritePair; // Floating point double add/sub (ZMM).			defm WriteFAdd64Z : X86SchedWritePair<ReadAfterVecYLd>; // Floating point double add/sub (ZMM).
	defm WriteFCmp : X86SchedWritePair; // Floating point compare.			defm WriteFCmp : X86SchedWritePair<ReadAfterVecLd>; // Floating point compare.
	defm WriteFCmpX : X86SchedWritePair; // Floating point compare (XMM).			defm WriteFCmpX : X86SchedWritePair<ReadAfterVecXLd>; // Floating point compare (XMM).
	defm WriteFCmpY : X86SchedWritePair; // Floating point compare (YMM).			defm WriteFCmpY : X86SchedWritePair<ReadAfterVecYLd>; // Floating point compare (YMM).
	defm WriteFCmpZ : X86SchedWritePair; // Floating point compare (ZMM).			defm WriteFCmpZ : X86SchedWritePair<ReadAfterVecYLd>; // Floating point compare (ZMM).
	defm WriteFCmp64 : X86SchedWritePair; // Floating point double compare.			defm WriteFCmp64 : X86SchedWritePair<ReadAfterVecLd>; // Floating point double compare.
	defm WriteFCmp64X : X86SchedWritePair; // Floating point double compare (XMM).			defm WriteFCmp64X : X86SchedWritePair<ReadAfterVecXLd>; // Floating point double compare (XMM).
	defm WriteFCmp64Y : X86SchedWritePair; // Floating point double compare (YMM).			defm WriteFCmp64Y : X86SchedWritePair<ReadAfterVecYLd>; // Floating point double compare (YMM).
	defm WriteFCmp64Z : X86SchedWritePair; // Floating point double compare (ZMM).			defm WriteFCmp64Z : X86SchedWritePair<ReadAfterVecYLd>; // Floating point double compare (ZMM).
	defm WriteFCom : X86SchedWritePair; // Floating point compare to flags.			defm WriteFCom : X86SchedWritePair<ReadAfterVecLd>; // Floating point compare to flags.
	defm WriteFMul : X86SchedWritePair; // Floating point multiplication.			defm WriteFMul : X86SchedWritePair<ReadAfterVecLd>; // Floating point multiplication.
	defm WriteFMulX : X86SchedWritePair; // Floating point multiplication (XMM).			defm WriteFMulX : X86SchedWritePair<ReadAfterVecXLd>; // Floating point multiplication (XMM).
	defm WriteFMulY : X86SchedWritePair; // Floating point multiplication (YMM).			defm WriteFMulY : X86SchedWritePair<ReadAfterVecYLd>; // Floating point multiplication (YMM).
	defm WriteFMulZ : X86SchedWritePair; // Floating point multiplication (YMM).			defm WriteFMulZ : X86SchedWritePair<ReadAfterVecYLd>; // Floating point multiplication (YMM).
	defm WriteFMul64 : X86SchedWritePair; // Floating point double multiplication.			defm WriteFMul64 : X86SchedWritePair<ReadAfterVecLd>; // Floating point double multiplication.
	defm WriteFMul64X : X86SchedWritePair; // Floating point double multiplication (XMM).			defm WriteFMul64X : X86SchedWritePair<ReadAfterVecXLd>; // Floating point double multiplication (XMM).
	defm WriteFMul64Y : X86SchedWritePair; // Floating point double multiplication (YMM).			defm WriteFMul64Y : X86SchedWritePair<ReadAfterVecYLd>; // Floating point double multiplication (YMM).
	defm WriteFMul64Z : X86SchedWritePair; // Floating point double multiplication (ZMM).			defm WriteFMul64Z : X86SchedWritePair<ReadAfterVecYLd>; // Floating point double multiplication (ZMM).
	defm WriteFDiv : X86SchedWritePair; // Floating point division.			defm WriteFDiv : X86SchedWritePair<ReadAfterVecLd>; // Floating point division.
	defm WriteFDivX : X86SchedWritePair; // Floating point division (XMM).			defm WriteFDivX : X86SchedWritePair<ReadAfterVecXLd>; // Floating point division (XMM).
	defm WriteFDivY : X86SchedWritePair; // Floating point division (YMM).			defm WriteFDivY : X86SchedWritePair<ReadAfterVecYLd>; // Floating point division (YMM).
	defm WriteFDivZ : X86SchedWritePair; // Floating point division (ZMM).			defm WriteFDivZ : X86SchedWritePair<ReadAfterVecYLd>; // Floating point division (ZMM).
	defm WriteFDiv64 : X86SchedWritePair; // Floating point double division.			defm WriteFDiv64 : X86SchedWritePair<ReadAfterVecLd>; // Floating point double division.
	defm WriteFDiv64X : X86SchedWritePair; // Floating point double division (XMM).			defm WriteFDiv64X : X86SchedWritePair<ReadAfterVecXLd>; // Floating point double division (XMM).
	defm WriteFDiv64Y : X86SchedWritePair; // Floating point double division (YMM).			defm WriteFDiv64Y : X86SchedWritePair<ReadAfterVecYLd>; // Floating point double division (YMM).
	defm WriteFDiv64Z : X86SchedWritePair; // Floating point double division (ZMM).			defm WriteFDiv64Z : X86SchedWritePair<ReadAfterVecYLd>; // Floating point double division (ZMM).
	defm WriteFSqrt : X86SchedWritePair; // Floating point square root.			defm WriteFSqrt : X86SchedWritePair<ReadAfterVecLd>; // Floating point square root.
	defm WriteFSqrtX : X86SchedWritePair; // Floating point square root (XMM).			defm WriteFSqrtX : X86SchedWritePair<ReadAfterVecXLd>; // Floating point square root (XMM).
	defm WriteFSqrtY : X86SchedWritePair; // Floating point square root (YMM).			defm WriteFSqrtY : X86SchedWritePair<ReadAfterVecYLd>; // Floating point square root (YMM).
	defm WriteFSqrtZ : X86SchedWritePair; // Floating point square root (ZMM).			defm WriteFSqrtZ : X86SchedWritePair<ReadAfterVecYLd>; // Floating point square root (ZMM).
	defm WriteFSqrt64 : X86SchedWritePair; // Floating point double square root.			defm WriteFSqrt64 : X86SchedWritePair<ReadAfterVecLd>; // Floating point double square root.
	defm WriteFSqrt64X : X86SchedWritePair; // Floating point double square root (XMM).			defm WriteFSqrt64X : X86SchedWritePair<ReadAfterVecXLd>; // Floating point double square root (XMM).
	defm WriteFSqrt64Y : X86SchedWritePair; // Floating point double square root (YMM).			defm WriteFSqrt64Y : X86SchedWritePair<ReadAfterVecYLd>; // Floating point double square root (YMM).
	defm WriteFSqrt64Z : X86SchedWritePair; // Floating point double square root (ZMM).			defm WriteFSqrt64Z : X86SchedWritePair<ReadAfterVecYLd>; // Floating point double square root (ZMM).
	defm WriteFSqrt80 : X86SchedWritePair; // Floating point long double square root.			defm WriteFSqrt80 : X86SchedWritePair<ReadAfterVecLd>; // Floating point long double square root.
	defm WriteFRcp : X86SchedWritePair; // Floating point reciprocal estimate.			defm WriteFRcp : X86SchedWritePair<ReadAfterVecLd>; // Floating point reciprocal estimate.
	defm WriteFRcpX : X86SchedWritePair; // Floating point reciprocal estimate (XMM).			defm WriteFRcpX : X86SchedWritePair<ReadAfterVecXLd>; // Floating point reciprocal estimate (XMM).
	defm WriteFRcpY : X86SchedWritePair; // Floating point reciprocal estimate (YMM).			defm WriteFRcpY : X86SchedWritePair<ReadAfterVecYLd>; // Floating point reciprocal estimate (YMM).
	defm WriteFRcpZ : X86SchedWritePair; // Floating point reciprocal estimate (ZMM).			defm WriteFRcpZ : X86SchedWritePair<ReadAfterVecYLd>; // Floating point reciprocal estimate (ZMM).
	defm WriteFRsqrt : X86SchedWritePair; // Floating point reciprocal square root estimate.			defm WriteFRsqrt : X86SchedWritePair<ReadAfterVecLd>; // Floating point reciprocal square root estimate.
	defm WriteFRsqrtX: X86SchedWritePair; // Floating point reciprocal square root estimate (XMM).			defm WriteFRsqrtX: X86SchedWritePair<ReadAfterVecXLd>; // Floating point reciprocal square root estimate (XMM).
	defm WriteFRsqrtY: X86SchedWritePair; // Floating point reciprocal square root estimate (YMM).			defm WriteFRsqrtY: X86SchedWritePair<ReadAfterVecYLd>; // Floating point reciprocal square root estimate (YMM).
	defm WriteFRsqrtZ: X86SchedWritePair; // Floating point reciprocal square root estimate (ZMM).			defm WriteFRsqrtZ: X86SchedWritePair<ReadAfterVecYLd>; // Floating point reciprocal square root estimate (ZMM).
	defm WriteFMA : X86SchedWritePair; // Fused Multiply Add.			defm WriteFMA : X86SchedWritePair<ReadAfterVecLd>; // Fused Multiply Add.
	defm WriteFMAX : X86SchedWritePair; // Fused Multiply Add (XMM).			defm WriteFMAX : X86SchedWritePair<ReadAfterVecXLd>; // Fused Multiply Add (XMM).
	defm WriteFMAY : X86SchedWritePair; // Fused Multiply Add (YMM).			defm WriteFMAY : X86SchedWritePair<ReadAfterVecYLd>; // Fused Multiply Add (YMM).
	defm WriteFMAZ : X86SchedWritePair; // Fused Multiply Add (ZMM).			defm WriteFMAZ : X86SchedWritePair<ReadAfterVecYLd>; // Fused Multiply Add (ZMM).
	defm WriteDPPD : X86SchedWritePair; // Floating point double dot product.			defm WriteDPPD : X86SchedWritePair<ReadAfterVecXLd>; // Floating point double dot product.
	defm WriteDPPS : X86SchedWritePair; // Floating point single dot product.			defm WriteDPPS : X86SchedWritePair<ReadAfterVecXLd>; // Floating point single dot product.
	defm WriteDPPSY : X86SchedWritePair; // Floating point single dot product (YMM).			defm WriteDPPSY : X86SchedWritePair<ReadAfterVecYLd>; // Floating point single dot product (YMM).
	defm WriteDPPSZ : X86SchedWritePair; // Floating point single dot product (ZMM).			defm WriteDPPSZ : X86SchedWritePair<ReadAfterVecYLd>; // Floating point single dot product (ZMM).
	defm WriteFSign : X86SchedWritePair; // Floating point fabs/fchs.			defm WriteFSign : X86SchedWritePair<ReadAfterVecLd>; // Floating point fabs/fchs.
	defm WriteFRnd : X86SchedWritePair; // Floating point rounding.			defm WriteFRnd : X86SchedWritePair<ReadAfterVecXLd>; // Floating point rounding.
	defm WriteFRndY : X86SchedWritePair; // Floating point rounding (YMM).			defm WriteFRndY : X86SchedWritePair<ReadAfterVecYLd>; // Floating point rounding (YMM).
	defm WriteFRndZ : X86SchedWritePair; // Floating point rounding (ZMM).			defm WriteFRndZ : X86SchedWritePair<ReadAfterVecYLd>; // Floating point rounding (ZMM).
	defm WriteFLogic : X86SchedWritePair; // Floating point and/or/xor logicals.			defm WriteFLogic : X86SchedWritePair<ReadAfterVecXLd>; // Floating point and/or/xor logicals.
	defm WriteFLogicY : X86SchedWritePair; // Floating point and/or/xor logicals (YMM).			defm WriteFLogicY : X86SchedWritePair<ReadAfterVecYLd>; // Floating point and/or/xor logicals (YMM).
	defm WriteFLogicZ : X86SchedWritePair; // Floating point and/or/xor logicals (ZMM).			defm WriteFLogicZ : X86SchedWritePair<ReadAfterVecYLd>; // Floating point and/or/xor logicals (ZMM).
	defm WriteFTest : X86SchedWritePair; // Floating point TEST instructions.			defm WriteFTest : X86SchedWritePair<ReadAfterVecXLd>; // Floating point TEST instructions.
	defm WriteFTestY : X86SchedWritePair; // Floating point TEST instructions (YMM).			defm WriteFTestY : X86SchedWritePair<ReadAfterVecYLd>; // Floating point TEST instructions (YMM).
	defm WriteFTestZ : X86SchedWritePair; // Floating point TEST instructions (ZMM).			defm WriteFTestZ : X86SchedWritePair<ReadAfterVecYLd>; // Floating point TEST instructions (ZMM).
	defm WriteFShuffle : X86SchedWritePair; // Floating point vector shuffles.			defm WriteFShuffle : X86SchedWritePair<ReadAfterVecXLd>; // Floating point vector shuffles.
	defm WriteFShuffleY : X86SchedWritePair; // Floating point vector shuffles (YMM).			defm WriteFShuffleY : X86SchedWritePair<ReadAfterVecYLd>; // Floating point vector shuffles (YMM).
	defm WriteFShuffleZ : X86SchedWritePair; // Floating point vector shuffles (ZMM).			defm WriteFShuffleZ : X86SchedWritePair<ReadAfterVecYLd>; // Floating point vector shuffles (ZMM).
	defm WriteFVarShuffle : X86SchedWritePair; // Floating point vector variable shuffles.			defm WriteFVarShuffle : X86SchedWritePair<ReadAfterVecXLd>; // Floating point vector variable shuffles.
	defm WriteFVarShuffleY : X86SchedWritePair; // Floating point vector variable shuffles (YMM).			defm WriteFVarShuffleY : X86SchedWritePair<ReadAfterVecYLd>; // Floating point vector variable shuffles (YMM).
	defm WriteFVarShuffleZ : X86SchedWritePair; // Floating point vector variable shuffles (ZMM).			defm WriteFVarShuffleZ : X86SchedWritePair<ReadAfterVecYLd>; // Floating point vector variable shuffles (ZMM).
	defm WriteFBlend : X86SchedWritePair; // Floating point vector blends.			defm WriteFBlend : X86SchedWritePair<ReadAfterVecXLd>; // Floating point vector blends.
	defm WriteFBlendY : X86SchedWritePair; // Floating point vector blends (YMM).			defm WriteFBlendY : X86SchedWritePair<ReadAfterVecYLd>; // Floating point vector blends (YMM).
	defm WriteFBlendZ : X86SchedWritePair; // Floating point vector blends (ZMM).			defm WriteFBlendZ : X86SchedWritePair<ReadAfterVecYLd>; // Floating point vector blends (ZMM).
	defm WriteFVarBlend : X86SchedWritePair; // Fp vector variable blends.			defm WriteFVarBlend : X86SchedWritePair<ReadAfterVecXLd>; // Fp vector variable blends.
	defm WriteFVarBlendY : X86SchedWritePair; // Fp vector variable blends (YMM).			defm WriteFVarBlendY : X86SchedWritePair<ReadAfterVecYLd>; // Fp vector variable blends (YMM).
	defm WriteFVarBlendZ : X86SchedWritePair; // Fp vector variable blends (YMZMM).			defm WriteFVarBlendZ : X86SchedWritePair<ReadAfterVecYLd>; // Fp vector variable blends (YMZMM).

	// FMA Scheduling helper class.			// FMA Scheduling helper class.
	class FMASC { X86FoldableSchedWrite Sched = WriteFAdd; }			class FMASC { X86FoldableSchedWrite Sched = WriteFAdd; }

	// Horizontal Add/Sub (float and integer)			// Horizontal Add/Sub (float and integer)
	defm WriteFHAdd : X86SchedWritePair;			defm WriteFHAdd : X86SchedWritePair<ReadAfterVecXLd>;
	defm WriteFHAddY : X86SchedWritePair;			defm WriteFHAddY : X86SchedWritePair<ReadAfterVecYLd>;
	defm WriteFHAddZ : X86SchedWritePair;			defm WriteFHAddZ : X86SchedWritePair<ReadAfterVecYLd>;
	defm WritePHAdd : X86SchedWritePair;			defm WritePHAdd : X86SchedWritePair<ReadAfterVecLd>;
	defm WritePHAddX : X86SchedWritePair;			defm WritePHAddX : X86SchedWritePair<ReadAfterVecXLd>;
	defm WritePHAddY : X86SchedWritePair;			defm WritePHAddY : X86SchedWritePair<ReadAfterVecYLd>;
	defm WritePHAddZ : X86SchedWritePair;			defm WritePHAddZ : X86SchedWritePair<ReadAfterVecYLd>;

	// Vector integer operations.			// Vector integer operations.
	def WriteVecLoad : SchedWrite;			def WriteVecLoad : SchedWrite;
	def WriteVecLoadX : SchedWrite;			def WriteVecLoadX : SchedWrite;
	def WriteVecLoadY : SchedWrite;			def WriteVecLoadY : SchedWrite;
	def WriteVecLoadNT : SchedWrite;			def WriteVecLoadNT : SchedWrite;
	def WriteVecLoadNTY : SchedWrite;			def WriteVecLoadNTY : SchedWrite;
	def WriteVecMaskedLoad : SchedWrite;			def WriteVecMaskedLoad : SchedWrite;
	def WriteVecMaskedLoadY : SchedWrite;			def WriteVecMaskedLoadY : SchedWrite;
	def WriteVecStore : SchedWrite;			def WriteVecStore : SchedWrite;
	def WriteVecStoreX : SchedWrite;			def WriteVecStoreX : SchedWrite;
	def WriteVecStoreY : SchedWrite;			def WriteVecStoreY : SchedWrite;
	def WriteVecStoreNT : SchedWrite;			def WriteVecStoreNT : SchedWrite;
	def WriteVecStoreNTY : SchedWrite;			def WriteVecStoreNTY : SchedWrite;
	def WriteVecMaskedStore : SchedWrite;			def WriteVecMaskedStore : SchedWrite;
	def WriteVecMaskedStoreY : SchedWrite;			def WriteVecMaskedStoreY : SchedWrite;
	def WriteVecMove : SchedWrite;			def WriteVecMove : SchedWrite;
	def WriteVecMoveX : SchedWrite;			def WriteVecMoveX : SchedWrite;
	def WriteVecMoveY : SchedWrite;			def WriteVecMoveY : SchedWrite;
	def WriteVecMoveToGpr : SchedWrite;			def WriteVecMoveToGpr : SchedWrite;
	def WriteVecMoveFromGpr : SchedWrite;			def WriteVecMoveFromGpr : SchedWrite;

	defm WriteVecALU : X86SchedWritePair; // Vector integer ALU op, no logicals.			defm WriteVecALU : X86SchedWritePair<ReadAfterVecLd>; // Vector integer ALU op, no logicals.
	defm WriteVecALUX : X86SchedWritePair; // Vector integer ALU op, no logicals (XMM).			defm WriteVecALUX : X86SchedWritePair<ReadAfterVecXLd>; // Vector integer ALU op, no logicals (XMM).
	defm WriteVecALUY : X86SchedWritePair; // Vector integer ALU op, no logicals (YMM).			defm WriteVecALUY : X86SchedWritePair<ReadAfterVecYLd>; // Vector integer ALU op, no logicals (YMM).
	defm WriteVecALUZ : X86SchedWritePair; // Vector integer ALU op, no logicals (ZMM).			defm WriteVecALUZ : X86SchedWritePair<ReadAfterVecYLd>; // Vector integer ALU op, no logicals (ZMM).
	defm WriteVecLogic : X86SchedWritePair; // Vector integer and/or/xor logicals.			defm WriteVecLogic : X86SchedWritePair<ReadAfterVecLd>; // Vector integer and/or/xor logicals.
	defm WriteVecLogicX : X86SchedWritePair; // Vector integer and/or/xor logicals (XMM).			defm WriteVecLogicX : X86SchedWritePair<ReadAfterVecXLd>; // Vector integer and/or/xor logicals (XMM).
	defm WriteVecLogicY : X86SchedWritePair; // Vector integer and/or/xor logicals (YMM).			defm WriteVecLogicY : X86SchedWritePair<ReadAfterVecYLd>; // Vector integer and/or/xor logicals (YMM).
	defm WriteVecLogicZ : X86SchedWritePair; // Vector integer and/or/xor logicals (ZMM).			defm WriteVecLogicZ : X86SchedWritePair<ReadAfterVecYLd>; // Vector integer and/or/xor logicals (ZMM).
	defm WriteVecTest : X86SchedWritePair; // Vector integer TEST instructions.			defm WriteVecTest : X86SchedWritePair<ReadAfterVecXLd>; // Vector integer TEST instructions.
	defm WriteVecTestY : X86SchedWritePair; // Vector integer TEST instructions (YMM).			defm WriteVecTestY : X86SchedWritePair<ReadAfterVecYLd>; // Vector integer TEST instructions (YMM).
	defm WriteVecTestZ : X86SchedWritePair; // Vector integer TEST instructions (ZMM).			defm WriteVecTestZ : X86SchedWritePair<ReadAfterVecYLd>; // Vector integer TEST instructions (ZMM).
	defm WriteVecShift : X86SchedWritePair; // Vector integer shifts (default).			defm WriteVecShift : X86SchedWritePair<ReadAfterVecLd>; // Vector integer shifts (default).
	defm WriteVecShiftX : X86SchedWritePair; // Vector integer shifts (XMM).			defm WriteVecShiftX : X86SchedWritePair<ReadAfterVecXLd>; // Vector integer shifts (XMM).
	defm WriteVecShiftY : X86SchedWritePair; // Vector integer shifts (YMM).			defm WriteVecShiftY : X86SchedWritePair<ReadAfterVecYLd>; // Vector integer shifts (YMM).
	defm WriteVecShiftZ : X86SchedWritePair; // Vector integer shifts (ZMM).			defm WriteVecShiftZ : X86SchedWritePair<ReadAfterVecYLd>; // Vector integer shifts (ZMM).
	defm WriteVecShiftImm : X86SchedWritePair; // Vector integer immediate shifts (default).			defm WriteVecShiftImm : X86SchedWritePair<ReadAfterVecLd>; // Vector integer immediate shifts (default).
	defm WriteVecShiftImmX: X86SchedWritePair; // Vector integer immediate shifts (XMM).			defm WriteVecShiftImmX: X86SchedWritePair<ReadAfterVecXLd>; // Vector integer immediate shifts (XMM).
	defm WriteVecShiftImmY: X86SchedWritePair; // Vector integer immediate shifts (YMM).			defm WriteVecShiftImmY: X86SchedWritePair<ReadAfterVecYLd>; // Vector integer immediate shifts (YMM).
	defm WriteVecShiftImmZ: X86SchedWritePair; // Vector integer immediate shifts (ZMM).			defm WriteVecShiftImmZ: X86SchedWritePair<ReadAfterVecYLd>; // Vector integer immediate shifts (ZMM).
	defm WriteVecIMul : X86SchedWritePair; // Vector integer multiply (default).			defm WriteVecIMul : X86SchedWritePair<ReadAfterVecLd>; // Vector integer multiply (default).
	defm WriteVecIMulX : X86SchedWritePair; // Vector integer multiply (XMM).			defm WriteVecIMulX : X86SchedWritePair<ReadAfterVecXLd>; // Vector integer multiply (XMM).
	defm WriteVecIMulY : X86SchedWritePair; // Vector integer multiply (YMM).			defm WriteVecIMulY : X86SchedWritePair<ReadAfterVecYLd>; // Vector integer multiply (YMM).
	defm WriteVecIMulZ : X86SchedWritePair; // Vector integer multiply (ZMM).			defm WriteVecIMulZ : X86SchedWritePair<ReadAfterVecYLd>; // Vector integer multiply (ZMM).
	defm WritePMULLD : X86SchedWritePair; // Vector PMULLD.			defm WritePMULLD : X86SchedWritePair<ReadAfterVecXLd>; // Vector PMULLD.
	defm WritePMULLDY : X86SchedWritePair; // Vector PMULLD (YMM).			defm WritePMULLDY : X86SchedWritePair<ReadAfterVecYLd>; // Vector PMULLD (YMM).
	defm WritePMULLDZ : X86SchedWritePair; // Vector PMULLD (ZMM).			defm WritePMULLDZ : X86SchedWritePair<ReadAfterVecYLd>; // Vector PMULLD (ZMM).
	defm WriteShuffle : X86SchedWritePair; // Vector shuffles.			defm WriteShuffle : X86SchedWritePair<ReadAfterVecLd>; // Vector shuffles.
	defm WriteShuffleX : X86SchedWritePair; // Vector shuffles (XMM).			defm WriteShuffleX : X86SchedWritePair<ReadAfterVecXLd>; // Vector shuffles (XMM).
	defm WriteShuffleY : X86SchedWritePair; // Vector shuffles (YMM).			defm WriteShuffleY : X86SchedWritePair<ReadAfterVecYLd>; // Vector shuffles (YMM).
	defm WriteShuffleZ : X86SchedWritePair; // Vector shuffles (ZMM).			defm WriteShuffleZ : X86SchedWritePair<ReadAfterVecYLd>; // Vector shuffles (ZMM).
	defm WriteVarShuffle : X86SchedWritePair; // Vector variable shuffles.			defm WriteVarShuffle : X86SchedWritePair<ReadAfterVecLd>; // Vector variable shuffles.
	defm WriteVarShuffleX : X86SchedWritePair; // Vector variable shuffles (XMM).			defm WriteVarShuffleX : X86SchedWritePair<ReadAfterVecXLd>; // Vector variable shuffles (XMM).
	defm WriteVarShuffleY : X86SchedWritePair; // Vector variable shuffles (YMM).			defm WriteVarShuffleY : X86SchedWritePair<ReadAfterVecYLd>; // Vector variable shuffles (YMM).
	defm WriteVarShuffleZ : X86SchedWritePair; // Vector variable shuffles (ZMM).			defm WriteVarShuffleZ : X86SchedWritePair<ReadAfterVecYLd>; // Vector variable shuffles (ZMM).
	defm WriteBlend : X86SchedWritePair; // Vector blends.			defm WriteBlend : X86SchedWritePair<ReadAfterVecXLd>; // Vector blends.
	defm WriteBlendY : X86SchedWritePair; // Vector blends (YMM).			defm WriteBlendY : X86SchedWritePair<ReadAfterVecYLd>; // Vector blends (YMM).
	defm WriteBlendZ : X86SchedWritePair; // Vector blends (ZMM).			defm WriteBlendZ : X86SchedWritePair<ReadAfterVecYLd>; // Vector blends (ZMM).
	defm WriteVarBlend : X86SchedWritePair; // Vector variable blends.			defm WriteVarBlend : X86SchedWritePair<ReadAfterVecXLd>; // Vector variable blends.
	defm WriteVarBlendY : X86SchedWritePair; // Vector variable blends (YMM).			defm WriteVarBlendY : X86SchedWritePair<ReadAfterVecYLd>; // Vector variable blends (YMM).
	defm WriteVarBlendZ : X86SchedWritePair; // Vector variable blends (ZMM).			defm WriteVarBlendZ : X86SchedWritePair<ReadAfterVecYLd>; // Vector variable blends (ZMM).
	defm WritePSADBW : X86SchedWritePair; // Vector PSADBW.			defm WritePSADBW : X86SchedWritePair<ReadAfterVecLd>; // Vector PSADBW.
	defm WritePSADBWX : X86SchedWritePair; // Vector PSADBW (XMM).			defm WritePSADBWX : X86SchedWritePair<ReadAfterVecXLd>; // Vector PSADBW (XMM).
	defm WritePSADBWY : X86SchedWritePair; // Vector PSADBW (YMM).			defm WritePSADBWY : X86SchedWritePair<ReadAfterVecYLd>; // Vector PSADBW (YMM).
	defm WritePSADBWZ : X86SchedWritePair; // Vector PSADBW (ZMM).			defm WritePSADBWZ : X86SchedWritePair<ReadAfterVecYLd>; // Vector PSADBW (ZMM).
	defm WriteMPSAD : X86SchedWritePair; // Vector MPSAD.			defm WriteMPSAD : X86SchedWritePair<ReadAfterVecXLd>; // Vector MPSAD.
	defm WriteMPSADY : X86SchedWritePair; // Vector MPSAD (YMM).			defm WriteMPSADY : X86SchedWritePair<ReadAfterVecYLd>; // Vector MPSAD (YMM).
	defm WriteMPSADZ : X86SchedWritePair; // Vector MPSAD (ZMM).			defm WriteMPSADZ : X86SchedWritePair<ReadAfterVecYLd>; // Vector MPSAD (ZMM).
	defm WritePHMINPOS : X86SchedWritePair; // Vector PHMINPOS.			defm WritePHMINPOS : X86SchedWritePair<ReadAfterVecXLd>; // Vector PHMINPOS.

	// Vector insert/extract operations.			// Vector insert/extract operations.
	defm WriteVecInsert : X86SchedWritePair; // Insert gpr to vector element.			defm WriteVecInsert : X86SchedWritePair; // Insert gpr to vector element.
	def WriteVecExtract : SchedWrite; // Extract vector element to gpr.			def WriteVecExtract : SchedWrite; // Extract vector element to gpr.
	def WriteVecExtractSt : SchedWrite; // Extract vector element and store.			def WriteVecExtractSt : SchedWrite; // Extract vector element and store.

	// MOVMSK operations.			// MOVMSK operations.
	def WriteFMOVMSK : SchedWrite;			def WriteFMOVMSK : SchedWrite;
	def WriteVecMOVMSK : SchedWrite;			def WriteVecMOVMSK : SchedWrite;
	def WriteVecMOVMSKY : SchedWrite;			def WriteVecMOVMSKY : SchedWrite;
	def WriteMMXMOVMSK : SchedWrite;			def WriteMMXMOVMSK : SchedWrite;

	// Conversion between integer and float.			// Conversion between integer and float.
	defm WriteCvtSD2I : X86SchedWritePair; // Double -> Integer.			defm WriteCvtSD2I : X86SchedWritePair<ReadAfterVecLd>; // Double -> Integer.
	defm WriteCvtPD2I : X86SchedWritePair; // Double -> Integer (XMM).			defm WriteCvtPD2I : X86SchedWritePair<ReadAfterVecXLd>; // Double -> Integer (XMM).
	defm WriteCvtPD2IY : X86SchedWritePair; // Double -> Integer (YMM).			defm WriteCvtPD2IY : X86SchedWritePair<ReadAfterVecYLd>; // Double -> Integer (YMM).
	defm WriteCvtPD2IZ : X86SchedWritePair; // Double -> Integer (ZMM).			defm WriteCvtPD2IZ : X86SchedWritePair<ReadAfterVecYLd>; // Double -> Integer (ZMM).

	defm WriteCvtSS2I : X86SchedWritePair; // Float -> Integer.			defm WriteCvtSS2I : X86SchedWritePair<ReadAfterVecLd>; // Float -> Integer.
	defm WriteCvtPS2I : X86SchedWritePair; // Float -> Integer (XMM).			defm WriteCvtPS2I : X86SchedWritePair<ReadAfterVecXLd>; // Float -> Integer (XMM).
	defm WriteCvtPS2IY : X86SchedWritePair; // Float -> Integer (YMM).			defm WriteCvtPS2IY : X86SchedWritePair<ReadAfterVecYLd>; // Float -> Integer (YMM).
	defm WriteCvtPS2IZ : X86SchedWritePair; // Float -> Integer (ZMM).			defm WriteCvtPS2IZ : X86SchedWritePair<ReadAfterVecYLd>; // Float -> Integer (ZMM).

	defm WriteCvtI2SD : X86SchedWritePair; // Integer -> Double.			defm WriteCvtI2SD : X86SchedWritePair<ReadAfterVecLd>; // Integer -> Double.
	defm WriteCvtI2PD : X86SchedWritePair; // Integer -> Double (XMM).			defm WriteCvtI2PD : X86SchedWritePair<ReadAfterVecXLd>; // Integer -> Double (XMM).
	defm WriteCvtI2PDY : X86SchedWritePair; // Integer -> Double (YMM).			defm WriteCvtI2PDY : X86SchedWritePair<ReadAfterVecYLd>; // Integer -> Double (YMM).
	defm WriteCvtI2PDZ : X86SchedWritePair; // Integer -> Double (ZMM).			defm WriteCvtI2PDZ : X86SchedWritePair<ReadAfterVecYLd>; // Integer -> Double (ZMM).

	defm WriteCvtI2SS : X86SchedWritePair; // Integer -> Float.			defm WriteCvtI2SS : X86SchedWritePair<ReadAfterVecLd>; // Integer -> Float.
	defm WriteCvtI2PS : X86SchedWritePair; // Integer -> Float (XMM).			defm WriteCvtI2PS : X86SchedWritePair<ReadAfterVecXLd>; // Integer -> Float (XMM).
	defm WriteCvtI2PSY : X86SchedWritePair; // Integer -> Float (YMM).			defm WriteCvtI2PSY : X86SchedWritePair<ReadAfterVecYLd>; // Integer -> Float (YMM).
	defm WriteCvtI2PSZ : X86SchedWritePair; // Integer -> Float (ZMM).			defm WriteCvtI2PSZ : X86SchedWritePair<ReadAfterVecYLd>; // Integer -> Float (ZMM).

	defm WriteCvtSS2SD : X86SchedWritePair; // Float -> Double size conversion.			defm WriteCvtSS2SD : X86SchedWritePair<ReadAfterVecLd>; // Float -> Double size conversion.
	defm WriteCvtPS2PD : X86SchedWritePair; // Float -> Double size conversion (XMM).			defm WriteCvtPS2PD : X86SchedWritePair<ReadAfterVecXLd>; // Float -> Double size conversion (XMM).
	defm WriteCvtPS2PDY : X86SchedWritePair; // Float -> Double size conversion (YMM).			defm WriteCvtPS2PDY : X86SchedWritePair<ReadAfterVecYLd>; // Float -> Double size conversion (YMM).
	defm WriteCvtPS2PDZ : X86SchedWritePair; // Float -> Double size conversion (ZMM).			defm WriteCvtPS2PDZ : X86SchedWritePair<ReadAfterVecYLd>; // Float -> Double size conversion (ZMM).

	defm WriteCvtSD2SS : X86SchedWritePair; // Double -> Float size conversion.			defm WriteCvtSD2SS : X86SchedWritePair<ReadAfterVecLd>; // Double -> Float size conversion.
	defm WriteCvtPD2PS : X86SchedWritePair; // Double -> Float size conversion (XMM).			defm WriteCvtPD2PS : X86SchedWritePair<ReadAfterVecXLd>; // Double -> Float size conversion (XMM).
	defm WriteCvtPD2PSY : X86SchedWritePair; // Double -> Float size conversion (YMM).			defm WriteCvtPD2PSY : X86SchedWritePair<ReadAfterVecYLd>; // Double -> Float size conversion (YMM).
	defm WriteCvtPD2PSZ : X86SchedWritePair; // Double -> Float size conversion (ZMM).			defm WriteCvtPD2PSZ : X86SchedWritePair<ReadAfterVecYLd>; // Double -> Float size conversion (ZMM).

	defm WriteCvtPH2PS : X86SchedWritePair; // Half -> Float size conversion.			defm WriteCvtPH2PS : X86SchedWritePair<ReadAfterVecXLd>; // Half -> Float size conversion.
	defm WriteCvtPH2PSY : X86SchedWritePair; // Half -> Float size conversion (YMM).			defm WriteCvtPH2PSY : X86SchedWritePair<ReadAfterVecYLd>; // Half -> Float size conversion (YMM).
	defm WriteCvtPH2PSZ : X86SchedWritePair; // Half -> Float size conversion (ZMM).			defm WriteCvtPH2PSZ : X86SchedWritePair<ReadAfterVecYLd>; // Half -> Float size conversion (ZMM).

	def WriteCvtPS2PH : SchedWrite; // // Float -> Half size conversion.			def WriteCvtPS2PH : SchedWrite; // // Float -> Half size conversion.
	def WriteCvtPS2PHY : SchedWrite; // // Float -> Half size conversion (YMM).			def WriteCvtPS2PHY : SchedWrite; // // Float -> Half size conversion (YMM).
	def WriteCvtPS2PHZ : SchedWrite; // // Float -> Half size conversion (ZMM).			def WriteCvtPS2PHZ : SchedWrite; // // Float -> Half size conversion (ZMM).
	def WriteCvtPS2PHSt : SchedWrite; // // Float -> Half + store size conversion.			def WriteCvtPS2PHSt : SchedWrite; // // Float -> Half + store size conversion.
	def WriteCvtPS2PHYSt : SchedWrite; // // Float -> Half + store size conversion (YMM).			def WriteCvtPS2PHYSt : SchedWrite; // // Float -> Half + store size conversion (YMM).
	def WriteCvtPS2PHZSt : SchedWrite; // // Float -> Half + store size conversion (ZMM).			def WriteCvtPS2PHZSt : SchedWrite; // // Float -> Half + store size conversion (ZMM).

	// CRC32 instruction.			// CRC32 instruction.
	defm WriteCRC32 : X86SchedWritePair;			defm WriteCRC32 : X86SchedWritePair<ReadAfterLd>;

	// Strings instructions.			// Strings instructions.
	// Packed Compare Implicit Length Strings, Return Mask			// Packed Compare Implicit Length Strings, Return Mask
	defm WritePCmpIStrM : X86SchedWritePair;			defm WritePCmpIStrM : X86SchedWritePair<ReadAfterVecXLd>;
	// Packed Compare Explicit Length Strings, Return Mask			// Packed Compare Explicit Length Strings, Return Mask
	defm WritePCmpEStrM : X86SchedWritePair;			defm WritePCmpEStrM : X86SchedWritePair<ReadAfterVecXLd>;
	// Packed Compare Implicit Length Strings, Return Index			// Packed Compare Implicit Length Strings, Return Index
	defm WritePCmpIStrI : X86SchedWritePair;			defm WritePCmpIStrI : X86SchedWritePair<ReadAfterVecXLd>;
	// Packed Compare Explicit Length Strings, Return Index			// Packed Compare Explicit Length Strings, Return Index
	defm WritePCmpEStrI : X86SchedWritePair;			defm WritePCmpEStrI : X86SchedWritePair<ReadAfterVecXLd>;

	// AES instructions.			// AES instructions.
	defm WriteAESDecEnc : X86SchedWritePair; // Decryption, encryption.			defm WriteAESDecEnc : X86SchedWritePair<ReadAfterVecXLd>; // Decryption, encryption.
	defm WriteAESIMC : X86SchedWritePair; // InvMixColumn.			defm WriteAESIMC : X86SchedWritePair<ReadAfterVecXLd>; // InvMixColumn.
	defm WriteAESKeyGen : X86SchedWritePair; // Key Generation.			defm WriteAESKeyGen : X86SchedWritePair<ReadAfterVecXLd>; // Key Generation.

	// Carry-less multiplication instructions.			// Carry-less multiplication instructions.
	defm WriteCLMul : X86SchedWritePair;			defm WriteCLMul : X86SchedWritePair<ReadAfterVecXLd>;

	// EMMS/FEMMS			// EMMS/FEMMS
	def WriteEMMS : SchedWrite;			def WriteEMMS : SchedWrite;

	// Load/store MXCSR			// Load/store MXCSR
	def WriteLDMXCSR : SchedWrite;			def WriteLDMXCSR : SchedWrite;
	def WriteSTMXCSR : SchedWrite;			def WriteSTMXCSR : SchedWrite;

	// Catch-all for expensive system instructions.			// Catch-all for expensive system instructions.
	def WriteSystem : SchedWrite;			def WriteSystem : SchedWrite;

	// AVX2.			// AVX2.
	defm WriteFShuffle256 : X86SchedWritePair; // Fp 256-bit width vector shuffles.			defm WriteFShuffle256 : X86SchedWritePair<ReadAfterVecYLd>; // Fp 256-bit width vector shuffles.
	defm WriteFVarShuffle256 : X86SchedWritePair; // Fp 256-bit width variable shuffles.			defm WriteFVarShuffle256 : X86SchedWritePair<ReadAfterVecYLd>; // Fp 256-bit width variable shuffles.
	defm WriteShuffle256 : X86SchedWritePair; // 256-bit width vector shuffles.			defm WriteShuffle256 : X86SchedWritePair<ReadAfterVecYLd>; // 256-bit width vector shuffles.
	defm WriteVarShuffle256 : X86SchedWritePair; // 256-bit width vector variable shuffles.			defm WriteVarShuffle256 : X86SchedWritePair<ReadAfterVecYLd>; // 256-bit width vector variable shuffles.
	defm WriteVarVecShift : X86SchedWritePair; // Variable vector shifts.			defm WriteVarVecShift : X86SchedWritePair<ReadAfterVecXLd>; // Variable vector shifts.
	defm WriteVarVecShiftY : X86SchedWritePair; // Variable vector shifts (YMM).			defm WriteVarVecShiftY : X86SchedWritePair<ReadAfterVecYLd>; // Variable vector shifts (YMM).
	defm WriteVarVecShiftZ : X86SchedWritePair; // Variable vector shifts (ZMM).			defm WriteVarVecShiftZ : X86SchedWritePair<ReadAfterVecYLd>; // Variable vector shifts (ZMM).

	// Old microcoded instructions that nobody use.			// Old microcoded instructions that nobody use.
	def WriteMicrocoded : SchedWrite;			def WriteMicrocoded : SchedWrite;

	// Fence instructions.			// Fence instructions.
	def WriteFence : SchedWrite;			def WriteFence : SchedWrite;

	// Nop, not very useful expect it provides a model for nops!			// Nop, not very useful expect it provides a model for nops!
	▲ Show 20 Lines • Show All 211 Lines • Show Last 20 Lines

lib/Target/X86/X86ScheduleAtom.td

	Show All 37 Lines
	def AtomPort1 : ProcResource<1>; // ALU: ALU1, bit processing, jump, and LEA			def AtomPort1 : ProcResource<1>; // ALU: ALU1, bit processing, jump, and LEA
	// SIMD/FP: SIMD ALU, FP Adder			// SIMD/FP: SIMD ALU, FP Adder

	def AtomPort01 : ProcResGroup<[AtomPort0, AtomPort1]>;			def AtomPort01 : ProcResGroup<[AtomPort0, AtomPort1]>;

	// Loads are 3 cycles, so ReadAfterLd registers needn't be available until 3			// Loads are 3 cycles, so ReadAfterLd registers needn't be available until 3
	// cycles after the memory operand.			// cycles after the memory operand.
	def : ReadAdvance<ReadAfterLd, 3>;			def : ReadAdvance<ReadAfterLd, 3>;
				def : ReadAdvance<ReadAfterVecLd, 3>;
				def : ReadAdvance<ReadAfterVecXLd, 3>;
				def : ReadAdvance<ReadAfterVecYLd, 3>;

	// Many SchedWrites are defined in pairs with and without a folded load.			// Many SchedWrites are defined in pairs with and without a folded load.
	// Instructions with folded loads are usually micro-fused, so they only appear			// Instructions with folded loads are usually micro-fused, so they only appear
	// as two micro-ops when dispatched by the schedulers.			// as two micro-ops when dispatched by the schedulers.
	// This multiclass defines the resource usage for variants with and without			// This multiclass defines the resource usage for variants with and without
	// folded loads.			// folded loads.
	multiclass AtomWriteResPair<X86FoldableSchedWrite SchedRW,			multiclass AtomWriteResPair<X86FoldableSchedWrite SchedRW,
	list<ProcResourceKind> RRPorts,			list<ProcResourceKind> RRPorts,
	▲ Show 20 Lines • Show All 848 Lines • Show Last 20 Lines

lib/Target/X86/X86ScheduleBtVer2.td

	Show First 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
	// Functional unit groups			// Functional unit groups
	def JFPX : ProcResGroup<[JFPA, JFPM]>;			def JFPX : ProcResGroup<[JFPA, JFPM]>;
	def JVALU : ProcResGroup<[JVALU0, JVALU1]>;			def JVALU : ProcResGroup<[JVALU0, JVALU1]>;

	// Integer loads are 3 cycles, so ReadAfterLd registers needn't be available until 3			// Integer loads are 3 cycles, so ReadAfterLd registers needn't be available until 3
	// cycles after the memory operand.			// cycles after the memory operand.
	def : ReadAdvance<ReadAfterLd, 3>;			def : ReadAdvance<ReadAfterLd, 3>;

				// Vector loads are 5 cycles, so ReadAfterVec*Ld registers needn't be available until 5
				// cycles after the memory operand.
				def : ReadAdvance<ReadAfterVecLd, 5>;
				def : ReadAdvance<ReadAfterVecXLd, 5>;
				def : ReadAdvance<ReadAfterVecYLd, 5>;

	// Many SchedWrites are defined in pairs with and without a folded load.			// Many SchedWrites are defined in pairs with and without a folded load.
	// Instructions with folded loads are usually micro-fused, so they only appear			// Instructions with folded loads are usually micro-fused, so they only appear
	// as two micro-ops when dispatched by the schedulers.			// as two micro-ops when dispatched by the schedulers.
	// This multiclass defines the resource usage for variants with and without			// This multiclass defines the resource usage for variants with and without
	// folded loads.			// folded loads.
	multiclass JWriteResIntPair<X86FoldableSchedWrite SchedRW,			multiclass JWriteResIntPair<X86FoldableSchedWrite SchedRW,
	list<ProcResourceKind> ExePorts,			list<ProcResourceKind> ExePorts,
	int Lat, list<int> Res = [], int UOps = 1,			int Lat, list<int> Res = [], int UOps = 1,
	▲ Show 20 Lines • Show All 699 Lines • Show Last 20 Lines

lib/Target/X86/X86ScheduleSLM.td

	Show First 20 Lines • Show All 43 Lines • ▼ Show 20 Lines

	def SLMDivider : ProcResource<1>;			def SLMDivider : ProcResource<1>;
	def SLMFPMultiplier : ProcResource<1>;			def SLMFPMultiplier : ProcResource<1>;
	def SLMFPDivider : ProcResource<1>;			def SLMFPDivider : ProcResource<1>;

	// Loads are 3 cycles, so ReadAfterLd registers needn't be available until 3			// Loads are 3 cycles, so ReadAfterLd registers needn't be available until 3
	// cycles after the memory operand.			// cycles after the memory operand.
	def : ReadAdvance<ReadAfterLd, 3>;			def : ReadAdvance<ReadAfterLd, 3>;
				def : ReadAdvance<ReadAfterVecLd, 3>;
				def : ReadAdvance<ReadAfterVecXLd, 3>;
				def : ReadAdvance<ReadAfterVecYLd, 3>;

	// Many SchedWrites are defined in pairs with and without a folded load.			// Many SchedWrites are defined in pairs with and without a folded load.
	// Instructions with folded loads are usually micro-fused, so they only appear			// Instructions with folded loads are usually micro-fused, so they only appear
	// as two micro-ops when queued in the reservation station.			// as two micro-ops when queued in the reservation station.
	// This multiclass defines the resource usage for variants with and without			// This multiclass defines the resource usage for variants with and without
	// folded loads.			// folded loads.
	multiclass SLMWriteResPair<X86FoldableSchedWrite SchedRW,			multiclass SLMWriteResPair<X86FoldableSchedWrite SchedRW,
	list<ProcResourceKind> ExePorts,			list<ProcResourceKind> ExePorts,
	▲ Show 20 Lines • Show All 448 Lines • Show Last 20 Lines

lib/Target/X86/X86ScheduleZnver1.td

	Show First 20 Lines • Show All 81 Lines • ▼ Show 20 Lines
	}			}

	// Integer Multiplication issued on ALU1.			// Integer Multiplication issued on ALU1.
	def ZnMultiplier : ProcResource<1>;			def ZnMultiplier : ProcResource<1>;

	// Integer division issued on ALU2.			// Integer division issued on ALU2.
	def ZnDivider : ProcResource<1>;			def ZnDivider : ProcResource<1>;

	// 4 Cycles load-to use Latency is captured			// 4 Cycles integer load-to use Latency is captured
	def : ReadAdvance<ReadAfterLd, 4>;			def : ReadAdvance<ReadAfterLd, 4>;

				// 8 Cycles vector load-to use Latency is captured
				def : ReadAdvance<ReadAfterVecLd, 8>;
				def : ReadAdvance<ReadAfterVecXLd, 8>;
				def : ReadAdvance<ReadAfterVecYLd, 8>;

	// The Integer PRF for Zen is 168 entries, and it holds the architectural and			// The Integer PRF for Zen is 168 entries, and it holds the architectural and
	// speculative version of the 64-bit integer registers.			// speculative version of the 64-bit integer registers.
	// Reference: "Software Optimization Guide for AMD Family 17h Processors"			// Reference: "Software Optimization Guide for AMD Family 17h Processors"
	def ZnIntegerPRF : RegisterFile<168, [GR64, CCR]>;			def ZnIntegerPRF : RegisterFile<168, [GR64, CCR]>;

	// 36 Entry (9x4 entries) floating-point Scheduler			// 36 Entry (9x4 entries) floating-point Scheduler
	def ZnFPU : ProcResGroup<[ZnFPU0, ZnFPU1, ZnFPU2, ZnFPU3]> {			def ZnFPU : ProcResGroup<[ZnFPU0, ZnFPU1, ZnFPU2, ZnFPU3]> {
	let BufferSize=36;			let BufferSize=36;
	▲ Show 20 Lines • Show All 1,449 Lines • Show Last 20 Lines

test/tools/llvm-mca/X86/read-after-ld-1.s

	Show All 9 Lines
	vaddps (%rax), %xmm1, %xmm1			vaddps (%rax), %xmm1, %xmm1

	# ALL: Iterations: 1			# ALL: Iterations: 1
	# ALL-NEXT: Instructions: 2			# ALL-NEXT: Instructions: 2

	# BDWELL-NEXT: Total Cycles: 17			# BDWELL-NEXT: Total Cycles: 17
	# BDWELL-NEXT: Total uOps: 3			# BDWELL-NEXT: Total uOps: 3

	# BTVER2-NEXT: Total Cycles: 27			# BTVER2-NEXT: Total Cycles: 25
	# BTVER2-NEXT: Total uOps: 2			# BTVER2-NEXT: Total uOps: 2

	# HASWELL-NEXT: Total Cycles: 20			# HASWELL-NEXT: Total Cycles: 19
	# HASWELL-NEXT: Total uOps: 3			# HASWELL-NEXT: Total uOps: 3

	# SANDY-NEXT: Total Cycles: 21			# SANDY-NEXT: Total Cycles: 20
	# SANDY-NEXT: Total uOps: 3			# SANDY-NEXT: Total uOps: 3

	# SKYLAKE-NEXT: Total Cycles: 19			# SKYLAKE-NEXT: Total Cycles: 18
	# SKYLAKE-NEXT: Total uOps: 3			# SKYLAKE-NEXT: Total uOps: 3

	# ZNVER1-NEXT: Total Cycles: 24			# ZNVER1-NEXT: Total Cycles: 20
	# ZNVER1-NEXT: Total uOps: 2			# ZNVER1-NEXT: Total uOps: 2

	# BDWELL: Dispatch Width: 4			# BDWELL: Dispatch Width: 4
	# BDWELL-NEXT: uOps Per Cycle: 0.18			# BDWELL-NEXT: uOps Per Cycle: 0.18
	# BDWELL-NEXT: IPC: 0.12			# BDWELL-NEXT: IPC: 0.12
	# BDWELL-NEXT: Block RThroughput: 5.0			# BDWELL-NEXT: Block RThroughput: 5.0

	# BTVER2: Dispatch Width: 2			# BTVER2: Dispatch Width: 2
	# BTVER2-NEXT: uOps Per Cycle: 0.07			# BTVER2-NEXT: uOps Per Cycle: 0.08
	# BTVER2-NEXT: IPC: 0.07			# BTVER2-NEXT: IPC: 0.08
	# BTVER2-NEXT: Block RThroughput: 19.0			# BTVER2-NEXT: Block RThroughput: 19.0

	# HASWELL: Dispatch Width: 4			# HASWELL: Dispatch Width: 4
	# HASWELL-NEXT: uOps Per Cycle: 0.15			# HASWELL-NEXT: uOps Per Cycle: 0.16
	# HASWELL-NEXT: IPC: 0.10			# HASWELL-NEXT: IPC: 0.11
	# HASWELL-NEXT: Block RThroughput: 7.0			# HASWELL-NEXT: Block RThroughput: 7.0

	# SANDY: Dispatch Width: 4			# SANDY: Dispatch Width: 4
	# SANDY-NEXT: uOps Per Cycle: 0.14			# SANDY-NEXT: uOps Per Cycle: 0.15
	# SANDY-NEXT: IPC: 0.10			# SANDY-NEXT: IPC: 0.10
	# SANDY-NEXT: Block RThroughput: 14.0			# SANDY-NEXT: Block RThroughput: 14.0

	# SKYLAKE: Dispatch Width: 6			# SKYLAKE: Dispatch Width: 6
	# SKYLAKE-NEXT: uOps Per Cycle: 0.16			# SKYLAKE-NEXT: uOps Per Cycle: 0.17
	# SKYLAKE-NEXT: IPC: 0.11			# SKYLAKE-NEXT: IPC: 0.11
	# SKYLAKE-NEXT: Block RThroughput: 3.0			# SKYLAKE-NEXT: Block RThroughput: 3.0

	# ZNVER1: Dispatch Width: 4			# ZNVER1: Dispatch Width: 4
	# ZNVER1-NEXT: uOps Per Cycle: 0.08			# ZNVER1-NEXT: uOps Per Cycle: 0.10
	# ZNVER1-NEXT: IPC: 0.08			# ZNVER1-NEXT: IPC: 0.10
	# ZNVER1-NEXT: Block RThroughput: 1.0			# ZNVER1-NEXT: Block RThroughput: 1.0

	# ALL: Timeline view:			# ALL: Timeline view:

	# BDWELL-NEXT: 0123456			# BDWELL-NEXT: 0123456
	# BDWELL-NEXT: Index 0123456789			# BDWELL-NEXT: Index 0123456789

	# BTVER2-NEXT: 0123456789			# BTVER2-NEXT: 0123456789
	# BTVER2-NEXT: Index 0123456789 0123456			# BTVER2-NEXT: Index 0123456789 01234

	# HASWELL-NEXT: 0123456789			# HASWELL-NEXT: 012345678
	# HASWELL-NEXT: Index 0123456789			# HASWELL-NEXT: Index 0123456789

	# SANDY-NEXT: 0123456789			# SANDY-NEXT: 0123456789
	# SANDY-NEXT: Index 0123456789 0			# SANDY-NEXT: Index 0123456789

	# SKYLAKE-NEXT: 012345678			# SKYLAKE-NEXT: 01234567
	# SKYLAKE-NEXT: Index 0123456789			# SKYLAKE-NEXT: Index 0123456789

	# ZNVER1-NEXT: 0123456789			# ZNVER1-NEXT: 0123456789
	# ZNVER1-NEXT: Index 0123456789 0123			# ZNVER1-NEXT: Index 0123456789

	# BDWELL: [0,0] DeeeeeeeeeeeER .. vdivps %xmm0, %xmm1, %xmm1			# BDWELL: [0,0] DeeeeeeeeeeeER .. vdivps %xmm0, %xmm1, %xmm1
	# BDWELL-NEXT: [0,1] D======eeeeeeeeER vaddps (%rax), %xmm1, %xmm1			# BDWELL-NEXT: [0,1] D======eeeeeeeeER vaddps (%rax), %xmm1, %xmm1

	# BTVER2: [0,0] DeeeeeeeeeeeeeeeeeeeER .. vdivps %xmm0, %xmm1, %xmm1			# BTVER2: [0,0] DeeeeeeeeeeeeeeeeeeeER . vdivps %xmm0, %xmm1, %xmm1
	# BTVER2-NEXT: [0,1] D================eeeeeeeeER vaddps (%rax), %xmm1, %xmm1			# BTVER2-NEXT: [0,1] D==============eeeeeeeeER vaddps (%rax), %xmm1, %xmm1

	# HASWELL: [0,0] DeeeeeeeeeeeeeER . vdivps %xmm0, %xmm1, %xmm1			# HASWELL: [0,0] DeeeeeeeeeeeeeER . vdivps %xmm0, %xmm1, %xmm1
	# HASWELL-NEXT: [0,1] D========eeeeeeeeeER vaddps (%rax), %xmm1, %xmm1			# HASWELL-NEXT: [0,1] D=======eeeeeeeeeER vaddps (%rax), %xmm1, %xmm1

	# SANDY: [0,0] DeeeeeeeeeeeeeeER . vdivps %xmm0, %xmm1, %xmm1			# SANDY: [0,0] DeeeeeeeeeeeeeeER . vdivps %xmm0, %xmm1, %xmm1
	# SANDY-NEXT: [0,1] D=========eeeeeeeeeER vaddps (%rax), %xmm1, %xmm1			# SANDY-NEXT: [0,1] D========eeeeeeeeeER vaddps (%rax), %xmm1, %xmm1

	# SKYLAKE: [0,0] DeeeeeeeeeeeER . . vdivps %xmm0, %xmm1, %xmm1			# SKYLAKE: [0,0] DeeeeeeeeeeeER . . vdivps %xmm0, %xmm1, %xmm1
	# SKYLAKE-NEXT: [0,1] D======eeeeeeeeeeER vaddps (%rax), %xmm1, %xmm1			# SKYLAKE-NEXT: [0,1] D=====eeeeeeeeeeER vaddps (%rax), %xmm1, %xmm1

	# ZNVER1: [0,0] DeeeeeeeeeeeeeeeER . . vdivps %xmm0, %xmm1, %xmm1			# ZNVER1: [0,0] DeeeeeeeeeeeeeeeER . vdivps %xmm0, %xmm1, %xmm1
	# ZNVER1-NEXT: [0,1] D===========eeeeeeeeeeER vaddps (%rax), %xmm1, %xmm1			# ZNVER1-NEXT: [0,1] D=======eeeeeeeeeeER vaddps (%rax), %xmm1, %xmm1

	# ALL: Average Wait times (based on the timeline view):			# ALL: Average Wait times (based on the timeline view):
	# ALL-NEXT: [0]: Executions			# ALL-NEXT: [0]: Executions
	# ALL-NEXT: [1]: Average time spent waiting in a scheduler's queue			# ALL-NEXT: [1]: Average time spent waiting in a scheduler's queue
	# ALL-NEXT: [2]: Average time spent waiting in a scheduler's queue while ready			# ALL-NEXT: [2]: Average time spent waiting in a scheduler's queue while ready
	# ALL-NEXT: [3]: Average time elapsed from WB until retire stage			# ALL-NEXT: [3]: Average time elapsed from WB until retire stage

	# ALL: [0] [1] [2] [3]			# ALL: [0] [1] [2] [3]
	# ALL-NEXT: 0. 1 1.0 1.0 0.0 vdivps %xmm0, %xmm1, %xmm1			# ALL-NEXT: 0. 1 1.0 1.0 0.0 vdivps %xmm0, %xmm1, %xmm1

	# BDWELL-NEXT: 1. 1 7.0 0.0 0.0 vaddps (%rax), %xmm1, %xmm1			# BDWELL-NEXT: 1. 1 7.0 0.0 0.0 vaddps (%rax), %xmm1, %xmm1
	# BTVER2-NEXT: 1. 1 17.0 0.0 0.0 vaddps (%rax), %xmm1, %xmm1			# BTVER2-NEXT: 1. 1 15.0 0.0 0.0 vaddps (%rax), %xmm1, %xmm1
	# HASWELL-NEXT: 1. 1 9.0 0.0 0.0 vaddps (%rax), %xmm1, %xmm1			# HASWELL-NEXT: 1. 1 8.0 0.0 0.0 vaddps (%rax), %xmm1, %xmm1
	# SANDY-NEXT: 1. 1 10.0 0.0 0.0 vaddps (%rax), %xmm1, %xmm1			# SANDY-NEXT: 1. 1 9.0 0.0 0.0 vaddps (%rax), %xmm1, %xmm1
	# SKYLAKE-NEXT: 1. 1 7.0 0.0 0.0 vaddps (%rax), %xmm1, %xmm1			# SKYLAKE-NEXT: 1. 1 6.0 0.0 0.0 vaddps (%rax), %xmm1, %xmm1
	# ZNVER1-NEXT: 1. 1 12.0 0.0 0.0 vaddps (%rax), %xmm1, %xmm1			# ZNVER1-NEXT: 1. 1 8.0 0.0 0.0 vaddps (%rax), %xmm1, %xmm1

test/tools/llvm-mca/X86/read-after-ld-2.s

	Show All 11 Lines
	add $1, %edx			add $1, %edx
	vpaddd (%r8), %ymm0, %ymm0			vpaddd (%r8), %ymm0, %ymm0
	add $32, %r8			add $32, %r8
	cmp %edi, %edx			cmp %edi, %edx

	# ALL: Iterations: 100			# ALL: Iterations: 100
	# ALL-NEXT: Instructions: 400			# ALL-NEXT: Instructions: 400

	# BDWELL-NEXT: Total Cycles: 208			# BDWELL-NEXT: Total Cycles: 142
	# BDWELL-NEXT: Total uOps: 500			# BDWELL-NEXT: Total uOps: 500

	# HASWELL-NEXT: Total Cycles: 308			# HASWELL-NEXT: Total Cycles: 143
	# HASWELL-NEXT: Total uOps: 500			# HASWELL-NEXT: Total uOps: 500

	# SKYLAKE-NEXT: Total Cycles: 803			# SKYLAKE-NEXT: Total Cycles: 803
	# SKYLAKE-NEXT: Total uOps: 500			# SKYLAKE-NEXT: Total uOps: 500

	# ZNVER1-NEXT: Total Cycles: 407			# ZNVER1-NEXT: Total Cycles: 110
	# ZNVER1-NEXT: Total uOps: 400			# ZNVER1-NEXT: Total uOps: 400

	# BDWELL: Dispatch Width: 4			# BDWELL: Dispatch Width: 4
	# BDWELL-NEXT: uOps Per Cycle: 2.40			# BDWELL-NEXT: uOps Per Cycle: 3.52
	# BDWELL-NEXT: IPC: 1.92			# BDWELL-NEXT: IPC: 2.82
	# BDWELL-NEXT: Block RThroughput: 1.3			# BDWELL-NEXT: Block RThroughput: 1.3

	# HASWELL: Dispatch Width: 4			# HASWELL: Dispatch Width: 4
	# HASWELL-NEXT: uOps Per Cycle: 1.62			# HASWELL-NEXT: uOps Per Cycle: 3.50
	# HASWELL-NEXT: IPC: 1.30			# HASWELL-NEXT: IPC: 2.80
	# HASWELL-NEXT: Block RThroughput: 1.3			# HASWELL-NEXT: Block RThroughput: 1.3

	# SKYLAKE: Dispatch Width: 6			# SKYLAKE: Dispatch Width: 6
	# SKYLAKE-NEXT: uOps Per Cycle: 0.62			# SKYLAKE-NEXT: uOps Per Cycle: 0.62
	# SKYLAKE-NEXT: IPC: 0.50			# SKYLAKE-NEXT: IPC: 0.50
	# SKYLAKE-NEXT: Block RThroughput: 0.8			# SKYLAKE-NEXT: Block RThroughput: 0.8

	# ZNVER1: Dispatch Width: 4			# ZNVER1: Dispatch Width: 4
	# ZNVER1-NEXT: uOps Per Cycle: 0.98			# ZNVER1-NEXT: uOps Per Cycle: 3.64
	# ZNVER1-NEXT: IPC: 0.98			# ZNVER1-NEXT: IPC: 3.64
	# ZNVER1-NEXT: Block RThroughput: 1.0			# ZNVER1-NEXT: Block RThroughput: 1.0

	# ALL: Timeline view:			# ALL: Timeline view:

	# BDWELL-NEXT: 0123456789			# BDWELL-NEXT: 0123456789
	# BDWELL-NEXT: Index 0123456789 01234567			# BDWELL-NEXT: Index 0123456789 01

	# HASWELL-NEXT: 0123456789 01234567			# HASWELL-NEXT: 0123456789
	# HASWELL-NEXT: Index 0123456789 0123456789			# HASWELL-NEXT: Index 0123456789 012

	# SKYLAKE-NEXT: 0123456789 0123456789 0123456789 01234			# SKYLAKE-NEXT: 0123456789 0123456789 0123456789 01234
	# SKYLAKE-NEXT: Index 0123456789 0123456789 0123456789 0123456789			# SKYLAKE-NEXT: Index 0123456789 0123456789 0123456789 0123456789

	# ZNVER1-NEXT: 0123456789 0123456789			# ZNVER1-NEXT: 0123456789
	# ZNVER1-NEXT: Index 0123456789 0123456789 0123456			# ZNVER1-NEXT: Index 0123456789

	# BDWELL: [0,0] DeER . . . . . . addl $1, %edx			# BDWELL: [0,0] DeER . . . .. addl $1, %edx
	# BDWELL-NEXT: [0,1] DeeeeeeeER. . . . . vpaddd (%r8), %ymm0, %ymm0			# BDWELL-NEXT: [0,1] DeeeeeeeER. . .. vpaddd (%r8), %ymm0, %ymm0
	# BDWELL-NEXT: [0,2] DeE------R. . . . . addq $32, %r8			# BDWELL-NEXT: [0,2] DeE------R. . .. addq $32, %r8
	# BDWELL-NEXT: [0,3] .DeE-----R. . . . . cmpl %edi, %edx			# BDWELL-NEXT: [0,3] .DeE-----R. . .. cmpl %edi, %edx
	# BDWELL-NEXT: [1,0] .DeE-----R. . . . . addl $1, %edx			# BDWELL-NEXT: [1,0] .DeE-----R. . .. addl $1, %edx
	# BDWELL-NEXT: [1,1] .D=eeeeeeeER . . . . vpaddd (%r8), %ymm0, %ymm0			# BDWELL-NEXT: [1,1] .DeeeeeeeER . .. vpaddd (%r8), %ymm0, %ymm0
	# BDWELL-NEXT: [1,2] . DeE------R . . . . addq $32, %r8			# BDWELL-NEXT: [1,2] . DeE-----R . .. addq $32, %r8
	# BDWELL-NEXT: [1,3] . DeE------R . . . . cmpl %edi, %edx			# BDWELL-NEXT: [1,3] . DeE-----R . .. cmpl %edi, %edx
	# BDWELL-NEXT: [2,0] . DeE------R . . . . addl $1, %edx			# BDWELL-NEXT: [2,0] . DeE-----R . .. addl $1, %edx
	# BDWELL-NEXT: [2,1] . D=eeeeeeeER . . . . vpaddd (%r8), %ymm0, %ymm0			# BDWELL-NEXT: [2,1] . DeeeeeeeER . .. vpaddd (%r8), %ymm0, %ymm0
	# BDWELL-NEXT: [2,2] . DeE-------R . . . . addq $32, %r8			# BDWELL-NEXT: [2,2] . DeE------R . .. addq $32, %r8
	# BDWELL-NEXT: [2,3] . DeE-------R . . . . cmpl %edi, %edx			# BDWELL-NEXT: [2,3] . DeE------R . .. cmpl %edi, %edx
	# BDWELL-NEXT: [3,0] . DeE------R . . . . addl $1, %edx			# BDWELL-NEXT: [3,0] . DeE-----R . .. addl $1, %edx
	# BDWELL-NEXT: [3,1] . D==eeeeeeeER . . . vpaddd (%r8), %ymm0, %ymm0			# BDWELL-NEXT: [3,1] . DeeeeeeeER . .. vpaddd (%r8), %ymm0, %ymm0
	# BDWELL-NEXT: [3,2] . DeE--------R . . . addq $32, %r8			# BDWELL-NEXT: [3,2] . DeE------R . .. addq $32, %r8
	# BDWELL-NEXT: [3,3] . DeE-------R . . . cmpl %edi, %edx			# BDWELL-NEXT: [3,3] . DeE-----R . .. cmpl %edi, %edx
	# BDWELL-NEXT: [4,0] . DeE-------R . . . addl $1, %edx			# BDWELL-NEXT: [4,0] . DeE-----R . .. addl $1, %edx
	# BDWELL-NEXT: [4,1] . D===eeeeeeeER . . . vpaddd (%r8), %ymm0, %ymm0			# BDWELL-NEXT: [4,1] . DeeeeeeeER. .. vpaddd (%r8), %ymm0, %ymm0
	# BDWELL-NEXT: [4,2] . .DeE--------R . . . addq $32, %r8			# BDWELL-NEXT: [4,2] . .DeE-----R. .. addq $32, %r8
	# BDWELL-NEXT: [4,3] . .DeE--------R . . . cmpl %edi, %edx			# BDWELL-NEXT: [4,3] . .DeE-----R. .. cmpl %edi, %edx
	# BDWELL-NEXT: [5,0] . .DeE--------R . . . addl $1, %edx			# BDWELL-NEXT: [5,0] . .DeE-----R. .. addl $1, %edx
	# BDWELL-NEXT: [5,1] . . D===eeeeeeeER. . . vpaddd (%r8), %ymm0, %ymm0			# BDWELL-NEXT: [5,1] . . DeeeeeeeER .. vpaddd (%r8), %ymm0, %ymm0
	# BDWELL-NEXT: [5,2] . . DeE---------R. . . addq $32, %r8			# BDWELL-NEXT: [5,2] . . DeE------R .. addq $32, %r8
	# BDWELL-NEXT: [5,3] . . DeE---------R. . . cmpl %edi, %edx			# BDWELL-NEXT: [5,3] . . DeE------R .. cmpl %edi, %edx
	# BDWELL-NEXT: [6,0] . . DeE--------R. . . addl $1, %edx			# BDWELL-NEXT: [6,0] . . DeE-----R .. addl $1, %edx
	# BDWELL-NEXT: [6,1] . . D====eeeeeeeER . . vpaddd (%r8), %ymm0, %ymm0			# BDWELL-NEXT: [6,1] . . DeeeeeeeER .. vpaddd (%r8), %ymm0, %ymm0
	# BDWELL-NEXT: [6,2] . . DeE----------R . . addq $32, %r8			# BDWELL-NEXT: [6,2] . . DeE------R .. addq $32, %r8
	# BDWELL-NEXT: [6,3] . . DeE---------R . . cmpl %edi, %edx			# BDWELL-NEXT: [6,3] . . DeE-----R .. cmpl %edi, %edx
	# BDWELL-NEXT: [7,0] . . DeE---------R . . addl $1, %edx			# BDWELL-NEXT: [7,0] . . DeE-----R .. addl $1, %edx
	# BDWELL-NEXT: [7,1] . . D=====eeeeeeeER . . vpaddd (%r8), %ymm0, %ymm0			# BDWELL-NEXT: [7,1] . . DeeeeeeeER .. vpaddd (%r8), %ymm0, %ymm0
	# BDWELL-NEXT: [7,2] . . DeE----------R . . addq $32, %r8			# BDWELL-NEXT: [7,2] . . DeE-----R .. addq $32, %r8
	# BDWELL-NEXT: [7,3] . . DeE----------R . . cmpl %edi, %edx			# BDWELL-NEXT: [7,3] . . DeE-----R .. cmpl %edi, %edx
	# BDWELL-NEXT: [8,0] . . DeE----------R . . addl $1, %edx			# BDWELL-NEXT: [8,0] . . DeE-----R .. addl $1, %edx
	# BDWELL-NEXT: [8,1] . . .D=====eeeeeeeER . vpaddd (%r8), %ymm0, %ymm0			# BDWELL-NEXT: [8,1] . . .DeeeeeeeER. vpaddd (%r8), %ymm0, %ymm0
	# BDWELL-NEXT: [8,2] . . .DeE-----------R . addq $32, %r8			# BDWELL-NEXT: [8,2] . . .DeE------R. addq $32, %r8
	# BDWELL-NEXT: [8,3] . . .DeE-----------R . cmpl %edi, %edx			# BDWELL-NEXT: [8,3] . . .DeE------R. cmpl %edi, %edx
	# BDWELL-NEXT: [9,0] . . . DeE----------R . addl $1, %edx			# BDWELL-NEXT: [9,0] . . . DeE-----R. addl $1, %edx
	# BDWELL-NEXT: [9,1] . . . D======eeeeeeeER vpaddd (%r8), %ymm0, %ymm0			# BDWELL-NEXT: [9,1] . . . DeeeeeeeER vpaddd (%r8), %ymm0, %ymm0
	# BDWELL-NEXT: [9,2] . . . DeE------------R addq $32, %r8			# BDWELL-NEXT: [9,2] . . . DeE------R addq $32, %r8
	# BDWELL-NEXT: [9,3] . . . DeE-----------R cmpl %edi, %edx			# BDWELL-NEXT: [9,3] . . . DeE-----R cmpl %edi, %edx

	# HASWELL: [0,0] DeER . . . . . . . . addl $1, %edx			# HASWELL: [0,0] DeER . . . . . addl $1, %edx
	# HASWELL-NEXT: [0,1] DeeeeeeeeER . . . . . . vpaddd (%r8), %ymm0, %ymm0			# HASWELL-NEXT: [0,1] DeeeeeeeeER . . . vpaddd (%r8), %ymm0, %ymm0
	# HASWELL-NEXT: [0,2] DeE-------R . . . . . . addq $32, %r8			# HASWELL-NEXT: [0,2] DeE-------R . . . addq $32, %r8
	# HASWELL-NEXT: [0,3] .DeE------R . . . . . . cmpl %edi, %edx			# HASWELL-NEXT: [0,3] .DeE------R . . . cmpl %edi, %edx
	# HASWELL-NEXT: [1,0] .DeE------R . . . . . . addl $1, %edx			# HASWELL-NEXT: [1,0] .DeE------R . . . addl $1, %edx
	# HASWELL-NEXT: [1,1] .D==eeeeeeeeER . . . . . . vpaddd (%r8), %ymm0, %ymm0			# HASWELL-NEXT: [1,1] .DeeeeeeeeER . . . vpaddd (%r8), %ymm0, %ymm0
	# HASWELL-NEXT: [1,2] . DeE--------R . . . . . . addq $32, %r8			# HASWELL-NEXT: [1,2] . DeE------R . . . addq $32, %r8
	# HASWELL-NEXT: [1,3] . DeE--------R . . . . . . cmpl %edi, %edx			# HASWELL-NEXT: [1,3] . DeE------R . . . cmpl %edi, %edx
	# HASWELL-NEXT: [2,0] . DeE--------R . . . . . . addl $1, %edx			# HASWELL-NEXT: [2,0] . DeE------R . . . addl $1, %edx
	# HASWELL-NEXT: [2,1] . D===eeeeeeeeER . . . . . vpaddd (%r8), %ymm0, %ymm0			# HASWELL-NEXT: [2,1] . DeeeeeeeeER . . . vpaddd (%r8), %ymm0, %ymm0
	# HASWELL-NEXT: [2,2] . DeE----------R . . . . . addq $32, %r8			# HASWELL-NEXT: [2,2] . DeE-------R . . . addq $32, %r8
	# HASWELL-NEXT: [2,3] . DeE----------R . . . . . cmpl %edi, %edx			# HASWELL-NEXT: [2,3] . DeE-------R . . . cmpl %edi, %edx
	# HASWELL-NEXT: [3,0] . DeE---------R . . . . . addl $1, %edx			# HASWELL-NEXT: [3,0] . DeE------R . . . addl $1, %edx
	# HASWELL-NEXT: [3,1] . D=====eeeeeeeeER. . . . . vpaddd (%r8), %ymm0, %ymm0			# HASWELL-NEXT: [3,1] . DeeeeeeeeER. . . vpaddd (%r8), %ymm0, %ymm0
	# HASWELL-NEXT: [3,2] . DeE------------R. . . . . addq $32, %r8			# HASWELL-NEXT: [3,2] . DeE-------R. . . addq $32, %r8
	# HASWELL-NEXT: [3,3] . DeE-----------R. . . . . cmpl %edi, %edx			# HASWELL-NEXT: [3,3] . DeE------R. . . cmpl %edi, %edx
	# HASWELL-NEXT: [4,0] . DeE-----------R. . . . . addl $1, %edx			# HASWELL-NEXT: [4,0] . DeE------R. . . addl $1, %edx
	# HASWELL-NEXT: [4,1] . D=======eeeeeeeeER . . . . vpaddd (%r8), %ymm0, %ymm0			# HASWELL-NEXT: [4,1] . DeeeeeeeeER . . vpaddd (%r8), %ymm0, %ymm0
	# HASWELL-NEXT: [4,2] . .DeE-------------R . . . . addq $32, %r8			# HASWELL-NEXT: [4,2] . .DeE------R . . addq $32, %r8
	# HASWELL-NEXT: [4,3] . .DeE-------------R . . . . cmpl %edi, %edx			# HASWELL-NEXT: [4,3] . .DeE------R . . cmpl %edi, %edx
	# HASWELL-NEXT: [5,0] . .DeE-------------R . . . . addl $1, %edx			# HASWELL-NEXT: [5,0] . .DeE------R . . addl $1, %edx
	# HASWELL-NEXT: [5,1] . . D========eeeeeeeeER . . . vpaddd (%r8), %ymm0, %ymm0			# HASWELL-NEXT: [5,1] . . DeeeeeeeeER . . vpaddd (%r8), %ymm0, %ymm0
	# HASWELL-NEXT: [5,2] . . DeE---------------R . . . addq $32, %r8			# HASWELL-NEXT: [5,2] . . DeE-------R . . addq $32, %r8
	# HASWELL-NEXT: [5,3] . . DeE---------------R . . . cmpl %edi, %edx			# HASWELL-NEXT: [5,3] . . DeE-------R . . cmpl %edi, %edx
	# HASWELL-NEXT: [6,0] . . DeE--------------R . . . addl $1, %edx			# HASWELL-NEXT: [6,0] . . DeE------R . . addl $1, %edx
	# HASWELL-NEXT: [6,1] . . D==========eeeeeeeeER . . . vpaddd (%r8), %ymm0, %ymm0			# HASWELL-NEXT: [6,1] . . DeeeeeeeeER . . vpaddd (%r8), %ymm0, %ymm0
	# HASWELL-NEXT: [6,2] . . DeE-----------------R . . . addq $32, %r8			# HASWELL-NEXT: [6,2] . . DeE-------R . . addq $32, %r8
	# HASWELL-NEXT: [6,3] . . DeE----------------R . . . cmpl %edi, %edx			# HASWELL-NEXT: [6,3] . . DeE------R . . cmpl %edi, %edx
	# HASWELL-NEXT: [7,0] . . DeE----------------R . . . addl $1, %edx			# HASWELL-NEXT: [7,0] . . DeE------R . . addl $1, %edx
	# HASWELL-NEXT: [7,1] . . D============eeeeeeeeER . . vpaddd (%r8), %ymm0, %ymm0			# HASWELL-NEXT: [7,1] . . DeeeeeeeeER. . vpaddd (%r8), %ymm0, %ymm0
	# HASWELL-NEXT: [7,2] . . DeE------------------R . . addq $32, %r8			# HASWELL-NEXT: [7,2] . . DeE------R. . addq $32, %r8
	# HASWELL-NEXT: [7,3] . . DeE------------------R . . cmpl %edi, %edx			# HASWELL-NEXT: [7,3] . . DeE------R. . cmpl %edi, %edx
	# HASWELL-NEXT: [8,0] . . DeE------------------R . . addl $1, %edx			# HASWELL-NEXT: [8,0] . . DeE------R. . addl $1, %edx
	# HASWELL-NEXT: [8,1] . . .D=============eeeeeeeeER. . vpaddd (%r8), %ymm0, %ymm0			# HASWELL-NEXT: [8,1] . . .DeeeeeeeeER. vpaddd (%r8), %ymm0, %ymm0
	# HASWELL-NEXT: [8,2] . . .DeE--------------------R. . addq $32, %r8			# HASWELL-NEXT: [8,2] . . .DeE-------R. addq $32, %r8
	# HASWELL-NEXT: [8,3] . . .DeE--------------------R. . cmpl %edi, %edx			# HASWELL-NEXT: [8,3] . . .DeE-------R. cmpl %edi, %edx
	# HASWELL-NEXT: [9,0] . . . DeE-------------------R. . addl $1, %edx			# HASWELL-NEXT: [9,0] . . . DeE------R. addl $1, %edx
	# HASWELL-NEXT: [9,1] . . . D===============eeeeeeeeER vpaddd (%r8), %ymm0, %ymm0			# HASWELL-NEXT: [9,1] . . . DeeeeeeeeER vpaddd (%r8), %ymm0, %ymm0
	# HASWELL-NEXT: [9,2] . . . DeE----------------------R addq $32, %r8			# HASWELL-NEXT: [9,2] . . . DeE-------R addq $32, %r8
	# HASWELL-NEXT: [9,3] . . . DeE---------------------R cmpl %edi, %edx			# HASWELL-NEXT: [9,3] . . . DeE------R cmpl %edi, %edx

	# SKYLAKE: [0,0] DeER . . . . . . . . . . . . . . . addl $1, %edx			# SKYLAKE: [0,0] DeER . . . . . . . . . . . . . . . addl $1, %edx
	# SKYLAKE-NEXT: [0,1] DeeeeeeeeER . . . . . . . . . . . . . vpaddd (%r8), %ymm0, %ymm0			# SKYLAKE-NEXT: [0,1] DeeeeeeeeER . . . . . . . . . . . . . vpaddd (%r8), %ymm0, %ymm0
	# SKYLAKE-NEXT: [0,2] DeE-------R . . . . . . . . . . . . . addq $32, %r8			# SKYLAKE-NEXT: [0,2] DeE-------R . . . . . . . . . . . . . addq $32, %r8
	# SKYLAKE-NEXT: [0,3] D=eE------R . . . . . . . . . . . . . cmpl %edi, %edx			# SKYLAKE-NEXT: [0,3] D=eE------R . . . . . . . . . . . . . cmpl %edi, %edx
	# SKYLAKE-NEXT: [1,0] D=eE------R . . . . . . . . . . . . . addl $1, %edx			# SKYLAKE-NEXT: [1,0] D=eE------R . . . . . . . . . . . . . addl $1, %edx
	# SKYLAKE-NEXT: [1,1] .D=======eeeeeeeeER . . . . . . . . . . . . vpaddd (%r8), %ymm0, %ymm0			# SKYLAKE-NEXT: [1,1] .D=======eeeeeeeeER . . . . . . . . . . . . vpaddd (%r8), %ymm0, %ymm0
	# SKYLAKE-NEXT: [1,2] .DeE--------------R . . . . . . . . . . . . addq $32, %r8			# SKYLAKE-NEXT: [1,2] .DeE--------------R . . . . . . . . . . . . addq $32, %r8
	Show All 23 Lines
	# SKYLAKE-NEXT: [7,2] . . DeE--------------------------------------------------------R . . addq $32, %r8			# SKYLAKE-NEXT: [7,2] . . DeE--------------------------------------------------------R . . addq $32, %r8
	# SKYLAKE-NEXT: [7,3] . . D=eE-------------------------------------------------------R . . cmpl %edi, %edx			# SKYLAKE-NEXT: [7,3] . . D=eE-------------------------------------------------------R . . cmpl %edi, %edx
	# SKYLAKE-NEXT: [8,0] . . D=eE-------------------------------------------------------R . . addl $1, %edx			# SKYLAKE-NEXT: [8,0] . . D=eE-------------------------------------------------------R . . addl $1, %edx
	# SKYLAKE-NEXT: [8,1] . . D========================================================eeeeeeeeER vpaddd (%r8), %ymm0, %ymm0			# SKYLAKE-NEXT: [8,1] . . D========================================================eeeeeeeeER vpaddd (%r8), %ymm0, %ymm0
	# SKYLAKE-NEXT: [8,2] . . DeE---------------------------------------------------------------R addq $32, %r8			# SKYLAKE-NEXT: [8,2] . . DeE---------------------------------------------------------------R addq $32, %r8
	# SKYLAKE-NEXT: [8,3] . . D=eE--------------------------------------------------------------R cmpl %edi, %edx			# SKYLAKE-NEXT: [8,3] . . D=eE--------------------------------------------------------------R cmpl %edi, %edx
	# SKYLAKE-NEXT: [9,0] . . D=eE--------------------------------------------------------------R addl $1, %edx			# SKYLAKE-NEXT: [9,0] . . D=eE--------------------------------------------------------------R addl $1, %edx

	# ZNVER1: [0,0] DeER . . . . . . . . .. addl $1, %edx			# ZNVER1: [0,0] DeER . . . . addl $1, %edx
	# ZNVER1-NEXT: [0,1] DeeeeeeeeER . . . . . . .. vpaddd (%r8), %ymm0, %ymm0			# ZNVER1-NEXT: [0,1] DeeeeeeeeER . . vpaddd (%r8), %ymm0, %ymm0
	# ZNVER1-NEXT: [0,2] DeE-------R . . . . . . .. addq $32, %r8			# ZNVER1-NEXT: [0,2] DeE-------R . . addq $32, %r8
	# ZNVER1-NEXT: [0,3] D=eE------R . . . . . . .. cmpl %edi, %edx			# ZNVER1-NEXT: [0,3] D=eE------R . . cmpl %edi, %edx
	# ZNVER1-NEXT: [1,0] .DeE------R . . . . . . .. addl $1, %edx			# ZNVER1-NEXT: [1,0] .DeE------R . . addl $1, %edx
	# ZNVER1-NEXT: [1,1] .D===eeeeeeeeER. . . . . . .. vpaddd (%r8), %ymm0, %ymm0			# ZNVER1-NEXT: [1,1] .DeeeeeeeeER . . vpaddd (%r8), %ymm0, %ymm0
	# ZNVER1-NEXT: [1,2] .DeE----------R. . . . . . .. addq $32, %r8			# ZNVER1-NEXT: [1,2] .DeE-------R . . addq $32, %r8
	# ZNVER1-NEXT: [1,3] .D=eE---------R. . . . . . .. cmpl %edi, %edx			# ZNVER1-NEXT: [1,3] .D=eE------R . . cmpl %edi, %edx
	# ZNVER1-NEXT: [2,0] . DeE---------R. . . . . . .. addl $1, %edx			# ZNVER1-NEXT: [2,0] . DeE------R . . addl $1, %edx
	# ZNVER1-NEXT: [2,1] . D======eeeeeeeeER . . . . . .. vpaddd (%r8), %ymm0, %ymm0			# ZNVER1-NEXT: [2,1] . DeeeeeeeeER . . vpaddd (%r8), %ymm0, %ymm0
	# ZNVER1-NEXT: [2,2] . DeE-------------R . . . . . .. addq $32, %r8			# ZNVER1-NEXT: [2,2] . DeE-------R . . addq $32, %r8
	# ZNVER1-NEXT: [2,3] . D=eE------------R . . . . . .. cmpl %edi, %edx			# ZNVER1-NEXT: [2,3] . D=eE------R . . cmpl %edi, %edx
	# ZNVER1-NEXT: [3,0] . DeE------------R . . . . . .. addl $1, %edx			# ZNVER1-NEXT: [3,0] . DeE------R . . addl $1, %edx
	# ZNVER1-NEXT: [3,1] . D=========eeeeeeeeER . . . . .. vpaddd (%r8), %ymm0, %ymm0			# ZNVER1-NEXT: [3,1] . DeeeeeeeeER . . vpaddd (%r8), %ymm0, %ymm0
	# ZNVER1-NEXT: [3,2] . DeE----------------R . . . . .. addq $32, %r8			# ZNVER1-NEXT: [3,2] . DeE-------R . . addq $32, %r8
	# ZNVER1-NEXT: [3,3] . D=eE---------------R . . . . .. cmpl %edi, %edx			# ZNVER1-NEXT: [3,3] . D=eE------R . . cmpl %edi, %edx
	# ZNVER1-NEXT: [4,0] . DeE---------------R . . . . .. addl $1, %edx			# ZNVER1-NEXT: [4,0] . DeE------R . . addl $1, %edx
	# ZNVER1-NEXT: [4,1] . D============eeeeeeeeER . . . .. vpaddd (%r8), %ymm0, %ymm0			# ZNVER1-NEXT: [4,1] . DeeeeeeeeER. . vpaddd (%r8), %ymm0, %ymm0
	# ZNVER1-NEXT: [4,2] . DeE-------------------R . . . .. addq $32, %r8			# ZNVER1-NEXT: [4,2] . DeE-------R. . addq $32, %r8
	# ZNVER1-NEXT: [4,3] . D=eE------------------R . . . .. cmpl %edi, %edx			# ZNVER1-NEXT: [4,3] . D=eE------R. . cmpl %edi, %edx
	# ZNVER1-NEXT: [5,0] . DeE------------------R . . . .. addl $1, %edx			# ZNVER1-NEXT: [5,0] . DeE------R. . addl $1, %edx
	# ZNVER1-NEXT: [5,1] . D===============eeeeeeeeER . . .. vpaddd (%r8), %ymm0, %ymm0			# ZNVER1-NEXT: [5,1] . DeeeeeeeeER . vpaddd (%r8), %ymm0, %ymm0
	# ZNVER1-NEXT: [5,2] . DeE----------------------R . . .. addq $32, %r8			# ZNVER1-NEXT: [5,2] . DeE-------R . addq $32, %r8
	# ZNVER1-NEXT: [5,3] . D=eE---------------------R . . .. cmpl %edi, %edx			# ZNVER1-NEXT: [5,3] . D=eE------R . cmpl %edi, %edx
	# ZNVER1-NEXT: [6,0] . .DeE---------------------R . . .. addl $1, %edx			# ZNVER1-NEXT: [6,0] . .DeE------R . addl $1, %edx
	# ZNVER1-NEXT: [6,1] . .D==================eeeeeeeeER. . .. vpaddd (%r8), %ymm0, %ymm0			# ZNVER1-NEXT: [6,1] . .DeeeeeeeeER . vpaddd (%r8), %ymm0, %ymm0
	# ZNVER1-NEXT: [6,2] . .DeE-------------------------R. . .. addq $32, %r8			# ZNVER1-NEXT: [6,2] . .DeE-------R . addq $32, %r8
	# ZNVER1-NEXT: [6,3] . .D=eE------------------------R. . .. cmpl %edi, %edx			# ZNVER1-NEXT: [6,3] . .D=eE------R . cmpl %edi, %edx
	# ZNVER1-NEXT: [7,0] . . DeE------------------------R. . .. addl $1, %edx			# ZNVER1-NEXT: [7,0] . . DeE------R . addl $1, %edx
	# ZNVER1-NEXT: [7,1] . . D=====================eeeeeeeeER . .. vpaddd (%r8), %ymm0, %ymm0			# ZNVER1-NEXT: [7,1] . . DeeeeeeeeER . vpaddd (%r8), %ymm0, %ymm0
	# ZNVER1-NEXT: [7,2] . . DeE----------------------------R . .. addq $32, %r8			# ZNVER1-NEXT: [7,2] . . DeE-------R . addq $32, %r8
	# ZNVER1-NEXT: [7,3] . . D=eE---------------------------R . .. cmpl %edi, %edx			# ZNVER1-NEXT: [7,3] . . D=eE------R . cmpl %edi, %edx
	# ZNVER1-NEXT: [8,0] . . DeE---------------------------R . .. addl $1, %edx			# ZNVER1-NEXT: [8,0] . . DeE------R . addl $1, %edx
	# ZNVER1-NEXT: [8,1] . . D========================eeeeeeeeER .. vpaddd (%r8), %ymm0, %ymm0			# ZNVER1-NEXT: [8,1] . . DeeeeeeeeER. vpaddd (%r8), %ymm0, %ymm0
	# ZNVER1-NEXT: [8,2] . . DeE-------------------------------R .. addq $32, %r8			# ZNVER1-NEXT: [8,2] . . DeE-------R. addq $32, %r8
	# ZNVER1-NEXT: [8,3] . . D=eE------------------------------R .. cmpl %edi, %edx			# ZNVER1-NEXT: [8,3] . . D=eE------R. cmpl %edi, %edx
	# ZNVER1-NEXT: [9,0] . . DeE------------------------------R .. addl $1, %edx			# ZNVER1-NEXT: [9,0] . . DeE------R. addl $1, %edx
	# ZNVER1-NEXT: [9,1] . . D===========================eeeeeeeeER vpaddd (%r8), %ymm0, %ymm0			# ZNVER1-NEXT: [9,1] . . DeeeeeeeeER vpaddd (%r8), %ymm0, %ymm0
	# ZNVER1-NEXT: [9,2] . . DeE----------------------------------R addq $32, %r8			# ZNVER1-NEXT: [9,2] . . DeE-------R addq $32, %r8
	# ZNVER1-NEXT: [9,3] . . D=eE---------------------------------R cmpl %edi, %edx			# ZNVER1-NEXT: [9,3] . . D=eE------R cmpl %edi, %edx

	# ALL: Average Wait times (based on the timeline view):			# ALL: Average Wait times (based on the timeline view):
	# ALL-NEXT: [0]: Executions			# ALL-NEXT: [0]: Executions
	# ALL-NEXT: [1]: Average time spent waiting in a scheduler's queue			# ALL-NEXT: [1]: Average time spent waiting in a scheduler's queue
	# ALL-NEXT: [2]: Average time spent waiting in a scheduler's queue while ready			# ALL-NEXT: [2]: Average time spent waiting in a scheduler's queue while ready
	# ALL-NEXT: [3]: Average time elapsed from WB until retire stage			# ALL-NEXT: [3]: Average time elapsed from WB until retire stage

	# ALL: [0] [1] [2] [3]			# ALL: [0] [1] [2] [3]

	# BDWELL-NEXT: 0. 10 1.0 0.4 6.9 addl $1, %edx			# BDWELL-NEXT: 0. 10 1.0 0.4 4.5 addl $1, %edx
	# BDWELL-NEXT: 1. 10 4.0 0.1 0.0 vpaddd (%r8), %ymm0, %ymm0			# BDWELL-NEXT: 1. 10 1.0 0.1 0.0 vpaddd (%r8), %ymm0, %ymm0
	# BDWELL-NEXT: 2. 10 1.0 0.4 8.7 addq $32, %r8			# BDWELL-NEXT: 2. 10 1.0 0.4 5.7 addq $32, %r8
	# BDWELL-NEXT: 3. 10 1.0 0.0 8.3 cmpl %edi, %edx			# BDWELL-NEXT: 3. 10 1.0 0.0 5.3 cmpl %edi, %edx

	# HASWELL-NEXT: 0. 10 1.0 0.4 11.4 addl $1, %edx			# HASWELL-NEXT: 0. 10 1.0 0.4 5.4 addl $1, %edx
	# HASWELL-NEXT: 1. 10 8.5 0.1 0.0 vpaddd (%r8), %ymm0, %ymm0			# HASWELL-NEXT: 1. 10 1.0 0.1 0.0 vpaddd (%r8), %ymm0, %ymm0
	# HASWELL-NEXT: 2. 10 1.0 0.4 14.2 addq $32, %r8			# HASWELL-NEXT: 2. 10 1.0 0.4 6.7 addq $32, %r8
	# HASWELL-NEXT: 3. 10 1.0 0.0 13.8 cmpl %edi, %edx			# HASWELL-NEXT: 3. 10 1.0 0.0 6.3 cmpl %edi, %edx

	# SKYLAKE-NEXT: 0. 10 1.9 0.1 30.6 addl $1, %edx			# SKYLAKE-NEXT: 0. 10 1.9 0.1 30.6 addl $1, %edx
	# SKYLAKE-NEXT: 1. 10 32.5 0.1 0.0 vpaddd (%r8), %ymm0, %ymm0			# SKYLAKE-NEXT: 1. 10 32.5 0.1 0.0 vpaddd (%r8), %ymm0, %ymm0
	# SKYLAKE-NEXT: 2. 10 1.0 0.1 38.5 addq $32, %r8			# SKYLAKE-NEXT: 2. 10 1.0 0.1 38.5 addq $32, %r8
	# SKYLAKE-NEXT: 3. 10 2.0 0.0 37.5 cmpl %edi, %edx			# SKYLAKE-NEXT: 3. 10 2.0 0.0 37.5 cmpl %edi, %edx

	# ZNVER1-NEXT: 0. 10 1.0 0.1 16.2 addl $1, %edx			# ZNVER1-NEXT: 0. 10 1.0 0.1 5.4 addl $1, %edx
	# ZNVER1-NEXT: 1. 10 14.5 0.1 0.0 vpaddd (%r8), %ymm0, %ymm0			# ZNVER1-NEXT: 1. 10 1.0 0.1 0.0 vpaddd (%r8), %ymm0, %ymm0
	# ZNVER1-NEXT: 2. 10 1.0 0.1 20.5 addq $32, %r8			# ZNVER1-NEXT: 2. 10 1.0 0.1 7.0 addq $32, %r8
	# ZNVER1-NEXT: 3. 10 2.0 0.0 19.5 cmpl %edi, %edx			# ZNVER1-NEXT: 3. 10 2.0 0.0 6.0 cmpl %edi, %edx

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Move ReadAfterLd functionality into X86FoldableSchedWrite (PR36957)ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 168464

lib/Target/X86/X86Instr3DNow.td

lib/Target/X86/X86InstrAVX512.td

lib/Target/X86/X86InstrArithmetic.td

lib/Target/X86/X86InstrCMovSetCC.td

lib/Target/X86/X86InstrFMA.td

lib/Target/X86/X86InstrInfo.td

lib/Target/X86/X86InstrMMX.td

lib/Target/X86/X86InstrSSE.td

lib/Target/X86/X86InstrShiftRotate.td

lib/Target/X86/X86InstrXOP.td

lib/Target/X86/X86SchedBroadwell.td

lib/Target/X86/X86SchedHaswell.td

lib/Target/X86/X86SchedSandyBridge.td

lib/Target/X86/X86SchedSkylakeClient.td

lib/Target/X86/X86SchedSkylakeServer.td

lib/Target/X86/X86Schedule.td

lib/Target/X86/X86ScheduleAtom.td

lib/Target/X86/X86ScheduleBtVer2.td

lib/Target/X86/X86ScheduleSLM.td

lib/Target/X86/X86ScheduleZnver1.td

test/tools/llvm-mca/X86/read-after-ld-1.s

test/tools/llvm-mca/X86/read-after-ld-2.s

[X86] Move ReadAfterLd functionality into X86FoldableSchedWrite (PR36957)
ClosedPublic