Diff 158552

lib/Target/X86/X86InstrInfo.td

Show First 20 Lines • Show All 2,055 Lines • ▼ Show 20 Lines	def XADD32rm : I<0xC1, MRMSrcMem, (outs GR32:$dst),
"xadd{l}\t{$val, $ptr\|$ptr, $val}", []>, TB,		"xadd{l}\t{$val, $ptr\|$ptr, $val}", []>, TB,
OpSize32;		OpSize32;
def XADD64rm : RI<0xC1, MRMSrcMem, (outs GR64:$dst),		def XADD64rm : RI<0xC1, MRMSrcMem, (outs GR64:$dst),
(ins GR64:$val, i64mem:$ptr),		(ins GR64:$val, i64mem:$ptr),
"xadd{q}\t{$val, $ptr\|$ptr, $val}", []>, TB;		"xadd{q}\t{$val, $ptr\|$ptr, $val}", []>, TB;

}		}

let SchedRW = [WriteALU], hasSideEffects = 0 in {		let SchedRW = [WriteCMPXCHG], hasSideEffects = 0 in {
let Defs = [AL, EFLAGS], Uses = [AL] in		let Defs = [AL, EFLAGS], Uses = [AL] in
def CMPXCHG8rr : I<0xB0, MRMDestReg, (outs GR8:$dst), (ins GR8:$src),		def CMPXCHG8rr : I<0xB0, MRMDestReg, (outs GR8:$dst), (ins GR8:$src),
"cmpxchg{b}\t{$src, $dst\|$dst, $src}", []>, TB,		"cmpxchg{b}\t{$src, $dst\|$dst, $src}", []>, TB,
NotMemoryFoldable;		NotMemoryFoldable;
let Defs = [AX, EFLAGS], Uses = [AX] in		let Defs = [AX, EFLAGS], Uses = [AX] in
def CMPXCHG16rr : I<0xB1, MRMDestReg, (outs GR16:$dst), (ins GR16:$src),		def CMPXCHG16rr : I<0xB1, MRMDestReg, (outs GR16:$dst), (ins GR16:$src),
"cmpxchg{w}\t{$src, $dst\|$dst, $src}", []>, TB, OpSize16,		"cmpxchg{w}\t{$src, $dst\|$dst, $src}", []>, TB, OpSize16,
NotMemoryFoldable;		NotMemoryFoldable;
let Defs = [EAX, EFLAGS], Uses = [EAX] in		let Defs = [EAX, EFLAGS], Uses = [EAX] in
def CMPXCHG32rr : I<0xB1, MRMDestReg, (outs GR32:$dst), (ins GR32:$src),		def CMPXCHG32rr : I<0xB1, MRMDestReg, (outs GR32:$dst), (ins GR32:$src),
"cmpxchg{l}\t{$src, $dst\|$dst, $src}", []>, TB, OpSize32,		"cmpxchg{l}\t{$src, $dst\|$dst, $src}", []>, TB, OpSize32,
NotMemoryFoldable;		NotMemoryFoldable;
let Defs = [RAX, EFLAGS], Uses = [RAX] in		let Defs = [RAX, EFLAGS], Uses = [RAX] in
def CMPXCHG64rr : RI<0xB1, MRMDestReg, (outs GR64:$dst), (ins GR64:$src),		def CMPXCHG64rr : RI<0xB1, MRMDestReg, (outs GR64:$dst), (ins GR64:$src),
"cmpxchg{q}\t{$src, $dst\|$dst, $src}", []>, TB,		"cmpxchg{q}\t{$src, $dst\|$dst, $src}", []>, TB,
NotMemoryFoldable;		NotMemoryFoldable;
} // SchedRW, hasSideEffects		} // SchedRW, hasSideEffects

let SchedRW = [WriteALULd, WriteRMW], mayLoad = 1, mayStore = 1,		let SchedRW = [WriteCMPXCHGLd, WriteRMW], mayLoad = 1, mayStore = 1,
		craig.topperUnsubmitted Not Done Reply Inline Actions If I remember right from arithmetic instructions, this doesn't make the latency additive the way it should be. This should probably be just WriteCMPXCHGRMW implemented as a WriteSequence like we do for WriteALURMW craig.topper: If I remember right from arithmetic instructions, this doesn't make the latency additive the…
		avt77AuthorUnsubmitted Not Done Reply Inline Actions The given implementation is very similar to suggested WriteSequence (in fact it's the same) and keeps all current sched values w/o changes. Could we stay with the current implementation or it's better to re-implement it? avt77: The given implementation is very similar to suggested WriteSequence (in fact it's the same) and…
		RKSimonUnsubmitted Not Done Reply Inline Actions Wasn't the plan to add a WriteCMPXCHGRMW WriteSequence class? RKSimon: Wasn't the plan to add a WriteCMPXCHGRMW WriteSequence class?
		avt77AuthorUnsubmitted Not Done Reply Inline Actions It was not the plan because it's the same change. And even more: I tried to switch to WriteCMPXCHGRMW and it did not work here. Should I try it again? avt77: It was not the plan because it's the same change. And even more: I tried to switch to…
hasSideEffects = 0 in {		hasSideEffects = 0 in {
let Defs = [AL, EFLAGS], Uses = [AL] in		let Defs = [AL, EFLAGS], Uses = [AL] in
def CMPXCHG8rm : I<0xB0, MRMDestMem, (outs), (ins i8mem:$dst, GR8:$src),		def CMPXCHG8rm : I<0xB0, MRMDestMem, (outs), (ins i8mem:$dst, GR8:$src),
"cmpxchg{b}\t{$src, $dst\|$dst, $src}", []>, TB,		"cmpxchg{b}\t{$src, $dst\|$dst, $src}", []>, TB,
NotMemoryFoldable;		NotMemoryFoldable;
let Defs = [AX, EFLAGS], Uses = [AX] in		let Defs = [AX, EFLAGS], Uses = [AX] in
def CMPXCHG16rm : I<0xB1, MRMDestMem, (outs), (ins i16mem:$dst, GR16:$src),		def CMPXCHG16rm : I<0xB1, MRMDestMem, (outs), (ins i16mem:$dst, GR16:$src),
"cmpxchg{w}\t{$src, $dst\|$dst, $src}", []>, TB, OpSize16,		"cmpxchg{w}\t{$src, $dst\|$dst, $src}", []>, TB, OpSize16,
Show All 12 Lines	def CMPXCHG8B : I<0xC7, MRM1m, (outs), (ins i64mem:$dst),
"cmpxchg8b\t$dst", []>, TB;		"cmpxchg8b\t$dst", []>, TB;

let Defs = [RAX, RDX, EFLAGS], Uses = [RAX, RBX, RCX, RDX] in		let Defs = [RAX, RDX, EFLAGS], Uses = [RAX, RBX, RCX, RDX] in
def CMPXCHG16B : RI<0xC7, MRM1m, (outs), (ins i128mem:$dst),		def CMPXCHG16B : RI<0xC7, MRM1m, (outs), (ins i128mem:$dst),
"cmpxchg16b\t$dst", []>,		"cmpxchg16b\t$dst", []>,
TB, Requires<[HasCmpxchg16b, In64BitMode]>;		TB, Requires<[HasCmpxchg16b, In64BitMode]>;
} // SchedRW, mayLoad, mayStore, hasSideEffects		} // SchedRW, mayLoad, mayStore, hasSideEffects


// Lock instruction prefix		// Lock instruction prefix
let SchedRW = [WriteMicrocoded] in		let SchedRW = [WriteMicrocoded] in
def LOCK_PREFIX : I<0xF0, RawFrm, (outs), (ins), "lock", []>;		def LOCK_PREFIX : I<0xF0, RawFrm, (outs), (ins), "lock", []>;

let SchedRW = [WriteNop] in {		let SchedRW = [WriteNop] in {

// Rex64 instruction prefix		// Rex64 instruction prefix
def REX64_PREFIX : I<0x48, RawFrm, (outs), (ins), "rex64", []>,		def REX64_PREFIX : I<0x48, RawFrm, (outs), (ins), "rex64", []>,
▲ Show 20 Lines • Show All 1,382 Lines • Show Last 20 Lines

lib/Target/X86/X86SchedBroadwell.td

	Show First 20 Lines • Show All 113 Lines • ▼ Show 20 Lines
	defm : BWWriteResPair<WriteDiv16, [BWPort0, BWDivider], 25, [1, 10]>;			defm : BWWriteResPair<WriteDiv16, [BWPort0, BWDivider], 25, [1, 10]>;
	defm : BWWriteResPair<WriteDiv32, [BWPort0, BWDivider], 25, [1, 10]>;			defm : BWWriteResPair<WriteDiv32, [BWPort0, BWDivider], 25, [1, 10]>;
	defm : BWWriteResPair<WriteDiv64, [BWPort0, BWDivider], 25, [1, 10]>;			defm : BWWriteResPair<WriteDiv64, [BWPort0, BWDivider], 25, [1, 10]>;
	defm : BWWriteResPair<WriteIDiv8, [BWPort0, BWDivider], 25, [1, 10]>;			defm : BWWriteResPair<WriteIDiv8, [BWPort0, BWDivider], 25, [1, 10]>;
	defm : BWWriteResPair<WriteIDiv16, [BWPort0, BWDivider], 25, [1, 10]>;			defm : BWWriteResPair<WriteIDiv16, [BWPort0, BWDivider], 25, [1, 10]>;
	defm : BWWriteResPair<WriteIDiv32, [BWPort0, BWDivider], 25, [1, 10]>;			defm : BWWriteResPair<WriteIDiv32, [BWPort0, BWDivider], 25, [1, 10]>;
	defm : BWWriteResPair<WriteIDiv64, [BWPort0, BWDivider], 25, [1, 10]>;			defm : BWWriteResPair<WriteIDiv64, [BWPort0, BWDivider], 25, [1, 10]>;

	defm : BWWriteResPair<WriteBSWAP32,[BWPort15], 1>; //			defm : X86WriteRes<WriteCMPXCHG,[BWPort06, BWPort0156], 5, [2, 3], 5>;
	defm : BWWriteResPair<WriteBSWAP64,[BWPort06, BWPort15], 2, [1, 1], 2>; //			defm : X86WriteRes<WriteCMPXCHGLd,[BWPort23, BWPort06, BWPort0156], 8, [1, 2, 1], 6>;

				defm : BWWriteResPair<WriteBSWAP32,[BWPort15], 1>;
				defm : BWWriteResPair<WriteBSWAP64,[BWPort06, BWPort15], 2, [1, 1], 2>;
				RKSimonUnsubmitted Not Done Reply Inline Actions What about the WriteCMPXCHGLd cases? RKSimon: What about the WriteCMPXCHGLd cases?
				avt77AuthorUnsubmitted Not Done Reply Inline Actions I decided (as with BTrr instrs) it'd be better to have separate patches for 'rr' and 'Ld' versions.The problem is: automaticaly generated WriteCMPXCHGLd does not fit to real numbers that's why it's better to use X86WriteRes for both 'rr' and 'Ld' versions instead of X86SchedWritePair. Should I do it in this patch? avt77:* I decided (as with BT*rr instrs) it'd be better to have separate patches for 'rr' and 'Ld'…

	defm : BWWriteResPair<WriteCRC32, [BWPort1], 3>;			defm : BWWriteResPair<WriteCRC32, [BWPort1], 3>;
	def : WriteRes<WriteIMulH, []> { let Latency = 3; } // Integer multiplication, high part.			def : WriteRes<WriteIMulH, []> { let Latency = 3; } // Integer multiplication, high part.

	def : WriteRes<WriteLEA, [BWPort15]>; // LEA instructions can't fold loads.			def : WriteRes<WriteLEA, [BWPort15]>; // LEA instructions can't fold loads.

	defm : BWWriteResPair<WriteCMOV, [BWPort06], 1>; // Conditional move.			defm : BWWriteResPair<WriteCMOV, [BWPort06], 1>; // Conditional move.
	defm : BWWriteResPair<WriteCMOV2, [BWPort06,BWPort0156], 2, [1,1], 2>; // // Conditional (CF + ZF flag) move.			defm : BWWriteResPair<WriteCMOV2, [BWPort06,BWPort0156], 2, [1,1], 2>; // // Conditional (CF + ZF flag) move.
	▲ Show 20 Lines • Show All 820 Lines • ▼ Show 20 Lines

	def BWWriteResGroup55 : SchedWriteRes<[BWPort06,BWPort0156]> {			def BWWriteResGroup55 : SchedWriteRes<[BWPort06,BWPort0156]> {
	let Latency = 5;			let Latency = 5;
	let NumMicroOps = 5;			let NumMicroOps = 5;
	let ResourceCycles = [1,4];			let ResourceCycles = [1,4];
	}			}
	def: InstRW<[BWWriteResGroup55], (instrs XSETBV)>;			def: InstRW<[BWWriteResGroup55], (instrs XSETBV)>;

	def BWWriteResGroup56 : SchedWriteRes<[BWPort06,BWPort0156]> {
	let Latency = 5;
	let NumMicroOps = 5;
	let ResourceCycles = [2,3];
	}
	def: InstRW<[BWWriteResGroup56], (instregex "CMPXCHG(8\|16\|32\|64)rr")>;

	def BWWriteResGroup57 : SchedWriteRes<[BWPort4,BWPort237,BWPort0156]> {			def BWWriteResGroup57 : SchedWriteRes<[BWPort4,BWPort237,BWPort0156]> {
	let Latency = 5;			let Latency = 5;
	let NumMicroOps = 6;			let NumMicroOps = 6;
	let ResourceCycles = [1,1,4];			let ResourceCycles = [1,1,4];
	}			}
	def: InstRW<[BWWriteResGroup57], (instregex "PUSHF(16\|64)")>;			def: InstRW<[BWWriteResGroup57], (instregex "PUSHF(16\|64)")>;

	def BWWriteResGroup58 : SchedWriteRes<[BWPort23]> {			def BWWriteResGroup58 : SchedWriteRes<[BWPort23]> {
	▲ Show 20 Lines • Show All 258 Lines • ▼ Show 20 Lines
	def: InstRW<[BWWriteResGroup99], (instregex "XCHG(8\|16\|32\|64)rm")>;			def: InstRW<[BWWriteResGroup99], (instregex "XCHG(8\|16\|32\|64)rm")>;

	def BWWriteResGroup100 : SchedWriteRes<[BWPort4,BWPort23,BWPort237,BWPort06,BWPort0156]> {			def BWWriteResGroup100 : SchedWriteRes<[BWPort4,BWPort23,BWPort237,BWPort06,BWPort0156]> {
	let Latency = 8;			let Latency = 8;
	let NumMicroOps = 6;			let NumMicroOps = 6;
	let ResourceCycles = [1,1,1,2,1];			let ResourceCycles = [1,1,1,2,1];
	}			}
	def : SchedAlias<WriteADCRMW, BWWriteResGroup100>;			def : SchedAlias<WriteADCRMW, BWWriteResGroup100>;
	def: InstRW<[BWWriteResGroup100], (instregex "CMPXCHG(8\|16\|32\|64)rm",			def: InstRW<[BWWriteResGroup100], (instregex "ROL(8\|16\|32\|64)mCL",
	"ROL(8\|16\|32\|64)mCL",
	"SAR(8\|16\|32\|64)mCL",			"SAR(8\|16\|32\|64)mCL",
	"SHL(8\|16\|32\|64)mCL",			"SHL(8\|16\|32\|64)mCL",
	"SHR(8\|16\|32\|64)mCL")>;			"SHR(8\|16\|32\|64)mCL")>;

	def BWWriteResGroup101 : SchedWriteRes<[BWPort1,BWPort23]> {			def BWWriteResGroup101 : SchedWriteRes<[BWPort1,BWPort23]> {
	let Latency = 9;			let Latency = 9;
	let NumMicroOps = 2;			let NumMicroOps = 2;
	let ResourceCycles = [1,1];			let ResourceCycles = [1,1];
	▲ Show 20 Lines • Show All 442 Lines • Show Last 20 Lines

lib/Target/X86/X86SchedHaswell.td

	Show First 20 Lines • Show All 118 Lines • ▼ Show 20 Lines
	def : WriteRes<WriteZero, []>;			def : WriteRes<WriteZero, []>;

	// Arithmetic.			// Arithmetic.
	defm : HWWriteResPair<WriteALU, [HWPort0156], 1>;			defm : HWWriteResPair<WriteALU, [HWPort0156], 1>;
	defm : HWWriteResPair<WriteADC, [HWPort06, HWPort0156], 2, [1,1], 2>;			defm : HWWriteResPair<WriteADC, [HWPort06, HWPort0156], 2, [1,1], 2>;
	defm : HWWriteResPair<WriteIMul, [HWPort1], 3>;			defm : HWWriteResPair<WriteIMul, [HWPort1], 3>;
	defm : HWWriteResPair<WriteIMul64, [HWPort1], 3>;			defm : HWWriteResPair<WriteIMul64, [HWPort1], 3>;

				defm : X86WriteRes<WriteCMPXCHG,[HWPort06, HWPort0156], 5, [2,3], 5>;
				defm : X86WriteRes<WriteCMPXCHGLd,[HWPort23,HWPort06,HWPort0156], 9, [1,2,1], 6>;

	defm : HWWriteResPair<WriteBSWAP32,[HWPort15], 1>;			defm : HWWriteResPair<WriteBSWAP32,[HWPort15], 1>;
	defm : HWWriteResPair<WriteBSWAP64,[HWPort06, HWPort15], 2, [1,1], 2>;			defm : HWWriteResPair<WriteBSWAP64,[HWPort06, HWPort15], 2, [1,1], 2>;

	def : WriteRes<WriteIMulH, []> { let Latency = 3; }			def : WriteRes<WriteIMulH, []> { let Latency = 3; }

	// Integer shifts and rotates.			// Integer shifts and rotates.
	defm : HWWriteResPair<WriteShift, [HWPort06], 1>;			defm : HWWriteResPair<WriteShift, [HWPort06], 1>;

	▲ Show 20 Lines • Show All 1,237 Lines • ▼ Show 20 Lines
	}			}
	def: InstRW<[HWWriteResGroup68], (instregex "XCHG(8\|16\|32\|64)rm")>;			def: InstRW<[HWWriteResGroup68], (instregex "XCHG(8\|16\|32\|64)rm")>;

	def HWWriteResGroup69 : SchedWriteRes<[HWPort4,HWPort23,HWPort237,HWPort06,HWPort0156]> {			def HWWriteResGroup69 : SchedWriteRes<[HWPort4,HWPort23,HWPort237,HWPort06,HWPort0156]> {
	let Latency = 9;			let Latency = 9;
	let NumMicroOps = 6;			let NumMicroOps = 6;
	let ResourceCycles = [1,1,1,2,1];			let ResourceCycles = [1,1,1,2,1];
	}			}
	def: InstRW<[HWWriteResGroup69], (instregex "CMPXCHG(8\|16\|32\|64)rm",			def: InstRW<[HWWriteResGroup69], (instregex "ROL(8\|16\|32\|64)mCL",
	"ROL(8\|16\|32\|64)mCL",
	"SAR(8\|16\|32\|64)mCL",			"SAR(8\|16\|32\|64)mCL",
	"SHL(8\|16\|32\|64)mCL",			"SHL(8\|16\|32\|64)mCL",
	"SHR(8\|16\|32\|64)mCL")>;			"SHR(8\|16\|32\|64)mCL")>;
	def: SchedAlias<WriteADCRMW, HWWriteResGroup69>;			def: SchedAlias<WriteADCRMW, HWWriteResGroup69>;

	def HWWriteResGroup70 : SchedWriteRes<[HWPort0,HWPort1]> {			def HWWriteResGroup70 : SchedWriteRes<[HWPort0,HWPort1]> {
	let Latency = 4;			let Latency = 4;
	let NumMicroOps = 2;			let NumMicroOps = 2;
	▲ Show 20 Lines • Show All 205 Lines • ▼ Show 20 Lines

	def HWWriteResGroup100 : SchedWriteRes<[HWPort06,HWPort0156]> {			def HWWriteResGroup100 : SchedWriteRes<[HWPort06,HWPort0156]> {
	let Latency = 5;			let Latency = 5;
	let NumMicroOps = 5;			let NumMicroOps = 5;
	let ResourceCycles = [1,4];			let ResourceCycles = [1,4];
	}			}
	def: InstRW<[HWWriteResGroup100], (instrs XSETBV)>;			def: InstRW<[HWWriteResGroup100], (instrs XSETBV)>;

	def HWWriteResGroup101 : SchedWriteRes<[HWPort06,HWPort0156]> {
	let Latency = 5;
	let NumMicroOps = 5;
	let ResourceCycles = [2,3];
	}
	def: InstRW<[HWWriteResGroup101], (instregex "CMPXCHG(8\|16\|32\|64)rr")>;

	def HWWriteResGroup102 : SchedWriteRes<[HWPort1,HWPort5]> {			def HWWriteResGroup102 : SchedWriteRes<[HWPort1,HWPort5]> {
	let Latency = 6;			let Latency = 6;
	let NumMicroOps = 2;			let NumMicroOps = 2;
	let ResourceCycles = [1,1];			let ResourceCycles = [1,1];
	}			}
	def: InstRW<[HWWriteResGroup102], (instregex "VCVTDQ2PDYrr",			def: InstRW<[HWWriteResGroup102], (instregex "VCVTDQ2PDYrr",
	"VCVTPD2PSYrr",			"VCVTPD2PSYrr",
	"VCVT(T?)PD2DQYrr")>;			"VCVT(T?)PD2DQYrr")>;
	▲ Show 20 Lines • Show All 358 Lines • Show Last 20 Lines

lib/Target/X86/X86SchedSandyBridge.td

	Show First 20 Lines • Show All 106 Lines • ▼ Show 20 Lines
	def : WriteRes<WriteZero, []>;			def : WriteRes<WriteZero, []>;

	// Arithmetic.			// Arithmetic.
	defm : SBWriteResPair<WriteALU, [SBPort015], 1>;			defm : SBWriteResPair<WriteALU, [SBPort015], 1>;
	defm : SBWriteResPair<WriteADC, [SBPort05,SBPort015], 2, [1,1], 2>;			defm : SBWriteResPair<WriteADC, [SBPort05,SBPort015], 2, [1,1], 2>;
	defm : SBWriteResPair<WriteIMul, [SBPort1], 3>;			defm : SBWriteResPair<WriteIMul, [SBPort1], 3>;
	defm : SBWriteResPair<WriteIMul64, [SBPort1], 3>;			defm : SBWriteResPair<WriteIMul64, [SBPort1], 3>;

				defm : X86WriteRes<WriteCMPXCHG,[SBPort05,SBPort015], 5, [1,3], 4>;
				defm : X86WriteRes<WriteCMPXCHGLd,[SBPort015], 8, [3], 4>;

	defm : SBWriteResPair<WriteBSWAP32,[SBPort1], 1>;			defm : SBWriteResPair<WriteBSWAP32,[SBPort1], 1>;
	defm : SBWriteResPair<WriteBSWAP64,[SBPort1,SBPort05], 2, [1,1], 2>;			defm : SBWriteResPair<WriteBSWAP64,[SBPort1,SBPort05], 2, [1,1], 2>;

				craig.topperUnsubmitted Not Done Reply Inline Actions The port4 and one of the port23 shouldn't be here. They come from WriteRMW that WriteCMPXCHGLd is paired with. craig.topper: The port4 and one of the port23 shouldn't be here. They come from WriteRMW that WriteCMPXCHGLd…
				avt77AuthorUnsubmitted Not Done Reply Inline Actions Oh, yes, you're right. Tnx. avt77: Oh, yes, you're right. Tnx.
				avt77AuthorUnsubmitted Not Done Reply Inline Actions The problem here is the following: we can't use the paired version because it uses the default values [1,1] but we need 2 cycles for port23. It seems we have to redefine these intrs for SB or to remove the pairing with WriteRMW. I'd prefer to remove the pairing if you don't mind. avt77: The problem here is the following: we can't use the paired version because it uses the default…
				craig.topperUnsubmitted Not Done Reply Inline Actions I'm fine with removing the pairing. But change the name to WriteCMPXCHGRMW craig.topper: I'm fine with removing the pairing. But change the name to WriteCMPXCHGRMW
				craig.topperUnsubmitted Not Done Reply Inline Actions Shouldn't this be 6 uops not 7? craig.topper: Shouldn't this be 6 uops not 7?
				avt77AuthorUnsubmitted Not Done Reply Inline Actions Yes, you suggested 6 in your first comments I'll fix it asap. avt77: Yes, you suggested 6 in your first comments I'll fix it asap.
	defm : SBWriteResPair<WriteDiv8, [SBPort0, SBDivider], 25, [1, 10]>;			defm : SBWriteResPair<WriteDiv8, [SBPort0, SBDivider], 25, [1, 10]>;
	defm : SBWriteResPair<WriteDiv16, [SBPort0, SBDivider], 25, [1, 10]>;			defm : SBWriteResPair<WriteDiv16, [SBPort0, SBDivider], 25, [1, 10]>;
	defm : SBWriteResPair<WriteDiv32, [SBPort0, SBDivider], 25, [1, 10]>;			defm : SBWriteResPair<WriteDiv32, [SBPort0, SBDivider], 25, [1, 10]>;
	defm : SBWriteResPair<WriteDiv64, [SBPort0, SBDivider], 25, [1, 10]>;			defm : SBWriteResPair<WriteDiv64, [SBPort0, SBDivider], 25, [1, 10]>;
	defm : SBWriteResPair<WriteIDiv8, [SBPort0, SBDivider], 25, [1, 10]>;			defm : SBWriteResPair<WriteIDiv8, [SBPort0, SBDivider], 25, [1, 10]>;
	defm : SBWriteResPair<WriteIDiv16, [SBPort0, SBDivider], 25, [1, 10]>;			defm : SBWriteResPair<WriteIDiv16, [SBPort0, SBDivider], 25, [1, 10]>;
	defm : SBWriteResPair<WriteIDiv32, [SBPort0, SBDivider], 25, [1, 10]>;			defm : SBWriteResPair<WriteIDiv32, [SBPort0, SBDivider], 25, [1, 10]>;
	defm : SBWriteResPair<WriteIDiv64, [SBPort0, SBDivider], 25, [1, 10]>;			defm : SBWriteResPair<WriteIDiv64, [SBPort0, SBDivider], 25, [1, 10]>;
	▲ Show 20 Lines • Show All 648 Lines • ▼ Show 20 Lines

	def SBWriteResGroup41 : SchedWriteRes<[SBPort5,SBPort015]> {			def SBWriteResGroup41 : SchedWriteRes<[SBPort5,SBPort015]> {
	let Latency = 5;			let Latency = 5;
	let NumMicroOps = 4;			let NumMicroOps = 4;
	let ResourceCycles = [1,3];			let ResourceCycles = [1,3];
	}			}
	def: InstRW<[SBWriteResGroup41], (instrs FNINIT)>;			def: InstRW<[SBWriteResGroup41], (instrs FNINIT)>;

	def SBWriteResGroup42 : SchedWriteRes<[SBPort05,SBPort015]> {
	let Latency = 5;
	let NumMicroOps = 4;
	let ResourceCycles = [1,3];
	}
	def: InstRW<[SBWriteResGroup42], (instregex "CMPXCHG(8\|16\|32\|64)rr")>;

	def SBWriteResGroup43 : SchedWriteRes<[SBPort4,SBPort23,SBPort05]> {			def SBWriteResGroup43 : SchedWriteRes<[SBPort4,SBPort23,SBPort05]> {
	let Latency = 3;			let Latency = 3;
	let NumMicroOps = 4;			let NumMicroOps = 4;
	let ResourceCycles = [1,1,2];			let ResourceCycles = [1,1,2];
	}			}
	def: InstRW<[SBWriteResGroup43], (instregex "SET(A\|BE)m")>;			def: InstRW<[SBWriteResGroup43], (instregex "SET(A\|BE)m")>;

	def SBWriteResGroup45 : SchedWriteRes<[SBPort0,SBPort4,SBPort23,SBPort15]> {			def SBWriteResGroup45 : SchedWriteRes<[SBPort0,SBPort4,SBPort23,SBPort15]> {
	▲ Show 20 Lines • Show All 159 Lines • ▼ Show 20 Lines

	def SBWriteResGroup77 : SchedWriteRes<[SBPort0,SBPort1,SBPort23]> {			def SBWriteResGroup77 : SchedWriteRes<[SBPort0,SBPort1,SBPort23]> {
	let Latency = 8;			let Latency = 8;
	let NumMicroOps = 3;			let NumMicroOps = 3;
	let ResourceCycles = [1,1,1];			let ResourceCycles = [1,1,1];
	}			}
	def: InstRW<[SBWriteResGroup77], (instregex "(V?)(U?)COMI(SD\|SS)rm")>;			def: InstRW<[SBWriteResGroup77], (instregex "(V?)(U?)COMI(SD\|SS)rm")>;

	def SBWriteResGroup81 : SchedWriteRes<[SBPort23,SBPort015]> {			def SBWriteResGroup81 : SchedWriteRes<[SBPort015]> {
	let Latency = 8;			let Latency = 6;
	let NumMicroOps = 4;			let NumMicroOps = 4;
	let ResourceCycles = [1,3];			let ResourceCycles = [3];
	}			}
	def: InstRW<[SBWriteResGroup81], (instregex "CMPXCHG(8\|16\|32\|64)rm")>;			def: InstRW<[SBWriteResGroup81], (instregex "CMPXCHG(8\|16)B")>;
				craig.topperUnsubmitted Not Done Reply Inline Actions My best guess is 6 uops and 8 latency like the other Intel CPUs. Resource cycles Port015 - 1 cycle (equivalent to 0156 on other Intel CPUs) Port05 - 2 cycles (equivalent to the Port06 on other Intel CPUs) Port4 - 1 cycle Port23 - 2 cycle craig.topper: My best guess is 6 uops and 8 latency like the other Intel CPUs. Resource cycles Port015 - 1…
				craig.topperUnsubmitted Not Done Reply Inline Actions I didn't notice the regular expression here had changed. The information I gave was for WriteCMPXCHGLd craig.topper: I didn't notice the regular expression here had changed. The information I gave was for…
				RKSimonUnsubmitted Not Done Reply Inline Actions Why has the regex changed? RKSimon: Why has the regex changed?
				avt77AuthorUnsubmitted Not Done Reply Inline Actions Because we don't need this SBWriteResGroup81 any more. Maybe I would change the name but I kept it. avt77: Because we don't need this SBWriteResGroup81 any more. Maybe I would change the name but I kept…

	def SBWriteResGroup83 : SchedWriteRes<[SBPort23,SBPort015]> {			def SBWriteResGroup83 : SchedWriteRes<[SBPort23,SBPort015]> {
	let Latency = 8;			let Latency = 8;
	let NumMicroOps = 5;			let NumMicroOps = 5;
	let ResourceCycles = [2,3];			let ResourceCycles = [2,3];
	}			}
	def: InstRW<[SBWriteResGroup83], (instrs CMPSB,			def: InstRW<[SBWriteResGroup83], (instrs CMPSB,
	CMPSL,			CMPSL,
	▲ Show 20 Lines • Show All 182 Lines • Show Last 20 Lines

lib/Target/X86/X86SchedSkylakeClient.td

Show First 20 Lines • Show All 104 Lines • ▼ Show 20 Lines
def : WriteRes<WriteRMW, [SKLPort237,SKLPort4]>;		def : WriteRes<WriteRMW, [SKLPort237,SKLPort4]>;

// Arithmetic.		// Arithmetic.
defm : SKLWriteResPair<WriteALU, [SKLPort0156], 1>; // Simple integer ALU op.		defm : SKLWriteResPair<WriteALU, [SKLPort0156], 1>; // Simple integer ALU op.
defm : SKLWriteResPair<WriteADC, [SKLPort06], 1>; // Integer ALU + flags op.		defm : SKLWriteResPair<WriteADC, [SKLPort06], 1>; // Integer ALU + flags op.
defm : SKLWriteResPair<WriteIMul, [SKLPort1], 3>; // Integer multiplication.		defm : SKLWriteResPair<WriteIMul, [SKLPort1], 3>; // Integer multiplication.
defm : SKLWriteResPair<WriteIMul64, [SKLPort1], 3>; // Integer 64-bit multiplication.		defm : SKLWriteResPair<WriteIMul64, [SKLPort1], 3>; // Integer 64-bit multiplication.

		defm : X86WriteRes<WriteCMPXCHG,[SKLPort06, SKLPort0156], 5, [2,3], 5>;
		defm : X86WriteRes<WriteCMPXCHGLd,[SKLPort23,SKLPort06,SKLPort0156], 8, [1,2,1], 6>;

defm : SKLWriteResPair<WriteBSWAP32,[SKLPort15], 1>; //		defm : SKLWriteResPair<WriteBSWAP32,[SKLPort15], 1>; //
defm : SKLWriteResPair<WriteBSWAP64,[SKLPort06, SKLPort15], 2, [1,1], 2>; //		defm : SKLWriteResPair<WriteBSWAP64,[SKLPort06, SKLPort15], 2, [1,1], 2>; //

defm : SKLWriteResPair<WriteDiv8, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;		defm : SKLWriteResPair<WriteDiv8, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;
defm : SKLWriteResPair<WriteDiv16, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;		defm : SKLWriteResPair<WriteDiv16, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;
defm : SKLWriteResPair<WriteDiv32, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;		defm : SKLWriteResPair<WriteDiv32, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;
defm : SKLWriteResPair<WriteDiv64, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;		defm : SKLWriteResPair<WriteDiv64, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;
defm : SKLWriteResPair<WriteIDiv8, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;		defm : SKLWriteResPair<WriteIDiv8, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;
▲ Show 20 Lines • Show All 857 Lines • ▼ Show 20 Lines

def SKLWriteResGroup63 : SchedWriteRes<[SKLPort06,SKLPort0156]> {		def SKLWriteResGroup63 : SchedWriteRes<[SKLPort06,SKLPort0156]> {
let Latency = 5;		let Latency = 5;
let NumMicroOps = 5;		let NumMicroOps = 5;
let ResourceCycles = [1,4];		let ResourceCycles = [1,4];
}		}
def: InstRW<[SKLWriteResGroup63], (instrs XSETBV)>;		def: InstRW<[SKLWriteResGroup63], (instrs XSETBV)>;

def SKLWriteResGroup64 : SchedWriteRes<[SKLPort06,SKLPort0156]> {
let Latency = 5;
let NumMicroOps = 5;
let ResourceCycles = [2,3];
}
def: InstRW<[SKLWriteResGroup64], (instregex "CMPXCHG(8\|16\|32\|64)rr")>;

def SKLWriteResGroup65 : SchedWriteRes<[SKLPort4,SKLPort237,SKLPort0156]> {		def SKLWriteResGroup65 : SchedWriteRes<[SKLPort4,SKLPort237,SKLPort0156]> {
let Latency = 5;		let Latency = 5;
let NumMicroOps = 6;		let NumMicroOps = 6;
let ResourceCycles = [1,1,4];		let ResourceCycles = [1,1,4];
}		}
def: InstRW<[SKLWriteResGroup65], (instregex "PUSHF(16\|64)")>;		def: InstRW<[SKLWriteResGroup65], (instregex "PUSHF(16\|64)")>;

def SKLWriteResGroup67 : SchedWriteRes<[SKLPort23]> {		def SKLWriteResGroup67 : SchedWriteRes<[SKLPort23]> {
▲ Show 20 Lines • Show All 329 Lines • ▼ Show 20 Lines	def: InstRW<[SKLWriteResGroup117], (instregex "ROL(8\|16\|32\|64)mCL",
"SHR(8\|16\|32\|64)mCL")>;		"SHR(8\|16\|32\|64)mCL")>;

def SKLWriteResGroup119 : SchedWriteRes<[SKLPort4,SKLPort23,SKLPort237,SKLPort06,SKLPort0156]> {		def SKLWriteResGroup119 : SchedWriteRes<[SKLPort4,SKLPort23,SKLPort237,SKLPort06,SKLPort0156]> {
let Latency = 8;		let Latency = 8;
let NumMicroOps = 6;		let NumMicroOps = 6;
let ResourceCycles = [1,1,1,2,1];		let ResourceCycles = [1,1,1,2,1];
}		}
def: SchedAlias<WriteADCRMW, SKLWriteResGroup119>;		def: SchedAlias<WriteADCRMW, SKLWriteResGroup119>;
def: InstRW<[SKLWriteResGroup119], (instregex "CMPXCHG(8\|16\|32\|64)rm")>;

def SKLWriteResGroup120 : SchedWriteRes<[SKLPort0,SKLPort23]> {		def SKLWriteResGroup120 : SchedWriteRes<[SKLPort0,SKLPort23]> {
let Latency = 9;		let Latency = 9;
let NumMicroOps = 2;		let NumMicroOps = 2;
let ResourceCycles = [1,1];		let ResourceCycles = [1,1];
}		}
def: InstRW<[SKLWriteResGroup120], (instregex "MMX_CVTPI2PSirm")>;		def: InstRW<[SKLWriteResGroup120], (instregex "MMX_CVTPI2PSirm")>;

▲ Show 20 Lines • Show All 504 Lines • Show Last 20 Lines

lib/Target/X86/X86SchedSkylakeServer.td

Show First 20 Lines • Show All 104 Lines • ▼ Show 20 Lines
def : WriteRes<WriteRMW, [SKXPort237,SKXPort4]>;		def : WriteRes<WriteRMW, [SKXPort237,SKXPort4]>;

// Arithmetic.		// Arithmetic.
defm : SKXWriteResPair<WriteALU, [SKXPort0156], 1>; // Simple integer ALU op.		defm : SKXWriteResPair<WriteALU, [SKXPort0156], 1>; // Simple integer ALU op.
defm : SKXWriteResPair<WriteADC, [SKXPort06], 1>; // Integer ALU + flags op.		defm : SKXWriteResPair<WriteADC, [SKXPort06], 1>; // Integer ALU + flags op.
defm : SKXWriteResPair<WriteIMul, [SKXPort1], 3>; // Integer multiplication.		defm : SKXWriteResPair<WriteIMul, [SKXPort1], 3>; // Integer multiplication.
defm : SKXWriteResPair<WriteIMul64, [SKXPort1], 3>; // Integer 64-bit multiplication.		defm : SKXWriteResPair<WriteIMul64, [SKXPort1], 3>; // Integer 64-bit multiplication.

		defm : X86WriteRes<WriteCMPXCHG,[SKXPort06, SKXPort0156], 5, [2,3], 5>;
		defm : X86WriteRes<WriteCMPXCHGLd,[SKXPort23,SKXPort06,SKXPort0156], 8, [1,2,1], 6>;

defm : SKXWriteResPair<WriteBSWAP32,[SKXPort15], 1>; //		defm : SKXWriteResPair<WriteBSWAP32,[SKXPort15], 1>; //
defm : SKXWriteResPair<WriteBSWAP64,[SKXPort06, SKXPort15], 2, [1,1], 2>; //		defm : SKXWriteResPair<WriteBSWAP64,[SKXPort06, SKXPort15], 2, [1,1], 2>; //

defm : SKXWriteResPair<WriteDiv8, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;		defm : SKXWriteResPair<WriteDiv8, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;
defm : SKXWriteResPair<WriteDiv16, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;		defm : SKXWriteResPair<WriteDiv16, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;
defm : SKXWriteResPair<WriteDiv32, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;		defm : SKXWriteResPair<WriteDiv32, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;
defm : SKXWriteResPair<WriteDiv64, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;		defm : SKXWriteResPair<WriteDiv64, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;
defm : SKXWriteResPair<WriteIDiv8, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;		defm : SKXWriteResPair<WriteIDiv8, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;
▲ Show 20 Lines • Show All 1,024 Lines • ▼ Show 20 Lines

def SKXWriteResGroup67 : SchedWriteRes<[SKXPort06,SKXPort0156]> {		def SKXWriteResGroup67 : SchedWriteRes<[SKXPort06,SKXPort0156]> {
let Latency = 5;		let Latency = 5;
let NumMicroOps = 5;		let NumMicroOps = 5;
let ResourceCycles = [1,4];		let ResourceCycles = [1,4];
}		}
def: InstRW<[SKXWriteResGroup67], (instrs XSETBV)>;		def: InstRW<[SKXWriteResGroup67], (instrs XSETBV)>;

def SKXWriteResGroup68 : SchedWriteRes<[SKXPort06,SKXPort0156]> {
let Latency = 5;
let NumMicroOps = 5;
let ResourceCycles = [2,3];
}
def: InstRW<[SKXWriteResGroup68], (instregex "CMPXCHG(8\|16\|32\|64)rr")>;

def SKXWriteResGroup69 : SchedWriteRes<[SKXPort4,SKXPort237,SKXPort0156]> {		def SKXWriteResGroup69 : SchedWriteRes<[SKXPort4,SKXPort237,SKXPort0156]> {
let Latency = 5;		let Latency = 5;
let NumMicroOps = 6;		let NumMicroOps = 6;
let ResourceCycles = [1,1,4];		let ResourceCycles = [1,1,4];
}		}
def: InstRW<[SKXWriteResGroup69], (instregex "PUSHF(16\|64)")>;		def: InstRW<[SKXWriteResGroup69], (instregex "PUSHF(16\|64)")>;

def SKXWriteResGroup71 : SchedWriteRes<[SKXPort23]> {		def SKXWriteResGroup71 : SchedWriteRes<[SKXPort23]> {
▲ Show 20 Lines • Show All 521 Lines • ▼ Show 20 Lines	def: InstRW<[SKXWriteResGroup128], (instregex "ROL(8\|16\|32\|64)mCL",
"SHR(8\|16\|32\|64)mCL")>;		"SHR(8\|16\|32\|64)mCL")>;

def SKXWriteResGroup130 : SchedWriteRes<[SKXPort4,SKXPort23,SKXPort237,SKXPort06,SKXPort0156]> {		def SKXWriteResGroup130 : SchedWriteRes<[SKXPort4,SKXPort23,SKXPort237,SKXPort06,SKXPort0156]> {
let Latency = 8;		let Latency = 8;
let NumMicroOps = 6;		let NumMicroOps = 6;
let ResourceCycles = [1,1,1,2,1];		let ResourceCycles = [1,1,1,2,1];
}		}
def: SchedAlias<WriteADCRMW, SKXWriteResGroup130>;		def: SchedAlias<WriteADCRMW, SKXWriteResGroup130>;
def: InstRW<[SKXWriteResGroup130], (instregex "CMPXCHG(8\|16\|32\|64)rm")>;

def SKXWriteResGroup131 : SchedWriteRes<[SKXPort0,SKXPort4,SKXPort5,SKXPort237,SKXPort0156]> {		def SKXWriteResGroup131 : SchedWriteRes<[SKXPort0,SKXPort4,SKXPort5,SKXPort237,SKXPort0156]> {
let Latency = 8;		let Latency = 8;
let NumMicroOps = 8;		let NumMicroOps = 8;
let ResourceCycles = [1,2,1,2,2];		let ResourceCycles = [1,2,1,2,2];
}		}
def: InstRW<[SKXWriteResGroup131], (instrs VPSCATTERQDZ128mr,		def: InstRW<[SKXWriteResGroup131], (instrs VPSCATTERQDZ128mr,
VPSCATTERQDZ256mr,		VPSCATTERQDZ256mr,
▲ Show 20 Lines • Show All 875 Lines • Show Last 20 Lines

lib/Target/X86/X86Schedule.td

	Show First 20 Lines • Show All 112 Lines • ▼ Show 20 Lines
	defm WriteADC : X86SchedWritePair; // Integer ALU + flags op.			defm WriteADC : X86SchedWritePair; // Integer ALU + flags op.
	def WriteALURMW : WriteSequence<[WriteALULd, WriteStore]>;			def WriteALURMW : WriteSequence<[WriteALULd, WriteStore]>;
	def WriteADCRMW : WriteSequence<[WriteADCLd, WriteStore]>;			def WriteADCRMW : WriteSequence<[WriteADCLd, WriteStore]>;
	defm WriteIMul : X86SchedWritePair; // Integer multiplication.			defm WriteIMul : X86SchedWritePair; // Integer multiplication.
	defm WriteIMul64 : X86SchedWritePair; // Integer 64-bit multiplication.			defm WriteIMul64 : X86SchedWritePair; // Integer 64-bit multiplication.
	def WriteIMulH : SchedWrite; // Integer multiplication, high part.			def WriteIMulH : SchedWrite; // Integer multiplication, high part.
	def WriteLEA : SchedWrite; // LEA instructions can't fold loads.			def WriteLEA : SchedWrite; // LEA instructions can't fold loads.

	defm WriteBSWAP32: X86SchedWritePair; // Byte Order (Endiannes) Swap			defm WriteCMPXCHG: X86SchedWritePair; // Compare and set, compare and swap.
	defm WriteBSWAP64: X86SchedWritePair; // Byte Order (Endiannes) Swap			defm WriteBSWAP32: X86SchedWritePair; // Byte Order (Endiannes) Swap.
				defm WriteBSWAP64: X86SchedWritePair; // Byte Order (Endiannes) Swap.

	// Integer division.			// Integer division.
	defm WriteDiv8 : X86SchedWritePair;			defm WriteDiv8 : X86SchedWritePair;
	defm WriteDiv16 : X86SchedWritePair;			defm WriteDiv16 : X86SchedWritePair;
	defm WriteDiv32 : X86SchedWritePair;			defm WriteDiv32 : X86SchedWritePair;
	defm WriteDiv64 : X86SchedWritePair;			defm WriteDiv64 : X86SchedWritePair;
	defm WriteIDiv8 : X86SchedWritePair;			defm WriteIDiv8 : X86SchedWritePair;
	defm WriteIDiv16 : X86SchedWritePair;			defm WriteIDiv16 : X86SchedWritePair;
	▲ Show 20 Lines • Show All 531 Lines • Show Last 20 Lines

lib/Target/X86/X86ScheduleAtom.td

	Show First 20 Lines • Show All 75 Lines • ▼ Show 20 Lines
	// Arithmetic.			// Arithmetic.
	////////////////////////////////////////////////////////////////////////////////			////////////////////////////////////////////////////////////////////////////////

	defm : AtomWriteResPair<WriteALU, [AtomPort01], [AtomPort0]>;			defm : AtomWriteResPair<WriteALU, [AtomPort01], [AtomPort0]>;
	defm : AtomWriteResPair<WriteADC, [AtomPort01], [AtomPort0]>;			defm : AtomWriteResPair<WriteADC, [AtomPort01], [AtomPort0]>;
	defm : AtomWriteResPair<WriteIMul, [AtomPort01], [AtomPort01], 7, 7, [7], [7]>;			defm : AtomWriteResPair<WriteIMul, [AtomPort01], [AtomPort01], 7, 7, [7], [7]>;
	defm : AtomWriteResPair<WriteIMul64, [AtomPort01], [AtomPort01], 12, 12, [12], [12]>;			defm : AtomWriteResPair<WriteIMul64, [AtomPort01], [AtomPort01], 12, 12, [12], [12]>;

				defm : AtomWriteResPair<WriteCMPXCHG, [AtomPort01], [AtomPort01], 15, 15, [15]>;
	defm : AtomWriteResPair<WriteBSWAP32, [AtomPort0], [AtomPort0]>;			defm : AtomWriteResPair<WriteBSWAP32, [AtomPort0], [AtomPort0]>;
	defm : AtomWriteResPair<WriteBSWAP64, [AtomPort0], [AtomPort0]>;			defm : AtomWriteResPair<WriteBSWAP64, [AtomPort0], [AtomPort0]>;

	defm : AtomWriteResPair<WriteDiv8, [AtomPort01], [AtomPort01], 50, 68, [50], [68]>;			defm : AtomWriteResPair<WriteDiv8, [AtomPort01], [AtomPort01], 50, 68, [50], [68]>;
	defm : AtomWriteResPair<WriteDiv16, [AtomPort01], [AtomPort01], 50, 50, [50], [50]>;			defm : AtomWriteResPair<WriteDiv16, [AtomPort01], [AtomPort01], 50, 50, [50], [50]>;
	defm : AtomWriteResPair<WriteDiv32, [AtomPort01], [AtomPort01], 50, 50, [50], [50]>;			defm : AtomWriteResPair<WriteDiv32, [AtomPort01], [AtomPort01], 50, 50, [50], [50]>;
	defm : AtomWriteResPair<WriteDiv64, [AtomPort01], [AtomPort01],130,130,[130],[130]>;			defm : AtomWriteResPair<WriteDiv64, [AtomPort01], [AtomPort01],130,130,[130],[130]>;
	defm : AtomWriteResPair<WriteIDiv8, [AtomPort01], [AtomPort01], 62, 62, [62], [62]>;			defm : AtomWriteResPair<WriteIDiv8, [AtomPort01], [AtomPort01], 62, 62, [62], [62]>;
	▲ Show 20 Lines • Show All 580 Lines • ▼ Show 20 Lines
	def : InstRW<[AtomWrite01_13], (instrs AAA, AAS)>;			def : InstRW<[AtomWrite01_13], (instrs AAA, AAS)>;

	def AtomWrite01_14 : SchedWriteRes<[AtomPort01]> {			def AtomWrite01_14 : SchedWriteRes<[AtomPort01]> {
	let Latency = 14;			let Latency = 14;
	let ResourceCycles = [14];			let ResourceCycles = [14];
	}			}
	def : InstRW<[AtomWrite01_14], (instrs CMPXCHG16rm, CMPXCHG32rm, CMPXCHG64rm)>;			def : InstRW<[AtomWrite01_14], (instrs CMPXCHG16rm, CMPXCHG32rm, CMPXCHG64rm)>;

	def AtomWrite01_15 : SchedWriteRes<[AtomPort01]> {
	let Latency = 15;
	let ResourceCycles = [15];
	}
	def : InstRW<[AtomWrite01_15], (instrs CMPXCHG16rr, CMPXCHG32rr, CMPXCHG64rr)>;

	def AtomWrite01_17 : SchedWriteRes<[AtomPort01]> {			def AtomWrite01_17 : SchedWriteRes<[AtomPort01]> {
	let Latency = 17;			let Latency = 17;
	let ResourceCycles = [17];			let ResourceCycles = [17];
	}			}
	def : InstRW<[AtomWrite01_17], (instrs LOOPNE, PAUSE)>;			def : InstRW<[AtomWrite01_17], (instrs LOOPNE, PAUSE)>;

	def AtomWrite01_18 : SchedWriteRes<[AtomPort01]> {			def AtomWrite01_18 : SchedWriteRes<[AtomPort01]> {
	let Latency = 18;			let Latency = 18;
	▲ Show 20 Lines • Show All 224 Lines • Show Last 20 Lines

lib/Target/X86/X86ScheduleBtVer2.td

	Show First 20 Lines • Show All 162 Lines • ▼ Show 20 Lines
	////////////////////////////////////////////////////////////////////////////////			////////////////////////////////////////////////////////////////////////////////

	defm : JWriteResIntPair<WriteALU, [JALU01], 1>;			defm : JWriteResIntPair<WriteALU, [JALU01], 1>;
	defm : JWriteResIntPair<WriteADC, [JALU01], 1, [2]>;			defm : JWriteResIntPair<WriteADC, [JALU01], 1, [2]>;
	defm : JWriteResIntPair<WriteIMul, [JALU1, JMul], 3, [1, 1], 2>; // i8/i16/i32 multiplication			defm : JWriteResIntPair<WriteIMul, [JALU1, JMul], 3, [1, 1], 2>; // i8/i16/i32 multiplication
	defm : JWriteResIntPair<WriteIMul64, [JALU1, JMul], 6, [1, 4], 2>; // i64 multiplication			defm : JWriteResIntPair<WriteIMul64, [JALU1, JMul], 6, [1, 4], 2>; // i64 multiplication
	defm : X86WriteRes<WriteIMulH, [JALU1], 6, [4], 1>;			defm : X86WriteRes<WriteIMulH, [JALU1], 6, [4], 1>;

				defm : JWriteResIntPair<WriteCMPXCHG,[JALU01], 1>;
	defm : JWriteResIntPair<WriteBSWAP32,[JALU01], 1>;			defm : JWriteResIntPair<WriteBSWAP32,[JALU01], 1>;
	defm : JWriteResIntPair<WriteBSWAP64,[JALU01], 1>;			defm : JWriteResIntPair<WriteBSWAP64,[JALU01], 1>;

	defm : JWriteResIntPair<WriteDiv8, [JALU1, JDiv], 12, [1, 12], 1>;			defm : JWriteResIntPair<WriteDiv8, [JALU1, JDiv], 12, [1, 12], 1>;
	defm : JWriteResIntPair<WriteDiv16, [JALU1, JDiv], 17, [1, 17], 2>;			defm : JWriteResIntPair<WriteDiv16, [JALU1, JDiv], 17, [1, 17], 2>;
	defm : JWriteResIntPair<WriteDiv32, [JALU1, JDiv], 25, [1, 25], 2>;			defm : JWriteResIntPair<WriteDiv32, [JALU1, JDiv], 25, [1, 25], 2>;
	defm : JWriteResIntPair<WriteDiv64, [JALU1, JDiv], 41, [1, 41], 2>;			defm : JWriteResIntPair<WriteDiv64, [JALU1, JDiv], 41, [1, 41], 2>;
	defm : JWriteResIntPair<WriteIDiv8, [JALU1, JDiv], 12, [1, 12], 1>;			defm : JWriteResIntPair<WriteIDiv8, [JALU1, JDiv], 12, [1, 12], 1>;
	▲ Show 20 Lines • Show All 504 Lines • Show Last 20 Lines

lib/Target/X86/X86ScheduleSLM.td

	Show First 20 Lines • Show All 92 Lines • ▼ Show 20 Lines
	// Treat misc copies as a move.			// Treat misc copies as a move.
	def : InstRW<[WriteMove], (instrs COPY)>;			def : InstRW<[WriteMove], (instrs COPY)>;

	defm : SLMWriteResPair<WriteALU, [SLM_IEC_RSV01], 1>;			defm : SLMWriteResPair<WriteALU, [SLM_IEC_RSV01], 1>;
	defm : SLMWriteResPair<WriteADC, [SLM_IEC_RSV01], 1>;			defm : SLMWriteResPair<WriteADC, [SLM_IEC_RSV01], 1>;
	defm : SLMWriteResPair<WriteIMul, [SLM_IEC_RSV1], 3>;			defm : SLMWriteResPair<WriteIMul, [SLM_IEC_RSV1], 3>;
	defm : SLMWriteResPair<WriteIMul64, [SLM_IEC_RSV1], 3>;			defm : SLMWriteResPair<WriteIMul64, [SLM_IEC_RSV1], 3>;

				defm : SLMWriteResPair<WriteCMPXCHG,[SLM_IEC_RSV01], 1>;
	defm : SLMWriteResPair<WriteBSWAP32,[SLM_IEC_RSV01], 1>;			defm : SLMWriteResPair<WriteBSWAP32,[SLM_IEC_RSV01], 1>;
	defm : SLMWriteResPair<WriteBSWAP64,[SLM_IEC_RSV01], 1>;			defm : SLMWriteResPair<WriteBSWAP64,[SLM_IEC_RSV01], 1>;

	defm : SLMWriteResPair<WriteShift, [SLM_IEC_RSV0], 1>;			defm : SLMWriteResPair<WriteShift, [SLM_IEC_RSV0], 1>;

	defm : X86WriteRes<WriteSHDrri, [SLM_IEC_RSV0], 1, [1], 1>;			defm : X86WriteRes<WriteSHDrri, [SLM_IEC_RSV0], 1, [1], 1>;
	defm : X86WriteRes<WriteSHDrrcl,[SLM_IEC_RSV0], 1, [1], 1>;			defm : X86WriteRes<WriteSHDrrcl,[SLM_IEC_RSV0], 1, [1], 1>;
	defm : X86WriteRes<WriteSHDmri, [SLM_MEC_RSV, SLM_IEC_RSV0], 4, [2, 1], 2>;			defm : X86WriteRes<WriteSHDmri, [SLM_MEC_RSV, SLM_IEC_RSV0], 4, [2, 1], 2>;
	▲ Show 20 Lines • Show All 378 Lines • Show Last 20 Lines

lib/Target/X86/X86ScheduleZnver1.td

	Show First 20 Lines • Show All 174 Lines • ▼ Show 20 Lines

	def : WriteRes<WriteZero, []>;			def : WriteRes<WriteZero, []>;
	def : WriteRes<WriteLEA, [ZnALU]>;			def : WriteRes<WriteLEA, [ZnALU]>;
	defm : ZnWriteResPair<WriteALU, [ZnALU], 1>;			defm : ZnWriteResPair<WriteALU, [ZnALU], 1>;
	defm : ZnWriteResPair<WriteADC, [ZnALU], 1>;			defm : ZnWriteResPair<WriteADC, [ZnALU], 1>;
	defm : ZnWriteResPair<WriteIMul, [ZnALU1, ZnMultiplier], 4>;			defm : ZnWriteResPair<WriteIMul, [ZnALU1, ZnMultiplier], 4>;
	defm : ZnWriteResPair<WriteIMul64, [ZnALU1, ZnMultiplier], 4, [1,1], 2>;			defm : ZnWriteResPair<WriteIMul64, [ZnALU1, ZnMultiplier], 4, [1,1], 2>;

				defm : X86WriteRes<WriteCMPXCHG,[ZnALU], 1, [1], 1>;
				defm : X86WriteRes<WriteCMPXCHGLd,[ZnALU], 8, [1], 5>;

	defm : ZnWriteResPair<WriteBSWAP32,[ZnALU], 1, [4]>;			defm : ZnWriteResPair<WriteBSWAP32,[ZnALU], 1, [4]>;
	defm : ZnWriteResPair<WriteBSWAP64,[ZnALU], 1, [4]>;			defm : ZnWriteResPair<WriteBSWAP64,[ZnALU], 1, [4]>;

	defm : ZnWriteResPair<WriteShift, [ZnALU], 1>;			defm : ZnWriteResPair<WriteShift, [ZnALU], 1>;

	defm : X86WriteRes<WriteSHDrri, [ZnALU], 1, [1], 1>;			defm : X86WriteRes<WriteSHDrri, [ZnALU], 1, [1], 1>;
	defm : X86WriteResUnsupported<WriteSHDrrcl>;			defm : X86WriteResUnsupported<WriteSHDrrcl>;
	defm : X86WriteResUnsupported<WriteSHDmri>;			defm : X86WriteResUnsupported<WriteSHDmri>;
	▲ Show 20 Lines • Show All 554 Lines • ▼ Show 20 Lines

	// r,r,cl.			// r,r,cl.
	def : InstRW<[WriteMicrocoded], (instregex "SH(R\|L)D(16\|32\|64)rrCL")>;			def : InstRW<[WriteMicrocoded], (instregex "SH(R\|L)D(16\|32\|64)rrCL")>;

	// m,r,cl.			// m,r,cl.
	def : InstRW<[WriteMicrocoded], (instregex "SH(R\|L)D(16\|32\|64)mrCL")>;			def : InstRW<[WriteMicrocoded], (instregex "SH(R\|L)D(16\|32\|64)mrCL")>;

	//-- Misc instructions --//			//-- Misc instructions --//
	// CMPXCHG.
	def ZnWriteCMPXCHG : SchedWriteRes<[ZnAGU, ZnALU]> {
	let Latency = 8;
	let NumMicroOps = 5;
	}
	def : InstRW<[ZnWriteCMPXCHG], (instregex "CMPXCHG(8\|16\|32\|64)rm")>;

	// CMPXCHG8B.			// CMPXCHG8B.
	def ZnWriteCMPXCHG8B : SchedWriteRes<[ZnAGU, ZnALU]> {			def ZnWriteCMPXCHG8B : SchedWriteRes<[ZnAGU, ZnALU]> {
	let NumMicroOps = 18;			let NumMicroOps = 18;
	}			}
	def : InstRW<[ZnWriteCMPXCHG8B], (instrs CMPXCHG8B)>;			def : InstRW<[ZnWriteCMPXCHG8B], (instrs CMPXCHG8B)>;

	def : InstRW<[WriteMicrocoded], (instrs CMPXCHG16B)>;			def : InstRW<[WriteMicrocoded], (instrs CMPXCHG16B)>;

	▲ Show 20 Lines • Show All 777 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Improved sched models for X86 CMPXCHG* instructions
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 158552

lib/Target/X86/X86InstrInfo.td

lib/Target/X86/X86SchedBroadwell.td

lib/Target/X86/X86SchedHaswell.td

lib/Target/X86/X86SchedSandyBridge.td

lib/Target/X86/X86SchedSkylakeClient.td

lib/Target/X86/X86SchedSkylakeServer.td

lib/Target/X86/X86Schedule.td

lib/Target/X86/X86ScheduleAtom.td

lib/Target/X86/X86ScheduleBtVer2.td

lib/Target/X86/X86ScheduleSLM.td

lib/Target/X86/X86ScheduleZnver1.td

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Improved sched models for X86 CMPXCHG* instructionsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 158552

lib/Target/X86/X86InstrInfo.td

lib/Target/X86/X86SchedBroadwell.td

lib/Target/X86/X86SchedHaswell.td

lib/Target/X86/X86SchedSandyBridge.td

lib/Target/X86/X86SchedSkylakeClient.td

lib/Target/X86/X86SchedSkylakeServer.td

lib/Target/X86/X86Schedule.td

lib/Target/X86/X86ScheduleAtom.td

lib/Target/X86/X86ScheduleBtVer2.td

lib/Target/X86/X86ScheduleSLM.td

lib/Target/X86/X86ScheduleZnver1.td

[X86] Improved sched models for X86 CMPXCHG* instructions
ClosedPublic