This is an archive of the discontinued LLVM Phabricator instance.

[X86] Improve the gather scheduler models for SkylakeClient and SkylakeServer
ClosedPublic

Authored by craig.topper on Feb 4 2020, 2:54 PM.

Download Raw Diff

Details

Reviewers

RKSimon
andreadb

Commits

rGc6bdd8e73110: [X86] Improve the gather scheduler models for SkylakeClient and SkylakeServer

Summary

The load ports need a cycle for each potentially loaded element just like Haswell and Skylake. Unlike Haswell and Broadwell, the number of uops does not scale with the number of elements. Instead the load uops run for multiple cycles.

I've taken the latency number from the uops.info. The port binding for the non-load uops is taken from the original IACA data I have.

I've added avx512 gather instructions to llvm-mca resource tests. I wanted to pre-commit them, but since some of them have 0 uops in the existing data, llvm-mca gave an error.

Diff Detail

Event Timeline

craig.topper created this revision.Feb 4 2020, 2:54 PM

Herald added a project: Restricted Project. · View Herald TranscriptFeb 4 2020, 2:55 PM

Herald added subscribers: gbedwell, hiraditya. · View Herald Transcript

Please can you add the resources-avx512.s/resources-avx512vl.s changes to the generic tests as well ?

I've added avx512 gather instructions to llvm-mca resource tests. I wanted to pre-commit them, but since some of them have 0 uops in the existing data, llvm-mca gave an error.

Field NumMicroOpcodes is currently used by mca to model the number of uOPs dispatched from the uOp-Queue to the out of order backend.
From a 'dispatch' point of view, an instruction with zero opcodes is still valid; it simply doesn't consume any dispatch group slots.

However, mca doesn't expect an instruction with zero uOPs to consume pipeline resources. That is seen as a contradiction in practice; it makes sense only if the instruction is always eliminated and never really executed. Maybe mca is being too conservative here. However I believe that we should check this in the subtarget emitter when we verify the scheduling info from tablegen (I'll raise a bug about it).

What I can do in the short term is to remove the check for MayLoad and MayStore in mca (I have a patch ready for it). That check is too conservative, since we were already test if an instruction consumes processor resources in general. That is enough to fix the issue that you saw with zero uOP gathers.

In D74000#1859033, @andreadb wrote:

I've added avx512 gather instructions to llvm-mca resource tests. I wanted to pre-commit them, but since some of them have 0 uops in the existing data, llvm-mca gave an error.

What I can do in the short term is to remove the check for MayLoad and MayStore in mca (I have a patch ready for it). That check is too conservative, since we were already test if an instruction consumes processor resources in general. That is enough to fix the issue that you saw with zero uOP gathers.

FTR: I have committed aaaeac6 to remove those checks.
So, (if you really want to) you should be able now to precommit your new tests.

That being said. The patch looks good to me modulo the request from Simon.

Update Generic tests too

No preference whether you pre-commit the tests or not. LGTM - cheers

This revision is now accepted and ready to land.Feb 5 2020, 8:35 AM

LGTM too.

Closed by commit rGc6bdd8e73110: [X86] Improve the gather scheduler models for SkylakeClient and SkylakeServer (authored by craig.topper). · Explain WhyFeb 5 2020, 1:30 PM

This revision was automatically updated to reflect the committed changes.

Revision Contents

Path

Size

llvm/

lib/

Target/

X86/

X86SchedSkylakeClient.td

44 lines

X86SchedSkylakeServer.td

151 lines

test/

tools/

llvm-mca/

X86/

SkylakeClient/

resources-avx2.s

54 lines

SkylakeServer/

resources-avx2.s

54 lines

resources-avx512.s

28 lines

resources-avx512vl.s

54 lines

Diff 242435

llvm/lib/Target/X86/X86SchedSkylakeClient.td

	Show First 20 Lines • Show All 1,587 Lines • ▼ Show 20 Lines

	def SKLWriteResGroup196 : SchedWriteRes<[SKLPort0,SKLPort23]> {			def SKLWriteResGroup196 : SchedWriteRes<[SKLPort0,SKLPort23]> {
	let Latency = 22;			let Latency = 22;
	let NumMicroOps = 2;			let NumMicroOps = 2;
	let ResourceCycles = [1,1];			let ResourceCycles = [1,1];
	}			}
	def: InstRW<[SKLWriteResGroup196], (instregex "DIV_F(32\|64)m")>;			def: InstRW<[SKLWriteResGroup196], (instregex "DIV_F(32\|64)m")>;

	def SKLWriteResGroup196_1 : SchedWriteRes<[SKLPort0, SKLPort23, SKLPort5, SKLPort015]> {			def SKLWriteResGroupVEX2 : SchedWriteRes<[SKLPort0, SKLPort23, SKLPort5, SKLPort015]> {
	let Latency = 22;			let Latency = 18;
	let NumMicroOps = 5;			let NumMicroOps = 5; // 2 uops perform multiple loads
	let ResourceCycles = [1,2,1,1];			let ResourceCycles = [1,2,1,1];
	}			}
	def: InstRW<[SKLWriteResGroup196_1], (instrs VGATHERDPSrm,			def: InstRW<[SKLWriteResGroupVEX2], (instrs VGATHERDPDrm, VPGATHERDQrm,
	VGATHERDPDrm,			VGATHERQPDrm, VPGATHERQQrm,
	VGATHERQPDrm,			VGATHERQPSrm, VPGATHERQDrm)>;
	VGATHERQPSrm,
	VPGATHERDDrm,
	VPGATHERDQrm,
	VPGATHERQDrm,
	VPGATHERQQrm)>;

	def SKLWriteResGroup196_2 : SchedWriteRes<[SKLPort0, SKLPort23, SKLPort5, SKLPort015]> {			def SKLWriteResGroupVEX4 : SchedWriteRes<[SKLPort0, SKLPort23, SKLPort5, SKLPort015]> {
	let Latency = 25;			let Latency = 20;
	let NumMicroOps = 5;			let NumMicroOps = 5; // 2 uops peform multiple loads
	let ResourceCycles = [1,2,1,1];			let ResourceCycles = [1,4,1,1];
				}
				def: InstRW<[SKLWriteResGroupVEX4], (instrs VGATHERDPDYrm, VPGATHERDQYrm,
				VGATHERDPSrm, VPGATHERDDrm,
				VGATHERQPDYrm, VPGATHERQQYrm,
				VGATHERQPSYrm, VPGATHERQDYrm)>;

				def SKLWriteResGroupVEX8 : SchedWriteRes<[SKLPort0, SKLPort23, SKLPort5, SKLPort015]> {
				let Latency = 22;
				let NumMicroOps = 5; // 2 uops perform multiple loads
				let ResourceCycles = [1,8,1,1];
	}			}
	def: InstRW<[SKLWriteResGroup196_2], (instrs VGATHERDPSYrm,			def: InstRW<[SKLWriteResGroupVEX8], (instrs VGATHERDPSYrm, VPGATHERDDYrm)>;
	VGATHERQPDYrm,
	VGATHERQPSYrm,
	VPGATHERDDYrm,
	VPGATHERDQYrm,
	VPGATHERQDYrm,
	VPGATHERQQYrm,
	VGATHERDPDYrm)>;

	def SKLWriteResGroup198 : SchedWriteRes<[SKLPort0,SKLPort4,SKLPort5,SKLPort23,SKLPort237,SKLPort06,SKLPort0156]> {			def SKLWriteResGroup198 : SchedWriteRes<[SKLPort0,SKLPort4,SKLPort5,SKLPort23,SKLPort237,SKLPort06,SKLPort0156]> {
	let Latency = 23;			let Latency = 23;
	let NumMicroOps = 19;			let NumMicroOps = 19;
	let ResourceCycles = [2,1,4,1,1,4,6];			let ResourceCycles = [2,1,4,1,1,4,6];
	}			}
	def: InstRW<[SKLWriteResGroup198], (instrs CMPXCHG16B)>;			def: InstRW<[SKLWriteResGroup198], (instrs CMPXCHG16B)>;

	▲ Show 20 Lines • Show All 264 Lines • Show Last 20 Lines

llvm/lib/Target/X86/X86SchedSkylakeServer.td

	Show First 20 Lines • Show All 2,139 Lines • ▼ Show 20 Lines
	def SKXWriteResGroup211 : SchedWriteRes<[SKXPort23,SKXPort015]> {			def SKXWriteResGroup211 : SchedWriteRes<[SKXPort23,SKXPort015]> {
	let Latency = 19;			let Latency = 19;
	let NumMicroOps = 4;			let NumMicroOps = 4;
	let ResourceCycles = [1,3];			let ResourceCycles = [1,3];
	}			}
	def: InstRW<[SKXWriteResGroup211], (instregex "VPMULLQZ256rm(b?)",			def: InstRW<[SKXWriteResGroup211], (instregex "VPMULLQZ256rm(b?)",
	"VPMULLQZrm(b?)")>;			"VPMULLQZrm(b?)")>;

	def SKXWriteResGroup214 : SchedWriteRes<[]> {
	let Latency = 20;
	let NumMicroOps = 0;
	}
	def: InstRW<[SKXWriteResGroup214], (instrs VGATHERDPSZ128rm,
	VGATHERQPSZrm,
	VPGATHERDDZ128rm)>;

	def SKXWriteResGroup215 : SchedWriteRes<[SKXPort0]> {			def SKXWriteResGroup215 : SchedWriteRes<[SKXPort0]> {
	let Latency = 20;			let Latency = 20;
	let NumMicroOps = 1;			let NumMicroOps = 1;
	let ResourceCycles = [1];			let ResourceCycles = [1];
	}			}
	def: InstRW<[SKXWriteResGroup215], (instregex "DIV_(FPrST0\|FST0r\|FrST0)")>;			def: InstRW<[SKXWriteResGroup215], (instregex "DIV_(FPrST0\|FST0r\|FrST0)")>;

	def SKXWriteResGroup216 : SchedWriteRes<[SKXPort0,SKXPort23,SKXFPDivider]> {			def SKXWriteResGroup216 : SchedWriteRes<[SKXPort0,SKXPort23,SKXFPDivider]> {
	let Latency = 20;			let Latency = 20;
	let NumMicroOps = 2;			let NumMicroOps = 2;
	let ResourceCycles = [1,1,4];			let ResourceCycles = [1,1,4];
	}			}
	def : SchedAlias<WriteFDiv64XLd, SKXWriteResGroup216>; // TODO - convert to ZnWriteResFpuPair			def : SchedAlias<WriteFDiv64XLd, SKXWriteResGroup216>; // TODO - convert to ZnWriteResFpuPair

	def SKXWriteResGroup218 : SchedWriteRes<[SKXPort0,SKXPort23,SKXPort015,SKXPort0156]> {			def SKXWriteGatherEVEX2 : SchedWriteRes<[SKXPort0,SKXPort23,SKXPort015,SKXPort0156]> {
	let Latency = 20;			let Latency = 17;
	let NumMicroOps = 5;			let NumMicroOps = 5; // 2 uops perform multiple loads
	let ResourceCycles = [1,2,1,1];			let ResourceCycles = [1,2,1,1];
	}			}
	def: InstRW<[SKXWriteResGroup218], (instrs VGATHERQPSZ128rm,			def: InstRW<[SKXWriteGatherEVEX2], (instrs VGATHERQPSZ128rm, VPGATHERQDZ128rm,
	VGATHERQPSZ256rm,			VGATHERDPDZ128rm, VPGATHERDQZ128rm,
	VPGATHERQDZ128rm,			VGATHERQPDZ128rm, VPGATHERQQZ128rm)>;
	VPGATHERQDZ256rm)>;
				def SKXWriteGatherEVEX4 : SchedWriteRes<[SKXPort0,SKXPort23,SKXPort015,SKXPort0156]> {
				let Latency = 19;
				let NumMicroOps = 5; // 2 uops perform multiple loads
				let ResourceCycles = [1,4,1,1];
				}
				def: InstRW<[SKXWriteGatherEVEX4], (instrs VGATHERQPSZ256rm, VPGATHERQDZ256rm,
				VGATHERQPDZ256rm, VPGATHERQQZ256rm,
				VGATHERDPSZ128rm, VPGATHERDDZ128rm,
				VGATHERDPDZ256rm, VPGATHERDQZ256rm)>;

				def SKXWriteGatherEVEX8 : SchedWriteRes<[SKXPort0,SKXPort23,SKXPort015,SKXPort0156]> {
				let Latency = 21;
				let NumMicroOps = 5; // 2 uops perform multiple loads
				let ResourceCycles = [1,8,1,1];
				}
				def: InstRW<[SKXWriteGatherEVEX8], (instrs VGATHERDPSZ256rm, VPGATHERDDZ256rm,
				VGATHERDPDZrm, VPGATHERDQZrm,
				VGATHERQPDZrm, VPGATHERQQZrm,
				VGATHERQPSZrm, VPGATHERQDZrm)>;

				def SKXWriteGatherEVEX16 : SchedWriteRes<[SKXPort0,SKXPort23,SKXPort015,SKXPort0156]> {
				let Latency = 25;
				let NumMicroOps = 5; // 2 uops perform multiple loads
				let ResourceCycles = [1,16,1,1];
				}
				def: InstRW<[SKXWriteGatherEVEX16], (instrs VGATHERDPSZrm, VPGATHERDDZrm)>;

	def SKXWriteResGroup219 : SchedWriteRes<[SKXPort4,SKXPort5,SKXPort6,SKXPort23,SKXPort237,SKXPort06,SKXPort0156]> {			def SKXWriteResGroup219 : SchedWriteRes<[SKXPort4,SKXPort5,SKXPort6,SKXPort23,SKXPort237,SKXPort06,SKXPort0156]> {
	let Latency = 20;			let Latency = 20;
	let NumMicroOps = 8;			let NumMicroOps = 8;
	let ResourceCycles = [1,1,1,1,1,1,2];			let ResourceCycles = [1,1,1,1,1,1,2];
	}			}
	def: InstRW<[SKXWriteResGroup219], (instrs INSB, INSL, INSW)>;			def: InstRW<[SKXWriteResGroup219], (instrs INSB, INSL, INSW)>;

	Show All 13 Lines

	def SKXWriteResGroup223 : SchedWriteRes<[SKXPort0,SKXPort23]> {			def SKXWriteResGroup223 : SchedWriteRes<[SKXPort0,SKXPort23]> {
	let Latency = 22;			let Latency = 22;
	let NumMicroOps = 2;			let NumMicroOps = 2;
	let ResourceCycles = [1,1];			let ResourceCycles = [1,1];
	}			}
	def: InstRW<[SKXWriteResGroup223], (instregex "DIV_F(32\|64)m")>;			def: InstRW<[SKXWriteResGroup223], (instregex "DIV_F(32\|64)m")>;

	def SKXWriteResGroup224 : SchedWriteRes<[SKXPort0,SKXPort23,SKXPort015,SKXPort0156]> {			def SKXWriteResGroupVEX2 : SchedWriteRes<[SKXPort0, SKXPort23, SKXPort5, SKXPort015]> {
	let Latency = 22;			let Latency = 18;
	let NumMicroOps = 5;			let NumMicroOps = 5; // 2 uops perform multiple loads
	let ResourceCycles = [1,2,1,1];			let ResourceCycles = [1,2,1,1];
	}			}
	def: InstRW<[SKXWriteResGroup224], (instrs VGATHERDPDZ128rm,			def: InstRW<[SKXWriteResGroupVEX2], (instrs VGATHERDPDrm, VPGATHERDQrm,
	VGATHERQPDZ128rm,			VGATHERQPDrm, VPGATHERQQrm,
	VPGATHERDQZ128rm,			VGATHERQPSrm, VPGATHERQDrm)>;
	VPGATHERQQZ128rm)>;

	def SKXWriteResGroup224_2 : SchedWriteRes<[SKXPort0, SKXPort23, SKXPort5, SKXPort015]> {			def SKXWriteResGroupVEX4 : SchedWriteRes<[SKXPort0, SKXPort23, SKXPort5, SKXPort015]> {
	let Latency = 22;			let Latency = 20;
	let NumMicroOps = 5;			let NumMicroOps = 5; // 2 uops peform multiple loads
	let ResourceCycles = [1,2,1,1];			let ResourceCycles = [1,4,1,1];
	}			}
	def: InstRW<[SKXWriteResGroup224_2], (instrs VGATHERDPSrm,			def: InstRW<[SKXWriteResGroupVEX4], (instrs VGATHERDPDYrm, VPGATHERDQYrm,
	VGATHERDPDrm,			VGATHERDPSrm, VPGATHERDDrm,
	VGATHERQPDrm,			VGATHERQPDYrm, VPGATHERQQYrm,
	VGATHERQPSrm,			VGATHERQPSYrm, VPGATHERQDYrm)>;
	VPGATHERDDrm,
	VPGATHERDQrm,
	VPGATHERQDrm,
	VPGATHERQQrm,
	VPGATHERDDrm,
	VPGATHERQDrm,
	VPGATHERDQrm,
	VPGATHERQQrm,
	VGATHERDPSrm,
	VGATHERQPSrm,
	VGATHERDPDrm,
	VGATHERQPDrm)>;

	def SKXWriteResGroup224_3 : SchedWriteRes<[SKXPort0, SKXPort23, SKXPort5, SKXPort015]> {			def SKXWriteResGroupVEX8 : SchedWriteRes<[SKXPort0, SKXPort23, SKXPort5, SKXPort015]> {
	let Latency = 25;			let Latency = 22;
	let NumMicroOps = 5;			let NumMicroOps = 5; // 2 uops perform multiple loads
	let ResourceCycles = [1,2,1,1];			let ResourceCycles = [1,8,1,1];
	}			}
	def: InstRW<[SKXWriteResGroup224_3], (instrs VGATHERDPSYrm,			def: InstRW<[SKXWriteResGroupVEX8], (instrs VGATHERDPSYrm, VPGATHERDDYrm)>;
	VGATHERQPDYrm,
	VGATHERQPSYrm,
	VPGATHERDDYrm,
	VPGATHERDQYrm,
	VPGATHERQDYrm,
	VPGATHERQQYrm,
	VPGATHERDDYrm,
	VPGATHERQDYrm,
	VPGATHERDQYrm,
	VPGATHERQQYrm,
	VGATHERDPSYrm,
	VGATHERQPSYrm,
	VGATHERDPDYrm)>;

	def SKXWriteResGroup225 : SchedWriteRes<[SKXPort5,SKXPort01,SKXPort015]> {			def SKXWriteResGroup225 : SchedWriteRes<[SKXPort5,SKXPort01,SKXPort015]> {
	let Latency = 22;			let Latency = 22;
	let NumMicroOps = 14;			let NumMicroOps = 14;
	let ResourceCycles = [5,5,4];			let ResourceCycles = [5,5,4];
	}			}
	def: InstRW<[SKXWriteResGroup225], (instregex "VPCONFLICTDZ128rr",			def: InstRW<[SKXWriteResGroup225], (instregex "VPCONFLICTDZ128rr",
	"VPCONFLICTQZ256rr")>;			"VPCONFLICTQZ256rr")>;

	def SKXWriteResGroup228 : SchedWriteRes<[SKXPort0,SKXPort4,SKXPort5,SKXPort23,SKXPort237,SKXPort06,SKXPort0156]> {			def SKXWriteResGroup228 : SchedWriteRes<[SKXPort0,SKXPort4,SKXPort5,SKXPort23,SKXPort237,SKXPort06,SKXPort0156]> {
	let Latency = 23;			let Latency = 23;
	let NumMicroOps = 19;			let NumMicroOps = 19;
	let ResourceCycles = [2,1,4,1,1,4,6];			let ResourceCycles = [2,1,4,1,1,4,6];
	}			}
	def: InstRW<[SKXWriteResGroup228], (instrs CMPXCHG16B)>;			def: InstRW<[SKXWriteResGroup228], (instrs CMPXCHG16B)>;

	def SKXWriteResGroup233 : SchedWriteRes<[SKXPort0,SKXPort5,SKXPort23]> {			def SKXWriteResGroup233 : SchedWriteRes<[SKXPort0,SKXPort5,SKXPort23]> {
	let Latency = 25;			let Latency = 25;
	let NumMicroOps = 3;			let NumMicroOps = 3;
	let ResourceCycles = [1,1,1];			let ResourceCycles = [1,1,1];
	}			}
	def: InstRW<[SKXWriteResGroup233], (instregex "DIV_FI(16\|32)m")>;			def: InstRW<[SKXWriteResGroup233], (instregex "DIV_FI(16\|32)m")>;

	def SKXWriteResGroup234 : SchedWriteRes<[SKXPort0,SKXPort23,SKXPort015,SKXPort0156]> {
	let Latency = 25;
	let NumMicroOps = 5;
	let ResourceCycles = [1,2,1,1];
	}
	def: InstRW<[SKXWriteResGroup234], (instrs VGATHERDPDZ256rm,
	VGATHERQPDZ256rm,
	VPGATHERDQZ256rm,
	VPGATHERQDZrm,
	VPGATHERQQZ256rm)>;

	def SKXWriteResGroup238 : SchedWriteRes<[SKXPort0,SKXPort23,SKXPort015,SKXPort0156]> {
	let Latency = 26;
	let NumMicroOps = 5;
	let ResourceCycles = [1,2,1,1];
	}
	def: InstRW<[SKXWriteResGroup238], (instrs VGATHERDPDZrm,
	VGATHERQPDZrm,
	VPGATHERDQZrm,
	VPGATHERQQZrm)>;

	def SKXWriteResGroup239 : SchedWriteRes<[SKXPort0,SKXPort23]> {			def SKXWriteResGroup239 : SchedWriteRes<[SKXPort0,SKXPort23]> {
	let Latency = 27;			let Latency = 27;
	let NumMicroOps = 2;			let NumMicroOps = 2;
	let ResourceCycles = [1,1];			let ResourceCycles = [1,1];
	}			}
	def: InstRW<[SKXWriteResGroup239], (instregex "DIVR_F(32\|64)m")>;			def: InstRW<[SKXWriteResGroup239], (instregex "DIVR_F(32\|64)m")>;

	def SKXWriteResGroup240 : SchedWriteRes<[SKXPort0,SKXPort23,SKXPort015,SKXPort0156]> {
	let Latency = 27;
	let NumMicroOps = 5;
	let ResourceCycles = [1,2,1,1];
	}
	def: InstRW<[SKXWriteResGroup240], (instrs VGATHERDPSZ256rm,
	VPGATHERDDZ256rm)>;

	def SKXWriteResGroup242 : SchedWriteRes<[SKXPort5,SKXPort01,SKXPort23,SKXPort015]> {			def SKXWriteResGroup242 : SchedWriteRes<[SKXPort5,SKXPort01,SKXPort23,SKXPort015]> {
	let Latency = 29;			let Latency = 29;
	let NumMicroOps = 15;			let NumMicroOps = 15;
	let ResourceCycles = [5,5,1,4];			let ResourceCycles = [5,5,1,4];
	}			}
	def: InstRW<[SKXWriteResGroup242], (instregex "VPCONFLICTQZ256rm(b?)")>;			def: InstRW<[SKXWriteResGroup242], (instregex "VPCONFLICTQZ256rm(b?)")>;

	def SKXWriteResGroup243 : SchedWriteRes<[SKXPort0,SKXPort5,SKXPort23]> {			def SKXWriteResGroup243 : SchedWriteRes<[SKXPort0,SKXPort5,SKXPort23]> {
	let Latency = 30;			let Latency = 30;
	let NumMicroOps = 3;			let NumMicroOps = 3;
	let ResourceCycles = [1,1,1];			let ResourceCycles = [1,1,1];
	}			}
	def: InstRW<[SKXWriteResGroup243], (instregex "DIVR_FI(16\|32)m")>;			def: InstRW<[SKXWriteResGroup243], (instregex "DIVR_FI(16\|32)m")>;

	def SKXWriteResGroup245 : SchedWriteRes<[SKXPort0,SKXPort23,SKXPort015,SKXPort0156]> {
	let Latency = 30;
	let NumMicroOps = 5;
	let ResourceCycles = [1,2,1,1];
	}
	def: InstRW<[SKXWriteResGroup245], (instrs VGATHERDPSZrm,
	VPGATHERDDZrm)>;

	def SKXWriteResGroup247 : SchedWriteRes<[SKXPort5,SKXPort6,SKXPort23,SKXPort06,SKXPort0156]> {			def SKXWriteResGroup247 : SchedWriteRes<[SKXPort5,SKXPort6,SKXPort23,SKXPort06,SKXPort0156]> {
	let Latency = 35;			let Latency = 35;
	let NumMicroOps = 23;			let NumMicroOps = 23;
	let ResourceCycles = [1,5,3,4,10];			let ResourceCycles = [1,5,3,4,10];
	}			}
	def: InstRW<[SKXWriteResGroup247], (instregex "IN(8\|16\|32)ri",			def: InstRW<[SKXWriteResGroup247], (instregex "IN(8\|16\|32)ri",
	"IN(8\|16\|32)rr")>;			"IN(8\|16\|32)rr")>;

	▲ Show 20 Lines • Show All 286 Lines • Show Last 20 Lines

llvm/test/tools/llvm-mca/X86/SkylakeClient/resources-avx2.s

	Show First 20 Lines • Show All 459 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: [6]: HasSideEffects (U)			# CHECK-NEXT: [6]: HasSideEffects (U)

	# CHECK: [1] [2] [3] [4] [5] [6] Instructions:			# CHECK: [1] [2] [3] [4] [5] [6] Instructions:
	# CHECK-NEXT: 1 7 0.50 * vbroadcasti128 (%rax), %ymm0			# CHECK-NEXT: 1 7 0.50 * vbroadcasti128 (%rax), %ymm0
	# CHECK-NEXT: 1 3 1.00 vbroadcastsd %xmm0, %ymm0			# CHECK-NEXT: 1 3 1.00 vbroadcastsd %xmm0, %ymm0
	# CHECK-NEXT: 1 3 1.00 vbroadcastss %xmm0, %ymm0			# CHECK-NEXT: 1 3 1.00 vbroadcastss %xmm0, %ymm0
	# CHECK-NEXT: 1 3 1.00 vextracti128 $1, %ymm0, %xmm2			# CHECK-NEXT: 1 3 1.00 vextracti128 $1, %ymm0, %xmm2
	# CHECK-NEXT: 2 1 1.00 * vextracti128 $1, %ymm0, (%rax)			# CHECK-NEXT: 2 1 1.00 * vextracti128 $1, %ymm0, (%rax)
	# CHECK-NEXT: 5 22 1.00 * vgatherdpd %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: 5 18 1.00 * vgatherdpd %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: 5 25 1.00 * vgatherdpd %ymm0, (%rax,%xmm1,2), %ymm2			# CHECK-NEXT: 5 20 2.00 * vgatherdpd %ymm0, (%rax,%xmm1,2), %ymm2
	# CHECK-NEXT: 5 22 1.00 * vgatherdps %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: 5 20 2.00 * vgatherdps %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: 5 25 1.00 * vgatherdps %ymm0, (%rax,%ymm1,2), %ymm2			# CHECK-NEXT: 5 22 4.00 * vgatherdps %ymm0, (%rax,%ymm1,2), %ymm2
	# CHECK-NEXT: 5 22 1.00 * vgatherqpd %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: 5 18 1.00 * vgatherqpd %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: 5 25 1.00 * vgatherqpd %ymm0, (%rax,%ymm1,2), %ymm2			# CHECK-NEXT: 5 20 2.00 * vgatherqpd %ymm0, (%rax,%ymm1,2), %ymm2
	# CHECK-NEXT: 5 22 1.00 * vgatherqps %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: 5 18 1.00 * vgatherqps %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: 5 25 1.00 * vgatherqps %xmm0, (%rax,%ymm1,2), %xmm2			# CHECK-NEXT: 5 20 2.00 * vgatherqps %xmm0, (%rax,%ymm1,2), %xmm2
	# CHECK-NEXT: 1 3 1.00 vinserti128 $1, %xmm0, %ymm1, %ymm2			# CHECK-NEXT: 1 3 1.00 vinserti128 $1, %xmm0, %ymm1, %ymm2
	# CHECK-NEXT: 2 7 0.50 * vinserti128 $1, (%rax), %ymm1, %ymm2			# CHECK-NEXT: 2 7 0.50 * vinserti128 $1, (%rax), %ymm1, %ymm2
	# CHECK-NEXT: 1 7 0.50 * vmovntdqa (%rax), %ymm0			# CHECK-NEXT: 1 7 0.50 * vmovntdqa (%rax), %ymm0
	# CHECK-NEXT: 2 4 2.00 vmpsadbw $1, %ymm0, %ymm1, %ymm2			# CHECK-NEXT: 2 4 2.00 vmpsadbw $1, %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: 3 11 2.00 * vmpsadbw $1, (%rax), %ymm1, %ymm2			# CHECK-NEXT: 3 11 2.00 * vmpsadbw $1, (%rax), %ymm1, %ymm2
	# CHECK-NEXT: 1 1 0.50 vpabsb %ymm0, %ymm2			# CHECK-NEXT: 1 1 0.50 vpabsb %ymm0, %ymm2
	# CHECK-NEXT: 2 8 0.50 * vpabsb (%rax), %ymm2			# CHECK-NEXT: 2 8 0.50 * vpabsb (%rax), %ymm2
	# CHECK-NEXT: 1 1 0.50 vpabsd %ymm0, %ymm2			# CHECK-NEXT: 1 1 0.50 vpabsd %ymm0, %ymm2
	▲ Show 20 Lines • Show All 79 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: 1 3 1.00 vpermd %ymm0, %ymm1, %ymm2			# CHECK-NEXT: 1 3 1.00 vpermd %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: 2 10 1.00 * vpermd (%rax), %ymm1, %ymm2			# CHECK-NEXT: 2 10 1.00 * vpermd (%rax), %ymm1, %ymm2
	# CHECK-NEXT: 1 3 1.00 vpermpd $1, %ymm0, %ymm2			# CHECK-NEXT: 1 3 1.00 vpermpd $1, %ymm0, %ymm2
	# CHECK-NEXT: 2 10 1.00 * vpermpd $1, (%rax), %ymm2			# CHECK-NEXT: 2 10 1.00 * vpermpd $1, (%rax), %ymm2
	# CHECK-NEXT: 1 3 1.00 vpermps %ymm0, %ymm1, %ymm2			# CHECK-NEXT: 1 3 1.00 vpermps %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: 2 10 1.00 * vpermps (%rax), %ymm1, %ymm2			# CHECK-NEXT: 2 10 1.00 * vpermps (%rax), %ymm1, %ymm2
	# CHECK-NEXT: 1 3 1.00 vpermq $1, %ymm0, %ymm2			# CHECK-NEXT: 1 3 1.00 vpermq $1, %ymm0, %ymm2
	# CHECK-NEXT: 2 10 1.00 * vpermq $1, (%rax), %ymm2			# CHECK-NEXT: 2 10 1.00 * vpermq $1, (%rax), %ymm2
	# CHECK-NEXT: 5 22 1.00 * vpgatherdd %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: 5 20 2.00 * vpgatherdd %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: 5 25 1.00 * vpgatherdd %ymm0, (%rax,%ymm1,2), %ymm2			# CHECK-NEXT: 5 22 4.00 * vpgatherdd %ymm0, (%rax,%ymm1,2), %ymm2
	# CHECK-NEXT: 5 22 1.00 * vpgatherdq %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: 5 18 1.00 * vpgatherdq %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: 5 25 1.00 * vpgatherdq %ymm0, (%rax,%xmm1,2), %ymm2			# CHECK-NEXT: 5 20 2.00 * vpgatherdq %ymm0, (%rax,%xmm1,2), %ymm2
	# CHECK-NEXT: 5 22 1.00 * vpgatherqd %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: 5 18 1.00 * vpgatherqd %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: 5 25 1.00 * vpgatherqd %xmm0, (%rax,%ymm1,2), %xmm2			# CHECK-NEXT: 5 20 2.00 * vpgatherqd %xmm0, (%rax,%ymm1,2), %xmm2
	# CHECK-NEXT: 5 22 1.00 * vpgatherqq %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: 5 18 1.00 * vpgatherqq %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: 5 25 1.00 * vpgatherqq %ymm0, (%rax,%ymm1,2), %ymm2			# CHECK-NEXT: 5 20 2.00 * vpgatherqq %ymm0, (%rax,%ymm1,2), %ymm2
	# CHECK-NEXT: 3 3 2.00 vphaddd %ymm0, %ymm1, %ymm2			# CHECK-NEXT: 3 3 2.00 vphaddd %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: 4 10 2.00 * vphaddd (%rax), %ymm1, %ymm2			# CHECK-NEXT: 4 10 2.00 * vphaddd (%rax), %ymm1, %ymm2
	# CHECK-NEXT: 3 3 2.00 vphaddsw %ymm0, %ymm1, %ymm2			# CHECK-NEXT: 3 3 2.00 vphaddsw %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: 4 10 2.00 * vphaddsw (%rax), %ymm1, %ymm2			# CHECK-NEXT: 4 10 2.00 * vphaddsw (%rax), %ymm1, %ymm2
	# CHECK-NEXT: 3 3 2.00 vphaddw %ymm0, %ymm1, %ymm2			# CHECK-NEXT: 3 3 2.00 vphaddw %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: 4 10 2.00 * vphaddw (%rax), %ymm1, %ymm2			# CHECK-NEXT: 4 10 2.00 * vphaddw (%rax), %ymm1, %ymm2
	# CHECK-NEXT: 3 3 2.00 vphsubd %ymm0, %ymm1, %ymm2			# CHECK-NEXT: 3 3 2.00 vphsubd %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: 4 10 2.00 * vphsubd (%rax), %ymm1, %ymm2			# CHECK-NEXT: 4 10 2.00 * vphsubd (%rax), %ymm1, %ymm2
	▲ Show 20 Lines • Show All 184 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: [5] - SKLPort3			# CHECK-NEXT: [5] - SKLPort3
	# CHECK-NEXT: [6] - SKLPort4			# CHECK-NEXT: [6] - SKLPort4
	# CHECK-NEXT: [7] - SKLPort5			# CHECK-NEXT: [7] - SKLPort5
	# CHECK-NEXT: [8] - SKLPort6			# CHECK-NEXT: [8] - SKLPort6
	# CHECK-NEXT: [9] - SKLPort7			# CHECK-NEXT: [9] - SKLPort7

	# CHECK: Resource pressure per iteration:			# CHECK: Resource pressure per iteration:
	# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9]			# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9]
	# CHECK-NEXT: - - 110.33 89.33 85.67 85.67 1.00 164.33 - 1.67			# CHECK-NEXT: - - 110.33 89.33 99.67 99.67 1.00 164.33 - 1.67

	# CHECK: Resource pressure by instruction:			# CHECK: Resource pressure by instruction:
	# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] Instructions:			# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] Instructions:
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - vbroadcasti128 (%rax), %ymm0			# CHECK-NEXT: - - - - 0.50 0.50 - - - - vbroadcasti128 (%rax), %ymm0
	# CHECK-NEXT: - - - - - - - 1.00 - - vbroadcastsd %xmm0, %ymm0			# CHECK-NEXT: - - - - - - - 1.00 - - vbroadcastsd %xmm0, %ymm0
	# CHECK-NEXT: - - - - - - - 1.00 - - vbroadcastss %xmm0, %ymm0			# CHECK-NEXT: - - - - - - - 1.00 - - vbroadcastss %xmm0, %ymm0
	# CHECK-NEXT: - - - - - - - 1.00 - - vextracti128 $1, %ymm0, %xmm2			# CHECK-NEXT: - - - - - - - 1.00 - - vextracti128 $1, %ymm0, %xmm2
	# CHECK-NEXT: - - - - 0.33 0.33 1.00 - - 0.33 vextracti128 $1, %ymm0, (%rax)			# CHECK-NEXT: - - - - 0.33 0.33 1.00 - - 0.33 vextracti128 $1, %ymm0, (%rax)
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vgatherdpd %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vgatherdpd %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vgatherdpd %ymm0, (%rax,%xmm1,2), %ymm2			# CHECK-NEXT: - - 1.33 0.33 2.00 2.00 - 1.33 - - vgatherdpd %ymm0, (%rax,%xmm1,2), %ymm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vgatherdps %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: - - 1.33 0.33 2.00 2.00 - 1.33 - - vgatherdps %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vgatherdps %ymm0, (%rax,%ymm1,2), %ymm2			# CHECK-NEXT: - - 1.33 0.33 4.00 4.00 - 1.33 - - vgatherdps %ymm0, (%rax,%ymm1,2), %ymm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vgatherqpd %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vgatherqpd %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vgatherqpd %ymm0, (%rax,%ymm1,2), %ymm2			# CHECK-NEXT: - - 1.33 0.33 2.00 2.00 - 1.33 - - vgatherqpd %ymm0, (%rax,%ymm1,2), %ymm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vgatherqps %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vgatherqps %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vgatherqps %xmm0, (%rax,%ymm1,2), %xmm2			# CHECK-NEXT: - - 1.33 0.33 2.00 2.00 - 1.33 - - vgatherqps %xmm0, (%rax,%ymm1,2), %xmm2
	# CHECK-NEXT: - - - - - - - 1.00 - - vinserti128 $1, %xmm0, %ymm1, %ymm2			# CHECK-NEXT: - - - - - - - 1.00 - - vinserti128 $1, %xmm0, %ymm1, %ymm2
	# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 0.33 - - vinserti128 $1, (%rax), %ymm1, %ymm2			# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 0.33 - - vinserti128 $1, (%rax), %ymm1, %ymm2
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - vmovntdqa (%rax), %ymm0			# CHECK-NEXT: - - - - 0.50 0.50 - - - - vmovntdqa (%rax), %ymm0
	# CHECK-NEXT: - - - - - - - 2.00 - - vmpsadbw $1, %ymm0, %ymm1, %ymm2			# CHECK-NEXT: - - - - - - - 2.00 - - vmpsadbw $1, %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: - - - - 0.50 0.50 - 2.00 - - vmpsadbw $1, (%rax), %ymm1, %ymm2			# CHECK-NEXT: - - - - 0.50 0.50 - 2.00 - - vmpsadbw $1, (%rax), %ymm1, %ymm2
	# CHECK-NEXT: - - 0.50 0.50 - - - - - - vpabsb %ymm0, %ymm2			# CHECK-NEXT: - - 0.50 0.50 - - - - - - vpabsb %ymm0, %ymm2
	# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - - - - vpabsb (%rax), %ymm2			# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - - - - vpabsb (%rax), %ymm2
	# CHECK-NEXT: - - 0.50 0.50 - - - - - - vpabsd %ymm0, %ymm2			# CHECK-NEXT: - - 0.50 0.50 - - - - - - vpabsd %ymm0, %ymm2
	▲ Show 20 Lines • Show All 79 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: - - - - - - - 1.00 - - vpermd %ymm0, %ymm1, %ymm2			# CHECK-NEXT: - - - - - - - 1.00 - - vpermd %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermd (%rax), %ymm1, %ymm2			# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermd (%rax), %ymm1, %ymm2
	# CHECK-NEXT: - - - - - - - 1.00 - - vpermpd $1, %ymm0, %ymm2			# CHECK-NEXT: - - - - - - - 1.00 - - vpermpd $1, %ymm0, %ymm2
	# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermpd $1, (%rax), %ymm2			# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermpd $1, (%rax), %ymm2
	# CHECK-NEXT: - - - - - - - 1.00 - - vpermps %ymm0, %ymm1, %ymm2			# CHECK-NEXT: - - - - - - - 1.00 - - vpermps %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermps (%rax), %ymm1, %ymm2			# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermps (%rax), %ymm1, %ymm2
	# CHECK-NEXT: - - - - - - - 1.00 - - vpermq $1, %ymm0, %ymm2			# CHECK-NEXT: - - - - - - - 1.00 - - vpermq $1, %ymm0, %ymm2
	# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermq $1, (%rax), %ymm2			# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermq $1, (%rax), %ymm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vpgatherdd %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: - - 1.33 0.33 2.00 2.00 - 1.33 - - vpgatherdd %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vpgatherdd %ymm0, (%rax,%ymm1,2), %ymm2			# CHECK-NEXT: - - 1.33 0.33 4.00 4.00 - 1.33 - - vpgatherdd %ymm0, (%rax,%ymm1,2), %ymm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vpgatherdq %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vpgatherdq %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vpgatherdq %ymm0, (%rax,%xmm1,2), %ymm2			# CHECK-NEXT: - - 1.33 0.33 2.00 2.00 - 1.33 - - vpgatherdq %ymm0, (%rax,%xmm1,2), %ymm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vpgatherqd %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vpgatherqd %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vpgatherqd %xmm0, (%rax,%ymm1,2), %xmm2			# CHECK-NEXT: - - 1.33 0.33 2.00 2.00 - 1.33 - - vpgatherqd %xmm0, (%rax,%ymm1,2), %xmm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vpgatherqq %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vpgatherqq %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vpgatherqq %ymm0, (%rax,%ymm1,2), %ymm2			# CHECK-NEXT: - - 1.33 0.33 2.00 2.00 - 1.33 - - vpgatherqq %ymm0, (%rax,%ymm1,2), %ymm2
	# CHECK-NEXT: - - 0.33 0.33 - - - 2.33 - - vphaddd %ymm0, %ymm1, %ymm2			# CHECK-NEXT: - - 0.33 0.33 - - - 2.33 - - vphaddd %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 2.33 - - vphaddd (%rax), %ymm1, %ymm2			# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 2.33 - - vphaddd (%rax), %ymm1, %ymm2
	# CHECK-NEXT: - - 0.50 0.50 - - - 2.00 - - vphaddsw %ymm0, %ymm1, %ymm2			# CHECK-NEXT: - - 0.50 0.50 - - - 2.00 - - vphaddsw %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - 2.00 - - vphaddsw (%rax), %ymm1, %ymm2			# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - 2.00 - - vphaddsw (%rax), %ymm1, %ymm2
	# CHECK-NEXT: - - 0.33 0.33 - - - 2.33 - - vphaddw %ymm0, %ymm1, %ymm2			# CHECK-NEXT: - - 0.33 0.33 - - - 2.33 - - vphaddw %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 2.33 - - vphaddw (%rax), %ymm1, %ymm2			# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 2.33 - - vphaddw (%rax), %ymm1, %ymm2
	# CHECK-NEXT: - - 0.33 0.33 - - - 2.33 - - vphsubd %ymm0, %ymm1, %ymm2			# CHECK-NEXT: - - 0.33 0.33 - - - 2.33 - - vphsubd %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 2.33 - - vphsubd (%rax), %ymm1, %ymm2			# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 2.33 - - vphsubd (%rax), %ymm1, %ymm2
	▲ Show 20 Lines • Show All 177 Lines • Show Last 20 Lines

llvm/test/tools/llvm-mca/X86/SkylakeServer/resources-avx2.s

	Show First 20 Lines • Show All 459 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: [6]: HasSideEffects (U)			# CHECK-NEXT: [6]: HasSideEffects (U)

	# CHECK: [1] [2] [3] [4] [5] [6] Instructions:			# CHECK: [1] [2] [3] [4] [5] [6] Instructions:
	# CHECK-NEXT: 1 7 0.50 * vbroadcasti128 (%rax), %ymm0			# CHECK-NEXT: 1 7 0.50 * vbroadcasti128 (%rax), %ymm0
	# CHECK-NEXT: 1 3 1.00 vbroadcastsd %xmm0, %ymm0			# CHECK-NEXT: 1 3 1.00 vbroadcastsd %xmm0, %ymm0
	# CHECK-NEXT: 1 3 1.00 vbroadcastss %xmm0, %ymm0			# CHECK-NEXT: 1 3 1.00 vbroadcastss %xmm0, %ymm0
	# CHECK-NEXT: 1 3 1.00 vextracti128 $1, %ymm0, %xmm2			# CHECK-NEXT: 1 3 1.00 vextracti128 $1, %ymm0, %xmm2
	# CHECK-NEXT: 2 1 1.00 * vextracti128 $1, %ymm0, (%rax)			# CHECK-NEXT: 2 1 1.00 * vextracti128 $1, %ymm0, (%rax)
	# CHECK-NEXT: 5 22 1.00 * vgatherdpd %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: 5 18 1.00 * vgatherdpd %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: 5 25 1.00 * vgatherdpd %ymm0, (%rax,%xmm1,2), %ymm2			# CHECK-NEXT: 5 20 2.00 * vgatherdpd %ymm0, (%rax,%xmm1,2), %ymm2
	# CHECK-NEXT: 5 22 1.00 * vgatherdps %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: 5 20 2.00 * vgatherdps %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: 5 25 1.00 * vgatherdps %ymm0, (%rax,%ymm1,2), %ymm2			# CHECK-NEXT: 5 22 4.00 * vgatherdps %ymm0, (%rax,%ymm1,2), %ymm2
	# CHECK-NEXT: 5 22 1.00 * vgatherqpd %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: 5 18 1.00 * vgatherqpd %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: 5 25 1.00 * vgatherqpd %ymm0, (%rax,%ymm1,2), %ymm2			# CHECK-NEXT: 5 20 2.00 * vgatherqpd %ymm0, (%rax,%ymm1,2), %ymm2
	# CHECK-NEXT: 5 22 1.00 * vgatherqps %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: 5 18 1.00 * vgatherqps %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: 5 25 1.00 * vgatherqps %xmm0, (%rax,%ymm1,2), %xmm2			# CHECK-NEXT: 5 20 2.00 * vgatherqps %xmm0, (%rax,%ymm1,2), %xmm2
	# CHECK-NEXT: 1 3 1.00 vinserti128 $1, %xmm0, %ymm1, %ymm2			# CHECK-NEXT: 1 3 1.00 vinserti128 $1, %xmm0, %ymm1, %ymm2
	# CHECK-NEXT: 2 7 0.50 * vinserti128 $1, (%rax), %ymm1, %ymm2			# CHECK-NEXT: 2 7 0.50 * vinserti128 $1, (%rax), %ymm1, %ymm2
	# CHECK-NEXT: 1 7 0.50 * vmovntdqa (%rax), %ymm0			# CHECK-NEXT: 1 7 0.50 * vmovntdqa (%rax), %ymm0
	# CHECK-NEXT: 2 4 2.00 vmpsadbw $1, %ymm0, %ymm1, %ymm2			# CHECK-NEXT: 2 4 2.00 vmpsadbw $1, %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: 3 11 2.00 * vmpsadbw $1, (%rax), %ymm1, %ymm2			# CHECK-NEXT: 3 11 2.00 * vmpsadbw $1, (%rax), %ymm1, %ymm2
	# CHECK-NEXT: 1 1 0.50 vpabsb %ymm0, %ymm2			# CHECK-NEXT: 1 1 0.50 vpabsb %ymm0, %ymm2
	# CHECK-NEXT: 2 8 0.50 * vpabsb (%rax), %ymm2			# CHECK-NEXT: 2 8 0.50 * vpabsb (%rax), %ymm2
	# CHECK-NEXT: 1 1 0.50 vpabsd %ymm0, %ymm2			# CHECK-NEXT: 1 1 0.50 vpabsd %ymm0, %ymm2
	▲ Show 20 Lines • Show All 79 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: 1 3 1.00 vpermd %ymm0, %ymm1, %ymm2			# CHECK-NEXT: 1 3 1.00 vpermd %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: 2 10 1.00 * vpermd (%rax), %ymm1, %ymm2			# CHECK-NEXT: 2 10 1.00 * vpermd (%rax), %ymm1, %ymm2
	# CHECK-NEXT: 1 3 1.00 vpermpd $1, %ymm0, %ymm2			# CHECK-NEXT: 1 3 1.00 vpermpd $1, %ymm0, %ymm2
	# CHECK-NEXT: 2 10 1.00 * vpermpd $1, (%rax), %ymm2			# CHECK-NEXT: 2 10 1.00 * vpermpd $1, (%rax), %ymm2
	# CHECK-NEXT: 1 3 1.00 vpermps %ymm0, %ymm1, %ymm2			# CHECK-NEXT: 1 3 1.00 vpermps %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: 2 10 1.00 * vpermps (%rax), %ymm1, %ymm2			# CHECK-NEXT: 2 10 1.00 * vpermps (%rax), %ymm1, %ymm2
	# CHECK-NEXT: 1 3 1.00 vpermq $1, %ymm0, %ymm2			# CHECK-NEXT: 1 3 1.00 vpermq $1, %ymm0, %ymm2
	# CHECK-NEXT: 2 10 1.00 * vpermq $1, (%rax), %ymm2			# CHECK-NEXT: 2 10 1.00 * vpermq $1, (%rax), %ymm2
	# CHECK-NEXT: 5 22 1.00 * vpgatherdd %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: 5 20 2.00 * vpgatherdd %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: 5 25 1.00 * vpgatherdd %ymm0, (%rax,%ymm1,2), %ymm2			# CHECK-NEXT: 5 22 4.00 * vpgatherdd %ymm0, (%rax,%ymm1,2), %ymm2
	# CHECK-NEXT: 5 22 1.00 * vpgatherdq %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: 5 18 1.00 * vpgatherdq %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: 5 25 1.00 * vpgatherdq %ymm0, (%rax,%xmm1,2), %ymm2			# CHECK-NEXT: 5 20 2.00 * vpgatherdq %ymm0, (%rax,%xmm1,2), %ymm2
	# CHECK-NEXT: 5 22 1.00 * vpgatherqd %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: 5 18 1.00 * vpgatherqd %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: 5 25 1.00 * vpgatherqd %xmm0, (%rax,%ymm1,2), %xmm2			# CHECK-NEXT: 5 20 2.00 * vpgatherqd %xmm0, (%rax,%ymm1,2), %xmm2
	# CHECK-NEXT: 5 22 1.00 * vpgatherqq %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: 5 18 1.00 * vpgatherqq %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: 5 25 1.00 * vpgatherqq %ymm0, (%rax,%ymm1,2), %ymm2			# CHECK-NEXT: 5 20 2.00 * vpgatherqq %ymm0, (%rax,%ymm1,2), %ymm2
	# CHECK-NEXT: 3 3 2.00 vphaddd %ymm0, %ymm1, %ymm2			# CHECK-NEXT: 3 3 2.00 vphaddd %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: 4 10 2.00 * vphaddd (%rax), %ymm1, %ymm2			# CHECK-NEXT: 4 10 2.00 * vphaddd (%rax), %ymm1, %ymm2
	# CHECK-NEXT: 3 3 2.00 vphaddsw %ymm0, %ymm1, %ymm2			# CHECK-NEXT: 3 3 2.00 vphaddsw %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: 4 10 2.00 * vphaddsw (%rax), %ymm1, %ymm2			# CHECK-NEXT: 4 10 2.00 * vphaddsw (%rax), %ymm1, %ymm2
	# CHECK-NEXT: 3 3 2.00 vphaddw %ymm0, %ymm1, %ymm2			# CHECK-NEXT: 3 3 2.00 vphaddw %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: 4 10 2.00 * vphaddw (%rax), %ymm1, %ymm2			# CHECK-NEXT: 4 10 2.00 * vphaddw (%rax), %ymm1, %ymm2
	# CHECK-NEXT: 3 3 2.00 vphsubd %ymm0, %ymm1, %ymm2			# CHECK-NEXT: 3 3 2.00 vphsubd %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: 4 10 2.00 * vphsubd (%rax), %ymm1, %ymm2			# CHECK-NEXT: 4 10 2.00 * vphsubd (%rax), %ymm1, %ymm2
	▲ Show 20 Lines • Show All 184 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: [5] - SKXPort3			# CHECK-NEXT: [5] - SKXPort3
	# CHECK-NEXT: [6] - SKXPort4			# CHECK-NEXT: [6] - SKXPort4
	# CHECK-NEXT: [7] - SKXPort5			# CHECK-NEXT: [7] - SKXPort5
	# CHECK-NEXT: [8] - SKXPort6			# CHECK-NEXT: [8] - SKXPort6
	# CHECK-NEXT: [9] - SKXPort7			# CHECK-NEXT: [9] - SKXPort7

	# CHECK: Resource pressure per iteration:			# CHECK: Resource pressure per iteration:
	# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9]			# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9]
	# CHECK-NEXT: - - 110.33 89.33 85.67 85.67 1.00 164.33 - 1.67			# CHECK-NEXT: - - 110.33 89.33 99.67 99.67 1.00 164.33 - 1.67

	# CHECK: Resource pressure by instruction:			# CHECK: Resource pressure by instruction:
	# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] Instructions:			# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] Instructions:
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - vbroadcasti128 (%rax), %ymm0			# CHECK-NEXT: - - - - 0.50 0.50 - - - - vbroadcasti128 (%rax), %ymm0
	# CHECK-NEXT: - - - - - - - 1.00 - - vbroadcastsd %xmm0, %ymm0			# CHECK-NEXT: - - - - - - - 1.00 - - vbroadcastsd %xmm0, %ymm0
	# CHECK-NEXT: - - - - - - - 1.00 - - vbroadcastss %xmm0, %ymm0			# CHECK-NEXT: - - - - - - - 1.00 - - vbroadcastss %xmm0, %ymm0
	# CHECK-NEXT: - - - - - - - 1.00 - - vextracti128 $1, %ymm0, %xmm2			# CHECK-NEXT: - - - - - - - 1.00 - - vextracti128 $1, %ymm0, %xmm2
	# CHECK-NEXT: - - - - 0.33 0.33 1.00 - - 0.33 vextracti128 $1, %ymm0, (%rax)			# CHECK-NEXT: - - - - 0.33 0.33 1.00 - - 0.33 vextracti128 $1, %ymm0, (%rax)
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vgatherdpd %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vgatherdpd %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vgatherdpd %ymm0, (%rax,%xmm1,2), %ymm2			# CHECK-NEXT: - - 1.33 0.33 2.00 2.00 - 1.33 - - vgatherdpd %ymm0, (%rax,%xmm1,2), %ymm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vgatherdps %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: - - 1.33 0.33 2.00 2.00 - 1.33 - - vgatherdps %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vgatherdps %ymm0, (%rax,%ymm1,2), %ymm2			# CHECK-NEXT: - - 1.33 0.33 4.00 4.00 - 1.33 - - vgatherdps %ymm0, (%rax,%ymm1,2), %ymm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vgatherqpd %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vgatherqpd %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vgatherqpd %ymm0, (%rax,%ymm1,2), %ymm2			# CHECK-NEXT: - - 1.33 0.33 2.00 2.00 - 1.33 - - vgatherqpd %ymm0, (%rax,%ymm1,2), %ymm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vgatherqps %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vgatherqps %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vgatherqps %xmm0, (%rax,%ymm1,2), %xmm2			# CHECK-NEXT: - - 1.33 0.33 2.00 2.00 - 1.33 - - vgatherqps %xmm0, (%rax,%ymm1,2), %xmm2
	# CHECK-NEXT: - - - - - - - 1.00 - - vinserti128 $1, %xmm0, %ymm1, %ymm2			# CHECK-NEXT: - - - - - - - 1.00 - - vinserti128 $1, %xmm0, %ymm1, %ymm2
	# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 0.33 - - vinserti128 $1, (%rax), %ymm1, %ymm2			# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 0.33 - - vinserti128 $1, (%rax), %ymm1, %ymm2
	# CHECK-NEXT: - - - - 0.50 0.50 - - - - vmovntdqa (%rax), %ymm0			# CHECK-NEXT: - - - - 0.50 0.50 - - - - vmovntdqa (%rax), %ymm0
	# CHECK-NEXT: - - - - - - - 2.00 - - vmpsadbw $1, %ymm0, %ymm1, %ymm2			# CHECK-NEXT: - - - - - - - 2.00 - - vmpsadbw $1, %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: - - - - 0.50 0.50 - 2.00 - - vmpsadbw $1, (%rax), %ymm1, %ymm2			# CHECK-NEXT: - - - - 0.50 0.50 - 2.00 - - vmpsadbw $1, (%rax), %ymm1, %ymm2
	# CHECK-NEXT: - - 0.50 0.50 - - - - - - vpabsb %ymm0, %ymm2			# CHECK-NEXT: - - 0.50 0.50 - - - - - - vpabsb %ymm0, %ymm2
	# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - - - - vpabsb (%rax), %ymm2			# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - - - - vpabsb (%rax), %ymm2
	# CHECK-NEXT: - - 0.50 0.50 - - - - - - vpabsd %ymm0, %ymm2			# CHECK-NEXT: - - 0.50 0.50 - - - - - - vpabsd %ymm0, %ymm2
	▲ Show 20 Lines • Show All 79 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: - - - - - - - 1.00 - - vpermd %ymm0, %ymm1, %ymm2			# CHECK-NEXT: - - - - - - - 1.00 - - vpermd %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermd (%rax), %ymm1, %ymm2			# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermd (%rax), %ymm1, %ymm2
	# CHECK-NEXT: - - - - - - - 1.00 - - vpermpd $1, %ymm0, %ymm2			# CHECK-NEXT: - - - - - - - 1.00 - - vpermpd $1, %ymm0, %ymm2
	# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermpd $1, (%rax), %ymm2			# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermpd $1, (%rax), %ymm2
	# CHECK-NEXT: - - - - - - - 1.00 - - vpermps %ymm0, %ymm1, %ymm2			# CHECK-NEXT: - - - - - - - 1.00 - - vpermps %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermps (%rax), %ymm1, %ymm2			# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermps (%rax), %ymm1, %ymm2
	# CHECK-NEXT: - - - - - - - 1.00 - - vpermq $1, %ymm0, %ymm2			# CHECK-NEXT: - - - - - - - 1.00 - - vpermq $1, %ymm0, %ymm2
	# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermq $1, (%rax), %ymm2			# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermq $1, (%rax), %ymm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vpgatherdd %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: - - 1.33 0.33 2.00 2.00 - 1.33 - - vpgatherdd %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vpgatherdd %ymm0, (%rax,%ymm1,2), %ymm2			# CHECK-NEXT: - - 1.33 0.33 4.00 4.00 - 1.33 - - vpgatherdd %ymm0, (%rax,%ymm1,2), %ymm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vpgatherdq %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vpgatherdq %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vpgatherdq %ymm0, (%rax,%xmm1,2), %ymm2			# CHECK-NEXT: - - 1.33 0.33 2.00 2.00 - 1.33 - - vpgatherdq %ymm0, (%rax,%xmm1,2), %ymm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vpgatherqd %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vpgatherqd %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vpgatherqd %xmm0, (%rax,%ymm1,2), %xmm2			# CHECK-NEXT: - - 1.33 0.33 2.00 2.00 - 1.33 - - vpgatherqd %xmm0, (%rax,%ymm1,2), %xmm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vpgatherqq %xmm0, (%rax,%xmm1,2), %xmm2			# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vpgatherqq %xmm0, (%rax,%xmm1,2), %xmm2
	# CHECK-NEXT: - - 1.33 0.33 1.00 1.00 - 1.33 - - vpgatherqq %ymm0, (%rax,%ymm1,2), %ymm2			# CHECK-NEXT: - - 1.33 0.33 2.00 2.00 - 1.33 - - vpgatherqq %ymm0, (%rax,%ymm1,2), %ymm2
	# CHECK-NEXT: - - 0.33 0.33 - - - 2.33 - - vphaddd %ymm0, %ymm1, %ymm2			# CHECK-NEXT: - - 0.33 0.33 - - - 2.33 - - vphaddd %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 2.33 - - vphaddd (%rax), %ymm1, %ymm2			# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 2.33 - - vphaddd (%rax), %ymm1, %ymm2
	# CHECK-NEXT: - - 0.50 0.50 - - - 2.00 - - vphaddsw %ymm0, %ymm1, %ymm2			# CHECK-NEXT: - - 0.50 0.50 - - - 2.00 - - vphaddsw %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - 2.00 - - vphaddsw (%rax), %ymm1, %ymm2			# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - 2.00 - - vphaddsw (%rax), %ymm1, %ymm2
	# CHECK-NEXT: - - 0.33 0.33 - - - 2.33 - - vphaddw %ymm0, %ymm1, %ymm2			# CHECK-NEXT: - - 0.33 0.33 - - - 2.33 - - vphaddw %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 2.33 - - vphaddw (%rax), %ymm1, %ymm2			# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 2.33 - - vphaddw (%rax), %ymm1, %ymm2
	# CHECK-NEXT: - - 0.33 0.33 - - - 2.33 - - vphsubd %ymm0, %ymm1, %ymm2			# CHECK-NEXT: - - 0.33 0.33 - - - 2.33 - - vphsubd %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 2.33 - - vphsubd (%rax), %ymm1, %ymm2			# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 2.33 - - vphsubd (%rax), %ymm1, %ymm2
	▲ Show 20 Lines • Show All 177 Lines • Show Last 20 Lines

llvm/test/tools/llvm-mca/X86/SkylakeServer/resources-avx512.s

	Show First 20 Lines • Show All 75 Lines • ▼ Show 20 Lines
	vdivps (%rax){1to16}, %zmm17, %zmm19			vdivps (%rax){1to16}, %zmm17, %zmm19
	vdivps %zmm16, %zmm17, %zmm19 {k1}			vdivps %zmm16, %zmm17, %zmm19 {k1}
	vdivps (%rax), %zmm17, %zmm19 {k1}			vdivps (%rax), %zmm17, %zmm19 {k1}
	vdivps (%rax){1to16}, %zmm17, %zmm19 {k1}			vdivps (%rax){1to16}, %zmm17, %zmm19 {k1}
	vdivps %zmm16, %zmm17, %zmm19 {z}{k1}			vdivps %zmm16, %zmm17, %zmm19 {z}{k1}
	vdivps (%rax), %zmm17, %zmm19 {z}{k1}			vdivps (%rax), %zmm17, %zmm19 {z}{k1}
	vdivps (%rax){1to16}, %zmm17, %zmm19 {z}{k1}			vdivps (%rax){1to16}, %zmm17, %zmm19 {z}{k1}

				vgatherdpd (%rax,%ymm1,2), %zmm2 {k1}
				vgatherdps (%rax,%zmm1,2), %zmm2 {k1}
				vgatherqpd (%rax,%zmm1,2), %zmm2 {k1}
				vgatherqps (%rax,%zmm1,2), %ymm2 {k1}

	vmaxpd %zmm16, %zmm17, %zmm19			vmaxpd %zmm16, %zmm17, %zmm19
	vmaxpd (%rax), %zmm17, %zmm19			vmaxpd (%rax), %zmm17, %zmm19
	vmaxpd (%rax){1to8}, %zmm17, %zmm19			vmaxpd (%rax){1to8}, %zmm17, %zmm19
	vmaxpd %zmm16, %zmm17, %zmm19 {k1}			vmaxpd %zmm16, %zmm17, %zmm19 {k1}
	vmaxpd (%rax), %zmm17, %zmm19 {k1}			vmaxpd (%rax), %zmm17, %zmm19 {k1}
	vmaxpd (%rax){1to8}, %zmm17, %zmm19 {k1}			vmaxpd (%rax){1to8}, %zmm17, %zmm19 {k1}
	vmaxpd %zmm16, %zmm17, %zmm19 {z}{k1}			vmaxpd %zmm16, %zmm17, %zmm19 {z}{k1}
	vmaxpd (%rax), %zmm17, %zmm19 {z}{k1}			vmaxpd (%rax), %zmm17, %zmm19 {z}{k1}
	▲ Show 20 Lines • Show All 84 Lines • ▼ Show 20 Lines
	vpaddq (%rax){1to8}, %zmm17, %zmm19			vpaddq (%rax){1to8}, %zmm17, %zmm19
	vpaddq %zmm16, %zmm17, %zmm19 {k1}			vpaddq %zmm16, %zmm17, %zmm19 {k1}
	vpaddq (%rax), %zmm17, %zmm19 {k1}			vpaddq (%rax), %zmm17, %zmm19 {k1}
	vpaddq (%rax){1to8}, %zmm17, %zmm19 {k1}			vpaddq (%rax){1to8}, %zmm17, %zmm19 {k1}
	vpaddq %zmm16, %zmm17, %zmm19 {z}{k1}			vpaddq %zmm16, %zmm17, %zmm19 {z}{k1}
	vpaddq (%rax), %zmm17, %zmm19 {z}{k1}			vpaddq (%rax), %zmm17, %zmm19 {z}{k1}
	vpaddq (%rax){1to8}, %zmm17, %zmm19 {z}{k1}			vpaddq (%rax){1to8}, %zmm17, %zmm19 {z}{k1}

				vpgatherdq (%rax,%ymm1,2), %zmm2 {k1}
				vpgatherdd (%rax,%zmm1,2), %zmm2 {k1}
				vpgatherqq (%rax,%zmm1,2), %zmm2 {k1}
				vpgatherqd (%rax,%zmm1,2), %ymm2 {k1}

	vpmulld %zmm16, %zmm17, %zmm19			vpmulld %zmm16, %zmm17, %zmm19
	vpmulld (%rax), %zmm17, %zmm19			vpmulld (%rax), %zmm17, %zmm19
	vpmulld (%rax){1to16}, %zmm17, %zmm19			vpmulld (%rax){1to16}, %zmm17, %zmm19
	vpmulld %zmm16, %zmm17, %zmm19 {k1}			vpmulld %zmm16, %zmm17, %zmm19 {k1}
	vpmulld (%rax), %zmm17, %zmm19 {k1}			vpmulld (%rax), %zmm17, %zmm19 {k1}
	vpmulld (%rax){1to16}, %zmm17, %zmm19 {k1}			vpmulld (%rax){1to16}, %zmm17, %zmm19 {k1}
	vpmulld %zmm16, %zmm17, %zmm19 {z}{k1}			vpmulld %zmm16, %zmm17, %zmm19 {z}{k1}
	vpmulld (%rax), %zmm17, %zmm19 {z}{k1}			vpmulld (%rax), %zmm17, %zmm19 {z}{k1}
	▲ Show 20 Lines • Show All 399 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: 4 25 10.00 * vdivps (%rax), %zmm17, %zmm19			# CHECK-NEXT: 4 25 10.00 * vdivps (%rax), %zmm17, %zmm19
	# CHECK-NEXT: 4 25 10.00 * vdivps (%rax){1to16}, %zmm17, %zmm19			# CHECK-NEXT: 4 25 10.00 * vdivps (%rax){1to16}, %zmm17, %zmm19
	# CHECK-NEXT: 3 18 10.00 vdivps %zmm16, %zmm17, %zmm19 {%k1}			# CHECK-NEXT: 3 18 10.00 vdivps %zmm16, %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: 4 25 10.00 * vdivps (%rax), %zmm17, %zmm19 {%k1}			# CHECK-NEXT: 4 25 10.00 * vdivps (%rax), %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: 4 25 10.00 * vdivps (%rax){1to16}, %zmm17, %zmm19 {%k1}			# CHECK-NEXT: 4 25 10.00 * vdivps (%rax){1to16}, %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: 3 18 10.00 vdivps %zmm16, %zmm17, %zmm19 {%k1} {z}			# CHECK-NEXT: 3 18 10.00 vdivps %zmm16, %zmm17, %zmm19 {%k1} {z}
	# CHECK-NEXT: 4 25 10.00 * vdivps (%rax), %zmm17, %zmm19 {%k1} {z}			# CHECK-NEXT: 4 25 10.00 * vdivps (%rax), %zmm17, %zmm19 {%k1} {z}
	# CHECK-NEXT: 4 25 10.00 * vdivps (%rax){1to16}, %zmm17, %zmm19 {%k1} {z}			# CHECK-NEXT: 4 25 10.00 * vdivps (%rax){1to16}, %zmm17, %zmm19 {%k1} {z}
				# CHECK-NEXT: 5 21 4.00 * vgatherdpd (%rax,%ymm1,2), %zmm2 {%k1}
				# CHECK-NEXT: 5 25 8.00 * vgatherdps (%rax,%zmm1,2), %zmm2 {%k1}
				# CHECK-NEXT: 5 21 4.00 * vgatherqpd (%rax,%zmm1,2), %zmm2 {%k1}
				# CHECK-NEXT: 5 21 4.00 * vgatherqps (%rax,%zmm1,2), %ymm2 {%k1}
	# CHECK-NEXT: 1 4 0.50 vmaxpd %zmm16, %zmm17, %zmm19			# CHECK-NEXT: 1 4 0.50 vmaxpd %zmm16, %zmm17, %zmm19
	# CHECK-NEXT: 2 11 0.50 * vmaxpd (%rax), %zmm17, %zmm19			# CHECK-NEXT: 2 11 0.50 * vmaxpd (%rax), %zmm17, %zmm19
	# CHECK-NEXT: 2 11 0.50 * vmaxpd (%rax){1to8}, %zmm17, %zmm19			# CHECK-NEXT: 2 11 0.50 * vmaxpd (%rax){1to8}, %zmm17, %zmm19
	# CHECK-NEXT: 1 4 0.50 vmaxpd %zmm16, %zmm17, %zmm19 {%k1}			# CHECK-NEXT: 1 4 0.50 vmaxpd %zmm16, %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: 2 11 0.50 * vmaxpd (%rax), %zmm17, %zmm19 {%k1}			# CHECK-NEXT: 2 11 0.50 * vmaxpd (%rax), %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: 2 11 0.50 * vmaxpd (%rax){1to8}, %zmm17, %zmm19 {%k1}			# CHECK-NEXT: 2 11 0.50 * vmaxpd (%rax){1to8}, %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: 1 4 0.50 vmaxpd %zmm16, %zmm17, %zmm19 {%k1} {z}			# CHECK-NEXT: 1 4 0.50 vmaxpd %zmm16, %zmm17, %zmm19 {%k1} {z}
	# CHECK-NEXT: 2 11 0.50 * vmaxpd (%rax), %zmm17, %zmm19 {%k1} {z}			# CHECK-NEXT: 2 11 0.50 * vmaxpd (%rax), %zmm17, %zmm19 {%k1} {z}
	▲ Show 20 Lines • Show All 74 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: 2 8 0.50 * vpaddq (%rax), %zmm17, %zmm19			# CHECK-NEXT: 2 8 0.50 * vpaddq (%rax), %zmm17, %zmm19
	# CHECK-NEXT: 2 8 0.50 * vpaddq (%rax){1to8}, %zmm17, %zmm19			# CHECK-NEXT: 2 8 0.50 * vpaddq (%rax){1to8}, %zmm17, %zmm19
	# CHECK-NEXT: 1 1 0.33 vpaddq %zmm16, %zmm17, %zmm19 {%k1}			# CHECK-NEXT: 1 1 0.33 vpaddq %zmm16, %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: 2 8 0.50 * vpaddq (%rax), %zmm17, %zmm19 {%k1}			# CHECK-NEXT: 2 8 0.50 * vpaddq (%rax), %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: 2 8 0.50 * vpaddq (%rax){1to8}, %zmm17, %zmm19 {%k1}			# CHECK-NEXT: 2 8 0.50 * vpaddq (%rax){1to8}, %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: 1 1 0.33 vpaddq %zmm16, %zmm17, %zmm19 {%k1} {z}			# CHECK-NEXT: 1 1 0.33 vpaddq %zmm16, %zmm17, %zmm19 {%k1} {z}
	# CHECK-NEXT: 2 8 0.50 * vpaddq (%rax), %zmm17, %zmm19 {%k1} {z}			# CHECK-NEXT: 2 8 0.50 * vpaddq (%rax), %zmm17, %zmm19 {%k1} {z}
	# CHECK-NEXT: 2 8 0.50 * vpaddq (%rax){1to8}, %zmm17, %zmm19 {%k1} {z}			# CHECK-NEXT: 2 8 0.50 * vpaddq (%rax){1to8}, %zmm17, %zmm19 {%k1} {z}
				# CHECK-NEXT: 5 21 4.00 * vpgatherdq (%rax,%ymm1,2), %zmm2 {%k1}
				# CHECK-NEXT: 5 25 8.00 * vpgatherdd (%rax,%zmm1,2), %zmm2 {%k1}
				# CHECK-NEXT: 5 21 4.00 * vpgatherqq (%rax,%zmm1,2), %zmm2 {%k1}
				# CHECK-NEXT: 5 21 4.00 * vpgatherqd (%rax,%zmm1,2), %ymm2 {%k1}
	# CHECK-NEXT: 2 10 1.00 vpmulld %zmm16, %zmm17, %zmm19			# CHECK-NEXT: 2 10 1.00 vpmulld %zmm16, %zmm17, %zmm19
	# CHECK-NEXT: 3 17 1.00 * vpmulld (%rax), %zmm17, %zmm19			# CHECK-NEXT: 3 17 1.00 * vpmulld (%rax), %zmm17, %zmm19
	# CHECK-NEXT: 3 17 1.00 * vpmulld (%rax){1to16}, %zmm17, %zmm19			# CHECK-NEXT: 3 17 1.00 * vpmulld (%rax){1to16}, %zmm17, %zmm19
	# CHECK-NEXT: 2 10 1.00 vpmulld %zmm16, %zmm17, %zmm19 {%k1}			# CHECK-NEXT: 2 10 1.00 vpmulld %zmm16, %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: 3 17 1.00 * vpmulld (%rax), %zmm17, %zmm19 {%k1}			# CHECK-NEXT: 3 17 1.00 * vpmulld (%rax), %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: 3 17 1.00 * vpmulld (%rax){1to16}, %zmm17, %zmm19 {%k1}			# CHECK-NEXT: 3 17 1.00 * vpmulld (%rax){1to16}, %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: 2 10 1.00 vpmulld %zmm16, %zmm17, %zmm19 {%k1} {z}			# CHECK-NEXT: 2 10 1.00 vpmulld %zmm16, %zmm17, %zmm19 {%k1} {z}
	# CHECK-NEXT: 3 17 1.00 * vpmulld (%rax), %zmm17, %zmm19 {%k1} {z}			# CHECK-NEXT: 3 17 1.00 * vpmulld (%rax), %zmm17, %zmm19 {%k1} {z}
	▲ Show 20 Lines • Show All 299 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: [5] - SKXPort3			# CHECK-NEXT: [5] - SKXPort3
	# CHECK-NEXT: [6] - SKXPort4			# CHECK-NEXT: [6] - SKXPort4
	# CHECK-NEXT: [7] - SKXPort5			# CHECK-NEXT: [7] - SKXPort5
	# CHECK-NEXT: [8] - SKXPort6			# CHECK-NEXT: [8] - SKXPort6
	# CHECK-NEXT: [9] - SKXPort7			# CHECK-NEXT: [9] - SKXPort7

	# CHECK: Resource pressure per iteration:			# CHECK: Resource pressure per iteration:
	# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9]			# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9]
	# CHECK-NEXT: - 612.00 188.00 26.00 153.00 153.00 - 330.00 - -			# CHECK-NEXT: - 612.00 200.67 30.67 193.00 193.00 - 334.67 2.00 -

	# CHECK: Resource pressure by instruction:			# CHECK: Resource pressure by instruction:
	# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] Instructions:			# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] Instructions:
	# CHECK-NEXT: - - 0.50 - - - - 0.50 - - vaddpd %zmm16, %zmm17, %zmm19			# CHECK-NEXT: - - 0.50 - - - - 0.50 - - vaddpd %zmm16, %zmm17, %zmm19
	# CHECK-NEXT: - - 0.50 - 0.50 0.50 - 0.50 - - vaddpd (%rax), %zmm17, %zmm19			# CHECK-NEXT: - - 0.50 - 0.50 0.50 - 0.50 - - vaddpd (%rax), %zmm17, %zmm19
	# CHECK-NEXT: - - 0.50 - 0.50 0.50 - 0.50 - - vaddpd (%rax){1to8}, %zmm17, %zmm19			# CHECK-NEXT: - - 0.50 - 0.50 0.50 - 0.50 - - vaddpd (%rax){1to8}, %zmm17, %zmm19
	# CHECK-NEXT: - - 0.50 - - - - 0.50 - - vaddpd %zmm16, %zmm17, %zmm19 {%k1}			# CHECK-NEXT: - - 0.50 - - - - 0.50 - - vaddpd %zmm16, %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: - - 0.50 - 0.50 0.50 - 0.50 - - vaddpd (%rax), %zmm17, %zmm19 {%k1}			# CHECK-NEXT: - - 0.50 - 0.50 0.50 - 0.50 - - vaddpd (%rax), %zmm17, %zmm19 {%k1}
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: - 10.00 2.00 - 0.50 0.50 - 1.00 - - vdivps (%rax), %zmm17, %zmm19			# CHECK-NEXT: - 10.00 2.00 - 0.50 0.50 - 1.00 - - vdivps (%rax), %zmm17, %zmm19
	# CHECK-NEXT: - 10.00 2.00 - 0.50 0.50 - 1.00 - - vdivps (%rax){1to16}, %zmm17, %zmm19			# CHECK-NEXT: - 10.00 2.00 - 0.50 0.50 - 1.00 - - vdivps (%rax){1to16}, %zmm17, %zmm19
	# CHECK-NEXT: - 10.00 2.00 - - - - 1.00 - - vdivps %zmm16, %zmm17, %zmm19 {%k1}			# CHECK-NEXT: - 10.00 2.00 - - - - 1.00 - - vdivps %zmm16, %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: - 10.00 2.00 - 0.50 0.50 - 1.00 - - vdivps (%rax), %zmm17, %zmm19 {%k1}			# CHECK-NEXT: - 10.00 2.00 - 0.50 0.50 - 1.00 - - vdivps (%rax), %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: - 10.00 2.00 - 0.50 0.50 - 1.00 - - vdivps (%rax){1to16}, %zmm17, %zmm19 {%k1}			# CHECK-NEXT: - 10.00 2.00 - 0.50 0.50 - 1.00 - - vdivps (%rax){1to16}, %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: - 10.00 2.00 - - - - 1.00 - - vdivps %zmm16, %zmm17, %zmm19 {%k1} {z}			# CHECK-NEXT: - 10.00 2.00 - - - - 1.00 - - vdivps %zmm16, %zmm17, %zmm19 {%k1} {z}
	# CHECK-NEXT: - 10.00 2.00 - 0.50 0.50 - 1.00 - - vdivps (%rax), %zmm17, %zmm19 {%k1} {z}			# CHECK-NEXT: - 10.00 2.00 - 0.50 0.50 - 1.00 - - vdivps (%rax), %zmm17, %zmm19 {%k1} {z}
	# CHECK-NEXT: - 10.00 2.00 - 0.50 0.50 - 1.00 - - vdivps (%rax){1to16}, %zmm17, %zmm19 {%k1} {z}			# CHECK-NEXT: - 10.00 2.00 - 0.50 0.50 - 1.00 - - vdivps (%rax){1to16}, %zmm17, %zmm19 {%k1} {z}
				# CHECK-NEXT: - - 1.58 0.58 4.00 4.00 - 0.58 0.25 - vgatherdpd (%rax,%ymm1,2), %zmm2 {%k1}
				# CHECK-NEXT: - - 1.58 0.58 8.00 8.00 - 0.58 0.25 - vgatherdps (%rax,%zmm1,2), %zmm2 {%k1}
				# CHECK-NEXT: - - 1.58 0.58 4.00 4.00 - 0.58 0.25 - vgatherqpd (%rax,%zmm1,2), %zmm2 {%k1}
				# CHECK-NEXT: - - 1.58 0.58 4.00 4.00 - 0.58 0.25 - vgatherqps (%rax,%zmm1,2), %ymm2 {%k1}
	# CHECK-NEXT: - - 0.50 - - - - 0.50 - - vmaxpd %zmm16, %zmm17, %zmm19			# CHECK-NEXT: - - 0.50 - - - - 0.50 - - vmaxpd %zmm16, %zmm17, %zmm19
	# CHECK-NEXT: - - 0.50 - 0.50 0.50 - 0.50 - - vmaxpd (%rax), %zmm17, %zmm19			# CHECK-NEXT: - - 0.50 - 0.50 0.50 - 0.50 - - vmaxpd (%rax), %zmm17, %zmm19
	# CHECK-NEXT: - - 0.50 - 0.50 0.50 - 0.50 - - vmaxpd (%rax){1to8}, %zmm17, %zmm19			# CHECK-NEXT: - - 0.50 - 0.50 0.50 - 0.50 - - vmaxpd (%rax){1to8}, %zmm17, %zmm19
	# CHECK-NEXT: - - 0.50 - - - - 0.50 - - vmaxpd %zmm16, %zmm17, %zmm19 {%k1}			# CHECK-NEXT: - - 0.50 - - - - 0.50 - - vmaxpd %zmm16, %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: - - 0.50 - 0.50 0.50 - 0.50 - - vmaxpd (%rax), %zmm17, %zmm19 {%k1}			# CHECK-NEXT: - - 0.50 - 0.50 0.50 - 0.50 - - vmaxpd (%rax), %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: - - 0.50 - 0.50 0.50 - 0.50 - - vmaxpd (%rax){1to8}, %zmm17, %zmm19 {%k1}			# CHECK-NEXT: - - 0.50 - 0.50 0.50 - 0.50 - - vmaxpd (%rax){1to8}, %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: - - 0.50 - - - - 0.50 - - vmaxpd %zmm16, %zmm17, %zmm19 {%k1} {z}			# CHECK-NEXT: - - 0.50 - - - - 0.50 - - vmaxpd %zmm16, %zmm17, %zmm19 {%k1} {z}
	# CHECK-NEXT: - - 0.50 - 0.50 0.50 - 0.50 - - vmaxpd (%rax), %zmm17, %zmm19 {%k1} {z}			# CHECK-NEXT: - - 0.50 - 0.50 0.50 - 0.50 - - vmaxpd (%rax), %zmm17, %zmm19 {%k1} {z}
	▲ Show 20 Lines • Show All 74 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 0.33 - - vpaddq (%rax), %zmm17, %zmm19			# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 0.33 - - vpaddq (%rax), %zmm17, %zmm19
	# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 0.33 - - vpaddq (%rax){1to8}, %zmm17, %zmm19			# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 0.33 - - vpaddq (%rax){1to8}, %zmm17, %zmm19
	# CHECK-NEXT: - - 0.33 0.33 - - - 0.33 - - vpaddq %zmm16, %zmm17, %zmm19 {%k1}			# CHECK-NEXT: - - 0.33 0.33 - - - 0.33 - - vpaddq %zmm16, %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 0.33 - - vpaddq (%rax), %zmm17, %zmm19 {%k1}			# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 0.33 - - vpaddq (%rax), %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 0.33 - - vpaddq (%rax){1to8}, %zmm17, %zmm19 {%k1}			# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 0.33 - - vpaddq (%rax){1to8}, %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: - - 0.33 0.33 - - - 0.33 - - vpaddq %zmm16, %zmm17, %zmm19 {%k1} {z}			# CHECK-NEXT: - - 0.33 0.33 - - - 0.33 - - vpaddq %zmm16, %zmm17, %zmm19 {%k1} {z}
	# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 0.33 - - vpaddq (%rax), %zmm17, %zmm19 {%k1} {z}			# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 0.33 - - vpaddq (%rax), %zmm17, %zmm19 {%k1} {z}
	# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 0.33 - - vpaddq (%rax){1to8}, %zmm17, %zmm19 {%k1} {z}			# CHECK-NEXT: - - 0.33 0.33 0.50 0.50 - 0.33 - - vpaddq (%rax){1to8}, %zmm17, %zmm19 {%k1} {z}
				# CHECK-NEXT: - - 1.58 0.58 4.00 4.00 - 0.58 0.25 - vpgatherdq (%rax,%ymm1,2), %zmm2 {%k1}
				# CHECK-NEXT: - - 1.58 0.58 8.00 8.00 - 0.58 0.25 - vpgatherdd (%rax,%zmm1,2), %zmm2 {%k1}
				# CHECK-NEXT: - - 1.58 0.58 4.00 4.00 - 0.58 0.25 - vpgatherqq (%rax,%zmm1,2), %zmm2 {%k1}
				# CHECK-NEXT: - - 1.58 0.58 4.00 4.00 - 0.58 0.25 - vpgatherqd (%rax,%zmm1,2), %ymm2 {%k1}
	# CHECK-NEXT: - - 1.00 - - - - 1.00 - - vpmulld %zmm16, %zmm17, %zmm19			# CHECK-NEXT: - - 1.00 - - - - 1.00 - - vpmulld %zmm16, %zmm17, %zmm19
	# CHECK-NEXT: - - 1.00 - 0.50 0.50 - 1.00 - - vpmulld (%rax), %zmm17, %zmm19			# CHECK-NEXT: - - 1.00 - 0.50 0.50 - 1.00 - - vpmulld (%rax), %zmm17, %zmm19
	# CHECK-NEXT: - - 1.00 - 0.50 0.50 - 1.00 - - vpmulld (%rax){1to16}, %zmm17, %zmm19			# CHECK-NEXT: - - 1.00 - 0.50 0.50 - 1.00 - - vpmulld (%rax){1to16}, %zmm17, %zmm19
	# CHECK-NEXT: - - 1.00 - - - - 1.00 - - vpmulld %zmm16, %zmm17, %zmm19 {%k1}			# CHECK-NEXT: - - 1.00 - - - - 1.00 - - vpmulld %zmm16, %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: - - 1.00 - 0.50 0.50 - 1.00 - - vpmulld (%rax), %zmm17, %zmm19 {%k1}			# CHECK-NEXT: - - 1.00 - 0.50 0.50 - 1.00 - - vpmulld (%rax), %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: - - 1.00 - 0.50 0.50 - 1.00 - - vpmulld (%rax){1to16}, %zmm17, %zmm19 {%k1}			# CHECK-NEXT: - - 1.00 - 0.50 0.50 - 1.00 - - vpmulld (%rax){1to16}, %zmm17, %zmm19 {%k1}
	# CHECK-NEXT: - - 1.00 - - - - 1.00 - - vpmulld %zmm16, %zmm17, %zmm19 {%k1} {z}			# CHECK-NEXT: - - 1.00 - - - - 1.00 - - vpmulld %zmm16, %zmm17, %zmm19 {%k1} {z}
	# CHECK-NEXT: - - 1.00 - 0.50 0.50 - 1.00 - - vpmulld (%rax), %zmm17, %zmm19 {%k1} {z}			# CHECK-NEXT: - - 1.00 - 0.50 0.50 - 1.00 - - vpmulld (%rax), %zmm17, %zmm19 {%k1} {z}
	▲ Show 20 Lines • Show All 292 Lines • Show Last 20 Lines

llvm/test/tools/llvm-mca/X86/SkylakeServer/resources-avx512vl.s

	Show First 20 Lines • Show All 115 Lines • ▼ Show 20 Lines
	vdivps (%rax){1to8}, %ymm17, %ymm19			vdivps (%rax){1to8}, %ymm17, %ymm19
	vdivps %ymm16, %ymm17, %ymm19 {k1}			vdivps %ymm16, %ymm17, %ymm19 {k1}
	vdivps (%rax), %ymm17, %ymm19 {k1}			vdivps (%rax), %ymm17, %ymm19 {k1}
	vdivps (%rax){1to8}, %ymm17, %ymm19 {k1}			vdivps (%rax){1to8}, %ymm17, %ymm19 {k1}
	vdivps %ymm16, %ymm17, %ymm19 {z}{k1}			vdivps %ymm16, %ymm17, %ymm19 {z}{k1}
	vdivps (%rax), %ymm17, %ymm19 {z}{k1}			vdivps (%rax), %ymm17, %ymm19 {z}{k1}
	vdivps (%rax){1to8}, %ymm17, %ymm19 {z}{k1}			vdivps (%rax){1to8}, %ymm17, %ymm19 {z}{k1}

				vgatherdpd (%rax,%xmm1,2), %ymm2 {k1}
				vgatherdps (%rax,%ymm1,2), %ymm2 {k1}
				vgatherqpd (%rax,%ymm1,2), %ymm2 {k1}
				vgatherqps (%rax,%ymm1,2), %xmm2 {k1}

				vgatherdpd (%rax,%xmm1,2), %xmm2 {k1}
				vgatherdps (%rax,%xmm1,2), %xmm2 {k1}
				vgatherqpd (%rax,%xmm1,2), %xmm2 {k1}
				vgatherqps (%rax,%xmm1,2), %xmm2 {k1}

	vmaxpd %xmm16, %xmm17, %xmm19			vmaxpd %xmm16, %xmm17, %xmm19
	vmaxpd (%rax), %xmm17, %xmm19			vmaxpd (%rax), %xmm17, %xmm19
	vmaxpd (%rax){1to2}, %xmm17, %xmm19			vmaxpd (%rax){1to2}, %xmm17, %xmm19
	vmaxpd %xmm16, %xmm17, %xmm19 {k1}			vmaxpd %xmm16, %xmm17, %xmm19 {k1}
	vmaxpd (%rax), %xmm17, %xmm19 {k1}			vmaxpd (%rax), %xmm17, %xmm19 {k1}
	vmaxpd (%rax){1to2}, %xmm17, %xmm19 {k1}			vmaxpd (%rax){1to2}, %xmm17, %xmm19 {k1}
	vmaxpd %xmm16, %xmm17, %xmm19 {z}{k1}			vmaxpd %xmm16, %xmm17, %xmm19 {z}{k1}
	vmaxpd (%rax), %xmm17, %xmm19 {z}{k1}			vmaxpd (%rax), %xmm17, %xmm19 {z}{k1}
	▲ Show 20 Lines • Show All 284 Lines • ▼ Show 20 Lines
	vpermq (%rax){1to4}, %ymm17, %ymm19			vpermq (%rax){1to4}, %ymm17, %ymm19
	vpermq %ymm16, %ymm17, %ymm19 {k1}			vpermq %ymm16, %ymm17, %ymm19 {k1}
	vpermq (%rax), %ymm17, %ymm19 {k1}			vpermq (%rax), %ymm17, %ymm19 {k1}
	vpermq (%rax){1to4}, %ymm17, %ymm19 {k1}			vpermq (%rax){1to4}, %ymm17, %ymm19 {k1}
	vpermq %ymm16, %ymm17, %ymm19 {z}{k1}			vpermq %ymm16, %ymm17, %ymm19 {z}{k1}
	vpermq (%rax), %ymm17, %ymm19 {z}{k1}			vpermq (%rax), %ymm17, %ymm19 {z}{k1}
	vpermq (%rax){1to4}, %ymm17, %ymm19 {z}{k1}			vpermq (%rax){1to4}, %ymm17, %ymm19 {z}{k1}

				vpgatherdq (%rax,%xmm1,2), %ymm2 {k1}
				vpgatherdd (%rax,%ymm1,2), %ymm2 {k1}
				vpgatherqq (%rax,%ymm1,2), %ymm2 {k1}
				vpgatherqd (%rax,%ymm1,2), %xmm2 {k1}

				vpgatherdq (%rax,%xmm1,2), %xmm2 {k1}
				vpgatherdd (%rax,%xmm1,2), %xmm2 {k1}
				vpgatherqq (%rax,%xmm1,2), %xmm2 {k1}
				vpgatherqd (%rax,%xmm1,2), %xmm2 {k1}

	vpmulld %xmm16, %xmm17, %xmm19			vpmulld %xmm16, %xmm17, %xmm19
	vpmulld (%rax), %xmm17, %xmm19			vpmulld (%rax), %xmm17, %xmm19
	vpmulld (%rax){1to4}, %xmm17, %xmm19			vpmulld (%rax){1to4}, %xmm17, %xmm19
	vpmulld %xmm16, %xmm17, %xmm19 {k1}			vpmulld %xmm16, %xmm17, %xmm19 {k1}
	vpmulld (%rax), %xmm17, %xmm19 {k1}			vpmulld (%rax), %xmm17, %xmm19 {k1}
	vpmulld (%rax){1to4}, %xmm17, %xmm19 {k1}			vpmulld (%rax){1to4}, %xmm17, %xmm19 {k1}
	vpmulld %xmm16, %xmm17, %xmm19 {z}{k1}			vpmulld %xmm16, %xmm17, %xmm19 {z}{k1}
	vpmulld (%rax), %xmm17, %xmm19 {z}{k1}			vpmulld (%rax), %xmm17, %xmm19 {z}{k1}
	▲ Show 20 Lines • Show All 421 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: 2 18 5.00 * vdivps (%rax), %ymm17, %ymm19			# CHECK-NEXT: 2 18 5.00 * vdivps (%rax), %ymm17, %ymm19
	# CHECK-NEXT: 2 18 5.00 * vdivps (%rax){1to8}, %ymm17, %ymm19			# CHECK-NEXT: 2 18 5.00 * vdivps (%rax){1to8}, %ymm17, %ymm19
	# CHECK-NEXT: 1 11 5.00 vdivps %ymm16, %ymm17, %ymm19 {%k1}			# CHECK-NEXT: 1 11 5.00 vdivps %ymm16, %ymm17, %ymm19 {%k1}
	# CHECK-NEXT: 2 18 5.00 * vdivps (%rax), %ymm17, %ymm19 {%k1}			# CHECK-NEXT: 2 18 5.00 * vdivps (%rax), %ymm17, %ymm19 {%k1}
	# CHECK-NEXT: 2 18 5.00 * vdivps (%rax){1to8}, %ymm17, %ymm19 {%k1}			# CHECK-NEXT: 2 18 5.00 * vdivps (%rax){1to8}, %ymm17, %ymm19 {%k1}
	# CHECK-NEXT: 1 11 5.00 vdivps %ymm16, %ymm17, %ymm19 {%k1} {z}			# CHECK-NEXT: 1 11 5.00 vdivps %ymm16, %ymm17, %ymm19 {%k1} {z}
	# CHECK-NEXT: 2 18 5.00 * vdivps (%rax), %ymm17, %ymm19 {%k1} {z}			# CHECK-NEXT: 2 18 5.00 * vdivps (%rax), %ymm17, %ymm19 {%k1} {z}
	# CHECK-NEXT: 2 18 5.00 * vdivps (%rax){1to8}, %ymm17, %ymm19 {%k1} {z}			# CHECK-NEXT: 2 18 5.00 * vdivps (%rax){1to8}, %ymm17, %ymm19 {%k1} {z}
				# CHECK-NEXT: 5 19 2.00 * vgatherdpd (%rax,%xmm1,2), %ymm2 {%k1}
				# CHECK-NEXT: 5 21 4.00 * vgatherdps (%rax,%ymm1,2), %ymm2 {%k1}
				# CHECK-NEXT: 5 19 2.00 * vgatherqpd (%rax,%ymm1,2), %ymm2 {%k1}
				# CHECK-NEXT: 5 19 2.00 * vgatherqps (%rax,%ymm1,2), %xmm2 {%k1}
				# CHECK-NEXT: 5 17 1.00 * vgatherdpd (%rax,%xmm1,2), %xmm2 {%k1}
				# CHECK-NEXT: 5 19 2.00 * vgatherdps (%rax,%xmm1,2), %xmm2 {%k1}
				# CHECK-NEXT: 5 17 1.00 * vgatherqpd (%rax,%xmm1,2), %xmm2 {%k1}
				# CHECK-NEXT: 5 17 1.00 * vgatherqps (%rax,%xmm1,2), %xmm2 {%k1}
	# CHECK-NEXT: 1 4 0.50 vmaxpd %xmm16, %xmm17, %xmm19			# CHECK-NEXT: 1 4 0.50 vmaxpd %xmm16, %xmm17, %xmm19
	# CHECK-NEXT: 2 10 0.50 * vmaxpd (%rax), %xmm17, %xmm19			# CHECK-NEXT: 2 10 0.50 * vmaxpd (%rax), %xmm17, %xmm19
	# CHECK-NEXT: 2 10 0.50 * vmaxpd (%rax){1to2}, %xmm17, %xmm19			# CHECK-NEXT: 2 10 0.50 * vmaxpd (%rax){1to2}, %xmm17, %xmm19
	# CHECK-NEXT: 1 4 0.50 vmaxpd %xmm16, %xmm17, %xmm19 {%k1}			# CHECK-NEXT: 1 4 0.50 vmaxpd %xmm16, %xmm17, %xmm19 {%k1}
	# CHECK-NEXT: 2 10 0.50 * vmaxpd (%rax), %xmm17, %xmm19 {%k1}			# CHECK-NEXT: 2 10 0.50 * vmaxpd (%rax), %xmm17, %xmm19 {%k1}
	# CHECK-NEXT: 2 10 0.50 * vmaxpd (%rax){1to2}, %xmm17, %xmm19 {%k1}			# CHECK-NEXT: 2 10 0.50 * vmaxpd (%rax){1to2}, %xmm17, %xmm19 {%k1}
	# CHECK-NEXT: 1 4 0.50 vmaxpd %xmm16, %xmm17, %xmm19 {%k1} {z}			# CHECK-NEXT: 1 4 0.50 vmaxpd %xmm16, %xmm17, %xmm19 {%k1} {z}
	# CHECK-NEXT: 2 10 0.50 * vmaxpd (%rax), %xmm17, %xmm19 {%k1} {z}			# CHECK-NEXT: 2 10 0.50 * vmaxpd (%rax), %xmm17, %xmm19 {%k1} {z}
	▲ Show 20 Lines • Show All 254 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: 2 10 1.00 * vpermq (%rax), %ymm17, %ymm19			# CHECK-NEXT: 2 10 1.00 * vpermq (%rax), %ymm17, %ymm19
	# CHECK-NEXT: 2 10 1.00 * vpermq (%rax){1to4}, %ymm17, %ymm19			# CHECK-NEXT: 2 10 1.00 * vpermq (%rax){1to4}, %ymm17, %ymm19
	# CHECK-NEXT: 1 3 1.00 vpermq %ymm16, %ymm17, %ymm19 {%k1}			# CHECK-NEXT: 1 3 1.00 vpermq %ymm16, %ymm17, %ymm19 {%k1}
	# CHECK-NEXT: 2 10 1.00 * vpermq (%rax), %ymm17, %ymm19 {%k1}			# CHECK-NEXT: 2 10 1.00 * vpermq (%rax), %ymm17, %ymm19 {%k1}
	# CHECK-NEXT: 2 10 1.00 * vpermq (%rax){1to4}, %ymm17, %ymm19 {%k1}			# CHECK-NEXT: 2 10 1.00 * vpermq (%rax){1to4}, %ymm17, %ymm19 {%k1}
	# CHECK-NEXT: 1 3 1.00 vpermq %ymm16, %ymm17, %ymm19 {%k1} {z}			# CHECK-NEXT: 1 3 1.00 vpermq %ymm16, %ymm17, %ymm19 {%k1} {z}
	# CHECK-NEXT: 2 10 1.00 * vpermq (%rax), %ymm17, %ymm19 {%k1} {z}			# CHECK-NEXT: 2 10 1.00 * vpermq (%rax), %ymm17, %ymm19 {%k1} {z}
	# CHECK-NEXT: 2 10 1.00 * vpermq (%rax){1to4}, %ymm17, %ymm19 {%k1} {z}			# CHECK-NEXT: 2 10 1.00 * vpermq (%rax){1to4}, %ymm17, %ymm19 {%k1} {z}
				# CHECK-NEXT: 5 19 2.00 * vpgatherdq (%rax,%xmm1,2), %ymm2 {%k1}
				# CHECK-NEXT: 5 21 4.00 * vpgatherdd (%rax,%ymm1,2), %ymm2 {%k1}
				# CHECK-NEXT: 5 19 2.00 * vpgatherqq (%rax,%ymm1,2), %ymm2 {%k1}
				# CHECK-NEXT: 5 19 2.00 * vpgatherqd (%rax,%ymm1,2), %xmm2 {%k1}
				# CHECK-NEXT: 5 17 1.00 * vpgatherdq (%rax,%xmm1,2), %xmm2 {%k1}
				# CHECK-NEXT: 5 19 2.00 * vpgatherdd (%rax,%xmm1,2), %xmm2 {%k1}
				# CHECK-NEXT: 5 17 1.00 * vpgatherqq (%rax,%xmm1,2), %xmm2 {%k1}
				# CHECK-NEXT: 5 17 1.00 * vpgatherqd (%rax,%xmm1,2), %xmm2 {%k1}
	# CHECK-NEXT: 2 10 1.00 vpmulld %xmm16, %xmm17, %xmm19			# CHECK-NEXT: 2 10 1.00 vpmulld %xmm16, %xmm17, %xmm19
	# CHECK-NEXT: 3 16 1.00 * vpmulld (%rax), %xmm17, %xmm19			# CHECK-NEXT: 3 16 1.00 * vpmulld (%rax), %xmm17, %xmm19
	# CHECK-NEXT: 3 16 1.00 * vpmulld (%rax){1to4}, %xmm17, %xmm19			# CHECK-NEXT: 3 16 1.00 * vpmulld (%rax){1to4}, %xmm17, %xmm19
	# CHECK-NEXT: 2 10 1.00 vpmulld %xmm16, %xmm17, %xmm19 {%k1}			# CHECK-NEXT: 2 10 1.00 vpmulld %xmm16, %xmm17, %xmm19 {%k1}
	# CHECK-NEXT: 3 16 1.00 * vpmulld (%rax), %xmm17, %xmm19 {%k1}			# CHECK-NEXT: 3 16 1.00 * vpmulld (%rax), %xmm17, %xmm19 {%k1}
	# CHECK-NEXT: 3 16 1.00 * vpmulld (%rax){1to4}, %xmm17, %xmm19 {%k1}			# CHECK-NEXT: 3 16 1.00 * vpmulld (%rax){1to4}, %xmm17, %xmm19 {%k1}
	# CHECK-NEXT: 2 10 1.00 vpmulld %xmm16, %xmm17, %xmm19 {%k1} {z}			# CHECK-NEXT: 2 10 1.00 vpmulld %xmm16, %xmm17, %xmm19 {%k1} {z}
	# CHECK-NEXT: 3 16 1.00 * vpmulld (%rax), %xmm17, %xmm19 {%k1} {z}			# CHECK-NEXT: 3 16 1.00 * vpmulld (%rax), %xmm17, %xmm19 {%k1} {z}
	▲ Show 20 Lines • Show All 287 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: [5] - SKXPort3			# CHECK-NEXT: [5] - SKXPort3
	# CHECK-NEXT: [6] - SKXPort4			# CHECK-NEXT: [6] - SKXPort4
	# CHECK-NEXT: [7] - SKXPort5			# CHECK-NEXT: [7] - SKXPort5
	# CHECK-NEXT: [8] - SKXPort6			# CHECK-NEXT: [8] - SKXPort6
	# CHECK-NEXT: [9] - SKXPort7			# CHECK-NEXT: [9] - SKXPort7

	# CHECK: Resource pressure per iteration:			# CHECK: Resource pressure per iteration:
	# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9]			# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9]
	# CHECK-NEXT: - 423.00 217.00 145.00 222.00 222.00 - 328.00 - -			# CHECK-NEXT: - 423.00 242.33 154.33 252.00 252.00 - 337.33 4.00 -

	# CHECK: Resource pressure by instruction:			# CHECK: Resource pressure by instruction:
	# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] Instructions:			# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] Instructions:
	# CHECK-NEXT: - - 0.50 0.50 - - - - - - vaddpd %xmm16, %xmm17, %xmm19			# CHECK-NEXT: - - 0.50 0.50 - - - - - - vaddpd %xmm16, %xmm17, %xmm19
	# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - - - - vaddpd (%rax), %xmm17, %xmm19			# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - - - - vaddpd (%rax), %xmm17, %xmm19
	# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - - - - vaddpd (%rax){1to2}, %xmm17, %xmm19			# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - - - - vaddpd (%rax){1to2}, %xmm17, %xmm19
	# CHECK-NEXT: - - 0.50 0.50 - - - - - - vaddpd %xmm16, %xmm17, %xmm19 {%k1}			# CHECK-NEXT: - - 0.50 0.50 - - - - - - vaddpd %xmm16, %xmm17, %xmm19 {%k1}
	# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - - - - vaddpd (%rax), %xmm17, %xmm19 {%k1}			# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - - - - vaddpd (%rax), %xmm17, %xmm19 {%k1}
	▲ Show 20 Lines • Show All 95 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: - 5.00 1.00 - 0.50 0.50 - - - - vdivps (%rax), %ymm17, %ymm19			# CHECK-NEXT: - 5.00 1.00 - 0.50 0.50 - - - - vdivps (%rax), %ymm17, %ymm19
	# CHECK-NEXT: - 5.00 1.00 - 0.50 0.50 - - - - vdivps (%rax){1to8}, %ymm17, %ymm19			# CHECK-NEXT: - 5.00 1.00 - 0.50 0.50 - - - - vdivps (%rax){1to8}, %ymm17, %ymm19
	# CHECK-NEXT: - 5.00 1.00 - - - - - - - vdivps %ymm16, %ymm17, %ymm19 {%k1}			# CHECK-NEXT: - 5.00 1.00 - - - - - - - vdivps %ymm16, %ymm17, %ymm19 {%k1}
	# CHECK-NEXT: - 5.00 1.00 - 0.50 0.50 - - - - vdivps (%rax), %ymm17, %ymm19 {%k1}			# CHECK-NEXT: - 5.00 1.00 - 0.50 0.50 - - - - vdivps (%rax), %ymm17, %ymm19 {%k1}
	# CHECK-NEXT: - 5.00 1.00 - 0.50 0.50 - - - - vdivps (%rax){1to8}, %ymm17, %ymm19 {%k1}			# CHECK-NEXT: - 5.00 1.00 - 0.50 0.50 - - - - vdivps (%rax){1to8}, %ymm17, %ymm19 {%k1}
	# CHECK-NEXT: - 5.00 1.00 - - - - - - - vdivps %ymm16, %ymm17, %ymm19 {%k1} {z}			# CHECK-NEXT: - 5.00 1.00 - - - - - - - vdivps %ymm16, %ymm17, %ymm19 {%k1} {z}
	# CHECK-NEXT: - 5.00 1.00 - 0.50 0.50 - - - - vdivps (%rax), %ymm17, %ymm19 {%k1} {z}			# CHECK-NEXT: - 5.00 1.00 - 0.50 0.50 - - - - vdivps (%rax), %ymm17, %ymm19 {%k1} {z}
	# CHECK-NEXT: - 5.00 1.00 - 0.50 0.50 - - - - vdivps (%rax){1to8}, %ymm17, %ymm19 {%k1} {z}			# CHECK-NEXT: - 5.00 1.00 - 0.50 0.50 - - - - vdivps (%rax){1to8}, %ymm17, %ymm19 {%k1} {z}
				# CHECK-NEXT: - - 1.58 0.58 2.00 2.00 - 0.58 0.25 - vgatherdpd (%rax,%xmm1,2), %ymm2 {%k1}
				# CHECK-NEXT: - - 1.58 0.58 4.00 4.00 - 0.58 0.25 - vgatherdps (%rax,%ymm1,2), %ymm2 {%k1}
				# CHECK-NEXT: - - 1.58 0.58 2.00 2.00 - 0.58 0.25 - vgatherqpd (%rax,%ymm1,2), %ymm2 {%k1}
				# CHECK-NEXT: - - 1.58 0.58 2.00 2.00 - 0.58 0.25 - vgatherqps (%rax,%ymm1,2), %xmm2 {%k1}
				# CHECK-NEXT: - - 1.58 0.58 1.00 1.00 - 0.58 0.25 - vgatherdpd (%rax,%xmm1,2), %xmm2 {%k1}
				# CHECK-NEXT: - - 1.58 0.58 2.00 2.00 - 0.58 0.25 - vgatherdps (%rax,%xmm1,2), %xmm2 {%k1}
				# CHECK-NEXT: - - 1.58 0.58 1.00 1.00 - 0.58 0.25 - vgatherqpd (%rax,%xmm1,2), %xmm2 {%k1}
				# CHECK-NEXT: - - 1.58 0.58 1.00 1.00 - 0.58 0.25 - vgatherqps (%rax,%xmm1,2), %xmm2 {%k1}
	# CHECK-NEXT: - - 0.50 0.50 - - - - - - vmaxpd %xmm16, %xmm17, %xmm19			# CHECK-NEXT: - - 0.50 0.50 - - - - - - vmaxpd %xmm16, %xmm17, %xmm19
	# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - - - - vmaxpd (%rax), %xmm17, %xmm19			# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - - - - vmaxpd (%rax), %xmm17, %xmm19
	# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - - - - vmaxpd (%rax){1to2}, %xmm17, %xmm19			# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - - - - vmaxpd (%rax){1to2}, %xmm17, %xmm19
	# CHECK-NEXT: - - 0.50 0.50 - - - - - - vmaxpd %xmm16, %xmm17, %xmm19 {%k1}			# CHECK-NEXT: - - 0.50 0.50 - - - - - - vmaxpd %xmm16, %xmm17, %xmm19 {%k1}
	# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - - - - vmaxpd (%rax), %xmm17, %xmm19 {%k1}			# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - - - - vmaxpd (%rax), %xmm17, %xmm19 {%k1}
	# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - - - - vmaxpd (%rax){1to2}, %xmm17, %xmm19 {%k1}			# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - - - - vmaxpd (%rax){1to2}, %xmm17, %xmm19 {%k1}
	# CHECK-NEXT: - - 0.50 0.50 - - - - - - vmaxpd %xmm16, %xmm17, %xmm19 {%k1} {z}			# CHECK-NEXT: - - 0.50 0.50 - - - - - - vmaxpd %xmm16, %xmm17, %xmm19 {%k1} {z}
	# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - - - - vmaxpd (%rax), %xmm17, %xmm19 {%k1} {z}			# CHECK-NEXT: - - 0.50 0.50 0.50 0.50 - - - - vmaxpd (%rax), %xmm17, %xmm19 {%k1} {z}
	▲ Show 20 Lines • Show All 254 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermq (%rax), %ymm17, %ymm19			# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermq (%rax), %ymm17, %ymm19
	# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermq (%rax){1to4}, %ymm17, %ymm19			# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermq (%rax){1to4}, %ymm17, %ymm19
	# CHECK-NEXT: - - - - - - - 1.00 - - vpermq %ymm16, %ymm17, %ymm19 {%k1}			# CHECK-NEXT: - - - - - - - 1.00 - - vpermq %ymm16, %ymm17, %ymm19 {%k1}
	# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermq (%rax), %ymm17, %ymm19 {%k1}			# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermq (%rax), %ymm17, %ymm19 {%k1}
	# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermq (%rax){1to4}, %ymm17, %ymm19 {%k1}			# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermq (%rax){1to4}, %ymm17, %ymm19 {%k1}
	# CHECK-NEXT: - - - - - - - 1.00 - - vpermq %ymm16, %ymm17, %ymm19 {%k1} {z}			# CHECK-NEXT: - - - - - - - 1.00 - - vpermq %ymm16, %ymm17, %ymm19 {%k1} {z}
	# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermq (%rax), %ymm17, %ymm19 {%k1} {z}			# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermq (%rax), %ymm17, %ymm19 {%k1} {z}
	# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermq (%rax){1to4}, %ymm17, %ymm19 {%k1} {z}			# CHECK-NEXT: - - - - 0.50 0.50 - 1.00 - - vpermq (%rax){1to4}, %ymm17, %ymm19 {%k1} {z}
				# CHECK-NEXT: - - 1.58 0.58 2.00 2.00 - 0.58 0.25 - vpgatherdq (%rax,%xmm1,2), %ymm2 {%k1}
				# CHECK-NEXT: - - 1.58 0.58 4.00 4.00 - 0.58 0.25 - vpgatherdd (%rax,%ymm1,2), %ymm2 {%k1}
				# CHECK-NEXT: - - 1.58 0.58 2.00 2.00 - 0.58 0.25 - vpgatherqq (%rax,%ymm1,2), %ymm2 {%k1}
				# CHECK-NEXT: - - 1.58 0.58 2.00 2.00 - 0.58 0.25 - vpgatherqd (%rax,%ymm1,2), %xmm2 {%k1}
				# CHECK-NEXT: - - 1.58 0.58 1.00 1.00 - 0.58 0.25 - vpgatherdq (%rax,%xmm1,2), %xmm2 {%k1}
				# CHECK-NEXT: - - 1.58 0.58 2.00 2.00 - 0.58 0.25 - vpgatherdd (%rax,%xmm1,2), %xmm2 {%k1}
				# CHECK-NEXT: - - 1.58 0.58 1.00 1.00 - 0.58 0.25 - vpgatherqq (%rax,%xmm1,2), %xmm2 {%k1}
				# CHECK-NEXT: - - 1.58 0.58 1.00 1.00 - 0.58 0.25 - vpgatherqd (%rax,%xmm1,2), %xmm2 {%k1}
	# CHECK-NEXT: - - 1.00 1.00 - - - - - - vpmulld %xmm16, %xmm17, %xmm19			# CHECK-NEXT: - - 1.00 1.00 - - - - - - vpmulld %xmm16, %xmm17, %xmm19
	# CHECK-NEXT: - - 1.00 1.00 0.50 0.50 - - - - vpmulld (%rax), %xmm17, %xmm19			# CHECK-NEXT: - - 1.00 1.00 0.50 0.50 - - - - vpmulld (%rax), %xmm17, %xmm19
	# CHECK-NEXT: - - 1.00 1.00 0.50 0.50 - - - - vpmulld (%rax){1to4}, %xmm17, %xmm19			# CHECK-NEXT: - - 1.00 1.00 0.50 0.50 - - - - vpmulld (%rax){1to4}, %xmm17, %xmm19
	# CHECK-NEXT: - - 1.00 1.00 - - - - - - vpmulld %xmm16, %xmm17, %xmm19 {%k1}			# CHECK-NEXT: - - 1.00 1.00 - - - - - - vpmulld %xmm16, %xmm17, %xmm19 {%k1}
	# CHECK-NEXT: - - 1.00 1.00 0.50 0.50 - - - - vpmulld (%rax), %xmm17, %xmm19 {%k1}			# CHECK-NEXT: - - 1.00 1.00 0.50 0.50 - - - - vpmulld (%rax), %xmm17, %xmm19 {%k1}
	# CHECK-NEXT: - - 1.00 1.00 0.50 0.50 - - - - vpmulld (%rax){1to4}, %xmm17, %xmm19 {%k1}			# CHECK-NEXT: - - 1.00 1.00 0.50 0.50 - - - - vpmulld (%rax){1to4}, %xmm17, %xmm19 {%k1}
	# CHECK-NEXT: - - 1.00 1.00 - - - - - - vpmulld %xmm16, %xmm17, %xmm19 {%k1} {z}			# CHECK-NEXT: - - 1.00 1.00 - - - - - - vpmulld %xmm16, %xmm17, %xmm19 {%k1} {z}
	# CHECK-NEXT: - - 1.00 1.00 0.50 0.50 - - - - vpmulld (%rax), %xmm17, %xmm19 {%k1} {z}			# CHECK-NEXT: - - 1.00 1.00 0.50 0.50 - - - - vpmulld (%rax), %xmm17, %xmm19 {%k1} {z}
	▲ Show 20 Lines • Show All 280 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Improve the gather scheduler models for SkylakeClient and SkylakeServerClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 242435

llvm/lib/Target/X86/X86SchedSkylakeClient.td

llvm/lib/Target/X86/X86SchedSkylakeServer.td

llvm/test/tools/llvm-mca/X86/SkylakeClient/resources-avx2.s

llvm/test/tools/llvm-mca/X86/SkylakeServer/resources-avx2.s

llvm/test/tools/llvm-mca/X86/SkylakeServer/resources-avx512.s

llvm/test/tools/llvm-mca/X86/SkylakeServer/resources-avx512vl.s

[X86] Improve the gather scheduler models for SkylakeClient and SkylakeServer
ClosedPublic