This is an archive of the discontinued LLVM Phabricator instance.

[X86][BtVer2] Improved latency and throughput of float/vector loads and stores.
ClosedPublic

Authored by andreadb on Oct 11 2019, 8:09 AM.

Download Raw Diff

Details

Reviewers

RKSimon
craig.topper
lebedev.ri

Commits

rGb744abb4f6a9: [X86][BtVer2] Improved latency and throughput of float/vector loads and stores.
rL374765: [X86][BtVer2] Improved latency and throughput of float/vector loads and stores.

Summary

This patch introduces the following changes to the btver2 scheduling model:

The number of micro opcodes for YMM loads and stores is now 2 (it was incorrectly set to 1 for both aligned and misaligned loads/stores).

Increased the number of AGU resource cycles for YMM loads and stores to 2cy (instead of 1cy).

Removed JFPU01 and JFPX from the list of resources consumed by pure float/vector loads (no MMX).

I verified with llvm-exegesis that pure XMM/YMM loads are no-pipe. They are dispatched to the FPU but not really issues on JFPU01.

Diff Detail

Event Timeline

andreadb created this revision.Oct 11 2019, 8:09 AM

Herald added subscribers: courbet, gbedwell. · View Herald TranscriptOct 11 2019, 8:09 AM

exegesis-report.txt10 KBDownload

Posted the output from llvm-exegesis for all the affected instructions.

LGTM - thanks for looking into this

This revision is now accepted and ready to land.Oct 13 2019, 4:29 AM

Closed by commit rGb744abb4f6a9: [X86][BtVer2] Improved latency and throughput of float/vector loads and stores. (authored by andreadb). · Explain WhyOct 14 2019, 4:14 AM

This revision was automatically updated to reflect the committed changes.

Herald added a project: Restricted Project. · View Herald TranscriptOct 14 2019, 4:14 AM

Herald added a subscriber: hiraditya. · View Herald Transcript

Revision Contents

Path

Size

lib/

Target/

X86/

X86ScheduleBtVer2.td

12 lines

test/

tools/

llvm-mca/

X86/

BtVer2/

10 lines

10 lines

10 lines

68 lines

6 lines

10 lines

4 lines

Diff 224598

lib/Target/X86/X86ScheduleBtVer2.td

	Show First 20 Lines • Show All 495 Lines • ▼ Show 20 Lines
	////////////////////////////////////////////////////////////////////////////////			////////////////////////////////////////////////////////////////////////////////
	// Floating point. This covers both scalar and vector operations.			// Floating point. This covers both scalar and vector operations.
	////////////////////////////////////////////////////////////////////////////////			////////////////////////////////////////////////////////////////////////////////

	defm : X86WriteRes<WriteFLD0, [JFPU1, JSTC], 3, [1,1], 1>;			defm : X86WriteRes<WriteFLD0, [JFPU1, JSTC], 3, [1,1], 1>;
	defm : X86WriteRes<WriteFLD1, [JFPU1, JSTC], 3, [1,1], 1>;			defm : X86WriteRes<WriteFLD1, [JFPU1, JSTC], 3, [1,1], 1>;
	defm : X86WriteRes<WriteFLDC, [JFPU1, JSTC], 3, [1,1], 1>;			defm : X86WriteRes<WriteFLDC, [JFPU1, JSTC], 3, [1,1], 1>;
	defm : X86WriteRes<WriteFLoad, [JLAGU, JFPU01, JFPX], 5, [1, 1, 1], 1>;			defm : X86WriteRes<WriteFLoad, [JLAGU, JFPU01, JFPX], 5, [1, 1, 1], 1>;
	defm : X86WriteRes<WriteFLoadX, [JLAGU, JFPU01, JFPX], 5, [1, 1, 1], 1>;			defm : X86WriteRes<WriteFLoadX, [JLAGU], 5, [1], 1>;
	defm : X86WriteRes<WriteFLoadY, [JLAGU, JFPU01, JFPX], 5, [1, 1, 1], 1>;			defm : X86WriteRes<WriteFLoadY, [JLAGU], 5, [2], 2>;
	defm : X86WriteRes<WriteFMaskedLoad, [JLAGU, JFPU01, JFPX], 6, [1, 2, 2], 1>;			defm : X86WriteRes<WriteFMaskedLoad, [JLAGU, JFPU01, JFPX], 6, [1, 2, 2], 1>;
	defm : X86WriteRes<WriteFMaskedLoadY, [JLAGU, JFPU01, JFPX], 6, [2, 4, 4], 2>;			defm : X86WriteRes<WriteFMaskedLoadY, [JLAGU, JFPU01, JFPX], 6, [2, 4, 4], 2>;

	defm : X86WriteRes<WriteFStore, [JSAGU, JFPU1, JSTC], 2, [1, 1, 1], 1>;			defm : X86WriteRes<WriteFStore, [JSAGU, JFPU1, JSTC], 2, [1, 1, 1], 1>;
	defm : X86WriteRes<WriteFStoreX, [JSAGU, JFPU1, JSTC], 1, [1, 1, 1], 1>;			defm : X86WriteRes<WriteFStoreX, [JSAGU, JFPU1, JSTC], 1, [1, 1, 1], 1>;
	defm : X86WriteRes<WriteFStoreY, [JSAGU, JFPU1, JSTC], 1, [1, 1, 1], 1>;			defm : X86WriteRes<WriteFStoreY, [JSAGU, JFPU1, JSTC], 1, [2, 2, 2], 2>;
	defm : X86WriteRes<WriteFStoreNT, [JSAGU, JFPU1, JSTC], 3, [1, 1, 1], 1>;			defm : X86WriteRes<WriteFStoreNT, [JSAGU, JFPU1, JSTC], 3, [1, 1, 1], 1>;
	defm : X86WriteRes<WriteFStoreNTX, [JSAGU, JFPU1, JSTC], 3, [1, 1, 1], 1>;			defm : X86WriteRes<WriteFStoreNTX, [JSAGU, JFPU1, JSTC], 3, [1, 1, 1], 1>;
	defm : X86WriteRes<WriteFStoreNTY, [JSAGU, JFPU1, JSTC], 3, [2, 2, 2], 1>;			defm : X86WriteRes<WriteFStoreNTY, [JSAGU, JFPU1, JSTC], 3, [2, 2, 2], 1>;

	defm : X86WriteRes<WriteFMaskedStore32, [JFPU0, JFPA, JFPU1, JSTC, JLAGU, JSAGU, JALU01], 16, [1,1, 5, 5,4,4,4], 19>;			defm : X86WriteRes<WriteFMaskedStore32, [JFPU0, JFPA, JFPU1, JSTC, JLAGU, JSAGU, JALU01], 16, [1,1, 5, 5,4,4,4], 19>;
	defm : X86WriteRes<WriteFMaskedStore64, [JFPU0, JFPA, JFPU1, JSTC, JLAGU, JSAGU, JALU01], 13, [1,1, 2, 2,2,2,2], 10>;			defm : X86WriteRes<WriteFMaskedStore64, [JFPU0, JFPA, JFPU1, JSTC, JLAGU, JSAGU, JALU01], 13, [1,1, 2, 2,2,2,2], 10>;
	defm : X86WriteRes<WriteFMaskedStore32Y, [JFPU0, JFPA, JFPU1, JSTC, JLAGU, JSAGU, JALU01], 22, [1,1,10,10,8,8,8], 36>;			defm : X86WriteRes<WriteFMaskedStore32Y, [JFPU0, JFPA, JFPU1, JSTC, JLAGU, JSAGU, JALU01], 22, [1,1,10,10,8,8,8], 36>;
	defm : X86WriteRes<WriteFMaskedStore64Y, [JFPU0, JFPA, JFPU1, JSTC, JLAGU, JSAGU, JALU01], 16, [1,1, 4, 4,4,4,4], 18>;			defm : X86WriteRes<WriteFMaskedStore64Y, [JFPU0, JFPA, JFPU1, JSTC, JLAGU, JSAGU, JALU01], 16, [1,1, 4, 4,4,4,4], 18>;
	▲ Show 20 Lines • Show All 132 Lines • ▼ Show 20 Lines
	defm : X86WriteRes<WriteCvtPS2PHYSt, [JFPU1, JSTC, JFPX, JSAGU], 7, [2,2,2,1], 3>;			defm : X86WriteRes<WriteCvtPS2PHYSt, [JFPU1, JSTC, JFPX, JSAGU], 7, [2,2,2,1], 3>;
	defm : X86WriteResUnsupported<WriteCvtPS2PHZSt>;			defm : X86WriteResUnsupported<WriteCvtPS2PHZSt>;

	////////////////////////////////////////////////////////////////////////////////			////////////////////////////////////////////////////////////////////////////////
	// Vector integer operations.			// Vector integer operations.
	////////////////////////////////////////////////////////////////////////////////			////////////////////////////////////////////////////////////////////////////////

	defm : X86WriteRes<WriteVecLoad, [JLAGU, JFPU01, JVALU], 5, [1, 1, 1], 1>;			defm : X86WriteRes<WriteVecLoad, [JLAGU, JFPU01, JVALU], 5, [1, 1, 1], 1>;
	defm : X86WriteRes<WriteVecLoadX, [JLAGU, JFPU01, JVALU], 5, [1, 1, 1], 1>;			defm : X86WriteRes<WriteVecLoadX, [JLAGU], 5, [1], 1>;
	defm : X86WriteRes<WriteVecLoadY, [JLAGU, JFPU01, JVALU], 5, [1, 1, 1], 1>;			defm : X86WriteRes<WriteVecLoadY, [JLAGU], 5, [2], 2>;
	defm : X86WriteRes<WriteVecLoadNT, [JLAGU, JFPU01, JVALU], 5, [1, 1, 1], 1>;			defm : X86WriteRes<WriteVecLoadNT, [JLAGU, JFPU01, JVALU], 5, [1, 1, 1], 1>;
	defm : X86WriteRes<WriteVecLoadNTY, [JLAGU, JFPU01, JVALU], 5, [1, 1, 1], 1>;			defm : X86WriteRes<WriteVecLoadNTY, [JLAGU, JFPU01, JVALU], 5, [1, 1, 1], 1>;
	defm : X86WriteRes<WriteVecMaskedLoad, [JLAGU, JFPU01, JVALU], 6, [1, 2, 2], 1>;			defm : X86WriteRes<WriteVecMaskedLoad, [JLAGU, JFPU01, JVALU], 6, [1, 2, 2], 1>;
	defm : X86WriteRes<WriteVecMaskedLoadY, [JLAGU, JFPU01, JVALU], 6, [2, 4, 4], 2>;			defm : X86WriteRes<WriteVecMaskedLoadY, [JLAGU, JFPU01, JVALU], 6, [2, 4, 4], 2>;

	defm : X86WriteRes<WriteVecStore, [JSAGU, JFPU1, JSTC], 2, [1, 1, 1], 1>;			defm : X86WriteRes<WriteVecStore, [JSAGU, JFPU1, JSTC], 2, [1, 1, 1], 1>;
	defm : X86WriteRes<WriteVecStoreX, [JSAGU, JFPU1, JSTC], 1, [1, 1, 1], 1>;			defm : X86WriteRes<WriteVecStoreX, [JSAGU, JFPU1, JSTC], 1, [1, 1, 1], 1>;
	defm : X86WriteRes<WriteVecStoreY, [JSAGU, JFPU1, JSTC], 1, [1, 1, 1], 1>;			defm : X86WriteRes<WriteVecStoreY, [JSAGU, JFPU1, JSTC], 1, [2, 2, 2], 2>;
	defm : X86WriteRes<WriteVecStoreNT, [JSAGU, JFPU1, JSTC], 2, [1, 1, 1], 1>;			defm : X86WriteRes<WriteVecStoreNT, [JSAGU, JFPU1, JSTC], 2, [1, 1, 1], 1>;
	defm : X86WriteRes<WriteVecStoreNTY, [JSAGU, JFPU1, JSTC], 2, [2, 2, 2], 1>;			defm : X86WriteRes<WriteVecStoreNTY, [JSAGU, JFPU1, JSTC], 2, [2, 2, 2], 1>;
	defm : X86WriteRes<WriteVecMaskedStore, [JSAGU, JFPU01, JVALU], 6, [1, 1, 4], 1>;			defm : X86WriteRes<WriteVecMaskedStore, [JSAGU, JFPU01, JVALU], 6, [1, 1, 4], 1>;
	defm : X86WriteRes<WriteVecMaskedStoreY, [JSAGU, JFPU01, JVALU], 6, [2, 2, 4], 2>;			defm : X86WriteRes<WriteVecMaskedStoreY, [JSAGU, JFPU01, JVALU], 6, [2, 2, 4], 2>;

	defm : X86WriteRes<WriteVecMove, [JFPU01, JVALU], 1, [1, 1], 1>;			defm : X86WriteRes<WriteVecMove, [JFPU01, JVALU], 1, [1, 1], 1>;
	defm : X86WriteRes<WriteVecMoveX, [JFPU01, JVALU], 1, [1, 1], 1>;			defm : X86WriteRes<WriteVecMoveX, [JFPU01, JVALU], 1, [1, 1], 1>;
	defm : X86WriteRes<WriteVecMoveY, [JFPU01, JVALU], 1, [2, 2], 2>;			defm : X86WriteRes<WriteVecMoveY, [JFPU01, JVALU], 1, [2, 2], 2>;
	▲ Show 20 Lines • Show All 369 Lines • Show Last 20 Lines

test/tools/llvm-mca/X86/BtVer2/bottleneck-hints-3.s

	Show First 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: [9] - JSAGU			# CHECK-NEXT: [9] - JSAGU
	# CHECK-NEXT: [10] - JSTC			# CHECK-NEXT: [10] - JSTC
	# CHECK-NEXT: [11] - JVALU0			# CHECK-NEXT: [11] - JVALU0
	# CHECK-NEXT: [12] - JVALU1			# CHECK-NEXT: [12] - JVALU1
	# CHECK-NEXT: [13] - JVIMUL			# CHECK-NEXT: [13] - JVIMUL

	# CHECK: Resource pressure per iteration:			# CHECK: Resource pressure per iteration:
	# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13]			# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13]
	# CHECK-NEXT: - - - 2.00 2.00 4.00 4.00 4.00 - 4.00 4.00 - - -			# CHECK-NEXT: - - - - - - 4.00 4.00 - 4.00 4.00 - - -

	# CHECK: Resource pressure by instruction:			# CHECK: Resource pressure by instruction:
	# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] Instructions:			# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] Instructions:
	# CHECK-NEXT: - - - - 1.00 1.00 - 1.00 - - - - - - vmovaps (%rsi), %xmm0			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - vmovaps (%rsi), %xmm0
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, (%rdi)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, (%rdi)
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - vmovaps 16(%rsi), %xmm0			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - vmovaps 16(%rsi), %xmm0
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, 16(%rdi)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, 16(%rdi)
	# CHECK-NEXT: - - - - 1.00 1.00 - 1.00 - - - - - - vmovaps 32(%rsi), %xmm0			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - vmovaps 32(%rsi), %xmm0
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, 32(%rdi)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, 32(%rdi)
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - vmovaps 48(%rsi), %xmm0			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - vmovaps 48(%rsi), %xmm0
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, 48(%rdi)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, 48(%rdi)

	# CHECK: Timeline view:			# CHECK: Timeline view:
	# CHECK-NEXT: 0123456789			# CHECK-NEXT: 0123456789
	# CHECK-NEXT: Index 0123456789 0123456			# CHECK-NEXT: Index 0123456789 0123456

	# CHECK: [0,0] DeeeeeER . . . .. vmovaps (%rsi), %xmm0			# CHECK: [0,0] DeeeeeER . . . .. vmovaps (%rsi), %xmm0
	# CHECK-NEXT: [0,1] D=====eER . . . .. vmovaps %xmm0, (%rdi)			# CHECK-NEXT: [0,1] D=====eER . . . .. vmovaps %xmm0, (%rdi)
	Show All 23 Lines

test/tools/llvm-mca/X86/BtVer2/load-store-alias.s

	Show First 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: [9] - JSAGU			# CHECK-NEXT: [9] - JSAGU
	# CHECK-NEXT: [10] - JSTC			# CHECK-NEXT: [10] - JSTC
	# CHECK-NEXT: [11] - JVALU0			# CHECK-NEXT: [11] - JVALU0
	# CHECK-NEXT: [12] - JVALU1			# CHECK-NEXT: [12] - JVALU1
	# CHECK-NEXT: [13] - JVIMUL			# CHECK-NEXT: [13] - JVIMUL

	# CHECK: Resource pressure per iteration:			# CHECK: Resource pressure per iteration:
	# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13]			# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13]
	# CHECK-NEXT: - - - 2.00 2.00 3.99 4.01 4.00 - 4.00 4.00 - - -			# CHECK-NEXT: - - - - - - 4.00 4.00 - 4.00 4.00 - - -

	# CHECK: Resource pressure by instruction:			# CHECK: Resource pressure by instruction:
	# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] Instructions:			# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] Instructions:
	# CHECK-NEXT: - - - - 1.00 0.99 0.01 1.00 - - - - - - vmovaps (%rsi), %xmm0			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - vmovaps (%rsi), %xmm0
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, (%rdi)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, (%rdi)
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - vmovaps 16(%rsi), %xmm0			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - vmovaps 16(%rsi), %xmm0
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, 16(%rdi)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, 16(%rdi)
	# CHECK-NEXT: - - - - 1.00 1.00 - 1.00 - - - - - - vmovaps 32(%rsi), %xmm0			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - vmovaps 32(%rsi), %xmm0
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, 32(%rdi)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, 32(%rdi)
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - vmovaps 48(%rsi), %xmm0			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - vmovaps 48(%rsi), %xmm0
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, 48(%rdi)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, 48(%rdi)

	# CHECK: Timeline view:			# CHECK: Timeline view:
	# CHECK-NEXT: 0123456789			# CHECK-NEXT: 0123456789
	# CHECK-NEXT: Index 0123456789 0123456			# CHECK-NEXT: Index 0123456789 0123456

	# CHECK: [0,0] DeeeeeER . . . .. vmovaps (%rsi), %xmm0			# CHECK: [0,0] DeeeeeER . . . .. vmovaps (%rsi), %xmm0
	# CHECK-NEXT: [0,1] D=====eER . . . .. vmovaps %xmm0, (%rdi)			# CHECK-NEXT: [0,1] D=====eER . . . .. vmovaps %xmm0, (%rdi)
	Show All 23 Lines

test/tools/llvm-mca/X86/BtVer2/memcpy-like-test.s

	Show First 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: [9] - JSAGU			# CHECK-NEXT: [9] - JSAGU
	# CHECK-NEXT: [10] - JSTC			# CHECK-NEXT: [10] - JSTC
	# CHECK-NEXT: [11] - JVALU0			# CHECK-NEXT: [11] - JVALU0
	# CHECK-NEXT: [12] - JVALU1			# CHECK-NEXT: [12] - JVALU1
	# CHECK-NEXT: [13] - JVIMUL			# CHECK-NEXT: [13] - JVIMUL

	# CHECK: Resource pressure per iteration:			# CHECK: Resource pressure per iteration:
	# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13]			# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13]
	# CHECK-NEXT: - - - 2.00 2.00 3.97 4.03 4.00 - 4.00 4.00 - - -			# CHECK-NEXT: - - - - - - 4.00 4.00 - 4.00 4.00 - - -

	# CHECK: Resource pressure by instruction:			# CHECK: Resource pressure by instruction:
	# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] Instructions:			# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] Instructions:
	# CHECK-NEXT: - - - - 1.00 0.98 0.02 1.00 - - - - - - vmovaps (%rsi), %xmm0			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - vmovaps (%rsi), %xmm0
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, (%rdi)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, (%rdi)
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - vmovaps 16(%rsi), %xmm0			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - vmovaps 16(%rsi), %xmm0
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, 16(%rdi)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, 16(%rdi)
	# CHECK-NEXT: - - - - 1.00 0.99 0.01 1.00 - - - - - - vmovaps 32(%rsi), %xmm0			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - vmovaps 32(%rsi), %xmm0
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, 32(%rdi)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, 32(%rdi)
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - vmovaps 48(%rsi), %xmm0			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - vmovaps 48(%rsi), %xmm0
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, 48(%rdi)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, 48(%rdi)

	# CHECK: Timeline view:			# CHECK: Timeline view:
	# CHECK-NEXT: 01			# CHECK-NEXT: 01
	# CHECK-NEXT: Index 0123456789			# CHECK-NEXT: Index 0123456789

	# CHECK: [0,0] DeeeeeER .. vmovaps (%rsi), %xmm0			# CHECK: [0,0] DeeeeeER .. vmovaps (%rsi), %xmm0
	# CHECK-NEXT: [0,1] D=====eER .. vmovaps %xmm0, (%rdi)			# CHECK-NEXT: [0,1] D=====eER .. vmovaps %xmm0, (%rdi)
	Show All 23 Lines

test/tools/llvm-mca/X86/BtVer2/resources-avx1.s

	Show First 20 Lines • Show All 1,211 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: 1 9 1.00 * vhsubps (%rax), %xmm1, %xmm2			# CHECK-NEXT: 1 9 1.00 * vhsubps (%rax), %xmm1, %xmm2
	# CHECK-NEXT: 2 4 2.00 vhsubps %ymm0, %ymm1, %ymm2			# CHECK-NEXT: 2 4 2.00 vhsubps %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: 2 9 2.00 * vhsubps (%rax), %ymm1, %ymm2			# CHECK-NEXT: 2 9 2.00 * vhsubps (%rax), %ymm1, %ymm2
	# CHECK-NEXT: 2 1 1.00 vinsertf128 $1, %xmm0, %ymm1, %ymm2			# CHECK-NEXT: 2 1 1.00 vinsertf128 $1, %xmm0, %ymm1, %ymm2
	# CHECK-NEXT: 2 6 1.00 * vinsertf128 $1, (%rax), %ymm1, %ymm2			# CHECK-NEXT: 2 6 1.00 * vinsertf128 $1, (%rax), %ymm1, %ymm2
	# CHECK-NEXT: 1 1 0.50 vinsertps $1, %xmm0, %xmm1, %xmm2			# CHECK-NEXT: 1 1 0.50 vinsertps $1, %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: 1 6 1.00 * vinsertps $1, (%rax), %xmm1, %xmm2			# CHECK-NEXT: 1 6 1.00 * vinsertps $1, (%rax), %xmm1, %xmm2
	# CHECK-NEXT: 1 5 1.00 * vlddqu (%rax), %xmm2			# CHECK-NEXT: 1 5 1.00 * vlddqu (%rax), %xmm2
	# CHECK-NEXT: 1 5 1.00 * vlddqu (%rax), %ymm2			# CHECK-NEXT: 2 5 2.00 * vlddqu (%rax), %ymm2
	# CHECK-NEXT: 1 3 1.00 * U vldmxcsr (%rax)			# CHECK-NEXT: 1 3 1.00 * U vldmxcsr (%rax)
	# CHECK-NEXT: 63 34 21.00 * * U vmaskmovdqu %xmm0, %xmm1			# CHECK-NEXT: 63 34 21.00 * * U vmaskmovdqu %xmm0, %xmm1
	# CHECK-NEXT: 1 6 1.00 * vmaskmovpd (%rax), %xmm0, %xmm2			# CHECK-NEXT: 1 6 1.00 * vmaskmovpd (%rax), %xmm0, %xmm2
	# CHECK-NEXT: 2 6 2.00 * vmaskmovpd (%rax), %ymm0, %ymm2			# CHECK-NEXT: 2 6 2.00 * vmaskmovpd (%rax), %ymm0, %ymm2
	# CHECK-NEXT: 10 13 2.00 * * vmaskmovpd %xmm0, %xmm1, (%rax)			# CHECK-NEXT: 10 13 2.00 * * vmaskmovpd %xmm0, %xmm1, (%rax)
	# CHECK-NEXT: 18 16 4.00 * * vmaskmovpd %ymm0, %ymm1, (%rax)			# CHECK-NEXT: 18 16 4.00 * * vmaskmovpd %ymm0, %ymm1, (%rax)
	# CHECK-NEXT: 1 6 1.00 * vmaskmovps (%rax), %xmm0, %xmm2			# CHECK-NEXT: 1 6 1.00 * vmaskmovps (%rax), %xmm0, %xmm2
	# CHECK-NEXT: 2 6 2.00 * vmaskmovps (%rax), %ymm0, %ymm2			# CHECK-NEXT: 2 6 2.00 * vmaskmovps (%rax), %ymm0, %ymm2
	Show All 22 Lines
	# CHECK-NEXT: 1 2 1.00 vminsd %xmm0, %xmm1, %xmm2			# CHECK-NEXT: 1 2 1.00 vminsd %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: 1 7 1.00 * vminsd (%rax), %xmm1, %xmm2			# CHECK-NEXT: 1 7 1.00 * vminsd (%rax), %xmm1, %xmm2
	# CHECK-NEXT: 1 2 1.00 vminss %xmm0, %xmm1, %xmm2			# CHECK-NEXT: 1 2 1.00 vminss %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: 1 7 1.00 * vminss (%rax), %xmm1, %xmm2			# CHECK-NEXT: 1 7 1.00 * vminss (%rax), %xmm1, %xmm2
	# CHECK-NEXT: 1 1 0.50 vmovapd %xmm0, %xmm2			# CHECK-NEXT: 1 1 0.50 vmovapd %xmm0, %xmm2
	# CHECK-NEXT: 1 1 1.00 * vmovapd %xmm0, (%rax)			# CHECK-NEXT: 1 1 1.00 * vmovapd %xmm0, (%rax)
	# CHECK-NEXT: 1 5 1.00 * vmovapd (%rax), %xmm2			# CHECK-NEXT: 1 5 1.00 * vmovapd (%rax), %xmm2
	# CHECK-NEXT: 2 1 1.00 vmovapd %ymm0, %ymm2			# CHECK-NEXT: 2 1 1.00 vmovapd %ymm0, %ymm2
	# CHECK-NEXT: 1 1 1.00 * vmovapd %ymm0, (%rax)			# CHECK-NEXT: 2 1 2.00 * vmovapd %ymm0, (%rax)
	# CHECK-NEXT: 1 5 1.00 * vmovapd (%rax), %ymm2			# CHECK-NEXT: 2 5 2.00 * vmovapd (%rax), %ymm2
	# CHECK-NEXT: 1 1 0.50 vmovaps %xmm0, %xmm2			# CHECK-NEXT: 1 1 0.50 vmovaps %xmm0, %xmm2
	# CHECK-NEXT: 1 1 1.00 * vmovaps %xmm0, (%rax)			# CHECK-NEXT: 1 1 1.00 * vmovaps %xmm0, (%rax)
	# CHECK-NEXT: 1 5 1.00 * vmovaps (%rax), %xmm2			# CHECK-NEXT: 1 5 1.00 * vmovaps (%rax), %xmm2
	# CHECK-NEXT: 2 1 1.00 vmovaps %ymm0, %ymm2			# CHECK-NEXT: 2 1 1.00 vmovaps %ymm0, %ymm2
	# CHECK-NEXT: 1 1 1.00 * vmovaps %ymm0, (%rax)			# CHECK-NEXT: 2 1 2.00 * vmovaps %ymm0, (%rax)
	# CHECK-NEXT: 1 5 1.00 * vmovaps (%rax), %ymm2			# CHECK-NEXT: 2 5 2.00 * vmovaps (%rax), %ymm2
	# CHECK-NEXT: 2 8 0.50 vmovd %eax, %xmm2			# CHECK-NEXT: 2 8 0.50 vmovd %eax, %xmm2
	# CHECK-NEXT: 1 5 1.00 * vmovd (%rax), %xmm2			# CHECK-NEXT: 1 5 1.00 * vmovd (%rax), %xmm2
	# CHECK-NEXT: 1 4 1.00 vmovd %xmm0, %ecx			# CHECK-NEXT: 1 4 1.00 vmovd %xmm0, %ecx
	# CHECK-NEXT: 1 2 1.00 * vmovd %xmm0, (%rax)			# CHECK-NEXT: 1 2 1.00 * vmovd %xmm0, (%rax)
	# CHECK-NEXT: 1 1 0.50 vmovddup %xmm0, %xmm2			# CHECK-NEXT: 1 1 0.50 vmovddup %xmm0, %xmm2
	# CHECK-NEXT: 1 6 1.00 * vmovddup (%rax), %xmm2			# CHECK-NEXT: 1 6 1.00 * vmovddup (%rax), %xmm2
	# CHECK-NEXT: 2 1 1.00 vmovddup %ymm0, %ymm2			# CHECK-NEXT: 2 1 1.00 vmovddup %ymm0, %ymm2
	# CHECK-NEXT: 2 6 2.00 * vmovddup (%rax), %ymm2			# CHECK-NEXT: 2 6 2.00 * vmovddup (%rax), %ymm2
	# CHECK-NEXT: 1 1 0.50 vmovdqa %xmm0, %xmm2			# CHECK-NEXT: 1 1 0.50 vmovdqa %xmm0, %xmm2
	# CHECK-NEXT: 1 1 1.00 * vmovdqa %xmm0, (%rax)			# CHECK-NEXT: 1 1 1.00 * vmovdqa %xmm0, (%rax)
	# CHECK-NEXT: 1 5 1.00 * vmovdqa (%rax), %xmm2			# CHECK-NEXT: 1 5 1.00 * vmovdqa (%rax), %xmm2
	# CHECK-NEXT: 2 1 1.00 vmovdqa %ymm0, %ymm2			# CHECK-NEXT: 2 1 1.00 vmovdqa %ymm0, %ymm2
	# CHECK-NEXT: 1 1 1.00 * vmovdqa %ymm0, (%rax)			# CHECK-NEXT: 2 1 2.00 * vmovdqa %ymm0, (%rax)
	# CHECK-NEXT: 1 5 1.00 * vmovdqa (%rax), %ymm2			# CHECK-NEXT: 2 5 2.00 * vmovdqa (%rax), %ymm2
	# CHECK-NEXT: 1 1 0.50 vmovdqu %xmm0, %xmm2			# CHECK-NEXT: 1 1 0.50 vmovdqu %xmm0, %xmm2
	# CHECK-NEXT: 1 1 1.00 * vmovdqu %xmm0, (%rax)			# CHECK-NEXT: 1 1 1.00 * vmovdqu %xmm0, (%rax)
	# CHECK-NEXT: 1 5 1.00 * vmovdqu (%rax), %xmm2			# CHECK-NEXT: 1 5 1.00 * vmovdqu (%rax), %xmm2
	# CHECK-NEXT: 2 1 1.00 vmovdqu %ymm0, %ymm2			# CHECK-NEXT: 2 1 1.00 vmovdqu %ymm0, %ymm2
	# CHECK-NEXT: 1 1 1.00 * vmovdqu %ymm0, (%rax)			# CHECK-NEXT: 2 1 2.00 * vmovdqu %ymm0, (%rax)
	# CHECK-NEXT: 1 5 1.00 * vmovdqu (%rax), %ymm2			# CHECK-NEXT: 2 5 2.00 * vmovdqu (%rax), %ymm2
	# CHECK-NEXT: 1 1 0.50 vmovhlps %xmm0, %xmm1, %xmm2			# CHECK-NEXT: 1 1 0.50 vmovhlps %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: 1 1 0.50 vmovlhps %xmm0, %xmm1, %xmm2			# CHECK-NEXT: 1 1 0.50 vmovlhps %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: 1 2 1.00 * vmovhpd %xmm0, (%rax)			# CHECK-NEXT: 1 2 1.00 * vmovhpd %xmm0, (%rax)
	# CHECK-NEXT: 1 6 1.00 * vmovhpd (%rax), %xmm1, %xmm2			# CHECK-NEXT: 1 6 1.00 * vmovhpd (%rax), %xmm1, %xmm2
	# CHECK-NEXT: 1 2 1.00 * vmovhps %xmm0, (%rax)			# CHECK-NEXT: 1 2 1.00 * vmovhps %xmm0, (%rax)
	# CHECK-NEXT: 1 6 1.00 * vmovhps (%rax), %xmm1, %xmm2			# CHECK-NEXT: 1 6 1.00 * vmovhps (%rax), %xmm1, %xmm2
	# CHECK-NEXT: 1 2 1.00 * vmovlpd %xmm0, (%rax)			# CHECK-NEXT: 1 2 1.00 * vmovlpd %xmm0, (%rax)
	# CHECK-NEXT: 1 6 1.00 * vmovlpd (%rax), %xmm1, %xmm2			# CHECK-NEXT: 1 6 1.00 * vmovlpd (%rax), %xmm1, %xmm2
	Show All 29 Lines
	# CHECK-NEXT: 2 6 2.00 * vmovsldup (%rax), %ymm2			# CHECK-NEXT: 2 6 2.00 * vmovsldup (%rax), %ymm2
	# CHECK-NEXT: 1 1 0.50 vmovss %xmm0, %xmm1, %xmm2			# CHECK-NEXT: 1 1 0.50 vmovss %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: 1 2 1.00 * vmovss %xmm0, (%rax)			# CHECK-NEXT: 1 2 1.00 * vmovss %xmm0, (%rax)
	# CHECK-NEXT: 1 5 1.00 * vmovss (%rax), %xmm2			# CHECK-NEXT: 1 5 1.00 * vmovss (%rax), %xmm2
	# CHECK-NEXT: 1 1 0.50 vmovupd %xmm0, %xmm2			# CHECK-NEXT: 1 1 0.50 vmovupd %xmm0, %xmm2
	# CHECK-NEXT: 1 1 1.00 * vmovupd %xmm0, (%rax)			# CHECK-NEXT: 1 1 1.00 * vmovupd %xmm0, (%rax)
	# CHECK-NEXT: 1 5 1.00 * vmovupd (%rax), %xmm2			# CHECK-NEXT: 1 5 1.00 * vmovupd (%rax), %xmm2
	# CHECK-NEXT: 2 1 1.00 vmovupd %ymm0, %ymm2			# CHECK-NEXT: 2 1 1.00 vmovupd %ymm0, %ymm2
	# CHECK-NEXT: 1 1 1.00 * vmovupd %ymm0, (%rax)			# CHECK-NEXT: 2 1 2.00 * vmovupd %ymm0, (%rax)
	# CHECK-NEXT: 1 5 1.00 * vmovupd (%rax), %ymm2			# CHECK-NEXT: 2 5 2.00 * vmovupd (%rax), %ymm2
	# CHECK-NEXT: 1 1 0.50 vmovups %xmm0, %xmm2			# CHECK-NEXT: 1 1 0.50 vmovups %xmm0, %xmm2
	# CHECK-NEXT: 1 1 1.00 * vmovups %xmm0, (%rax)			# CHECK-NEXT: 1 1 1.00 * vmovups %xmm0, (%rax)
	# CHECK-NEXT: 1 5 1.00 * vmovups (%rax), %xmm2			# CHECK-NEXT: 1 5 1.00 * vmovups (%rax), %xmm2
	# CHECK-NEXT: 2 1 1.00 vmovups %ymm0, %ymm2			# CHECK-NEXT: 2 1 1.00 vmovups %ymm0, %ymm2
	# CHECK-NEXT: 1 1 1.00 * vmovups %ymm0, (%rax)			# CHECK-NEXT: 2 1 2.00 * vmovups %ymm0, (%rax)
	# CHECK-NEXT: 1 5 1.00 * vmovups (%rax), %ymm2			# CHECK-NEXT: 2 5 2.00 * vmovups (%rax), %ymm2
	# CHECK-NEXT: 3 3 2.00 vmpsadbw $1, %xmm0, %xmm1, %xmm2			# CHECK-NEXT: 3 3 2.00 vmpsadbw $1, %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: 3 8 2.00 * vmpsadbw $1, (%rax), %xmm1, %xmm2			# CHECK-NEXT: 3 8 2.00 * vmpsadbw $1, (%rax), %xmm1, %xmm2
	# CHECK-NEXT: 1 4 2.00 vmulpd %xmm0, %xmm1, %xmm2			# CHECK-NEXT: 1 4 2.00 vmulpd %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: 1 9 2.00 * vmulpd (%rax), %xmm1, %xmm2			# CHECK-NEXT: 1 9 2.00 * vmulpd (%rax), %xmm1, %xmm2
	# CHECK-NEXT: 2 4 4.00 vmulpd %ymm0, %ymm1, %ymm2			# CHECK-NEXT: 2 4 4.00 vmulpd %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: 2 9 4.00 * vmulpd (%rax), %ymm1, %ymm2			# CHECK-NEXT: 2 9 4.00 * vmulpd (%rax), %ymm1, %ymm2
	# CHECK-NEXT: 1 2 1.00 vmulps %xmm0, %xmm1, %xmm2			# CHECK-NEXT: 1 2 1.00 vmulps %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: 1 7 1.00 * vmulps (%rax), %xmm1, %xmm2			# CHECK-NEXT: 1 7 1.00 * vmulps (%rax), %xmm1, %xmm2
	▲ Show 20 Lines • Show All 387 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: [9] - JSAGU			# CHECK-NEXT: [9] - JSAGU
	# CHECK-NEXT: [10] - JSTC			# CHECK-NEXT: [10] - JSTC
	# CHECK-NEXT: [11] - JVALU0			# CHECK-NEXT: [11] - JVALU0
	# CHECK-NEXT: [12] - JVALU1			# CHECK-NEXT: [12] - JVALU1
	# CHECK-NEXT: [13] - JVIMUL			# CHECK-NEXT: [13] - JVIMUL

	# CHECK: Resource pressure per iteration:			# CHECK: Resource pressure per iteration:
	# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13]			# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13]
	# CHECK-NEXT: 86.00 30.00 - 362.00 907.00 449.50 480.50 414.00 - 78.00 154.00 135.50 159.50 38.00			# CHECK-NEXT: 86.00 30.00 - 358.00 903.00 442.50 479.50 421.00 - 84.00 160.00 132.50 156.50 38.00

	# CHECK: Resource pressure by instruction:			# CHECK: Resource pressure by instruction:
	# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] Instructions:			# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] Instructions:
	# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - vaddpd %xmm0, %xmm1, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - vaddpd %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - vaddpd (%rax), %xmm1, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - vaddpd (%rax), %xmm1, %xmm2
	# CHECK-NEXT: - - - 2.00 - 2.00 - - - - - - - - vaddpd %ymm0, %ymm1, %ymm2			# CHECK-NEXT: - - - 2.00 - 2.00 - - - - - - - - vaddpd %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: - - - 2.00 - 2.00 - 2.00 - - - - - - vaddpd (%rax), %ymm1, %ymm2			# CHECK-NEXT: - - - 2.00 - 2.00 - 2.00 - - - - - - vaddpd (%rax), %ymm1, %ymm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - vaddps %xmm0, %xmm1, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - vaddps %xmm0, %xmm1, %xmm2
	▲ Show 20 Lines • Show All 173 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - vhsubps %xmm0, %xmm1, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - vhsubps %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - vhsubps (%rax), %xmm1, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - vhsubps (%rax), %xmm1, %xmm2
	# CHECK-NEXT: - - - 2.00 - 2.00 - - - - - - - - vhsubps %ymm0, %ymm1, %ymm2			# CHECK-NEXT: - - - 2.00 - 2.00 - - - - - - - - vhsubps %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: - - - 2.00 - 2.00 - 2.00 - - - - - - vhsubps (%rax), %ymm1, %ymm2			# CHECK-NEXT: - - - 2.00 - 2.00 - 2.00 - - - - - - vhsubps (%rax), %ymm1, %ymm2
	# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 - - - - - - - vinsertf128 $1, %xmm0, %ymm1, %ymm2			# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 - - - - - - - vinsertf128 $1, %xmm0, %ymm1, %ymm2
	# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 1.00 - - - - - - vinsertf128 $1, (%rax), %ymm1, %ymm2			# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 1.00 - - - - - - vinsertf128 $1, (%rax), %ymm1, %ymm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - vinsertps $1, %xmm0, %xmm1, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - vinsertps $1, %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - vinsertps $1, (%rax), %xmm1, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - vinsertps $1, (%rax), %xmm1, %xmm2
	# CHECK-NEXT: - - - - - 0.50 0.50 1.00 - - - 0.50 0.50 - vlddqu (%rax), %xmm2			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - vlddqu (%rax), %xmm2
	# CHECK-NEXT: - - - - - 0.50 0.50 1.00 - - - 0.50 0.50 - vlddqu (%rax), %ymm2			# CHECK-NEXT: - - - - - - - 2.00 - - - - - - vlddqu (%rax), %ymm2
	# CHECK-NEXT: - - - - - - - 1.00 - - - - - - vldmxcsr (%rax)			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - vldmxcsr (%rax)
	# CHECK-NEXT: 21.00 21.00 - 1.00 - 1.00 2.00 2.00 - 16.00 2.00 - - - vmaskmovdqu %xmm0, %xmm1			# CHECK-NEXT: 21.00 21.00 - 1.00 - 1.00 2.00 2.00 - 16.00 2.00 - - - vmaskmovdqu %xmm0, %xmm1
	# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 1.00 - - - - - - vmaskmovpd (%rax), %xmm0, %xmm2			# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 1.00 - - - - - - vmaskmovpd (%rax), %xmm0, %xmm2
	# CHECK-NEXT: - - - 2.00 2.00 2.00 2.00 2.00 - - - - - - vmaskmovpd (%rax), %ymm0, %ymm2			# CHECK-NEXT: - - - 2.00 2.00 2.00 2.00 2.00 - - - - - - vmaskmovpd (%rax), %ymm0, %ymm2
	# CHECK-NEXT: 1.00 1.00 - 1.00 - 1.00 2.00 2.00 - 2.00 2.00 - - - vmaskmovpd %xmm0, %xmm1, (%rax)			# CHECK-NEXT: 1.00 1.00 - 1.00 - 1.00 2.00 2.00 - 2.00 2.00 - - - vmaskmovpd %xmm0, %xmm1, (%rax)
	# CHECK-NEXT: 2.00 2.00 - 1.00 - 1.00 4.00 4.00 - 4.00 4.00 - - - vmaskmovpd %ymm0, %ymm1, (%rax)			# CHECK-NEXT: 2.00 2.00 - 1.00 - 1.00 4.00 4.00 - 4.00 4.00 - - - vmaskmovpd %ymm0, %ymm1, (%rax)
	# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 1.00 - - - - - - vmaskmovps (%rax), %xmm0, %xmm2			# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 1.00 - - - - - - vmaskmovps (%rax), %xmm0, %xmm2
	# CHECK-NEXT: - - - 2.00 2.00 2.00 2.00 2.00 - - - - - - vmaskmovps (%rax), %ymm0, %ymm2			# CHECK-NEXT: - - - 2.00 2.00 2.00 2.00 2.00 - - - - - - vmaskmovps (%rax), %ymm0, %ymm2
	Show All 20 Lines
	# CHECK-NEXT: - - - 2.00 - 2.00 - - - - - - - - vminps %ymm0, %ymm1, %ymm2			# CHECK-NEXT: - - - 2.00 - 2.00 - - - - - - - - vminps %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: - - - 2.00 - 2.00 - 2.00 - - - - - - vminps (%rax), %ymm1, %ymm2			# CHECK-NEXT: - - - 2.00 - 2.00 - 2.00 - - - - - - vminps (%rax), %ymm1, %ymm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - vminsd %xmm0, %xmm1, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - vminsd %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - vminsd (%rax), %xmm1, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - vminsd (%rax), %xmm1, %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - vminss %xmm0, %xmm1, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - vminss %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - vminss (%rax), %xmm1, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - vminss (%rax), %xmm1, %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - vmovapd %xmm0, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - vmovapd %xmm0, %xmm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovapd %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovapd %xmm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - vmovapd (%rax), %xmm2			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - vmovapd (%rax), %xmm2
	# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 - - - - - - - vmovapd %ymm0, %ymm2			# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 - - - - - - - vmovapd %ymm0, %ymm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovapd %ymm0, (%rax)			# CHECK-NEXT: - - - - - - 2.00 - - 2.00 2.00 - - - vmovapd %ymm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - vmovapd (%rax), %ymm2			# CHECK-NEXT: - - - - - - - 2.00 - - - - - - vmovapd (%rax), %ymm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - vmovaps %xmm0, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - vmovaps %xmm0, %xmm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %xmm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - vmovaps (%rax), %xmm2			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - vmovaps (%rax), %xmm2
	# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 - - - - - - - vmovaps %ymm0, %ymm2			# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 - - - - - - - vmovaps %ymm0, %ymm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovaps %ymm0, (%rax)			# CHECK-NEXT: - - - - - - 2.00 - - 2.00 2.00 - - - vmovaps %ymm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - vmovaps (%rax), %ymm2			# CHECK-NEXT: - - - - - - - 2.00 - - - - - - vmovaps (%rax), %ymm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - vmovd %eax, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - vmovd %eax, %xmm2
	# CHECK-NEXT: - - - - - 0.50 0.50 1.00 - - - 0.50 0.50 - vmovd (%rax), %xmm2			# CHECK-NEXT: - - - - - 0.50 0.50 1.00 - - - 0.50 0.50 - vmovd (%rax), %xmm2
	# CHECK-NEXT: 1.00 - - 1.00 - 1.00 - - - - - - - - vmovd %xmm0, %ecx			# CHECK-NEXT: 1.00 - - 1.00 - 1.00 - - - - - - - - vmovd %xmm0, %ecx
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovd %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovd %xmm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - vmovddup %xmm0, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - vmovddup %xmm0, %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - vmovddup (%rax), %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - vmovddup (%rax), %xmm2
	# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 - - - - - - - vmovddup %ymm0, %ymm2			# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 - - - - - - - vmovddup %ymm0, %ymm2
	# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 2.00 - - - - - - vmovddup (%rax), %ymm2			# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 2.00 - - - - - - vmovddup (%rax), %ymm2
	# CHECK-NEXT: - - - - - 0.50 0.50 - - - - 0.50 0.50 - vmovdqa %xmm0, %xmm2			# CHECK-NEXT: - - - - - 0.50 0.50 - - - - 0.50 0.50 - vmovdqa %xmm0, %xmm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovdqa %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovdqa %xmm0, (%rax)
	# CHECK-NEXT: - - - - - 0.50 0.50 1.00 - - - 0.50 0.50 - vmovdqa (%rax), %xmm2			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - vmovdqa (%rax), %xmm2
	# CHECK-NEXT: - - - - - 1.00 1.00 - - - - 1.00 1.00 - vmovdqa %ymm0, %ymm2			# CHECK-NEXT: - - - - - 1.00 1.00 - - - - 1.00 1.00 - vmovdqa %ymm0, %ymm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovdqa %ymm0, (%rax)			# CHECK-NEXT: - - - - - - 2.00 - - 2.00 2.00 - - - vmovdqa %ymm0, (%rax)
	# CHECK-NEXT: - - - - - 0.50 0.50 1.00 - - - 0.50 0.50 - vmovdqa (%rax), %ymm2			# CHECK-NEXT: - - - - - - - 2.00 - - - - - - vmovdqa (%rax), %ymm2
	# CHECK-NEXT: - - - - - 0.50 0.50 - - - - 0.50 0.50 - vmovdqu %xmm0, %xmm2			# CHECK-NEXT: - - - - - 0.50 0.50 - - - - 0.50 0.50 - vmovdqu %xmm0, %xmm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovdqu %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovdqu %xmm0, (%rax)
	# CHECK-NEXT: - - - - - 0.50 0.50 1.00 - - - 0.50 0.50 - vmovdqu (%rax), %xmm2			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - vmovdqu (%rax), %xmm2
	# CHECK-NEXT: - - - - - 1.00 1.00 - - - - 1.00 1.00 - vmovdqu %ymm0, %ymm2			# CHECK-NEXT: - - - - - 1.00 1.00 - - - - 1.00 1.00 - vmovdqu %ymm0, %ymm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovdqu %ymm0, (%rax)			# CHECK-NEXT: - - - - - - 2.00 - - 2.00 2.00 - - - vmovdqu %ymm0, (%rax)
	# CHECK-NEXT: - - - - - 0.50 0.50 1.00 - - - 0.50 0.50 - vmovdqu (%rax), %ymm2			# CHECK-NEXT: - - - - - - - 2.00 - - - - - - vmovdqu (%rax), %ymm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - vmovhlps %xmm0, %xmm1, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - vmovhlps %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - vmovlhps %xmm0, %xmm1, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - vmovlhps %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovhpd %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovhpd %xmm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - vmovhpd (%rax), %xmm1, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - vmovhpd (%rax), %xmm1, %xmm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovhps %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovhps %xmm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - vmovhps (%rax), %xmm1, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - vmovhps (%rax), %xmm1, %xmm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovlpd %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovlpd %xmm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - vmovlpd (%rax), %xmm1, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - vmovlpd (%rax), %xmm1, %xmm2
	Show All 27 Lines
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - vmovsldup (%rax), %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - vmovsldup (%rax), %xmm2
	# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 - - - - - - - vmovsldup %ymm0, %ymm2			# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 - - - - - - - vmovsldup %ymm0, %ymm2
	# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 2.00 - - - - - - vmovsldup (%rax), %ymm2			# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 2.00 - - - - - - vmovsldup (%rax), %ymm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - vmovss %xmm0, %xmm1, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - vmovss %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovss %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovss %xmm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - vmovss (%rax), %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - vmovss (%rax), %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - vmovupd %xmm0, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - vmovupd %xmm0, %xmm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovupd %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovupd %xmm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - vmovupd (%rax), %xmm2			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - vmovupd (%rax), %xmm2
	# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 - - - - - - - vmovupd %ymm0, %ymm2			# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 - - - - - - - vmovupd %ymm0, %ymm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovupd %ymm0, (%rax)			# CHECK-NEXT: - - - - - - 2.00 - - 2.00 2.00 - - - vmovupd %ymm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - vmovupd (%rax), %ymm2			# CHECK-NEXT: - - - - - - - 2.00 - - - - - - vmovupd (%rax), %ymm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - vmovups %xmm0, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - vmovups %xmm0, %xmm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovups %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovups %xmm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - vmovups (%rax), %xmm2			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - vmovups (%rax), %xmm2
	# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 - - - - - - - vmovups %ymm0, %ymm2			# CHECK-NEXT: - - - 1.00 1.00 1.00 1.00 - - - - - - - vmovups %ymm0, %ymm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - vmovups %ymm0, (%rax)			# CHECK-NEXT: - - - - - - 2.00 - - 2.00 2.00 - - - vmovups %ymm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - vmovups (%rax), %ymm2			# CHECK-NEXT: - - - - - - - 2.00 - - - - - - vmovups (%rax), %ymm2
	# CHECK-NEXT: - - - - - 1.00 - - - - - - - 2.00 vmpsadbw $1, %xmm0, %xmm1, %xmm2			# CHECK-NEXT: - - - - - 1.00 - - - - - - - 2.00 vmpsadbw $1, %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: - - - - - 1.00 - 1.00 - - - - - 2.00 vmpsadbw $1, (%rax), %xmm1, %xmm2			# CHECK-NEXT: - - - - - 1.00 - 1.00 - - - - - 2.00 vmpsadbw $1, (%rax), %xmm1, %xmm2
	# CHECK-NEXT: - - - - 2.00 - 1.00 - - - - - - - vmulpd %xmm0, %xmm1, %xmm2			# CHECK-NEXT: - - - - 2.00 - 1.00 - - - - - - - vmulpd %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: - - - - 2.00 - 1.00 1.00 - - - - - - vmulpd (%rax), %xmm1, %xmm2			# CHECK-NEXT: - - - - 2.00 - 1.00 1.00 - - - - - - vmulpd (%rax), %xmm1, %xmm2
	# CHECK-NEXT: - - - - 4.00 - 2.00 - - - - - - - vmulpd %ymm0, %ymm1, %ymm2			# CHECK-NEXT: - - - - 4.00 - 2.00 - - - - - - - vmulpd %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: - - - - 4.00 - 2.00 2.00 - - - - - - vmulpd (%rax), %ymm1, %ymm2			# CHECK-NEXT: - - - - 4.00 - 2.00 2.00 - - - - - - vmulpd (%rax), %ymm1, %ymm2
	# CHECK-NEXT: - - - - 1.00 - 1.00 - - - - - - - vmulps %xmm0, %xmm1, %xmm2			# CHECK-NEXT: - - - - 1.00 - 1.00 - - - - - - - vmulps %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: - - - - 1.00 - 1.00 1.00 - - - - - - vmulps (%rax), %xmm1, %xmm2			# CHECK-NEXT: - - - - 1.00 - 1.00 1.00 - - - - - - vmulps (%rax), %xmm1, %xmm2
	▲ Show 20 Lines • Show All 376 Lines • Show Last 20 Lines

test/tools/llvm-mca/X86/BtVer2/resources-sse1.s

	Show First 20 Lines • Show All 331 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: [9] - JSAGU			# CHECK-NEXT: [9] - JSAGU
	# CHECK-NEXT: [10] - JSTC			# CHECK-NEXT: [10] - JSTC
	# CHECK-NEXT: [11] - JVALU0			# CHECK-NEXT: [11] - JVALU0
	# CHECK-NEXT: [12] - JVALU1			# CHECK-NEXT: [12] - JVALU1
	# CHECK-NEXT: [13] - JVIMUL			# CHECK-NEXT: [13] - JVIMUL

	# CHECK: Resource pressure per iteration:			# CHECK: Resource pressure per iteration:
	# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13]			# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13]
	# CHECK-NEXT: 15.00 - - 47.00 184.00 58.50 66.50 58.00 - 9.00 25.00 9.50 9.50 2.00			# CHECK-NEXT: 15.00 - - 46.00 183.00 57.50 65.50 58.00 - 9.00 25.00 9.50 9.50 2.00

	# CHECK: Resource pressure by instruction:			# CHECK: Resource pressure by instruction:
	# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] Instructions:			# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] Instructions:
	# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - addps %xmm0, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - addps %xmm0, %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - addps (%rax), %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - addps (%rax), %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - addss %xmm0, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - addss %xmm0, %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - addss (%rax), %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - addss (%rax), %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - andnps %xmm0, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - andnps %xmm0, %xmm2
	Show All 35 Lines
	# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - maxss %xmm0, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - maxss %xmm0, %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - maxss (%rax), %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - maxss (%rax), %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - minps %xmm0, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - minps %xmm0, %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - minps (%rax), %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - minps (%rax), %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - minss %xmm0, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - minss %xmm0, %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - minss (%rax), %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - minss (%rax), %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movaps %xmm0, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movaps %xmm0, %xmm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movaps %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movaps %xmm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - movaps (%rax), %xmm2			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - movaps (%rax), %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movhlps %xmm0, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movhlps %xmm0, %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movlhps %xmm0, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movlhps %xmm0, %xmm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movhps %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movhps %xmm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - movhps (%rax), %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - movhps (%rax), %xmm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movlps %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movlps %xmm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - movlps (%rax), %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - movlps (%rax), %xmm2
	# CHECK-NEXT: 1.00 - - 1.00 - 1.00 - - - - - - - - movmskps %xmm0, %ecx			# CHECK-NEXT: 1.00 - - 1.00 - 1.00 - - - - - - - - movmskps %xmm0, %ecx
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movntps %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movntps %xmm0, (%rax)
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movntq %mm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movntq %mm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movss %xmm0, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movss %xmm0, %xmm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movss %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movss %xmm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - movss (%rax), %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - movss (%rax), %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movups %xmm0, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movups %xmm0, %xmm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movups %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movups %xmm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - movups (%rax), %xmm2			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - movups (%rax), %xmm2
	# CHECK-NEXT: - - - - 1.00 - 1.00 - - - - - - - mulps %xmm0, %xmm2			# CHECK-NEXT: - - - - 1.00 - 1.00 - - - - - - - mulps %xmm0, %xmm2
	# CHECK-NEXT: - - - - 1.00 - 1.00 1.00 - - - - - - mulps (%rax), %xmm2			# CHECK-NEXT: - - - - 1.00 - 1.00 1.00 - - - - - - mulps (%rax), %xmm2
	# CHECK-NEXT: - - - - 1.00 - 1.00 - - - - - - - mulss %xmm0, %xmm2			# CHECK-NEXT: - - - - 1.00 - 1.00 - - - - - - - mulss %xmm0, %xmm2
	# CHECK-NEXT: - - - - 1.00 - 1.00 1.00 - - - - - - mulss (%rax), %xmm2			# CHECK-NEXT: - - - - 1.00 - 1.00 1.00 - - - - - - mulss (%rax), %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - orps %xmm0, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - orps %xmm0, %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - orps (%rax), %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - orps (%rax), %xmm2
	# CHECK-NEXT: - - - - - 0.50 0.50 - - - - 0.50 0.50 - pavgb %mm0, %mm2			# CHECK-NEXT: - - - - - 0.50 0.50 - - - - 0.50 0.50 - pavgb %mm0, %mm2
	# CHECK-NEXT: - - - - - 0.50 0.50 1.00 - - - 0.50 0.50 - pavgb (%rax), %mm2			# CHECK-NEXT: - - - - - 0.50 0.50 1.00 - - - 0.50 0.50 - pavgb (%rax), %mm2
	▲ Show 20 Lines • Show All 52 Lines • Show Last 20 Lines

test/tools/llvm-mca/X86/BtVer2/resources-sse2.s

	Show First 20 Lines • Show All 687 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: [9] - JSAGU			# CHECK-NEXT: [9] - JSAGU
	# CHECK-NEXT: [10] - JSTC			# CHECK-NEXT: [10] - JSTC
	# CHECK-NEXT: [11] - JVALU0			# CHECK-NEXT: [11] - JVALU0
	# CHECK-NEXT: [12] - JVALU1			# CHECK-NEXT: [12] - JVALU1
	# CHECK-NEXT: [13] - JVIMUL			# CHECK-NEXT: [13] - JVIMUL

	# CHECK: Resource pressure per iteration:			# CHECK: Resource pressure per iteration:
	# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13]			# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13]
	# CHECK-NEXT: 38.00 21.00 - 50.00 204.00 129.50 142.50 120.00 - 31.00 55.00 67.50 67.50 12.00			# CHECK-NEXT: 38.00 21.00 - 49.00 203.00 127.50 140.50 120.00 - 31.00 55.00 66.50 66.50 12.00

	# CHECK: Resource pressure by instruction:			# CHECK: Resource pressure by instruction:
	# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] Instructions:			# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] Instructions:
	# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - addpd %xmm0, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - addpd %xmm0, %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - addpd (%rax), %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - addpd (%rax), %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - addsd %xmm0, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - addsd %xmm0, %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - addsd (%rax), %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - addsd (%rax), %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - andnpd %xmm0, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - andnpd %xmm0, %xmm2
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - maxsd (%rax), %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - maxsd (%rax), %xmm2
	# CHECK-NEXT: - - - - - - - - - 1.00 - - - - mfence			# CHECK-NEXT: - - - - - - - - - 1.00 - - - - mfence
	# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - minpd %xmm0, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - minpd %xmm0, %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - minpd (%rax), %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - minpd (%rax), %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - minsd %xmm0, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - minsd %xmm0, %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - minsd (%rax), %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - minsd (%rax), %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movapd %xmm0, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movapd %xmm0, %xmm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movapd %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movapd %xmm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - movapd (%rax), %xmm2			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - movapd (%rax), %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movd %eax, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movd %eax, %xmm2
	# CHECK-NEXT: - - - - - 0.50 0.50 1.00 - - - 0.50 0.50 - movd (%rax), %xmm2			# CHECK-NEXT: - - - - - 0.50 0.50 1.00 - - - 0.50 0.50 - movd (%rax), %xmm2
	# CHECK-NEXT: 1.00 - - 1.00 - 1.00 - - - - - - - - movd %xmm0, %ecx			# CHECK-NEXT: 1.00 - - 1.00 - 1.00 - - - - - - - - movd %xmm0, %ecx
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movd %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movd %xmm0, (%rax)
	# CHECK-NEXT: - - - - - 0.50 0.50 - - - - 0.50 0.50 - movdqa %xmm0, %xmm2			# CHECK-NEXT: - - - - - 0.50 0.50 - - - - 0.50 0.50 - movdqa %xmm0, %xmm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movdqa %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movdqa %xmm0, (%rax)
	# CHECK-NEXT: - - - - - 0.50 0.50 1.00 - - - 0.50 0.50 - movdqa (%rax), %xmm2			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - movdqa (%rax), %xmm2
	# CHECK-NEXT: - - - - - 0.50 0.50 - - - - 0.50 0.50 - movdqu %xmm0, %xmm2			# CHECK-NEXT: - - - - - 0.50 0.50 - - - - 0.50 0.50 - movdqu %xmm0, %xmm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movdqu %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movdqu %xmm0, (%rax)
	# CHECK-NEXT: - - - - - 0.50 0.50 1.00 - - - 0.50 0.50 - movdqu (%rax), %xmm2			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - movdqu (%rax), %xmm2
	# CHECK-NEXT: - - - - - 0.50 0.50 - - - - 0.50 0.50 - movdq2q %xmm0, %mm2			# CHECK-NEXT: - - - - - 0.50 0.50 - - - - 0.50 0.50 - movdq2q %xmm0, %mm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movhpd %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movhpd %xmm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - movhpd (%rax), %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - movhpd (%rax), %xmm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movlpd %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movlpd %xmm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - movlpd (%rax), %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - movlpd (%rax), %xmm2
	# CHECK-NEXT: 1.00 - - 1.00 - 1.00 - - - - - - - - movmskpd %xmm0, %ecx			# CHECK-NEXT: 1.00 - - 1.00 - 1.00 - - - - - - - - movmskpd %xmm0, %ecx
	# CHECK-NEXT: - - - - - - - - - 1.00 - - - - movntil %eax, (%rax)			# CHECK-NEXT: - - - - - - - - - 1.00 - - - - movntil %eax, (%rax)
	# CHECK-NEXT: - - - - - - - - - 1.00 - - - - movntiq %rax, (%rax)			# CHECK-NEXT: - - - - - - - - - 1.00 - - - - movntiq %rax, (%rax)
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movntdq %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movntdq %xmm0, (%rax)
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movntpd %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movntpd %xmm0, (%rax)
	# CHECK-NEXT: - - - - - 0.50 0.50 - - - - 0.50 0.50 - movq %xmm0, %xmm2			# CHECK-NEXT: - - - - - 0.50 0.50 - - - - 0.50 0.50 - movq %xmm0, %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movq %rax, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movq %rax, %xmm2
	# CHECK-NEXT: - - - - - 0.50 0.50 1.00 - - - 0.50 0.50 - movq (%rax), %xmm2			# CHECK-NEXT: - - - - - 0.50 0.50 1.00 - - - 0.50 0.50 - movq (%rax), %xmm2
	# CHECK-NEXT: 1.00 - - 1.00 - 1.00 - - - - - - - - movq %xmm0, %rcx			# CHECK-NEXT: 1.00 - - 1.00 - 1.00 - - - - - - - - movq %xmm0, %rcx
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movq %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movq %xmm0, (%rax)
	# CHECK-NEXT: - - - - - 0.50 0.50 - - - - 0.50 0.50 - movq2dq %mm0, %xmm2			# CHECK-NEXT: - - - - - 0.50 0.50 - - - - 0.50 0.50 - movq2dq %mm0, %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movsd %xmm0, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movsd %xmm0, %xmm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movsd %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movsd %xmm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - movsd (%rax), %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - movsd (%rax), %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movupd %xmm0, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movupd %xmm0, %xmm2
	# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movupd %xmm0, (%rax)			# CHECK-NEXT: - - - - - - 1.00 - - 1.00 1.00 - - - movupd %xmm0, (%rax)
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - movupd (%rax), %xmm2			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - movupd (%rax), %xmm2
	# CHECK-NEXT: - - - - 2.00 - 1.00 - - - - - - - mulpd %xmm0, %xmm2			# CHECK-NEXT: - - - - 2.00 - 1.00 - - - - - - - mulpd %xmm0, %xmm2
	# CHECK-NEXT: - - - - 2.00 - 1.00 1.00 - - - - - - mulpd (%rax), %xmm2			# CHECK-NEXT: - - - - 2.00 - 1.00 1.00 - - - - - - mulpd (%rax), %xmm2
	# CHECK-NEXT: - - - - 2.00 - 1.00 - - - - - - - mulsd %xmm0, %xmm2			# CHECK-NEXT: - - - - 2.00 - 1.00 - - - - - - - mulsd %xmm0, %xmm2
	# CHECK-NEXT: - - - - 2.00 - 1.00 1.00 - - - - - - mulsd (%rax), %xmm2			# CHECK-NEXT: - - - - 2.00 - 1.00 1.00 - - - - - - mulsd (%rax), %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - orpd %xmm0, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - orpd %xmm0, %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - orpd (%rax), %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - orpd (%rax), %xmm2
	# CHECK-NEXT: - - - - - 0.50 0.50 - - - - 0.50 0.50 - packssdw %xmm0, %xmm2			# CHECK-NEXT: - - - - - 0.50 0.50 - - - - 0.50 0.50 - packssdw %xmm0, %xmm2
	# CHECK-NEXT: - - - - - 0.50 0.50 1.00 - - - 0.50 0.50 - packssdw (%rax), %xmm2			# CHECK-NEXT: - - - - - 0.50 0.50 1.00 - - - 0.50 0.50 - packssdw (%rax), %xmm2
	▲ Show 20 Lines • Show All 156 Lines • Show Last 20 Lines

test/tools/llvm-mca/X86/BtVer2/resources-sse3.s

	Show First 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: [9] - JSAGU			# CHECK-NEXT: [9] - JSAGU
	# CHECK-NEXT: [10] - JSTC			# CHECK-NEXT: [10] - JSTC
	# CHECK-NEXT: [11] - JVALU0			# CHECK-NEXT: [11] - JVALU0
	# CHECK-NEXT: [12] - JVALU1			# CHECK-NEXT: [12] - JVALU1
	# CHECK-NEXT: [13] - JVIMUL			# CHECK-NEXT: [13] - JVIMUL

	# CHECK: Resource pressure per iteration:			# CHECK: Resource pressure per iteration:
	# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13]			# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13]
	# CHECK-NEXT: 1.00 1.00 - 15.00 3.00 15.50 3.50 10.00 - - - 0.50 0.50 -			# CHECK-NEXT: 1.00 1.00 - 15.00 3.00 15.00 3.00 10.00 - - - - - -

	# CHECK: Resource pressure by instruction:			# CHECK: Resource pressure by instruction:
	# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] Instructions:			# CHECK-NEXT: [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] Instructions:
	# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - addsubpd %xmm0, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - addsubpd %xmm0, %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - addsubpd (%rax), %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - addsubpd (%rax), %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - addsubps %xmm0, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - addsubps %xmm0, %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - addsubps (%rax), %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - addsubps (%rax), %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - haddpd %xmm0, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - haddpd %xmm0, %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - haddpd (%rax), %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - haddpd (%rax), %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - haddps %xmm0, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - haddps %xmm0, %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - haddps (%rax), %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - haddps (%rax), %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - hsubpd %xmm0, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - hsubpd %xmm0, %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - hsubpd (%rax), %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - hsubpd (%rax), %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - hsubps %xmm0, %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - - - - - - - - hsubps %xmm0, %xmm2
	# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - hsubps (%rax), %xmm2			# CHECK-NEXT: - - - 1.00 - 1.00 - 1.00 - - - - - - hsubps (%rax), %xmm2
	# CHECK-NEXT: - - - - - 0.50 0.50 1.00 - - - 0.50 0.50 - lddqu (%rax), %xmm2			# CHECK-NEXT: - - - - - - - 1.00 - - - - - - lddqu (%rax), %xmm2
	# CHECK-NEXT: 0.50 0.50 - - - - - - - - - - - - monitor			# CHECK-NEXT: 0.50 0.50 - - - - - - - - - - - - monitor
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movddup %xmm0, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movddup %xmm0, %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - movddup (%rax), %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - movddup (%rax), %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movshdup %xmm0, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movshdup %xmm0, %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - movshdup (%rax), %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - movshdup (%rax), %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movsldup %xmm0, %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 - - - - - - - movsldup %xmm0, %xmm2
	# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - movsldup (%rax), %xmm2			# CHECK-NEXT: - - - 0.50 0.50 0.50 0.50 1.00 - - - - - - movsldup (%rax), %xmm2
	# CHECK-NEXT: 0.50 0.50 - - - - - - - - - - - - mwait			# CHECK-NEXT: 0.50 0.50 - - - - - - - - - - - - mwait

This is an archive of the discontinued LLVM Phabricator instance.

[X86][BtVer2] Improved latency and throughput of float/vector loads and stores.ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 224598

lib/Target/X86/X86ScheduleBtVer2.td

test/tools/llvm-mca/X86/BtVer2/bottleneck-hints-3.s

test/tools/llvm-mca/X86/BtVer2/load-store-alias.s

test/tools/llvm-mca/X86/BtVer2/memcpy-like-test.s

test/tools/llvm-mca/X86/BtVer2/resources-avx1.s

test/tools/llvm-mca/X86/BtVer2/resources-sse1.s

test/tools/llvm-mca/X86/BtVer2/resources-sse2.s

test/tools/llvm-mca/X86/BtVer2/resources-sse3.s

[X86][BtVer2] Improved latency and throughput of float/vector loads and stores.
ClosedPublic