This is an archive of the discontinued LLVM Phabricator instance.

[X86] Alter throughput for vpshufb/vpperm on bdver2 model to match AMD documentation (PR51539)
AbandonedPublic

Authored by RKSimon on Sep 25 2021, 9:05 AM.

Download Raw Diff

Details

Reviewers

lebedev.ri
GGanesh
andreadb

Summary

As reported on PR51539, codegen involving vpshufb/vpperm appears to report higher than likely throughput costs.

e.g. ctpop: https://c.godbolt.org/z/4hcaMqPzd

According to the AMDFam15h SoG, these are fastpath (tp = 1.0) but just on pipe1 (xbr). Agner + Instxlat agree that both the latency and throughput are faster than the model as well.

AMD (https://www.amd.com/system/files/TechDocs/47414_15h_sw_opt_guide.pdf)
Agner (https://agner.org/optimize/instruction_tables.pdf)
Instxlat (http://users.atw.hu/instlatx64/AuthenticAMD/AuthenticAMD0610F01_K15_Piledriver_InstLatX64.txt)

I think most other shuffles should probably be using xbr as well?

Diff Detail

Repository: rG LLVM Github Monorepo

Unit TestsFailed

	Time	Test
	90 ms	x64 debian > ORC-x86_64-linux.TestCases/Linux/x86-64::trivial-cxa-atexit.S
	110 ms	x64 debian > ORC-x86_64-linux.TestCases/Linux/x86-64::trivial-static-initializer.S
	80 ms	x64 debian > ORC-x86_64-linux.TestCases/Linux/x86-64::trivial-tls.S

Event Timeline

RKSimon created this revision.Sep 25 2021, 9:05 AM

Herald added a reviewer: andreadb. · View Herald TranscriptSep 25 2021, 9:05 AM

Herald added subscribers: pengfei, gbedwell, hiraditya. · View Herald Transcript

RKSimon requested review of this revision.Sep 25 2021, 9:05 AM

Herald added a project: Restricted Project. · View Herald TranscriptSep 25 2021, 9:05 AM

Harbormaster completed remote builds in B125706: Diff 375041.Sep 25 2021, 9:22 AM

ping?

@lebedev.ri Any thoughts?

In D110480#3058468, @RKSimon wrote:

@lebedev.ri Any thoughts?

Sorry, i've been meaning to verify this, but hasn't gotten around to it :/

ping @lebedev.ri ?

Herald added a project: Restricted Project. · View Herald TranscriptJun 14 2022, 8:28 AM

Herald added a subscriber: jsji. · View Herald Transcript

RKSimon abandoned this revision.Sep 6 2022, 9:02 AM

Revision Contents

Path

Size

llvm/

lib/

Target/

X86/

X86ScheduleBdVer2.td

14 lines

test/

tools/

llvm-mca/

X86/

BdVer2/

resources-avx1.s

8 lines

resources-ssse3.s

12 lines

resources-xop.s

14 lines

Diff 375041

llvm/lib/Target/X86/X86ScheduleBdVer2.td

	Show First 20 Lines • Show All 1,167 Lines • ▼ Show 20 Lines

	defm : PdWriteResXMMPair<WritePHMINPOS, [PdFPU0, PdFPMAL], 4, [], 2>;			defm : PdWriteResXMMPair<WritePHMINPOS, [PdFPU0, PdFPMAL], 4, [], 2>;

	defm : PdWriteResXMMPair<WriteShuffle, [PdFPU01, PdFPMAL], 2, [1, 2]>;			defm : PdWriteResXMMPair<WriteShuffle, [PdFPU01, PdFPMAL], 2, [1, 2]>;
	defm : PdWriteResXMMPair<WriteShuffleX, [PdFPU01, PdFPMAL], 2, [1, 2]>;			defm : PdWriteResXMMPair<WriteShuffleX, [PdFPU01, PdFPMAL], 2, [1, 2]>;
	defm : PdWriteResYMMPair<WriteShuffleY, [PdFPU01, PdFPMAL], 2, [1, 4]>;			defm : PdWriteResYMMPair<WriteShuffleY, [PdFPU01, PdFPMAL], 2, [1, 4]>;
	defm : X86WriteResPairUnsupported<WriteShuffleZ>;			defm : X86WriteResPairUnsupported<WriteShuffleZ>;

	defm : PdWriteResXMMPair<WriteVarShuffle, [PdFPU01, PdFPMAL], 3, [1, 2]>;			defm : PdWriteResXMMPair<WriteVarShuffle, [PdFPU1, PdFPXBR], 3, [1, 1]>;
	defm : PdWriteResXMMPair<WriteVarShuffleX, [PdFPU01, PdFPMAL], 3, [1, 3]>;			defm : PdWriteResXMMPair<WriteVarShuffleX, [PdFPU1, PdFPXBR], 3, [1, 1]>;
	defm : X86WriteResPairUnsupported<WriteVarShuffleY>;			defm : X86WriteResPairUnsupported<WriteVarShuffleY>;
	defm : X86WriteResPairUnsupported<WriteVarShuffleZ>;			defm : X86WriteResPairUnsupported<WriteVarShuffleZ>;

	def PdWriteVPPERM : SchedWriteRes<[PdFPU01, PdFPMAL]> {			def PdWriteVPPERM : SchedWriteRes<[PdFPU1, PdFPXBR]> {
	let Latency = 2;			let Latency = 2;
	let ResourceCycles = [1, 3];			let ResourceCycles = [1, 1];
	}			}
	def : InstRW<[PdWriteVPPERM], (instrs VPPERMrrr, VPPERMrrr_REV)>;			def : InstRW<[PdWriteVPPERM], (instrs VPPERMrrr, VPPERMrrr_REV)>;

				def PdWriteVPPERMLd : SchedWriteRes<[PdFPU1, PdFPXBR, PdLoad]> {
				let Latency = 7;
				let ResourceCycles = [1, 1, 3];
				}
				def : InstRW<[PdWriteVPPERMLd], (instrs VPPERMrrm, VPPERMrmr)>;

	defm : PdWriteResXMMPair<WriteBlend, [PdFPU01, PdFPMAL], 2>;			defm : PdWriteResXMMPair<WriteBlend, [PdFPU01, PdFPMAL], 2>;
	defm : X86WriteResPairUnsupported<WriteBlendY>;			defm : X86WriteResPairUnsupported<WriteBlendY>;
	defm : X86WriteResPairUnsupported<WriteBlendZ>;			defm : X86WriteResPairUnsupported<WriteBlendZ>;

	defm : PdWriteResXMMPair<WriteVarBlend, [PdFPU01, PdFPMAL], 2, [1, 2]>;			defm : PdWriteResXMMPair<WriteVarBlend, [PdFPU01, PdFPMAL], 2, [1, 2]>;
	defm : X86WriteResPairUnsupported<WriteVarBlendY>;			defm : X86WriteResPairUnsupported<WriteVarBlendY>;
	defm : X86WriteResPairUnsupported<WriteVarBlendZ>;			defm : X86WriteResPairUnsupported<WriteVarBlendZ>;

	▲ Show 20 Lines • Show All 275 Lines • Show Last 20 Lines

llvm/test/tools/llvm-mca/X86/BdVer2/resources-avx1.s

	Show First 20 Lines • Show All 1,542 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: 1 4 1.00 vpmullw %xmm0, %xmm1, %xmm2			# CHECK-NEXT: 1 4 1.00 vpmullw %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: 1 9 1.50 * vpmullw (%rax), %xmm1, %xmm2			# CHECK-NEXT: 1 9 1.50 * vpmullw (%rax), %xmm1, %xmm2
	# CHECK-NEXT: 1 4 1.00 vpmuludq %xmm0, %xmm1, %xmm2			# CHECK-NEXT: 1 4 1.00 vpmuludq %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: 1 9 1.50 * vpmuludq (%rax), %xmm1, %xmm2			# CHECK-NEXT: 1 9 1.50 * vpmuludq (%rax), %xmm1, %xmm2
	# CHECK-NEXT: 1 2 1.00 vpor %xmm0, %xmm1, %xmm2			# CHECK-NEXT: 1 2 1.00 vpor %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: 1 7 1.50 * vpor (%rax), %xmm1, %xmm2			# CHECK-NEXT: 1 7 1.50 * vpor (%rax), %xmm1, %xmm2
	# CHECK-NEXT: 2 4 1.00 vpsadbw %xmm0, %xmm1, %xmm2			# CHECK-NEXT: 2 4 1.00 vpsadbw %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: 2 9 1.50 * vpsadbw (%rax), %xmm1, %xmm2			# CHECK-NEXT: 2 9 1.50 * vpsadbw (%rax), %xmm1, %xmm2
	# CHECK-NEXT: 1 3 1.50 vpshufb %xmm0, %xmm1, %xmm2			# CHECK-NEXT: 1 3 1.00 vpshufb %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: 1 8 1.50 * vpshufb (%rax), %xmm1, %xmm2			# CHECK-NEXT: 1 8 1.50 * vpshufb (%rax), %xmm1, %xmm2
	# CHECK-NEXT: 1 2 1.00 vpshufd $1, %xmm0, %xmm2			# CHECK-NEXT: 1 2 1.00 vpshufd $1, %xmm0, %xmm2
	# CHECK-NEXT: 1 7 1.50 * vpshufd $1, (%rax), %xmm2			# CHECK-NEXT: 1 7 1.50 * vpshufd $1, (%rax), %xmm2
	# CHECK-NEXT: 1 2 1.00 vpshufhw $1, %xmm0, %xmm2			# CHECK-NEXT: 1 2 1.00 vpshufhw $1, %xmm0, %xmm2
	# CHECK-NEXT: 1 7 1.50 * vpshufhw $1, (%rax), %xmm2			# CHECK-NEXT: 1 7 1.50 * vpshufhw $1, (%rax), %xmm2
	# CHECK-NEXT: 1 2 1.00 vpshuflw $1, %xmm0, %xmm2			# CHECK-NEXT: 1 2 1.00 vpshuflw $1, %xmm0, %xmm2
	# CHECK-NEXT: 1 7 1.50 * vpshuflw $1, (%rax), %xmm2			# CHECK-NEXT: 1 7 1.50 * vpshuflw $1, (%rax), %xmm2
	# CHECK-NEXT: 1 2 1.00 vpsignb %xmm0, %xmm1, %xmm2			# CHECK-NEXT: 1 2 1.00 vpsignb %xmm0, %xmm1, %xmm2
	▲ Show 20 Lines • Show All 184 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: [15] - PdFPXBR			# CHECK-NEXT: [15] - PdFPXBR
	# CHECK-NEXT: [16.0] - PdLoad			# CHECK-NEXT: [16.0] - PdLoad
	# CHECK-NEXT: [16.1] - PdLoad			# CHECK-NEXT: [16.1] - PdLoad
	# CHECK-NEXT: [17] - PdMul			# CHECK-NEXT: [17] - PdMul
	# CHECK-NEXT: [18] - PdStore			# CHECK-NEXT: [18] - PdStore

	# CHECK: Resource pressure per iteration:			# CHECK: Resource pressure per iteration:
	# CHECK-NEXT: [0.0] [0.1] [1] [2] [3] [4] [5] [6] [7.0] [7.1] [8.0] [8.1] [9] [10] [11] [12] [13] [14] [15] [16.0] [16.1] [17] [18]			# CHECK-NEXT: [0.0] [0.1] [1] [2] [3] [4] [5] [6] [7.0] [7.1] [8.0] [8.1] [9] [10] [11] [12] [13] [14] [15] [16.0] [16.1] [17] [18]
	# CHECK-NEXT: 545.50 545.50 - - - 56.00 - 80.00 1126.50 1126.50 267.00 267.00 54.00 110.00 436.50 342.50 76.50 76.50 - 495.50 495.50 - 100.00			# CHECK-NEXT: 545.50 545.50 - - - 56.00 - 80.00 1126.50 1126.50 264.00 264.00 54.00 110.00 435.50 343.50 76.50 76.50 2.00 495.50 495.50 - 100.00

	# CHECK: Resource pressure by instruction:			# CHECK: Resource pressure by instruction:
	# CHECK-NEXT: [0.0] [0.1] [1] [2] [3] [4] [5] [6] [7.0] [7.1] [8.0] [8.1] [9] [10] [11] [12] [13] [14] [15] [16.0] [16.1] [17] [18] Instructions:			# CHECK-NEXT: [0.0] [0.1] [1] [2] [3] [4] [5] [6] [7.0] [7.1] [8.0] [8.1] [9] [10] [11] [12] [13] [14] [15] [16.0] [16.1] [17] [18] Instructions:
	# CHECK-NEXT: - - - - - - - - 0.50 0.50 - - - - 1.00 - - - - - - - - vaddpd %xmm0, %xmm1, %xmm2			# CHECK-NEXT: - - - - - - - - 0.50 0.50 - - - - 1.00 - - - - - - - - vaddpd %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - 0.50 0.50 - - - - 1.00 - - - - 1.50 1.50 - - vaddpd (%rax), %xmm1, %xmm2			# CHECK-NEXT: 1.50 1.50 - - - - - - 0.50 0.50 - - - - 1.00 - - - - 1.50 1.50 - - vaddpd (%rax), %xmm1, %xmm2
	# CHECK-NEXT: - - - - - - - - 1.00 1.00 - - - - 1.00 - - - - - - - - vaddpd %ymm0, %ymm1, %ymm2			# CHECK-NEXT: - - - - - - - - 1.00 1.00 - - - - 1.00 - - - - - - - - vaddpd %ymm0, %ymm1, %ymm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - 1.00 1.00 - - - - 1.00 - - - - 1.50 1.50 - - vaddpd (%rax), %ymm1, %ymm2			# CHECK-NEXT: 1.50 1.50 - - - - - - 1.00 1.00 - - - - 1.00 - - - - 1.50 1.50 - - vaddpd (%rax), %ymm1, %ymm2
	# CHECK-NEXT: - - - - - - - - 0.50 0.50 - - - - 1.00 - - - - - - - - vaddps %xmm0, %xmm1, %xmm2			# CHECK-NEXT: - - - - - - - - 0.50 0.50 - - - - 1.00 - - - - - - - - vaddps %xmm0, %xmm1, %xmm2
	▲ Show 20 Lines • Show All 505 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: - - - - - - - - - - - - 1.00 - 1.00 - - - - - - - - vpmullw %xmm0, %xmm1, %xmm2			# CHECK-NEXT: - - - - - - - - - - - - 1.00 - 1.00 - - - - - - - - vpmullw %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - 1.00 - 1.00 - - - - 1.50 1.50 - - vpmullw (%rax), %xmm1, %xmm2			# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - 1.00 - 1.00 - - - - 1.50 1.50 - - vpmullw (%rax), %xmm1, %xmm2
	# CHECK-NEXT: - - - - - - - - - - - - 1.00 - 1.00 - - - - - - - - vpmuludq %xmm0, %xmm1, %xmm2			# CHECK-NEXT: - - - - - - - - - - - - 1.00 - 1.00 - - - - - - - - vpmuludq %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - 1.00 - 1.00 - - - - 1.50 1.50 - - vpmuludq (%rax), %xmm1, %xmm2			# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - 1.00 - 1.00 - - - - 1.50 1.50 - - vpmuludq (%rax), %xmm1, %xmm2
	# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - vpor %xmm0, %xmm1, %xmm2			# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - vpor %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - vpor (%rax), %xmm1, %xmm2			# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - vpor (%rax), %xmm1, %xmm2
	# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - vpsadbw %xmm0, %xmm1, %xmm2			# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - vpsadbw %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - vpsadbw (%rax), %xmm1, %xmm2			# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - vpsadbw (%rax), %xmm1, %xmm2
	# CHECK-NEXT: - - - - - - - - - - 1.50 1.50 - - 0.50 0.50 - - - - - - - vpshufb %xmm0, %xmm1, %xmm2			# CHECK-NEXT: - - - - - - - - - - - - - - - 1.00 - - 1.00 - - - - vpshufb %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.50 1.50 - - 0.50 0.50 - - - 1.50 1.50 - - vpshufb (%rax), %xmm1, %xmm2			# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - - - - 1.00 - - 1.00 1.50 1.50 - - vpshufb (%rax), %xmm1, %xmm2
	# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - vpshufd $1, %xmm0, %xmm2			# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - vpshufd $1, %xmm0, %xmm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - vpshufd $1, (%rax), %xmm2			# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - vpshufd $1, (%rax), %xmm2
	# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - vpshufhw $1, %xmm0, %xmm2			# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - vpshufhw $1, %xmm0, %xmm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - vpshufhw $1, (%rax), %xmm2			# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - vpshufhw $1, (%rax), %xmm2
	# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - vpshuflw $1, %xmm0, %xmm2			# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - vpshuflw $1, %xmm0, %xmm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - vpshuflw $1, (%rax), %xmm2			# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - vpshuflw $1, (%rax), %xmm2
	# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - vpsignb %xmm0, %xmm1, %xmm2			# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - vpsignb %xmm0, %xmm1, %xmm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - vpsignb (%rax), %xmm1, %xmm2			# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - vpsignb (%rax), %xmm1, %xmm2
	▲ Show 20 Lines • Show All 163 Lines • Show Last 20 Lines

llvm/test/tools/llvm-mca/X86/BdVer2/resources-ssse3.s

	Show First 20 Lines • Show All 150 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: 1 4 1.00 pmaddubsw %xmm0, %xmm2			# CHECK-NEXT: 1 4 1.00 pmaddubsw %xmm0, %xmm2
	# CHECK-NEXT: 1 9 1.50 * pmaddubsw (%rax), %xmm2			# CHECK-NEXT: 1 9 1.50 * pmaddubsw (%rax), %xmm2
	# CHECK-NEXT: 1 4 1.00 pmulhrsw %mm0, %mm2			# CHECK-NEXT: 1 4 1.00 pmulhrsw %mm0, %mm2
	# CHECK-NEXT: 1 9 1.50 * pmulhrsw (%rax), %mm2			# CHECK-NEXT: 1 9 1.50 * pmulhrsw (%rax), %mm2
	# CHECK-NEXT: 1 4 1.00 pmulhrsw %xmm0, %xmm2			# CHECK-NEXT: 1 4 1.00 pmulhrsw %xmm0, %xmm2
	# CHECK-NEXT: 1 9 1.50 * pmulhrsw (%rax), %xmm2			# CHECK-NEXT: 1 9 1.50 * pmulhrsw (%rax), %xmm2
	# CHECK-NEXT: 1 3 1.00 pshufb %mm0, %mm2			# CHECK-NEXT: 1 3 1.00 pshufb %mm0, %mm2
	# CHECK-NEXT: 1 8 1.50 * pshufb (%rax), %mm2			# CHECK-NEXT: 1 8 1.50 * pshufb (%rax), %mm2
	# CHECK-NEXT: 1 3 1.50 pshufb %xmm0, %xmm2			# CHECK-NEXT: 1 3 1.00 pshufb %xmm0, %xmm2
	# CHECK-NEXT: 1 8 1.50 * pshufb (%rax), %xmm2			# CHECK-NEXT: 1 8 1.50 * pshufb (%rax), %xmm2
	# CHECK-NEXT: 1 2 0.50 psignb %mm0, %mm2			# CHECK-NEXT: 1 2 0.50 psignb %mm0, %mm2
	# CHECK-NEXT: 1 7 1.50 * psignb (%rax), %mm2			# CHECK-NEXT: 1 7 1.50 * psignb (%rax), %mm2
	# CHECK-NEXT: 1 2 1.00 psignb %xmm0, %xmm2			# CHECK-NEXT: 1 2 1.00 psignb %xmm0, %xmm2
	# CHECK-NEXT: 1 7 1.50 * psignb (%rax), %xmm2			# CHECK-NEXT: 1 7 1.50 * psignb (%rax), %xmm2
	# CHECK-NEXT: 1 2 0.50 psignd %mm0, %mm2			# CHECK-NEXT: 1 2 0.50 psignd %mm0, %mm2
	# CHECK-NEXT: 1 7 1.50 * psignd (%rax), %mm2			# CHECK-NEXT: 1 7 1.50 * psignd (%rax), %mm2
	# CHECK-NEXT: 1 2 1.00 psignd %xmm0, %xmm2			# CHECK-NEXT: 1 2 1.00 psignd %xmm0, %xmm2
	Show All 25 Lines
	# CHECK-NEXT: [15] - PdFPXBR			# CHECK-NEXT: [15] - PdFPXBR
	# CHECK-NEXT: [16.0] - PdLoad			# CHECK-NEXT: [16.0] - PdLoad
	# CHECK-NEXT: [16.1] - PdLoad			# CHECK-NEXT: [16.1] - PdLoad
	# CHECK-NEXT: [17] - PdMul			# CHECK-NEXT: [17] - PdMul
	# CHECK-NEXT: [18] - PdStore			# CHECK-NEXT: [18] - PdStore

	# CHECK: Resource pressure per iteration:			# CHECK: Resource pressure per iteration:
	# CHECK-NEXT: [0.0] [0.1] [1] [2] [3] [4] [5] [6] [7.0] [7.1] [8.0] [8.1] [9] [10] [11] [12] [13] [14] [15] [16.0] [16.1] [17] [18]			# CHECK-NEXT: [0.0] [0.1] [1] [2] [3] [4] [5] [6] [7.0] [7.1] [8.0] [8.1] [9] [10] [11] [12] [13] [14] [15] [16.0] [16.1] [17] [18]
	# CHECK-NEXT: 48.00 48.00 - - - - - - - - 75.00 75.00 8.00 - 36.00 28.00 - - - 48.00 48.00 - -			# CHECK-NEXT: 48.00 48.00 - - - - - - - - 70.00 70.00 8.00 - 34.00 30.00 - - 4.00 48.00 48.00 - -

	# CHECK: Resource pressure by instruction:			# CHECK: Resource pressure by instruction:
	# CHECK-NEXT: [0.0] [0.1] [1] [2] [3] [4] [5] [6] [7.0] [7.1] [8.0] [8.1] [9] [10] [11] [12] [13] [14] [15] [16.0] [16.1] [17] [18] Instructions:			# CHECK-NEXT: [0.0] [0.1] [1] [2] [3] [4] [5] [6] [7.0] [7.1] [8.0] [8.1] [9] [10] [11] [12] [13] [14] [15] [16.0] [16.1] [17] [18] Instructions:
	# CHECK-NEXT: - - - - - - - - - - 0.50 0.50 - - 0.50 0.50 - - - - - - - pabsb %mm0, %mm2			# CHECK-NEXT: - - - - - - - - - - 0.50 0.50 - - 0.50 0.50 - - - - - - - pabsb %mm0, %mm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 0.50 0.50 - - 0.50 0.50 - - - 1.50 1.50 - - pabsb (%rax), %mm2			# CHECK-NEXT: 1.50 1.50 - - - - - - - - 0.50 0.50 - - 0.50 0.50 - - - 1.50 1.50 - - pabsb (%rax), %mm2
	# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - pabsb %xmm0, %xmm2			# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - pabsb %xmm0, %xmm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - pabsb (%rax), %xmm2			# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - pabsb (%rax), %xmm2
	# CHECK-NEXT: - - - - - - - - - - 0.50 0.50 - - 0.50 0.50 - - - - - - - pabsd %mm0, %mm2			# CHECK-NEXT: - - - - - - - - - - 0.50 0.50 - - 0.50 0.50 - - - - - - - pabsd %mm0, %mm2
	Show All 35 Lines
	# CHECK-NEXT: - - - - - - - - - - - - 1.00 - 1.00 - - - - - - - - pmaddubsw %mm0, %mm2			# CHECK-NEXT: - - - - - - - - - - - - 1.00 - 1.00 - - - - - - - - pmaddubsw %mm0, %mm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - 1.00 - 1.00 - - - - 1.50 1.50 - - pmaddubsw (%rax), %mm2			# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - 1.00 - 1.00 - - - - 1.50 1.50 - - pmaddubsw (%rax), %mm2
	# CHECK-NEXT: - - - - - - - - - - - - 1.00 - 1.00 - - - - - - - - pmaddubsw %xmm0, %xmm2			# CHECK-NEXT: - - - - - - - - - - - - 1.00 - 1.00 - - - - - - - - pmaddubsw %xmm0, %xmm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - 1.00 - 1.00 - - - - 1.50 1.50 - - pmaddubsw (%rax), %xmm2			# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - 1.00 - 1.00 - - - - 1.50 1.50 - - pmaddubsw (%rax), %xmm2
	# CHECK-NEXT: - - - - - - - - - - - - 1.00 - 1.00 - - - - - - - - pmulhrsw %mm0, %mm2			# CHECK-NEXT: - - - - - - - - - - - - 1.00 - 1.00 - - - - - - - - pmulhrsw %mm0, %mm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - 1.00 - 1.00 - - - - 1.50 1.50 - - pmulhrsw (%rax), %mm2			# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - 1.00 - 1.00 - - - - 1.50 1.50 - - pmulhrsw (%rax), %mm2
	# CHECK-NEXT: - - - - - - - - - - - - 1.00 - 1.00 - - - - - - - - pmulhrsw %xmm0, %xmm2			# CHECK-NEXT: - - - - - - - - - - - - 1.00 - 1.00 - - - - - - - - pmulhrsw %xmm0, %xmm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - 1.00 - 1.00 - - - - 1.50 1.50 - - pmulhrsw (%rax), %xmm2			# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - 1.00 - 1.00 - - - - 1.50 1.50 - - pmulhrsw (%rax), %xmm2
	# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - pshufb %mm0, %mm2			# CHECK-NEXT: - - - - - - - - - - - - - - - 1.00 - - 1.00 - - - - pshufb %mm0, %mm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - pshufb (%rax), %mm2			# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - - - - 1.00 - - 1.00 1.50 1.50 - - pshufb (%rax), %mm2
	# CHECK-NEXT: - - - - - - - - - - 1.50 1.50 - - 0.50 0.50 - - - - - - - pshufb %xmm0, %xmm2			# CHECK-NEXT: - - - - - - - - - - - - - - - 1.00 - - 1.00 - - - - pshufb %xmm0, %xmm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.50 1.50 - - 0.50 0.50 - - - 1.50 1.50 - - pshufb (%rax), %xmm2			# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - - - - 1.00 - - 1.00 1.50 1.50 - - pshufb (%rax), %xmm2
	# CHECK-NEXT: - - - - - - - - - - 0.50 0.50 - - 0.50 0.50 - - - - - - - psignb %mm0, %mm2			# CHECK-NEXT: - - - - - - - - - - 0.50 0.50 - - 0.50 0.50 - - - - - - - psignb %mm0, %mm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 0.50 0.50 - - 0.50 0.50 - - - 1.50 1.50 - - psignb (%rax), %mm2			# CHECK-NEXT: 1.50 1.50 - - - - - - - - 0.50 0.50 - - 0.50 0.50 - - - 1.50 1.50 - - psignb (%rax), %mm2
	# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - psignb %xmm0, %xmm2			# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - psignb %xmm0, %xmm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - psignb (%rax), %xmm2			# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - psignb (%rax), %xmm2
	# CHECK-NEXT: - - - - - - - - - - 0.50 0.50 - - 0.50 0.50 - - - - - - - psignd %mm0, %mm2			# CHECK-NEXT: - - - - - - - - - - 0.50 0.50 - - 0.50 0.50 - - - - - - - psignd %mm0, %mm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 0.50 0.50 - - 0.50 0.50 - - - 1.50 1.50 - - psignd (%rax), %mm2			# CHECK-NEXT: 1.50 1.50 - - - - - - - - 0.50 0.50 - - 0.50 0.50 - - - 1.50 1.50 - - psignd (%rax), %mm2
	# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - psignd %xmm0, %xmm2			# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - psignd %xmm0, %xmm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - psignd (%rax), %xmm2			# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - psignd (%rax), %xmm2
	# CHECK-NEXT: - - - - - - - - - - 0.50 0.50 - - 0.50 0.50 - - - - - - - psignw %mm0, %mm2			# CHECK-NEXT: - - - - - - - - - - 0.50 0.50 - - 0.50 0.50 - - - - - - - psignw %mm0, %mm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 0.50 0.50 - - 0.50 0.50 - - - 1.50 1.50 - - psignw (%rax), %mm2			# CHECK-NEXT: 1.50 1.50 - - - - - - - - 0.50 0.50 - - 0.50 0.50 - - - 1.50 1.50 - - psignw (%rax), %mm2
	# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - psignw %xmm0, %xmm2			# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - psignw %xmm0, %xmm2
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - psignw (%rax), %xmm2			# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - psignw (%rax), %xmm2

llvm/test/tools/llvm-mca/X86/BdVer2/resources-xop.s

	Show First 20 Lines • Show All 315 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: 1 4 1.00 vpmacswd %xmm0, %xmm1, %xmm2, %xmm3			# CHECK-NEXT: 1 4 1.00 vpmacswd %xmm0, %xmm1, %xmm2, %xmm3
	# CHECK-NEXT: 1 9 1.50 * vpmacswd %xmm0, (%rax), %xmm1, %xmm3			# CHECK-NEXT: 1 9 1.50 * vpmacswd %xmm0, (%rax), %xmm1, %xmm3
	# CHECK-NEXT: 1 4 1.00 vpmacsww %xmm0, %xmm1, %xmm2, %xmm3			# CHECK-NEXT: 1 4 1.00 vpmacsww %xmm0, %xmm1, %xmm2, %xmm3
	# CHECK-NEXT: 1 9 1.50 * vpmacsww %xmm0, (%rax), %xmm1, %xmm3			# CHECK-NEXT: 1 9 1.50 * vpmacsww %xmm0, (%rax), %xmm1, %xmm3
	# CHECK-NEXT: 1 4 1.00 vpmadcsswd %xmm0, %xmm1, %xmm2, %xmm3			# CHECK-NEXT: 1 4 1.00 vpmadcsswd %xmm0, %xmm1, %xmm2, %xmm3
	# CHECK-NEXT: 1 9 1.50 * vpmadcsswd %xmm0, (%rax), %xmm1, %xmm3			# CHECK-NEXT: 1 9 1.50 * vpmadcsswd %xmm0, (%rax), %xmm1, %xmm3
	# CHECK-NEXT: 1 4 1.00 vpmadcswd %xmm0, %xmm1, %xmm2, %xmm3			# CHECK-NEXT: 1 4 1.00 vpmadcswd %xmm0, %xmm1, %xmm2, %xmm3
	# CHECK-NEXT: 1 9 1.50 * vpmadcswd %xmm0, (%rax), %xmm1, %xmm3			# CHECK-NEXT: 1 9 1.50 * vpmadcswd %xmm0, (%rax), %xmm1, %xmm3
	# CHECK-NEXT: 1 2 1.50 vpperm %xmm0, %xmm1, %xmm2, %xmm3			# CHECK-NEXT: 1 2 1.00 vpperm %xmm0, %xmm1, %xmm2, %xmm3
	# CHECK-NEXT: 1 8 1.50 * vpperm (%rax), %xmm0, %xmm1, %xmm3			# CHECK-NEXT: 1 7 1.50 * vpperm (%rax), %xmm0, %xmm1, %xmm3
	# CHECK-NEXT: 1 8 1.50 * vpperm %xmm0, (%rax), %xmm1, %xmm3			# CHECK-NEXT: 1 7 1.50 * vpperm %xmm0, (%rax), %xmm1, %xmm3
	# CHECK-NEXT: 1 3 1.00 vprotb %xmm0, %xmm1, %xmm3			# CHECK-NEXT: 1 3 1.00 vprotb %xmm0, %xmm1, %xmm3
	# CHECK-NEXT: 1 8 1.50 * vprotb (%rax), %xmm0, %xmm3			# CHECK-NEXT: 1 8 1.50 * vprotb (%rax), %xmm0, %xmm3
	# CHECK-NEXT: 1 8 1.50 * vprotb %xmm0, (%rax), %xmm3			# CHECK-NEXT: 1 8 1.50 * vprotb %xmm0, (%rax), %xmm3
	# CHECK-NEXT: 1 2 1.00 vprotb $0, %xmm0, %xmm3			# CHECK-NEXT: 1 2 1.00 vprotb $0, %xmm0, %xmm3
	# CHECK-NEXT: 1 7 1.50 * vprotb $0, (%rax), %xmm3			# CHECK-NEXT: 1 7 1.50 * vprotb $0, (%rax), %xmm3
	# CHECK-NEXT: 1 3 1.00 vprotd %xmm0, %xmm1, %xmm3			# CHECK-NEXT: 1 3 1.00 vprotd %xmm0, %xmm1, %xmm3
	# CHECK-NEXT: 1 8 1.50 * vprotd (%rax), %xmm0, %xmm3			# CHECK-NEXT: 1 8 1.50 * vprotd (%rax), %xmm0, %xmm3
	# CHECK-NEXT: 1 8 1.50 * vprotd %xmm0, (%rax), %xmm3			# CHECK-NEXT: 1 8 1.50 * vprotd %xmm0, (%rax), %xmm3
	▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: [15] - PdFPXBR			# CHECK-NEXT: [15] - PdFPXBR
	# CHECK-NEXT: [16.0] - PdLoad			# CHECK-NEXT: [16.0] - PdLoad
	# CHECK-NEXT: [16.1] - PdLoad			# CHECK-NEXT: [16.1] - PdLoad
	# CHECK-NEXT: [17] - PdMul			# CHECK-NEXT: [17] - PdMul
	# CHECK-NEXT: [18] - PdStore			# CHECK-NEXT: [18] - PdStore

	# CHECK: Resource pressure per iteration:			# CHECK: Resource pressure per iteration:
	# CHECK-NEXT: [0.0] [0.1] [1] [2] [3] [4] [5] [6] [7.0] [7.1] [8.0] [8.1] [9] [10] [11] [12] [13] [14] [15] [16.0] [16.1] [17] [18]			# CHECK-NEXT: [0.0] [0.1] [1] [2] [3] [4] [5] [6] [7.0] [7.1] [8.0] [8.1] [9] [10] [11] [12] [13] [14] [15] [16.0] [16.1] [17] [18]
	# CHECK-NEXT: 115.50 115.50 - - - - - - 18.00 18.00 109.50 109.50 32.00 12.00 94.50 108.50 - - - 115.50 115.50 - -			# CHECK-NEXT: 115.50 115.50 - - - - - - 18.00 18.00 105.00 105.00 32.00 12.00 93.00 110.00 - - 3.00 115.50 115.50 - -

	# CHECK: Resource pressure by instruction:			# CHECK: Resource pressure by instruction:
	# CHECK-NEXT: [0.0] [0.1] [1] [2] [3] [4] [5] [6] [7.0] [7.1] [8.0] [8.1] [9] [10] [11] [12] [13] [14] [15] [16.0] [16.1] [17] [18] Instructions:			# CHECK-NEXT: [0.0] [0.1] [1] [2] [3] [4] [5] [6] [7.0] [7.1] [8.0] [8.1] [9] [10] [11] [12] [13] [14] [15] [16.0] [16.1] [17] [18] Instructions:
	# CHECK-NEXT: - - - - - - - - - - - - - 1.00 - 2.00 - - - - - - - vfrczpd %xmm0, %xmm3			# CHECK-NEXT: - - - - - - - - - - - - - 1.00 - 2.00 - - - - - - - vfrczpd %xmm0, %xmm3
	# CHECK-NEXT: - - - - - - - - - - - - - 1.00 - 2.00 - - - - - - - vfrczpd (%rax), %xmm3			# CHECK-NEXT: - - - - - - - - - - - - - 1.00 - 2.00 - - - - - - - vfrczpd (%rax), %xmm3
	# CHECK-NEXT: - - - - - - - - - - - - - 1.00 - 3.00 - - - - - - - vfrczpd %ymm0, %ymm3			# CHECK-NEXT: - - - - - - - - - - - - - 1.00 - 3.00 - - - - - - - vfrczpd %ymm0, %ymm3
	# CHECK-NEXT: - - - - - - - - - - - - - 1.00 - 4.00 - - - - - - - vfrczpd (%rax), %ymm3			# CHECK-NEXT: - - - - - - - - - - - - - 1.00 - 4.00 - - - - - - - vfrczpd (%rax), %ymm3
	# CHECK-NEXT: - - - - - - - - - - - - - 1.00 - 2.00 - - - - - - - vfrczps %xmm0, %xmm3			# CHECK-NEXT: - - - - - - - - - - - - - 1.00 - 2.00 - - - - - - - vfrczps %xmm0, %xmm3
	▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
	# CHECK-NEXT: - - - - - - - - - - - - 1.00 - 1.00 - - - - - - - - vpmacswd %xmm0, %xmm1, %xmm2, %xmm3			# CHECK-NEXT: - - - - - - - - - - - - 1.00 - 1.00 - - - - - - - - vpmacswd %xmm0, %xmm1, %xmm2, %xmm3
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - 1.00 - 1.00 - - - - 1.50 1.50 - - vpmacswd %xmm0, (%rax), %xmm1, %xmm3			# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - 1.00 - 1.00 - - - - 1.50 1.50 - - vpmacswd %xmm0, (%rax), %xmm1, %xmm3
	# CHECK-NEXT: - - - - - - - - - - - - 1.00 - 1.00 - - - - - - - - vpmacsww %xmm0, %xmm1, %xmm2, %xmm3			# CHECK-NEXT: - - - - - - - - - - - - 1.00 - 1.00 - - - - - - - - vpmacsww %xmm0, %xmm1, %xmm2, %xmm3
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - 1.00 - 1.00 - - - - 1.50 1.50 - - vpmacsww %xmm0, (%rax), %xmm1, %xmm3			# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - 1.00 - 1.00 - - - - 1.50 1.50 - - vpmacsww %xmm0, (%rax), %xmm1, %xmm3
	# CHECK-NEXT: - - - - - - - - - - - - 1.00 - 1.00 - - - - - - - - vpmadcsswd %xmm0, %xmm1, %xmm2, %xmm3			# CHECK-NEXT: - - - - - - - - - - - - 1.00 - 1.00 - - - - - - - - vpmadcsswd %xmm0, %xmm1, %xmm2, %xmm3
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - 1.00 - 1.00 - - - - 1.50 1.50 - - vpmadcsswd %xmm0, (%rax), %xmm1, %xmm3			# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - 1.00 - 1.00 - - - - 1.50 1.50 - - vpmadcsswd %xmm0, (%rax), %xmm1, %xmm3
	# CHECK-NEXT: - - - - - - - - - - - - 1.00 - 1.00 - - - - - - - - vpmadcswd %xmm0, %xmm1, %xmm2, %xmm3			# CHECK-NEXT: - - - - - - - - - - - - 1.00 - 1.00 - - - - - - - - vpmadcswd %xmm0, %xmm1, %xmm2, %xmm3
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - 1.00 - 1.00 - - - - 1.50 1.50 - - vpmadcswd %xmm0, (%rax), %xmm1, %xmm3			# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - 1.00 - 1.00 - - - - 1.50 1.50 - - vpmadcswd %xmm0, (%rax), %xmm1, %xmm3
	# CHECK-NEXT: - - - - - - - - - - 1.50 1.50 - - 0.50 0.50 - - - - - - - vpperm %xmm0, %xmm1, %xmm2, %xmm3			# CHECK-NEXT: - - - - - - - - - - - - - - - 1.00 - - 1.00 - - - - vpperm %xmm0, %xmm1, %xmm2, %xmm3
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.50 1.50 - - 0.50 0.50 - - - 1.50 1.50 - - vpperm (%rax), %xmm0, %xmm1, %xmm3			# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - - - - 1.00 - - 1.00 1.50 1.50 - - vpperm (%rax), %xmm0, %xmm1, %xmm3
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.50 1.50 - - 0.50 0.50 - - - 1.50 1.50 - - vpperm %xmm0, (%rax), %xmm1, %xmm3			# CHECK-NEXT: 1.50 1.50 - - - - - - - - - - - - - 1.00 - - 1.00 1.50 1.50 - - vpperm %xmm0, (%rax), %xmm1, %xmm3
	# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - vprotb %xmm0, %xmm1, %xmm3			# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - vprotb %xmm0, %xmm1, %xmm3
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - vprotb (%rax), %xmm0, %xmm3			# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - vprotb (%rax), %xmm0, %xmm3
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - vprotb %xmm0, (%rax), %xmm3			# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - vprotb %xmm0, (%rax), %xmm3
	# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - vprotb $0, %xmm0, %xmm3			# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - vprotb $0, %xmm0, %xmm3
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - vprotb $0, (%rax), %xmm3			# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - vprotb $0, (%rax), %xmm3
	# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - vprotd %xmm0, %xmm1, %xmm3			# CHECK-NEXT: - - - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - - - - - vprotd %xmm0, %xmm1, %xmm3
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - vprotd (%rax), %xmm0, %xmm3			# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - vprotd (%rax), %xmm0, %xmm3
	# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - vprotd %xmm0, (%rax), %xmm3			# CHECK-NEXT: 1.50 1.50 - - - - - - - - 1.00 1.00 - - 0.50 0.50 - - - 1.50 1.50 - - vprotd %xmm0, (%rax), %xmm3
	Show All 36 Lines