This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Target/X86/
-
Target/
-
X86/
-
X86ISelLowering.cpp
-
X86InstrInfo.cpp
1/1
X86InstrShiftRotate.td
2/2
X86MCInstLower.cpp
-
test/CodeGen/X86/
-
CodeGen/
-
X86/
-
GlobalISel/
-
ashr-scalar.ll
-
lshr-scalar.ll
-
select-ashr-scalar.mir
-
select-lshr-scalar.mir
-
fast-isel-shift.ll
-
gpr-to-mask.ll
-
is_fpclass.ll

Differential D150107

[X86] Remove patterns for shift/rotate with immediate 1 and optimize during MC lowering
ClosedPublic

Authored by skan on May 8 2023, 3:18 AM.

Download Raw Diff

Details

Reviewers

andreadb
lebedev.ri
craig.topper
RKSimon
pengfei

Commits

rG77589e945f0d: [X86] Remove patterns for shift/rotate with immediate 1 and optimize during MC…

Summary

It's first suggested by @craig.topper in D150068. I think there are at least three pros

This can reduce the patterns during ISEL, as a result, reducing the bytes in X86GenDAGISel.inc
The patterns for shift/rotate with immediate 1 look quite similar to shift/rotate with immediate 8. So this can be seen as eliminating "duplicate" code.
Delay the optimization from imm8 to imm1, so that the previous optimization passes do not need to handle the version of imm1

It improves fast isel code and makes X86DomainReassignment work for shifts by 1, but regressed global isel, though no one should care.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

skan created this revision.May 8 2023, 3:18 AM

Herald added a reviewer: andreadb. · View Herald TranscriptMay 8 2023, 3:18 AM

Herald added a reviewer: lebedev.ri. · View Herald Transcript

Herald added a project: Restricted Project. · View Herald Transcript

Herald added subscribers: lebedev.ri, pengfei, gbedwell, hiraditya. · View Herald Transcript

skan requested review of this revision.May 8 2023, 3:18 AM

Herald added a project: Restricted Project. · View Herald TranscriptMay 8 2023, 3:18 AM

Herald added subscribers: llvm-commits, StephenFan. · View Herald Transcript

skan added reviewers: craig.topper, RKSimon, pengfei.May 8 2023, 3:21 AM

What is the motivation here?

Harbormaster completed remote builds in B230597: Diff 520315.May 8 2023, 4:07 AM

In D150107#4326328, @RKSimon wrote:

What is the motivation here?

It's first suggested by craig in D150068. I think there are at least three pros

This can reduce the patterns during ISEL, as a result, reducing the bytes in X86GenDAGISel.inc
The patterns for shift/rotate with immediate 1 look quite similar to shift/rotate with immediate 8. So this can be seen as eliminating "duplicate" code.
Delay the optimization from imm8 to imm1, so that the previous optimization passes do not need to handle the version of imm1

craig.topper added inline comments.May 8 2023, 5:12 PM

llvm/test/tools/llvm-mca/X86/AlderlakeP/resources-x86_64.s
1518 ↗	(On Diff #520315)	I think you need to `let mayLoad = 0`

craig.topper added inline comments.May 8 2023, 5:14 PM

llvm/test/tools/llvm-mca/X86/AlderlakeP/resources-x86_64.s
1518 ↗	(On Diff #520315)	Err nevermind

craig.topper added inline comments.May 8 2023, 5:19 PM

llvm/test/tools/llvm-mca/X86/AlderlakeP/resources-x86_64.s
1518 ↗	(On Diff #520315)	This should really be a different patch. This is an existing bug independent of whether removing the patterns gets approved.

In D150107#4326423, @skan wrote:

In D150107#4326328, @RKSimon wrote:

What is the motivation here?

It's first suggested by craig in D150068. I think there are at least three pros

This can reduce the patterns during ISEL, as a result, reducing the bytes in X86GenDAGISel.inc

The patterns for shift/rotate with immediate 1 look quite similar to shift/rotate with immediate 8. So this can be seen as eliminating "duplicate" code.

Delay the optimization from imm8 to imm1, so that the previous optimization passes do not need to handle the version of imm1

Yeah I thought since the code had been moved to a function it was easy to share it and get an isel table reduction.

Looks like it improved fast isel code and made X86DomainReassignment work for shifts by 1. But regressed global isel, though I guess no one should care.

In D150107#4328315, @craig.topper wrote:

In D150107#4326423, @skan wrote:

In D150107#4326328, @RKSimon wrote:

What is the motivation here?

It's first suggested by craig in D150068. I think there are at least three pros

This can reduce the patterns during ISEL, as a result, reducing the bytes in X86GenDAGISel.inc

The patterns for shift/rotate with immediate 1 look quite similar to shift/rotate with immediate 8. So this can be seen as eliminating "duplicate" code.

Delay the optimization from imm8 to imm1, so that the previous optimization passes do not need to handle the version of imm1

Yeah I thought since the code had been moved to a function it was easy to share it and get an isel table reduction.

Looks like it improved fast isel code and made X86DomainReassignment work for shifts by 1. But regressed global isel, though I guess no one should care.

Yes, and thank you for the illustration! The code generated by global isel is far from expected in this test, so I agree no one should care.

llvm/test/tools/llvm-mca/X86/AlderlakeP/resources-x86_64.s
1518 ↗	(On Diff #520315)	I thought so. But when I tried to remove the patterns only in the TD, these tests changed too. If I did not add `mayLoad =1, mayStore=1` explicitly for shift/rotate[m1], these instructions would show `mayLoad=0, mayStore=0, hasUnModeledSideEffect=1` in these tests. That's why I updated these bits. It's weird to me if I set `mayLoad=1` for m1 version but set `mayLoad=0` for mi version.

craig.topper added inline comments.May 8 2023, 8:05 PM

llvm/lib/Target/X86/X86InstrShiftRotate.td
365	I think this line is the one that affected the llvm-mca tests. You can go ahead and commit that and the the llvm-mca test changes.

Address review comments: commit unrelated change first rGc60461e3f815

skan retitled this revision from [X86] Remove patterns for shift/rotate with immediate 1 and update side effect to [X86] Remove patterns for shift/rotate with immediate 1 and optimize during MC lowering.May 9 2023, 12:01 AM

skan edited the summary of this revision. (Show Details)

Harbormaster completed remote builds in B230803: Diff 520604.May 9 2023, 12:32 AM

Remove more patterns

Harbormaster completed remote builds in B230818: Diff 520627.May 9 2023, 2:42 AM

craig.topper added inline comments.May 9 2023, 8:31 PM

llvm/lib/Target/X86/X86MCInstLower.cpp
508	Missing if?

Address review comments

llvm/lib/Target/X86/X86MCInstLower.cpp
508	Good catch! Done.

Harbormaster completed remote builds in B231021: Diff 520896.May 9 2023, 9:14 PM

craig.topper added inline comments.May 11 2023, 11:55 AM

llvm/lib/Target/X86/MCTargetDesc/X86EncodingOptimization.cpp
139 ↗	(On Diff #520896)	Why not check the opcode first?

Address review comments: check opcode first in optimizeRotateWithImmediate

Harbormaster completed remote builds in B231515: Diff 521538.May 11 2023, 9:00 PM

Friendly ping

craig.topper added inline comments.May 15 2023, 7:15 PM

llvm/lib/Target/X86/MCTargetDesc/X86EncodingOptimization.cpp
151 ↗	(On Diff #521538)	Are the flags the same? I don't think we ever use the flags from rotate, but since we're treating this like almost an assembler optimization we should probably know if we'll break any future flag usages.

skan marked an inline comment as done.May 16 2023, 7:09 AM

skan added inline comments.

llvm/lib/Target/X86/MCTargetDesc/X86EncodingOptimization.cpp
151 ↗	(On Diff #521538)	Are the flags the same? I don't think we ever use the flags from rotate, but since we're treating this like almost an assembler optimization we should probably know if we'll break any future flag usages. Good point! The SPEC says For ROL and ROR instructions, if the masked count is 0, the flags are not affected. If the masked count is 1, then the OF flag is affected, otherwise (masked count is greater than 1) the OF flag is undefined. So they have different impact on the flags. I will revert the related changes.

Revert incorrect change about ROL/ROR

LGTM

This revision is now accepted and ready to land.May 16 2023, 12:50 PM

Rebase

This revision was landed with ongoing or failed builds.May 17 2023, 4:55 AM

Closed by commit rG77589e945f0d: [X86] Remove patterns for shift/rotate with immediate 1 and optimize during MC… (authored by skan). · Explain Why

This revision was automatically updated to reflect the committed changes.

skan added a commit: rG77589e945f0d: [X86] Remove patterns for shift/rotate with immediate 1 and optimize during MC….

Harbormaster completed remote builds in B232576: Diff 523002.May 17 2023, 5:43 AM

skan mentioned this in rG2ef8ae134828: [X86] Remove patterns for ADC/SBB with immediate 8 and optimize during MC….May 18 2023, 7:34 PM

skan mentioned this in D150949: [X86] Remove patterns for ADD/AND/OR/SUB/XOR/CMP with immediate 8 and optimize during MC lowering, NFCI.May 19 2023, 2:54 AM

skan mentioned this in rG5586bc539acb: [X86] Remove patterns for ADD/AND/OR/SUB/XOR/CMP with immediate 8 and optimize….May 19 2023, 3:22 AM

skan mentioned this in rG2ef8ae134828: [X86] Remove patterns for ADC/SBB with immediate 8 and optimize during MC…

That caused assert in Chromium builds. See https://bugs.chromium.org/p/chromium/issues/detail?id=1446973#c2 for a reproducer.

In D150107#4356102, @hans wrote:

skan mentioned this in rG2ef8ae134828: [X86] Remove patterns for ADC/SBB with immediate 8 and optimize during MC…

That caused assert in Chromium builds. See https://bugs.chromium.org/p/chromium/issues/detail?id=1446973#c2 for a reproducer.

I'll revert while that's investigated.

hans mentioned this in rGcb16b33a03af: Revert "[X86] Remove patterns for ADC/SBB with immediate 8 and optimize during….May 19 2023, 5:43 AM

In D150107#4356140, @hans wrote:

In D150107#4356102, @hans wrote:

skan mentioned this in rG2ef8ae134828: [X86] Remove patterns for ADC/SBB with immediate 8 and optimize during MC…

That caused assert in Chromium builds. See https://bugs.chromium.org/p/chromium/issues/detail?id=1446973#c2 for a reproducer.

I'll revert while that's investigated.

@hans Thanks for the report! If you retested the reproducer before the revert, you would find it already passed after 5586bc539acb26cb94e461438de01a5080513401. So I reapplied the patch.

It failed before b/c the last operand of MCInst ADC/SBBri could be an expression instead of an immediate.

In D150107#4356347, @skan wrote:

In D150107#4356140, @hans wrote:

In D150107#4356102, @hans wrote:

skan mentioned this in rG2ef8ae134828: [X86] Remove patterns for ADC/SBB with immediate 8 and optimize during MC…

That caused assert in Chromium builds. See https://bugs.chromium.org/p/chromium/issues/detail?id=1446973#c2 for a reproducer.

I'll revert while that's investigated.

@hans Thanks for the report! If you retested the reproducer before the revert, you would find it already passed after 5586bc539acb26cb94e461438de01a5080513401. So I reapplied the patch.

It failed before b/c the last operand of MCInst ADC/SBBri could be an expression instead of an immediate.

Sorry about that. I didn't realize 5586bc539acb26cb94e461438de01a5080513401 was a bug fix, and I obviously failed to re-run the test at head.

Revision Contents

Path

Size

llvm/

lib/

Target/

X86/

X86ISelLowering.cpp

5 lines

X86InstrInfo.cpp

3 lines

X86InstrShiftRotate.td

152 lines

X86MCInstLower.cpp

3 lines

test/

CodeGen/

X86/

GlobalISel/

ashr-scalar.ll

3 lines

lshr-scalar.ll

3 lines

select-ashr-scalar.mir

152 lines

select-lshr-scalar.mir

151 lines

fast-isel-shift.ll

16 lines

gpr-to-mask.ll

14 lines

is_fpclass.ll

2 lines

Diff 523003

llvm/lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 37,699 Lines • ▼ Show 20 Lines	BuildMI(fixShadowMBB, DL, TII->get(ShrRIOpc), SspSecondShrReg)
.addImm(8);		.addImm(8);

// Jump if the result of the shift is zero.		// Jump if the result of the shift is zero.
BuildMI(fixShadowMBB, DL, TII->get(X86::JCC_1)).addMBB(sinkMBB).addImm(X86::COND_E);		BuildMI(fixShadowMBB, DL, TII->get(X86::JCC_1)).addMBB(sinkMBB).addImm(X86::COND_E);
fixShadowMBB->addSuccessor(sinkMBB);		fixShadowMBB->addSuccessor(sinkMBB);
fixShadowMBB->addSuccessor(fixShadowLoopPrepareMBB);		fixShadowMBB->addSuccessor(fixShadowLoopPrepareMBB);

// Do a single shift left.		// Do a single shift left.
unsigned ShlR1Opc = (PVT == MVT::i64) ? X86::SHL64r1 : X86::SHL32r1;		unsigned ShlR1Opc = (PVT == MVT::i64) ? X86::SHL64ri : X86::SHL32ri;
Register SspAfterShlReg = MRI.createVirtualRegister(PtrRC);		Register SspAfterShlReg = MRI.createVirtualRegister(PtrRC);
BuildMI(fixShadowLoopPrepareMBB, DL, TII->get(ShlR1Opc), SspAfterShlReg)		BuildMI(fixShadowLoopPrepareMBB, DL, TII->get(ShlR1Opc), SspAfterShlReg)
.addReg(SspSecondShrReg);		.addReg(SspSecondShrReg)
		.addImm(1);

// Save the value 128 to a register (will be used next with incssp).		// Save the value 128 to a register (will be used next with incssp).
Register Value128InReg = MRI.createVirtualRegister(PtrRC);		Register Value128InReg = MRI.createVirtualRegister(PtrRC);
unsigned MovRIOpc = (PVT == MVT::i64) ? X86::MOV64ri32 : X86::MOV32ri;		unsigned MovRIOpc = (PVT == MVT::i64) ? X86::MOV64ri32 : X86::MOV32ri;
BuildMI(fixShadowLoopPrepareMBB, DL, TII->get(MovRIOpc), Value128InReg)		BuildMI(fixShadowLoopPrepareMBB, DL, TII->get(MovRIOpc), Value128InReg)
.addImm(128);		.addImm(128);
fixShadowLoopPrepareMBB->addSuccessor(fixShadowLoopMBB);		fixShadowLoopPrepareMBB->addSuccessor(fixShadowLoopMBB);

▲ Show 20 Lines • Show All 21,683 Lines • Show Last 20 Lines

llvm/lib/Target/X86/X86InstrInfo.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 4,250 Lines • ▼ Show 20 Lines	inline static bool isDefConvertible(const MachineInstr &MI, bool &NoSignFlag,
case X86::ADC16rr: case X86::ADC8rr: case X86::ADC64rm:		case X86::ADC16rr: case X86::ADC8rr: case X86::ADC64rm:
case X86::ADC32rm: case X86::ADC16rm: case X86::ADC8rm:		case X86::ADC32rm: case X86::ADC16rm: case X86::ADC8rm:
case X86::SBB64ri32: case X86::SBB64ri8: case X86::SBB32ri:		case X86::SBB64ri32: case X86::SBB64ri8: case X86::SBB32ri:
case X86::SBB32ri8: case X86::SBB16ri: case X86::SBB16ri8:		case X86::SBB32ri8: case X86::SBB16ri: case X86::SBB16ri8:
case X86::SBB8ri: case X86::SBB64rr: case X86::SBB32rr:		case X86::SBB8ri: case X86::SBB64rr: case X86::SBB32rr:
case X86::SBB16rr: case X86::SBB8rr: case X86::SBB64rm:		case X86::SBB16rr: case X86::SBB8rr: case X86::SBB64rm:
case X86::SBB32rm: case X86::SBB16rm: case X86::SBB8rm:		case X86::SBB32rm: case X86::SBB16rm: case X86::SBB8rm:
case X86::NEG8r: case X86::NEG16r: case X86::NEG32r: case X86::NEG64r:		case X86::NEG8r: case X86::NEG16r: case X86::NEG32r: case X86::NEG64r:
case X86::SAR8r1: case X86::SAR16r1: case X86::SAR32r1:case X86::SAR64r1:
case X86::SHR8r1: case X86::SHR16r1: case X86::SHR32r1:case X86::SHR64r1:
case X86::SHL8r1: case X86::SHL16r1: case X86::SHL32r1:case X86::SHL64r1:
case X86::LZCNT16rr: case X86::LZCNT16rm:		case X86::LZCNT16rr: case X86::LZCNT16rm:
case X86::LZCNT32rr: case X86::LZCNT32rm:		case X86::LZCNT32rr: case X86::LZCNT32rm:
case X86::LZCNT64rr: case X86::LZCNT64rm:		case X86::LZCNT64rr: case X86::LZCNT64rm:
case X86::POPCNT16rr:case X86::POPCNT16rm:		case X86::POPCNT16rr:case X86::POPCNT16rm:
case X86::POPCNT32rr:case X86::POPCNT32rm:		case X86::POPCNT32rr:case X86::POPCNT32rm:
case X86::POPCNT64rr:case X86::POPCNT64rm:		case X86::POPCNT64rr:case X86::POPCNT64rm:
case X86::TZCNT16rr: case X86::TZCNT16rm:		case X86::TZCNT16rr: case X86::TZCNT16rm:
case X86::TZCNT32rr: case X86::TZCNT32rm:		case X86::TZCNT32rr: case X86::TZCNT32rm:
▲ Show 20 Lines • Show All 5,681 Lines • Show Last 20 Lines

llvm/lib/Target/X86/X86InstrShiftRotate.td

//===-- X86InstrShiftRotate.td - Shift and Rotate Instrs ---- tablegen --===//		//===-- X86InstrShiftRotate.td - Shift and Rotate Instrs ---- tablegen --===//
//		//
// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.		// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
// See https://llvm.org/LICENSE.txt for license information.		// See https://llvm.org/LICENSE.txt for license information.
// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception		// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
//		//
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
//		//
// This file describes the shift and rotate instructions.		// This file describes the shift and rotate instructions.
//		//
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

// FIXME: Someone needs to smear multipattern goodness all over this file.		// FIXME: Someone needs to smear multipattern goodness all over this file.

let Defs = [EFLAGS] in {		let Defs = [EFLAGS], hasSideEffects = 0 in {

let Constraints = "$src1 = $dst" in {		let Constraints = "$src1 = $dst" in {
let Uses = [CL], SchedRW = [WriteShiftCL] in {		let Uses = [CL], SchedRW = [WriteShiftCL] in {
def SHL8rCL : I<0xD2, MRM4r, (outs GR8 :$dst), (ins GR8 :$src1),		def SHL8rCL : I<0xD2, MRM4r, (outs GR8 :$dst), (ins GR8 :$src1),
"shl{b}\t{%cl, $dst\|$dst, cl}",		"shl{b}\t{%cl, $dst\|$dst, cl}",
[(set GR8:$dst, (shl GR8:$src1, CL))]>;		[(set GR8:$dst, (shl GR8:$src1, CL))]>;
def SHL16rCL : I<0xD3, MRM4r, (outs GR16:$dst), (ins GR16:$src1),		def SHL16rCL : I<0xD3, MRM4r, (outs GR16:$dst), (ins GR16:$src1),
"shl{w}\t{%cl, $dst\|$dst, cl}",		"shl{w}\t{%cl, $dst\|$dst, cl}",
Show All 21 Lines	def SHL32ri : Ii8<0xC1, MRM4r, (outs GR32:$dst), (ins GR32:$src1, u8imm:$src2),
[(set GR32:$dst, (shl GR32:$src1, (i8 imm:$src2)))]>,		[(set GR32:$dst, (shl GR32:$src1, (i8 imm:$src2)))]>,
OpSize32;		OpSize32;
def SHL64ri : RIi8<0xC1, MRM4r, (outs GR64:$dst),		def SHL64ri : RIi8<0xC1, MRM4r, (outs GR64:$dst),
(ins GR64:$src1, u8imm:$src2),		(ins GR64:$src1, u8imm:$src2),
"shl{q}\t{$src2, $dst\|$dst, $src2}",		"shl{q}\t{$src2, $dst\|$dst, $src2}",
[(set GR64:$dst, (shl GR64:$src1, (i8 imm:$src2)))]>;		[(set GR64:$dst, (shl GR64:$src1, (i8 imm:$src2)))]>;
} // isConvertibleToThreeAddress = 1		} // isConvertibleToThreeAddress = 1

// NOTE: We don't include patterns for shifts of a register by one, because
// 'add reg,reg' is cheaper (and we have a Pat pattern for shift-by-one).
let hasSideEffects = 0 in {
def SHL8r1 : I<0xD0, MRM4r, (outs GR8:$dst), (ins GR8:$src1),		def SHL8r1 : I<0xD0, MRM4r, (outs GR8:$dst), (ins GR8:$src1),
"shl{b}\t$dst", []>;		"shl{b}\t$dst", []>;
def SHL16r1 : I<0xD1, MRM4r, (outs GR16:$dst), (ins GR16:$src1),		def SHL16r1 : I<0xD1, MRM4r, (outs GR16:$dst), (ins GR16:$src1),
"shl{w}\t$dst", []>, OpSize16;		"shl{w}\t$dst", []>, OpSize16;
def SHL32r1 : I<0xD1, MRM4r, (outs GR32:$dst), (ins GR32:$src1),		def SHL32r1 : I<0xD1, MRM4r, (outs GR32:$dst), (ins GR32:$src1),
"shl{l}\t$dst", []>, OpSize32;		"shl{l}\t$dst", []>, OpSize32;
def SHL64r1 : RI<0xD1, MRM4r, (outs GR64:$dst), (ins GR64:$src1),		def SHL64r1 : RI<0xD1, MRM4r, (outs GR64:$dst), (ins GR64:$src1),
"shl{q}\t$dst", []>;		"shl{q}\t$dst", []>;
} // hasSideEffects = 0
} // SchedRW		} // SchedRW
} // Constraints = "$src = $dst"		} // Constraints = "$src = $dst"

// FIXME: Why do we need an explicit "Uses = [CL]" when the instr has a pattern		// FIXME: Why do we need an explicit "Uses = [CL]" when the instr has a pattern
// using CL?		// using CL?
let Uses = [CL], SchedRW = [WriteShiftCLLd, WriteRMW] in {		let Uses = [CL], SchedRW = [WriteShiftCLLd, WriteRMW] in {
def SHL8mCL : I<0xD2, MRM4m, (outs), (ins i8mem :$dst),		def SHL8mCL : I<0xD2, MRM4m, (outs), (ins i8mem :$dst),
"shl{b}\t{%cl, $dst\|$dst, cl}",		"shl{b}\t{%cl, $dst\|$dst, cl}",
[(store (shl (loadi8 addr:$dst), CL), addr:$dst)]>;		[(store (shl (loadi8 addr:$dst), CL), addr:$dst)]>;
def SHL16mCL : I<0xD3, MRM4m, (outs), (ins i16mem:$dst),		def SHL16mCL : I<0xD3, MRM4m, (outs), (ins i16mem:$dst),
"shl{w}\t{%cl, $dst\|$dst, cl}",		"shl{w}\t{%cl, $dst\|$dst, cl}",
[(store (shl (loadi16 addr:$dst), CL), addr:$dst)]>,		[(store (shl (loadi16 addr:$dst), CL), addr:$dst)]>,
OpSize16;		OpSize16;
def SHL32mCL : I<0xD3, MRM4m, (outs), (ins i32mem:$dst),		def SHL32mCL : I<0xD3, MRM4m, (outs), (ins i32mem:$dst),
"shl{l}\t{%cl, $dst\|$dst, cl}",		"shl{l}\t{%cl, $dst\|$dst, cl}",
[(store (shl (loadi32 addr:$dst), CL), addr:$dst)]>,		[(store (shl (loadi32 addr:$dst), CL), addr:$dst)]>,
OpSize32;		OpSize32;
def SHL64mCL : RI<0xD3, MRM4m, (outs), (ins i64mem:$dst),		def SHL64mCL : RI<0xD3, MRM4m, (outs), (ins i64mem:$dst),
"shl{q}\t{%cl, $dst\|$dst, cl}",		"shl{q}\t{%cl, $dst\|$dst, cl}",
[(store (shl (loadi64 addr:$dst), CL), addr:$dst)]>,		[(store (shl (loadi64 addr:$dst), CL), addr:$dst)]>,
Requires<[In64BitMode]>;		Requires<[In64BitMode]>;
} // Uses, SchedRW		} // Uses, SchedRW

let SchedRW = [WriteShiftLd, WriteRMW] in {		let SchedRW = [WriteShiftLd, WriteRMW], mayLoad = 1, mayStore = 1 in {
def SHL8mi : Ii8<0xC0, MRM4m, (outs), (ins i8mem :$dst, u8imm:$src),		def SHL8mi : Ii8<0xC0, MRM4m, (outs), (ins i8mem :$dst, u8imm:$src),
"shl{b}\t{$src, $dst\|$dst, $src}",		"shl{b}\t{$src, $dst\|$dst, $src}",
[(store (shl (loadi8 addr:$dst), (i8 imm:$src)), addr:$dst)]>;		[(store (shl (loadi8 addr:$dst), (i8 imm:$src)), addr:$dst)]>;
def SHL16mi : Ii8<0xC1, MRM4m, (outs), (ins i16mem:$dst, u8imm:$src),		def SHL16mi : Ii8<0xC1, MRM4m, (outs), (ins i16mem:$dst, u8imm:$src),
"shl{w}\t{$src, $dst\|$dst, $src}",		"shl{w}\t{$src, $dst\|$dst, $src}",
[(store (shl (loadi16 addr:$dst), (i8 imm:$src)), addr:$dst)]>,		[(store (shl (loadi16 addr:$dst), (i8 imm:$src)), addr:$dst)]>,
OpSize16;		OpSize16;
def SHL32mi : Ii8<0xC1, MRM4m, (outs), (ins i32mem:$dst, u8imm:$src),		def SHL32mi : Ii8<0xC1, MRM4m, (outs), (ins i32mem:$dst, u8imm:$src),
"shl{l}\t{$src, $dst\|$dst, $src}",		"shl{l}\t{$src, $dst\|$dst, $src}",
[(store (shl (loadi32 addr:$dst), (i8 imm:$src)), addr:$dst)]>,		[(store (shl (loadi32 addr:$dst), (i8 imm:$src)), addr:$dst)]>,
OpSize32;		OpSize32;
def SHL64mi : RIi8<0xC1, MRM4m, (outs), (ins i64mem:$dst, u8imm:$src),		def SHL64mi : RIi8<0xC1, MRM4m, (outs), (ins i64mem:$dst, u8imm:$src),
"shl{q}\t{$src, $dst\|$dst, $src}",		"shl{q}\t{$src, $dst\|$dst, $src}",
[(store (shl (loadi64 addr:$dst), (i8 imm:$src)), addr:$dst)]>,		[(store (shl (loadi64 addr:$dst), (i8 imm:$src)), addr:$dst)]>,
Requires<[In64BitMode]>;		Requires<[In64BitMode]>;

// Shift by 1		// Shift by 1
def SHL8m1 : I<0xD0, MRM4m, (outs), (ins i8mem :$dst),		def SHL8m1 : I<0xD0, MRM4m, (outs), (ins i8mem :$dst),
"shl{b}\t$dst",		"shl{b}\t$dst", []>;
[(store (shl (loadi8 addr:$dst), (i8 1)), addr:$dst)]>;
def SHL16m1 : I<0xD1, MRM4m, (outs), (ins i16mem:$dst),		def SHL16m1 : I<0xD1, MRM4m, (outs), (ins i16mem:$dst),
"shl{w}\t$dst",		"shl{w}\t$dst", []>, OpSize16;
[(store (shl (loadi16 addr:$dst), (i8 1)), addr:$dst)]>,
OpSize16;
def SHL32m1 : I<0xD1, MRM4m, (outs), (ins i32mem:$dst),		def SHL32m1 : I<0xD1, MRM4m, (outs), (ins i32mem:$dst),
"shl{l}\t$dst",		"shl{l}\t$dst", []>, OpSize32;
[(store (shl (loadi32 addr:$dst), (i8 1)), addr:$dst)]>,
OpSize32;
def SHL64m1 : RI<0xD1, MRM4m, (outs), (ins i64mem:$dst),		def SHL64m1 : RI<0xD1, MRM4m, (outs), (ins i64mem:$dst),
"shl{q}\t$dst",		"shl{q}\t$dst", []>, Requires<[In64BitMode]>;
[(store (shl (loadi64 addr:$dst), (i8 1)), addr:$dst)]>,		} // SchedRW, mayLoad, mayStore
Requires<[In64BitMode]>;
} // SchedRW

let Constraints = "$src1 = $dst" in {		let Constraints = "$src1 = $dst" in {
let Uses = [CL], SchedRW = [WriteShiftCL] in {		let Uses = [CL], SchedRW = [WriteShiftCL] in {
def SHR8rCL : I<0xD2, MRM5r, (outs GR8 :$dst), (ins GR8 :$src1),		def SHR8rCL : I<0xD2, MRM5r, (outs GR8 :$dst), (ins GR8 :$src1),
"shr{b}\t{%cl, $dst\|$dst, cl}",		"shr{b}\t{%cl, $dst\|$dst, cl}",
[(set GR8:$dst, (srl GR8:$src1, CL))]>;		[(set GR8:$dst, (srl GR8:$src1, CL))]>;
def SHR16rCL : I<0xD3, MRM5r, (outs GR16:$dst), (ins GR16:$src1),		def SHR16rCL : I<0xD3, MRM5r, (outs GR16:$dst), (ins GR16:$src1),
"shr{w}\t{%cl, $dst\|$dst, cl}",		"shr{w}\t{%cl, $dst\|$dst, cl}",
Show All 19 Lines	def SHR32ri : Ii8<0xC1, MRM5r, (outs GR32:$dst), (ins GR32:$src1, u8imm:$src2),
[(set GR32:$dst, (srl GR32:$src1, (i8 imm:$src2)))]>,		[(set GR32:$dst, (srl GR32:$src1, (i8 imm:$src2)))]>,
OpSize32;		OpSize32;
def SHR64ri : RIi8<0xC1, MRM5r, (outs GR64:$dst), (ins GR64:$src1, u8imm:$src2),		def SHR64ri : RIi8<0xC1, MRM5r, (outs GR64:$dst), (ins GR64:$src1, u8imm:$src2),
"shr{q}\t{$src2, $dst\|$dst, $src2}",		"shr{q}\t{$src2, $dst\|$dst, $src2}",
[(set GR64:$dst, (srl GR64:$src1, (i8 imm:$src2)))]>;		[(set GR64:$dst, (srl GR64:$src1, (i8 imm:$src2)))]>;

// Shift right by 1		// Shift right by 1
def SHR8r1 : I<0xD0, MRM5r, (outs GR8:$dst), (ins GR8:$src1),		def SHR8r1 : I<0xD0, MRM5r, (outs GR8:$dst), (ins GR8:$src1),
"shr{b}\t$dst",		"shr{b}\t$dst", []>;
[(set GR8:$dst, (srl GR8:$src1, (i8 1)))]>;
def SHR16r1 : I<0xD1, MRM5r, (outs GR16:$dst), (ins GR16:$src1),		def SHR16r1 : I<0xD1, MRM5r, (outs GR16:$dst), (ins GR16:$src1),
"shr{w}\t$dst",		"shr{w}\t$dst", []>, OpSize16;
[(set GR16:$dst, (srl GR16:$src1, (i8 1)))]>, OpSize16;
def SHR32r1 : I<0xD1, MRM5r, (outs GR32:$dst), (ins GR32:$src1),		def SHR32r1 : I<0xD1, MRM5r, (outs GR32:$dst), (ins GR32:$src1),
"shr{l}\t$dst",		"shr{l}\t$dst", []>, OpSize32;
[(set GR32:$dst, (srl GR32:$src1, (i8 1)))]>, OpSize32;
def SHR64r1 : RI<0xD1, MRM5r, (outs GR64:$dst), (ins GR64:$src1),		def SHR64r1 : RI<0xD1, MRM5r, (outs GR64:$dst), (ins GR64:$src1),
"shr{q}\t$dst",		"shr{q}\t$dst", []>;
[(set GR64:$dst, (srl GR64:$src1, (i8 1)))]>;
} // SchedRW		} // SchedRW
} // Constraints = "$src = $dst"		} // Constraints = "$src = $dst"


let Uses = [CL], SchedRW = [WriteShiftCLLd, WriteRMW] in {		let Uses = [CL], SchedRW = [WriteShiftCLLd, WriteRMW] in {
def SHR8mCL : I<0xD2, MRM5m, (outs), (ins i8mem :$dst),		def SHR8mCL : I<0xD2, MRM5m, (outs), (ins i8mem :$dst),
"shr{b}\t{%cl, $dst\|$dst, cl}",		"shr{b}\t{%cl, $dst\|$dst, cl}",
[(store (srl (loadi8 addr:$dst), CL), addr:$dst)]>;		[(store (srl (loadi8 addr:$dst), CL), addr:$dst)]>;
def SHR16mCL : I<0xD3, MRM5m, (outs), (ins i16mem:$dst),		def SHR16mCL : I<0xD3, MRM5m, (outs), (ins i16mem:$dst),
"shr{w}\t{%cl, $dst\|$dst, cl}",		"shr{w}\t{%cl, $dst\|$dst, cl}",
[(store (srl (loadi16 addr:$dst), CL), addr:$dst)]>,		[(store (srl (loadi16 addr:$dst), CL), addr:$dst)]>,
OpSize16;		OpSize16;
def SHR32mCL : I<0xD3, MRM5m, (outs), (ins i32mem:$dst),		def SHR32mCL : I<0xD3, MRM5m, (outs), (ins i32mem:$dst),
"shr{l}\t{%cl, $dst\|$dst, cl}",		"shr{l}\t{%cl, $dst\|$dst, cl}",
[(store (srl (loadi32 addr:$dst), CL), addr:$dst)]>,		[(store (srl (loadi32 addr:$dst), CL), addr:$dst)]>,
OpSize32;		OpSize32;
def SHR64mCL : RI<0xD3, MRM5m, (outs), (ins i64mem:$dst),		def SHR64mCL : RI<0xD3, MRM5m, (outs), (ins i64mem:$dst),
"shr{q}\t{%cl, $dst\|$dst, cl}",		"shr{q}\t{%cl, $dst\|$dst, cl}",
[(store (srl (loadi64 addr:$dst), CL), addr:$dst)]>,		[(store (srl (loadi64 addr:$dst), CL), addr:$dst)]>,
Requires<[In64BitMode]>;		Requires<[In64BitMode]>;
} // Uses, SchedRW		} // Uses, SchedRW

let SchedRW = [WriteShiftLd, WriteRMW] in {		let SchedRW = [WriteShiftLd, WriteRMW], mayLoad = 1, mayStore = 1 in {
def SHR8mi : Ii8<0xC0, MRM5m, (outs), (ins i8mem :$dst, u8imm:$src),		def SHR8mi : Ii8<0xC0, MRM5m, (outs), (ins i8mem :$dst, u8imm:$src),
"shr{b}\t{$src, $dst\|$dst, $src}",		"shr{b}\t{$src, $dst\|$dst, $src}",
[(store (srl (loadi8 addr:$dst), (i8 imm:$src)), addr:$dst)]>;		[(store (srl (loadi8 addr:$dst), (i8 imm:$src)), addr:$dst)]>;
def SHR16mi : Ii8<0xC1, MRM5m, (outs), (ins i16mem:$dst, u8imm:$src),		def SHR16mi : Ii8<0xC1, MRM5m, (outs), (ins i16mem:$dst, u8imm:$src),
"shr{w}\t{$src, $dst\|$dst, $src}",		"shr{w}\t{$src, $dst\|$dst, $src}",
[(store (srl (loadi16 addr:$dst), (i8 imm:$src)), addr:$dst)]>,		[(store (srl (loadi16 addr:$dst), (i8 imm:$src)), addr:$dst)]>,
OpSize16;		OpSize16;
def SHR32mi : Ii8<0xC1, MRM5m, (outs), (ins i32mem:$dst, u8imm:$src),		def SHR32mi : Ii8<0xC1, MRM5m, (outs), (ins i32mem:$dst, u8imm:$src),
"shr{l}\t{$src, $dst\|$dst, $src}",		"shr{l}\t{$src, $dst\|$dst, $src}",
[(store (srl (loadi32 addr:$dst), (i8 imm:$src)), addr:$dst)]>,		[(store (srl (loadi32 addr:$dst), (i8 imm:$src)), addr:$dst)]>,
OpSize32;		OpSize32;
def SHR64mi : RIi8<0xC1, MRM5m, (outs), (ins i64mem:$dst, u8imm:$src),		def SHR64mi : RIi8<0xC1, MRM5m, (outs), (ins i64mem:$dst, u8imm:$src),
"shr{q}\t{$src, $dst\|$dst, $src}",		"shr{q}\t{$src, $dst\|$dst, $src}",
[(store (srl (loadi64 addr:$dst), (i8 imm:$src)), addr:$dst)]>,		[(store (srl (loadi64 addr:$dst), (i8 imm:$src)), addr:$dst)]>,
Requires<[In64BitMode]>;		Requires<[In64BitMode]>;

// Shift by 1		// Shift by 1
def SHR8m1 : I<0xD0, MRM5m, (outs), (ins i8mem :$dst),		def SHR8m1 : I<0xD0, MRM5m, (outs), (ins i8mem :$dst),
"shr{b}\t$dst",		"shr{b}\t$dst", []>;
[(store (srl (loadi8 addr:$dst), (i8 1)), addr:$dst)]>;
def SHR16m1 : I<0xD1, MRM5m, (outs), (ins i16mem:$dst),		def SHR16m1 : I<0xD1, MRM5m, (outs), (ins i16mem:$dst),
"shr{w}\t$dst",		"shr{w}\t$dst", []>, OpSize16;
[(store (srl (loadi16 addr:$dst), (i8 1)), addr:$dst)]>,
OpSize16;
def SHR32m1 : I<0xD1, MRM5m, (outs), (ins i32mem:$dst),		def SHR32m1 : I<0xD1, MRM5m, (outs), (ins i32mem:$dst),
"shr{l}\t$dst",		"shr{l}\t$dst", []>, OpSize32;
[(store (srl (loadi32 addr:$dst), (i8 1)), addr:$dst)]>,
OpSize32;
def SHR64m1 : RI<0xD1, MRM5m, (outs), (ins i64mem:$dst),		def SHR64m1 : RI<0xD1, MRM5m, (outs), (ins i64mem:$dst),
"shr{q}\t$dst",		"shr{q}\t$dst", []>, Requires<[In64BitMode]>;
[(store (srl (loadi64 addr:$dst), (i8 1)), addr:$dst)]>,		} // SchedRW, mayLoad, mayStore
Requires<[In64BitMode]>;
} // SchedRW

let Constraints = "$src1 = $dst" in {		let Constraints = "$src1 = $dst" in {
let Uses = [CL], SchedRW = [WriteShiftCL] in {		let Uses = [CL], SchedRW = [WriteShiftCL] in {
def SAR8rCL : I<0xD2, MRM7r, (outs GR8 :$dst), (ins GR8 :$src1),		def SAR8rCL : I<0xD2, MRM7r, (outs GR8 :$dst), (ins GR8 :$src1),
"sar{b}\t{%cl, $dst\|$dst, cl}",		"sar{b}\t{%cl, $dst\|$dst, cl}",
[(set GR8:$dst, (sra GR8:$src1, CL))]>;		[(set GR8:$dst, (sra GR8:$src1, CL))]>;
def SAR16rCL : I<0xD3, MRM7r, (outs GR16:$dst), (ins GR16:$src1),		def SAR16rCL : I<0xD3, MRM7r, (outs GR16:$dst), (ins GR16:$src1),
"sar{w}\t{%cl, $dst\|$dst, cl}",		"sar{w}\t{%cl, $dst\|$dst, cl}",
Show All 22 Lines	def SAR32ri : Ii8<0xC1, MRM7r, (outs GR32:$dst), (ins GR32:$src1, u8imm:$src2),
OpSize32;		OpSize32;
def SAR64ri : RIi8<0xC1, MRM7r, (outs GR64:$dst),		def SAR64ri : RIi8<0xC1, MRM7r, (outs GR64:$dst),
(ins GR64:$src1, u8imm:$src2),		(ins GR64:$src1, u8imm:$src2),
"sar{q}\t{$src2, $dst\|$dst, $src2}",		"sar{q}\t{$src2, $dst\|$dst, $src2}",
[(set GR64:$dst, (sra GR64:$src1, (i8 imm:$src2)))]>;		[(set GR64:$dst, (sra GR64:$src1, (i8 imm:$src2)))]>;

// Shift by 1		// Shift by 1
def SAR8r1 : I<0xD0, MRM7r, (outs GR8 :$dst), (ins GR8 :$src1),		def SAR8r1 : I<0xD0, MRM7r, (outs GR8 :$dst), (ins GR8 :$src1),
"sar{b}\t$dst",		"sar{b}\t$dst", []>;
[(set GR8:$dst, (sra GR8:$src1, (i8 1)))]>;
def SAR16r1 : I<0xD1, MRM7r, (outs GR16:$dst), (ins GR16:$src1),		def SAR16r1 : I<0xD1, MRM7r, (outs GR16:$dst), (ins GR16:$src1),
"sar{w}\t$dst",		"sar{w}\t$dst", []>, OpSize16;
[(set GR16:$dst, (sra GR16:$src1, (i8 1)))]>, OpSize16;
def SAR32r1 : I<0xD1, MRM7r, (outs GR32:$dst), (ins GR32:$src1),		def SAR32r1 : I<0xD1, MRM7r, (outs GR32:$dst), (ins GR32:$src1),
"sar{l}\t$dst",		"sar{l}\t$dst", []>, OpSize32;
[(set GR32:$dst, (sra GR32:$src1, (i8 1)))]>, OpSize32;
def SAR64r1 : RI<0xD1, MRM7r, (outs GR64:$dst), (ins GR64:$src1),		def SAR64r1 : RI<0xD1, MRM7r, (outs GR64:$dst), (ins GR64:$src1),
"sar{q}\t$dst",		"sar{q}\t$dst", []>;
[(set GR64:$dst, (sra GR64:$src1, (i8 1)))]>;
} // SchedRW		} // SchedRW
} // Constraints = "$src = $dst"		} // Constraints = "$src = $dst"


let Uses = [CL], SchedRW = [WriteShiftCLLd, WriteRMW] in {		let Uses = [CL], SchedRW = [WriteShiftCLLd, WriteRMW] in {
def SAR8mCL : I<0xD2, MRM7m, (outs), (ins i8mem :$dst),		def SAR8mCL : I<0xD2, MRM7m, (outs), (ins i8mem :$dst),
"sar{b}\t{%cl, $dst\|$dst, cl}",		"sar{b}\t{%cl, $dst\|$dst, cl}",
[(store (sra (loadi8 addr:$dst), CL), addr:$dst)]>;		[(store (sra (loadi8 addr:$dst), CL), addr:$dst)]>;
def SAR16mCL : I<0xD3, MRM7m, (outs), (ins i16mem:$dst),		def SAR16mCL : I<0xD3, MRM7m, (outs), (ins i16mem:$dst),
"sar{w}\t{%cl, $dst\|$dst, cl}",		"sar{w}\t{%cl, $dst\|$dst, cl}",
[(store (sra (loadi16 addr:$dst), CL), addr:$dst)]>,		[(store (sra (loadi16 addr:$dst), CL), addr:$dst)]>,
OpSize16;		OpSize16;
def SAR32mCL : I<0xD3, MRM7m, (outs), (ins i32mem:$dst),		def SAR32mCL : I<0xD3, MRM7m, (outs), (ins i32mem:$dst),
"sar{l}\t{%cl, $dst\|$dst, cl}",		"sar{l}\t{%cl, $dst\|$dst, cl}",
[(store (sra (loadi32 addr:$dst), CL), addr:$dst)]>,		[(store (sra (loadi32 addr:$dst), CL), addr:$dst)]>,
OpSize32;		OpSize32;
def SAR64mCL : RI<0xD3, MRM7m, (outs), (ins i64mem:$dst),		def SAR64mCL : RI<0xD3, MRM7m, (outs), (ins i64mem:$dst),
"sar{q}\t{%cl, $dst\|$dst, cl}",		"sar{q}\t{%cl, $dst\|$dst, cl}",
[(store (sra (loadi64 addr:$dst), CL), addr:$dst)]>,		[(store (sra (loadi64 addr:$dst), CL), addr:$dst)]>,
Requires<[In64BitMode]>;		Requires<[In64BitMode]>;
} // Uses, SchedRW		} // Uses, SchedRW

let SchedRW = [WriteShiftLd, WriteRMW] in {		let SchedRW = [WriteShiftLd, WriteRMW], mayLoad = 1, mayStore = 1 in {
def SAR8mi : Ii8<0xC0, MRM7m, (outs), (ins i8mem :$dst, u8imm:$src),		def SAR8mi : Ii8<0xC0, MRM7m, (outs), (ins i8mem :$dst, u8imm:$src),
"sar{b}\t{$src, $dst\|$dst, $src}",		"sar{b}\t{$src, $dst\|$dst, $src}",
[(store (sra (loadi8 addr:$dst), (i8 imm:$src)), addr:$dst)]>;		[(store (sra (loadi8 addr:$dst), (i8 imm:$src)), addr:$dst)]>;
def SAR16mi : Ii8<0xC1, MRM7m, (outs), (ins i16mem:$dst, u8imm:$src),		def SAR16mi : Ii8<0xC1, MRM7m, (outs), (ins i16mem:$dst, u8imm:$src),
"sar{w}\t{$src, $dst\|$dst, $src}",		"sar{w}\t{$src, $dst\|$dst, $src}",
[(store (sra (loadi16 addr:$dst), (i8 imm:$src)), addr:$dst)]>,		[(store (sra (loadi16 addr:$dst), (i8 imm:$src)), addr:$dst)]>,
OpSize16;		OpSize16;
def SAR32mi : Ii8<0xC1, MRM7m, (outs), (ins i32mem:$dst, u8imm:$src),		def SAR32mi : Ii8<0xC1, MRM7m, (outs), (ins i32mem:$dst, u8imm:$src),
"sar{l}\t{$src, $dst\|$dst, $src}",		"sar{l}\t{$src, $dst\|$dst, $src}",
[(store (sra (loadi32 addr:$dst), (i8 imm:$src)), addr:$dst)]>,		[(store (sra (loadi32 addr:$dst), (i8 imm:$src)), addr:$dst)]>,
OpSize32;		OpSize32;
def SAR64mi : RIi8<0xC1, MRM7m, (outs), (ins i64mem:$dst, u8imm:$src),		def SAR64mi : RIi8<0xC1, MRM7m, (outs), (ins i64mem:$dst, u8imm:$src),
"sar{q}\t{$src, $dst\|$dst, $src}",		"sar{q}\t{$src, $dst\|$dst, $src}",
[(store (sra (loadi64 addr:$dst), (i8 imm:$src)), addr:$dst)]>,		[(store (sra (loadi64 addr:$dst), (i8 imm:$src)), addr:$dst)]>,
Requires<[In64BitMode]>;		Requires<[In64BitMode]>;

// Shift by 1		// Shift by 1
def SAR8m1 : I<0xD0, MRM7m, (outs), (ins i8mem :$dst),		def SAR8m1 : I<0xD0, MRM7m, (outs), (ins i8mem :$dst),
"sar{b}\t$dst",		"sar{b}\t$dst", []>;
[(store (sra (loadi8 addr:$dst), (i8 1)), addr:$dst)]>;
def SAR16m1 : I<0xD1, MRM7m, (outs), (ins i16mem:$dst),		def SAR16m1 : I<0xD1, MRM7m, (outs), (ins i16mem:$dst),
"sar{w}\t$dst",		"sar{w}\t$dst", []>, OpSize16;
[(store (sra (loadi16 addr:$dst), (i8 1)), addr:$dst)]>,
OpSize16;
def SAR32m1 : I<0xD1, MRM7m, (outs), (ins i32mem:$dst),		def SAR32m1 : I<0xD1, MRM7m, (outs), (ins i32mem:$dst),
"sar{l}\t$dst",		"sar{l}\t$dst", []>, OpSize32;
[(store (sra (loadi32 addr:$dst), (i8 1)), addr:$dst)]>,
OpSize32;
def SAR64m1 : RI<0xD1, MRM7m, (outs), (ins i64mem:$dst),		def SAR64m1 : RI<0xD1, MRM7m, (outs), (ins i64mem:$dst),
"sar{q}\t$dst",		"sar{q}\t$dst", []>, Requires<[In64BitMode]>;
[(store (sra (loadi64 addr:$dst), (i8 1)), addr:$dst)]>,
Requires<[In64BitMode]>;
} // SchedRW		} // SchedRW

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// Rotate instructions		// Rotate instructions
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

let hasSideEffects = 0 in {
let Constraints = "$src1 = $dst" in {		let Constraints = "$src1 = $dst" in {

let Uses = [CL, EFLAGS], SchedRW = [WriteRotateCL] in {		let Uses = [CL, EFLAGS], SchedRW = [WriteRotateCL] in {
def RCL8rCL : I<0xD2, MRM2r, (outs GR8:$dst), (ins GR8:$src1),		def RCL8rCL : I<0xD2, MRM2r, (outs GR8:$dst), (ins GR8:$src1),
"rcl{b}\t{%cl, $dst\|$dst, cl}", []>;		"rcl{b}\t{%cl, $dst\|$dst, cl}", []>;
def RCL16rCL : I<0xD3, MRM2r, (outs GR16:$dst), (ins GR16:$src1),		def RCL16rCL : I<0xD3, MRM2r, (outs GR16:$dst), (ins GR16:$src1),
"rcl{w}\t{%cl, $dst\|$dst, cl}", []>, OpSize16;		"rcl{w}\t{%cl, $dst\|$dst, cl}", []>, OpSize16;
def RCL32rCL : I<0xD3, MRM2r, (outs GR32:$dst), (ins GR32:$src1),		def RCL32rCL : I<0xD3, MRM2r, (outs GR32:$dst), (ins GR32:$src1),
▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines	def RCR32r1 : I<0xD1, MRM3r, (outs GR32:$dst), (ins GR32:$src1),
"rcr{l}\t$dst", []>, OpSize32;		"rcr{l}\t$dst", []>, OpSize32;
def RCR32ri : Ii8<0xC1, MRM3r, (outs GR32:$dst), (ins GR32:$src1, u8imm:$cnt),		def RCR32ri : Ii8<0xC1, MRM3r, (outs GR32:$dst), (ins GR32:$src1, u8imm:$cnt),
"rcr{l}\t{$cnt, $dst\|$dst, $cnt}", []>, OpSize32;		"rcr{l}\t{$cnt, $dst\|$dst, $cnt}", []>, OpSize32;
def RCR64r1 : RI<0xD1, MRM3r, (outs GR64:$dst), (ins GR64:$src1),		def RCR64r1 : RI<0xD1, MRM3r, (outs GR64:$dst), (ins GR64:$src1),
"rcr{q}\t$dst", []>;		"rcr{q}\t$dst", []>;
def RCR64ri : RIi8<0xC1, MRM3r, (outs GR64:$dst), (ins GR64:$src1, u8imm:$cnt),		def RCR64ri : RIi8<0xC1, MRM3r, (outs GR64:$dst), (ins GR64:$src1, u8imm:$cnt),
"rcr{q}\t{$cnt, $dst\|$dst, $cnt}", []>;		"rcr{q}\t{$cnt, $dst\|$dst, $cnt}", []>;
} // Uses = [EFLAGS], SchedRW		} // Uses = [EFLAGS], SchedRW

} // Constraints = "$src = $dst"		} // Constraints = "$src = $dst"

let mayLoad = 1, mayStore = 1 in {		let mayLoad = 1, mayStore = 1 in {
		craig.topperUnsubmitted Done Reply Inline Actions I think this line is the one that affected the llvm-mca tests. You can go ahead and commit that and the the llvm-mca test changes. craig.topper: I think this line is the one that affected the llvm-mca tests. You can go ahead and commit that…
let Uses = [EFLAGS], SchedRW = [WriteRotateLd, WriteRMW] in {		let Uses = [EFLAGS], SchedRW = [WriteRotateLd, WriteRMW] in {
def RCL8m1 : I<0xD0, MRM2m, (outs), (ins i8mem:$dst),		def RCL8m1 : I<0xD0, MRM2m, (outs), (ins i8mem:$dst),
"rcl{b}\t$dst", []>;		"rcl{b}\t$dst", []>;
def RCL8mi : Ii8<0xC0, MRM2m, (outs), (ins i8mem:$dst, u8imm:$cnt),		def RCL8mi : Ii8<0xC0, MRM2m, (outs), (ins i8mem:$dst, u8imm:$cnt),
"rcl{b}\t{$cnt, $dst\|$dst, $cnt}", []>;		"rcl{b}\t{$cnt, $dst\|$dst, $cnt}", []>;
def RCL16m1 : I<0xD1, MRM2m, (outs), (ins i16mem:$dst),		def RCL16m1 : I<0xD1, MRM2m, (outs), (ins i16mem:$dst),
"rcl{w}\t$dst", []>, OpSize16;		"rcl{w}\t$dst", []>, OpSize16;
def RCL16mi : Ii8<0xC1, MRM2m, (outs), (ins i16mem:$dst, u8imm:$cnt),		def RCL16mi : Ii8<0xC1, MRM2m, (outs), (ins i16mem:$dst, u8imm:$cnt),
▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines	def RCR16mCL : I<0xD3, MRM3m, (outs), (ins i16mem:$dst),
"rcr{w}\t{%cl, $dst\|$dst, cl}", []>, OpSize16;		"rcr{w}\t{%cl, $dst\|$dst, cl}", []>, OpSize16;
def RCR32mCL : I<0xD3, MRM3m, (outs), (ins i32mem:$dst),		def RCR32mCL : I<0xD3, MRM3m, (outs), (ins i32mem:$dst),
"rcr{l}\t{%cl, $dst\|$dst, cl}", []>, OpSize32;		"rcr{l}\t{%cl, $dst\|$dst, cl}", []>, OpSize32;
def RCR64mCL : RI<0xD3, MRM3m, (outs), (ins i64mem:$dst),		def RCR64mCL : RI<0xD3, MRM3m, (outs), (ins i64mem:$dst),
"rcr{q}\t{%cl, $dst\|$dst, cl}", []>,		"rcr{q}\t{%cl, $dst\|$dst, cl}", []>,
Requires<[In64BitMode]>;		Requires<[In64BitMode]>;
} // Uses = [CL, EFLAGS], SchedRW		} // Uses = [CL, EFLAGS], SchedRW
} // mayLoad, mayStore		} // mayLoad, mayStore
} // hasSideEffects = 0

let Constraints = "$src1 = $dst" in {		let Constraints = "$src1 = $dst" in {
// FIXME: provide shorter instructions when imm8 == 1		// FIXME: provide shorter instructions when imm8 == 1
let Uses = [CL], SchedRW = [WriteRotateCL] in {		let Uses = [CL], SchedRW = [WriteRotateCL] in {
def ROL8rCL : I<0xD2, MRM0r, (outs GR8 :$dst), (ins GR8 :$src1),		def ROL8rCL : I<0xD2, MRM0r, (outs GR8 :$dst), (ins GR8 :$src1),
"rol{b}\t{%cl, $dst\|$dst, cl}",		"rol{b}\t{%cl, $dst\|$dst, cl}",
[(set GR8:$dst, (rotl GR8:$src1, CL))]>;		[(set GR8:$dst, (rotl GR8:$src1, CL))]>;
def ROL16rCL : I<0xD3, MRM0r, (outs GR16:$dst), (ins GR16:$src1),		def ROL16rCL : I<0xD3, MRM0r, (outs GR16:$dst), (ins GR16:$src1),
Show All 21 Lines	def ROL32ri : Ii8<0xC1, MRM0r, (outs GR32:$dst), (ins GR32:$src1, u8imm:$src2),
OpSize32;		OpSize32;
def ROL64ri : RIi8<0xC1, MRM0r, (outs GR64:$dst),		def ROL64ri : RIi8<0xC1, MRM0r, (outs GR64:$dst),
(ins GR64:$src1, u8imm:$src2),		(ins GR64:$src1, u8imm:$src2),
"rol{q}\t{$src2, $dst\|$dst, $src2}",		"rol{q}\t{$src2, $dst\|$dst, $src2}",
[(set GR64:$dst, (rotl GR64:$src1, (i8 imm:$src2)))]>;		[(set GR64:$dst, (rotl GR64:$src1, (i8 imm:$src2)))]>;

// Rotate by 1		// Rotate by 1
def ROL8r1 : I<0xD0, MRM0r, (outs GR8 :$dst), (ins GR8 :$src1),		def ROL8r1 : I<0xD0, MRM0r, (outs GR8 :$dst), (ins GR8 :$src1),
"rol{b}\t$dst",		"rol{b}\t$dst", []>;
[(set GR8:$dst, (rotl GR8:$src1, (i8 1)))]>;
def ROL16r1 : I<0xD1, MRM0r, (outs GR16:$dst), (ins GR16:$src1),		def ROL16r1 : I<0xD1, MRM0r, (outs GR16:$dst), (ins GR16:$src1),
"rol{w}\t$dst",		"rol{w}\t$dst", []>, OpSize16;
[(set GR16:$dst, (rotl GR16:$src1, (i8 1)))]>, OpSize16;
def ROL32r1 : I<0xD1, MRM0r, (outs GR32:$dst), (ins GR32:$src1),		def ROL32r1 : I<0xD1, MRM0r, (outs GR32:$dst), (ins GR32:$src1),
"rol{l}\t$dst",		"rol{l}\t$dst", []>, OpSize32;
[(set GR32:$dst, (rotl GR32:$src1, (i8 1)))]>, OpSize32;
def ROL64r1 : RI<0xD1, MRM0r, (outs GR64:$dst), (ins GR64:$src1),		def ROL64r1 : RI<0xD1, MRM0r, (outs GR64:$dst), (ins GR64:$src1),
"rol{q}\t$dst",		"rol{q}\t$dst", []>;
[(set GR64:$dst, (rotl GR64:$src1, (i8 1)))]>;
} // SchedRW		} // SchedRW
} // Constraints = "$src = $dst"		} // Constraints = "$src = $dst"

let Uses = [CL], SchedRW = [WriteRotateCLLd, WriteRMW] in {		let Uses = [CL], SchedRW = [WriteRotateCLLd, WriteRMW] in {
def ROL8mCL : I<0xD2, MRM0m, (outs), (ins i8mem :$dst),		def ROL8mCL : I<0xD2, MRM0m, (outs), (ins i8mem :$dst),
"rol{b}\t{%cl, $dst\|$dst, cl}",		"rol{b}\t{%cl, $dst\|$dst, cl}",
[(store (rotl (loadi8 addr:$dst), CL), addr:$dst)]>;		[(store (rotl (loadi8 addr:$dst), CL), addr:$dst)]>;
def ROL16mCL : I<0xD3, MRM0m, (outs), (ins i16mem:$dst),		def ROL16mCL : I<0xD3, MRM0m, (outs), (ins i16mem:$dst),
"rol{w}\t{%cl, $dst\|$dst, cl}",		"rol{w}\t{%cl, $dst\|$dst, cl}",
[(store (rotl (loadi16 addr:$dst), CL), addr:$dst)]>, OpSize16;		[(store (rotl (loadi16 addr:$dst), CL), addr:$dst)]>, OpSize16;
def ROL32mCL : I<0xD3, MRM0m, (outs), (ins i32mem:$dst),		def ROL32mCL : I<0xD3, MRM0m, (outs), (ins i32mem:$dst),
"rol{l}\t{%cl, $dst\|$dst, cl}",		"rol{l}\t{%cl, $dst\|$dst, cl}",
[(store (rotl (loadi32 addr:$dst), CL), addr:$dst)]>, OpSize32;		[(store (rotl (loadi32 addr:$dst), CL), addr:$dst)]>, OpSize32;
def ROL64mCL : RI<0xD3, MRM0m, (outs), (ins i64mem:$dst),		def ROL64mCL : RI<0xD3, MRM0m, (outs), (ins i64mem:$dst),
"rol{q}\t{%cl, $dst\|$dst, cl}",		"rol{q}\t{%cl, $dst\|$dst, cl}",
[(store (rotl (loadi64 addr:$dst), CL), addr:$dst)]>,		[(store (rotl (loadi64 addr:$dst), CL), addr:$dst)]>,
Requires<[In64BitMode]>;		Requires<[In64BitMode]>;
} // Uses, SchedRW		} // Uses, SchedRW

let SchedRW = [WriteRotateLd, WriteRMW] in {		let SchedRW = [WriteRotateLd, WriteRMW], mayLoad = 1, mayStore = 1 in {
def ROL8mi : Ii8<0xC0, MRM0m, (outs), (ins i8mem :$dst, u8imm:$src1),		def ROL8mi : Ii8<0xC0, MRM0m, (outs), (ins i8mem :$dst, u8imm:$src1),
"rol{b}\t{$src1, $dst\|$dst, $src1}",		"rol{b}\t{$src1, $dst\|$dst, $src1}",
[(store (rotl (loadi8 addr:$dst), (i8 imm:$src1)), addr:$dst)]>;		[(store (rotl (loadi8 addr:$dst), (i8 imm:$src1)), addr:$dst)]>;
def ROL16mi : Ii8<0xC1, MRM0m, (outs), (ins i16mem:$dst, u8imm:$src1),		def ROL16mi : Ii8<0xC1, MRM0m, (outs), (ins i16mem:$dst, u8imm:$src1),
"rol{w}\t{$src1, $dst\|$dst, $src1}",		"rol{w}\t{$src1, $dst\|$dst, $src1}",
[(store (rotl (loadi16 addr:$dst), (i8 imm:$src1)), addr:$dst)]>,		[(store (rotl (loadi16 addr:$dst), (i8 imm:$src1)), addr:$dst)]>,
OpSize16;		OpSize16;
def ROL32mi : Ii8<0xC1, MRM0m, (outs), (ins i32mem:$dst, u8imm:$src1),		def ROL32mi : Ii8<0xC1, MRM0m, (outs), (ins i32mem:$dst, u8imm:$src1),
"rol{l}\t{$src1, $dst\|$dst, $src1}",		"rol{l}\t{$src1, $dst\|$dst, $src1}",
[(store (rotl (loadi32 addr:$dst), (i8 imm:$src1)), addr:$dst)]>,		[(store (rotl (loadi32 addr:$dst), (i8 imm:$src1)), addr:$dst)]>,
OpSize32;		OpSize32;
def ROL64mi : RIi8<0xC1, MRM0m, (outs), (ins i64mem:$dst, u8imm:$src1),		def ROL64mi : RIi8<0xC1, MRM0m, (outs), (ins i64mem:$dst, u8imm:$src1),
"rol{q}\t{$src1, $dst\|$dst, $src1}",		"rol{q}\t{$src1, $dst\|$dst, $src1}",
[(store (rotl (loadi64 addr:$dst), (i8 imm:$src1)), addr:$dst)]>,		[(store (rotl (loadi64 addr:$dst), (i8 imm:$src1)), addr:$dst)]>,
Requires<[In64BitMode]>;		Requires<[In64BitMode]>;

// Rotate by 1		// Rotate by 1
def ROL8m1 : I<0xD0, MRM0m, (outs), (ins i8mem :$dst),		def ROL8m1 : I<0xD0, MRM0m, (outs), (ins i8mem :$dst),
"rol{b}\t$dst",		"rol{b}\t$dst", []>;
[(store (rotl (loadi8 addr:$dst), (i8 1)), addr:$dst)]>;
def ROL16m1 : I<0xD1, MRM0m, (outs), (ins i16mem:$dst),		def ROL16m1 : I<0xD1, MRM0m, (outs), (ins i16mem:$dst),
"rol{w}\t$dst",		"rol{w}\t$dst", []>, OpSize16;
[(store (rotl (loadi16 addr:$dst), (i8 1)), addr:$dst)]>,
OpSize16;
def ROL32m1 : I<0xD1, MRM0m, (outs), (ins i32mem:$dst),		def ROL32m1 : I<0xD1, MRM0m, (outs), (ins i32mem:$dst),
"rol{l}\t$dst",		"rol{l}\t$dst", []>, OpSize32;
[(store (rotl (loadi32 addr:$dst), (i8 1)), addr:$dst)]>,
OpSize32;
def ROL64m1 : RI<0xD1, MRM0m, (outs), (ins i64mem:$dst),		def ROL64m1 : RI<0xD1, MRM0m, (outs), (ins i64mem:$dst),
"rol{q}\t$dst",		"rol{q}\t$dst", []>, Requires<[In64BitMode]>;
[(store (rotl (loadi64 addr:$dst), (i8 1)), addr:$dst)]>,		} // SchedRW, mayLoad, mayStore
Requires<[In64BitMode]>;
} // SchedRW

let Constraints = "$src1 = $dst" in {		let Constraints = "$src1 = $dst" in {
let Uses = [CL], SchedRW = [WriteRotateCL] in {		let Uses = [CL], SchedRW = [WriteRotateCL] in {
def ROR8rCL : I<0xD2, MRM1r, (outs GR8 :$dst), (ins GR8 :$src1),		def ROR8rCL : I<0xD2, MRM1r, (outs GR8 :$dst), (ins GR8 :$src1),
"ror{b}\t{%cl, $dst\|$dst, cl}",		"ror{b}\t{%cl, $dst\|$dst, cl}",
[(set GR8:$dst, (rotr GR8:$src1, CL))]>;		[(set GR8:$dst, (rotr GR8:$src1, CL))]>;
def ROR16rCL : I<0xD3, MRM1r, (outs GR16:$dst), (ins GR16:$src1),		def ROR16rCL : I<0xD3, MRM1r, (outs GR16:$dst), (ins GR16:$src1),
"ror{w}\t{%cl, $dst\|$dst, cl}",		"ror{w}\t{%cl, $dst\|$dst, cl}",
Show All 20 Lines	def ROR32ri : Ii8<0xC1, MRM1r, (outs GR32:$dst), (ins GR32:$src1, u8imm:$src2),
OpSize32;		OpSize32;
def ROR64ri : RIi8<0xC1, MRM1r, (outs GR64:$dst),		def ROR64ri : RIi8<0xC1, MRM1r, (outs GR64:$dst),
(ins GR64:$src1, u8imm:$src2),		(ins GR64:$src1, u8imm:$src2),
"ror{q}\t{$src2, $dst\|$dst, $src2}",		"ror{q}\t{$src2, $dst\|$dst, $src2}",
[(set GR64:$dst, (rotr GR64:$src1, (i8 imm:$src2)))]>;		[(set GR64:$dst, (rotr GR64:$src1, (i8 imm:$src2)))]>;

// Rotate by 1		// Rotate by 1
def ROR8r1 : I<0xD0, MRM1r, (outs GR8 :$dst), (ins GR8 :$src1),		def ROR8r1 : I<0xD0, MRM1r, (outs GR8 :$dst), (ins GR8 :$src1),
"ror{b}\t$dst",		"ror{b}\t$dst", []>;
[(set GR8:$dst, (rotr GR8:$src1, (i8 1)))]>;
def ROR16r1 : I<0xD1, MRM1r, (outs GR16:$dst), (ins GR16:$src1),		def ROR16r1 : I<0xD1, MRM1r, (outs GR16:$dst), (ins GR16:$src1),
"ror{w}\t$dst",		"ror{w}\t$dst", []>, OpSize16;
[(set GR16:$dst, (rotr GR16:$src1, (i8 1)))]>, OpSize16;
def ROR32r1 : I<0xD1, MRM1r, (outs GR32:$dst), (ins GR32:$src1),		def ROR32r1 : I<0xD1, MRM1r, (outs GR32:$dst), (ins GR32:$src1),
"ror{l}\t$dst",		"ror{l}\t$dst", []>, OpSize32;
[(set GR32:$dst, (rotr GR32:$src1, (i8 1)))]>, OpSize32;
def ROR64r1 : RI<0xD1, MRM1r, (outs GR64:$dst), (ins GR64:$src1),		def ROR64r1 : RI<0xD1, MRM1r, (outs GR64:$dst), (ins GR64:$src1),
"ror{q}\t$dst",		"ror{q}\t$dst", []>;
[(set GR64:$dst, (rotr GR64:$src1, (i8 1)))]>;
} // SchedRW		} // SchedRW
} // Constraints = "$src = $dst", SchedRW		} // Constraints = "$src = $dst", SchedRW

let Uses = [CL], SchedRW = [WriteRotateCLLd, WriteRMW] in {		let Uses = [CL], SchedRW = [WriteRotateCLLd, WriteRMW] in {
def ROR8mCL : I<0xD2, MRM1m, (outs), (ins i8mem :$dst),		def ROR8mCL : I<0xD2, MRM1m, (outs), (ins i8mem :$dst),
"ror{b}\t{%cl, $dst\|$dst, cl}",		"ror{b}\t{%cl, $dst\|$dst, cl}",
[(store (rotr (loadi8 addr:$dst), CL), addr:$dst)]>;		[(store (rotr (loadi8 addr:$dst), CL), addr:$dst)]>;
def ROR16mCL : I<0xD3, MRM1m, (outs), (ins i16mem:$dst),		def ROR16mCL : I<0xD3, MRM1m, (outs), (ins i16mem:$dst),
"ror{w}\t{%cl, $dst\|$dst, cl}",		"ror{w}\t{%cl, $dst\|$dst, cl}",
[(store (rotr (loadi16 addr:$dst), CL), addr:$dst)]>, OpSize16;		[(store (rotr (loadi16 addr:$dst), CL), addr:$dst)]>, OpSize16;
def ROR32mCL : I<0xD3, MRM1m, (outs), (ins i32mem:$dst),		def ROR32mCL : I<0xD3, MRM1m, (outs), (ins i32mem:$dst),
"ror{l}\t{%cl, $dst\|$dst, cl}",		"ror{l}\t{%cl, $dst\|$dst, cl}",
[(store (rotr (loadi32 addr:$dst), CL), addr:$dst)]>, OpSize32;		[(store (rotr (loadi32 addr:$dst), CL), addr:$dst)]>, OpSize32;
def ROR64mCL : RI<0xD3, MRM1m, (outs), (ins i64mem:$dst),		def ROR64mCL : RI<0xD3, MRM1m, (outs), (ins i64mem:$dst),
"ror{q}\t{%cl, $dst\|$dst, cl}",		"ror{q}\t{%cl, $dst\|$dst, cl}",
[(store (rotr (loadi64 addr:$dst), CL), addr:$dst)]>,		[(store (rotr (loadi64 addr:$dst), CL), addr:$dst)]>,
Requires<[In64BitMode]>;		Requires<[In64BitMode]>;
} // Uses, SchedRW		} // Uses, SchedRW

let SchedRW = [WriteRotateLd, WriteRMW] in {		let SchedRW = [WriteRotateLd, WriteRMW], mayLoad = 1, mayStore =1 in {
def ROR8mi : Ii8<0xC0, MRM1m, (outs), (ins i8mem :$dst, u8imm:$src),		def ROR8mi : Ii8<0xC0, MRM1m, (outs), (ins i8mem :$dst, u8imm:$src),
"ror{b}\t{$src, $dst\|$dst, $src}",		"ror{b}\t{$src, $dst\|$dst, $src}",
[(store (rotr (loadi8 addr:$dst), (i8 imm:$src)), addr:$dst)]>;		[(store (rotr (loadi8 addr:$dst), (i8 imm:$src)), addr:$dst)]>;
def ROR16mi : Ii8<0xC1, MRM1m, (outs), (ins i16mem:$dst, u8imm:$src),		def ROR16mi : Ii8<0xC1, MRM1m, (outs), (ins i16mem:$dst, u8imm:$src),
"ror{w}\t{$src, $dst\|$dst, $src}",		"ror{w}\t{$src, $dst\|$dst, $src}",
[(store (rotr (loadi16 addr:$dst), (i8 imm:$src)), addr:$dst)]>,		[(store (rotr (loadi16 addr:$dst), (i8 imm:$src)), addr:$dst)]>,
OpSize16;		OpSize16;
def ROR32mi : Ii8<0xC1, MRM1m, (outs), (ins i32mem:$dst, u8imm:$src),		def ROR32mi : Ii8<0xC1, MRM1m, (outs), (ins i32mem:$dst, u8imm:$src),
"ror{l}\t{$src, $dst\|$dst, $src}",		"ror{l}\t{$src, $dst\|$dst, $src}",
[(store (rotr (loadi32 addr:$dst), (i8 imm:$src)), addr:$dst)]>,		[(store (rotr (loadi32 addr:$dst), (i8 imm:$src)), addr:$dst)]>,
OpSize32;		OpSize32;
def ROR64mi : RIi8<0xC1, MRM1m, (outs), (ins i64mem:$dst, u8imm:$src),		def ROR64mi : RIi8<0xC1, MRM1m, (outs), (ins i64mem:$dst, u8imm:$src),
"ror{q}\t{$src, $dst\|$dst, $src}",		"ror{q}\t{$src, $dst\|$dst, $src}",
[(store (rotr (loadi64 addr:$dst), (i8 imm:$src)), addr:$dst)]>,		[(store (rotr (loadi64 addr:$dst), (i8 imm:$src)), addr:$dst)]>,
Requires<[In64BitMode]>;		Requires<[In64BitMode]>;

// Rotate by 1		// Rotate by 1
def ROR8m1 : I<0xD0, MRM1m, (outs), (ins i8mem :$dst),		def ROR8m1 : I<0xD0, MRM1m, (outs), (ins i8mem :$dst),
"ror{b}\t$dst",		"ror{b}\t$dst", []>;
[(store (rotr (loadi8 addr:$dst), (i8 1)), addr:$dst)]>;
def ROR16m1 : I<0xD1, MRM1m, (outs), (ins i16mem:$dst),		def ROR16m1 : I<0xD1, MRM1m, (outs), (ins i16mem:$dst),
"ror{w}\t$dst",		"ror{w}\t$dst", []>, OpSize16;
[(store (rotr (loadi16 addr:$dst), (i8 1)), addr:$dst)]>,
OpSize16;
def ROR32m1 : I<0xD1, MRM1m, (outs), (ins i32mem:$dst),		def ROR32m1 : I<0xD1, MRM1m, (outs), (ins i32mem:$dst),
"ror{l}\t$dst",		"ror{l}\t$dst", []>,
[(store (rotr (loadi32 addr:$dst), (i8 1)), addr:$dst)]>,
OpSize32;		OpSize32;
def ROR64m1 : RI<0xD1, MRM1m, (outs), (ins i64mem:$dst),		def ROR64m1 : RI<0xD1, MRM1m, (outs), (ins i64mem:$dst),
"ror{q}\t$dst",		"ror{q}\t$dst", []>, Requires<[In64BitMode]>;
[(store (rotr (loadi64 addr:$dst), (i8 1)), addr:$dst)]>,		} // SchedRW, mayLoad, mayStore
Requires<[In64BitMode]>;
} // SchedRW


//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// Double shift instructions (generalizations of rotate)		// Double shift instructions (generalizations of rotate)
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

let Constraints = "$src1 = $dst" in {		let Constraints = "$src1 = $dst" in {

▲ Show 20 Lines • Show All 141 Lines • ▼ Show 20 Lines
def SHRD64mri8 : RIi8<0xAC, MRMDestMem,		def SHRD64mri8 : RIi8<0xAC, MRMDestMem,
(outs), (ins i64mem:$dst, GR64:$src2, u8imm:$src3),		(outs), (ins i64mem:$dst, GR64:$src2, u8imm:$src3),
"shrd{q}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",		"shrd{q}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",
[(store (fshr GR64:$src2, (loadi64 addr:$dst),		[(store (fshr GR64:$src2, (loadi64 addr:$dst),
(i8 imm:$src3)), addr:$dst)]>,		(i8 imm:$src3)), addr:$dst)]>,
TB;		TB;
} // SchedRW		} // SchedRW

} // Defs = [EFLAGS]		} // Defs = [EFLAGS], hasSideEffects

// Use the opposite rotate if allows us to use the rotate by 1 instruction.		// Use the opposite rotate if allows us to use the rotate by 1 instruction.
def : Pat<(rotl GR8:$src1, (i8 7)), (ROR8r1 GR8:$src1)>;		def : Pat<(rotl GR8:$src1, (i8 7)), (ROR8r1 GR8:$src1)>;
def : Pat<(rotl GR16:$src1, (i8 15)), (ROR16r1 GR16:$src1)>;		def : Pat<(rotl GR16:$src1, (i8 15)), (ROR16r1 GR16:$src1)>;
def : Pat<(rotl GR32:$src1, (i8 31)), (ROR32r1 GR32:$src1)>;		def : Pat<(rotl GR32:$src1, (i8 31)), (ROR32r1 GR32:$src1)>;
def : Pat<(rotl GR64:$src1, (i8 63)), (ROR64r1 GR64:$src1)>;		def : Pat<(rotl GR64:$src1, (i8 63)), (ROR64r1 GR64:$src1)>;
def : Pat<(rotr GR8:$src1, (i8 7)), (ROL8r1 GR8:$src1)>;		def : Pat<(rotr GR8:$src1, (i8 7)), (ROL8r1 GR8:$src1)>;
def : Pat<(rotr GR16:$src1, (i8 15)), (ROL16r1 GR16:$src1)>;		def : Pat<(rotr GR16:$src1, (i8 15)), (ROL16r1 GR16:$src1)>;
▲ Show 20 Lines • Show All 216 Lines • Show Last 20 Lines

llvm/lib/Target/X86/X86MCInstLower.cpp

Show First 20 Lines • Show All 499 Lines • ▼ Show 20 Lines	void X86MCInstLower::Lower(const MachineInstr *MI, MCInst &OutMI) const {

for (const MachineOperand &MO : MI->operands())		for (const MachineOperand &MO : MI->operands())
if (auto MaybeMCOp = LowerMachineOperand(MI, MO))		if (auto MaybeMCOp = LowerMachineOperand(MI, MO))
OutMI.addOperand(*MaybeMCOp);		OutMI.addOperand(*MaybeMCOp);

if (X86::optimizeInstFromVEX3ToVEX2(OutMI, MI->getDesc()))		if (X86::optimizeInstFromVEX3ToVEX2(OutMI, MI->getDesc()))
return;		return;

		if (X86::optimizeShiftRotateWithImmediateOne(OutMI))
		craig.topperUnsubmitted Done Reply Inline Actions Missing if? craig.topper: Missing if?
		skanAuthorUnsubmitted Done Reply Inline Actions Good catch! Done. skan: Good catch! Done.
		return;

// Handle a few special cases to eliminate operand modifiers.		// Handle a few special cases to eliminate operand modifiers.
switch (OutMI.getOpcode()) {		switch (OutMI.getOpcode()) {
case X86::LEA64_32r:		case X86::LEA64_32r:
case X86::LEA64r:		case X86::LEA64r:
case X86::LEA16r:		case X86::LEA16r:
case X86::LEA32r:		case X86::LEA32r:
// LEA should have a segment register, but it must be empty.		// LEA should have a segment register, but it must be empty.
assert(OutMI.getNumOperands() == 1 + X86::AddrNumOperands &&		assert(OutMI.getNumOperands() == 1 + X86::AddrNumOperands &&
▲ Show 20 Lines • Show All 2,177 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/GlobalISel/ashr-scalar.ll

	Show First 20 Lines • Show All 161 Lines • ▼ Show 20 Lines
	}			}

	define i1 @test_ashr_i1_imm1(i32 %arg1) {			define i1 @test_ashr_i1_imm1(i32 %arg1) {
	; X64-LABEL: test_ashr_i1_imm1:			; X64-LABEL: test_ashr_i1_imm1:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: movl %edi, %eax			; X64-NEXT: movl %edi, %eax
	; X64-NEXT: shlb $7, %al			; X64-NEXT: shlb $7, %al
	; X64-NEXT: sarb $7, %al			; X64-NEXT: sarb $7, %al
	; X64-NEXT: sarb %al			; X64-NEXT: movb $1, %cl
				; X64-NEXT: sarb %cl, %al
	; X64-NEXT: # kill: def $al killed $al killed $eax			; X64-NEXT: # kill: def $al killed $al killed $eax
	; X64-NEXT: retq			; X64-NEXT: retq
	%a = trunc i32 %arg1 to i1			%a = trunc i32 %arg1 to i1
	%res = ashr i1 %a, 1			%res = ashr i1 %a, 1
	ret i1 %res			ret i1 %res
	}			}

llvm/test/CodeGen/X86/GlobalISel/lshr-scalar.ll

Show First 20 Lines • Show All 159 Lines • ▼ Show 20 Lines	; X64-NEXT: retq
ret i1 %res		ret i1 %res
}		}

define i1 @test_lshr_i1_imm1(i32 %arg1) {		define i1 @test_lshr_i1_imm1(i32 %arg1) {
; X64-LABEL: test_lshr_i1_imm1:		; X64-LABEL: test_lshr_i1_imm1:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: movl %edi, %eax		; X64-NEXT: movl %edi, %eax
; X64-NEXT: andb $1, %al		; X64-NEXT: andb $1, %al
; X64-NEXT: shrb %al		; X64-NEXT: movb $1, %cl
		; X64-NEXT: shrb %cl, %al
; X64-NEXT: # kill: def $al killed $al killed $eax		; X64-NEXT: # kill: def $al killed $al killed $eax
; X64-NEXT: retq		; X64-NEXT: retq
%a = trunc i32 %arg1 to i1		%a = trunc i32 %arg1 to i1
%res = lshr i1 %a, 1		%res = lshr i1 %a, 1
ret i1 %res		ret i1 %res
}		}

llvm/test/CodeGen/X86/GlobalISel/select-ashr-scalar.mir

# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py		# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
# RUN: llc -mtriple=x86_64-linux-gnu -run-pass=instruction-select -verify-machineinstrs %s -o - \| FileCheck %s --check-prefix=ALL		# RUN: llc -mtriple=x86_64-linux-gnu -run-pass=instruction-select -verify-machineinstrs %s -o - \| FileCheck %s --check-prefix=ALL
--- \|		--- \|

define i64 @test_ashr_i64(i64 %arg1, i64 %arg2) {		define i64 @test_ashr_i64(i64 %arg1, i64 %arg2) {
%res = ashr i64 %arg1, %arg2		%res = ashr i64 %arg1, %arg2
ret i64 %res		ret i64 %res
}		}

define i64 @test_ashr_i64_imm(i64 %arg1) {		define i64 @test_ashr_i64_imm(i64 %arg1) {
%res = ashr i64 %arg1, 5		%res = ashr i64 %arg1, 5
ret i64 %res		ret i64 %res
}		}

define i64 @test_ashr_i64_imm1(i64 %arg1) {
%res = ashr i64 %arg1, 1
ret i64 %res
}

define i32 @test_ashr_i32(i32 %arg1, i32 %arg2) {		define i32 @test_ashr_i32(i32 %arg1, i32 %arg2) {
%res = ashr i32 %arg1, %arg2		%res = ashr i32 %arg1, %arg2
ret i32 %res		ret i32 %res
}		}

define i32 @test_ashr_i32_imm(i32 %arg1) {		define i32 @test_ashr_i32_imm(i32 %arg1) {
%res = ashr i32 %arg1, 5		%res = ashr i32 %arg1, 5
ret i32 %res		ret i32 %res
}		}

define i32 @test_ashr_i32_imm1(i32 %arg1) {
%res = ashr i32 %arg1, 1
ret i32 %res
}

define i16 @test_ashr_i16(i32 %arg1, i32 %arg2) {		define i16 @test_ashr_i16(i32 %arg1, i32 %arg2) {
%a = trunc i32 %arg1 to i16		%a = trunc i32 %arg1 to i16
%a2 = trunc i32 %arg2 to i16		%a2 = trunc i32 %arg2 to i16
%res = ashr i16 %a, %a2		%res = ashr i16 %a, %a2
ret i16 %res		ret i16 %res
}		}

define i16 @test_ashr_i16_imm(i32 %arg1) {		define i16 @test_ashr_i16_imm(i32 %arg1) {
%a = trunc i32 %arg1 to i16		%a = trunc i32 %arg1 to i16
%res = ashr i16 %a, 5		%res = ashr i16 %a, 5
ret i16 %res		ret i16 %res
}		}

define i16 @test_ashr_i16_imm1(i32 %arg1) {
%a = trunc i32 %arg1 to i16
%res = ashr i16 %a, 1
ret i16 %res
}

define i8 @test_ashr_i8(i32 %arg1, i32 %arg2) {		define i8 @test_ashr_i8(i32 %arg1, i32 %arg2) {
%a = trunc i32 %arg1 to i8		%a = trunc i32 %arg1 to i8
%a2 = trunc i32 %arg2 to i8		%a2 = trunc i32 %arg2 to i8
%res = ashr i8 %a, %a2		%res = ashr i8 %a, %a2
ret i8 %res		ret i8 %res
}		}

define i8 @test_ashr_i8_imm(i32 %arg1) {		define i8 @test_ashr_i8_imm(i32 %arg1) {
%a = trunc i32 %arg1 to i8		%a = trunc i32 %arg1 to i8
%res = ashr i8 %a, 5		%res = ashr i8 %a, 5
ret i8 %res		ret i8 %res
}		}

define i8 @test_ashr_i8_imm1(i32 %arg1) {
%a = trunc i32 %arg1 to i8
%res = ashr i8 %a, 1
ret i8 %res
}
...		...
---		---
name: test_ashr_i64		name: test_ashr_i64
alignment: 16		alignment: 16
legalized: true		legalized: true
regBankSelected: true		regBankSelected: true
tracksRegLiveness: true		tracksRegLiveness: true
registers:		registers:
▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines	bb.1 (%ir-block.0):
%0(s64) = COPY $rdi		%0(s64) = COPY $rdi
%1(s8) = G_CONSTANT i8 5		%1(s8) = G_CONSTANT i8 5
%2(s64) = G_ASHR %0, %1		%2(s64) = G_ASHR %0, %1
$rax = COPY %2(s64)		$rax = COPY %2(s64)
RET 0, implicit $rax		RET 0, implicit $rax

...		...
---		---
name: test_ashr_i64_imm1
alignment: 16
legalized: true
regBankSelected: true
tracksRegLiveness: true
registers:
- { id: 0, class: gpr, preferred-register: '' }
- { id: 1, class: gpr, preferred-register: '' }
- { id: 2, class: gpr, preferred-register: '' }
liveins:
fixedStack:
stack:
constants:
body: \|
bb.1 (%ir-block.0):
liveins: $rdi

; ALL-LABEL: name: test_ashr_i64_imm1
; ALL: liveins: $rdi
; ALL: [[COPY:%[0-9]+]]:gr64 = COPY $rdi
; ALL: [[SAR64r1_:%[0-9]+]]:gr64 = SAR64r1 [[COPY]], implicit-def $eflags
; ALL: $rax = COPY [[SAR64r1_]]
; ALL: RET 0, implicit $rax
%0(s64) = COPY $rdi
%1(s8) = G_CONSTANT i8 1
%2(s64) = G_ASHR %0, %1
$rax = COPY %2(s64)
RET 0, implicit $rax

...
---
name: test_ashr_i32		name: test_ashr_i32
alignment: 16		alignment: 16
legalized: true		legalized: true
regBankSelected: true		regBankSelected: true
tracksRegLiveness: true		tracksRegLiveness: true
registers:		registers:
- { id: 0, class: gpr, preferred-register: '' }		- { id: 0, class: gpr, preferred-register: '' }
- { id: 1, class: gpr, preferred-register: '' }		- { id: 1, class: gpr, preferred-register: '' }
▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines	bb.1 (%ir-block.0):
%0(s32) = COPY $edi		%0(s32) = COPY $edi
%1(s8) = G_CONSTANT i8 5		%1(s8) = G_CONSTANT i8 5
%2(s32) = G_ASHR %0, %1		%2(s32) = G_ASHR %0, %1
$eax = COPY %2(s32)		$eax = COPY %2(s32)
RET 0, implicit $eax		RET 0, implicit $eax

...		...
---		---
name: test_ashr_i32_imm1
alignment: 16
legalized: true
regBankSelected: true
tracksRegLiveness: true
registers:
- { id: 0, class: gpr, preferred-register: '' }
- { id: 1, class: gpr, preferred-register: '' }
- { id: 2, class: gpr, preferred-register: '' }
liveins:
fixedStack:
stack:
constants:
body: \|
bb.1 (%ir-block.0):
liveins: $edi

; ALL-LABEL: name: test_ashr_i32_imm1
; ALL: liveins: $edi
; ALL: [[COPY:%[0-9]+]]:gr32 = COPY $edi
; ALL: [[SAR32r1_:%[0-9]+]]:gr32 = SAR32r1 [[COPY]], implicit-def $eflags
; ALL: $eax = COPY [[SAR32r1_]]
; ALL: RET 0, implicit $eax
%0(s32) = COPY $edi
%1(s8) = G_CONSTANT i8 1
%2(s32) = G_ASHR %0, %1
$eax = COPY %2(s32)
RET 0, implicit $eax

...
---
name: test_ashr_i16		name: test_ashr_i16
alignment: 16		alignment: 16
legalized: true		legalized: true
regBankSelected: true		regBankSelected: true
tracksRegLiveness: true		tracksRegLiveness: true
registers:		registers:
- { id: 0, class: gpr, preferred-register: '' }		- { id: 0, class: gpr, preferred-register: '' }
- { id: 1, class: gpr, preferred-register: '' }		- { id: 1, class: gpr, preferred-register: '' }
▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines	bb.1 (%ir-block.0):
%2(s8) = G_CONSTANT i8 5		%2(s8) = G_CONSTANT i8 5
%1(s16) = G_TRUNC %0(s32)		%1(s16) = G_TRUNC %0(s32)
%3(s16) = G_ASHR %1, %2		%3(s16) = G_ASHR %1, %2
$ax = COPY %3(s16)		$ax = COPY %3(s16)
RET 0, implicit $ax		RET 0, implicit $ax

...		...
---		---
name: test_ashr_i16_imm1
alignment: 16
legalized: true
regBankSelected: true
tracksRegLiveness: true
registers:
- { id: 0, class: gpr, preferred-register: '' }
- { id: 1, class: gpr, preferred-register: '' }
- { id: 2, class: gpr, preferred-register: '' }
- { id: 3, class: gpr, preferred-register: '' }
liveins:
fixedStack:
stack:
constants:
body: \|
bb.1 (%ir-block.0):
liveins: $edi

; ALL-LABEL: name: test_ashr_i16_imm1
; ALL: liveins: $edi
; ALL: [[COPY:%[0-9]+]]:gr32 = COPY $edi
; ALL: [[COPY1:%[0-9]+]]:gr16 = COPY [[COPY]].sub_16bit
; ALL: [[SAR16r1_:%[0-9]+]]:gr16 = SAR16r1 [[COPY1]], implicit-def $eflags
; ALL: $ax = COPY [[SAR16r1_]]
; ALL: RET 0, implicit $ax
%0(s32) = COPY $edi
%2(s8) = G_CONSTANT i8 1
%1(s16) = G_TRUNC %0(s32)
%3(s16) = G_ASHR %1, %2
$ax = COPY %3(s16)
RET 0, implicit $ax

...
---
name: test_ashr_i8		name: test_ashr_i8
alignment: 16		alignment: 16
legalized: true		legalized: true
regBankSelected: true		regBankSelected: true
tracksRegLiveness: true		tracksRegLiveness: true
registers:		registers:
- { id: 0, class: gpr, preferred-register: '' }		- { id: 0, class: gpr, preferred-register: '' }
- { id: 1, class: gpr, preferred-register: '' }		- { id: 1, class: gpr, preferred-register: '' }
▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines	bb.1 (%ir-block.0):
%0(s32) = COPY $edi		%0(s32) = COPY $edi
%2(s8) = G_CONSTANT i8 5		%2(s8) = G_CONSTANT i8 5
%1(s8) = G_TRUNC %0(s32)		%1(s8) = G_TRUNC %0(s32)
%3(s8) = G_ASHR %1, %2		%3(s8) = G_ASHR %1, %2
$al = COPY %3(s8)		$al = COPY %3(s8)
RET 0, implicit $al		RET 0, implicit $al

...		...
---
name: test_ashr_i8_imm1
alignment: 16
legalized: true
regBankSelected: true
tracksRegLiveness: true
registers:
- { id: 0, class: gpr, preferred-register: '' }
- { id: 1, class: gpr, preferred-register: '' }
- { id: 2, class: gpr, preferred-register: '' }
- { id: 3, class: gpr, preferred-register: '' }
liveins:
fixedStack:
stack:
constants:
body: \|
bb.1 (%ir-block.0):
liveins: $edi

; ALL-LABEL: name: test_ashr_i8_imm1
; ALL: liveins: $edi
; ALL: [[COPY:%[0-9]+]]:gr32 = COPY $edi
; ALL: [[COPY1:%[0-9]+]]:gr8 = COPY [[COPY]].sub_8bit
; ALL: [[SAR8r1_:%[0-9]+]]:gr8 = SAR8r1 [[COPY1]], implicit-def $eflags
; ALL: $al = COPY [[SAR8r1_]]
; ALL: RET 0, implicit $al
%0(s32) = COPY $edi
%2(s8) = G_CONSTANT i8 1
%1(s8) = G_TRUNC %0(s32)
%3(s8) = G_ASHR %1, %2
$al = COPY %3(s8)
RET 0, implicit $al

...

llvm/test/CodeGen/X86/GlobalISel/select-lshr-scalar.mir

# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py		# NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
# RUN: llc -mtriple=x86_64-linux-gnu -run-pass=instruction-select -verify-machineinstrs %s -o - \| FileCheck %s --check-prefix=ALL		# RUN: llc -mtriple=x86_64-linux-gnu -run-pass=instruction-select -verify-machineinstrs %s -o - \| FileCheck %s --check-prefix=ALL
--- \|		--- \|

define i64 @test_lshr_i64(i64 %arg1, i64 %arg2) {		define i64 @test_lshr_i64(i64 %arg1, i64 %arg2) {
%res = lshr i64 %arg1, %arg2		%res = lshr i64 %arg1, %arg2
ret i64 %res		ret i64 %res
}		}

define i64 @test_lshr_i64_imm(i64 %arg1) {		define i64 @test_lshr_i64_imm(i64 %arg1) {
%res = lshr i64 %arg1, 5		%res = lshr i64 %arg1, 5
ret i64 %res		ret i64 %res
}		}

define i64 @test_lshr_i64_imm1(i64 %arg1) {
%res = lshr i64 %arg1, 1
ret i64 %res
}

define i32 @test_lshr_i32(i32 %arg1, i32 %arg2) {		define i32 @test_lshr_i32(i32 %arg1, i32 %arg2) {
%res = lshr i32 %arg1, %arg2		%res = lshr i32 %arg1, %arg2
ret i32 %res		ret i32 %res
}		}

define i32 @test_lshr_i32_imm(i32 %arg1) {		define i32 @test_lshr_i32_imm(i32 %arg1) {
%res = lshr i32 %arg1, 5		%res = lshr i32 %arg1, 5
ret i32 %res		ret i32 %res
}		}

define i32 @test_lshr_i32_imm1(i32 %arg1) {
%res = lshr i32 %arg1, 1
ret i32 %res
}

define i16 @test_lshr_i16(i32 %arg1, i32 %arg2) {		define i16 @test_lshr_i16(i32 %arg1, i32 %arg2) {
%a = trunc i32 %arg1 to i16		%a = trunc i32 %arg1 to i16
%a2 = trunc i32 %arg2 to i16		%a2 = trunc i32 %arg2 to i16
%res = lshr i16 %a, %a2		%res = lshr i16 %a, %a2
ret i16 %res		ret i16 %res
}		}

define i16 @test_lshr_i16_imm(i32 %arg1) {		define i16 @test_lshr_i16_imm(i32 %arg1) {
%a = trunc i32 %arg1 to i16		%a = trunc i32 %arg1 to i16
%res = lshr i16 %a, 5		%res = lshr i16 %a, 5
ret i16 %res		ret i16 %res
}		}

define i16 @test_lshr_i16_imm1(i32 %arg1) {
%a = trunc i32 %arg1 to i16
%res = lshr i16 %a, 1
ret i16 %res
}

define i8 @test_lshr_i8(i32 %arg1, i32 %arg2) {		define i8 @test_lshr_i8(i32 %arg1, i32 %arg2) {
%a = trunc i32 %arg1 to i8		%a = trunc i32 %arg1 to i8
%a2 = trunc i32 %arg2 to i8		%a2 = trunc i32 %arg2 to i8
%res = lshr i8 %a, %a2		%res = lshr i8 %a, %a2
ret i8 %res		ret i8 %res
}		}

define i8 @test_lshr_i8_imm(i32 %arg1) {		define i8 @test_lshr_i8_imm(i32 %arg1) {
%a = trunc i32 %arg1 to i8		%a = trunc i32 %arg1 to i8
%res = lshr i8 %a, 5		%res = lshr i8 %a, 5
ret i8 %res		ret i8 %res
}		}

define i8 @test_lshr_i8_imm1(i32 %arg1) {
%a = trunc i32 %arg1 to i8
%res = lshr i8 %a, 1
ret i8 %res
}
...		...
---		---
name: test_lshr_i64		name: test_lshr_i64
alignment: 16		alignment: 16
legalized: true		legalized: true
regBankSelected: true		regBankSelected: true
tracksRegLiveness: true		tracksRegLiveness: true
registers:		registers:
▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines	bb.1 (%ir-block.0):
%0(s64) = COPY $rdi		%0(s64) = COPY $rdi
%1(s8) = G_CONSTANT i8 5		%1(s8) = G_CONSTANT i8 5
%2(s64) = G_LSHR %0, %1		%2(s64) = G_LSHR %0, %1
$rax = COPY %2(s64)		$rax = COPY %2(s64)
RET 0, implicit $rax		RET 0, implicit $rax

...		...
---		---
name: test_lshr_i64_imm1
alignment: 16
legalized: true
regBankSelected: true
tracksRegLiveness: true
registers:
- { id: 0, class: gpr, preferred-register: '' }
- { id: 1, class: gpr, preferred-register: '' }
- { id: 2, class: gpr, preferred-register: '' }
liveins:
fixedStack:
stack:
constants:
body: \|
bb.1 (%ir-block.0):
liveins: $rdi

; ALL-LABEL: name: test_lshr_i64_imm1
; ALL: liveins: $rdi
; ALL: [[COPY:%[0-9]+]]:gr64 = COPY $rdi
; ALL: [[SHR64r1_:%[0-9]+]]:gr64 = SHR64r1 [[COPY]], implicit-def $eflags
; ALL: $rax = COPY [[SHR64r1_]]
; ALL: RET 0, implicit $rax
%0(s64) = COPY $rdi
%1(s8) = G_CONSTANT i8 1
%2(s64) = G_LSHR %0, %1
$rax = COPY %2(s64)
RET 0, implicit $rax

...
---
name: test_lshr_i32		name: test_lshr_i32
alignment: 16		alignment: 16
legalized: true		legalized: true
regBankSelected: true		regBankSelected: true
tracksRegLiveness: true		tracksRegLiveness: true
registers:		registers:
- { id: 0, class: gpr, preferred-register: '' }		- { id: 0, class: gpr, preferred-register: '' }
- { id: 1, class: gpr, preferred-register: '' }		- { id: 1, class: gpr, preferred-register: '' }
▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines	bb.1 (%ir-block.0):
%0(s32) = COPY $edi		%0(s32) = COPY $edi
%1(s8) = G_CONSTANT i8 5		%1(s8) = G_CONSTANT i8 5
%2(s32) = G_LSHR %0, %1		%2(s32) = G_LSHR %0, %1
$eax = COPY %2(s32)		$eax = COPY %2(s32)
RET 0, implicit $eax		RET 0, implicit $eax

...		...
---		---
name: test_lshr_i32_imm1
alignment: 16
legalized: true
regBankSelected: true
tracksRegLiveness: true
registers:
- { id: 0, class: gpr, preferred-register: '' }
- { id: 1, class: gpr, preferred-register: '' }
- { id: 2, class: gpr, preferred-register: '' }
liveins:
fixedStack:
stack:
constants:
body: \|
bb.1 (%ir-block.0):
liveins: $edi

; ALL-LABEL: name: test_lshr_i32_imm1
; ALL: liveins: $edi
; ALL: [[COPY:%[0-9]+]]:gr32 = COPY $edi
; ALL: [[SHR32r1_:%[0-9]+]]:gr32 = SHR32r1 [[COPY]], implicit-def $eflags
; ALL: $eax = COPY [[SHR32r1_]]
; ALL: RET 0, implicit $eax
%0(s32) = COPY $edi
%1(s8) = G_CONSTANT i8 1
%2(s32) = G_LSHR %0, %1
$eax = COPY %2(s32)
RET 0, implicit $eax

...
---
name: test_lshr_i16		name: test_lshr_i16
alignment: 16		alignment: 16
legalized: true		legalized: true
regBankSelected: true		regBankSelected: true
tracksRegLiveness: true		tracksRegLiveness: true
registers:		registers:
- { id: 0, class: gpr, preferred-register: '' }		- { id: 0, class: gpr, preferred-register: '' }
- { id: 1, class: gpr, preferred-register: '' }		- { id: 1, class: gpr, preferred-register: '' }
▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines	bb.1 (%ir-block.0):
%2(s8) = G_CONSTANT i8 5		%2(s8) = G_CONSTANT i8 5
%1(s16) = G_TRUNC %0(s32)		%1(s16) = G_TRUNC %0(s32)
%3(s16) = G_LSHR %1, %2		%3(s16) = G_LSHR %1, %2
$ax = COPY %3(s16)		$ax = COPY %3(s16)
RET 0, implicit $ax		RET 0, implicit $ax

...		...
---		---
name: test_lshr_i16_imm1
alignment: 16
legalized: true
regBankSelected: true
tracksRegLiveness: true
registers:
- { id: 0, class: gpr, preferred-register: '' }
- { id: 1, class: gpr, preferred-register: '' }
- { id: 2, class: gpr, preferred-register: '' }
- { id: 3, class: gpr, preferred-register: '' }
liveins:
fixedStack:
stack:
constants:
body: \|
bb.1 (%ir-block.0):
liveins: $edi

; ALL-LABEL: name: test_lshr_i16_imm1
; ALL: liveins: $edi
; ALL: [[COPY:%[0-9]+]]:gr32 = COPY $edi
; ALL: [[COPY1:%[0-9]+]]:gr16 = COPY [[COPY]].sub_16bit
; ALL: [[SHR16r1_:%[0-9]+]]:gr16 = SHR16r1 [[COPY1]], implicit-def $eflags
; ALL: $ax = COPY [[SHR16r1_]]
; ALL: RET 0, implicit $ax
%0(s32) = COPY $edi
%2(s8) = G_CONSTANT i8 1
%1(s16) = G_TRUNC %0(s32)
%3(s16) = G_LSHR %1, %2
$ax = COPY %3(s16)
RET 0, implicit $ax

...
---
name: test_lshr_i8		name: test_lshr_i8
alignment: 16		alignment: 16
legalized: true		legalized: true
regBankSelected: true		regBankSelected: true
tracksRegLiveness: true		tracksRegLiveness: true
registers:		registers:
- { id: 0, class: gpr, preferred-register: '' }		- { id: 0, class: gpr, preferred-register: '' }
- { id: 1, class: gpr, preferred-register: '' }		- { id: 1, class: gpr, preferred-register: '' }
▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines	bb.1 (%ir-block.0):
%0(s32) = COPY $edi		%0(s32) = COPY $edi
%2(s8) = G_CONSTANT i8 5		%2(s8) = G_CONSTANT i8 5
%1(s8) = G_TRUNC %0(s32)		%1(s8) = G_TRUNC %0(s32)
%3(s8) = G_LSHR %1, %2		%3(s8) = G_LSHR %1, %2
$al = COPY %3(s8)		$al = COPY %3(s8)
RET 0, implicit $al		RET 0, implicit $al

...		...
---
name: test_lshr_i8_imm1
alignment: 16
legalized: true
regBankSelected: true
tracksRegLiveness: true
registers:
- { id: 0, class: gpr, preferred-register: '' }
- { id: 1, class: gpr, preferred-register: '' }
- { id: 2, class: gpr, preferred-register: '' }
- { id: 3, class: gpr, preferred-register: '' }
liveins:
fixedStack:
stack:
constants:
body: \|
bb.1 (%ir-block.0):
liveins: $edi

; ALL-LABEL: name: test_lshr_i8_imm1
; ALL: liveins: $edi
; ALL: [[COPY:%[0-9]+]]:gr32 = COPY $edi
; ALL: [[COPY1:%[0-9]+]]:gr8 = COPY [[COPY]].sub_8bit
; ALL: [[SHR8r1_:%[0-9]+]]:gr8 = SHR8r1 [[COPY1]], implicit-def $eflags
; ALL: $al = COPY [[SHR8r1_]]
; ALL: RET 0, implicit $al
%0(s32) = COPY $edi
%2(s8) = G_CONSTANT i8 1
%1(s8) = G_TRUNC %0(s32)
%3(s8) = G_LSHR %1, %2
$al = COPY %3(s8)
RET 0, implicit $al

...

llvm/test/CodeGen/X86/fast-isel-shift.ll

Show First 20 Lines • Show All 193 Lines • ▼ Show 20 Lines	; CHECK-NEXT: retq
%c = shl i64 %a, 1		%c = shl i64 %a, 1
ret i64 %c		ret i64 %c
}		}

define i8 @lshr_imm1_i8(i8 %a) {		define i8 @lshr_imm1_i8(i8 %a) {
; CHECK-LABEL: lshr_imm1_i8:		; CHECK-LABEL: lshr_imm1_i8:
; CHECK: ## %bb.0:		; CHECK: ## %bb.0:
; CHECK-NEXT: movl %edi, %eax		; CHECK-NEXT: movl %edi, %eax
; CHECK-NEXT: shrb $1, %al		; CHECK-NEXT: shrb %al
; CHECK-NEXT: ## kill: def $al killed $al killed $eax		; CHECK-NEXT: ## kill: def $al killed $al killed $eax
; CHECK-NEXT: retq		; CHECK-NEXT: retq
%c = lshr i8 %a, 1		%c = lshr i8 %a, 1
ret i8 %c		ret i8 %c
}		}

define i16 @lshr_imm1_i16(i16 %a) {		define i16 @lshr_imm1_i16(i16 %a) {
; CHECK-LABEL: lshr_imm1_i16:		; CHECK-LABEL: lshr_imm1_i16:
; CHECK: ## %bb.0:		; CHECK: ## %bb.0:
; CHECK-NEXT: movl %edi, %eax		; CHECK-NEXT: movl %edi, %eax
; CHECK-NEXT: shrw $1, %ax		; CHECK-NEXT: shrw %ax
; CHECK-NEXT: ## kill: def $ax killed $ax killed $eax		; CHECK-NEXT: ## kill: def $ax killed $ax killed $eax
; CHECK-NEXT: retq		; CHECK-NEXT: retq
%c = lshr i16 %a, 1		%c = lshr i16 %a, 1
ret i16 %c		ret i16 %c
}		}

define i32 @lshr_imm1_i32(i32 %a) {		define i32 @lshr_imm1_i32(i32 %a) {
; CHECK-LABEL: lshr_imm1_i32:		; CHECK-LABEL: lshr_imm1_i32:
; CHECK: ## %bb.0:		; CHECK: ## %bb.0:
; CHECK-NEXT: movl %edi, %eax		; CHECK-NEXT: movl %edi, %eax
; CHECK-NEXT: shrl $1, %eax		; CHECK-NEXT: shrl %eax
; CHECK-NEXT: retq		; CHECK-NEXT: retq
%c = lshr i32 %a, 1		%c = lshr i32 %a, 1
ret i32 %c		ret i32 %c
}		}

define i64 @lshr_imm1_i64(i64 %a) {		define i64 @lshr_imm1_i64(i64 %a) {
; CHECK-LABEL: lshr_imm1_i64:		; CHECK-LABEL: lshr_imm1_i64:
; CHECK: ## %bb.0:		; CHECK: ## %bb.0:
; CHECK-NEXT: movq %rdi, %rax		; CHECK-NEXT: movq %rdi, %rax
; CHECK-NEXT: shrq $1, %rax		; CHECK-NEXT: shrq %rax
; CHECK-NEXT: retq		; CHECK-NEXT: retq
%c = lshr i64 %a, 1		%c = lshr i64 %a, 1
ret i64 %c		ret i64 %c
}		}

define i8 @ashr_imm1_i8(i8 %a) {		define i8 @ashr_imm1_i8(i8 %a) {
; CHECK-LABEL: ashr_imm1_i8:		; CHECK-LABEL: ashr_imm1_i8:
; CHECK: ## %bb.0:		; CHECK: ## %bb.0:
; CHECK-NEXT: movl %edi, %eax		; CHECK-NEXT: movl %edi, %eax
; CHECK-NEXT: sarb $1, %al		; CHECK-NEXT: sarb %al
; CHECK-NEXT: ## kill: def $al killed $al killed $eax		; CHECK-NEXT: ## kill: def $al killed $al killed $eax
; CHECK-NEXT: retq		; CHECK-NEXT: retq
%c = ashr i8 %a, 1		%c = ashr i8 %a, 1
ret i8 %c		ret i8 %c
}		}

define i16 @ashr_imm1_i16(i16 %a) {		define i16 @ashr_imm1_i16(i16 %a) {
; CHECK-LABEL: ashr_imm1_i16:		; CHECK-LABEL: ashr_imm1_i16:
; CHECK: ## %bb.0:		; CHECK: ## %bb.0:
; CHECK-NEXT: movl %edi, %eax		; CHECK-NEXT: movl %edi, %eax
; CHECK-NEXT: sarw $1, %ax		; CHECK-NEXT: sarw %ax
; CHECK-NEXT: ## kill: def $ax killed $ax killed $eax		; CHECK-NEXT: ## kill: def $ax killed $ax killed $eax
; CHECK-NEXT: retq		; CHECK-NEXT: retq
%c = ashr i16 %a, 1		%c = ashr i16 %a, 1
ret i16 %c		ret i16 %c
}		}

define i32 @ashr_imm1_i32(i32 %a) {		define i32 @ashr_imm1_i32(i32 %a) {
; CHECK-LABEL: ashr_imm1_i32:		; CHECK-LABEL: ashr_imm1_i32:
; CHECK: ## %bb.0:		; CHECK: ## %bb.0:
; CHECK-NEXT: movl %edi, %eax		; CHECK-NEXT: movl %edi, %eax
; CHECK-NEXT: sarl $1, %eax		; CHECK-NEXT: sarl %eax
; CHECK-NEXT: retq		; CHECK-NEXT: retq
%c = ashr i32 %a, 1		%c = ashr i32 %a, 1
ret i32 %c		ret i32 %c
}		}

define i64 @ashr_imm1_i64(i64 %a) {		define i64 @ashr_imm1_i64(i64 %a) {
; CHECK-LABEL: ashr_imm1_i64:		; CHECK-LABEL: ashr_imm1_i64:
; CHECK: ## %bb.0:		; CHECK: ## %bb.0:
; CHECK-NEXT: movq %rdi, %rax		; CHECK-NEXT: movq %rdi, %rax
; CHECK-NEXT: sarq $1, %rax		; CHECK-NEXT: sarq %rax
; CHECK-NEXT: retq		; CHECK-NEXT: retq
%c = ashr i64 %a, 1		%c = ashr i64 %a, 1
ret i64 %c		ret i64 %c
}		}

define i8 @shl_imm4_i8(i8 %a) {		define i8 @shl_imm4_i8(i8 %a) {
; CHECK-LABEL: shl_imm4_i8:		; CHECK-LABEL: shl_imm4_i8:
; CHECK: ## %bb.0:		; CHECK: ## %bb.0:
▲ Show 20 Lines • Show All 135 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/gpr-to-mask.ll

	Show First 20 Lines • Show All 314 Lines • ▼ Show 20 Lines
	define void @test_shr1(i1 %cond, ptr %ptr1, ptr %ptr2, <8 x float> %fvec1, <8 x float> %fvec2, ptr %fptrvec) {			define void @test_shr1(i1 %cond, ptr %ptr1, ptr %ptr2, <8 x float> %fvec1, <8 x float> %fvec2, ptr %fptrvec) {
	; X86-64-LABEL: test_shr1:			; X86-64-LABEL: test_shr1:
	; X86-64: # %bb.0: # %entry			; X86-64: # %bb.0: # %entry
	; X86-64-NEXT: # kill: def $ymm1 killed $ymm1 def $zmm1			; X86-64-NEXT: # kill: def $ymm1 killed $ymm1 def $zmm1
	; X86-64-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0			; X86-64-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0
	; X86-64-NEXT: testb $1, %dil			; X86-64-NEXT: testb $1, %dil
	; X86-64-NEXT: je .LBB6_2			; X86-64-NEXT: je .LBB6_2
	; X86-64-NEXT: # %bb.1: # %if			; X86-64-NEXT: # %bb.1: # %if
	; X86-64-NEXT: movzbl (%rsi), %eax			; X86-64-NEXT: kmovb (%rsi), %k0
	; X86-64-NEXT: shrb %al			; X86-64-NEXT: kshiftrb $1, %k0, %k1
	; X86-64-NEXT: jmp .LBB6_3			; X86-64-NEXT: jmp .LBB6_3
	; X86-64-NEXT: .LBB6_2: # %else			; X86-64-NEXT: .LBB6_2: # %else
	; X86-64-NEXT: movzbl (%rdx), %eax			; X86-64-NEXT: kmovb (%rdx), %k1
	; X86-64-NEXT: .LBB6_3: # %exit			; X86-64-NEXT: .LBB6_3: # %exit
	; X86-64-NEXT: kmovd %eax, %k1
	; X86-64-NEXT: vmovaps %zmm0, %zmm1 {%k1}			; X86-64-NEXT: vmovaps %zmm0, %zmm1 {%k1}
	; X86-64-NEXT: vmovaps %ymm1, (%rcx)			; X86-64-NEXT: vmovaps %ymm1, (%rcx)
	; X86-64-NEXT: vzeroupper			; X86-64-NEXT: vzeroupper
	; X86-64-NEXT: retq			; X86-64-NEXT: retq
	;			;
	; X86-32-LABEL: test_shr1:			; X86-32-LABEL: test_shr1:
	; X86-32: # %bb.0: # %entry			; X86-32: # %bb.0: # %entry
	; X86-32-NEXT: # kill: def $ymm1 killed $ymm1 def $zmm1			; X86-32-NEXT: # kill: def $ymm1 killed $ymm1 def $zmm1
	; X86-32-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0			; X86-32-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0
	; X86-32-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-32-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-32-NEXT: testb $1, {{[0-9]+}}(%esp)			; X86-32-NEXT: testb $1, {{[0-9]+}}(%esp)
	; X86-32-NEXT: je .LBB6_2			; X86-32-NEXT: je .LBB6_2
	; X86-32-NEXT: # %bb.1: # %if			; X86-32-NEXT: # %bb.1: # %if
	; X86-32-NEXT: movl {{[0-9]+}}(%esp), %ecx			; X86-32-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X86-32-NEXT: movzbl (%ecx), %ecx			; X86-32-NEXT: kmovb (%ecx), %k0
	; X86-32-NEXT: shrb %cl			; X86-32-NEXT: kshiftrb $1, %k0, %k1
	; X86-32-NEXT: jmp .LBB6_3			; X86-32-NEXT: jmp .LBB6_3
	; X86-32-NEXT: .LBB6_2: # %else			; X86-32-NEXT: .LBB6_2: # %else
	; X86-32-NEXT: movl {{[0-9]+}}(%esp), %ecx			; X86-32-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X86-32-NEXT: movzbl (%ecx), %ecx			; X86-32-NEXT: kmovb (%ecx), %k1
	; X86-32-NEXT: .LBB6_3: # %exit			; X86-32-NEXT: .LBB6_3: # %exit
	; X86-32-NEXT: kmovd %ecx, %k1
	; X86-32-NEXT: vmovaps %zmm0, %zmm1 {%k1}			; X86-32-NEXT: vmovaps %zmm0, %zmm1 {%k1}
	; X86-32-NEXT: vmovaps %ymm1, (%eax)			; X86-32-NEXT: vmovaps %ymm1, (%eax)
	; X86-32-NEXT: vzeroupper			; X86-32-NEXT: vzeroupper
	; X86-32-NEXT: retl			; X86-32-NEXT: retl
	entry:			entry:
	br i1 %cond, label %if, label %else			br i1 %cond, label %if, label %else

	if:			if:
	▲ Show 20 Lines • Show All 195 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/is_fpclass.ll

	Show First 20 Lines • Show All 1,405 Lines • ▼ Show 20 Lines
	; CHECK-32-NEXT: andl {{[0-9]+}}(%esp), %eax			; CHECK-32-NEXT: andl {{[0-9]+}}(%esp), %eax
	; CHECK-32-NEXT: orl {{[0-9]+}}(%esp), %eax			; CHECK-32-NEXT: orl {{[0-9]+}}(%esp), %eax
	; CHECK-32-NEXT: sete %al			; CHECK-32-NEXT: sete %al
	; CHECK-32-NEXT: retl			; CHECK-32-NEXT: retl
	;			;
	; CHECK-64-LABEL: iszero_d_strictfp:			; CHECK-64-LABEL: iszero_d_strictfp:
	; CHECK-64: # %bb.0: # %entry			; CHECK-64: # %bb.0: # %entry
	; CHECK-64-NEXT: movq %xmm0, %rax			; CHECK-64-NEXT: movq %xmm0, %rax
	; CHECK-64-NEXT: shlq $1, %rax			; CHECK-64-NEXT: shlq %rax
	; CHECK-64-NEXT: testq %rax, %rax			; CHECK-64-NEXT: testq %rax, %rax
	; CHECK-64-NEXT: sete %al			; CHECK-64-NEXT: sete %al
	; CHECK-64-NEXT: retq			; CHECK-64-NEXT: retq
	entry:			entry:
	%0 = tail call i1 @llvm.is.fpclass.f64(double %x, i32 96) ; 0x60 = "zero"			%0 = tail call i1 @llvm.is.fpclass.f64(double %x, i32 96) ; 0x60 = "zero"
	ret i1 %0			ret i1 %0
	}			}

	▲ Show 20 Lines • Show All 691 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Remove patterns for shift/rotate with immediate 1 and optimize during MC loweringClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 523003

llvm/lib/Target/X86/X86ISelLowering.cpp

llvm/lib/Target/X86/X86InstrInfo.cpp

llvm/lib/Target/X86/X86InstrShiftRotate.td

llvm/lib/Target/X86/X86MCInstLower.cpp

llvm/test/CodeGen/X86/GlobalISel/ashr-scalar.ll

llvm/test/CodeGen/X86/GlobalISel/lshr-scalar.ll

llvm/test/CodeGen/X86/GlobalISel/select-ashr-scalar.mir

llvm/test/CodeGen/X86/GlobalISel/select-lshr-scalar.mir

llvm/test/CodeGen/X86/fast-isel-shift.ll

llvm/test/CodeGen/X86/gpr-to-mask.ll

llvm/test/CodeGen/X86/is_fpclass.ll

[X86] Remove patterns for shift/rotate with immediate 1 and optimize during MC lowering
ClosedPublic