Diff 155380

lib/Target/X86/X86InstrInfo.td

Show First 20 Lines • Show All 1,743 Lines • ▼ Show 20 Lines
def LAHF : I<0x9F, RawFrm, (outs), (ins), "lahf", []>, // AH = flags		def LAHF : I<0x9F, RawFrm, (outs), (ins), "lahf", []>, // AH = flags
Requires<[HasLAHFSAHF]>;		Requires<[HasLAHFSAHF]>;
} // SchedRW		} // SchedRW

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// Bit tests instructions: BT, BTS, BTR, BTC.		// Bit tests instructions: BT, BTS, BTR, BTC.

let Defs = [EFLAGS] in {		let Defs = [EFLAGS] in {
let SchedRW = [WriteALU] in {		let SchedRW = [WriteBitTest] in {
def BT16rr : I<0xA3, MRMDestReg, (outs), (ins GR16:$src1, GR16:$src2),		def BT16rr : I<0xA3, MRMDestReg, (outs), (ins GR16:$src1, GR16:$src2),
"bt{w}\t{$src2, $src1\|$src1, $src2}",		"bt{w}\t{$src2, $src1\|$src1, $src2}",
[(set EFLAGS, (X86bt GR16:$src1, GR16:$src2))]>,		[(set EFLAGS, (X86bt GR16:$src1, GR16:$src2))]>,
OpSize16, TB, NotMemoryFoldable;		OpSize16, TB, NotMemoryFoldable;
def BT32rr : I<0xA3, MRMDestReg, (outs), (ins GR32:$src1, GR32:$src2),		def BT32rr : I<0xA3, MRMDestReg, (outs), (ins GR32:$src1, GR32:$src2),
"bt{l}\t{$src2, $src1\|$src1, $src2}",		"bt{l}\t{$src2, $src1\|$src1, $src2}",
[(set EFLAGS, (X86bt GR32:$src1, GR32:$src2))]>,		[(set EFLAGS, (X86bt GR32:$src1, GR32:$src2))]>,
OpSize32, TB, NotMemoryFoldable;		OpSize32, TB, NotMemoryFoldable;
Show All 16 Lines	let mayLoad = 1, hasSideEffects = 0, SchedRW = [WriteALULd] in {
def BT32mr : I<0xA3, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),		def BT32mr : I<0xA3, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),
"bt{l}\t{$src2, $src1\|$src1, $src2}",		"bt{l}\t{$src2, $src1\|$src1, $src2}",
[]>, OpSize32, TB, NotMemoryFoldable;		[]>, OpSize32, TB, NotMemoryFoldable;
def BT64mr : RI<0xA3, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),		def BT64mr : RI<0xA3, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),
"bt{q}\t{$src2, $src1\|$src1, $src2}",		"bt{q}\t{$src2, $src1\|$src1, $src2}",
[]>, TB, NotMemoryFoldable;		[]>, TB, NotMemoryFoldable;
}		}

let SchedRW = [WriteALU] in {		let SchedRW = [WriteBitTest] in {
def BT16ri8 : Ii8<0xBA, MRM4r, (outs), (ins GR16:$src1, i16i8imm:$src2),		def BT16ri8 : Ii8<0xBA, MRM4r, (outs), (ins GR16:$src1, i16i8imm:$src2),
"bt{w}\t{$src2, $src1\|$src1, $src2}",		"bt{w}\t{$src2, $src1\|$src1, $src2}",
[(set EFLAGS, (X86bt GR16:$src1, i16immSExt8:$src2))]>,		[(set EFLAGS, (X86bt GR16:$src1, i16immSExt8:$src2))]>,
OpSize16, TB;		OpSize16, TB;
def BT32ri8 : Ii8<0xBA, MRM4r, (outs), (ins GR32:$src1, i32i8imm:$src2),		def BT32ri8 : Ii8<0xBA, MRM4r, (outs), (ins GR32:$src1, i32i8imm:$src2),
"bt{l}\t{$src2, $src1\|$src1, $src2}",		"bt{l}\t{$src2, $src1\|$src1, $src2}",
[(set EFLAGS, (X86bt GR32:$src1, i32immSExt8:$src2))]>,		[(set EFLAGS, (X86bt GR32:$src1, i32immSExt8:$src2))]>,
OpSize32, TB;		OpSize32, TB;
def BT64ri8 : RIi8<0xBA, MRM4r, (outs), (ins GR64:$src1, i64i8imm:$src2),		def BT64ri8 : RIi8<0xBA, MRM4r, (outs), (ins GR64:$src1, i64i8imm:$src2),
"bt{q}\t{$src2, $src1\|$src1, $src2}",		"bt{q}\t{$src2, $src1\|$src1, $src2}",
[(set EFLAGS, (X86bt GR64:$src1, i64immSExt8:$src2))]>, TB;		[(set EFLAGS, (X86bt GR64:$src1, i64immSExt8:$src2))]>, TB;
} // SchedRW		} // SchedRW

// Note that these instructions aren't slow because that only applies when the		// Note that these instructions aren't slow because that only applies when the
// other operand is in a register. When it's an immediate, bt is still fast.		// other operand is in a register. When it's an immediate, bt is still fast.
let SchedRW = [WriteALU] in {		let SchedRW = [WriteALU] in {
		RKSimonUnsubmitted Not Done Reply Inline Actions Why isn't this WriteBTLd ? RKSimon: Why isn't this WriteBTLd ?
		avt77AuthorUnsubmitted Not Done Reply Inline Actions This patch does not deal with mem at all but I'm going to do it asap. avt77: This patch does not deal with mem at all but I'm going to do it asap.
def BT16mi8 : Ii8<0xBA, MRM4m, (outs), (ins i16mem:$src1, i16i8imm:$src2),		def BT16mi8 : Ii8<0xBA, MRM4m, (outs), (ins i16mem:$src1, i16i8imm:$src2),
"bt{w}\t{$src2, $src1\|$src1, $src2}",		"bt{w}\t{$src2, $src1\|$src1, $src2}",
[(set EFLAGS, (X86bt (loadi16 addr:$src1),		[(set EFLAGS, (X86bt (loadi16 addr:$src1),
i16immSExt8:$src2))]>,		i16immSExt8:$src2))]>,
OpSize16, TB;		OpSize16, TB;
def BT32mi8 : Ii8<0xBA, MRM4m, (outs), (ins i32mem:$src1, i32i8imm:$src2),		def BT32mi8 : Ii8<0xBA, MRM4m, (outs), (ins i32mem:$src1, i32i8imm:$src2),
"bt{l}\t{$src2, $src1\|$src1, $src2}",		"bt{l}\t{$src2, $src1\|$src1, $src2}",
[(set EFLAGS, (X86bt (loadi32 addr:$src1),		[(set EFLAGS, (X86bt (loadi32 addr:$src1),
i32immSExt8:$src2))]>,		i32immSExt8:$src2))]>,
OpSize32, TB;		OpSize32, TB;
def BT64mi8 : RIi8<0xBA, MRM4m, (outs), (ins i64mem:$src1, i64i8imm:$src2),		def BT64mi8 : RIi8<0xBA, MRM4m, (outs), (ins i64mem:$src1, i64i8imm:$src2),
"bt{q}\t{$src2, $src1\|$src1, $src2}",		"bt{q}\t{$src2, $src1\|$src1, $src2}",
[(set EFLAGS, (X86bt (loadi64 addr:$src1),		[(set EFLAGS, (X86bt (loadi64 addr:$src1),
i64immSExt8:$src2))]>, TB,		i64immSExt8:$src2))]>, TB,
Requires<[In64BitMode]>;		Requires<[In64BitMode]>;
} // SchedRW		} // SchedRW

let hasSideEffects = 0 in {		let hasSideEffects = 0 in {
let SchedRW = [WriteALU], Constraints = "$src1 = $dst" in {		let SchedRW = [WriteBitTest], Constraints = "$src1 = $dst" in {
def BTC16rr : I<0xBB, MRMDestReg, (outs GR16:$dst), (ins GR16:$src1, GR16:$src2),		def BTC16rr : I<0xBB, MRMDestReg, (outs GR16:$dst), (ins GR16:$src1, GR16:$src2),
"btc{w}\t{$src2, $src1\|$src1, $src2}", []>,		"btc{w}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize16, TB, NotMemoryFoldable;		OpSize16, TB, NotMemoryFoldable;
def BTC32rr : I<0xBB, MRMDestReg, (outs GR32:$dst), (ins GR32:$src1, GR32:$src2),		def BTC32rr : I<0xBB, MRMDestReg, (outs GR32:$dst), (ins GR32:$src1, GR32:$src2),
"btc{l}\t{$src2, $src1\|$src1, $src2}", []>,		"btc{l}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize32, TB, NotMemoryFoldable;		OpSize32, TB, NotMemoryFoldable;
def BTC64rr : RI<0xBB, MRMDestReg, (outs GR64:$dst), (ins GR64:$src1, GR64:$src2),		def BTC64rr : RI<0xBB, MRMDestReg, (outs GR64:$dst), (ins GR64:$src1, GR64:$src2),
"btc{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,		"btc{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,
NotMemoryFoldable;		NotMemoryFoldable;
} // SchedRW		} // SchedRW

let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {		let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {
def BTC16mr : I<0xBB, MRMDestMem, (outs), (ins i16mem:$src1, GR16:$src2),		def BTC16mr : I<0xBB, MRMDestMem, (outs), (ins i16mem:$src1, GR16:$src2),
"btc{w}\t{$src2, $src1\|$src1, $src2}", []>,		"btc{w}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize16, TB, NotMemoryFoldable;		OpSize16, TB, NotMemoryFoldable;
def BTC32mr : I<0xBB, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),		def BTC32mr : I<0xBB, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),
"btc{l}\t{$src2, $src1\|$src1, $src2}", []>,		"btc{l}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize32, TB, NotMemoryFoldable;		OpSize32, TB, NotMemoryFoldable;
def BTC64mr : RI<0xBB, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),		def BTC64mr : RI<0xBB, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),
"btc{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,		"btc{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,
NotMemoryFoldable;		NotMemoryFoldable;
}		}

let SchedRW = [WriteALU], Constraints = "$src1 = $dst" in {		let SchedRW = [WriteBitTest], Constraints = "$src1 = $dst" in {
def BTC16ri8 : Ii8<0xBA, MRM7r, (outs GR16:$dst), (ins GR16:$src1, i16i8imm:$src2),		def BTC16ri8 : Ii8<0xBA, MRM7r, (outs GR16:$dst), (ins GR16:$src1, i16i8imm:$src2),
"btc{w}\t{$src2, $src1\|$src1, $src2}", []>, OpSize16, TB;		"btc{w}\t{$src2, $src1\|$src1, $src2}", []>, OpSize16, TB;
def BTC32ri8 : Ii8<0xBA, MRM7r, (outs GR32:$dst), (ins GR32:$src1, i32i8imm:$src2),		def BTC32ri8 : Ii8<0xBA, MRM7r, (outs GR32:$dst), (ins GR32:$src1, i32i8imm:$src2),
"btc{l}\t{$src2, $src1\|$src1, $src2}", []>, OpSize32, TB;		"btc{l}\t{$src2, $src1\|$src1, $src2}", []>, OpSize32, TB;
def BTC64ri8 : RIi8<0xBA, MRM7r, (outs GR64:$dst), (ins GR64:$src1, i64i8imm:$src2),		def BTC64ri8 : RIi8<0xBA, MRM7r, (outs GR64:$dst), (ins GR64:$src1, i64i8imm:$src2),
"btc{q}\t{$src2, $src1\|$src1, $src2}", []>, TB;		"btc{q}\t{$src2, $src1\|$src1, $src2}", []>, TB;
} // SchedRW		} // SchedRW

let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {		let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {
def BTC16mi8 : Ii8<0xBA, MRM7m, (outs), (ins i16mem:$src1, i16i8imm:$src2),		def BTC16mi8 : Ii8<0xBA, MRM7m, (outs), (ins i16mem:$src1, i16i8imm:$src2),
"btc{w}\t{$src2, $src1\|$src1, $src2}", []>, OpSize16, TB;		"btc{w}\t{$src2, $src1\|$src1, $src2}", []>, OpSize16, TB;
def BTC32mi8 : Ii8<0xBA, MRM7m, (outs), (ins i32mem:$src1, i32i8imm:$src2),		def BTC32mi8 : Ii8<0xBA, MRM7m, (outs), (ins i32mem:$src1, i32i8imm:$src2),
"btc{l}\t{$src2, $src1\|$src1, $src2}", []>, OpSize32, TB;		"btc{l}\t{$src2, $src1\|$src1, $src2}", []>, OpSize32, TB;
def BTC64mi8 : RIi8<0xBA, MRM7m, (outs), (ins i64mem:$src1, i64i8imm:$src2),		def BTC64mi8 : RIi8<0xBA, MRM7m, (outs), (ins i64mem:$src1, i64i8imm:$src2),
"btc{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,		"btc{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,
Requires<[In64BitMode]>;		Requires<[In64BitMode]>;
}		}

let SchedRW = [WriteALU], Constraints = "$src1 = $dst" in {		let SchedRW = [WriteBitTest], Constraints = "$src1 = $dst" in {
def BTR16rr : I<0xB3, MRMDestReg, (outs GR16:$dst), (ins GR16:$src1, GR16:$src2),		def BTR16rr : I<0xB3, MRMDestReg, (outs GR16:$dst), (ins GR16:$src1, GR16:$src2),
"btr{w}\t{$src2, $src1\|$src1, $src2}", []>,		"btr{w}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize16, TB, NotMemoryFoldable;		OpSize16, TB, NotMemoryFoldable;
def BTR32rr : I<0xB3, MRMDestReg, (outs GR32:$dst), (ins GR32:$src1, GR32:$src2),		def BTR32rr : I<0xB3, MRMDestReg, (outs GR32:$dst), (ins GR32:$src1, GR32:$src2),
"btr{l}\t{$src2, $src1\|$src1, $src2}", []>,		"btr{l}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize32, TB, NotMemoryFoldable;		OpSize32, TB, NotMemoryFoldable;
def BTR64rr : RI<0xB3, MRMDestReg, (outs GR64:$dst), (ins GR64:$src1, GR64:$src2),		def BTR64rr : RI<0xB3, MRMDestReg, (outs GR64:$dst), (ins GR64:$src1, GR64:$src2),
"btr{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,		"btr{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,
NotMemoryFoldable;		NotMemoryFoldable;
} // SchedRW		} // SchedRW

let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {		let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {
def BTR16mr : I<0xB3, MRMDestMem, (outs), (ins i16mem:$src1, GR16:$src2),		def BTR16mr : I<0xB3, MRMDestMem, (outs), (ins i16mem:$src1, GR16:$src2),
"btr{w}\t{$src2, $src1\|$src1, $src2}", []>,		"btr{w}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize16, TB, NotMemoryFoldable;		OpSize16, TB, NotMemoryFoldable;
def BTR32mr : I<0xB3, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),		def BTR32mr : I<0xB3, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),
"btr{l}\t{$src2, $src1\|$src1, $src2}", []>,		"btr{l}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize32, TB, NotMemoryFoldable;		OpSize32, TB, NotMemoryFoldable;
def BTR64mr : RI<0xB3, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),		def BTR64mr : RI<0xB3, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),
"btr{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,		"btr{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,
NotMemoryFoldable;		NotMemoryFoldable;
}		}

let SchedRW = [WriteALU], Constraints = "$src1 = $dst" in {		let SchedRW = [WriteBitTest], Constraints = "$src1 = $dst" in {
def BTR16ri8 : Ii8<0xBA, MRM6r, (outs GR16:$dst), (ins GR16:$src1, i16i8imm:$src2),		def BTR16ri8 : Ii8<0xBA, MRM6r, (outs GR16:$dst), (ins GR16:$src1, i16i8imm:$src2),
"btr{w}\t{$src2, $src1\|$src1, $src2}", []>,		"btr{w}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize16, TB;		OpSize16, TB;
def BTR32ri8 : Ii8<0xBA, MRM6r, (outs GR32:$dst), (ins GR32:$src1, i32i8imm:$src2),		def BTR32ri8 : Ii8<0xBA, MRM6r, (outs GR32:$dst), (ins GR32:$src1, i32i8imm:$src2),
"btr{l}\t{$src2, $src1\|$src1, $src2}", []>,		"btr{l}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize32, TB;		OpSize32, TB;
def BTR64ri8 : RIi8<0xBA, MRM6r, (outs GR64:$dst), (ins GR64:$src1, i64i8imm:$src2),		def BTR64ri8 : RIi8<0xBA, MRM6r, (outs GR64:$dst), (ins GR64:$src1, i64i8imm:$src2),
"btr{q}\t{$src2, $src1\|$src1, $src2}", []>, TB;		"btr{q}\t{$src2, $src1\|$src1, $src2}", []>, TB;
} // SchedRW		} // SchedRW

let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {		let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {
def BTR16mi8 : Ii8<0xBA, MRM6m, (outs), (ins i16mem:$src1, i16i8imm:$src2),		def BTR16mi8 : Ii8<0xBA, MRM6m, (outs), (ins i16mem:$src1, i16i8imm:$src2),
"btr{w}\t{$src2, $src1\|$src1, $src2}", []>,		"btr{w}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize16, TB;		OpSize16, TB;
def BTR32mi8 : Ii8<0xBA, MRM6m, (outs), (ins i32mem:$src1, i32i8imm:$src2),		def BTR32mi8 : Ii8<0xBA, MRM6m, (outs), (ins i32mem:$src1, i32i8imm:$src2),
"btr{l}\t{$src2, $src1\|$src1, $src2}", []>,		"btr{l}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize32, TB;		OpSize32, TB;
def BTR64mi8 : RIi8<0xBA, MRM6m, (outs), (ins i64mem:$src1, i64i8imm:$src2),		def BTR64mi8 : RIi8<0xBA, MRM6m, (outs), (ins i64mem:$src1, i64i8imm:$src2),
"btr{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,		"btr{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,
Requires<[In64BitMode]>;		Requires<[In64BitMode]>;
}		}

let SchedRW = [WriteALU], Constraints = "$src1 = $dst" in {		let SchedRW = [WriteBitTest], Constraints = "$src1 = $dst" in {
def BTS16rr : I<0xAB, MRMDestReg, (outs GR16:$dst), (ins GR16:$src1, GR16:$src2),		def BTS16rr : I<0xAB, MRMDestReg, (outs GR16:$dst), (ins GR16:$src1, GR16:$src2),
"bts{w}\t{$src2, $src1\|$src1, $src2}", []>,		"bts{w}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize16, TB, NotMemoryFoldable;		OpSize16, TB, NotMemoryFoldable;
def BTS32rr : I<0xAB, MRMDestReg, (outs GR32:$dst), (ins GR32:$src1, GR32:$src2),		def BTS32rr : I<0xAB, MRMDestReg, (outs GR32:$dst), (ins GR32:$src1, GR32:$src2),
"bts{l}\t{$src2, $src1\|$src1, $src2}", []>,		"bts{l}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize32, TB, NotMemoryFoldable;		OpSize32, TB, NotMemoryFoldable;
def BTS64rr : RI<0xAB, MRMDestReg, (outs GR64:$dst), (ins GR64:$src1, GR64:$src2),		def BTS64rr : RI<0xAB, MRMDestReg, (outs GR64:$dst), (ins GR64:$src1, GR64:$src2),
"bts{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,		"bts{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,
NotMemoryFoldable;		NotMemoryFoldable;
} // SchedRW		} // SchedRW

let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {		let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {
def BTS16mr : I<0xAB, MRMDestMem, (outs), (ins i16mem:$src1, GR16:$src2),		def BTS16mr : I<0xAB, MRMDestMem, (outs), (ins i16mem:$src1, GR16:$src2),
"bts{w}\t{$src2, $src1\|$src1, $src2}", []>,		"bts{w}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize16, TB, NotMemoryFoldable;		OpSize16, TB, NotMemoryFoldable;
def BTS32mr : I<0xAB, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),		def BTS32mr : I<0xAB, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),
"bts{l}\t{$src2, $src1\|$src1, $src2}", []>,		"bts{l}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize32, TB, NotMemoryFoldable;		OpSize32, TB, NotMemoryFoldable;
def BTS64mr : RI<0xAB, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),		def BTS64mr : RI<0xAB, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),
"bts{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,		"bts{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,
NotMemoryFoldable;		NotMemoryFoldable;
}		}

let SchedRW = [WriteALU], Constraints = "$src1 = $dst" in {		let SchedRW = [WriteBitTest], Constraints = "$src1 = $dst" in {
def BTS16ri8 : Ii8<0xBA, MRM5r, (outs GR16:$dst), (ins GR16:$src1, i16i8imm:$src2),		def BTS16ri8 : Ii8<0xBA, MRM5r, (outs GR16:$dst), (ins GR16:$src1, i16i8imm:$src2),
"bts{w}\t{$src2, $src1\|$src1, $src2}", []>, OpSize16, TB;		"bts{w}\t{$src2, $src1\|$src1, $src2}", []>, OpSize16, TB;
def BTS32ri8 : Ii8<0xBA, MRM5r, (outs GR32:$dst), (ins GR32:$src1, i32i8imm:$src2),		def BTS32ri8 : Ii8<0xBA, MRM5r, (outs GR32:$dst), (ins GR32:$src1, i32i8imm:$src2),
"bts{l}\t{$src2, $src1\|$src1, $src2}", []>, OpSize32, TB;		"bts{l}\t{$src2, $src1\|$src1, $src2}", []>, OpSize32, TB;
def BTS64ri8 : RIi8<0xBA, MRM5r, (outs GR64:$dst), (ins GR64:$src1, i64i8imm:$src2),		def BTS64ri8 : RIi8<0xBA, MRM5r, (outs GR64:$dst), (ins GR64:$src1, i64i8imm:$src2),
"bts{q}\t{$src2, $src1\|$src1, $src2}", []>, TB;		"bts{q}\t{$src2, $src1\|$src1, $src2}", []>, TB;
} // SchedRW		} // SchedRW

▲ Show 20 Lines • Show All 1,559 Lines • Show Last 20 Lines

lib/Target/X86/X86SchedBroadwell.td

	Show First 20 Lines • Show All 104 Lines • ▼ Show 20 Lines
	// 2/3/7 cycle to recompute the address.			// 2/3/7 cycle to recompute the address.
	def : WriteRes<WriteRMW, [BWPort237,BWPort4]>;			def : WriteRes<WriteRMW, [BWPort237,BWPort4]>;

	// Arithmetic.			// Arithmetic.
	defm : BWWriteResPair<WriteALU, [BWPort0156], 1>; // Simple integer ALU op.			defm : BWWriteResPair<WriteALU, [BWPort0156], 1>; // Simple integer ALU op.
	defm : BWWriteResPair<WriteADC, [BWPort06], 1>; // Integer ALU + flags op.			defm : BWWriteResPair<WriteADC, [BWPort06], 1>; // Integer ALU + flags op.
	defm : BWWriteResPair<WriteIMul, [BWPort1], 3>; // Integer multiplication.			defm : BWWriteResPair<WriteIMul, [BWPort1], 3>; // Integer multiplication.
	defm : BWWriteResPair<WriteIMul64, [BWPort1], 3>; // Integer 64-bit multiplication.			defm : BWWriteResPair<WriteIMul64, [BWPort1], 3>; // Integer 64-bit multiplication.
				defm : BWWriteResPair<WriteBitTest,[BWPort06], 1>; //

	defm : BWWriteResPair<WriteDiv8, [BWPort0, BWDivider], 25, [1, 10]>;			defm : BWWriteResPair<WriteDiv8, [BWPort0, BWDivider], 25, [1, 10]>;
	defm : BWWriteResPair<WriteDiv16, [BWPort0, BWDivider], 25, [1, 10]>;			defm : BWWriteResPair<WriteDiv16, [BWPort0, BWDivider], 25, [1, 10]>;
	defm : BWWriteResPair<WriteDiv32, [BWPort0, BWDivider], 25, [1, 10]>;			defm : BWWriteResPair<WriteDiv32, [BWPort0, BWDivider], 25, [1, 10]>;
	defm : BWWriteResPair<WriteDiv64, [BWPort0, BWDivider], 25, [1, 10]>;			defm : BWWriteResPair<WriteDiv64, [BWPort0, BWDivider], 25, [1, 10]>;
	defm : BWWriteResPair<WriteIDiv8, [BWPort0, BWDivider], 25, [1, 10]>;			defm : BWWriteResPair<WriteIDiv8, [BWPort0, BWDivider], 25, [1, 10]>;
	defm : BWWriteResPair<WriteIDiv16, [BWPort0, BWDivider], 25, [1, 10]>;			defm : BWWriteResPair<WriteIDiv16, [BWPort0, BWDivider], 25, [1, 10]>;
	defm : BWWriteResPair<WriteIDiv32, [BWPort0, BWDivider], 25, [1, 10]>;			defm : BWWriteResPair<WriteIDiv32, [BWPort0, BWDivider], 25, [1, 10]>;
	▲ Show 20 Lines • Show All 472 Lines • ▼ Show 20 Lines
	def: InstRW<[BWWriteResGroup5], (instrs FINCSTP, FNOP)>;			def: InstRW<[BWWriteResGroup5], (instrs FINCSTP, FNOP)>;

	def BWWriteResGroup6 : SchedWriteRes<[BWPort06]> {			def BWWriteResGroup6 : SchedWriteRes<[BWPort06]> {
	let Latency = 1;			let Latency = 1;
	let NumMicroOps = 1;			let NumMicroOps = 1;
	let ResourceCycles = [1];			let ResourceCycles = [1];
	}			}
	def: InstRW<[BWWriteResGroup6], (instrs CDQ, CQO)>;			def: InstRW<[BWWriteResGroup6], (instrs CDQ, CQO)>;
	def: InstRW<[BWWriteResGroup6], (instregex "BT(16\|32\|64)ri8",
	"BT(16\|32\|64)rr",
	"BTC(16\|32\|64)ri8",
	"BTC(16\|32\|64)rr",
	"BTR(16\|32\|64)ri8",
	"BTR(16\|32\|64)rr",
	"BTS(16\|32\|64)ri8",
	"BTS(16\|32\|64)rr")>;

	def BWWriteResGroup7 : SchedWriteRes<[BWPort15]> {			def BWWriteResGroup7 : SchedWriteRes<[BWPort15]> {
	let Latency = 1;			let Latency = 1;
	let NumMicroOps = 1;			let NumMicroOps = 1;
	let ResourceCycles = [1];			let ResourceCycles = [1];
	}			}
	def: InstRW<[BWWriteResGroup7], (instregex "ANDN(32\|64)rr",			def: InstRW<[BWWriteResGroup7], (instregex "ANDN(32\|64)rr",
	"BLSI(32\|64)rr",			"BLSI(32\|64)rr",
	▲ Show 20 Lines • Show All 1,118 Lines • Show Last 20 Lines

lib/Target/X86/X86SchedHaswell.td

	Show First 20 Lines • Show All 113 Lines • ▼ Show 20 Lines
	// Store_data on 4.			// Store_data on 4.
	defm : X86WriteRes<WriteStore, [HWPort237, HWPort4], 1, [1,1], 1>;			defm : X86WriteRes<WriteStore, [HWPort237, HWPort4], 1, [1,1], 1>;
	defm : X86WriteRes<WriteStoreNT, [HWPort237, HWPort4], 1, [1,1], 2>;			defm : X86WriteRes<WriteStoreNT, [HWPort237, HWPort4], 1, [1,1], 2>;
	defm : X86WriteRes<WriteLoad, [HWPort23], 5, [1], 1>;			defm : X86WriteRes<WriteLoad, [HWPort23], 5, [1], 1>;
	defm : X86WriteRes<WriteMove, [HWPort0156], 1, [1], 1>;			defm : X86WriteRes<WriteMove, [HWPort0156], 1, [1], 1>;
	def : WriteRes<WriteZero, []>;			def : WriteRes<WriteZero, []>;

	defm : HWWriteResPair<WriteALU, [HWPort0156], 1>;			defm : HWWriteResPair<WriteALU, [HWPort0156], 1>;
				defm : HWWriteResPair<WriteBitTest,[HWPort06], 1>;
	defm : HWWriteResPair<WriteADC, [HWPort06,HWPort0156], 2, [1,1], 2>;			defm : HWWriteResPair<WriteADC, [HWPort06,HWPort0156], 2, [1,1], 2>;
	defm : HWWriteResPair<WriteIMul, [HWPort1], 3>;			defm : HWWriteResPair<WriteIMul, [HWPort1], 3>;
	defm : HWWriteResPair<WriteIMul64, [HWPort1], 3>;			defm : HWWriteResPair<WriteIMul64, [HWPort1], 3>;
	def : WriteRes<WriteIMulH, []> { let Latency = 3; }			def : WriteRes<WriteIMulH, []> { let Latency = 3; }
	defm : HWWriteResPair<WriteShift, [HWPort06], 1>;			defm : HWWriteResPair<WriteShift, [HWPort06], 1>;
	defm : HWWriteResPair<WriteShiftDouble, [HWPort06], 1>;			defm : HWWriteResPair<WriteShiftDouble, [HWPort06], 1>;
	defm : HWWriteResPair<WriteJump, [HWPort06], 1>;			defm : HWWriteResPair<WriteJump, [HWPort06], 1>;
	defm : HWWriteResPair<WriteCRC32, [HWPort1], 3>;			defm : HWWriteResPair<WriteCRC32, [HWPort1], 3>;
	▲ Show 20 Lines • Show All 493 Lines • ▼ Show 20 Lines
	}			}
	def : InstRW<[HWWriteBTmr], (instregex "BT(16\|32\|64)mr")>;			def : InstRW<[HWWriteBTmr], (instregex "BT(16\|32\|64)mr")>;

	// BTR BTS BTC.			// BTR BTS BTC.
	// m,r.			// m,r.
	def HWWriteBTRSCmr : SchedWriteRes<[]> {			def HWWriteBTRSCmr : SchedWriteRes<[]> {
	let NumMicroOps = 11;			let NumMicroOps = 11;
	}			}
	def : InstRW<[HWWriteBTRSCmr], (instregex "BT(R\|S\|C)(16\|32\|64)mr")>;			def : InstRW<[HWWriteBTRSCmr], (instregex "BT(R\|S\|C)(16\|32\|64)mr")>;
				RKSimonUnsubmitted Not Done Reply Inline Actions @craig.topper @courbet @gchatelet These look completely wrong (and BTmr above) - and Broadwell appears to be missing them as well - any suggestions for the bit tests memory cases? RKSimon: @craig.topper @courbet @gchatelet These look completely wrong (and BTmr above) - and Broadwell…
				craig.topperUnsubmitted Not Done Reply Inline Actions Skylake doesn't even have an InstRW for them. They're also missing from the copy of the database used by IACA that I have. I believe that's where Gadi got most of the info from. I wonder what IACA does if you feed it those instructions. craig.topper: Skylake doesn't even have an InstRW for them. They're also missing from the copy of the…
				courbetUnsubmitted Not Done Reply Inline Actions I can't tell for latencies because we do not support memory operands yet. For uops, I have working support in this patch: https://reviews.llvm.org/D48935 On haswell, this gives: --- mode: uops key: instructions: - 'BTC64mr RDI i_0x1x i_0x0x R9' - 'BTC64mr RDI i_0x1x i_0x64x RBX' - 'BTC64mr RDI i_0x1x i_0x128x RSI' - 'BTC64mr RDI i_0x1x i_0x192x RCX' - 'BTC64mr RDI i_0x1x i_0x256x R8' - 'BTC64mr RDI i_0x1x i_0x320x RDX' config: '' cpu_name: haswell llvm_triple: x86_64-unknown-linux-gnu num_repetitions: 10000 measurements: - { key: '3', value: 1.3771, debug_string: HWPort0 } - { key: '4', value: 1.8848, debug_string: HWPort1 } - { key: '5', value: 1.3687, debug_string: HWPort2 } - { key: '6', value: 0.728, debug_string: HWPort3 } - { key: '7', value: 1.0025, debug_string: HWPort4 } - { key: '8', value: 1.6272, debug_string: HWPort5 } - { key: '9', value: 2.1307, debug_string: HWPort6 } - { key: '10', value: 0.0002, debug_string: HWPort7 } error: '' info: instruction is parallel, repeating a random one. assembled_snippet: 5349C7C10100000048C7C30100000048C7C60100000048C7C10100000049C7C00100000048C7C2010000004C0FBB0F480FBB5F40480FBBB780000000480FBB8FC00000004C0FBB8700010000480FBB97400100004C0FBB0F480FBB5F40480FBBB780000000480FBB8FC00000004C0FBB8700010000480FBB97400100004C0FBB0F480FBB5F40480FBBB780000000480FBB8FC00000004C0FBB8700010000480FBB97400100004C0FBB0F480FBB5F40480FBBB780000000480FBB8FC00000005BC3 ... Other instructions are similar. This is a bit noisy unfortunately. This looks like 2P23 (or maybe P23 + P237, P7 being unused for some reason ?) + 7P0156 + P4. courbet: I can't tell for latencies because we do not support memory operands yet. For uops, I have…

	//-- Control transfer instructions --//			//-- Control transfer instructions --//

	// CALL.			// CALL.
	// i.			// i.
	def HWWriteRETI : SchedWriteRes<[HWPort23, HWPort6, HWPort015]> {			def HWWriteRETI : SchedWriteRes<[HWPort23, HWPort6, HWPort015]> {
	let NumMicroOps = 4;			let NumMicroOps = 4;
	let ResourceCycles = [1, 2, 1];			let ResourceCycles = [1, 2, 1];
	▲ Show 20 Lines • Show All 237 Lines • ▼ Show 20 Lines
	def: InstRW<[HWWriteResGroup6], (instrs FINCSTP, FNOP)>;			def: InstRW<[HWWriteResGroup6], (instrs FINCSTP, FNOP)>;

	def HWWriteResGroup7 : SchedWriteRes<[HWPort06]> {			def HWWriteResGroup7 : SchedWriteRes<[HWPort06]> {
	let Latency = 1;			let Latency = 1;
	let NumMicroOps = 1;			let NumMicroOps = 1;
	let ResourceCycles = [1];			let ResourceCycles = [1];
	}			}
	def: InstRW<[HWWriteResGroup7], (instrs CDQ, CQO)>;			def: InstRW<[HWWriteResGroup7], (instrs CDQ, CQO)>;
	def: InstRW<[HWWriteResGroup7], (instregex "BT(16\|32\|64)ri8",
	"BT(16\|32\|64)rr",
	"BTC(16\|32\|64)ri8",
	"BTC(16\|32\|64)rr",
	"BTR(16\|32\|64)ri8",
	"BTR(16\|32\|64)rr",
	"BTS(16\|32\|64)ri8",
	"BTS(16\|32\|64)rr")>;

	def HWWriteResGroup8 : SchedWriteRes<[HWPort15]> {			def HWWriteResGroup8 : SchedWriteRes<[HWPort15]> {
	let Latency = 1;			let Latency = 1;
	let NumMicroOps = 1;			let NumMicroOps = 1;
	let ResourceCycles = [1];			let ResourceCycles = [1];
	}			}
	def: InstRW<[HWWriteResGroup8], (instregex "ANDN(32\|64)rr",			def: InstRW<[HWWriteResGroup8], (instregex "ANDN(32\|64)rr",
	"BLSI(32\|64)rr",			"BLSI(32\|64)rr",
	▲ Show 20 Lines • Show All 1,109 Lines • Show Last 20 Lines

lib/Target/X86/X86SchedSandyBridge.td

	Show First 20 Lines • Show All 101 Lines • ▼ Show 20 Lines

	def : WriteRes<WriteStore, [SBPort23, SBPort4]>;			def : WriteRes<WriteStore, [SBPort23, SBPort4]>;
	def : WriteRes<WriteStoreNT, [SBPort23, SBPort4]>;			def : WriteRes<WriteStoreNT, [SBPort23, SBPort4]>;
	def : WriteRes<WriteLoad, [SBPort23]> { let Latency = 5; }			def : WriteRes<WriteLoad, [SBPort23]> { let Latency = 5; }
	def : WriteRes<WriteMove, [SBPort015]>;			def : WriteRes<WriteMove, [SBPort015]>;
	def : WriteRes<WriteZero, []>;			def : WriteRes<WriteZero, []>;

	defm : SBWriteResPair<WriteALU, [SBPort015], 1>;			defm : SBWriteResPair<WriteALU, [SBPort015], 1>;
				defm : SBWriteResPair<WriteBitTest,[SBPort05], 1, [1]>;
	defm : SBWriteResPair<WriteADC, [SBPort05,SBPort015], 2, [1,1], 2>;			defm : SBWriteResPair<WriteADC, [SBPort05,SBPort015], 2, [1,1], 2>;
	defm : SBWriteResPair<WriteIMul, [SBPort1], 3>;			defm : SBWriteResPair<WriteIMul, [SBPort1], 3>;
	defm : SBWriteResPair<WriteIMul64, [SBPort1], 3>;			defm : SBWriteResPair<WriteIMul64, [SBPort1], 3>;

	defm : SBWriteResPair<WriteDiv8, [SBPort0, SBDivider], 25, [1, 10]>;			defm : SBWriteResPair<WriteDiv8, [SBPort0, SBDivider], 25, [1, 10]>;
	defm : SBWriteResPair<WriteDiv16, [SBPort0, SBDivider], 25, [1, 10]>;			defm : SBWriteResPair<WriteDiv16, [SBPort0, SBDivider], 25, [1, 10]>;
	defm : SBWriteResPair<WriteDiv32, [SBPort0, SBDivider], 25, [1, 10]>;			defm : SBWriteResPair<WriteDiv32, [SBPort0, SBDivider], 25, [1, 10]>;
	defm : SBWriteResPair<WriteDiv64, [SBPort0, SBDivider], 25, [1, 10]>;			defm : SBWriteResPair<WriteDiv64, [SBPort0, SBDivider], 25, [1, 10]>;
	▲ Show 20 Lines • Show All 438 Lines • ▼ Show 20 Lines
	def: InstRW<[SBWriteResGroup2], (instrs RETQ)>;			def: InstRW<[SBWriteResGroup2], (instrs RETQ)>;

	def SBWriteResGroup4 : SchedWriteRes<[SBPort05]> {			def SBWriteResGroup4 : SchedWriteRes<[SBPort05]> {
	let Latency = 1;			let Latency = 1;
	let NumMicroOps = 1;			let NumMicroOps = 1;
	let ResourceCycles = [1];			let ResourceCycles = [1];
	}			}
	def: InstRW<[SBWriteResGroup4], (instrs CDQ, CQO)>;			def: InstRW<[SBWriteResGroup4], (instrs CDQ, CQO)>;
	def: InstRW<[SBWriteResGroup4], (instregex "BT(16\|32\|64)ri8",
	"BT(16\|32\|64)rr",
	"BTC(16\|32\|64)ri8",
	"BTC(16\|32\|64)rr",
	"BTR(16\|32\|64)ri8",
	"BTR(16\|32\|64)rr",
	"BTS(16\|32\|64)ri8",
	"BTS(16\|32\|64)rr")>;

	def SBWriteResGroup5 : SchedWriteRes<[SBPort15]> {			def SBWriteResGroup5 : SchedWriteRes<[SBPort15]> {
	let Latency = 1;			let Latency = 1;
	let NumMicroOps = 1;			let NumMicroOps = 1;
	let ResourceCycles = [1];			let ResourceCycles = [1];
	}			}
	def: InstRW<[SBWriteResGroup5], (instregex "MMX_PABS(B\|D\|W)rr",			def: InstRW<[SBWriteResGroup5], (instregex "MMX_PABS(B\|D\|W)rr",
	"MMX_PADDQirr",			"MMX_PADDQirr",
	▲ Show 20 Lines • Show All 624 Lines • Show Last 20 Lines

lib/Target/X86/X86SchedSkylakeClient.td

	Show First 20 Lines • Show All 103 Lines • ▼ Show 20 Lines
	// 2/3/7 cycle to recompute the address.			// 2/3/7 cycle to recompute the address.
	def : WriteRes<WriteRMW, [SKLPort237,SKLPort4]>;			def : WriteRes<WriteRMW, [SKLPort237,SKLPort4]>;

	// Arithmetic.			// Arithmetic.
	defm : SKLWriteResPair<WriteALU, [SKLPort0156], 1>; // Simple integer ALU op.			defm : SKLWriteResPair<WriteALU, [SKLPort0156], 1>; // Simple integer ALU op.
	defm : SKLWriteResPair<WriteADC, [SKLPort06], 1>; // Integer ALU + flags op.			defm : SKLWriteResPair<WriteADC, [SKLPort06], 1>; // Integer ALU + flags op.
	defm : SKLWriteResPair<WriteIMul, [SKLPort1], 3>; // Integer multiplication.			defm : SKLWriteResPair<WriteIMul, [SKLPort1], 3>; // Integer multiplication.
	defm : SKLWriteResPair<WriteIMul64, [SKLPort1], 3>; // Integer 64-bit multiplication.			defm : SKLWriteResPair<WriteIMul64, [SKLPort1], 3>; // Integer 64-bit multiplication.
				defm : SKLWriteResPair<WriteBitTest,[SKLPort06], 1>; //

	defm : SKLWriteResPair<WriteDiv8, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;			defm : SKLWriteResPair<WriteDiv8, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;
	defm : SKLWriteResPair<WriteDiv16, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;			defm : SKLWriteResPair<WriteDiv16, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;
	defm : SKLWriteResPair<WriteDiv32, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;			defm : SKLWriteResPair<WriteDiv32, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;
	defm : SKLWriteResPair<WriteDiv64, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;			defm : SKLWriteResPair<WriteDiv64, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;
	defm : SKLWriteResPair<WriteIDiv8, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;			defm : SKLWriteResPair<WriteIDiv8, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;
	defm : SKLWriteResPair<WriteIDiv16, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;			defm : SKLWriteResPair<WriteIDiv16, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;
	defm : SKLWriteResPair<WriteIDiv32, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;			defm : SKLWriteResPair<WriteIDiv32, [SKLPort0, SKLDivider], 25, [1,10], 1, 4>;
	▲ Show 20 Lines • Show All 474 Lines • ▼ Show 20 Lines
	def: InstRW<[SKLWriteResGroup6], (instrs FINCSTP, FNOP)>;			def: InstRW<[SKLWriteResGroup6], (instrs FINCSTP, FNOP)>;

	def SKLWriteResGroup7 : SchedWriteRes<[SKLPort06]> {			def SKLWriteResGroup7 : SchedWriteRes<[SKLPort06]> {
	let Latency = 1;			let Latency = 1;
	let NumMicroOps = 1;			let NumMicroOps = 1;
	let ResourceCycles = [1];			let ResourceCycles = [1];
	}			}
	def: InstRW<[SKLWriteResGroup7], (instrs CDQ, CQO, CLAC, STAC)>;			def: InstRW<[SKLWriteResGroup7], (instrs CDQ, CQO, CLAC, STAC)>;
	def: InstRW<[SKLWriteResGroup7], (instregex "BT(16\|32\|64)ri8",
	"BT(16\|32\|64)rr",
	"BTC(16\|32\|64)ri8",
	"BTC(16\|32\|64)rr",
	"BTR(16\|32\|64)ri8",
	"BTR(16\|32\|64)rr",
	"BTS(16\|32\|64)ri8",
	"BTS(16\|32\|64)rr")>;

	def SKLWriteResGroup8 : SchedWriteRes<[SKLPort15]> {			def SKLWriteResGroup8 : SchedWriteRes<[SKLPort15]> {
	let Latency = 1;			let Latency = 1;
	let NumMicroOps = 1;			let NumMicroOps = 1;
	let ResourceCycles = [1];			let ResourceCycles = [1];
	}			}
	def: InstRW<[SKLWriteResGroup8], (instregex "ANDN(32\|64)rr",			def: InstRW<[SKLWriteResGroup8], (instregex "ANDN(32\|64)rr",
	"BLSI(32\|64)rr",			"BLSI(32\|64)rr",
	▲ Show 20 Lines • Show All 1,274 Lines • Show Last 20 Lines

lib/Target/X86/X86SchedSkylakeServer.td

	Show First 20 Lines • Show All 103 Lines • ▼ Show 20 Lines
	// 2/3/7 cycle to recompute the address.			// 2/3/7 cycle to recompute the address.
	def : WriteRes<WriteRMW, [SKXPort237,SKXPort4]>;			def : WriteRes<WriteRMW, [SKXPort237,SKXPort4]>;

	// Arithmetic.			// Arithmetic.
	defm : SKXWriteResPair<WriteALU, [SKXPort0156], 1>; // Simple integer ALU op.			defm : SKXWriteResPair<WriteALU, [SKXPort0156], 1>; // Simple integer ALU op.
	defm : SKXWriteResPair<WriteADC, [SKXPort06], 1>; // Integer ALU + flags op.			defm : SKXWriteResPair<WriteADC, [SKXPort06], 1>; // Integer ALU + flags op.
	defm : SKXWriteResPair<WriteIMul, [SKXPort1], 3>; // Integer multiplication.			defm : SKXWriteResPair<WriteIMul, [SKXPort1], 3>; // Integer multiplication.
	defm : SKXWriteResPair<WriteIMul64, [SKXPort1], 3>; // Integer 64-bit multiplication.			defm : SKXWriteResPair<WriteIMul64, [SKXPort1], 3>; // Integer 64-bit multiplication.
				defm : SKXWriteResPair<WriteBitTest,[SKXPort06], 1>; //

	defm : SKXWriteResPair<WriteDiv8, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;			defm : SKXWriteResPair<WriteDiv8, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;
	defm : SKXWriteResPair<WriteDiv16, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;			defm : SKXWriteResPair<WriteDiv16, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;
	defm : SKXWriteResPair<WriteDiv32, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;			defm : SKXWriteResPair<WriteDiv32, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;
	defm : SKXWriteResPair<WriteDiv64, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;			defm : SKXWriteResPair<WriteDiv64, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;
	defm : SKXWriteResPair<WriteIDiv8, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;			defm : SKXWriteResPair<WriteIDiv8, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;
	defm : SKXWriteResPair<WriteIDiv16, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;			defm : SKXWriteResPair<WriteIDiv16, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;
	defm : SKXWriteResPair<WriteIDiv32, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;			defm : SKXWriteResPair<WriteIDiv32, [SKXPort0, SKXDivider], 25, [1,10], 1, 4>;
	▲ Show 20 Lines • Show All 487 Lines • ▼ Show 20 Lines
	def: InstRW<[SKXWriteResGroup6], (instrs FINCSTP, FNOP)>;			def: InstRW<[SKXWriteResGroup6], (instrs FINCSTP, FNOP)>;

	def SKXWriteResGroup7 : SchedWriteRes<[SKXPort06]> {			def SKXWriteResGroup7 : SchedWriteRes<[SKXPort06]> {
	let Latency = 1;			let Latency = 1;
	let NumMicroOps = 1;			let NumMicroOps = 1;
	let ResourceCycles = [1];			let ResourceCycles = [1];
	}			}
	def: InstRW<[SKXWriteResGroup7], (instrs CDQ, CQO, CLAC, STAC)>;			def: InstRW<[SKXWriteResGroup7], (instrs CDQ, CQO, CLAC, STAC)>;
	def: InstRW<[SKXWriteResGroup7], (instregex "BT(16\|32\|64)ri8",
	"BT(16\|32\|64)rr",
	"BTC(16\|32\|64)ri8",
	"BTC(16\|32\|64)rr",
	"BTR(16\|32\|64)ri8",
	"BTR(16\|32\|64)rr",
	"BTS(16\|32\|64)ri8",
	"BTS(16\|32\|64)rr")>;

	def SKXWriteResGroup8 : SchedWriteRes<[SKXPort15]> {			def SKXWriteResGroup8 : SchedWriteRes<[SKXPort15]> {
	let Latency = 1;			let Latency = 1;
	let NumMicroOps = 1;			let NumMicroOps = 1;
	let ResourceCycles = [1];			let ResourceCycles = [1];
	}			}
	def: InstRW<[SKXWriteResGroup8], (instregex "ANDN(32\|64)rr",			def: InstRW<[SKXWriteResGroup8], (instregex "ANDN(32\|64)rr",
	"BLSI(32\|64)rr",			"BLSI(32\|64)rr",
	▲ Show 20 Lines • Show All 1,991 Lines • Show Last 20 Lines

lib/Target/X86/X86Schedule.td

	Show First 20 Lines • Show All 112 Lines • ▼ Show 20 Lines
	defm WriteADC : X86SchedWritePair; // Integer ALU + flags op.			defm WriteADC : X86SchedWritePair; // Integer ALU + flags op.
	def WriteALURMW : WriteSequence<[WriteALULd, WriteStore]>;			def WriteALURMW : WriteSequence<[WriteALULd, WriteStore]>;
	def WriteADCRMW : WriteSequence<[WriteADCLd, WriteStore]>;			def WriteADCRMW : WriteSequence<[WriteADCLd, WriteStore]>;
	defm WriteIMul : X86SchedWritePair; // Integer multiplication.			defm WriteIMul : X86SchedWritePair; // Integer multiplication.
	defm WriteIMul64 : X86SchedWritePair; // Integer 64-bit multiplication.			defm WriteIMul64 : X86SchedWritePair; // Integer 64-bit multiplication.
	def WriteIMulH : SchedWrite; // Integer multiplication, high part.			def WriteIMulH : SchedWrite; // Integer multiplication, high part.
	def WriteLEA : SchedWrite; // LEA instructions can't fold loads.			def WriteLEA : SchedWrite; // LEA instructions can't fold loads.

				// Bit Test
				defm WriteBitTest : X86SchedWritePair;
				lebedev.riUnsubmitted Not Done Reply Inline Actions Hmm. Nits: (not a nit) The suffix `r` notes that only the non-mem versions are covered. I wonder if we can convey that somehow better. These cover 4 different bit-test instructions - `bt`,`bt[rcs]` Naming this `WriteBTr` may be confizing - is this only about `bt` instruction? How about calling it `WriteBitTest`? lebedev.ri: Hmm. Nits: 1. (not a nit) The suffix `r` notes that only the non-mem versions are covered. I…
				RKSimonUnsubmitted Not Done Reply Inline Actions I'm confused - this should be probably be called WriteBT. But then you've declared this as a X86SchedWritePair but you're not using the folded half of the pair? RKSimon: I'm confused - this should be probably be called WriteBT. But then you've declared this as a…
				lebedev.riUnsubmitted Not Done Reply Inline Actions Note that it only covers `rr` versions, and does not include `mr` versions. So yeah, maybe it shouldn't be `X86SchedWritePair`, but `X86WriteRes`? lebedev.ri: Note that it only covers `rr` versions, and does not include `mr` versions. So yeah, maybe it…
				avt77AuthorUnsubmitted Not Done Reply Inline Actions I'm going to implement mr version asap that's why I use Pair here. avt77: I'm going to implement mr version asap that's why I use Pair here.
				RKSimonUnsubmitted Not Done Reply Inline Actions If the memory cases are causing a problem it'd be acceptable to just do a reg-reg version for now: def WriteBitTest : SchedWrite // Bit Test - TODO add memory folding support And you can come back to the memory cases once we understand whats to be done. I just don't want a X86SchedWritePair def when you're not using the folded case. RKSimon: If the memory cases are causing a problem it'd be acceptable to just do a reg-reg version for…
				RKSimonUnsubmitted Not Done Reply Inline Actions Very minor, but please can you put the WriteBT defs next to the CMOV/SETCC defs - they are closer in behaviour. RKSimon: Very minor, but please can you put the WriteBT defs next to the CMOV/SETCC defs - they are…

	// Integer division.			// Integer division.
	defm WriteDiv8 : X86SchedWritePair;			defm WriteDiv8 : X86SchedWritePair;
	defm WriteDiv16 : X86SchedWritePair;			defm WriteDiv16 : X86SchedWritePair;
	defm WriteDiv32 : X86SchedWritePair;			defm WriteDiv32 : X86SchedWritePair;
	defm WriteDiv64 : X86SchedWritePair;			defm WriteDiv64 : X86SchedWritePair;
	defm WriteIDiv8 : X86SchedWritePair;			defm WriteIDiv8 : X86SchedWritePair;
	defm WriteIDiv16 : X86SchedWritePair;			defm WriteIDiv16 : X86SchedWritePair;
	defm WriteIDiv32 : X86SchedWritePair;			defm WriteIDiv32 : X86SchedWritePair;
	▲ Show 20 Lines • Show All 531 Lines • Show Last 20 Lines

lib/Target/X86/X86ScheduleAtom.td

	Show First 20 Lines • Show All 74 Lines • ▼ Show 20 Lines
	////////////////////////////////////////////////////////////////////////////////			////////////////////////////////////////////////////////////////////////////////
	// Arithmetic.			// Arithmetic.
	////////////////////////////////////////////////////////////////////////////////			////////////////////////////////////////////////////////////////////////////////

	defm : AtomWriteResPair<WriteALU, [AtomPort01], [AtomPort0]>;			defm : AtomWriteResPair<WriteALU, [AtomPort01], [AtomPort0]>;
	defm : AtomWriteResPair<WriteADC, [AtomPort01], [AtomPort0]>;			defm : AtomWriteResPair<WriteADC, [AtomPort01], [AtomPort0]>;
	defm : AtomWriteResPair<WriteIMul, [AtomPort01], [AtomPort01], 7, 7, [7], [7]>;			defm : AtomWriteResPair<WriteIMul, [AtomPort01], [AtomPort01], 7, 7, [7], [7]>;
	defm : AtomWriteResPair<WriteIMul64, [AtomPort01], [AtomPort01], 12, 12, [12], [12]>;			defm : AtomWriteResPair<WriteIMul64, [AtomPort01], [AtomPort01], 12, 12, [12], [12]>;
				defm : AtomWriteResPair<WriteBitTest,[AtomPort01], [AtomPort0]>;

	defm : AtomWriteResPair<WriteDiv8, [AtomPort01], [AtomPort01], 50, 68, [50], [68]>;			defm : AtomWriteResPair<WriteDiv8, [AtomPort01], [AtomPort01], 50, 68, [50], [68]>;
	defm : AtomWriteResPair<WriteDiv16, [AtomPort01], [AtomPort01], 50, 50, [50], [50]>;			defm : AtomWriteResPair<WriteDiv16, [AtomPort01], [AtomPort01], 50, 50, [50], [50]>;
	defm : AtomWriteResPair<WriteDiv32, [AtomPort01], [AtomPort01], 50, 50, [50], [50]>;			defm : AtomWriteResPair<WriteDiv32, [AtomPort01], [AtomPort01], 50, 50, [50], [50]>;
	defm : AtomWriteResPair<WriteDiv64, [AtomPort01], [AtomPort01],130,130,[130],[130]>;			defm : AtomWriteResPair<WriteDiv64, [AtomPort01], [AtomPort01],130,130,[130],[130]>;
	defm : AtomWriteResPair<WriteIDiv8, [AtomPort01], [AtomPort01], 62, 62, [62], [62]>;			defm : AtomWriteResPair<WriteIDiv8, [AtomPort01], [AtomPort01], 62, 62, [62], [62]>;
	defm : AtomWriteResPair<WriteIDiv16, [AtomPort01], [AtomPort01], 62, 62, [62], [62]>;			defm : AtomWriteResPair<WriteIDiv16, [AtomPort01], [AtomPort01], 62, 62, [62], [62]>;
	defm : AtomWriteResPair<WriteIDiv32, [AtomPort01], [AtomPort01], 62, 62, [62], [62]>;			defm : AtomWriteResPair<WriteIDiv32, [AtomPort01], [AtomPort01], 62, 62, [62], [62]>;
	▲ Show 20 Lines • Show All 829 Lines • Show Last 20 Lines

lib/Target/X86/X86ScheduleBtVer2.td

	Show First 20 Lines • Show All 155 Lines • ▼ Show 20 Lines
	////////////////////////////////////////////////////////////////////////////////			////////////////////////////////////////////////////////////////////////////////

	defm : JWriteResIntPair<WriteALU, [JALU01], 1>;			defm : JWriteResIntPair<WriteALU, [JALU01], 1>;
	defm : JWriteResIntPair<WriteADC, [JALU01], 1, [2]>;			defm : JWriteResIntPair<WriteADC, [JALU01], 1, [2]>;
	defm : JWriteResIntPair<WriteIMul, [JALU1, JMul], 3, [1, 1], 2>; // i8/i16/i32 multiplication			defm : JWriteResIntPair<WriteIMul, [JALU1, JMul], 3, [1, 1], 2>; // i8/i16/i32 multiplication
	defm : JWriteResIntPair<WriteIMul64, [JALU1, JMul], 6, [1, 4], 2>; // i64 multiplication			defm : JWriteResIntPair<WriteIMul64, [JALU1, JMul], 6, [1, 4], 2>; // i64 multiplication
	defm : X86WriteRes<WriteIMulH, [JALU1], 6, [4], 1>;			defm : X86WriteRes<WriteIMulH, [JALU1], 6, [4], 1>;

				defm : JWriteResIntPair<WriteBitTest,[JALU01], 1>;

	defm : JWriteResIntPair<WriteDiv8, [JALU1, JDiv], 12, [1, 12], 1>;			defm : JWriteResIntPair<WriteDiv8, [JALU1, JDiv], 12, [1, 12], 1>;
	defm : JWriteResIntPair<WriteDiv16, [JALU1, JDiv], 17, [1, 17], 2>;			defm : JWriteResIntPair<WriteDiv16, [JALU1, JDiv], 17, [1, 17], 2>;
	defm : JWriteResIntPair<WriteDiv32, [JALU1, JDiv], 25, [1, 25], 2>;			defm : JWriteResIntPair<WriteDiv32, [JALU1, JDiv], 25, [1, 25], 2>;
	defm : JWriteResIntPair<WriteDiv64, [JALU1, JDiv], 41, [1, 41], 2>;			defm : JWriteResIntPair<WriteDiv64, [JALU1, JDiv], 41, [1, 41], 2>;
	defm : JWriteResIntPair<WriteIDiv8, [JALU1, JDiv], 12, [1, 12], 1>;			defm : JWriteResIntPair<WriteIDiv8, [JALU1, JDiv], 12, [1, 12], 1>;
	defm : JWriteResIntPair<WriteIDiv16, [JALU1, JDiv], 17, [1, 17], 2>;			defm : JWriteResIntPair<WriteIDiv16, [JALU1, JDiv], 17, [1, 17], 2>;
	defm : JWriteResIntPair<WriteIDiv32, [JALU1, JDiv], 25, [1, 25], 2>;			defm : JWriteResIntPair<WriteIDiv32, [JALU1, JDiv], 25, [1, 25], 2>;
	defm : JWriteResIntPair<WriteIDiv64, [JALU1, JDiv], 41, [1, 41], 2>;			defm : JWriteResIntPair<WriteIDiv64, [JALU1, JDiv], 41, [1, 41], 2>;
	▲ Show 20 Lines • Show All 489 Lines • Show Last 20 Lines

lib/Target/X86/X86ScheduleSLM.td

	Show First 20 Lines • Show All 88 Lines • ▼ Show 20 Lines
	// FIXME: These are probably wrong. They are copy pasted from WriteStore/Load.			// FIXME: These are probably wrong. They are copy pasted from WriteStore/Load.
	def : WriteRes<WriteSTMXCSR, [SLM_IEC_RSV01, SLM_MEC_RSV]>;			def : WriteRes<WriteSTMXCSR, [SLM_IEC_RSV01, SLM_MEC_RSV]>;
	def : WriteRes<WriteLDMXCSR, [SLM_MEC_RSV]> { let Latency = 3; }			def : WriteRes<WriteLDMXCSR, [SLM_MEC_RSV]> { let Latency = 3; }

	// Treat misc copies as a move.			// Treat misc copies as a move.
	def : InstRW<[WriteMove], (instrs COPY)>;			def : InstRW<[WriteMove], (instrs COPY)>;

	defm : SLMWriteResPair<WriteALU, [SLM_IEC_RSV01], 1>;			defm : SLMWriteResPair<WriteALU, [SLM_IEC_RSV01], 1>;
				defm : SLMWriteResPair<WriteBitTest,[SLM_IEC_RSV01], 1>;
	defm : SLMWriteResPair<WriteADC, [SLM_IEC_RSV01], 1>;			defm : SLMWriteResPair<WriteADC, [SLM_IEC_RSV01], 1>;
	defm : SLMWriteResPair<WriteIMul, [SLM_IEC_RSV1], 3>;			defm : SLMWriteResPair<WriteIMul, [SLM_IEC_RSV1], 3>;
	defm : SLMWriteResPair<WriteIMul64, [SLM_IEC_RSV1], 3>;			defm : SLMWriteResPair<WriteIMul64, [SLM_IEC_RSV1], 3>;
	defm : SLMWriteResPair<WriteShift, [SLM_IEC_RSV0], 1>;			defm : SLMWriteResPair<WriteShift, [SLM_IEC_RSV0], 1>;
	defm : SLMWriteResPair<WriteShiftDouble, [SLM_IEC_RSV0], 1>;			defm : SLMWriteResPair<WriteShiftDouble, [SLM_IEC_RSV0], 1>;
	defm : SLMWriteResPair<WriteJump, [SLM_IEC_RSV1], 1>;			defm : SLMWriteResPair<WriteJump, [SLM_IEC_RSV1], 1>;
	defm : SLMWriteResPair<WriteCRC32, [SLM_IEC_RSV1], 3>;			defm : SLMWriteResPair<WriteCRC32, [SLM_IEC_RSV1], 3>;

	▲ Show 20 Lines • Show All 372 Lines • Show Last 20 Lines

lib/Target/X86/X86ScheduleZnver1.td

	Show First 20 Lines • Show All 171 Lines • ▼ Show 20 Lines
	def : WriteRes<WriteStoreNT, [ZnAGU]>;			def : WriteRes<WriteStoreNT, [ZnAGU]>;
	def : WriteRes<WriteMove, [ZnALU]>;			def : WriteRes<WriteMove, [ZnALU]>;
	def : WriteRes<WriteLoad, [ZnAGU]> { let Latency = 8; }			def : WriteRes<WriteLoad, [ZnAGU]> { let Latency = 8; }

	def : WriteRes<WriteZero, []>;			def : WriteRes<WriteZero, []>;
	def : WriteRes<WriteLEA, [ZnALU]>;			def : WriteRes<WriteLEA, [ZnALU]>;
	defm : ZnWriteResPair<WriteALU, [ZnALU], 1>;			defm : ZnWriteResPair<WriteALU, [ZnALU], 1>;
	defm : ZnWriteResPair<WriteADC, [ZnALU], 1>;			defm : ZnWriteResPair<WriteADC, [ZnALU], 1>;
				defm : ZnWriteResPair<WriteBitTest,[ZnALU], 1>;
	defm : ZnWriteResPair<WriteIMul, [ZnALU1, ZnMultiplier], 4>;			defm : ZnWriteResPair<WriteIMul, [ZnALU1, ZnMultiplier], 4>;
	defm : ZnWriteResPair<WriteIMul64, [ZnALU1, ZnMultiplier], 4, [1,1], 2>;			defm : ZnWriteResPair<WriteIMul64, [ZnALU1, ZnMultiplier], 4, [1,1], 2>;
	defm : ZnWriteResPair<WriteShift, [ZnALU], 1>;			defm : ZnWriteResPair<WriteShift, [ZnALU], 1>;
	defm : ZnWriteResPair<WriteShiftDouble, [ZnALU], 1>;			defm : ZnWriteResPair<WriteShiftDouble, [ZnALU], 1>;
	defm : ZnWriteResPair<WriteJump, [ZnALU], 1>;			defm : ZnWriteResPair<WriteJump, [ZnALU], 1>;
	defm : ZnWriteResFpuPair<WriteCRC32, [ZnFPU0], 3>;			defm : ZnWriteResFpuPair<WriteCRC32, [ZnFPU0], 3>;

	defm : ZnWriteResPair<WriteCMOV, [ZnALU], 1>;			defm : ZnWriteResPair<WriteCMOV, [ZnALU], 1>;
	▲ Show 20 Lines • Show All 1,353 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Improved sched models for X86 BT*rr instructions
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 155380

lib/Target/X86/X86InstrInfo.td

lib/Target/X86/X86SchedBroadwell.td

lib/Target/X86/X86SchedHaswell.td

lib/Target/X86/X86SchedSandyBridge.td

lib/Target/X86/X86SchedSkylakeClient.td

lib/Target/X86/X86SchedSkylakeServer.td

lib/Target/X86/X86Schedule.td

lib/Target/X86/X86ScheduleAtom.td

lib/Target/X86/X86ScheduleBtVer2.td

lib/Target/X86/X86ScheduleSLM.td

lib/Target/X86/X86ScheduleZnver1.td

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Improved sched models for X86 BT*rr instructionsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 155380

lib/Target/X86/X86InstrInfo.td

lib/Target/X86/X86SchedBroadwell.td

lib/Target/X86/X86SchedHaswell.td

lib/Target/X86/X86SchedSandyBridge.td

lib/Target/X86/X86SchedSkylakeClient.td

lib/Target/X86/X86SchedSkylakeServer.td

lib/Target/X86/X86Schedule.td

lib/Target/X86/X86ScheduleAtom.td

lib/Target/X86/X86ScheduleBtVer2.td

lib/Target/X86/X86ScheduleSLM.td

lib/Target/X86/X86ScheduleZnver1.td

[X86] Improved sched models for X86 BT*rr instructions
ClosedPublic