Diff 156741

lib/Target/X86/X86InstrInfo.td

Show First 20 Lines • Show All 1,744 Lines • ▼ Show 20 Lines
def LAHF : I<0x9F, RawFrm, (outs), (ins), "lahf", []>, // AH = flags		def LAHF : I<0x9F, RawFrm, (outs), (ins), "lahf", []>, // AH = flags
Requires<[HasLAHFSAHF]>;		Requires<[HasLAHFSAHF]>;
} // SchedRW		} // SchedRW

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// Bit tests instructions: BT, BTS, BTR, BTC.		// Bit tests instructions: BT, BTS, BTR, BTC.

let Defs = [EFLAGS] in {		let Defs = [EFLAGS] in {
let SchedRW = [WriteALU] in {		let SchedRW = [WriteBitTest] in {
def BT16rr : I<0xA3, MRMDestReg, (outs), (ins GR16:$src1, GR16:$src2),		def BT16rr : I<0xA3, MRMDestReg, (outs), (ins GR16:$src1, GR16:$src2),
"bt{w}\t{$src2, $src1\|$src1, $src2}",		"bt{w}\t{$src2, $src1\|$src1, $src2}",
[(set EFLAGS, (X86bt GR16:$src1, GR16:$src2))]>,		[(set EFLAGS, (X86bt GR16:$src1, GR16:$src2))]>,
OpSize16, TB, NotMemoryFoldable;		OpSize16, TB, NotMemoryFoldable;
def BT32rr : I<0xA3, MRMDestReg, (outs), (ins GR32:$src1, GR32:$src2),		def BT32rr : I<0xA3, MRMDestReg, (outs), (ins GR32:$src1, GR32:$src2),
"bt{l}\t{$src2, $src1\|$src1, $src2}",		"bt{l}\t{$src2, $src1\|$src1, $src2}",
[(set EFLAGS, (X86bt GR32:$src1, GR32:$src2))]>,		[(set EFLAGS, (X86bt GR32:$src1, GR32:$src2))]>,
OpSize32, TB, NotMemoryFoldable;		OpSize32, TB, NotMemoryFoldable;
Show All 16 Lines	let mayLoad = 1, hasSideEffects = 0, SchedRW = [WriteALULd] in {
def BT32mr : I<0xA3, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),		def BT32mr : I<0xA3, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),
"bt{l}\t{$src2, $src1\|$src1, $src2}",		"bt{l}\t{$src2, $src1\|$src1, $src2}",
[]>, OpSize32, TB, NotMemoryFoldable;		[]>, OpSize32, TB, NotMemoryFoldable;
def BT64mr : RI<0xA3, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),		def BT64mr : RI<0xA3, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),
"bt{q}\t{$src2, $src1\|$src1, $src2}",		"bt{q}\t{$src2, $src1\|$src1, $src2}",
[]>, TB, NotMemoryFoldable;		[]>, TB, NotMemoryFoldable;
}		}

let SchedRW = [WriteALU] in {		let SchedRW = [WriteBitTest] in {
def BT16ri8 : Ii8<0xBA, MRM4r, (outs), (ins GR16:$src1, i16i8imm:$src2),		def BT16ri8 : Ii8<0xBA, MRM4r, (outs), (ins GR16:$src1, i16i8imm:$src2),
"bt{w}\t{$src2, $src1\|$src1, $src2}",		"bt{w}\t{$src2, $src1\|$src1, $src2}",
[(set EFLAGS, (X86bt GR16:$src1, i16immSExt8:$src2))]>,		[(set EFLAGS, (X86bt GR16:$src1, i16immSExt8:$src2))]>,
OpSize16, TB;		OpSize16, TB;
def BT32ri8 : Ii8<0xBA, MRM4r, (outs), (ins GR32:$src1, i32i8imm:$src2),		def BT32ri8 : Ii8<0xBA, MRM4r, (outs), (ins GR32:$src1, i32i8imm:$src2),
"bt{l}\t{$src2, $src1\|$src1, $src2}",		"bt{l}\t{$src2, $src1\|$src1, $src2}",
[(set EFLAGS, (X86bt GR32:$src1, i32immSExt8:$src2))]>,		[(set EFLAGS, (X86bt GR32:$src1, i32immSExt8:$src2))]>,
OpSize32, TB;		OpSize32, TB;
def BT64ri8 : RIi8<0xBA, MRM4r, (outs), (ins GR64:$src1, i64i8imm:$src2),		def BT64ri8 : RIi8<0xBA, MRM4r, (outs), (ins GR64:$src1, i64i8imm:$src2),
"bt{q}\t{$src2, $src1\|$src1, $src2}",		"bt{q}\t{$src2, $src1\|$src1, $src2}",
[(set EFLAGS, (X86bt GR64:$src1, i64immSExt8:$src2))]>, TB;		[(set EFLAGS, (X86bt GR64:$src1, i64immSExt8:$src2))]>, TB;
} // SchedRW		} // SchedRW

// Note that these instructions aren't slow because that only applies when the		// Note that these instructions aren't slow because that only applies when the
// other operand is in a register. When it's an immediate, bt is still fast.		// other operand is in a register. When it's an immediate, bt is still fast.
let SchedRW = [WriteALU] in {		let SchedRW = [WriteALU] in {
		RKSimonUnsubmitted Not Done Reply Inline Actions Why isn't this WriteBTLd ? RKSimon: Why isn't this WriteBTLd ?
		avt77AuthorUnsubmitted Not Done Reply Inline Actions This patch does not deal with mem at all but I'm going to do it asap. avt77: This patch does not deal with mem at all but I'm going to do it asap.
def BT16mi8 : Ii8<0xBA, MRM4m, (outs), (ins i16mem:$src1, i16i8imm:$src2),		def BT16mi8 : Ii8<0xBA, MRM4m, (outs), (ins i16mem:$src1, i16i8imm:$src2),
"bt{w}\t{$src2, $src1\|$src1, $src2}",		"bt{w}\t{$src2, $src1\|$src1, $src2}",
[(set EFLAGS, (X86bt (loadi16 addr:$src1),		[(set EFLAGS, (X86bt (loadi16 addr:$src1),
i16immSExt8:$src2))]>,		i16immSExt8:$src2))]>,
OpSize16, TB;		OpSize16, TB;
def BT32mi8 : Ii8<0xBA, MRM4m, (outs), (ins i32mem:$src1, i32i8imm:$src2),		def BT32mi8 : Ii8<0xBA, MRM4m, (outs), (ins i32mem:$src1, i32i8imm:$src2),
"bt{l}\t{$src2, $src1\|$src1, $src2}",		"bt{l}\t{$src2, $src1\|$src1, $src2}",
[(set EFLAGS, (X86bt (loadi32 addr:$src1),		[(set EFLAGS, (X86bt (loadi32 addr:$src1),
i32immSExt8:$src2))]>,		i32immSExt8:$src2))]>,
OpSize32, TB;		OpSize32, TB;
def BT64mi8 : RIi8<0xBA, MRM4m, (outs), (ins i64mem:$src1, i64i8imm:$src2),		def BT64mi8 : RIi8<0xBA, MRM4m, (outs), (ins i64mem:$src1, i64i8imm:$src2),
"bt{q}\t{$src2, $src1\|$src1, $src2}",		"bt{q}\t{$src2, $src1\|$src1, $src2}",
[(set EFLAGS, (X86bt (loadi64 addr:$src1),		[(set EFLAGS, (X86bt (loadi64 addr:$src1),
i64immSExt8:$src2))]>, TB,		i64immSExt8:$src2))]>, TB,
Requires<[In64BitMode]>;		Requires<[In64BitMode]>;
} // SchedRW		} // SchedRW

let hasSideEffects = 0 in {		let hasSideEffects = 0 in {
let SchedRW = [WriteALU], Constraints = "$src1 = $dst" in {		let SchedRW = [WriteBitTest], Constraints = "$src1 = $dst" in {
def BTC16rr : I<0xBB, MRMDestReg, (outs GR16:$dst), (ins GR16:$src1, GR16:$src2),		def BTC16rr : I<0xBB, MRMDestReg, (outs GR16:$dst), (ins GR16:$src1, GR16:$src2),
"btc{w}\t{$src2, $src1\|$src1, $src2}", []>,		"btc{w}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize16, TB, NotMemoryFoldable;		OpSize16, TB, NotMemoryFoldable;
def BTC32rr : I<0xBB, MRMDestReg, (outs GR32:$dst), (ins GR32:$src1, GR32:$src2),		def BTC32rr : I<0xBB, MRMDestReg, (outs GR32:$dst), (ins GR32:$src1, GR32:$src2),
"btc{l}\t{$src2, $src1\|$src1, $src2}", []>,		"btc{l}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize32, TB, NotMemoryFoldable;		OpSize32, TB, NotMemoryFoldable;
def BTC64rr : RI<0xBB, MRMDestReg, (outs GR64:$dst), (ins GR64:$src1, GR64:$src2),		def BTC64rr : RI<0xBB, MRMDestReg, (outs GR64:$dst), (ins GR64:$src1, GR64:$src2),
"btc{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,		"btc{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,
NotMemoryFoldable;		NotMemoryFoldable;
} // SchedRW		} // SchedRW

let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {		let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {
def BTC16mr : I<0xBB, MRMDestMem, (outs), (ins i16mem:$src1, GR16:$src2),		def BTC16mr : I<0xBB, MRMDestMem, (outs), (ins i16mem:$src1, GR16:$src2),
"btc{w}\t{$src2, $src1\|$src1, $src2}", []>,		"btc{w}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize16, TB, NotMemoryFoldable;		OpSize16, TB, NotMemoryFoldable;
def BTC32mr : I<0xBB, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),		def BTC32mr : I<0xBB, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),
"btc{l}\t{$src2, $src1\|$src1, $src2}", []>,		"btc{l}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize32, TB, NotMemoryFoldable;		OpSize32, TB, NotMemoryFoldable;
def BTC64mr : RI<0xBB, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),		def BTC64mr : RI<0xBB, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),
"btc{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,		"btc{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,
NotMemoryFoldable;		NotMemoryFoldable;
}		}

let SchedRW = [WriteALU], Constraints = "$src1 = $dst" in {		let SchedRW = [WriteBitTest], Constraints = "$src1 = $dst" in {
def BTC16ri8 : Ii8<0xBA, MRM7r, (outs GR16:$dst), (ins GR16:$src1, i16i8imm:$src2),		def BTC16ri8 : Ii8<0xBA, MRM7r, (outs GR16:$dst), (ins GR16:$src1, i16i8imm:$src2),
"btc{w}\t{$src2, $src1\|$src1, $src2}", []>, OpSize16, TB;		"btc{w}\t{$src2, $src1\|$src1, $src2}", []>, OpSize16, TB;
def BTC32ri8 : Ii8<0xBA, MRM7r, (outs GR32:$dst), (ins GR32:$src1, i32i8imm:$src2),		def BTC32ri8 : Ii8<0xBA, MRM7r, (outs GR32:$dst), (ins GR32:$src1, i32i8imm:$src2),
"btc{l}\t{$src2, $src1\|$src1, $src2}", []>, OpSize32, TB;		"btc{l}\t{$src2, $src1\|$src1, $src2}", []>, OpSize32, TB;
def BTC64ri8 : RIi8<0xBA, MRM7r, (outs GR64:$dst), (ins GR64:$src1, i64i8imm:$src2),		def BTC64ri8 : RIi8<0xBA, MRM7r, (outs GR64:$dst), (ins GR64:$src1, i64i8imm:$src2),
"btc{q}\t{$src2, $src1\|$src1, $src2}", []>, TB;		"btc{q}\t{$src2, $src1\|$src1, $src2}", []>, TB;
} // SchedRW		} // SchedRW

let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {		let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {
def BTC16mi8 : Ii8<0xBA, MRM7m, (outs), (ins i16mem:$src1, i16i8imm:$src2),		def BTC16mi8 : Ii8<0xBA, MRM7m, (outs), (ins i16mem:$src1, i16i8imm:$src2),
"btc{w}\t{$src2, $src1\|$src1, $src2}", []>, OpSize16, TB;		"btc{w}\t{$src2, $src1\|$src1, $src2}", []>, OpSize16, TB;
def BTC32mi8 : Ii8<0xBA, MRM7m, (outs), (ins i32mem:$src1, i32i8imm:$src2),		def BTC32mi8 : Ii8<0xBA, MRM7m, (outs), (ins i32mem:$src1, i32i8imm:$src2),
"btc{l}\t{$src2, $src1\|$src1, $src2}", []>, OpSize32, TB;		"btc{l}\t{$src2, $src1\|$src1, $src2}", []>, OpSize32, TB;
def BTC64mi8 : RIi8<0xBA, MRM7m, (outs), (ins i64mem:$src1, i64i8imm:$src2),		def BTC64mi8 : RIi8<0xBA, MRM7m, (outs), (ins i64mem:$src1, i64i8imm:$src2),
"btc{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,		"btc{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,
Requires<[In64BitMode]>;		Requires<[In64BitMode]>;
}		}

let SchedRW = [WriteALU], Constraints = "$src1 = $dst" in {		let SchedRW = [WriteBitTest], Constraints = "$src1 = $dst" in {
def BTR16rr : I<0xB3, MRMDestReg, (outs GR16:$dst), (ins GR16:$src1, GR16:$src2),		def BTR16rr : I<0xB3, MRMDestReg, (outs GR16:$dst), (ins GR16:$src1, GR16:$src2),
"btr{w}\t{$src2, $src1\|$src1, $src2}", []>,		"btr{w}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize16, TB, NotMemoryFoldable;		OpSize16, TB, NotMemoryFoldable;
def BTR32rr : I<0xB3, MRMDestReg, (outs GR32:$dst), (ins GR32:$src1, GR32:$src2),		def BTR32rr : I<0xB3, MRMDestReg, (outs GR32:$dst), (ins GR32:$src1, GR32:$src2),
"btr{l}\t{$src2, $src1\|$src1, $src2}", []>,		"btr{l}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize32, TB, NotMemoryFoldable;		OpSize32, TB, NotMemoryFoldable;
def BTR64rr : RI<0xB3, MRMDestReg, (outs GR64:$dst), (ins GR64:$src1, GR64:$src2),		def BTR64rr : RI<0xB3, MRMDestReg, (outs GR64:$dst), (ins GR64:$src1, GR64:$src2),
"btr{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,		"btr{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,
NotMemoryFoldable;		NotMemoryFoldable;
} // SchedRW		} // SchedRW

let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {		let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {
def BTR16mr : I<0xB3, MRMDestMem, (outs), (ins i16mem:$src1, GR16:$src2),		def BTR16mr : I<0xB3, MRMDestMem, (outs), (ins i16mem:$src1, GR16:$src2),
"btr{w}\t{$src2, $src1\|$src1, $src2}", []>,		"btr{w}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize16, TB, NotMemoryFoldable;		OpSize16, TB, NotMemoryFoldable;
def BTR32mr : I<0xB3, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),		def BTR32mr : I<0xB3, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),
"btr{l}\t{$src2, $src1\|$src1, $src2}", []>,		"btr{l}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize32, TB, NotMemoryFoldable;		OpSize32, TB, NotMemoryFoldable;
def BTR64mr : RI<0xB3, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),		def BTR64mr : RI<0xB3, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),
"btr{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,		"btr{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,
NotMemoryFoldable;		NotMemoryFoldable;
}		}

let SchedRW = [WriteALU], Constraints = "$src1 = $dst" in {		let SchedRW = [WriteBitTest], Constraints = "$src1 = $dst" in {
def BTR16ri8 : Ii8<0xBA, MRM6r, (outs GR16:$dst), (ins GR16:$src1, i16i8imm:$src2),		def BTR16ri8 : Ii8<0xBA, MRM6r, (outs GR16:$dst), (ins GR16:$src1, i16i8imm:$src2),
"btr{w}\t{$src2, $src1\|$src1, $src2}", []>,		"btr{w}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize16, TB;		OpSize16, TB;
def BTR32ri8 : Ii8<0xBA, MRM6r, (outs GR32:$dst), (ins GR32:$src1, i32i8imm:$src2),		def BTR32ri8 : Ii8<0xBA, MRM6r, (outs GR32:$dst), (ins GR32:$src1, i32i8imm:$src2),
"btr{l}\t{$src2, $src1\|$src1, $src2}", []>,		"btr{l}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize32, TB;		OpSize32, TB;
def BTR64ri8 : RIi8<0xBA, MRM6r, (outs GR64:$dst), (ins GR64:$src1, i64i8imm:$src2),		def BTR64ri8 : RIi8<0xBA, MRM6r, (outs GR64:$dst), (ins GR64:$src1, i64i8imm:$src2),
"btr{q}\t{$src2, $src1\|$src1, $src2}", []>, TB;		"btr{q}\t{$src2, $src1\|$src1, $src2}", []>, TB;
} // SchedRW		} // SchedRW

let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {		let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {
def BTR16mi8 : Ii8<0xBA, MRM6m, (outs), (ins i16mem:$src1, i16i8imm:$src2),		def BTR16mi8 : Ii8<0xBA, MRM6m, (outs), (ins i16mem:$src1, i16i8imm:$src2),
"btr{w}\t{$src2, $src1\|$src1, $src2}", []>,		"btr{w}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize16, TB;		OpSize16, TB;
def BTR32mi8 : Ii8<0xBA, MRM6m, (outs), (ins i32mem:$src1, i32i8imm:$src2),		def BTR32mi8 : Ii8<0xBA, MRM6m, (outs), (ins i32mem:$src1, i32i8imm:$src2),
"btr{l}\t{$src2, $src1\|$src1, $src2}", []>,		"btr{l}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize32, TB;		OpSize32, TB;
def BTR64mi8 : RIi8<0xBA, MRM6m, (outs), (ins i64mem:$src1, i64i8imm:$src2),		def BTR64mi8 : RIi8<0xBA, MRM6m, (outs), (ins i64mem:$src1, i64i8imm:$src2),
"btr{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,		"btr{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,
Requires<[In64BitMode]>;		Requires<[In64BitMode]>;
}		}

let SchedRW = [WriteALU], Constraints = "$src1 = $dst" in {		let SchedRW = [WriteBitTest], Constraints = "$src1 = $dst" in {
def BTS16rr : I<0xAB, MRMDestReg, (outs GR16:$dst), (ins GR16:$src1, GR16:$src2),		def BTS16rr : I<0xAB, MRMDestReg, (outs GR16:$dst), (ins GR16:$src1, GR16:$src2),
"bts{w}\t{$src2, $src1\|$src1, $src2}", []>,		"bts{w}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize16, TB, NotMemoryFoldable;		OpSize16, TB, NotMemoryFoldable;
def BTS32rr : I<0xAB, MRMDestReg, (outs GR32:$dst), (ins GR32:$src1, GR32:$src2),		def BTS32rr : I<0xAB, MRMDestReg, (outs GR32:$dst), (ins GR32:$src1, GR32:$src2),
"bts{l}\t{$src2, $src1\|$src1, $src2}", []>,		"bts{l}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize32, TB, NotMemoryFoldable;		OpSize32, TB, NotMemoryFoldable;
def BTS64rr : RI<0xAB, MRMDestReg, (outs GR64:$dst), (ins GR64:$src1, GR64:$src2),		def BTS64rr : RI<0xAB, MRMDestReg, (outs GR64:$dst), (ins GR64:$src1, GR64:$src2),
"bts{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,		"bts{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,
NotMemoryFoldable;		NotMemoryFoldable;
} // SchedRW		} // SchedRW

let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {		let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {
def BTS16mr : I<0xAB, MRMDestMem, (outs), (ins i16mem:$src1, GR16:$src2),		def BTS16mr : I<0xAB, MRMDestMem, (outs), (ins i16mem:$src1, GR16:$src2),
"bts{w}\t{$src2, $src1\|$src1, $src2}", []>,		"bts{w}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize16, TB, NotMemoryFoldable;		OpSize16, TB, NotMemoryFoldable;
def BTS32mr : I<0xAB, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),		def BTS32mr : I<0xAB, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),
"bts{l}\t{$src2, $src1\|$src1, $src2}", []>,		"bts{l}\t{$src2, $src1\|$src1, $src2}", []>,
OpSize32, TB, NotMemoryFoldable;		OpSize32, TB, NotMemoryFoldable;
def BTS64mr : RI<0xAB, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),		def BTS64mr : RI<0xAB, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),
"bts{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,		"bts{q}\t{$src2, $src1\|$src1, $src2}", []>, TB,
NotMemoryFoldable;		NotMemoryFoldable;
}		}

let SchedRW = [WriteALU], Constraints = "$src1 = $dst" in {		let SchedRW = [WriteBitTest], Constraints = "$src1 = $dst" in {
def BTS16ri8 : Ii8<0xBA, MRM5r, (outs GR16:$dst), (ins GR16:$src1, i16i8imm:$src2),		def BTS16ri8 : Ii8<0xBA, MRM5r, (outs GR16:$dst), (ins GR16:$src1, i16i8imm:$src2),
"bts{w}\t{$src2, $src1\|$src1, $src2}", []>, OpSize16, TB;		"bts{w}\t{$src2, $src1\|$src1, $src2}", []>, OpSize16, TB;
def BTS32ri8 : Ii8<0xBA, MRM5r, (outs GR32:$dst), (ins GR32:$src1, i32i8imm:$src2),		def BTS32ri8 : Ii8<0xBA, MRM5r, (outs GR32:$dst), (ins GR32:$src1, i32i8imm:$src2),
"bts{l}\t{$src2, $src1\|$src1, $src2}", []>, OpSize32, TB;		"bts{l}\t{$src2, $src1\|$src1, $src2}", []>, OpSize32, TB;
def BTS64ri8 : RIi8<0xBA, MRM5r, (outs GR64:$dst), (ins GR64:$src1, i64i8imm:$src2),		def BTS64ri8 : RIi8<0xBA, MRM5r, (outs GR64:$dst), (ins GR64:$src1, i64i8imm:$src2),
"bts{q}\t{$src2, $src1\|$src1, $src2}", []>, TB;		"bts{q}\t{$src2, $src1\|$src1, $src2}", []>, TB;
} // SchedRW		} // SchedRW

▲ Show 20 Lines • Show All 1,559 Lines • Show Last 20 Lines

lib/Target/X86/X86SchedBroadwell.td

	Show First 20 Lines • Show All 131 Lines • ▼ Show 20 Lines
	defm : X86WriteRes<WriteFCMOV, [BWPort1], 3, [1], 1>; // x87 conditional move.			defm : X86WriteRes<WriteFCMOV, [BWPort1], 3, [1], 1>; // x87 conditional move.

	def : WriteRes<WriteSETCC, [BWPort06]>; // Setcc.			def : WriteRes<WriteSETCC, [BWPort06]>; // Setcc.
	def : WriteRes<WriteSETCCStore, [BWPort06,BWPort4,BWPort237]> {			def : WriteRes<WriteSETCCStore, [BWPort06,BWPort4,BWPort237]> {
	let Latency = 2;			let Latency = 2;
	let NumMicroOps = 3;			let NumMicroOps = 3;
	}			}
	def : WriteRes<WriteLAHFSAHF, [BWPort06]>;			def : WriteRes<WriteLAHFSAHF, [BWPort06]>;
				def : WriteRes<WriteBitTest,[BWPort06]>; // Bit Test instrs

	// Bit counts.			// Bit counts.
	defm : BWWriteResPair<WriteBSF, [BWPort1], 3>;			defm : BWWriteResPair<WriteBSF, [BWPort1], 3>;
	defm : BWWriteResPair<WriteBSR, [BWPort1], 3>;			defm : BWWriteResPair<WriteBSR, [BWPort1], 3>;
	defm : BWWriteResPair<WriteLZCNT, [BWPort1], 3>;			defm : BWWriteResPair<WriteLZCNT, [BWPort1], 3>;
	defm : BWWriteResPair<WriteTZCNT, [BWPort1], 3>;			defm : BWWriteResPair<WriteTZCNT, [BWPort1], 3>;
	defm : BWWriteResPair<WritePOPCNT, [BWPort1], 3>;			defm : BWWriteResPair<WritePOPCNT, [BWPort1], 3>;

	▲ Show 20 Lines • Show All 447 Lines • ▼ Show 20 Lines
	def: InstRW<[BWWriteResGroup5], (instrs FINCSTP, FNOP)>;			def: InstRW<[BWWriteResGroup5], (instrs FINCSTP, FNOP)>;

	def BWWriteResGroup6 : SchedWriteRes<[BWPort06]> {			def BWWriteResGroup6 : SchedWriteRes<[BWPort06]> {
	let Latency = 1;			let Latency = 1;
	let NumMicroOps = 1;			let NumMicroOps = 1;
	let ResourceCycles = [1];			let ResourceCycles = [1];
	}			}
	def: InstRW<[BWWriteResGroup6], (instrs CDQ, CQO)>;			def: InstRW<[BWWriteResGroup6], (instrs CDQ, CQO)>;
	def: InstRW<[BWWriteResGroup6], (instregex "BT(16\|32\|64)ri8",
	"BT(16\|32\|64)rr",
	"BTC(16\|32\|64)ri8",
	"BTC(16\|32\|64)rr",
	"BTR(16\|32\|64)ri8",
	"BTR(16\|32\|64)rr",
	"BTS(16\|32\|64)ri8",
	"BTS(16\|32\|64)rr")>;

	def BWWriteResGroup7 : SchedWriteRes<[BWPort15]> {			def BWWriteResGroup7 : SchedWriteRes<[BWPort15]> {
	let Latency = 1;			let Latency = 1;
	let NumMicroOps = 1;			let NumMicroOps = 1;
	let ResourceCycles = [1];			let ResourceCycles = [1];
	}			}
	def: InstRW<[BWWriteResGroup7], (instregex "ANDN(32\|64)rr",			def: InstRW<[BWWriteResGroup7], (instregex "ANDN(32\|64)rr",
	"BLSI(32\|64)rr",			"BLSI(32\|64)rr",
	▲ Show 20 Lines • Show All 1,104 Lines • Show Last 20 Lines

lib/Target/X86/X86SchedHaswell.td

	Show First 20 Lines • Show All 135 Lines • ▼ Show 20 Lines
	defm : HWWriteResPair<WriteCMOV2, [HWPort06,HWPort0156], 3, [1,2], 3>; // Conditional (CF + ZF flag) move.			defm : HWWriteResPair<WriteCMOV2, [HWPort06,HWPort0156], 3, [1,2], 3>; // Conditional (CF + ZF flag) move.
	defm : X86WriteRes<WriteFCMOV, [HWPort1], 3, [1], 1>; // x87 conditional move.			defm : X86WriteRes<WriteFCMOV, [HWPort1], 3, [1], 1>; // x87 conditional move.
	def : WriteRes<WriteSETCC, [HWPort06]>; // Setcc.			def : WriteRes<WriteSETCC, [HWPort06]>; // Setcc.
	def : WriteRes<WriteSETCCStore, [HWPort06,HWPort4,HWPort237]> {			def : WriteRes<WriteSETCCStore, [HWPort06,HWPort4,HWPort237]> {
	let Latency = 2;			let Latency = 2;
	let NumMicroOps = 3;			let NumMicroOps = 3;
	}			}
	def : WriteRes<WriteLAHFSAHF, [HWPort06]>;			def : WriteRes<WriteLAHFSAHF, [HWPort06]>;
				def : WriteRes<WriteBitTest,[HWPort06]>;

	// This is for simple LEAs with one or two input operands.			// This is for simple LEAs with one or two input operands.
	// The complex ones can only execute on port 1, and they require two cycles on			// The complex ones can only execute on port 1, and they require two cycles on
	// the port to read all inputs. We don't model that.			// the port to read all inputs. We don't model that.
	def : WriteRes<WriteLEA, [HWPort15]>;			def : WriteRes<WriteLEA, [HWPort15]>;

	// Bit counts.			// Bit counts.
	defm : HWWriteResPair<WriteBSF, [HWPort1], 3>;			defm : HWWriteResPair<WriteBSF, [HWPort1], 3>;
	▲ Show 20 Lines • Show All 475 Lines • ▼ Show 20 Lines
	}			}
	def : InstRW<[HWWriteBTmr], (instregex "BT(16\|32\|64)mr")>;			def : InstRW<[HWWriteBTmr], (instregex "BT(16\|32\|64)mr")>;

	// BTR BTS BTC.			// BTR BTS BTC.
	// m,r.			// m,r.
	def HWWriteBTRSCmr : SchedWriteRes<[]> {			def HWWriteBTRSCmr : SchedWriteRes<[]> {
	let NumMicroOps = 11;			let NumMicroOps = 11;
	}			}
	def : InstRW<[HWWriteBTRSCmr], (instregex "BT(R\|S\|C)(16\|32\|64)mr")>;			def : InstRW<[HWWriteBTRSCmr], (instregex "BT(R\|S\|C)(16\|32\|64)mr")>;
				RKSimonUnsubmitted Not Done Reply Inline Actions @craig.topper @courbet @gchatelet These look completely wrong (and BTmr above) - and Broadwell appears to be missing them as well - any suggestions for the bit tests memory cases? RKSimon: @craig.topper @courbet @gchatelet These look completely wrong (and BTmr above) - and Broadwell…
				craig.topperUnsubmitted Not Done Reply Inline Actions Skylake doesn't even have an InstRW for them. They're also missing from the copy of the database used by IACA that I have. I believe that's where Gadi got most of the info from. I wonder what IACA does if you feed it those instructions. craig.topper: Skylake doesn't even have an InstRW for them. They're also missing from the copy of the…
				courbetUnsubmitted Not Done Reply Inline Actions I can't tell for latencies because we do not support memory operands yet. For uops, I have working support in this patch: https://reviews.llvm.org/D48935 On haswell, this gives: --- mode: uops key: instructions: - 'BTC64mr RDI i_0x1x i_0x0x R9' - 'BTC64mr RDI i_0x1x i_0x64x RBX' - 'BTC64mr RDI i_0x1x i_0x128x RSI' - 'BTC64mr RDI i_0x1x i_0x192x RCX' - 'BTC64mr RDI i_0x1x i_0x256x R8' - 'BTC64mr RDI i_0x1x i_0x320x RDX' config: '' cpu_name: haswell llvm_triple: x86_64-unknown-linux-gnu num_repetitions: 10000 measurements: - { key: '3', value: 1.3771, debug_string: HWPort0 } - { key: '4', value: 1.8848, debug_string: HWPort1 } - { key: '5', value: 1.3687, debug_string: HWPort2 } - { key: '6', value: 0.728, debug_string: HWPort3 } - { key: '7', value: 1.0025, debug_string: HWPort4 } - { key: '8', value: 1.6272, debug_string: HWPort5 } - { key: '9', value: 2.1307, debug_string: HWPort6 } - { key: '10', value: 0.0002, debug_string: HWPort7 } error: '' info: instruction is parallel, repeating a random one. assembled_snippet: 5349C7C10100000048C7C30100000048C7C60100000048C7C10100000049C7C00100000048C7C2010000004C0FBB0F480FBB5F40480FBBB780000000480FBB8FC00000004C0FBB8700010000480FBB97400100004C0FBB0F480FBB5F40480FBBB780000000480FBB8FC00000004C0FBB8700010000480FBB97400100004C0FBB0F480FBB5F40480FBBB780000000480FBB8FC00000004C0FBB8700010000480FBB97400100004C0FBB0F480FBB5F40480FBBB780000000480FBB8FC00000005BC3 ... Other instructions are similar. This is a bit noisy unfortunately. This looks like 2P23 (or maybe P23 + P237, P7 being unused for some reason ?) + 7P0156 + P4. courbet: I can't tell for latencies because we do not support memory operands yet. For uops, I have…

	//-- Control transfer instructions --//			//-- Control transfer instructions --//

	// CALL.			// CALL.
	// i.			// i.
	def HWWriteRETI : SchedWriteRes<[HWPort23, HWPort6, HWPort015]> {			def HWWriteRETI : SchedWriteRes<[HWPort23, HWPort6, HWPort015]> {
	let NumMicroOps = 4;			let NumMicroOps = 4;
	let ResourceCycles = [1, 2, 1];			let ResourceCycles = [1, 2, 1];
	▲ Show 20 Lines • Show All 237 Lines • ▼ Show 20 Lines
	def: InstRW<[HWWriteResGroup6], (instrs FINCSTP, FNOP)>;			def: InstRW<[HWWriteResGroup6], (instrs FINCSTP, FNOP)>;

	def HWWriteResGroup7 : SchedWriteRes<[HWPort06]> {			def HWWriteResGroup7 : SchedWriteRes<[HWPort06]> {
	let Latency = 1;			let Latency = 1;
	let NumMicroOps = 1;			let NumMicroOps = 1;
	let ResourceCycles = [1];			let ResourceCycles = [1];
	}			}
	def: InstRW<[HWWriteResGroup7], (instrs CDQ, CQO)>;			def: InstRW<[HWWriteResGroup7], (instrs CDQ, CQO)>;
	def: InstRW<[HWWriteResGroup7], (instregex "BT(16\|32\|64)ri8",
	"BT(16\|32\|64)rr",
	"BTC(16\|32\|64)ri8",
	"BTC(16\|32\|64)rr",
	"BTR(16\|32\|64)ri8",
	"BTR(16\|32\|64)rr",
	"BTS(16\|32\|64)ri8",
	"BTS(16\|32\|64)rr")>;

	def HWWriteResGroup8 : SchedWriteRes<[HWPort15]> {			def HWWriteResGroup8 : SchedWriteRes<[HWPort15]> {
	let Latency = 1;			let Latency = 1;
	let NumMicroOps = 1;			let NumMicroOps = 1;
	let ResourceCycles = [1];			let ResourceCycles = [1];
	}			}
	def: InstRW<[HWWriteResGroup8], (instregex "ANDN(32\|64)rr",			def: InstRW<[HWWriteResGroup8], (instregex "ANDN(32\|64)rr",
	"BLSI(32\|64)rr",			"BLSI(32\|64)rr",
	▲ Show 20 Lines • Show All 1,095 Lines • Show Last 20 Lines

lib/Target/X86/X86SchedSandyBridge.td

	Show First 20 Lines • Show All 133 Lines • ▼ Show 20 Lines
	defm : SBWriteResPair<WriteCMOV2, [SBPort05,SBPort015], 3, [2,1], 3>; // Conditional (CF + ZF flag) move.			defm : SBWriteResPair<WriteCMOV2, [SBPort05,SBPort015], 3, [2,1], 3>; // Conditional (CF + ZF flag) move.
	defm : X86WriteRes<WriteFCMOV, [SBPort5,SBPort05], 3, [2,1], 3>; // x87 conditional move.			defm : X86WriteRes<WriteFCMOV, [SBPort5,SBPort05], 3, [2,1], 3>; // x87 conditional move.
	def : WriteRes<WriteSETCC, [SBPort05]>; // Setcc.			def : WriteRes<WriteSETCC, [SBPort05]>; // Setcc.
	def : WriteRes<WriteSETCCStore, [SBPort05,SBPort4,SBPort23]> {			def : WriteRes<WriteSETCCStore, [SBPort05,SBPort4,SBPort23]> {
	let Latency = 2;			let Latency = 2;
	let NumMicroOps = 3;			let NumMicroOps = 3;
	}			}
	def : WriteRes<WriteLAHFSAHF, [SBPort05]>;			def : WriteRes<WriteLAHFSAHF, [SBPort05]>;
				def : WriteRes<WriteBitTest,[SBPort05]>;

	// This is for simple LEAs with one or two input operands.			// This is for simple LEAs with one or two input operands.
	// The complex ones can only execute on port 1, and they require two cycles on			// The complex ones can only execute on port 1, and they require two cycles on
	// the port to read all inputs. We don't model that.			// the port to read all inputs. We don't model that.
	def : WriteRes<WriteLEA, [SBPort01]>;			def : WriteRes<WriteLEA, [SBPort01]>;

	// Bit counts.			// Bit counts.
	defm : SBWriteResPair<WriteBSF, [SBPort1], 3, [1], 1, 5>;			defm : SBWriteResPair<WriteBSF, [SBPort1], 3, [1], 1, 5>;
	▲ Show 20 Lines • Show All 409 Lines • ▼ Show 20 Lines
	def: InstRW<[SBWriteResGroup2], (instrs RETQ)>;			def: InstRW<[SBWriteResGroup2], (instrs RETQ)>;

	def SBWriteResGroup4 : SchedWriteRes<[SBPort05]> {			def SBWriteResGroup4 : SchedWriteRes<[SBPort05]> {
	let Latency = 1;			let Latency = 1;
	let NumMicroOps = 1;			let NumMicroOps = 1;
	let ResourceCycles = [1];			let ResourceCycles = [1];
	}			}
	def: InstRW<[SBWriteResGroup4], (instrs CDQ, CQO)>;			def: InstRW<[SBWriteResGroup4], (instrs CDQ, CQO)>;
	def: InstRW<[SBWriteResGroup4], (instregex "BT(16\|32\|64)ri8",
	"BT(16\|32\|64)rr",
	"BTC(16\|32\|64)ri8",
	"BTC(16\|32\|64)rr",
	"BTR(16\|32\|64)ri8",
	"BTR(16\|32\|64)rr",
	"BTS(16\|32\|64)ri8",
	"BTS(16\|32\|64)rr")>;

	def SBWriteResGroup5 : SchedWriteRes<[SBPort15]> {			def SBWriteResGroup5 : SchedWriteRes<[SBPort15]> {
	let Latency = 1;			let Latency = 1;
	let NumMicroOps = 1;			let NumMicroOps = 1;
	let ResourceCycles = [1];			let ResourceCycles = [1];
	}			}
	def: InstRW<[SBWriteResGroup5], (instregex "MMX_PABS(B\|D\|W)rr",			def: InstRW<[SBWriteResGroup5], (instregex "MMX_PABS(B\|D\|W)rr",
	"MMX_PADDQirr",			"MMX_PADDQirr",
	▲ Show 20 Lines • Show All 610 Lines • Show Last 20 Lines

lib/Target/X86/X86SchedSkylakeClient.td

	Show First 20 Lines • Show All 130 Lines • ▼ Show 20 Lines
	defm : SKLWriteResPair<WriteCMOV2, [SKLPort06], 2, [2], 2>; // Conditional (CF + ZF flag) move.			defm : SKLWriteResPair<WriteCMOV2, [SKLPort06], 2, [2], 2>; // Conditional (CF + ZF flag) move.
	defm : X86WriteRes<WriteFCMOV, [SKLPort1], 3, [1], 1>; // x87 conditional move.			defm : X86WriteRes<WriteFCMOV, [SKLPort1], 3, [1], 1>; // x87 conditional move.
	def : WriteRes<WriteSETCC, [SKLPort06]>; // Setcc.			def : WriteRes<WriteSETCC, [SKLPort06]>; // Setcc.
	def : WriteRes<WriteSETCCStore, [SKLPort06,SKLPort4,SKLPort237]> {			def : WriteRes<WriteSETCCStore, [SKLPort06,SKLPort4,SKLPort237]> {
	let Latency = 2;			let Latency = 2;
	let NumMicroOps = 3;			let NumMicroOps = 3;
	}			}
	def : WriteRes<WriteLAHFSAHF, [SKLPort06]>;			def : WriteRes<WriteLAHFSAHF, [SKLPort06]>;
				def : WriteRes<WriteBitTest,[SKLPort06]>; //

	// Bit counts.			// Bit counts.
	defm : SKLWriteResPair<WriteBSF, [SKLPort1], 3>;			defm : SKLWriteResPair<WriteBSF, [SKLPort1], 3>;
	defm : SKLWriteResPair<WriteBSR, [SKLPort1], 3>;			defm : SKLWriteResPair<WriteBSR, [SKLPort1], 3>;
	defm : SKLWriteResPair<WriteLZCNT, [SKLPort1], 3>;			defm : SKLWriteResPair<WriteLZCNT, [SKLPort1], 3>;
	defm : SKLWriteResPair<WriteTZCNT, [SKLPort1], 3>;			defm : SKLWriteResPair<WriteTZCNT, [SKLPort1], 3>;
	defm : SKLWriteResPair<WritePOPCNT, [SKLPort1], 3>;			defm : SKLWriteResPair<WritePOPCNT, [SKLPort1], 3>;

	▲ Show 20 Lines • Show All 450 Lines • ▼ Show 20 Lines
	def: InstRW<[SKLWriteResGroup6], (instrs FINCSTP, FNOP)>;			def: InstRW<[SKLWriteResGroup6], (instrs FINCSTP, FNOP)>;

	def SKLWriteResGroup7 : SchedWriteRes<[SKLPort06]> {			def SKLWriteResGroup7 : SchedWriteRes<[SKLPort06]> {
	let Latency = 1;			let Latency = 1;
	let NumMicroOps = 1;			let NumMicroOps = 1;
	let ResourceCycles = [1];			let ResourceCycles = [1];
	}			}
	def: InstRW<[SKLWriteResGroup7], (instrs CDQ, CQO, CLAC, STAC)>;			def: InstRW<[SKLWriteResGroup7], (instrs CDQ, CQO, CLAC, STAC)>;
	def: InstRW<[SKLWriteResGroup7], (instregex "BT(16\|32\|64)ri8",
	"BT(16\|32\|64)rr",
	"BTC(16\|32\|64)ri8",
	"BTC(16\|32\|64)rr",
	"BTR(16\|32\|64)ri8",
	"BTR(16\|32\|64)rr",
	"BTS(16\|32\|64)ri8",
	"BTS(16\|32\|64)rr")>;

	def SKLWriteResGroup8 : SchedWriteRes<[SKLPort15]> {			def SKLWriteResGroup8 : SchedWriteRes<[SKLPort15]> {
	let Latency = 1;			let Latency = 1;
	let NumMicroOps = 1;			let NumMicroOps = 1;
	let ResourceCycles = [1];			let ResourceCycles = [1];
	}			}
	def: InstRW<[SKLWriteResGroup8], (instregex "ANDN(32\|64)rr",			def: InstRW<[SKLWriteResGroup8], (instregex "ANDN(32\|64)rr",
	"BLSI(32\|64)rr",			"BLSI(32\|64)rr",
	▲ Show 20 Lines • Show All 1,260 Lines • Show Last 20 Lines

lib/Target/X86/X86SchedSkylakeServer.td

	Show First 20 Lines • Show All 130 Lines • ▼ Show 20 Lines
	defm : SKXWriteResPair<WriteCMOV2, [SKXPort06], 2, [2], 2>; // Conditional (CF + ZF flag) move.			defm : SKXWriteResPair<WriteCMOV2, [SKXPort06], 2, [2], 2>; // Conditional (CF + ZF flag) move.
	defm : X86WriteRes<WriteFCMOV, [SKXPort1], 3, [1], 1>; // x87 conditional move.			defm : X86WriteRes<WriteFCMOV, [SKXPort1], 3, [1], 1>; // x87 conditional move.
	def : WriteRes<WriteSETCC, [SKXPort06]>; // Setcc.			def : WriteRes<WriteSETCC, [SKXPort06]>; // Setcc.
	def : WriteRes<WriteSETCCStore, [SKXPort06,SKXPort4,SKXPort237]> {			def : WriteRes<WriteSETCCStore, [SKXPort06,SKXPort4,SKXPort237]> {
	let Latency = 2;			let Latency = 2;
	let NumMicroOps = 3;			let NumMicroOps = 3;
	}			}
	def : WriteRes<WriteLAHFSAHF, [SKXPort06]>;			def : WriteRes<WriteLAHFSAHF, [SKXPort06]>;
				def : WriteRes<WriteBitTest,[SKXPort06]>; //

	// Integer shifts and rotates.			// Integer shifts and rotates.
	defm : SKXWriteResPair<WriteShift, [SKXPort06], 1>;			defm : SKXWriteResPair<WriteShift, [SKXPort06], 1>;

	// Double shift instructions.			// Double shift instructions.
	defm : SKXWriteResPair<WriteShiftDouble, [SKXPort06], 1>;			defm : SKXWriteResPair<WriteShiftDouble, [SKXPort06], 1>;

	// Bit counts.			// Bit counts.
	▲ Show 20 Lines • Show All 463 Lines • ▼ Show 20 Lines
	def: InstRW<[SKXWriteResGroup6], (instrs FINCSTP, FNOP)>;			def: InstRW<[SKXWriteResGroup6], (instrs FINCSTP, FNOP)>;

	def SKXWriteResGroup7 : SchedWriteRes<[SKXPort06]> {			def SKXWriteResGroup7 : SchedWriteRes<[SKXPort06]> {
	let Latency = 1;			let Latency = 1;
	let NumMicroOps = 1;			let NumMicroOps = 1;
	let ResourceCycles = [1];			let ResourceCycles = [1];
	}			}
	def: InstRW<[SKXWriteResGroup7], (instrs CDQ, CQO, CLAC, STAC)>;			def: InstRW<[SKXWriteResGroup7], (instrs CDQ, CQO, CLAC, STAC)>;
	def: InstRW<[SKXWriteResGroup7], (instregex "BT(16\|32\|64)ri8",
	"BT(16\|32\|64)rr",
	"BTC(16\|32\|64)ri8",
	"BTC(16\|32\|64)rr",
	"BTR(16\|32\|64)ri8",
	"BTR(16\|32\|64)rr",
	"BTS(16\|32\|64)ri8",
	"BTS(16\|32\|64)rr")>;

	def SKXWriteResGroup8 : SchedWriteRes<[SKXPort15]> {			def SKXWriteResGroup8 : SchedWriteRes<[SKXPort15]> {
	let Latency = 1;			let Latency = 1;
	let NumMicroOps = 1;			let NumMicroOps = 1;
	let ResourceCycles = [1];			let ResourceCycles = [1];
	}			}
	def: InstRW<[SKXWriteResGroup8], (instregex "ANDN(32\|64)rr",			def: InstRW<[SKXWriteResGroup8], (instregex "ANDN(32\|64)rr",
	"BLSI(32\|64)rr",			"BLSI(32\|64)rr",
	▲ Show 20 Lines • Show All 1,977 Lines • Show Last 20 Lines

lib/Target/X86/X86Schedule.td

	Show First 20 Lines • Show All 113 Lines • ▼ Show 20 Lines
	def WriteALURMW : WriteSequence<[WriteALULd, WriteStore]>;			def WriteALURMW : WriteSequence<[WriteALULd, WriteStore]>;
	def WriteADCRMW : WriteSequence<[WriteADCLd, WriteStore]>;			def WriteADCRMW : WriteSequence<[WriteADCLd, WriteStore]>;
	defm WriteIMul : X86SchedWritePair; // Integer multiplication.			defm WriteIMul : X86SchedWritePair; // Integer multiplication.
	defm WriteIMul64 : X86SchedWritePair; // Integer 64-bit multiplication.			defm WriteIMul64 : X86SchedWritePair; // Integer 64-bit multiplication.
	def WriteIMulH : SchedWrite; // Integer multiplication, high part.			def WriteIMulH : SchedWrite; // Integer multiplication, high part.
	def WriteLEA : SchedWrite; // LEA instructions can't fold loads.			def WriteLEA : SchedWrite; // LEA instructions can't fold loads.

	defm WriteBSWAP32: X86SchedWritePair; // Byte Order (Endiannes) Swap			defm WriteBSWAP32: X86SchedWritePair; // Byte Order (Endiannes) Swap
	defm WriteBSWAP64: X86SchedWritePair; // Byte Order (Endiannes) Swap			defm WriteBSWAP64: X86SchedWritePair; // Byte Order (Endiannes) Swap
				lebedev.riUnsubmitted Not Done Reply Inline Actions Hmm. Nits: (not a nit) The suffix `r` notes that only the non-mem versions are covered. I wonder if we can convey that somehow better. These cover 4 different bit-test instructions - `bt`,`bt[rcs]` Naming this `WriteBTr` may be confizing - is this only about `bt` instruction? How about calling it `WriteBitTest`? lebedev.ri: Hmm. Nits: 1. (not a nit) The suffix `r` notes that only the non-mem versions are covered. I…
				RKSimonUnsubmitted Not Done Reply Inline Actions I'm confused - this should be probably be called WriteBT. But then you've declared this as a X86SchedWritePair but you're not using the folded half of the pair? RKSimon: I'm confused - this should be probably be called WriteBT. But then you've declared this as a…
				lebedev.riUnsubmitted Not Done Reply Inline Actions Note that it only covers `rr` versions, and does not include `mr` versions. So yeah, maybe it shouldn't be `X86SchedWritePair`, but `X86WriteRes`? lebedev.ri: Note that it only covers `rr` versions, and does not include `mr` versions. So yeah, maybe it…
				avt77AuthorUnsubmitted Not Done Reply Inline Actions I'm going to implement mr version asap that's why I use Pair here. avt77: I'm going to implement mr version asap that's why I use Pair here.
				RKSimonUnsubmitted Not Done Reply Inline Actions If the memory cases are causing a problem it'd be acceptable to just do a reg-reg version for now: def WriteBitTest : SchedWrite // Bit Test - TODO add memory folding support And you can come back to the memory cases once we understand whats to be done. I just don't want a X86SchedWritePair def when you're not using the folded case. RKSimon: If the memory cases are causing a problem it'd be acceptable to just do a reg-reg version for…
				RKSimonUnsubmitted Not Done Reply Inline Actions Very minor, but please can you put the WriteBT defs next to the CMOV/SETCC defs - they are closer in behaviour. RKSimon: Very minor, but please can you put the WriteBT defs next to the CMOV/SETCC defs - they are…

	// Integer division.			// Integer division.
	defm WriteDiv8 : X86SchedWritePair;			defm WriteDiv8 : X86SchedWritePair;
	defm WriteDiv16 : X86SchedWritePair;			defm WriteDiv16 : X86SchedWritePair;
	defm WriteDiv32 : X86SchedWritePair;			defm WriteDiv32 : X86SchedWritePair;
	defm WriteDiv64 : X86SchedWritePair;			defm WriteDiv64 : X86SchedWritePair;
	defm WriteIDiv8 : X86SchedWritePair;			defm WriteIDiv8 : X86SchedWritePair;
	defm WriteIDiv16 : X86SchedWritePair;			defm WriteIDiv16 : X86SchedWritePair;
	defm WriteIDiv32 : X86SchedWritePair;			defm WriteIDiv32 : X86SchedWritePair;
	defm WriteIDiv64 : X86SchedWritePair;			defm WriteIDiv64 : X86SchedWritePair;

	defm WriteBSF : X86SchedWritePair; // Bit scan forward.			defm WriteBSF : X86SchedWritePair; // Bit scan forward.
	defm WriteBSR : X86SchedWritePair; // Bit scan reverse.			defm WriteBSR : X86SchedWritePair; // Bit scan reverse.
	defm WritePOPCNT : X86SchedWritePair; // Bit population count.			defm WritePOPCNT : X86SchedWritePair; // Bit population count.
	defm WriteLZCNT : X86SchedWritePair; // Leading zero count.			defm WriteLZCNT : X86SchedWritePair; // Leading zero count.
	defm WriteTZCNT : X86SchedWritePair; // Trailing zero count.			defm WriteTZCNT : X86SchedWritePair; // Trailing zero count.
	defm WriteCMOV : X86SchedWritePair; // Conditional move.			defm WriteCMOV : X86SchedWritePair; // Conditional move.
	defm WriteCMOV2 : X86SchedWritePair; // Conditional (CF + ZF flag) move.			defm WriteCMOV2 : X86SchedWritePair; // Conditional (CF + ZF flag) move.
	def WriteFCMOV : SchedWrite; // X87 conditional move.			def WriteFCMOV : SchedWrite; // X87 conditional move.
	def WriteSETCC : SchedWrite; // Set register based on condition code.			def WriteSETCC : SchedWrite; // Set register based on condition code.
	def WriteSETCCStore : SchedWrite;			def WriteSETCCStore : SchedWrite;
	def WriteLAHFSAHF : SchedWrite; // Load/Store flags in AH.			def WriteLAHFSAHF : SchedWrite; // Load/Store flags in AH.
				def WriteBitTest : SchedWrite; // Bit Test - TODO add memory folding support

	// Integer shifts and rotates.			// Integer shifts and rotates.
	defm WriteShift : X86SchedWritePair;			defm WriteShift : X86SchedWritePair;
	// Double shift instructions.			// Double shift instructions.
	defm WriteShiftDouble : X86SchedWritePair;			defm WriteShiftDouble : X86SchedWritePair;

	// BMI1 BEXTR, BMI2 BZHI			// BMI1 BEXTR, BMI2 BZHI
	defm WriteBEXTR : X86SchedWritePair;			defm WriteBEXTR : X86SchedWritePair;
	▲ Show 20 Lines • Show All 505 Lines • Show Last 20 Lines

lib/Target/X86/X86ScheduleAtom.td

	Show First 20 Lines • Show All 102 Lines • ▼ Show 20 Lines
	def : WriteRes<WriteSETCCStore, [AtomPort01]> {			def : WriteRes<WriteSETCCStore, [AtomPort01]> {
	let Latency = 2;			let Latency = 2;
	let ResourceCycles = [2];			let ResourceCycles = [2];
	}			}
	def : WriteRes<WriteLAHFSAHF, [AtomPort01]> {			def : WriteRes<WriteLAHFSAHF, [AtomPort01]> {
	let Latency = 2;			let Latency = 2;
	let ResourceCycles = [2];			let ResourceCycles = [2];
	}			}
				def : WriteRes<WriteBitTest,[AtomPort01]>;

	defm : X86WriteResUnsupported<WriteIMulH>;			defm : X86WriteResUnsupported<WriteIMulH>;

	// This is for simple LEAs with one or two input operands.			// This is for simple LEAs with one or two input operands.
	def : WriteRes<WriteLEA, [AtomPort1]>;			def : WriteRes<WriteLEA, [AtomPort1]>;

	def AtomWriteIMul16Ld : SchedWriteRes<[AtomPort01]> {			def AtomWriteIMul16Ld : SchedWriteRes<[AtomPort01]> {
	let Latency = 8;			let Latency = 8;
	▲ Show 20 Lines • Show All 803 Lines • Show Last 20 Lines

lib/Target/X86/X86ScheduleBtVer2.td

	Show First 20 Lines • Show All 182 Lines • ▼ Show 20 Lines
	defm : JWriteResIntPair<WriteCRC32, [JALU01], 3, [4], 3>;			defm : JWriteResIntPair<WriteCRC32, [JALU01], 3, [4], 3>;

	defm : JWriteResIntPair<WriteCMOV, [JALU01], 1>; // Conditional move.			defm : JWriteResIntPair<WriteCMOV, [JALU01], 1>; // Conditional move.
	defm : JWriteResIntPair<WriteCMOV2, [JALU01], 1>; // Conditional (CF + ZF flag) move.			defm : JWriteResIntPair<WriteCMOV2, [JALU01], 1>; // Conditional (CF + ZF flag) move.
	defm : X86WriteRes<WriteFCMOV, [JFPU0, JFPA], 3, [1,1], 1>; // x87 conditional move.			defm : X86WriteRes<WriteFCMOV, [JFPU0, JFPA], 3, [1,1], 1>; // x87 conditional move.
	def : WriteRes<WriteSETCC, [JALU01]>; // Setcc.			def : WriteRes<WriteSETCC, [JALU01]>; // Setcc.
	def : WriteRes<WriteSETCCStore, [JALU01,JSAGU]>;			def : WriteRes<WriteSETCCStore, [JALU01,JSAGU]>;
	def : WriteRes<WriteLAHFSAHF, [JALU01]>;			def : WriteRes<WriteLAHFSAHF, [JALU01]>;
				def : WriteRes<WriteBitTest,[JALU01]>;

	// This is for simple LEAs with one or two input operands.			// This is for simple LEAs with one or two input operands.
	def : WriteRes<WriteLEA, [JALU01]>;			def : WriteRes<WriteLEA, [JALU01]>;

	// Bit counts.			// Bit counts.
	defm : JWriteResIntPair<WriteBSF, [JALU01], 5, [4], 8>;			defm : JWriteResIntPair<WriteBSF, [JALU01], 5, [4], 8>;
	defm : JWriteResIntPair<WriteBSR, [JALU01], 5, [4], 8>;			defm : JWriteResIntPair<WriteBSR, [JALU01], 5, [4], 8>;
	defm : JWriteResIntPair<WritePOPCNT, [JALU01], 1>;			defm : JWriteResIntPair<WritePOPCNT, [JALU01], 1>;
	▲ Show 20 Lines • Show All 505 Lines • Show Last 20 Lines

lib/Target/X86/X86ScheduleSLM.td

	Show First 20 Lines • Show All 109 Lines • ▼ Show 20 Lines
	defm : SLMWriteResPair<WriteCMOV2, [SLM_IEC_RSV01], 2, [2]>;			defm : SLMWriteResPair<WriteCMOV2, [SLM_IEC_RSV01], 2, [2]>;
	defm : X86WriteRes<WriteFCMOV, [SLM_FPC_RSV1], 3, [1], 1>; // x87 conditional move.			defm : X86WriteRes<WriteFCMOV, [SLM_FPC_RSV1], 3, [1], 1>; // x87 conditional move.
	def : WriteRes<WriteSETCC, [SLM_IEC_RSV01]>;			def : WriteRes<WriteSETCC, [SLM_IEC_RSV01]>;
	def : WriteRes<WriteSETCCStore, [SLM_IEC_RSV01, SLM_MEC_RSV]> {			def : WriteRes<WriteSETCCStore, [SLM_IEC_RSV01, SLM_MEC_RSV]> {
	// FIXME Latency and NumMicrOps?			// FIXME Latency and NumMicrOps?
	let ResourceCycles = [2,1];			let ResourceCycles = [2,1];
	}			}
	def : WriteRes<WriteLAHFSAHF, [SLM_IEC_RSV01]>;			def : WriteRes<WriteLAHFSAHF, [SLM_IEC_RSV01]>;
				def : WriteRes<WriteBitTest,[SLM_IEC_RSV01]>;

	// This is for simple LEAs with one or two input operands.			// This is for simple LEAs with one or two input operands.
	// The complex ones can only execute on port 1, and they require two cycles on			// The complex ones can only execute on port 1, and they require two cycles on
	// the port to read all inputs. We don't model that.			// the port to read all inputs. We don't model that.
	def : WriteRes<WriteLEA, [SLM_IEC_RSV1]>;			def : WriteRes<WriteLEA, [SLM_IEC_RSV1]>;

	// Bit counts.			// Bit counts.
	defm : SLMWriteResPair<WriteBSF, [SLM_IEC_RSV01], 10, [20], 10>;			defm : SLMWriteResPair<WriteBSF, [SLM_IEC_RSV01], 10, [20], 10>;
	▲ Show 20 Lines • Show All 355 Lines • Show Last 20 Lines

lib/Target/X86/X86ScheduleZnver1.td

	Show First 20 Lines • Show All 187 Lines • ▼ Show 20 Lines
	defm : ZnWriteResPair<WriteJump, [ZnALU], 1>;			defm : ZnWriteResPair<WriteJump, [ZnALU], 1>;
	defm : ZnWriteResFpuPair<WriteCRC32, [ZnFPU0], 3>;			defm : ZnWriteResFpuPair<WriteCRC32, [ZnFPU0], 3>;

	defm : ZnWriteResPair<WriteCMOV, [ZnALU], 1>;			defm : ZnWriteResPair<WriteCMOV, [ZnALU], 1>;
	defm : ZnWriteResPair<WriteCMOV2, [ZnALU], 1>;			defm : ZnWriteResPair<WriteCMOV2, [ZnALU], 1>;
	def : WriteRes<WriteSETCC, [ZnALU]>;			def : WriteRes<WriteSETCC, [ZnALU]>;
	def : WriteRes<WriteSETCCStore, [ZnALU, ZnAGU]>;			def : WriteRes<WriteSETCCStore, [ZnALU, ZnAGU]>;
	defm : X86WriteRes<WriteLAHFSAHF, [ZnALU], 2, [1], 2>;			defm : X86WriteRes<WriteLAHFSAHF, [ZnALU], 2, [1], 2>;
				def : WriteRes<WriteBitTest,[ZnALU]>;

	// Bit counts.			// Bit counts.
	defm : ZnWriteResPair<WriteBSF, [ZnALU], 3>;			defm : ZnWriteResPair<WriteBSF, [ZnALU], 3>;
	defm : ZnWriteResPair<WriteBSR, [ZnALU], 3>;			defm : ZnWriteResPair<WriteBSR, [ZnALU], 3>;
	defm : ZnWriteResPair<WriteLZCNT, [ZnALU], 2>;			defm : ZnWriteResPair<WriteLZCNT, [ZnALU], 2>;
	defm : ZnWriteResPair<WriteTZCNT, [ZnALU], 2>;			defm : ZnWriteResPair<WriteTZCNT, [ZnALU], 2>;
	defm : ZnWriteResPair<WritePOPCNT, [ZnALU], 1>;			defm : ZnWriteResPair<WritePOPCNT, [ZnALU], 1>;

	▲ Show 20 Lines • Show All 1,335 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Improved sched models for X86 BT*rr instructions
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 156741

lib/Target/X86/X86InstrInfo.td

lib/Target/X86/X86SchedBroadwell.td

lib/Target/X86/X86SchedHaswell.td

lib/Target/X86/X86SchedSandyBridge.td

lib/Target/X86/X86SchedSkylakeClient.td

lib/Target/X86/X86SchedSkylakeServer.td

lib/Target/X86/X86Schedule.td

lib/Target/X86/X86ScheduleAtom.td

lib/Target/X86/X86ScheduleBtVer2.td

lib/Target/X86/X86ScheduleSLM.td

lib/Target/X86/X86ScheduleZnver1.td

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Improved sched models for X86 BT*rr instructionsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 156741

lib/Target/X86/X86InstrInfo.td

lib/Target/X86/X86SchedBroadwell.td

lib/Target/X86/X86SchedHaswell.td

lib/Target/X86/X86SchedSandyBridge.td

lib/Target/X86/X86SchedSkylakeClient.td

lib/Target/X86/X86SchedSkylakeServer.td

lib/Target/X86/X86Schedule.td

lib/Target/X86/X86ScheduleAtom.td

lib/Target/X86/X86ScheduleBtVer2.td

lib/Target/X86/X86ScheduleSLM.td

lib/Target/X86/X86ScheduleZnver1.td

[X86] Improved sched models for X86 BT*rr instructions
ClosedPublic