This is an archive of the discontinued LLVM Phabricator instance.

[X86] Replace (most) X86ISD::SHLD/SHRD usage with ISD::FSHL/FSHR generic opcodes (PR39467)
ClosedPublic

Authored by RKSimon on Mar 6 2020, 7:50 AM.

Download Raw Diff

Details

Reviewers

craig.topper
spatel
lebedev.ri

Commits

rGb3b4727a3e7e: [X86] Replace (most) X86ISD::SHLD/SHRD usage with ISD::FSHL/FSHR generic…

Summary

For i32 and i64 cases, X86ISD::SHLD/SHRD are close enough to ISD::FSHL/FSHR that we can use them directly, we just need to account for the operand commutation for SHRD.

The i16 SHLD/SHRD case is annoying as the shift amount is modulo-32 (vs funnel shift modulo-16), so I've added X86ISD::FSHL/FSHR equivalents, which matches the generic implementation in all other terms.

Something I'm slightly concerned with is that ISD::FSHL/FSHR legality is controlled by the Subtarget.isSHLDSlow() feature flag - we don't normally use non-ISA features for this but it allows the DAG combines to continue to operate after legalization in a lot more cases.

The X86 clear_highbits.ll changes are all affected by the same issue - we now have a "FSHR(-1,-1,amt) -> ROTR(-1,amt) -> (-1)" simplification that reduces the dependencies enough for the branch fall through code to mess up. I'm not sure how much of a patch-specific problem this is - tbh if it wasn't for the extra stack usage I wouldn't care much at all. Thoughts?

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

RKSimon created this revision.Mar 6 2020, 7:50 AM

Herald added a project: Restricted Project. · View Herald TranscriptMar 6 2020, 7:50 AM

Herald added a subscriber: hiraditya. · View Herald Transcript

RKSimon edited the summary of this revision. (Show Details)Mar 6 2020, 7:54 AM

RKSimon marked an inline comment as done.Mar 6 2020, 8:03 AM

RKSimon added inline comments.

llvm/test/CodeGen/X86/clear-highbits.ll
3–6	@lebedev.ri Apart from the X86-FALLBACK0 case, can't we enable +cmov on these x86 targets? I can't think of a target that would support any BMI/TBM level without CMOV support.

lebedev.ri added inline comments.Mar 6 2020, 8:20 AM

llvm/test/CodeGen/X86/clear-highbits.ll
3–6	I don't see why not.

Harbormaster failed remote builds in B48338: Diff 248730!Mar 6 2020, 8:46 AM

RKSimon mentioned this in D58475: [X86] Improve detection of unneeded shift amount masking to also handle the case that the LHS has known zeroes in it.Mar 6 2020, 9:42 AM

rebase

RKSimon mentioned this in rGfb8149cac8b0: [X86] Add CMOV to i686 BMI/TBM tests.Mar 6 2020, 9:55 AM

(i think this is the wrong patch)

Harbormaster failed remote builds in B48367: Diff 248768!Mar 6 2020, 10:29 AM

Are you sure this is the right patch?

This revision now requires changes to proceed.Mar 9 2020, 6:29 AM

Sorry, git was being git - will fix in a sec

regenerate diff

Harbormaster failed remote builds in B48550: Diff 249099!Mar 9 2020, 8:35 AM

Any more comments? I don't want to rush but I'm keen to get this in as it blocks a number of other patches.

craig.topper added inline comments.Mar 10 2020, 10:58 AM

llvm/lib/Target/X86/X86ISelLowering.h
37	What is the 'x' after the W?

This doesn't look unreasonable to me but best for someone one too look this over, too.

This revision is now accepted and ready to land.Mar 10 2020, 11:04 AM

RKSimon marked an inline comment as done.Mar 10 2020, 3:23 PM

RKSimon added inline comments.

llvm/lib/Target/X86/X86ISelLowering.h
37	The instruction suffix for the rr/rm/mr cases - I'll remove it.

RKSimon marked an inline comment as done and an inline comment as not done.Mar 10 2020, 3:49 PM

RKSimon added inline comments.

llvm/lib/Target/X86/X86ISelLowering.h
37	@craig.topper Other than this are you ok with the patch?

LGTM

llvm/lib/Target/X86/X86ISelLowering.h
37	Yeah

Closed by commit rGb3b4727a3e7e: [X86] Replace (most) X86ISD::SHLD/SHRD usage with ISD::FSHL/FSHR generic… (authored by RKSimon). · Explain WhyMar 11 2020, 4:33 AM

This revision was automatically updated to reflect the committed changes.

RKSimon marked an inline comment as not done.

RKSimon mentioned this in D75114: [DAG] MatchRotate - Add funnel shift by immediate support.Mar 11 2020, 5:07 AM

Revision Contents

Path

Size

llvm/

lib/

Target/

X86/

10 lines

22 lines

33 lines

4 lines

X86InstrShiftRotate.td

70 lines

test/

CodeGen/

X86/

255 lines

158 lines

464 lines

489 lines

9 lines

13 lines

1 line

11 lines

Diff 249584

llvm/lib/Target/X86/X86ISelLowering.h

Show All 27 Lines	enum NodeType : unsigned {
// Start the numbering where the builtin ops leave off.		// Start the numbering where the builtin ops leave off.
FIRST_NUMBER = ISD::BUILTIN_OP_END,		FIRST_NUMBER = ISD::BUILTIN_OP_END,

/// Bit scan forward.		/// Bit scan forward.
BSF,		BSF,
/// Bit scan reverse.		/// Bit scan reverse.
BSR,		BSR,

/// Double shift instructions. These correspond to		/// X86 funnel/double shift i16 instructions. These correspond to
/// X86::SHLDxx and X86::SHRDxx instructions.		/// X86::SHLDW and X86::SHRDW instructions which have different amt
		craig.topperUnsubmitted Not Done Reply Inline Actions What is the 'x' after the W? craig.topper: What is the 'x' after the W?
		RKSimonAuthorUnsubmitted Not Done Reply Inline Actions The instruction suffix for the rr/rm/mr cases - I'll remove it. RKSimon: The instruction suffix for the rr/rm/mr cases - I'll remove it.
		RKSimonAuthorUnsubmitted Done Reply Inline Actions @craig.topper Other than this are you ok with the patch? RKSimon: @craig.topper Other than this are you ok with the patch?
		craig.topperUnsubmitted Not Done Reply Inline Actions Yeah craig.topper: Yeah
SHLD,		/// modulo rules to generic funnel shifts.
SHRD,		/// NOTE: The operand order matches ISD::FSHL/FSHR not SHLD/SHRD.
		FSHL,
		FSHR,

/// Bitwise logical AND of floating point values. This corresponds		/// Bitwise logical AND of floating point values. This corresponds
/// to X86::ANDPS or X86::ANDPD.		/// to X86::ANDPS or X86::ANDPD.
FAND,		FAND,

/// Bitwise logical OR of floating point values. This corresponds		/// Bitwise logical OR of floating point values. This corresponds
/// to X86::ORPS or X86::ORPD.		/// to X86::ORPS or X86::ORPD.
FOR,		FOR,
▲ Show 20 Lines • Show All 1,574 Lines • Show Last 20 Lines

llvm/lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 201 Lines • ▼ Show 20 Lines	X86TargetLowering::X86TargetLowering(const X86TargetMachine &TM,
if (Subtarget.hasCMov()) {		if (Subtarget.hasCMov()) {
setOperationAction(ISD::ABS , MVT::i16 , Custom);		setOperationAction(ISD::ABS , MVT::i16 , Custom);
setOperationAction(ISD::ABS , MVT::i32 , Custom);		setOperationAction(ISD::ABS , MVT::i32 , Custom);
}		}
setOperationAction(ISD::ABS , MVT::i64 , Custom);		setOperationAction(ISD::ABS , MVT::i64 , Custom);

// Funnel shifts.		// Funnel shifts.
for (auto ShiftOp : {ISD::FSHL, ISD::FSHR}) {		for (auto ShiftOp : {ISD::FSHL, ISD::FSHR}) {
		// For slow shld targets we only lower for code size.
		LegalizeAction ShiftDoubleAction = Subtarget.isSHLDSlow() ? Custom : Legal;

setOperationAction(ShiftOp , MVT::i16 , Custom);		setOperationAction(ShiftOp , MVT::i16 , Custom);
setOperationAction(ShiftOp , MVT::i32 , Custom);		setOperationAction(ShiftOp , MVT::i32 , ShiftDoubleAction);
if (Subtarget.is64Bit())		if (Subtarget.is64Bit())
setOperationAction(ShiftOp , MVT::i64 , Custom);		setOperationAction(ShiftOp , MVT::i64 , ShiftDoubleAction);
}		}

if (!Subtarget.useSoftFloat()) {		if (!Subtarget.useSoftFloat()) {
// Promote all UINT_TO_FP to larger SINT_TO_FP's, as X86 doesn't have this		// Promote all UINT_TO_FP to larger SINT_TO_FP's, as X86 doesn't have this
// operation.		// operation.
setOperationAction(ISD::UINT_TO_FP, MVT::i8, Promote);		setOperationAction(ISD::UINT_TO_FP, MVT::i8, Promote);
setOperationAction(ISD::STRICT_UINT_TO_FP, MVT::i8, Promote);		setOperationAction(ISD::STRICT_UINT_TO_FP, MVT::i8, Promote);
setOperationAction(ISD::UINT_TO_FP, MVT::i16, Promote);		setOperationAction(ISD::UINT_TO_FP, MVT::i16, Promote);
▲ Show 20 Lines • Show All 18,633 Lines • ▼ Show 20 Lines	static SDValue LowerFunnelShift(SDValue Op, const X86Subtarget &Subtarget,
assert((VT == MVT::i16 \|\| VT == MVT::i32 \|\| VT == MVT::i64) &&		assert((VT == MVT::i16 \|\| VT == MVT::i32 \|\| VT == MVT::i64) &&
"Unexpected funnel shift type!");		"Unexpected funnel shift type!");

// Expand slow SHLD/SHRD cases if we are not optimizing for size.		// Expand slow SHLD/SHRD cases if we are not optimizing for size.
bool OptForSize = DAG.shouldOptForSize();		bool OptForSize = DAG.shouldOptForSize();
if (!OptForSize && Subtarget.isSHLDSlow())		if (!OptForSize && Subtarget.isSHLDSlow())
return SDValue();		return SDValue();

if (IsFSHR)
std::swap(Op0, Op1);

// i16 needs to modulo the shift amount, but i32/i64 have implicit modulo.		// i16 needs to modulo the shift amount, but i32/i64 have implicit modulo.
if (VT == MVT::i16)		if (VT == MVT::i16) {
Amt = DAG.getNode(ISD::AND, DL, Amt.getValueType(), Amt,		Amt = DAG.getNode(ISD::AND, DL, Amt.getValueType(), Amt,
DAG.getConstant(15, DL, Amt.getValueType()));		DAG.getConstant(15, DL, Amt.getValueType()));
		unsigned FSHOp = (IsFSHR ? X86ISD::FSHR : X86ISD::FSHL);
		return DAG.getNode(FSHOp, DL, VT, Op0, Op1, Amt);
		}

unsigned SHDOp = (IsFSHR ? X86ISD::SHRD : X86ISD::SHLD);		return Op;
return DAG.getNode(SHDOp, DL, VT, Op0, Op1, Amt);
}		}

// Try to use a packed vector operation to handle i64 on 32-bit targets when		// Try to use a packed vector operation to handle i64 on 32-bit targets when
// AVX512DQ is enabled.		// AVX512DQ is enabled.
static SDValue LowerI64IntToFP_AVX512DQ(SDValue Op, SelectionDAG &DAG,		static SDValue LowerI64IntToFP_AVX512DQ(SDValue Op, SelectionDAG &DAG,
const X86Subtarget &Subtarget) {		const X86Subtarget &Subtarget) {
assert((Op.getOpcode() == ISD::SINT_TO_FP \|\|		assert((Op.getOpcode() == ISD::SINT_TO_FP \|\|
Op.getOpcode() == ISD::STRICT_SINT_TO_FP \|\|		Op.getOpcode() == ISD::STRICT_SINT_TO_FP \|\|
▲ Show 20 Lines • Show All 11,077 Lines • ▼ Show 20 Lines
}		}

const char *X86TargetLowering::getTargetNodeName(unsigned Opcode) const {		const char *X86TargetLowering::getTargetNodeName(unsigned Opcode) const {
switch ((X86ISD::NodeType)Opcode) {		switch ((X86ISD::NodeType)Opcode) {
case X86ISD::FIRST_NUMBER: break;		case X86ISD::FIRST_NUMBER: break;
#define NODE_NAME_CASE(NODE) case X86ISD::NODE: return "X86ISD::" #NODE;		#define NODE_NAME_CASE(NODE) case X86ISD::NODE: return "X86ISD::" #NODE;
NODE_NAME_CASE(BSF)		NODE_NAME_CASE(BSF)
NODE_NAME_CASE(BSR)		NODE_NAME_CASE(BSR)
NODE_NAME_CASE(SHLD)		NODE_NAME_CASE(FSHL)
NODE_NAME_CASE(SHRD)		NODE_NAME_CASE(FSHR)
NODE_NAME_CASE(FAND)		NODE_NAME_CASE(FAND)
NODE_NAME_CASE(FANDN)		NODE_NAME_CASE(FANDN)
NODE_NAME_CASE(FOR)		NODE_NAME_CASE(FOR)
NODE_NAME_CASE(FXOR)		NODE_NAME_CASE(FXOR)
NODE_NAME_CASE(FILD)		NODE_NAME_CASE(FILD)
NODE_NAME_CASE(FIST)		NODE_NAME_CASE(FIST)
NODE_NAME_CASE(FP_TO_INT_IN_MEM)		NODE_NAME_CASE(FP_TO_INT_IN_MEM)
NODE_NAME_CASE(FLD)		NODE_NAME_CASE(FLD)
▲ Show 20 Lines • Show All 18,536 Lines • Show Last 20 Lines

llvm/lib/Target/X86/X86InstrCompiler.td

Show First 20 Lines • Show All 1,776 Lines • ▼ Show 20 Lines	multiclass MaskedRotateAmountPats<SDNode frag, string name> {
def : Pat<(store (frag (loadi64 addr:$dst), (shiftMask64 CL)), addr:$dst),		def : Pat<(store (frag (loadi64 addr:$dst), (shiftMask64 CL)), addr:$dst),
(!cast<Instruction>(name # "64mCL") addr:$dst)>;		(!cast<Instruction>(name # "64mCL") addr:$dst)>;
}		}


defm : MaskedRotateAmountPats<rotl, "ROL">;		defm : MaskedRotateAmountPats<rotl, "ROL">;
defm : MaskedRotateAmountPats<rotr, "ROR">;		defm : MaskedRotateAmountPats<rotr, "ROR">;

// Double shift amount is implicitly masked.		// Double "funnel" shift amount is implicitly masked.
multiclass MaskedDoubleShiftAmountPats<SDNode frag, string name> {		// (fshl/fshr x (and y, 31)) ==> (fshl/fshr x, y) (NOTE: modulo32)
// (shift x (and y, 31)) ==> (shift x, y)		def : Pat<(X86fshl GR16:$src1, GR16:$src2, (shiftMask32 CL)),
def : Pat<(frag GR16:$src1, GR16:$src2, (shiftMask32 CL)),		(SHLD16rrCL GR16:$src1, GR16:$src2)>;
(!cast<Instruction>(name # "16rrCL") GR16:$src1, GR16:$src2)>;		def : Pat<(X86fshr GR16:$src2, GR16:$src1, (shiftMask32 CL)),
def : Pat<(frag GR32:$src1, GR32:$src2, (shiftMask32 CL)),		(SHRD16rrCL GR16:$src1, GR16:$src2)>;
(!cast<Instruction>(name # "32rrCL") GR32:$src1, GR32:$src2)>;
		// (fshl/fshr x (and y, 31)) ==> (fshl/fshr x, y)
// (shift x (and y, 63)) ==> (shift x, y)		def : Pat<(fshl GR32:$src1, GR32:$src2, (shiftMask32 CL)),
def : Pat<(frag GR64:$src1, GR64:$src2, (shiftMask32 CL)),		(SHLD32rrCL GR32:$src1, GR32:$src2)>;
(!cast<Instruction>(name # "64rrCL") GR64:$src1, GR64:$src2)>;		def : Pat<(fshr GR32:$src2, GR32:$src1, (shiftMask32 CL)),
}		(SHRD32rrCL GR32:$src1, GR32:$src2)>;

defm : MaskedDoubleShiftAmountPats<X86shld, "SHLD">;		// (fshl/fshr x (and y, 63)) ==> (fshl/fshr x, y)
defm : MaskedDoubleShiftAmountPats<X86shrd, "SHRD">;		def : Pat<(fshl GR64:$src1, GR64:$src2, (shiftMask64 CL)),
		(SHLD64rrCL GR64:$src1, GR64:$src2)>;
		def : Pat<(fshr GR64:$src2, GR64:$src1, (shiftMask64 CL)),
		(SHRD64rrCL GR64:$src1, GR64:$src2)>;

let Predicates = [HasBMI2] in {		let Predicates = [HasBMI2] in {
let AddedComplexity = 1 in {		let AddedComplexity = 1 in {
def : Pat<(sra GR32:$src1, (shiftMask32 GR8:$src2)),		def : Pat<(sra GR32:$src1, (shiftMask32 GR8:$src2)),
(SARX32rr GR32:$src1,		(SARX32rr GR32:$src1,
(INSERT_SUBREG		(INSERT_SUBREG
(i32 (IMPLICIT_DEF)), GR8:$src2, sub_8bit))>;		(i32 (IMPLICIT_DEF)), GR8:$src2, sub_8bit))>;
def : Pat<(sra GR64:$src1, (shiftMask64 GR8:$src2)),		def : Pat<(sra GR64:$src1, (shiftMask64 GR8:$src2)),
▲ Show 20 Lines • Show All 328 Lines • Show Last 20 Lines

llvm/lib/Target/X86/X86InstrInfo.td

	Show First 20 Lines • Show All 137 Lines • ▼ Show 20 Lines
	def X86MemBarrier : SDNode<"X86ISD::MEMBARRIER", SDT_X86MEMBARRIER,			def X86MemBarrier : SDNode<"X86ISD::MEMBARRIER", SDT_X86MEMBARRIER,
	[SDNPHasChain,SDNPSideEffect]>;			[SDNPHasChain,SDNPSideEffect]>;
	def X86MFence : SDNode<"X86ISD::MFENCE", SDT_X86MEMBARRIER,			def X86MFence : SDNode<"X86ISD::MFENCE", SDT_X86MEMBARRIER,
	[SDNPHasChain]>;			[SDNPHasChain]>;


	def X86bsf : SDNode<"X86ISD::BSF", SDTUnaryArithWithFlags>;			def X86bsf : SDNode<"X86ISD::BSF", SDTUnaryArithWithFlags>;
	def X86bsr : SDNode<"X86ISD::BSR", SDTUnaryArithWithFlags>;			def X86bsr : SDNode<"X86ISD::BSR", SDTUnaryArithWithFlags>;
	def X86shld : SDNode<"X86ISD::SHLD", SDTIntShiftDOp>;			def X86fshl : SDNode<"X86ISD::FSHL", SDTIntShiftDOp>;
	def X86shrd : SDNode<"X86ISD::SHRD", SDTIntShiftDOp>;			def X86fshr : SDNode<"X86ISD::FSHR", SDTIntShiftDOp>;

	def X86cmp : SDNode<"X86ISD::CMP" , SDTX86CmpTest>;			def X86cmp : SDNode<"X86ISD::CMP" , SDTX86CmpTest>;
	def X86fcmp : SDNode<"X86ISD::FCMP", SDTX86FCmp>;			def X86fcmp : SDNode<"X86ISD::FCMP", SDTX86FCmp>;
	def X86strict_fcmp : SDNode<"X86ISD::STRICT_FCMP", SDTX86FCmp, [SDNPHasChain]>;			def X86strict_fcmp : SDNode<"X86ISD::STRICT_FCMP", SDTX86FCmp, [SDNPHasChain]>;
	def X86strict_fcmps : SDNode<"X86ISD::STRICT_FCMPS", SDTX86FCmp, [SDNPHasChain]>;			def X86strict_fcmps : SDNode<"X86ISD::STRICT_FCMPS", SDTX86FCmp, [SDNPHasChain]>;
	def X86bt : SDNode<"X86ISD::BT", SDTX86CmpTest>;			def X86bt : SDNode<"X86ISD::BT", SDTX86CmpTest>;

	def X86cmov : SDNode<"X86ISD::CMOV", SDTX86Cmov>;			def X86cmov : SDNode<"X86ISD::CMOV", SDTX86Cmov>;
	▲ Show 20 Lines • Show All 3,439 Lines • Show Last 20 Lines

llvm/lib/Target/X86/X86InstrShiftRotate.td

	Show First 20 Lines • Show All 655 Lines • ▼ Show 20 Lines
	//===----------------------------------------------------------------------===//			//===----------------------------------------------------------------------===//

	let Constraints = "$src1 = $dst" in {			let Constraints = "$src1 = $dst" in {

	let Uses = [CL], SchedRW = [WriteSHDrrcl] in {			let Uses = [CL], SchedRW = [WriteSHDrrcl] in {
	def SHLD16rrCL : I<0xA5, MRMDestReg, (outs GR16:$dst),			def SHLD16rrCL : I<0xA5, MRMDestReg, (outs GR16:$dst),
	(ins GR16:$src1, GR16:$src2),			(ins GR16:$src1, GR16:$src2),
	"shld{w}\t{%cl, $src2, $dst\|$dst, $src2, cl}",			"shld{w}\t{%cl, $src2, $dst\|$dst, $src2, cl}",
	[(set GR16:$dst, (X86shld GR16:$src1, GR16:$src2, CL))]>,			[(set GR16:$dst, (X86fshl GR16:$src1, GR16:$src2, CL))]>,
	TB, OpSize16;			TB, OpSize16;
	def SHRD16rrCL : I<0xAD, MRMDestReg, (outs GR16:$dst),			def SHRD16rrCL : I<0xAD, MRMDestReg, (outs GR16:$dst),
	(ins GR16:$src1, GR16:$src2),			(ins GR16:$src1, GR16:$src2),
	"shrd{w}\t{%cl, $src2, $dst\|$dst, $src2, cl}",			"shrd{w}\t{%cl, $src2, $dst\|$dst, $src2, cl}",
	[(set GR16:$dst, (X86shrd GR16:$src1, GR16:$src2, CL))]>,			[(set GR16:$dst, (X86fshr GR16:$src2, GR16:$src1, CL))]>,
	TB, OpSize16;			TB, OpSize16;
	def SHLD32rrCL : I<0xA5, MRMDestReg, (outs GR32:$dst),			def SHLD32rrCL : I<0xA5, MRMDestReg, (outs GR32:$dst),
	(ins GR32:$src1, GR32:$src2),			(ins GR32:$src1, GR32:$src2),
	"shld{l}\t{%cl, $src2, $dst\|$dst, $src2, cl}",			"shld{l}\t{%cl, $src2, $dst\|$dst, $src2, cl}",
	[(set GR32:$dst, (X86shld GR32:$src1, GR32:$src2, CL))]>,			[(set GR32:$dst, (fshl GR32:$src1, GR32:$src2, CL))]>,
	TB, OpSize32;			TB, OpSize32;
	def SHRD32rrCL : I<0xAD, MRMDestReg, (outs GR32:$dst),			def SHRD32rrCL : I<0xAD, MRMDestReg, (outs GR32:$dst),
	(ins GR32:$src1, GR32:$src2),			(ins GR32:$src1, GR32:$src2),
	"shrd{l}\t{%cl, $src2, $dst\|$dst, $src2, cl}",			"shrd{l}\t{%cl, $src2, $dst\|$dst, $src2, cl}",
	[(set GR32:$dst, (X86shrd GR32:$src1, GR32:$src2, CL))]>,			[(set GR32:$dst, (fshr GR32:$src2, GR32:$src1, CL))]>,
	TB, OpSize32;			TB, OpSize32;
	def SHLD64rrCL : RI<0xA5, MRMDestReg, (outs GR64:$dst),			def SHLD64rrCL : RI<0xA5, MRMDestReg, (outs GR64:$dst),
	(ins GR64:$src1, GR64:$src2),			(ins GR64:$src1, GR64:$src2),
	"shld{q}\t{%cl, $src2, $dst\|$dst, $src2, cl}",			"shld{q}\t{%cl, $src2, $dst\|$dst, $src2, cl}",
	[(set GR64:$dst, (X86shld GR64:$src1, GR64:$src2, CL))]>,			[(set GR64:$dst, (fshl GR64:$src1, GR64:$src2, CL))]>,
	TB;			TB;
	def SHRD64rrCL : RI<0xAD, MRMDestReg, (outs GR64:$dst),			def SHRD64rrCL : RI<0xAD, MRMDestReg, (outs GR64:$dst),
	(ins GR64:$src1, GR64:$src2),			(ins GR64:$src1, GR64:$src2),
	"shrd{q}\t{%cl, $src2, $dst\|$dst, $src2, cl}",			"shrd{q}\t{%cl, $src2, $dst\|$dst, $src2, cl}",
	[(set GR64:$dst, (X86shrd GR64:$src1, GR64:$src2, CL))]>,			[(set GR64:$dst, (fshr GR64:$src2, GR64:$src1, CL))]>,
	TB;			TB;
	} // SchedRW			} // SchedRW

	let isCommutable = 1, SchedRW = [WriteSHDrri] in { // These instructions commute to each other.			let isCommutable = 1, SchedRW = [WriteSHDrri] in { // These instructions commute to each other.
	def SHLD16rri8 : Ii8<0xA4, MRMDestReg,			def SHLD16rri8 : Ii8<0xA4, MRMDestReg,
	(outs GR16:$dst),			(outs GR16:$dst),
	(ins GR16:$src1, GR16:$src2, u8imm:$src3),			(ins GR16:$src1, GR16:$src2, u8imm:$src3),
	"shld{w}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",			"shld{w}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",
	[(set GR16:$dst, (X86shld GR16:$src1, GR16:$src2,			[(set GR16:$dst, (X86fshl GR16:$src1, GR16:$src2,
	(i8 imm:$src3)))]>,			(i8 imm:$src3)))]>,
	TB, OpSize16;			TB, OpSize16;
	def SHRD16rri8 : Ii8<0xAC, MRMDestReg,			def SHRD16rri8 : Ii8<0xAC, MRMDestReg,
	(outs GR16:$dst),			(outs GR16:$dst),
	(ins GR16:$src1, GR16:$src2, u8imm:$src3),			(ins GR16:$src1, GR16:$src2, u8imm:$src3),
	"shrd{w}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",			"shrd{w}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",
	[(set GR16:$dst, (X86shrd GR16:$src1, GR16:$src2,			[(set GR16:$dst, (X86fshr GR16:$src2, GR16:$src1,
	(i8 imm:$src3)))]>,			(i8 imm:$src3)))]>,
	TB, OpSize16;			TB, OpSize16;
	def SHLD32rri8 : Ii8<0xA4, MRMDestReg,			def SHLD32rri8 : Ii8<0xA4, MRMDestReg,
	(outs GR32:$dst),			(outs GR32:$dst),
	(ins GR32:$src1, GR32:$src2, u8imm:$src3),			(ins GR32:$src1, GR32:$src2, u8imm:$src3),
	"shld{l}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",			"shld{l}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",
	[(set GR32:$dst, (X86shld GR32:$src1, GR32:$src2,			[(set GR32:$dst, (fshl GR32:$src1, GR32:$src2,
	(i8 imm:$src3)))]>,			(i8 imm:$src3)))]>,
	TB, OpSize32;			TB, OpSize32;
	def SHRD32rri8 : Ii8<0xAC, MRMDestReg,			def SHRD32rri8 : Ii8<0xAC, MRMDestReg,
	(outs GR32:$dst),			(outs GR32:$dst),
	(ins GR32:$src1, GR32:$src2, u8imm:$src3),			(ins GR32:$src1, GR32:$src2, u8imm:$src3),
	"shrd{l}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",			"shrd{l}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",
	[(set GR32:$dst, (X86shrd GR32:$src1, GR32:$src2,			[(set GR32:$dst, (fshr GR32:$src2, GR32:$src1,
	(i8 imm:$src3)))]>,			(i8 imm:$src3)))]>,
	TB, OpSize32;			TB, OpSize32;
	def SHLD64rri8 : RIi8<0xA4, MRMDestReg,			def SHLD64rri8 : RIi8<0xA4, MRMDestReg,
	(outs GR64:$dst),			(outs GR64:$dst),
	(ins GR64:$src1, GR64:$src2, u8imm:$src3),			(ins GR64:$src1, GR64:$src2, u8imm:$src3),
	"shld{q}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",			"shld{q}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",
	[(set GR64:$dst, (X86shld GR64:$src1, GR64:$src2,			[(set GR64:$dst, (fshl GR64:$src1, GR64:$src2,
	(i8 imm:$src3)))]>,			(i8 imm:$src3)))]>,
	TB;			TB;
	def SHRD64rri8 : RIi8<0xAC, MRMDestReg,			def SHRD64rri8 : RIi8<0xAC, MRMDestReg,
	(outs GR64:$dst),			(outs GR64:$dst),
	(ins GR64:$src1, GR64:$src2, u8imm:$src3),			(ins GR64:$src1, GR64:$src2, u8imm:$src3),
	"shrd{q}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",			"shrd{q}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",
	[(set GR64:$dst, (X86shrd GR64:$src1, GR64:$src2,			[(set GR64:$dst, (fshr GR64:$src2, GR64:$src1,
	(i8 imm:$src3)))]>,			(i8 imm:$src3)))]>,
	TB;			TB;
	} // SchedRW			} // SchedRW
	} // Constraints = "$src = $dst"			} // Constraints = "$src = $dst"

	let Uses = [CL], SchedRW = [WriteSHDmrcl] in {			let Uses = [CL], SchedRW = [WriteSHDmrcl] in {
	def SHLD16mrCL : I<0xA5, MRMDestMem, (outs), (ins i16mem:$dst, GR16:$src2),			def SHLD16mrCL : I<0xA5, MRMDestMem, (outs), (ins i16mem:$dst, GR16:$src2),
	"shld{w}\t{%cl, $src2, $dst\|$dst, $src2, cl}",			"shld{w}\t{%cl, $src2, $dst\|$dst, $src2, cl}",
	[(store (X86shld (loadi16 addr:$dst), GR16:$src2, CL),			[(store (X86fshl (loadi16 addr:$dst), GR16:$src2, CL),
	addr:$dst)]>, TB, OpSize16;			addr:$dst)]>, TB, OpSize16;
	def SHRD16mrCL : I<0xAD, MRMDestMem, (outs), (ins i16mem:$dst, GR16:$src2),			def SHRD16mrCL : I<0xAD, MRMDestMem, (outs), (ins i16mem:$dst, GR16:$src2),
	"shrd{w}\t{%cl, $src2, $dst\|$dst, $src2, cl}",			"shrd{w}\t{%cl, $src2, $dst\|$dst, $src2, cl}",
	[(store (X86shrd (loadi16 addr:$dst), GR16:$src2, CL),			[(store (X86fshr GR16:$src2, (loadi16 addr:$dst), CL),
	addr:$dst)]>, TB, OpSize16;			addr:$dst)]>, TB, OpSize16;

	def SHLD32mrCL : I<0xA5, MRMDestMem, (outs), (ins i32mem:$dst, GR32:$src2),			def SHLD32mrCL : I<0xA5, MRMDestMem, (outs), (ins i32mem:$dst, GR32:$src2),
	"shld{l}\t{%cl, $src2, $dst\|$dst, $src2, cl}",			"shld{l}\t{%cl, $src2, $dst\|$dst, $src2, cl}",
	[(store (X86shld (loadi32 addr:$dst), GR32:$src2, CL),			[(store (fshl (loadi32 addr:$dst), GR32:$src2, CL),
	addr:$dst)]>, TB, OpSize32;			addr:$dst)]>, TB, OpSize32;
	def SHRD32mrCL : I<0xAD, MRMDestMem, (outs), (ins i32mem:$dst, GR32:$src2),			def SHRD32mrCL : I<0xAD, MRMDestMem, (outs), (ins i32mem:$dst, GR32:$src2),
	"shrd{l}\t{%cl, $src2, $dst\|$dst, $src2, cl}",			"shrd{l}\t{%cl, $src2, $dst\|$dst, $src2, cl}",
	[(store (X86shrd (loadi32 addr:$dst), GR32:$src2, CL),			[(store (fshr GR32:$src2, (loadi32 addr:$dst), CL),
	addr:$dst)]>, TB, OpSize32;			addr:$dst)]>, TB, OpSize32;

	def SHLD64mrCL : RI<0xA5, MRMDestMem, (outs), (ins i64mem:$dst, GR64:$src2),			def SHLD64mrCL : RI<0xA5, MRMDestMem, (outs), (ins i64mem:$dst, GR64:$src2),
	"shld{q}\t{%cl, $src2, $dst\|$dst, $src2, cl}",			"shld{q}\t{%cl, $src2, $dst\|$dst, $src2, cl}",
	[(store (X86shld (loadi64 addr:$dst), GR64:$src2, CL),			[(store (fshl (loadi64 addr:$dst), GR64:$src2, CL),
	addr:$dst)]>, TB;			addr:$dst)]>, TB;
	def SHRD64mrCL : RI<0xAD, MRMDestMem, (outs), (ins i64mem:$dst, GR64:$src2),			def SHRD64mrCL : RI<0xAD, MRMDestMem, (outs), (ins i64mem:$dst, GR64:$src2),
	"shrd{q}\t{%cl, $src2, $dst\|$dst, $src2, cl}",			"shrd{q}\t{%cl, $src2, $dst\|$dst, $src2, cl}",
	[(store (X86shrd (loadi64 addr:$dst), GR64:$src2, CL),			[(store (fshr GR64:$src2, (loadi64 addr:$dst), CL),
	addr:$dst)]>, TB;			addr:$dst)]>, TB;
	} // SchedRW			} // SchedRW

	let SchedRW = [WriteSHDmri] in {			let SchedRW = [WriteSHDmri] in {
	def SHLD16mri8 : Ii8<0xA4, MRMDestMem,			def SHLD16mri8 : Ii8<0xA4, MRMDestMem,
	(outs), (ins i16mem:$dst, GR16:$src2, u8imm:$src3),			(outs), (ins i16mem:$dst, GR16:$src2, u8imm:$src3),
	"shld{w}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",			"shld{w}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",
	[(store (X86shld (loadi16 addr:$dst), GR16:$src2,			[(store (X86fshl (loadi16 addr:$dst), GR16:$src2,
	(i8 imm:$src3)), addr:$dst)]>,			(i8 imm:$src3)), addr:$dst)]>,
	TB, OpSize16;			TB, OpSize16;
	def SHRD16mri8 : Ii8<0xAC, MRMDestMem,			def SHRD16mri8 : Ii8<0xAC, MRMDestMem,
	(outs), (ins i16mem:$dst, GR16:$src2, u8imm:$src3),			(outs), (ins i16mem:$dst, GR16:$src2, u8imm:$src3),
	"shrd{w}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",			"shrd{w}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",
	[(store (X86shrd (loadi16 addr:$dst), GR16:$src2,			[(store (X86fshr GR16:$src2, (loadi16 addr:$dst),
	(i8 imm:$src3)), addr:$dst)]>,			(i8 imm:$src3)), addr:$dst)]>,
	TB, OpSize16;			TB, OpSize16;

	def SHLD32mri8 : Ii8<0xA4, MRMDestMem,			def SHLD32mri8 : Ii8<0xA4, MRMDestMem,
	(outs), (ins i32mem:$dst, GR32:$src2, u8imm:$src3),			(outs), (ins i32mem:$dst, GR32:$src2, u8imm:$src3),
	"shld{l}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",			"shld{l}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",
	[(store (X86shld (loadi32 addr:$dst), GR32:$src2,			[(store (fshl (loadi32 addr:$dst), GR32:$src2,
	(i8 imm:$src3)), addr:$dst)]>,			(i8 imm:$src3)), addr:$dst)]>,
	TB, OpSize32;			TB, OpSize32;
	def SHRD32mri8 : Ii8<0xAC, MRMDestMem,			def SHRD32mri8 : Ii8<0xAC, MRMDestMem,
	(outs), (ins i32mem:$dst, GR32:$src2, u8imm:$src3),			(outs), (ins i32mem:$dst, GR32:$src2, u8imm:$src3),
	"shrd{l}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",			"shrd{l}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",
	[(store (X86shrd (loadi32 addr:$dst), GR32:$src2,			[(store (fshr GR32:$src2, (loadi32 addr:$dst),
	(i8 imm:$src3)), addr:$dst)]>,			(i8 imm:$src3)), addr:$dst)]>,
	TB, OpSize32;			TB, OpSize32;

	def SHLD64mri8 : RIi8<0xA4, MRMDestMem,			def SHLD64mri8 : RIi8<0xA4, MRMDestMem,
	(outs), (ins i64mem:$dst, GR64:$src2, u8imm:$src3),			(outs), (ins i64mem:$dst, GR64:$src2, u8imm:$src3),
	"shld{q}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",			"shld{q}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",
	[(store (X86shld (loadi64 addr:$dst), GR64:$src2,			[(store (fshl (loadi64 addr:$dst), GR64:$src2,
	(i8 imm:$src3)), addr:$dst)]>,			(i8 imm:$src3)), addr:$dst)]>,
	TB;			TB;
	def SHRD64mri8 : RIi8<0xAC, MRMDestMem,			def SHRD64mri8 : RIi8<0xAC, MRMDestMem,
	(outs), (ins i64mem:$dst, GR64:$src2, u8imm:$src3),			(outs), (ins i64mem:$dst, GR64:$src2, u8imm:$src3),
	"shrd{q}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",			"shrd{q}\t{$src3, $src2, $dst\|$dst, $src2, $src3}",
	[(store (X86shrd (loadi64 addr:$dst), GR64:$src2,			[(store (fshr GR64:$src2, (loadi64 addr:$dst),
	(i8 imm:$src3)), addr:$dst)]>,			(i8 imm:$src3)), addr:$dst)]>,
	TB;			TB;
	} // SchedRW			} // SchedRW

	} // Defs = [EFLAGS]			} // Defs = [EFLAGS]

	// Use the opposite rotate if allows us to use the rotate by 1 instruction.			// Use the opposite rotate if allows us to use the rotate by 1 instruction.
	def : Pat<(rotl GR8:$src1, (i8 7)), (ROR8r1 GR8:$src1)>;			def : Pat<(rotl GR8:$src1, (i8 7)), (ROR8r1 GR8:$src1)>;
	def : Pat<(rotl GR16:$src1, (i8 15)), (ROR16r1 GR16:$src1)>;			def : Pat<(rotl GR16:$src1, (i8 15)), (ROR16r1 GR16:$src1)>;
	▲ Show 20 Lines • Show All 202 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/clear-highbits.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc -mtriple=i686-unknown-linux-gnu -mattr=-bmi,-tbm,-bmi2 < %s \| FileCheck %s --check-prefixes=CHECK,X86,NOBMI2,X86-NOBMI2,FALLBACK0,X86-FALLBACK0		; RUN: llc -mtriple=i686-unknown-linux-gnu -mattr=-bmi,-tbm,-bmi2 < %s \| FileCheck %s --check-prefixes=CHECK,X86,NOBMI2,X86-NOBMI2,FALLBACK0,X86-FALLBACK0
; RUN: llc -mtriple=i686-unknown-linux-gnu -mattr=+cmov,+bmi,-tbm,-bmi2 < %s \| FileCheck %s --check-prefixes=CHECK,X86,NOBMI2,X86-NOBMI2,FALLBACK1,X86-FALLBACK1		; RUN: llc -mtriple=i686-unknown-linux-gnu -mattr=+cmov,+bmi,-tbm,-bmi2 < %s \| FileCheck %s --check-prefixes=CHECK,X86,NOBMI2,X86-NOBMI2,FALLBACK1,X86-FALLBACK1
; RUN: llc -mtriple=i686-unknown-linux-gnu -mattr=+cmov,+bmi,+tbm,-bmi2 < %s \| FileCheck %s --check-prefixes=CHECK,X86,NOBMI2,X86-NOBMI2,FALLBACK2,X86-FALLBACK2		; RUN: llc -mtriple=i686-unknown-linux-gnu -mattr=+cmov,+bmi,+tbm,-bmi2 < %s \| FileCheck %s --check-prefixes=CHECK,X86,NOBMI2,X86-NOBMI2,FALLBACK2,X86-FALLBACK2
; RUN: llc -mtriple=i686-unknown-linux-gnu -mattr=+cmov,+bmi,+tbm,+bmi2 < %s \| FileCheck %s --check-prefixes=CHECK,X86,BMI2,X86-BMI2,FALLBACK3,X86-FALLBACK3		; RUN: llc -mtriple=i686-unknown-linux-gnu -mattr=+cmov,+bmi,+tbm,+bmi2 < %s \| FileCheck %s --check-prefixes=CHECK,X86,BMI2,X86-BMI2,FALLBACK3,X86-FALLBACK3
; RUN: llc -mtriple=i686-unknown-linux-gnu -mattr=+cmov,+bmi,-tbm,+bmi2 < %s \| FileCheck %s --check-prefixes=CHECK,X86,BMI2,X86-BMI2,FALLBACK4,X86-FALLBACK4		; RUN: llc -mtriple=i686-unknown-linux-gnu -mattr=+cmov,+bmi,-tbm,+bmi2 < %s \| FileCheck %s --check-prefixes=CHECK,X86,BMI2,X86-BMI2,FALLBACK4,X86-FALLBACK4
		RKSimonAuthorUnsubmitted Done Reply Inline Actions @lebedev.ri Apart from the X86-FALLBACK0 case, can't we enable +cmov on these x86 targets? I can't think of a target that would support any BMI/TBM level without CMOV support. RKSimon: @lebedev.ri Apart from the X86-FALLBACK0 case, can't we enable +cmov on these x86 targets? I…
		lebedev.riUnsubmitted Not Done Reply Inline Actions I don't see why not. lebedev.ri: I don't see why not.
; RUN: llc -mtriple=x86_64-unknown-linux-gnu -mattr=-bmi,-tbm,-bmi2 < %s \| FileCheck %s --check-prefixes=CHECK,X64,NOBMI2,X64-NOBMI2,FALLBACK0,X64-FALLBACK0		; RUN: llc -mtriple=x86_64-unknown-linux-gnu -mattr=-bmi,-tbm,-bmi2 < %s \| FileCheck %s --check-prefixes=CHECK,X64,NOBMI2,X64-NOBMI2,FALLBACK0,X64-FALLBACK0
; RUN: llc -mtriple=x86_64-unknown-linux-gnu -mattr=+bmi,-tbm,-bmi2 < %s \| FileCheck %s --check-prefixes=CHECK,X64,NOBMI2,X64-NOBMI2,FALLBACK1,X64-FALLBACK1		; RUN: llc -mtriple=x86_64-unknown-linux-gnu -mattr=+bmi,-tbm,-bmi2 < %s \| FileCheck %s --check-prefixes=CHECK,X64,NOBMI2,X64-NOBMI2,FALLBACK1,X64-FALLBACK1
; RUN: llc -mtriple=x86_64-unknown-linux-gnu -mattr=+bmi,+tbm,-bmi2 < %s \| FileCheck %s --check-prefixes=CHECK,X64,NOBMI2,X64-NOBMI2,FALLBACK2,X64-FALLBACK2		; RUN: llc -mtriple=x86_64-unknown-linux-gnu -mattr=+bmi,+tbm,-bmi2 < %s \| FileCheck %s --check-prefixes=CHECK,X64,NOBMI2,X64-NOBMI2,FALLBACK2,X64-FALLBACK2
; RUN: llc -mtriple=x86_64-unknown-linux-gnu -mattr=+bmi,+tbm,+bmi2 < %s \| FileCheck %s --check-prefixes=CHECK,X64,BMI2,X64-BMI2,FALLBACK3,X64-FALLBACK3		; RUN: llc -mtriple=x86_64-unknown-linux-gnu -mattr=+bmi,+tbm,+bmi2 < %s \| FileCheck %s --check-prefixes=CHECK,X64,BMI2,X64-BMI2,FALLBACK3,X64-FALLBACK3
; RUN: llc -mtriple=x86_64-unknown-linux-gnu -mattr=+bmi,-tbm,+bmi2 < %s \| FileCheck %s --check-prefixes=CHECK,X64,BMI2,X64-BMI2,FALLBACK4,X64-FALLBACK4		; RUN: llc -mtriple=x86_64-unknown-linux-gnu -mattr=+bmi,-tbm,+bmi2 < %s \| FileCheck %s --check-prefixes=CHECK,X64,BMI2,X64-BMI2,FALLBACK4,X64-FALLBACK4

; Patterns:		; Patterns:
; c) x & (-1 >> y)		; c) x & (-1 >> y)
▲ Show 20 Lines • Show All 493 Lines • ▼ Show 20 Lines

; ---------------------------------------------------------------------------- ;		; ---------------------------------------------------------------------------- ;
; 64-bit		; 64-bit
; ---------------------------------------------------------------------------- ;		; ---------------------------------------------------------------------------- ;

define i64 @clear_highbits64_c0(i64 %val, i64 %numhighbits) nounwind {		define i64 @clear_highbits64_c0(i64 %val, i64 %numhighbits) nounwind {
; X86-FALLBACK0-LABEL: clear_highbits64_c0:		; X86-FALLBACK0-LABEL: clear_highbits64_c0:
; X86-FALLBACK0: # %bb.0:		; X86-FALLBACK0: # %bb.0:
		; X86-FALLBACK0-NEXT: pushl %esi
; X86-FALLBACK0-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-FALLBACK0-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-FALLBACK0-NEXT: movl $-1, %eax		; X86-FALLBACK0-NEXT: movl $-1, %eax
; X86-FALLBACK0-NEXT: movl $-1, %edx		; X86-FALLBACK0-NEXT: movl $-1, %esi
; X86-FALLBACK0-NEXT: shrl %cl, %edx		; X86-FALLBACK0-NEXT: shrl %cl, %esi
; X86-FALLBACK0-NEXT: shrdl %cl, %eax, %eax
; X86-FALLBACK0-NEXT: testb $32, %cl
; X86-FALLBACK0-NEXT: je .LBB13_2
; X86-FALLBACK0-NEXT: # %bb.1:
; X86-FALLBACK0-NEXT: movl %edx, %eax
; X86-FALLBACK0-NEXT: xorl %edx, %edx		; X86-FALLBACK0-NEXT: xorl %edx, %edx
; X86-FALLBACK0-NEXT: .LBB13_2:		; X86-FALLBACK0-NEXT: testb $32, %cl
		; X86-FALLBACK0-NEXT: jne .LBB13_1
		; X86-FALLBACK0-NEXT: # %bb.2:
		; X86-FALLBACK0-NEXT: movl %esi, %edx
		; X86-FALLBACK0-NEXT: jmp .LBB13_3
		; X86-FALLBACK0-NEXT: .LBB13_1:
		; X86-FALLBACK0-NEXT: movl %esi, %eax
		; X86-FALLBACK0-NEXT: .LBB13_3:
; X86-FALLBACK0-NEXT: andl {{[0-9]+}}(%esp), %eax		; X86-FALLBACK0-NEXT: andl {{[0-9]+}}(%esp), %eax
; X86-FALLBACK0-NEXT: andl {{[0-9]+}}(%esp), %edx		; X86-FALLBACK0-NEXT: andl {{[0-9]+}}(%esp), %edx
		; X86-FALLBACK0-NEXT: popl %esi
; X86-FALLBACK0-NEXT: retl		; X86-FALLBACK0-NEXT: retl
;		;
; X86-FALLBACK1-LABEL: clear_highbits64_c0:		; X86-FALLBACK1-LABEL: clear_highbits64_c0:
; X86-FALLBACK1: # %bb.0:		; X86-FALLBACK1: # %bb.0:
; X86-FALLBACK1-NEXT: pushl %esi		; X86-FALLBACK1-NEXT: pushl %esi
; X86-FALLBACK1-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-FALLBACK1-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-FALLBACK1-NEXT: movl $-1, %eax
; X86-FALLBACK1-NEXT: movl $-1, %esi		; X86-FALLBACK1-NEXT: movl $-1, %esi
; X86-FALLBACK1-NEXT: shrl %cl, %esi		; X86-FALLBACK1-NEXT: movl $-1, %eax
; X86-FALLBACK1-NEXT: shrdl %cl, %eax, %eax		; X86-FALLBACK1-NEXT: shrl %cl, %eax
; X86-FALLBACK1-NEXT: xorl %edx, %edx		; X86-FALLBACK1-NEXT: xorl %edx, %edx
; X86-FALLBACK1-NEXT: testb $32, %cl		; X86-FALLBACK1-NEXT: testb $32, %cl
; X86-FALLBACK1-NEXT: cmovnel %esi, %eax		; X86-FALLBACK1-NEXT: cmovel %eax, %edx
; X86-FALLBACK1-NEXT: cmovel %esi, %edx		; X86-FALLBACK1-NEXT: cmovel %esi, %eax
; X86-FALLBACK1-NEXT: andl {{[0-9]+}}(%esp), %eax		; X86-FALLBACK1-NEXT: andl {{[0-9]+}}(%esp), %eax
; X86-FALLBACK1-NEXT: andl {{[0-9]+}}(%esp), %edx		; X86-FALLBACK1-NEXT: andl {{[0-9]+}}(%esp), %edx
; X86-FALLBACK1-NEXT: popl %esi		; X86-FALLBACK1-NEXT: popl %esi
; X86-FALLBACK1-NEXT: retl		; X86-FALLBACK1-NEXT: retl
;		;
; X86-FALLBACK2-LABEL: clear_highbits64_c0:		; X86-FALLBACK2-LABEL: clear_highbits64_c0:
; X86-FALLBACK2: # %bb.0:		; X86-FALLBACK2: # %bb.0:
; X86-FALLBACK2-NEXT: pushl %esi		; X86-FALLBACK2-NEXT: pushl %esi
; X86-FALLBACK2-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-FALLBACK2-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-FALLBACK2-NEXT: movl $-1, %eax
; X86-FALLBACK2-NEXT: movl $-1, %esi		; X86-FALLBACK2-NEXT: movl $-1, %esi
; X86-FALLBACK2-NEXT: shrl %cl, %esi		; X86-FALLBACK2-NEXT: movl $-1, %eax
; X86-FALLBACK2-NEXT: shrdl %cl, %eax, %eax		; X86-FALLBACK2-NEXT: shrl %cl, %eax
; X86-FALLBACK2-NEXT: xorl %edx, %edx		; X86-FALLBACK2-NEXT: xorl %edx, %edx
; X86-FALLBACK2-NEXT: testb $32, %cl		; X86-FALLBACK2-NEXT: testb $32, %cl
; X86-FALLBACK2-NEXT: cmovnel %esi, %eax		; X86-FALLBACK2-NEXT: cmovel %eax, %edx
; X86-FALLBACK2-NEXT: cmovel %esi, %edx		; X86-FALLBACK2-NEXT: cmovel %esi, %eax
; X86-FALLBACK2-NEXT: andl {{[0-9]+}}(%esp), %eax		; X86-FALLBACK2-NEXT: andl {{[0-9]+}}(%esp), %eax
; X86-FALLBACK2-NEXT: andl {{[0-9]+}}(%esp), %edx		; X86-FALLBACK2-NEXT: andl {{[0-9]+}}(%esp), %edx
; X86-FALLBACK2-NEXT: popl %esi		; X86-FALLBACK2-NEXT: popl %esi
; X86-FALLBACK2-NEXT: retl		; X86-FALLBACK2-NEXT: retl
;		;
; X86-BMI2-LABEL: clear_highbits64_c0:		; X86-BMI2-LABEL: clear_highbits64_c0:
; X86-BMI2: # %bb.0:		; X86-BMI2: # %bb.0:
; X86-BMI2-NEXT: pushl %esi		; X86-BMI2-NEXT: pushl %esi
; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-BMI2-NEXT: movl $-1, %eax		; X86-BMI2-NEXT: movl $-1, %eax
; X86-BMI2-NEXT: shrxl %ecx, %eax, %esi		; X86-BMI2-NEXT: shrxl %ecx, %eax, %esi
; X86-BMI2-NEXT: shrdl %cl, %eax, %eax
; X86-BMI2-NEXT: xorl %edx, %edx		; X86-BMI2-NEXT: xorl %edx, %edx
; X86-BMI2-NEXT: testb $32, %cl		; X86-BMI2-NEXT: testb $32, %cl
; X86-BMI2-NEXT: cmovnel %esi, %eax
; X86-BMI2-NEXT: cmovel %esi, %edx		; X86-BMI2-NEXT: cmovel %esi, %edx
		; X86-BMI2-NEXT: cmovnel %esi, %eax
; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %eax		; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %eax
; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %edx		; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
; X86-BMI2-NEXT: popl %esi		; X86-BMI2-NEXT: popl %esi
; X86-BMI2-NEXT: retl		; X86-BMI2-NEXT: retl
;		;
; X64-NOBMI2-LABEL: clear_highbits64_c0:		; X64-NOBMI2-LABEL: clear_highbits64_c0:
; X64-NOBMI2: # %bb.0:		; X64-NOBMI2: # %bb.0:
; X64-NOBMI2-NEXT: movq %rsi, %rcx		; X64-NOBMI2-NEXT: movq %rsi, %rcx
Show All 11 Lines	; X64-BMI2-NEXT: retq
%mask = lshr i64 -1, %numhighbits		%mask = lshr i64 -1, %numhighbits
%masked = and i64 %mask, %val		%masked = and i64 %mask, %val
ret i64 %masked		ret i64 %masked
}		}

define i64 @clear_highbits64_c1_indexzext(i64 %val, i8 %numhighbits) nounwind {		define i64 @clear_highbits64_c1_indexzext(i64 %val, i8 %numhighbits) nounwind {
; X86-FALLBACK0-LABEL: clear_highbits64_c1_indexzext:		; X86-FALLBACK0-LABEL: clear_highbits64_c1_indexzext:
; X86-FALLBACK0: # %bb.0:		; X86-FALLBACK0: # %bb.0:
		; X86-FALLBACK0-NEXT: pushl %esi
; X86-FALLBACK0-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-FALLBACK0-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-FALLBACK0-NEXT: movl $-1, %eax		; X86-FALLBACK0-NEXT: movl $-1, %eax
; X86-FALLBACK0-NEXT: movl $-1, %edx		; X86-FALLBACK0-NEXT: movl $-1, %esi
; X86-FALLBACK0-NEXT: shrl %cl, %edx		; X86-FALLBACK0-NEXT: shrl %cl, %esi
; X86-FALLBACK0-NEXT: shrdl %cl, %eax, %eax
; X86-FALLBACK0-NEXT: testb $32, %cl
; X86-FALLBACK0-NEXT: je .LBB14_2
; X86-FALLBACK0-NEXT: # %bb.1:
; X86-FALLBACK0-NEXT: movl %edx, %eax
; X86-FALLBACK0-NEXT: xorl %edx, %edx		; X86-FALLBACK0-NEXT: xorl %edx, %edx
; X86-FALLBACK0-NEXT: .LBB14_2:		; X86-FALLBACK0-NEXT: testb $32, %cl
		; X86-FALLBACK0-NEXT: jne .LBB14_1
		; X86-FALLBACK0-NEXT: # %bb.2:
		; X86-FALLBACK0-NEXT: movl %esi, %edx
		; X86-FALLBACK0-NEXT: jmp .LBB14_3
		; X86-FALLBACK0-NEXT: .LBB14_1:
		; X86-FALLBACK0-NEXT: movl %esi, %eax
		; X86-FALLBACK0-NEXT: .LBB14_3:
; X86-FALLBACK0-NEXT: andl {{[0-9]+}}(%esp), %eax		; X86-FALLBACK0-NEXT: andl {{[0-9]+}}(%esp), %eax
; X86-FALLBACK0-NEXT: andl {{[0-9]+}}(%esp), %edx		; X86-FALLBACK0-NEXT: andl {{[0-9]+}}(%esp), %edx
		; X86-FALLBACK0-NEXT: popl %esi
; X86-FALLBACK0-NEXT: retl		; X86-FALLBACK0-NEXT: retl
;		;
; X86-FALLBACK1-LABEL: clear_highbits64_c1_indexzext:		; X86-FALLBACK1-LABEL: clear_highbits64_c1_indexzext:
; X86-FALLBACK1: # %bb.0:		; X86-FALLBACK1: # %bb.0:
; X86-FALLBACK1-NEXT: pushl %esi		; X86-FALLBACK1-NEXT: pushl %esi
; X86-FALLBACK1-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-FALLBACK1-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-FALLBACK1-NEXT: movl $-1, %eax
; X86-FALLBACK1-NEXT: movl $-1, %esi		; X86-FALLBACK1-NEXT: movl $-1, %esi
; X86-FALLBACK1-NEXT: shrl %cl, %esi		; X86-FALLBACK1-NEXT: movl $-1, %eax
; X86-FALLBACK1-NEXT: shrdl %cl, %eax, %eax		; X86-FALLBACK1-NEXT: shrl %cl, %eax
; X86-FALLBACK1-NEXT: xorl %edx, %edx		; X86-FALLBACK1-NEXT: xorl %edx, %edx
; X86-FALLBACK1-NEXT: testb $32, %cl		; X86-FALLBACK1-NEXT: testb $32, %cl
; X86-FALLBACK1-NEXT: cmovnel %esi, %eax		; X86-FALLBACK1-NEXT: cmovel %eax, %edx
; X86-FALLBACK1-NEXT: cmovel %esi, %edx		; X86-FALLBACK1-NEXT: cmovel %esi, %eax
; X86-FALLBACK1-NEXT: andl {{[0-9]+}}(%esp), %eax		; X86-FALLBACK1-NEXT: andl {{[0-9]+}}(%esp), %eax
; X86-FALLBACK1-NEXT: andl {{[0-9]+}}(%esp), %edx		; X86-FALLBACK1-NEXT: andl {{[0-9]+}}(%esp), %edx
; X86-FALLBACK1-NEXT: popl %esi		; X86-FALLBACK1-NEXT: popl %esi
; X86-FALLBACK1-NEXT: retl		; X86-FALLBACK1-NEXT: retl
;		;
; X86-FALLBACK2-LABEL: clear_highbits64_c1_indexzext:		; X86-FALLBACK2-LABEL: clear_highbits64_c1_indexzext:
; X86-FALLBACK2: # %bb.0:		; X86-FALLBACK2: # %bb.0:
; X86-FALLBACK2-NEXT: pushl %esi		; X86-FALLBACK2-NEXT: pushl %esi
; X86-FALLBACK2-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-FALLBACK2-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-FALLBACK2-NEXT: movl $-1, %eax
; X86-FALLBACK2-NEXT: movl $-1, %esi		; X86-FALLBACK2-NEXT: movl $-1, %esi
; X86-FALLBACK2-NEXT: shrl %cl, %esi		; X86-FALLBACK2-NEXT: movl $-1, %eax
; X86-FALLBACK2-NEXT: shrdl %cl, %eax, %eax		; X86-FALLBACK2-NEXT: shrl %cl, %eax
; X86-FALLBACK2-NEXT: xorl %edx, %edx		; X86-FALLBACK2-NEXT: xorl %edx, %edx
; X86-FALLBACK2-NEXT: testb $32, %cl		; X86-FALLBACK2-NEXT: testb $32, %cl
; X86-FALLBACK2-NEXT: cmovnel %esi, %eax		; X86-FALLBACK2-NEXT: cmovel %eax, %edx
; X86-FALLBACK2-NEXT: cmovel %esi, %edx		; X86-FALLBACK2-NEXT: cmovel %esi, %eax
; X86-FALLBACK2-NEXT: andl {{[0-9]+}}(%esp), %eax		; X86-FALLBACK2-NEXT: andl {{[0-9]+}}(%esp), %eax
; X86-FALLBACK2-NEXT: andl {{[0-9]+}}(%esp), %edx		; X86-FALLBACK2-NEXT: andl {{[0-9]+}}(%esp), %edx
; X86-FALLBACK2-NEXT: popl %esi		; X86-FALLBACK2-NEXT: popl %esi
; X86-FALLBACK2-NEXT: retl		; X86-FALLBACK2-NEXT: retl
;		;
; X86-BMI2-LABEL: clear_highbits64_c1_indexzext:		; X86-BMI2-LABEL: clear_highbits64_c1_indexzext:
; X86-BMI2: # %bb.0:		; X86-BMI2: # %bb.0:
; X86-BMI2-NEXT: pushl %esi		; X86-BMI2-NEXT: pushl %esi
; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-BMI2-NEXT: movl $-1, %eax		; X86-BMI2-NEXT: movl $-1, %eax
; X86-BMI2-NEXT: shrxl %ecx, %eax, %esi		; X86-BMI2-NEXT: shrxl %ecx, %eax, %esi
; X86-BMI2-NEXT: shrdl %cl, %eax, %eax
; X86-BMI2-NEXT: xorl %edx, %edx		; X86-BMI2-NEXT: xorl %edx, %edx
; X86-BMI2-NEXT: testb $32, %cl		; X86-BMI2-NEXT: testb $32, %cl
; X86-BMI2-NEXT: cmovnel %esi, %eax
; X86-BMI2-NEXT: cmovel %esi, %edx		; X86-BMI2-NEXT: cmovel %esi, %edx
		; X86-BMI2-NEXT: cmovnel %esi, %eax
; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %eax		; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %eax
; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %edx		; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
; X86-BMI2-NEXT: popl %esi		; X86-BMI2-NEXT: popl %esi
; X86-BMI2-NEXT: retl		; X86-BMI2-NEXT: retl
;		;
; X64-NOBMI2-LABEL: clear_highbits64_c1_indexzext:		; X64-NOBMI2-LABEL: clear_highbits64_c1_indexzext:
; X64-NOBMI2: # %bb.0:		; X64-NOBMI2: # %bb.0:
; X64-NOBMI2-NEXT: movl %esi, %ecx		; X64-NOBMI2-NEXT: movl %esi, %ecx
Show All 13 Lines	; X64-BMI2-NEXT: retq
%mask = lshr i64 -1, %sh_prom		%mask = lshr i64 -1, %sh_prom
%masked = and i64 %mask, %val		%masked = and i64 %mask, %val
ret i64 %masked		ret i64 %masked
}		}

define i64 @clear_highbits64_c2_load(i64* %w, i64 %numhighbits) nounwind {		define i64 @clear_highbits64_c2_load(i64* %w, i64 %numhighbits) nounwind {
; X86-FALLBACK0-LABEL: clear_highbits64_c2_load:		; X86-FALLBACK0-LABEL: clear_highbits64_c2_load:
; X86-FALLBACK0: # %bb.0:		; X86-FALLBACK0: # %bb.0:
		; X86-FALLBACK0-NEXT: pushl %edi
; X86-FALLBACK0-NEXT: pushl %esi		; X86-FALLBACK0-NEXT: pushl %esi
; X86-FALLBACK0-NEXT: movl {{[0-9]+}}(%esp), %esi		; X86-FALLBACK0-NEXT: movl {{[0-9]+}}(%esp), %esi
; X86-FALLBACK0-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-FALLBACK0-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-FALLBACK0-NEXT: movl $-1, %eax		; X86-FALLBACK0-NEXT: movl $-1, %eax
; X86-FALLBACK0-NEXT: movl $-1, %edx		; X86-FALLBACK0-NEXT: movl $-1, %edi
; X86-FALLBACK0-NEXT: shrl %cl, %edx		; X86-FALLBACK0-NEXT: shrl %cl, %edi
; X86-FALLBACK0-NEXT: shrdl %cl, %eax, %eax
; X86-FALLBACK0-NEXT: testb $32, %cl
; X86-FALLBACK0-NEXT: je .LBB15_2
; X86-FALLBACK0-NEXT: # %bb.1:
; X86-FALLBACK0-NEXT: movl %edx, %eax
; X86-FALLBACK0-NEXT: xorl %edx, %edx		; X86-FALLBACK0-NEXT: xorl %edx, %edx
; X86-FALLBACK0-NEXT: .LBB15_2:		; X86-FALLBACK0-NEXT: testb $32, %cl
		; X86-FALLBACK0-NEXT: jne .LBB15_1
		; X86-FALLBACK0-NEXT: # %bb.2:
		; X86-FALLBACK0-NEXT: movl %edi, %edx
		; X86-FALLBACK0-NEXT: jmp .LBB15_3
		; X86-FALLBACK0-NEXT: .LBB15_1:
		; X86-FALLBACK0-NEXT: movl %edi, %eax
		; X86-FALLBACK0-NEXT: .LBB15_3:
; X86-FALLBACK0-NEXT: andl (%esi), %eax		; X86-FALLBACK0-NEXT: andl (%esi), %eax
; X86-FALLBACK0-NEXT: andl 4(%esi), %edx		; X86-FALLBACK0-NEXT: andl 4(%esi), %edx
; X86-FALLBACK0-NEXT: popl %esi		; X86-FALLBACK0-NEXT: popl %esi
		; X86-FALLBACK0-NEXT: popl %edi
; X86-FALLBACK0-NEXT: retl		; X86-FALLBACK0-NEXT: retl
;		;
; X86-FALLBACK1-LABEL: clear_highbits64_c2_load:		; X86-FALLBACK1-LABEL: clear_highbits64_c2_load:
; X86-FALLBACK1: # %bb.0:		; X86-FALLBACK1: # %bb.0:
; X86-FALLBACK1-NEXT: pushl %edi		; X86-FALLBACK1-NEXT: pushl %edi
; X86-FALLBACK1-NEXT: pushl %esi		; X86-FALLBACK1-NEXT: pushl %esi
; X86-FALLBACK1-NEXT: movl {{[0-9]+}}(%esp), %esi		; X86-FALLBACK1-NEXT: movl {{[0-9]+}}(%esp), %esi
; X86-FALLBACK1-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-FALLBACK1-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-FALLBACK1-NEXT: movl $-1, %eax
; X86-FALLBACK1-NEXT: movl $-1, %edi		; X86-FALLBACK1-NEXT: movl $-1, %edi
; X86-FALLBACK1-NEXT: shrl %cl, %edi		; X86-FALLBACK1-NEXT: movl $-1, %eax
; X86-FALLBACK1-NEXT: shrdl %cl, %eax, %eax		; X86-FALLBACK1-NEXT: shrl %cl, %eax
; X86-FALLBACK1-NEXT: xorl %edx, %edx		; X86-FALLBACK1-NEXT: xorl %edx, %edx
; X86-FALLBACK1-NEXT: testb $32, %cl		; X86-FALLBACK1-NEXT: testb $32, %cl
; X86-FALLBACK1-NEXT: cmovnel %edi, %eax		; X86-FALLBACK1-NEXT: cmovel %eax, %edx
; X86-FALLBACK1-NEXT: cmovel %edi, %edx		; X86-FALLBACK1-NEXT: cmovel %edi, %eax
; X86-FALLBACK1-NEXT: andl (%esi), %eax		; X86-FALLBACK1-NEXT: andl (%esi), %eax
; X86-FALLBACK1-NEXT: andl 4(%esi), %edx		; X86-FALLBACK1-NEXT: andl 4(%esi), %edx
; X86-FALLBACK1-NEXT: popl %esi		; X86-FALLBACK1-NEXT: popl %esi
; X86-FALLBACK1-NEXT: popl %edi		; X86-FALLBACK1-NEXT: popl %edi
; X86-FALLBACK1-NEXT: retl		; X86-FALLBACK1-NEXT: retl
;		;
; X86-FALLBACK2-LABEL: clear_highbits64_c2_load:		; X86-FALLBACK2-LABEL: clear_highbits64_c2_load:
; X86-FALLBACK2: # %bb.0:		; X86-FALLBACK2: # %bb.0:
; X86-FALLBACK2-NEXT: pushl %edi		; X86-FALLBACK2-NEXT: pushl %edi
; X86-FALLBACK2-NEXT: pushl %esi		; X86-FALLBACK2-NEXT: pushl %esi
; X86-FALLBACK2-NEXT: movl {{[0-9]+}}(%esp), %esi		; X86-FALLBACK2-NEXT: movl {{[0-9]+}}(%esp), %esi
; X86-FALLBACK2-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-FALLBACK2-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-FALLBACK2-NEXT: movl $-1, %eax
; X86-FALLBACK2-NEXT: movl $-1, %edi		; X86-FALLBACK2-NEXT: movl $-1, %edi
; X86-FALLBACK2-NEXT: shrl %cl, %edi		; X86-FALLBACK2-NEXT: movl $-1, %eax
; X86-FALLBACK2-NEXT: shrdl %cl, %eax, %eax		; X86-FALLBACK2-NEXT: shrl %cl, %eax
; X86-FALLBACK2-NEXT: xorl %edx, %edx		; X86-FALLBACK2-NEXT: xorl %edx, %edx
; X86-FALLBACK2-NEXT: testb $32, %cl		; X86-FALLBACK2-NEXT: testb $32, %cl
; X86-FALLBACK2-NEXT: cmovnel %edi, %eax		; X86-FALLBACK2-NEXT: cmovel %eax, %edx
; X86-FALLBACK2-NEXT: cmovel %edi, %edx		; X86-FALLBACK2-NEXT: cmovel %edi, %eax
; X86-FALLBACK2-NEXT: andl (%esi), %eax		; X86-FALLBACK2-NEXT: andl (%esi), %eax
; X86-FALLBACK2-NEXT: andl 4(%esi), %edx		; X86-FALLBACK2-NEXT: andl 4(%esi), %edx
; X86-FALLBACK2-NEXT: popl %esi		; X86-FALLBACK2-NEXT: popl %esi
; X86-FALLBACK2-NEXT: popl %edi		; X86-FALLBACK2-NEXT: popl %edi
; X86-FALLBACK2-NEXT: retl		; X86-FALLBACK2-NEXT: retl
;		;
; X86-BMI2-LABEL: clear_highbits64_c2_load:		; X86-BMI2-LABEL: clear_highbits64_c2_load:
; X86-BMI2: # %bb.0:		; X86-BMI2: # %bb.0:
; X86-BMI2-NEXT: pushl %edi		; X86-BMI2-NEXT: pushl %ebx
; X86-BMI2-NEXT: pushl %esi		; X86-BMI2-NEXT: pushl %esi
; X86-BMI2-NEXT: movl {{[0-9]+}}(%esp), %esi		; X86-BMI2-NEXT: movl {{[0-9]+}}(%esp), %ecx
; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %bl
; X86-BMI2-NEXT: movl $-1, %eax		; X86-BMI2-NEXT: movl $-1, %eax
; X86-BMI2-NEXT: shrxl %ecx, %eax, %edi		; X86-BMI2-NEXT: shrxl %ebx, %eax, %esi
; X86-BMI2-NEXT: shrdl %cl, %eax, %eax
; X86-BMI2-NEXT: xorl %edx, %edx		; X86-BMI2-NEXT: xorl %edx, %edx
; X86-BMI2-NEXT: testb $32, %cl		; X86-BMI2-NEXT: testb $32, %bl
; X86-BMI2-NEXT: cmovnel %edi, %eax		; X86-BMI2-NEXT: cmovel %esi, %edx
; X86-BMI2-NEXT: cmovel %edi, %edx		; X86-BMI2-NEXT: cmovnel %esi, %eax
; X86-BMI2-NEXT: andl (%esi), %eax		; X86-BMI2-NEXT: andl (%ecx), %eax
; X86-BMI2-NEXT: andl 4(%esi), %edx		; X86-BMI2-NEXT: andl 4(%ecx), %edx
; X86-BMI2-NEXT: popl %esi		; X86-BMI2-NEXT: popl %esi
; X86-BMI2-NEXT: popl %edi		; X86-BMI2-NEXT: popl %ebx
; X86-BMI2-NEXT: retl		; X86-BMI2-NEXT: retl
;		;
; X64-NOBMI2-LABEL: clear_highbits64_c2_load:		; X64-NOBMI2-LABEL: clear_highbits64_c2_load:
; X64-NOBMI2: # %bb.0:		; X64-NOBMI2: # %bb.0:
; X64-NOBMI2-NEXT: movq %rsi, %rcx		; X64-NOBMI2-NEXT: movq %rsi, %rcx
; X64-NOBMI2-NEXT: movq (%rdi), %rax		; X64-NOBMI2-NEXT: movq (%rdi), %rax
; X64-NOBMI2-NEXT: shlq %cl, %rax		; X64-NOBMI2-NEXT: shlq %cl, %rax
; X64-NOBMI2-NEXT: # kill: def $cl killed $cl killed $rcx		; X64-NOBMI2-NEXT: # kill: def $cl killed $cl killed $rcx
Show All 9 Lines	; X64-BMI2-NEXT: retq
%mask = lshr i64 -1, %numhighbits		%mask = lshr i64 -1, %numhighbits
%masked = and i64 %mask, %val		%masked = and i64 %mask, %val
ret i64 %masked		ret i64 %masked
}		}

define i64 @clear_highbits64_c3_load_indexzext(i64* %w, i8 %numhighbits) nounwind {		define i64 @clear_highbits64_c3_load_indexzext(i64* %w, i8 %numhighbits) nounwind {
; X86-FALLBACK0-LABEL: clear_highbits64_c3_load_indexzext:		; X86-FALLBACK0-LABEL: clear_highbits64_c3_load_indexzext:
; X86-FALLBACK0: # %bb.0:		; X86-FALLBACK0: # %bb.0:
		; X86-FALLBACK0-NEXT: pushl %edi
; X86-FALLBACK0-NEXT: pushl %esi		; X86-FALLBACK0-NEXT: pushl %esi
; X86-FALLBACK0-NEXT: movl {{[0-9]+}}(%esp), %esi		; X86-FALLBACK0-NEXT: movl {{[0-9]+}}(%esp), %esi
; X86-FALLBACK0-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-FALLBACK0-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-FALLBACK0-NEXT: movl $-1, %eax		; X86-FALLBACK0-NEXT: movl $-1, %eax
; X86-FALLBACK0-NEXT: movl $-1, %edx		; X86-FALLBACK0-NEXT: movl $-1, %edi
; X86-FALLBACK0-NEXT: shrl %cl, %edx		; X86-FALLBACK0-NEXT: shrl %cl, %edi
; X86-FALLBACK0-NEXT: shrdl %cl, %eax, %eax
; X86-FALLBACK0-NEXT: testb $32, %cl
; X86-FALLBACK0-NEXT: je .LBB16_2
; X86-FALLBACK0-NEXT: # %bb.1:
; X86-FALLBACK0-NEXT: movl %edx, %eax
; X86-FALLBACK0-NEXT: xorl %edx, %edx		; X86-FALLBACK0-NEXT: xorl %edx, %edx
; X86-FALLBACK0-NEXT: .LBB16_2:		; X86-FALLBACK0-NEXT: testb $32, %cl
		; X86-FALLBACK0-NEXT: jne .LBB16_1
		; X86-FALLBACK0-NEXT: # %bb.2:
		; X86-FALLBACK0-NEXT: movl %edi, %edx
		; X86-FALLBACK0-NEXT: jmp .LBB16_3
		; X86-FALLBACK0-NEXT: .LBB16_1:
		; X86-FALLBACK0-NEXT: movl %edi, %eax
		; X86-FALLBACK0-NEXT: .LBB16_3:
; X86-FALLBACK0-NEXT: andl (%esi), %eax		; X86-FALLBACK0-NEXT: andl (%esi), %eax
; X86-FALLBACK0-NEXT: andl 4(%esi), %edx		; X86-FALLBACK0-NEXT: andl 4(%esi), %edx
; X86-FALLBACK0-NEXT: popl %esi		; X86-FALLBACK0-NEXT: popl %esi
		; X86-FALLBACK0-NEXT: popl %edi
; X86-FALLBACK0-NEXT: retl		; X86-FALLBACK0-NEXT: retl
;		;
; X86-FALLBACK1-LABEL: clear_highbits64_c3_load_indexzext:		; X86-FALLBACK1-LABEL: clear_highbits64_c3_load_indexzext:
; X86-FALLBACK1: # %bb.0:		; X86-FALLBACK1: # %bb.0:
; X86-FALLBACK1-NEXT: pushl %edi		; X86-FALLBACK1-NEXT: pushl %edi
; X86-FALLBACK1-NEXT: pushl %esi		; X86-FALLBACK1-NEXT: pushl %esi
; X86-FALLBACK1-NEXT: movl {{[0-9]+}}(%esp), %esi		; X86-FALLBACK1-NEXT: movl {{[0-9]+}}(%esp), %esi
; X86-FALLBACK1-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-FALLBACK1-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-FALLBACK1-NEXT: movl $-1, %eax
; X86-FALLBACK1-NEXT: movl $-1, %edi		; X86-FALLBACK1-NEXT: movl $-1, %edi
; X86-FALLBACK1-NEXT: shrl %cl, %edi		; X86-FALLBACK1-NEXT: movl $-1, %eax
; X86-FALLBACK1-NEXT: shrdl %cl, %eax, %eax		; X86-FALLBACK1-NEXT: shrl %cl, %eax
; X86-FALLBACK1-NEXT: xorl %edx, %edx		; X86-FALLBACK1-NEXT: xorl %edx, %edx
; X86-FALLBACK1-NEXT: testb $32, %cl		; X86-FALLBACK1-NEXT: testb $32, %cl
; X86-FALLBACK1-NEXT: cmovnel %edi, %eax		; X86-FALLBACK1-NEXT: cmovel %eax, %edx
; X86-FALLBACK1-NEXT: cmovel %edi, %edx		; X86-FALLBACK1-NEXT: cmovel %edi, %eax
; X86-FALLBACK1-NEXT: andl (%esi), %eax		; X86-FALLBACK1-NEXT: andl (%esi), %eax
; X86-FALLBACK1-NEXT: andl 4(%esi), %edx		; X86-FALLBACK1-NEXT: andl 4(%esi), %edx
; X86-FALLBACK1-NEXT: popl %esi		; X86-FALLBACK1-NEXT: popl %esi
; X86-FALLBACK1-NEXT: popl %edi		; X86-FALLBACK1-NEXT: popl %edi
; X86-FALLBACK1-NEXT: retl		; X86-FALLBACK1-NEXT: retl
;		;
; X86-FALLBACK2-LABEL: clear_highbits64_c3_load_indexzext:		; X86-FALLBACK2-LABEL: clear_highbits64_c3_load_indexzext:
; X86-FALLBACK2: # %bb.0:		; X86-FALLBACK2: # %bb.0:
; X86-FALLBACK2-NEXT: pushl %edi		; X86-FALLBACK2-NEXT: pushl %edi
; X86-FALLBACK2-NEXT: pushl %esi		; X86-FALLBACK2-NEXT: pushl %esi
; X86-FALLBACK2-NEXT: movl {{[0-9]+}}(%esp), %esi		; X86-FALLBACK2-NEXT: movl {{[0-9]+}}(%esp), %esi
; X86-FALLBACK2-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-FALLBACK2-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-FALLBACK2-NEXT: movl $-1, %eax
; X86-FALLBACK2-NEXT: movl $-1, %edi		; X86-FALLBACK2-NEXT: movl $-1, %edi
; X86-FALLBACK2-NEXT: shrl %cl, %edi		; X86-FALLBACK2-NEXT: movl $-1, %eax
; X86-FALLBACK2-NEXT: shrdl %cl, %eax, %eax		; X86-FALLBACK2-NEXT: shrl %cl, %eax
; X86-FALLBACK2-NEXT: xorl %edx, %edx		; X86-FALLBACK2-NEXT: xorl %edx, %edx
; X86-FALLBACK2-NEXT: testb $32, %cl		; X86-FALLBACK2-NEXT: testb $32, %cl
; X86-FALLBACK2-NEXT: cmovnel %edi, %eax		; X86-FALLBACK2-NEXT: cmovel %eax, %edx
; X86-FALLBACK2-NEXT: cmovel %edi, %edx		; X86-FALLBACK2-NEXT: cmovel %edi, %eax
; X86-FALLBACK2-NEXT: andl (%esi), %eax		; X86-FALLBACK2-NEXT: andl (%esi), %eax
; X86-FALLBACK2-NEXT: andl 4(%esi), %edx		; X86-FALLBACK2-NEXT: andl 4(%esi), %edx
; X86-FALLBACK2-NEXT: popl %esi		; X86-FALLBACK2-NEXT: popl %esi
; X86-FALLBACK2-NEXT: popl %edi		; X86-FALLBACK2-NEXT: popl %edi
; X86-FALLBACK2-NEXT: retl		; X86-FALLBACK2-NEXT: retl
;		;
; X86-BMI2-LABEL: clear_highbits64_c3_load_indexzext:		; X86-BMI2-LABEL: clear_highbits64_c3_load_indexzext:
; X86-BMI2: # %bb.0:		; X86-BMI2: # %bb.0:
; X86-BMI2-NEXT: pushl %edi		; X86-BMI2-NEXT: pushl %ebx
; X86-BMI2-NEXT: pushl %esi		; X86-BMI2-NEXT: pushl %esi
; X86-BMI2-NEXT: movl {{[0-9]+}}(%esp), %esi		; X86-BMI2-NEXT: movl {{[0-9]+}}(%esp), %ecx
; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %bl
; X86-BMI2-NEXT: movl $-1, %eax		; X86-BMI2-NEXT: movl $-1, %eax
; X86-BMI2-NEXT: shrxl %ecx, %eax, %edi		; X86-BMI2-NEXT: shrxl %ebx, %eax, %esi
; X86-BMI2-NEXT: shrdl %cl, %eax, %eax
; X86-BMI2-NEXT: xorl %edx, %edx		; X86-BMI2-NEXT: xorl %edx, %edx
; X86-BMI2-NEXT: testb $32, %cl		; X86-BMI2-NEXT: testb $32, %bl
; X86-BMI2-NEXT: cmovnel %edi, %eax		; X86-BMI2-NEXT: cmovel %esi, %edx
; X86-BMI2-NEXT: cmovel %edi, %edx		; X86-BMI2-NEXT: cmovnel %esi, %eax
; X86-BMI2-NEXT: andl (%esi), %eax		; X86-BMI2-NEXT: andl (%ecx), %eax
; X86-BMI2-NEXT: andl 4(%esi), %edx		; X86-BMI2-NEXT: andl 4(%ecx), %edx
; X86-BMI2-NEXT: popl %esi		; X86-BMI2-NEXT: popl %esi
; X86-BMI2-NEXT: popl %edi		; X86-BMI2-NEXT: popl %ebx
; X86-BMI2-NEXT: retl		; X86-BMI2-NEXT: retl
;		;
; X64-NOBMI2-LABEL: clear_highbits64_c3_load_indexzext:		; X64-NOBMI2-LABEL: clear_highbits64_c3_load_indexzext:
; X64-NOBMI2: # %bb.0:		; X64-NOBMI2: # %bb.0:
; X64-NOBMI2-NEXT: movl %esi, %ecx		; X64-NOBMI2-NEXT: movl %esi, %ecx
; X64-NOBMI2-NEXT: movq (%rdi), %rax		; X64-NOBMI2-NEXT: movq (%rdi), %rax
; X64-NOBMI2-NEXT: shlq %cl, %rax		; X64-NOBMI2-NEXT: shlq %cl, %rax
; X64-NOBMI2-NEXT: # kill: def $cl killed $cl killed $ecx		; X64-NOBMI2-NEXT: # kill: def $cl killed $cl killed $ecx
Show All 11 Lines	; X64-BMI2-NEXT: retq
%mask = lshr i64 -1, %sh_prom		%mask = lshr i64 -1, %sh_prom
%masked = and i64 %mask, %val		%masked = and i64 %mask, %val
ret i64 %masked		ret i64 %masked
}		}

define i64 @clear_highbits64_c4_commutative(i64 %val, i64 %numhighbits) nounwind {		define i64 @clear_highbits64_c4_commutative(i64 %val, i64 %numhighbits) nounwind {
; X86-FALLBACK0-LABEL: clear_highbits64_c4_commutative:		; X86-FALLBACK0-LABEL: clear_highbits64_c4_commutative:
; X86-FALLBACK0: # %bb.0:		; X86-FALLBACK0: # %bb.0:
		; X86-FALLBACK0-NEXT: pushl %esi
; X86-FALLBACK0-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-FALLBACK0-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-FALLBACK0-NEXT: movl $-1, %eax		; X86-FALLBACK0-NEXT: movl $-1, %eax
; X86-FALLBACK0-NEXT: movl $-1, %edx		; X86-FALLBACK0-NEXT: movl $-1, %esi
; X86-FALLBACK0-NEXT: shrl %cl, %edx		; X86-FALLBACK0-NEXT: shrl %cl, %esi
; X86-FALLBACK0-NEXT: shrdl %cl, %eax, %eax
; X86-FALLBACK0-NEXT: testb $32, %cl
; X86-FALLBACK0-NEXT: je .LBB17_2
; X86-FALLBACK0-NEXT: # %bb.1:
; X86-FALLBACK0-NEXT: movl %edx, %eax
; X86-FALLBACK0-NEXT: xorl %edx, %edx		; X86-FALLBACK0-NEXT: xorl %edx, %edx
; X86-FALLBACK0-NEXT: .LBB17_2:		; X86-FALLBACK0-NEXT: testb $32, %cl
		; X86-FALLBACK0-NEXT: jne .LBB17_1
		; X86-FALLBACK0-NEXT: # %bb.2:
		; X86-FALLBACK0-NEXT: movl %esi, %edx
		; X86-FALLBACK0-NEXT: jmp .LBB17_3
		; X86-FALLBACK0-NEXT: .LBB17_1:
		; X86-FALLBACK0-NEXT: movl %esi, %eax
		; X86-FALLBACK0-NEXT: .LBB17_3:
; X86-FALLBACK0-NEXT: andl {{[0-9]+}}(%esp), %eax		; X86-FALLBACK0-NEXT: andl {{[0-9]+}}(%esp), %eax
; X86-FALLBACK0-NEXT: andl {{[0-9]+}}(%esp), %edx		; X86-FALLBACK0-NEXT: andl {{[0-9]+}}(%esp), %edx
		; X86-FALLBACK0-NEXT: popl %esi
; X86-FALLBACK0-NEXT: retl		; X86-FALLBACK0-NEXT: retl
;		;
; X86-FALLBACK1-LABEL: clear_highbits64_c4_commutative:		; X86-FALLBACK1-LABEL: clear_highbits64_c4_commutative:
; X86-FALLBACK1: # %bb.0:		; X86-FALLBACK1: # %bb.0:
; X86-FALLBACK1-NEXT: pushl %esi		; X86-FALLBACK1-NEXT: pushl %esi
; X86-FALLBACK1-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-FALLBACK1-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-FALLBACK1-NEXT: movl $-1, %eax
; X86-FALLBACK1-NEXT: movl $-1, %esi		; X86-FALLBACK1-NEXT: movl $-1, %esi
; X86-FALLBACK1-NEXT: shrl %cl, %esi		; X86-FALLBACK1-NEXT: movl $-1, %eax
; X86-FALLBACK1-NEXT: shrdl %cl, %eax, %eax		; X86-FALLBACK1-NEXT: shrl %cl, %eax
; X86-FALLBACK1-NEXT: xorl %edx, %edx		; X86-FALLBACK1-NEXT: xorl %edx, %edx
; X86-FALLBACK1-NEXT: testb $32, %cl		; X86-FALLBACK1-NEXT: testb $32, %cl
; X86-FALLBACK1-NEXT: cmovnel %esi, %eax		; X86-FALLBACK1-NEXT: cmovel %eax, %edx
; X86-FALLBACK1-NEXT: cmovel %esi, %edx		; X86-FALLBACK1-NEXT: cmovel %esi, %eax
; X86-FALLBACK1-NEXT: andl {{[0-9]+}}(%esp), %eax		; X86-FALLBACK1-NEXT: andl {{[0-9]+}}(%esp), %eax
; X86-FALLBACK1-NEXT: andl {{[0-9]+}}(%esp), %edx		; X86-FALLBACK1-NEXT: andl {{[0-9]+}}(%esp), %edx
; X86-FALLBACK1-NEXT: popl %esi		; X86-FALLBACK1-NEXT: popl %esi
; X86-FALLBACK1-NEXT: retl		; X86-FALLBACK1-NEXT: retl
;		;
; X86-FALLBACK2-LABEL: clear_highbits64_c4_commutative:		; X86-FALLBACK2-LABEL: clear_highbits64_c4_commutative:
; X86-FALLBACK2: # %bb.0:		; X86-FALLBACK2: # %bb.0:
; X86-FALLBACK2-NEXT: pushl %esi		; X86-FALLBACK2-NEXT: pushl %esi
; X86-FALLBACK2-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-FALLBACK2-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-FALLBACK2-NEXT: movl $-1, %eax
; X86-FALLBACK2-NEXT: movl $-1, %esi		; X86-FALLBACK2-NEXT: movl $-1, %esi
; X86-FALLBACK2-NEXT: shrl %cl, %esi		; X86-FALLBACK2-NEXT: movl $-1, %eax
; X86-FALLBACK2-NEXT: shrdl %cl, %eax, %eax		; X86-FALLBACK2-NEXT: shrl %cl, %eax
; X86-FALLBACK2-NEXT: xorl %edx, %edx		; X86-FALLBACK2-NEXT: xorl %edx, %edx
; X86-FALLBACK2-NEXT: testb $32, %cl		; X86-FALLBACK2-NEXT: testb $32, %cl
; X86-FALLBACK2-NEXT: cmovnel %esi, %eax		; X86-FALLBACK2-NEXT: cmovel %eax, %edx
; X86-FALLBACK2-NEXT: cmovel %esi, %edx		; X86-FALLBACK2-NEXT: cmovel %esi, %eax
; X86-FALLBACK2-NEXT: andl {{[0-9]+}}(%esp), %eax		; X86-FALLBACK2-NEXT: andl {{[0-9]+}}(%esp), %eax
; X86-FALLBACK2-NEXT: andl {{[0-9]+}}(%esp), %edx		; X86-FALLBACK2-NEXT: andl {{[0-9]+}}(%esp), %edx
; X86-FALLBACK2-NEXT: popl %esi		; X86-FALLBACK2-NEXT: popl %esi
; X86-FALLBACK2-NEXT: retl		; X86-FALLBACK2-NEXT: retl
;		;
; X86-BMI2-LABEL: clear_highbits64_c4_commutative:		; X86-BMI2-LABEL: clear_highbits64_c4_commutative:
; X86-BMI2: # %bb.0:		; X86-BMI2: # %bb.0:
; X86-BMI2-NEXT: pushl %esi		; X86-BMI2-NEXT: pushl %esi
; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-BMI2-NEXT: movl $-1, %eax		; X86-BMI2-NEXT: movl $-1, %eax
; X86-BMI2-NEXT: shrxl %ecx, %eax, %esi		; X86-BMI2-NEXT: shrxl %ecx, %eax, %esi
; X86-BMI2-NEXT: shrdl %cl, %eax, %eax
; X86-BMI2-NEXT: xorl %edx, %edx		; X86-BMI2-NEXT: xorl %edx, %edx
; X86-BMI2-NEXT: testb $32, %cl		; X86-BMI2-NEXT: testb $32, %cl
; X86-BMI2-NEXT: cmovnel %esi, %eax
; X86-BMI2-NEXT: cmovel %esi, %edx		; X86-BMI2-NEXT: cmovel %esi, %edx
		; X86-BMI2-NEXT: cmovnel %esi, %eax
; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %eax		; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %eax
; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %edx		; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
; X86-BMI2-NEXT: popl %esi		; X86-BMI2-NEXT: popl %esi
; X86-BMI2-NEXT: retl		; X86-BMI2-NEXT: retl
;		;
; X64-NOBMI2-LABEL: clear_highbits64_c4_commutative:		; X64-NOBMI2-LABEL: clear_highbits64_c4_commutative:
; X64-NOBMI2: # %bb.0:		; X64-NOBMI2: # %bb.0:
; X64-NOBMI2-NEXT: movq %rsi, %rcx		; X64-NOBMI2-NEXT: movq %rsi, %rcx
▲ Show 20 Lines • Show All 97 Lines • ▼ Show 20 Lines
; X86-FALLBACK0: # %bb.0:		; X86-FALLBACK0: # %bb.0:
; X86-FALLBACK0-NEXT: pushl %edi		; X86-FALLBACK0-NEXT: pushl %edi
; X86-FALLBACK0-NEXT: pushl %esi		; X86-FALLBACK0-NEXT: pushl %esi
; X86-FALLBACK0-NEXT: pushl %eax		; X86-FALLBACK0-NEXT: pushl %eax
; X86-FALLBACK0-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-FALLBACK0-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-FALLBACK0-NEXT: movl $-1, %esi		; X86-FALLBACK0-NEXT: movl $-1, %esi
; X86-FALLBACK0-NEXT: movl $-1, %edi		; X86-FALLBACK0-NEXT: movl $-1, %edi
; X86-FALLBACK0-NEXT: shrl %cl, %edi		; X86-FALLBACK0-NEXT: shrl %cl, %edi
; X86-FALLBACK0-NEXT: shrdl %cl, %esi, %esi
; X86-FALLBACK0-NEXT: testb $32, %cl		; X86-FALLBACK0-NEXT: testb $32, %cl
; X86-FALLBACK0-NEXT: je .LBB19_2		; X86-FALLBACK0-NEXT: je .LBB19_2
; X86-FALLBACK0-NEXT: # %bb.1:		; X86-FALLBACK0-NEXT: # %bb.1:
; X86-FALLBACK0-NEXT: movl %edi, %esi		; X86-FALLBACK0-NEXT: movl %edi, %esi
; X86-FALLBACK0-NEXT: xorl %edi, %edi		; X86-FALLBACK0-NEXT: xorl %edi, %edi
; X86-FALLBACK0-NEXT: .LBB19_2:		; X86-FALLBACK0-NEXT: .LBB19_2:
; X86-FALLBACK0-NEXT: subl $8, %esp		; X86-FALLBACK0-NEXT: subl $8, %esp
; X86-FALLBACK0-NEXT: pushl %edi		; X86-FALLBACK0-NEXT: pushl %edi
Show All 13 Lines
; X86-FALLBACK1: # %bb.0:		; X86-FALLBACK1: # %bb.0:
; X86-FALLBACK1-NEXT: pushl %edi		; X86-FALLBACK1-NEXT: pushl %edi
; X86-FALLBACK1-NEXT: pushl %esi		; X86-FALLBACK1-NEXT: pushl %esi
; X86-FALLBACK1-NEXT: pushl %eax		; X86-FALLBACK1-NEXT: pushl %eax
; X86-FALLBACK1-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-FALLBACK1-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-FALLBACK1-NEXT: movl $-1, %esi		; X86-FALLBACK1-NEXT: movl $-1, %esi
; X86-FALLBACK1-NEXT: movl $-1, %eax		; X86-FALLBACK1-NEXT: movl $-1, %eax
; X86-FALLBACK1-NEXT: shrl %cl, %eax		; X86-FALLBACK1-NEXT: shrl %cl, %eax
; X86-FALLBACK1-NEXT: shrdl %cl, %esi, %esi
; X86-FALLBACK1-NEXT: xorl %edi, %edi		; X86-FALLBACK1-NEXT: xorl %edi, %edi
; X86-FALLBACK1-NEXT: testb $32, %cl		; X86-FALLBACK1-NEXT: testb $32, %cl
; X86-FALLBACK1-NEXT: cmovnel %eax, %esi		; X86-FALLBACK1-NEXT: cmovnel %eax, %esi
; X86-FALLBACK1-NEXT: cmovel %eax, %edi		; X86-FALLBACK1-NEXT: cmovel %eax, %edi
; X86-FALLBACK1-NEXT: subl $8, %esp		; X86-FALLBACK1-NEXT: subl $8, %esp
; X86-FALLBACK1-NEXT: pushl %edi		; X86-FALLBACK1-NEXT: pushl %edi
; X86-FALLBACK1-NEXT: pushl %esi		; X86-FALLBACK1-NEXT: pushl %esi
; X86-FALLBACK1-NEXT: calll use64		; X86-FALLBACK1-NEXT: calll use64
Show All 11 Lines
; X86-FALLBACK2: # %bb.0:		; X86-FALLBACK2: # %bb.0:
; X86-FALLBACK2-NEXT: pushl %edi		; X86-FALLBACK2-NEXT: pushl %edi
; X86-FALLBACK2-NEXT: pushl %esi		; X86-FALLBACK2-NEXT: pushl %esi
; X86-FALLBACK2-NEXT: pushl %eax		; X86-FALLBACK2-NEXT: pushl %eax
; X86-FALLBACK2-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-FALLBACK2-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-FALLBACK2-NEXT: movl $-1, %esi		; X86-FALLBACK2-NEXT: movl $-1, %esi
; X86-FALLBACK2-NEXT: movl $-1, %eax		; X86-FALLBACK2-NEXT: movl $-1, %eax
; X86-FALLBACK2-NEXT: shrl %cl, %eax		; X86-FALLBACK2-NEXT: shrl %cl, %eax
; X86-FALLBACK2-NEXT: shrdl %cl, %esi, %esi
; X86-FALLBACK2-NEXT: xorl %edi, %edi		; X86-FALLBACK2-NEXT: xorl %edi, %edi
; X86-FALLBACK2-NEXT: testb $32, %cl		; X86-FALLBACK2-NEXT: testb $32, %cl
; X86-FALLBACK2-NEXT: cmovnel %eax, %esi		; X86-FALLBACK2-NEXT: cmovnel %eax, %esi
; X86-FALLBACK2-NEXT: cmovel %eax, %edi		; X86-FALLBACK2-NEXT: cmovel %eax, %edi
; X86-FALLBACK2-NEXT: subl $8, %esp		; X86-FALLBACK2-NEXT: subl $8, %esp
; X86-FALLBACK2-NEXT: pushl %edi		; X86-FALLBACK2-NEXT: pushl %edi
; X86-FALLBACK2-NEXT: pushl %esi		; X86-FALLBACK2-NEXT: pushl %esi
; X86-FALLBACK2-NEXT: calll use64		; X86-FALLBACK2-NEXT: calll use64
; X86-FALLBACK2-NEXT: addl $16, %esp		; X86-FALLBACK2-NEXT: addl $16, %esp
; X86-FALLBACK2-NEXT: andl {{[0-9]+}}(%esp), %esi		; X86-FALLBACK2-NEXT: andl {{[0-9]+}}(%esp), %esi
; X86-FALLBACK2-NEXT: andl {{[0-9]+}}(%esp), %edi		; X86-FALLBACK2-NEXT: andl {{[0-9]+}}(%esp), %edi
; X86-FALLBACK2-NEXT: movl %esi, %eax		; X86-FALLBACK2-NEXT: movl %esi, %eax
; X86-FALLBACK2-NEXT: movl %edi, %edx		; X86-FALLBACK2-NEXT: movl %edi, %edx
; X86-FALLBACK2-NEXT: addl $4, %esp		; X86-FALLBACK2-NEXT: addl $4, %esp
; X86-FALLBACK2-NEXT: popl %esi		; X86-FALLBACK2-NEXT: popl %esi
; X86-FALLBACK2-NEXT: popl %edi		; X86-FALLBACK2-NEXT: popl %edi
; X86-FALLBACK2-NEXT: retl		; X86-FALLBACK2-NEXT: retl
;		;
; X86-BMI2-LABEL: oneuse64:		; X86-BMI2-LABEL: oneuse64:
; X86-BMI2: # %bb.0:		; X86-BMI2: # %bb.0:
; X86-BMI2-NEXT: pushl %edi		; X86-BMI2-NEXT: pushl %edi
; X86-BMI2-NEXT: pushl %esi		; X86-BMI2-NEXT: pushl %esi
; X86-BMI2-NEXT: pushl %eax		; X86-BMI2-NEXT: pushl %eax
; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %al
; X86-BMI2-NEXT: movl $-1, %esi		; X86-BMI2-NEXT: movl $-1, %esi
; X86-BMI2-NEXT: shrxl %ecx, %esi, %eax		; X86-BMI2-NEXT: shrxl %eax, %esi, %ecx
; X86-BMI2-NEXT: shrdl %cl, %esi, %esi
; X86-BMI2-NEXT: xorl %edi, %edi		; X86-BMI2-NEXT: xorl %edi, %edi
; X86-BMI2-NEXT: testb $32, %cl		; X86-BMI2-NEXT: testb $32, %al
; X86-BMI2-NEXT: cmovnel %eax, %esi		; X86-BMI2-NEXT: cmovnel %ecx, %esi
; X86-BMI2-NEXT: cmovel %eax, %edi		; X86-BMI2-NEXT: cmovel %ecx, %edi
; X86-BMI2-NEXT: subl $8, %esp		; X86-BMI2-NEXT: subl $8, %esp
; X86-BMI2-NEXT: pushl %edi		; X86-BMI2-NEXT: pushl %edi
; X86-BMI2-NEXT: pushl %esi		; X86-BMI2-NEXT: pushl %esi
; X86-BMI2-NEXT: calll use64		; X86-BMI2-NEXT: calll use64
; X86-BMI2-NEXT: addl $16, %esp		; X86-BMI2-NEXT: addl $16, %esp
; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %esi		; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %esi
; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %edi		; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %edi
; X86-BMI2-NEXT: movl %esi, %eax		; X86-BMI2-NEXT: movl %esi, %eax
▲ Show 20 Lines • Show All 46 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/clear-lowbits.ll

	Show First 20 Lines • Show All 496 Lines • ▼ Show 20 Lines

	define i64 @clear_lowbits64_c0(i64 %val, i64 %numlowbits) nounwind {			define i64 @clear_lowbits64_c0(i64 %val, i64 %numlowbits) nounwind {
	; X86-NOBMI2-LABEL: clear_lowbits64_c0:			; X86-NOBMI2-LABEL: clear_lowbits64_c0:
	; X86-NOBMI2: # %bb.0:			; X86-NOBMI2: # %bb.0:
	; X86-NOBMI2-NEXT: movb {{[0-9]+}}(%esp), %cl			; X86-NOBMI2-NEXT: movb {{[0-9]+}}(%esp), %cl
	; X86-NOBMI2-NEXT: movl $-1, %edx			; X86-NOBMI2-NEXT: movl $-1, %edx
	; X86-NOBMI2-NEXT: movl $-1, %eax			; X86-NOBMI2-NEXT: movl $-1, %eax
	; X86-NOBMI2-NEXT: shll %cl, %eax			; X86-NOBMI2-NEXT: shll %cl, %eax
	; X86-NOBMI2-NEXT: shldl %cl, %edx, %edx
	; X86-NOBMI2-NEXT: testb $32, %cl			; X86-NOBMI2-NEXT: testb $32, %cl
	; X86-NOBMI2-NEXT: je .LBB13_2			; X86-NOBMI2-NEXT: je .LBB13_2
	; X86-NOBMI2-NEXT: # %bb.1:			; X86-NOBMI2-NEXT: # %bb.1:
	; X86-NOBMI2-NEXT: movl %eax, %edx			; X86-NOBMI2-NEXT: movl %eax, %edx
	; X86-NOBMI2-NEXT: xorl %eax, %eax			; X86-NOBMI2-NEXT: xorl %eax, %eax
	; X86-NOBMI2-NEXT: .LBB13_2:			; X86-NOBMI2-NEXT: .LBB13_2:
	; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %eax			; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %eax
				; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-NOBMI2-NEXT: retl			; X86-NOBMI2-NEXT: retl
	;			;
	; X86-BMI2-LABEL: clear_lowbits64_c0:			; X86-BMI2-LABEL: clear_lowbits64_c0:
	; X86-BMI2: # %bb.0:			; X86-BMI2: # %bb.0:
	; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl			; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl
	; X86-BMI2-NEXT: movl $-1, %edx			; X86-BMI2-NEXT: movl $-1, %edx
	; X86-BMI2-NEXT: shlxl %ecx, %edx, %eax			; X86-BMI2-NEXT: shlxl %ecx, %edx, %eax
	; X86-BMI2-NEXT: shldl %cl, %edx, %edx
	; X86-BMI2-NEXT: testb $32, %cl			; X86-BMI2-NEXT: testb $32, %cl
	; X86-BMI2-NEXT: je .LBB13_2			; X86-BMI2-NEXT: je .LBB13_2
	; X86-BMI2-NEXT: # %bb.1:			; X86-BMI2-NEXT: # %bb.1:
	; X86-BMI2-NEXT: movl %eax, %edx			; X86-BMI2-NEXT: movl %eax, %edx
	; X86-BMI2-NEXT: xorl %eax, %eax			; X86-BMI2-NEXT: xorl %eax, %eax
	; X86-BMI2-NEXT: .LBB13_2:			; X86-BMI2-NEXT: .LBB13_2:
	; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %eax			; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %eax
				; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-BMI2-NEXT: retl			; X86-BMI2-NEXT: retl
	;			;
	; X64-NOBMI2-LABEL: clear_lowbits64_c0:			; X64-NOBMI2-LABEL: clear_lowbits64_c0:
	; X64-NOBMI2: # %bb.0:			; X64-NOBMI2: # %bb.0:
	; X64-NOBMI2-NEXT: movq %rsi, %rcx			; X64-NOBMI2-NEXT: movq %rsi, %rcx
	; X64-NOBMI2-NEXT: movq %rdi, %rax			; X64-NOBMI2-NEXT: movq %rdi, %rax
	; X64-NOBMI2-NEXT: shrq %cl, %rax			; X64-NOBMI2-NEXT: shrq %cl, %rax
	; X64-NOBMI2-NEXT: # kill: def $cl killed $cl killed $rcx			; X64-NOBMI2-NEXT: # kill: def $cl killed $cl killed $rcx
	Show All 12 Lines

	define i64 @clear_lowbits64_c1_indexzext(i64 %val, i8 %numlowbits) nounwind {			define i64 @clear_lowbits64_c1_indexzext(i64 %val, i8 %numlowbits) nounwind {
	; X86-NOBMI2-LABEL: clear_lowbits64_c1_indexzext:			; X86-NOBMI2-LABEL: clear_lowbits64_c1_indexzext:
	; X86-NOBMI2: # %bb.0:			; X86-NOBMI2: # %bb.0:
	; X86-NOBMI2-NEXT: movb {{[0-9]+}}(%esp), %cl			; X86-NOBMI2-NEXT: movb {{[0-9]+}}(%esp), %cl
	; X86-NOBMI2-NEXT: movl $-1, %edx			; X86-NOBMI2-NEXT: movl $-1, %edx
	; X86-NOBMI2-NEXT: movl $-1, %eax			; X86-NOBMI2-NEXT: movl $-1, %eax
	; X86-NOBMI2-NEXT: shll %cl, %eax			; X86-NOBMI2-NEXT: shll %cl, %eax
	; X86-NOBMI2-NEXT: shldl %cl, %edx, %edx
	; X86-NOBMI2-NEXT: testb $32, %cl			; X86-NOBMI2-NEXT: testb $32, %cl
	; X86-NOBMI2-NEXT: je .LBB14_2			; X86-NOBMI2-NEXT: je .LBB14_2
	; X86-NOBMI2-NEXT: # %bb.1:			; X86-NOBMI2-NEXT: # %bb.1:
	; X86-NOBMI2-NEXT: movl %eax, %edx			; X86-NOBMI2-NEXT: movl %eax, %edx
	; X86-NOBMI2-NEXT: xorl %eax, %eax			; X86-NOBMI2-NEXT: xorl %eax, %eax
	; X86-NOBMI2-NEXT: .LBB14_2:			; X86-NOBMI2-NEXT: .LBB14_2:
	; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %eax			; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %eax
				; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-NOBMI2-NEXT: retl			; X86-NOBMI2-NEXT: retl
	;			;
	; X86-BMI2-LABEL: clear_lowbits64_c1_indexzext:			; X86-BMI2-LABEL: clear_lowbits64_c1_indexzext:
	; X86-BMI2: # %bb.0:			; X86-BMI2: # %bb.0:
	; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl			; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl
	; X86-BMI2-NEXT: movl $-1, %edx			; X86-BMI2-NEXT: movl $-1, %edx
	; X86-BMI2-NEXT: shlxl %ecx, %edx, %eax			; X86-BMI2-NEXT: shlxl %ecx, %edx, %eax
	; X86-BMI2-NEXT: shldl %cl, %edx, %edx
	; X86-BMI2-NEXT: testb $32, %cl			; X86-BMI2-NEXT: testb $32, %cl
	; X86-BMI2-NEXT: je .LBB14_2			; X86-BMI2-NEXT: je .LBB14_2
	; X86-BMI2-NEXT: # %bb.1:			; X86-BMI2-NEXT: # %bb.1:
	; X86-BMI2-NEXT: movl %eax, %edx			; X86-BMI2-NEXT: movl %eax, %edx
	; X86-BMI2-NEXT: xorl %eax, %eax			; X86-BMI2-NEXT: xorl %eax, %eax
	; X86-BMI2-NEXT: .LBB14_2:			; X86-BMI2-NEXT: .LBB14_2:
	; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %eax			; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %eax
				; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-BMI2-NEXT: retl			; X86-BMI2-NEXT: retl
	;			;
	; X64-NOBMI2-LABEL: clear_lowbits64_c1_indexzext:			; X64-NOBMI2-LABEL: clear_lowbits64_c1_indexzext:
	; X64-NOBMI2: # %bb.0:			; X64-NOBMI2: # %bb.0:
	; X64-NOBMI2-NEXT: movl %esi, %ecx			; X64-NOBMI2-NEXT: movl %esi, %ecx
	; X64-NOBMI2-NEXT: movq %rdi, %rax			; X64-NOBMI2-NEXT: movq %rdi, %rax
	; X64-NOBMI2-NEXT: shrq %cl, %rax			; X64-NOBMI2-NEXT: shrq %cl, %rax
	; X64-NOBMI2-NEXT: # kill: def $cl killed $cl killed $ecx			; X64-NOBMI2-NEXT: # kill: def $cl killed $cl killed $ecx
	Show All 16 Lines
	; X86-NOBMI2-LABEL: clear_lowbits64_c2_load:			; X86-NOBMI2-LABEL: clear_lowbits64_c2_load:
	; X86-NOBMI2: # %bb.0:			; X86-NOBMI2: # %bb.0:
	; X86-NOBMI2-NEXT: pushl %esi			; X86-NOBMI2-NEXT: pushl %esi
	; X86-NOBMI2-NEXT: movl {{[0-9]+}}(%esp), %esi			; X86-NOBMI2-NEXT: movl {{[0-9]+}}(%esp), %esi
	; X86-NOBMI2-NEXT: movb {{[0-9]+}}(%esp), %cl			; X86-NOBMI2-NEXT: movb {{[0-9]+}}(%esp), %cl
	; X86-NOBMI2-NEXT: movl $-1, %edx			; X86-NOBMI2-NEXT: movl $-1, %edx
	; X86-NOBMI2-NEXT: movl $-1, %eax			; X86-NOBMI2-NEXT: movl $-1, %eax
	; X86-NOBMI2-NEXT: shll %cl, %eax			; X86-NOBMI2-NEXT: shll %cl, %eax
	; X86-NOBMI2-NEXT: shldl %cl, %edx, %edx
	; X86-NOBMI2-NEXT: testb $32, %cl			; X86-NOBMI2-NEXT: testb $32, %cl
	; X86-NOBMI2-NEXT: je .LBB15_2			; X86-NOBMI2-NEXT: je .LBB15_2
	; X86-NOBMI2-NEXT: # %bb.1:			; X86-NOBMI2-NEXT: # %bb.1:
	; X86-NOBMI2-NEXT: movl %eax, %edx			; X86-NOBMI2-NEXT: movl %eax, %edx
	; X86-NOBMI2-NEXT: xorl %eax, %eax			; X86-NOBMI2-NEXT: xorl %eax, %eax
	; X86-NOBMI2-NEXT: .LBB15_2:			; X86-NOBMI2-NEXT: .LBB15_2:
	; X86-NOBMI2-NEXT: andl 4(%esi), %edx
	; X86-NOBMI2-NEXT: andl (%esi), %eax			; X86-NOBMI2-NEXT: andl (%esi), %eax
				; X86-NOBMI2-NEXT: andl 4(%esi), %edx
	; X86-NOBMI2-NEXT: popl %esi			; X86-NOBMI2-NEXT: popl %esi
	; X86-NOBMI2-NEXT: retl			; X86-NOBMI2-NEXT: retl
	;			;
	; X86-BMI2-LABEL: clear_lowbits64_c2_load:			; X86-BMI2-LABEL: clear_lowbits64_c2_load:
	; X86-BMI2: # %bb.0:			; X86-BMI2: # %bb.0:
	; X86-BMI2-NEXT: pushl %esi			; X86-BMI2-NEXT: pushl %ebx
	; X86-BMI2-NEXT: movl {{[0-9]+}}(%esp), %esi			; X86-BMI2-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl			; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %bl
	; X86-BMI2-NEXT: movl $-1, %edx			; X86-BMI2-NEXT: movl $-1, %edx
	; X86-BMI2-NEXT: shlxl %ecx, %edx, %eax			; X86-BMI2-NEXT: shlxl %ebx, %edx, %eax
	; X86-BMI2-NEXT: shldl %cl, %edx, %edx			; X86-BMI2-NEXT: testb $32, %bl
	; X86-BMI2-NEXT: testb $32, %cl
	; X86-BMI2-NEXT: je .LBB15_2			; X86-BMI2-NEXT: je .LBB15_2
	; X86-BMI2-NEXT: # %bb.1:			; X86-BMI2-NEXT: # %bb.1:
	; X86-BMI2-NEXT: movl %eax, %edx			; X86-BMI2-NEXT: movl %eax, %edx
	; X86-BMI2-NEXT: xorl %eax, %eax			; X86-BMI2-NEXT: xorl %eax, %eax
	; X86-BMI2-NEXT: .LBB15_2:			; X86-BMI2-NEXT: .LBB15_2:
	; X86-BMI2-NEXT: andl 4(%esi), %edx			; X86-BMI2-NEXT: andl (%ecx), %eax
	; X86-BMI2-NEXT: andl (%esi), %eax			; X86-BMI2-NEXT: andl 4(%ecx), %edx
	; X86-BMI2-NEXT: popl %esi			; X86-BMI2-NEXT: popl %ebx
	; X86-BMI2-NEXT: retl			; X86-BMI2-NEXT: retl
	;			;
	; X64-NOBMI2-LABEL: clear_lowbits64_c2_load:			; X64-NOBMI2-LABEL: clear_lowbits64_c2_load:
	; X64-NOBMI2: # %bb.0:			; X64-NOBMI2: # %bb.0:
	; X64-NOBMI2-NEXT: movq %rsi, %rcx			; X64-NOBMI2-NEXT: movq %rsi, %rcx
	; X64-NOBMI2-NEXT: movq (%rdi), %rax			; X64-NOBMI2-NEXT: movq (%rdi), %rax
	; X64-NOBMI2-NEXT: shrq %cl, %rax			; X64-NOBMI2-NEXT: shrq %cl, %rax
	; X64-NOBMI2-NEXT: # kill: def $cl killed $cl killed $rcx			; X64-NOBMI2-NEXT: # kill: def $cl killed $cl killed $rcx
	Show All 15 Lines
	; X86-NOBMI2-LABEL: clear_lowbits64_c3_load_indexzext:			; X86-NOBMI2-LABEL: clear_lowbits64_c3_load_indexzext:
	; X86-NOBMI2: # %bb.0:			; X86-NOBMI2: # %bb.0:
	; X86-NOBMI2-NEXT: pushl %esi			; X86-NOBMI2-NEXT: pushl %esi
	; X86-NOBMI2-NEXT: movl {{[0-9]+}}(%esp), %esi			; X86-NOBMI2-NEXT: movl {{[0-9]+}}(%esp), %esi
	; X86-NOBMI2-NEXT: movb {{[0-9]+}}(%esp), %cl			; X86-NOBMI2-NEXT: movb {{[0-9]+}}(%esp), %cl
	; X86-NOBMI2-NEXT: movl $-1, %edx			; X86-NOBMI2-NEXT: movl $-1, %edx
	; X86-NOBMI2-NEXT: movl $-1, %eax			; X86-NOBMI2-NEXT: movl $-1, %eax
	; X86-NOBMI2-NEXT: shll %cl, %eax			; X86-NOBMI2-NEXT: shll %cl, %eax
	; X86-NOBMI2-NEXT: shldl %cl, %edx, %edx
	; X86-NOBMI2-NEXT: testb $32, %cl			; X86-NOBMI2-NEXT: testb $32, %cl
	; X86-NOBMI2-NEXT: je .LBB16_2			; X86-NOBMI2-NEXT: je .LBB16_2
	; X86-NOBMI2-NEXT: # %bb.1:			; X86-NOBMI2-NEXT: # %bb.1:
	; X86-NOBMI2-NEXT: movl %eax, %edx			; X86-NOBMI2-NEXT: movl %eax, %edx
	; X86-NOBMI2-NEXT: xorl %eax, %eax			; X86-NOBMI2-NEXT: xorl %eax, %eax
	; X86-NOBMI2-NEXT: .LBB16_2:			; X86-NOBMI2-NEXT: .LBB16_2:
	; X86-NOBMI2-NEXT: andl 4(%esi), %edx
	; X86-NOBMI2-NEXT: andl (%esi), %eax			; X86-NOBMI2-NEXT: andl (%esi), %eax
				; X86-NOBMI2-NEXT: andl 4(%esi), %edx
	; X86-NOBMI2-NEXT: popl %esi			; X86-NOBMI2-NEXT: popl %esi
	; X86-NOBMI2-NEXT: retl			; X86-NOBMI2-NEXT: retl
	;			;
	; X86-BMI2-LABEL: clear_lowbits64_c3_load_indexzext:			; X86-BMI2-LABEL: clear_lowbits64_c3_load_indexzext:
	; X86-BMI2: # %bb.0:			; X86-BMI2: # %bb.0:
	; X86-BMI2-NEXT: pushl %esi			; X86-BMI2-NEXT: pushl %ebx
	; X86-BMI2-NEXT: movl {{[0-9]+}}(%esp), %esi			; X86-BMI2-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl			; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %bl
	; X86-BMI2-NEXT: movl $-1, %edx			; X86-BMI2-NEXT: movl $-1, %edx
	; X86-BMI2-NEXT: shlxl %ecx, %edx, %eax			; X86-BMI2-NEXT: shlxl %ebx, %edx, %eax
	; X86-BMI2-NEXT: shldl %cl, %edx, %edx			; X86-BMI2-NEXT: testb $32, %bl
	; X86-BMI2-NEXT: testb $32, %cl
	; X86-BMI2-NEXT: je .LBB16_2			; X86-BMI2-NEXT: je .LBB16_2
	; X86-BMI2-NEXT: # %bb.1:			; X86-BMI2-NEXT: # %bb.1:
	; X86-BMI2-NEXT: movl %eax, %edx			; X86-BMI2-NEXT: movl %eax, %edx
	; X86-BMI2-NEXT: xorl %eax, %eax			; X86-BMI2-NEXT: xorl %eax, %eax
	; X86-BMI2-NEXT: .LBB16_2:			; X86-BMI2-NEXT: .LBB16_2:
	; X86-BMI2-NEXT: andl 4(%esi), %edx			; X86-BMI2-NEXT: andl (%ecx), %eax
	; X86-BMI2-NEXT: andl (%esi), %eax			; X86-BMI2-NEXT: andl 4(%ecx), %edx
	; X86-BMI2-NEXT: popl %esi			; X86-BMI2-NEXT: popl %ebx
	; X86-BMI2-NEXT: retl			; X86-BMI2-NEXT: retl
	;			;
	; X64-NOBMI2-LABEL: clear_lowbits64_c3_load_indexzext:			; X64-NOBMI2-LABEL: clear_lowbits64_c3_load_indexzext:
	; X64-NOBMI2: # %bb.0:			; X64-NOBMI2: # %bb.0:
	; X64-NOBMI2-NEXT: movl %esi, %ecx			; X64-NOBMI2-NEXT: movl %esi, %ecx
	; X64-NOBMI2-NEXT: movq (%rdi), %rax			; X64-NOBMI2-NEXT: movq (%rdi), %rax
	; X64-NOBMI2-NEXT: shrq %cl, %rax			; X64-NOBMI2-NEXT: shrq %cl, %rax
	; X64-NOBMI2-NEXT: # kill: def $cl killed $cl killed $ecx			; X64-NOBMI2-NEXT: # kill: def $cl killed $cl killed $ecx
	Show All 15 Lines

	define i64 @clear_lowbits64_c4_commutative(i64 %val, i64 %numlowbits) nounwind {			define i64 @clear_lowbits64_c4_commutative(i64 %val, i64 %numlowbits) nounwind {
	; X86-NOBMI2-LABEL: clear_lowbits64_c4_commutative:			; X86-NOBMI2-LABEL: clear_lowbits64_c4_commutative:
	; X86-NOBMI2: # %bb.0:			; X86-NOBMI2: # %bb.0:
	; X86-NOBMI2-NEXT: movb {{[0-9]+}}(%esp), %cl			; X86-NOBMI2-NEXT: movb {{[0-9]+}}(%esp), %cl
	; X86-NOBMI2-NEXT: movl $-1, %edx			; X86-NOBMI2-NEXT: movl $-1, %edx
	; X86-NOBMI2-NEXT: movl $-1, %eax			; X86-NOBMI2-NEXT: movl $-1, %eax
	; X86-NOBMI2-NEXT: shll %cl, %eax			; X86-NOBMI2-NEXT: shll %cl, %eax
	; X86-NOBMI2-NEXT: shldl %cl, %edx, %edx
	; X86-NOBMI2-NEXT: testb $32, %cl			; X86-NOBMI2-NEXT: testb $32, %cl
	; X86-NOBMI2-NEXT: je .LBB17_2			; X86-NOBMI2-NEXT: je .LBB17_2
	; X86-NOBMI2-NEXT: # %bb.1:			; X86-NOBMI2-NEXT: # %bb.1:
	; X86-NOBMI2-NEXT: movl %eax, %edx			; X86-NOBMI2-NEXT: movl %eax, %edx
	; X86-NOBMI2-NEXT: xorl %eax, %eax			; X86-NOBMI2-NEXT: xorl %eax, %eax
	; X86-NOBMI2-NEXT: .LBB17_2:			; X86-NOBMI2-NEXT: .LBB17_2:
	; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %eax			; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %eax
				; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-NOBMI2-NEXT: retl			; X86-NOBMI2-NEXT: retl
	;			;
	; X86-BMI2-LABEL: clear_lowbits64_c4_commutative:			; X86-BMI2-LABEL: clear_lowbits64_c4_commutative:
	; X86-BMI2: # %bb.0:			; X86-BMI2: # %bb.0:
	; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl			; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl
	; X86-BMI2-NEXT: movl $-1, %edx			; X86-BMI2-NEXT: movl $-1, %edx
	; X86-BMI2-NEXT: shlxl %ecx, %edx, %eax			; X86-BMI2-NEXT: shlxl %ecx, %edx, %eax
	; X86-BMI2-NEXT: shldl %cl, %edx, %edx
	; X86-BMI2-NEXT: testb $32, %cl			; X86-BMI2-NEXT: testb $32, %cl
	; X86-BMI2-NEXT: je .LBB17_2			; X86-BMI2-NEXT: je .LBB17_2
	; X86-BMI2-NEXT: # %bb.1:			; X86-BMI2-NEXT: # %bb.1:
	; X86-BMI2-NEXT: movl %eax, %edx			; X86-BMI2-NEXT: movl %eax, %edx
	; X86-BMI2-NEXT: xorl %eax, %eax			; X86-BMI2-NEXT: xorl %eax, %eax
	; X86-BMI2-NEXT: .LBB17_2:			; X86-BMI2-NEXT: .LBB17_2:
	; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %eax			; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %eax
				; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-BMI2-NEXT: retl			; X86-BMI2-NEXT: retl
	;			;
	; X64-NOBMI2-LABEL: clear_lowbits64_c4_commutative:			; X64-NOBMI2-LABEL: clear_lowbits64_c4_commutative:
	; X64-NOBMI2: # %bb.0:			; X64-NOBMI2: # %bb.0:
	; X64-NOBMI2-NEXT: movq %rsi, %rcx			; X64-NOBMI2-NEXT: movq %rsi, %rcx
	; X64-NOBMI2-NEXT: movq %rdi, %rax			; X64-NOBMI2-NEXT: movq %rdi, %rax
	; X64-NOBMI2-NEXT: shrq %cl, %rax			; X64-NOBMI2-NEXT: shrq %cl, %rax
	; X64-NOBMI2-NEXT: # kill: def $cl killed $cl killed $rcx			; X64-NOBMI2-NEXT: # kill: def $cl killed $cl killed $rcx
	▲ Show 20 Lines • Show All 552 Lines • ▼ Show 20 Lines
	define i64 @clear_lowbits64_ic0(i64 %val, i64 %numlowbits) nounwind {			define i64 @clear_lowbits64_ic0(i64 %val, i64 %numlowbits) nounwind {
	; X86-NOBMI2-LABEL: clear_lowbits64_ic0:			; X86-NOBMI2-LABEL: clear_lowbits64_ic0:
	; X86-NOBMI2: # %bb.0:			; X86-NOBMI2: # %bb.0:
	; X86-NOBMI2-NEXT: movb $64, %cl			; X86-NOBMI2-NEXT: movb $64, %cl
	; X86-NOBMI2-NEXT: subb {{[0-9]+}}(%esp), %cl			; X86-NOBMI2-NEXT: subb {{[0-9]+}}(%esp), %cl
	; X86-NOBMI2-NEXT: movl $-1, %edx			; X86-NOBMI2-NEXT: movl $-1, %edx
	; X86-NOBMI2-NEXT: movl $-1, %eax			; X86-NOBMI2-NEXT: movl $-1, %eax
	; X86-NOBMI2-NEXT: shll %cl, %eax			; X86-NOBMI2-NEXT: shll %cl, %eax
	; X86-NOBMI2-NEXT: shldl %cl, %edx, %edx
	; X86-NOBMI2-NEXT: testb $32, %cl			; X86-NOBMI2-NEXT: testb $32, %cl
	; X86-NOBMI2-NEXT: je .LBB31_2			; X86-NOBMI2-NEXT: je .LBB31_2
	; X86-NOBMI2-NEXT: # %bb.1:			; X86-NOBMI2-NEXT: # %bb.1:
	; X86-NOBMI2-NEXT: movl %eax, %edx			; X86-NOBMI2-NEXT: movl %eax, %edx
	; X86-NOBMI2-NEXT: xorl %eax, %eax			; X86-NOBMI2-NEXT: xorl %eax, %eax
	; X86-NOBMI2-NEXT: .LBB31_2:			; X86-NOBMI2-NEXT: .LBB31_2:
	; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %eax			; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %eax
				; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-NOBMI2-NEXT: retl			; X86-NOBMI2-NEXT: retl
	;			;
	; X86-BMI2-LABEL: clear_lowbits64_ic0:			; X86-BMI2-LABEL: clear_lowbits64_ic0:
	; X86-BMI2: # %bb.0:			; X86-BMI2: # %bb.0:
	; X86-BMI2-NEXT: movb $64, %cl			; X86-BMI2-NEXT: movb $64, %cl
	; X86-BMI2-NEXT: subb {{[0-9]+}}(%esp), %cl			; X86-BMI2-NEXT: subb {{[0-9]+}}(%esp), %cl
	; X86-BMI2-NEXT: movl $-1, %edx			; X86-BMI2-NEXT: movl $-1, %edx
	; X86-BMI2-NEXT: shlxl %ecx, %edx, %eax			; X86-BMI2-NEXT: shlxl %ecx, %edx, %eax
	; X86-BMI2-NEXT: shldl %cl, %edx, %edx
	; X86-BMI2-NEXT: testb $32, %cl			; X86-BMI2-NEXT: testb $32, %cl
	; X86-BMI2-NEXT: je .LBB31_2			; X86-BMI2-NEXT: je .LBB31_2
	; X86-BMI2-NEXT: # %bb.1:			; X86-BMI2-NEXT: # %bb.1:
	; X86-BMI2-NEXT: movl %eax, %edx			; X86-BMI2-NEXT: movl %eax, %edx
	; X86-BMI2-NEXT: xorl %eax, %eax			; X86-BMI2-NEXT: xorl %eax, %eax
	; X86-BMI2-NEXT: .LBB31_2:			; X86-BMI2-NEXT: .LBB31_2:
	; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %eax			; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %eax
				; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-BMI2-NEXT: retl			; X86-BMI2-NEXT: retl
	;			;
	; X64-NOBMI2-LABEL: clear_lowbits64_ic0:			; X64-NOBMI2-LABEL: clear_lowbits64_ic0:
	; X64-NOBMI2: # %bb.0:			; X64-NOBMI2: # %bb.0:
	; X64-NOBMI2-NEXT: movq %rsi, %rcx			; X64-NOBMI2-NEXT: movq %rsi, %rcx
	; X64-NOBMI2-NEXT: movq %rdi, %rax			; X64-NOBMI2-NEXT: movq %rdi, %rax
	; X64-NOBMI2-NEXT: negb %cl			; X64-NOBMI2-NEXT: negb %cl
	; X64-NOBMI2-NEXT: shrq %cl, %rax			; X64-NOBMI2-NEXT: shrq %cl, %rax
	Show All 16 Lines
	define i64 @clear_lowbits64_ic1_indexzext(i64 %val, i8 %numlowbits) nounwind {			define i64 @clear_lowbits64_ic1_indexzext(i64 %val, i8 %numlowbits) nounwind {
	; X86-NOBMI2-LABEL: clear_lowbits64_ic1_indexzext:			; X86-NOBMI2-LABEL: clear_lowbits64_ic1_indexzext:
	; X86-NOBMI2: # %bb.0:			; X86-NOBMI2: # %bb.0:
	; X86-NOBMI2-NEXT: movb $64, %cl			; X86-NOBMI2-NEXT: movb $64, %cl
	; X86-NOBMI2-NEXT: subb {{[0-9]+}}(%esp), %cl			; X86-NOBMI2-NEXT: subb {{[0-9]+}}(%esp), %cl
	; X86-NOBMI2-NEXT: movl $-1, %edx			; X86-NOBMI2-NEXT: movl $-1, %edx
	; X86-NOBMI2-NEXT: movl $-1, %eax			; X86-NOBMI2-NEXT: movl $-1, %eax
	; X86-NOBMI2-NEXT: shll %cl, %eax			; X86-NOBMI2-NEXT: shll %cl, %eax
	; X86-NOBMI2-NEXT: shldl %cl, %edx, %edx
	; X86-NOBMI2-NEXT: testb $32, %cl			; X86-NOBMI2-NEXT: testb $32, %cl
	; X86-NOBMI2-NEXT: je .LBB32_2			; X86-NOBMI2-NEXT: je .LBB32_2
	; X86-NOBMI2-NEXT: # %bb.1:			; X86-NOBMI2-NEXT: # %bb.1:
	; X86-NOBMI2-NEXT: movl %eax, %edx			; X86-NOBMI2-NEXT: movl %eax, %edx
	; X86-NOBMI2-NEXT: xorl %eax, %eax			; X86-NOBMI2-NEXT: xorl %eax, %eax
	; X86-NOBMI2-NEXT: .LBB32_2:			; X86-NOBMI2-NEXT: .LBB32_2:
	; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %eax			; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %eax
				; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-NOBMI2-NEXT: retl			; X86-NOBMI2-NEXT: retl
	;			;
	; X86-BMI2-LABEL: clear_lowbits64_ic1_indexzext:			; X86-BMI2-LABEL: clear_lowbits64_ic1_indexzext:
	; X86-BMI2: # %bb.0:			; X86-BMI2: # %bb.0:
	; X86-BMI2-NEXT: movb $64, %cl			; X86-BMI2-NEXT: movb $64, %cl
	; X86-BMI2-NEXT: subb {{[0-9]+}}(%esp), %cl			; X86-BMI2-NEXT: subb {{[0-9]+}}(%esp), %cl
	; X86-BMI2-NEXT: movl $-1, %edx			; X86-BMI2-NEXT: movl $-1, %edx
	; X86-BMI2-NEXT: shlxl %ecx, %edx, %eax			; X86-BMI2-NEXT: shlxl %ecx, %edx, %eax
	; X86-BMI2-NEXT: shldl %cl, %edx, %edx
	; X86-BMI2-NEXT: testb $32, %cl			; X86-BMI2-NEXT: testb $32, %cl
	; X86-BMI2-NEXT: je .LBB32_2			; X86-BMI2-NEXT: je .LBB32_2
	; X86-BMI2-NEXT: # %bb.1:			; X86-BMI2-NEXT: # %bb.1:
	; X86-BMI2-NEXT: movl %eax, %edx			; X86-BMI2-NEXT: movl %eax, %edx
	; X86-BMI2-NEXT: xorl %eax, %eax			; X86-BMI2-NEXT: xorl %eax, %eax
	; X86-BMI2-NEXT: .LBB32_2:			; X86-BMI2-NEXT: .LBB32_2:
	; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %eax			; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %eax
				; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-BMI2-NEXT: retl			; X86-BMI2-NEXT: retl
	;			;
	; X64-NOBMI2-LABEL: clear_lowbits64_ic1_indexzext:			; X64-NOBMI2-LABEL: clear_lowbits64_ic1_indexzext:
	; X64-NOBMI2: # %bb.0:			; X64-NOBMI2: # %bb.0:
	; X64-NOBMI2-NEXT: movl %esi, %ecx			; X64-NOBMI2-NEXT: movl %esi, %ecx
	; X64-NOBMI2-NEXT: movq %rdi, %rax			; X64-NOBMI2-NEXT: movq %rdi, %rax
	; X64-NOBMI2-NEXT: negb %cl			; X64-NOBMI2-NEXT: negb %cl
	; X64-NOBMI2-NEXT: shrq %cl, %rax			; X64-NOBMI2-NEXT: shrq %cl, %rax
	Show All 20 Lines
	; X86-NOBMI2: # %bb.0:			; X86-NOBMI2: # %bb.0:
	; X86-NOBMI2-NEXT: pushl %esi			; X86-NOBMI2-NEXT: pushl %esi
	; X86-NOBMI2-NEXT: movl {{[0-9]+}}(%esp), %esi			; X86-NOBMI2-NEXT: movl {{[0-9]+}}(%esp), %esi
	; X86-NOBMI2-NEXT: movb $64, %cl			; X86-NOBMI2-NEXT: movb $64, %cl
	; X86-NOBMI2-NEXT: subb {{[0-9]+}}(%esp), %cl			; X86-NOBMI2-NEXT: subb {{[0-9]+}}(%esp), %cl
	; X86-NOBMI2-NEXT: movl $-1, %edx			; X86-NOBMI2-NEXT: movl $-1, %edx
	; X86-NOBMI2-NEXT: movl $-1, %eax			; X86-NOBMI2-NEXT: movl $-1, %eax
	; X86-NOBMI2-NEXT: shll %cl, %eax			; X86-NOBMI2-NEXT: shll %cl, %eax
	; X86-NOBMI2-NEXT: shldl %cl, %edx, %edx
	; X86-NOBMI2-NEXT: testb $32, %cl			; X86-NOBMI2-NEXT: testb $32, %cl
	; X86-NOBMI2-NEXT: je .LBB33_2			; X86-NOBMI2-NEXT: je .LBB33_2
	; X86-NOBMI2-NEXT: # %bb.1:			; X86-NOBMI2-NEXT: # %bb.1:
	; X86-NOBMI2-NEXT: movl %eax, %edx			; X86-NOBMI2-NEXT: movl %eax, %edx
	; X86-NOBMI2-NEXT: xorl %eax, %eax			; X86-NOBMI2-NEXT: xorl %eax, %eax
	; X86-NOBMI2-NEXT: .LBB33_2:			; X86-NOBMI2-NEXT: .LBB33_2:
	; X86-NOBMI2-NEXT: andl 4(%esi), %edx
	; X86-NOBMI2-NEXT: andl (%esi), %eax			; X86-NOBMI2-NEXT: andl (%esi), %eax
				; X86-NOBMI2-NEXT: andl 4(%esi), %edx
	; X86-NOBMI2-NEXT: popl %esi			; X86-NOBMI2-NEXT: popl %esi
	; X86-NOBMI2-NEXT: retl			; X86-NOBMI2-NEXT: retl
	;			;
	; X86-BMI2-LABEL: clear_lowbits64_ic2_load:			; X86-BMI2-LABEL: clear_lowbits64_ic2_load:
	; X86-BMI2: # %bb.0:			; X86-BMI2: # %bb.0:
	; X86-BMI2-NEXT: pushl %esi			; X86-BMI2-NEXT: pushl %ebx
	; X86-BMI2-NEXT: movl {{[0-9]+}}(%esp), %esi			; X86-BMI2-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X86-BMI2-NEXT: movb $64, %cl			; X86-BMI2-NEXT: movb $64, %bl
	; X86-BMI2-NEXT: subb {{[0-9]+}}(%esp), %cl			; X86-BMI2-NEXT: subb {{[0-9]+}}(%esp), %bl
	; X86-BMI2-NEXT: movl $-1, %edx			; X86-BMI2-NEXT: movl $-1, %edx
	; X86-BMI2-NEXT: shlxl %ecx, %edx, %eax			; X86-BMI2-NEXT: shlxl %ebx, %edx, %eax
	; X86-BMI2-NEXT: shldl %cl, %edx, %edx			; X86-BMI2-NEXT: testb $32, %bl
	; X86-BMI2-NEXT: testb $32, %cl
	; X86-BMI2-NEXT: je .LBB33_2			; X86-BMI2-NEXT: je .LBB33_2
	; X86-BMI2-NEXT: # %bb.1:			; X86-BMI2-NEXT: # %bb.1:
	; X86-BMI2-NEXT: movl %eax, %edx			; X86-BMI2-NEXT: movl %eax, %edx
	; X86-BMI2-NEXT: xorl %eax, %eax			; X86-BMI2-NEXT: xorl %eax, %eax
	; X86-BMI2-NEXT: .LBB33_2:			; X86-BMI2-NEXT: .LBB33_2:
	; X86-BMI2-NEXT: andl 4(%esi), %edx			; X86-BMI2-NEXT: andl (%ecx), %eax
	; X86-BMI2-NEXT: andl (%esi), %eax			; X86-BMI2-NEXT: andl 4(%ecx), %edx
	; X86-BMI2-NEXT: popl %esi			; X86-BMI2-NEXT: popl %ebx
	; X86-BMI2-NEXT: retl			; X86-BMI2-NEXT: retl
	;			;
	; X64-NOBMI2-LABEL: clear_lowbits64_ic2_load:			; X64-NOBMI2-LABEL: clear_lowbits64_ic2_load:
	; X64-NOBMI2: # %bb.0:			; X64-NOBMI2: # %bb.0:
	; X64-NOBMI2-NEXT: movq %rsi, %rcx			; X64-NOBMI2-NEXT: movq %rsi, %rcx
	; X64-NOBMI2-NEXT: movq (%rdi), %rax			; X64-NOBMI2-NEXT: movq (%rdi), %rax
	; X64-NOBMI2-NEXT: negb %cl			; X64-NOBMI2-NEXT: negb %cl
	; X64-NOBMI2-NEXT: shrq %cl, %rax			; X64-NOBMI2-NEXT: shrq %cl, %rax
	Show All 19 Lines
	; X86-NOBMI2: # %bb.0:			; X86-NOBMI2: # %bb.0:
	; X86-NOBMI2-NEXT: pushl %esi			; X86-NOBMI2-NEXT: pushl %esi
	; X86-NOBMI2-NEXT: movl {{[0-9]+}}(%esp), %esi			; X86-NOBMI2-NEXT: movl {{[0-9]+}}(%esp), %esi
	; X86-NOBMI2-NEXT: movb $64, %cl			; X86-NOBMI2-NEXT: movb $64, %cl
	; X86-NOBMI2-NEXT: subb {{[0-9]+}}(%esp), %cl			; X86-NOBMI2-NEXT: subb {{[0-9]+}}(%esp), %cl
	; X86-NOBMI2-NEXT: movl $-1, %edx			; X86-NOBMI2-NEXT: movl $-1, %edx
	; X86-NOBMI2-NEXT: movl $-1, %eax			; X86-NOBMI2-NEXT: movl $-1, %eax
	; X86-NOBMI2-NEXT: shll %cl, %eax			; X86-NOBMI2-NEXT: shll %cl, %eax
	; X86-NOBMI2-NEXT: shldl %cl, %edx, %edx
	; X86-NOBMI2-NEXT: testb $32, %cl			; X86-NOBMI2-NEXT: testb $32, %cl
	; X86-NOBMI2-NEXT: je .LBB34_2			; X86-NOBMI2-NEXT: je .LBB34_2
	; X86-NOBMI2-NEXT: # %bb.1:			; X86-NOBMI2-NEXT: # %bb.1:
	; X86-NOBMI2-NEXT: movl %eax, %edx			; X86-NOBMI2-NEXT: movl %eax, %edx
	; X86-NOBMI2-NEXT: xorl %eax, %eax			; X86-NOBMI2-NEXT: xorl %eax, %eax
	; X86-NOBMI2-NEXT: .LBB34_2:			; X86-NOBMI2-NEXT: .LBB34_2:
	; X86-NOBMI2-NEXT: andl 4(%esi), %edx
	; X86-NOBMI2-NEXT: andl (%esi), %eax			; X86-NOBMI2-NEXT: andl (%esi), %eax
				; X86-NOBMI2-NEXT: andl 4(%esi), %edx
	; X86-NOBMI2-NEXT: popl %esi			; X86-NOBMI2-NEXT: popl %esi
	; X86-NOBMI2-NEXT: retl			; X86-NOBMI2-NEXT: retl
	;			;
	; X86-BMI2-LABEL: clear_lowbits64_ic3_load_indexzext:			; X86-BMI2-LABEL: clear_lowbits64_ic3_load_indexzext:
	; X86-BMI2: # %bb.0:			; X86-BMI2: # %bb.0:
	; X86-BMI2-NEXT: pushl %esi			; X86-BMI2-NEXT: pushl %ebx
	; X86-BMI2-NEXT: movl {{[0-9]+}}(%esp), %esi			; X86-BMI2-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X86-BMI2-NEXT: movb $64, %cl			; X86-BMI2-NEXT: movb $64, %bl
	; X86-BMI2-NEXT: subb {{[0-9]+}}(%esp), %cl			; X86-BMI2-NEXT: subb {{[0-9]+}}(%esp), %bl
	; X86-BMI2-NEXT: movl $-1, %edx			; X86-BMI2-NEXT: movl $-1, %edx
	; X86-BMI2-NEXT: shlxl %ecx, %edx, %eax			; X86-BMI2-NEXT: shlxl %ebx, %edx, %eax
	; X86-BMI2-NEXT: shldl %cl, %edx, %edx			; X86-BMI2-NEXT: testb $32, %bl
	; X86-BMI2-NEXT: testb $32, %cl
	; X86-BMI2-NEXT: je .LBB34_2			; X86-BMI2-NEXT: je .LBB34_2
	; X86-BMI2-NEXT: # %bb.1:			; X86-BMI2-NEXT: # %bb.1:
	; X86-BMI2-NEXT: movl %eax, %edx			; X86-BMI2-NEXT: movl %eax, %edx
	; X86-BMI2-NEXT: xorl %eax, %eax			; X86-BMI2-NEXT: xorl %eax, %eax
	; X86-BMI2-NEXT: .LBB34_2:			; X86-BMI2-NEXT: .LBB34_2:
	; X86-BMI2-NEXT: andl 4(%esi), %edx			; X86-BMI2-NEXT: andl (%ecx), %eax
	; X86-BMI2-NEXT: andl (%esi), %eax			; X86-BMI2-NEXT: andl 4(%ecx), %edx
	; X86-BMI2-NEXT: popl %esi			; X86-BMI2-NEXT: popl %ebx
	; X86-BMI2-NEXT: retl			; X86-BMI2-NEXT: retl
	;			;
	; X64-NOBMI2-LABEL: clear_lowbits64_ic3_load_indexzext:			; X64-NOBMI2-LABEL: clear_lowbits64_ic3_load_indexzext:
	; X64-NOBMI2: # %bb.0:			; X64-NOBMI2: # %bb.0:
	; X64-NOBMI2-NEXT: movl %esi, %ecx			; X64-NOBMI2-NEXT: movl %esi, %ecx
	; X64-NOBMI2-NEXT: movq (%rdi), %rax			; X64-NOBMI2-NEXT: movq (%rdi), %rax
	; X64-NOBMI2-NEXT: negb %cl			; X64-NOBMI2-NEXT: negb %cl
	; X64-NOBMI2-NEXT: shrq %cl, %rax			; X64-NOBMI2-NEXT: shrq %cl, %rax
	Show All 19 Lines
	define i64 @clear_lowbits64_ic4_commutative(i64 %val, i64 %numlowbits) nounwind {			define i64 @clear_lowbits64_ic4_commutative(i64 %val, i64 %numlowbits) nounwind {
	; X86-NOBMI2-LABEL: clear_lowbits64_ic4_commutative:			; X86-NOBMI2-LABEL: clear_lowbits64_ic4_commutative:
	; X86-NOBMI2: # %bb.0:			; X86-NOBMI2: # %bb.0:
	; X86-NOBMI2-NEXT: movb $64, %cl			; X86-NOBMI2-NEXT: movb $64, %cl
	; X86-NOBMI2-NEXT: subb {{[0-9]+}}(%esp), %cl			; X86-NOBMI2-NEXT: subb {{[0-9]+}}(%esp), %cl
	; X86-NOBMI2-NEXT: movl $-1, %edx			; X86-NOBMI2-NEXT: movl $-1, %edx
	; X86-NOBMI2-NEXT: movl $-1, %eax			; X86-NOBMI2-NEXT: movl $-1, %eax
	; X86-NOBMI2-NEXT: shll %cl, %eax			; X86-NOBMI2-NEXT: shll %cl, %eax
	; X86-NOBMI2-NEXT: shldl %cl, %edx, %edx
	; X86-NOBMI2-NEXT: testb $32, %cl			; X86-NOBMI2-NEXT: testb $32, %cl
	; X86-NOBMI2-NEXT: je .LBB35_2			; X86-NOBMI2-NEXT: je .LBB35_2
	; X86-NOBMI2-NEXT: # %bb.1:			; X86-NOBMI2-NEXT: # %bb.1:
	; X86-NOBMI2-NEXT: movl %eax, %edx			; X86-NOBMI2-NEXT: movl %eax, %edx
	; X86-NOBMI2-NEXT: xorl %eax, %eax			; X86-NOBMI2-NEXT: xorl %eax, %eax
	; X86-NOBMI2-NEXT: .LBB35_2:			; X86-NOBMI2-NEXT: .LBB35_2:
	; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %eax			; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %eax
				; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-NOBMI2-NEXT: retl			; X86-NOBMI2-NEXT: retl
	;			;
	; X86-BMI2-LABEL: clear_lowbits64_ic4_commutative:			; X86-BMI2-LABEL: clear_lowbits64_ic4_commutative:
	; X86-BMI2: # %bb.0:			; X86-BMI2: # %bb.0:
	; X86-BMI2-NEXT: movb $64, %cl			; X86-BMI2-NEXT: movb $64, %cl
	; X86-BMI2-NEXT: subb {{[0-9]+}}(%esp), %cl			; X86-BMI2-NEXT: subb {{[0-9]+}}(%esp), %cl
	; X86-BMI2-NEXT: movl $-1, %edx			; X86-BMI2-NEXT: movl $-1, %edx
	; X86-BMI2-NEXT: shlxl %ecx, %edx, %eax			; X86-BMI2-NEXT: shlxl %ecx, %edx, %eax
	; X86-BMI2-NEXT: shldl %cl, %edx, %edx
	; X86-BMI2-NEXT: testb $32, %cl			; X86-BMI2-NEXT: testb $32, %cl
	; X86-BMI2-NEXT: je .LBB35_2			; X86-BMI2-NEXT: je .LBB35_2
	; X86-BMI2-NEXT: # %bb.1:			; X86-BMI2-NEXT: # %bb.1:
	; X86-BMI2-NEXT: movl %eax, %edx			; X86-BMI2-NEXT: movl %eax, %edx
	; X86-BMI2-NEXT: xorl %eax, %eax			; X86-BMI2-NEXT: xorl %eax, %eax
	; X86-BMI2-NEXT: .LBB35_2:			; X86-BMI2-NEXT: .LBB35_2:
	; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %eax			; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %eax
				; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %edx
	; X86-BMI2-NEXT: retl			; X86-BMI2-NEXT: retl
	;			;
	; X64-NOBMI2-LABEL: clear_lowbits64_ic4_commutative:			; X64-NOBMI2-LABEL: clear_lowbits64_ic4_commutative:
	; X64-NOBMI2: # %bb.0:			; X64-NOBMI2: # %bb.0:
	; X64-NOBMI2-NEXT: movq %rsi, %rcx			; X64-NOBMI2-NEXT: movq %rsi, %rcx
	; X64-NOBMI2-NEXT: movq %rdi, %rax			; X64-NOBMI2-NEXT: movq %rdi, %rax
	; X64-NOBMI2-NEXT: negb %cl			; X64-NOBMI2-NEXT: negb %cl
	; X64-NOBMI2-NEXT: shrq %cl, %rax			; X64-NOBMI2-NEXT: shrq %cl, %rax
	▲ Show 20 Lines • Show All 95 Lines • ▼ Show 20 Lines
	define i64 @oneuse64(i64 %val, i64 %numlowbits) nounwind {			define i64 @oneuse64(i64 %val, i64 %numlowbits) nounwind {
	; X86-NOBMI2-LABEL: oneuse64:			; X86-NOBMI2-LABEL: oneuse64:
	; X86-NOBMI2: # %bb.0:			; X86-NOBMI2: # %bb.0:
	; X86-NOBMI2-NEXT: pushl %edi			; X86-NOBMI2-NEXT: pushl %edi
	; X86-NOBMI2-NEXT: pushl %esi			; X86-NOBMI2-NEXT: pushl %esi
	; X86-NOBMI2-NEXT: pushl %eax			; X86-NOBMI2-NEXT: pushl %eax
	; X86-NOBMI2-NEXT: movb {{[0-9]+}}(%esp), %cl			; X86-NOBMI2-NEXT: movb {{[0-9]+}}(%esp), %cl
	; X86-NOBMI2-NEXT: movl $-1, %esi			; X86-NOBMI2-NEXT: movl $-1, %esi
	; X86-NOBMI2-NEXT: movl $-1, %edi			; X86-NOBMI2-NEXT: movl $-1, %eax
	; X86-NOBMI2-NEXT: shll %cl, %edi			; X86-NOBMI2-NEXT: shll %cl, %eax
	; X86-NOBMI2-NEXT: shldl %cl, %esi, %esi
	; X86-NOBMI2-NEXT: testb $32, %cl
	; X86-NOBMI2-NEXT: je .LBB37_2
	; X86-NOBMI2-NEXT: # %bb.1:
	; X86-NOBMI2-NEXT: movl %edi, %esi
	; X86-NOBMI2-NEXT: xorl %edi, %edi			; X86-NOBMI2-NEXT: xorl %edi, %edi
	; X86-NOBMI2-NEXT: .LBB37_2:			; X86-NOBMI2-NEXT: testb $32, %cl
				; X86-NOBMI2-NEXT: jne .LBB37_1
				; X86-NOBMI2-NEXT: # %bb.2:
				; X86-NOBMI2-NEXT: movl %eax, %edi
				; X86-NOBMI2-NEXT: jmp .LBB37_3
				; X86-NOBMI2-NEXT: .LBB37_1:
				; X86-NOBMI2-NEXT: movl %eax, %esi
				; X86-NOBMI2-NEXT: .LBB37_3:
	; X86-NOBMI2-NEXT: subl $8, %esp			; X86-NOBMI2-NEXT: subl $8, %esp
	; X86-NOBMI2-NEXT: pushl %esi			; X86-NOBMI2-NEXT: pushl %esi
	; X86-NOBMI2-NEXT: pushl %edi			; X86-NOBMI2-NEXT: pushl %edi
	; X86-NOBMI2-NEXT: calll use64			; X86-NOBMI2-NEXT: calll use64
	; X86-NOBMI2-NEXT: addl $16, %esp			; X86-NOBMI2-NEXT: addl $16, %esp
	; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %esi
	; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %edi			; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %edi
				; X86-NOBMI2-NEXT: andl {{[0-9]+}}(%esp), %esi
	; X86-NOBMI2-NEXT: movl %edi, %eax			; X86-NOBMI2-NEXT: movl %edi, %eax
	; X86-NOBMI2-NEXT: movl %esi, %edx			; X86-NOBMI2-NEXT: movl %esi, %edx
	; X86-NOBMI2-NEXT: addl $4, %esp			; X86-NOBMI2-NEXT: addl $4, %esp
	; X86-NOBMI2-NEXT: popl %esi			; X86-NOBMI2-NEXT: popl %esi
	; X86-NOBMI2-NEXT: popl %edi			; X86-NOBMI2-NEXT: popl %edi
	; X86-NOBMI2-NEXT: retl			; X86-NOBMI2-NEXT: retl
	;			;
	; X86-BMI2-LABEL: oneuse64:			; X86-BMI2-LABEL: oneuse64:
	; X86-BMI2: # %bb.0:			; X86-BMI2: # %bb.0:
	; X86-BMI2-NEXT: pushl %edi			; X86-BMI2-NEXT: pushl %edi
	; X86-BMI2-NEXT: pushl %esi			; X86-BMI2-NEXT: pushl %esi
	; X86-BMI2-NEXT: pushl %eax			; X86-BMI2-NEXT: pushl %eax
	; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl			; X86-BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl
	; X86-BMI2-NEXT: movl $-1, %esi			; X86-BMI2-NEXT: movl $-1, %esi
	; X86-BMI2-NEXT: shlxl %ecx, %esi, %edi			; X86-BMI2-NEXT: shlxl %ecx, %esi, %eax
	; X86-BMI2-NEXT: shldl %cl, %esi, %esi
	; X86-BMI2-NEXT: testb $32, %cl
	; X86-BMI2-NEXT: je .LBB37_2
	; X86-BMI2-NEXT: # %bb.1:
	; X86-BMI2-NEXT: movl %edi, %esi
	; X86-BMI2-NEXT: xorl %edi, %edi			; X86-BMI2-NEXT: xorl %edi, %edi
	; X86-BMI2-NEXT: .LBB37_2:			; X86-BMI2-NEXT: testb $32, %cl
				; X86-BMI2-NEXT: jne .LBB37_1
				; X86-BMI2-NEXT: # %bb.2:
				; X86-BMI2-NEXT: movl %eax, %edi
				; X86-BMI2-NEXT: jmp .LBB37_3
				; X86-BMI2-NEXT: .LBB37_1:
				; X86-BMI2-NEXT: movl %eax, %esi
				; X86-BMI2-NEXT: .LBB37_3:
	; X86-BMI2-NEXT: subl $8, %esp			; X86-BMI2-NEXT: subl $8, %esp
	; X86-BMI2-NEXT: pushl %esi			; X86-BMI2-NEXT: pushl %esi
	; X86-BMI2-NEXT: pushl %edi			; X86-BMI2-NEXT: pushl %edi
	; X86-BMI2-NEXT: calll use64			; X86-BMI2-NEXT: calll use64
	; X86-BMI2-NEXT: addl $16, %esp			; X86-BMI2-NEXT: addl $16, %esp
	; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %esi
	; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %edi			; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %edi
				; X86-BMI2-NEXT: andl {{[0-9]+}}(%esp), %esi
	; X86-BMI2-NEXT: movl %edi, %eax			; X86-BMI2-NEXT: movl %edi, %eax
	; X86-BMI2-NEXT: movl %esi, %edx			; X86-BMI2-NEXT: movl %esi, %edx
	; X86-BMI2-NEXT: addl $4, %esp			; X86-BMI2-NEXT: addl $4, %esp
	; X86-BMI2-NEXT: popl %esi			; X86-BMI2-NEXT: popl %esi
	; X86-BMI2-NEXT: popl %edi			; X86-BMI2-NEXT: popl %edi
	; X86-BMI2-NEXT: retl			; X86-BMI2-NEXT: retl
	;			;
	; X64-NOBMI2-LABEL: oneuse64:			; X64-NOBMI2-LABEL: oneuse64:
	Show All 39 Lines

llvm/test/CodeGen/X86/extract-bits.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 2,655 Lines • ▼ Show 20 Lines	; X64-BMI1BMI2-NEXT: retq
ret i32 %masked		ret i32 %masked
}		}

; 64-bit		; 64-bit

define i64 @bextr64_b0(i64 %val, i64 %numskipbits, i64 %numlowbits) nounwind {		define i64 @bextr64_b0(i64 %val, i64 %numskipbits, i64 %numlowbits) nounwind {
; X86-NOBMI-LABEL: bextr64_b0:		; X86-NOBMI-LABEL: bextr64_b0:
; X86-NOBMI: # %bb.0:		; X86-NOBMI: # %bb.0:
		; X86-NOBMI-NEXT: pushl %ebx
; X86-NOBMI-NEXT: pushl %edi		; X86-NOBMI-NEXT: pushl %edi
; X86-NOBMI-NEXT: pushl %esi		; X86-NOBMI-NEXT: pushl %esi
; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %ch		; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %ch
; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %esi		; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %esi
; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %eax		; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %eax
; X86-NOBMI-NEXT: movl %eax, %edi		; X86-NOBMI-NEXT: movl %eax, %edi
; X86-NOBMI-NEXT: shrl %cl, %edi		; X86-NOBMI-NEXT: shrl %cl, %edi
; X86-NOBMI-NEXT: shrdl %cl, %eax, %esi		; X86-NOBMI-NEXT: shrdl %cl, %eax, %esi
		; X86-NOBMI-NEXT: xorl %eax, %eax
; X86-NOBMI-NEXT: testb $32, %cl		; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: je .LBB25_2		; X86-NOBMI-NEXT: je .LBB25_2
; X86-NOBMI-NEXT: # %bb.1:		; X86-NOBMI-NEXT: # %bb.1:
; X86-NOBMI-NEXT: movl %edi, %esi		; X86-NOBMI-NEXT: movl %edi, %esi
; X86-NOBMI-NEXT: xorl %edi, %edi		; X86-NOBMI-NEXT: xorl %edi, %edi
; X86-NOBMI-NEXT: .LBB25_2:		; X86-NOBMI-NEXT: .LBB25_2:
; X86-NOBMI-NEXT: movl $-1, %edx		; X86-NOBMI-NEXT: movl $-1, %edx
; X86-NOBMI-NEXT: movl $-1, %eax		; X86-NOBMI-NEXT: movl $-1, %ebx
; X86-NOBMI-NEXT: movb %ch, %cl		; X86-NOBMI-NEXT: movb %ch, %cl
; X86-NOBMI-NEXT: shll %cl, %eax		; X86-NOBMI-NEXT: shll %cl, %ebx
; X86-NOBMI-NEXT: shldl %cl, %edx, %edx
; X86-NOBMI-NEXT: testb $32, %ch		; X86-NOBMI-NEXT: testb $32, %ch
; X86-NOBMI-NEXT: je .LBB25_4		; X86-NOBMI-NEXT: jne .LBB25_3
; X86-NOBMI-NEXT: # %bb.3:		; X86-NOBMI-NEXT: # %bb.4:
; X86-NOBMI-NEXT: movl %eax, %edx		; X86-NOBMI-NEXT: movl %ebx, %eax
; X86-NOBMI-NEXT: xorl %eax, %eax		; X86-NOBMI-NEXT: jmp .LBB25_5
; X86-NOBMI-NEXT: .LBB25_4:		; X86-NOBMI-NEXT: .LBB25_3:
		; X86-NOBMI-NEXT: movl %ebx, %edx
		; X86-NOBMI-NEXT: .LBB25_5:
; X86-NOBMI-NEXT: notl %edx		; X86-NOBMI-NEXT: notl %edx
; X86-NOBMI-NEXT: andl %edi, %edx		; X86-NOBMI-NEXT: andl %edi, %edx
; X86-NOBMI-NEXT: notl %eax		; X86-NOBMI-NEXT: notl %eax
; X86-NOBMI-NEXT: andl %esi, %eax		; X86-NOBMI-NEXT: andl %esi, %eax
; X86-NOBMI-NEXT: popl %esi		; X86-NOBMI-NEXT: popl %esi
; X86-NOBMI-NEXT: popl %edi		; X86-NOBMI-NEXT: popl %edi
		; X86-NOBMI-NEXT: popl %ebx
; X86-NOBMI-NEXT: retl		; X86-NOBMI-NEXT: retl
;		;
; X86-BMI1NOTBM-LABEL: bextr64_b0:		; X86-BMI1NOTBM-LABEL: bextr64_b0:
; X86-BMI1NOTBM: # %bb.0:		; X86-BMI1NOTBM: # %bb.0:
; X86-BMI1NOTBM-NEXT: pushl %ebx		; X86-BMI1NOTBM-NEXT: pushl %ebx
; X86-BMI1NOTBM-NEXT: pushl %edi		; X86-BMI1NOTBM-NEXT: pushl %edi
; X86-BMI1NOTBM-NEXT: pushl %esi		; X86-BMI1NOTBM-NEXT: pushl %esi
; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %al		; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %al
; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %esi		; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %esi
; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %edi		; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %edi
; X86-BMI1NOTBM-NEXT: movl %edi, %edx		; X86-BMI1NOTBM-NEXT: movl %edi, %edx
; X86-BMI1NOTBM-NEXT: shrl %cl, %edx		; X86-BMI1NOTBM-NEXT: shrl %cl, %edx
; X86-BMI1NOTBM-NEXT: shrdl %cl, %edi, %esi		; X86-BMI1NOTBM-NEXT: shrdl %cl, %edi, %esi
; X86-BMI1NOTBM-NEXT: testb $32, %cl		; X86-BMI1NOTBM-NEXT: testb $32, %cl
; X86-BMI1NOTBM-NEXT: je .LBB25_2		; X86-BMI1NOTBM-NEXT: je .LBB25_2
; X86-BMI1NOTBM-NEXT: # %bb.1:		; X86-BMI1NOTBM-NEXT: # %bb.1:
; X86-BMI1NOTBM-NEXT: movl %edx, %esi		; X86-BMI1NOTBM-NEXT: movl %edx, %esi
; X86-BMI1NOTBM-NEXT: xorl %edx, %edx		; X86-BMI1NOTBM-NEXT: xorl %edx, %edx
; X86-BMI1NOTBM-NEXT: .LBB25_2:		; X86-BMI1NOTBM-NEXT: .LBB25_2:
; X86-BMI1NOTBM-NEXT: movl $-1, %edi		; X86-BMI1NOTBM-NEXT: movl $-1, %edi
; X86-BMI1NOTBM-NEXT: movl $-1, %ebx		; X86-BMI1NOTBM-NEXT: movl $-1, %ebx
; X86-BMI1NOTBM-NEXT: movl %eax, %ecx		; X86-BMI1NOTBM-NEXT: movl %eax, %ecx
; X86-BMI1NOTBM-NEXT: shll %cl, %ebx		; X86-BMI1NOTBM-NEXT: shll %cl, %ebx
; X86-BMI1NOTBM-NEXT: shldl %cl, %edi, %edi
; X86-BMI1NOTBM-NEXT: testb $32, %al		; X86-BMI1NOTBM-NEXT: testb $32, %al
; X86-BMI1NOTBM-NEXT: je .LBB25_4		; X86-BMI1NOTBM-NEXT: je .LBB25_4
; X86-BMI1NOTBM-NEXT: # %bb.3:		; X86-BMI1NOTBM-NEXT: # %bb.3:
; X86-BMI1NOTBM-NEXT: movl %ebx, %edi		; X86-BMI1NOTBM-NEXT: movl %ebx, %edi
; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx		; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx
; X86-BMI1NOTBM-NEXT: .LBB25_4:		; X86-BMI1NOTBM-NEXT: .LBB25_4:
; X86-BMI1NOTBM-NEXT: andnl %edx, %edi, %edx		; X86-BMI1NOTBM-NEXT: andnl %edx, %edi, %edx
; X86-BMI1NOTBM-NEXT: andnl %esi, %ebx, %eax		; X86-BMI1NOTBM-NEXT: andnl %esi, %ebx, %eax
; X86-BMI1NOTBM-NEXT: popl %esi		; X86-BMI1NOTBM-NEXT: popl %esi
; X86-BMI1NOTBM-NEXT: popl %edi		; X86-BMI1NOTBM-NEXT: popl %edi
; X86-BMI1NOTBM-NEXT: popl %ebx		; X86-BMI1NOTBM-NEXT: popl %ebx
; X86-BMI1NOTBM-NEXT: retl		; X86-BMI1NOTBM-NEXT: retl
;		;
; X86-BMI1BMI2-LABEL: bextr64_b0:		; X86-BMI1BMI2-LABEL: bextr64_b0:
; X86-BMI1BMI2: # %bb.0:		; X86-BMI1BMI2: # %bb.0:
; X86-BMI1BMI2-NEXT: pushl %ebx		; X86-BMI1BMI2-NEXT: pushl %ebx
; X86-BMI1BMI2-NEXT: pushl %edi
; X86-BMI1BMI2-NEXT: pushl %esi		; X86-BMI1BMI2-NEXT: pushl %esi
; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %al		; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %bl
; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %esi		; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %eax
; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %edx		; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %edx
; X86-BMI1BMI2-NEXT: shrdl %cl, %edx, %esi		; X86-BMI1BMI2-NEXT: shrdl %cl, %edx, %eax
; X86-BMI1BMI2-NEXT: shrxl %ecx, %edx, %edx		; X86-BMI1BMI2-NEXT: shrxl %ecx, %edx, %edx
; X86-BMI1BMI2-NEXT: testb $32, %cl		; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB25_2		; X86-BMI1BMI2-NEXT: je .LBB25_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: movl %edx, %esi		; X86-BMI1BMI2-NEXT: movl %edx, %eax
; X86-BMI1BMI2-NEXT: xorl %edx, %edx		; X86-BMI1BMI2-NEXT: xorl %edx, %edx
; X86-BMI1BMI2-NEXT: .LBB25_2:		; X86-BMI1BMI2-NEXT: .LBB25_2:
; X86-BMI1BMI2-NEXT: movl $-1, %edi		; X86-BMI1BMI2-NEXT: movl $-1, %esi
; X86-BMI1BMI2-NEXT: shlxl %eax, %edi, %ebx		; X86-BMI1BMI2-NEXT: shlxl %ebx, %esi, %ecx
; X86-BMI1BMI2-NEXT: movl %eax, %ecx		; X86-BMI1BMI2-NEXT: testb $32, %bl
; X86-BMI1BMI2-NEXT: shldl %cl, %edi, %edi
; X86-BMI1BMI2-NEXT: testb $32, %al
; X86-BMI1BMI2-NEXT: je .LBB25_4		; X86-BMI1BMI2-NEXT: je .LBB25_4
; X86-BMI1BMI2-NEXT: # %bb.3:		; X86-BMI1BMI2-NEXT: # %bb.3:
; X86-BMI1BMI2-NEXT: movl %ebx, %edi		; X86-BMI1BMI2-NEXT: movl %ecx, %esi
; X86-BMI1BMI2-NEXT: xorl %ebx, %ebx		; X86-BMI1BMI2-NEXT: xorl %ecx, %ecx
; X86-BMI1BMI2-NEXT: .LBB25_4:		; X86-BMI1BMI2-NEXT: .LBB25_4:
; X86-BMI1BMI2-NEXT: andnl %edx, %edi, %edx		; X86-BMI1BMI2-NEXT: andnl %edx, %esi, %edx
; X86-BMI1BMI2-NEXT: andnl %esi, %ebx, %eax		; X86-BMI1BMI2-NEXT: andnl %eax, %ecx, %eax
; X86-BMI1BMI2-NEXT: popl %esi		; X86-BMI1BMI2-NEXT: popl %esi
; X86-BMI1BMI2-NEXT: popl %edi
; X86-BMI1BMI2-NEXT: popl %ebx		; X86-BMI1BMI2-NEXT: popl %ebx
; X86-BMI1BMI2-NEXT: retl		; X86-BMI1BMI2-NEXT: retl
;		;
; X64-NOBMI-LABEL: bextr64_b0:		; X64-NOBMI-LABEL: bextr64_b0:
; X64-NOBMI: # %bb.0:		; X64-NOBMI: # %bb.0:
; X64-NOBMI-NEXT: movq %rsi, %rcx		; X64-NOBMI-NEXT: movq %rsi, %rcx
; X64-NOBMI-NEXT: # kill: def $cl killed $cl killed $rcx		; X64-NOBMI-NEXT: # kill: def $cl killed $cl killed $rcx
; X64-NOBMI-NEXT: shrq %cl, %rdi		; X64-NOBMI-NEXT: shrq %cl, %rdi
Show All 22 Lines	; X64-BMI1BMI2-NEXT: retq
%mask = xor i64 %notmask, -1		%mask = xor i64 %notmask, -1
%masked = and i64 %mask, %shifted		%masked = and i64 %mask, %shifted
ret i64 %masked		ret i64 %masked
}		}

define i64 @bextr64_b1_indexzext(i64 %val, i8 zeroext %numskipbits, i8 zeroext %numlowbits) nounwind {		define i64 @bextr64_b1_indexzext(i64 %val, i8 zeroext %numskipbits, i8 zeroext %numlowbits) nounwind {
; X86-NOBMI-LABEL: bextr64_b1_indexzext:		; X86-NOBMI-LABEL: bextr64_b1_indexzext:
; X86-NOBMI: # %bb.0:		; X86-NOBMI: # %bb.0:
		; X86-NOBMI-NEXT: pushl %ebx
; X86-NOBMI-NEXT: pushl %edi		; X86-NOBMI-NEXT: pushl %edi
; X86-NOBMI-NEXT: pushl %esi		; X86-NOBMI-NEXT: pushl %esi
; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %ch		; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %ch
; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %esi		; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %esi
; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %eax		; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %eax
; X86-NOBMI-NEXT: movl %eax, %edi		; X86-NOBMI-NEXT: movl %eax, %edi
; X86-NOBMI-NEXT: shrl %cl, %edi		; X86-NOBMI-NEXT: shrl %cl, %edi
; X86-NOBMI-NEXT: shrdl %cl, %eax, %esi		; X86-NOBMI-NEXT: shrdl %cl, %eax, %esi
		; X86-NOBMI-NEXT: xorl %eax, %eax
; X86-NOBMI-NEXT: testb $32, %cl		; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: je .LBB26_2		; X86-NOBMI-NEXT: je .LBB26_2
; X86-NOBMI-NEXT: # %bb.1:		; X86-NOBMI-NEXT: # %bb.1:
; X86-NOBMI-NEXT: movl %edi, %esi		; X86-NOBMI-NEXT: movl %edi, %esi
; X86-NOBMI-NEXT: xorl %edi, %edi		; X86-NOBMI-NEXT: xorl %edi, %edi
; X86-NOBMI-NEXT: .LBB26_2:		; X86-NOBMI-NEXT: .LBB26_2:
; X86-NOBMI-NEXT: movl $-1, %edx		; X86-NOBMI-NEXT: movl $-1, %edx
; X86-NOBMI-NEXT: movl $-1, %eax		; X86-NOBMI-NEXT: movl $-1, %ebx
; X86-NOBMI-NEXT: movb %ch, %cl		; X86-NOBMI-NEXT: movb %ch, %cl
; X86-NOBMI-NEXT: shll %cl, %eax		; X86-NOBMI-NEXT: shll %cl, %ebx
; X86-NOBMI-NEXT: shldl %cl, %edx, %edx
; X86-NOBMI-NEXT: testb $32, %ch		; X86-NOBMI-NEXT: testb $32, %ch
; X86-NOBMI-NEXT: je .LBB26_4		; X86-NOBMI-NEXT: jne .LBB26_3
; X86-NOBMI-NEXT: # %bb.3:		; X86-NOBMI-NEXT: # %bb.4:
; X86-NOBMI-NEXT: movl %eax, %edx		; X86-NOBMI-NEXT: movl %ebx, %eax
; X86-NOBMI-NEXT: xorl %eax, %eax		; X86-NOBMI-NEXT: jmp .LBB26_5
; X86-NOBMI-NEXT: .LBB26_4:		; X86-NOBMI-NEXT: .LBB26_3:
		; X86-NOBMI-NEXT: movl %ebx, %edx
		; X86-NOBMI-NEXT: .LBB26_5:
; X86-NOBMI-NEXT: notl %edx		; X86-NOBMI-NEXT: notl %edx
; X86-NOBMI-NEXT: andl %edi, %edx		; X86-NOBMI-NEXT: andl %edi, %edx
; X86-NOBMI-NEXT: notl %eax		; X86-NOBMI-NEXT: notl %eax
; X86-NOBMI-NEXT: andl %esi, %eax		; X86-NOBMI-NEXT: andl %esi, %eax
; X86-NOBMI-NEXT: popl %esi		; X86-NOBMI-NEXT: popl %esi
; X86-NOBMI-NEXT: popl %edi		; X86-NOBMI-NEXT: popl %edi
		; X86-NOBMI-NEXT: popl %ebx
; X86-NOBMI-NEXT: retl		; X86-NOBMI-NEXT: retl
;		;
; X86-BMI1NOTBM-LABEL: bextr64_b1_indexzext:		; X86-BMI1NOTBM-LABEL: bextr64_b1_indexzext:
; X86-BMI1NOTBM: # %bb.0:		; X86-BMI1NOTBM: # %bb.0:
; X86-BMI1NOTBM-NEXT: pushl %ebx		; X86-BMI1NOTBM-NEXT: pushl %ebx
; X86-BMI1NOTBM-NEXT: pushl %edi		; X86-BMI1NOTBM-NEXT: pushl %edi
; X86-BMI1NOTBM-NEXT: pushl %esi		; X86-BMI1NOTBM-NEXT: pushl %esi
; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %al		; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %al
; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %esi		; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %esi
; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %edi		; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %edi
; X86-BMI1NOTBM-NEXT: movl %edi, %edx		; X86-BMI1NOTBM-NEXT: movl %edi, %edx
; X86-BMI1NOTBM-NEXT: shrl %cl, %edx		; X86-BMI1NOTBM-NEXT: shrl %cl, %edx
; X86-BMI1NOTBM-NEXT: shrdl %cl, %edi, %esi		; X86-BMI1NOTBM-NEXT: shrdl %cl, %edi, %esi
; X86-BMI1NOTBM-NEXT: testb $32, %cl		; X86-BMI1NOTBM-NEXT: testb $32, %cl
; X86-BMI1NOTBM-NEXT: je .LBB26_2		; X86-BMI1NOTBM-NEXT: je .LBB26_2
; X86-BMI1NOTBM-NEXT: # %bb.1:		; X86-BMI1NOTBM-NEXT: # %bb.1:
; X86-BMI1NOTBM-NEXT: movl %edx, %esi		; X86-BMI1NOTBM-NEXT: movl %edx, %esi
; X86-BMI1NOTBM-NEXT: xorl %edx, %edx		; X86-BMI1NOTBM-NEXT: xorl %edx, %edx
; X86-BMI1NOTBM-NEXT: .LBB26_2:		; X86-BMI1NOTBM-NEXT: .LBB26_2:
; X86-BMI1NOTBM-NEXT: movl $-1, %edi		; X86-BMI1NOTBM-NEXT: movl $-1, %edi
; X86-BMI1NOTBM-NEXT: movl $-1, %ebx		; X86-BMI1NOTBM-NEXT: movl $-1, %ebx
; X86-BMI1NOTBM-NEXT: movl %eax, %ecx		; X86-BMI1NOTBM-NEXT: movl %eax, %ecx
; X86-BMI1NOTBM-NEXT: shll %cl, %ebx		; X86-BMI1NOTBM-NEXT: shll %cl, %ebx
; X86-BMI1NOTBM-NEXT: shldl %cl, %edi, %edi
; X86-BMI1NOTBM-NEXT: testb $32, %al		; X86-BMI1NOTBM-NEXT: testb $32, %al
; X86-BMI1NOTBM-NEXT: je .LBB26_4		; X86-BMI1NOTBM-NEXT: je .LBB26_4
; X86-BMI1NOTBM-NEXT: # %bb.3:		; X86-BMI1NOTBM-NEXT: # %bb.3:
; X86-BMI1NOTBM-NEXT: movl %ebx, %edi		; X86-BMI1NOTBM-NEXT: movl %ebx, %edi
; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx		; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx
; X86-BMI1NOTBM-NEXT: .LBB26_4:		; X86-BMI1NOTBM-NEXT: .LBB26_4:
; X86-BMI1NOTBM-NEXT: andnl %edx, %edi, %edx		; X86-BMI1NOTBM-NEXT: andnl %edx, %edi, %edx
; X86-BMI1NOTBM-NEXT: andnl %esi, %ebx, %eax		; X86-BMI1NOTBM-NEXT: andnl %esi, %ebx, %eax
; X86-BMI1NOTBM-NEXT: popl %esi		; X86-BMI1NOTBM-NEXT: popl %esi
; X86-BMI1NOTBM-NEXT: popl %edi		; X86-BMI1NOTBM-NEXT: popl %edi
; X86-BMI1NOTBM-NEXT: popl %ebx		; X86-BMI1NOTBM-NEXT: popl %ebx
; X86-BMI1NOTBM-NEXT: retl		; X86-BMI1NOTBM-NEXT: retl
;		;
; X86-BMI1BMI2-LABEL: bextr64_b1_indexzext:		; X86-BMI1BMI2-LABEL: bextr64_b1_indexzext:
; X86-BMI1BMI2: # %bb.0:		; X86-BMI1BMI2: # %bb.0:
; X86-BMI1BMI2-NEXT: pushl %ebx		; X86-BMI1BMI2-NEXT: pushl %ebx
; X86-BMI1BMI2-NEXT: pushl %edi
; X86-BMI1BMI2-NEXT: pushl %esi		; X86-BMI1BMI2-NEXT: pushl %esi
; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %al		; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %bl
; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %esi		; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %eax
; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %edx		; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %edx
; X86-BMI1BMI2-NEXT: shrdl %cl, %edx, %esi		; X86-BMI1BMI2-NEXT: shrdl %cl, %edx, %eax
; X86-BMI1BMI2-NEXT: shrxl %ecx, %edx, %edx		; X86-BMI1BMI2-NEXT: shrxl %ecx, %edx, %edx
; X86-BMI1BMI2-NEXT: testb $32, %cl		; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB26_2		; X86-BMI1BMI2-NEXT: je .LBB26_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: movl %edx, %esi		; X86-BMI1BMI2-NEXT: movl %edx, %eax
; X86-BMI1BMI2-NEXT: xorl %edx, %edx		; X86-BMI1BMI2-NEXT: xorl %edx, %edx
; X86-BMI1BMI2-NEXT: .LBB26_2:		; X86-BMI1BMI2-NEXT: .LBB26_2:
; X86-BMI1BMI2-NEXT: movl $-1, %edi		; X86-BMI1BMI2-NEXT: movl $-1, %esi
; X86-BMI1BMI2-NEXT: shlxl %eax, %edi, %ebx		; X86-BMI1BMI2-NEXT: shlxl %ebx, %esi, %ecx
; X86-BMI1BMI2-NEXT: movl %eax, %ecx		; X86-BMI1BMI2-NEXT: testb $32, %bl
; X86-BMI1BMI2-NEXT: shldl %cl, %edi, %edi
; X86-BMI1BMI2-NEXT: testb $32, %al
; X86-BMI1BMI2-NEXT: je .LBB26_4		; X86-BMI1BMI2-NEXT: je .LBB26_4
; X86-BMI1BMI2-NEXT: # %bb.3:		; X86-BMI1BMI2-NEXT: # %bb.3:
; X86-BMI1BMI2-NEXT: movl %ebx, %edi		; X86-BMI1BMI2-NEXT: movl %ecx, %esi
; X86-BMI1BMI2-NEXT: xorl %ebx, %ebx		; X86-BMI1BMI2-NEXT: xorl %ecx, %ecx
; X86-BMI1BMI2-NEXT: .LBB26_4:		; X86-BMI1BMI2-NEXT: .LBB26_4:
; X86-BMI1BMI2-NEXT: andnl %edx, %edi, %edx		; X86-BMI1BMI2-NEXT: andnl %edx, %esi, %edx
; X86-BMI1BMI2-NEXT: andnl %esi, %ebx, %eax		; X86-BMI1BMI2-NEXT: andnl %eax, %ecx, %eax
; X86-BMI1BMI2-NEXT: popl %esi		; X86-BMI1BMI2-NEXT: popl %esi
; X86-BMI1BMI2-NEXT: popl %edi
; X86-BMI1BMI2-NEXT: popl %ebx		; X86-BMI1BMI2-NEXT: popl %ebx
; X86-BMI1BMI2-NEXT: retl		; X86-BMI1BMI2-NEXT: retl
;		;
; X64-NOBMI-LABEL: bextr64_b1_indexzext:		; X64-NOBMI-LABEL: bextr64_b1_indexzext:
; X64-NOBMI: # %bb.0:		; X64-NOBMI: # %bb.0:
; X64-NOBMI-NEXT: movl %esi, %ecx		; X64-NOBMI-NEXT: movl %esi, %ecx
; X64-NOBMI-NEXT: # kill: def $cl killed $cl killed $ecx		; X64-NOBMI-NEXT: # kill: def $cl killed $cl killed $ecx
; X64-NOBMI-NEXT: shrq %cl, %rdi		; X64-NOBMI-NEXT: shrq %cl, %rdi
Show All 26 Lines	; X64-BMI1BMI2-NEXT: retq
%mask = xor i64 %notmask, -1		%mask = xor i64 %notmask, -1
%masked = and i64 %mask, %shifted		%masked = and i64 %mask, %shifted
ret i64 %masked		ret i64 %masked
}		}

define i64 @bextr64_b2_load(i64* %w, i64 %numskipbits, i64 %numlowbits) nounwind {		define i64 @bextr64_b2_load(i64* %w, i64 %numskipbits, i64 %numlowbits) nounwind {
; X86-NOBMI-LABEL: bextr64_b2_load:		; X86-NOBMI-LABEL: bextr64_b2_load:
; X86-NOBMI: # %bb.0:		; X86-NOBMI: # %bb.0:
		; X86-NOBMI-NEXT: pushl %ebx
; X86-NOBMI-NEXT: pushl %edi		; X86-NOBMI-NEXT: pushl %edi
; X86-NOBMI-NEXT: pushl %esi		; X86-NOBMI-NEXT: pushl %esi
; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %ch		; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %ch
; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %eax		; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %eax
; X86-NOBMI-NEXT: movl (%eax), %esi		; X86-NOBMI-NEXT: movl (%eax), %esi
; X86-NOBMI-NEXT: movl 4(%eax), %eax		; X86-NOBMI-NEXT: movl 4(%eax), %eax
; X86-NOBMI-NEXT: movl %eax, %edi		; X86-NOBMI-NEXT: movl %eax, %edi
; X86-NOBMI-NEXT: shrl %cl, %edi		; X86-NOBMI-NEXT: shrl %cl, %edi
; X86-NOBMI-NEXT: shrdl %cl, %eax, %esi		; X86-NOBMI-NEXT: shrdl %cl, %eax, %esi
		; X86-NOBMI-NEXT: xorl %eax, %eax
; X86-NOBMI-NEXT: testb $32, %cl		; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: je .LBB27_2		; X86-NOBMI-NEXT: je .LBB27_2
; X86-NOBMI-NEXT: # %bb.1:		; X86-NOBMI-NEXT: # %bb.1:
; X86-NOBMI-NEXT: movl %edi, %esi		; X86-NOBMI-NEXT: movl %edi, %esi
; X86-NOBMI-NEXT: xorl %edi, %edi		; X86-NOBMI-NEXT: xorl %edi, %edi
; X86-NOBMI-NEXT: .LBB27_2:		; X86-NOBMI-NEXT: .LBB27_2:
; X86-NOBMI-NEXT: movl $-1, %edx		; X86-NOBMI-NEXT: movl $-1, %edx
; X86-NOBMI-NEXT: movl $-1, %eax		; X86-NOBMI-NEXT: movl $-1, %ebx
; X86-NOBMI-NEXT: movb %ch, %cl		; X86-NOBMI-NEXT: movb %ch, %cl
; X86-NOBMI-NEXT: shll %cl, %eax		; X86-NOBMI-NEXT: shll %cl, %ebx
; X86-NOBMI-NEXT: shldl %cl, %edx, %edx
; X86-NOBMI-NEXT: testb $32, %ch		; X86-NOBMI-NEXT: testb $32, %ch
; X86-NOBMI-NEXT: je .LBB27_4		; X86-NOBMI-NEXT: jne .LBB27_3
; X86-NOBMI-NEXT: # %bb.3:		; X86-NOBMI-NEXT: # %bb.4:
; X86-NOBMI-NEXT: movl %eax, %edx		; X86-NOBMI-NEXT: movl %ebx, %eax
; X86-NOBMI-NEXT: xorl %eax, %eax		; X86-NOBMI-NEXT: jmp .LBB27_5
; X86-NOBMI-NEXT: .LBB27_4:		; X86-NOBMI-NEXT: .LBB27_3:
		; X86-NOBMI-NEXT: movl %ebx, %edx
		; X86-NOBMI-NEXT: .LBB27_5:
; X86-NOBMI-NEXT: notl %edx		; X86-NOBMI-NEXT: notl %edx
; X86-NOBMI-NEXT: andl %edi, %edx		; X86-NOBMI-NEXT: andl %edi, %edx
; X86-NOBMI-NEXT: notl %eax		; X86-NOBMI-NEXT: notl %eax
; X86-NOBMI-NEXT: andl %esi, %eax		; X86-NOBMI-NEXT: andl %esi, %eax
; X86-NOBMI-NEXT: popl %esi		; X86-NOBMI-NEXT: popl %esi
; X86-NOBMI-NEXT: popl %edi		; X86-NOBMI-NEXT: popl %edi
		; X86-NOBMI-NEXT: popl %ebx
; X86-NOBMI-NEXT: retl		; X86-NOBMI-NEXT: retl
;		;
; X86-BMI1NOTBM-LABEL: bextr64_b2_load:		; X86-BMI1NOTBM-LABEL: bextr64_b2_load:
; X86-BMI1NOTBM: # %bb.0:		; X86-BMI1NOTBM: # %bb.0:
; X86-BMI1NOTBM-NEXT: pushl %ebx		; X86-BMI1NOTBM-NEXT: pushl %ebx
; X86-BMI1NOTBM-NEXT: pushl %edi		; X86-BMI1NOTBM-NEXT: pushl %edi
; X86-BMI1NOTBM-NEXT: pushl %esi		; X86-BMI1NOTBM-NEXT: pushl %esi
; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %al		; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %al
Show All 9 Lines
; X86-BMI1NOTBM-NEXT: # %bb.1:		; X86-BMI1NOTBM-NEXT: # %bb.1:
; X86-BMI1NOTBM-NEXT: movl %edx, %esi		; X86-BMI1NOTBM-NEXT: movl %edx, %esi
; X86-BMI1NOTBM-NEXT: xorl %edx, %edx		; X86-BMI1NOTBM-NEXT: xorl %edx, %edx
; X86-BMI1NOTBM-NEXT: .LBB27_2:		; X86-BMI1NOTBM-NEXT: .LBB27_2:
; X86-BMI1NOTBM-NEXT: movl $-1, %edi		; X86-BMI1NOTBM-NEXT: movl $-1, %edi
; X86-BMI1NOTBM-NEXT: movl $-1, %ebx		; X86-BMI1NOTBM-NEXT: movl $-1, %ebx
; X86-BMI1NOTBM-NEXT: movl %eax, %ecx		; X86-BMI1NOTBM-NEXT: movl %eax, %ecx
; X86-BMI1NOTBM-NEXT: shll %cl, %ebx		; X86-BMI1NOTBM-NEXT: shll %cl, %ebx
; X86-BMI1NOTBM-NEXT: shldl %cl, %edi, %edi
; X86-BMI1NOTBM-NEXT: testb $32, %al		; X86-BMI1NOTBM-NEXT: testb $32, %al
; X86-BMI1NOTBM-NEXT: je .LBB27_4		; X86-BMI1NOTBM-NEXT: je .LBB27_4
; X86-BMI1NOTBM-NEXT: # %bb.3:		; X86-BMI1NOTBM-NEXT: # %bb.3:
; X86-BMI1NOTBM-NEXT: movl %ebx, %edi		; X86-BMI1NOTBM-NEXT: movl %ebx, %edi
; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx		; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx
; X86-BMI1NOTBM-NEXT: .LBB27_4:		; X86-BMI1NOTBM-NEXT: .LBB27_4:
; X86-BMI1NOTBM-NEXT: andnl %edx, %edi, %edx		; X86-BMI1NOTBM-NEXT: andnl %edx, %edi, %edx
; X86-BMI1NOTBM-NEXT: andnl %esi, %ebx, %eax		; X86-BMI1NOTBM-NEXT: andnl %esi, %ebx, %eax
; X86-BMI1NOTBM-NEXT: popl %esi		; X86-BMI1NOTBM-NEXT: popl %esi
; X86-BMI1NOTBM-NEXT: popl %edi		; X86-BMI1NOTBM-NEXT: popl %edi
; X86-BMI1NOTBM-NEXT: popl %ebx		; X86-BMI1NOTBM-NEXT: popl %ebx
; X86-BMI1NOTBM-NEXT: retl		; X86-BMI1NOTBM-NEXT: retl
;		;
; X86-BMI1BMI2-LABEL: bextr64_b2_load:		; X86-BMI1BMI2-LABEL: bextr64_b2_load:
; X86-BMI1BMI2: # %bb.0:		; X86-BMI1BMI2: # %bb.0:
; X86-BMI1BMI2-NEXT: pushl %ebx		; X86-BMI1BMI2-NEXT: pushl %ebx
; X86-BMI1BMI2-NEXT: pushl %edi
; X86-BMI1BMI2-NEXT: pushl %esi		; X86-BMI1BMI2-NEXT: pushl %esi
; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %al		; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %bl
; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %edx		; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %edx
; X86-BMI1BMI2-NEXT: movl (%edx), %esi		; X86-BMI1BMI2-NEXT: movl (%edx), %eax
; X86-BMI1BMI2-NEXT: movl 4(%edx), %edi		; X86-BMI1BMI2-NEXT: movl 4(%edx), %esi
; X86-BMI1BMI2-NEXT: shrxl %ecx, %edi, %edx		; X86-BMI1BMI2-NEXT: shrxl %ecx, %esi, %edx
; X86-BMI1BMI2-NEXT: shrdl %cl, %edi, %esi		; X86-BMI1BMI2-NEXT: shrdl %cl, %esi, %eax
; X86-BMI1BMI2-NEXT: testb $32, %cl		; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB27_2		; X86-BMI1BMI2-NEXT: je .LBB27_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: movl %edx, %esi		; X86-BMI1BMI2-NEXT: movl %edx, %eax
; X86-BMI1BMI2-NEXT: xorl %edx, %edx		; X86-BMI1BMI2-NEXT: xorl %edx, %edx
; X86-BMI1BMI2-NEXT: .LBB27_2:		; X86-BMI1BMI2-NEXT: .LBB27_2:
; X86-BMI1BMI2-NEXT: movl $-1, %edi		; X86-BMI1BMI2-NEXT: movl $-1, %esi
; X86-BMI1BMI2-NEXT: shlxl %eax, %edi, %ebx		; X86-BMI1BMI2-NEXT: shlxl %ebx, %esi, %ecx
; X86-BMI1BMI2-NEXT: movl %eax, %ecx		; X86-BMI1BMI2-NEXT: testb $32, %bl
; X86-BMI1BMI2-NEXT: shldl %cl, %edi, %edi
; X86-BMI1BMI2-NEXT: testb $32, %al
; X86-BMI1BMI2-NEXT: je .LBB27_4		; X86-BMI1BMI2-NEXT: je .LBB27_4
; X86-BMI1BMI2-NEXT: # %bb.3:		; X86-BMI1BMI2-NEXT: # %bb.3:
; X86-BMI1BMI2-NEXT: movl %ebx, %edi		; X86-BMI1BMI2-NEXT: movl %ecx, %esi
; X86-BMI1BMI2-NEXT: xorl %ebx, %ebx		; X86-BMI1BMI2-NEXT: xorl %ecx, %ecx
; X86-BMI1BMI2-NEXT: .LBB27_4:		; X86-BMI1BMI2-NEXT: .LBB27_4:
; X86-BMI1BMI2-NEXT: andnl %edx, %edi, %edx		; X86-BMI1BMI2-NEXT: andnl %edx, %esi, %edx
; X86-BMI1BMI2-NEXT: andnl %esi, %ebx, %eax		; X86-BMI1BMI2-NEXT: andnl %eax, %ecx, %eax
; X86-BMI1BMI2-NEXT: popl %esi		; X86-BMI1BMI2-NEXT: popl %esi
; X86-BMI1BMI2-NEXT: popl %edi
; X86-BMI1BMI2-NEXT: popl %ebx		; X86-BMI1BMI2-NEXT: popl %ebx
; X86-BMI1BMI2-NEXT: retl		; X86-BMI1BMI2-NEXT: retl
;		;
; X64-NOBMI-LABEL: bextr64_b2_load:		; X64-NOBMI-LABEL: bextr64_b2_load:
; X64-NOBMI: # %bb.0:		; X64-NOBMI: # %bb.0:
; X64-NOBMI-NEXT: movq %rsi, %rcx		; X64-NOBMI-NEXT: movq %rsi, %rcx
; X64-NOBMI-NEXT: movq (%rdi), %rsi		; X64-NOBMI-NEXT: movq (%rdi), %rsi
; X64-NOBMI-NEXT: # kill: def $cl killed $cl killed $rcx		; X64-NOBMI-NEXT: # kill: def $cl killed $cl killed $rcx
Show All 24 Lines	; X64-BMI1BMI2-NEXT: retq
%mask = xor i64 %notmask, -1		%mask = xor i64 %notmask, -1
%masked = and i64 %mask, %shifted		%masked = and i64 %mask, %shifted
ret i64 %masked		ret i64 %masked
}		}

define i64 @bextr64_b3_load_indexzext(i64* %w, i8 zeroext %numskipbits, i8 zeroext %numlowbits) nounwind {		define i64 @bextr64_b3_load_indexzext(i64* %w, i8 zeroext %numskipbits, i8 zeroext %numlowbits) nounwind {
; X86-NOBMI-LABEL: bextr64_b3_load_indexzext:		; X86-NOBMI-LABEL: bextr64_b3_load_indexzext:
; X86-NOBMI: # %bb.0:		; X86-NOBMI: # %bb.0:
		; X86-NOBMI-NEXT: pushl %ebx
; X86-NOBMI-NEXT: pushl %edi		; X86-NOBMI-NEXT: pushl %edi
; X86-NOBMI-NEXT: pushl %esi		; X86-NOBMI-NEXT: pushl %esi
; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %ch		; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %ch
; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %eax		; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %eax
; X86-NOBMI-NEXT: movl (%eax), %esi		; X86-NOBMI-NEXT: movl (%eax), %esi
; X86-NOBMI-NEXT: movl 4(%eax), %eax		; X86-NOBMI-NEXT: movl 4(%eax), %eax
; X86-NOBMI-NEXT: movl %eax, %edi		; X86-NOBMI-NEXT: movl %eax, %edi
; X86-NOBMI-NEXT: shrl %cl, %edi		; X86-NOBMI-NEXT: shrl %cl, %edi
; X86-NOBMI-NEXT: shrdl %cl, %eax, %esi		; X86-NOBMI-NEXT: shrdl %cl, %eax, %esi
		; X86-NOBMI-NEXT: xorl %eax, %eax
; X86-NOBMI-NEXT: testb $32, %cl		; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: je .LBB28_2		; X86-NOBMI-NEXT: je .LBB28_2
; X86-NOBMI-NEXT: # %bb.1:		; X86-NOBMI-NEXT: # %bb.1:
; X86-NOBMI-NEXT: movl %edi, %esi		; X86-NOBMI-NEXT: movl %edi, %esi
; X86-NOBMI-NEXT: xorl %edi, %edi		; X86-NOBMI-NEXT: xorl %edi, %edi
; X86-NOBMI-NEXT: .LBB28_2:		; X86-NOBMI-NEXT: .LBB28_2:
; X86-NOBMI-NEXT: movl $-1, %edx		; X86-NOBMI-NEXT: movl $-1, %edx
; X86-NOBMI-NEXT: movl $-1, %eax		; X86-NOBMI-NEXT: movl $-1, %ebx
; X86-NOBMI-NEXT: movb %ch, %cl		; X86-NOBMI-NEXT: movb %ch, %cl
; X86-NOBMI-NEXT: shll %cl, %eax		; X86-NOBMI-NEXT: shll %cl, %ebx
; X86-NOBMI-NEXT: shldl %cl, %edx, %edx
; X86-NOBMI-NEXT: testb $32, %ch		; X86-NOBMI-NEXT: testb $32, %ch
; X86-NOBMI-NEXT: je .LBB28_4		; X86-NOBMI-NEXT: jne .LBB28_3
; X86-NOBMI-NEXT: # %bb.3:		; X86-NOBMI-NEXT: # %bb.4:
; X86-NOBMI-NEXT: movl %eax, %edx		; X86-NOBMI-NEXT: movl %ebx, %eax
; X86-NOBMI-NEXT: xorl %eax, %eax		; X86-NOBMI-NEXT: jmp .LBB28_5
; X86-NOBMI-NEXT: .LBB28_4:		; X86-NOBMI-NEXT: .LBB28_3:
		; X86-NOBMI-NEXT: movl %ebx, %edx
		; X86-NOBMI-NEXT: .LBB28_5:
; X86-NOBMI-NEXT: notl %edx		; X86-NOBMI-NEXT: notl %edx
; X86-NOBMI-NEXT: andl %edi, %edx		; X86-NOBMI-NEXT: andl %edi, %edx
; X86-NOBMI-NEXT: notl %eax		; X86-NOBMI-NEXT: notl %eax
; X86-NOBMI-NEXT: andl %esi, %eax		; X86-NOBMI-NEXT: andl %esi, %eax
; X86-NOBMI-NEXT: popl %esi		; X86-NOBMI-NEXT: popl %esi
; X86-NOBMI-NEXT: popl %edi		; X86-NOBMI-NEXT: popl %edi
		; X86-NOBMI-NEXT: popl %ebx
; X86-NOBMI-NEXT: retl		; X86-NOBMI-NEXT: retl
;		;
; X86-BMI1NOTBM-LABEL: bextr64_b3_load_indexzext:		; X86-BMI1NOTBM-LABEL: bextr64_b3_load_indexzext:
; X86-BMI1NOTBM: # %bb.0:		; X86-BMI1NOTBM: # %bb.0:
; X86-BMI1NOTBM-NEXT: pushl %ebx		; X86-BMI1NOTBM-NEXT: pushl %ebx
; X86-BMI1NOTBM-NEXT: pushl %edi		; X86-BMI1NOTBM-NEXT: pushl %edi
; X86-BMI1NOTBM-NEXT: pushl %esi		; X86-BMI1NOTBM-NEXT: pushl %esi
; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %al		; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %al
Show All 9 Lines
; X86-BMI1NOTBM-NEXT: # %bb.1:		; X86-BMI1NOTBM-NEXT: # %bb.1:
; X86-BMI1NOTBM-NEXT: movl %edx, %esi		; X86-BMI1NOTBM-NEXT: movl %edx, %esi
; X86-BMI1NOTBM-NEXT: xorl %edx, %edx		; X86-BMI1NOTBM-NEXT: xorl %edx, %edx
; X86-BMI1NOTBM-NEXT: .LBB28_2:		; X86-BMI1NOTBM-NEXT: .LBB28_2:
; X86-BMI1NOTBM-NEXT: movl $-1, %edi		; X86-BMI1NOTBM-NEXT: movl $-1, %edi
; X86-BMI1NOTBM-NEXT: movl $-1, %ebx		; X86-BMI1NOTBM-NEXT: movl $-1, %ebx
; X86-BMI1NOTBM-NEXT: movl %eax, %ecx		; X86-BMI1NOTBM-NEXT: movl %eax, %ecx
; X86-BMI1NOTBM-NEXT: shll %cl, %ebx		; X86-BMI1NOTBM-NEXT: shll %cl, %ebx
; X86-BMI1NOTBM-NEXT: shldl %cl, %edi, %edi
; X86-BMI1NOTBM-NEXT: testb $32, %al		; X86-BMI1NOTBM-NEXT: testb $32, %al
; X86-BMI1NOTBM-NEXT: je .LBB28_4		; X86-BMI1NOTBM-NEXT: je .LBB28_4
; X86-BMI1NOTBM-NEXT: # %bb.3:		; X86-BMI1NOTBM-NEXT: # %bb.3:
; X86-BMI1NOTBM-NEXT: movl %ebx, %edi		; X86-BMI1NOTBM-NEXT: movl %ebx, %edi
; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx		; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx
; X86-BMI1NOTBM-NEXT: .LBB28_4:		; X86-BMI1NOTBM-NEXT: .LBB28_4:
; X86-BMI1NOTBM-NEXT: andnl %edx, %edi, %edx		; X86-BMI1NOTBM-NEXT: andnl %edx, %edi, %edx
; X86-BMI1NOTBM-NEXT: andnl %esi, %ebx, %eax		; X86-BMI1NOTBM-NEXT: andnl %esi, %ebx, %eax
; X86-BMI1NOTBM-NEXT: popl %esi		; X86-BMI1NOTBM-NEXT: popl %esi
; X86-BMI1NOTBM-NEXT: popl %edi		; X86-BMI1NOTBM-NEXT: popl %edi
; X86-BMI1NOTBM-NEXT: popl %ebx		; X86-BMI1NOTBM-NEXT: popl %ebx
; X86-BMI1NOTBM-NEXT: retl		; X86-BMI1NOTBM-NEXT: retl
;		;
; X86-BMI1BMI2-LABEL: bextr64_b3_load_indexzext:		; X86-BMI1BMI2-LABEL: bextr64_b3_load_indexzext:
; X86-BMI1BMI2: # %bb.0:		; X86-BMI1BMI2: # %bb.0:
; X86-BMI1BMI2-NEXT: pushl %ebx		; X86-BMI1BMI2-NEXT: pushl %ebx
; X86-BMI1BMI2-NEXT: pushl %edi
; X86-BMI1BMI2-NEXT: pushl %esi		; X86-BMI1BMI2-NEXT: pushl %esi
; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %al		; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %bl
; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %edx		; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %edx
; X86-BMI1BMI2-NEXT: movl (%edx), %esi		; X86-BMI1BMI2-NEXT: movl (%edx), %eax
; X86-BMI1BMI2-NEXT: movl 4(%edx), %edi		; X86-BMI1BMI2-NEXT: movl 4(%edx), %esi
; X86-BMI1BMI2-NEXT: shrxl %ecx, %edi, %edx		; X86-BMI1BMI2-NEXT: shrxl %ecx, %esi, %edx
; X86-BMI1BMI2-NEXT: shrdl %cl, %edi, %esi		; X86-BMI1BMI2-NEXT: shrdl %cl, %esi, %eax
; X86-BMI1BMI2-NEXT: testb $32, %cl		; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB28_2		; X86-BMI1BMI2-NEXT: je .LBB28_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: movl %edx, %esi		; X86-BMI1BMI2-NEXT: movl %edx, %eax
; X86-BMI1BMI2-NEXT: xorl %edx, %edx		; X86-BMI1BMI2-NEXT: xorl %edx, %edx
; X86-BMI1BMI2-NEXT: .LBB28_2:		; X86-BMI1BMI2-NEXT: .LBB28_2:
; X86-BMI1BMI2-NEXT: movl $-1, %edi		; X86-BMI1BMI2-NEXT: movl $-1, %esi
; X86-BMI1BMI2-NEXT: shlxl %eax, %edi, %ebx		; X86-BMI1BMI2-NEXT: shlxl %ebx, %esi, %ecx
; X86-BMI1BMI2-NEXT: movl %eax, %ecx		; X86-BMI1BMI2-NEXT: testb $32, %bl
; X86-BMI1BMI2-NEXT: shldl %cl, %edi, %edi
; X86-BMI1BMI2-NEXT: testb $32, %al
; X86-BMI1BMI2-NEXT: je .LBB28_4		; X86-BMI1BMI2-NEXT: je .LBB28_4
; X86-BMI1BMI2-NEXT: # %bb.3:		; X86-BMI1BMI2-NEXT: # %bb.3:
; X86-BMI1BMI2-NEXT: movl %ebx, %edi		; X86-BMI1BMI2-NEXT: movl %ecx, %esi
; X86-BMI1BMI2-NEXT: xorl %ebx, %ebx		; X86-BMI1BMI2-NEXT: xorl %ecx, %ecx
; X86-BMI1BMI2-NEXT: .LBB28_4:		; X86-BMI1BMI2-NEXT: .LBB28_4:
; X86-BMI1BMI2-NEXT: andnl %edx, %edi, %edx		; X86-BMI1BMI2-NEXT: andnl %edx, %esi, %edx
; X86-BMI1BMI2-NEXT: andnl %esi, %ebx, %eax		; X86-BMI1BMI2-NEXT: andnl %eax, %ecx, %eax
; X86-BMI1BMI2-NEXT: popl %esi		; X86-BMI1BMI2-NEXT: popl %esi
; X86-BMI1BMI2-NEXT: popl %edi
; X86-BMI1BMI2-NEXT: popl %ebx		; X86-BMI1BMI2-NEXT: popl %ebx
; X86-BMI1BMI2-NEXT: retl		; X86-BMI1BMI2-NEXT: retl
;		;
; X64-NOBMI-LABEL: bextr64_b3_load_indexzext:		; X64-NOBMI-LABEL: bextr64_b3_load_indexzext:
; X64-NOBMI: # %bb.0:		; X64-NOBMI: # %bb.0:
; X64-NOBMI-NEXT: movl %esi, %ecx		; X64-NOBMI-NEXT: movl %esi, %ecx
; X64-NOBMI-NEXT: movq (%rdi), %rsi		; X64-NOBMI-NEXT: movq (%rdi), %rsi
; X64-NOBMI-NEXT: # kill: def $cl killed $cl killed $ecx		; X64-NOBMI-NEXT: # kill: def $cl killed $cl killed $ecx
Show All 28 Lines	; X64-BMI1BMI2-NEXT: retq
%mask = xor i64 %notmask, -1		%mask = xor i64 %notmask, -1
%masked = and i64 %mask, %shifted		%masked = and i64 %mask, %shifted
ret i64 %masked		ret i64 %masked
}		}

define i64 @bextr64_b4_commutative(i64 %val, i64 %numskipbits, i64 %numlowbits) nounwind {		define i64 @bextr64_b4_commutative(i64 %val, i64 %numskipbits, i64 %numlowbits) nounwind {
; X86-NOBMI-LABEL: bextr64_b4_commutative:		; X86-NOBMI-LABEL: bextr64_b4_commutative:
; X86-NOBMI: # %bb.0:		; X86-NOBMI: # %bb.0:
		; X86-NOBMI-NEXT: pushl %ebx
; X86-NOBMI-NEXT: pushl %edi		; X86-NOBMI-NEXT: pushl %edi
; X86-NOBMI-NEXT: pushl %esi		; X86-NOBMI-NEXT: pushl %esi
; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %ch		; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %ch
; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %eax		; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %eax
; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %esi		; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %esi
; X86-NOBMI-NEXT: movl %esi, %edx		; X86-NOBMI-NEXT: movl %esi, %edx
; X86-NOBMI-NEXT: shrl %cl, %edx		; X86-NOBMI-NEXT: shrl %cl, %edx
; X86-NOBMI-NEXT: shrdl %cl, %esi, %eax		; X86-NOBMI-NEXT: shrdl %cl, %esi, %eax
		; X86-NOBMI-NEXT: xorl %esi, %esi
; X86-NOBMI-NEXT: testb $32, %cl		; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: je .LBB29_2		; X86-NOBMI-NEXT: je .LBB29_2
; X86-NOBMI-NEXT: # %bb.1:		; X86-NOBMI-NEXT: # %bb.1:
; X86-NOBMI-NEXT: movl %edx, %eax		; X86-NOBMI-NEXT: movl %edx, %eax
; X86-NOBMI-NEXT: xorl %edx, %edx		; X86-NOBMI-NEXT: xorl %edx, %edx
; X86-NOBMI-NEXT: .LBB29_2:		; X86-NOBMI-NEXT: .LBB29_2:
; X86-NOBMI-NEXT: movl $-1, %edi		; X86-NOBMI-NEXT: movl $-1, %edi
; X86-NOBMI-NEXT: movl $-1, %esi		; X86-NOBMI-NEXT: movl $-1, %ebx
; X86-NOBMI-NEXT: movb %ch, %cl		; X86-NOBMI-NEXT: movb %ch, %cl
; X86-NOBMI-NEXT: shll %cl, %esi		; X86-NOBMI-NEXT: shll %cl, %ebx
; X86-NOBMI-NEXT: shldl %cl, %edi, %edi
; X86-NOBMI-NEXT: testb $32, %ch		; X86-NOBMI-NEXT: testb $32, %ch
; X86-NOBMI-NEXT: je .LBB29_4		; X86-NOBMI-NEXT: jne .LBB29_3
; X86-NOBMI-NEXT: # %bb.3:		; X86-NOBMI-NEXT: # %bb.4:
; X86-NOBMI-NEXT: movl %esi, %edi		; X86-NOBMI-NEXT: movl %ebx, %esi
; X86-NOBMI-NEXT: xorl %esi, %esi		; X86-NOBMI-NEXT: jmp .LBB29_5
; X86-NOBMI-NEXT: .LBB29_4:		; X86-NOBMI-NEXT: .LBB29_3:
		; X86-NOBMI-NEXT: movl %ebx, %edi
		; X86-NOBMI-NEXT: .LBB29_5:
; X86-NOBMI-NEXT: notl %edi		; X86-NOBMI-NEXT: notl %edi
; X86-NOBMI-NEXT: andl %edi, %edx		; X86-NOBMI-NEXT: andl %edi, %edx
; X86-NOBMI-NEXT: notl %esi		; X86-NOBMI-NEXT: notl %esi
; X86-NOBMI-NEXT: andl %esi, %eax		; X86-NOBMI-NEXT: andl %esi, %eax
; X86-NOBMI-NEXT: popl %esi		; X86-NOBMI-NEXT: popl %esi
; X86-NOBMI-NEXT: popl %edi		; X86-NOBMI-NEXT: popl %edi
		; X86-NOBMI-NEXT: popl %ebx
; X86-NOBMI-NEXT: retl		; X86-NOBMI-NEXT: retl
;		;
; X86-BMI1NOTBM-LABEL: bextr64_b4_commutative:		; X86-BMI1NOTBM-LABEL: bextr64_b4_commutative:
; X86-BMI1NOTBM: # %bb.0:		; X86-BMI1NOTBM: # %bb.0:
; X86-BMI1NOTBM-NEXT: pushl %ebx		; X86-BMI1NOTBM-NEXT: pushl %ebx
; X86-BMI1NOTBM-NEXT: pushl %edi		; X86-BMI1NOTBM-NEXT: pushl %edi
; X86-BMI1NOTBM-NEXT: pushl %esi		; X86-BMI1NOTBM-NEXT: pushl %esi
; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %al		; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %al
; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %esi		; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %esi
; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %edi		; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %edi
; X86-BMI1NOTBM-NEXT: movl %edi, %edx		; X86-BMI1NOTBM-NEXT: movl %edi, %edx
; X86-BMI1NOTBM-NEXT: shrl %cl, %edx		; X86-BMI1NOTBM-NEXT: shrl %cl, %edx
; X86-BMI1NOTBM-NEXT: shrdl %cl, %edi, %esi		; X86-BMI1NOTBM-NEXT: shrdl %cl, %edi, %esi
; X86-BMI1NOTBM-NEXT: testb $32, %cl		; X86-BMI1NOTBM-NEXT: testb $32, %cl
; X86-BMI1NOTBM-NEXT: je .LBB29_2		; X86-BMI1NOTBM-NEXT: je .LBB29_2
; X86-BMI1NOTBM-NEXT: # %bb.1:		; X86-BMI1NOTBM-NEXT: # %bb.1:
; X86-BMI1NOTBM-NEXT: movl %edx, %esi		; X86-BMI1NOTBM-NEXT: movl %edx, %esi
; X86-BMI1NOTBM-NEXT: xorl %edx, %edx		; X86-BMI1NOTBM-NEXT: xorl %edx, %edx
; X86-BMI1NOTBM-NEXT: .LBB29_2:		; X86-BMI1NOTBM-NEXT: .LBB29_2:
; X86-BMI1NOTBM-NEXT: movl $-1, %edi		; X86-BMI1NOTBM-NEXT: movl $-1, %edi
; X86-BMI1NOTBM-NEXT: movl $-1, %ebx		; X86-BMI1NOTBM-NEXT: movl $-1, %ebx
; X86-BMI1NOTBM-NEXT: movl %eax, %ecx		; X86-BMI1NOTBM-NEXT: movl %eax, %ecx
; X86-BMI1NOTBM-NEXT: shll %cl, %ebx		; X86-BMI1NOTBM-NEXT: shll %cl, %ebx
; X86-BMI1NOTBM-NEXT: shldl %cl, %edi, %edi
; X86-BMI1NOTBM-NEXT: testb $32, %al		; X86-BMI1NOTBM-NEXT: testb $32, %al
; X86-BMI1NOTBM-NEXT: je .LBB29_4		; X86-BMI1NOTBM-NEXT: je .LBB29_4
; X86-BMI1NOTBM-NEXT: # %bb.3:		; X86-BMI1NOTBM-NEXT: # %bb.3:
; X86-BMI1NOTBM-NEXT: movl %ebx, %edi		; X86-BMI1NOTBM-NEXT: movl %ebx, %edi
; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx		; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx
; X86-BMI1NOTBM-NEXT: .LBB29_4:		; X86-BMI1NOTBM-NEXT: .LBB29_4:
; X86-BMI1NOTBM-NEXT: andnl %edx, %edi, %edx		; X86-BMI1NOTBM-NEXT: andnl %edx, %edi, %edx
; X86-BMI1NOTBM-NEXT: andnl %esi, %ebx, %eax		; X86-BMI1NOTBM-NEXT: andnl %esi, %ebx, %eax
; X86-BMI1NOTBM-NEXT: popl %esi		; X86-BMI1NOTBM-NEXT: popl %esi
; X86-BMI1NOTBM-NEXT: popl %edi		; X86-BMI1NOTBM-NEXT: popl %edi
; X86-BMI1NOTBM-NEXT: popl %ebx		; X86-BMI1NOTBM-NEXT: popl %ebx
; X86-BMI1NOTBM-NEXT: retl		; X86-BMI1NOTBM-NEXT: retl
;		;
; X86-BMI1BMI2-LABEL: bextr64_b4_commutative:		; X86-BMI1BMI2-LABEL: bextr64_b4_commutative:
; X86-BMI1BMI2: # %bb.0:		; X86-BMI1BMI2: # %bb.0:
; X86-BMI1BMI2-NEXT: pushl %ebx		; X86-BMI1BMI2-NEXT: pushl %ebx
; X86-BMI1BMI2-NEXT: pushl %edi
; X86-BMI1BMI2-NEXT: pushl %esi		; X86-BMI1BMI2-NEXT: pushl %esi
; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %al		; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %bl
; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %esi		; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %eax
; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %edx		; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %edx
; X86-BMI1BMI2-NEXT: shrdl %cl, %edx, %esi		; X86-BMI1BMI2-NEXT: shrdl %cl, %edx, %eax
; X86-BMI1BMI2-NEXT: shrxl %ecx, %edx, %edx		; X86-BMI1BMI2-NEXT: shrxl %ecx, %edx, %edx
; X86-BMI1BMI2-NEXT: testb $32, %cl		; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB29_2		; X86-BMI1BMI2-NEXT: je .LBB29_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: movl %edx, %esi		; X86-BMI1BMI2-NEXT: movl %edx, %eax
; X86-BMI1BMI2-NEXT: xorl %edx, %edx		; X86-BMI1BMI2-NEXT: xorl %edx, %edx
; X86-BMI1BMI2-NEXT: .LBB29_2:		; X86-BMI1BMI2-NEXT: .LBB29_2:
; X86-BMI1BMI2-NEXT: movl $-1, %edi		; X86-BMI1BMI2-NEXT: movl $-1, %esi
; X86-BMI1BMI2-NEXT: shlxl %eax, %edi, %ebx		; X86-BMI1BMI2-NEXT: shlxl %ebx, %esi, %ecx
; X86-BMI1BMI2-NEXT: movl %eax, %ecx		; X86-BMI1BMI2-NEXT: testb $32, %bl
; X86-BMI1BMI2-NEXT: shldl %cl, %edi, %edi
; X86-BMI1BMI2-NEXT: testb $32, %al
; X86-BMI1BMI2-NEXT: je .LBB29_4		; X86-BMI1BMI2-NEXT: je .LBB29_4
; X86-BMI1BMI2-NEXT: # %bb.3:		; X86-BMI1BMI2-NEXT: # %bb.3:
; X86-BMI1BMI2-NEXT: movl %ebx, %edi		; X86-BMI1BMI2-NEXT: movl %ecx, %esi
; X86-BMI1BMI2-NEXT: xorl %ebx, %ebx		; X86-BMI1BMI2-NEXT: xorl %ecx, %ecx
; X86-BMI1BMI2-NEXT: .LBB29_4:		; X86-BMI1BMI2-NEXT: .LBB29_4:
; X86-BMI1BMI2-NEXT: andnl %edx, %edi, %edx		; X86-BMI1BMI2-NEXT: andnl %edx, %esi, %edx
; X86-BMI1BMI2-NEXT: andnl %esi, %ebx, %eax		; X86-BMI1BMI2-NEXT: andnl %eax, %ecx, %eax
; X86-BMI1BMI2-NEXT: popl %esi		; X86-BMI1BMI2-NEXT: popl %esi
; X86-BMI1BMI2-NEXT: popl %edi
; X86-BMI1BMI2-NEXT: popl %ebx		; X86-BMI1BMI2-NEXT: popl %ebx
; X86-BMI1BMI2-NEXT: retl		; X86-BMI1BMI2-NEXT: retl
;		;
; X64-NOBMI-LABEL: bextr64_b4_commutative:		; X64-NOBMI-LABEL: bextr64_b4_commutative:
; X64-NOBMI: # %bb.0:		; X64-NOBMI: # %bb.0:
; X64-NOBMI-NEXT: movq %rsi, %rcx		; X64-NOBMI-NEXT: movq %rsi, %rcx
; X64-NOBMI-NEXT: # kill: def $cl killed $cl killed $rcx		; X64-NOBMI-NEXT: # kill: def $cl killed $cl killed $rcx
; X64-NOBMI-NEXT: shrq %cl, %rdi		; X64-NOBMI-NEXT: shrq %cl, %rdi
Show All 27 Lines
define i64 @bextr64_b5_skipextrauses(i64 %val, i64 %numskipbits, i64 %numlowbits) nounwind {		define i64 @bextr64_b5_skipextrauses(i64 %val, i64 %numskipbits, i64 %numlowbits) nounwind {
; X86-NOBMI-LABEL: bextr64_b5_skipextrauses:		; X86-NOBMI-LABEL: bextr64_b5_skipextrauses:
; X86-NOBMI: # %bb.0:		; X86-NOBMI: # %bb.0:
; X86-NOBMI-NEXT: pushl %ebp		; X86-NOBMI-NEXT: pushl %ebp
; X86-NOBMI-NEXT: pushl %ebx		; X86-NOBMI-NEXT: pushl %ebx
; X86-NOBMI-NEXT: pushl %edi		; X86-NOBMI-NEXT: pushl %edi
; X86-NOBMI-NEXT: pushl %esi		; X86-NOBMI-NEXT: pushl %esi
; X86-NOBMI-NEXT: subl $12, %esp		; X86-NOBMI-NEXT: subl $12, %esp
; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %dl		; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %ch
; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %ebx		; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %edx
; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %esi		; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %esi
; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %eax		; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %eax
; X86-NOBMI-NEXT: movl %esi, %ebp		; X86-NOBMI-NEXT: movl %esi, %ebp
; X86-NOBMI-NEXT: movl %eax, %ecx		; X86-NOBMI-NEXT: movb %al, %cl
; X86-NOBMI-NEXT: shrl %cl, %ebp		; X86-NOBMI-NEXT: shrl %cl, %ebp
; X86-NOBMI-NEXT: shrdl %cl, %esi, %ebx		; X86-NOBMI-NEXT: shrdl %cl, %esi, %edx
		; X86-NOBMI-NEXT: xorl %ebx, %ebx
; X86-NOBMI-NEXT: testb $32, %al		; X86-NOBMI-NEXT: testb $32, %al
; X86-NOBMI-NEXT: je .LBB30_2		; X86-NOBMI-NEXT: je .LBB30_2
; X86-NOBMI-NEXT: # %bb.1:		; X86-NOBMI-NEXT: # %bb.1:
; X86-NOBMI-NEXT: movl %ebp, %ebx		; X86-NOBMI-NEXT: movl %ebp, %edx
; X86-NOBMI-NEXT: xorl %ebp, %ebp		; X86-NOBMI-NEXT: xorl %ebp, %ebp
; X86-NOBMI-NEXT: .LBB30_2:		; X86-NOBMI-NEXT: .LBB30_2:
; X86-NOBMI-NEXT: movl $-1, %esi
; X86-NOBMI-NEXT: movl $-1, %edi		; X86-NOBMI-NEXT: movl $-1, %edi
; X86-NOBMI-NEXT: movl %edx, %ecx		; X86-NOBMI-NEXT: movl $-1, %esi
; X86-NOBMI-NEXT: shll %cl, %edi		; X86-NOBMI-NEXT: movb %ch, %cl
; X86-NOBMI-NEXT: shldl %cl, %esi, %esi		; X86-NOBMI-NEXT: shll %cl, %esi
; X86-NOBMI-NEXT: testb $32, %dl		; X86-NOBMI-NEXT: testb $32, %ch
; X86-NOBMI-NEXT: je .LBB30_4		; X86-NOBMI-NEXT: jne .LBB30_3
; X86-NOBMI-NEXT: # %bb.3:		; X86-NOBMI-NEXT: # %bb.4:
; X86-NOBMI-NEXT: movl %edi, %esi		; X86-NOBMI-NEXT: movl %esi, %ebx
; X86-NOBMI-NEXT: xorl %edi, %edi		; X86-NOBMI-NEXT: jmp .LBB30_5
; X86-NOBMI-NEXT: .LBB30_4:		; X86-NOBMI-NEXT: .LBB30_3:
; X86-NOBMI-NEXT: notl %esi		; X86-NOBMI-NEXT: movl %esi, %edi
; X86-NOBMI-NEXT: andl %ebp, %esi		; X86-NOBMI-NEXT: .LBB30_5:
; X86-NOBMI-NEXT: notl %edi		; X86-NOBMI-NEXT: notl %edi
; X86-NOBMI-NEXT: andl %ebx, %edi		; X86-NOBMI-NEXT: andl %ebp, %edi
		; X86-NOBMI-NEXT: notl %ebx
		; X86-NOBMI-NEXT: andl %edx, %ebx
; X86-NOBMI-NEXT: subl $8, %esp		; X86-NOBMI-NEXT: subl $8, %esp
; X86-NOBMI-NEXT: pushl {{[0-9]+}}(%esp)		; X86-NOBMI-NEXT: pushl {{[0-9]+}}(%esp)
; X86-NOBMI-NEXT: pushl %eax		; X86-NOBMI-NEXT: pushl %eax
; X86-NOBMI-NEXT: calll use64		; X86-NOBMI-NEXT: calll use64
; X86-NOBMI-NEXT: addl $16, %esp		; X86-NOBMI-NEXT: addl $16, %esp
; X86-NOBMI-NEXT: movl %edi, %eax		; X86-NOBMI-NEXT: movl %ebx, %eax
; X86-NOBMI-NEXT: movl %esi, %edx		; X86-NOBMI-NEXT: movl %edi, %edx
; X86-NOBMI-NEXT: addl $12, %esp		; X86-NOBMI-NEXT: addl $12, %esp
; X86-NOBMI-NEXT: popl %esi		; X86-NOBMI-NEXT: popl %esi
; X86-NOBMI-NEXT: popl %edi		; X86-NOBMI-NEXT: popl %edi
; X86-NOBMI-NEXT: popl %ebx		; X86-NOBMI-NEXT: popl %ebx
; X86-NOBMI-NEXT: popl %ebp		; X86-NOBMI-NEXT: popl %ebp
; X86-NOBMI-NEXT: retl		; X86-NOBMI-NEXT: retl
;		;
; X86-BMI1NOTBM-LABEL: bextr64_b5_skipextrauses:		; X86-BMI1NOTBM-LABEL: bextr64_b5_skipextrauses:
Show All 16 Lines
; X86-BMI1NOTBM-NEXT: # %bb.1:		; X86-BMI1NOTBM-NEXT: # %bb.1:
; X86-BMI1NOTBM-NEXT: movl %esi, %edi		; X86-BMI1NOTBM-NEXT: movl %esi, %edi
; X86-BMI1NOTBM-NEXT: xorl %esi, %esi		; X86-BMI1NOTBM-NEXT: xorl %esi, %esi
; X86-BMI1NOTBM-NEXT: .LBB30_2:		; X86-BMI1NOTBM-NEXT: .LBB30_2:
; X86-BMI1NOTBM-NEXT: movl $-1, %ebx		; X86-BMI1NOTBM-NEXT: movl $-1, %ebx
; X86-BMI1NOTBM-NEXT: movl $-1, %ebp		; X86-BMI1NOTBM-NEXT: movl $-1, %ebp
; X86-BMI1NOTBM-NEXT: movl %edx, %ecx		; X86-BMI1NOTBM-NEXT: movl %edx, %ecx
; X86-BMI1NOTBM-NEXT: shll %cl, %ebp		; X86-BMI1NOTBM-NEXT: shll %cl, %ebp
; X86-BMI1NOTBM-NEXT: shldl %cl, %ebx, %ebx
; X86-BMI1NOTBM-NEXT: testb $32, %dl		; X86-BMI1NOTBM-NEXT: testb $32, %dl
; X86-BMI1NOTBM-NEXT: je .LBB30_4		; X86-BMI1NOTBM-NEXT: je .LBB30_4
; X86-BMI1NOTBM-NEXT: # %bb.3:		; X86-BMI1NOTBM-NEXT: # %bb.3:
; X86-BMI1NOTBM-NEXT: movl %ebp, %ebx		; X86-BMI1NOTBM-NEXT: movl %ebp, %ebx
; X86-BMI1NOTBM-NEXT: xorl %ebp, %ebp		; X86-BMI1NOTBM-NEXT: xorl %ebp, %ebp
; X86-BMI1NOTBM-NEXT: .LBB30_4:		; X86-BMI1NOTBM-NEXT: .LBB30_4:
; X86-BMI1NOTBM-NEXT: andnl %esi, %ebx, %esi		; X86-BMI1NOTBM-NEXT: andnl %esi, %ebx, %esi
; X86-BMI1NOTBM-NEXT: andnl %edi, %ebp, %edi		; X86-BMI1NOTBM-NEXT: andnl %edi, %ebp, %edi
Show All 13 Lines
;		;
; X86-BMI1BMI2-LABEL: bextr64_b5_skipextrauses:		; X86-BMI1BMI2-LABEL: bextr64_b5_skipextrauses:
; X86-BMI1BMI2: # %bb.0:		; X86-BMI1BMI2: # %bb.0:
; X86-BMI1BMI2-NEXT: pushl %ebp		; X86-BMI1BMI2-NEXT: pushl %ebp
; X86-BMI1BMI2-NEXT: pushl %ebx		; X86-BMI1BMI2-NEXT: pushl %ebx
; X86-BMI1BMI2-NEXT: pushl %edi		; X86-BMI1BMI2-NEXT: pushl %edi
; X86-BMI1BMI2-NEXT: pushl %esi		; X86-BMI1BMI2-NEXT: pushl %esi
; X86-BMI1BMI2-NEXT: subl $12, %esp		; X86-BMI1BMI2-NEXT: subl $12, %esp
; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %dl		; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %bl
; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %edi
; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %esi
; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %eax		; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %eax
; X86-BMI1BMI2-NEXT: movl %eax, %ecx		; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %edx
; X86-BMI1BMI2-NEXT: shrdl %cl, %esi, %edi		; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %ecx
; X86-BMI1BMI2-NEXT: shrxl %eax, %esi, %esi		; X86-BMI1BMI2-NEXT: shrdl %cl, %edx, %eax
; X86-BMI1BMI2-NEXT: testb $32, %al		; X86-BMI1BMI2-NEXT: shrxl %ecx, %edx, %edx
		; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB30_2		; X86-BMI1BMI2-NEXT: je .LBB30_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: movl %esi, %edi		; X86-BMI1BMI2-NEXT: movl %edx, %eax
; X86-BMI1BMI2-NEXT: xorl %esi, %esi		; X86-BMI1BMI2-NEXT: xorl %edx, %edx
; X86-BMI1BMI2-NEXT: .LBB30_2:		; X86-BMI1BMI2-NEXT: .LBB30_2:
; X86-BMI1BMI2-NEXT: movl $-1, %ebp		; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %ebp
; X86-BMI1BMI2-NEXT: shlxl %edx, %ebp, %ebx		; X86-BMI1BMI2-NEXT: movl $-1, %esi
; X86-BMI1BMI2-NEXT: movl %edx, %ecx		; X86-BMI1BMI2-NEXT: shlxl %ebx, %esi, %edi
; X86-BMI1BMI2-NEXT: shldl %cl, %ebp, %ebp		; X86-BMI1BMI2-NEXT: testb $32, %bl
; X86-BMI1BMI2-NEXT: testb $32, %dl
; X86-BMI1BMI2-NEXT: je .LBB30_4		; X86-BMI1BMI2-NEXT: je .LBB30_4
; X86-BMI1BMI2-NEXT: # %bb.3:		; X86-BMI1BMI2-NEXT: # %bb.3:
; X86-BMI1BMI2-NEXT: movl %ebx, %ebp		; X86-BMI1BMI2-NEXT: movl %edi, %esi
; X86-BMI1BMI2-NEXT: xorl %ebx, %ebx		; X86-BMI1BMI2-NEXT: xorl %edi, %edi
; X86-BMI1BMI2-NEXT: .LBB30_4:		; X86-BMI1BMI2-NEXT: .LBB30_4:
; X86-BMI1BMI2-NEXT: andnl %esi, %ebp, %esi		; X86-BMI1BMI2-NEXT: andnl %edx, %esi, %esi
; X86-BMI1BMI2-NEXT: andnl %edi, %ebx, %edi		; X86-BMI1BMI2-NEXT: andnl %eax, %edi, %edi
; X86-BMI1BMI2-NEXT: subl $8, %esp		; X86-BMI1BMI2-NEXT: subl $8, %esp
; X86-BMI1BMI2-NEXT: pushl {{[0-9]+}}(%esp)		; X86-BMI1BMI2-NEXT: pushl %ebp
; X86-BMI1BMI2-NEXT: pushl %eax		; X86-BMI1BMI2-NEXT: pushl %ecx
; X86-BMI1BMI2-NEXT: calll use64		; X86-BMI1BMI2-NEXT: calll use64
; X86-BMI1BMI2-NEXT: addl $16, %esp		; X86-BMI1BMI2-NEXT: addl $16, %esp
; X86-BMI1BMI2-NEXT: movl %edi, %eax		; X86-BMI1BMI2-NEXT: movl %edi, %eax
; X86-BMI1BMI2-NEXT: movl %esi, %edx		; X86-BMI1BMI2-NEXT: movl %esi, %edx
; X86-BMI1BMI2-NEXT: addl $12, %esp		; X86-BMI1BMI2-NEXT: addl $12, %esp
; X86-BMI1BMI2-NEXT: popl %esi		; X86-BMI1BMI2-NEXT: popl %esi
; X86-BMI1BMI2-NEXT: popl %edi		; X86-BMI1BMI2-NEXT: popl %edi
; X86-BMI1BMI2-NEXT: popl %ebx		; X86-BMI1BMI2-NEXT: popl %ebx
▲ Show 20 Lines • Show All 1,367 Lines • ▼ Show 20 Lines
; X86-NOBMI-NEXT: movl %edi, %esi		; X86-NOBMI-NEXT: movl %edi, %esi
; X86-NOBMI-NEXT: xorl %edi, %edi		; X86-NOBMI-NEXT: xorl %edi, %edi
; X86-NOBMI-NEXT: .LBB41_2:		; X86-NOBMI-NEXT: .LBB41_2:
; X86-NOBMI-NEXT: movb $64, %cl		; X86-NOBMI-NEXT: movb $64, %cl
; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-NOBMI-NEXT: movl $-1, %ebp		; X86-NOBMI-NEXT: movl $-1, %ebp
; X86-NOBMI-NEXT: movl $-1, %ebx		; X86-NOBMI-NEXT: movl $-1, %ebx
; X86-NOBMI-NEXT: shrl %cl, %ebx		; X86-NOBMI-NEXT: shrl %cl, %ebx
; X86-NOBMI-NEXT: shrdl %cl, %ebp, %ebp
; X86-NOBMI-NEXT: testb $32, %cl		; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: je .LBB41_4		; X86-NOBMI-NEXT: je .LBB41_4
; X86-NOBMI-NEXT: # %bb.3:		; X86-NOBMI-NEXT: # %bb.3:
; X86-NOBMI-NEXT: movl %ebx, %ebp		; X86-NOBMI-NEXT: movl %ebx, %ebp
; X86-NOBMI-NEXT: xorl %ebx, %ebx		; X86-NOBMI-NEXT: xorl %ebx, %ebx
; X86-NOBMI-NEXT: .LBB41_4:		; X86-NOBMI-NEXT: .LBB41_4:
; X86-NOBMI-NEXT: subl $8, %esp		; X86-NOBMI-NEXT: subl $8, %esp
; X86-NOBMI-NEXT: pushl %ebx		; X86-NOBMI-NEXT: pushl %ebx
Show All 30 Lines
; X86-BMI1NOTBM-NEXT: movl %edi, %esi		; X86-BMI1NOTBM-NEXT: movl %edi, %esi
; X86-BMI1NOTBM-NEXT: xorl %edi, %edi		; X86-BMI1NOTBM-NEXT: xorl %edi, %edi
; X86-BMI1NOTBM-NEXT: .LBB41_2:		; X86-BMI1NOTBM-NEXT: .LBB41_2:
; X86-BMI1NOTBM-NEXT: movb $64, %cl		; X86-BMI1NOTBM-NEXT: movb $64, %cl
; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-BMI1NOTBM-NEXT: movl $-1, %ebp		; X86-BMI1NOTBM-NEXT: movl $-1, %ebp
; X86-BMI1NOTBM-NEXT: movl $-1, %ebx		; X86-BMI1NOTBM-NEXT: movl $-1, %ebx
; X86-BMI1NOTBM-NEXT: shrl %cl, %ebx		; X86-BMI1NOTBM-NEXT: shrl %cl, %ebx
; X86-BMI1NOTBM-NEXT: shrdl %cl, %ebp, %ebp
; X86-BMI1NOTBM-NEXT: testb $32, %cl		; X86-BMI1NOTBM-NEXT: testb $32, %cl
; X86-BMI1NOTBM-NEXT: je .LBB41_4		; X86-BMI1NOTBM-NEXT: je .LBB41_4
; X86-BMI1NOTBM-NEXT: # %bb.3:		; X86-BMI1NOTBM-NEXT: # %bb.3:
; X86-BMI1NOTBM-NEXT: movl %ebx, %ebp		; X86-BMI1NOTBM-NEXT: movl %ebx, %ebp
; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx		; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx
; X86-BMI1NOTBM-NEXT: .LBB41_4:		; X86-BMI1NOTBM-NEXT: .LBB41_4:
; X86-BMI1NOTBM-NEXT: subl $8, %esp		; X86-BMI1NOTBM-NEXT: subl $8, %esp
; X86-BMI1NOTBM-NEXT: pushl %ebx		; X86-BMI1NOTBM-NEXT: pushl %ebx
Show All 24 Lines
; X86-BMI1BMI2-NEXT: shrdl %cl, %eax, %esi		; X86-BMI1BMI2-NEXT: shrdl %cl, %eax, %esi
; X86-BMI1BMI2-NEXT: shrxl %ecx, %eax, %edi		; X86-BMI1BMI2-NEXT: shrxl %ecx, %eax, %edi
; X86-BMI1BMI2-NEXT: testb $32, %cl		; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB41_2		; X86-BMI1BMI2-NEXT: je .LBB41_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: movl %edi, %esi		; X86-BMI1BMI2-NEXT: movl %edi, %esi
; X86-BMI1BMI2-NEXT: xorl %edi, %edi		; X86-BMI1BMI2-NEXT: xorl %edi, %edi
; X86-BMI1BMI2-NEXT: .LBB41_2:		; X86-BMI1BMI2-NEXT: .LBB41_2:
; X86-BMI1BMI2-NEXT: movb $64, %cl		; X86-BMI1BMI2-NEXT: movb $64, %al
; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %al
; X86-BMI1BMI2-NEXT: movl $-1, %ebx		; X86-BMI1BMI2-NEXT: movl $-1, %ebp
; X86-BMI1BMI2-NEXT: shrxl %ecx, %ebx, %ebp		; X86-BMI1BMI2-NEXT: shrxl %eax, %ebp, %ebx
; X86-BMI1BMI2-NEXT: shrdl %cl, %ebx, %ebx		; X86-BMI1BMI2-NEXT: testb $32, %al
; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB41_4		; X86-BMI1BMI2-NEXT: je .LBB41_4
; X86-BMI1BMI2-NEXT: # %bb.3:		; X86-BMI1BMI2-NEXT: # %bb.3:
; X86-BMI1BMI2-NEXT: movl %ebp, %ebx		; X86-BMI1BMI2-NEXT: movl %ebx, %ebp
; X86-BMI1BMI2-NEXT: xorl %ebp, %ebp		; X86-BMI1BMI2-NEXT: xorl %ebx, %ebx
; X86-BMI1BMI2-NEXT: .LBB41_4:		; X86-BMI1BMI2-NEXT: .LBB41_4:
; X86-BMI1BMI2-NEXT: subl $8, %esp		; X86-BMI1BMI2-NEXT: subl $8, %esp
; X86-BMI1BMI2-NEXT: pushl %ebp
; X86-BMI1BMI2-NEXT: pushl %ebx		; X86-BMI1BMI2-NEXT: pushl %ebx
		; X86-BMI1BMI2-NEXT: pushl %ebp
; X86-BMI1BMI2-NEXT: calll use64		; X86-BMI1BMI2-NEXT: calll use64
; X86-BMI1BMI2-NEXT: addl $16, %esp		; X86-BMI1BMI2-NEXT: addl $16, %esp
; X86-BMI1BMI2-NEXT: andl %ebx, %esi		; X86-BMI1BMI2-NEXT: andl %ebp, %esi
; X86-BMI1BMI2-NEXT: andl %ebp, %edi		; X86-BMI1BMI2-NEXT: andl %ebx, %edi
; X86-BMI1BMI2-NEXT: movl %esi, %eax		; X86-BMI1BMI2-NEXT: movl %esi, %eax
; X86-BMI1BMI2-NEXT: movl %edi, %edx		; X86-BMI1BMI2-NEXT: movl %edi, %edx
; X86-BMI1BMI2-NEXT: addl $12, %esp		; X86-BMI1BMI2-NEXT: addl $12, %esp
; X86-BMI1BMI2-NEXT: popl %esi		; X86-BMI1BMI2-NEXT: popl %esi
; X86-BMI1BMI2-NEXT: popl %edi		; X86-BMI1BMI2-NEXT: popl %edi
; X86-BMI1BMI2-NEXT: popl %ebx		; X86-BMI1BMI2-NEXT: popl %ebx
; X86-BMI1BMI2-NEXT: popl %ebp		; X86-BMI1BMI2-NEXT: popl %ebp
; X86-BMI1BMI2-NEXT: retl		; X86-BMI1BMI2-NEXT: retl
▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
; X86-NOBMI-NEXT: movl %edi, %esi		; X86-NOBMI-NEXT: movl %edi, %esi
; X86-NOBMI-NEXT: xorl %edi, %edi		; X86-NOBMI-NEXT: xorl %edi, %edi
; X86-NOBMI-NEXT: .LBB42_2:		; X86-NOBMI-NEXT: .LBB42_2:
; X86-NOBMI-NEXT: movb $64, %cl		; X86-NOBMI-NEXT: movb $64, %cl
; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-NOBMI-NEXT: movl $-1, %ebp		; X86-NOBMI-NEXT: movl $-1, %ebp
; X86-NOBMI-NEXT: movl $-1, %ebx		; X86-NOBMI-NEXT: movl $-1, %ebx
; X86-NOBMI-NEXT: shrl %cl, %ebx		; X86-NOBMI-NEXT: shrl %cl, %ebx
; X86-NOBMI-NEXT: shrdl %cl, %ebp, %ebp
; X86-NOBMI-NEXT: testb $32, %cl		; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: je .LBB42_4		; X86-NOBMI-NEXT: je .LBB42_4
; X86-NOBMI-NEXT: # %bb.3:		; X86-NOBMI-NEXT: # %bb.3:
; X86-NOBMI-NEXT: movl %ebx, %ebp		; X86-NOBMI-NEXT: movl %ebx, %ebp
; X86-NOBMI-NEXT: xorl %ebx, %ebx		; X86-NOBMI-NEXT: xorl %ebx, %ebx
; X86-NOBMI-NEXT: .LBB42_4:		; X86-NOBMI-NEXT: .LBB42_4:
; X86-NOBMI-NEXT: subl $8, %esp		; X86-NOBMI-NEXT: subl $8, %esp
; X86-NOBMI-NEXT: pushl %ebx		; X86-NOBMI-NEXT: pushl %ebx
Show All 30 Lines
; X86-BMI1NOTBM-NEXT: movl %edi, %esi		; X86-BMI1NOTBM-NEXT: movl %edi, %esi
; X86-BMI1NOTBM-NEXT: xorl %edi, %edi		; X86-BMI1NOTBM-NEXT: xorl %edi, %edi
; X86-BMI1NOTBM-NEXT: .LBB42_2:		; X86-BMI1NOTBM-NEXT: .LBB42_2:
; X86-BMI1NOTBM-NEXT: movb $64, %cl		; X86-BMI1NOTBM-NEXT: movb $64, %cl
; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-BMI1NOTBM-NEXT: movl $-1, %ebp		; X86-BMI1NOTBM-NEXT: movl $-1, %ebp
; X86-BMI1NOTBM-NEXT: movl $-1, %ebx		; X86-BMI1NOTBM-NEXT: movl $-1, %ebx
; X86-BMI1NOTBM-NEXT: shrl %cl, %ebx		; X86-BMI1NOTBM-NEXT: shrl %cl, %ebx
; X86-BMI1NOTBM-NEXT: shrdl %cl, %ebp, %ebp
; X86-BMI1NOTBM-NEXT: testb $32, %cl		; X86-BMI1NOTBM-NEXT: testb $32, %cl
; X86-BMI1NOTBM-NEXT: je .LBB42_4		; X86-BMI1NOTBM-NEXT: je .LBB42_4
; X86-BMI1NOTBM-NEXT: # %bb.3:		; X86-BMI1NOTBM-NEXT: # %bb.3:
; X86-BMI1NOTBM-NEXT: movl %ebx, %ebp		; X86-BMI1NOTBM-NEXT: movl %ebx, %ebp
; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx		; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx
; X86-BMI1NOTBM-NEXT: .LBB42_4:		; X86-BMI1NOTBM-NEXT: .LBB42_4:
; X86-BMI1NOTBM-NEXT: subl $8, %esp		; X86-BMI1NOTBM-NEXT: subl $8, %esp
; X86-BMI1NOTBM-NEXT: pushl %ebx		; X86-BMI1NOTBM-NEXT: pushl %ebx
Show All 24 Lines
; X86-BMI1BMI2-NEXT: shrdl %cl, %eax, %esi		; X86-BMI1BMI2-NEXT: shrdl %cl, %eax, %esi
; X86-BMI1BMI2-NEXT: shrxl %ecx, %eax, %edi		; X86-BMI1BMI2-NEXT: shrxl %ecx, %eax, %edi
; X86-BMI1BMI2-NEXT: testb $32, %cl		; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB42_2		; X86-BMI1BMI2-NEXT: je .LBB42_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: movl %edi, %esi		; X86-BMI1BMI2-NEXT: movl %edi, %esi
; X86-BMI1BMI2-NEXT: xorl %edi, %edi		; X86-BMI1BMI2-NEXT: xorl %edi, %edi
; X86-BMI1BMI2-NEXT: .LBB42_2:		; X86-BMI1BMI2-NEXT: .LBB42_2:
; X86-BMI1BMI2-NEXT: movb $64, %cl		; X86-BMI1BMI2-NEXT: movb $64, %al
; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %al
; X86-BMI1BMI2-NEXT: movl $-1, %ebx		; X86-BMI1BMI2-NEXT: movl $-1, %ebp
; X86-BMI1BMI2-NEXT: shrxl %ecx, %ebx, %ebp		; X86-BMI1BMI2-NEXT: shrxl %eax, %ebp, %ebx
; X86-BMI1BMI2-NEXT: shrdl %cl, %ebx, %ebx		; X86-BMI1BMI2-NEXT: testb $32, %al
; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB42_4		; X86-BMI1BMI2-NEXT: je .LBB42_4
; X86-BMI1BMI2-NEXT: # %bb.3:		; X86-BMI1BMI2-NEXT: # %bb.3:
; X86-BMI1BMI2-NEXT: movl %ebp, %ebx		; X86-BMI1BMI2-NEXT: movl %ebx, %ebp
; X86-BMI1BMI2-NEXT: xorl %ebp, %ebp		; X86-BMI1BMI2-NEXT: xorl %ebx, %ebx
; X86-BMI1BMI2-NEXT: .LBB42_4:		; X86-BMI1BMI2-NEXT: .LBB42_4:
; X86-BMI1BMI2-NEXT: subl $8, %esp		; X86-BMI1BMI2-NEXT: subl $8, %esp
; X86-BMI1BMI2-NEXT: pushl %ebp
; X86-BMI1BMI2-NEXT: pushl %ebx		; X86-BMI1BMI2-NEXT: pushl %ebx
		; X86-BMI1BMI2-NEXT: pushl %ebp
; X86-BMI1BMI2-NEXT: calll use64		; X86-BMI1BMI2-NEXT: calll use64
; X86-BMI1BMI2-NEXT: addl $16, %esp		; X86-BMI1BMI2-NEXT: addl $16, %esp
; X86-BMI1BMI2-NEXT: andl %ebx, %esi		; X86-BMI1BMI2-NEXT: andl %ebp, %esi
; X86-BMI1BMI2-NEXT: andl %ebp, %edi		; X86-BMI1BMI2-NEXT: andl %ebx, %edi
; X86-BMI1BMI2-NEXT: movl %esi, %eax		; X86-BMI1BMI2-NEXT: movl %esi, %eax
; X86-BMI1BMI2-NEXT: movl %edi, %edx		; X86-BMI1BMI2-NEXT: movl %edi, %edx
; X86-BMI1BMI2-NEXT: addl $12, %esp		; X86-BMI1BMI2-NEXT: addl $12, %esp
; X86-BMI1BMI2-NEXT: popl %esi		; X86-BMI1BMI2-NEXT: popl %esi
; X86-BMI1BMI2-NEXT: popl %edi		; X86-BMI1BMI2-NEXT: popl %edi
; X86-BMI1BMI2-NEXT: popl %ebx		; X86-BMI1BMI2-NEXT: popl %ebx
; X86-BMI1BMI2-NEXT: popl %ebp		; X86-BMI1BMI2-NEXT: popl %ebp
; X86-BMI1BMI2-NEXT: retl		; X86-BMI1BMI2-NEXT: retl
▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
; X86-NOBMI-NEXT: movl %edi, %esi		; X86-NOBMI-NEXT: movl %edi, %esi
; X86-NOBMI-NEXT: xorl %edi, %edi		; X86-NOBMI-NEXT: xorl %edi, %edi
; X86-NOBMI-NEXT: .LBB43_2:		; X86-NOBMI-NEXT: .LBB43_2:
; X86-NOBMI-NEXT: movb $64, %cl		; X86-NOBMI-NEXT: movb $64, %cl
; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-NOBMI-NEXT: movl $-1, %ebp		; X86-NOBMI-NEXT: movl $-1, %ebp
; X86-NOBMI-NEXT: movl $-1, %ebx		; X86-NOBMI-NEXT: movl $-1, %ebx
; X86-NOBMI-NEXT: shrl %cl, %ebx		; X86-NOBMI-NEXT: shrl %cl, %ebx
; X86-NOBMI-NEXT: shrdl %cl, %ebp, %ebp
; X86-NOBMI-NEXT: testb $32, %cl		; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: je .LBB43_4		; X86-NOBMI-NEXT: je .LBB43_4
; X86-NOBMI-NEXT: # %bb.3:		; X86-NOBMI-NEXT: # %bb.3:
; X86-NOBMI-NEXT: movl %ebx, %ebp		; X86-NOBMI-NEXT: movl %ebx, %ebp
; X86-NOBMI-NEXT: xorl %ebx, %ebx		; X86-NOBMI-NEXT: xorl %ebx, %ebx
; X86-NOBMI-NEXT: .LBB43_4:		; X86-NOBMI-NEXT: .LBB43_4:
; X86-NOBMI-NEXT: subl $8, %esp		; X86-NOBMI-NEXT: subl $8, %esp
; X86-NOBMI-NEXT: pushl %ebx		; X86-NOBMI-NEXT: pushl %ebx
Show All 31 Lines
; X86-BMI1NOTBM-NEXT: movl %edi, %esi		; X86-BMI1NOTBM-NEXT: movl %edi, %esi
; X86-BMI1NOTBM-NEXT: xorl %edi, %edi		; X86-BMI1NOTBM-NEXT: xorl %edi, %edi
; X86-BMI1NOTBM-NEXT: .LBB43_2:		; X86-BMI1NOTBM-NEXT: .LBB43_2:
; X86-BMI1NOTBM-NEXT: movb $64, %cl		; X86-BMI1NOTBM-NEXT: movb $64, %cl
; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-BMI1NOTBM-NEXT: movl $-1, %ebp		; X86-BMI1NOTBM-NEXT: movl $-1, %ebp
; X86-BMI1NOTBM-NEXT: movl $-1, %ebx		; X86-BMI1NOTBM-NEXT: movl $-1, %ebx
; X86-BMI1NOTBM-NEXT: shrl %cl, %ebx		; X86-BMI1NOTBM-NEXT: shrl %cl, %ebx
; X86-BMI1NOTBM-NEXT: shrdl %cl, %ebp, %ebp
; X86-BMI1NOTBM-NEXT: testb $32, %cl		; X86-BMI1NOTBM-NEXT: testb $32, %cl
; X86-BMI1NOTBM-NEXT: je .LBB43_4		; X86-BMI1NOTBM-NEXT: je .LBB43_4
; X86-BMI1NOTBM-NEXT: # %bb.3:		; X86-BMI1NOTBM-NEXT: # %bb.3:
; X86-BMI1NOTBM-NEXT: movl %ebx, %ebp		; X86-BMI1NOTBM-NEXT: movl %ebx, %ebp
; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx		; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx
; X86-BMI1NOTBM-NEXT: .LBB43_4:		; X86-BMI1NOTBM-NEXT: .LBB43_4:
; X86-BMI1NOTBM-NEXT: subl $8, %esp		; X86-BMI1NOTBM-NEXT: subl $8, %esp
; X86-BMI1NOTBM-NEXT: pushl %ebx		; X86-BMI1NOTBM-NEXT: pushl %ebx
Show All 25 Lines
; X86-BMI1BMI2-NEXT: shrxl %ecx, %eax, %edi		; X86-BMI1BMI2-NEXT: shrxl %ecx, %eax, %edi
; X86-BMI1BMI2-NEXT: shrdl %cl, %eax, %esi		; X86-BMI1BMI2-NEXT: shrdl %cl, %eax, %esi
; X86-BMI1BMI2-NEXT: testb $32, %cl		; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB43_2		; X86-BMI1BMI2-NEXT: je .LBB43_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: movl %edi, %esi		; X86-BMI1BMI2-NEXT: movl %edi, %esi
; X86-BMI1BMI2-NEXT: xorl %edi, %edi		; X86-BMI1BMI2-NEXT: xorl %edi, %edi
; X86-BMI1BMI2-NEXT: .LBB43_2:		; X86-BMI1BMI2-NEXT: .LBB43_2:
; X86-BMI1BMI2-NEXT: movb $64, %cl		; X86-BMI1BMI2-NEXT: movb $64, %al
; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %al
; X86-BMI1BMI2-NEXT: movl $-1, %ebx		; X86-BMI1BMI2-NEXT: movl $-1, %ebp
; X86-BMI1BMI2-NEXT: shrxl %ecx, %ebx, %ebp		; X86-BMI1BMI2-NEXT: shrxl %eax, %ebp, %ebx
; X86-BMI1BMI2-NEXT: shrdl %cl, %ebx, %ebx		; X86-BMI1BMI2-NEXT: testb $32, %al
; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB43_4		; X86-BMI1BMI2-NEXT: je .LBB43_4
; X86-BMI1BMI2-NEXT: # %bb.3:		; X86-BMI1BMI2-NEXT: # %bb.3:
; X86-BMI1BMI2-NEXT: movl %ebp, %ebx		; X86-BMI1BMI2-NEXT: movl %ebx, %ebp
; X86-BMI1BMI2-NEXT: xorl %ebp, %ebp		; X86-BMI1BMI2-NEXT: xorl %ebx, %ebx
; X86-BMI1BMI2-NEXT: .LBB43_4:		; X86-BMI1BMI2-NEXT: .LBB43_4:
; X86-BMI1BMI2-NEXT: subl $8, %esp		; X86-BMI1BMI2-NEXT: subl $8, %esp
; X86-BMI1BMI2-NEXT: pushl %ebp
; X86-BMI1BMI2-NEXT: pushl %ebx		; X86-BMI1BMI2-NEXT: pushl %ebx
		; X86-BMI1BMI2-NEXT: pushl %ebp
; X86-BMI1BMI2-NEXT: calll use64		; X86-BMI1BMI2-NEXT: calll use64
; X86-BMI1BMI2-NEXT: addl $16, %esp		; X86-BMI1BMI2-NEXT: addl $16, %esp
; X86-BMI1BMI2-NEXT: andl %ebx, %esi		; X86-BMI1BMI2-NEXT: andl %ebp, %esi
; X86-BMI1BMI2-NEXT: andl %ebp, %edi		; X86-BMI1BMI2-NEXT: andl %ebx, %edi
; X86-BMI1BMI2-NEXT: movl %esi, %eax		; X86-BMI1BMI2-NEXT: movl %esi, %eax
; X86-BMI1BMI2-NEXT: movl %edi, %edx		; X86-BMI1BMI2-NEXT: movl %edi, %edx
; X86-BMI1BMI2-NEXT: addl $12, %esp		; X86-BMI1BMI2-NEXT: addl $12, %esp
; X86-BMI1BMI2-NEXT: popl %esi		; X86-BMI1BMI2-NEXT: popl %esi
; X86-BMI1BMI2-NEXT: popl %edi		; X86-BMI1BMI2-NEXT: popl %edi
; X86-BMI1BMI2-NEXT: popl %ebx		; X86-BMI1BMI2-NEXT: popl %ebx
; X86-BMI1BMI2-NEXT: popl %ebp		; X86-BMI1BMI2-NEXT: popl %ebp
; X86-BMI1BMI2-NEXT: retl		; X86-BMI1BMI2-NEXT: retl
▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines
; X86-NOBMI-NEXT: movl %edi, %esi		; X86-NOBMI-NEXT: movl %edi, %esi
; X86-NOBMI-NEXT: xorl %edi, %edi		; X86-NOBMI-NEXT: xorl %edi, %edi
; X86-NOBMI-NEXT: .LBB44_2:		; X86-NOBMI-NEXT: .LBB44_2:
; X86-NOBMI-NEXT: movb $64, %cl		; X86-NOBMI-NEXT: movb $64, %cl
; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-NOBMI-NEXT: movl $-1, %ebp		; X86-NOBMI-NEXT: movl $-1, %ebp
; X86-NOBMI-NEXT: movl $-1, %ebx		; X86-NOBMI-NEXT: movl $-1, %ebx
; X86-NOBMI-NEXT: shrl %cl, %ebx		; X86-NOBMI-NEXT: shrl %cl, %ebx
; X86-NOBMI-NEXT: shrdl %cl, %ebp, %ebp
; X86-NOBMI-NEXT: testb $32, %cl		; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: je .LBB44_4		; X86-NOBMI-NEXT: je .LBB44_4
; X86-NOBMI-NEXT: # %bb.3:		; X86-NOBMI-NEXT: # %bb.3:
; X86-NOBMI-NEXT: movl %ebx, %ebp		; X86-NOBMI-NEXT: movl %ebx, %ebp
; X86-NOBMI-NEXT: xorl %ebx, %ebx		; X86-NOBMI-NEXT: xorl %ebx, %ebx
; X86-NOBMI-NEXT: .LBB44_4:		; X86-NOBMI-NEXT: .LBB44_4:
; X86-NOBMI-NEXT: subl $8, %esp		; X86-NOBMI-NEXT: subl $8, %esp
; X86-NOBMI-NEXT: pushl %ebx		; X86-NOBMI-NEXT: pushl %ebx
Show All 31 Lines
; X86-BMI1NOTBM-NEXT: movl %edi, %esi		; X86-BMI1NOTBM-NEXT: movl %edi, %esi
; X86-BMI1NOTBM-NEXT: xorl %edi, %edi		; X86-BMI1NOTBM-NEXT: xorl %edi, %edi
; X86-BMI1NOTBM-NEXT: .LBB44_2:		; X86-BMI1NOTBM-NEXT: .LBB44_2:
; X86-BMI1NOTBM-NEXT: movb $64, %cl		; X86-BMI1NOTBM-NEXT: movb $64, %cl
; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-BMI1NOTBM-NEXT: movl $-1, %ebp		; X86-BMI1NOTBM-NEXT: movl $-1, %ebp
; X86-BMI1NOTBM-NEXT: movl $-1, %ebx		; X86-BMI1NOTBM-NEXT: movl $-1, %ebx
; X86-BMI1NOTBM-NEXT: shrl %cl, %ebx		; X86-BMI1NOTBM-NEXT: shrl %cl, %ebx
; X86-BMI1NOTBM-NEXT: shrdl %cl, %ebp, %ebp
; X86-BMI1NOTBM-NEXT: testb $32, %cl		; X86-BMI1NOTBM-NEXT: testb $32, %cl
; X86-BMI1NOTBM-NEXT: je .LBB44_4		; X86-BMI1NOTBM-NEXT: je .LBB44_4
; X86-BMI1NOTBM-NEXT: # %bb.3:		; X86-BMI1NOTBM-NEXT: # %bb.3:
; X86-BMI1NOTBM-NEXT: movl %ebx, %ebp		; X86-BMI1NOTBM-NEXT: movl %ebx, %ebp
; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx		; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx
; X86-BMI1NOTBM-NEXT: .LBB44_4:		; X86-BMI1NOTBM-NEXT: .LBB44_4:
; X86-BMI1NOTBM-NEXT: subl $8, %esp		; X86-BMI1NOTBM-NEXT: subl $8, %esp
; X86-BMI1NOTBM-NEXT: pushl %ebx		; X86-BMI1NOTBM-NEXT: pushl %ebx
Show All 25 Lines
; X86-BMI1BMI2-NEXT: shrxl %ecx, %eax, %edi		; X86-BMI1BMI2-NEXT: shrxl %ecx, %eax, %edi
; X86-BMI1BMI2-NEXT: shrdl %cl, %eax, %esi		; X86-BMI1BMI2-NEXT: shrdl %cl, %eax, %esi
; X86-BMI1BMI2-NEXT: testb $32, %cl		; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB44_2		; X86-BMI1BMI2-NEXT: je .LBB44_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: movl %edi, %esi		; X86-BMI1BMI2-NEXT: movl %edi, %esi
; X86-BMI1BMI2-NEXT: xorl %edi, %edi		; X86-BMI1BMI2-NEXT: xorl %edi, %edi
; X86-BMI1BMI2-NEXT: .LBB44_2:		; X86-BMI1BMI2-NEXT: .LBB44_2:
; X86-BMI1BMI2-NEXT: movb $64, %cl		; X86-BMI1BMI2-NEXT: movb $64, %al
; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %al
; X86-BMI1BMI2-NEXT: movl $-1, %ebx		; X86-BMI1BMI2-NEXT: movl $-1, %ebp
; X86-BMI1BMI2-NEXT: shrxl %ecx, %ebx, %ebp		; X86-BMI1BMI2-NEXT: shrxl %eax, %ebp, %ebx
; X86-BMI1BMI2-NEXT: shrdl %cl, %ebx, %ebx		; X86-BMI1BMI2-NEXT: testb $32, %al
; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB44_4		; X86-BMI1BMI2-NEXT: je .LBB44_4
; X86-BMI1BMI2-NEXT: # %bb.3:		; X86-BMI1BMI2-NEXT: # %bb.3:
; X86-BMI1BMI2-NEXT: movl %ebp, %ebx		; X86-BMI1BMI2-NEXT: movl %ebx, %ebp
; X86-BMI1BMI2-NEXT: xorl %ebp, %ebp		; X86-BMI1BMI2-NEXT: xorl %ebx, %ebx
; X86-BMI1BMI2-NEXT: .LBB44_4:		; X86-BMI1BMI2-NEXT: .LBB44_4:
; X86-BMI1BMI2-NEXT: subl $8, %esp		; X86-BMI1BMI2-NEXT: subl $8, %esp
; X86-BMI1BMI2-NEXT: pushl %ebp
; X86-BMI1BMI2-NEXT: pushl %ebx		; X86-BMI1BMI2-NEXT: pushl %ebx
		; X86-BMI1BMI2-NEXT: pushl %ebp
; X86-BMI1BMI2-NEXT: calll use64		; X86-BMI1BMI2-NEXT: calll use64
; X86-BMI1BMI2-NEXT: addl $16, %esp		; X86-BMI1BMI2-NEXT: addl $16, %esp
; X86-BMI1BMI2-NEXT: andl %ebx, %esi		; X86-BMI1BMI2-NEXT: andl %ebp, %esi
; X86-BMI1BMI2-NEXT: andl %ebp, %edi		; X86-BMI1BMI2-NEXT: andl %ebx, %edi
; X86-BMI1BMI2-NEXT: movl %esi, %eax		; X86-BMI1BMI2-NEXT: movl %esi, %eax
; X86-BMI1BMI2-NEXT: movl %edi, %edx		; X86-BMI1BMI2-NEXT: movl %edi, %edx
; X86-BMI1BMI2-NEXT: addl $12, %esp		; X86-BMI1BMI2-NEXT: addl $12, %esp
; X86-BMI1BMI2-NEXT: popl %esi		; X86-BMI1BMI2-NEXT: popl %esi
; X86-BMI1BMI2-NEXT: popl %edi		; X86-BMI1BMI2-NEXT: popl %edi
; X86-BMI1BMI2-NEXT: popl %ebx		; X86-BMI1BMI2-NEXT: popl %ebx
; X86-BMI1BMI2-NEXT: popl %ebp		; X86-BMI1BMI2-NEXT: popl %ebp
; X86-BMI1BMI2-NEXT: retl		; X86-BMI1BMI2-NEXT: retl
▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
; X86-NOBMI-NEXT: movl %edi, %esi		; X86-NOBMI-NEXT: movl %edi, %esi
; X86-NOBMI-NEXT: xorl %edi, %edi		; X86-NOBMI-NEXT: xorl %edi, %edi
; X86-NOBMI-NEXT: .LBB45_2:		; X86-NOBMI-NEXT: .LBB45_2:
; X86-NOBMI-NEXT: movb $64, %cl		; X86-NOBMI-NEXT: movb $64, %cl
; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-NOBMI-NEXT: movl $-1, %ebp		; X86-NOBMI-NEXT: movl $-1, %ebp
; X86-NOBMI-NEXT: movl $-1, %ebx		; X86-NOBMI-NEXT: movl $-1, %ebx
; X86-NOBMI-NEXT: shrl %cl, %ebx		; X86-NOBMI-NEXT: shrl %cl, %ebx
; X86-NOBMI-NEXT: shrdl %cl, %ebp, %ebp
; X86-NOBMI-NEXT: testb $32, %cl		; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: je .LBB45_4		; X86-NOBMI-NEXT: je .LBB45_4
; X86-NOBMI-NEXT: # %bb.3:		; X86-NOBMI-NEXT: # %bb.3:
; X86-NOBMI-NEXT: movl %ebx, %ebp		; X86-NOBMI-NEXT: movl %ebx, %ebp
; X86-NOBMI-NEXT: xorl %ebx, %ebx		; X86-NOBMI-NEXT: xorl %ebx, %ebx
; X86-NOBMI-NEXT: .LBB45_4:		; X86-NOBMI-NEXT: .LBB45_4:
; X86-NOBMI-NEXT: subl $8, %esp		; X86-NOBMI-NEXT: subl $8, %esp
; X86-NOBMI-NEXT: pushl %ebx		; X86-NOBMI-NEXT: pushl %ebx
Show All 30 Lines
; X86-BMI1NOTBM-NEXT: movl %edi, %esi		; X86-BMI1NOTBM-NEXT: movl %edi, %esi
; X86-BMI1NOTBM-NEXT: xorl %edi, %edi		; X86-BMI1NOTBM-NEXT: xorl %edi, %edi
; X86-BMI1NOTBM-NEXT: .LBB45_2:		; X86-BMI1NOTBM-NEXT: .LBB45_2:
; X86-BMI1NOTBM-NEXT: movb $64, %cl		; X86-BMI1NOTBM-NEXT: movb $64, %cl
; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-BMI1NOTBM-NEXT: movl $-1, %ebp		; X86-BMI1NOTBM-NEXT: movl $-1, %ebp
; X86-BMI1NOTBM-NEXT: movl $-1, %ebx		; X86-BMI1NOTBM-NEXT: movl $-1, %ebx
; X86-BMI1NOTBM-NEXT: shrl %cl, %ebx		; X86-BMI1NOTBM-NEXT: shrl %cl, %ebx
; X86-BMI1NOTBM-NEXT: shrdl %cl, %ebp, %ebp
; X86-BMI1NOTBM-NEXT: testb $32, %cl		; X86-BMI1NOTBM-NEXT: testb $32, %cl
; X86-BMI1NOTBM-NEXT: je .LBB45_4		; X86-BMI1NOTBM-NEXT: je .LBB45_4
; X86-BMI1NOTBM-NEXT: # %bb.3:		; X86-BMI1NOTBM-NEXT: # %bb.3:
; X86-BMI1NOTBM-NEXT: movl %ebx, %ebp		; X86-BMI1NOTBM-NEXT: movl %ebx, %ebp
; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx		; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx
; X86-BMI1NOTBM-NEXT: .LBB45_4:		; X86-BMI1NOTBM-NEXT: .LBB45_4:
; X86-BMI1NOTBM-NEXT: subl $8, %esp		; X86-BMI1NOTBM-NEXT: subl $8, %esp
; X86-BMI1NOTBM-NEXT: pushl %ebx		; X86-BMI1NOTBM-NEXT: pushl %ebx
Show All 24 Lines
; X86-BMI1BMI2-NEXT: shrdl %cl, %eax, %esi		; X86-BMI1BMI2-NEXT: shrdl %cl, %eax, %esi
; X86-BMI1BMI2-NEXT: shrxl %ecx, %eax, %edi		; X86-BMI1BMI2-NEXT: shrxl %ecx, %eax, %edi
; X86-BMI1BMI2-NEXT: testb $32, %cl		; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB45_2		; X86-BMI1BMI2-NEXT: je .LBB45_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: movl %edi, %esi		; X86-BMI1BMI2-NEXT: movl %edi, %esi
; X86-BMI1BMI2-NEXT: xorl %edi, %edi		; X86-BMI1BMI2-NEXT: xorl %edi, %edi
; X86-BMI1BMI2-NEXT: .LBB45_2:		; X86-BMI1BMI2-NEXT: .LBB45_2:
; X86-BMI1BMI2-NEXT: movb $64, %cl		; X86-BMI1BMI2-NEXT: movb $64, %al
; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %al
; X86-BMI1BMI2-NEXT: movl $-1, %ebx		; X86-BMI1BMI2-NEXT: movl $-1, %ebp
; X86-BMI1BMI2-NEXT: shrxl %ecx, %ebx, %ebp		; X86-BMI1BMI2-NEXT: shrxl %eax, %ebp, %ebx
; X86-BMI1BMI2-NEXT: shrdl %cl, %ebx, %ebx		; X86-BMI1BMI2-NEXT: testb $32, %al
; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB45_4		; X86-BMI1BMI2-NEXT: je .LBB45_4
; X86-BMI1BMI2-NEXT: # %bb.3:		; X86-BMI1BMI2-NEXT: # %bb.3:
; X86-BMI1BMI2-NEXT: movl %ebp, %ebx		; X86-BMI1BMI2-NEXT: movl %ebx, %ebp
; X86-BMI1BMI2-NEXT: xorl %ebp, %ebp		; X86-BMI1BMI2-NEXT: xorl %ebx, %ebx
; X86-BMI1BMI2-NEXT: .LBB45_4:		; X86-BMI1BMI2-NEXT: .LBB45_4:
; X86-BMI1BMI2-NEXT: subl $8, %esp		; X86-BMI1BMI2-NEXT: subl $8, %esp
; X86-BMI1BMI2-NEXT: pushl %ebp
; X86-BMI1BMI2-NEXT: pushl %ebx		; X86-BMI1BMI2-NEXT: pushl %ebx
		; X86-BMI1BMI2-NEXT: pushl %ebp
; X86-BMI1BMI2-NEXT: calll use64		; X86-BMI1BMI2-NEXT: calll use64
; X86-BMI1BMI2-NEXT: addl $16, %esp		; X86-BMI1BMI2-NEXT: addl $16, %esp
; X86-BMI1BMI2-NEXT: andl %ebx, %esi		; X86-BMI1BMI2-NEXT: andl %ebp, %esi
; X86-BMI1BMI2-NEXT: andl %ebp, %edi		; X86-BMI1BMI2-NEXT: andl %ebx, %edi
; X86-BMI1BMI2-NEXT: movl %esi, %eax		; X86-BMI1BMI2-NEXT: movl %esi, %eax
; X86-BMI1BMI2-NEXT: movl %edi, %edx		; X86-BMI1BMI2-NEXT: movl %edi, %edx
; X86-BMI1BMI2-NEXT: addl $12, %esp		; X86-BMI1BMI2-NEXT: addl $12, %esp
; X86-BMI1BMI2-NEXT: popl %esi		; X86-BMI1BMI2-NEXT: popl %esi
; X86-BMI1BMI2-NEXT: popl %edi		; X86-BMI1BMI2-NEXT: popl %edi
; X86-BMI1BMI2-NEXT: popl %ebx		; X86-BMI1BMI2-NEXT: popl %ebx
; X86-BMI1BMI2-NEXT: popl %ebp		; X86-BMI1BMI2-NEXT: popl %ebp
; X86-BMI1BMI2-NEXT: retl		; X86-BMI1BMI2-NEXT: retl
▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
; X86-NOBMI-NEXT: movl %edi, %esi		; X86-NOBMI-NEXT: movl %edi, %esi
; X86-NOBMI-NEXT: xorl %edi, %edi		; X86-NOBMI-NEXT: xorl %edi, %edi
; X86-NOBMI-NEXT: .LBB46_2:		; X86-NOBMI-NEXT: .LBB46_2:
; X86-NOBMI-NEXT: movb $64, %cl		; X86-NOBMI-NEXT: movb $64, %cl
; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-NOBMI-NEXT: movl $-1, %ebx		; X86-NOBMI-NEXT: movl $-1, %ebx
; X86-NOBMI-NEXT: movl $-1, %ebp		; X86-NOBMI-NEXT: movl $-1, %ebp
; X86-NOBMI-NEXT: shrl %cl, %ebp		; X86-NOBMI-NEXT: shrl %cl, %ebp
; X86-NOBMI-NEXT: shrdl %cl, %ebx, %ebx
; X86-NOBMI-NEXT: testb $32, %cl		; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: je .LBB46_4		; X86-NOBMI-NEXT: je .LBB46_4
; X86-NOBMI-NEXT: # %bb.3:		; X86-NOBMI-NEXT: # %bb.3:
; X86-NOBMI-NEXT: movl %ebp, %ebx		; X86-NOBMI-NEXT: movl %ebp, %ebx
; X86-NOBMI-NEXT: xorl %ebp, %ebp		; X86-NOBMI-NEXT: xorl %ebp, %ebp
; X86-NOBMI-NEXT: .LBB46_4:		; X86-NOBMI-NEXT: .LBB46_4:
; X86-NOBMI-NEXT: subl $8, %esp		; X86-NOBMI-NEXT: subl $8, %esp
; X86-NOBMI-NEXT: pushl %ebp		; X86-NOBMI-NEXT: pushl %ebp
Show All 35 Lines
; X86-BMI1NOTBM-NEXT: movl %edi, %esi		; X86-BMI1NOTBM-NEXT: movl %edi, %esi
; X86-BMI1NOTBM-NEXT: xorl %edi, %edi		; X86-BMI1NOTBM-NEXT: xorl %edi, %edi
; X86-BMI1NOTBM-NEXT: .LBB46_2:		; X86-BMI1NOTBM-NEXT: .LBB46_2:
; X86-BMI1NOTBM-NEXT: movb $64, %cl		; X86-BMI1NOTBM-NEXT: movb $64, %cl
; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-BMI1NOTBM-NEXT: movl $-1, %ebx		; X86-BMI1NOTBM-NEXT: movl $-1, %ebx
; X86-BMI1NOTBM-NEXT: movl $-1, %ebp		; X86-BMI1NOTBM-NEXT: movl $-1, %ebp
; X86-BMI1NOTBM-NEXT: shrl %cl, %ebp		; X86-BMI1NOTBM-NEXT: shrl %cl, %ebp
; X86-BMI1NOTBM-NEXT: shrdl %cl, %ebx, %ebx
; X86-BMI1NOTBM-NEXT: testb $32, %cl		; X86-BMI1NOTBM-NEXT: testb $32, %cl
; X86-BMI1NOTBM-NEXT: je .LBB46_4		; X86-BMI1NOTBM-NEXT: je .LBB46_4
; X86-BMI1NOTBM-NEXT: # %bb.3:		; X86-BMI1NOTBM-NEXT: # %bb.3:
; X86-BMI1NOTBM-NEXT: movl %ebp, %ebx		; X86-BMI1NOTBM-NEXT: movl %ebp, %ebx
; X86-BMI1NOTBM-NEXT: xorl %ebp, %ebp		; X86-BMI1NOTBM-NEXT: xorl %ebp, %ebp
; X86-BMI1NOTBM-NEXT: .LBB46_4:		; X86-BMI1NOTBM-NEXT: .LBB46_4:
; X86-BMI1NOTBM-NEXT: subl $8, %esp		; X86-BMI1NOTBM-NEXT: subl $8, %esp
; X86-BMI1NOTBM-NEXT: pushl %ebp		; X86-BMI1NOTBM-NEXT: pushl %ebp
Show All 29 Lines
; X86-BMI1BMI2-NEXT: shrdl %cl, %eax, %esi		; X86-BMI1BMI2-NEXT: shrdl %cl, %eax, %esi
; X86-BMI1BMI2-NEXT: shrxl %ecx, %eax, %edi		; X86-BMI1BMI2-NEXT: shrxl %ecx, %eax, %edi
; X86-BMI1BMI2-NEXT: testb $32, %cl		; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB46_2		; X86-BMI1BMI2-NEXT: je .LBB46_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: movl %edi, %esi		; X86-BMI1BMI2-NEXT: movl %edi, %esi
; X86-BMI1BMI2-NEXT: xorl %edi, %edi		; X86-BMI1BMI2-NEXT: xorl %edi, %edi
; X86-BMI1BMI2-NEXT: .LBB46_2:		; X86-BMI1BMI2-NEXT: .LBB46_2:
; X86-BMI1BMI2-NEXT: movb $64, %cl		; X86-BMI1BMI2-NEXT: movb $64, %al
; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %al
; X86-BMI1BMI2-NEXT: movl $-1, %ebp		; X86-BMI1BMI2-NEXT: movl $-1, %ebp
; X86-BMI1BMI2-NEXT: shrxl %ecx, %ebp, %ebx		; X86-BMI1BMI2-NEXT: shrxl %eax, %ebp, %ebx
; X86-BMI1BMI2-NEXT: shrdl %cl, %ebp, %ebp		; X86-BMI1BMI2-NEXT: testb $32, %al
; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB46_4		; X86-BMI1BMI2-NEXT: je .LBB46_4
; X86-BMI1BMI2-NEXT: # %bb.3:		; X86-BMI1BMI2-NEXT: # %bb.3:
; X86-BMI1BMI2-NEXT: movl %ebx, %ebp		; X86-BMI1BMI2-NEXT: movl %ebx, %ebp
; X86-BMI1BMI2-NEXT: xorl %ebx, %ebx		; X86-BMI1BMI2-NEXT: xorl %ebx, %ebx
; X86-BMI1BMI2-NEXT: .LBB46_4:		; X86-BMI1BMI2-NEXT: .LBB46_4:
; X86-BMI1BMI2-NEXT: subl $8, %esp		; X86-BMI1BMI2-NEXT: subl $8, %esp
; X86-BMI1BMI2-NEXT: pushl %ebx		; X86-BMI1BMI2-NEXT: pushl %ebx
; X86-BMI1BMI2-NEXT: pushl %ebp		; X86-BMI1BMI2-NEXT: pushl %ebp
▲ Show 20 Lines • Show All 108 Lines • ▼ Show 20 Lines
; X86-NOBMI-NEXT: shrdl %cl, %esi, %eax		; X86-NOBMI-NEXT: shrdl %cl, %esi, %eax
; X86-NOBMI-NEXT: testb $32, %cl		; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: jne .LBB47_2		; X86-NOBMI-NEXT: jne .LBB47_2
; X86-NOBMI-NEXT: # %bb.1:		; X86-NOBMI-NEXT: # %bb.1:
; X86-NOBMI-NEXT: movl %eax, %edx		; X86-NOBMI-NEXT: movl %eax, %edx
; X86-NOBMI-NEXT: .LBB47_2:		; X86-NOBMI-NEXT: .LBB47_2:
; X86-NOBMI-NEXT: movb $64, %cl		; X86-NOBMI-NEXT: movb $64, %cl
; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-NOBMI-NEXT: movl $-1, %esi
; X86-NOBMI-NEXT: movl $-1, %eax		; X86-NOBMI-NEXT: movl $-1, %eax
; X86-NOBMI-NEXT: shrl %cl, %eax		; X86-NOBMI-NEXT: shrl %cl, %eax
; X86-NOBMI-NEXT: shrdl %cl, %esi, %esi
; X86-NOBMI-NEXT: testb $32, %cl		; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: jne .LBB47_4		; X86-NOBMI-NEXT: jne .LBB47_4
; X86-NOBMI-NEXT: # %bb.3:		; X86-NOBMI-NEXT: # %bb.3:
; X86-NOBMI-NEXT: movl %esi, %eax		; X86-NOBMI-NEXT: movl $-1, %eax
; X86-NOBMI-NEXT: .LBB47_4:		; X86-NOBMI-NEXT: .LBB47_4:
; X86-NOBMI-NEXT: andl %edx, %eax		; X86-NOBMI-NEXT: andl %edx, %eax
; X86-NOBMI-NEXT: popl %esi		; X86-NOBMI-NEXT: popl %esi
; X86-NOBMI-NEXT: retl		; X86-NOBMI-NEXT: retl
;		;
; X86-BMI1NOTBM-LABEL: bextr64_32_c0:		; X86-BMI1NOTBM-LABEL: bextr64_32_c0:
; X86-BMI1NOTBM: # %bb.0:		; X86-BMI1NOTBM: # %bb.0:
; X86-BMI1NOTBM-NEXT: pushl %esi		; X86-BMI1NOTBM-NEXT: pushl %esi
; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %eax		; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %eax
; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %esi		; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %esi
; X86-BMI1NOTBM-NEXT: movl %esi, %edx		; X86-BMI1NOTBM-NEXT: movl %esi, %edx
; X86-BMI1NOTBM-NEXT: shrl %cl, %edx		; X86-BMI1NOTBM-NEXT: shrl %cl, %edx
; X86-BMI1NOTBM-NEXT: shrdl %cl, %esi, %eax		; X86-BMI1NOTBM-NEXT: shrdl %cl, %esi, %eax
; X86-BMI1NOTBM-NEXT: testb $32, %cl		; X86-BMI1NOTBM-NEXT: testb $32, %cl
; X86-BMI1NOTBM-NEXT: jne .LBB47_2		; X86-BMI1NOTBM-NEXT: jne .LBB47_2
; X86-BMI1NOTBM-NEXT: # %bb.1:		; X86-BMI1NOTBM-NEXT: # %bb.1:
; X86-BMI1NOTBM-NEXT: movl %eax, %edx		; X86-BMI1NOTBM-NEXT: movl %eax, %edx
; X86-BMI1NOTBM-NEXT: .LBB47_2:		; X86-BMI1NOTBM-NEXT: .LBB47_2:
; X86-BMI1NOTBM-NEXT: movb $64, %cl		; X86-BMI1NOTBM-NEXT: movb $64, %cl
; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-BMI1NOTBM-NEXT: movl $-1, %esi
; X86-BMI1NOTBM-NEXT: movl $-1, %eax		; X86-BMI1NOTBM-NEXT: movl $-1, %eax
; X86-BMI1NOTBM-NEXT: shrl %cl, %eax		; X86-BMI1NOTBM-NEXT: shrl %cl, %eax
; X86-BMI1NOTBM-NEXT: shrdl %cl, %esi, %esi
; X86-BMI1NOTBM-NEXT: testb $32, %cl		; X86-BMI1NOTBM-NEXT: testb $32, %cl
; X86-BMI1NOTBM-NEXT: jne .LBB47_4		; X86-BMI1NOTBM-NEXT: jne .LBB47_4
; X86-BMI1NOTBM-NEXT: # %bb.3:		; X86-BMI1NOTBM-NEXT: # %bb.3:
; X86-BMI1NOTBM-NEXT: movl %esi, %eax		; X86-BMI1NOTBM-NEXT: movl $-1, %eax
; X86-BMI1NOTBM-NEXT: .LBB47_4:		; X86-BMI1NOTBM-NEXT: .LBB47_4:
; X86-BMI1NOTBM-NEXT: andl %edx, %eax		; X86-BMI1NOTBM-NEXT: andl %edx, %eax
; X86-BMI1NOTBM-NEXT: popl %esi		; X86-BMI1NOTBM-NEXT: popl %esi
; X86-BMI1NOTBM-NEXT: retl		; X86-BMI1NOTBM-NEXT: retl
;		;
; X86-BMI1BMI2-LABEL: bextr64_32_c0:		; X86-BMI1BMI2-LABEL: bextr64_32_c0:
; X86-BMI1BMI2: # %bb.0:		; X86-BMI1BMI2: # %bb.0:
; X86-BMI1BMI2-NEXT: pushl %esi
; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %edx		; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %edx
; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %eax		; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %eax
; X86-BMI1BMI2-NEXT: shrdl %cl, %eax, %edx		; X86-BMI1BMI2-NEXT: shrdl %cl, %eax, %edx
; X86-BMI1BMI2-NEXT: testb $32, %cl		; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB47_2		; X86-BMI1BMI2-NEXT: je .LBB47_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: shrxl %ecx, %eax, %edx		; X86-BMI1BMI2-NEXT: shrxl %ecx, %eax, %edx
; X86-BMI1BMI2-NEXT: .LBB47_2:		; X86-BMI1BMI2-NEXT: .LBB47_2:
; X86-BMI1BMI2-NEXT: movb $64, %cl		; X86-BMI1BMI2-NEXT: movb $64, %cl
; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-BMI1BMI2-NEXT: movl $-1, %esi
; X86-BMI1BMI2-NEXT: movl $-1, %eax		; X86-BMI1BMI2-NEXT: movl $-1, %eax
; X86-BMI1BMI2-NEXT: shrdl %cl, %eax, %eax
; X86-BMI1BMI2-NEXT: testb $32, %cl		; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB47_4		; X86-BMI1BMI2-NEXT: je .LBB47_4
; X86-BMI1BMI2-NEXT: # %bb.3:		; X86-BMI1BMI2-NEXT: # %bb.3:
; X86-BMI1BMI2-NEXT: shrxl %ecx, %esi, %eax		; X86-BMI1BMI2-NEXT: shrxl %ecx, %eax, %eax
; X86-BMI1BMI2-NEXT: .LBB47_4:		; X86-BMI1BMI2-NEXT: .LBB47_4:
; X86-BMI1BMI2-NEXT: andl %edx, %eax		; X86-BMI1BMI2-NEXT: andl %edx, %eax
; X86-BMI1BMI2-NEXT: popl %esi
; X86-BMI1BMI2-NEXT: retl		; X86-BMI1BMI2-NEXT: retl
;		;
; X64-NOBMI-LABEL: bextr64_32_c0:		; X64-NOBMI-LABEL: bextr64_32_c0:
; X64-NOBMI: # %bb.0:		; X64-NOBMI: # %bb.0:
; X64-NOBMI-NEXT: movq %rsi, %rcx		; X64-NOBMI-NEXT: movq %rsi, %rcx
; X64-NOBMI-NEXT: # kill: def $cl killed $cl killed $rcx		; X64-NOBMI-NEXT: # kill: def $cl killed $cl killed $rcx
; X64-NOBMI-NEXT: shrq %cl, %rdi		; X64-NOBMI-NEXT: shrq %cl, %rdi
; X64-NOBMI-NEXT: negb %dl		; X64-NOBMI-NEXT: negb %dl
▲ Show 20 Lines • Show All 2,524 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/extract-lowbits.ll

Show First 20 Lines • Show All 1,350 Lines • ▼ Show 20 Lines	; X64-BMI1BMI2-NEXT: retq
ret i32 %masked		ret i32 %masked
}		}

; 64-bit		; 64-bit

define i64 @bzhi64_b0(i64 %val, i64 %numlowbits) nounwind {		define i64 @bzhi64_b0(i64 %val, i64 %numlowbits) nounwind {
; X86-NOBMI-LABEL: bzhi64_b0:		; X86-NOBMI-LABEL: bzhi64_b0:
; X86-NOBMI: # %bb.0:		; X86-NOBMI: # %bb.0:
		; X86-NOBMI-NEXT: pushl %esi
; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-NOBMI-NEXT: movl $-1, %edx		; X86-NOBMI-NEXT: movl $-1, %edx
; X86-NOBMI-NEXT: movl $-1, %eax		; X86-NOBMI-NEXT: movl $-1, %esi
; X86-NOBMI-NEXT: shll %cl, %eax		; X86-NOBMI-NEXT: shll %cl, %esi
; X86-NOBMI-NEXT: shldl %cl, %edx, %edx
; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: je .LBB20_2
; X86-NOBMI-NEXT: # %bb.1:
; X86-NOBMI-NEXT: movl %eax, %edx
; X86-NOBMI-NEXT: xorl %eax, %eax		; X86-NOBMI-NEXT: xorl %eax, %eax
; X86-NOBMI-NEXT: .LBB20_2:		; X86-NOBMI-NEXT: testb $32, %cl
		; X86-NOBMI-NEXT: jne .LBB20_1
		; X86-NOBMI-NEXT: # %bb.2:
		; X86-NOBMI-NEXT: movl %esi, %eax
		; X86-NOBMI-NEXT: jmp .LBB20_3
		; X86-NOBMI-NEXT: .LBB20_1:
		; X86-NOBMI-NEXT: movl %esi, %edx
		; X86-NOBMI-NEXT: .LBB20_3:
; X86-NOBMI-NEXT: notl %edx		; X86-NOBMI-NEXT: notl %edx
; X86-NOBMI-NEXT: notl %eax		; X86-NOBMI-NEXT: notl %eax
; X86-NOBMI-NEXT: andl {{[0-9]+}}(%esp), %edx
; X86-NOBMI-NEXT: andl {{[0-9]+}}(%esp), %eax		; X86-NOBMI-NEXT: andl {{[0-9]+}}(%esp), %eax
		; X86-NOBMI-NEXT: andl {{[0-9]+}}(%esp), %edx
		; X86-NOBMI-NEXT: popl %esi
; X86-NOBMI-NEXT: retl		; X86-NOBMI-NEXT: retl
;		;
; X86-BMI1NOTBM-LABEL: bzhi64_b0:		; X86-BMI1NOTBM-LABEL: bzhi64_b0:
; X86-BMI1NOTBM: # %bb.0:		; X86-BMI1NOTBM: # %bb.0:
; X86-BMI1NOTBM-NEXT: pushl %esi
; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %cl
		; X86-BMI1NOTBM-NEXT: movl $-1, %edx
; X86-BMI1NOTBM-NEXT: movl $-1, %eax		; X86-BMI1NOTBM-NEXT: movl $-1, %eax
; X86-BMI1NOTBM-NEXT: movl $-1, %esi		; X86-BMI1NOTBM-NEXT: shll %cl, %eax
; X86-BMI1NOTBM-NEXT: shll %cl, %esi
; X86-BMI1NOTBM-NEXT: shldl %cl, %eax, %eax
; X86-BMI1NOTBM-NEXT: testb $32, %cl		; X86-BMI1NOTBM-NEXT: testb $32, %cl
; X86-BMI1NOTBM-NEXT: je .LBB20_2		; X86-BMI1NOTBM-NEXT: je .LBB20_2
; X86-BMI1NOTBM-NEXT: # %bb.1:		; X86-BMI1NOTBM-NEXT: # %bb.1:
; X86-BMI1NOTBM-NEXT: movl %esi, %eax		; X86-BMI1NOTBM-NEXT: movl %eax, %edx
; X86-BMI1NOTBM-NEXT: xorl %esi, %esi		; X86-BMI1NOTBM-NEXT: xorl %eax, %eax
; X86-BMI1NOTBM-NEXT: .LBB20_2:		; X86-BMI1NOTBM-NEXT: .LBB20_2:
; X86-BMI1NOTBM-NEXT: andnl {{[0-9]+}}(%esp), %eax, %edx		; X86-BMI1NOTBM-NEXT: andnl {{[0-9]+}}(%esp), %eax, %eax
; X86-BMI1NOTBM-NEXT: andnl {{[0-9]+}}(%esp), %esi, %eax		; X86-BMI1NOTBM-NEXT: andnl {{[0-9]+}}(%esp), %edx, %edx
; X86-BMI1NOTBM-NEXT: popl %esi
; X86-BMI1NOTBM-NEXT: retl		; X86-BMI1NOTBM-NEXT: retl
;		;
; X86-BMI1BMI2-LABEL: bzhi64_b0:		; X86-BMI1BMI2-LABEL: bzhi64_b0:
; X86-BMI1BMI2: # %bb.0:		; X86-BMI1BMI2: # %bb.0:
; X86-BMI1BMI2-NEXT: pushl %esi		; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %dl
; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: movl $-1, %ecx
; X86-BMI1BMI2-NEXT: movl $-1, %eax		; X86-BMI1BMI2-NEXT: shlxl %edx, %ecx, %eax
; X86-BMI1BMI2-NEXT: shlxl %ecx, %eax, %esi		; X86-BMI1BMI2-NEXT: testb $32, %dl
; X86-BMI1BMI2-NEXT: shldl %cl, %eax, %eax
; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB20_2		; X86-BMI1BMI2-NEXT: je .LBB20_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: movl %esi, %eax		; X86-BMI1BMI2-NEXT: movl %eax, %ecx
; X86-BMI1BMI2-NEXT: xorl %esi, %esi		; X86-BMI1BMI2-NEXT: xorl %eax, %eax
; X86-BMI1BMI2-NEXT: .LBB20_2:		; X86-BMI1BMI2-NEXT: .LBB20_2:
; X86-BMI1BMI2-NEXT: andnl {{[0-9]+}}(%esp), %eax, %edx		; X86-BMI1BMI2-NEXT: andnl {{[0-9]+}}(%esp), %eax, %eax
; X86-BMI1BMI2-NEXT: andnl {{[0-9]+}}(%esp), %esi, %eax		; X86-BMI1BMI2-NEXT: andnl {{[0-9]+}}(%esp), %ecx, %edx
; X86-BMI1BMI2-NEXT: popl %esi
; X86-BMI1BMI2-NEXT: retl		; X86-BMI1BMI2-NEXT: retl
;		;
; X64-NOBMI-LABEL: bzhi64_b0:		; X64-NOBMI-LABEL: bzhi64_b0:
; X64-NOBMI: # %bb.0:		; X64-NOBMI: # %bb.0:
; X64-NOBMI-NEXT: movq %rsi, %rcx		; X64-NOBMI-NEXT: movq %rsi, %rcx
; X64-NOBMI-NEXT: movq $-1, %rax		; X64-NOBMI-NEXT: movq $-1, %rax
; X64-NOBMI-NEXT: # kill: def $cl killed $cl killed $rcx		; X64-NOBMI-NEXT: # kill: def $cl killed $cl killed $rcx
; X64-NOBMI-NEXT: shlq %cl, %rax		; X64-NOBMI-NEXT: shlq %cl, %rax
Show All 15 Lines	; X64-BMI1BMI2-NEXT: retq
%mask = xor i64 %notmask, -1		%mask = xor i64 %notmask, -1
%masked = and i64 %mask, %val		%masked = and i64 %mask, %val
ret i64 %masked		ret i64 %masked
}		}

define i64 @bzhi64_b1_indexzext(i64 %val, i8 zeroext %numlowbits) nounwind {		define i64 @bzhi64_b1_indexzext(i64 %val, i8 zeroext %numlowbits) nounwind {
; X86-NOBMI-LABEL: bzhi64_b1_indexzext:		; X86-NOBMI-LABEL: bzhi64_b1_indexzext:
; X86-NOBMI: # %bb.0:		; X86-NOBMI: # %bb.0:
		; X86-NOBMI-NEXT: pushl %esi
; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-NOBMI-NEXT: movl $-1, %edx		; X86-NOBMI-NEXT: movl $-1, %edx
; X86-NOBMI-NEXT: movl $-1, %eax		; X86-NOBMI-NEXT: movl $-1, %esi
; X86-NOBMI-NEXT: shll %cl, %eax		; X86-NOBMI-NEXT: shll %cl, %esi
; X86-NOBMI-NEXT: shldl %cl, %edx, %edx
; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: je .LBB21_2
; X86-NOBMI-NEXT: # %bb.1:
; X86-NOBMI-NEXT: movl %eax, %edx
; X86-NOBMI-NEXT: xorl %eax, %eax		; X86-NOBMI-NEXT: xorl %eax, %eax
; X86-NOBMI-NEXT: .LBB21_2:		; X86-NOBMI-NEXT: testb $32, %cl
		; X86-NOBMI-NEXT: jne .LBB21_1
		; X86-NOBMI-NEXT: # %bb.2:
		; X86-NOBMI-NEXT: movl %esi, %eax
		; X86-NOBMI-NEXT: jmp .LBB21_3
		; X86-NOBMI-NEXT: .LBB21_1:
		; X86-NOBMI-NEXT: movl %esi, %edx
		; X86-NOBMI-NEXT: .LBB21_3:
; X86-NOBMI-NEXT: notl %edx		; X86-NOBMI-NEXT: notl %edx
; X86-NOBMI-NEXT: notl %eax		; X86-NOBMI-NEXT: notl %eax
; X86-NOBMI-NEXT: andl {{[0-9]+}}(%esp), %edx
; X86-NOBMI-NEXT: andl {{[0-9]+}}(%esp), %eax		; X86-NOBMI-NEXT: andl {{[0-9]+}}(%esp), %eax
		; X86-NOBMI-NEXT: andl {{[0-9]+}}(%esp), %edx
		; X86-NOBMI-NEXT: popl %esi
; X86-NOBMI-NEXT: retl		; X86-NOBMI-NEXT: retl
;		;
; X86-BMI1NOTBM-LABEL: bzhi64_b1_indexzext:		; X86-BMI1NOTBM-LABEL: bzhi64_b1_indexzext:
; X86-BMI1NOTBM: # %bb.0:		; X86-BMI1NOTBM: # %bb.0:
; X86-BMI1NOTBM-NEXT: pushl %esi
; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %cl
		; X86-BMI1NOTBM-NEXT: movl $-1, %edx
; X86-BMI1NOTBM-NEXT: movl $-1, %eax		; X86-BMI1NOTBM-NEXT: movl $-1, %eax
; X86-BMI1NOTBM-NEXT: movl $-1, %esi		; X86-BMI1NOTBM-NEXT: shll %cl, %eax
; X86-BMI1NOTBM-NEXT: shll %cl, %esi
; X86-BMI1NOTBM-NEXT: shldl %cl, %eax, %eax
; X86-BMI1NOTBM-NEXT: testb $32, %cl		; X86-BMI1NOTBM-NEXT: testb $32, %cl
; X86-BMI1NOTBM-NEXT: je .LBB21_2		; X86-BMI1NOTBM-NEXT: je .LBB21_2
; X86-BMI1NOTBM-NEXT: # %bb.1:		; X86-BMI1NOTBM-NEXT: # %bb.1:
; X86-BMI1NOTBM-NEXT: movl %esi, %eax		; X86-BMI1NOTBM-NEXT: movl %eax, %edx
; X86-BMI1NOTBM-NEXT: xorl %esi, %esi		; X86-BMI1NOTBM-NEXT: xorl %eax, %eax
; X86-BMI1NOTBM-NEXT: .LBB21_2:		; X86-BMI1NOTBM-NEXT: .LBB21_2:
; X86-BMI1NOTBM-NEXT: andnl {{[0-9]+}}(%esp), %eax, %edx		; X86-BMI1NOTBM-NEXT: andnl {{[0-9]+}}(%esp), %eax, %eax
; X86-BMI1NOTBM-NEXT: andnl {{[0-9]+}}(%esp), %esi, %eax		; X86-BMI1NOTBM-NEXT: andnl {{[0-9]+}}(%esp), %edx, %edx
; X86-BMI1NOTBM-NEXT: popl %esi
; X86-BMI1NOTBM-NEXT: retl		; X86-BMI1NOTBM-NEXT: retl
;		;
; X86-BMI1BMI2-LABEL: bzhi64_b1_indexzext:		; X86-BMI1BMI2-LABEL: bzhi64_b1_indexzext:
; X86-BMI1BMI2: # %bb.0:		; X86-BMI1BMI2: # %bb.0:
; X86-BMI1BMI2-NEXT: pushl %esi		; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %dl
; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: movl $-1, %ecx
; X86-BMI1BMI2-NEXT: movl $-1, %eax		; X86-BMI1BMI2-NEXT: shlxl %edx, %ecx, %eax
; X86-BMI1BMI2-NEXT: shlxl %ecx, %eax, %esi		; X86-BMI1BMI2-NEXT: testb $32, %dl
; X86-BMI1BMI2-NEXT: shldl %cl, %eax, %eax
; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB21_2		; X86-BMI1BMI2-NEXT: je .LBB21_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: movl %esi, %eax		; X86-BMI1BMI2-NEXT: movl %eax, %ecx
; X86-BMI1BMI2-NEXT: xorl %esi, %esi		; X86-BMI1BMI2-NEXT: xorl %eax, %eax
; X86-BMI1BMI2-NEXT: .LBB21_2:		; X86-BMI1BMI2-NEXT: .LBB21_2:
; X86-BMI1BMI2-NEXT: andnl {{[0-9]+}}(%esp), %eax, %edx		; X86-BMI1BMI2-NEXT: andnl {{[0-9]+}}(%esp), %eax, %eax
; X86-BMI1BMI2-NEXT: andnl {{[0-9]+}}(%esp), %esi, %eax		; X86-BMI1BMI2-NEXT: andnl {{[0-9]+}}(%esp), %ecx, %edx
; X86-BMI1BMI2-NEXT: popl %esi
; X86-BMI1BMI2-NEXT: retl		; X86-BMI1BMI2-NEXT: retl
;		;
; X64-NOBMI-LABEL: bzhi64_b1_indexzext:		; X64-NOBMI-LABEL: bzhi64_b1_indexzext:
; X64-NOBMI: # %bb.0:		; X64-NOBMI: # %bb.0:
; X64-NOBMI-NEXT: movl %esi, %ecx		; X64-NOBMI-NEXT: movl %esi, %ecx
; X64-NOBMI-NEXT: movq $-1, %rax		; X64-NOBMI-NEXT: movq $-1, %rax
; X64-NOBMI-NEXT: # kill: def $cl killed $cl killed $ecx		; X64-NOBMI-NEXT: # kill: def $cl killed $cl killed $ecx
; X64-NOBMI-NEXT: shlq %cl, %rax		; X64-NOBMI-NEXT: shlq %cl, %rax
Show All 18 Lines	; X64-BMI1BMI2-NEXT: retq
%mask = xor i64 %notmask, -1		%mask = xor i64 %notmask, -1
%masked = and i64 %mask, %val		%masked = and i64 %mask, %val
ret i64 %masked		ret i64 %masked
}		}

define i64 @bzhi64_b2_load(i64* %w, i64 %numlowbits) nounwind {		define i64 @bzhi64_b2_load(i64* %w, i64 %numlowbits) nounwind {
; X86-NOBMI-LABEL: bzhi64_b2_load:		; X86-NOBMI-LABEL: bzhi64_b2_load:
; X86-NOBMI: # %bb.0:		; X86-NOBMI: # %bb.0:
		; X86-NOBMI-NEXT: pushl %edi
; X86-NOBMI-NEXT: pushl %esi		; X86-NOBMI-NEXT: pushl %esi
; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %esi		; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %esi
; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-NOBMI-NEXT: movl $-1, %edx		; X86-NOBMI-NEXT: movl $-1, %edx
; X86-NOBMI-NEXT: movl $-1, %eax		; X86-NOBMI-NEXT: movl $-1, %edi
; X86-NOBMI-NEXT: shll %cl, %eax		; X86-NOBMI-NEXT: shll %cl, %edi
; X86-NOBMI-NEXT: shldl %cl, %edx, %edx
; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: je .LBB22_2
; X86-NOBMI-NEXT: # %bb.1:
; X86-NOBMI-NEXT: movl %eax, %edx
; X86-NOBMI-NEXT: xorl %eax, %eax		; X86-NOBMI-NEXT: xorl %eax, %eax
; X86-NOBMI-NEXT: .LBB22_2:		; X86-NOBMI-NEXT: testb $32, %cl
		; X86-NOBMI-NEXT: jne .LBB22_1
		; X86-NOBMI-NEXT: # %bb.2:
		; X86-NOBMI-NEXT: movl %edi, %eax
		; X86-NOBMI-NEXT: jmp .LBB22_3
		; X86-NOBMI-NEXT: .LBB22_1:
		; X86-NOBMI-NEXT: movl %edi, %edx
		; X86-NOBMI-NEXT: .LBB22_3:
; X86-NOBMI-NEXT: notl %edx		; X86-NOBMI-NEXT: notl %edx
; X86-NOBMI-NEXT: notl %eax		; X86-NOBMI-NEXT: notl %eax
; X86-NOBMI-NEXT: andl 4(%esi), %edx
; X86-NOBMI-NEXT: andl (%esi), %eax		; X86-NOBMI-NEXT: andl (%esi), %eax
		; X86-NOBMI-NEXT: andl 4(%esi), %edx
; X86-NOBMI-NEXT: popl %esi		; X86-NOBMI-NEXT: popl %esi
		; X86-NOBMI-NEXT: popl %edi
; X86-NOBMI-NEXT: retl		; X86-NOBMI-NEXT: retl
;		;
; X86-BMI1NOTBM-LABEL: bzhi64_b2_load:		; X86-BMI1NOTBM-LABEL: bzhi64_b2_load:
; X86-BMI1NOTBM: # %bb.0:		; X86-BMI1NOTBM: # %bb.0:
; X86-BMI1NOTBM-NEXT: pushl %esi		; X86-BMI1NOTBM-NEXT: pushl %esi
; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %eax		; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %edx
; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-BMI1NOTBM-NEXT: movl $-1, %edx
; X86-BMI1NOTBM-NEXT: movl $-1, %esi		; X86-BMI1NOTBM-NEXT: movl $-1, %esi
; X86-BMI1NOTBM-NEXT: shll %cl, %esi		; X86-BMI1NOTBM-NEXT: movl $-1, %eax
; X86-BMI1NOTBM-NEXT: shldl %cl, %edx, %edx		; X86-BMI1NOTBM-NEXT: shll %cl, %eax
; X86-BMI1NOTBM-NEXT: testb $32, %cl		; X86-BMI1NOTBM-NEXT: testb $32, %cl
; X86-BMI1NOTBM-NEXT: je .LBB22_2		; X86-BMI1NOTBM-NEXT: je .LBB22_2
; X86-BMI1NOTBM-NEXT: # %bb.1:		; X86-BMI1NOTBM-NEXT: # %bb.1:
; X86-BMI1NOTBM-NEXT: movl %esi, %edx		; X86-BMI1NOTBM-NEXT: movl %eax, %esi
; X86-BMI1NOTBM-NEXT: xorl %esi, %esi		; X86-BMI1NOTBM-NEXT: xorl %eax, %eax
; X86-BMI1NOTBM-NEXT: .LBB22_2:		; X86-BMI1NOTBM-NEXT: .LBB22_2:
; X86-BMI1NOTBM-NEXT: andnl 4(%eax), %edx, %edx		; X86-BMI1NOTBM-NEXT: andnl (%edx), %eax, %eax
; X86-BMI1NOTBM-NEXT: andnl (%eax), %esi, %eax		; X86-BMI1NOTBM-NEXT: andnl 4(%edx), %esi, %edx
; X86-BMI1NOTBM-NEXT: popl %esi		; X86-BMI1NOTBM-NEXT: popl %esi
; X86-BMI1NOTBM-NEXT: retl		; X86-BMI1NOTBM-NEXT: retl
;		;
; X86-BMI1BMI2-LABEL: bzhi64_b2_load:		; X86-BMI1BMI2-LABEL: bzhi64_b2_load:
; X86-BMI1BMI2: # %bb.0:		; X86-BMI1BMI2: # %bb.0:
; X86-BMI1BMI2-NEXT: pushl %esi		; X86-BMI1BMI2-NEXT: pushl %ebx
; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %eax		; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %ecx
; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %bl
; X86-BMI1BMI2-NEXT: movl $-1, %edx		; X86-BMI1BMI2-NEXT: movl $-1, %edx
; X86-BMI1BMI2-NEXT: shlxl %ecx, %edx, %esi		; X86-BMI1BMI2-NEXT: shlxl %ebx, %edx, %eax
; X86-BMI1BMI2-NEXT: shldl %cl, %edx, %edx		; X86-BMI1BMI2-NEXT: testb $32, %bl
; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB22_2		; X86-BMI1BMI2-NEXT: je .LBB22_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: movl %esi, %edx		; X86-BMI1BMI2-NEXT: movl %eax, %edx
; X86-BMI1BMI2-NEXT: xorl %esi, %esi		; X86-BMI1BMI2-NEXT: xorl %eax, %eax
; X86-BMI1BMI2-NEXT: .LBB22_2:		; X86-BMI1BMI2-NEXT: .LBB22_2:
; X86-BMI1BMI2-NEXT: andnl 4(%eax), %edx, %edx		; X86-BMI1BMI2-NEXT: andnl (%ecx), %eax, %eax
; X86-BMI1BMI2-NEXT: andnl (%eax), %esi, %eax		; X86-BMI1BMI2-NEXT: andnl 4(%ecx), %edx, %edx
; X86-BMI1BMI2-NEXT: popl %esi		; X86-BMI1BMI2-NEXT: popl %ebx
; X86-BMI1BMI2-NEXT: retl		; X86-BMI1BMI2-NEXT: retl
;		;
; X64-NOBMI-LABEL: bzhi64_b2_load:		; X64-NOBMI-LABEL: bzhi64_b2_load:
; X64-NOBMI: # %bb.0:		; X64-NOBMI: # %bb.0:
; X64-NOBMI-NEXT: movq %rsi, %rcx		; X64-NOBMI-NEXT: movq %rsi, %rcx
; X64-NOBMI-NEXT: movq $-1, %rax		; X64-NOBMI-NEXT: movq $-1, %rax
; X64-NOBMI-NEXT: # kill: def $cl killed $cl killed $rcx		; X64-NOBMI-NEXT: # kill: def $cl killed $cl killed $rcx
; X64-NOBMI-NEXT: shlq %cl, %rax		; X64-NOBMI-NEXT: shlq %cl, %rax
Show All 16 Lines	; X64-BMI1BMI2-NEXT: retq
%mask = xor i64 %notmask, -1		%mask = xor i64 %notmask, -1
%masked = and i64 %mask, %val		%masked = and i64 %mask, %val
ret i64 %masked		ret i64 %masked
}		}

define i64 @bzhi64_b3_load_indexzext(i64* %w, i8 zeroext %numlowbits) nounwind {		define i64 @bzhi64_b3_load_indexzext(i64* %w, i8 zeroext %numlowbits) nounwind {
; X86-NOBMI-LABEL: bzhi64_b3_load_indexzext:		; X86-NOBMI-LABEL: bzhi64_b3_load_indexzext:
; X86-NOBMI: # %bb.0:		; X86-NOBMI: # %bb.0:
		; X86-NOBMI-NEXT: pushl %edi
; X86-NOBMI-NEXT: pushl %esi		; X86-NOBMI-NEXT: pushl %esi
; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %esi		; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %esi
; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-NOBMI-NEXT: movl $-1, %edx		; X86-NOBMI-NEXT: movl $-1, %edx
; X86-NOBMI-NEXT: movl $-1, %eax		; X86-NOBMI-NEXT: movl $-1, %edi
; X86-NOBMI-NEXT: shll %cl, %eax		; X86-NOBMI-NEXT: shll %cl, %edi
; X86-NOBMI-NEXT: shldl %cl, %edx, %edx
; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: je .LBB23_2
; X86-NOBMI-NEXT: # %bb.1:
; X86-NOBMI-NEXT: movl %eax, %edx
; X86-NOBMI-NEXT: xorl %eax, %eax		; X86-NOBMI-NEXT: xorl %eax, %eax
; X86-NOBMI-NEXT: .LBB23_2:		; X86-NOBMI-NEXT: testb $32, %cl
		; X86-NOBMI-NEXT: jne .LBB23_1
		; X86-NOBMI-NEXT: # %bb.2:
		; X86-NOBMI-NEXT: movl %edi, %eax
		; X86-NOBMI-NEXT: jmp .LBB23_3
		; X86-NOBMI-NEXT: .LBB23_1:
		; X86-NOBMI-NEXT: movl %edi, %edx
		; X86-NOBMI-NEXT: .LBB23_3:
; X86-NOBMI-NEXT: notl %edx		; X86-NOBMI-NEXT: notl %edx
; X86-NOBMI-NEXT: notl %eax		; X86-NOBMI-NEXT: notl %eax
; X86-NOBMI-NEXT: andl 4(%esi), %edx
; X86-NOBMI-NEXT: andl (%esi), %eax		; X86-NOBMI-NEXT: andl (%esi), %eax
		; X86-NOBMI-NEXT: andl 4(%esi), %edx
; X86-NOBMI-NEXT: popl %esi		; X86-NOBMI-NEXT: popl %esi
		; X86-NOBMI-NEXT: popl %edi
; X86-NOBMI-NEXT: retl		; X86-NOBMI-NEXT: retl
;		;
; X86-BMI1NOTBM-LABEL: bzhi64_b3_load_indexzext:		; X86-BMI1NOTBM-LABEL: bzhi64_b3_load_indexzext:
; X86-BMI1NOTBM: # %bb.0:		; X86-BMI1NOTBM: # %bb.0:
; X86-BMI1NOTBM-NEXT: pushl %esi		; X86-BMI1NOTBM-NEXT: pushl %esi
; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %eax		; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %edx
; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-BMI1NOTBM-NEXT: movl $-1, %edx
; X86-BMI1NOTBM-NEXT: movl $-1, %esi		; X86-BMI1NOTBM-NEXT: movl $-1, %esi
; X86-BMI1NOTBM-NEXT: shll %cl, %esi		; X86-BMI1NOTBM-NEXT: movl $-1, %eax
; X86-BMI1NOTBM-NEXT: shldl %cl, %edx, %edx		; X86-BMI1NOTBM-NEXT: shll %cl, %eax
; X86-BMI1NOTBM-NEXT: testb $32, %cl		; X86-BMI1NOTBM-NEXT: testb $32, %cl
; X86-BMI1NOTBM-NEXT: je .LBB23_2		; X86-BMI1NOTBM-NEXT: je .LBB23_2
; X86-BMI1NOTBM-NEXT: # %bb.1:		; X86-BMI1NOTBM-NEXT: # %bb.1:
; X86-BMI1NOTBM-NEXT: movl %esi, %edx		; X86-BMI1NOTBM-NEXT: movl %eax, %esi
; X86-BMI1NOTBM-NEXT: xorl %esi, %esi		; X86-BMI1NOTBM-NEXT: xorl %eax, %eax
; X86-BMI1NOTBM-NEXT: .LBB23_2:		; X86-BMI1NOTBM-NEXT: .LBB23_2:
; X86-BMI1NOTBM-NEXT: andnl 4(%eax), %edx, %edx		; X86-BMI1NOTBM-NEXT: andnl (%edx), %eax, %eax
; X86-BMI1NOTBM-NEXT: andnl (%eax), %esi, %eax		; X86-BMI1NOTBM-NEXT: andnl 4(%edx), %esi, %edx
; X86-BMI1NOTBM-NEXT: popl %esi		; X86-BMI1NOTBM-NEXT: popl %esi
; X86-BMI1NOTBM-NEXT: retl		; X86-BMI1NOTBM-NEXT: retl
;		;
; X86-BMI1BMI2-LABEL: bzhi64_b3_load_indexzext:		; X86-BMI1BMI2-LABEL: bzhi64_b3_load_indexzext:
; X86-BMI1BMI2: # %bb.0:		; X86-BMI1BMI2: # %bb.0:
; X86-BMI1BMI2-NEXT: pushl %esi		; X86-BMI1BMI2-NEXT: pushl %ebx
; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %eax		; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %ecx
; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %bl
; X86-BMI1BMI2-NEXT: movl $-1, %edx		; X86-BMI1BMI2-NEXT: movl $-1, %edx
; X86-BMI1BMI2-NEXT: shlxl %ecx, %edx, %esi		; X86-BMI1BMI2-NEXT: shlxl %ebx, %edx, %eax
; X86-BMI1BMI2-NEXT: shldl %cl, %edx, %edx		; X86-BMI1BMI2-NEXT: testb $32, %bl
; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB23_2		; X86-BMI1BMI2-NEXT: je .LBB23_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: movl %esi, %edx		; X86-BMI1BMI2-NEXT: movl %eax, %edx
; X86-BMI1BMI2-NEXT: xorl %esi, %esi		; X86-BMI1BMI2-NEXT: xorl %eax, %eax
; X86-BMI1BMI2-NEXT: .LBB23_2:		; X86-BMI1BMI2-NEXT: .LBB23_2:
; X86-BMI1BMI2-NEXT: andnl 4(%eax), %edx, %edx		; X86-BMI1BMI2-NEXT: andnl (%ecx), %eax, %eax
; X86-BMI1BMI2-NEXT: andnl (%eax), %esi, %eax		; X86-BMI1BMI2-NEXT: andnl 4(%ecx), %edx, %edx
; X86-BMI1BMI2-NEXT: popl %esi		; X86-BMI1BMI2-NEXT: popl %ebx
; X86-BMI1BMI2-NEXT: retl		; X86-BMI1BMI2-NEXT: retl
;		;
; X64-NOBMI-LABEL: bzhi64_b3_load_indexzext:		; X64-NOBMI-LABEL: bzhi64_b3_load_indexzext:
; X64-NOBMI: # %bb.0:		; X64-NOBMI: # %bb.0:
; X64-NOBMI-NEXT: movl %esi, %ecx		; X64-NOBMI-NEXT: movl %esi, %ecx
; X64-NOBMI-NEXT: movq $-1, %rax		; X64-NOBMI-NEXT: movq $-1, %rax
; X64-NOBMI-NEXT: # kill: def $cl killed $cl killed $ecx		; X64-NOBMI-NEXT: # kill: def $cl killed $cl killed $ecx
; X64-NOBMI-NEXT: shlq %cl, %rax		; X64-NOBMI-NEXT: shlq %cl, %rax
Show All 19 Lines	; X64-BMI1BMI2-NEXT: retq
%mask = xor i64 %notmask, -1		%mask = xor i64 %notmask, -1
%masked = and i64 %mask, %val		%masked = and i64 %mask, %val
ret i64 %masked		ret i64 %masked
}		}

define i64 @bzhi64_b4_commutative(i64 %val, i64 %numlowbits) nounwind {		define i64 @bzhi64_b4_commutative(i64 %val, i64 %numlowbits) nounwind {
; X86-NOBMI-LABEL: bzhi64_b4_commutative:		; X86-NOBMI-LABEL: bzhi64_b4_commutative:
; X86-NOBMI: # %bb.0:		; X86-NOBMI: # %bb.0:
		; X86-NOBMI-NEXT: pushl %esi
; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-NOBMI-NEXT: movb {{[0-9]+}}(%esp), %cl
; X86-NOBMI-NEXT: movl $-1, %edx		; X86-NOBMI-NEXT: movl $-1, %edx
; X86-NOBMI-NEXT: movl $-1, %eax		; X86-NOBMI-NEXT: movl $-1, %esi
; X86-NOBMI-NEXT: shll %cl, %eax		; X86-NOBMI-NEXT: shll %cl, %esi
; X86-NOBMI-NEXT: shldl %cl, %edx, %edx
; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: je .LBB24_2
; X86-NOBMI-NEXT: # %bb.1:
; X86-NOBMI-NEXT: movl %eax, %edx
; X86-NOBMI-NEXT: xorl %eax, %eax		; X86-NOBMI-NEXT: xorl %eax, %eax
; X86-NOBMI-NEXT: .LBB24_2:		; X86-NOBMI-NEXT: testb $32, %cl
		; X86-NOBMI-NEXT: jne .LBB24_1
		; X86-NOBMI-NEXT: # %bb.2:
		; X86-NOBMI-NEXT: movl %esi, %eax
		; X86-NOBMI-NEXT: jmp .LBB24_3
		; X86-NOBMI-NEXT: .LBB24_1:
		; X86-NOBMI-NEXT: movl %esi, %edx
		; X86-NOBMI-NEXT: .LBB24_3:
; X86-NOBMI-NEXT: notl %edx		; X86-NOBMI-NEXT: notl %edx
; X86-NOBMI-NEXT: notl %eax		; X86-NOBMI-NEXT: notl %eax
; X86-NOBMI-NEXT: andl {{[0-9]+}}(%esp), %edx
; X86-NOBMI-NEXT: andl {{[0-9]+}}(%esp), %eax		; X86-NOBMI-NEXT: andl {{[0-9]+}}(%esp), %eax
		; X86-NOBMI-NEXT: andl {{[0-9]+}}(%esp), %edx
		; X86-NOBMI-NEXT: popl %esi
; X86-NOBMI-NEXT: retl		; X86-NOBMI-NEXT: retl
;		;
; X86-BMI1NOTBM-LABEL: bzhi64_b4_commutative:		; X86-BMI1NOTBM-LABEL: bzhi64_b4_commutative:
; X86-BMI1NOTBM: # %bb.0:		; X86-BMI1NOTBM: # %bb.0:
; X86-BMI1NOTBM-NEXT: pushl %esi
; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI1NOTBM-NEXT: movb {{[0-9]+}}(%esp), %cl
		; X86-BMI1NOTBM-NEXT: movl $-1, %edx
; X86-BMI1NOTBM-NEXT: movl $-1, %eax		; X86-BMI1NOTBM-NEXT: movl $-1, %eax
; X86-BMI1NOTBM-NEXT: movl $-1, %esi		; X86-BMI1NOTBM-NEXT: shll %cl, %eax
; X86-BMI1NOTBM-NEXT: shll %cl, %esi
; X86-BMI1NOTBM-NEXT: shldl %cl, %eax, %eax
; X86-BMI1NOTBM-NEXT: testb $32, %cl		; X86-BMI1NOTBM-NEXT: testb $32, %cl
; X86-BMI1NOTBM-NEXT: je .LBB24_2		; X86-BMI1NOTBM-NEXT: je .LBB24_2
; X86-BMI1NOTBM-NEXT: # %bb.1:		; X86-BMI1NOTBM-NEXT: # %bb.1:
; X86-BMI1NOTBM-NEXT: movl %esi, %eax		; X86-BMI1NOTBM-NEXT: movl %eax, %edx
; X86-BMI1NOTBM-NEXT: xorl %esi, %esi		; X86-BMI1NOTBM-NEXT: xorl %eax, %eax
; X86-BMI1NOTBM-NEXT: .LBB24_2:		; X86-BMI1NOTBM-NEXT: .LBB24_2:
; X86-BMI1NOTBM-NEXT: andnl {{[0-9]+}}(%esp), %eax, %edx		; X86-BMI1NOTBM-NEXT: andnl {{[0-9]+}}(%esp), %eax, %eax
; X86-BMI1NOTBM-NEXT: andnl {{[0-9]+}}(%esp), %esi, %eax		; X86-BMI1NOTBM-NEXT: andnl {{[0-9]+}}(%esp), %edx, %edx
; X86-BMI1NOTBM-NEXT: popl %esi
; X86-BMI1NOTBM-NEXT: retl		; X86-BMI1NOTBM-NEXT: retl
;		;
; X86-BMI1BMI2-LABEL: bzhi64_b4_commutative:		; X86-BMI1BMI2-LABEL: bzhi64_b4_commutative:
; X86-BMI1BMI2: # %bb.0:		; X86-BMI1BMI2: # %bb.0:
; X86-BMI1BMI2-NEXT: pushl %esi		; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %dl
; X86-BMI1BMI2-NEXT: movb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: movl $-1, %ecx
; X86-BMI1BMI2-NEXT: movl $-1, %eax		; X86-BMI1BMI2-NEXT: shlxl %edx, %ecx, %eax
; X86-BMI1BMI2-NEXT: shlxl %ecx, %eax, %esi		; X86-BMI1BMI2-NEXT: testb $32, %dl
; X86-BMI1BMI2-NEXT: shldl %cl, %eax, %eax
; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB24_2		; X86-BMI1BMI2-NEXT: je .LBB24_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: movl %esi, %eax		; X86-BMI1BMI2-NEXT: movl %eax, %ecx
; X86-BMI1BMI2-NEXT: xorl %esi, %esi		; X86-BMI1BMI2-NEXT: xorl %eax, %eax
; X86-BMI1BMI2-NEXT: .LBB24_2:		; X86-BMI1BMI2-NEXT: .LBB24_2:
; X86-BMI1BMI2-NEXT: andnl {{[0-9]+}}(%esp), %eax, %edx		; X86-BMI1BMI2-NEXT: andnl {{[0-9]+}}(%esp), %eax, %eax
; X86-BMI1BMI2-NEXT: andnl {{[0-9]+}}(%esp), %esi, %eax		; X86-BMI1BMI2-NEXT: andnl {{[0-9]+}}(%esp), %ecx, %edx
; X86-BMI1BMI2-NEXT: popl %esi
; X86-BMI1BMI2-NEXT: retl		; X86-BMI1BMI2-NEXT: retl
;		;
; X64-NOBMI-LABEL: bzhi64_b4_commutative:		; X64-NOBMI-LABEL: bzhi64_b4_commutative:
; X64-NOBMI: # %bb.0:		; X64-NOBMI: # %bb.0:
; X64-NOBMI-NEXT: movq %rsi, %rcx		; X64-NOBMI-NEXT: movq %rsi, %rcx
; X64-NOBMI-NEXT: movq $-1, %rax		; X64-NOBMI-NEXT: movq $-1, %rax
; X64-NOBMI-NEXT: # kill: def $cl killed $cl killed $rcx		; X64-NOBMI-NEXT: # kill: def $cl killed $cl killed $rcx
; X64-NOBMI-NEXT: shlq %cl, %rax		; X64-NOBMI-NEXT: shlq %cl, %rax
▲ Show 20 Lines • Show All 854 Lines • ▼ Show 20 Lines
; X86-NOBMI-NEXT: pushl %edi		; X86-NOBMI-NEXT: pushl %edi
; X86-NOBMI-NEXT: pushl %esi		; X86-NOBMI-NEXT: pushl %esi
; X86-NOBMI-NEXT: pushl %eax		; X86-NOBMI-NEXT: pushl %eax
; X86-NOBMI-NEXT: movb $64, %cl		; X86-NOBMI-NEXT: movb $64, %cl
; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-NOBMI-NEXT: movl $-1, %esi		; X86-NOBMI-NEXT: movl $-1, %esi
; X86-NOBMI-NEXT: movl $-1, %edi		; X86-NOBMI-NEXT: movl $-1, %edi
; X86-NOBMI-NEXT: shrl %cl, %edi		; X86-NOBMI-NEXT: shrl %cl, %edi
; X86-NOBMI-NEXT: shrdl %cl, %esi, %esi
; X86-NOBMI-NEXT: testb $32, %cl		; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: je .LBB34_2		; X86-NOBMI-NEXT: je .LBB34_2
; X86-NOBMI-NEXT: # %bb.1:		; X86-NOBMI-NEXT: # %bb.1:
; X86-NOBMI-NEXT: movl %edi, %esi		; X86-NOBMI-NEXT: movl %edi, %esi
; X86-NOBMI-NEXT: xorl %edi, %edi		; X86-NOBMI-NEXT: xorl %edi, %edi
; X86-NOBMI-NEXT: .LBB34_2:		; X86-NOBMI-NEXT: .LBB34_2:
; X86-NOBMI-NEXT: subl $8, %esp		; X86-NOBMI-NEXT: subl $8, %esp
; X86-NOBMI-NEXT: pushl %edi		; X86-NOBMI-NEXT: pushl %edi
Show All 14 Lines
; X86-BMI1NOTBM-NEXT: pushl %edi		; X86-BMI1NOTBM-NEXT: pushl %edi
; X86-BMI1NOTBM-NEXT: pushl %esi		; X86-BMI1NOTBM-NEXT: pushl %esi
; X86-BMI1NOTBM-NEXT: pushl %eax		; X86-BMI1NOTBM-NEXT: pushl %eax
; X86-BMI1NOTBM-NEXT: movb $64, %cl		; X86-BMI1NOTBM-NEXT: movb $64, %cl
; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-BMI1NOTBM-NEXT: movl $-1, %esi		; X86-BMI1NOTBM-NEXT: movl $-1, %esi
; X86-BMI1NOTBM-NEXT: movl $-1, %edi		; X86-BMI1NOTBM-NEXT: movl $-1, %edi
; X86-BMI1NOTBM-NEXT: shrl %cl, %edi		; X86-BMI1NOTBM-NEXT: shrl %cl, %edi
; X86-BMI1NOTBM-NEXT: shrdl %cl, %esi, %esi
; X86-BMI1NOTBM-NEXT: testb $32, %cl		; X86-BMI1NOTBM-NEXT: testb $32, %cl
; X86-BMI1NOTBM-NEXT: je .LBB34_2		; X86-BMI1NOTBM-NEXT: je .LBB34_2
; X86-BMI1NOTBM-NEXT: # %bb.1:		; X86-BMI1NOTBM-NEXT: # %bb.1:
; X86-BMI1NOTBM-NEXT: movl %edi, %esi		; X86-BMI1NOTBM-NEXT: movl %edi, %esi
; X86-BMI1NOTBM-NEXT: xorl %edi, %edi		; X86-BMI1NOTBM-NEXT: xorl %edi, %edi
; X86-BMI1NOTBM-NEXT: .LBB34_2:		; X86-BMI1NOTBM-NEXT: .LBB34_2:
; X86-BMI1NOTBM-NEXT: subl $8, %esp		; X86-BMI1NOTBM-NEXT: subl $8, %esp
; X86-BMI1NOTBM-NEXT: pushl %edi		; X86-BMI1NOTBM-NEXT: pushl %edi
Show All 9 Lines
; X86-BMI1NOTBM-NEXT: popl %edi		; X86-BMI1NOTBM-NEXT: popl %edi
; X86-BMI1NOTBM-NEXT: retl		; X86-BMI1NOTBM-NEXT: retl
;		;
; X86-BMI1BMI2-LABEL: bzhi64_c0:		; X86-BMI1BMI2-LABEL: bzhi64_c0:
; X86-BMI1BMI2: # %bb.0:		; X86-BMI1BMI2: # %bb.0:
; X86-BMI1BMI2-NEXT: pushl %edi		; X86-BMI1BMI2-NEXT: pushl %edi
; X86-BMI1BMI2-NEXT: pushl %esi		; X86-BMI1BMI2-NEXT: pushl %esi
; X86-BMI1BMI2-NEXT: pushl %eax		; X86-BMI1BMI2-NEXT: pushl %eax
; X86-BMI1BMI2-NEXT: movb $64, %cl		; X86-BMI1BMI2-NEXT: movb $64, %al
; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %al
; X86-BMI1BMI2-NEXT: movl $-1, %esi		; X86-BMI1BMI2-NEXT: movl $-1, %edi
; X86-BMI1BMI2-NEXT: shrxl %ecx, %esi, %edi		; X86-BMI1BMI2-NEXT: shrxl %eax, %edi, %esi
; X86-BMI1BMI2-NEXT: shrdl %cl, %esi, %esi		; X86-BMI1BMI2-NEXT: testb $32, %al
; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB34_2		; X86-BMI1BMI2-NEXT: je .LBB34_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: movl %edi, %esi		; X86-BMI1BMI2-NEXT: movl %esi, %edi
; X86-BMI1BMI2-NEXT: xorl %edi, %edi		; X86-BMI1BMI2-NEXT: xorl %esi, %esi
; X86-BMI1BMI2-NEXT: .LBB34_2:		; X86-BMI1BMI2-NEXT: .LBB34_2:
; X86-BMI1BMI2-NEXT: subl $8, %esp		; X86-BMI1BMI2-NEXT: subl $8, %esp
; X86-BMI1BMI2-NEXT: pushl %edi
; X86-BMI1BMI2-NEXT: pushl %esi		; X86-BMI1BMI2-NEXT: pushl %esi
		; X86-BMI1BMI2-NEXT: pushl %edi
; X86-BMI1BMI2-NEXT: calll use64		; X86-BMI1BMI2-NEXT: calll use64
; X86-BMI1BMI2-NEXT: addl $16, %esp		; X86-BMI1BMI2-NEXT: addl $16, %esp
; X86-BMI1BMI2-NEXT: andl {{[0-9]+}}(%esp), %esi
; X86-BMI1BMI2-NEXT: andl {{[0-9]+}}(%esp), %edi		; X86-BMI1BMI2-NEXT: andl {{[0-9]+}}(%esp), %edi
; X86-BMI1BMI2-NEXT: movl %esi, %eax		; X86-BMI1BMI2-NEXT: andl {{[0-9]+}}(%esp), %esi
; X86-BMI1BMI2-NEXT: movl %edi, %edx		; X86-BMI1BMI2-NEXT: movl %edi, %eax
		; X86-BMI1BMI2-NEXT: movl %esi, %edx
; X86-BMI1BMI2-NEXT: addl $4, %esp		; X86-BMI1BMI2-NEXT: addl $4, %esp
; X86-BMI1BMI2-NEXT: popl %esi		; X86-BMI1BMI2-NEXT: popl %esi
; X86-BMI1BMI2-NEXT: popl %edi		; X86-BMI1BMI2-NEXT: popl %edi
; X86-BMI1BMI2-NEXT: retl		; X86-BMI1BMI2-NEXT: retl
;		;
; X64-NOBMI-LABEL: bzhi64_c0:		; X64-NOBMI-LABEL: bzhi64_c0:
; X64-NOBMI: # %bb.0:		; X64-NOBMI: # %bb.0:
; X64-NOBMI-NEXT: pushq %r14		; X64-NOBMI-NEXT: pushq %r14
▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
; X86-NOBMI-NEXT: pushl %edi		; X86-NOBMI-NEXT: pushl %edi
; X86-NOBMI-NEXT: pushl %esi		; X86-NOBMI-NEXT: pushl %esi
; X86-NOBMI-NEXT: pushl %eax		; X86-NOBMI-NEXT: pushl %eax
; X86-NOBMI-NEXT: movb $64, %cl		; X86-NOBMI-NEXT: movb $64, %cl
; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-NOBMI-NEXT: movl $-1, %esi		; X86-NOBMI-NEXT: movl $-1, %esi
; X86-NOBMI-NEXT: movl $-1, %edi		; X86-NOBMI-NEXT: movl $-1, %edi
; X86-NOBMI-NEXT: shrl %cl, %edi		; X86-NOBMI-NEXT: shrl %cl, %edi
; X86-NOBMI-NEXT: shrdl %cl, %esi, %esi
; X86-NOBMI-NEXT: testb $32, %cl		; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: je .LBB35_2		; X86-NOBMI-NEXT: je .LBB35_2
; X86-NOBMI-NEXT: # %bb.1:		; X86-NOBMI-NEXT: # %bb.1:
; X86-NOBMI-NEXT: movl %edi, %esi		; X86-NOBMI-NEXT: movl %edi, %esi
; X86-NOBMI-NEXT: xorl %edi, %edi		; X86-NOBMI-NEXT: xorl %edi, %edi
; X86-NOBMI-NEXT: .LBB35_2:		; X86-NOBMI-NEXT: .LBB35_2:
; X86-NOBMI-NEXT: subl $8, %esp		; X86-NOBMI-NEXT: subl $8, %esp
; X86-NOBMI-NEXT: pushl %edi		; X86-NOBMI-NEXT: pushl %edi
Show All 14 Lines
; X86-BMI1NOTBM-NEXT: pushl %edi		; X86-BMI1NOTBM-NEXT: pushl %edi
; X86-BMI1NOTBM-NEXT: pushl %esi		; X86-BMI1NOTBM-NEXT: pushl %esi
; X86-BMI1NOTBM-NEXT: pushl %eax		; X86-BMI1NOTBM-NEXT: pushl %eax
; X86-BMI1NOTBM-NEXT: movb $64, %cl		; X86-BMI1NOTBM-NEXT: movb $64, %cl
; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-BMI1NOTBM-NEXT: movl $-1, %esi		; X86-BMI1NOTBM-NEXT: movl $-1, %esi
; X86-BMI1NOTBM-NEXT: movl $-1, %edi		; X86-BMI1NOTBM-NEXT: movl $-1, %edi
; X86-BMI1NOTBM-NEXT: shrl %cl, %edi		; X86-BMI1NOTBM-NEXT: shrl %cl, %edi
; X86-BMI1NOTBM-NEXT: shrdl %cl, %esi, %esi
; X86-BMI1NOTBM-NEXT: testb $32, %cl		; X86-BMI1NOTBM-NEXT: testb $32, %cl
; X86-BMI1NOTBM-NEXT: je .LBB35_2		; X86-BMI1NOTBM-NEXT: je .LBB35_2
; X86-BMI1NOTBM-NEXT: # %bb.1:		; X86-BMI1NOTBM-NEXT: # %bb.1:
; X86-BMI1NOTBM-NEXT: movl %edi, %esi		; X86-BMI1NOTBM-NEXT: movl %edi, %esi
; X86-BMI1NOTBM-NEXT: xorl %edi, %edi		; X86-BMI1NOTBM-NEXT: xorl %edi, %edi
; X86-BMI1NOTBM-NEXT: .LBB35_2:		; X86-BMI1NOTBM-NEXT: .LBB35_2:
; X86-BMI1NOTBM-NEXT: subl $8, %esp		; X86-BMI1NOTBM-NEXT: subl $8, %esp
; X86-BMI1NOTBM-NEXT: pushl %edi		; X86-BMI1NOTBM-NEXT: pushl %edi
Show All 9 Lines
; X86-BMI1NOTBM-NEXT: popl %edi		; X86-BMI1NOTBM-NEXT: popl %edi
; X86-BMI1NOTBM-NEXT: retl		; X86-BMI1NOTBM-NEXT: retl
;		;
; X86-BMI1BMI2-LABEL: bzhi64_c1_indexzext:		; X86-BMI1BMI2-LABEL: bzhi64_c1_indexzext:
; X86-BMI1BMI2: # %bb.0:		; X86-BMI1BMI2: # %bb.0:
; X86-BMI1BMI2-NEXT: pushl %edi		; X86-BMI1BMI2-NEXT: pushl %edi
; X86-BMI1BMI2-NEXT: pushl %esi		; X86-BMI1BMI2-NEXT: pushl %esi
; X86-BMI1BMI2-NEXT: pushl %eax		; X86-BMI1BMI2-NEXT: pushl %eax
; X86-BMI1BMI2-NEXT: movb $64, %cl		; X86-BMI1BMI2-NEXT: movb $64, %al
; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %al
; X86-BMI1BMI2-NEXT: movl $-1, %esi		; X86-BMI1BMI2-NEXT: movl $-1, %edi
; X86-BMI1BMI2-NEXT: shrxl %ecx, %esi, %edi		; X86-BMI1BMI2-NEXT: shrxl %eax, %edi, %esi
; X86-BMI1BMI2-NEXT: shrdl %cl, %esi, %esi		; X86-BMI1BMI2-NEXT: testb $32, %al
; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB35_2		; X86-BMI1BMI2-NEXT: je .LBB35_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: movl %edi, %esi		; X86-BMI1BMI2-NEXT: movl %esi, %edi
; X86-BMI1BMI2-NEXT: xorl %edi, %edi		; X86-BMI1BMI2-NEXT: xorl %esi, %esi
; X86-BMI1BMI2-NEXT: .LBB35_2:		; X86-BMI1BMI2-NEXT: .LBB35_2:
; X86-BMI1BMI2-NEXT: subl $8, %esp		; X86-BMI1BMI2-NEXT: subl $8, %esp
; X86-BMI1BMI2-NEXT: pushl %edi
; X86-BMI1BMI2-NEXT: pushl %esi		; X86-BMI1BMI2-NEXT: pushl %esi
		; X86-BMI1BMI2-NEXT: pushl %edi
; X86-BMI1BMI2-NEXT: calll use64		; X86-BMI1BMI2-NEXT: calll use64
; X86-BMI1BMI2-NEXT: addl $16, %esp		; X86-BMI1BMI2-NEXT: addl $16, %esp
; X86-BMI1BMI2-NEXT: andl {{[0-9]+}}(%esp), %esi
; X86-BMI1BMI2-NEXT: andl {{[0-9]+}}(%esp), %edi		; X86-BMI1BMI2-NEXT: andl {{[0-9]+}}(%esp), %edi
; X86-BMI1BMI2-NEXT: movl %esi, %eax		; X86-BMI1BMI2-NEXT: andl {{[0-9]+}}(%esp), %esi
; X86-BMI1BMI2-NEXT: movl %edi, %edx		; X86-BMI1BMI2-NEXT: movl %edi, %eax
		; X86-BMI1BMI2-NEXT: movl %esi, %edx
; X86-BMI1BMI2-NEXT: addl $4, %esp		; X86-BMI1BMI2-NEXT: addl $4, %esp
; X86-BMI1BMI2-NEXT: popl %esi		; X86-BMI1BMI2-NEXT: popl %esi
; X86-BMI1BMI2-NEXT: popl %edi		; X86-BMI1BMI2-NEXT: popl %edi
; X86-BMI1BMI2-NEXT: retl		; X86-BMI1BMI2-NEXT: retl
;		;
; X64-NOBMI-LABEL: bzhi64_c1_indexzext:		; X64-NOBMI-LABEL: bzhi64_c1_indexzext:
; X64-NOBMI: # %bb.0:		; X64-NOBMI: # %bb.0:
; X64-NOBMI-NEXT: pushq %r14		; X64-NOBMI-NEXT: pushq %r14
▲ Show 20 Lines • Show All 66 Lines • ▼ Show 20 Lines
; X86-NOBMI-NEXT: pushl %edi		; X86-NOBMI-NEXT: pushl %edi
; X86-NOBMI-NEXT: pushl %esi		; X86-NOBMI-NEXT: pushl %esi
; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %edx		; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %edx
; X86-NOBMI-NEXT: movb $64, %cl		; X86-NOBMI-NEXT: movb $64, %cl
; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-NOBMI-NEXT: movl $-1, %eax		; X86-NOBMI-NEXT: movl $-1, %eax
; X86-NOBMI-NEXT: movl $-1, %ebx		; X86-NOBMI-NEXT: movl $-1, %ebx
; X86-NOBMI-NEXT: shrl %cl, %ebx		; X86-NOBMI-NEXT: shrl %cl, %ebx
; X86-NOBMI-NEXT: shrdl %cl, %eax, %eax
; X86-NOBMI-NEXT: testb $32, %cl		; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: je .LBB36_2		; X86-NOBMI-NEXT: je .LBB36_2
; X86-NOBMI-NEXT: # %bb.1:		; X86-NOBMI-NEXT: # %bb.1:
; X86-NOBMI-NEXT: movl %ebx, %eax		; X86-NOBMI-NEXT: movl %ebx, %eax
; X86-NOBMI-NEXT: xorl %ebx, %ebx		; X86-NOBMI-NEXT: xorl %ebx, %ebx
; X86-NOBMI-NEXT: .LBB36_2:		; X86-NOBMI-NEXT: .LBB36_2:
; X86-NOBMI-NEXT: movl (%edx), %esi		; X86-NOBMI-NEXT: movl 4(%edx), %esi
; X86-NOBMI-NEXT: andl %eax, %esi		; X86-NOBMI-NEXT: andl %ebx, %esi
; X86-NOBMI-NEXT: movl 4(%edx), %edi		; X86-NOBMI-NEXT: movl (%edx), %edi
; X86-NOBMI-NEXT: andl %ebx, %edi		; X86-NOBMI-NEXT: andl %eax, %edi
; X86-NOBMI-NEXT: subl $8, %esp		; X86-NOBMI-NEXT: subl $8, %esp
; X86-NOBMI-NEXT: pushl %ebx		; X86-NOBMI-NEXT: pushl %ebx
; X86-NOBMI-NEXT: pushl %eax		; X86-NOBMI-NEXT: pushl %eax
; X86-NOBMI-NEXT: calll use64		; X86-NOBMI-NEXT: calll use64
; X86-NOBMI-NEXT: addl $16, %esp		; X86-NOBMI-NEXT: addl $16, %esp
; X86-NOBMI-NEXT: movl %esi, %eax		; X86-NOBMI-NEXT: movl %edi, %eax
; X86-NOBMI-NEXT: movl %edi, %edx		; X86-NOBMI-NEXT: movl %esi, %edx
; X86-NOBMI-NEXT: popl %esi		; X86-NOBMI-NEXT: popl %esi
; X86-NOBMI-NEXT: popl %edi		; X86-NOBMI-NEXT: popl %edi
; X86-NOBMI-NEXT: popl %ebx		; X86-NOBMI-NEXT: popl %ebx
; X86-NOBMI-NEXT: retl		; X86-NOBMI-NEXT: retl
;		;
; X86-BMI1NOTBM-LABEL: bzhi64_c2_load:		; X86-BMI1NOTBM-LABEL: bzhi64_c2_load:
; X86-BMI1NOTBM: # %bb.0:		; X86-BMI1NOTBM: # %bb.0:
; X86-BMI1NOTBM-NEXT: pushl %ebx		; X86-BMI1NOTBM-NEXT: pushl %ebx
; X86-BMI1NOTBM-NEXT: pushl %edi		; X86-BMI1NOTBM-NEXT: pushl %edi
; X86-BMI1NOTBM-NEXT: pushl %esi		; X86-BMI1NOTBM-NEXT: pushl %esi
; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %edx		; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %edx
; X86-BMI1NOTBM-NEXT: movb $64, %cl		; X86-BMI1NOTBM-NEXT: movb $64, %cl
; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-BMI1NOTBM-NEXT: movl $-1, %eax		; X86-BMI1NOTBM-NEXT: movl $-1, %eax
; X86-BMI1NOTBM-NEXT: movl $-1, %ebx		; X86-BMI1NOTBM-NEXT: movl $-1, %ebx
; X86-BMI1NOTBM-NEXT: shrl %cl, %ebx		; X86-BMI1NOTBM-NEXT: shrl %cl, %ebx
; X86-BMI1NOTBM-NEXT: shrdl %cl, %eax, %eax
; X86-BMI1NOTBM-NEXT: testb $32, %cl		; X86-BMI1NOTBM-NEXT: testb $32, %cl
; X86-BMI1NOTBM-NEXT: je .LBB36_2		; X86-BMI1NOTBM-NEXT: je .LBB36_2
; X86-BMI1NOTBM-NEXT: # %bb.1:		; X86-BMI1NOTBM-NEXT: # %bb.1:
; X86-BMI1NOTBM-NEXT: movl %ebx, %eax		; X86-BMI1NOTBM-NEXT: movl %ebx, %eax
; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx		; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx
; X86-BMI1NOTBM-NEXT: .LBB36_2:		; X86-BMI1NOTBM-NEXT: .LBB36_2:
; X86-BMI1NOTBM-NEXT: movl (%edx), %esi		; X86-BMI1NOTBM-NEXT: movl 4(%edx), %esi
; X86-BMI1NOTBM-NEXT: andl %eax, %esi		; X86-BMI1NOTBM-NEXT: andl %ebx, %esi
; X86-BMI1NOTBM-NEXT: movl 4(%edx), %edi		; X86-BMI1NOTBM-NEXT: movl (%edx), %edi
; X86-BMI1NOTBM-NEXT: andl %ebx, %edi		; X86-BMI1NOTBM-NEXT: andl %eax, %edi
; X86-BMI1NOTBM-NEXT: subl $8, %esp		; X86-BMI1NOTBM-NEXT: subl $8, %esp
; X86-BMI1NOTBM-NEXT: pushl %ebx		; X86-BMI1NOTBM-NEXT: pushl %ebx
; X86-BMI1NOTBM-NEXT: pushl %eax		; X86-BMI1NOTBM-NEXT: pushl %eax
; X86-BMI1NOTBM-NEXT: calll use64		; X86-BMI1NOTBM-NEXT: calll use64
; X86-BMI1NOTBM-NEXT: addl $16, %esp		; X86-BMI1NOTBM-NEXT: addl $16, %esp
; X86-BMI1NOTBM-NEXT: movl %esi, %eax		; X86-BMI1NOTBM-NEXT: movl %edi, %eax
; X86-BMI1NOTBM-NEXT: movl %edi, %edx		; X86-BMI1NOTBM-NEXT: movl %esi, %edx
; X86-BMI1NOTBM-NEXT: popl %esi		; X86-BMI1NOTBM-NEXT: popl %esi
; X86-BMI1NOTBM-NEXT: popl %edi		; X86-BMI1NOTBM-NEXT: popl %edi
; X86-BMI1NOTBM-NEXT: popl %ebx		; X86-BMI1NOTBM-NEXT: popl %ebx
; X86-BMI1NOTBM-NEXT: retl		; X86-BMI1NOTBM-NEXT: retl
;		;
; X86-BMI1BMI2-LABEL: bzhi64_c2_load:		; X86-BMI1BMI2-LABEL: bzhi64_c2_load:
; X86-BMI1BMI2: # %bb.0:		; X86-BMI1BMI2: # %bb.0:
; X86-BMI1BMI2-NEXT: pushl %ebx		; X86-BMI1BMI2-NEXT: pushl %ebx
; X86-BMI1BMI2-NEXT: pushl %edi		; X86-BMI1BMI2-NEXT: pushl %edi
; X86-BMI1BMI2-NEXT: pushl %esi		; X86-BMI1BMI2-NEXT: pushl %esi
; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %edx		; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %eax
; X86-BMI1BMI2-NEXT: movb $64, %cl		; X86-BMI1BMI2-NEXT: movb $64, %bl
; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %bl
; X86-BMI1BMI2-NEXT: movl $-1, %eax		; X86-BMI1BMI2-NEXT: movl $-1, %ecx
; X86-BMI1BMI2-NEXT: shrxl %ecx, %eax, %ebx		; X86-BMI1BMI2-NEXT: shrxl %ebx, %ecx, %edx
; X86-BMI1BMI2-NEXT: shrdl %cl, %eax, %eax		; X86-BMI1BMI2-NEXT: testb $32, %bl
; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB36_2		; X86-BMI1BMI2-NEXT: je .LBB36_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: movl %ebx, %eax		; X86-BMI1BMI2-NEXT: movl %edx, %ecx
; X86-BMI1BMI2-NEXT: xorl %ebx, %ebx		; X86-BMI1BMI2-NEXT: xorl %edx, %edx
; X86-BMI1BMI2-NEXT: .LBB36_2:		; X86-BMI1BMI2-NEXT: .LBB36_2:
; X86-BMI1BMI2-NEXT: movl (%edx), %esi		; X86-BMI1BMI2-NEXT: movl 4(%eax), %esi
; X86-BMI1BMI2-NEXT: andl %eax, %esi		; X86-BMI1BMI2-NEXT: andl %edx, %esi
; X86-BMI1BMI2-NEXT: movl 4(%edx), %edi		; X86-BMI1BMI2-NEXT: movl (%eax), %edi
; X86-BMI1BMI2-NEXT: andl %ebx, %edi		; X86-BMI1BMI2-NEXT: andl %ecx, %edi
; X86-BMI1BMI2-NEXT: subl $8, %esp		; X86-BMI1BMI2-NEXT: subl $8, %esp
; X86-BMI1BMI2-NEXT: pushl %ebx		; X86-BMI1BMI2-NEXT: pushl %edx
; X86-BMI1BMI2-NEXT: pushl %eax		; X86-BMI1BMI2-NEXT: pushl %ecx
; X86-BMI1BMI2-NEXT: calll use64		; X86-BMI1BMI2-NEXT: calll use64
; X86-BMI1BMI2-NEXT: addl $16, %esp		; X86-BMI1BMI2-NEXT: addl $16, %esp
; X86-BMI1BMI2-NEXT: movl %esi, %eax		; X86-BMI1BMI2-NEXT: movl %edi, %eax
; X86-BMI1BMI2-NEXT: movl %edi, %edx		; X86-BMI1BMI2-NEXT: movl %esi, %edx
; X86-BMI1BMI2-NEXT: popl %esi		; X86-BMI1BMI2-NEXT: popl %esi
; X86-BMI1BMI2-NEXT: popl %edi		; X86-BMI1BMI2-NEXT: popl %edi
; X86-BMI1BMI2-NEXT: popl %ebx		; X86-BMI1BMI2-NEXT: popl %ebx
; X86-BMI1BMI2-NEXT: retl		; X86-BMI1BMI2-NEXT: retl
;		;
; X64-NOBMI-LABEL: bzhi64_c2_load:		; X64-NOBMI-LABEL: bzhi64_c2_load:
; X64-NOBMI: # %bb.0:		; X64-NOBMI: # %bb.0:
; X64-NOBMI-NEXT: pushq %rbx		; X64-NOBMI-NEXT: pushq %rbx
▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines
; X86-NOBMI-NEXT: pushl %edi		; X86-NOBMI-NEXT: pushl %edi
; X86-NOBMI-NEXT: pushl %esi		; X86-NOBMI-NEXT: pushl %esi
; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %edx		; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %edx
; X86-NOBMI-NEXT: movb $64, %cl		; X86-NOBMI-NEXT: movb $64, %cl
; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-NOBMI-NEXT: movl $-1, %eax		; X86-NOBMI-NEXT: movl $-1, %eax
; X86-NOBMI-NEXT: movl $-1, %ebx		; X86-NOBMI-NEXT: movl $-1, %ebx
; X86-NOBMI-NEXT: shrl %cl, %ebx		; X86-NOBMI-NEXT: shrl %cl, %ebx
; X86-NOBMI-NEXT: shrdl %cl, %eax, %eax
; X86-NOBMI-NEXT: testb $32, %cl		; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: je .LBB37_2		; X86-NOBMI-NEXT: je .LBB37_2
; X86-NOBMI-NEXT: # %bb.1:		; X86-NOBMI-NEXT: # %bb.1:
; X86-NOBMI-NEXT: movl %ebx, %eax		; X86-NOBMI-NEXT: movl %ebx, %eax
; X86-NOBMI-NEXT: xorl %ebx, %ebx		; X86-NOBMI-NEXT: xorl %ebx, %ebx
; X86-NOBMI-NEXT: .LBB37_2:		; X86-NOBMI-NEXT: .LBB37_2:
; X86-NOBMI-NEXT: movl (%edx), %esi		; X86-NOBMI-NEXT: movl 4(%edx), %esi
; X86-NOBMI-NEXT: andl %eax, %esi		; X86-NOBMI-NEXT: andl %ebx, %esi
; X86-NOBMI-NEXT: movl 4(%edx), %edi		; X86-NOBMI-NEXT: movl (%edx), %edi
; X86-NOBMI-NEXT: andl %ebx, %edi		; X86-NOBMI-NEXT: andl %eax, %edi
; X86-NOBMI-NEXT: subl $8, %esp		; X86-NOBMI-NEXT: subl $8, %esp
; X86-NOBMI-NEXT: pushl %ebx		; X86-NOBMI-NEXT: pushl %ebx
; X86-NOBMI-NEXT: pushl %eax		; X86-NOBMI-NEXT: pushl %eax
; X86-NOBMI-NEXT: calll use64		; X86-NOBMI-NEXT: calll use64
; X86-NOBMI-NEXT: addl $16, %esp		; X86-NOBMI-NEXT: addl $16, %esp
; X86-NOBMI-NEXT: movl %esi, %eax		; X86-NOBMI-NEXT: movl %edi, %eax
; X86-NOBMI-NEXT: movl %edi, %edx		; X86-NOBMI-NEXT: movl %esi, %edx
; X86-NOBMI-NEXT: popl %esi		; X86-NOBMI-NEXT: popl %esi
; X86-NOBMI-NEXT: popl %edi		; X86-NOBMI-NEXT: popl %edi
; X86-NOBMI-NEXT: popl %ebx		; X86-NOBMI-NEXT: popl %ebx
; X86-NOBMI-NEXT: retl		; X86-NOBMI-NEXT: retl
;		;
; X86-BMI1NOTBM-LABEL: bzhi64_c3_load_indexzext:		; X86-BMI1NOTBM-LABEL: bzhi64_c3_load_indexzext:
; X86-BMI1NOTBM: # %bb.0:		; X86-BMI1NOTBM: # %bb.0:
; X86-BMI1NOTBM-NEXT: pushl %ebx		; X86-BMI1NOTBM-NEXT: pushl %ebx
; X86-BMI1NOTBM-NEXT: pushl %edi		; X86-BMI1NOTBM-NEXT: pushl %edi
; X86-BMI1NOTBM-NEXT: pushl %esi		; X86-BMI1NOTBM-NEXT: pushl %esi
; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %edx		; X86-BMI1NOTBM-NEXT: movl {{[0-9]+}}(%esp), %edx
; X86-BMI1NOTBM-NEXT: movb $64, %cl		; X86-BMI1NOTBM-NEXT: movb $64, %cl
; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-BMI1NOTBM-NEXT: movl $-1, %eax		; X86-BMI1NOTBM-NEXT: movl $-1, %eax
; X86-BMI1NOTBM-NEXT: movl $-1, %ebx		; X86-BMI1NOTBM-NEXT: movl $-1, %ebx
; X86-BMI1NOTBM-NEXT: shrl %cl, %ebx		; X86-BMI1NOTBM-NEXT: shrl %cl, %ebx
; X86-BMI1NOTBM-NEXT: shrdl %cl, %eax, %eax
; X86-BMI1NOTBM-NEXT: testb $32, %cl		; X86-BMI1NOTBM-NEXT: testb $32, %cl
; X86-BMI1NOTBM-NEXT: je .LBB37_2		; X86-BMI1NOTBM-NEXT: je .LBB37_2
; X86-BMI1NOTBM-NEXT: # %bb.1:		; X86-BMI1NOTBM-NEXT: # %bb.1:
; X86-BMI1NOTBM-NEXT: movl %ebx, %eax		; X86-BMI1NOTBM-NEXT: movl %ebx, %eax
; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx		; X86-BMI1NOTBM-NEXT: xorl %ebx, %ebx
; X86-BMI1NOTBM-NEXT: .LBB37_2:		; X86-BMI1NOTBM-NEXT: .LBB37_2:
; X86-BMI1NOTBM-NEXT: movl (%edx), %esi		; X86-BMI1NOTBM-NEXT: movl 4(%edx), %esi
; X86-BMI1NOTBM-NEXT: andl %eax, %esi		; X86-BMI1NOTBM-NEXT: andl %ebx, %esi
; X86-BMI1NOTBM-NEXT: movl 4(%edx), %edi		; X86-BMI1NOTBM-NEXT: movl (%edx), %edi
; X86-BMI1NOTBM-NEXT: andl %ebx, %edi		; X86-BMI1NOTBM-NEXT: andl %eax, %edi
; X86-BMI1NOTBM-NEXT: subl $8, %esp		; X86-BMI1NOTBM-NEXT: subl $8, %esp
; X86-BMI1NOTBM-NEXT: pushl %ebx		; X86-BMI1NOTBM-NEXT: pushl %ebx
; X86-BMI1NOTBM-NEXT: pushl %eax		; X86-BMI1NOTBM-NEXT: pushl %eax
; X86-BMI1NOTBM-NEXT: calll use64		; X86-BMI1NOTBM-NEXT: calll use64
; X86-BMI1NOTBM-NEXT: addl $16, %esp		; X86-BMI1NOTBM-NEXT: addl $16, %esp
; X86-BMI1NOTBM-NEXT: movl %esi, %eax		; X86-BMI1NOTBM-NEXT: movl %edi, %eax
; X86-BMI1NOTBM-NEXT: movl %edi, %edx		; X86-BMI1NOTBM-NEXT: movl %esi, %edx
; X86-BMI1NOTBM-NEXT: popl %esi		; X86-BMI1NOTBM-NEXT: popl %esi
; X86-BMI1NOTBM-NEXT: popl %edi		; X86-BMI1NOTBM-NEXT: popl %edi
; X86-BMI1NOTBM-NEXT: popl %ebx		; X86-BMI1NOTBM-NEXT: popl %ebx
; X86-BMI1NOTBM-NEXT: retl		; X86-BMI1NOTBM-NEXT: retl
;		;
; X86-BMI1BMI2-LABEL: bzhi64_c3_load_indexzext:		; X86-BMI1BMI2-LABEL: bzhi64_c3_load_indexzext:
; X86-BMI1BMI2: # %bb.0:		; X86-BMI1BMI2: # %bb.0:
; X86-BMI1BMI2-NEXT: pushl %ebx		; X86-BMI1BMI2-NEXT: pushl %ebx
; X86-BMI1BMI2-NEXT: pushl %edi		; X86-BMI1BMI2-NEXT: pushl %edi
; X86-BMI1BMI2-NEXT: pushl %esi		; X86-BMI1BMI2-NEXT: pushl %esi
; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %edx		; X86-BMI1BMI2-NEXT: movl {{[0-9]+}}(%esp), %eax
; X86-BMI1BMI2-NEXT: movb $64, %cl		; X86-BMI1BMI2-NEXT: movb $64, %bl
; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %bl
; X86-BMI1BMI2-NEXT: movl $-1, %eax		; X86-BMI1BMI2-NEXT: movl $-1, %ecx
; X86-BMI1BMI2-NEXT: shrxl %ecx, %eax, %ebx		; X86-BMI1BMI2-NEXT: shrxl %ebx, %ecx, %edx
; X86-BMI1BMI2-NEXT: shrdl %cl, %eax, %eax		; X86-BMI1BMI2-NEXT: testb $32, %bl
; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB37_2		; X86-BMI1BMI2-NEXT: je .LBB37_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: movl %ebx, %eax		; X86-BMI1BMI2-NEXT: movl %edx, %ecx
; X86-BMI1BMI2-NEXT: xorl %ebx, %ebx		; X86-BMI1BMI2-NEXT: xorl %edx, %edx
; X86-BMI1BMI2-NEXT: .LBB37_2:		; X86-BMI1BMI2-NEXT: .LBB37_2:
; X86-BMI1BMI2-NEXT: movl (%edx), %esi		; X86-BMI1BMI2-NEXT: movl 4(%eax), %esi
; X86-BMI1BMI2-NEXT: andl %eax, %esi		; X86-BMI1BMI2-NEXT: andl %edx, %esi
; X86-BMI1BMI2-NEXT: movl 4(%edx), %edi		; X86-BMI1BMI2-NEXT: movl (%eax), %edi
; X86-BMI1BMI2-NEXT: andl %ebx, %edi		; X86-BMI1BMI2-NEXT: andl %ecx, %edi
; X86-BMI1BMI2-NEXT: subl $8, %esp		; X86-BMI1BMI2-NEXT: subl $8, %esp
; X86-BMI1BMI2-NEXT: pushl %ebx		; X86-BMI1BMI2-NEXT: pushl %edx
; X86-BMI1BMI2-NEXT: pushl %eax		; X86-BMI1BMI2-NEXT: pushl %ecx
; X86-BMI1BMI2-NEXT: calll use64		; X86-BMI1BMI2-NEXT: calll use64
; X86-BMI1BMI2-NEXT: addl $16, %esp		; X86-BMI1BMI2-NEXT: addl $16, %esp
; X86-BMI1BMI2-NEXT: movl %esi, %eax		; X86-BMI1BMI2-NEXT: movl %edi, %eax
; X86-BMI1BMI2-NEXT: movl %edi, %edx		; X86-BMI1BMI2-NEXT: movl %esi, %edx
; X86-BMI1BMI2-NEXT: popl %esi		; X86-BMI1BMI2-NEXT: popl %esi
; X86-BMI1BMI2-NEXT: popl %edi		; X86-BMI1BMI2-NEXT: popl %edi
; X86-BMI1BMI2-NEXT: popl %ebx		; X86-BMI1BMI2-NEXT: popl %ebx
; X86-BMI1BMI2-NEXT: retl		; X86-BMI1BMI2-NEXT: retl
;		;
; X64-NOBMI-LABEL: bzhi64_c3_load_indexzext:		; X64-NOBMI-LABEL: bzhi64_c3_load_indexzext:
; X64-NOBMI: # %bb.0:		; X64-NOBMI: # %bb.0:
; X64-NOBMI-NEXT: pushq %rbx		; X64-NOBMI-NEXT: pushq %rbx
▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
; X86-NOBMI-NEXT: pushl %edi		; X86-NOBMI-NEXT: pushl %edi
; X86-NOBMI-NEXT: pushl %esi		; X86-NOBMI-NEXT: pushl %esi
; X86-NOBMI-NEXT: pushl %eax		; X86-NOBMI-NEXT: pushl %eax
; X86-NOBMI-NEXT: movb $64, %cl		; X86-NOBMI-NEXT: movb $64, %cl
; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-NOBMI-NEXT: movl $-1, %esi		; X86-NOBMI-NEXT: movl $-1, %esi
; X86-NOBMI-NEXT: movl $-1, %edi		; X86-NOBMI-NEXT: movl $-1, %edi
; X86-NOBMI-NEXT: shrl %cl, %edi		; X86-NOBMI-NEXT: shrl %cl, %edi
; X86-NOBMI-NEXT: shrdl %cl, %esi, %esi
; X86-NOBMI-NEXT: testb $32, %cl		; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: je .LBB38_2		; X86-NOBMI-NEXT: je .LBB38_2
; X86-NOBMI-NEXT: # %bb.1:		; X86-NOBMI-NEXT: # %bb.1:
; X86-NOBMI-NEXT: movl %edi, %esi		; X86-NOBMI-NEXT: movl %edi, %esi
; X86-NOBMI-NEXT: xorl %edi, %edi		; X86-NOBMI-NEXT: xorl %edi, %edi
; X86-NOBMI-NEXT: .LBB38_2:		; X86-NOBMI-NEXT: .LBB38_2:
; X86-NOBMI-NEXT: subl $8, %esp		; X86-NOBMI-NEXT: subl $8, %esp
; X86-NOBMI-NEXT: pushl %edi		; X86-NOBMI-NEXT: pushl %edi
Show All 14 Lines
; X86-BMI1NOTBM-NEXT: pushl %edi		; X86-BMI1NOTBM-NEXT: pushl %edi
; X86-BMI1NOTBM-NEXT: pushl %esi		; X86-BMI1NOTBM-NEXT: pushl %esi
; X86-BMI1NOTBM-NEXT: pushl %eax		; X86-BMI1NOTBM-NEXT: pushl %eax
; X86-BMI1NOTBM-NEXT: movb $64, %cl		; X86-BMI1NOTBM-NEXT: movb $64, %cl
; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-BMI1NOTBM-NEXT: movl $-1, %esi		; X86-BMI1NOTBM-NEXT: movl $-1, %esi
; X86-BMI1NOTBM-NEXT: movl $-1, %edi		; X86-BMI1NOTBM-NEXT: movl $-1, %edi
; X86-BMI1NOTBM-NEXT: shrl %cl, %edi		; X86-BMI1NOTBM-NEXT: shrl %cl, %edi
; X86-BMI1NOTBM-NEXT: shrdl %cl, %esi, %esi
; X86-BMI1NOTBM-NEXT: testb $32, %cl		; X86-BMI1NOTBM-NEXT: testb $32, %cl
; X86-BMI1NOTBM-NEXT: je .LBB38_2		; X86-BMI1NOTBM-NEXT: je .LBB38_2
; X86-BMI1NOTBM-NEXT: # %bb.1:		; X86-BMI1NOTBM-NEXT: # %bb.1:
; X86-BMI1NOTBM-NEXT: movl %edi, %esi		; X86-BMI1NOTBM-NEXT: movl %edi, %esi
; X86-BMI1NOTBM-NEXT: xorl %edi, %edi		; X86-BMI1NOTBM-NEXT: xorl %edi, %edi
; X86-BMI1NOTBM-NEXT: .LBB38_2:		; X86-BMI1NOTBM-NEXT: .LBB38_2:
; X86-BMI1NOTBM-NEXT: subl $8, %esp		; X86-BMI1NOTBM-NEXT: subl $8, %esp
; X86-BMI1NOTBM-NEXT: pushl %edi		; X86-BMI1NOTBM-NEXT: pushl %edi
Show All 9 Lines
; X86-BMI1NOTBM-NEXT: popl %edi		; X86-BMI1NOTBM-NEXT: popl %edi
; X86-BMI1NOTBM-NEXT: retl		; X86-BMI1NOTBM-NEXT: retl
;		;
; X86-BMI1BMI2-LABEL: bzhi64_c4_commutative:		; X86-BMI1BMI2-LABEL: bzhi64_c4_commutative:
; X86-BMI1BMI2: # %bb.0:		; X86-BMI1BMI2: # %bb.0:
; X86-BMI1BMI2-NEXT: pushl %edi		; X86-BMI1BMI2-NEXT: pushl %edi
; X86-BMI1BMI2-NEXT: pushl %esi		; X86-BMI1BMI2-NEXT: pushl %esi
; X86-BMI1BMI2-NEXT: pushl %eax		; X86-BMI1BMI2-NEXT: pushl %eax
; X86-BMI1BMI2-NEXT: movb $64, %cl		; X86-BMI1BMI2-NEXT: movb $64, %al
; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %al
; X86-BMI1BMI2-NEXT: movl $-1, %esi		; X86-BMI1BMI2-NEXT: movl $-1, %edi
; X86-BMI1BMI2-NEXT: shrxl %ecx, %esi, %edi		; X86-BMI1BMI2-NEXT: shrxl %eax, %edi, %esi
; X86-BMI1BMI2-NEXT: shrdl %cl, %esi, %esi		; X86-BMI1BMI2-NEXT: testb $32, %al
; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB38_2		; X86-BMI1BMI2-NEXT: je .LBB38_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: movl %edi, %esi		; X86-BMI1BMI2-NEXT: movl %esi, %edi
; X86-BMI1BMI2-NEXT: xorl %edi, %edi		; X86-BMI1BMI2-NEXT: xorl %esi, %esi
; X86-BMI1BMI2-NEXT: .LBB38_2:		; X86-BMI1BMI2-NEXT: .LBB38_2:
; X86-BMI1BMI2-NEXT: subl $8, %esp		; X86-BMI1BMI2-NEXT: subl $8, %esp
; X86-BMI1BMI2-NEXT: pushl %edi
; X86-BMI1BMI2-NEXT: pushl %esi		; X86-BMI1BMI2-NEXT: pushl %esi
		; X86-BMI1BMI2-NEXT: pushl %edi
; X86-BMI1BMI2-NEXT: calll use64		; X86-BMI1BMI2-NEXT: calll use64
; X86-BMI1BMI2-NEXT: addl $16, %esp		; X86-BMI1BMI2-NEXT: addl $16, %esp
; X86-BMI1BMI2-NEXT: andl {{[0-9]+}}(%esp), %esi
; X86-BMI1BMI2-NEXT: andl {{[0-9]+}}(%esp), %edi		; X86-BMI1BMI2-NEXT: andl {{[0-9]+}}(%esp), %edi
; X86-BMI1BMI2-NEXT: movl %esi, %eax		; X86-BMI1BMI2-NEXT: andl {{[0-9]+}}(%esp), %esi
; X86-BMI1BMI2-NEXT: movl %edi, %edx		; X86-BMI1BMI2-NEXT: movl %edi, %eax
		; X86-BMI1BMI2-NEXT: movl %esi, %edx
; X86-BMI1BMI2-NEXT: addl $4, %esp		; X86-BMI1BMI2-NEXT: addl $4, %esp
; X86-BMI1BMI2-NEXT: popl %esi		; X86-BMI1BMI2-NEXT: popl %esi
; X86-BMI1BMI2-NEXT: popl %edi		; X86-BMI1BMI2-NEXT: popl %edi
; X86-BMI1BMI2-NEXT: retl		; X86-BMI1BMI2-NEXT: retl
;		;
; X64-NOBMI-LABEL: bzhi64_c4_commutative:		; X64-NOBMI-LABEL: bzhi64_c4_commutative:
; X64-NOBMI: # %bb.0:		; X64-NOBMI: # %bb.0:
; X64-NOBMI-NEXT: pushq %r14		; X64-NOBMI-NEXT: pushq %r14
▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
; 64-bit, but with 32-bit output		; 64-bit, but with 32-bit output

; Everything done in 64-bit, truncation happens last.		; Everything done in 64-bit, truncation happens last.
define i32 @bzhi64_32_c0(i64 %val, i64 %numlowbits) nounwind {		define i32 @bzhi64_32_c0(i64 %val, i64 %numlowbits) nounwind {
; X86-NOBMI-LABEL: bzhi64_32_c0:		; X86-NOBMI-LABEL: bzhi64_32_c0:
; X86-NOBMI: # %bb.0:		; X86-NOBMI: # %bb.0:
; X86-NOBMI-NEXT: movb $64, %cl		; X86-NOBMI-NEXT: movb $64, %cl
; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-NOBMI-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-NOBMI-NEXT: movl $-1, %edx
; X86-NOBMI-NEXT: movl $-1, %eax		; X86-NOBMI-NEXT: movl $-1, %eax
; X86-NOBMI-NEXT: shrl %cl, %eax		; X86-NOBMI-NEXT: shrl %cl, %eax
; X86-NOBMI-NEXT: shrdl %cl, %edx, %edx
; X86-NOBMI-NEXT: testb $32, %cl		; X86-NOBMI-NEXT: testb $32, %cl
; X86-NOBMI-NEXT: jne .LBB39_2		; X86-NOBMI-NEXT: jne .LBB39_2
; X86-NOBMI-NEXT: # %bb.1:		; X86-NOBMI-NEXT: # %bb.1:
; X86-NOBMI-NEXT: movl %edx, %eax		; X86-NOBMI-NEXT: movl $-1, %eax
; X86-NOBMI-NEXT: .LBB39_2:		; X86-NOBMI-NEXT: .LBB39_2:
; X86-NOBMI-NEXT: andl {{[0-9]+}}(%esp), %eax		; X86-NOBMI-NEXT: andl {{[0-9]+}}(%esp), %eax
; X86-NOBMI-NEXT: retl		; X86-NOBMI-NEXT: retl
;		;
; X86-BMI1NOTBM-LABEL: bzhi64_32_c0:		; X86-BMI1NOTBM-LABEL: bzhi64_32_c0:
; X86-BMI1NOTBM: # %bb.0:		; X86-BMI1NOTBM: # %bb.0:
; X86-BMI1NOTBM-NEXT: movb $64, %cl		; X86-BMI1NOTBM-NEXT: movb $64, %cl
; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1NOTBM-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-BMI1NOTBM-NEXT: movl $-1, %edx
; X86-BMI1NOTBM-NEXT: movl $-1, %eax		; X86-BMI1NOTBM-NEXT: movl $-1, %eax
; X86-BMI1NOTBM-NEXT: shrl %cl, %eax		; X86-BMI1NOTBM-NEXT: shrl %cl, %eax
; X86-BMI1NOTBM-NEXT: shrdl %cl, %edx, %edx
; X86-BMI1NOTBM-NEXT: testb $32, %cl		; X86-BMI1NOTBM-NEXT: testb $32, %cl
; X86-BMI1NOTBM-NEXT: jne .LBB39_2		; X86-BMI1NOTBM-NEXT: jne .LBB39_2
; X86-BMI1NOTBM-NEXT: # %bb.1:		; X86-BMI1NOTBM-NEXT: # %bb.1:
; X86-BMI1NOTBM-NEXT: movl %edx, %eax		; X86-BMI1NOTBM-NEXT: movl $-1, %eax
; X86-BMI1NOTBM-NEXT: .LBB39_2:		; X86-BMI1NOTBM-NEXT: .LBB39_2:
; X86-BMI1NOTBM-NEXT: andl {{[0-9]+}}(%esp), %eax		; X86-BMI1NOTBM-NEXT: andl {{[0-9]+}}(%esp), %eax
; X86-BMI1NOTBM-NEXT: retl		; X86-BMI1NOTBM-NEXT: retl
;		;
; X86-BMI1BMI2-LABEL: bzhi64_32_c0:		; X86-BMI1BMI2-LABEL: bzhi64_32_c0:
; X86-BMI1BMI2: # %bb.0:		; X86-BMI1BMI2: # %bb.0:
; X86-BMI1BMI2-NEXT: movb $64, %cl		; X86-BMI1BMI2-NEXT: movb $64, %cl
; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %cl		; X86-BMI1BMI2-NEXT: subb {{[0-9]+}}(%esp), %cl
; X86-BMI1BMI2-NEXT: movl $-1, %edx
; X86-BMI1BMI2-NEXT: movl $-1, %eax		; X86-BMI1BMI2-NEXT: movl $-1, %eax
; X86-BMI1BMI2-NEXT: shrdl %cl, %eax, %eax
; X86-BMI1BMI2-NEXT: testb $32, %cl		; X86-BMI1BMI2-NEXT: testb $32, %cl
; X86-BMI1BMI2-NEXT: je .LBB39_2		; X86-BMI1BMI2-NEXT: je .LBB39_2
; X86-BMI1BMI2-NEXT: # %bb.1:		; X86-BMI1BMI2-NEXT: # %bb.1:
; X86-BMI1BMI2-NEXT: shrxl %ecx, %edx, %eax		; X86-BMI1BMI2-NEXT: shrxl %ecx, %eax, %eax
; X86-BMI1BMI2-NEXT: .LBB39_2:		; X86-BMI1BMI2-NEXT: .LBB39_2:
; X86-BMI1BMI2-NEXT: andl {{[0-9]+}}(%esp), %eax		; X86-BMI1BMI2-NEXT: andl {{[0-9]+}}(%esp), %eax
; X86-BMI1BMI2-NEXT: retl		; X86-BMI1BMI2-NEXT: retl
;		;
; X64-NOBMI-LABEL: bzhi64_32_c0:		; X64-NOBMI-LABEL: bzhi64_32_c0:
; X64-NOBMI: # %bb.0:		; X64-NOBMI: # %bb.0:
; X64-NOBMI-NEXT: movq %rsi, %rcx		; X64-NOBMI-NEXT: movq %rsi, %rcx
; X64-NOBMI-NEXT: negb %cl		; X64-NOBMI-NEXT: negb %cl
▲ Show 20 Lines • Show All 1,413 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/fshl.ll

Show First 20 Lines • Show All 581 Lines • ▼ Show 20 Lines	; X64-NEXT: retq
%ld1 = load i32, i32 *%p1		%ld1 = load i32, i32 *%p1
%res = call i32 @llvm.fshl.i32(i32 %ld1, i32 %ld0, i32 8)		%res = call i32 @llvm.fshl.i32(i32 %ld1, i32 %ld0, i32 8)
ret i32 %res		ret i32 %res
}		}

define i64 @combine_fshl_load_i64(i64* %p) nounwind {		define i64 @combine_fshl_load_i64(i64* %p) nounwind {
; X86-FAST-LABEL: combine_fshl_load_i64:		; X86-FAST-LABEL: combine_fshl_load_i64:
; X86-FAST: # %bb.0:		; X86-FAST: # %bb.0:
; X86-FAST-NEXT: pushl %esi
; X86-FAST-NEXT: movl {{[0-9]+}}(%esp), %ecx		; X86-FAST-NEXT: movl {{[0-9]+}}(%esp), %ecx
; X86-FAST-NEXT: movl 12(%ecx), %eax		; X86-FAST-NEXT: movl 13(%ecx), %eax
; X86-FAST-NEXT: movl 16(%ecx), %esi		; X86-FAST-NEXT: movl 17(%ecx), %edx
; X86-FAST-NEXT: movl 20(%ecx), %edx
; X86-FAST-NEXT: shldl $24, %esi, %edx
; X86-FAST-NEXT: shrdl $8, %esi, %eax
; X86-FAST-NEXT: popl %esi
; X86-FAST-NEXT: retl		; X86-FAST-NEXT: retl
;		;
; X86-SLOW-LABEL: combine_fshl_load_i64:		; X86-SLOW-LABEL: combine_fshl_load_i64:
; X86-SLOW: # %bb.0:		; X86-SLOW: # %bb.0:
; X86-SLOW-NEXT: pushl %esi		; X86-SLOW-NEXT: pushl %esi
; X86-SLOW-NEXT: movl {{[0-9]+}}(%esp), %eax		; X86-SLOW-NEXT: movl {{[0-9]+}}(%esp), %eax
; X86-SLOW-NEXT: movl 20(%eax), %edx		; X86-SLOW-NEXT: movl 20(%eax), %edx
; X86-SLOW-NEXT: movl 12(%eax), %ecx		; X86-SLOW-NEXT: movl 12(%eax), %ecx
Show All 39 Lines

llvm/test/CodeGen/X86/fshr.ll

Show First 20 Lines • Show All 576 Lines • ▼ Show 20 Lines	; X64-NEXT: retq
%ld1 = load i32, i32 *%p1		%ld1 = load i32, i32 *%p1
%res = call i32 @llvm.fshr.i32(i32 %ld1, i32 %ld0, i32 8)		%res = call i32 @llvm.fshr.i32(i32 %ld1, i32 %ld0, i32 8)
ret i32 %res		ret i32 %res
}		}

define i64 @combine_fshr_load_i64(i64* %p) nounwind {		define i64 @combine_fshr_load_i64(i64* %p) nounwind {
; X86-FAST-LABEL: combine_fshr_load_i64:		; X86-FAST-LABEL: combine_fshr_load_i64:
; X86-FAST: # %bb.0:		; X86-FAST: # %bb.0:
; X86-FAST-NEXT: pushl %esi		; X86-FAST-NEXT: movl {{[0-9]+}}(%esp), %ecx
; X86-FAST-NEXT: movl {{[0-9]+}}(%esp), %eax		; X86-FAST-NEXT: movl 11(%ecx), %eax
; X86-FAST-NEXT: movzbl 11(%eax), %ecx		; X86-FAST-NEXT: movl 15(%ecx), %edx
; X86-FAST-NEXT: movl 12(%eax), %esi
; X86-FAST-NEXT: movl 16(%eax), %edx
; X86-FAST-NEXT: shldl $8, %esi, %edx
; X86-FAST-NEXT: movl %esi, %eax
; X86-FAST-NEXT: shll $8, %eax
; X86-FAST-NEXT: orl %ecx, %eax
; X86-FAST-NEXT: popl %esi
; X86-FAST-NEXT: retl		; X86-FAST-NEXT: retl
;		;
; X86-SLOW-LABEL: combine_fshr_load_i64:		; X86-SLOW-LABEL: combine_fshr_load_i64:
; X86-SLOW: # %bb.0:		; X86-SLOW: # %bb.0:
; X86-SLOW-NEXT: pushl %esi		; X86-SLOW-NEXT: pushl %esi
; X86-SLOW-NEXT: movl {{[0-9]+}}(%esp), %eax		; X86-SLOW-NEXT: movl {{[0-9]+}}(%esp), %eax
; X86-SLOW-NEXT: movzbl 11(%eax), %ecx		; X86-SLOW-NEXT: movzbl 11(%eax), %ecx
; X86-SLOW-NEXT: movl 12(%eax), %esi		; X86-SLOW-NEXT: movl 12(%eax), %esi
Show All 38 Lines

llvm/test/CodeGen/X86/shift-combine.ll

Show First 20 Lines • Show All 284 Lines • ▼ Show 20 Lines	; X64-NEXT: retq
ret i64 %conv1		ret i64 %conv1
}		}

define i64 @ashr_add_shl_mismatch_shifts2(i64 %r) nounwind {		define i64 @ashr_add_shl_mismatch_shifts2(i64 %r) nounwind {
; X32-LABEL: ashr_add_shl_mismatch_shifts2:		; X32-LABEL: ashr_add_shl_mismatch_shifts2:
; X32: # %bb.0:		; X32: # %bb.0:
; X32-NEXT: movl {{[0-9]+}}(%esp), %eax		; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
; X32-NEXT: movl {{[0-9]+}}(%esp), %edx		; X32-NEXT: movl {{[0-9]+}}(%esp), %edx
; X32-NEXT: shrdl $8, %edx, %eax
; X32-NEXT: shrl $8, %edx		; X32-NEXT: shrl $8, %edx
; X32-NEXT: incl %edx		; X32-NEXT: incl %edx
; X32-NEXT: shrdl $8, %edx, %eax		; X32-NEXT: shrdl $8, %edx, %eax
; X32-NEXT: shrl $8, %edx		; X32-NEXT: shrl $8, %edx
; X32-NEXT: retl		; X32-NEXT: retl
;		;
; X64-LABEL: ashr_add_shl_mismatch_shifts2:		; X64-LABEL: ashr_add_shl_mismatch_shifts2:
; X64: # %bb.0:		; X64: # %bb.0:
▲ Show 20 Lines • Show All 125 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/shift-parts.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=x86_64-- < %s \| FileCheck %s			; RUN: llc -mtriple=x86_64-- < %s \| FileCheck %s
	; PR4736			; PR4736

	%0 = type { i32, i8, [35 x i8] }			%0 = type { i32, i8, [35 x i8] }

	@g_144 = external global %0, align 8 ; <%0*> [#uses=1]			@g_144 = external global %0, align 8 ; <%0*> [#uses=1]

	define i32 @int87(i32 %uint64p_8, i1 %cond) nounwind {			define i32 @int87(i32 %uint64p_8, i1 %cond) nounwind {
	; CHECK-LABEL: int87:			; CHECK-LABEL: int87:
	; CHECK: # %bb.0: # %entry			; CHECK: # %bb.0: # %entry
	; CHECK-NEXT: movq g_144+{{.*}}(%rip), %rax			; CHECK-NEXT: movq g_144+{{.*}}(%rip), %rax
	; CHECK-NEXT: movq g_144+{{.*}}(%rip), %rdx			; CHECK-NEXT: movq g_144+{{.*}}(%rip), %rcx
	; CHECK-NEXT: movzbl %sil, %ecx			; CHECK-NEXT: movzbl %sil, %edx
	; CHECK-NEXT: shll $6, %ecx			; CHECK-NEXT: shll $6, %edx
	; CHECK-NEXT: .p2align 4, 0x90			; CHECK-NEXT: .p2align 4, 0x90
	; CHECK-NEXT: .LBB0_1: # %for.cond			; CHECK-NEXT: .LBB0_1: # %for.cond
	; CHECK-NEXT: # =>This Inner Loop Header: Depth=1			; CHECK-NEXT: # =>This Inner Loop Header: Depth=1
	; CHECK-NEXT: movq %rdx, %rsi			; CHECK-NEXT: testb $64, %dl
	; CHECK-NEXT: shrdq %cl, %rax, %rsi			; CHECK-NEXT: movq %rcx, %rsi
	; CHECK-NEXT: testb $64, %cl
	; CHECK-NEXT: cmovneq %rax, %rsi			; CHECK-NEXT: cmovneq %rax, %rsi
	; CHECK-NEXT: orl $0, %esi			; CHECK-NEXT: orl $0, %esi
	; CHECK-NEXT: je .LBB0_1			; CHECK-NEXT: je .LBB0_1
	; CHECK-NEXT: # %bb.2: # %if.then			; CHECK-NEXT: # %bb.2: # %if.then
	; CHECK-NEXT: movl $1, %eax			; CHECK-NEXT: movl $1, %eax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%srcval4 = load i320, i320* bitcast (%0* @g_144 to i320*), align 8 ; <i320> [#uses=1]			%srcval4 = load i320, i320* bitcast (%0* @g_144 to i320*), align 8 ; <i320> [#uses=1]
	Show All 12 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Replace (most) X86ISD::SHLD/SHRD usage with ISD::FSHL/FSHR generic opcodes (PR39467)ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 249584

llvm/lib/Target/X86/X86ISelLowering.h

llvm/lib/Target/X86/X86ISelLowering.cpp

llvm/lib/Target/X86/X86InstrCompiler.td

llvm/lib/Target/X86/X86InstrInfo.td

llvm/lib/Target/X86/X86InstrShiftRotate.td

llvm/test/CodeGen/X86/clear-highbits.ll

llvm/test/CodeGen/X86/clear-lowbits.ll

llvm/test/CodeGen/X86/extract-bits.ll

llvm/test/CodeGen/X86/extract-lowbits.ll

llvm/test/CodeGen/X86/fshl.ll

llvm/test/CodeGen/X86/fshr.ll

llvm/test/CodeGen/X86/shift-combine.ll

llvm/test/CodeGen/X86/shift-parts.ll

[X86] Replace (most) X86ISD::SHLD/SHRD usage with ISD::FSHL/FSHR generic opcodes (PR39467)
ClosedPublic