Diff 161681

llvm/trunk/lib/CodeGen/SelectionDAG/DAGCombiner.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 9,057 Lines • ▼ Show 20 Lines	SDValue DAGCombiner::ReduceLoadWidth(SDNode *N) {
SDValue N0 = N->getOperand(0);		SDValue N0 = N->getOperand(0);
EVT VT = N->getValueType(0);		EVT VT = N->getValueType(0);
EVT ExtVT = VT;		EVT ExtVT = VT;

// This transformation isn't valid for vector loads.		// This transformation isn't valid for vector loads.
if (VT.isVector())		if (VT.isVector())
return SDValue();		return SDValue();

		unsigned ShAmt = 0;
		bool HasShiftedOffset = false;
// Special case: SIGN_EXTEND_INREG is basically truncating to ExtVT then		// Special case: SIGN_EXTEND_INREG is basically truncating to ExtVT then
// extended to VT.		// extended to VT.
if (Opc == ISD::SIGN_EXTEND_INREG) {		if (Opc == ISD::SIGN_EXTEND_INREG) {
ExtType = ISD::SEXTLOAD;		ExtType = ISD::SEXTLOAD;
ExtVT = cast<VTSDNode>(N->getOperand(1))->getVT();		ExtVT = cast<VTSDNode>(N->getOperand(1))->getVT();
} else if (Opc == ISD::SRL) {		} else if (Opc == ISD::SRL) {
// Another special-case: SRL is basically zero-extending a narrower value,		// Another special-case: SRL is basically zero-extending a narrower value,
// or it maybe shifting a higher subword, half or byte into the lowest		// or it maybe shifting a higher subword, half or byte into the lowest
Show All 11 Lines	if (Opc == ISD::SIGN_EXTEND_INREG) {
if (LN0->getExtensionType() != ISD::SEXTLOAD && MemoryWidth > ShiftAmt)		if (LN0->getExtensionType() != ISD::SEXTLOAD && MemoryWidth > ShiftAmt)
ExtVT = EVT::getIntegerVT(*DAG.getContext(), MemoryWidth - ShiftAmt);		ExtVT = EVT::getIntegerVT(*DAG.getContext(), MemoryWidth - ShiftAmt);
else		else
ExtVT = EVT::getIntegerVT(*DAG.getContext(),		ExtVT = EVT::getIntegerVT(*DAG.getContext(),
VT.getSizeInBits() - ShiftAmt);		VT.getSizeInBits() - ShiftAmt);
} else if (Opc == ISD::AND) {		} else if (Opc == ISD::AND) {
// An AND with a constant mask is the same as a truncate + zero-extend.		// An AND with a constant mask is the same as a truncate + zero-extend.
auto AndC = dyn_cast<ConstantSDNode>(N->getOperand(1));		auto AndC = dyn_cast<ConstantSDNode>(N->getOperand(1));
if (!AndC \|\| !AndC->getAPIntValue().isMask())		if (!AndC)
		return SDValue();

		const APInt &Mask = AndC->getAPIntValue();
		unsigned ActiveBits = 0;
		if (Mask.isMask()) {
		ActiveBits = Mask.countTrailingOnes();
		} else if (Mask.isShiftedMask()) {
		ShAmt = Mask.countTrailingZeros();
		APInt ShiftedMask = Mask.lshr(ShAmt);
		ActiveBits = ShiftedMask.countTrailingOnes();
		HasShiftedOffset = true;
		} else
return SDValue();		return SDValue();

unsigned ActiveBits = AndC->getAPIntValue().countTrailingOnes();
ExtType = ISD::ZEXTLOAD;		ExtType = ISD::ZEXTLOAD;
ExtVT = EVT::getIntegerVT(*DAG.getContext(), ActiveBits);		ExtVT = EVT::getIntegerVT(*DAG.getContext(), ActiveBits);
}		}

unsigned ShAmt = 0;
if (N0.getOpcode() == ISD::SRL && N0.hasOneUse()) {		if (N0.getOpcode() == ISD::SRL && N0.hasOneUse()) {
SDValue SRL = N0;		SDValue SRL = N0;
if (auto *ConstShift = dyn_cast<ConstantSDNode>(SRL.getOperand(1))) {		if (auto *ConstShift = dyn_cast<ConstantSDNode>(SRL.getOperand(1))) {
ShAmt = ConstShift->getZExtValue();		ShAmt = ConstShift->getZExtValue();
unsigned EVTBits = ExtVT.getSizeInBits();		unsigned EVTBits = ExtVT.getSizeInBits();
// Is the shift amount a multiple of size of VT?		// Is the shift amount a multiple of size of VT?
if ((ShAmt & (EVTBits-1)) == 0) {		if ((ShAmt & (EVTBits-1)) == 0) {
N0 = N0.getOperand(0);		N0 = N0.getOperand(0);
▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines	SDValue DAGCombiner::ReduceLoadWidth(SDNode *N) {
// If we haven't found a load, we can't narrow it.		// If we haven't found a load, we can't narrow it.
if (!isa<LoadSDNode>(N0))		if (!isa<LoadSDNode>(N0))
return SDValue();		return SDValue();

LoadSDNode *LN0 = cast<LoadSDNode>(N0);		LoadSDNode *LN0 = cast<LoadSDNode>(N0);
if (!isLegalNarrowLdSt(LN0, ExtType, ExtVT, ShAmt))		if (!isLegalNarrowLdSt(LN0, ExtType, ExtVT, ShAmt))
return SDValue();		return SDValue();

// For big endian targets, we need to adjust the offset to the pointer to		auto AdjustBigEndianShift = [&](unsigned ShAmt) {
// load the correct bytes.
if (DAG.getDataLayout().isBigEndian()) {
unsigned LVTStoreBits = LN0->getMemoryVT().getStoreSizeInBits();		unsigned LVTStoreBits = LN0->getMemoryVT().getStoreSizeInBits();
unsigned EVTStoreBits = ExtVT.getStoreSizeInBits();		unsigned EVTStoreBits = ExtVT.getStoreSizeInBits();
ShAmt = LVTStoreBits - EVTStoreBits - ShAmt;		return LVTStoreBits - EVTStoreBits - ShAmt;
}		};

		// For big endian targets, we need to adjust the offset to the pointer to
		// load the correct bytes.
		if (DAG.getDataLayout().isBigEndian())
		ShAmt = AdjustBigEndianShift(ShAmt);

EVT PtrType = N0.getOperand(1).getValueType();		EVT PtrType = N0.getOperand(1).getValueType();
uint64_t PtrOff = ShAmt / 8;		uint64_t PtrOff = ShAmt / 8;
unsigned NewAlign = MinAlign(LN0->getAlignment(), PtrOff);		unsigned NewAlign = MinAlign(LN0->getAlignment(), PtrOff);
SDLoc DL(LN0);		SDLoc DL(LN0);
// The original load itself didn't wrap, so an offset within it doesn't.		// The original load itself didn't wrap, so an offset within it doesn't.
SDNodeFlags Flags;		SDNodeFlags Flags;
Flags.setNoUnsignedWrap(true);		Flags.setNoUnsignedWrap(true);
Show All 31 Lines	if (ShLeftAmt != 0) {
SDLoc DL(N0);		SDLoc DL(N0);
if (ShLeftAmt >= VT.getSizeInBits())		if (ShLeftAmt >= VT.getSizeInBits())
Result = DAG.getConstant(0, DL, VT);		Result = DAG.getConstant(0, DL, VT);
else		else
Result = DAG.getNode(ISD::SHL, DL, VT,		Result = DAG.getNode(ISD::SHL, DL, VT,
Result, DAG.getConstant(ShLeftAmt, DL, ShImmTy));		Result, DAG.getConstant(ShLeftAmt, DL, ShImmTy));
}		}

		if (HasShiftedOffset) {
		// Recalculate the shift amount after it has been altered to calculate
		// the offset.
		if (DAG.getDataLayout().isBigEndian())
		ShAmt = AdjustBigEndianShift(ShAmt);

		// We're using a shifted mask, so the load now has an offset. This means we
		// now need to shift right the mask to match the new load and then shift
		// right the result of the AND.
		const APInt &Mask = cast<ConstantSDNode>(N->getOperand(1))->getAPIntValue();
		APInt ShiftedMask = Mask.lshr(ShAmt);
		DAG.UpdateNodeOperands(N, Result, DAG.getConstant(ShiftedMask, DL, VT));
		SDValue ShiftC = DAG.getConstant(ShAmt, DL, VT);
		SDValue Shifted = DAG.getNode(ISD::SHL, DL, VT, SDValue(N, 0),
		fpichetUnsubmitted Not Done Reply Inline Actions I think this line should be: SDValue Shifted = DAG.getNode(ISD::SHL, DL, VT, N->getOperand(0), fpichet: I think this line should be: SDValue Shifted = DAG.getNode(ISD::SHL, DL, VT, N->getOperand(0),
		ShiftC);
		DAG.ReplaceAllUsesOfValueWith(SDValue(N, 0), Shifted);
		DAG.UpdateNodeOperands(Shifted.getNode(), SDValue(N, 0), ShiftC);
		}
// Return the new loaded value.		// Return the new loaded value.
return Result;		return Result;
}		}

SDValue DAGCombiner::visitSIGN_EXTEND_INREG(SDNode *N) {		SDValue DAGCombiner::visitSIGN_EXTEND_INREG(SDNode *N) {
SDValue N0 = N->getOperand(0);		SDValue N0 = N->getOperand(0);
SDValue N1 = N->getOperand(1);		SDValue N1 = N->getOperand(1);
EVT VT = N->getValueType(0);		EVT VT = N->getValueType(0);
▲ Show 20 Lines • Show All 9,451 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/ARM/and-load-combine.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc -mtriple=armv7 %s -o - \| FileCheck %s --check-prefix=ARM		; RUN: llc -mtriple=armv7 %s -o - \| FileCheck %s --check-prefix=ARM
; RUN: llc -mtriple=armv7eb %s -o - \| FileCheck %s --check-prefix=ARMEB		; RUN: llc -mtriple=armv7eb %s -o - \| FileCheck %s --check-prefix=ARMEB
; RUN: llc -mtriple=armv6m %s -o - \| FileCheck %s --check-prefix=THUMB1		; RUN: llc -mtriple=armv6m %s -o - \| FileCheck %s --check-prefix=THUMB1
; RUN: llc -mtriple=thumbv8m.main %s -o - \| FileCheck %s --check-prefix=THUMB2		; RUN: llc -mtriple=thumbv8m.main %s -o - \| FileCheck %s --check-prefix=THUMB2

define arm_aapcscc zeroext i1 @cmp_xor8_short_short(i16* nocapture readonly %a,		define arm_aapcscc zeroext i1 @cmp_xor8_short_short(i16* nocapture readonly %a, i16* nocapture readonly %b) {
i16* nocapture readonly %b) {
; ARM-LABEL: cmp_xor8_short_short:		; ARM-LABEL: cmp_xor8_short_short:
; ARM: @ %bb.0: @ %entry		; ARM: @ %bb.0: @ %entry
; ARM-NEXT: ldrb r0, [r0]		; ARM-NEXT: ldrb r0, [r0]
; ARM-NEXT: ldrb r1, [r1]		; ARM-NEXT: ldrb r1, [r1]
; ARM-NEXT: eor r0, r1, r0		; ARM-NEXT: eor r0, r1, r0
; ARM-NEXT: clz r0, r0		; ARM-NEXT: clz r0, r0
; ARM-NEXT: lsr r0, r0, #5		; ARM-NEXT: lsr r0, r0, #5
; ARM-NEXT: bx lr		; ARM-NEXT: bx lr
Show All 29 Lines	entry:
%0 = load i16, i16* %a, align 2		%0 = load i16, i16* %a, align 2
%1 = load i16, i16* %b, align 2		%1 = load i16, i16* %b, align 2
%xor2 = xor i16 %1, %0		%xor2 = xor i16 %1, %0
%2 = and i16 %xor2, 255		%2 = and i16 %xor2, 255
%cmp = icmp eq i16 %2, 0		%cmp = icmp eq i16 %2, 0
ret i1 %cmp		ret i1 %cmp
}		}

define arm_aapcscc zeroext i1 @cmp_xor8_short_int(i16* nocapture readonly %a,		define arm_aapcscc zeroext i1 @cmp_xor8_short_int(i16* nocapture readonly %a, i32* nocapture readonly %b) {
i32* nocapture readonly %b) {
; ARM-LABEL: cmp_xor8_short_int:		; ARM-LABEL: cmp_xor8_short_int:
; ARM: @ %bb.0: @ %entry		; ARM: @ %bb.0: @ %entry
; ARM-NEXT: ldrb r0, [r0]		; ARM-NEXT: ldrb r0, [r0]
; ARM-NEXT: ldrb r1, [r1]		; ARM-NEXT: ldrb r1, [r1]
; ARM-NEXT: eor r0, r1, r0		; ARM-NEXT: eor r0, r1, r0
; ARM-NEXT: clz r0, r0		; ARM-NEXT: clz r0, r0
; ARM-NEXT: lsr r0, r0, #5		; ARM-NEXT: lsr r0, r0, #5
; ARM-NEXT: bx lr		; ARM-NEXT: bx lr
Show All 30 Lines	entry:
%conv = zext i16 %0 to i32		%conv = zext i16 %0 to i32
%1 = load i32, i32* %b, align 4		%1 = load i32, i32* %b, align 4
%xor = xor i32 %1, %conv		%xor = xor i32 %1, %conv
%and = and i32 %xor, 255		%and = and i32 %xor, 255
%cmp = icmp eq i32 %and, 0		%cmp = icmp eq i32 %and, 0
ret i1 %cmp		ret i1 %cmp
}		}

define arm_aapcscc zeroext i1 @cmp_xor8_int_int(i32* nocapture readonly %a,		define arm_aapcscc zeroext i1 @cmp_xor8_int_int(i32* nocapture readonly %a, i32* nocapture readonly %b) {
i32* nocapture readonly %b) {
; ARM-LABEL: cmp_xor8_int_int:		; ARM-LABEL: cmp_xor8_int_int:
; ARM: @ %bb.0: @ %entry		; ARM: @ %bb.0: @ %entry
; ARM-NEXT: ldrb r0, [r0]		; ARM-NEXT: ldrb r0, [r0]
; ARM-NEXT: ldrb r1, [r1]		; ARM-NEXT: ldrb r1, [r1]
; ARM-NEXT: eor r0, r1, r0		; ARM-NEXT: eor r0, r1, r0
; ARM-NEXT: clz r0, r0		; ARM-NEXT: clz r0, r0
; ARM-NEXT: lsr r0, r0, #5		; ARM-NEXT: lsr r0, r0, #5
; ARM-NEXT: bx lr		; ARM-NEXT: bx lr
Show All 29 Lines	entry:
%0 = load i32, i32* %a, align 4		%0 = load i32, i32* %a, align 4
%1 = load i32, i32* %b, align 4		%1 = load i32, i32* %b, align 4
%xor = xor i32 %1, %0		%xor = xor i32 %1, %0
%and = and i32 %xor, 255		%and = and i32 %xor, 255
%cmp = icmp eq i32 %and, 0		%cmp = icmp eq i32 %and, 0
ret i1 %cmp		ret i1 %cmp
}		}

define arm_aapcscc zeroext i1 @cmp_xor16(i32* nocapture readonly %a,		define arm_aapcscc zeroext i1 @cmp_xor16(i32* nocapture readonly %a, i32* nocapture readonly %b) {
i32* nocapture readonly %b) {
; ARM-LABEL: cmp_xor16:		; ARM-LABEL: cmp_xor16:
; ARM: @ %bb.0: @ %entry		; ARM: @ %bb.0: @ %entry
; ARM-NEXT: ldrh r0, [r0]		; ARM-NEXT: ldrh r0, [r0]
; ARM-NEXT: ldrh r1, [r1]		; ARM-NEXT: ldrh r1, [r1]
; ARM-NEXT: eor r0, r1, r0		; ARM-NEXT: eor r0, r1, r0
; ARM-NEXT: clz r0, r0		; ARM-NEXT: clz r0, r0
; ARM-NEXT: lsr r0, r0, #5		; ARM-NEXT: lsr r0, r0, #5
; ARM-NEXT: bx lr		; ARM-NEXT: bx lr
Show All 29 Lines	entry:
%0 = load i32, i32* %a, align 4		%0 = load i32, i32* %a, align 4
%1 = load i32, i32* %b, align 4		%1 = load i32, i32* %b, align 4
%xor = xor i32 %1, %0		%xor = xor i32 %1, %0
%and = and i32 %xor, 65535		%and = and i32 %xor, 65535
%cmp = icmp eq i32 %and, 0		%cmp = icmp eq i32 %and, 0
ret i1 %cmp		ret i1 %cmp
}		}

define arm_aapcscc zeroext i1 @cmp_or8_short_short(i16* nocapture readonly %a,		define arm_aapcscc zeroext i1 @cmp_or8_short_short(i16* nocapture readonly %a, i16* nocapture readonly %b) {
i16* nocapture readonly %b) {
; ARM-LABEL: cmp_or8_short_short:		; ARM-LABEL: cmp_or8_short_short:
; ARM: @ %bb.0: @ %entry		; ARM: @ %bb.0: @ %entry
; ARM-NEXT: ldrb r0, [r0]		; ARM-NEXT: ldrb r0, [r0]
; ARM-NEXT: ldrb r1, [r1]		; ARM-NEXT: ldrb r1, [r1]
; ARM-NEXT: orr r0, r1, r0		; ARM-NEXT: orr r0, r1, r0
; ARM-NEXT: clz r0, r0		; ARM-NEXT: clz r0, r0
; ARM-NEXT: lsr r0, r0, #5		; ARM-NEXT: lsr r0, r0, #5
; ARM-NEXT: bx lr		; ARM-NEXT: bx lr
Show All 29 Lines	entry:
%0 = load i16, i16* %a, align 2		%0 = load i16, i16* %a, align 2
%1 = load i16, i16* %b, align 2		%1 = load i16, i16* %b, align 2
%or2 = or i16 %1, %0		%or2 = or i16 %1, %0
%2 = and i16 %or2, 255		%2 = and i16 %or2, 255
%cmp = icmp eq i16 %2, 0		%cmp = icmp eq i16 %2, 0
ret i1 %cmp		ret i1 %cmp
}		}

define arm_aapcscc zeroext i1 @cmp_or8_short_int(i16* nocapture readonly %a,		define arm_aapcscc zeroext i1 @cmp_or8_short_int(i16* nocapture readonly %a, i32* nocapture readonly %b) {
i32* nocapture readonly %b) {
; ARM-LABEL: cmp_or8_short_int:		; ARM-LABEL: cmp_or8_short_int:
; ARM: @ %bb.0: @ %entry		; ARM: @ %bb.0: @ %entry
; ARM-NEXT: ldrb r0, [r0]		; ARM-NEXT: ldrb r0, [r0]
; ARM-NEXT: ldrb r1, [r1]		; ARM-NEXT: ldrb r1, [r1]
; ARM-NEXT: orr r0, r1, r0		; ARM-NEXT: orr r0, r1, r0
; ARM-NEXT: clz r0, r0		; ARM-NEXT: clz r0, r0
; ARM-NEXT: lsr r0, r0, #5		; ARM-NEXT: lsr r0, r0, #5
; ARM-NEXT: bx lr		; ARM-NEXT: bx lr
Show All 30 Lines	entry:
%conv = zext i16 %0 to i32		%conv = zext i16 %0 to i32
%1 = load i32, i32* %b, align 4		%1 = load i32, i32* %b, align 4
%or = or i32 %1, %conv		%or = or i32 %1, %conv
%and = and i32 %or, 255		%and = and i32 %or, 255
%cmp = icmp eq i32 %and, 0		%cmp = icmp eq i32 %and, 0
ret i1 %cmp		ret i1 %cmp
}		}

define arm_aapcscc zeroext i1 @cmp_or8_int_int(i32* nocapture readonly %a,		define arm_aapcscc zeroext i1 @cmp_or8_int_int(i32* nocapture readonly %a, i32* nocapture readonly %b) {
i32* nocapture readonly %b) {
; ARM-LABEL: cmp_or8_int_int:		; ARM-LABEL: cmp_or8_int_int:
; ARM: @ %bb.0: @ %entry		; ARM: @ %bb.0: @ %entry
; ARM-NEXT: ldrb r0, [r0]		; ARM-NEXT: ldrb r0, [r0]
; ARM-NEXT: ldrb r1, [r1]		; ARM-NEXT: ldrb r1, [r1]
; ARM-NEXT: orr r0, r1, r0		; ARM-NEXT: orr r0, r1, r0
; ARM-NEXT: clz r0, r0		; ARM-NEXT: clz r0, r0
; ARM-NEXT: lsr r0, r0, #5		; ARM-NEXT: lsr r0, r0, #5
; ARM-NEXT: bx lr		; ARM-NEXT: bx lr
Show All 29 Lines	entry:
%0 = load i32, i32* %a, align 4		%0 = load i32, i32* %a, align 4
%1 = load i32, i32* %b, align 4		%1 = load i32, i32* %b, align 4
%or = or i32 %1, %0		%or = or i32 %1, %0
%and = and i32 %or, 255		%and = and i32 %or, 255
%cmp = icmp eq i32 %and, 0		%cmp = icmp eq i32 %and, 0
ret i1 %cmp		ret i1 %cmp
}		}

define arm_aapcscc zeroext i1 @cmp_or16(i32* nocapture readonly %a,		define arm_aapcscc zeroext i1 @cmp_or16(i32* nocapture readonly %a, i32* nocapture readonly %b) {
i32* nocapture readonly %b) {
; ARM-LABEL: cmp_or16:		; ARM-LABEL: cmp_or16:
; ARM: @ %bb.0: @ %entry		; ARM: @ %bb.0: @ %entry
; ARM-NEXT: ldrh r0, [r0]		; ARM-NEXT: ldrh r0, [r0]
; ARM-NEXT: ldrh r1, [r1]		; ARM-NEXT: ldrh r1, [r1]
; ARM-NEXT: orr r0, r1, r0		; ARM-NEXT: orr r0, r1, r0
; ARM-NEXT: clz r0, r0		; ARM-NEXT: clz r0, r0
; ARM-NEXT: lsr r0, r0, #5		; ARM-NEXT: lsr r0, r0, #5
; ARM-NEXT: bx lr		; ARM-NEXT: bx lr
Show All 29 Lines	entry:
%0 = load i32, i32* %a, align 4		%0 = load i32, i32* %a, align 4
%1 = load i32, i32* %b, align 4		%1 = load i32, i32* %b, align 4
%or = or i32 %1, %0		%or = or i32 %1, %0
%and = and i32 %or, 65535		%and = and i32 %or, 65535
%cmp = icmp eq i32 %and, 0		%cmp = icmp eq i32 %and, 0
ret i1 %cmp		ret i1 %cmp
}		}

define arm_aapcscc zeroext i1 @cmp_and8_short_short(i16* nocapture readonly %a,		define arm_aapcscc zeroext i1 @cmp_and8_short_short(i16* nocapture readonly %a, i16* nocapture readonly %b) {
i16* nocapture readonly %b) {
; ARM-LABEL: cmp_and8_short_short:		; ARM-LABEL: cmp_and8_short_short:
; ARM: @ %bb.0: @ %entry		; ARM: @ %bb.0: @ %entry
; ARM-NEXT: ldrb r1, [r1]		; ARM-NEXT: ldrb r1, [r1]
; ARM-NEXT: ldrb r0, [r0]		; ARM-NEXT: ldrb r0, [r0]
; ARM-NEXT: and r0, r0, r1		; ARM-NEXT: and r0, r0, r1
; ARM-NEXT: clz r0, r0		; ARM-NEXT: clz r0, r0
; ARM-NEXT: lsr r0, r0, #5		; ARM-NEXT: lsr r0, r0, #5
; ARM-NEXT: bx lr		; ARM-NEXT: bx lr
Show All 29 Lines	entry:
%0 = load i16, i16* %a, align 2		%0 = load i16, i16* %a, align 2
%1 = load i16, i16* %b, align 2		%1 = load i16, i16* %b, align 2
%and3 = and i16 %0, 255		%and3 = and i16 %0, 255
%2 = and i16 %and3, %1		%2 = and i16 %and3, %1
%cmp = icmp eq i16 %2, 0		%cmp = icmp eq i16 %2, 0
ret i1 %cmp		ret i1 %cmp
}		}

define arm_aapcscc zeroext i1 @cmp_and8_short_int(i16* nocapture readonly %a,		define arm_aapcscc zeroext i1 @cmp_and8_short_int(i16* nocapture readonly %a, i32* nocapture readonly %b) {
i32* nocapture readonly %b) {
; ARM-LABEL: cmp_and8_short_int:		; ARM-LABEL: cmp_and8_short_int:
; ARM: @ %bb.0: @ %entry		; ARM: @ %bb.0: @ %entry
; ARM-NEXT: ldrb r0, [r0]		; ARM-NEXT: ldrb r0, [r0]
; ARM-NEXT: ldrb r1, [r1]		; ARM-NEXT: ldrb r1, [r1]
; ARM-NEXT: and r0, r1, r0		; ARM-NEXT: and r0, r1, r0
; ARM-NEXT: clz r0, r0		; ARM-NEXT: clz r0, r0
; ARM-NEXT: lsr r0, r0, #5		; ARM-NEXT: lsr r0, r0, #5
; ARM-NEXT: bx lr		; ARM-NEXT: bx lr
Show All 30 Lines	entry:
%1 = load i32, i32* %b, align 4		%1 = load i32, i32* %b, align 4
%2 = and i16 %0, 255		%2 = and i16 %0, 255
%and = zext i16 %2 to i32		%and = zext i16 %2 to i32
%and1 = and i32 %1, %and		%and1 = and i32 %1, %and
%cmp = icmp eq i32 %and1, 0		%cmp = icmp eq i32 %and1, 0
ret i1 %cmp		ret i1 %cmp
}		}

define arm_aapcscc zeroext i1 @cmp_and8_int_int(i32* nocapture readonly %a,		define arm_aapcscc zeroext i1 @cmp_and8_int_int(i32* nocapture readonly %a, i32* nocapture readonly %b) {
i32* nocapture readonly %b) {
; ARM-LABEL: cmp_and8_int_int:		; ARM-LABEL: cmp_and8_int_int:
; ARM: @ %bb.0: @ %entry		; ARM: @ %bb.0: @ %entry
; ARM-NEXT: ldrb r1, [r1]		; ARM-NEXT: ldrb r1, [r1]
; ARM-NEXT: ldrb r0, [r0]		; ARM-NEXT: ldrb r0, [r0]
; ARM-NEXT: and r0, r0, r1		; ARM-NEXT: and r0, r0, r1
; ARM-NEXT: clz r0, r0		; ARM-NEXT: clz r0, r0
; ARM-NEXT: lsr r0, r0, #5		; ARM-NEXT: lsr r0, r0, #5
; ARM-NEXT: bx lr		; ARM-NEXT: bx lr
Show All 29 Lines	entry:
%0 = load i32, i32* %a, align 4		%0 = load i32, i32* %a, align 4
%1 = load i32, i32* %b, align 4		%1 = load i32, i32* %b, align 4
%and = and i32 %0, 255		%and = and i32 %0, 255
%and1 = and i32 %and, %1		%and1 = and i32 %and, %1
%cmp = icmp eq i32 %and1, 0		%cmp = icmp eq i32 %and1, 0
ret i1 %cmp		ret i1 %cmp
}		}

define arm_aapcscc zeroext i1 @cmp_and16(i32* nocapture readonly %a,		define arm_aapcscc zeroext i1 @cmp_and16(i32* nocapture readonly %a, i32* nocapture readonly %b) {
i32* nocapture readonly %b) {
; ARM-LABEL: cmp_and16:		; ARM-LABEL: cmp_and16:
; ARM: @ %bb.0: @ %entry		; ARM: @ %bb.0: @ %entry
; ARM-NEXT: ldrh r1, [r1]		; ARM-NEXT: ldrh r1, [r1]
; ARM-NEXT: ldrh r0, [r0]		; ARM-NEXT: ldrh r0, [r0]
; ARM-NEXT: and r0, r0, r1		; ARM-NEXT: and r0, r0, r1
; ARM-NEXT: clz r0, r0		; ARM-NEXT: clz r0, r0
; ARM-NEXT: lsr r0, r0, #5		; ARM-NEXT: lsr r0, r0, #5
; ARM-NEXT: bx lr		; ARM-NEXT: bx lr
▲ Show 20 Lines • Show All 495 Lines • ▼ Show 20 Lines
entry:		entry:
%0 = load i32, i32* %p, align 4		%0 = load i32, i32* %p, align 4
%neg = xor i32 %0, -1		%neg = xor i32 %0, -1
%and = and i32 %neg, 255		%and = and i32 %neg, 255
store i32 %and, i32* %p, align 4		store i32 %and, i32* %p, align 4
ret void		ret void
}		}

		define arm_aapcscc void @test10(i32* nocapture %p) {
; ARM-LABEL: test10:		; ARM-LABEL: test10:
; ARM: @ %bb.0: @ %entry		; ARM: @ %bb.0: @ %entry
; ARM-NEXT: ldrb r1, [r0]		; ARM-NEXT: ldrb r1, [r0]
; ARM-NEXT: eor r1, r1, #255		; ARM-NEXT: eor r1, r1, #255
; ARM-NEXT: str r1, [r0]		; ARM-NEXT: str r1, [r0]
; ARM-NEXT: bx lr		; ARM-NEXT: bx lr
;		;
; ARMEB-LABEL: test10:		; ARMEB-LABEL: test10:
Show All 12 Lines
; THUMB1-NEXT: bx lr		; THUMB1-NEXT: bx lr
;		;
; THUMB2-LABEL: test10:		; THUMB2-LABEL: test10:
; THUMB2: @ %bb.0: @ %entry		; THUMB2: @ %bb.0: @ %entry
; THUMB2-NEXT: ldrb r1, [r0]		; THUMB2-NEXT: ldrb r1, [r0]
; THUMB2-NEXT: eor r1, r1, #255		; THUMB2-NEXT: eor r1, r1, #255
; THUMB2-NEXT: str r1, [r0]		; THUMB2-NEXT: str r1, [r0]
; THUMB2-NEXT: bx lr		; THUMB2-NEXT: bx lr
define arm_aapcscc void @test10(i32* nocapture %p) {
entry:		entry:
%0 = load i32, i32* %p, align 4		%0 = load i32, i32* %p, align 4
%neg = and i32 %0, 255		%neg = and i32 %0, 255
%and = xor i32 %neg, 255		%and = xor i32 %neg, 255
store i32 %and, i32* %p, align 4		store i32 %and, i32* %p, align 4
ret void		ret void
}		}

		define arm_aapcscc i32 @test11(i32* nocapture %p) {
		; ARM-LABEL: test11:
		; ARM: @ %bb.0:
		; ARM-NEXT: ldrb r0, [r0, #1]
		; ARM-NEXT: lsl r0, r0, #8
		; ARM-NEXT: bx lr
		;
		; ARMEB-LABEL: test11:
		; ARMEB: @ %bb.0:
		; ARMEB-NEXT: ldrb r0, [r0, #2]
		; ARMEB-NEXT: lsl r0, r0, #8
		; ARMEB-NEXT: bx lr
		;
		; THUMB1-LABEL: test11:
		; THUMB1: @ %bb.0:
		; THUMB1-NEXT: ldrb r0, [r0, #1]
		; THUMB1-NEXT: lsls r0, r0, #8
		; THUMB1-NEXT: bx lr
		;
		; THUMB2-LABEL: test11:
		; THUMB2: @ %bb.0:
		; THUMB2-NEXT: ldrb r0, [r0, #1]
		; THUMB2-NEXT: lsls r0, r0, #8
		; THUMB2-NEXT: bx lr
		%1 = load i32, i32* %p, align 4
		%and = and i32 %1, 65280
		ret i32 %and
		}

		define arm_aapcscc i32 @test12(i32* nocapture %p) {
		; ARM-LABEL: test12:
		; ARM: @ %bb.0:
		; ARM-NEXT: ldrb r0, [r0, #2]
		; ARM-NEXT: lsl r0, r0, #16
		; ARM-NEXT: bx lr
		;
		; ARMEB-LABEL: test12:
		; ARMEB: @ %bb.0:
		; ARMEB-NEXT: ldrb r0, [r0, #1]
		; ARMEB-NEXT: lsl r0, r0, #16
		; ARMEB-NEXT: bx lr
		;
		; THUMB1-LABEL: test12:
		; THUMB1: @ %bb.0:
		; THUMB1-NEXT: ldrb r0, [r0, #2]
		; THUMB1-NEXT: lsls r0, r0, #16
		; THUMB1-NEXT: bx lr
		;
		; THUMB2-LABEL: test12:
		; THUMB2: @ %bb.0:
		; THUMB2-NEXT: ldrb r0, [r0, #2]
		; THUMB2-NEXT: lsls r0, r0, #16
		; THUMB2-NEXT: bx lr
		%1 = load i32, i32* %p, align 4
		%and = and i32 %1, 16711680
		ret i32 %and
		}

		define arm_aapcscc i32 @test13(i32* nocapture %p) {
		; ARM-LABEL: test13:
		; ARM: @ %bb.0:
		; ARM-NEXT: ldrb r0, [r0, #3]
		; ARM-NEXT: lsl r0, r0, #24
		; ARM-NEXT: bx lr
		;
		; ARMEB-LABEL: test13:
		; ARMEB: @ %bb.0:
		; ARMEB-NEXT: ldrb r0, [r0]
		; ARMEB-NEXT: lsl r0, r0, #24
		; ARMEB-NEXT: bx lr
		;
		; THUMB1-LABEL: test13:
		; THUMB1: @ %bb.0:
		; THUMB1-NEXT: ldrb r0, [r0, #3]
		; THUMB1-NEXT: lsls r0, r0, #24
		; THUMB1-NEXT: bx lr
		;
		; THUMB2-LABEL: test13:
		; THUMB2: @ %bb.0:
		; THUMB2-NEXT: ldrb r0, [r0, #3]
		; THUMB2-NEXT: lsls r0, r0, #24
		; THUMB2-NEXT: bx lr
		%1 = load i32, i32* %p, align 4
		%and = and i32 %1, 4278190080
		ret i32 %and
		}

		define arm_aapcscc i32 @test14(i32* nocapture %p) {
		; ARM-LABEL: test14:
		; ARM: @ %bb.0:
		; ARM-NEXT: ldrh r0, [r0, #1]
		; ARM-NEXT: lsl r0, r0, #8
		; ARM-NEXT: bx lr
		;
		; ARMEB-LABEL: test14:
		; ARMEB: @ %bb.0:
		; ARMEB-NEXT: ldrh r0, [r0, #1]
		; ARMEB-NEXT: lsl r0, r0, #8
		; ARMEB-NEXT: bx lr
		;
		; THUMB1-LABEL: test14:
		; THUMB1: @ %bb.0:
		; THUMB1-NEXT: ldr r1, [r0]
		; THUMB1-NEXT: ldr r0, .LCPI26_0
		; THUMB1-NEXT: ands r0, r1
		; THUMB1-NEXT: bx lr
		; THUMB1-NEXT: .p2align 2
		; THUMB1-NEXT: @ %bb.1:
		; THUMB1-NEXT: .LCPI26_0:
		; THUMB1-NEXT: .long 16776960 @ 0xffff00
		;
		; THUMB2-LABEL: test14:
		; THUMB2: @ %bb.0:
		; THUMB2-NEXT: ldrh.w r0, [r0, #1]
		; THUMB2-NEXT: lsls r0, r0, #8
		; THUMB2-NEXT: bx lr
		%1 = load i32, i32* %p, align 4
		%and = and i32 %1, 16776960
		ret i32 %and
		}

		define arm_aapcscc i32 @test15(i32* nocapture %p) {
		; ARM-LABEL: test15:
		; ARM: @ %bb.0:
		; ARM-NEXT: ldrh r0, [r0, #2]
		; ARM-NEXT: lsl r0, r0, #16
		; ARM-NEXT: bx lr
		;
		; ARMEB-LABEL: test15:
		; ARMEB: @ %bb.0:
		; ARMEB-NEXT: ldrh r0, [r0]
		; ARMEB-NEXT: lsl r0, r0, #16
		; ARMEB-NEXT: bx lr
		;
		; THUMB1-LABEL: test15:
		; THUMB1: @ %bb.0:
		; THUMB1-NEXT: ldrh r0, [r0, #2]
		; THUMB1-NEXT: lsls r0, r0, #16
		; THUMB1-NEXT: bx lr
		;
		; THUMB2-LABEL: test15:
		; THUMB2: @ %bb.0:
		; THUMB2-NEXT: ldrh r0, [r0, #2]
		; THUMB2-NEXT: lsls r0, r0, #16
		; THUMB2-NEXT: bx lr
		%1 = load i32, i32* %p, align 4
		%and = and i32 %1, 4294901760
		ret i32 %and
		}

		define arm_aapcscc i32 @test16(i64* nocapture %p) {
		; ARM-LABEL: test16:
		; ARM: @ %bb.0:
		; ARM-NEXT: ldrb r0, [r0, #1]
		; ARM-NEXT: lsl r0, r0, #8
		; ARM-NEXT: bx lr
		;
		; ARMEB-LABEL: test16:
		; ARMEB: @ %bb.0:
		; ARMEB-NEXT: ldrb r0, [r0, #6]
		; ARMEB-NEXT: lsl r0, r0, #8
		; ARMEB-NEXT: bx lr
		;
		; THUMB1-LABEL: test16:
		; THUMB1: @ %bb.0:
		; THUMB1-NEXT: ldrb r0, [r0, #1]
		; THUMB1-NEXT: lsls r0, r0, #8
		; THUMB1-NEXT: bx lr
		;
		; THUMB2-LABEL: test16:
		; THUMB2: @ %bb.0:
		; THUMB2-NEXT: ldrb r0, [r0, #1]
		; THUMB2-NEXT: lsls r0, r0, #8
		; THUMB2-NEXT: bx lr
		%1 = load i64, i64* %p, align 8
		%and = and i64 %1, 65280
		%trunc = trunc i64 %and to i32
		ret i32 %trunc
		}

		define arm_aapcscc i32 @test17(i64* nocapture %p) {
		; ARM-LABEL: test17:
		; ARM: @ %bb.0:
		; ARM-NEXT: ldrb r0, [r0, #2]
		; ARM-NEXT: lsl r0, r0, #16
		; ARM-NEXT: bx lr
		;
		; ARMEB-LABEL: test17:
		; ARMEB: @ %bb.0:
		; ARMEB-NEXT: ldrb r0, [r0, #5]
		; ARMEB-NEXT: lsl r0, r0, #16
		; ARMEB-NEXT: bx lr
		;
		; THUMB1-LABEL: test17:
		; THUMB1: @ %bb.0:
		; THUMB1-NEXT: ldrb r0, [r0, #2]
		; THUMB1-NEXT: lsls r0, r0, #16
		; THUMB1-NEXT: bx lr
		;
		; THUMB2-LABEL: test17:
		; THUMB2: @ %bb.0:
		; THUMB2-NEXT: ldrb r0, [r0, #2]
		; THUMB2-NEXT: lsls r0, r0, #16
		; THUMB2-NEXT: bx lr
		%1 = load i64, i64* %p, align 8
		%and = and i64 %1, 16711680
		%trunc = trunc i64 %and to i32
		ret i32 %trunc
		}

		define arm_aapcscc i32 @test18(i64* nocapture %p) {
		; ARM-LABEL: test18:
		; ARM: @ %bb.0:
		; ARM-NEXT: ldrb r0, [r0, #3]
		; ARM-NEXT: lsl r0, r0, #24
		; ARM-NEXT: bx lr
		;
		; ARMEB-LABEL: test18:
		; ARMEB: @ %bb.0:
		; ARMEB-NEXT: ldrb r0, [r0, #4]
		; ARMEB-NEXT: lsl r0, r0, #24
		; ARMEB-NEXT: bx lr
		;
		; THUMB1-LABEL: test18:
		; THUMB1: @ %bb.0:
		; THUMB1-NEXT: ldrb r0, [r0, #3]
		; THUMB1-NEXT: lsls r0, r0, #24
		; THUMB1-NEXT: bx lr
		;
		; THUMB2-LABEL: test18:
		; THUMB2: @ %bb.0:
		; THUMB2-NEXT: ldrb r0, [r0, #3]
		; THUMB2-NEXT: lsls r0, r0, #24
		; THUMB2-NEXT: bx lr
		%1 = load i64, i64* %p, align 8
		%and = and i64 %1, 4278190080
		%trunc = trunc i64 %and to i32
		ret i32 %trunc
		}

		define arm_aapcscc i64 @test19(i64* nocapture %p) {
		; ARM-LABEL: test19:
		; ARM: @ %bb.0:
		; ARM-NEXT: ldrb r1, [r0, #4]
		; ARM-NEXT: mov r0, #0
		; ARM-NEXT: bx lr
		;
		; ARMEB-LABEL: test19:
		; ARMEB: @ %bb.0:
		; ARMEB-NEXT: ldrb r0, [r0, #3]
		; ARMEB-NEXT: mov r1, #0
		; ARMEB-NEXT: bx lr
		;
		; THUMB1-LABEL: test19:
		; THUMB1: @ %bb.0:
		; THUMB1-NEXT: ldrb r1, [r0, #4]
		; THUMB1-NEXT: movs r0, #0
		; THUMB1-NEXT: bx lr
		;
		; THUMB2-LABEL: test19:
		; THUMB2: @ %bb.0:
		; THUMB2-NEXT: ldrb r1, [r0, #4]
		; THUMB2-NEXT: movs r0, #0
		; THUMB2-NEXT: bx lr
		%1 = load i64, i64* %p, align 8
		%and = and i64 %1, 1095216660480
		ret i64 %and
		}

		define arm_aapcscc i64 @test20(i64* nocapture %p) {
		; ARM-LABEL: test20:
		; ARM: @ %bb.0:
		; ARM-NEXT: ldrb r0, [r0, #5]
		; ARM-NEXT: lsl r1, r0, #8
		; ARM-NEXT: mov r0, #0
		; ARM-NEXT: bx lr
		;
		; ARMEB-LABEL: test20:
		; ARMEB: @ %bb.0:
		; ARMEB-NEXT: ldrb r0, [r0, #2]
		; ARMEB-NEXT: mov r1, #0
		; ARMEB-NEXT: lsl r0, r0, #8
		; ARMEB-NEXT: bx lr
		;
		; THUMB1-LABEL: test20:
		; THUMB1: @ %bb.0:
		; THUMB1-NEXT: ldrb r0, [r0, #5]
		; THUMB1-NEXT: lsls r1, r0, #8
		; THUMB1-NEXT: movs r0, #0
		; THUMB1-NEXT: bx lr
		;
		; THUMB2-LABEL: test20:
		; THUMB2: @ %bb.0:
		; THUMB2-NEXT: ldrb r0, [r0, #5]
		; THUMB2-NEXT: lsls r1, r0, #8
		; THUMB2-NEXT: movs r0, #0
		; THUMB2-NEXT: bx lr
		%1 = load i64, i64* %p, align 8
		%and = and i64 %1, 280375465082880
		ret i64 %and
		}

		define arm_aapcscc i64 @test21(i64* nocapture %p) {
		; ARM-LABEL: test21:
		; ARM: @ %bb.0:
		; ARM-NEXT: ldrb r0, [r0, #6]
		; ARM-NEXT: lsl r1, r0, #16
		; ARM-NEXT: mov r0, #0
		; ARM-NEXT: bx lr
		;
		; ARMEB-LABEL: test21:
		; ARMEB: @ %bb.0:
		; ARMEB-NEXT: ldrb r0, [r0, #1]
		; ARMEB-NEXT: mov r1, #0
		; ARMEB-NEXT: lsl r0, r0, #16
		; ARMEB-NEXT: bx lr
		;
		; THUMB1-LABEL: test21:
		; THUMB1: @ %bb.0:
		; THUMB1-NEXT: ldrb r0, [r0, #6]
		; THUMB1-NEXT: lsls r1, r0, #16
		; THUMB1-NEXT: movs r0, #0
		; THUMB1-NEXT: bx lr
		;
		; THUMB2-LABEL: test21:
		; THUMB2: @ %bb.0:
		; THUMB2-NEXT: ldrb r0, [r0, #6]
		; THUMB2-NEXT: lsls r1, r0, #16
		; THUMB2-NEXT: movs r0, #0
		; THUMB2-NEXT: bx lr
		%1 = load i64, i64* %p, align 8
		%and = and i64 %1, 71776119061217280
		ret i64 %and
		}

		define arm_aapcscc i64 @test22(i64* nocapture %p) {
		; ARM-LABEL: test22:
		; ARM: @ %bb.0:
		; ARM-NEXT: ldrb r0, [r0, #7]
		; ARM-NEXT: lsl r1, r0, #24
		; ARM-NEXT: mov r0, #0
		; ARM-NEXT: bx lr
		;
		; ARMEB-LABEL: test22:
		; ARMEB: @ %bb.0:
		; ARMEB-NEXT: ldrb r0, [r0]
		; ARMEB-NEXT: mov r1, #0
		; ARMEB-NEXT: lsl r0, r0, #24
		; ARMEB-NEXT: bx lr
		;
		; THUMB1-LABEL: test22:
		; THUMB1: @ %bb.0:
		; THUMB1-NEXT: ldrb r0, [r0, #7]
		; THUMB1-NEXT: lsls r1, r0, #24
		; THUMB1-NEXT: movs r0, #0
		; THUMB1-NEXT: bx lr
		;
		; THUMB2-LABEL: test22:
		; THUMB2: @ %bb.0:
		; THUMB2-NEXT: ldrb r0, [r0, #7]
		; THUMB2-NEXT: lsls r1, r0, #24
		; THUMB2-NEXT: movs r0, #0
		; THUMB2-NEXT: bx lr
		%1 = load i64, i64* %p, align 8
		%and = and i64 %1, -72057594037927936
		ret i64 %and
		}

		define arm_aapcscc i64 @test23(i64* nocapture %p) {
		; ARM-LABEL: test23:
		; ARM: @ %bb.0:
		; ARM-NEXT: ldrh r1, [r0, #3]
		; ARM-NEXT: lsl r0, r1, #24
		; ARM-NEXT: lsr r1, r1, #8
		; ARM-NEXT: bx lr
		;
		; ARMEB-LABEL: test23:
		; ARMEB: @ %bb.0:
		; ARMEB-NEXT: ldrh r1, [r0, #3]
		; ARMEB-NEXT: lsr r0, r1, #8
		; ARMEB-NEXT: lsl r1, r1, #24
		; ARMEB-NEXT: bx lr
		;
		; THUMB1-LABEL: test23:
		; THUMB1: @ %bb.0:
		; THUMB1-NEXT: ldrb r1, [r0, #3]
		; THUMB1-NEXT: ldrb r0, [r0, #4]
		; THUMB1-NEXT: lsls r0, r0, #8
		; THUMB1-NEXT: adds r1, r0, r1
		; THUMB1-NEXT: lsls r0, r1, #24
		; THUMB1-NEXT: lsrs r1, r1, #8
		; THUMB1-NEXT: bx lr
		;
		; THUMB2-LABEL: test23:
		; THUMB2: @ %bb.0:
		; THUMB2-NEXT: ldrh.w r1, [r0, #3]
		; THUMB2-NEXT: lsls r0, r1, #24
		; THUMB2-NEXT: lsrs r1, r1, #8
		; THUMB2-NEXT: bx lr
		%1 = load i64, i64* %p, align 8
		%and = and i64 %1, 1099494850560
		ret i64 %and
		}

		define arm_aapcscc i64 @test24(i64* nocapture %p) {
		; ARM-LABEL: test24:
		; ARM: @ %bb.0:
		; ARM-NEXT: ldrh r1, [r0, #4]
		; ARM-NEXT: mov r0, #0
		; ARM-NEXT: bx lr
		;
		; ARMEB-LABEL: test24:
		; ARMEB: @ %bb.0:
		; ARMEB-NEXT: ldrh r0, [r0, #2]
		; ARMEB-NEXT: mov r1, #0
		; ARMEB-NEXT: bx lr
		;
		; THUMB1-LABEL: test24:
		; THUMB1: @ %bb.0:
		; THUMB1-NEXT: ldrh r1, [r0, #4]
		; THUMB1-NEXT: movs r0, #0
		; THUMB1-NEXT: bx lr
		;
		; THUMB2-LABEL: test24:
		; THUMB2: @ %bb.0:
		; THUMB2-NEXT: ldrh r1, [r0, #4]
		; THUMB2-NEXT: movs r0, #0
		; THUMB2-NEXT: bx lr
		%1 = load i64, i64* %p, align 8
		%and = and i64 %1, 281470681743360
		ret i64 %and
		}

		define arm_aapcscc i64 @test25(i64* nocapture %p) {
		; ARM-LABEL: test25:
		; ARM: @ %bb.0:
		; ARM-NEXT: ldrh r0, [r0, #5]
		; ARM-NEXT: lsl r1, r0, #8
		; ARM-NEXT: mov r0, #0
		; ARM-NEXT: bx lr
		;
		; ARMEB-LABEL: test25:
		; ARMEB: @ %bb.0:
		; ARMEB-NEXT: ldrh r0, [r0, #1]
		; ARMEB-NEXT: mov r1, #0
		; ARMEB-NEXT: lsl r0, r0, #8
		; ARMEB-NEXT: bx lr
		;
		; THUMB1-LABEL: test25:
		; THUMB1: @ %bb.0:
		; THUMB1-NEXT: ldrb r1, [r0, #5]
		; THUMB1-NEXT: ldrb r0, [r0, #6]
		; THUMB1-NEXT: lsls r0, r0, #8
		; THUMB1-NEXT: adds r0, r0, r1
		; THUMB1-NEXT: lsls r1, r0, #8
		; THUMB1-NEXT: movs r0, #0
		; THUMB1-NEXT: bx lr
		;
		; THUMB2-LABEL: test25:
		; THUMB2: @ %bb.0:
		; THUMB2-NEXT: ldrh.w r0, [r0, #5]
		; THUMB2-NEXT: lsls r1, r0, #8
		; THUMB2-NEXT: movs r0, #0
		; THUMB2-NEXT: bx lr
		%1 = load i64, i64* %p, align 8
		%and = and i64 %1, 72056494526300160
		ret i64 %and
		}

		define arm_aapcscc i64 @test26(i64* nocapture %p) {
		; ARM-LABEL: test26:
		; ARM: @ %bb.0:
		; ARM-NEXT: ldrh r0, [r0, #6]
		; ARM-NEXT: lsl r1, r0, #16
		; ARM-NEXT: mov r0, #0
		; ARM-NEXT: bx lr
		;
		; ARMEB-LABEL: test26:
		; ARMEB: @ %bb.0:
		; ARMEB-NEXT: ldrh r0, [r0]
		; ARMEB-NEXT: mov r1, #0
		; ARMEB-NEXT: lsl r0, r0, #16
		; ARMEB-NEXT: bx lr
		;
		; THUMB1-LABEL: test26:
		; THUMB1: @ %bb.0:
		; THUMB1-NEXT: ldrh r0, [r0, #6]
		; THUMB1-NEXT: lsls r1, r0, #16
		; THUMB1-NEXT: movs r0, #0
		; THUMB1-NEXT: bx lr
		;
		; THUMB2-LABEL: test26:
		; THUMB2: @ %bb.0:
		; THUMB2-NEXT: ldrh r0, [r0, #6]
		; THUMB2-NEXT: lsls r1, r0, #16
		; THUMB2-NEXT: movs r0, #0
		; THUMB2-NEXT: bx lr
		%1 = load i64, i64* %p, align 8
		%and = and i64 %1, -281474976710656
		ret i64 %and
		}

llvm/trunk/test/CodeGen/X86/fp128-i128.ll

	Show First 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; u.bits.manh = n;			; u.bits.manh = n;
	; w = u.e;			; w = u.e;
	; foo(w);			; foo(w);
	; }			; }
	define void @TestUnionLD1(fp128 %s, i64 %n) #0 {			define void @TestUnionLD1(fp128 %s, i64 %n) #0 {
	; SSE-LABEL: TestUnionLD1:			; SSE-LABEL: TestUnionLD1:
	; SSE: # %bb.0: # %entry			; SSE: # %bb.0: # %entry
	; SSE-NEXT: movaps %xmm0, -{{[0-9]+}}(%rsp)			; SSE-NEXT: movaps %xmm0, -{{[0-9]+}}(%rsp)
	; SSE-NEXT: movq -{{[0-9]+}}(%rsp), %rax			; SSE-NEXT: movzwl -{{[0-9]+}}(%rsp), %eax
	; SSE-NEXT: movabsq $281474976710655, %rcx # imm = 0xFFFFFFFFFFFF			; SSE-NEXT: shlq $48, %rax
	; SSE-NEXT: andq %rdi, %rcx			; SSE-NEXT: movq -{{[0-9]+}}(%rsp), %rcx
	; SSE-NEXT: movabsq $-281474976710656, %rdx # imm = 0xFFFF000000000000			; SSE-NEXT: movabsq $281474976710655, %rdx # imm = 0xFFFFFFFFFFFF
	; SSE-NEXT: andq -{{[0-9]+}}(%rsp), %rdx			; SSE-NEXT: andq %rdi, %rdx
	; SSE-NEXT: orq %rcx, %rdx			; SSE-NEXT: orq %rax, %rdx
	; SSE-NEXT: movq %rax, -{{[0-9]+}}(%rsp)			; SSE-NEXT: movq %rcx, -{{[0-9]+}}(%rsp)
	; SSE-NEXT: movq %rdx, -{{[0-9]+}}(%rsp)			; SSE-NEXT: movq %rdx, -{{[0-9]+}}(%rsp)
	; SSE-NEXT: movaps -{{[0-9]+}}(%rsp), %xmm0			; SSE-NEXT: movaps -{{[0-9]+}}(%rsp), %xmm0
	; SSE-NEXT: jmp foo # TAILCALL			; SSE-NEXT: jmp foo # TAILCALL
	;			;
	; AVX-LABEL: TestUnionLD1:			; AVX-LABEL: TestUnionLD1:
	; AVX: # %bb.0: # %entry			; AVX: # %bb.0: # %entry
	; AVX-NEXT: vmovaps %xmm0, -{{[0-9]+}}(%rsp)			; AVX-NEXT: vmovaps %xmm0, -{{[0-9]+}}(%rsp)
	; AVX-NEXT: movq -{{[0-9]+}}(%rsp), %rax			; AVX-NEXT: movzwl -{{[0-9]+}}(%rsp), %eax
	; AVX-NEXT: movabsq $281474976710655, %rcx # imm = 0xFFFFFFFFFFFF			; AVX-NEXT: shlq $48, %rax
	; AVX-NEXT: andq %rdi, %rcx			; AVX-NEXT: movq -{{[0-9]+}}(%rsp), %rcx
	; AVX-NEXT: movabsq $-281474976710656, %rdx # imm = 0xFFFF000000000000			; AVX-NEXT: movabsq $281474976710655, %rdx # imm = 0xFFFFFFFFFFFF
	; AVX-NEXT: andq -{{[0-9]+}}(%rsp), %rdx			; AVX-NEXT: andq %rdi, %rdx
	; AVX-NEXT: orq %rcx, %rdx			; AVX-NEXT: orq %rax, %rdx
	; AVX-NEXT: movq %rax, -{{[0-9]+}}(%rsp)			; AVX-NEXT: movq %rcx, -{{[0-9]+}}(%rsp)
	; AVX-NEXT: movq %rdx, -{{[0-9]+}}(%rsp)			; AVX-NEXT: movq %rdx, -{{[0-9]+}}(%rsp)
	; AVX-NEXT: vmovaps -{{[0-9]+}}(%rsp), %xmm0			; AVX-NEXT: vmovaps -{{[0-9]+}}(%rsp), %xmm0
	; AVX-NEXT: jmp foo # TAILCALL			; AVX-NEXT: jmp foo # TAILCALL
	entry:			entry:
	%0 = bitcast fp128 %s to i128			%0 = bitcast fp128 %s to i128
	%1 = zext i64 %n to i128			%1 = zext i64 %n to i128
	%bf.value = shl nuw i128 %1, 64			%bf.value = shl nuw i128 %1, 64
	%bf.shl = and i128 %bf.value, 5192296858534809181786422619668480			%bf.shl = and i128 %bf.value, 5192296858534809181786422619668480
	▲ Show 20 Lines • Show All 476 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[DAGCombiner] Reduce load widths of shifted masks
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 161681

llvm/trunk/lib/CodeGen/SelectionDAG/DAGCombiner.cpp

llvm/trunk/test/CodeGen/ARM/and-load-combine.ll

llvm/trunk/test/CodeGen/X86/fp128-i128.ll

This is an archive of the discontinued LLVM Phabricator instance.

[DAGCombiner] Reduce load widths of shifted masksClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 161681

llvm/trunk/lib/CodeGen/SelectionDAG/DAGCombiner.cpp

llvm/trunk/test/CodeGen/ARM/and-load-combine.ll

llvm/trunk/test/CodeGen/X86/fp128-i128.ll

[DAGCombiner] Reduce load widths of shifted masks
ClosedPublic