This is an archive of the discontinued LLVM Phabricator instance.

[DAGCombiner] Call SimplifyDemandedVectorElts from EXTRACT_VECTOR_ELT
ClosedPublic

Authored by RKSimon on Jul 12 2018, 11:41 AM.

Download Raw Diff

Details

Reviewers

spatel
efriedma
uweigand
t.p.northover
arsenm
bogner
javed.absar
atanasyan

Commits

rGe4d12bb2d61e: [DAGCombiner] Call SimplifyDemandedVectorElts from EXTRACT_VECTOR_ELT
rL337258: [DAGCombiner] Call SimplifyDemandedVectorElts from EXTRACT_VECTOR_ELT

Summary

If we are only extracting vector elements via EXTRACT_VECTOR_ELT(s) we may be able to use SimplifyDemandedVectorElts to avoid unnecessary vector ops.

Diff Detail

Repository: rL LLVM

Event Timeline

RKSimon created this revision.Jul 12 2018, 11:41 AM

Herald added a reviewer: javed.absar. · View Herald TranscriptJul 12 2018, 11:41 AM

Herald added subscribers: nhaehnle, wdng. · View Herald Transcript

Makes sense.

test/CodeGen/AArch64/aarch64-be-bv.ll
33 ↗	(On Diff #155238)	This is nice, but it's destroying the intent of the test, which is to check that we generate the correct movi instruction.
test/CodeGen/ARM/func-argpassing-endian.ll
3 ↗	(On Diff #155238)	Regenerating this file LGTM; please commit separately.

RKSimon added inline comments.Jul 12 2018, 1:49 PM

test/CodeGen/AArch64/aarch64-be-bv.ll
33 ↗	(On Diff #155238)	Am I missing something - why the extractelement - why not return the <8 x i16> add result directly?

efriedma added inline comments.Jul 12 2018, 3:17 PM

test/CodeGen/AArch64/aarch64-be-bv.ll
33 ↗	(On Diff #155238)	Returning the result "directly" involves a bitcast, which is also likely to break in the future (this is big-endian, so it swaps the elements.) Maybe store the result to memory instead.

RKSimon mentioned this in rL336980: [ARM] Regenerated arg endian test.Jul 13 2018, 2:22 AM

RKSimon mentioned this in rL336981: [AArch64] Updated bigendian buildvector tests.Jul 13 2018, 2:30 AM

Rebased after the arm/aarch64 tests updates

You need to get reviewers for the test changes to AMDGPU and SystemZ. Otherwise LGTM.

test/CodeGen/X86/oddshuffles.ll
366 ↗	(On Diff #155334)	It looks like the total instructions is increasing here? Maybe an issue with x86 shuffle lowering?

@arsenm @uweigand Any commments?

test/CodeGen/X86/oddshuffles.ll
366 ↗	(On Diff #155334)	Pre-combine we've decreased the the number of shuffles, meaning that it now falls below the threshold for permitting domain swaps to use shufps - on older SSE2 machines we're better off avoiding the domain swap.

Hmm ... The SystemZ tests seem to be getting strictly worse. Before, we have in f3:

vaf     %v0, %v24, %v26
vlgvh   %r0, %v0, 6
vlgvh   %r2, %v28, 3
ar      %r2, %r0

and after the patch you're testing for:

vaf %v0, %v24, %v26
vrepf %v0, %v0, 3
vlgvh %r0, %v0, 2
vlgvh %r2, %v28, 3
ar %r2, %r0

(And similar for f4.)

Given that the point of this test to ensure that there is no superfluous vrep, this seems a clear regression. Can you check what's going on here?

Updated with SystemZ fix to permit permute decode of target shuffles (well, SPLAT) as well - @uweigand does that look OK to you?

I've generalized DAGCombiner::visitEXTRACT_VECTOR_ELT to handle the case where the source vector has multiple uses, if all of them are EXTRACT_VECTOR_ELT we now accumulate the demanded mask accordingly - this simplifies some MIPS vector codegen so adding @atanasyan to take a look.

Herald added subscribers: jrtc27, sdardis. · View Herald TranscriptJul 16 2018, 8:12 AM

The SystemZ changes look good to me. Thanks for taking care of this!

LGTM

@atanasyan Any comments?

MIPS changes LGTM

This revision was not accepted when it landed; it landed in state Needs Review.Jul 17 2018, 2:50 AM

Closed by commit rL337258: [DAGCombiner] Call SimplifyDemandedVectorElts from EXTRACT_VECTOR_ELT (authored by RKSimon). · Explain Why

This revision was automatically updated to reflect the committed changes.

Revision Contents

Path

Size

llvm/

trunk/

lib/

CodeGen/

SelectionDAG/

DAGCombiner.cpp

27 lines

Target/

SystemZ/

SystemZISelLowering.cpp

36 lines

test/

CodeGen/

AMDGPU/

indirect-addressing-si.ll

48 lines

ARM/

func-argpassing-endian.ll

2 lines

Mips/

cconv/

vector.ll

760 lines

X86/

dagcombine-cse.ll

1 line

extractelement-load.ll

3 lines

10 lines

77 lines

1 line

7 lines

Diff 155829

llvm/trunk/lib/CodeGen/SelectionDAG/DAGCombiner.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 236 Lines • ▼ Show 20 Lines	private:
/// elements. If so, return true.		/// elements. If so, return true.
bool SimplifyDemandedVectorElts(SDValue Op) {		bool SimplifyDemandedVectorElts(SDValue Op) {
unsigned NumElts = Op.getValueType().getVectorNumElements();		unsigned NumElts = Op.getValueType().getVectorNumElements();
APInt Demanded = APInt::getAllOnesValue(NumElts);		APInt Demanded = APInt::getAllOnesValue(NumElts);
return SimplifyDemandedVectorElts(Op, Demanded);		return SimplifyDemandedVectorElts(Op, Demanded);
}		}

bool SimplifyDemandedBits(SDValue Op, const APInt &Demanded);		bool SimplifyDemandedBits(SDValue Op, const APInt &Demanded);
bool SimplifyDemandedVectorElts(SDValue Op, const APInt &Demanded);		bool SimplifyDemandedVectorElts(SDValue Op, const APInt &Demanded,
		bool AssumeSingleUse = false);

bool CombineToPreIndexedLoadStore(SDNode *N);		bool CombineToPreIndexedLoadStore(SDNode *N);
bool CombineToPostIndexedLoadStore(SDNode *N);		bool CombineToPostIndexedLoadStore(SDNode *N);
SDValue SplitIndexingFromLoad(LoadSDNode *LD);		SDValue SplitIndexingFromLoad(LoadSDNode *LD);
bool SliceUpLoad(SDNode *N);		bool SliceUpLoad(SDNode *N);

/// Replace an ISD::EXTRACT_VECTOR_ELT of a load with a narrowed		/// Replace an ISD::EXTRACT_VECTOR_ELT of a load with a narrowed
/// load.		/// load.
▲ Show 20 Lines • Show All 805 Lines • ▼ Show 20 Lines	bool DAGCombiner::SimplifyDemandedBits(SDValue Op, const APInt &Demanded) {

CommitTargetLoweringOpt(TLO);		CommitTargetLoweringOpt(TLO);
return true;		return true;
}		}

/// Check the specified vector node value to see if it can be simplified or		/// Check the specified vector node value to see if it can be simplified or
/// if things it uses can be simplified as it only uses some of the elements.		/// if things it uses can be simplified as it only uses some of the elements.
/// If so, return true.		/// If so, return true.
bool DAGCombiner::SimplifyDemandedVectorElts(SDValue Op,		bool DAGCombiner::SimplifyDemandedVectorElts(SDValue Op, const APInt &Demanded,
const APInt &Demanded) {		bool AssumeSingleUse) {
TargetLowering::TargetLoweringOpt TLO(DAG, LegalTypes, LegalOperations);		TargetLowering::TargetLoweringOpt TLO(DAG, LegalTypes, LegalOperations);
APInt KnownUndef, KnownZero;		APInt KnownUndef, KnownZero;
if (!TLI.SimplifyDemandedVectorElts(Op, Demanded, KnownUndef, KnownZero, TLO))		if (!TLI.SimplifyDemandedVectorElts(Op, Demanded, KnownUndef, KnownZero, TLO,
		0, AssumeSingleUse))
return false;		return false;

// Revisit the node.		// Revisit the node.
AddToWorklist(Op.getNode());		AddToWorklist(Op.getNode());

// Replace the old value with the new one.		// Replace the old value with the new one.
++NodesCombined;		++NodesCombined;
LLVM_DEBUG(dbgs() << "\nReplacing.2 "; TLO.Old.getNode()->dump(&DAG);		LLVM_DEBUG(dbgs() << "\nReplacing.2 "; TLO.Old.getNode()->dump(&DAG);
▲ Show 20 Lines • Show All 13,929 Lines • ▼ Show 20 Lines	if (!LegalOperations \|\|
TLI.isOperationLegal(ISD::EXTRACT_VECTOR_ELT, VT) \|\|		TLI.isOperationLegal(ISD::EXTRACT_VECTOR_ELT, VT) \|\|
TLI.isOperationExpand(ISD::VECTOR_SHUFFLE, VT)) {		TLI.isOperationExpand(ISD::VECTOR_SHUFFLE, VT)) {
EVT IndexTy = TLI.getVectorIdxTy(DAG.getDataLayout());		EVT IndexTy = TLI.getVectorIdxTy(DAG.getDataLayout());
return DAG.getNode(ISD::EXTRACT_VECTOR_ELT, SDLoc(N), NVT, SVInVec,		return DAG.getNode(ISD::EXTRACT_VECTOR_ELT, SDLoc(N), NVT, SVInVec,
DAG.getConstant(OrigElt, SDLoc(SVOp), IndexTy));		DAG.getConstant(OrigElt, SDLoc(SVOp), IndexTy));
}		}
}		}

		// If only EXTRACT_VECTOR_ELT nodes use the source vector we can
		// simplify it based on the (valid) extraction indices.
		if (llvm::all_of(InVec->uses(), [&](SDNode *Use) {
		return Use->getOpcode() == ISD::EXTRACT_VECTOR_ELT &&
		Use->getOperand(0) == InVec &&
		isa<ConstantSDNode>(Use->getOperand(1));
		})) {
		APInt DemandedElts = APInt::getNullValue(VT.getVectorNumElements());
		for (SDNode *Use : InVec->uses()) {
		auto *CstElt = cast<ConstantSDNode>(Use->getOperand(1));
		if (CstElt->getAPIntValue().ult(VT.getVectorNumElements()))
		DemandedElts.setBit(CstElt->getZExtValue());
		}
		if (SimplifyDemandedVectorElts(InVec, DemandedElts, true))
		return SDValue(N, 0);
		}

bool BCNumEltsChanged = false;		bool BCNumEltsChanged = false;
EVT ExtVT = VT.getVectorElementType();		EVT ExtVT = VT.getVectorElementType();
EVT LVT = ExtVT;		EVT LVT = ExtVT;

// If the result of load has to be truncated, then it's not necessarily		// If the result of load has to be truncated, then it's not necessarily
// profitable.		// profitable.
if (NVT.bitsLT(LVT) && !TLI.isTruncateFree(LVT, NVT))		if (NVT.bitsLT(LVT) && !TLI.isTruncateFree(LVT, NVT))
return SDValue();		return SDValue();
▲ Show 20 Lines • Show All 3,417 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/SystemZ/SystemZISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 3,887 Lines • ▼ Show 20 Lines
static const Permute *matchDoublePermute(const SmallVectorImpl<int> &Bytes,		static const Permute *matchDoublePermute(const SmallVectorImpl<int> &Bytes,
SmallVectorImpl<int> &Transform) {		SmallVectorImpl<int> &Transform) {
for (auto &P : PermuteForms)		for (auto &P : PermuteForms)
if (matchDoublePermute(Bytes, P, Transform))		if (matchDoublePermute(Bytes, P, Transform))
return &P;		return &P;
return nullptr;		return nullptr;
}		}

// Convert the mask of the given VECTOR_SHUFFLE into a byte-level mask,		// Convert the mask of the given shuffle op into a byte-level mask,
// as if it had type vNi8.		// as if it had type vNi8.
static void getVPermMask(ShuffleVectorSDNode *VSN,		static bool getVPermMask(SDValue ShuffleOp,
SmallVectorImpl<int> &Bytes) {		SmallVectorImpl<int> &Bytes) {
EVT VT = VSN->getValueType(0);		EVT VT = ShuffleOp.getValueType();
unsigned NumElements = VT.getVectorNumElements();		unsigned NumElements = VT.getVectorNumElements();
unsigned BytesPerElement = VT.getVectorElementType().getStoreSize();		unsigned BytesPerElement = VT.getVectorElementType().getStoreSize();

		if (auto *VSN = dyn_cast<ShuffleVectorSDNode>(ShuffleOp)) {
Bytes.resize(NumElements * BytesPerElement, -1);		Bytes.resize(NumElements * BytesPerElement, -1);
for (unsigned I = 0; I < NumElements; ++I) {		for (unsigned I = 0; I < NumElements; ++I) {
int Index = VSN->getMaskElt(I);		int Index = VSN->getMaskElt(I);
if (Index >= 0)		if (Index >= 0)
for (unsigned J = 0; J < BytesPerElement; ++J)		for (unsigned J = 0; J < BytesPerElement; ++J)
Bytes[I * BytesPerElement + J] = Index * BytesPerElement + J;		Bytes[I * BytesPerElement + J] = Index * BytesPerElement + J;
}		}
		return true;
		}
		if (SystemZISD::SPLAT == ShuffleOp.getOpcode() &&
		isa<ConstantSDNode>(ShuffleOp.getOperand(1))) {
		unsigned Index = ShuffleOp.getConstantOperandVal(1);
		Bytes.resize(NumElements * BytesPerElement, -1);
		for (unsigned I = 0; I < NumElements; ++I)
		for (unsigned J = 0; J < BytesPerElement; ++J)
		Bytes[I * BytesPerElement + J] = Index * BytesPerElement + J;
		return true;
		}
		return false;
}		}

// Bytes is a VPERM-like permute vector, except that -1 is used for		// Bytes is a VPERM-like permute vector, except that -1 is used for
// undefined bytes. See whether bytes [Start, Start + BytesPerElement) of		// undefined bytes. See whether bytes [Start, Start + BytesPerElement) of
// the result come from a contiguous sequence of bytes from one input.		// the result come from a contiguous sequence of bytes from one input.
// Set Base to the selector for the first byte if so.		// Set Base to the selector for the first byte if so.
static bool getShuffleInput(const SmallVectorImpl<int> &Bytes, unsigned Start,		static bool getShuffleInput(const SmallVectorImpl<int> &Bytes, unsigned Start,
unsigned BytesPerElement, int &Base) {		unsigned BytesPerElement, int &Base) {
▲ Show 20 Lines • Show All 152 Lines • ▼ Show 20 Lines	bool GeneralShuffle::add(SDValue Op, unsigned Elem) {
// Look through things like shuffles and bitcasts.		// Look through things like shuffles and bitcasts.
while (Op.getNode()) {		while (Op.getNode()) {
if (Op.getOpcode() == ISD::BITCAST)		if (Op.getOpcode() == ISD::BITCAST)
Op = Op.getOperand(0);		Op = Op.getOperand(0);
else if (Op.getOpcode() == ISD::VECTOR_SHUFFLE && Op.hasOneUse()) {		else if (Op.getOpcode() == ISD::VECTOR_SHUFFLE && Op.hasOneUse()) {
// See whether the bytes we need come from a contiguous part of one		// See whether the bytes we need come from a contiguous part of one
// operand.		// operand.
SmallVector<int, SystemZ::VectorBytes> OpBytes;		SmallVector<int, SystemZ::VectorBytes> OpBytes;
getVPermMask(cast<ShuffleVectorSDNode>(Op), OpBytes);		if (!getVPermMask(Op, OpBytes))
		break;
int NewByte;		int NewByte;
if (!getShuffleInput(OpBytes, Byte, BytesPerElement, NewByte))		if (!getShuffleInput(OpBytes, Byte, BytesPerElement, NewByte))
break;		break;
if (NewByte < 0) {		if (NewByte < 0) {
addUndef();		addUndef();
return true;		return true;
}		}
Op = Op.getOperand(unsigned(NewByte) / SystemZ::VectorBytes);		Op = Op.getOperand(unsigned(NewByte) / SystemZ::VectorBytes);
▲ Show 20 Lines • Show All 1,017 Lines • ▼ Show 20 Lines	SDValue SystemZTargetLowering::combineExtract(const SDLoc &DL, EVT ResVT,
// The number of bytes being extracted.		// The number of bytes being extracted.
unsigned BytesPerElement = VecVT.getVectorElementType().getStoreSize();		unsigned BytesPerElement = VecVT.getVectorElementType().getStoreSize();

for (;;) {		for (;;) {
unsigned Opcode = Op.getOpcode();		unsigned Opcode = Op.getOpcode();
if (Opcode == ISD::BITCAST)		if (Opcode == ISD::BITCAST)
// Look through bitcasts.		// Look through bitcasts.
Op = Op.getOperand(0);		Op = Op.getOperand(0);
else if (Opcode == ISD::VECTOR_SHUFFLE &&		else if ((Opcode == ISD::VECTOR_SHUFFLE \|\| Opcode == SystemZISD::SPLAT) &&
canTreatAsByteVector(Op.getValueType())) {		canTreatAsByteVector(Op.getValueType())) {
// Get a VPERM-like permute mask and see whether the bytes covered		// Get a VPERM-like permute mask and see whether the bytes covered
// by the extracted element are a contiguous sequence from one		// by the extracted element are a contiguous sequence from one
// source operand.		// source operand.
SmallVector<int, SystemZ::VectorBytes> Bytes;		SmallVector<int, SystemZ::VectorBytes> Bytes;
getVPermMask(cast<ShuffleVectorSDNode>(Op), Bytes);		if (!getVPermMask(Op, Bytes))
		break;
int First;		int First;
if (!getShuffleInput(Bytes, Index * BytesPerElement,		if (!getShuffleInput(Bytes, Index * BytesPerElement,
BytesPerElement, First))		BytesPerElement, First))
break;		break;
if (First < 0)		if (First < 0)
return DAG.getUNDEF(ResVT);		return DAG.getUNDEF(ResVT);
// Make sure the contiguous sequence starts at a multiple of the		// Make sure the contiguous sequence starts at a multiple of the
// original element size.		// original element size.
▲ Show 20 Lines • Show All 2,225 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/AMDGPU/indirect-addressing-si.ll

Show First 20 Lines • Show All 474 Lines • ▼ Show 20 Lines	bb7: ; preds = %bb4, %bb1
store volatile <4 x float> %tmp8, <4 x float> addrspace(1)* undef		store volatile <4 x float> %tmp8, <4 x float> addrspace(1)* undef
ret void		ret void
}		}

; FIXME: Should be able to fold zero input to movreld to inline imm?		; FIXME: Should be able to fold zero input to movreld to inline imm?

; GCN-LABEL: {{^}}multi_same_block:		; GCN-LABEL: {{^}}multi_same_block:

; GCN-DAG: v_mov_b32_e32 v[[VEC0_ELT0:[0-9]+]], 0x41880000		; GCN: s_load_dword [[ARG:s[0-9]+]]
; GCN-DAG: v_mov_b32_e32 v{{[0-9]+}}, 0x41900000
; GCN-DAG: v_mov_b32_e32 v[[VEC0_ELT2:[0-9]+]], 0x41980000
; GCN-DAG: v_mov_b32_e32 v{{[0-9]+}}, 0x41a00000
; GCN-DAG: v_mov_b32_e32 v{{[0-9]+}}, 0x41a80000
; GCN-DAG: v_mov_b32_e32 v{{[0-9]+}}, 0x41b00000
; GCN-DAG: s_load_dword [[ARG:s[0-9]+]]
; IDXMODE-DAG: s_add_i32 [[ARG_ADD:s[0-9]+]], [[ARG]], -16

; MOVREL-DAG: s_add_i32 m0, [[ARG]], -16
; MOVREL: v_movreld_b32_e32 v[[VEC0_ELT0]], 4.0
; GCN-NOT: m0

; IDXMODE: s_set_gpr_idx_on [[ARG_ADD]], dst
; IDXMODE: v_mov_b32_e32 v[[VEC0_ELT0]], 4.0
; IDXMODE: s_set_gpr_idx_off

; GCN: v_mov_b32_e32 v[[VEC0_ELT2]], 0x4188cccd
; GCN-DAG: v_mov_b32_e32 v{{[0-9]+}}, 0x4190cccd
; GCN-DAG: v_mov_b32_e32 v{{[0-9]+}}, 0x4198cccd
; GCN-DAG: v_mov_b32_e32 v{{[0-9]+}}, 0x41a0cccd
; GCN-DAG: v_mov_b32_e32 v{{[0-9]+}}, 0x41a8cccd
; GCN-DAG: v_mov_b32_e32 v{{[0-9]+}}, 0x41b0cccd

; MOVREL: v_movreld_b32_e32 v[[VEC0_ELT2]], -4.0		; MOVREL: v_mov_b32_e32 v{{[0-9]+}}, 0x41900000
		; MOVREL: v_mov_b32_e32 v{{[0-9]+}}, 0x41b0cccd
; IDXMODE: s_set_gpr_idx_on [[ARG_ADD]], dst		; MOVREL: s_waitcnt
; IDXMODE: v_mov_b32_e32 v[[VEC0_ELT2]], -4.0		; MOVREL: s_add_i32 m0, [[ARG]], -16
		; MOVREL: v_movreld_b32_e32 v{{[0-9]+}}, 4.0
		; MOVREL: v_movreld_b32_e32 v{{[0-9]+}}, -4.0
		; MOVREL: s_mov_b32 m0, -1


		; IDXMODE: v_mov_b32_e32 v{{[0-9]+}}, 0x41900000
		; IDXMODE: s_waitcnt
		; IDXMODE: s_add_i32 [[ARG]], [[ARG]], -16
		; IDXMODE: s_set_gpr_idx_on [[ARG]], dst
		; IDXMODE: v_mov_b32_e32 v{{[0-9]+}}, 4.0
		; IDXMODE: s_set_gpr_idx_off
		; IDXMODE: v_mov_b32_e32 v{{[0-9]+}}, 0x41b0cccd
		; IDXMODE: s_set_gpr_idx_on [[ARG]], dst
		; IDXMODE: v_mov_b32_e32 v{{[0-9]+}}, -4.0
; IDXMODE: s_set_gpr_idx_off		; IDXMODE: s_set_gpr_idx_off

; PREGFX9: s_mov_b32 m0, -1
; GFX9-NOT: s_mov_b32 m0
; GCN: ds_write_b32		; GCN: ds_write_b32
; GCN: ds_write_b32		; GCN: ds_write_b32
; GCN: s_endpgm		; GCN: s_endpgm
define amdgpu_kernel void @multi_same_block(i32 %arg) #0 {		define amdgpu_kernel void @multi_same_block(i32 %arg) #0 {
bb:		bb:
%tmp1 = add i32 %arg, -16		%tmp1 = add i32 %arg, -16
%tmp2 = insertelement <6 x float> <float 1.700000e+01, float 1.800000e+01, float 1.900000e+01, float 2.000000e+01, float 2.100000e+01, float 2.200000e+01>, float 4.000000e+00, i32 %tmp1		%tmp2 = insertelement <6 x float> <float 1.700000e+01, float 1.800000e+01, float 1.900000e+01, float 2.000000e+01, float 2.100000e+01, float 2.200000e+01>, float 4.000000e+00, i32 %tmp1
%tmp3 = add i32 %arg, -16		%tmp3 = add i32 %arg, -16
▲ Show 20 Lines • Show All 141 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/ARM/func-argpassing-endian.ll

	Show All 32 Lines
	; CHECK-NEXT: bx lr			; CHECK-NEXT: bx lr
	store double %val, double* @vardouble			store double %val, double* @vardouble
	ret void			ret void
	}			}

	define void @arg_v4i32(<4 x i32> %vec ) {			define void @arg_v4i32(<4 x i32> %vec ) {
	; CHECK-LE-LABEL: arg_v4i32:			; CHECK-LE-LABEL: arg_v4i32:
	; CHECK-LE: @ %bb.0:			; CHECK-LE: @ %bb.0:
	; CHECK-LE-NEXT: vmov d17, r2, r3
	; CHECK-LE-NEXT: vmov d16, r0, r1			; CHECK-LE-NEXT: vmov d16, r0, r1
	; CHECK-LE-NEXT: movw r0, :lower16:var32			; CHECK-LE-NEXT: movw r0, :lower16:var32
	; CHECK-LE-NEXT: movt r0, :upper16:var32			; CHECK-LE-NEXT: movt r0, :upper16:var32
	; CHECK-LE-NEXT: vst1.32 {d16[0]}, [r0:32]			; CHECK-LE-NEXT: vst1.32 {d16[0]}, [r0:32]
	; CHECK-LE-NEXT: bx lr			; CHECK-LE-NEXT: bx lr
	;			;
	; CHECK-BE-LABEL: arg_v4i32:			; CHECK-BE-LABEL: arg_v4i32:
	; CHECK-BE: @ %bb.0:			; CHECK-BE: @ %bb.0:
	; CHECK-BE-NEXT: vmov d17, r3, r2
	; CHECK-BE-NEXT: vmov d16, r1, r0			; CHECK-BE-NEXT: vmov d16, r1, r0
	; CHECK-BE-NEXT: movw r0, :lower16:var32			; CHECK-BE-NEXT: movw r0, :lower16:var32
	; CHECK-BE-NEXT: movt r0, :upper16:var32			; CHECK-BE-NEXT: movt r0, :upper16:var32
	; CHECK-BE-NEXT: vrev64.32 q8, q8			; CHECK-BE-NEXT: vrev64.32 q8, q8
	; CHECK-BE-NEXT: vst1.32 {d16[0]}, [r0:32]			; CHECK-BE-NEXT: vst1.32 {d16[0]}, [r0:32]
	; CHECK-BE-NEXT: bx lr			; CHECK-BE-NEXT: bx lr
	%tmp = extractelement <4 x i32> %vec, i32 0			%tmp = extractelement <4 x i32> %vec, i32 0
	store i32 %tmp, i32* @var32			store i32 %tmp, i32* @var32
	▲ Show 20 Lines • Show All 240 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/Mips/cconv/vector.ll

	Show First 20 Lines • Show All 83 Lines • ▼ Show 20 Lines
	; MIPS32R5EB-NEXT: move $sp, $fp			; MIPS32R5EB-NEXT: move $sp, $fp
	; MIPS32R5EB-NEXT: lw $fp, 44($sp) # 4-byte Folded Reload			; MIPS32R5EB-NEXT: lw $fp, 44($sp) # 4-byte Folded Reload
	; MIPS32R5EB-NEXT: addiu $sp, $sp, 48			; MIPS32R5EB-NEXT: addiu $sp, $sp, 48
	; MIPS32R5EB-NEXT: jr $ra			; MIPS32R5EB-NEXT: jr $ra
	; MIPS32R5EB-NEXT: nop			; MIPS32R5EB-NEXT: nop
	;			;
	; MIPS64R5EB-LABEL: i8_2:			; MIPS64R5EB-LABEL: i8_2:
	; MIPS64R5EB: # %bb.0:			; MIPS64R5EB: # %bb.0:
	; MIPS64R5EB-NEXT: daddiu $sp, $sp, -64			; MIPS64R5EB-NEXT: daddiu $sp, $sp, -96
	; MIPS64R5EB-NEXT: .cfi_def_cfa_offset 64			; MIPS64R5EB-NEXT: .cfi_def_cfa_offset 96
	; MIPS64R5EB-NEXT: sd $4, 56($sp)			; MIPS64R5EB-NEXT: sd $4, 88($sp)
	; MIPS64R5EB-NEXT: ldi.b $w0, 0			; MIPS64R5EB-NEXT: lbu $1, 89($sp)
	; MIPS64R5EB-NEXT: lbu $1, 57($sp)			; MIPS64R5EB-NEXT: sh $1, 2($sp)
	; MIPS64R5EB-NEXT: lbu $2, 56($sp)			; MIPS64R5EB-NEXT: lbu $1, 88($sp)
	; MIPS64R5EB-NEXT: move.v $w1, $w0			; MIPS64R5EB-NEXT: sh $1, 0($sp)
	; MIPS64R5EB-NEXT: insert.h $w1[0], $2			; MIPS64R5EB-NEXT: ld.h $w0, 0($sp)
	; MIPS64R5EB-NEXT: insert.h $w1[1], $1			; MIPS64R5EB-NEXT: copy_s.h $1, $w0[0]
	; MIPS64R5EB-NEXT: lbu $1, 58($sp)			; MIPS64R5EB-NEXT: copy_s.h $2, $w0[1]
	; MIPS64R5EB-NEXT: insert.h $w1[2], $1			; MIPS64R5EB-NEXT: sd $5, 80($sp)
	; MIPS64R5EB-NEXT: lbu $1, 59($sp)			; MIPS64R5EB-NEXT: lbu $3, 81($sp)
	; MIPS64R5EB-NEXT: insert.h $w1[3], $1			; MIPS64R5EB-NEXT: sh $3, 18($sp)
	; MIPS64R5EB-NEXT: lbu $1, 60($sp)			; MIPS64R5EB-NEXT: lbu $3, 80($sp)
	; MIPS64R5EB-NEXT: insert.h $w1[4], $1			; MIPS64R5EB-NEXT: sh $3, 16($sp)
	; MIPS64R5EB-NEXT: lbu $1, 61($sp)			; MIPS64R5EB-NEXT: ld.h $w0, 16($sp)
	; MIPS64R5EB-NEXT: insert.h $w1[5], $1
	; MIPS64R5EB-NEXT: lbu $1, 63($sp)
	; MIPS64R5EB-NEXT: lbu $2, 62($sp)
	; MIPS64R5EB-NEXT: insert.h $w1[6], $2
	; MIPS64R5EB-NEXT: insert.h $w1[7], $1
	; MIPS64R5EB-NEXT: copy_s.h $1, $w1[0]
	; MIPS64R5EB-NEXT: copy_s.h $2, $w1[1]
	; MIPS64R5EB-NEXT: sd $5, 48($sp)
	; MIPS64R5EB-NEXT: lbu $3, 48($sp)
	; MIPS64R5EB-NEXT: insert.h $w0[0], $3
	; MIPS64R5EB-NEXT: lbu $3, 49($sp)
	; MIPS64R5EB-NEXT: insert.h $w0[1], $3
	; MIPS64R5EB-NEXT: lbu $3, 50($sp)
	; MIPS64R5EB-NEXT: insert.h $w0[2], $3
	; MIPS64R5EB-NEXT: lbu $3, 51($sp)
	; MIPS64R5EB-NEXT: insert.h $w0[3], $3
	; MIPS64R5EB-NEXT: lbu $3, 52($sp)
	; MIPS64R5EB-NEXT: insert.h $w0[4], $3
	; MIPS64R5EB-NEXT: lbu $3, 53($sp)
	; MIPS64R5EB-NEXT: insert.h $w0[5], $3
	; MIPS64R5EB-NEXT: lbu $3, 55($sp)
	; MIPS64R5EB-NEXT: lbu $4, 54($sp)
	; MIPS64R5EB-NEXT: insert.h $w0[6], $4
	; MIPS64R5EB-NEXT: insert.h $w0[7], $3
	; MIPS64R5EB-NEXT: copy_s.h $3, $w0[0]			; MIPS64R5EB-NEXT: copy_s.h $3, $w0[0]
	; MIPS64R5EB-NEXT: copy_s.h $4, $w0[1]			; MIPS64R5EB-NEXT: copy_s.h $4, $w0[1]
	; MIPS64R5EB-NEXT: sw $4, 28($sp)			; MIPS64R5EB-NEXT: sw $4, 60($sp)
	; MIPS64R5EB-NEXT: sw $3, 20($sp)			; MIPS64R5EB-NEXT: sw $3, 52($sp)
	; MIPS64R5EB-NEXT: sw $2, 12($sp)			; MIPS64R5EB-NEXT: sw $2, 44($sp)
	; MIPS64R5EB-NEXT: sw $1, 4($sp)			; MIPS64R5EB-NEXT: sw $1, 36($sp)
	; MIPS64R5EB-NEXT: ld.d $w0, 16($sp)			; MIPS64R5EB-NEXT: ld.d $w0, 48($sp)
	; MIPS64R5EB-NEXT: ld.d $w1, 0($sp)			; MIPS64R5EB-NEXT: ld.d $w1, 32($sp)
	; MIPS64R5EB-NEXT: addv.d $w0, $w1, $w0			; MIPS64R5EB-NEXT: addv.d $w0, $w1, $w0
	; MIPS64R5EB-NEXT: copy_s.d $1, $w0[0]			; MIPS64R5EB-NEXT: copy_s.d $1, $w0[0]
	; MIPS64R5EB-NEXT: copy_s.d $2, $w0[1]			; MIPS64R5EB-NEXT: copy_s.d $2, $w0[1]
	; MIPS64R5EB-NEXT: sb $2, 45($sp)			; MIPS64R5EB-NEXT: sb $2, 77($sp)
	; MIPS64R5EB-NEXT: sb $1, 44($sp)			; MIPS64R5EB-NEXT: sb $1, 76($sp)
	; MIPS64R5EB-NEXT: lh $2, 44($sp)			; MIPS64R5EB-NEXT: lh $2, 76($sp)
	; MIPS64R5EB-NEXT: daddiu $sp, $sp, 64			; MIPS64R5EB-NEXT: daddiu $sp, $sp, 96
	; MIPS64R5EB-NEXT: jr $ra			; MIPS64R5EB-NEXT: jr $ra
	; MIPS64R5EB-NEXT: nop			; MIPS64R5EB-NEXT: nop
	;			;
	; MIPS32EL-LABEL: i8_2:			; MIPS32EL-LABEL: i8_2:
	; MIPS32EL: # %bb.0:			; MIPS32EL: # %bb.0:
	; MIPS32EL-NEXT: addu $1, $4, $5			; MIPS32EL-NEXT: addu $1, $4, $5
	; MIPS32EL-NEXT: andi $1, $1, 255			; MIPS32EL-NEXT: andi $1, $1, 255
	; MIPS32EL-NEXT: andi $2, $5, 65280			; MIPS32EL-NEXT: andi $2, $5, 65280
	▲ Show 20 Lines • Show All 55 Lines • ▼ Show 20 Lines
	; MIPS32R5EL-NEXT: move $sp, $fp			; MIPS32R5EL-NEXT: move $sp, $fp
	; MIPS32R5EL-NEXT: lw $fp, 44($sp) # 4-byte Folded Reload			; MIPS32R5EL-NEXT: lw $fp, 44($sp) # 4-byte Folded Reload
	; MIPS32R5EL-NEXT: addiu $sp, $sp, 48			; MIPS32R5EL-NEXT: addiu $sp, $sp, 48
	; MIPS32R5EL-NEXT: jr $ra			; MIPS32R5EL-NEXT: jr $ra
	; MIPS32R5EL-NEXT: nop			; MIPS32R5EL-NEXT: nop
	;			;
	; MIPS64R5EL-LABEL: i8_2:			; MIPS64R5EL-LABEL: i8_2:
	; MIPS64R5EL: # %bb.0:			; MIPS64R5EL: # %bb.0:
	; MIPS64R5EL-NEXT: daddiu $sp, $sp, -64			; MIPS64R5EL-NEXT: daddiu $sp, $sp, -96
	; MIPS64R5EL-NEXT: .cfi_def_cfa_offset 64			; MIPS64R5EL-NEXT: .cfi_def_cfa_offset 96
	; MIPS64R5EL-NEXT: sd $4, 56($sp)			; MIPS64R5EL-NEXT: sd $4, 88($sp)
	; MIPS64R5EL-NEXT: ldi.b $w0, 0			; MIPS64R5EL-NEXT: lbu $1, 89($sp)
	; MIPS64R5EL-NEXT: lbu $1, 57($sp)			; MIPS64R5EL-NEXT: sh $1, 2($sp)
	; MIPS64R5EL-NEXT: lbu $2, 56($sp)			; MIPS64R5EL-NEXT: lbu $1, 88($sp)
	; MIPS64R5EL-NEXT: move.v $w1, $w0			; MIPS64R5EL-NEXT: sh $1, 0($sp)
	; MIPS64R5EL-NEXT: insert.h $w1[0], $2			; MIPS64R5EL-NEXT: ld.h $w0, 0($sp)
	; MIPS64R5EL-NEXT: insert.h $w1[1], $1			; MIPS64R5EL-NEXT: copy_s.h $1, $w0[0]
	; MIPS64R5EL-NEXT: lbu $1, 58($sp)			; MIPS64R5EL-NEXT: copy_s.h $2, $w0[1]
	; MIPS64R5EL-NEXT: insert.h $w1[2], $1			; MIPS64R5EL-NEXT: sd $5, 80($sp)
	; MIPS64R5EL-NEXT: lbu $1, 59($sp)			; MIPS64R5EL-NEXT: lbu $3, 81($sp)
	; MIPS64R5EL-NEXT: insert.h $w1[3], $1			; MIPS64R5EL-NEXT: sh $3, 18($sp)
	; MIPS64R5EL-NEXT: lbu $1, 60($sp)			; MIPS64R5EL-NEXT: lbu $3, 80($sp)
	; MIPS64R5EL-NEXT: insert.h $w1[4], $1			; MIPS64R5EL-NEXT: sh $3, 16($sp)
	; MIPS64R5EL-NEXT: lbu $1, 61($sp)			; MIPS64R5EL-NEXT: ld.h $w0, 16($sp)
	; MIPS64R5EL-NEXT: insert.h $w1[5], $1
	; MIPS64R5EL-NEXT: lbu $1, 63($sp)
	; MIPS64R5EL-NEXT: lbu $2, 62($sp)
	; MIPS64R5EL-NEXT: insert.h $w1[6], $2
	; MIPS64R5EL-NEXT: insert.h $w1[7], $1
	; MIPS64R5EL-NEXT: copy_s.h $1, $w1[0]
	; MIPS64R5EL-NEXT: copy_s.h $2, $w1[1]
	; MIPS64R5EL-NEXT: sd $5, 48($sp)
	; MIPS64R5EL-NEXT: lbu $3, 48($sp)
	; MIPS64R5EL-NEXT: insert.h $w0[0], $3
	; MIPS64R5EL-NEXT: lbu $3, 49($sp)
	; MIPS64R5EL-NEXT: insert.h $w0[1], $3
	; MIPS64R5EL-NEXT: lbu $3, 50($sp)
	; MIPS64R5EL-NEXT: insert.h $w0[2], $3
	; MIPS64R5EL-NEXT: lbu $3, 51($sp)
	; MIPS64R5EL-NEXT: insert.h $w0[3], $3
	; MIPS64R5EL-NEXT: lbu $3, 52($sp)
	; MIPS64R5EL-NEXT: insert.h $w0[4], $3
	; MIPS64R5EL-NEXT: lbu $3, 53($sp)
	; MIPS64R5EL-NEXT: insert.h $w0[5], $3
	; MIPS64R5EL-NEXT: lbu $3, 55($sp)
	; MIPS64R5EL-NEXT: lbu $4, 54($sp)
	; MIPS64R5EL-NEXT: insert.h $w0[6], $4
	; MIPS64R5EL-NEXT: insert.h $w0[7], $3
	; MIPS64R5EL-NEXT: copy_s.h $3, $w0[0]			; MIPS64R5EL-NEXT: copy_s.h $3, $w0[0]
	; MIPS64R5EL-NEXT: copy_s.h $4, $w0[1]			; MIPS64R5EL-NEXT: copy_s.h $4, $w0[1]
	; MIPS64R5EL-NEXT: sw $4, 24($sp)			; MIPS64R5EL-NEXT: sw $4, 56($sp)
	; MIPS64R5EL-NEXT: sw $3, 16($sp)			; MIPS64R5EL-NEXT: sw $3, 48($sp)
	; MIPS64R5EL-NEXT: sw $2, 8($sp)			; MIPS64R5EL-NEXT: sw $2, 40($sp)
	; MIPS64R5EL-NEXT: sw $1, 0($sp)			; MIPS64R5EL-NEXT: sw $1, 32($sp)
	; MIPS64R5EL-NEXT: ld.d $w0, 16($sp)			; MIPS64R5EL-NEXT: ld.d $w0, 48($sp)
	; MIPS64R5EL-NEXT: ld.d $w1, 0($sp)			; MIPS64R5EL-NEXT: ld.d $w1, 32($sp)
	; MIPS64R5EL-NEXT: addv.d $w0, $w1, $w0			; MIPS64R5EL-NEXT: addv.d $w0, $w1, $w0
	; MIPS64R5EL-NEXT: copy_s.d $1, $w0[0]			; MIPS64R5EL-NEXT: copy_s.d $1, $w0[0]
	; MIPS64R5EL-NEXT: copy_s.d $2, $w0[1]			; MIPS64R5EL-NEXT: copy_s.d $2, $w0[1]
	; MIPS64R5EL-NEXT: sb $2, 45($sp)			; MIPS64R5EL-NEXT: sb $2, 77($sp)
	; MIPS64R5EL-NEXT: sb $1, 44($sp)			; MIPS64R5EL-NEXT: sb $1, 76($sp)
	; MIPS64R5EL-NEXT: lh $2, 44($sp)			; MIPS64R5EL-NEXT: lh $2, 76($sp)
	; MIPS64R5EL-NEXT: daddiu $sp, $sp, 64			; MIPS64R5EL-NEXT: daddiu $sp, $sp, 96
	; MIPS64R5EL-NEXT: jr $ra			; MIPS64R5EL-NEXT: jr $ra
	; MIPS64R5EL-NEXT: nop			; MIPS64R5EL-NEXT: nop
	%1 = add <2 x i8> %a, %b			%1 = add <2 x i8> %a, %b
	ret <2 x i8> %1			ret <2 x i8> %1
	}			}

	; Test that vector spilled to the outgoing argument area have the expected			; Test that vector spilled to the outgoing argument area have the expected
	; offset from $sp.			; offset from $sp.
	▲ Show 20 Lines • Show All 159 Lines • ▼ Show 20 Lines
	; MIPS32R5EB-NEXT: move $sp, $fp			; MIPS32R5EB-NEXT: move $sp, $fp
	; MIPS32R5EB-NEXT: lw $fp, 140($sp) # 4-byte Folded Reload			; MIPS32R5EB-NEXT: lw $fp, 140($sp) # 4-byte Folded Reload
	; MIPS32R5EB-NEXT: addiu $sp, $sp, 144			; MIPS32R5EB-NEXT: addiu $sp, $sp, 144
	; MIPS32R5EB-NEXT: jr $ra			; MIPS32R5EB-NEXT: jr $ra
	; MIPS32R5EB-NEXT: nop			; MIPS32R5EB-NEXT: nop
	;			;
	; MIPS64R5EB-LABEL: i8x2_7:			; MIPS64R5EB-LABEL: i8x2_7:
	; MIPS64R5EB: # %bb.0: # %entry			; MIPS64R5EB: # %bb.0: # %entry
	; MIPS64R5EB-NEXT: daddiu $sp, $sp, -176			; MIPS64R5EB-NEXT: daddiu $sp, $sp, -288
	; MIPS64R5EB-NEXT: .cfi_def_cfa_offset 176			; MIPS64R5EB-NEXT: .cfi_def_cfa_offset 288
	; MIPS64R5EB-NEXT: sd $4, 168($sp)			; MIPS64R5EB-NEXT: sd $4, 280($sp)
	; MIPS64R5EB-NEXT: ldi.b $w0, 0			; MIPS64R5EB-NEXT: lbu $1, 281($sp)
	; MIPS64R5EB-NEXT: lbu $1, 169($sp)			; MIPS64R5EB-NEXT: sh $1, 2($sp)
	; MIPS64R5EB-NEXT: lbu $2, 168($sp)			; MIPS64R5EB-NEXT: lbu $1, 280($sp)
	; MIPS64R5EB-NEXT: move.v $w1, $w0			; MIPS64R5EB-NEXT: sh $1, 0($sp)
	; MIPS64R5EB-NEXT: insert.h $w1[0], $2			; MIPS64R5EB-NEXT: ld.h $w0, 0($sp)
	; MIPS64R5EB-NEXT: insert.h $w1[1], $1			; MIPS64R5EB-NEXT: copy_s.h $1, $w0[0]
	; MIPS64R5EB-NEXT: lbu $1, 170($sp)			; MIPS64R5EB-NEXT: copy_s.h $2, $w0[1]
	; MIPS64R5EB-NEXT: insert.h $w1[2], $1			; MIPS64R5EB-NEXT: sd $5, 272($sp)
	; MIPS64R5EB-NEXT: lbu $1, 171($sp)			; MIPS64R5EB-NEXT: lbu $3, 273($sp)
	; MIPS64R5EB-NEXT: insert.h $w1[3], $1			; MIPS64R5EB-NEXT: sh $3, 18($sp)
	; MIPS64R5EB-NEXT: lbu $1, 172($sp)			; MIPS64R5EB-NEXT: lbu $3, 272($sp)
	; MIPS64R5EB-NEXT: insert.h $w1[4], $1			; MIPS64R5EB-NEXT: sh $3, 16($sp)
	; MIPS64R5EB-NEXT: lbu $1, 173($sp)			; MIPS64R5EB-NEXT: ld.h $w0, 16($sp)
	; MIPS64R5EB-NEXT: insert.h $w1[5], $1			; MIPS64R5EB-NEXT: copy_s.h $3, $w0[0]
	; MIPS64R5EB-NEXT: lbu $1, 175($sp)			; MIPS64R5EB-NEXT: copy_s.h $4, $w0[1]
	; MIPS64R5EB-NEXT: lbu $2, 174($sp)			; MIPS64R5EB-NEXT: sw $4, 140($sp)
	; MIPS64R5EB-NEXT: insert.h $w1[6], $2			; MIPS64R5EB-NEXT: sw $3, 132($sp)
	; MIPS64R5EB-NEXT: insert.h $w1[7], $1			; MIPS64R5EB-NEXT: sw $2, 124($sp)
				; MIPS64R5EB-NEXT: sw $1, 116($sp)
				; MIPS64R5EB-NEXT: ld.d $w0, 128($sp)
				; MIPS64R5EB-NEXT: ld.d $w1, 112($sp)
				; MIPS64R5EB-NEXT: addv.d $w0, $w1, $w0
				; MIPS64R5EB-NEXT: sd $6, 264($sp)
				; MIPS64R5EB-NEXT: lbu $1, 265($sp)
				; MIPS64R5EB-NEXT: sh $1, 34($sp)
				; MIPS64R5EB-NEXT: lbu $1, 264($sp)
				; MIPS64R5EB-NEXT: sh $1, 32($sp)
				; MIPS64R5EB-NEXT: ld.h $w1, 32($sp)
	; MIPS64R5EB-NEXT: copy_s.h $1, $w1[0]			; MIPS64R5EB-NEXT: copy_s.h $1, $w1[0]
	; MIPS64R5EB-NEXT: copy_s.h $2, $w1[1]			; MIPS64R5EB-NEXT: copy_s.h $2, $w1[1]
	; MIPS64R5EB-NEXT: sd $5, 160($sp)			; MIPS64R5EB-NEXT: sw $2, 156($sp)
	; MIPS64R5EB-NEXT: lbu $3, 161($sp)			; MIPS64R5EB-NEXT: sw $1, 148($sp)
	; MIPS64R5EB-NEXT: lbu $4, 160($sp)			; MIPS64R5EB-NEXT: ld.d $w1, 144($sp)
	; MIPS64R5EB-NEXT: move.v $w1, $w0			; MIPS64R5EB-NEXT: addv.d $w0, $w0, $w1
	; MIPS64R5EB-NEXT: insert.h $w1[0], $4			; MIPS64R5EB-NEXT: sd $7, 256($sp)
	; MIPS64R5EB-NEXT: insert.h $w1[1], $3			; MIPS64R5EB-NEXT: lbu $1, 257($sp)
	; MIPS64R5EB-NEXT: lbu $3, 162($sp)			; MIPS64R5EB-NEXT: sh $1, 50($sp)
	; MIPS64R5EB-NEXT: insert.h $w1[2], $3			; MIPS64R5EB-NEXT: lbu $1, 256($sp)
	; MIPS64R5EB-NEXT: lbu $3, 163($sp)			; MIPS64R5EB-NEXT: sh $1, 48($sp)
	; MIPS64R5EB-NEXT: insert.h $w1[3], $3			; MIPS64R5EB-NEXT: ld.h $w1, 48($sp)
	; MIPS64R5EB-NEXT: lbu $3, 164($sp)			; MIPS64R5EB-NEXT: copy_s.h $1, $w1[0]
	; MIPS64R5EB-NEXT: insert.h $w1[4], $3			; MIPS64R5EB-NEXT: copy_s.h $2, $w1[1]
	; MIPS64R5EB-NEXT: lbu $3, 165($sp)			; MIPS64R5EB-NEXT: sw $2, 172($sp)
	; MIPS64R5EB-NEXT: insert.h $w1[5], $3			; MIPS64R5EB-NEXT: sw $1, 164($sp)
	; MIPS64R5EB-NEXT: lbu $3, 167($sp)			; MIPS64R5EB-NEXT: ld.d $w1, 160($sp)
	; MIPS64R5EB-NEXT: lbu $4, 166($sp)			; MIPS64R5EB-NEXT: addv.d $w0, $w0, $w1
	; MIPS64R5EB-NEXT: insert.h $w1[6], $4			; MIPS64R5EB-NEXT: sd $8, 248($sp)
	; MIPS64R5EB-NEXT: insert.h $w1[7], $3			; MIPS64R5EB-NEXT: lbu $1, 249($sp)
				; MIPS64R5EB-NEXT: sh $1, 66($sp)
				; MIPS64R5EB-NEXT: lbu $1, 248($sp)
				; MIPS64R5EB-NEXT: sh $1, 64($sp)
				; MIPS64R5EB-NEXT: ld.h $w1, 64($sp)
				; MIPS64R5EB-NEXT: copy_s.h $1, $w1[0]
				; MIPS64R5EB-NEXT: copy_s.h $2, $w1[1]
				; MIPS64R5EB-NEXT: sw $2, 188($sp)
				; MIPS64R5EB-NEXT: sw $1, 180($sp)
				; MIPS64R5EB-NEXT: ld.d $w1, 176($sp)
				; MIPS64R5EB-NEXT: addv.d $w0, $w0, $w1
				; MIPS64R5EB-NEXT: sd $10, 232($sp)
				; MIPS64R5EB-NEXT: lbu $1, 233($sp)
				; MIPS64R5EB-NEXT: sh $1, 98($sp)
				; MIPS64R5EB-NEXT: lbu $1, 232($sp)
				; MIPS64R5EB-NEXT: sh $1, 96($sp)
				; MIPS64R5EB-NEXT: ld.h $w1, 96($sp)
				; MIPS64R5EB-NEXT: copy_s.h $1, $w1[0]
				; MIPS64R5EB-NEXT: copy_s.h $2, $w1[1]
				; MIPS64R5EB-NEXT: sd $9, 240($sp)
				; MIPS64R5EB-NEXT: lbu $3, 241($sp)
				; MIPS64R5EB-NEXT: sh $3, 82($sp)
				; MIPS64R5EB-NEXT: lbu $3, 240($sp)
				; MIPS64R5EB-NEXT: sh $3, 80($sp)
				; MIPS64R5EB-NEXT: ld.h $w1, 80($sp)
	; MIPS64R5EB-NEXT: copy_s.h $3, $w1[0]			; MIPS64R5EB-NEXT: copy_s.h $3, $w1[0]
	; MIPS64R5EB-NEXT: copy_s.h $4, $w1[1]			; MIPS64R5EB-NEXT: copy_s.h $4, $w1[1]
	; MIPS64R5EB-NEXT: sw $4, 28($sp)			; MIPS64R5EB-NEXT: sw $4, 204($sp)
	; MIPS64R5EB-NEXT: sw $3, 20($sp)			; MIPS64R5EB-NEXT: sw $3, 196($sp)
	; MIPS64R5EB-NEXT: sw $2, 12($sp)			; MIPS64R5EB-NEXT: ld.d $w1, 192($sp)
	; MIPS64R5EB-NEXT: sw $1, 4($sp)			; MIPS64R5EB-NEXT: addv.d $w0, $w0, $w1
	; MIPS64R5EB-NEXT: ld.d $w1, 16($sp)			; MIPS64R5EB-NEXT: sw $2, 220($sp)
	; MIPS64R5EB-NEXT: ld.d $w2, 0($sp)			; MIPS64R5EB-NEXT: sw $1, 212($sp)
	; MIPS64R5EB-NEXT: addv.d $w1, $w2, $w1			; MIPS64R5EB-NEXT: ld.d $w1, 208($sp)
	; MIPS64R5EB-NEXT: sd $6, 152($sp)
	; MIPS64R5EB-NEXT: lbu $1, 153($sp)
	; MIPS64R5EB-NEXT: lbu $2, 152($sp)
	; MIPS64R5EB-NEXT: move.v $w2, $w0
	; MIPS64R5EB-NEXT: insert.h $w2[0], $2
	; MIPS64R5EB-NEXT: insert.h $w2[1], $1
	; MIPS64R5EB-NEXT: lbu $1, 154($sp)
	; MIPS64R5EB-NEXT: insert.h $w2[2], $1
	; MIPS64R5EB-NEXT: lbu $1, 155($sp)
	; MIPS64R5EB-NEXT: insert.h $w2[3], $1
	; MIPS64R5EB-NEXT: lbu $1, 156($sp)
	; MIPS64R5EB-NEXT: insert.h $w2[4], $1
	; MIPS64R5EB-NEXT: lbu $1, 157($sp)
	; MIPS64R5EB-NEXT: insert.h $w2[5], $1
	; MIPS64R5EB-NEXT: lbu $1, 159($sp)
	; MIPS64R5EB-NEXT: lbu $2, 158($sp)
	; MIPS64R5EB-NEXT: insert.h $w2[6], $2
	; MIPS64R5EB-NEXT: insert.h $w2[7], $1
	; MIPS64R5EB-NEXT: copy_s.h $1, $w2[0]
	; MIPS64R5EB-NEXT: copy_s.h $2, $w2[1]
	; MIPS64R5EB-NEXT: sw $2, 44($sp)
	; MIPS64R5EB-NEXT: sw $1, 36($sp)
	; MIPS64R5EB-NEXT: ld.d $w2, 32($sp)
	; MIPS64R5EB-NEXT: addv.d $w1, $w1, $w2
	; MIPS64R5EB-NEXT: sd $7, 144($sp)
	; MIPS64R5EB-NEXT: lbu $1, 145($sp)
	; MIPS64R5EB-NEXT: lbu $2, 144($sp)
	; MIPS64R5EB-NEXT: move.v $w2, $w0
	; MIPS64R5EB-NEXT: insert.h $w2[0], $2
	; MIPS64R5EB-NEXT: insert.h $w2[1], $1
	; MIPS64R5EB-NEXT: lbu $1, 146($sp)
	; MIPS64R5EB-NEXT: insert.h $w2[2], $1
	; MIPS64R5EB-NEXT: lbu $1, 147($sp)
	; MIPS64R5EB-NEXT: insert.h $w2[3], $1
	; MIPS64R5EB-NEXT: lbu $1, 148($sp)
	; MIPS64R5EB-NEXT: insert.h $w2[4], $1
	; MIPS64R5EB-NEXT: lbu $1, 149($sp)
	; MIPS64R5EB-NEXT: insert.h $w2[5], $1
	; MIPS64R5EB-NEXT: lbu $1, 151($sp)
	; MIPS64R5EB-NEXT: lbu $2, 150($sp)
	; MIPS64R5EB-NEXT: insert.h $w2[6], $2
	; MIPS64R5EB-NEXT: insert.h $w2[7], $1
	; MIPS64R5EB-NEXT: copy_s.h $1, $w2[0]
	; MIPS64R5EB-NEXT: copy_s.h $2, $w2[1]
	; MIPS64R5EB-NEXT: sw $2, 60($sp)
	; MIPS64R5EB-NEXT: sw $1, 52($sp)
	; MIPS64R5EB-NEXT: ld.d $w2, 48($sp)
	; MIPS64R5EB-NEXT: addv.d $w1, $w1, $w2
	; MIPS64R5EB-NEXT: sd $8, 136($sp)
	; MIPS64R5EB-NEXT: lbu $1, 137($sp)
	; MIPS64R5EB-NEXT: lbu $2, 136($sp)
	; MIPS64R5EB-NEXT: move.v $w2, $w0
	; MIPS64R5EB-NEXT: insert.h $w2[0], $2
	; MIPS64R5EB-NEXT: insert.h $w2[1], $1
	; MIPS64R5EB-NEXT: lbu $1, 138($sp)
	; MIPS64R5EB-NEXT: insert.h $w2[2], $1
	; MIPS64R5EB-NEXT: lbu $1, 139($sp)
	; MIPS64R5EB-NEXT: insert.h $w2[3], $1
	; MIPS64R5EB-NEXT: lbu $1, 140($sp)
	; MIPS64R5EB-NEXT: insert.h $w2[4], $1
	; MIPS64R5EB-NEXT: lbu $1, 141($sp)
	; MIPS64R5EB-NEXT: insert.h $w2[5], $1
	; MIPS64R5EB-NEXT: lbu $1, 143($sp)
	; MIPS64R5EB-NEXT: lbu $2, 142($sp)
	; MIPS64R5EB-NEXT: insert.h $w2[6], $2
	; MIPS64R5EB-NEXT: insert.h $w2[7], $1
	; MIPS64R5EB-NEXT: copy_s.h $1, $w2[0]
	; MIPS64R5EB-NEXT: copy_s.h $2, $w2[1]
	; MIPS64R5EB-NEXT: sd $10, 120($sp)
	; MIPS64R5EB-NEXT: lbu $3, 121($sp)
	; MIPS64R5EB-NEXT: lbu $4, 120($sp)
	; MIPS64R5EB-NEXT: move.v $w2, $w0
	; MIPS64R5EB-NEXT: insert.h $w2[0], $4
	; MIPS64R5EB-NEXT: insert.h $w2[1], $3
	; MIPS64R5EB-NEXT: lbu $3, 122($sp)
	; MIPS64R5EB-NEXT: insert.h $w2[2], $3
	; MIPS64R5EB-NEXT: lbu $3, 123($sp)
	; MIPS64R5EB-NEXT: insert.h $w2[3], $3
	; MIPS64R5EB-NEXT: lbu $3, 124($sp)
	; MIPS64R5EB-NEXT: insert.h $w2[4], $3
	; MIPS64R5EB-NEXT: lbu $3, 125($sp)
	; MIPS64R5EB-NEXT: insert.h $w2[5], $3
	; MIPS64R5EB-NEXT: lbu $3, 127($sp)
	; MIPS64R5EB-NEXT: lbu $4, 126($sp)
	; MIPS64R5EB-NEXT: insert.h $w2[6], $4
	; MIPS64R5EB-NEXT: insert.h $w2[7], $3
	; MIPS64R5EB-NEXT: copy_s.h $3, $w2[0]
	; MIPS64R5EB-NEXT: copy_s.h $4, $w2[1]
	; MIPS64R5EB-NEXT: sw $2, 76($sp)
	; MIPS64R5EB-NEXT: sw $1, 68($sp)
	; MIPS64R5EB-NEXT: ld.d $w2, 64($sp)
	; MIPS64R5EB-NEXT: addv.d $w1, $w1, $w2
	; MIPS64R5EB-NEXT: sd $9, 128($sp)
	; MIPS64R5EB-NEXT: lbu $1, 128($sp)
	; MIPS64R5EB-NEXT: insert.h $w0[0], $1
	; MIPS64R5EB-NEXT: lbu $1, 129($sp)
	; MIPS64R5EB-NEXT: insert.h $w0[1], $1
	; MIPS64R5EB-NEXT: lbu $1, 130($sp)
	; MIPS64R5EB-NEXT: insert.h $w0[2], $1
	; MIPS64R5EB-NEXT: lbu $1, 131($sp)
	; MIPS64R5EB-NEXT: insert.h $w0[3], $1
	; MIPS64R5EB-NEXT: lbu $1, 132($sp)
	; MIPS64R5EB-NEXT: insert.h $w0[4], $1
	; MIPS64R5EB-NEXT: lbu $1, 133($sp)
	; MIPS64R5EB-NEXT: insert.h $w0[5], $1
	; MIPS64R5EB-NEXT: lbu $1, 135($sp)
	; MIPS64R5EB-NEXT: lbu $2, 134($sp)
	; MIPS64R5EB-NEXT: insert.h $w0[6], $2
	; MIPS64R5EB-NEXT: insert.h $w0[7], $1
	; MIPS64R5EB-NEXT: copy_s.h $1, $w0[0]
	; MIPS64R5EB-NEXT: copy_s.h $2, $w0[1]
	; MIPS64R5EB-NEXT: sw $2, 92($sp)
	; MIPS64R5EB-NEXT: sw $1, 84($sp)
	; MIPS64R5EB-NEXT: ld.d $w0, 80($sp)
	; MIPS64R5EB-NEXT: addv.d $w0, $w1, $w0
	; MIPS64R5EB-NEXT: sw $4, 108($sp)
	; MIPS64R5EB-NEXT: sw $3, 100($sp)
	; MIPS64R5EB-NEXT: ld.d $w1, 96($sp)
	; MIPS64R5EB-NEXT: addv.d $w0, $w0, $w1			; MIPS64R5EB-NEXT: addv.d $w0, $w0, $w1
	; MIPS64R5EB-NEXT: copy_s.d $1, $w0[0]			; MIPS64R5EB-NEXT: copy_s.d $1, $w0[0]
	; MIPS64R5EB-NEXT: copy_s.d $2, $w0[1]			; MIPS64R5EB-NEXT: copy_s.d $2, $w0[1]
	; MIPS64R5EB-NEXT: sb $2, 117($sp)			; MIPS64R5EB-NEXT: sb $2, 229($sp)
	; MIPS64R5EB-NEXT: sb $1, 116($sp)			; MIPS64R5EB-NEXT: sb $1, 228($sp)
	; MIPS64R5EB-NEXT: lh $2, 116($sp)			; MIPS64R5EB-NEXT: lh $2, 228($sp)
	; MIPS64R5EB-NEXT: daddiu $sp, $sp, 176			; MIPS64R5EB-NEXT: daddiu $sp, $sp, 288
	; MIPS64R5EB-NEXT: jr $ra			; MIPS64R5EB-NEXT: jr $ra
	; MIPS64R5EB-NEXT: nop			; MIPS64R5EB-NEXT: nop
	;			;
	; MIPS32EL-LABEL: i8x2_7:			; MIPS32EL-LABEL: i8x2_7:
	; MIPS32EL: # %bb.0: # %entry			; MIPS32EL: # %bb.0: # %entry
	; MIPS32EL-NEXT: addu $1, $4, $5			; MIPS32EL-NEXT: addu $1, $4, $5
	; MIPS32EL-NEXT: addu $1, $1, $6			; MIPS32EL-NEXT: addu $1, $1, $6
	; MIPS32EL-NEXT: addu $1, $1, $7			; MIPS32EL-NEXT: addu $1, $1, $7
	▲ Show 20 Lines • Show All 137 Lines • ▼ Show 20 Lines
	; MIPS32R5EL-NEXT: move $sp, $fp			; MIPS32R5EL-NEXT: move $sp, $fp
	; MIPS32R5EL-NEXT: lw $fp, 140($sp) # 4-byte Folded Reload			; MIPS32R5EL-NEXT: lw $fp, 140($sp) # 4-byte Folded Reload
	; MIPS32R5EL-NEXT: addiu $sp, $sp, 144			; MIPS32R5EL-NEXT: addiu $sp, $sp, 144
	; MIPS32R5EL-NEXT: jr $ra			; MIPS32R5EL-NEXT: jr $ra
	; MIPS32R5EL-NEXT: nop			; MIPS32R5EL-NEXT: nop
	;			;
	; MIPS64R5EL-LABEL: i8x2_7:			; MIPS64R5EL-LABEL: i8x2_7:
	; MIPS64R5EL: # %bb.0: # %entry			; MIPS64R5EL: # %bb.0: # %entry
	; MIPS64R5EL-NEXT: daddiu $sp, $sp, -176			; MIPS64R5EL-NEXT: daddiu $sp, $sp, -288
	; MIPS64R5EL-NEXT: .cfi_def_cfa_offset 176			; MIPS64R5EL-NEXT: .cfi_def_cfa_offset 288
	; MIPS64R5EL-NEXT: sd $4, 168($sp)			; MIPS64R5EL-NEXT: sd $4, 280($sp)
	; MIPS64R5EL-NEXT: ldi.b $w0, 0			; MIPS64R5EL-NEXT: lbu $1, 281($sp)
	; MIPS64R5EL-NEXT: lbu $1, 169($sp)			; MIPS64R5EL-NEXT: sh $1, 2($sp)
	; MIPS64R5EL-NEXT: lbu $2, 168($sp)			; MIPS64R5EL-NEXT: lbu $1, 280($sp)
	; MIPS64R5EL-NEXT: move.v $w1, $w0			; MIPS64R5EL-NEXT: sh $1, 0($sp)
	; MIPS64R5EL-NEXT: insert.h $w1[0], $2			; MIPS64R5EL-NEXT: ld.h $w0, 0($sp)
	; MIPS64R5EL-NEXT: insert.h $w1[1], $1			; MIPS64R5EL-NEXT: copy_s.h $1, $w0[0]
	; MIPS64R5EL-NEXT: lbu $1, 170($sp)			; MIPS64R5EL-NEXT: copy_s.h $2, $w0[1]
	; MIPS64R5EL-NEXT: insert.h $w1[2], $1			; MIPS64R5EL-NEXT: sd $5, 272($sp)
	; MIPS64R5EL-NEXT: lbu $1, 171($sp)			; MIPS64R5EL-NEXT: lbu $3, 273($sp)
	; MIPS64R5EL-NEXT: insert.h $w1[3], $1			; MIPS64R5EL-NEXT: sh $3, 18($sp)
	; MIPS64R5EL-NEXT: lbu $1, 172($sp)			; MIPS64R5EL-NEXT: lbu $3, 272($sp)
	; MIPS64R5EL-NEXT: insert.h $w1[4], $1			; MIPS64R5EL-NEXT: sh $3, 16($sp)
	; MIPS64R5EL-NEXT: lbu $1, 173($sp)			; MIPS64R5EL-NEXT: ld.h $w0, 16($sp)
	; MIPS64R5EL-NEXT: insert.h $w1[5], $1			; MIPS64R5EL-NEXT: copy_s.h $3, $w0[0]
	; MIPS64R5EL-NEXT: lbu $1, 175($sp)			; MIPS64R5EL-NEXT: copy_s.h $4, $w0[1]
	; MIPS64R5EL-NEXT: lbu $2, 174($sp)			; MIPS64R5EL-NEXT: sw $4, 136($sp)
	; MIPS64R5EL-NEXT: insert.h $w1[6], $2			; MIPS64R5EL-NEXT: sw $3, 128($sp)
	; MIPS64R5EL-NEXT: insert.h $w1[7], $1			; MIPS64R5EL-NEXT: sw $2, 120($sp)
				; MIPS64R5EL-NEXT: sw $1, 112($sp)
				; MIPS64R5EL-NEXT: ld.d $w0, 128($sp)
				; MIPS64R5EL-NEXT: ld.d $w1, 112($sp)
				; MIPS64R5EL-NEXT: addv.d $w0, $w1, $w0
				; MIPS64R5EL-NEXT: sd $6, 264($sp)
				; MIPS64R5EL-NEXT: lbu $1, 265($sp)
				; MIPS64R5EL-NEXT: sh $1, 34($sp)
				; MIPS64R5EL-NEXT: lbu $1, 264($sp)
				; MIPS64R5EL-NEXT: sh $1, 32($sp)
				; MIPS64R5EL-NEXT: ld.h $w1, 32($sp)
	; MIPS64R5EL-NEXT: copy_s.h $1, $w1[0]			; MIPS64R5EL-NEXT: copy_s.h $1, $w1[0]
	; MIPS64R5EL-NEXT: copy_s.h $2, $w1[1]			; MIPS64R5EL-NEXT: copy_s.h $2, $w1[1]
	; MIPS64R5EL-NEXT: sd $5, 160($sp)			; MIPS64R5EL-NEXT: sw $2, 152($sp)
	; MIPS64R5EL-NEXT: lbu $3, 161($sp)			; MIPS64R5EL-NEXT: sw $1, 144($sp)
	; MIPS64R5EL-NEXT: lbu $4, 160($sp)			; MIPS64R5EL-NEXT: ld.d $w1, 144($sp)
	; MIPS64R5EL-NEXT: move.v $w1, $w0			; MIPS64R5EL-NEXT: addv.d $w0, $w0, $w1
	; MIPS64R5EL-NEXT: insert.h $w1[0], $4			; MIPS64R5EL-NEXT: sd $7, 256($sp)
	; MIPS64R5EL-NEXT: insert.h $w1[1], $3			; MIPS64R5EL-NEXT: lbu $1, 257($sp)
	; MIPS64R5EL-NEXT: lbu $3, 162($sp)			; MIPS64R5EL-NEXT: sh $1, 50($sp)
	; MIPS64R5EL-NEXT: insert.h $w1[2], $3			; MIPS64R5EL-NEXT: lbu $1, 256($sp)
	; MIPS64R5EL-NEXT: lbu $3, 163($sp)			; MIPS64R5EL-NEXT: sh $1, 48($sp)
	; MIPS64R5EL-NEXT: insert.h $w1[3], $3			; MIPS64R5EL-NEXT: ld.h $w1, 48($sp)
	; MIPS64R5EL-NEXT: lbu $3, 164($sp)			; MIPS64R5EL-NEXT: copy_s.h $1, $w1[0]
	; MIPS64R5EL-NEXT: insert.h $w1[4], $3			; MIPS64R5EL-NEXT: copy_s.h $2, $w1[1]
	; MIPS64R5EL-NEXT: lbu $3, 165($sp)			; MIPS64R5EL-NEXT: sw $2, 168($sp)
	; MIPS64R5EL-NEXT: insert.h $w1[5], $3			; MIPS64R5EL-NEXT: sw $1, 160($sp)
	; MIPS64R5EL-NEXT: lbu $3, 167($sp)			; MIPS64R5EL-NEXT: ld.d $w1, 160($sp)
	; MIPS64R5EL-NEXT: lbu $4, 166($sp)			; MIPS64R5EL-NEXT: addv.d $w0, $w0, $w1
	; MIPS64R5EL-NEXT: insert.h $w1[6], $4			; MIPS64R5EL-NEXT: sd $8, 248($sp)
	; MIPS64R5EL-NEXT: insert.h $w1[7], $3			; MIPS64R5EL-NEXT: lbu $1, 249($sp)
				; MIPS64R5EL-NEXT: sh $1, 66($sp)
				; MIPS64R5EL-NEXT: lbu $1, 248($sp)
				; MIPS64R5EL-NEXT: sh $1, 64($sp)
				; MIPS64R5EL-NEXT: ld.h $w1, 64($sp)
				; MIPS64R5EL-NEXT: copy_s.h $1, $w1[0]
				; MIPS64R5EL-NEXT: copy_s.h $2, $w1[1]
				; MIPS64R5EL-NEXT: sw $2, 184($sp)
				; MIPS64R5EL-NEXT: sw $1, 176($sp)
				; MIPS64R5EL-NEXT: ld.d $w1, 176($sp)
				; MIPS64R5EL-NEXT: addv.d $w0, $w0, $w1
				; MIPS64R5EL-NEXT: sd $10, 232($sp)
				; MIPS64R5EL-NEXT: lbu $1, 233($sp)
				; MIPS64R5EL-NEXT: sh $1, 98($sp)
				; MIPS64R5EL-NEXT: lbu $1, 232($sp)
				; MIPS64R5EL-NEXT: sh $1, 96($sp)
				; MIPS64R5EL-NEXT: ld.h $w1, 96($sp)
				; MIPS64R5EL-NEXT: copy_s.h $1, $w1[0]
				; MIPS64R5EL-NEXT: copy_s.h $2, $w1[1]
				; MIPS64R5EL-NEXT: sd $9, 240($sp)
				; MIPS64R5EL-NEXT: lbu $3, 241($sp)
				; MIPS64R5EL-NEXT: sh $3, 82($sp)
				; MIPS64R5EL-NEXT: lbu $3, 240($sp)
				; MIPS64R5EL-NEXT: sh $3, 80($sp)
				; MIPS64R5EL-NEXT: ld.h $w1, 80($sp)
	; MIPS64R5EL-NEXT: copy_s.h $3, $w1[0]			; MIPS64R5EL-NEXT: copy_s.h $3, $w1[0]
	; MIPS64R5EL-NEXT: copy_s.h $4, $w1[1]			; MIPS64R5EL-NEXT: copy_s.h $4, $w1[1]
	; MIPS64R5EL-NEXT: sw $4, 24($sp)			; MIPS64R5EL-NEXT: sw $4, 200($sp)
	; MIPS64R5EL-NEXT: sw $3, 16($sp)			; MIPS64R5EL-NEXT: sw $3, 192($sp)
	; MIPS64R5EL-NEXT: sw $2, 8($sp)			; MIPS64R5EL-NEXT: ld.d $w1, 192($sp)
	; MIPS64R5EL-NEXT: sw $1, 0($sp)			; MIPS64R5EL-NEXT: addv.d $w0, $w0, $w1
	; MIPS64R5EL-NEXT: ld.d $w1, 16($sp)			; MIPS64R5EL-NEXT: sw $2, 216($sp)
	; MIPS64R5EL-NEXT: ld.d $w2, 0($sp)			; MIPS64R5EL-NEXT: sw $1, 208($sp)
	; MIPS64R5EL-NEXT: addv.d $w1, $w2, $w1			; MIPS64R5EL-NEXT: ld.d $w1, 208($sp)
	; MIPS64R5EL-NEXT: sd $6, 152($sp)
	; MIPS64R5EL-NEXT: lbu $1, 153($sp)
	; MIPS64R5EL-NEXT: lbu $2, 152($sp)
	; MIPS64R5EL-NEXT: move.v $w2, $w0
	; MIPS64R5EL-NEXT: insert.h $w2[0], $2
	; MIPS64R5EL-NEXT: insert.h $w2[1], $1
	; MIPS64R5EL-NEXT: lbu $1, 154($sp)
	; MIPS64R5EL-NEXT: insert.h $w2[2], $1
	; MIPS64R5EL-NEXT: lbu $1, 155($sp)
	; MIPS64R5EL-NEXT: insert.h $w2[3], $1
	; MIPS64R5EL-NEXT: lbu $1, 156($sp)
	; MIPS64R5EL-NEXT: insert.h $w2[4], $1
	; MIPS64R5EL-NEXT: lbu $1, 157($sp)
	; MIPS64R5EL-NEXT: insert.h $w2[5], $1
	; MIPS64R5EL-NEXT: lbu $1, 159($sp)
	; MIPS64R5EL-NEXT: lbu $2, 158($sp)
	; MIPS64R5EL-NEXT: insert.h $w2[6], $2
	; MIPS64R5EL-NEXT: insert.h $w2[7], $1
	; MIPS64R5EL-NEXT: copy_s.h $1, $w2[0]
	; MIPS64R5EL-NEXT: copy_s.h $2, $w2[1]
	; MIPS64R5EL-NEXT: sw $2, 40($sp)
	; MIPS64R5EL-NEXT: sw $1, 32($sp)
	; MIPS64R5EL-NEXT: ld.d $w2, 32($sp)
	; MIPS64R5EL-NEXT: addv.d $w1, $w1, $w2
	; MIPS64R5EL-NEXT: sd $7, 144($sp)
	; MIPS64R5EL-NEXT: lbu $1, 145($sp)
	; MIPS64R5EL-NEXT: lbu $2, 144($sp)
	; MIPS64R5EL-NEXT: move.v $w2, $w0
	; MIPS64R5EL-NEXT: insert.h $w2[0], $2
	; MIPS64R5EL-NEXT: insert.h $w2[1], $1
	; MIPS64R5EL-NEXT: lbu $1, 146($sp)
	; MIPS64R5EL-NEXT: insert.h $w2[2], $1
	; MIPS64R5EL-NEXT: lbu $1, 147($sp)
	; MIPS64R5EL-NEXT: insert.h $w2[3], $1
	; MIPS64R5EL-NEXT: lbu $1, 148($sp)
	; MIPS64R5EL-NEXT: insert.h $w2[4], $1
	; MIPS64R5EL-NEXT: lbu $1, 149($sp)
	; MIPS64R5EL-NEXT: insert.h $w2[5], $1
	; MIPS64R5EL-NEXT: lbu $1, 151($sp)
	; MIPS64R5EL-NEXT: lbu $2, 150($sp)
	; MIPS64R5EL-NEXT: insert.h $w2[6], $2
	; MIPS64R5EL-NEXT: insert.h $w2[7], $1
	; MIPS64R5EL-NEXT: copy_s.h $1, $w2[0]
	; MIPS64R5EL-NEXT: copy_s.h $2, $w2[1]
	; MIPS64R5EL-NEXT: sw $2, 56($sp)
	; MIPS64R5EL-NEXT: sw $1, 48($sp)
	; MIPS64R5EL-NEXT: ld.d $w2, 48($sp)
	; MIPS64R5EL-NEXT: addv.d $w1, $w1, $w2
	; MIPS64R5EL-NEXT: sd $8, 136($sp)
	; MIPS64R5EL-NEXT: lbu $1, 137($sp)
	; MIPS64R5EL-NEXT: lbu $2, 136($sp)
	; MIPS64R5EL-NEXT: move.v $w2, $w0
	; MIPS64R5EL-NEXT: insert.h $w2[0], $2
	; MIPS64R5EL-NEXT: insert.h $w2[1], $1
	; MIPS64R5EL-NEXT: lbu $1, 138($sp)
	; MIPS64R5EL-NEXT: insert.h $w2[2], $1
	; MIPS64R5EL-NEXT: lbu $1, 139($sp)
	; MIPS64R5EL-NEXT: insert.h $w2[3], $1
	; MIPS64R5EL-NEXT: lbu $1, 140($sp)
	; MIPS64R5EL-NEXT: insert.h $w2[4], $1
	; MIPS64R5EL-NEXT: lbu $1, 141($sp)
	; MIPS64R5EL-NEXT: insert.h $w2[5], $1
	; MIPS64R5EL-NEXT: lbu $1, 143($sp)
	; MIPS64R5EL-NEXT: lbu $2, 142($sp)
	; MIPS64R5EL-NEXT: insert.h $w2[6], $2
	; MIPS64R5EL-NEXT: insert.h $w2[7], $1
	; MIPS64R5EL-NEXT: copy_s.h $1, $w2[0]
	; MIPS64R5EL-NEXT: copy_s.h $2, $w2[1]
	; MIPS64R5EL-NEXT: sd $10, 120($sp)
	; MIPS64R5EL-NEXT: lbu $3, 121($sp)
	; MIPS64R5EL-NEXT: lbu $4, 120($sp)
	; MIPS64R5EL-NEXT: move.v $w2, $w0
	; MIPS64R5EL-NEXT: insert.h $w2[0], $4
	; MIPS64R5EL-NEXT: insert.h $w2[1], $3
	; MIPS64R5EL-NEXT: lbu $3, 122($sp)
	; MIPS64R5EL-NEXT: insert.h $w2[2], $3
	; MIPS64R5EL-NEXT: lbu $3, 123($sp)
	; MIPS64R5EL-NEXT: insert.h $w2[3], $3
	; MIPS64R5EL-NEXT: lbu $3, 124($sp)
	; MIPS64R5EL-NEXT: insert.h $w2[4], $3
	; MIPS64R5EL-NEXT: lbu $3, 125($sp)
	; MIPS64R5EL-NEXT: insert.h $w2[5], $3
	; MIPS64R5EL-NEXT: lbu $3, 127($sp)
	; MIPS64R5EL-NEXT: lbu $4, 126($sp)
	; MIPS64R5EL-NEXT: insert.h $w2[6], $4
	; MIPS64R5EL-NEXT: insert.h $w2[7], $3
	; MIPS64R5EL-NEXT: copy_s.h $3, $w2[0]
	; MIPS64R5EL-NEXT: copy_s.h $4, $w2[1]
	; MIPS64R5EL-NEXT: sw $2, 72($sp)
	; MIPS64R5EL-NEXT: sw $1, 64($sp)
	; MIPS64R5EL-NEXT: ld.d $w2, 64($sp)
	; MIPS64R5EL-NEXT: addv.d $w1, $w1, $w2
	; MIPS64R5EL-NEXT: sd $9, 128($sp)
	; MIPS64R5EL-NEXT: lbu $1, 128($sp)
	; MIPS64R5EL-NEXT: insert.h $w0[0], $1
	; MIPS64R5EL-NEXT: lbu $1, 129($sp)
	; MIPS64R5EL-NEXT: insert.h $w0[1], $1
	; MIPS64R5EL-NEXT: lbu $1, 130($sp)
	; MIPS64R5EL-NEXT: insert.h $w0[2], $1
	; MIPS64R5EL-NEXT: lbu $1, 131($sp)
	; MIPS64R5EL-NEXT: insert.h $w0[3], $1
	; MIPS64R5EL-NEXT: lbu $1, 132($sp)
	; MIPS64R5EL-NEXT: insert.h $w0[4], $1
	; MIPS64R5EL-NEXT: lbu $1, 133($sp)
	; MIPS64R5EL-NEXT: insert.h $w0[5], $1
	; MIPS64R5EL-NEXT: lbu $1, 135($sp)
	; MIPS64R5EL-NEXT: lbu $2, 134($sp)
	; MIPS64R5EL-NEXT: insert.h $w0[6], $2
	; MIPS64R5EL-NEXT: insert.h $w0[7], $1
	; MIPS64R5EL-NEXT: copy_s.h $1, $w0[0]
	; MIPS64R5EL-NEXT: copy_s.h $2, $w0[1]
	; MIPS64R5EL-NEXT: sw $2, 88($sp)
	; MIPS64R5EL-NEXT: sw $1, 80($sp)
	; MIPS64R5EL-NEXT: ld.d $w0, 80($sp)
	; MIPS64R5EL-NEXT: addv.d $w0, $w1, $w0
	; MIPS64R5EL-NEXT: sw $4, 104($sp)
	; MIPS64R5EL-NEXT: sw $3, 96($sp)
	; MIPS64R5EL-NEXT: ld.d $w1, 96($sp)
	; MIPS64R5EL-NEXT: addv.d $w0, $w0, $w1			; MIPS64R5EL-NEXT: addv.d $w0, $w0, $w1
	; MIPS64R5EL-NEXT: copy_s.d $1, $w0[0]			; MIPS64R5EL-NEXT: copy_s.d $1, $w0[0]
	; MIPS64R5EL-NEXT: copy_s.d $2, $w0[1]			; MIPS64R5EL-NEXT: copy_s.d $2, $w0[1]
	; MIPS64R5EL-NEXT: sb $2, 117($sp)			; MIPS64R5EL-NEXT: sb $2, 229($sp)
	; MIPS64R5EL-NEXT: sb $1, 116($sp)			; MIPS64R5EL-NEXT: sb $1, 228($sp)
	; MIPS64R5EL-NEXT: lh $2, 116($sp)			; MIPS64R5EL-NEXT: lh $2, 228($sp)
	; MIPS64R5EL-NEXT: daddiu $sp, $sp, 176			; MIPS64R5EL-NEXT: daddiu $sp, $sp, 288
	; MIPS64R5EL-NEXT: jr $ra			; MIPS64R5EL-NEXT: jr $ra
	; MIPS64R5EL-NEXT: nop			; MIPS64R5EL-NEXT: nop
	entry:			entry:
	%0 = add <2 x i8> %a, %b			%0 = add <2 x i8> %a, %b
	%1 = add <2 x i8> %0, %c			%1 = add <2 x i8> %0, %c
	%2 = add <2 x i8> %1, %d			%2 = add <2 x i8> %1, %d
	%3 = add <2 x i8> %2, %e			%3 = add <2 x i8> %2, %e
	%4 = add <2 x i8> %3, %f			%4 = add <2 x i8> %3, %f
	▲ Show 20 Lines • Show All 2,804 Lines • ▼ Show 20 Lines
	; MIPS32R5EB-NEXT: sh $2, %lo(gv2i8)($1)			; MIPS32R5EB-NEXT: sh $2, %lo(gv2i8)($1)
	; MIPS32R5EB-NEXT: lw $ra, 28($sp) # 4-byte Folded Reload			; MIPS32R5EB-NEXT: lw $ra, 28($sp) # 4-byte Folded Reload
	; MIPS32R5EB-NEXT: addiu $sp, $sp, 32			; MIPS32R5EB-NEXT: addiu $sp, $sp, 32
	; MIPS32R5EB-NEXT: jr $ra			; MIPS32R5EB-NEXT: jr $ra
	; MIPS32R5EB-NEXT: nop			; MIPS32R5EB-NEXT: nop
	;			;
	; MIPS64R5EB-LABEL: call_i8_2:			; MIPS64R5EB-LABEL: call_i8_2:
	; MIPS64R5EB: # %bb.0: # %entry			; MIPS64R5EB: # %bb.0: # %entry
	; MIPS64R5EB-NEXT: daddiu $sp, $sp, -48			; MIPS64R5EB-NEXT: daddiu $sp, $sp, -64
	; MIPS64R5EB-NEXT: .cfi_def_cfa_offset 48			; MIPS64R5EB-NEXT: .cfi_def_cfa_offset 64
	; MIPS64R5EB-NEXT: sd $ra, 40($sp) # 8-byte Folded Spill			; MIPS64R5EB-NEXT: sd $ra, 56($sp) # 8-byte Folded Spill
	; MIPS64R5EB-NEXT: sd $gp, 32($sp) # 8-byte Folded Spill			; MIPS64R5EB-NEXT: sd $gp, 48($sp) # 8-byte Folded Spill
	; MIPS64R5EB-NEXT: .cfi_offset 31, -8			; MIPS64R5EB-NEXT: .cfi_offset 31, -8
	; MIPS64R5EB-NEXT: .cfi_offset 28, -16			; MIPS64R5EB-NEXT: .cfi_offset 28, -16
	; MIPS64R5EB-NEXT: lui $1, %hi(%neg(%gp_rel(call_i8_2)))			; MIPS64R5EB-NEXT: lui $1, %hi(%neg(%gp_rel(call_i8_2)))
	; MIPS64R5EB-NEXT: daddu $1, $1, $25			; MIPS64R5EB-NEXT: daddu $1, $1, $25
	; MIPS64R5EB-NEXT: daddiu $gp, $1, %lo(%neg(%gp_rel(call_i8_2)))			; MIPS64R5EB-NEXT: daddiu $gp, $1, %lo(%neg(%gp_rel(call_i8_2)))
	; MIPS64R5EB-NEXT: addiu $1, $zero, 1543			; MIPS64R5EB-NEXT: addiu $1, $zero, 1543
	; MIPS64R5EB-NEXT: sh $1, 24($sp)			; MIPS64R5EB-NEXT: sh $1, 40($sp)
	; MIPS64R5EB-NEXT: addiu $1, $zero, 3080			; MIPS64R5EB-NEXT: addiu $1, $zero, 3080
	; MIPS64R5EB-NEXT: sh $1, 28($sp)			; MIPS64R5EB-NEXT: sh $1, 44($sp)
	; MIPS64R5EB-NEXT: ld $25, %call16(i8_2)($gp)			; MIPS64R5EB-NEXT: ld $25, %call16(i8_2)($gp)
	; MIPS64R5EB-NEXT: lh $4, 24($sp)			; MIPS64R5EB-NEXT: lh $4, 40($sp)
	; MIPS64R5EB-NEXT: lh $5, 28($sp)			; MIPS64R5EB-NEXT: lh $5, 44($sp)
	; MIPS64R5EB-NEXT: jalr $25			; MIPS64R5EB-NEXT: jalr $25
	; MIPS64R5EB-NEXT: nop			; MIPS64R5EB-NEXT: nop
	; MIPS64R5EB-NEXT: sd $2, 16($sp)			; MIPS64R5EB-NEXT: sd $2, 32($sp)
	; MIPS64R5EB-NEXT: ldi.b $w0, 0			; MIPS64R5EB-NEXT: lbu $1, 33($sp)
	; MIPS64R5EB-NEXT: lbu $1, 16($sp)			; MIPS64R5EB-NEXT: sh $1, 2($sp)
	; MIPS64R5EB-NEXT: insert.h $w0[0], $1			; MIPS64R5EB-NEXT: lbu $1, 32($sp)
	; MIPS64R5EB-NEXT: lbu $1, 17($sp)			; MIPS64R5EB-NEXT: sh $1, 0($sp)
	; MIPS64R5EB-NEXT: insert.h $w0[1], $1			; MIPS64R5EB-NEXT: ld.h $w0, 0($sp)
	; MIPS64R5EB-NEXT: lbu $1, 18($sp)
	; MIPS64R5EB-NEXT: insert.h $w0[2], $1
	; MIPS64R5EB-NEXT: lbu $1, 19($sp)
	; MIPS64R5EB-NEXT: insert.h $w0[3], $1
	; MIPS64R5EB-NEXT: lbu $1, 20($sp)
	; MIPS64R5EB-NEXT: insert.h $w0[4], $1
	; MIPS64R5EB-NEXT: lbu $1, 21($sp)
	; MIPS64R5EB-NEXT: insert.h $w0[5], $1
	; MIPS64R5EB-NEXT: lbu $1, 23($sp)
	; MIPS64R5EB-NEXT: lbu $2, 22($sp)
	; MIPS64R5EB-NEXT: insert.h $w0[6], $2
	; MIPS64R5EB-NEXT: insert.h $w0[7], $1
	; MIPS64R5EB-NEXT: copy_s.h $1, $w0[0]			; MIPS64R5EB-NEXT: copy_s.h $1, $w0[0]
	; MIPS64R5EB-NEXT: copy_s.h $2, $w0[1]			; MIPS64R5EB-NEXT: copy_s.h $2, $w0[1]
	; MIPS64R5EB-NEXT: sw $2, 12($sp)			; MIPS64R5EB-NEXT: sw $2, 28($sp)
	; MIPS64R5EB-NEXT: sw $1, 4($sp)			; MIPS64R5EB-NEXT: sw $1, 20($sp)
	; MIPS64R5EB-NEXT: ld.d $w0, 0($sp)			; MIPS64R5EB-NEXT: ld.d $w0, 16($sp)
	; MIPS64R5EB-NEXT: copy_s.d $1, $w0[0]			; MIPS64R5EB-NEXT: copy_s.d $1, $w0[0]
	; MIPS64R5EB-NEXT: copy_s.d $2, $w0[1]			; MIPS64R5EB-NEXT: copy_s.d $2, $w0[1]
	; MIPS64R5EB-NEXT: ld $3, %got_disp(gv2i8)($gp)			; MIPS64R5EB-NEXT: ld $3, %got_disp(gv2i8)($gp)
	; MIPS64R5EB-NEXT: sb $2, 1($3)			; MIPS64R5EB-NEXT: sb $2, 1($3)
	; MIPS64R5EB-NEXT: sb $1, 0($3)			; MIPS64R5EB-NEXT: sb $1, 0($3)
	; MIPS64R5EB-NEXT: ld $gp, 32($sp) # 8-byte Folded Reload			; MIPS64R5EB-NEXT: ld $gp, 48($sp) # 8-byte Folded Reload
	; MIPS64R5EB-NEXT: ld $ra, 40($sp) # 8-byte Folded Reload			; MIPS64R5EB-NEXT: ld $ra, 56($sp) # 8-byte Folded Reload
	; MIPS64R5EB-NEXT: daddiu $sp, $sp, 48			; MIPS64R5EB-NEXT: daddiu $sp, $sp, 64
	; MIPS64R5EB-NEXT: jr $ra			; MIPS64R5EB-NEXT: jr $ra
	; MIPS64R5EB-NEXT: nop			; MIPS64R5EB-NEXT: nop
	;			;
	; MIPS32EL-LABEL: call_i8_2:			; MIPS32EL-LABEL: call_i8_2:
	; MIPS32EL: # %bb.0: # %entry			; MIPS32EL: # %bb.0: # %entry
	; MIPS32EL-NEXT: addiu $sp, $sp, -24			; MIPS32EL-NEXT: addiu $sp, $sp, -24
	; MIPS32EL-NEXT: .cfi_def_cfa_offset 24			; MIPS32EL-NEXT: .cfi_def_cfa_offset 24
	; MIPS32EL-NEXT: sw $ra, 20($sp) # 4-byte Folded Spill			; MIPS32EL-NEXT: sw $ra, 20($sp) # 4-byte Folded Spill
	▲ Show 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; MIPS32R5EL-NEXT: sh $2, %lo(gv2i8)($1)			; MIPS32R5EL-NEXT: sh $2, %lo(gv2i8)($1)
	; MIPS32R5EL-NEXT: lw $ra, 28($sp) # 4-byte Folded Reload			; MIPS32R5EL-NEXT: lw $ra, 28($sp) # 4-byte Folded Reload
	; MIPS32R5EL-NEXT: addiu $sp, $sp, 32			; MIPS32R5EL-NEXT: addiu $sp, $sp, 32
	; MIPS32R5EL-NEXT: jr $ra			; MIPS32R5EL-NEXT: jr $ra
	; MIPS32R5EL-NEXT: nop			; MIPS32R5EL-NEXT: nop
	;			;
	; MIPS64R5EL-LABEL: call_i8_2:			; MIPS64R5EL-LABEL: call_i8_2:
	; MIPS64R5EL: # %bb.0: # %entry			; MIPS64R5EL: # %bb.0: # %entry
	; MIPS64R5EL-NEXT: daddiu $sp, $sp, -48			; MIPS64R5EL-NEXT: daddiu $sp, $sp, -64
	; MIPS64R5EL-NEXT: .cfi_def_cfa_offset 48			; MIPS64R5EL-NEXT: .cfi_def_cfa_offset 64
	; MIPS64R5EL-NEXT: sd $ra, 40($sp) # 8-byte Folded Spill			; MIPS64R5EL-NEXT: sd $ra, 56($sp) # 8-byte Folded Spill
	; MIPS64R5EL-NEXT: sd $gp, 32($sp) # 8-byte Folded Spill			; MIPS64R5EL-NEXT: sd $gp, 48($sp) # 8-byte Folded Spill
	; MIPS64R5EL-NEXT: .cfi_offset 31, -8			; MIPS64R5EL-NEXT: .cfi_offset 31, -8
	; MIPS64R5EL-NEXT: .cfi_offset 28, -16			; MIPS64R5EL-NEXT: .cfi_offset 28, -16
	; MIPS64R5EL-NEXT: lui $1, %hi(%neg(%gp_rel(call_i8_2)))			; MIPS64R5EL-NEXT: lui $1, %hi(%neg(%gp_rel(call_i8_2)))
	; MIPS64R5EL-NEXT: daddu $1, $1, $25			; MIPS64R5EL-NEXT: daddu $1, $1, $25
	; MIPS64R5EL-NEXT: daddiu $gp, $1, %lo(%neg(%gp_rel(call_i8_2)))			; MIPS64R5EL-NEXT: daddiu $gp, $1, %lo(%neg(%gp_rel(call_i8_2)))
	; MIPS64R5EL-NEXT: addiu $1, $zero, 1798			; MIPS64R5EL-NEXT: addiu $1, $zero, 1798
	; MIPS64R5EL-NEXT: sh $1, 24($sp)			; MIPS64R5EL-NEXT: sh $1, 40($sp)
	; MIPS64R5EL-NEXT: addiu $1, $zero, 2060			; MIPS64R5EL-NEXT: addiu $1, $zero, 2060
	; MIPS64R5EL-NEXT: sh $1, 28($sp)			; MIPS64R5EL-NEXT: sh $1, 44($sp)
	; MIPS64R5EL-NEXT: ld $25, %call16(i8_2)($gp)			; MIPS64R5EL-NEXT: ld $25, %call16(i8_2)($gp)
	; MIPS64R5EL-NEXT: lh $4, 24($sp)			; MIPS64R5EL-NEXT: lh $4, 40($sp)
	; MIPS64R5EL-NEXT: lh $5, 28($sp)			; MIPS64R5EL-NEXT: lh $5, 44($sp)
	; MIPS64R5EL-NEXT: jalr $25			; MIPS64R5EL-NEXT: jalr $25
	; MIPS64R5EL-NEXT: nop			; MIPS64R5EL-NEXT: nop
	; MIPS64R5EL-NEXT: sd $2, 16($sp)			; MIPS64R5EL-NEXT: sd $2, 32($sp)
	; MIPS64R5EL-NEXT: ldi.b $w0, 0			; MIPS64R5EL-NEXT: lbu $1, 33($sp)
	; MIPS64R5EL-NEXT: lbu $1, 16($sp)			; MIPS64R5EL-NEXT: sh $1, 2($sp)
	; MIPS64R5EL-NEXT: insert.h $w0[0], $1			; MIPS64R5EL-NEXT: lbu $1, 32($sp)
	; MIPS64R5EL-NEXT: lbu $1, 17($sp)			; MIPS64R5EL-NEXT: sh $1, 0($sp)
	; MIPS64R5EL-NEXT: insert.h $w0[1], $1			; MIPS64R5EL-NEXT: ld.h $w0, 0($sp)
	; MIPS64R5EL-NEXT: lbu $1, 18($sp)
	; MIPS64R5EL-NEXT: insert.h $w0[2], $1
	; MIPS64R5EL-NEXT: lbu $1, 19($sp)
	; MIPS64R5EL-NEXT: insert.h $w0[3], $1
	; MIPS64R5EL-NEXT: lbu $1, 20($sp)
	; MIPS64R5EL-NEXT: insert.h $w0[4], $1
	; MIPS64R5EL-NEXT: lbu $1, 21($sp)
	; MIPS64R5EL-NEXT: insert.h $w0[5], $1
	; MIPS64R5EL-NEXT: lbu $1, 23($sp)
	; MIPS64R5EL-NEXT: lbu $2, 22($sp)
	; MIPS64R5EL-NEXT: insert.h $w0[6], $2
	; MIPS64R5EL-NEXT: insert.h $w0[7], $1
	; MIPS64R5EL-NEXT: copy_s.h $1, $w0[0]			; MIPS64R5EL-NEXT: copy_s.h $1, $w0[0]
	; MIPS64R5EL-NEXT: copy_s.h $2, $w0[1]			; MIPS64R5EL-NEXT: copy_s.h $2, $w0[1]
	; MIPS64R5EL-NEXT: sw $2, 8($sp)			; MIPS64R5EL-NEXT: sw $2, 24($sp)
	; MIPS64R5EL-NEXT: sw $1, 0($sp)			; MIPS64R5EL-NEXT: sw $1, 16($sp)
	; MIPS64R5EL-NEXT: ld.d $w0, 0($sp)			; MIPS64R5EL-NEXT: ld.d $w0, 16($sp)
	; MIPS64R5EL-NEXT: copy_s.d $1, $w0[0]			; MIPS64R5EL-NEXT: copy_s.d $1, $w0[0]
	; MIPS64R5EL-NEXT: copy_s.d $2, $w0[1]			; MIPS64R5EL-NEXT: copy_s.d $2, $w0[1]
	; MIPS64R5EL-NEXT: ld $3, %got_disp(gv2i8)($gp)			; MIPS64R5EL-NEXT: ld $3, %got_disp(gv2i8)($gp)
	; MIPS64R5EL-NEXT: sb $2, 1($3)			; MIPS64R5EL-NEXT: sb $2, 1($3)
	; MIPS64R5EL-NEXT: sb $1, 0($3)			; MIPS64R5EL-NEXT: sb $1, 0($3)
	; MIPS64R5EL-NEXT: ld $gp, 32($sp) # 8-byte Folded Reload			; MIPS64R5EL-NEXT: ld $gp, 48($sp) # 8-byte Folded Reload
	; MIPS64R5EL-NEXT: ld $ra, 40($sp) # 8-byte Folded Reload			; MIPS64R5EL-NEXT: ld $ra, 56($sp) # 8-byte Folded Reload
	; MIPS64R5EL-NEXT: daddiu $sp, $sp, 48			; MIPS64R5EL-NEXT: daddiu $sp, $sp, 64
	; MIPS64R5EL-NEXT: jr $ra			; MIPS64R5EL-NEXT: jr $ra
	; MIPS64R5EL-NEXT: nop			; MIPS64R5EL-NEXT: nop
	entry:			entry:
	%0 = call <2 x i8> @i8_2(<2 x i8> <i8 6, i8 7>, <2 x i8> <i8 12, i8 8>)			%0 = call <2 x i8> @i8_2(<2 x i8> <i8 6, i8 7>, <2 x i8> <i8 12, i8 8>)
	store <2 x i8> %0, <2 x i8> * @gv2i8			store <2 x i8> %0, <2 x i8> * @gv2i8
	ret void			ret void
	}			}

	▲ Show 20 Lines • Show All 3,134 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/dagcombine-cse.ll

	Show All 25 Lines
	; X64-NEXT: cltq			; X64-NEXT: cltq
	; X64-NEXT: movl (%rdi,%rax), %eax			; X64-NEXT: movl (%rdi,%rax), %eax
	; X64-NEXT: leal 4(%rsi,%rdx), %ecx			; X64-NEXT: leal 4(%rsi,%rdx), %ecx
	; X64-NEXT: movslq %ecx, %rcx			; X64-NEXT: movslq %ecx, %rcx
	; X64-NEXT: movzwl (%rdi,%rcx), %ecx			; X64-NEXT: movzwl (%rdi,%rcx), %ecx
	; X64-NEXT: shlq $32, %rcx			; X64-NEXT: shlq $32, %rcx
	; X64-NEXT: orq %rax, %rcx			; X64-NEXT: orq %rax, %rcx
	; X64-NEXT: movq %rcx, %xmm0			; X64-NEXT: movq %rcx, %xmm0
	; X64-NEXT: movq {{.*#+}} xmm0 = xmm0[0],zero
	; X64-NEXT: pshuflw {{.*#+}} xmm0 = xmm0[0,1,1,2,4,5,6,7]			; X64-NEXT: pshuflw {{.*#+}} xmm0 = xmm0[0,1,1,2,4,5,6,7]
	; X64-NEXT: movd %xmm0, %eax			; X64-NEXT: movd %xmm0, %eax
	; X64-NEXT: retq			; X64-NEXT: retq
	entry:			entry:
	%tmp7 = mul i32 %idxY, %ref_frame_stride ; <i32> [#uses=2]			%tmp7 = mul i32 %idxY, %ref_frame_stride ; <i32> [#uses=2]
	%tmp9 = add i32 %tmp7, %idxX ; <i32> [#uses=1]			%tmp9 = add i32 %tmp7, %idxX ; <i32> [#uses=1]
	%tmp11 = getelementptr i8, i8* %ref_frame_ptr, i32 %tmp9 ; <i8*> [#uses=1]			%tmp11 = getelementptr i8, i8* %ref_frame_ptr, i32 %tmp9 ; <i8*> [#uses=1]
	%tmp1112 = bitcast i8* %tmp11 to i32* ; <i32*> [#uses=1]			%tmp1112 = bitcast i8* %tmp11 to i32* ; <i32*> [#uses=1]
	Show All 19 Lines

llvm/trunk/test/CodeGen/X86/extractelement-load.ll

	Show First 20 Lines • Show All 79 Lines • ▼ Show 20 Lines
	; Case where a load is unary shuffled, then bitcast (to a type with the same			; Case where a load is unary shuffled, then bitcast (to a type with the same
	; number of elements) before extractelement.			; number of elements) before extractelement.
	; This is testing for an assertion - the extraction was assuming that the undef			; This is testing for an assertion - the extraction was assuming that the undef
	; second shuffle operand was a post-bitcast type instead of a pre-bitcast type.			; second shuffle operand was a post-bitcast type instead of a pre-bitcast type.
	define i64 @t4(<2 x double>* %a) {			define i64 @t4(<2 x double>* %a) {
	; X32-SSE2-LABEL: t4:			; X32-SSE2-LABEL: t4:
	; X32-SSE2: # %bb.0:			; X32-SSE2: # %bb.0:
	; X32-SSE2-NEXT: movl {{[0-9]+}}(%esp), %eax			; X32-SSE2-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X32-SSE2-NEXT: movapd (%eax), %xmm0			; X32-SSE2-NEXT: movhps {{.*#+}} xmm0 = xmm0[0,1],mem[0,1]
	; X32-SSE2-NEXT: shufpd {{.*#+}} xmm0 = xmm0[1,0]
	; X32-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]			; X32-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
	; X32-SSE2-NEXT: movd %xmm1, %eax			; X32-SSE2-NEXT: movd %xmm1, %eax
	; X32-SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; X32-SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; X32-SSE2-NEXT: movd %xmm0, %edx			; X32-SSE2-NEXT: movd %xmm0, %edx
	; X32-SSE2-NEXT: retl			; X32-SSE2-NEXT: retl
	;			;
	; X64-SSSE3-LABEL: t4:			; X64-SSSE3-LABEL: t4:
	; X64-SSSE3: # %bb.0:			; X64-SSSE3: # %bb.0:
	Show All 14 Lines

llvm/trunk/test/CodeGen/X86/known-bits-vector.ll

Show All 18 Lines	; X64-NEXT: retq
%3 = sext i16 %2 to i32		%3 = sext i16 %2 to i32
ret i32 %3		ret i32 %3
}		}

define float @knownbits_mask_extract_uitofp(<2 x i64> %a0) nounwind {		define float @knownbits_mask_extract_uitofp(<2 x i64> %a0) nounwind {
; X32-LABEL: knownbits_mask_extract_uitofp:		; X32-LABEL: knownbits_mask_extract_uitofp:
; X32: # %bb.0:		; X32: # %bb.0:
; X32-NEXT: pushl %eax		; X32-NEXT: pushl %eax
; X32-NEXT: vpxor %xmm1, %xmm1, %xmm1		; X32-NEXT: vpmovzxwq {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero
; X32-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0],xmm1[1,2,3],xmm0[4,5,6,7]
; X32-NEXT: vmovd %xmm0, %eax		; X32-NEXT: vmovd %xmm0, %eax
; X32-NEXT: vcvtsi2ssl %eax, %xmm2, %xmm0		; X32-NEXT: vcvtsi2ssl %eax, %xmm1, %xmm0
; X32-NEXT: vmovss %xmm0, (%esp)		; X32-NEXT: vmovss %xmm0, (%esp)
; X32-NEXT: flds (%esp)		; X32-NEXT: flds (%esp)
; X32-NEXT: popl %eax		; X32-NEXT: popl %eax
; X32-NEXT: retl		; X32-NEXT: retl
;		;
; X64-LABEL: knownbits_mask_extract_uitofp:		; X64-LABEL: knownbits_mask_extract_uitofp:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: vpxor %xmm1, %xmm1, %xmm1		; X64-NEXT: vpmovzxwq {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero
; X64-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0],xmm1[1,2,3],xmm0[4,5,6,7]
; X64-NEXT: vmovq %xmm0, %rax		; X64-NEXT: vmovq %xmm0, %rax
; X64-NEXT: vcvtsi2ssl %eax, %xmm2, %xmm0		; X64-NEXT: vcvtsi2ssl %eax, %xmm1, %xmm0
; X64-NEXT: retq		; X64-NEXT: retq
%1 = and <2 x i64> %a0, <i64 65535, i64 -1>		%1 = and <2 x i64> %a0, <i64 65535, i64 -1>
%2 = extractelement <2 x i64> %1, i32 0		%2 = extractelement <2 x i64> %1, i32 0
%3 = uitofp i64 %2 to float		%3 = uitofp i64 %2 to float
ret float %3		ret float %3
}		}

define <4 x float> @knownbits_insert_uitofp(<4 x i32> %a0, i16 %a1, i16 %a2) nounwind {		define <4 x float> @knownbits_insert_uitofp(<4 x i32> %a0, i16 %a1, i16 %a2) nounwind {
▲ Show 20 Lines • Show All 631 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/oddshuffles.ll

Show First 20 Lines • Show All 62 Lines • ▼ Show 20 Lines	; XOP-NEXT: retq
%r = shufflevector <2 x double> %a, <2 x double> %b, <3 x i32> <i32 0, i32 2, i32 1>		%r = shufflevector <2 x double> %a, <2 x double> %b, <3 x i32> <i32 0, i32 2, i32 1>
store <3 x double> %r, <3 x double>* %p		store <3 x double> %r, <3 x double>* %p
ret void		ret void
}		}

define void @v3i32(<2 x i32> %a, <2 x i32> %b, <3 x i32>* %p) nounwind {		define void @v3i32(<2 x i32> %a, <2 x i32> %b, <3 x i32>* %p) nounwind {
; SSE2-LABEL: v3i32:		; SSE2-LABEL: v3i32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm0[0,2,2,3]		; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,0,1]
; SSE2-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1]		; SSE2-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm0[2,3,0,1]		; SSE2-NEXT: movd %xmm2, 8(%rdi)
; SSE2-NEXT: movd %xmm0, 8(%rdi)		; SSE2-NEXT: movq %xmm0, (%rdi)
; SSE2-NEXT: movq %xmm2, (%rdi)
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE42-LABEL: v3i32:		; SSE42-LABEL: v3i32:
; SSE42: # %bb.0:		; SSE42: # %bb.0:
; SSE42-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,0,1,1]		; SSE42-NEXT: extractps $2, %xmm0, 8(%rdi)
; SSE42-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0,1],xmm1[2,3],xmm0[4,5,6,7]		; SSE42-NEXT: unpcklps {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
; SSE42-NEXT: pextrd $2, %xmm0, 8(%rdi)		; SSE42-NEXT: movlps %xmm0, (%rdi)
; SSE42-NEXT: movq %xmm1, (%rdi)
; SSE42-NEXT: retq		; SSE42-NEXT: retq
;		;
; AVX1-LABEL: v3i32:		; AVX-LABEL: v3i32:
; AVX1: # %bb.0:		; AVX: # %bb.0:
; AVX1-NEXT: vpermilps {{.*#+}} xmm1 = xmm1[0,0,1,1]		; AVX-NEXT: vunpcklps {{.*#+}} xmm1 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
; AVX1-NEXT: vblendps {{.*#+}} xmm1 = xmm0[0],xmm1[1],xmm0[2,3]		; AVX-NEXT: vextractps $2, %xmm0, 8(%rdi)
; AVX1-NEXT: vextractps $2, %xmm0, 8(%rdi)		; AVX-NEXT: vmovlps %xmm1, (%rdi)
; AVX1-NEXT: vmovlps %xmm1, (%rdi)		; AVX-NEXT: retq
; AVX1-NEXT: retq
;
; AVX2-LABEL: v3i32:
; AVX2: # %bb.0:
; AVX2-NEXT: vbroadcastss %xmm1, %xmm1
; AVX2-NEXT: vblendps {{.*#+}} xmm1 = xmm0[0],xmm1[1],xmm0[2,3]
; AVX2-NEXT: vextractps $2, %xmm0, 8(%rdi)
; AVX2-NEXT: vmovlps %xmm1, (%rdi)
; AVX2-NEXT: retq
;		;
; XOP-LABEL: v3i32:		; XOP-LABEL: v3i32:
; XOP: # %bb.0:		; XOP: # %bb.0:
; XOP-NEXT: vpermilps {{.*#+}} xmm1 = xmm1[0,0,1,1]		; XOP-NEXT: vunpcklps {{.*#+}} xmm1 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
; XOP-NEXT: vblendps {{.*#+}} xmm1 = xmm0[0],xmm1[1],xmm0[2,3]
; XOP-NEXT: vextractps $2, %xmm0, 8(%rdi)		; XOP-NEXT: vextractps $2, %xmm0, 8(%rdi)
; XOP-NEXT: vmovlps %xmm1, (%rdi)		; XOP-NEXT: vmovlps %xmm1, (%rdi)
; XOP-NEXT: retq		; XOP-NEXT: retq
%r = shufflevector <2 x i32> %a, <2 x i32> %b, <3 x i32> <i32 0, i32 2, i32 1>		%r = shufflevector <2 x i32> %a, <2 x i32> %b, <3 x i32> <i32 0, i32 2, i32 1>
store <3 x i32> %r, <3 x i32>* %p		store <3 x i32> %r, <3 x i32>* %p
ret void		ret void
}		}

define void @v5i16(<4 x i16> %a, <4 x i16> %b, <5 x i16>* %p) nounwind {		define void @v5i16(<4 x i16> %a, <4 x i16> %b, <5 x i16>* %p) nounwind {
; SSE2-LABEL: v5i16:		; SSE2-LABEL: v5i16:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
		; SSE2-NEXT: pshuflw {{.*#+}} xmm2 = xmm0[0,2,2,3,4,5,6,7]
; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[2,1,2,3]		; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[2,1,2,3]
; SSE2-NEXT: pshuflw {{.*#+}} xmm1 = xmm1[2,0,2,3,4,5,6,7]		; SSE2-NEXT: pshuflw {{.*#+}} xmm1 = xmm1[2,0,2,3,4,5,6,7]
; SSE2-NEXT: pshuflw {{.*#+}} xmm2 = xmm0[0,2,2,3,4,5,6,7]
; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,3,2,3]
; SSE2-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1],xmm2[2],xmm1[2],xmm2[3],xmm1[3]		; SSE2-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1],xmm2[2],xmm1[2],xmm2[3],xmm1[3]
; SSE2-NEXT: pextrw $6, %xmm0, %eax		; SSE2-NEXT: pextrw $6, %xmm0, %eax
; SSE2-NEXT: movw %ax, 8(%rdi)		; SSE2-NEXT: movw %ax, 8(%rdi)
; SSE2-NEXT: movq %xmm2, (%rdi)		; SSE2-NEXT: movq %xmm2, (%rdi)
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE42-LABEL: v5i16:		; SSE42-LABEL: v5i16:
; SSE42: # %bb.0:		; SSE42: # %bb.0:
		; SSE42-NEXT: pshuflw {{.*#+}} xmm2 = xmm0[0,2,2,3,4,5,6,7]
; SSE42-NEXT: pshufd {{.*#+}} xmm1 = xmm1[2,1,2,3]		; SSE42-NEXT: pshufd {{.*#+}} xmm1 = xmm1[2,1,2,3]
; SSE42-NEXT: pshuflw {{.*#+}} xmm1 = xmm1[2,0,2,3,4,5,6,7]		; SSE42-NEXT: pshuflw {{.*#+}} xmm1 = xmm1[2,0,2,3,4,5,6,7]
; SSE42-NEXT: pshuflw {{.*#+}} xmm2 = xmm0[0,2,2,3,4,5,6,7]
; SSE42-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,3,2,3]
; SSE42-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1],xmm2[2],xmm1[2],xmm2[3],xmm1[3]		; SSE42-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1],xmm2[2],xmm1[2],xmm2[3],xmm1[3]
; SSE42-NEXT: pextrw $6, %xmm0, 8(%rdi)		; SSE42-NEXT: pextrw $6, %xmm0, 8(%rdi)
; SSE42-NEXT: movq %xmm2, (%rdi)		; SSE42-NEXT: movq %xmm2, (%rdi)
; SSE42-NEXT: retq		; SSE42-NEXT: retq
;		;
; AVX1-LABEL: v5i16:		; AVX1-LABEL: v5i16:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
		; AVX1-NEXT: vpshuflw {{.*#+}} xmm2 = xmm0[0,2,2,3,4,5,6,7]
; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm1[2,1,2,3]		; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm1[2,1,2,3]
; AVX1-NEXT: vpshuflw {{.*#+}} xmm1 = xmm1[2,0,2,3,4,5,6,7]		; AVX1-NEXT: vpshuflw {{.*#+}} xmm1 = xmm1[2,0,2,3,4,5,6,7]
; AVX1-NEXT: vpshuflw {{.*#+}} xmm2 = xmm0[0,2,2,3,4,5,6,7]
; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm2[0,3,2,3]
; AVX1-NEXT: vpunpcklwd {{.*#+}} xmm1 = xmm2[0],xmm1[0],xmm2[1],xmm1[1],xmm2[2],xmm1[2],xmm2[3],xmm1[3]		; AVX1-NEXT: vpunpcklwd {{.*#+}} xmm1 = xmm2[0],xmm1[0],xmm2[1],xmm1[1],xmm2[2],xmm1[2],xmm2[3],xmm1[3]
; AVX1-NEXT: vpextrw $6, %xmm0, 8(%rdi)		; AVX1-NEXT: vpextrw $6, %xmm0, 8(%rdi)
; AVX1-NEXT: vmovq %xmm1, (%rdi)		; AVX1-NEXT: vmovq %xmm1, (%rdi)
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-SLOW-LABEL: v5i16:		; AVX2-SLOW-LABEL: v5i16:
; AVX2-SLOW: # %bb.0:		; AVX2-SLOW: # %bb.0:
		; AVX2-SLOW-NEXT: vpshuflw {{.*#+}} xmm2 = xmm0[0,2,2,3,4,5,6,7]
; AVX2-SLOW-NEXT: vpshufd {{.*#+}} xmm1 = xmm1[2,1,2,3]		; AVX2-SLOW-NEXT: vpshufd {{.*#+}} xmm1 = xmm1[2,1,2,3]
; AVX2-SLOW-NEXT: vpshuflw {{.*#+}} xmm1 = xmm1[2,0,2,3,4,5,6,7]		; AVX2-SLOW-NEXT: vpshuflw {{.*#+}} xmm1 = xmm1[2,0,2,3,4,5,6,7]
; AVX2-SLOW-NEXT: vpshuflw {{.*#+}} xmm2 = xmm0[0,2,2,3,4,5,6,7]
; AVX2-SLOW-NEXT: vpshufd {{.*#+}} xmm2 = xmm2[0,3,2,3]
; AVX2-SLOW-NEXT: vpunpcklwd {{.*#+}} xmm1 = xmm2[0],xmm1[0],xmm2[1],xmm1[1],xmm2[2],xmm1[2],xmm2[3],xmm1[3]		; AVX2-SLOW-NEXT: vpunpcklwd {{.*#+}} xmm1 = xmm2[0],xmm1[0],xmm2[1],xmm1[1],xmm2[2],xmm1[2],xmm2[3],xmm1[3]
; AVX2-SLOW-NEXT: vpextrw $6, %xmm0, 8(%rdi)		; AVX2-SLOW-NEXT: vpextrw $6, %xmm0, 8(%rdi)
; AVX2-SLOW-NEXT: vmovq %xmm1, (%rdi)		; AVX2-SLOW-NEXT: vmovq %xmm1, (%rdi)
; AVX2-SLOW-NEXT: retq		; AVX2-SLOW-NEXT: retq
;		;
; AVX2-FAST-LABEL: v5i16:		; AVX2-FAST-LABEL: v5i16:
; AVX2-FAST: # %bb.0:		; AVX2-FAST: # %bb.0:
; AVX2-FAST-NEXT: vpshufb {{.*#+}} xmm1 = xmm1[4,5,8,9,4,5,6,7,8,9,10,11,12,13,14,15]		; AVX2-FAST-NEXT: vpshufb {{.*#+}} xmm1 = xmm1[4,5,8,9,4,5,6,7,8,9,10,11,12,13,14,15]
; AVX2-FAST-NEXT: vpshufb {{.*#+}} xmm2 = xmm0[0,1,4,5,12,13,14,15,8,9,10,11,12,13,14,15]		; AVX2-FAST-NEXT: vpshuflw {{.*#+}} xmm2 = xmm0[0,2,2,3,4,5,6,7]
; AVX2-FAST-NEXT: vpunpcklwd {{.*#+}} xmm1 = xmm2[0],xmm1[0],xmm2[1],xmm1[1],xmm2[2],xmm1[2],xmm2[3],xmm1[3]		; AVX2-FAST-NEXT: vpunpcklwd {{.*#+}} xmm1 = xmm2[0],xmm1[0],xmm2[1],xmm1[1],xmm2[2],xmm1[2],xmm2[3],xmm1[3]
; AVX2-FAST-NEXT: vpextrw $6, %xmm0, 8(%rdi)		; AVX2-FAST-NEXT: vpextrw $6, %xmm0, 8(%rdi)
; AVX2-FAST-NEXT: vmovq %xmm1, (%rdi)		; AVX2-FAST-NEXT: vmovq %xmm1, (%rdi)
; AVX2-FAST-NEXT: retq		; AVX2-FAST-NEXT: retq
;		;
; XOP-LABEL: v5i16:		; XOP-LABEL: v5i16:
; XOP: # %bb.0:		; XOP: # %bb.0:
; XOP-NEXT: vpperm {{.*#+}} xmm1 = xmm0[0,1],xmm1[4,5],xmm0[4,5],xmm1[8,9],xmm0[12,13],xmm1[4,5],xmm0[14,15],xmm1[6,7]		; XOP-NEXT: vpperm {{.*#+}} xmm1 = xmm0[0,1],xmm1[4,5],xmm0[4,5],xmm1[8,9],xmm0[4,5],xmm1[4,5],xmm0[6,7],xmm1[6,7]
; XOP-NEXT: vpextrw $6, %xmm0, 8(%rdi)		; XOP-NEXT: vpextrw $6, %xmm0, 8(%rdi)
; XOP-NEXT: vmovq %xmm1, (%rdi)		; XOP-NEXT: vmovq %xmm1, (%rdi)
; XOP-NEXT: retq		; XOP-NEXT: retq
%r = shufflevector <4 x i16> %a, <4 x i16> %b, <5 x i32> <i32 0, i32 5, i32 1, i32 6, i32 3>		%r = shufflevector <4 x i16> %a, <4 x i16> %b, <5 x i32> <i32 0, i32 5, i32 1, i32 6, i32 3>
store <5 x i16> %r, <5 x i16>* %p		store <5 x i16> %r, <5 x i16>* %p
ret void		ret void
}		}

▲ Show 20 Lines • Show All 192 Lines • ▼ Show 20 Lines


define void @v7i32(<4 x i32> %a, <4 x i32> %b, <7 x i32>* %p) nounwind {		define void @v7i32(<4 x i32> %a, <4 x i32> %b, <7 x i32>* %p) nounwind {
; SSE2-LABEL: v7i32:		; SSE2-LABEL: v7i32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,1,2,2]		; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,1,2,2]
; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm0[0,1,0,3]		; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm0[0,1,0,3]
; SSE2-NEXT: punpckhdq {{.*#+}} xmm3 = xmm3[2],xmm2[2],xmm3[3],xmm2[3]		; SSE2-NEXT: punpckhdq {{.*#+}} xmm3 = xmm3[2],xmm2[2],xmm3[3],xmm2[3]
; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,0],xmm1[3,0]		; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm1[3,1,2,3]
; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,2],xmm1[0,3]		; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,2,3]
		; SSE2-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]
; SSE2-NEXT: movd %xmm1, 24(%rdi)		; SSE2-NEXT: movd %xmm1, 24(%rdi)
; SSE2-NEXT: movlps %xmm0, 16(%rdi)		; SSE2-NEXT: movq %xmm0, 16(%rdi)
; SSE2-NEXT: movdqa %xmm3, (%rdi)		; SSE2-NEXT: movdqa %xmm3, (%rdi)
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE42-LABEL: v7i32:		; SSE42-LABEL: v7i32:
; SSE42: # %bb.0:		; SSE42: # %bb.0:
; SSE42-NEXT: movdqa %xmm1, %xmm2		; SSE42-NEXT: movdqa %xmm0, %xmm2
; SSE42-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm0[2,3],xmm2[4,5,6,7]		; SSE42-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1,2,3],xmm1[4,5],xmm2[6,7]
; SSE42-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5],xmm0[6,7]		; SSE42-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,2,3,2]
; SSE42-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,2,3,2]		; SSE42-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
; SSE42-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,3,0,3]		; SSE42-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,3,2,3]
; SSE42-NEXT: movd %xmm1, 24(%rdi)		; SSE42-NEXT: movd %xmm1, 24(%rdi)
; SSE42-NEXT: movq %xmm2, 16(%rdi)		; SSE42-NEXT: movq %xmm0, 16(%rdi)
; SSE42-NEXT: movdqa %xmm0, (%rdi)		; SSE42-NEXT: movdqa %xmm2, (%rdi)
; SSE42-NEXT: retq		; SSE42-NEXT: retq
;		;
; AVX1-LABEL: v7i32:		; AVX1-LABEL: v7i32:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vblendps {{.*#+}} xmm2 = xmm0[0,1],xmm1[2],xmm0[3]		; AVX1-NEXT: vblendps {{.*#+}} xmm2 = xmm0[0,1],xmm1[2],xmm0[3]
; AVX1-NEXT: vpermilps {{.*#+}} xmm2 = xmm2[0,2,3,2]		; AVX1-NEXT: vpermilps {{.*#+}} xmm2 = xmm2[0,2,3,2]
; AVX1-NEXT: vblendps {{.*#+}} xmm0 = xmm1[0],xmm0[1],xmm1[2,3]		; AVX1-NEXT: vblendps {{.*#+}} xmm0 = xmm1[0],xmm0[1],xmm1[2,3]
; AVX1-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[1,3,0,3]		; AVX1-NEXT: vpermilps {{.*#+}} xmm0 = xmm0[1,3,0,3]
▲ Show 20 Lines • Show All 1,394 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/scalar_widen_div.ll

	Show First 20 Lines • Show All 421 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: cltd			; CHECK-NEXT: cltd
	; CHECK-NEXT: idivl %r10d			; CHECK-NEXT: idivl %r10d
	; CHECK-NEXT: movd %eax, %xmm2			; CHECK-NEXT: movd %eax, %xmm2
	; CHECK-NEXT: pinsrd $1, %r8d, %xmm2			; CHECK-NEXT: pinsrd $1, %r8d, %xmm2
	; CHECK-NEXT: pextrd $2, %xmm0, %eax			; CHECK-NEXT: pextrd $2, %xmm0, %eax
	; CHECK-NEXT: pextrd $2, %xmm1, %r8d			; CHECK-NEXT: pextrd $2, %xmm1, %r8d
	; CHECK-NEXT: cltd			; CHECK-NEXT: cltd
	; CHECK-NEXT: idivl %r8d			; CHECK-NEXT: idivl %r8d
	; CHECK-NEXT: pinsrd $2, %eax, %xmm2
	; CHECK-NEXT: movl %eax, 8(%rdi,%rcx)			; CHECK-NEXT: movl %eax, 8(%rdi,%rcx)
	; CHECK-NEXT: movq %xmm2, (%rdi,%rcx)			; CHECK-NEXT: movq %xmm2, (%rdi,%rcx)
	; CHECK-NEXT: addq $16, %rcx			; CHECK-NEXT: addq $16, %rcx
	; CHECK-NEXT: decl %r9d			; CHECK-NEXT: decl %r9d
	; CHECK-NEXT: jne .LBB12_2			; CHECK-NEXT: jne .LBB12_2
	; CHECK-NEXT: .LBB12_3: # %for.end			; CHECK-NEXT: .LBB12_3: # %for.end
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	Show All 21 Lines

llvm/trunk/test/CodeGen/X86/vec_shift7.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=i686-unknown -mattr=+sse2 \| FileCheck %s --check-prefix=X32			; RUN: llc < %s -mtriple=i686-unknown -mattr=+sse2 \| FileCheck %s --check-prefix=X32
	; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+sse2 \| FileCheck %s --check-prefix=X64			; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+sse2 \| FileCheck %s --check-prefix=X64

	; Verify that we don't fail when shift by zero is encountered.			; Verify that we don't fail when shift by zero is encountered.

	define i64 @test1(<2 x i64> %a) {			define i64 @test1(<2 x i64> %a) {
	; X32-LABEL: test1:			; X32-LABEL: test1:
	; X32: # %bb.0: # %entry			; X32: # %bb.0: # %entry
	; X32-NEXT: movdqa %xmm0, %xmm1
	; X32-NEXT: psllq $2, %xmm1
	; X32-NEXT: movsd {{.*#+}} xmm1 = xmm0[0],xmm1[1]
	; X32-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,2,3]
	; X32-NEXT: movd %xmm1, %edx
	; X32-NEXT: movd %xmm0, %eax			; X32-NEXT: movd %xmm0, %eax
				; X32-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,1,2,3]
				; X32-NEXT: movd %xmm0, %edx
	; X32-NEXT: retl			; X32-NEXT: retl
	;			;
	; X64-LABEL: test1:			; X64-LABEL: test1:
	; X64: # %bb.0: # %entry			; X64: # %bb.0: # %entry
	; X64-NEXT: movq %xmm0, %rax			; X64-NEXT: movq %xmm0, %rax
	; X64-NEXT: retq			; X64-NEXT: retq
	entry:			entry:
	%c = shl <2 x i64> %a, <i64 0, i64 2>			%c = shl <2 x i64> %a, <i64 0, i64 2>
	%d = extractelement <2 x i64> %c, i32 0			%d = extractelement <2 x i64> %c, i32 0
	ret i64 %d			ret i64 %d
	}			}