This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Target/PowerPC/
-
Target/
-
PowerPC/
9/16
PPCISelLowering.cpp
-
test/CodeGen/PowerPC/
-
CodeGen/
-
PowerPC/
-
p8-scalar_vector_conversions.ll
6
v16i8_scalar_to_vector_shuffle.ll
-
v2i64_scalar_to_vector_shuffle.ll

Differential D130487

[PowerPC] Fix vector_shuffle combines when inputs are scalar_to_vector of differing types.
Needs RevisionPublic

Authored by amyk on Jul 25 2022, 7:23 AM.

Download Raw Diff

Details

Reviewers

power-llvm-team
nemanjai
stefanp
kamaub

Group Reviewers

Restricted Project

Summary

This patch fixes the combines for vector_shuffles when either or both of its
left and right hand side inputs are scalar_to_vector nodes.

Previously, when both left and right side inputs are scalar_to_vector nodes,
the current combine could not handle this situation, as the shuffle mask was
updated incorrectly. https://reviews.llvm.org/D127818 was a temporary solution
to this issue. Now, not only does this patch aim to resolve the previous issue the
of incorrect shuffle mask adjustments respectively, it also updates any test cases
that are affected by this change.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

amyk created this revision.Jul 25 2022, 7:23 AM

Herald added a project: Restricted Project. · View Herald TranscriptJul 25 2022, 7:23 AM

Herald added subscribers: shchenz, hiraditya. · View Herald Transcript

amyk requested review of this revision.Jul 25 2022, 7:23 AM

Herald added a project: Restricted Project. · View Herald TranscriptJul 25 2022, 7:23 AM

Harbormaster completed remote builds in B177375: Diff 447331.Jul 25 2022, 7:23 AM

amyk mentioned this in D130485: [PowerPC][NFC] Add additional vector_shuffle tests involving scalar_to_vector..Jul 25 2022, 7:46 AM

Rebase patch based on new tests added within D130485.

Harbormaster completed remote builds in B181036: Diff 452354.Aug 12 2022, 7:00 PM

amyk mentioned this in rGa5bef98c7513: [PowerPC][NFC] Add additional vector_shuffle tests involving scalar_to_vector..Aug 15 2022, 10:31 AM

Ping.

Can you also comment on whether this was thoroughly tested on both little endian and big endian systems (bootstrap, test-suite, SPEC, additional internal tests).

llvm/lib/Target/PowerPC/PPCISelLowering.cpp
14917–14918	I don't follow why we need these here. They both seem to only be needed in the respective conditions (i.e. depending on whether the LHS/RHS are `scalar_to_vector` nodes). And within those conditional blocks, they are reset before they're used. So why do we need to define them here and initialize them to the width of a vector?
llvm/test/CodeGen/PowerPC/v16i8_scalar_to_vector_shuffle.ll
267	The code for this one gets worse on big endian. Do we know why?
347	The code for this one gets worse on big endian. Do we know why?
578	The code for this one gets worse on big endian. Do we know why?
659	The code for this one gets worse on big endian. Do we know why?
1431	The code for this one gets worse on big endian. Do we know why?
1658	The code for this one gets worse on big endian. Do we know why? There are probably a bunch of other places. Can you please review what is happening there? I'll stop adding further similar comments.
llvm/test/CodeGen/PowerPC/v4i32_scalar_to_vector_shuffle.ll
123 ↗	(On Diff #452354)	The code generated for this one gets worse on all subtargets. Do we know why?

Discussed this patch with Nemanja outside of the review.

Many of the cases where we get worse codegen on BE (and some on LE as well) within the test cases occur either when the shuffle mask is explicitly asking for undefined vector elements from the original scalar_to_vector, or when the values in the vector are partially defined in the cases where the scalar_to_vector element size is smaller than the vector_shuffle element size. These cases primarily seem to appear within these contrived test cases, rather than real code. As a result, I've rebased this patch and addressed some review comments to move forward with this patch.

@nemanjai Yeah, at the time of posting the patch, I did do little endian and big endian system tests as you mentioned. Since it's been awhile and I need update the patch, I'd like to retest these particular runs with this patch.

llvm/lib/Target/PowerPC/PPCISelLowering.cpp
14917–14918	Ya, I think I had that in the beginning and meant to remove it prior to putting up the patch but didn't realize that it was still left in there. I don't believe I need it either, so I've removed it.

Harbormaster completed remote builds in B200980: Diff 479927.Dec 4 2022, 10:27 AM

Ping.

Although I have a fair number of comments, they're mostly stylistic comments that probably don't really require another revision. So LGTM and please address the comments prior to committing.

llvm/lib/Target/PowerPC/PPCISelLowering.cpp
14847	I don't think we modify `ShuffV` so it should be a `const` reference.
14848–14849	These two values are actually the last element rather than byte aren't they? If so, please rename accordingly.
14855	Why do we only check here if `LHSLastByteDefined >= 0` and similarly for the RHS below? Do we really want to pretend that a shuffle mask is in range if the last byte/element defined is undefined (i.e. presumably no bytes are defined)?
14903–14904	The name `LaneWidth` is misleading here. I kept thinking the width (i.e. the number of bits) of the lane that contains a defined value. But it is actually the number of valid elements in the vector. For a node: (shuff (v4i32 s_to_v i32), arbitrary_v4i32), mask) LHSValidLaneWidth = 1 RHSValidLaneWidth = 4 And for a node: (shuff (v4i32 s_to_v i32), (bitcast (s_to_v i64), v4i32), mask) LHSValidLaneWidth = 1 RHSValidLaneWidth = 2 If I'm interpreting it correctly, please rename them to something like `NumValidElts`.
14932	I think we should have an early exit here if the valid lane width is zero: if (LHSValidLaneWidth == 0) return false; Since it is not really reasonable to do this transform if we are pulling in more bits than the original `scalar_to_vector` actually defined. Similarly with the RHS below.
14933	Nit: maybe a comment to make this clearer: // The last element that comes from the LHS. For example: // (shuff (s_to_v i32), (bitcast (s_to_v i64), v4i32), ...) // The last element that comes from the LHS is actually 0, not 3 // because elements 1 and higher of a scalar_to_vector are undefined.
14945	Similar nit as above. A comment along the lines of: // The last element that comes from the RHS. For example: // (shuff (s_to_v i32), (bitcast (s_to_v i64), v4i32), ...) // The last element that comes from the RHS is actually 5, not 7 // because elements 1 and higher of a scalar_to_vector are undefined. // It is also not 4 because the original scalar_to_vector is wider and // actually contains two i32 elements.

This revision is now accepted and ready to land.Feb 24 2023, 4:36 AM

kamaub added a subscriber: kamaub.Feb 27 2023, 10:27 AM

kamaub added inline comments.

llvm/lib/Target/PowerPC/PPCISelLowering.cpp
14932	move `LHSScalarSize` up and use it in this block
14944	Same here, please raise `RHSScalarSize` and reuse it.

Request changes because of the bug in the isShuffleMaskInRange() conditions

llvm/lib/Target/PowerPC/PPCISelLowering.cpp
14850	please use a range based loop
14855–14856
14856	Please change this to `>` (and for below).
14860–14861
14907–14908	please expand this comment to point out that -1 means all elements are defined

This revision now requires changes to proceed.Feb 28 2023, 9:49 AM

Revision Contents

Path

Size

llvm/

lib/

Target/

PowerPC/

PPCISelLowering.cpp

77 lines

test/

CodeGen/

PowerPC/

p8-scalar_vector_conversions.ll

6 lines

v16i8_scalar_to_vector_shuffle.ll

451 lines

v2i64_scalar_to_vector_shuffle.ll

432 lines

Diff 447331

llvm/lib/Target/PowerPC/PPCISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 14,788 Lines • ▼ Show 20 Lines

// Fix up the shuffle mask to account for the fact that the result of // Fix up the shuffle mask to account for the fact that the result of

// scalar_to_vector is not in lane zero. This just takes all values in // scalar_to_vector is not in lane zero. This just takes all values in

// the ranges specified by the min/max indices and adds the number of // the ranges specified by the min/max indices and adds the number of

// elements required to ensure each element comes from the respective // elements required to ensure each element comes from the respective

// position in the valid lane. // position in the valid lane.

// On little endian, that's just the corresponding element in the other // On little endian, that's just the corresponding element in the other

// half of the vector. On big endian, it is in the same half but right // half of the vector. On big endian, it is in the same half but right

// justified rather than left justified in that half. // justified rather than left justified in that half.

static void fixupShuffleMaskForPermutedSToV(SmallVectorImpl<int> &ShuffV, static void fixupShuffleMaskForPermutedSToV(

int LHSMaxIdx, int RHSMinIdx, SmallVectorImpl<int> &ShuffV, int LHSFirstElt, int LHSLastElt,

int RHSMaxIdx, int HalfVec, int RHSFirstElt, int RHSLastElt, int HalfVec, unsigned LHSValidLaneWidth,

unsigned ValidLaneWidth, unsigned RHSValidLaneWidth, const PPCSubtarget &Subtarget) {

const PPCSubtarget &Subtarget) {

for (int i = 0, e = ShuffV.size(); i < e; i++) { for (int i = 0, e = ShuffV.size(); i < e; i++) {

int Idx = ShuffV[i]; int Idx = ShuffV[i];

if ((Idx >= 0 && Idx < LHSMaxIdx) || (Idx >= RHSMinIdx && Idx < RHSMaxIdx)) if (Idx >= LHSFirstElt && Idx <= LHSLastElt)

ShuffV[i] +=

Subtarget.isLittleEndian() ? HalfVec : HalfVec - LHSValidLaneWidth;

if (Idx >= RHSFirstElt && Idx <= RHSLastElt)

ShuffV[i] += ShuffV[i] +=

Subtarget.isLittleEndian() ? HalfVec : HalfVec - ValidLaneWidth; Subtarget.isLittleEndian() ? HalfVec : HalfVec - RHSValidLaneWidth;

} }

// Replace a SCALAR_TO_VECTOR with a SCALAR_TO_VECTOR_PERMUTED except if // Replace a SCALAR_TO_VECTOR with a SCALAR_TO_VECTOR_PERMUTED except if

// the original is: // the original is:

// (<n x Ty> (scalar_to_vector (Ty (extract_elt <n x Ty> %a, C)))) // (<n x Ty> (scalar_to_vector (Ty (extract_elt <n x Ty> %a, C))))

// In such a case, just change the shuffle mask to extract the element // In such a case, just change the shuffle mask to extract the element

// from the permuted index. // from the permuted index.

Show All 22 Lines if (Idx && VT == OrigVector.getValueType()) {

NewMask[ResultInElt] = Idx->getZExtValue(); NewMask[ResultInElt] = Idx->getZExtValue();

return DAG.getVectorShuffle(VT, dl, OrigVector, OrigVector, NewMask); return DAG.getVectorShuffle(VT, dl, OrigVector, OrigVector, NewMask);

} }

return DAG.getNode(PPCISD::SCALAR_TO_VECTOR_PERMUTED, dl, VT, return DAG.getNode(PPCISD::SCALAR_TO_VECTOR_PERMUTED, dl, VT,

OrigSToV.getOperand(0)); OrigSToV.getOperand(0));

} }

// On little endian subtargets, combine shuffles such as: // On little endian subtargets, combine shuffles such as:

nemanjaiUnsubmitted

Not Done

I don't think we modify ShuffV so it should be a const reference.

nemanjai: I don't think we modify `ShuffV` so it should be a `const` reference.

// vector_shuffle<16,1,17,3,18,5,19,7,20,9,21,11,22,13,23,15>, <zero>, %b // vector_shuffle<16,1,17,3,18,5,19,7,20,9,21,11,22,13,23,15>, <zero>, %b

// into: // into:

nemanjaiUnsubmitted

Not Done

These two values are actually the last *element* rather than *byte* aren't they? If so, please rename accordingly.

nemanjai: These two values are actually the last *element* rather than *byte* aren't they? If so, please…

// vector_shuffle<16,0,17,1,18,2,19,3,20,4,21,5,22,6,23,7>, <zero>, %b // vector_shuffle<16,0,17,1,18,2,19,3,20,4,21,5,22,6,23,7>, <zero>, %b

kamaubUnsubmitted

Not Done

please use a range based loop

kamaub: please use a range based loop

// because the latter can be matched to a single instruction merge. // because the latter can be matched to a single instruction merge.

// Furthermore, SCALAR_TO_VECTOR on little endian always involves a permute // Furthermore, SCALAR_TO_VECTOR on little endian always involves a permute

// to put the value into element zero. Adjust the shuffle mask so that the // to put the value into element zero. Adjust the shuffle mask so that the

// vector can remain in permuted form (to prevent a swap prior to a shuffle). // vector can remain in permuted form (to prevent a swap prior to a shuffle).

// On big endian targets, this is still useful for SCALAR_TO_VECTOR // On big endian targets, this is still useful for SCALAR_TO_VECTOR

nemanjaiUnsubmitted

Not Done

Why do we only check here if LHSLastByteDefined >= 0 and similarly for the RHS below? Do we really want to pretend that a shuffle mask is in range if the last byte/element defined is undefined (i.e. presumably no bytes are defined)?

nemanjai: Why do we only check here if `LHSLastByteDefined >= 0` and similarly for the RHS below? Do we…

// nodes with elements smaller than doubleword because all the ways // nodes with elements smaller than doubleword because all the ways

kamaubUnsubmitted

Not Done

Please change this to > (and for below).

kamaub: Please change this to `>` (and for below).

kamaubUnsubmitted

Not Done

// Handle first input vector of the vector_shuffle.

- if (Index < HalfVec && LHSLastByteDefined >= 0) {

- if (!(Index <= LHSLastByteDefined))

+ if (LHSLastByteDefined >= 0 && Index < HalfVec &&

+ Index > LHSLastByteDefined)

return false;

kamaub:

// of getting scalar data into a vector register put the value in the // of getting scalar data into a vector register put the value in the

// rightmost element of the left half of the vector. // rightmost element of the left half of the vector.

SDValue PPCTargetLowering::combineVectorShuffle(ShuffleVectorSDNode *SVN, SDValue PPCTargetLowering::combineVectorShuffle(ShuffleVectorSDNode *SVN,

SelectionDAG &DAG) const { SelectionDAG &DAG) const {

SDValue LHS = SVN->getOperand(0); SDValue LHS = SVN->getOperand(0);

kamaubUnsubmitted

Not Done

// Handle second input vector of the vector_shuffle.

- if (Index >= HalfVec && RHSLastByteDefined >= 0) {

- if (!(Index <= Index + (RHSLastByteDefined)))

- return false;

+ if (RHSLastByteDefined >= 0 && Index > HalfVec + RHSLastByteDefined) return false;

kamaub:

SDValue RHS = SVN->getOperand(1); SDValue RHS = SVN->getOperand(1);

auto Mask = SVN->getMask(); auto Mask = SVN->getMask();

int NumElts = LHS.getValueType().getVectorNumElements(); int NumElts = LHS.getValueType().getVectorNumElements();

SDValue Res(SVN, 0); SDValue Res(SVN, 0);

SDLoc dl(SVN); SDLoc dl(SVN);

bool IsLittleEndian = Subtarget.isLittleEndian(); bool IsLittleEndian = Subtarget.isLittleEndian();

// On big endian targets this is only useful for subtargets with direct moves. // On big endian targets this is only useful for subtargets with direct moves.

Show All 16 Lines SDValue PPCTargetLowering::combineVectorShuffle(ShuffleVectorSDNode *SVN,

// Adjust the shuffle mask if either input vector comes from a // Adjust the shuffle mask if either input vector comes from a

// SCALAR_TO_VECTOR and keep the respective input vector in permuted // SCALAR_TO_VECTOR and keep the respective input vector in permuted

// form (to prevent the need for a swap). // form (to prevent the need for a swap).

SmallVector<int, 16> ShuffV(Mask.begin(), Mask.end()); SmallVector<int, 16> ShuffV(Mask.begin(), Mask.end());

SDValue SToVLHS = isScalarToVec(LHS); SDValue SToVLHS = isScalarToVec(LHS);

SDValue SToVRHS = isScalarToVec(RHS); SDValue SToVRHS = isScalarToVec(RHS);

if (SToVLHS || SToVRHS) { if (SToVLHS || SToVRHS) {

// FIXME: If both LHS and RHS are SCALAR_TO_VECTOR, but are not the int ShuffleEltWidth =

// same type and have differing element sizes, then do not perform SVN->getValueType(0).getVectorElementType().getSizeInBits();

// the following transformation. The current transformation for int ShuffleNumElts = ShuffV.size();

// SCALAR_TO_VECTOR assumes that both input vectors have the same int HalfVec = ShuffleNumElts / 2;

// element size. This will be updated in the future to account for

// differing sizes of the LHS and RHS.

if (SToVLHS && SToVRHS &&

(SToVLHS.getValueType().getScalarSizeInBits() !=

SToVRHS.getValueType().getScalarSizeInBits()))

return Res;

int NumEltsIn = SToVLHS ? SToVLHS.getValueType().getVectorNumElements()

: SToVRHS.getValueType().getVectorNumElements();

int NumEltsOut = ShuffV.size();

// The width of the "valid lane" (i.e. the lane that contains the value that // The width of the "valid lane" (i.e. the lane that contains the value that

// is vectorized) needs to be expressed in terms of the number of elements // is vectorized) needs to be expressed in terms of the number of elements

// of the shuffle. It is thereby the ratio of the values before and after // of the shuffle. It is thereby the ratio of the values before and after

// any bitcast. // any bitcast, which will be set later on if the LHS or RHS are

unsigned ValidLaneWidth = // SCALAR_TO_VECTOR nodes.

SToVLHS ? SToVLHS.getValueType().getScalarSizeInBits() / unsigned LHSValidLaneWidth = HalfVec;

LHS.getValueType().getScalarSizeInBits() unsigned RHSValidLaneWidth = HalfVec;

nemanjaiUnsubmitted

Not Done

The name LaneWidth is misleading here. I kept thinking the width (i.e. the number of bits) of the lane that contains a defined value. But it is actually the number of valid elements in the vector.
For a node:

(shuff (v4i32 s_to_v i32), arbitrary_v4i32), mask)
LHSValidLaneWidth = 1
RHSValidLaneWidth = 4

And for a node:

(shuff (v4i32 s_to_v i32), (bitcast (s_to_v i64), v4i32), mask)
LHSValidLaneWidth = 1
RHSValidLaneWidth = 2

If I'm interpreting it correctly, please rename them to something like NumValidElts.

nemanjai: The name `LaneWidth` is misleading here. I kept thinking the width (i.e. the number of bits) of…

: SToVRHS.getValueType().getScalarSizeInBits() /

RHS.getValueType().getScalarSizeInBits();

// Initially assume that neither input is permuted. These will be adjusted // Initially assume that neither input is permuted. These will be adjusted

// accordingly if either input is. // accordingly if either input is.

int LHSMaxIdx = -1; int LHSFirstElt = 0;

kamaubUnsubmitted

Not Done

please expand this comment to point out that -1 means all elements are defined

kamaub: please expand this comment to point out that -1 means all elements are defined

int RHSMinIdx = -1; int RHSFirstElt = ShuffleNumElts;

int RHSMaxIdx = -1; int LHSLastElt = -1;

int HalfVec = LHS.getValueType().getVectorNumElements() / 2; int RHSLastElt = -1;

// The scalar size of the LHS and RHS is initially assumed to be 128, as

// 128 is the default scalar size for any vector.

// If the LHS or RHS are SCALAR_TO_VECTOR nodes, we will adjust these values

// to the size of the scalar input to the SCALAR_TO_VECTOR later on.

int LHSScalarSize = 128;

int RHSScalarSize = 128;

nemanjaiUnsubmitted

Not Done

I don't follow why we need these here. They both seem to only be needed in the respective conditions (i.e. depending on whether the LHS/RHS are scalar_to_vector nodes). And within those conditional blocks, they are reset before they're used.

So why do we need to define them here and initialize them to the width of a vector?

nemanjai: I don't follow why we need these here. They both seem to only be needed in the respective…

amykAuthorUnsubmitted

Done

Ya, I think I had that in the beginning and meant to remove it prior to putting up the patch but didn't realize that it was still left in there. I don't believe I need it either, so I've removed it.

amyk: Ya, I think I had that in the beginning and meant to remove it prior to putting up the patch…

// Get the permuted scalar to vector nodes for the source(s) that come from // Get the permuted scalar to vector nodes for the source(s) that come from

// ISD::SCALAR_TO_VECTOR. // ISD::SCALAR_TO_VECTOR.

// On big endian systems, this only makes sense for element sizes smaller // On big endian systems, this only makes sense for element sizes smaller

// than 64 bits since for 64-bit elements, all instructions already put // than 64 bits since for 64-bit elements, all instructions already put

// the value into element zero. Since scalar size of LHS and RHS may differ // the value into element zero. Since scalar size of LHS and RHS may differ

// after isScalarToVec, this should be checked using their own sizes. // after isScalarToVec, this should be checked using their own sizes.

if (SToVLHS) { if (SToVLHS) {

if (!IsLittleEndian && SToVLHS.getValueType().getScalarSizeInBits() >= 64) if (!IsLittleEndian && SToVLHS.getValueType().getScalarSizeInBits() >= 64)

return Res; return Res;

// Set up the values for the shuffle vector fixup. // Set up the values for the shuffle vector fixup.

LHSMaxIdx = NumEltsOut / NumEltsIn; LHSValidLaneWidth = SToVLHS.getValueType().getScalarSizeInBits() /

LHS.getValueType().getScalarSizeInBits();

LHSScalarSize = SToVLHS.getValueType().getScalarSizeInBits();

nemanjaiUnsubmitted

Not Done

I think we should have an early exit here if the valid lane width is zero:

if (LHSValidLaneWidth == 0)
  return false;

Since it is not really reasonable to do this transform if we are pulling in more bits than the original scalar_to_vector actually defined. Similarly with the RHS below.

nemanjai: I think we should have an early exit here if the valid lane width is zero: ``` if…

kamaubUnsubmitted

Not Done

move LHSScalarSize up and use it in this block

kamaub: move `LHSScalarSize` up and use it in this block

LHSLastElt = LHSScalarSize / (ShuffleEltWidth + 1);

nemanjaiUnsubmitted

Not Done

Nit: maybe a comment to make this clearer:

// The last element that comes from the LHS. For example:
// (shuff (s_to_v i32), (bitcast (s_to_v i64), v4i32), ...)
// The last element that comes from the LHS is actually 0, not 3
// because elements 1 and higher of a scalar_to_vector are undefined.

nemanjai: Nit: maybe a comment to make this clearer: ``` // The last element that comes from the LHS. For…

SToVLHS = getSToVPermuted(SToVLHS, DAG, Subtarget); SToVLHS = getSToVPermuted(SToVLHS, DAG, Subtarget);

if (SToVLHS.getValueType() != LHS.getValueType()) if (SToVLHS.getValueType() != LHS.getValueType())

SToVLHS = DAG.getBitcast(LHS.getValueType(), SToVLHS); SToVLHS = DAG.getBitcast(LHS.getValueType(), SToVLHS);

LHS = SToVLHS; LHS = SToVLHS;

} }

if (SToVRHS) { if (SToVRHS) {

if (!IsLittleEndian && SToVRHS.getValueType().getScalarSizeInBits() >= 64) if (!IsLittleEndian && SToVRHS.getValueType().getScalarSizeInBits() >= 64)

return Res; return Res;

RHSMinIdx = NumEltsOut; RHSValidLaneWidth = SToVRHS.getValueType().getScalarSizeInBits() /

RHSMaxIdx = NumEltsOut / NumEltsIn + RHSMinIdx; RHS.getValueType().getScalarSizeInBits();

RHSScalarSize = SToVRHS.getValueType().getScalarSizeInBits();

kamaubUnsubmitted

Not Done

Same here, please raise RHSScalarSize and reuse it.

kamaub: Same here, please raise `RHSScalarSize` and reuse it.

RHSLastElt = RHSScalarSize / (ShuffleEltWidth + 1) + RHSFirstElt;

nemanjaiUnsubmitted

Not Done

Similar nit as above. A comment along the lines of:

// The last element that comes from the RHS. For example:
// (shuff (s_to_v i32), (bitcast (s_to_v i64), v4i32), ...)
// The last element that comes from the RHS is actually 5, not 7
// because elements 1 and higher of a scalar_to_vector are undefined.
// It is also not 4 because the original scalar_to_vector is wider and
// actually contains two i32 elements.

nemanjai: Similar nit as above. A comment along the lines of: ``` // The last element that comes from the…

SToVRHS = getSToVPermuted(SToVRHS, DAG, Subtarget); SToVRHS = getSToVPermuted(SToVRHS, DAG, Subtarget);

if (SToVRHS.getValueType() != RHS.getValueType()) if (SToVRHS.getValueType() != RHS.getValueType())

SToVRHS = DAG.getBitcast(RHS.getValueType(), SToVRHS); SToVRHS = DAG.getBitcast(RHS.getValueType(), SToVRHS);

RHS = SToVRHS; RHS = SToVRHS;

} }

// Fix up the shuffle mask to reflect where the desired element actually is. // Fix up the shuffle mask to reflect where the desired element actually is.

// The minimum and maximum indices that correspond to element zero for both // The minimum and maximum indices that correspond to element zero for both

// the LHS and RHS are computed and will control which shuffle mask entries // the LHS and RHS are computed and will control which shuffle mask entries

// are to be changed. For example, if the RHS is permuted, any shuffle mask // are to be changed. For example, if the RHS is permuted, any shuffle mask

// entries in the range [RHSMinIdx,RHSMaxIdx) will be adjusted. // entries in the range [RHSFirstElt,RHSLastElt] will be adjusted.

fixupShuffleMaskForPermutedSToV(ShuffV, LHSMaxIdx, RHSMinIdx, RHSMaxIdx, fixupShuffleMaskForPermutedSToV(

HalfVec, ValidLaneWidth, Subtarget); ShuffV, LHSFirstElt, LHSLastElt, RHSFirstElt, RHSLastElt, HalfVec,

LHSValidLaneWidth, RHSValidLaneWidth, Subtarget);

Res = DAG.getVectorShuffle(SVN->getValueType(0), dl, LHS, RHS, ShuffV); Res = DAG.getVectorShuffle(SVN->getValueType(0), dl, LHS, RHS, ShuffV);

// We may have simplified away the shuffle. We won't be able to do anything // We may have simplified away the shuffle. We won't be able to do anything

// further with it here. // further with it here.

if (!isa<ShuffleVectorSDNode>(Res)) if (!isa<ShuffleVectorSDNode>(Res))

return Res; return Res;

Mask = cast<ShuffleVectorSDNode>(Res)->getMask(); Mask = cast<ShuffleVectorSDNode>(Res)->getMask();

} }

▲ Show 20 Lines • Show All 3,233 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/p8-scalar_vector_conversions.ll

	Show First 20 Lines • Show All 2,561 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: sldi r4, r4, 32			; CHECK-NEXT: sldi r4, r4, 32
	; CHECK-NEXT: mtfprd f1, r3			; CHECK-NEXT: mtfprd f1, r3
	; CHECK-NEXT: mtfprd f0, r4			; CHECK-NEXT: mtfprd f0, r4
	; CHECK-NEXT: xxmrghd v2, vs0, vs1			; CHECK-NEXT: xxmrghd v2, vs0, vs1
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	;			;
	; CHECK-LE-LABEL: buildi2:			; CHECK-LE-LABEL: buildi2:
	; CHECK-LE: # %bb.0: # %entry			; CHECK-LE: # %bb.0: # %entry
	; CHECK-LE-NEXT: mtfprd f0, r4			; CHECK-LE-NEXT: mtfprwz f0, r4
	; CHECK-LE-NEXT: mtfprd f1, r3			; CHECK-LE-NEXT: mtfprd f1, r3
	; CHECK-LE-NEXT: xxswapd vs0, vs0			; CHECK-LE-NEXT: xxmrghd v2, vs1, vs0
	; CHECK-LE-NEXT: xxswapd v2, vs1
	; CHECK-LE-NEXT: xxmrgld v2, v2, vs0
	; CHECK-LE-NEXT: blr			; CHECK-LE-NEXT: blr
	;			;
	; CHECK-AIX-LABEL: buildi2:			; CHECK-AIX-LABEL: buildi2:
	; CHECK-AIX: # %bb.0: # %entry			; CHECK-AIX: # %bb.0: # %entry
	; CHECK-AIX-NEXT: sldi 4, 4, 32			; CHECK-AIX-NEXT: sldi 4, 4, 32
	; CHECK-AIX-NEXT: mtfprd 1, 3			; CHECK-AIX-NEXT: mtfprd 1, 3
	; CHECK-AIX-NEXT: mtfprd 0, 4			; CHECK-AIX-NEXT: mtfprd 0, 4
	; CHECK-AIX-NEXT: xxmrghd 34, 0, 1			; CHECK-AIX-NEXT: xxmrghd 34, 0, 1
	; CHECK-AIX-NEXT: blr			; CHECK-AIX-NEXT: blr
	entry:			entry:
	%lhs.i32 = insertelement <4 x i32> undef, i32 %arg1, i32 0			%lhs.i32 = insertelement <4 x i32> undef, i32 %arg1, i32 0
	%rhs = insertelement <2 x i64> undef, i64 %arg, i32 0			%rhs = insertelement <2 x i64> undef, i64 %arg, i32 0
	%lhs = bitcast <4 x i32> %lhs.i32 to <2 x i64>			%lhs = bitcast <4 x i32> %lhs.i32 to <2 x i64>
	%shuffle = shufflevector <2 x i64> %lhs, <2 x i64> %rhs, <2 x i32> <i32 0, i32 2>			%shuffle = shufflevector <2 x i64> %lhs, <2 x i64> %rhs, <2 x i32> <i32 0, i32 2>
	ret <2 x i64> %shuffle			ret <2 x i64> %shuffle
	}			}

llvm/test/CodeGen/PowerPC/v16i8_scalar_to_vector_shuffle.ll

Show First 20 Lines • Show All 258 Lines • ▼ Show 20 Lines
; CHECK-AIX-32-P9-NEXT: blr		; CHECK-AIX-32-P9-NEXT: blr
entry:		entry:
%lhs = load <16 x i8>, ptr %b, align 4		%lhs = load <16 x i8>, ptr %b, align 4
%rhs = insertelement <16 x i8> undef, i8 %arg, i32 0		%rhs = insertelement <16 x i8> undef, i8 %arg, i32 0
%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v16i8_v8i16(i16 %arg, i8 %arg1) {		define <16 x i8> @test_v16i8_v8i16(i16 %arg, i8 %arg1) {
		nemanjaiUnsubmitted Not Done Reply Inline Actions The code for this one gets worse on big endian. Do we know why? nemanjai: The code for this one gets worse on big endian. Do we know why?
; CHECK-LE-P8-LABEL: test_v16i8_v8i16:		; CHECK-LE-P8-LABEL: test_v16i8_v8i16:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r4		; CHECK-LE-P8-NEXT: mtvsrd v2, r4
; CHECK-LE-P8-NEXT: mtfprd f1, r3		; CHECK-LE-P8-NEXT: mtvsrd v3, r3
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: vmrghh v2, v3, v2
; CHECK-LE-P8-NEXT: xxswapd v3, vs1
; CHECK-LE-P8-NEXT: vmrglh v2, v3, v2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v16i8_v8i16:		; CHECK-LE-P9-LABEL: test_v16i8_v8i16:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r4		; CHECK-LE-P9-NEXT: mtvsrd v2, r4
; CHECK-LE-P9-NEXT: xxswapd v2, vs0		; CHECK-LE-P9-NEXT: mtvsrd v3, r3
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: vmrghh v2, v3, v2
; CHECK-LE-P9-NEXT: xxswapd v3, vs0
; CHECK-LE-P9-NEXT: vmrglh v2, v3, v2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v16i8_v8i16:		; CHECK-BE-P8-LABEL: test_v16i8_v8i16:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r4, r4, 56		; CHECK-BE-P8-NEXT: addis r5, r2, .LCPI3_0@toc@ha
; CHECK-BE-P8-NEXT: sldi r3, r3, 48		; CHECK-BE-P8-NEXT: mtvsrwz v2, r4
; CHECK-BE-P8-NEXT: mtvsrd v2, r4		; CHECK-BE-P8-NEXT: addi r5, r5, .LCPI3_0@toc@l
; CHECK-BE-P8-NEXT: mtvsrd v3, r3		; CHECK-BE-P8-NEXT: mtvsrwz v4, r3
; CHECK-BE-P8-NEXT: vmrghh v2, v2, v3		; CHECK-BE-P8-NEXT: lxvw4x v3, 0, r5
		; CHECK-BE-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v16i8_v8i16:		; CHECK-BE-P9-LABEL: test_v16i8_v8i16:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: sldi r4, r4, 56		; CHECK-BE-P9-NEXT: mtvsrwz v3, r3
; CHECK-BE-P9-NEXT: sldi r3, r3, 48		; CHECK-BE-P9-NEXT: addis r3, r2, .LCPI3_0@toc@ha
; CHECK-BE-P9-NEXT: mtvsrd v2, r4		; CHECK-BE-P9-NEXT: mtvsrwz v2, r4
; CHECK-BE-P9-NEXT: mtvsrd v3, r3		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI3_0@toc@l
; CHECK-BE-P9-NEXT: vmrghh v2, v2, v3		; CHECK-BE-P9-NEXT: lxv v4, 0(r3)
		; CHECK-BE-P9-NEXT: vperm v2, v2, v3, v4
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v16i8_v8i16:		; CHECK-AIX-64-P8-LABEL: test_v16i8_v8i16:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 56		; CHECK-AIX-64-P8-NEXT: ld r5, L..C3(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 48		; CHECK-AIX-64-P8-NEXT: mtvsrwz v2, r4
; CHECK-AIX-64-P8-NEXT: mtvsrd v2, r4		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3
; CHECK-AIX-64-P8-NEXT: mtvsrd v3, r3		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-64-P8-NEXT: vmrghh v2, v2, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v16i8_v8i16:		; CHECK-AIX-64-P9-LABEL: test_v16i8_v8i16:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: sldi r4, r4, 56		; CHECK-AIX-64-P9-NEXT: mtvsrwz v3, r3
; CHECK-AIX-64-P9-NEXT: sldi r3, r3, 48		; CHECK-AIX-64-P9-NEXT: ld r3, L..C2(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: mtvsrd v2, r4		; CHECK-AIX-64-P9-NEXT: mtvsrwz v2, r4
; CHECK-AIX-64-P9-NEXT: mtvsrd v3, r3		; CHECK-AIX-64-P9-NEXT: lxv v4, 0(r3)
; CHECK-AIX-64-P9-NEXT: vmrghh v2, v2, v3		; CHECK-AIX-64-P9-NEXT: vperm v2, v2, v3, v4
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v16i8_v8i16:		; CHECK-AIX-32-P8-LABEL: test_v16i8_v8i16:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -32
; CHECK-AIX-32-P8-NEXT: stb r4, -32(r1)		; CHECK-AIX-32-P8-NEXT: stb r4, -32(r1)
; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5
; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)
Show All 13 Lines
entry:		entry:
%lhs = insertelement <16 x i8> undef, i8 %arg1, i32 0		%lhs = insertelement <16 x i8> undef, i8 %arg1, i32 0
%rhs.tmp = insertelement <8 x i16> undef, i16 %arg, i32 0		%rhs.tmp = insertelement <8 x i16> undef, i16 %arg, i32 0
%rhs = bitcast <8 x i16> %rhs.tmp to <16 x i8>		%rhs = bitcast <8 x i16> %rhs.tmp to <16 x i8>
%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v8i16_v16i8(i16 %arg, i8 %arg1) {		define <16 x i8> @test_v8i16_v16i8(i16 %arg, i8 %arg1) {
		nemanjaiUnsubmitted Not Done Reply Inline Actions The code for this one gets worse on big endian. Do we know why? nemanjai: The code for this one gets worse on big endian. Do we know why?
; CHECK-LE-P8-LABEL: test_v8i16_v16i8:		; CHECK-LE-P8-LABEL: test_v8i16_v16i8:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r4		; CHECK-LE-P8-NEXT: mtvsrd v2, r4
; CHECK-LE-P8-NEXT: mtfprd f1, r3		; CHECK-LE-P8-NEXT: mtvsrd v3, r3
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: vmrghh v2, v2, v3
; CHECK-LE-P8-NEXT: xxswapd v3, vs1
; CHECK-LE-P8-NEXT: vmrglh v2, v2, v3
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v8i16_v16i8:		; CHECK-LE-P9-LABEL: test_v8i16_v16i8:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r4		; CHECK-LE-P9-NEXT: mtvsrd v2, r4
; CHECK-LE-P9-NEXT: xxswapd v2, vs0		; CHECK-LE-P9-NEXT: mtvsrd v3, r3
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: vmrghh v2, v2, v3
; CHECK-LE-P9-NEXT: xxswapd v3, vs0
; CHECK-LE-P9-NEXT: vmrglh v2, v2, v3
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v8i16_v16i8:		; CHECK-BE-P8-LABEL: test_v8i16_v16i8:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r4, r4, 56		; CHECK-BE-P8-NEXT: addis r5, r2, .LCPI4_0@toc@ha
; CHECK-BE-P8-NEXT: sldi r3, r3, 48		; CHECK-BE-P8-NEXT: mtvsrwz v2, r4
; CHECK-BE-P8-NEXT: mtvsrd v2, r4		; CHECK-BE-P8-NEXT: addi r5, r5, .LCPI4_0@toc@l
; CHECK-BE-P8-NEXT: mtvsrd v3, r3		; CHECK-BE-P8-NEXT: mtvsrwz v4, r3
; CHECK-BE-P8-NEXT: vmrghh v2, v3, v2		; CHECK-BE-P8-NEXT: lxvw4x v3, 0, r5
		; CHECK-BE-P8-NEXT: vperm v2, v4, v2, v3
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v8i16_v16i8:		; CHECK-BE-P9-LABEL: test_v8i16_v16i8:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: sldi r4, r4, 56		; CHECK-BE-P9-NEXT: mtvsrwz v3, r3
; CHECK-BE-P9-NEXT: sldi r3, r3, 48		; CHECK-BE-P9-NEXT: addis r3, r2, .LCPI4_0@toc@ha
; CHECK-BE-P9-NEXT: mtvsrd v2, r4		; CHECK-BE-P9-NEXT: mtvsrwz v2, r4
; CHECK-BE-P9-NEXT: mtvsrd v3, r3		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI4_0@toc@l
; CHECK-BE-P9-NEXT: vmrghh v2, v3, v2		; CHECK-BE-P9-NEXT: lxv v4, 0(r3)
		; CHECK-BE-P9-NEXT: vperm v2, v3, v2, v4
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v8i16_v16i8:		; CHECK-AIX-64-P8-LABEL: test_v8i16_v16i8:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 56		; CHECK-AIX-64-P8-NEXT: ld r5, L..C4(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 48		; CHECK-AIX-64-P8-NEXT: mtvsrwz v2, r4
; CHECK-AIX-64-P8-NEXT: mtvsrd v2, r4		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3
; CHECK-AIX-64-P8-NEXT: mtvsrd v3, r3		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-64-P8-NEXT: vmrghh v2, v3, v2		; CHECK-AIX-64-P8-NEXT: vperm v2, v4, v2, v3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v8i16_v16i8:		; CHECK-AIX-64-P9-LABEL: test_v8i16_v16i8:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: sldi r4, r4, 56		; CHECK-AIX-64-P9-NEXT: mtvsrwz v3, r3
; CHECK-AIX-64-P9-NEXT: sldi r3, r3, 48		; CHECK-AIX-64-P9-NEXT: ld r3, L..C3(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: mtvsrd v2, r4		; CHECK-AIX-64-P9-NEXT: mtvsrwz v2, r4
; CHECK-AIX-64-P9-NEXT: mtvsrd v3, r3		; CHECK-AIX-64-P9-NEXT: lxv v4, 0(r3)
; CHECK-AIX-64-P9-NEXT: vmrghh v2, v3, v2		; CHECK-AIX-64-P9-NEXT: vperm v2, v3, v2, v4
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v8i16_v16i8:		; CHECK-AIX-32-P8-LABEL: test_v8i16_v16i8:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -32
; CHECK-AIX-32-P8-NEXT: stb r4, -32(r1)		; CHECK-AIX-32-P8-NEXT: stb r4, -32(r1)
; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5
; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)
▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
; CHECK-BE-P9-NEXT: lxv v2, 0(r4)		; CHECK-BE-P9-NEXT: lxv v2, 0(r4)
; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI5_0@toc@l		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI5_0@toc@l
; CHECK-BE-P9-NEXT: lxv v4, 0(r3)		; CHECK-BE-P9-NEXT: lxv v4, 0(r3)
; CHECK-BE-P9-NEXT: vperm v2, v2, v3, v4		; CHECK-BE-P9-NEXT: vperm v2, v2, v3, v4
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_none_v8i16:		; CHECK-AIX-64-P8-LABEL: test_none_v8i16:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: ld r5, L..C3(r2) # %const.0		; CHECK-AIX-64-P8-NEXT: ld r5, L..C5(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: lxvw4x v2, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvw4x v2, 0, r4
; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3
; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_none_v8i16:		; CHECK-AIX-64-P9-LABEL: test_none_v8i16:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: mtvsrwz v3, r3		; CHECK-AIX-64-P9-NEXT: mtvsrwz v3, r3
; CHECK-AIX-64-P9-NEXT: ld r3, L..C2(r2) # %const.0		; CHECK-AIX-64-P9-NEXT: ld r3, L..C4(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)		; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)
; CHECK-AIX-64-P9-NEXT: lxv v4, 0(r3)		; CHECK-AIX-64-P9-NEXT: lxv v4, 0(r3)
; CHECK-AIX-64-P9-NEXT: vperm v2, v2, v3, v4		; CHECK-AIX-64-P9-NEXT: vperm v2, v2, v3, v4
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_none_v8i16:		; CHECK-AIX-32-P8-LABEL: test_none_v8i16:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
; CHECK-BE-P9-LABEL: test_v8i16_none:		; CHECK-BE-P9-LABEL: test_v8i16_none:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: mtvsrwz v3, r5		; CHECK-BE-P9-NEXT: mtvsrwz v3, r5
; CHECK-BE-P9-NEXT: vinserth v2, v3, 0		; CHECK-BE-P9-NEXT: vinserth v2, v3, 0
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v8i16_none:		; CHECK-AIX-64-P8-LABEL: test_v8i16_none:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: ld r4, L..C4(r2) # %const.0		; CHECK-AIX-64-P8-NEXT: ld r4, L..C6(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3
; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r4
; CHECK-AIX-64-P8-NEXT: vperm v2, v4, v2, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v4, v2, v3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v8i16_none:		; CHECK-AIX-64-P9-LABEL: test_v8i16_none:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: mtvsrwz v3, r3		; CHECK-AIX-64-P9-NEXT: mtvsrwz v3, r3
Show All 15 Lines
; CHECK-AIX-32-P9-NEXT: mtvsrwz v3, r3		; CHECK-AIX-32-P9-NEXT: mtvsrwz v3, r3
; CHECK-AIX-32-P9-NEXT: vinserth v2, v3, 0		; CHECK-AIX-32-P9-NEXT: vinserth v2, v3, 0
; CHECK-AIX-32-P9-NEXT: blr		; CHECK-AIX-32-P9-NEXT: blr
entry:		entry:
%vecins = insertelement <8 x i16> %a, i16 %b, i32 0		%vecins = insertelement <8 x i16> %a, i16 %b, i32 0
ret <8 x i16> %vecins		ret <8 x i16> %vecins
}		}

define <16 x i8> @test_v16i8_v4i32(i8 %arg, i32 %arg1, <16 x i8> %a, <4 x i32> %b) {		define <16 x i8> @test_v16i8_v4i32(i8 %arg, i32 %arg1, <16 x i8> %a, <4 x i32> %b) {
		nemanjaiUnsubmitted Not Done Reply Inline Actions The code for this one gets worse on big endian. Do we know why? nemanjai: The code for this one gets worse on big endian. Do we know why?
; CHECK-LE-P8-LABEL: test_v16i8_v4i32:		; CHECK-LE-P8-LABEL: test_v16i8_v4i32:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtvsrd v2, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtvsrwz v3, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: vmrghb v2, v3, v2
; CHECK-LE-P8-NEXT: xxswapd v3, vs1
; CHECK-LE-P8-NEXT: vmrglb v2, v3, v2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v16i8_v4i32:		; CHECK-LE-P9-LABEL: test_v16i8_v4i32:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtvsrd v2, r3
; CHECK-LE-P9-NEXT: mtvsrws v3, r4		; CHECK-LE-P9-NEXT: mtvsrwz v3, r4
; CHECK-LE-P9-NEXT: xxswapd v2, vs0		; CHECK-LE-P9-NEXT: vmrghb v2, v3, v2
; CHECK-LE-P9-NEXT: vmrglb v2, v3, v2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v16i8_v4i32:		; CHECK-BE-P8-LABEL: test_v16i8_v4i32:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 56		; CHECK-BE-P8-NEXT: addis r5, r2, .LCPI7_0@toc@ha
; CHECK-BE-P8-NEXT: sldi r4, r4, 32		; CHECK-BE-P8-NEXT: mtvsrwz v2, r3
; CHECK-BE-P8-NEXT: mtvsrd v2, r3		; CHECK-BE-P8-NEXT: addi r5, r5, .LCPI7_0@toc@l
; CHECK-BE-P8-NEXT: mtvsrd v3, r4		; CHECK-BE-P8-NEXT: mtvsrwz v4, r4
; CHECK-BE-P8-NEXT: vmrghb v2, v2, v3		; CHECK-BE-P8-NEXT: lxvw4x v3, 0, r5
		; CHECK-BE-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v16i8_v4i32:		; CHECK-BE-P9-LABEL: test_v16i8_v4i32:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: sldi r3, r3, 56		; CHECK-BE-P9-NEXT: mtvsrwz v2, r3
; CHECK-BE-P9-NEXT: mtvsrws v3, r4		; CHECK-BE-P9-NEXT: addis r3, r2, .LCPI7_0@toc@ha
; CHECK-BE-P9-NEXT: mtvsrd v2, r3		; CHECK-BE-P9-NEXT: mtvsrwz v3, r4
; CHECK-BE-P9-NEXT: vmrghb v2, v2, v3		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI7_0@toc@l
		; CHECK-BE-P9-NEXT: lxv v4, 0(r3)
		; CHECK-BE-P9-NEXT: vperm v2, v2, v3, v4
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v16i8_v4i32:		; CHECK-AIX-64-P8-LABEL: test_v16i8_v4i32:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 56		; CHECK-AIX-64-P8-NEXT: ld r5, L..C7(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 32		; CHECK-AIX-64-P8-NEXT: mtvsrwz v2, r3
; CHECK-AIX-64-P8-NEXT: mtvsrd v2, r3		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r4
; CHECK-AIX-64-P8-NEXT: mtvsrd v3, r4		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-64-P8-NEXT: vmrghb v2, v2, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v16i8_v4i32:		; CHECK-AIX-64-P9-LABEL: test_v16i8_v4i32:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: sldi r3, r3, 56		; CHECK-AIX-64-P9-NEXT: mtvsrwz v2, r3
; CHECK-AIX-64-P9-NEXT: mtvsrws v3, r4		; CHECK-AIX-64-P9-NEXT: ld r3, L..C5(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: mtvsrd v2, r3		; CHECK-AIX-64-P9-NEXT: mtvsrwz v3, r4
; CHECK-AIX-64-P9-NEXT: vmrghb v2, v2, v3		; CHECK-AIX-64-P9-NEXT: lxv v4, 0(r3)
		; CHECK-AIX-64-P9-NEXT: vperm v2, v2, v3, v4
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v16i8_v4i32:		; CHECK-AIX-32-P8-LABEL: test_v16i8_v4i32:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5
Show All 14 Lines	entry:
%lhs.tmp = insertelement <16 x i8> %a, i8 %arg, i32 0		%lhs.tmp = insertelement <16 x i8> %a, i8 %arg, i32 0
%lhs = bitcast <16 x i8> %lhs.tmp to <16 x i8>		%lhs = bitcast <16 x i8> %lhs.tmp to <16 x i8>
%rhs.tmp = insertelement <4 x i32> %b, i32 %arg1, i32 0		%rhs.tmp = insertelement <4 x i32> %b, i32 %arg1, i32 0
%rhs = bitcast <4 x i32> %rhs.tmp to <16 x i8>		%rhs = bitcast <4 x i32> %rhs.tmp to <16 x i8>
%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 16, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 16, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v4i32_v16i8(i32 %arg, i8 %arg1) {		define <16 x i8> @test_v4i32_v16i8(i32 %arg, i8 %arg1) {
		nemanjaiUnsubmitted Not Done Reply Inline Actions The code for this one gets worse on big endian. Do we know why? nemanjai: The code for this one gets worse on big endian. Do we know why?
; CHECK-LE-P8-LABEL: test_v4i32_v16i8:		; CHECK-LE-P8-LABEL: test_v4i32_v16i8:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r4		; CHECK-LE-P8-NEXT: mtvsrd v2, r4
; CHECK-LE-P8-NEXT: mtfprd f1, r3		; CHECK-LE-P8-NEXT: mtvsrwz v3, r3
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: vmrghh v2, v2, v3
; CHECK-LE-P8-NEXT: xxswapd v3, vs1
; CHECK-LE-P8-NEXT: vmrglh v2, v2, v3
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v4i32_v16i8:		; CHECK-LE-P9-LABEL: test_v4i32_v16i8:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r4		; CHECK-LE-P9-NEXT: mtvsrd v2, r4
; CHECK-LE-P9-NEXT: mtvsrws v3, r3		; CHECK-LE-P9-NEXT: mtvsrwz v3, r3
; CHECK-LE-P9-NEXT: xxswapd v2, vs0		; CHECK-LE-P9-NEXT: vmrghh v2, v2, v3
; CHECK-LE-P9-NEXT: vmrglh v2, v2, v3
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v4i32_v16i8:		; CHECK-BE-P8-LABEL: test_v4i32_v16i8:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r4, r4, 56		; CHECK-BE-P8-NEXT: addis r5, r2, .LCPI8_0@toc@ha
; CHECK-BE-P8-NEXT: sldi r3, r3, 32		; CHECK-BE-P8-NEXT: mtvsrwz v2, r4
; CHECK-BE-P8-NEXT: mtvsrd v2, r4		; CHECK-BE-P8-NEXT: addi r5, r5, .LCPI8_0@toc@l
; CHECK-BE-P8-NEXT: mtvsrd v3, r3		; CHECK-BE-P8-NEXT: mtvsrwz v4, r3
; CHECK-BE-P8-NEXT: vmrghh v2, v3, v2		; CHECK-BE-P8-NEXT: lxvw4x v3, 0, r5
		; CHECK-BE-P8-NEXT: vperm v2, v4, v2, v3
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v4i32_v16i8:		; CHECK-BE-P9-LABEL: test_v4i32_v16i8:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: sldi r4, r4, 56		; CHECK-BE-P9-NEXT: mtvsrwz v3, r3
; CHECK-BE-P9-NEXT: mtvsrws v3, r3		; CHECK-BE-P9-NEXT: addis r3, r2, .LCPI8_0@toc@ha
; CHECK-BE-P9-NEXT: mtvsrd v2, r4		; CHECK-BE-P9-NEXT: mtvsrwz v2, r4
; CHECK-BE-P9-NEXT: vmrghh v2, v3, v2		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI8_0@toc@l
		; CHECK-BE-P9-NEXT: lxv v4, 0(r3)
		; CHECK-BE-P9-NEXT: vperm v2, v3, v2, v4
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v4i32_v16i8:		; CHECK-AIX-64-P8-LABEL: test_v4i32_v16i8:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 56		; CHECK-AIX-64-P8-NEXT: ld r5, L..C8(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 32		; CHECK-AIX-64-P8-NEXT: mtvsrwz v2, r4
; CHECK-AIX-64-P8-NEXT: mtvsrd v2, r4		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3
; CHECK-AIX-64-P8-NEXT: mtvsrd v3, r3		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-64-P8-NEXT: vmrghh v2, v3, v2		; CHECK-AIX-64-P8-NEXT: vperm v2, v4, v2, v3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v4i32_v16i8:		; CHECK-AIX-64-P9-LABEL: test_v4i32_v16i8:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: sldi r4, r4, 56		; CHECK-AIX-64-P9-NEXT: mtvsrwz v3, r3
; CHECK-AIX-64-P9-NEXT: mtvsrws v3, r3		; CHECK-AIX-64-P9-NEXT: ld r3, L..C6(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: mtvsrd v2, r4		; CHECK-AIX-64-P9-NEXT: mtvsrwz v2, r4
; CHECK-AIX-64-P9-NEXT: vmrghh v2, v3, v2		; CHECK-AIX-64-P9-NEXT: lxv v4, 0(r3)
		; CHECK-AIX-64-P9-NEXT: vperm v2, v3, v2, v4
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v4i32_v16i8:		; CHECK-AIX-32-P8-LABEL: test_v4i32_v16i8:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -32
; CHECK-AIX-32-P8-NEXT: stb r4, -32(r1)		; CHECK-AIX-32-P8-NEXT: stb r4, -32(r1)
; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5
; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)
▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: mtfprwz f0, r5		; CHECK-BE-P9-NEXT: mtfprwz f0, r5
; CHECK-BE-P9-NEXT: xxinsertw v2, vs0, 4		; CHECK-BE-P9-NEXT: xxinsertw v2, vs0, 4
; CHECK-BE-P9-NEXT: xxinsertw v2, vs0, 12		; CHECK-BE-P9-NEXT: xxinsertw v2, vs0, 12
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_none_v4i32:		; CHECK-AIX-64-P8-LABEL: test_none_v4i32:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: ld r4, L..C5(r2) # %const.0		; CHECK-AIX-64-P8-NEXT: ld r4, L..C9(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3
; CHECK-AIX-64-P8-NEXT: ld r3, L..C6(r2) # %const.1		; CHECK-AIX-64-P8-NEXT: ld r3, L..C10(r2) # %const.1
; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r4
; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r3		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r3
; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_none_v4i32:		; CHECK-AIX-64-P9-LABEL: test_none_v4i32:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
▲ Show 20 Lines • Show All 74 Lines • ▼ Show 20 Lines
; CHECK-BE-P9-NEXT: lxv v4, 0(r3)		; CHECK-BE-P9-NEXT: lxv v4, 0(r3)
; CHECK-BE-P9-NEXT: vspltb v3, v3, 7		; CHECK-BE-P9-NEXT: vspltb v3, v3, 7
; CHECK-BE-P9-NEXT: vperm v2, v2, v3, v4		; CHECK-BE-P9-NEXT: vperm v2, v2, v3, v4
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v4i32_none:		; CHECK-AIX-64-P8-LABEL: test_v4i32_none:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: lbzx r4, 0, r4		; CHECK-AIX-64-P8-NEXT: lbzx r4, 0, r4
; CHECK-AIX-64-P8-NEXT: ld r5, L..C7(r2) # %const.0		; CHECK-AIX-64-P8-NEXT: ld r5, L..C11(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: lxsiwzx v3, 0, r3		; CHECK-AIX-64-P8-NEXT: lxsiwzx v3, 0, r3
; CHECK-AIX-64-P8-NEXT: mtvsrwz v2, r4		; CHECK-AIX-64-P8-NEXT: mtvsrwz v2, r4
; CHECK-AIX-64-P8-NEXT: lxvw4x v4, 0, r5		; CHECK-AIX-64-P8-NEXT: lxvw4x v4, 0, r5
; CHECK-AIX-64-P8-NEXT: vspltb v2, v2, 7		; CHECK-AIX-64-P8-NEXT: vspltb v2, v2, 7
; CHECK-AIX-64-P8-NEXT: vperm v2, v3, v2, v4		; CHECK-AIX-64-P8-NEXT: vperm v2, v3, v2, v4
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v4i32_none:		; CHECK-AIX-64-P9-LABEL: test_v4i32_none:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lxsiwzx v2, 0, r3		; CHECK-AIX-64-P9-NEXT: lxsiwzx v2, 0, r3
; CHECK-AIX-64-P9-NEXT: ld r3, L..C3(r2) # %const.0		; CHECK-AIX-64-P9-NEXT: ld r3, L..C7(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: lxsibzx v3, 0, r4		; CHECK-AIX-64-P9-NEXT: lxsibzx v3, 0, r4
; CHECK-AIX-64-P9-NEXT: lxv v4, 0(r3)		; CHECK-AIX-64-P9-NEXT: lxv v4, 0(r3)
; CHECK-AIX-64-P9-NEXT: vspltb v3, v3, 7		; CHECK-AIX-64-P9-NEXT: vspltb v3, v3, 7
; CHECK-AIX-64-P9-NEXT: vperm v2, v2, v3, v4		; CHECK-AIX-64-P9-NEXT: vperm v2, v2, v3, v4
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v4i32_none:		; CHECK-AIX-32-P8-LABEL: test_v4i32_none:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
Show All 26 Lines	entry:
%3 = bitcast <16 x i8> %vecinit6 to <16 x i8>		%3 = bitcast <16 x i8> %vecinit6 to <16 x i8>
%shuffle = shufflevector <16 x i8> %2, <16 x i8> %3, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %2, <16 x i8> %3, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v16i8_v2i64(i8 %arg, i64 %arg1, <16 x i8> %a, <2 x i64> %b) {		define <16 x i8> @test_v16i8_v2i64(i8 %arg, i64 %arg1, <16 x i8> %a, <2 x i64> %b) {
; CHECK-LE-P8-LABEL: test_v16i8_v2i64:		; CHECK-LE-P8-LABEL: test_v16i8_v2i64:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtvsrd v2, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtvsrd v3, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: vmrghb v2, v3, v2
; CHECK-LE-P8-NEXT: xxswapd v3, vs1
; CHECK-LE-P8-NEXT: vmrglb v2, v3, v2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v16i8_v2i64:		; CHECK-LE-P9-LABEL: test_v16i8_v2i64:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtvsrd v2, r3
; CHECK-LE-P9-NEXT: xxswapd v2, vs0		; CHECK-LE-P9-NEXT: mtvsrd v3, r4
; CHECK-LE-P9-NEXT: mtfprd f0, r4		; CHECK-LE-P9-NEXT: vmrghb v2, v3, v2
; CHECK-LE-P9-NEXT: xxswapd v3, vs0
; CHECK-LE-P9-NEXT: vmrglb v2, v3, v2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v16i8_v2i64:		; CHECK-BE-P8-LABEL: test_v16i8_v2i64:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 56		; CHECK-BE-P8-NEXT: sldi r3, r3, 56
; CHECK-BE-P8-NEXT: mtvsrd v3, r4		; CHECK-BE-P8-NEXT: mtvsrd v3, r4
; CHECK-BE-P8-NEXT: mtvsrd v2, r3		; CHECK-BE-P8-NEXT: mtvsrd v2, r3
; CHECK-BE-P8-NEXT: vmrghb v2, v2, v3		; CHECK-BE-P8-NEXT: vmrghb v2, v2, v3
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines	entry:
%rhs = bitcast <2 x i64> %rhs.tmp to <16 x i8>		%rhs = bitcast <2 x i64> %rhs.tmp to <16 x i8>
%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 16, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 16, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v2i64_v16i8(i64 %arg, i8 %arg1) {		define <16 x i8> @test_v2i64_v16i8(i64 %arg, i8 %arg1) {
; CHECK-LE-P8-LABEL: test_v2i64_v16i8:		; CHECK-LE-P8-LABEL: test_v2i64_v16i8:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r4		; CHECK-LE-P8-NEXT: mtvsrd v2, r4
; CHECK-LE-P8-NEXT: mtfprd f1, r3		; CHECK-LE-P8-NEXT: mtvsrd v3, r3
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: vmrghh v2, v2, v3
; CHECK-LE-P8-NEXT: xxswapd v3, vs1
; CHECK-LE-P8-NEXT: vmrglh v2, v2, v3
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v2i64_v16i8:		; CHECK-LE-P9-LABEL: test_v2i64_v16i8:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r4		; CHECK-LE-P9-NEXT: mtvsrd v2, r4
; CHECK-LE-P9-NEXT: xxswapd v2, vs0		; CHECK-LE-P9-NEXT: mtvsrd v3, r3
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: vmrghh v2, v2, v3
; CHECK-LE-P9-NEXT: xxswapd v3, vs0
; CHECK-LE-P9-NEXT: vmrglh v2, v2, v3
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v2i64_v16i8:		; CHECK-BE-P8-LABEL: test_v2i64_v16i8:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r4, r4, 56		; CHECK-BE-P8-NEXT: sldi r4, r4, 56
; CHECK-BE-P8-NEXT: mtvsrd v3, r3		; CHECK-BE-P8-NEXT: mtvsrd v3, r3
; CHECK-BE-P8-NEXT: mtvsrd v2, r4		; CHECK-BE-P8-NEXT: mtvsrd v2, r4
; CHECK-BE-P8-NEXT: vmrghh v2, v3, v2		; CHECK-BE-P8-NEXT: vmrghh v2, v3, v2
▲ Show 20 Lines • Show All 355 Lines • ▼ Show 20 Lines
; CHECK-BE-P9-NEXT: mtvsrwz v4, r3		; CHECK-BE-P9-NEXT: mtvsrwz v4, r3
; CHECK-BE-P9-NEXT: addi r5, r5, .LCPI16_0@toc@l		; CHECK-BE-P9-NEXT: addi r5, r5, .LCPI16_0@toc@l
; CHECK-BE-P9-NEXT: lxv v2, 0(r5)		; CHECK-BE-P9-NEXT: lxv v2, 0(r5)
; CHECK-BE-P9-NEXT: vperm v2, v4, v3, v2		; CHECK-BE-P9-NEXT: vperm v2, v4, v3, v2
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v8i16_v8i16rhs:		; CHECK-AIX-64-P8-LABEL: test_v8i16_v8i16rhs:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: ld r5, L..C8(r2) # %const.0		; CHECK-AIX-64-P8-NEXT: ld r5, L..C12(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: mtvsrwz v2, r4		; CHECK-AIX-64-P8-NEXT: mtvsrwz v2, r4
; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3
; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-64-P8-NEXT: vperm v2, v4, v2, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v4, v2, v3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v8i16_v8i16rhs:		; CHECK-AIX-64-P9-LABEL: test_v8i16_v8i16rhs:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: ld r5, L..C4(r2) # %const.0		; CHECK-AIX-64-P9-NEXT: ld r5, L..C8(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: mtvsrwz v3, r4		; CHECK-AIX-64-P9-NEXT: mtvsrwz v3, r4
; CHECK-AIX-64-P9-NEXT: mtvsrwz v4, r3		; CHECK-AIX-64-P9-NEXT: mtvsrwz v4, r3
; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r5)		; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r5)
; CHECK-AIX-64-P9-NEXT: vperm v2, v4, v3, v2		; CHECK-AIX-64-P9-NEXT: vperm v2, v4, v3, v2
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v8i16_v8i16rhs:		; CHECK-AIX-32-P8-LABEL: test_v8i16_v8i16rhs:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
Show All 18 Lines	entry:
%rhs.tmp = insertelement <8 x i16> undef, i16 %arg1, i32 0		%rhs.tmp = insertelement <8 x i16> undef, i16 %arg1, i32 0
%rhs = bitcast <8 x i16> %rhs.tmp to <16 x i8>		%rhs = bitcast <8 x i16> %rhs.tmp to <16 x i8>
%lhs.tmp = insertelement <8 x i16> undef, i16 %arg, i32 0		%lhs.tmp = insertelement <8 x i16> undef, i16 %arg, i32 0
%lhs = bitcast <8 x i16> %lhs.tmp to <16 x i8>		%lhs = bitcast <8 x i16> %lhs.tmp to <16 x i8>
%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v8i16_v4i32(<8 x i16> %a, <4 x i32> %b, i16 %arg, i32 %arg1) {		define <16 x i8> @test_v8i16_v4i32(<8 x i16> %a, <4 x i32> %b, i16 %arg, i32 %arg1) {
		nemanjaiUnsubmitted Not Done Reply Inline Actions The code for this one gets worse on big endian. Do we know why? nemanjai: The code for this one gets worse on big endian. Do we know why?
; CHECK-LE-P8-LABEL: test_v8i16_v4i32:		; CHECK-LE-P8-LABEL: test_v8i16_v4i32:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r7		; CHECK-LE-P8-NEXT: mtvsrd v2, r7
; CHECK-LE-P8-NEXT: mtfprd f1, r8		; CHECK-LE-P8-NEXT: mtvsrwz v3, r8
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: vmrghb v2, v3, v2
; CHECK-LE-P8-NEXT: xxswapd v3, vs1
; CHECK-LE-P8-NEXT: vmrglb v2, v3, v2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v8i16_v4i32:		; CHECK-LE-P9-LABEL: test_v8i16_v4i32:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r7		; CHECK-LE-P9-NEXT: mtvsrd v2, r7
; CHECK-LE-P9-NEXT: mtvsrws v3, r8		; CHECK-LE-P9-NEXT: mtvsrwz v3, r8
; CHECK-LE-P9-NEXT: xxswapd v2, vs0		; CHECK-LE-P9-NEXT: vmrghb v2, v3, v2
; CHECK-LE-P9-NEXT: vmrglb v2, v3, v2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v8i16_v4i32:		; CHECK-BE-P8-LABEL: test_v8i16_v4i32:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r7, 48		; CHECK-BE-P8-NEXT: addis r3, r2, .LCPI17_0@toc@ha
; CHECK-BE-P8-NEXT: sldi r4, r8, 32		; CHECK-BE-P8-NEXT: mtvsrwz v2, r7
; CHECK-BE-P8-NEXT: mtvsrd v2, r3		; CHECK-BE-P8-NEXT: addi r3, r3, .LCPI17_0@toc@l
; CHECK-BE-P8-NEXT: mtvsrd v3, r4		; CHECK-BE-P8-NEXT: mtvsrwz v4, r8
; CHECK-BE-P8-NEXT: vmrghb v2, v2, v3		; CHECK-BE-P8-NEXT: lxvw4x v3, 0, r3
		; CHECK-BE-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v8i16_v4i32:		; CHECK-BE-P9-LABEL: test_v8i16_v4i32:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: sldi r3, r7, 48		; CHECK-BE-P9-NEXT: addis r3, r2, .LCPI17_0@toc@ha
; CHECK-BE-P9-NEXT: mtvsrws v3, r8		; CHECK-BE-P9-NEXT: mtvsrwz v2, r7
; CHECK-BE-P9-NEXT: mtvsrd v2, r3		; CHECK-BE-P9-NEXT: mtvsrwz v3, r8
; CHECK-BE-P9-NEXT: vmrghb v2, v2, v3		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI17_0@toc@l
		; CHECK-BE-P9-NEXT: lxv v4, 0(r3)
		; CHECK-BE-P9-NEXT: vperm v2, v2, v3, v4
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v8i16_v4i32:		; CHECK-AIX-64-P8-LABEL: test_v8i16_v4i32:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 48		; CHECK-AIX-64-P8-NEXT: ld r5, L..C13(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 32		; CHECK-AIX-64-P8-NEXT: mtvsrwz v2, r3
; CHECK-AIX-64-P8-NEXT: mtvsrd v2, r3		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r4
; CHECK-AIX-64-P8-NEXT: mtvsrd v3, r4		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-64-P8-NEXT: vmrghb v2, v2, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v8i16_v4i32:		; CHECK-AIX-64-P9-LABEL: test_v8i16_v4i32:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: sldi r3, r3, 48		; CHECK-AIX-64-P9-NEXT: mtvsrwz v2, r3
; CHECK-AIX-64-P9-NEXT: mtvsrws v3, r4		; CHECK-AIX-64-P9-NEXT: ld r3, L..C9(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: mtvsrd v2, r3		; CHECK-AIX-64-P9-NEXT: mtvsrwz v3, r4
; CHECK-AIX-64-P9-NEXT: vmrghb v2, v2, v3		; CHECK-AIX-64-P9-NEXT: lxv v4, 0(r3)
		; CHECK-AIX-64-P9-NEXT: vperm v2, v2, v3, v4
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v8i16_v4i32:		; CHECK-AIX-32-P8-LABEL: test_v8i16_v4i32:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5
Show All 17 Lines	entry:
%rhs = bitcast <4 x i32> %rhs.tmp to <16 x i8>		%rhs = bitcast <4 x i32> %rhs.tmp to <16 x i8>
%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 16, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 16, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v8i16_v2i64(<8 x i16> %a, <2 x i64> %b, i16 %arg, i64 %arg1) {		define <16 x i8> @test_v8i16_v2i64(<8 x i16> %a, <2 x i64> %b, i16 %arg, i64 %arg1) {
; CHECK-LE-P8-LABEL: test_v8i16_v2i64:		; CHECK-LE-P8-LABEL: test_v8i16_v2i64:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r7		; CHECK-LE-P8-NEXT: mtvsrd v2, r7
; CHECK-LE-P8-NEXT: mtfprd f1, r8		; CHECK-LE-P8-NEXT: mtvsrd v3, r8
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: vmrghb v2, v3, v2
; CHECK-LE-P8-NEXT: xxswapd v3, vs1
; CHECK-LE-P8-NEXT: vmrglb v2, v3, v2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v8i16_v2i64:		; CHECK-LE-P9-LABEL: test_v8i16_v2i64:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r7		; CHECK-LE-P9-NEXT: mtvsrd v2, r7
; CHECK-LE-P9-NEXT: xxswapd v2, vs0		; CHECK-LE-P9-NEXT: mtvsrd v3, r8
; CHECK-LE-P9-NEXT: mtfprd f0, r8		; CHECK-LE-P9-NEXT: vmrghb v2, v3, v2
; CHECK-LE-P9-NEXT: xxswapd v3, vs0
; CHECK-LE-P9-NEXT: vmrglb v2, v3, v2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v8i16_v2i64:		; CHECK-BE-P8-LABEL: test_v8i16_v2i64:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r7, 48		; CHECK-BE-P8-NEXT: sldi r3, r7, 48
; CHECK-BE-P8-NEXT: mtvsrd v3, r8		; CHECK-BE-P8-NEXT: mtvsrd v3, r8
; CHECK-BE-P8-NEXT: mtvsrd v2, r3		; CHECK-BE-P8-NEXT: mtvsrd v2, r3
; CHECK-BE-P8-NEXT: vmrghb v2, v2, v3		; CHECK-BE-P8-NEXT: vmrghb v2, v2, v3
▲ Show 20 Lines • Show All 117 Lines • ▼ Show 20 Lines	entry:
%lhs.tmp = insertelement <4 x i32> %a, i32 %arg, i32 0		%lhs.tmp = insertelement <4 x i32> %a, i32 %arg, i32 0
%lhs = bitcast <4 x i32> %lhs.tmp to <16 x i8>		%lhs = bitcast <4 x i32> %lhs.tmp to <16 x i8>
%rhs.tmp = insertelement <4 x i32> %b, i32 %arg1, i32 0		%rhs.tmp = insertelement <4 x i32> %b, i32 %arg1, i32 0
%rhs = bitcast <4 x i32> %rhs.tmp to <16 x i8>		%rhs = bitcast <4 x i32> %rhs.tmp to <16 x i8>
%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 16, i32 17, i32 18, i32 19, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 16, i32 17, i32 18, i32 19, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v4i32_v8i16(i32 %arg, i16 %arg1) {		define <16 x i8> @test_v4i32_v8i16(i32 %arg, i16 %arg1) {
		nemanjaiUnsubmitted Not Done Reply Inline Actions The code for this one gets worse on big endian. Do we know why? There are probably a bunch of other places. Can you please review what is happening there? I'll stop adding further similar comments. nemanjai: The code for this one gets worse on big endian. Do we know why? There are probably a bunch of…
; CHECK-LE-P8-LABEL: test_v4i32_v8i16:		; CHECK-LE-P8-LABEL: test_v4i32_v8i16:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtvsrwz v2, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtvsrd v3, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: vmrghh v2, v3, v2
; CHECK-LE-P8-NEXT: xxswapd v3, vs1
; CHECK-LE-P8-NEXT: vmrglh v2, v3, v2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v4i32_v8i16:		; CHECK-LE-P9-LABEL: test_v4i32_v8i16:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r4		; CHECK-LE-P9-NEXT: mtvsrwz v2, r3
; CHECK-LE-P9-NEXT: mtvsrws v2, r3		; CHECK-LE-P9-NEXT: mtvsrd v3, r4
; CHECK-LE-P9-NEXT: xxswapd v3, vs0		; CHECK-LE-P9-NEXT: vmrghh v2, v3, v2
; CHECK-LE-P9-NEXT: vmrglh v2, v3, v2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v4i32_v8i16:		; CHECK-BE-P8-LABEL: test_v4i32_v8i16:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 32		; CHECK-BE-P8-NEXT: addis r5, r2, .LCPI20_0@toc@ha
; CHECK-BE-P8-NEXT: sldi r4, r4, 48		; CHECK-BE-P8-NEXT: mtvsrwz v2, r3
; CHECK-BE-P8-NEXT: mtvsrd v2, r3		; CHECK-BE-P8-NEXT: addi r5, r5, .LCPI20_0@toc@l
; CHECK-BE-P8-NEXT: mtvsrd v3, r4		; CHECK-BE-P8-NEXT: mtvsrwz v4, r4
; CHECK-BE-P8-NEXT: vmrghh v2, v2, v3		; CHECK-BE-P8-NEXT: lxvw4x v3, 0, r5
		; CHECK-BE-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v4i32_v8i16:		; CHECK-BE-P9-LABEL: test_v4i32_v8i16:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: mtvsrws v2, r3		; CHECK-BE-P9-NEXT: mtvsrwz v2, r3
; CHECK-BE-P9-NEXT: sldi r3, r4, 48		; CHECK-BE-P9-NEXT: addis r3, r2, .LCPI20_0@toc@ha
; CHECK-BE-P9-NEXT: mtvsrd v3, r3		; CHECK-BE-P9-NEXT: mtvsrwz v3, r4
; CHECK-BE-P9-NEXT: vmrghh v2, v2, v3		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI20_0@toc@l
		; CHECK-BE-P9-NEXT: lxv v4, 0(r3)
		; CHECK-BE-P9-NEXT: vperm v2, v2, v3, v4
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v4i32_v8i16:		; CHECK-AIX-64-P8-LABEL: test_v4i32_v8i16:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 32		; CHECK-AIX-64-P8-NEXT: ld r5, L..C14(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 48		; CHECK-AIX-64-P8-NEXT: mtvsrwz v2, r3
; CHECK-AIX-64-P8-NEXT: mtvsrd v2, r3		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r4
; CHECK-AIX-64-P8-NEXT: mtvsrd v3, r4		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-64-P8-NEXT: vmrghh v2, v2, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v4i32_v8i16:		; CHECK-AIX-64-P9-LABEL: test_v4i32_v8i16:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: mtvsrws v2, r3		; CHECK-AIX-64-P9-NEXT: mtvsrwz v2, r3
; CHECK-AIX-64-P9-NEXT: sldi r3, r4, 48		; CHECK-AIX-64-P9-NEXT: ld r3, L..C10(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: mtvsrd v3, r3		; CHECK-AIX-64-P9-NEXT: mtvsrwz v3, r4
; CHECK-AIX-64-P9-NEXT: vmrghh v2, v2, v3		; CHECK-AIX-64-P9-NEXT: lxv v4, 0(r3)
		; CHECK-AIX-64-P9-NEXT: vperm v2, v2, v3, v4
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v4i32_v8i16:		; CHECK-AIX-32-P8-LABEL: test_v4i32_v8i16:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5
▲ Show 20 Lines • Show All 92 Lines • ▼ Show 20 Lines	entry:
%shuffle = shufflevector <16 x i8> %2, <16 x i8> %3, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %2, <16 x i8> %3, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v2i64_v4i32(i64 %arg, i32 %arg1, <2 x i64> %a, <4 x i32> %b) {		define <16 x i8> @test_v2i64_v4i32(i64 %arg, i32 %arg1, <2 x i64> %a, <4 x i32> %b) {
; CHECK-LE-P8-LABEL: test_v2i64_v4i32:		; CHECK-LE-P8-LABEL: test_v2i64_v4i32:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprwz f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxmrghw v2, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd vs1, vs1
; CHECK-LE-P8-NEXT: xxmrglw v2, vs1, vs0
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v2i64_v4i32:		; CHECK-LE-P9-LABEL: test_v2i64_v4i32:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: mtvsrws vs1, r4		; CHECK-LE-P9-NEXT: mtfprwz f1, r4
; CHECK-LE-P9-NEXT: xxswapd vs0, vs0		; CHECK-LE-P9-NEXT: xxmrghw v2, vs1, vs0
; CHECK-LE-P9-NEXT: xxmrglw v2, vs1, vs0
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v2i64_v4i32:		; CHECK-BE-P8-LABEL: test_v2i64_v4i32:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: mtfprd f0, r3
; CHECK-BE-P8-NEXT: sldi r3, r4, 32		; CHECK-BE-P8-NEXT: sldi r3, r4, 32
; CHECK-BE-P8-NEXT: mtfprd f1, r3		; CHECK-BE-P8-NEXT: mtfprd f1, r3
; CHECK-BE-P8-NEXT: xxmrghw v2, vs0, vs1		; CHECK-BE-P8-NEXT: xxmrghw v2, vs0, vs1
▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines	entry:
%rhs = bitcast <4 x i32> %rhs.tmp to <16 x i8>		%rhs = bitcast <4 x i32> %rhs.tmp to <16 x i8>
%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 16, i32 17, i32 18, i32 19, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 16, i32 17, i32 18, i32 19, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v2i64_v8i16(i64 %arg, i16 %arg1) {		define <16 x i8> @test_v2i64_v8i16(i64 %arg, i16 %arg1) {
; CHECK-LE-P8-LABEL: test_v2i64_v8i16:		; CHECK-LE-P8-LABEL: test_v2i64_v8i16:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtvsrd v2, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtvsrd v3, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: vmrghh v2, v3, v2
; CHECK-LE-P8-NEXT: xxswapd v3, vs1
; CHECK-LE-P8-NEXT: vmrglh v2, v3, v2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v2i64_v8i16:		; CHECK-LE-P9-LABEL: test_v2i64_v8i16:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtvsrd v2, r3
; CHECK-LE-P9-NEXT: xxswapd v2, vs0		; CHECK-LE-P9-NEXT: mtvsrd v3, r4
; CHECK-LE-P9-NEXT: mtfprd f0, r4		; CHECK-LE-P9-NEXT: vmrghh v2, v3, v2
; CHECK-LE-P9-NEXT: xxswapd v3, vs0
; CHECK-LE-P9-NEXT: vmrglh v2, v3, v2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v2i64_v8i16:		; CHECK-BE-P8-LABEL: test_v2i64_v8i16:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: mtvsrd v2, r3		; CHECK-BE-P8-NEXT: mtvsrd v2, r3
; CHECK-BE-P8-NEXT: sldi r3, r4, 48		; CHECK-BE-P8-NEXT: sldi r3, r4, 48
; CHECK-BE-P8-NEXT: mtvsrd v3, r3		; CHECK-BE-P8-NEXT: mtvsrd v3, r3
; CHECK-BE-P8-NEXT: vmrghh v2, v2, v3		; CHECK-BE-P8-NEXT: vmrghh v2, v2, v3
▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines	entry:
%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v4i32_v2i64(ptr nocapture noundef readonly %a, ptr nocapture noundef readonly %b) {		define <16 x i8> @test_v4i32_v2i64(ptr nocapture noundef readonly %a, ptr nocapture noundef readonly %b) {
; CHECK-LE-P8-LABEL: test_v4i32_v2i64:		; CHECK-LE-P8-LABEL: test_v4i32_v2i64:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: addis r5, r2, .LCPI24_0@toc@ha		; CHECK-LE-P8-NEXT: addis r5, r2, .LCPI24_0@toc@ha
; CHECK-LE-P8-NEXT: lfiwzx f0, 0, r3		; CHECK-LE-P8-NEXT: lxsiwzx v2, 0, r3
; CHECK-LE-P8-NEXT: lfdx f1, 0, r4		; CHECK-LE-P8-NEXT: lxsdx v3, 0, r4
; CHECK-LE-P8-NEXT: addi r3, r5, .LCPI24_0@toc@l		; CHECK-LE-P8-NEXT: addi r5, r5, .LCPI24_0@toc@l
; CHECK-LE-P8-NEXT: lxvd2x vs2, 0, r3		; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r5
; CHECK-LE-P8-NEXT: xxswapd v2, f0		; CHECK-LE-P8-NEXT: xxswapd v4, vs0
; CHECK-LE-P8-NEXT: xxswapd v3, f1
; CHECK-LE-P8-NEXT: xxswapd v4, vs2
; CHECK-LE-P8-NEXT: vperm v2, v3, v2, v4		; CHECK-LE-P8-NEXT: vperm v2, v3, v2, v4
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v4i32_v2i64:		; CHECK-LE-P9-LABEL: test_v4i32_v2i64:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lfiwzx f0, 0, r3		; CHECK-LE-P9-NEXT: lxsiwzx v2, 0, r3
; CHECK-LE-P9-NEXT: addis r3, r2, .LCPI24_0@toc@ha		; CHECK-LE-P9-NEXT: addis r3, r2, .LCPI24_0@toc@ha
		; CHECK-LE-P9-NEXT: lxsd v3, 0(r4)
; CHECK-LE-P9-NEXT: addi r3, r3, .LCPI24_0@toc@l		; CHECK-LE-P9-NEXT: addi r3, r3, .LCPI24_0@toc@l
; CHECK-LE-P9-NEXT: xxswapd v2, f0
; CHECK-LE-P9-NEXT: lfd f0, 0(r4)
; CHECK-LE-P9-NEXT: lxv v4, 0(r3)		; CHECK-LE-P9-NEXT: lxv v4, 0(r3)
; CHECK-LE-P9-NEXT: xxswapd v3, f0
; CHECK-LE-P9-NEXT: vperm v2, v3, v2, v4		; CHECK-LE-P9-NEXT: vperm v2, v3, v2, v4
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v4i32_v2i64:		; CHECK-BE-P8-LABEL: test_v4i32_v2i64:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lfiwzx f0, 0, r3		; CHECK-BE-P8-NEXT: lfiwzx f0, 0, r3
; CHECK-BE-P8-NEXT: addis r5, r2, .LCPI24_0@toc@ha		; CHECK-BE-P8-NEXT: addis r5, r2, .LCPI24_0@toc@ha
; CHECK-BE-P8-NEXT: lxsdx v3, 0, r4		; CHECK-BE-P8-NEXT: lxsdx v3, 0, r4
Show All 11 Lines
; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI24_0@toc@l		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI24_0@toc@l
; CHECK-BE-P9-NEXT: lxv v4, 0(r3)		; CHECK-BE-P9-NEXT: lxv v4, 0(r3)
; CHECK-BE-P9-NEXT: xxsldwi v2, f0, f0, 1		; CHECK-BE-P9-NEXT: xxsldwi v2, f0, f0, 1
; CHECK-BE-P9-NEXT: vperm v2, v2, v3, v4		; CHECK-BE-P9-NEXT: vperm v2, v2, v3, v4
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v4i32_v2i64:		; CHECK-AIX-64-P8-LABEL: test_v4i32_v2i64:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: ld r5, L..C9(r2) # %const.0		; CHECK-AIX-64-P8-NEXT: ld r5, L..C15(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: lfiwzx f0, 0, r3		; CHECK-AIX-64-P8-NEXT: lfiwzx f0, 0, r3
; CHECK-AIX-64-P8-NEXT: lxsdx v3, 0, r4		; CHECK-AIX-64-P8-NEXT: lxsdx v3, 0, r4
; CHECK-AIX-64-P8-NEXT: xxsldwi v2, f0, f0, 1		; CHECK-AIX-64-P8-NEXT: xxsldwi v2, f0, f0, 1
; CHECK-AIX-64-P8-NEXT: lxvw4x v4, 0, r5		; CHECK-AIX-64-P8-NEXT: lxvw4x v4, 0, r5
; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v3, v4		; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v3, v4
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v4i32_v2i64:		; CHECK-AIX-64-P9-LABEL: test_v4i32_v2i64:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lfiwzx f0, 0, r3		; CHECK-AIX-64-P9-NEXT: lfiwzx f0, 0, r3
; CHECK-AIX-64-P9-NEXT: ld r3, L..C5(r2) # %const.0		; CHECK-AIX-64-P9-NEXT: ld r3, L..C11(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: lxsd v3, 0(r4)		; CHECK-AIX-64-P9-NEXT: lxsd v3, 0(r4)
; CHECK-AIX-64-P9-NEXT: xxsldwi v2, f0, f0, 1		; CHECK-AIX-64-P9-NEXT: xxsldwi v2, f0, f0, 1
; CHECK-AIX-64-P9-NEXT: lxv v4, 0(r3)		; CHECK-AIX-64-P9-NEXT: lxv v4, 0(r3)
; CHECK-AIX-64-P9-NEXT: vperm v2, v2, v3, v4		; CHECK-AIX-64-P9-NEXT: vperm v2, v2, v3, v4
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v4i32_v2i64:		; CHECK-AIX-32-P8-LABEL: test_v4i32_v2i64:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
▲ Show 20 Lines • Show All 41 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/v2i64_scalar_to_vector_shuffle.ll

Show All 24 Lines
; RUN: -ppc-vsr-nums-as-vr -mtriple=powerpc-ibm-aix < %s \| \		; RUN: -ppc-vsr-nums-as-vr -mtriple=powerpc-ibm-aix < %s \| \
; RUN: FileCheck %s --check-prefix=CHECK-AIX-32-P9		; RUN: FileCheck %s --check-prefix=CHECK-AIX-32-P9

define <2 x i64> @test_v16i8_v16i8(i8 %arg1, i8 %arg) {		define <2 x i64> @test_v16i8_v16i8(i8 %arg1, i8 %arg) {
; CHECK-LE-P8-LABEL: test_v16i8_v16i8:		; CHECK-LE-P8-LABEL: test_v16i8_v16i8:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxmrgld v2, vs1, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v16i8_v16i8:		; CHECK-LE-P9-LABEL: test_v16i8_v16i8:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: mtfprd f1, r4		; CHECK-LE-P9-NEXT: mtfprd f1, r4
; CHECK-LE-P9-NEXT: xxmrgld v2, vs1, vs0		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v16i8_v16i8:		; CHECK-BE-P8-LABEL: test_v16i8_v16i8:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: mtfprwz f0, r3		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: mtfprwz f1, r4		; CHECK-BE-P8-NEXT: mtfprwz f1, r4
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1		; CHECK-BE-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v16i8_v16i8:		; CHECK-BE-P9-LABEL: test_v16i8_v16i8:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: mtfprwz f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: mtfprwz f1, r4		; CHECK-BE-P9-NEXT: mtfprwz f1, r4
; CHECK-BE-P9-NEXT: xxmrghd v2, vs0, vs1		; CHECK-BE-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v16i8_v16i8:		; CHECK-AIX-64-P8-LABEL: test_v16i8_v16i8:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4		; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs1		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v16i8_v16i8:		; CHECK-AIX-64-P9-LABEL: test_v16i8_v16i8:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4		; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs0, vs1		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v16i8_v16i8:		; CHECK-AIX-32-P8-LABEL: test_v16i8_v16i8:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
Show All 20 Lines
}		}

define <2 x i64> @test_none_v16i8(i8 %arg1, ptr nocapture noundef readonly %b) {		define <2 x i64> @test_none_v16i8(i8 %arg1, ptr nocapture noundef readonly %b) {
; CHECK-LE-P8-LABEL: test_none_v16i8:		; CHECK-LE-P8-LABEL: test_none_v16i8:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4		; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: xxswapd v2, vs0
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: xxmrgld v2, vs0, v2		; CHECK-LE-P8-NEXT: xxpermdi v2, vs0, v2, 1
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_none_v16i8:		; CHECK-LE-P9-LABEL: test_none_v16i8:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxv v2, 0(r4)		; CHECK-LE-P9-NEXT: lxv v2, 0(r4)
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: xxmrgld v2, vs0, v2		; CHECK-LE-P9-NEXT: xxpermdi v2, vs0, v2, 1
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_none_v16i8:		; CHECK-BE-P8-LABEL: test_none_v16i8:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-BE-P8-NEXT: mtfprwz f0, r3		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P8-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_none_v16i8:		; CHECK-BE-P9-LABEL: test_none_v16i8:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: lxv v2, 0(r4)		; CHECK-BE-P9-NEXT: lxv v2, 0(r4)
; CHECK-BE-P9-NEXT: mtfprwz f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P9-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_none_v16i8:		; CHECK-AIX-64-P8-LABEL: test_none_v16i8:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P8-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_none_v16i8:		; CHECK-AIX-64-P9-LABEL: test_none_v16i8:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)		; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P9-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_none_v16i8:		; CHECK-AIX-32-P8-LABEL: test_none_v16i8:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4
Show All 16 Lines
}		}

define <2 x i64> @test_v16i8_none(i8 %arg1, ptr nocapture noundef readonly %b) {		define <2 x i64> @test_v16i8_none(i8 %arg1, ptr nocapture noundef readonly %b) {
; CHECK-LE-P8-LABEL: test_v16i8_none:		; CHECK-LE-P8-LABEL: test_v16i8_none:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4		; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: xxswapd v2, vs0
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: xxmrgld v2, v2, vs0		; CHECK-LE-P8-NEXT: xxpermdi v2, v2, vs0, 2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v16i8_none:		; CHECK-LE-P9-LABEL: test_v16i8_none:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxv v2, 0(r4)		; CHECK-LE-P9-NEXT: lxv v2, 0(r4)
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: xxmrgld v2, v2, vs0		; CHECK-LE-P9-NEXT: xxpermdi v2, v2, vs0, 2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v16i8_none:		; CHECK-BE-P8-LABEL: test_v16i8_none:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-BE-P8-NEXT: mtfprwz f0, r3		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, v2		; CHECK-BE-P8-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v16i8_none:		; CHECK-BE-P9-LABEL: test_v16i8_none:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: lxv v2, 0(r4)		; CHECK-BE-P9-NEXT: lxv v2, 0(r4)
; CHECK-BE-P9-NEXT: mtfprwz f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: xxmrghd v2, vs0, v2		; CHECK-BE-P9-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v16i8_none:		; CHECK-AIX-64-P8-LABEL: test_v16i8_none:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, v2		; CHECK-AIX-64-P8-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v16i8_none:		; CHECK-AIX-64-P9-LABEL: test_v16i8_none:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)		; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs0, v2		; CHECK-AIX-64-P9-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v16i8_none:		; CHECK-AIX-32-P8-LABEL: test_v16i8_none:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4
Show All 15 Lines	entry:
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v16i8_v8i16(i8 %arg1, i16 %arg) {		define <2 x i64> @test_v16i8_v8i16(i8 %arg1, i16 %arg) {
; CHECK-LE-P8-LABEL: test_v16i8_v8i16:		; CHECK-LE-P8-LABEL: test_v16i8_v8i16:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd vs1, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, vs1, vs0
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v16i8_v8i16:		; CHECK-LE-P9-LABEL: test_v16i8_v8i16:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: mtfprd f1, r4		; CHECK-LE-P9-NEXT: mtfprd f1, r4
; CHECK-LE-P9-NEXT: xxswapd vs0, vs0		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: xxswapd vs1, vs1
; CHECK-LE-P9-NEXT: xxmrgld v2, vs1, vs0
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v16i8_v8i16:		; CHECK-BE-P8-LABEL: test_v16i8_v8i16:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 56		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: sldi r4, r4, 48		; CHECK-BE-P8-NEXT: mtfprwz f1, r4
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P8-NEXT: mtfprd f1, r4
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v16i8_v8i16:		; CHECK-BE-P9-LABEL: test_v16i8_v8i16:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: sldi r3, r3, 56		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: mtfprd f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f1, r4
; CHECK-BE-P9-NEXT: sldi r3, r4, 48		; CHECK-BE-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P9-NEXT: mtfprd f1, r3
; CHECK-BE-P9-NEXT: xxmrghd v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v16i8_v8i16:		; CHECK-AIX-64-P8-LABEL: test_v16i8_v8i16:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 56		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 48		; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P8-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P8-NEXT: mtfprd f1, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs1
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v16i8_v8i16:		; CHECK-AIX-64-P9-LABEL: test_v16i8_v8i16:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: sldi r3, r3, 56		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P9-NEXT: sldi r3, r4, 48		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: mtfprd f1, r3
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v16i8_v8i16:		; CHECK-AIX-32-P8-LABEL: test_v16i8_v8i16:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
Show All 19 Lines	entry:
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v8i16_v16i8(i8 %arg1, i16 %arg) {		define <2 x i64> @test_v8i16_v16i8(i8 %arg1, i16 %arg) {
; CHECK-LE-P8-LABEL: test_v8i16_v16i8:		; CHECK-LE-P8-LABEL: test_v8i16_v16i8:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs0, vs1
; CHECK-LE-P8-NEXT: xxswapd vs1, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v8i16_v16i8:		; CHECK-LE-P9-LABEL: test_v8i16_v16i8:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: mtfprd f1, r4		; CHECK-LE-P9-NEXT: mtfprd f1, r4
; CHECK-LE-P9-NEXT: xxswapd vs0, vs0		; CHECK-LE-P9-NEXT: xxmrghd v2, vs0, vs1
; CHECK-LE-P9-NEXT: xxswapd vs1, vs1
; CHECK-LE-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v8i16_v16i8:		; CHECK-BE-P8-LABEL: test_v8i16_v16i8:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 56		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: sldi r4, r4, 48		; CHECK-BE-P8-NEXT: mtfprwz f1, r4
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: xxmrgld v2, vs1, vs0
; CHECK-BE-P8-NEXT: mtfprd f1, r4
; CHECK-BE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v8i16_v16i8:		; CHECK-BE-P9-LABEL: test_v8i16_v16i8:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: sldi r3, r3, 56		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: mtfprd f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f1, r4
; CHECK-BE-P9-NEXT: sldi r3, r4, 48		; CHECK-BE-P9-NEXT: xxmrgld v2, vs1, vs0
; CHECK-BE-P9-NEXT: mtfprd f1, r3
; CHECK-BE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v8i16_v16i8:		; CHECK-AIX-64-P8-LABEL: test_v8i16_v16i8:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 56		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 48		; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P8-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, vs1, vs0
; CHECK-AIX-64-P8-NEXT: mtfprd f1, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v8i16_v16i8:		; CHECK-AIX-64-P9-LABEL: test_v8i16_v16i8:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: sldi r3, r3, 56		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P9-NEXT: sldi r3, r4, 48		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, vs1, vs0
; CHECK-AIX-64-P9-NEXT: mtfprd f1, r3
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v8i16_v16i8:		; CHECK-AIX-32-P8-LABEL: test_v8i16_v16i8:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
Show All 20 Lines
}		}

define <2 x i64> @test_v8i16_none(i16 %arg1, ptr nocapture noundef readonly %b) {		define <2 x i64> @test_v8i16_none(i16 %arg1, ptr nocapture noundef readonly %b) {
; CHECK-LE-P8-LABEL: test_v8i16_none:		; CHECK-LE-P8-LABEL: test_v8i16_none:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4		; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: xxswapd v2, vs0
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: xxmrgld v2, v2, vs0		; CHECK-LE-P8-NEXT: xxpermdi v2, v2, vs0, 2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v8i16_none:		; CHECK-LE-P9-LABEL: test_v8i16_none:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxv v2, 0(r4)		; CHECK-LE-P9-NEXT: lxv v2, 0(r4)
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: xxmrgld v2, v2, vs0		; CHECK-LE-P9-NEXT: xxpermdi v2, v2, vs0, 2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v8i16_none:		; CHECK-BE-P8-LABEL: test_v8i16_none:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-BE-P8-NEXT: mtfprwz f0, r3		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, v2		; CHECK-BE-P8-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v8i16_none:		; CHECK-BE-P9-LABEL: test_v8i16_none:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: lxv v2, 0(r4)		; CHECK-BE-P9-NEXT: lxv v2, 0(r4)
; CHECK-BE-P9-NEXT: mtfprwz f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: xxmrghd v2, vs0, v2		; CHECK-BE-P9-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v8i16_none:		; CHECK-AIX-64-P8-LABEL: test_v8i16_none:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, v2		; CHECK-AIX-64-P8-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v8i16_none:		; CHECK-AIX-64-P9-LABEL: test_v8i16_none:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)		; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs0, v2		; CHECK-AIX-64-P9-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v8i16_none:		; CHECK-AIX-32-P8-LABEL: test_v8i16_none:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4
Show All 16 Lines
}		}

define <2 x i64> @test_none_v8i16(i16 %arg1, ptr nocapture noundef readonly %b) {		define <2 x i64> @test_none_v8i16(i16 %arg1, ptr nocapture noundef readonly %b) {
; CHECK-LE-P8-LABEL: test_none_v8i16:		; CHECK-LE-P8-LABEL: test_none_v8i16:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4		; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: xxswapd v2, vs0
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: xxmrgld v2, vs0, v2		; CHECK-LE-P8-NEXT: xxpermdi v2, vs0, v2, 1
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_none_v8i16:		; CHECK-LE-P9-LABEL: test_none_v8i16:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxv v2, 0(r4)		; CHECK-LE-P9-NEXT: lxv v2, 0(r4)
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: xxmrgld v2, vs0, v2		; CHECK-LE-P9-NEXT: xxpermdi v2, vs0, v2, 1
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_none_v8i16:		; CHECK-BE-P8-LABEL: test_none_v8i16:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-BE-P8-NEXT: mtfprwz f0, r3		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P8-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_none_v8i16:		; CHECK-BE-P9-LABEL: test_none_v8i16:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: lxv v2, 0(r4)		; CHECK-BE-P9-NEXT: lxv v2, 0(r4)
; CHECK-BE-P9-NEXT: mtfprwz f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P9-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_none_v8i16:		; CHECK-AIX-64-P8-LABEL: test_none_v8i16:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P8-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_none_v8i16:		; CHECK-AIX-64-P9-LABEL: test_none_v8i16:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)		; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P9-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_none_v8i16:		; CHECK-AIX-32-P8-LABEL: test_none_v8i16:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4
Show All 14 Lines	entry:
%shuffle = shufflevector <2 x i64> %rhs, <2 x i64> %lhs, <2 x i32> <i32 0, i32 2>		%shuffle = shufflevector <2 x i64> %rhs, <2 x i64> %lhs, <2 x i32> <i32 0, i32 2>
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v16i8_v4i32(i8 %arg1, i32 %arg) {		define <2 x i64> @test_v16i8_v4i32(i8 %arg1, i32 %arg) {
; CHECK-LE-P8-LABEL: test_v16i8_v4i32:		; CHECK-LE-P8-LABEL: test_v16i8_v4i32:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprwz f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd vs1, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, vs1, vs0
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v16i8_v4i32:		; CHECK-LE-P9-LABEL: test_v16i8_v4i32:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: mtvsrws vs1, r4		; CHECK-LE-P9-NEXT: mtfprwz f1, r4
; CHECK-LE-P9-NEXT: xxswapd vs0, vs0		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: xxmrgld v2, vs1, vs0
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v16i8_v4i32:		; CHECK-BE-P8-LABEL: test_v16i8_v4i32:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 56		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: sldi r4, r4, 32		; CHECK-BE-P8-NEXT: mtfprwz f1, r4
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P8-NEXT: mtfprd f1, r4
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v16i8_v4i32:		; CHECK-BE-P9-LABEL: test_v16i8_v4i32:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: sldi r3, r3, 56		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: mtvsrws vs1, r4		; CHECK-BE-P9-NEXT: mtfprwz f1, r4
; CHECK-BE-P9-NEXT: mtfprd f0, r3		; CHECK-BE-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P9-NEXT: xxmrghd v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v16i8_v4i32:		; CHECK-AIX-64-P8-LABEL: test_v16i8_v4i32:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 56		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 32		; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P8-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P8-NEXT: mtfprd f1, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs1
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v16i8_v4i32:		; CHECK-AIX-64-P9-LABEL: test_v16i8_v4i32:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: sldi r3, r3, 56		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: mtvsrws vs1, r4		; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P9-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v16i8_v4i32:		; CHECK-AIX-32-P8-LABEL: test_v16i8_v4i32:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
Show All 18 Lines	entry:
%shuffle = shufflevector <2 x i64> %lhs, <2 x i64> %rhs, <2 x i32> <i32 0, i32 2>		%shuffle = shufflevector <2 x i64> %lhs, <2 x i64> %rhs, <2 x i32> <i32 0, i32 2>
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v4i32_v16i8(i8 %arg1, i32 %arg) {		define <2 x i64> @test_v4i32_v16i8(i8 %arg1, i32 %arg) {
; CHECK-LE-P8-LABEL: test_v4i32_v16i8:		; CHECK-LE-P8-LABEL: test_v4i32_v16i8:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprwz f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs0, vs1
; CHECK-LE-P8-NEXT: xxswapd vs1, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v4i32_v16i8:		; CHECK-LE-P9-LABEL: test_v4i32_v16i8:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: mtvsrws vs1, r4		; CHECK-LE-P9-NEXT: mtfprwz f1, r4
; CHECK-LE-P9-NEXT: xxswapd vs0, vs0		; CHECK-LE-P9-NEXT: xxmrghd v2, vs0, vs1
; CHECK-LE-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v4i32_v16i8:		; CHECK-BE-P8-LABEL: test_v4i32_v16i8:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 56		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: sldi r4, r4, 32		; CHECK-BE-P8-NEXT: mtfprwz f1, r4
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: xxmrgld v2, vs1, vs0
; CHECK-BE-P8-NEXT: mtfprd f1, r4
; CHECK-BE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v4i32_v16i8:		; CHECK-BE-P9-LABEL: test_v4i32_v16i8:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: sldi r3, r3, 56		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: mtvsrws vs1, r4		; CHECK-BE-P9-NEXT: mtfprwz f1, r4
; CHECK-BE-P9-NEXT: mtfprd f0, r3		; CHECK-BE-P9-NEXT: xxmrgld v2, vs1, vs0
; CHECK-BE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v4i32_v16i8:		; CHECK-AIX-64-P8-LABEL: test_v4i32_v16i8:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 56		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 32		; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P8-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, vs1, vs0
; CHECK-AIX-64-P8-NEXT: mtfprd f1, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v4i32_v16i8:		; CHECK-AIX-64-P9-LABEL: test_v4i32_v16i8:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: sldi r3, r3, 56		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: mtvsrws vs1, r4		; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P9-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, vs1, vs0
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v4i32_v16i8:		; CHECK-AIX-32-P8-LABEL: test_v4i32_v16i8:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
Show All 20 Lines
}		}

define <2 x i64> @test_none_v4i32(i32 %arg1, ptr nocapture noundef readonly %b) {		define <2 x i64> @test_none_v4i32(i32 %arg1, ptr nocapture noundef readonly %b) {
; CHECK-LE-P8-LABEL: test_none_v4i32:		; CHECK-LE-P8-LABEL: test_none_v4i32:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4		; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: xxswapd v2, vs0
; CHECK-LE-P8-NEXT: mtfprwz f0, r3		; CHECK-LE-P8-NEXT: mtfprwz f0, r3
; CHECK-LE-P8-NEXT: xxmrgld v2, vs0, v2		; CHECK-LE-P8-NEXT: xxpermdi v2, vs0, v2, 1
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_none_v4i32:		; CHECK-LE-P9-LABEL: test_none_v4i32:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxv v2, 0(r4)		; CHECK-LE-P9-NEXT: lxv v2, 0(r4)
; CHECK-LE-P9-NEXT: mtfprwz f0, r3		; CHECK-LE-P9-NEXT: mtfprwz f0, r3
; CHECK-LE-P9-NEXT: xxmrgld v2, vs0, v2		; CHECK-LE-P9-NEXT: xxpermdi v2, vs0, v2, 1
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_none_v4i32:		; CHECK-BE-P8-LABEL: test_none_v4i32:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-BE-P8-NEXT: mtfprwz f0, r3		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P8-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_none_v4i32:		; CHECK-BE-P9-LABEL: test_none_v4i32:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: lxv v2, 0(r4)		; CHECK-BE-P9-NEXT: lxv v2, 0(r4)
; CHECK-BE-P9-NEXT: mtfprwz f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P9-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_none_v4i32:		; CHECK-AIX-64-P8-LABEL: test_none_v4i32:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P8-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_none_v4i32:		; CHECK-AIX-64-P9-LABEL: test_none_v4i32:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)		; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P9-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_none_v4i32:		; CHECK-AIX-32-P8-LABEL: test_none_v4i32:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4
Show All 16 Lines
}		}

define <2 x i64> @test_v4i32_none(i32 %arg1, ptr nocapture noundef readonly %b) {		define <2 x i64> @test_v4i32_none(i32 %arg1, ptr nocapture noundef readonly %b) {
; CHECK-LE-P8-LABEL: test_v4i32_none:		; CHECK-LE-P8-LABEL: test_v4i32_none:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4		; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: xxswapd v2, vs0
; CHECK-LE-P8-NEXT: mtfprwz f0, r3		; CHECK-LE-P8-NEXT: mtfprwz f0, r3
; CHECK-LE-P8-NEXT: xxmrgld v2, v2, vs0		; CHECK-LE-P8-NEXT: xxpermdi v2, v2, vs0, 2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v4i32_none:		; CHECK-LE-P9-LABEL: test_v4i32_none:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxv v2, 0(r4)		; CHECK-LE-P9-NEXT: lxv v2, 0(r4)
; CHECK-LE-P9-NEXT: mtfprwz f0, r3		; CHECK-LE-P9-NEXT: mtfprwz f0, r3
; CHECK-LE-P9-NEXT: xxmrgld v2, v2, vs0		; CHECK-LE-P9-NEXT: xxpermdi v2, v2, vs0, 2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v4i32_none:		; CHECK-BE-P8-LABEL: test_v4i32_none:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-BE-P8-NEXT: mtfprwz f0, r3		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, v2		; CHECK-BE-P8-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v4i32_none:		; CHECK-BE-P9-LABEL: test_v4i32_none:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: lxv v2, 0(r4)		; CHECK-BE-P9-NEXT: lxv v2, 0(r4)
; CHECK-BE-P9-NEXT: mtfprwz f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: xxmrghd v2, vs0, v2		; CHECK-BE-P9-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v4i32_none:		; CHECK-AIX-64-P8-LABEL: test_v4i32_none:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, v2		; CHECK-AIX-64-P8-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v4i32_none:		; CHECK-AIX-64-P9-LABEL: test_v4i32_none:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)		; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs0, v2		; CHECK-AIX-64-P9-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v4i32_none:		; CHECK-AIX-32-P8-LABEL: test_v4i32_none:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4
Show All 15 Lines	entry:
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v16i8_v2i64(i8 %arg1, i64 %arg) {		define <2 x i64> @test_v16i8_v2i64(i8 %arg1, i64 %arg) {
; CHECK-LE-P8-LABEL: test_v16i8_v2i64:		; CHECK-LE-P8-LABEL: test_v16i8_v2i64:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd v2, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, v2, vs0
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v16i8_v2i64:		; CHECK-LE-P9-LABEL: test_v16i8_v2i64:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: mtfprd f1, r4		; CHECK-LE-P9-NEXT: mtfprd f1, r4
; CHECK-LE-P9-NEXT: xxswapd vs0, vs0		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: xxswapd v2, vs1
; CHECK-LE-P9-NEXT: xxmrgld v2, v2, vs0
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v16i8_v2i64:		; CHECK-BE-P8-LABEL: test_v16i8_v2i64:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 56		; CHECK-BE-P8-NEXT: sldi r3, r3, 56
; CHECK-BE-P8-NEXT: mtfprd f1, r4		; CHECK-BE-P8-NEXT: mtfprd f1, r4
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: mtfprd f0, r3
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1		; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1
▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines	entry:
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v2i64_v16i8(i8 %arg1, i64 %arg) {		define <2 x i64> @test_v2i64_v16i8(i8 %arg1, i64 %arg) {
; CHECK-LE-P8-LABEL: test_v2i64_v16i8:		; CHECK-LE-P8-LABEL: test_v2i64_v16i8:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs0, vs1
; CHECK-LE-P8-NEXT: xxswapd v2, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, vs0, v2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v2i64_v16i8:		; CHECK-LE-P9-LABEL: test_v2i64_v16i8:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: mtfprd f1, r4		; CHECK-LE-P9-NEXT: mtfprd f1, r4
; CHECK-LE-P9-NEXT: xxswapd vs0, vs0		; CHECK-LE-P9-NEXT: xxmrghd v2, vs0, vs1
; CHECK-LE-P9-NEXT: xxswapd v2, vs1
; CHECK-LE-P9-NEXT: xxmrgld v2, vs0, v2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v2i64_v16i8:		; CHECK-BE-P8-LABEL: test_v2i64_v16i8:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: mtfprd f0, r4		; CHECK-BE-P8-NEXT: mtfprd f0, r4
; CHECK-BE-P8-NEXT: xxspltd v2, vs0, 0		; CHECK-BE-P8-NEXT: xxspltd v2, vs0, 0
; CHECK-BE-P8-NEXT: mtfprwz f0, r3		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P8-NEXT: xxmrgld v2, v2, vs0
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v2i64_v16i8:		; CHECK-BE-P9-LABEL: test_v2i64_v16i8:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: mtfprwz f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: mtvsrdd v2, r4, r4		; CHECK-BE-P9-NEXT: mtvsrdd v2, r4, r4
; CHECK-BE-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P9-NEXT: xxmrgld v2, v2, vs0
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v2i64_v16i8:		; CHECK-AIX-64-P8-LABEL: test_v2i64_v16i8:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: mtfprd f0, r4		; CHECK-AIX-64-P8-NEXT: mtfprd f0, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs0		; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs0
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, v2, vs0
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v2i64_v16i8:		; CHECK-AIX-64-P9-LABEL: test_v2i64_v16i8:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: mtvsrdd v2, r4, r4		; CHECK-AIX-64-P9-NEXT: mtvsrdd v2, r4, r4
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, v2, vs0
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v2i64_v16i8:		; CHECK-AIX-32-P8-LABEL: test_v2i64_v16i8:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r6, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r6, r1, -16
; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r6		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r6
▲ Show 20 Lines • Show All 178 Lines • ▼ Show 20 Lines	entry:
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v8i16_v8i16(i16 %arg1, i16 %arg) {		define <2 x i64> @test_v8i16_v8i16(i16 %arg1, i16 %arg) {
; CHECK-LE-P8-LABEL: test_v8i16_v8i16:		; CHECK-LE-P8-LABEL: test_v8i16_v8i16:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxmrgld v2, vs1, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v8i16_v8i16:		; CHECK-LE-P9-LABEL: test_v8i16_v8i16:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: mtfprd f1, r4		; CHECK-LE-P9-NEXT: mtfprd f1, r4
; CHECK-LE-P9-NEXT: xxmrgld v2, vs1, vs0		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v8i16_v8i16:		; CHECK-BE-P8-LABEL: test_v8i16_v8i16:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: mtfprwz f0, r3		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: mtfprwz f1, r4		; CHECK-BE-P8-NEXT: mtfprwz f1, r4
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1		; CHECK-BE-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v8i16_v8i16:		; CHECK-BE-P9-LABEL: test_v8i16_v8i16:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: mtfprwz f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: mtfprwz f1, r4		; CHECK-BE-P9-NEXT: mtfprwz f1, r4
; CHECK-BE-P9-NEXT: xxmrghd v2, vs0, vs1		; CHECK-BE-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v8i16_v8i16:		; CHECK-AIX-64-P8-LABEL: test_v8i16_v8i16:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4		; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs1		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v8i16_v8i16:		; CHECK-AIX-64-P9-LABEL: test_v8i16_v8i16:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4		; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs0, vs1		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v8i16_v8i16:		; CHECK-AIX-32-P8-LABEL: test_v8i16_v8i16:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
Show All 18 Lines	entry:
%shuffle = shufflevector <2 x i64> %lhs, <2 x i64> %rhs, <2 x i32> <i32 0, i32 2>		%shuffle = shufflevector <2 x i64> %lhs, <2 x i64> %rhs, <2 x i32> <i32 0, i32 2>
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v8i16_v4i32(i16 %arg1, i32 %arg) {		define <2 x i64> @test_v8i16_v4i32(i16 %arg1, i32 %arg) {
; CHECK-LE-P8-LABEL: test_v8i16_v4i32:		; CHECK-LE-P8-LABEL: test_v8i16_v4i32:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprwz f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd vs1, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, vs1, vs0
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v8i16_v4i32:		; CHECK-LE-P9-LABEL: test_v8i16_v4i32:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: mtvsrws vs1, r4		; CHECK-LE-P9-NEXT: mtfprwz f1, r4
; CHECK-LE-P9-NEXT: xxswapd vs0, vs0		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: xxmrgld v2, vs1, vs0
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v8i16_v4i32:		; CHECK-BE-P8-LABEL: test_v8i16_v4i32:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 48		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: sldi r4, r4, 32		; CHECK-BE-P8-NEXT: mtfprwz f1, r4
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P8-NEXT: mtfprd f1, r4
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v8i16_v4i32:		; CHECK-BE-P9-LABEL: test_v8i16_v4i32:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: sldi r3, r3, 48		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: mtvsrws vs1, r4		; CHECK-BE-P9-NEXT: mtfprwz f1, r4
; CHECK-BE-P9-NEXT: mtfprd f0, r3		; CHECK-BE-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P9-NEXT: xxmrghd v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v8i16_v4i32:		; CHECK-AIX-64-P8-LABEL: test_v8i16_v4i32:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 48		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 32		; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P8-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P8-NEXT: mtfprd f1, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs1
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v8i16_v4i32:		; CHECK-AIX-64-P9-LABEL: test_v8i16_v4i32:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: sldi r3, r3, 48		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: mtvsrws vs1, r4		; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P9-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v8i16_v4i32:		; CHECK-AIX-32-P8-LABEL: test_v8i16_v4i32:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
Show All 19 Lines	entry:
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v8i16_v2i64(i16 %arg1, i64 %arg) {		define <2 x i64> @test_v8i16_v2i64(i16 %arg1, i64 %arg) {
; CHECK-LE-P8-LABEL: test_v8i16_v2i64:		; CHECK-LE-P8-LABEL: test_v8i16_v2i64:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd v2, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, v2, vs0
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v8i16_v2i64:		; CHECK-LE-P9-LABEL: test_v8i16_v2i64:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: mtfprd f1, r4		; CHECK-LE-P9-NEXT: mtfprd f1, r4
; CHECK-LE-P9-NEXT: xxswapd vs0, vs0		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: xxswapd v2, vs1
; CHECK-LE-P9-NEXT: xxmrgld v2, v2, vs0
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v8i16_v2i64:		; CHECK-BE-P8-LABEL: test_v8i16_v2i64:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 48		; CHECK-BE-P8-NEXT: sldi r3, r3, 48
; CHECK-BE-P8-NEXT: mtfprd f1, r4		; CHECK-BE-P8-NEXT: mtfprd f1, r4
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: mtfprd f0, r3
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1		; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1
▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines	entry:
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v4i32_v4i32(i32 %arg1, i32 %arg) {		define <2 x i64> @test_v4i32_v4i32(i32 %arg1, i32 %arg) {
; CHECK-LE-P8-LABEL: test_v4i32_v4i32:		; CHECK-LE-P8-LABEL: test_v4i32_v4i32:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprwz f0, r3		; CHECK-LE-P8-NEXT: mtfprwz f0, r3
; CHECK-LE-P8-NEXT: mtfprwz f1, r4		; CHECK-LE-P8-NEXT: mtfprwz f1, r4
; CHECK-LE-P8-NEXT: xxmrgld v2, vs1, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v4i32_v4i32:		; CHECK-LE-P9-LABEL: test_v4i32_v4i32:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprwz f0, r3		; CHECK-LE-P9-NEXT: mtfprwz f0, r3
; CHECK-LE-P9-NEXT: mtfprwz f1, r4		; CHECK-LE-P9-NEXT: mtfprwz f1, r4
; CHECK-LE-P9-NEXT: xxmrgld v2, vs1, vs0		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v4i32_v4i32:		; CHECK-BE-P8-LABEL: test_v4i32_v4i32:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: mtfprwz f0, r3		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: mtfprwz f1, r4		; CHECK-BE-P8-NEXT: mtfprwz f1, r4
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1		; CHECK-BE-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v4i32_v4i32:		; CHECK-BE-P9-LABEL: test_v4i32_v4i32:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: mtfprwz f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: mtfprwz f1, r4		; CHECK-BE-P9-NEXT: mtfprwz f1, r4
; CHECK-BE-P9-NEXT: xxmrghd v2, vs0, vs1		; CHECK-BE-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v4i32_v4i32:		; CHECK-AIX-64-P8-LABEL: test_v4i32_v4i32:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4		; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs1		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v4i32_v4i32:		; CHECK-AIX-64-P9-LABEL: test_v4i32_v4i32:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4		; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs0, vs1		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v4i32_v4i32:		; CHECK-AIX-32-P8-LABEL: test_v4i32_v4i32:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
Show All 17 Lines	entry:
%rhs = bitcast <4 x i32> %rhs.tmp to <2 x i64>		%rhs = bitcast <4 x i32> %rhs.tmp to <2 x i64>
%shuffle = shufflevector <2 x i64> %lhs, <2 x i64> %rhs, <2 x i32> <i32 0, i32 2>		%shuffle = shufflevector <2 x i64> %lhs, <2 x i64> %rhs, <2 x i32> <i32 0, i32 2>
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v4i32_v8i16(i32 %arg1, i16 %arg) {		define <2 x i64> @test_v4i32_v8i16(i32 %arg1, i16 %arg) {
; CHECK-LE-P8-LABEL: test_v4i32_v8i16:		; CHECK-LE-P8-LABEL: test_v4i32_v8i16:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprwz f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd vs1, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, vs1, vs0
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v4i32_v8i16:		; CHECK-LE-P9-LABEL: test_v4i32_v8i16:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
		; CHECK-LE-P9-NEXT: mtfprwz f0, r3
; CHECK-LE-P9-NEXT: mtfprd f1, r4		; CHECK-LE-P9-NEXT: mtfprd f1, r4
; CHECK-LE-P9-NEXT: mtvsrws vs0, r3		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: xxswapd vs1, vs1
; CHECK-LE-P9-NEXT: xxmrgld v2, vs1, vs0
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v4i32_v8i16:		; CHECK-BE-P8-LABEL: test_v4i32_v8i16:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 32		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: sldi r4, r4, 48		; CHECK-BE-P8-NEXT: mtfprwz f1, r4
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P8-NEXT: mtfprd f1, r4
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v4i32_v8i16:		; CHECK-BE-P9-LABEL: test_v4i32_v8i16:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: mtvsrws vs0, r3		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: sldi r3, r4, 48		; CHECK-BE-P9-NEXT: mtfprwz f1, r4
; CHECK-BE-P9-NEXT: mtfprd f1, r3		; CHECK-BE-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P9-NEXT: xxmrghd v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v4i32_v8i16:		; CHECK-AIX-64-P8-LABEL: test_v4i32_v8i16:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 32		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 48		; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P8-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P8-NEXT: mtfprd f1, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs1
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v4i32_v8i16:		; CHECK-AIX-64-P9-LABEL: test_v4i32_v8i16:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: mtvsrws vs0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: sldi r3, r4, 48		; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P9-NEXT: mtfprd f1, r3		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v4i32_v8i16:		; CHECK-AIX-32-P8-LABEL: test_v4i32_v8i16:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
Show All 17 Lines	entry:
%rhs = bitcast <8 x i16> %rhs.tmp to <2 x i64>		%rhs = bitcast <8 x i16> %rhs.tmp to <2 x i64>
%shuffle = shufflevector <2 x i64> %lhs, <2 x i64> %rhs, <2 x i32> <i32 0, i32 2>		%shuffle = shufflevector <2 x i64> %lhs, <2 x i64> %rhs, <2 x i32> <i32 0, i32 2>
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v4i32_v2i64(i32 %arg1, i64 %arg) {		define <2 x i64> @test_v4i32_v2i64(i32 %arg1, i64 %arg) {
; CHECK-LE-P8-LABEL: test_v4i32_v2i64:		; CHECK-LE-P8-LABEL: test_v4i32_v2i64:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprwz f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd v2, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, v2, vs0
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v4i32_v2i64:		; CHECK-LE-P9-LABEL: test_v4i32_v2i64:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
		; CHECK-LE-P9-NEXT: mtfprwz f0, r3
; CHECK-LE-P9-NEXT: mtfprd f1, r4		; CHECK-LE-P9-NEXT: mtfprd f1, r4
; CHECK-LE-P9-NEXT: mtvsrws vs0, r3		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: xxswapd v2, vs1
; CHECK-LE-P9-NEXT: xxmrgld v2, v2, vs0
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v4i32_v2i64:		; CHECK-BE-P8-LABEL: test_v4i32_v2i64:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 32		; CHECK-BE-P8-NEXT: sldi r3, r3, 32
; CHECK-BE-P8-NEXT: mtfprd f1, r4		; CHECK-BE-P8-NEXT: mtfprd f1, r4
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: mtfprd f0, r3
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1		; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1
▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines	entry:
%4 = add <2 x i64> %shuffle, %2		%4 = add <2 x i64> %shuffle, %2
ret <2 x i64> %4		ret <2 x i64> %4
}		}

define <2 x i64> @test_v2i64_v4i32(i64 %arg1, i32 %arg) {		define <2 x i64> @test_v2i64_v4i32(i64 %arg1, i32 %arg) {
; CHECK-LE-P8-LABEL: test_v2i64_v4i32:		; CHECK-LE-P8-LABEL: test_v2i64_v4i32:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprwz f1, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd vs0, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, vs0, v2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v2i64_v4i32:		; CHECK-LE-P9-LABEL: test_v2i64_v4i32:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: xxswapd v2, vs0		; CHECK-LE-P9-NEXT: mtfprwz f1, r4
; CHECK-LE-P9-NEXT: mtvsrws vs0, r4		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: xxmrgld v2, vs0, v2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v2i64_v4i32:		; CHECK-BE-P8-LABEL: test_v2i64_v4i32:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: mtfprd f0, r3
; CHECK-BE-P8-NEXT: xxspltd v2, vs0, 0		; CHECK-BE-P8-NEXT: xxspltd v2, vs0, 0
; CHECK-BE-P8-NEXT: mtfprwz f0, r4		; CHECK-BE-P8-NEXT: mtfprwz f0, r4
; CHECK-BE-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P8-NEXT: xxmrgld v2, v2, vs0
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v2i64_v4i32:		; CHECK-BE-P9-LABEL: test_v2i64_v4i32:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: mtfprwz f0, r4		; CHECK-BE-P9-NEXT: mtfprwz f0, r4
; CHECK-BE-P9-NEXT: mtvsrdd v2, r3, r3		; CHECK-BE-P9-NEXT: mtvsrdd v2, r3, r3
; CHECK-BE-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P9-NEXT: xxmrgld v2, v2, vs0
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v2i64_v4i32:		; CHECK-AIX-64-P8-LABEL: test_v2i64_v4i32:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprd f0, r3
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs0		; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs0
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r4		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, v2, vs0
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v2i64_v4i32:		; CHECK-AIX-64-P9-LABEL: test_v2i64_v4i32:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r4		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r4
; CHECK-AIX-64-P9-NEXT: mtvsrdd v2, r3, r3		; CHECK-AIX-64-P9-NEXT: mtvsrdd v2, r3, r3
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, v2, vs0
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v2i64_v4i32:		; CHECK-AIX-32-P8-LABEL: test_v2i64_v4i32:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r6, r1, -48		; CHECK-AIX-32-P8-NEXT: addi r6, r1, -48
; CHECK-AIX-32-P8-NEXT: stw r5, -48(r1)		; CHECK-AIX-32-P8-NEXT: stw r5, -48(r1)
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r6		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r6
; CHECK-AIX-32-P8-NEXT: stw r4, -16(r1)		; CHECK-AIX-32-P8-NEXT: stw r4, -16(r1)
Show All 26 Lines	entry:
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v2i64_v8i16(i64 %arg1, i16 %arg) {		define <2 x i64> @test_v2i64_v8i16(i64 %arg1, i16 %arg) {
; CHECK-LE-P8-LABEL: test_v2i64_v8i16:		; CHECK-LE-P8-LABEL: test_v2i64_v8i16:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd vs0, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, vs0, v2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v2i64_v8i16:		; CHECK-LE-P9-LABEL: test_v2i64_v8i16:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: xxswapd v2, vs0		; CHECK-LE-P9-NEXT: mtfprd f1, r4
; CHECK-LE-P9-NEXT: mtfprd f0, r4		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: xxswapd vs0, vs0
; CHECK-LE-P9-NEXT: xxmrgld v2, vs0, v2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v2i64_v8i16:		; CHECK-BE-P8-LABEL: test_v2i64_v8i16:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: mtfprd f0, r3
; CHECK-BE-P8-NEXT: xxspltd v2, vs0, 0		; CHECK-BE-P8-NEXT: xxspltd v2, vs0, 0
; CHECK-BE-P8-NEXT: mtfprwz f0, r4		; CHECK-BE-P8-NEXT: mtfprwz f0, r4
; CHECK-BE-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P8-NEXT: xxmrgld v2, v2, vs0
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v2i64_v8i16:		; CHECK-BE-P9-LABEL: test_v2i64_v8i16:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: mtfprwz f0, r4		; CHECK-BE-P9-NEXT: mtfprwz f0, r4
; CHECK-BE-P9-NEXT: mtvsrdd v2, r3, r3		; CHECK-BE-P9-NEXT: mtvsrdd v2, r3, r3
; CHECK-BE-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P9-NEXT: xxmrgld v2, v2, vs0
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v2i64_v8i16:		; CHECK-AIX-64-P8-LABEL: test_v2i64_v8i16:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprd f0, r3
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs0		; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs0
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r4		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, v2, vs0
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v2i64_v8i16:		; CHECK-AIX-64-P9-LABEL: test_v2i64_v8i16:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r4		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r4
; CHECK-AIX-64-P9-NEXT: mtvsrdd v2, r3, r3		; CHECK-AIX-64-P9-NEXT: mtvsrdd v2, r3, r3
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, v2, vs0
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v2i64_v8i16:		; CHECK-AIX-32-P8-LABEL: test_v2i64_v8i16:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r6, r1, -48		; CHECK-AIX-32-P8-NEXT: addi r6, r1, -48
; CHECK-AIX-32-P8-NEXT: sth r5, -48(r1)		; CHECK-AIX-32-P8-NEXT: sth r5, -48(r1)
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r6		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r6
; CHECK-AIX-32-P8-NEXT: stw r4, -16(r1)		; CHECK-AIX-32-P8-NEXT: stw r4, -16(r1)
Show All 29 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[PowerPC] Fix vector_shuffle combines when inputs are scalar_to_vector of differing types.Needs RevisionPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 447331

llvm/lib/Target/PowerPC/PPCISelLowering.cpp

llvm/test/CodeGen/PowerPC/p8-scalar_vector_conversions.ll

llvm/test/CodeGen/PowerPC/v16i8_scalar_to_vector_shuffle.ll

llvm/test/CodeGen/PowerPC/v2i64_scalar_to_vector_shuffle.ll

[PowerPC] Fix vector_shuffle combines when inputs are scalar_to_vector of differing types.
Needs RevisionPublic