This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Target/PowerPC/
-
Target/
-
PowerPC/
9/16
PPCISelLowering.cpp
-
test/CodeGen/PowerPC/
-
CodeGen/
-
PowerPC/
-
p8-scalar_vector_conversions.ll
6
v16i8_scalar_to_vector_shuffle.ll
-
v2i64_scalar_to_vector_shuffle.ll
1
v4i32_scalar_to_vector_shuffle.ll
-
v8i16_scalar_to_vector_shuffle.ll

Differential D130487

[PowerPC] Fix vector_shuffle combines when inputs are scalar_to_vector of differing types.
Needs RevisionPublic

Authored by amyk on Jul 25 2022, 7:23 AM.

Download Raw Diff

Details

Reviewers

power-llvm-team
nemanjai
stefanp
kamaub

Group Reviewers

Restricted Project

Summary

This patch fixes the combines for vector_shuffles when either or both of its
left and right hand side inputs are scalar_to_vector nodes.

Previously, when both left and right side inputs are scalar_to_vector nodes,
the current combine could not handle this situation, as the shuffle mask was
updated incorrectly. https://reviews.llvm.org/D127818 was a temporary solution
to this issue. Now, not only does this patch aim to resolve the previous issue the
of incorrect shuffle mask adjustments respectively, it also updates any test cases
that are affected by this change.

Diff Detail

Repository: rG LLVM Github Monorepo

Unit TestsFailed

	Time	Test
	60,070 ms	x64 debian > libFuzzer.libFuzzer::fuzzer-leak.test
	60,040 ms	x64 debian > libFuzzer.libFuzzer::minimize_crash.test
	60,040 ms	x64 debian > libFuzzer.libFuzzer::value-profile-load.test

Event Timeline

amyk created this revision.Jul 25 2022, 7:23 AM

Herald added a project: Restricted Project. · View Herald TranscriptJul 25 2022, 7:23 AM

Herald added subscribers: shchenz, hiraditya. · View Herald Transcript

amyk requested review of this revision.Jul 25 2022, 7:23 AM

Herald added a project: Restricted Project. · View Herald TranscriptJul 25 2022, 7:23 AM

Harbormaster completed remote builds in B177375: Diff 447331.Jul 25 2022, 7:23 AM

amyk mentioned this in D130485: [PowerPC][NFC] Add additional vector_shuffle tests involving scalar_to_vector..Jul 25 2022, 7:46 AM

Rebase patch based on new tests added within D130485.

Harbormaster completed remote builds in B181036: Diff 452354.Aug 12 2022, 7:00 PM

amyk mentioned this in rGa5bef98c7513: [PowerPC][NFC] Add additional vector_shuffle tests involving scalar_to_vector..Aug 15 2022, 10:31 AM

Ping.

Can you also comment on whether this was thoroughly tested on both little endian and big endian systems (bootstrap, test-suite, SPEC, additional internal tests).

llvm/lib/Target/PowerPC/PPCISelLowering.cpp
15080–15081	I don't follow why we need these here. They both seem to only be needed in the respective conditions (i.e. depending on whether the LHS/RHS are `scalar_to_vector` nodes). And within those conditional blocks, they are reset before they're used. So why do we need to define them here and initialize them to the width of a vector?
llvm/test/CodeGen/PowerPC/v16i8_scalar_to_vector_shuffle.ll
267	The code for this one gets worse on big endian. Do we know why?
347	The code for this one gets worse on big endian. Do we know why?
578	The code for this one gets worse on big endian. Do we know why?
659	The code for this one gets worse on big endian. Do we know why?
1431	The code for this one gets worse on big endian. Do we know why?
1658	The code for this one gets worse on big endian. Do we know why? There are probably a bunch of other places. Can you please review what is happening there? I'll stop adding further similar comments.
llvm/test/CodeGen/PowerPC/v4i32_scalar_to_vector_shuffle.ll
123	The code generated for this one gets worse on all subtargets. Do we know why?

Discussed this patch with Nemanja outside of the review.

Many of the cases where we get worse codegen on BE (and some on LE as well) within the test cases occur either when the shuffle mask is explicitly asking for undefined vector elements from the original scalar_to_vector, or when the values in the vector are partially defined in the cases where the scalar_to_vector element size is smaller than the vector_shuffle element size. These cases primarily seem to appear within these contrived test cases, rather than real code. As a result, I've rebased this patch and addressed some review comments to move forward with this patch.

@nemanjai Yeah, at the time of posting the patch, I did do little endian and big endian system tests as you mentioned. Since it's been awhile and I need update the patch, I'd like to retest these particular runs with this patch.

llvm/lib/Target/PowerPC/PPCISelLowering.cpp
15080–15081	Ya, I think I had that in the beginning and meant to remove it prior to putting up the patch but didn't realize that it was still left in there. I don't believe I need it either, so I've removed it.

Harbormaster completed remote builds in B200980: Diff 479927.Dec 4 2022, 10:27 AM

Ping.

Although I have a fair number of comments, they're mostly stylistic comments that probably don't really require another revision. So LGTM and please address the comments prior to committing.

llvm/lib/Target/PowerPC/PPCISelLowering.cpp
14989	I don't think we modify `ShuffV` so it should be a `const` reference.
14990–14991	These two values are actually the last element rather than byte aren't they? If so, please rename accordingly.
14997	Why do we only check here if `LHSLastByteDefined >= 0` and similarly for the RHS below? Do we really want to pretend that a shuffle mask is in range if the last byte/element defined is undefined (i.e. presumably no bytes are defined)?
15066–15067	The name `LaneWidth` is misleading here. I kept thinking the width (i.e. the number of bits) of the lane that contains a defined value. But it is actually the number of valid elements in the vector. For a node: (shuff (v4i32 s_to_v i32), arbitrary_v4i32), mask) LHSValidLaneWidth = 1 RHSValidLaneWidth = 4 And for a node: (shuff (v4i32 s_to_v i32), (bitcast (s_to_v i64), v4i32), mask) LHSValidLaneWidth = 1 RHSValidLaneWidth = 2 If I'm interpreting it correctly, please rename them to something like `NumValidElts`.
15088	I think we should have an early exit here if the valid lane width is zero: if (LHSValidLaneWidth == 0) return false; Since it is not really reasonable to do this transform if we are pulling in more bits than the original `scalar_to_vector` actually defined. Similarly with the RHS below.
15089	Nit: maybe a comment to make this clearer: // The last element that comes from the LHS. For example: // (shuff (s_to_v i32), (bitcast (s_to_v i64), v4i32), ...) // The last element that comes from the LHS is actually 0, not 3 // because elements 1 and higher of a scalar_to_vector are undefined.
15101	Similar nit as above. A comment along the lines of: // The last element that comes from the RHS. For example: // (shuff (s_to_v i32), (bitcast (s_to_v i64), v4i32), ...) // The last element that comes from the RHS is actually 5, not 7 // because elements 1 and higher of a scalar_to_vector are undefined. // It is also not 4 because the original scalar_to_vector is wider and // actually contains two i32 elements.

This revision is now accepted and ready to land.Feb 24 2023, 4:36 AM

kamaub added a subscriber: kamaub.Feb 27 2023, 10:27 AM

kamaub added inline comments.

llvm/lib/Target/PowerPC/PPCISelLowering.cpp
15088	move `LHSScalarSize` up and use it in this block
15100	Same here, please raise `RHSScalarSize` and reuse it.

Request changes because of the bug in the isShuffleMaskInRange() conditions

llvm/lib/Target/PowerPC/PPCISelLowering.cpp
14992	please use a range based loop
14997–14998
14998	Please change this to `>` (and for below).
15002–15003
15070	please expand this comment to point out that -1 means all elements are defined

This revision now requires changes to proceed.Feb 28 2023, 9:49 AM

Revision Contents

Path

Size

llvm/

lib/

Target/

PowerPC/

PPCISelLowering.cpp

94 lines

test/

CodeGen/

PowerPC/

p8-scalar_vector_conversions.ll

6 lines

v16i8_scalar_to_vector_shuffle.ll

455 lines

v2i64_scalar_to_vector_shuffle.ll

432 lines

v4i32_scalar_to_vector_shuffle.ll

432 lines

v8i16_scalar_to_vector_shuffle.ll

349 lines

Diff 479927

llvm/lib/Target/PowerPC/PPCISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 14,930 Lines • ▼ Show 20 Lines

// Fix up the shuffle mask to account for the fact that the result of // Fix up the shuffle mask to account for the fact that the result of

// scalar_to_vector is not in lane zero. This just takes all values in // scalar_to_vector is not in lane zero. This just takes all values in

// the ranges specified by the min/max indices and adds the number of // the ranges specified by the min/max indices and adds the number of

// elements required to ensure each element comes from the respective // elements required to ensure each element comes from the respective

// position in the valid lane. // position in the valid lane.

// On little endian, that's just the corresponding element in the other // On little endian, that's just the corresponding element in the other

// half of the vector. On big endian, it is in the same half but right // half of the vector. On big endian, it is in the same half but right

// justified rather than left justified in that half. // justified rather than left justified in that half.

static void fixupShuffleMaskForPermutedSToV(SmallVectorImpl<int> &ShuffV, static void fixupShuffleMaskForPermutedSToV(

int LHSMaxIdx, int RHSMinIdx, SmallVectorImpl<int> &ShuffV, int LHSFirstElt, int LHSLastElt,

int RHSMaxIdx, int HalfVec, int RHSFirstElt, int RHSLastElt, int HalfVec, unsigned LHSValidLaneWidth,

unsigned ValidLaneWidth, unsigned RHSValidLaneWidth, const PPCSubtarget &Subtarget) {

const PPCSubtarget &Subtarget) {

for (int i = 0, e = ShuffV.size(); i < e; i++) { for (int i = 0, e = ShuffV.size(); i < e; i++) {

int Idx = ShuffV[i]; int Idx = ShuffV[i];

if ((Idx >= 0 && Idx < LHSMaxIdx) || (Idx >= RHSMinIdx && Idx < RHSMaxIdx)) if (Idx >= LHSFirstElt && Idx <= LHSLastElt)

ShuffV[i] +=

Subtarget.isLittleEndian() ? HalfVec : HalfVec - LHSValidLaneWidth;

if (Idx >= RHSFirstElt && Idx <= RHSLastElt)

ShuffV[i] += ShuffV[i] +=

Subtarget.isLittleEndian() ? HalfVec : HalfVec - ValidLaneWidth; Subtarget.isLittleEndian() ? HalfVec : HalfVec - RHSValidLaneWidth;

} }

// Replace a SCALAR_TO_VECTOR with a SCALAR_TO_VECTOR_PERMUTED except if // Replace a SCALAR_TO_VECTOR with a SCALAR_TO_VECTOR_PERMUTED except if

// the original is: // the original is:

// (<n x Ty> (scalar_to_vector (Ty (extract_elt <n x Ty> %a, C)))) // (<n x Ty> (scalar_to_vector (Ty (extract_elt <n x Ty> %a, C))))

// In such a case, just change the shuffle mask to extract the element // In such a case, just change the shuffle mask to extract the element

// from the permuted index. // from the permuted index.

Show All 22 Lines if (Idx && VT == OrigVector.getValueType()) {

NewMask[ResultInElt] = Idx->getZExtValue(); NewMask[ResultInElt] = Idx->getZExtValue();

return DAG.getVectorShuffle(VT, dl, OrigVector, OrigVector, NewMask); return DAG.getVectorShuffle(VT, dl, OrigVector, OrigVector, NewMask);

} }

return DAG.getNode(PPCISD::SCALAR_TO_VECTOR_PERMUTED, dl, VT, return DAG.getNode(PPCISD::SCALAR_TO_VECTOR_PERMUTED, dl, VT,

OrigSToV.getOperand(0)); OrigSToV.getOperand(0));

} }

static bool isShuffleMaskInRange(SmallVectorImpl<int> &ShuffV, int HalfVec,

nemanjaiUnsubmitted

Not Done

I don't think we modify ShuffV so it should be a const reference.

nemanjai: I don't think we modify `ShuffV` so it should be a `const` reference.

int LHSLastByteDefined,

int RHSLastByteDefined) {

nemanjaiUnsubmitted

Not Done

These two values are actually the last *element* rather than *byte* aren't they? If so, please rename accordingly.

nemanjai: These two values are actually the last *element* rather than *byte* aren't they? If so, please…

for (int i = 0, elt = ShuffV.size(); i < elt; i++) {

kamaubUnsubmitted

Not Done

please use a range based loop

kamaub: please use a range based loop

int Index = ShuffV[i];

if (Index < 0) // Skip explicit undefined mask indices.

continue;

// Handle first input vector of the vector_shuffle.

if (Index < HalfVec && LHSLastByteDefined >= 0) {

nemanjaiUnsubmitted

Not Done

Why do we only check here if LHSLastByteDefined >= 0 and similarly for the RHS below? Do we really want to pretend that a shuffle mask is in range if the last byte/element defined is undefined (i.e. presumably no bytes are defined)?

nemanjai: Why do we only check here if `LHSLastByteDefined >= 0` and similarly for the RHS below? Do we…

if (!(Index <= LHSLastByteDefined))

kamaubUnsubmitted

Not Done

Please change this to > (and for below).

kamaub: Please change this to `>` (and for below).

kamaubUnsubmitted

Not Done

// Handle first input vector of the vector_shuffle.

- if (Index < HalfVec && LHSLastByteDefined >= 0) {

- if (!(Index <= LHSLastByteDefined))

+ if (LHSLastByteDefined >= 0 && Index < HalfVec &&

+ Index > LHSLastByteDefined)

return false;

kamaub:

return false;

}

// Handle second input vector of the vector_shuffle.

if (Index >= HalfVec && RHSLastByteDefined >= 0) {

if (!(Index <= Index + (RHSLastByteDefined)))

kamaubUnsubmitted

Not Done

// Handle second input vector of the vector_shuffle.

- if (Index >= HalfVec && RHSLastByteDefined >= 0) {

- if (!(Index <= Index + (RHSLastByteDefined)))

- return false;

+ if (RHSLastByteDefined >= 0 && Index > HalfVec + RHSLastByteDefined) return false;

kamaub:

return false;

}

return true;

}

// On little endian subtargets, combine shuffles such as: // On little endian subtargets, combine shuffles such as:

// vector_shuffle<16,1,17,3,18,5,19,7,20,9,21,11,22,13,23,15>, <zero>, %b // vector_shuffle<16,1,17,3,18,5,19,7,20,9,21,11,22,13,23,15>, <zero>, %b

// into: // into:

// vector_shuffle<16,0,17,1,18,2,19,3,20,4,21,5,22,6,23,7>, <zero>, %b // vector_shuffle<16,0,17,1,18,2,19,3,20,4,21,5,22,6,23,7>, <zero>, %b

// because the latter can be matched to a single instruction merge. // because the latter can be matched to a single instruction merge.

// Furthermore, SCALAR_TO_VECTOR on little endian always involves a permute // Furthermore, SCALAR_TO_VECTOR on little endian always involves a permute

// to put the value into element zero. Adjust the shuffle mask so that the // to put the value into element zero. Adjust the shuffle mask so that the

// vector can remain in permuted form (to prevent a swap prior to a shuffle). // vector can remain in permuted form (to prevent a swap prior to a shuffle).

Show All 31 Lines SDValue PPCTargetLowering::combineVectorShuffle(ShuffleVectorSDNode *SVN,

// Adjust the shuffle mask if either input vector comes from a // Adjust the shuffle mask if either input vector comes from a

// SCALAR_TO_VECTOR and keep the respective input vector in permuted // SCALAR_TO_VECTOR and keep the respective input vector in permuted

// form (to prevent the need for a swap). // form (to prevent the need for a swap).

SmallVector<int, 16> ShuffV(Mask); SmallVector<int, 16> ShuffV(Mask);

SDValue SToVLHS = isScalarToVec(LHS); SDValue SToVLHS = isScalarToVec(LHS);

SDValue SToVRHS = isScalarToVec(RHS); SDValue SToVRHS = isScalarToVec(RHS);

if (SToVLHS || SToVRHS) { if (SToVLHS || SToVRHS) {

// FIXME: If both LHS and RHS are SCALAR_TO_VECTOR, but are not the EVT VT = SVN->getValueType(0);

// same type and have differing element sizes, then do not perform uint64_t ShuffleEltWidth = VT.getVectorElementType().getSizeInBits();

// the following transformation. The current transformation for int ShuffleNumElts = ShuffV.size();

// SCALAR_TO_VECTOR assumes that both input vectors have the same int HalfVec = ShuffleNumElts / 2;

// element size. This will be updated in the future to account for

// differing sizes of the LHS and RHS.

if (SToVLHS && SToVRHS &&

(SToVLHS.getValueType().getScalarSizeInBits() !=

SToVRHS.getValueType().getScalarSizeInBits()))

return Res;

int NumEltsIn = SToVLHS ? SToVLHS.getValueType().getVectorNumElements()

: SToVRHS.getValueType().getVectorNumElements();

int NumEltsOut = ShuffV.size();

// The width of the "valid lane" (i.e. the lane that contains the value that // The width of the "valid lane" (i.e. the lane that contains the value that

// is vectorized) needs to be expressed in terms of the number of elements // is vectorized) needs to be expressed in terms of the number of elements

// of the shuffle. It is thereby the ratio of the values before and after // of the shuffle. It is thereby the ratio of the values before and after

// any bitcast. // any bitcast, which will be set later on if the LHS or RHS are

unsigned ValidLaneWidth = // SCALAR_TO_VECTOR nodes.

SToVLHS ? SToVLHS.getValueType().getScalarSizeInBits() / unsigned LHSValidLaneWidth = HalfVec;

LHS.getValueType().getScalarSizeInBits() unsigned RHSValidLaneWidth = HalfVec;

nemanjaiUnsubmitted

Not Done

The name LaneWidth is misleading here. I kept thinking the width (i.e. the number of bits) of the lane that contains a defined value. But it is actually the number of valid elements in the vector.
For a node:

(shuff (v4i32 s_to_v i32), arbitrary_v4i32), mask)
LHSValidLaneWidth = 1
RHSValidLaneWidth = 4

And for a node:

(shuff (v4i32 s_to_v i32), (bitcast (s_to_v i64), v4i32), mask)
LHSValidLaneWidth = 1
RHSValidLaneWidth = 2

If I'm interpreting it correctly, please rename them to something like NumValidElts.

nemanjai: The name `LaneWidth` is misleading here. I kept thinking the width (i.e. the number of bits) of…

: SToVRHS.getValueType().getScalarSizeInBits() /

RHS.getValueType().getScalarSizeInBits();

// Initially assume that neither input is permuted. These will be adjusted // Initially assume that neither input is permuted. These will be adjusted

// accordingly if either input is. // accordingly if either input is.

kamaubUnsubmitted

Not Done

please expand this comment to point out that -1 means all elements are defined

kamaub: please expand this comment to point out that -1 means all elements are defined

int LHSMaxIdx = -1; int LHSFirstElt = 0;

int RHSMinIdx = -1; int RHSFirstElt = ShuffleNumElts;

int RHSMaxIdx = -1; int LHSLastElt = -1;

int HalfVec = LHS.getValueType().getVectorNumElements() / 2; int RHSLastElt = -1;

// Get the permuted scalar to vector nodes for the source(s) that come from // Get the permuted scalar to vector nodes for the source(s) that come from

// ISD::SCALAR_TO_VECTOR. // ISD::SCALAR_TO_VECTOR.

// On big endian systems, this only makes sense for element sizes smaller // On big endian systems, this only makes sense for element sizes smaller

// than 64 bits since for 64-bit elements, all instructions already put // than 64 bits since for 64-bit elements, all instructions already put

// the value into element zero. Since scalar size of LHS and RHS may differ // the value into element zero. Since scalar size of LHS and RHS may differ

// after isScalarToVec, this should be checked using their own sizes. // after isScalarToVec, this should be checked using their own sizes.

nemanjaiUnsubmitted

Not Done

I don't follow why we need these here. They both seem to only be needed in the respective conditions (i.e. depending on whether the LHS/RHS are scalar_to_vector nodes). And within those conditional blocks, they are reset before they're used.

So why do we need to define them here and initialize them to the width of a vector?

nemanjai: I don't follow why we need these here. They both seem to only be needed in the respective…

amykAuthorUnsubmitted

Done

Ya, I think I had that in the beginning and meant to remove it prior to putting up the patch but didn't realize that it was still left in there. I don't believe I need it either, so I've removed it.

amyk: Ya, I think I had that in the beginning and meant to remove it prior to putting up the patch…

if (SToVLHS) { if (SToVLHS) {

if (!IsLittleEndian && SToVLHS.getValueType().getScalarSizeInBits() >= 64) if (!IsLittleEndian && SToVLHS.getValueType().getScalarSizeInBits() >= 64)

return Res; return Res;

// Set up the values for the shuffle vector fixup. // Set up the values for the shuffle vector fixup.

LHSMaxIdx = NumEltsOut / NumEltsIn; LHSValidLaneWidth = SToVLHS.getValueType().getScalarSizeInBits() /

LHS.getValueType().getScalarSizeInBits();

int LHSScalarSize = SToVLHS.getValueType().getScalarSizeInBits();

nemanjaiUnsubmitted

Not Done

I think we should have an early exit here if the valid lane width is zero:

if (LHSValidLaneWidth == 0)
  return false;

Since it is not really reasonable to do this transform if we are pulling in more bits than the original scalar_to_vector actually defined. Similarly with the RHS below.

nemanjai: I think we should have an early exit here if the valid lane width is zero: ``` if…

kamaubUnsubmitted

Not Done

move LHSScalarSize up and use it in this block

kamaub: move `LHSScalarSize` up and use it in this block

LHSLastElt = LHSScalarSize / (ShuffleEltWidth + 1);

nemanjaiUnsubmitted

Not Done

Nit: maybe a comment to make this clearer:

// The last element that comes from the LHS. For example:
// (shuff (s_to_v i32), (bitcast (s_to_v i64), v4i32), ...)
// The last element that comes from the LHS is actually 0, not 3
// because elements 1 and higher of a scalar_to_vector are undefined.

nemanjai: Nit: maybe a comment to make this clearer: ``` // The last element that comes from the LHS. For…

SToVLHS = getSToVPermuted(SToVLHS, DAG, Subtarget); SToVLHS = getSToVPermuted(SToVLHS, DAG, Subtarget);

if (SToVLHS.getValueType() != LHS.getValueType()) if (SToVLHS.getValueType() != LHS.getValueType())

SToVLHS = DAG.getBitcast(LHS.getValueType(), SToVLHS); SToVLHS = DAG.getBitcast(LHS.getValueType(), SToVLHS);

LHS = SToVLHS; LHS = SToVLHS;

} }

if (SToVRHS) { if (SToVRHS) {

if (!IsLittleEndian && SToVRHS.getValueType().getScalarSizeInBits() >= 64) if (!IsLittleEndian && SToVRHS.getValueType().getScalarSizeInBits() >= 64)

return Res; return Res;

RHSMinIdx = NumEltsOut; RHSValidLaneWidth = SToVRHS.getValueType().getScalarSizeInBits() /

RHSMaxIdx = NumEltsOut / NumEltsIn + RHSMinIdx; RHS.getValueType().getScalarSizeInBits();

int RHSScalarSize = SToVRHS.getValueType().getScalarSizeInBits();

kamaubUnsubmitted

Not Done

Same here, please raise RHSScalarSize and reuse it.

kamaub: Same here, please raise `RHSScalarSize` and reuse it.

RHSLastElt = RHSScalarSize / (ShuffleEltWidth + 1) + RHSFirstElt;

nemanjaiUnsubmitted

Not Done

Similar nit as above. A comment along the lines of:

// The last element that comes from the RHS. For example:
// (shuff (s_to_v i32), (bitcast (s_to_v i64), v4i32), ...)
// The last element that comes from the RHS is actually 5, not 7
// because elements 1 and higher of a scalar_to_vector are undefined.
// It is also not 4 because the original scalar_to_vector is wider and
// actually contains two i32 elements.

nemanjai: Similar nit as above. A comment along the lines of: ``` // The last element that comes from the…

SToVRHS = getSToVPermuted(SToVRHS, DAG, Subtarget); SToVRHS = getSToVPermuted(SToVRHS, DAG, Subtarget);

if (SToVRHS.getValueType() != RHS.getValueType()) if (SToVRHS.getValueType() != RHS.getValueType())

SToVRHS = DAG.getBitcast(RHS.getValueType(), SToVRHS); SToVRHS = DAG.getBitcast(RHS.getValueType(), SToVRHS);

RHS = SToVRHS; RHS = SToVRHS;

} }

if (!isShuffleMaskInRange(ShuffV, HalfVec, LHSLastElt, RHSLastElt))

return Res;

// Fix up the shuffle mask to reflect where the desired element actually is. // Fix up the shuffle mask to reflect where the desired element actually is.

// The minimum and maximum indices that correspond to element zero for both // The minimum and maximum indices that correspond to element zero for both

// the LHS and RHS are computed and will control which shuffle mask entries // the LHS and RHS are computed and will control which shuffle mask entries

// are to be changed. For example, if the RHS is permuted, any shuffle mask // are to be changed. For example, if the RHS is permuted, any shuffle mask

// entries in the range [RHSMinIdx,RHSMaxIdx) will be adjusted. // entries in the range [RHSFirstElt,RHSLastElt] will be adjusted.

fixupShuffleMaskForPermutedSToV(ShuffV, LHSMaxIdx, RHSMinIdx, RHSMaxIdx, fixupShuffleMaskForPermutedSToV(

HalfVec, ValidLaneWidth, Subtarget); ShuffV, LHSFirstElt, LHSLastElt, RHSFirstElt, RHSLastElt, HalfVec,

LHSValidLaneWidth, RHSValidLaneWidth, Subtarget);

Res = DAG.getVectorShuffle(SVN->getValueType(0), dl, LHS, RHS, ShuffV); Res = DAG.getVectorShuffle(SVN->getValueType(0), dl, LHS, RHS, ShuffV);

// We may have simplified away the shuffle. We won't be able to do anything // We may have simplified away the shuffle. We won't be able to do anything

// further with it here. // further with it here.

if (!isa<ShuffleVectorSDNode>(Res)) if (!isa<ShuffleVectorSDNode>(Res))

return Res; return Res;

Mask = cast<ShuffleVectorSDNode>(Res)->getMask(); Mask = cast<ShuffleVectorSDNode>(Res)->getMask();

} }

▲ Show 20 Lines • Show All 3,308 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/p8-scalar_vector_conversions.ll

	Show First 20 Lines • Show All 2,505 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: sldi r4, r4, 32			; CHECK-NEXT: sldi r4, r4, 32
	; CHECK-NEXT: mtfprd f1, r3			; CHECK-NEXT: mtfprd f1, r3
	; CHECK-NEXT: mtfprd f0, r4			; CHECK-NEXT: mtfprd f0, r4
	; CHECK-NEXT: xxmrghd v2, vs0, vs1			; CHECK-NEXT: xxmrghd v2, vs0, vs1
	; CHECK-NEXT: blr			; CHECK-NEXT: blr
	;			;
	; CHECK-LE-LABEL: buildi2:			; CHECK-LE-LABEL: buildi2:
	; CHECK-LE: # %bb.0: # %entry			; CHECK-LE: # %bb.0: # %entry
	; CHECK-LE-NEXT: mtfprd f0, r4			; CHECK-LE-NEXT: mtfprwz f0, r4
	; CHECK-LE-NEXT: mtfprd f1, r3			; CHECK-LE-NEXT: mtfprd f1, r3
	; CHECK-LE-NEXT: xxswapd vs0, vs0			; CHECK-LE-NEXT: xxmrghd v2, vs1, vs0
	; CHECK-LE-NEXT: xxswapd v2, vs1
	; CHECK-LE-NEXT: xxmrgld v2, v2, vs0
	; CHECK-LE-NEXT: blr			; CHECK-LE-NEXT: blr
	;			;
	; CHECK-AIX-LABEL: buildi2:			; CHECK-AIX-LABEL: buildi2:
	; CHECK-AIX: # %bb.0: # %entry			; CHECK-AIX: # %bb.0: # %entry
	; CHECK-AIX-NEXT: sldi 4, 4, 32			; CHECK-AIX-NEXT: sldi 4, 4, 32
	; CHECK-AIX-NEXT: mtfprd 1, 3			; CHECK-AIX-NEXT: mtfprd 1, 3
	; CHECK-AIX-NEXT: mtfprd 0, 4			; CHECK-AIX-NEXT: mtfprd 0, 4
	; CHECK-AIX-NEXT: xxmrghd 34, 0, 1			; CHECK-AIX-NEXT: xxmrghd 34, 0, 1
	; CHECK-AIX-NEXT: blr			; CHECK-AIX-NEXT: blr
	entry:			entry:
	%lhs.i32 = insertelement <4 x i32> undef, i32 %arg1, i32 0			%lhs.i32 = insertelement <4 x i32> undef, i32 %arg1, i32 0
	%rhs = insertelement <2 x i64> undef, i64 %arg, i32 0			%rhs = insertelement <2 x i64> undef, i64 %arg, i32 0
	%lhs = bitcast <4 x i32> %lhs.i32 to <2 x i64>			%lhs = bitcast <4 x i32> %lhs.i32 to <2 x i64>
	%shuffle = shufflevector <2 x i64> %lhs, <2 x i64> %rhs, <2 x i32> <i32 0, i32 2>			%shuffle = shufflevector <2 x i64> %lhs, <2 x i64> %rhs, <2 x i32> <i32 0, i32 2>
	ret <2 x i64> %shuffle			ret <2 x i64> %shuffle
	}			}

llvm/test/CodeGen/PowerPC/v16i8_scalar_to_vector_shuffle.ll

Show First 20 Lines • Show All 258 Lines • ▼ Show 20 Lines
; CHECK-AIX-32-P9-NEXT: blr		; CHECK-AIX-32-P9-NEXT: blr
entry:		entry:
%lhs = load <16 x i8>, ptr %b, align 4		%lhs = load <16 x i8>, ptr %b, align 4
%rhs = insertelement <16 x i8> undef, i8 %arg, i32 0		%rhs = insertelement <16 x i8> undef, i8 %arg, i32 0
%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v16i8_v8i16(i16 %arg, i8 %arg1) {		define <16 x i8> @test_v16i8_v8i16(i16 %arg, i8 %arg1) {
		nemanjaiUnsubmitted Not Done Reply Inline Actions The code for this one gets worse on big endian. Do we know why? nemanjai: The code for this one gets worse on big endian. Do we know why?
; CHECK-LE-P8-LABEL: test_v16i8_v8i16:		; CHECK-LE-P8-LABEL: test_v16i8_v8i16:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r4		; CHECK-LE-P8-NEXT: mtvsrd v2, r4
; CHECK-LE-P8-NEXT: mtfprd f1, r3		; CHECK-LE-P8-NEXT: mtvsrd v3, r3
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: vmrghh v2, v3, v2
; CHECK-LE-P8-NEXT: xxswapd v3, vs1
; CHECK-LE-P8-NEXT: vmrglh v2, v3, v2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v16i8_v8i16:		; CHECK-LE-P9-LABEL: test_v16i8_v8i16:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r4		; CHECK-LE-P9-NEXT: mtvsrd v2, r4
; CHECK-LE-P9-NEXT: xxswapd v2, vs0		; CHECK-LE-P9-NEXT: mtvsrd v3, r3
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: vmrghh v2, v3, v2
; CHECK-LE-P9-NEXT: xxswapd v3, vs0
; CHECK-LE-P9-NEXT: vmrglh v2, v3, v2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v16i8_v8i16:		; CHECK-BE-P8-LABEL: test_v16i8_v8i16:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r4, r4, 56		; CHECK-BE-P8-NEXT: addis r5, r2, .LCPI3_0@toc@ha
; CHECK-BE-P8-NEXT: sldi r3, r3, 48		; CHECK-BE-P8-NEXT: mtvsrwz v2, r4
; CHECK-BE-P8-NEXT: mtvsrd v2, r4		; CHECK-BE-P8-NEXT: addi r5, r5, .LCPI3_0@toc@l
; CHECK-BE-P8-NEXT: mtvsrd v3, r3		; CHECK-BE-P8-NEXT: mtvsrwz v4, r3
; CHECK-BE-P8-NEXT: vmrghh v2, v2, v3		; CHECK-BE-P8-NEXT: lxvw4x v3, 0, r5
		; CHECK-BE-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v16i8_v8i16:		; CHECK-BE-P9-LABEL: test_v16i8_v8i16:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: sldi r4, r4, 56		; CHECK-BE-P9-NEXT: mtvsrwz v2, r3
; CHECK-BE-P9-NEXT: sldi r3, r3, 48		; CHECK-BE-P9-NEXT: addis r3, r2, .LCPI3_0@toc@ha
; CHECK-BE-P9-NEXT: mtvsrd v2, r4		; CHECK-BE-P9-NEXT: mtfprwz f0, r4
; CHECK-BE-P9-NEXT: mtvsrd v3, r3		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI3_0@toc@l
; CHECK-BE-P9-NEXT: vmrghh v2, v2, v3		; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)
		; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v16i8_v8i16:		; CHECK-AIX-64-P8-LABEL: test_v16i8_v8i16:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 56		; CHECK-AIX-64-P8-NEXT: ld r5, L..C3(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 48		; CHECK-AIX-64-P8-NEXT: mtvsrwz v2, r4
; CHECK-AIX-64-P8-NEXT: mtvsrd v2, r4		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3
; CHECK-AIX-64-P8-NEXT: mtvsrd v3, r3		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-64-P8-NEXT: vmrghh v2, v2, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v16i8_v8i16:		; CHECK-AIX-64-P9-LABEL: test_v16i8_v8i16:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: sldi r4, r4, 56		; CHECK-AIX-64-P9-NEXT: mtvsrwz v2, r3
; CHECK-AIX-64-P9-NEXT: sldi r3, r3, 48		; CHECK-AIX-64-P9-NEXT: ld r3, L..C2(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: mtvsrd v2, r4		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r4
; CHECK-AIX-64-P9-NEXT: mtvsrd v3, r3		; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-64-P9-NEXT: vmrghh v2, v2, v3		; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v16i8_v8i16:		; CHECK-AIX-32-P8-LABEL: test_v16i8_v8i16:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -32
; CHECK-AIX-32-P8-NEXT: stb r4, -32(r1)		; CHECK-AIX-32-P8-NEXT: stb r4, -32(r1)
; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5
; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)
Show All 13 Lines
entry:		entry:
%lhs = insertelement <16 x i8> undef, i8 %arg1, i32 0		%lhs = insertelement <16 x i8> undef, i8 %arg1, i32 0
%rhs.tmp = insertelement <8 x i16> undef, i16 %arg, i32 0		%rhs.tmp = insertelement <8 x i16> undef, i16 %arg, i32 0
%rhs = bitcast <8 x i16> %rhs.tmp to <16 x i8>		%rhs = bitcast <8 x i16> %rhs.tmp to <16 x i8>
%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v8i16_v16i8(i16 %arg, i8 %arg1) {		define <16 x i8> @test_v8i16_v16i8(i16 %arg, i8 %arg1) {
		nemanjaiUnsubmitted Not Done Reply Inline Actions The code for this one gets worse on big endian. Do we know why? nemanjai: The code for this one gets worse on big endian. Do we know why?
; CHECK-LE-P8-LABEL: test_v8i16_v16i8:		; CHECK-LE-P8-LABEL: test_v8i16_v16i8:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r4		; CHECK-LE-P8-NEXT: mtvsrd v2, r4
; CHECK-LE-P8-NEXT: mtfprd f1, r3		; CHECK-LE-P8-NEXT: mtvsrd v3, r3
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: vmrghh v2, v2, v3
; CHECK-LE-P8-NEXT: xxswapd v3, vs1
; CHECK-LE-P8-NEXT: vmrglh v2, v2, v3
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v8i16_v16i8:		; CHECK-LE-P9-LABEL: test_v8i16_v16i8:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r4		; CHECK-LE-P9-NEXT: mtvsrd v2, r4
; CHECK-LE-P9-NEXT: xxswapd v2, vs0		; CHECK-LE-P9-NEXT: mtvsrd v3, r3
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: vmrghh v2, v2, v3
; CHECK-LE-P9-NEXT: xxswapd v3, vs0
; CHECK-LE-P9-NEXT: vmrglh v2, v2, v3
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v8i16_v16i8:		; CHECK-BE-P8-LABEL: test_v8i16_v16i8:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r4, r4, 56		; CHECK-BE-P8-NEXT: addis r5, r2, .LCPI4_0@toc@ha
; CHECK-BE-P8-NEXT: sldi r3, r3, 48		; CHECK-BE-P8-NEXT: mtvsrwz v2, r4
; CHECK-BE-P8-NEXT: mtvsrd v2, r4		; CHECK-BE-P8-NEXT: addi r5, r5, .LCPI4_0@toc@l
; CHECK-BE-P8-NEXT: mtvsrd v3, r3		; CHECK-BE-P8-NEXT: mtvsrwz v4, r3
; CHECK-BE-P8-NEXT: vmrghh v2, v3, v2		; CHECK-BE-P8-NEXT: lxvw4x v3, 0, r5
		; CHECK-BE-P8-NEXT: vperm v2, v4, v2, v3
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v8i16_v16i8:		; CHECK-BE-P9-LABEL: test_v8i16_v16i8:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: sldi r4, r4, 56		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: sldi r3, r3, 48		; CHECK-BE-P9-NEXT: addis r3, r2, .LCPI4_0@toc@ha
; CHECK-BE-P9-NEXT: mtvsrd v2, r4		; CHECK-BE-P9-NEXT: mtvsrwz v2, r4
; CHECK-BE-P9-NEXT: mtvsrd v3, r3		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI4_0@toc@l
; CHECK-BE-P9-NEXT: vmrghh v2, v3, v2		; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)
		; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v8i16_v16i8:		; CHECK-AIX-64-P8-LABEL: test_v8i16_v16i8:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 56		; CHECK-AIX-64-P8-NEXT: ld r5, L..C4(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 48		; CHECK-AIX-64-P8-NEXT: mtvsrwz v2, r4
; CHECK-AIX-64-P8-NEXT: mtvsrd v2, r4		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3
; CHECK-AIX-64-P8-NEXT: mtvsrd v3, r3		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-64-P8-NEXT: vmrghh v2, v3, v2		; CHECK-AIX-64-P8-NEXT: vperm v2, v4, v2, v3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v8i16_v16i8:		; CHECK-AIX-64-P9-LABEL: test_v8i16_v16i8:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: sldi r4, r4, 56		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: sldi r3, r3, 48		; CHECK-AIX-64-P9-NEXT: ld r3, L..C3(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: mtvsrd v2, r4		; CHECK-AIX-64-P9-NEXT: mtvsrwz v2, r4
; CHECK-AIX-64-P9-NEXT: mtvsrd v3, r3		; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-64-P9-NEXT: vmrghh v2, v3, v2		; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v8i16_v16i8:		; CHECK-AIX-32-P8-LABEL: test_v8i16_v16i8:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -32
; CHECK-AIX-32-P8-NEXT: stb r4, -32(r1)		; CHECK-AIX-32-P8-NEXT: stb r4, -32(r1)
; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5
; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)
▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
; CHECK-BE-P9-NEXT: lxv v2, 0(r4)		; CHECK-BE-P9-NEXT: lxv v2, 0(r4)
; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI5_0@toc@l		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI5_0@toc@l
; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)		; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)
; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1		; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_none_v8i16:		; CHECK-AIX-64-P8-LABEL: test_none_v8i16:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: ld r5, L..C3(r2) # %const.0		; CHECK-AIX-64-P8-NEXT: ld r5, L..C5(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: lxvw4x v2, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvw4x v2, 0, r4
; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3
; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_none_v8i16:		; CHECK-AIX-64-P9-LABEL: test_none_v8i16:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: ld r3, L..C2(r2) # %const.0		; CHECK-AIX-64-P9-NEXT: ld r3, L..C4(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)		; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)
; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)		; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1		; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_none_v8i16:		; CHECK-AIX-32-P8-LABEL: test_none_v8i16:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
; CHECK-BE-P9-LABEL: test_v8i16_none:		; CHECK-BE-P9-LABEL: test_v8i16_none:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: mtvsrwz v3, r5		; CHECK-BE-P9-NEXT: mtvsrwz v3, r5
; CHECK-BE-P9-NEXT: vinserth v2, v3, 0		; CHECK-BE-P9-NEXT: vinserth v2, v3, 0
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v8i16_none:		; CHECK-AIX-64-P8-LABEL: test_v8i16_none:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: ld r4, L..C4(r2) # %const.0		; CHECK-AIX-64-P8-NEXT: ld r4, L..C6(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3
; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r4
; CHECK-AIX-64-P8-NEXT: vperm v2, v4, v2, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v4, v2, v3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v8i16_none:		; CHECK-AIX-64-P9-LABEL: test_v8i16_none:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: mtvsrwz v3, r3		; CHECK-AIX-64-P9-NEXT: mtvsrwz v3, r3
Show All 15 Lines
; CHECK-AIX-32-P9-NEXT: mtvsrwz v3, r3		; CHECK-AIX-32-P9-NEXT: mtvsrwz v3, r3
; CHECK-AIX-32-P9-NEXT: vinserth v2, v3, 0		; CHECK-AIX-32-P9-NEXT: vinserth v2, v3, 0
; CHECK-AIX-32-P9-NEXT: blr		; CHECK-AIX-32-P9-NEXT: blr
entry:		entry:
%vecins = insertelement <8 x i16> %a, i16 %b, i32 0		%vecins = insertelement <8 x i16> %a, i16 %b, i32 0
ret <8 x i16> %vecins		ret <8 x i16> %vecins
}		}

define <16 x i8> @test_v16i8_v4i32(i8 %arg, i32 %arg1, <16 x i8> %a, <4 x i32> %b) {		define <16 x i8> @test_v16i8_v4i32(i8 %arg, i32 %arg1, <16 x i8> %a, <4 x i32> %b) {
		nemanjaiUnsubmitted Not Done Reply Inline Actions The code for this one gets worse on big endian. Do we know why? nemanjai: The code for this one gets worse on big endian. Do we know why?
; CHECK-LE-P8-LABEL: test_v16i8_v4i32:		; CHECK-LE-P8-LABEL: test_v16i8_v4i32:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtvsrd v2, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtvsrwz v3, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: vmrghb v2, v3, v2
; CHECK-LE-P8-NEXT: xxswapd v3, vs1
; CHECK-LE-P8-NEXT: vmrglb v2, v3, v2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v16i8_v4i32:		; CHECK-LE-P9-LABEL: test_v16i8_v4i32:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtvsrd v2, r3
; CHECK-LE-P9-NEXT: mtvsrws v3, r4		; CHECK-LE-P9-NEXT: mtvsrwz v3, r4
; CHECK-LE-P9-NEXT: xxswapd v2, vs0		; CHECK-LE-P9-NEXT: vmrghb v2, v3, v2
; CHECK-LE-P9-NEXT: vmrglb v2, v3, v2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v16i8_v4i32:		; CHECK-BE-P8-LABEL: test_v16i8_v4i32:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 56		; CHECK-BE-P8-NEXT: addis r5, r2, .LCPI7_0@toc@ha
; CHECK-BE-P8-NEXT: sldi r4, r4, 32		; CHECK-BE-P8-NEXT: mtvsrwz v2, r3
; CHECK-BE-P8-NEXT: mtvsrd v2, r3		; CHECK-BE-P8-NEXT: addi r5, r5, .LCPI7_0@toc@l
; CHECK-BE-P8-NEXT: mtvsrd v3, r4		; CHECK-BE-P8-NEXT: mtvsrwz v4, r4
; CHECK-BE-P8-NEXT: vmrghb v2, v2, v3		; CHECK-BE-P8-NEXT: lxvw4x v3, 0, r5
		; CHECK-BE-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v16i8_v4i32:		; CHECK-BE-P9-LABEL: test_v16i8_v4i32:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: sldi r3, r3, 56		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: mtvsrws v3, r4		; CHECK-BE-P9-NEXT: addis r3, r2, .LCPI7_0@toc@ha
; CHECK-BE-P9-NEXT: mtvsrd v2, r3		; CHECK-BE-P9-NEXT: mtvsrwz v2, r4
; CHECK-BE-P9-NEXT: vmrghb v2, v2, v3		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI7_0@toc@l
		; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)
		; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v16i8_v4i32:		; CHECK-AIX-64-P8-LABEL: test_v16i8_v4i32:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 56		; CHECK-AIX-64-P8-NEXT: ld r5, L..C7(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 32		; CHECK-AIX-64-P8-NEXT: mtvsrwz v2, r3
; CHECK-AIX-64-P8-NEXT: mtvsrd v2, r3		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r4
; CHECK-AIX-64-P8-NEXT: mtvsrd v3, r4		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-64-P8-NEXT: vmrghb v2, v2, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v16i8_v4i32:		; CHECK-AIX-64-P9-LABEL: test_v16i8_v4i32:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: sldi r3, r3, 56		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: mtvsrws v3, r4		; CHECK-AIX-64-P9-NEXT: ld r3, L..C5(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: mtvsrd v2, r3		; CHECK-AIX-64-P9-NEXT: mtvsrwz v2, r4
; CHECK-AIX-64-P9-NEXT: vmrghb v2, v2, v3		; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)
		; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v16i8_v4i32:		; CHECK-AIX-32-P8-LABEL: test_v16i8_v4i32:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5
Show All 14 Lines	entry:
%lhs.tmp = insertelement <16 x i8> %a, i8 %arg, i32 0		%lhs.tmp = insertelement <16 x i8> %a, i8 %arg, i32 0
%lhs = bitcast <16 x i8> %lhs.tmp to <16 x i8>		%lhs = bitcast <16 x i8> %lhs.tmp to <16 x i8>
%rhs.tmp = insertelement <4 x i32> %b, i32 %arg1, i32 0		%rhs.tmp = insertelement <4 x i32> %b, i32 %arg1, i32 0
%rhs = bitcast <4 x i32> %rhs.tmp to <16 x i8>		%rhs = bitcast <4 x i32> %rhs.tmp to <16 x i8>
%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 16, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 16, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v4i32_v16i8(i32 %arg, i8 %arg1) {		define <16 x i8> @test_v4i32_v16i8(i32 %arg, i8 %arg1) {
		nemanjaiUnsubmitted Not Done Reply Inline Actions The code for this one gets worse on big endian. Do we know why? nemanjai: The code for this one gets worse on big endian. Do we know why?
; CHECK-LE-P8-LABEL: test_v4i32_v16i8:		; CHECK-LE-P8-LABEL: test_v4i32_v16i8:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r4		; CHECK-LE-P8-NEXT: mtvsrd v2, r4
; CHECK-LE-P8-NEXT: mtfprd f1, r3		; CHECK-LE-P8-NEXT: mtvsrwz v3, r3
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: vmrghh v2, v2, v3
; CHECK-LE-P8-NEXT: xxswapd v3, vs1
; CHECK-LE-P8-NEXT: vmrglh v2, v2, v3
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v4i32_v16i8:		; CHECK-LE-P9-LABEL: test_v4i32_v16i8:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r4		; CHECK-LE-P9-NEXT: mtvsrd v2, r4
; CHECK-LE-P9-NEXT: mtvsrws v3, r3		; CHECK-LE-P9-NEXT: mtvsrwz v3, r3
; CHECK-LE-P9-NEXT: xxswapd v2, vs0		; CHECK-LE-P9-NEXT: vmrghh v2, v2, v3
; CHECK-LE-P9-NEXT: vmrglh v2, v2, v3
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v4i32_v16i8:		; CHECK-BE-P8-LABEL: test_v4i32_v16i8:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r4, r4, 56		; CHECK-BE-P8-NEXT: addis r5, r2, .LCPI8_0@toc@ha
; CHECK-BE-P8-NEXT: sldi r3, r3, 32		; CHECK-BE-P8-NEXT: mtvsrwz v2, r4
; CHECK-BE-P8-NEXT: mtvsrd v2, r4		; CHECK-BE-P8-NEXT: addi r5, r5, .LCPI8_0@toc@l
; CHECK-BE-P8-NEXT: mtvsrd v3, r3		; CHECK-BE-P8-NEXT: mtvsrwz v4, r3
; CHECK-BE-P8-NEXT: vmrghh v2, v3, v2		; CHECK-BE-P8-NEXT: lxvw4x v3, 0, r5
		; CHECK-BE-P8-NEXT: vperm v2, v4, v2, v3
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v4i32_v16i8:		; CHECK-BE-P9-LABEL: test_v4i32_v16i8:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: sldi r4, r4, 56		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: mtvsrws v3, r3		; CHECK-BE-P9-NEXT: addis r3, r2, .LCPI8_0@toc@ha
; CHECK-BE-P9-NEXT: mtvsrd v2, r4		; CHECK-BE-P9-NEXT: mtvsrwz v2, r4
; CHECK-BE-P9-NEXT: vmrghh v2, v3, v2		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI8_0@toc@l
		; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)
		; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v4i32_v16i8:		; CHECK-AIX-64-P8-LABEL: test_v4i32_v16i8:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 56		; CHECK-AIX-64-P8-NEXT: ld r5, L..C8(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 32		; CHECK-AIX-64-P8-NEXT: mtvsrwz v2, r4
; CHECK-AIX-64-P8-NEXT: mtvsrd v2, r4		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3
; CHECK-AIX-64-P8-NEXT: mtvsrd v3, r3		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-64-P8-NEXT: vmrghh v2, v3, v2		; CHECK-AIX-64-P8-NEXT: vperm v2, v4, v2, v3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v4i32_v16i8:		; CHECK-AIX-64-P9-LABEL: test_v4i32_v16i8:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: sldi r4, r4, 56		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: mtvsrws v3, r3		; CHECK-AIX-64-P9-NEXT: ld r3, L..C6(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: mtvsrd v2, r4		; CHECK-AIX-64-P9-NEXT: mtvsrwz v2, r4
; CHECK-AIX-64-P9-NEXT: vmrghh v2, v3, v2		; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)
		; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v4i32_v16i8:		; CHECK-AIX-32-P8-LABEL: test_v4i32_v16i8:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -32
; CHECK-AIX-32-P8-NEXT: stb r4, -32(r1)		; CHECK-AIX-32-P8-NEXT: stb r4, -32(r1)
; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5
; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)
▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: mtfprwz f0, r5		; CHECK-BE-P9-NEXT: mtfprwz f0, r5
; CHECK-BE-P9-NEXT: xxinsertw v2, vs0, 4		; CHECK-BE-P9-NEXT: xxinsertw v2, vs0, 4
; CHECK-BE-P9-NEXT: xxinsertw v2, vs0, 12		; CHECK-BE-P9-NEXT: xxinsertw v2, vs0, 12
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_none_v4i32:		; CHECK-AIX-64-P8-LABEL: test_none_v4i32:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: ld r4, L..C5(r2) # %const.0		; CHECK-AIX-64-P8-NEXT: ld r4, L..C9(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3
; CHECK-AIX-64-P8-NEXT: ld r3, L..C6(r2) # %const.1		; CHECK-AIX-64-P8-NEXT: ld r3, L..C10(r2) # %const.1
; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r4
; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r3		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r3
; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_none_v4i32:		; CHECK-AIX-64-P9-LABEL: test_none_v4i32:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
▲ Show 20 Lines • Show All 74 Lines • ▼ Show 20 Lines
; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)		; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)
; CHECK-BE-P9-NEXT: vspltb v2, v2, 7		; CHECK-BE-P9-NEXT: vspltb v2, v2, 7
; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1		; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v4i32_none:		; CHECK-AIX-64-P8-LABEL: test_v4i32_none:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: lbzx r4, 0, r4		; CHECK-AIX-64-P8-NEXT: lbzx r4, 0, r4
; CHECK-AIX-64-P8-NEXT: ld r5, L..C7(r2) # %const.0		; CHECK-AIX-64-P8-NEXT: ld r5, L..C11(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: lxsiwzx v3, 0, r3		; CHECK-AIX-64-P8-NEXT: lxsiwzx v3, 0, r3
; CHECK-AIX-64-P8-NEXT: mtvsrwz v2, r4		; CHECK-AIX-64-P8-NEXT: mtvsrwz v2, r4
; CHECK-AIX-64-P8-NEXT: lxvw4x v4, 0, r5		; CHECK-AIX-64-P8-NEXT: lxvw4x v4, 0, r5
; CHECK-AIX-64-P8-NEXT: vspltb v2, v2, 7		; CHECK-AIX-64-P8-NEXT: vspltb v2, v2, 7
; CHECK-AIX-64-P8-NEXT: vperm v2, v3, v2, v4		; CHECK-AIX-64-P8-NEXT: vperm v2, v3, v2, v4
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v4i32_none:		; CHECK-AIX-64-P9-LABEL: test_v4i32_none:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lfiwzx f0, 0, r3		; CHECK-AIX-64-P9-NEXT: lfiwzx f0, 0, r3
; CHECK-AIX-64-P9-NEXT: ld r3, L..C3(r2) # %const.0		; CHECK-AIX-64-P9-NEXT: ld r3, L..C7(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: lxsibzx v2, 0, r4		; CHECK-AIX-64-P9-NEXT: lxsibzx v2, 0, r4
; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)		; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-64-P9-NEXT: vspltb v2, v2, 7		; CHECK-AIX-64-P9-NEXT: vspltb v2, v2, 7
; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1		; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v4i32_none:		; CHECK-AIX-32-P8-LABEL: test_v4i32_none:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
Show All 26 Lines	entry:
%3 = bitcast <16 x i8> %vecinit6 to <16 x i8>		%3 = bitcast <16 x i8> %vecinit6 to <16 x i8>
%shuffle = shufflevector <16 x i8> %2, <16 x i8> %3, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %2, <16 x i8> %3, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v16i8_v2i64(i8 %arg, i64 %arg1, <16 x i8> %a, <2 x i64> %b) {		define <16 x i8> @test_v16i8_v2i64(i8 %arg, i64 %arg1, <16 x i8> %a, <2 x i64> %b) {
; CHECK-LE-P8-LABEL: test_v16i8_v2i64:		; CHECK-LE-P8-LABEL: test_v16i8_v2i64:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtvsrd v2, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtvsrd v3, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: vmrghb v2, v3, v2
; CHECK-LE-P8-NEXT: xxswapd v3, vs1
; CHECK-LE-P8-NEXT: vmrglb v2, v3, v2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v16i8_v2i64:		; CHECK-LE-P9-LABEL: test_v16i8_v2i64:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtvsrd v2, r3
; CHECK-LE-P9-NEXT: xxswapd v2, vs0		; CHECK-LE-P9-NEXT: mtvsrd v3, r4
; CHECK-LE-P9-NEXT: mtfprd f0, r4		; CHECK-LE-P9-NEXT: vmrghb v2, v3, v2
; CHECK-LE-P9-NEXT: xxswapd v3, vs0
; CHECK-LE-P9-NEXT: vmrglb v2, v3, v2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v16i8_v2i64:		; CHECK-BE-P8-LABEL: test_v16i8_v2i64:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 56		; CHECK-BE-P8-NEXT: sldi r3, r3, 56
; CHECK-BE-P8-NEXT: mtvsrd v3, r4		; CHECK-BE-P8-NEXT: mtvsrd v3, r4
; CHECK-BE-P8-NEXT: mtvsrd v2, r3		; CHECK-BE-P8-NEXT: mtvsrd v2, r3
; CHECK-BE-P8-NEXT: vmrghb v2, v2, v3		; CHECK-BE-P8-NEXT: vmrghb v2, v2, v3
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines	entry:
%rhs = bitcast <2 x i64> %rhs.tmp to <16 x i8>		%rhs = bitcast <2 x i64> %rhs.tmp to <16 x i8>
%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 16, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 16, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v2i64_v16i8(i64 %arg, i8 %arg1) {		define <16 x i8> @test_v2i64_v16i8(i64 %arg, i8 %arg1) {
; CHECK-LE-P8-LABEL: test_v2i64_v16i8:		; CHECK-LE-P8-LABEL: test_v2i64_v16i8:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r4		; CHECK-LE-P8-NEXT: mtvsrd v2, r4
; CHECK-LE-P8-NEXT: mtfprd f1, r3		; CHECK-LE-P8-NEXT: mtvsrd v3, r3
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: vmrghh v2, v2, v3
; CHECK-LE-P8-NEXT: xxswapd v3, vs1
; CHECK-LE-P8-NEXT: vmrglh v2, v2, v3
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v2i64_v16i8:		; CHECK-LE-P9-LABEL: test_v2i64_v16i8:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r4		; CHECK-LE-P9-NEXT: mtvsrd v2, r4
; CHECK-LE-P9-NEXT: xxswapd v2, vs0		; CHECK-LE-P9-NEXT: mtvsrd v3, r3
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: vmrghh v2, v2, v3
; CHECK-LE-P9-NEXT: xxswapd v3, vs0
; CHECK-LE-P9-NEXT: vmrglh v2, v2, v3
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v2i64_v16i8:		; CHECK-BE-P8-LABEL: test_v2i64_v16i8:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r4, r4, 56		; CHECK-BE-P8-NEXT: sldi r4, r4, 56
; CHECK-BE-P8-NEXT: mtvsrd v3, r3		; CHECK-BE-P8-NEXT: mtvsrd v3, r3
; CHECK-BE-P8-NEXT: mtvsrd v2, r4		; CHECK-BE-P8-NEXT: mtvsrd v2, r4
; CHECK-BE-P8-NEXT: vmrghh v2, v3, v2		; CHECK-BE-P8-NEXT: vmrghh v2, v3, v2
▲ Show 20 Lines • Show All 355 Lines • ▼ Show 20 Lines
; CHECK-BE-P9-NEXT: mtfprwz f1, r3		; CHECK-BE-P9-NEXT: mtfprwz f1, r3
; CHECK-BE-P9-NEXT: addi r5, r5, .LCPI16_0@toc@l		; CHECK-BE-P9-NEXT: addi r5, r5, .LCPI16_0@toc@l
; CHECK-BE-P9-NEXT: lxv vs0, 0(r5)		; CHECK-BE-P9-NEXT: lxv vs0, 0(r5)
; CHECK-BE-P9-NEXT: xxperm v2, vs1, vs0		; CHECK-BE-P9-NEXT: xxperm v2, vs1, vs0
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v8i16_v8i16rhs:		; CHECK-AIX-64-P8-LABEL: test_v8i16_v8i16rhs:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: ld r5, L..C8(r2) # %const.0		; CHECK-AIX-64-P8-NEXT: ld r5, L..C12(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: mtvsrwz v2, r4		; CHECK-AIX-64-P8-NEXT: mtvsrwz v2, r4
; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3
; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-64-P8-NEXT: vperm v2, v4, v2, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v4, v2, v3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v8i16_v8i16rhs:		; CHECK-AIX-64-P9-LABEL: test_v8i16_v8i16rhs:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: ld r5, L..C4(r2) # %const.0		; CHECK-AIX-64-P9-NEXT: ld r5, L..C8(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: mtvsrwz v2, r4		; CHECK-AIX-64-P9-NEXT: mtvsrwz v2, r4
; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r3
; CHECK-AIX-64-P9-NEXT: lxv vs0, 0(r5)		; CHECK-AIX-64-P9-NEXT: lxv vs0, 0(r5)
; CHECK-AIX-64-P9-NEXT: xxperm v2, vs1, vs0		; CHECK-AIX-64-P9-NEXT: xxperm v2, vs1, vs0
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v8i16_v8i16rhs:		; CHECK-AIX-32-P8-LABEL: test_v8i16_v8i16rhs:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
Show All 18 Lines	entry:
%rhs.tmp = insertelement <8 x i16> undef, i16 %arg1, i32 0		%rhs.tmp = insertelement <8 x i16> undef, i16 %arg1, i32 0
%rhs = bitcast <8 x i16> %rhs.tmp to <16 x i8>		%rhs = bitcast <8 x i16> %rhs.tmp to <16 x i8>
%lhs.tmp = insertelement <8 x i16> undef, i16 %arg, i32 0		%lhs.tmp = insertelement <8 x i16> undef, i16 %arg, i32 0
%lhs = bitcast <8 x i16> %lhs.tmp to <16 x i8>		%lhs = bitcast <8 x i16> %lhs.tmp to <16 x i8>
%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v8i16_v4i32(<8 x i16> %a, <4 x i32> %b, i16 %arg, i32 %arg1) {		define <16 x i8> @test_v8i16_v4i32(<8 x i16> %a, <4 x i32> %b, i16 %arg, i32 %arg1) {
		nemanjaiUnsubmitted Not Done Reply Inline Actions The code for this one gets worse on big endian. Do we know why? nemanjai: The code for this one gets worse on big endian. Do we know why?
; CHECK-LE-P8-LABEL: test_v8i16_v4i32:		; CHECK-LE-P8-LABEL: test_v8i16_v4i32:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r7		; CHECK-LE-P8-NEXT: mtvsrd v2, r7
; CHECK-LE-P8-NEXT: mtfprd f1, r8		; CHECK-LE-P8-NEXT: mtvsrwz v3, r8
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: vmrghb v2, v3, v2
; CHECK-LE-P8-NEXT: xxswapd v3, vs1
; CHECK-LE-P8-NEXT: vmrglb v2, v3, v2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v8i16_v4i32:		; CHECK-LE-P9-LABEL: test_v8i16_v4i32:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r7		; CHECK-LE-P9-NEXT: mtvsrd v2, r7
; CHECK-LE-P9-NEXT: mtvsrws v3, r8		; CHECK-LE-P9-NEXT: mtvsrwz v3, r8
; CHECK-LE-P9-NEXT: xxswapd v2, vs0		; CHECK-LE-P9-NEXT: vmrghb v2, v3, v2
; CHECK-LE-P9-NEXT: vmrglb v2, v3, v2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v8i16_v4i32:		; CHECK-BE-P8-LABEL: test_v8i16_v4i32:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r7, 48		; CHECK-BE-P8-NEXT: addis r3, r2, .LCPI17_0@toc@ha
; CHECK-BE-P8-NEXT: sldi r4, r8, 32		; CHECK-BE-P8-NEXT: mtvsrwz v2, r7
; CHECK-BE-P8-NEXT: mtvsrd v2, r3		; CHECK-BE-P8-NEXT: addi r3, r3, .LCPI17_0@toc@l
; CHECK-BE-P8-NEXT: mtvsrd v3, r4		; CHECK-BE-P8-NEXT: mtvsrwz v4, r8
; CHECK-BE-P8-NEXT: vmrghb v2, v2, v3		; CHECK-BE-P8-NEXT: lxvw4x v3, 0, r3
		; CHECK-BE-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v8i16_v4i32:		; CHECK-BE-P9-LABEL: test_v8i16_v4i32:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: sldi r3, r7, 48		; CHECK-BE-P9-NEXT: addis r3, r2, .LCPI17_0@toc@ha
; CHECK-BE-P9-NEXT: mtvsrws v3, r8		; CHECK-BE-P9-NEXT: mtfprwz f0, r7
; CHECK-BE-P9-NEXT: mtvsrd v2, r3		; CHECK-BE-P9-NEXT: mtvsrwz v2, r8
; CHECK-BE-P9-NEXT: vmrghb v2, v2, v3		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI17_0@toc@l
		; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)
		; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v8i16_v4i32:		; CHECK-AIX-64-P8-LABEL: test_v8i16_v4i32:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 48		; CHECK-AIX-64-P8-NEXT: ld r5, L..C13(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 32		; CHECK-AIX-64-P8-NEXT: mtvsrwz v2, r3
; CHECK-AIX-64-P8-NEXT: mtvsrd v2, r3		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r4
; CHECK-AIX-64-P8-NEXT: mtvsrd v3, r4		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-64-P8-NEXT: vmrghb v2, v2, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v8i16_v4i32:		; CHECK-AIX-64-P9-LABEL: test_v8i16_v4i32:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: sldi r3, r3, 48		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: mtvsrws v3, r4		; CHECK-AIX-64-P9-NEXT: ld r3, L..C9(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: mtvsrd v2, r3		; CHECK-AIX-64-P9-NEXT: mtvsrwz v2, r4
; CHECK-AIX-64-P9-NEXT: vmrghb v2, v2, v3		; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)
		; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v8i16_v4i32:		; CHECK-AIX-32-P8-LABEL: test_v8i16_v4i32:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5
Show All 17 Lines	entry:
%rhs = bitcast <4 x i32> %rhs.tmp to <16 x i8>		%rhs = bitcast <4 x i32> %rhs.tmp to <16 x i8>
%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 16, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 16, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v8i16_v2i64(<8 x i16> %a, <2 x i64> %b, i16 %arg, i64 %arg1) {		define <16 x i8> @test_v8i16_v2i64(<8 x i16> %a, <2 x i64> %b, i16 %arg, i64 %arg1) {
; CHECK-LE-P8-LABEL: test_v8i16_v2i64:		; CHECK-LE-P8-LABEL: test_v8i16_v2i64:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r7		; CHECK-LE-P8-NEXT: mtvsrd v2, r7
; CHECK-LE-P8-NEXT: mtfprd f1, r8		; CHECK-LE-P8-NEXT: mtvsrd v3, r8
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: vmrghb v2, v3, v2
; CHECK-LE-P8-NEXT: xxswapd v3, vs1
; CHECK-LE-P8-NEXT: vmrglb v2, v3, v2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v8i16_v2i64:		; CHECK-LE-P9-LABEL: test_v8i16_v2i64:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r7		; CHECK-LE-P9-NEXT: mtvsrd v2, r7
; CHECK-LE-P9-NEXT: xxswapd v2, vs0		; CHECK-LE-P9-NEXT: mtvsrd v3, r8
; CHECK-LE-P9-NEXT: mtfprd f0, r8		; CHECK-LE-P9-NEXT: vmrghb v2, v3, v2
; CHECK-LE-P9-NEXT: xxswapd v3, vs0
; CHECK-LE-P9-NEXT: vmrglb v2, v3, v2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v8i16_v2i64:		; CHECK-BE-P8-LABEL: test_v8i16_v2i64:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r7, 48		; CHECK-BE-P8-NEXT: sldi r3, r7, 48
; CHECK-BE-P8-NEXT: mtvsrd v3, r8		; CHECK-BE-P8-NEXT: mtvsrd v3, r8
; CHECK-BE-P8-NEXT: mtvsrd v2, r3		; CHECK-BE-P8-NEXT: mtvsrd v2, r3
; CHECK-BE-P8-NEXT: vmrghb v2, v2, v3		; CHECK-BE-P8-NEXT: vmrghb v2, v2, v3
▲ Show 20 Lines • Show All 117 Lines • ▼ Show 20 Lines	entry:
%lhs.tmp = insertelement <4 x i32> %a, i32 %arg, i32 0		%lhs.tmp = insertelement <4 x i32> %a, i32 %arg, i32 0
%lhs = bitcast <4 x i32> %lhs.tmp to <16 x i8>		%lhs = bitcast <4 x i32> %lhs.tmp to <16 x i8>
%rhs.tmp = insertelement <4 x i32> %b, i32 %arg1, i32 0		%rhs.tmp = insertelement <4 x i32> %b, i32 %arg1, i32 0
%rhs = bitcast <4 x i32> %rhs.tmp to <16 x i8>		%rhs = bitcast <4 x i32> %rhs.tmp to <16 x i8>
%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 16, i32 17, i32 18, i32 19, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 16, i32 17, i32 18, i32 19, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v4i32_v8i16(i32 %arg, i16 %arg1) {		define <16 x i8> @test_v4i32_v8i16(i32 %arg, i16 %arg1) {
		nemanjaiUnsubmitted Not Done Reply Inline Actions The code for this one gets worse on big endian. Do we know why? There are probably a bunch of other places. Can you please review what is happening there? I'll stop adding further similar comments. nemanjai: The code for this one gets worse on big endian. Do we know why? There are probably a bunch of…
; CHECK-LE-P8-LABEL: test_v4i32_v8i16:		; CHECK-LE-P8-LABEL: test_v4i32_v8i16:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtvsrwz v2, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtvsrd v3, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: vmrghh v2, v3, v2
; CHECK-LE-P8-NEXT: xxswapd v3, vs1
; CHECK-LE-P8-NEXT: vmrglh v2, v3, v2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v4i32_v8i16:		; CHECK-LE-P9-LABEL: test_v4i32_v8i16:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r4		; CHECK-LE-P9-NEXT: mtvsrwz v2, r3
; CHECK-LE-P9-NEXT: mtvsrws v2, r3		; CHECK-LE-P9-NEXT: mtvsrd v3, r4
; CHECK-LE-P9-NEXT: xxswapd v3, vs0		; CHECK-LE-P9-NEXT: vmrghh v2, v3, v2
; CHECK-LE-P9-NEXT: vmrglh v2, v3, v2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v4i32_v8i16:		; CHECK-BE-P8-LABEL: test_v4i32_v8i16:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 32		; CHECK-BE-P8-NEXT: addis r5, r2, .LCPI20_0@toc@ha
; CHECK-BE-P8-NEXT: sldi r4, r4, 48		; CHECK-BE-P8-NEXT: mtvsrwz v2, r3
; CHECK-BE-P8-NEXT: mtvsrd v2, r3		; CHECK-BE-P8-NEXT: addi r5, r5, .LCPI20_0@toc@l
; CHECK-BE-P8-NEXT: mtvsrd v3, r4		; CHECK-BE-P8-NEXT: mtvsrwz v4, r4
; CHECK-BE-P8-NEXT: vmrghh v2, v2, v3		; CHECK-BE-P8-NEXT: lxvw4x v3, 0, r5
		; CHECK-BE-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v4i32_v8i16:		; CHECK-BE-P9-LABEL: test_v4i32_v8i16:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: mtvsrws v2, r3		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: sldi r3, r4, 48		; CHECK-BE-P9-NEXT: addis r3, r2, .LCPI20_0@toc@ha
; CHECK-BE-P9-NEXT: mtvsrd v3, r3		; CHECK-BE-P9-NEXT: mtvsrwz v2, r4
; CHECK-BE-P9-NEXT: vmrghh v2, v2, v3		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI20_0@toc@l
		; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)
		; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v4i32_v8i16:		; CHECK-AIX-64-P8-LABEL: test_v4i32_v8i16:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 32		; CHECK-AIX-64-P8-NEXT: ld r5, L..C14(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 48		; CHECK-AIX-64-P8-NEXT: mtvsrwz v2, r3
; CHECK-AIX-64-P8-NEXT: mtvsrd v2, r3		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r4
; CHECK-AIX-64-P8-NEXT: mtvsrd v3, r4		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-64-P8-NEXT: vmrghh v2, v2, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v4i32_v8i16:		; CHECK-AIX-64-P9-LABEL: test_v4i32_v8i16:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: mtvsrws v2, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: sldi r3, r4, 48		; CHECK-AIX-64-P9-NEXT: ld r3, L..C10(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: mtvsrd v3, r3		; CHECK-AIX-64-P9-NEXT: mtvsrwz v2, r4
; CHECK-AIX-64-P9-NEXT: vmrghh v2, v2, v3		; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)
		; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v4i32_v8i16:		; CHECK-AIX-32-P8-LABEL: test_v4i32_v8i16:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r5
▲ Show 20 Lines • Show All 92 Lines • ▼ Show 20 Lines	entry:
%shuffle = shufflevector <16 x i8> %2, <16 x i8> %3, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %2, <16 x i8> %3, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v2i64_v4i32(i64 %arg, i32 %arg1, <2 x i64> %a, <4 x i32> %b) {		define <16 x i8> @test_v2i64_v4i32(i64 %arg, i32 %arg1, <2 x i64> %a, <4 x i32> %b) {
; CHECK-LE-P8-LABEL: test_v2i64_v4i32:		; CHECK-LE-P8-LABEL: test_v2i64_v4i32:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprwz f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxmrghw v2, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd vs1, vs1
; CHECK-LE-P8-NEXT: xxmrglw v2, vs1, vs0
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v2i64_v4i32:		; CHECK-LE-P9-LABEL: test_v2i64_v4i32:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: mtvsrws vs1, r4		; CHECK-LE-P9-NEXT: mtfprwz f1, r4
; CHECK-LE-P9-NEXT: xxswapd vs0, vs0		; CHECK-LE-P9-NEXT: xxmrghw v2, vs1, vs0
; CHECK-LE-P9-NEXT: xxmrglw v2, vs1, vs0
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v2i64_v4i32:		; CHECK-BE-P8-LABEL: test_v2i64_v4i32:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: mtfprd f0, r3
; CHECK-BE-P8-NEXT: sldi r3, r4, 32		; CHECK-BE-P8-NEXT: sldi r3, r4, 32
; CHECK-BE-P8-NEXT: mtfprd f1, r3		; CHECK-BE-P8-NEXT: mtfprd f1, r3
; CHECK-BE-P8-NEXT: xxmrghw v2, vs0, vs1		; CHECK-BE-P8-NEXT: xxmrghw v2, vs0, vs1
▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines	entry:
%rhs = bitcast <4 x i32> %rhs.tmp to <16 x i8>		%rhs = bitcast <4 x i32> %rhs.tmp to <16 x i8>
%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 16, i32 17, i32 18, i32 19, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 16, i32 17, i32 18, i32 19, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v2i64_v8i16(i64 %arg, i16 %arg1) {		define <16 x i8> @test_v2i64_v8i16(i64 %arg, i16 %arg1) {
; CHECK-LE-P8-LABEL: test_v2i64_v8i16:		; CHECK-LE-P8-LABEL: test_v2i64_v8i16:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtvsrd v2, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtvsrd v3, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: vmrghh v2, v3, v2
; CHECK-LE-P8-NEXT: xxswapd v3, vs1
; CHECK-LE-P8-NEXT: vmrglh v2, v3, v2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v2i64_v8i16:		; CHECK-LE-P9-LABEL: test_v2i64_v8i16:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtvsrd v2, r3
; CHECK-LE-P9-NEXT: xxswapd v2, vs0		; CHECK-LE-P9-NEXT: mtvsrd v3, r4
; CHECK-LE-P9-NEXT: mtfprd f0, r4		; CHECK-LE-P9-NEXT: vmrghh v2, v3, v2
; CHECK-LE-P9-NEXT: xxswapd v3, vs0
; CHECK-LE-P9-NEXT: vmrglh v2, v3, v2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v2i64_v8i16:		; CHECK-BE-P8-LABEL: test_v2i64_v8i16:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: mtvsrd v2, r3		; CHECK-BE-P8-NEXT: mtvsrd v2, r3
; CHECK-BE-P8-NEXT: sldi r3, r4, 48		; CHECK-BE-P8-NEXT: sldi r3, r4, 48
; CHECK-BE-P8-NEXT: mtvsrd v3, r3		; CHECK-BE-P8-NEXT: mtvsrd v3, r3
; CHECK-BE-P8-NEXT: vmrghh v2, v2, v3		; CHECK-BE-P8-NEXT: vmrghh v2, v2, v3
▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines	entry:
%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %lhs, <16 x i8> %rhs, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v4i32_v2i64(ptr nocapture noundef readonly %a, ptr nocapture noundef readonly %b) {		define <16 x i8> @test_v4i32_v2i64(ptr nocapture noundef readonly %a, ptr nocapture noundef readonly %b) {
; CHECK-LE-P8-LABEL: test_v4i32_v2i64:		; CHECK-LE-P8-LABEL: test_v4i32_v2i64:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: addis r5, r2, .LCPI24_0@toc@ha		; CHECK-LE-P8-NEXT: addis r5, r2, .LCPI24_0@toc@ha
; CHECK-LE-P8-NEXT: lfiwzx f0, 0, r3		; CHECK-LE-P8-NEXT: lxsiwzx v2, 0, r3
; CHECK-LE-P8-NEXT: lfdx f1, 0, r4		; CHECK-LE-P8-NEXT: lxsdx v3, 0, r4
; CHECK-LE-P8-NEXT: addi r3, r5, .LCPI24_0@toc@l		; CHECK-LE-P8-NEXT: addi r5, r5, .LCPI24_0@toc@l
; CHECK-LE-P8-NEXT: lxvd2x vs2, 0, r3		; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r5
; CHECK-LE-P8-NEXT: xxswapd v2, f0		; CHECK-LE-P8-NEXT: xxswapd v4, vs0
; CHECK-LE-P8-NEXT: xxswapd v3, f1
; CHECK-LE-P8-NEXT: xxswapd v4, vs2
; CHECK-LE-P8-NEXT: vperm v2, v3, v2, v4		; CHECK-LE-P8-NEXT: vperm v2, v3, v2, v4
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v4i32_v2i64:		; CHECK-LE-P9-LABEL: test_v4i32_v2i64:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lfiwzx f0, 0, r3		; CHECK-LE-P9-NEXT: lxsiwzx v2, 0, r3
; CHECK-LE-P9-NEXT: addis r3, r2, .LCPI24_0@toc@ha		; CHECK-LE-P9-NEXT: addis r3, r2, .LCPI24_0@toc@ha
; CHECK-LE-P9-NEXT: addi r3, r3, .LCPI24_0@toc@l
; CHECK-LE-P9-NEXT: xxswapd v2, f0
; CHECK-LE-P9-NEXT: lfd f0, 0(r4)		; CHECK-LE-P9-NEXT: lfd f0, 0(r4)
; CHECK-LE-P9-NEXT: xxswapd v3, f0		; CHECK-LE-P9-NEXT: addi r3, r3, .LCPI24_0@toc@l
; CHECK-LE-P9-NEXT: lxv vs0, 0(r3)		; CHECK-LE-P9-NEXT: lxv vs1, 0(r3)
; CHECK-LE-P9-NEXT: xxperm v2, v3, vs0		; CHECK-LE-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v4i32_v2i64:		; CHECK-BE-P8-LABEL: test_v4i32_v2i64:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lfiwzx f0, 0, r3		; CHECK-BE-P8-NEXT: lfiwzx f0, 0, r3
; CHECK-BE-P8-NEXT: addis r5, r2, .LCPI24_0@toc@ha		; CHECK-BE-P8-NEXT: addis r5, r2, .LCPI24_0@toc@ha
; CHECK-BE-P8-NEXT: lxsdx v3, 0, r4		; CHECK-BE-P8-NEXT: lxsdx v3, 0, r4
; CHECK-BE-P8-NEXT: addi r3, r5, .LCPI24_0@toc@l		; CHECK-BE-P8-NEXT: addi r3, r5, .LCPI24_0@toc@l
Show All 10 Lines
; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI24_0@toc@l		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI24_0@toc@l
; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)		; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)
; CHECK-BE-P9-NEXT: xxsldwi vs0, f0, f0, 1		; CHECK-BE-P9-NEXT: xxsldwi vs0, f0, f0, 1
; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1		; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v4i32_v2i64:		; CHECK-AIX-64-P8-LABEL: test_v4i32_v2i64:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: ld r5, L..C9(r2) # %const.0		; CHECK-AIX-64-P8-NEXT: ld r5, L..C15(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: lfiwzx f0, 0, r3		; CHECK-AIX-64-P8-NEXT: lfiwzx f0, 0, r3
; CHECK-AIX-64-P8-NEXT: lxsdx v3, 0, r4		; CHECK-AIX-64-P8-NEXT: lxsdx v3, 0, r4
; CHECK-AIX-64-P8-NEXT: xxsldwi v2, f0, f0, 1		; CHECK-AIX-64-P8-NEXT: xxsldwi v2, f0, f0, 1
; CHECK-AIX-64-P8-NEXT: lxvw4x v4, 0, r5		; CHECK-AIX-64-P8-NEXT: lxvw4x v4, 0, r5
; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v3, v4		; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v3, v4
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v4i32_v2i64:		; CHECK-AIX-64-P9-LABEL: test_v4i32_v2i64:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lfiwzx f0, 0, r3		; CHECK-AIX-64-P9-NEXT: lfiwzx f0, 0, r3
; CHECK-AIX-64-P9-NEXT: ld r3, L..C5(r2) # %const.0		; CHECK-AIX-64-P9-NEXT: ld r3, L..C11(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: lxsd v2, 0(r4)		; CHECK-AIX-64-P9-NEXT: lxsd v2, 0(r4)
; CHECK-AIX-64-P9-NEXT: xxsldwi vs0, f0, f0, 1		; CHECK-AIX-64-P9-NEXT: xxsldwi vs0, f0, f0, 1
; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)		; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1		; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v4i32_v2i64:		; CHECK-AIX-32-P8-LABEL: test_v4i32_v2i64:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
▲ Show 20 Lines • Show All 41 Lines • Show Last 20 Lines

llvm/test/CodeGen/PowerPC/v2i64_scalar_to_vector_shuffle.ll

Show All 24 Lines
; RUN: -ppc-vsr-nums-as-vr -mtriple=powerpc-ibm-aix < %s \| \		; RUN: -ppc-vsr-nums-as-vr -mtriple=powerpc-ibm-aix < %s \| \
; RUN: FileCheck %s --check-prefix=CHECK-AIX-32-P9		; RUN: FileCheck %s --check-prefix=CHECK-AIX-32-P9

define <2 x i64> @test_v16i8_v16i8(i8 %arg1, i8 %arg) {		define <2 x i64> @test_v16i8_v16i8(i8 %arg1, i8 %arg) {
; CHECK-LE-P8-LABEL: test_v16i8_v16i8:		; CHECK-LE-P8-LABEL: test_v16i8_v16i8:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxmrgld v2, vs1, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v16i8_v16i8:		; CHECK-LE-P9-LABEL: test_v16i8_v16i8:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: mtfprd f1, r4		; CHECK-LE-P9-NEXT: mtfprd f1, r4
; CHECK-LE-P9-NEXT: xxmrgld v2, vs1, vs0		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v16i8_v16i8:		; CHECK-BE-P8-LABEL: test_v16i8_v16i8:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: mtfprwz f0, r3		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: mtfprwz f1, r4		; CHECK-BE-P8-NEXT: mtfprwz f1, r4
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1		; CHECK-BE-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v16i8_v16i8:		; CHECK-BE-P9-LABEL: test_v16i8_v16i8:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: mtfprwz f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: mtfprwz f1, r4		; CHECK-BE-P9-NEXT: mtfprwz f1, r4
; CHECK-BE-P9-NEXT: xxmrghd v2, vs0, vs1		; CHECK-BE-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v16i8_v16i8:		; CHECK-AIX-64-P8-LABEL: test_v16i8_v16i8:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4		; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs1		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v16i8_v16i8:		; CHECK-AIX-64-P9-LABEL: test_v16i8_v16i8:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4		; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs0, vs1		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v16i8_v16i8:		; CHECK-AIX-32-P8-LABEL: test_v16i8_v16i8:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
Show All 20 Lines
}		}

define <2 x i64> @test_none_v16i8(i8 %arg1, ptr nocapture noundef readonly %b) {		define <2 x i64> @test_none_v16i8(i8 %arg1, ptr nocapture noundef readonly %b) {
; CHECK-LE-P8-LABEL: test_none_v16i8:		; CHECK-LE-P8-LABEL: test_none_v16i8:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4		; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: xxswapd v2, vs0
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: xxmrgld v2, vs0, v2		; CHECK-LE-P8-NEXT: xxpermdi v2, vs0, v2, 1
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_none_v16i8:		; CHECK-LE-P9-LABEL: test_none_v16i8:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxv v2, 0(r4)		; CHECK-LE-P9-NEXT: lxv v2, 0(r4)
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: xxmrgld v2, vs0, v2		; CHECK-LE-P9-NEXT: xxpermdi v2, vs0, v2, 1
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_none_v16i8:		; CHECK-BE-P8-LABEL: test_none_v16i8:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-BE-P8-NEXT: mtfprwz f0, r3		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P8-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_none_v16i8:		; CHECK-BE-P9-LABEL: test_none_v16i8:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: lxv v2, 0(r4)		; CHECK-BE-P9-NEXT: lxv v2, 0(r4)
; CHECK-BE-P9-NEXT: mtfprwz f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P9-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_none_v16i8:		; CHECK-AIX-64-P8-LABEL: test_none_v16i8:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P8-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_none_v16i8:		; CHECK-AIX-64-P9-LABEL: test_none_v16i8:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)		; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P9-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_none_v16i8:		; CHECK-AIX-32-P8-LABEL: test_none_v16i8:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4
Show All 16 Lines
}		}

define <2 x i64> @test_v16i8_none(i8 %arg1, ptr nocapture noundef readonly %b) {		define <2 x i64> @test_v16i8_none(i8 %arg1, ptr nocapture noundef readonly %b) {
; CHECK-LE-P8-LABEL: test_v16i8_none:		; CHECK-LE-P8-LABEL: test_v16i8_none:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4		; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: xxswapd v2, vs0
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: xxmrgld v2, v2, vs0		; CHECK-LE-P8-NEXT: xxpermdi v2, v2, vs0, 2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v16i8_none:		; CHECK-LE-P9-LABEL: test_v16i8_none:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxv v2, 0(r4)		; CHECK-LE-P9-NEXT: lxv v2, 0(r4)
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: xxmrgld v2, v2, vs0		; CHECK-LE-P9-NEXT: xxpermdi v2, v2, vs0, 2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v16i8_none:		; CHECK-BE-P8-LABEL: test_v16i8_none:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-BE-P8-NEXT: mtfprwz f0, r3		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, v2		; CHECK-BE-P8-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v16i8_none:		; CHECK-BE-P9-LABEL: test_v16i8_none:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: lxv v2, 0(r4)		; CHECK-BE-P9-NEXT: lxv v2, 0(r4)
; CHECK-BE-P9-NEXT: mtfprwz f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: xxmrghd v2, vs0, v2		; CHECK-BE-P9-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v16i8_none:		; CHECK-AIX-64-P8-LABEL: test_v16i8_none:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, v2		; CHECK-AIX-64-P8-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v16i8_none:		; CHECK-AIX-64-P9-LABEL: test_v16i8_none:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)		; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs0, v2		; CHECK-AIX-64-P9-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v16i8_none:		; CHECK-AIX-32-P8-LABEL: test_v16i8_none:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4
Show All 15 Lines	entry:
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v16i8_v8i16(i8 %arg1, i16 %arg) {		define <2 x i64> @test_v16i8_v8i16(i8 %arg1, i16 %arg) {
; CHECK-LE-P8-LABEL: test_v16i8_v8i16:		; CHECK-LE-P8-LABEL: test_v16i8_v8i16:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd vs1, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, vs1, vs0
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v16i8_v8i16:		; CHECK-LE-P9-LABEL: test_v16i8_v8i16:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: mtfprd f1, r4		; CHECK-LE-P9-NEXT: mtfprd f1, r4
; CHECK-LE-P9-NEXT: xxswapd vs0, vs0		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: xxswapd vs1, vs1
; CHECK-LE-P9-NEXT: xxmrgld v2, vs1, vs0
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v16i8_v8i16:		; CHECK-BE-P8-LABEL: test_v16i8_v8i16:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 56		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: sldi r4, r4, 48		; CHECK-BE-P8-NEXT: mtfprwz f1, r4
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P8-NEXT: mtfprd f1, r4
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v16i8_v8i16:		; CHECK-BE-P9-LABEL: test_v16i8_v8i16:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: sldi r3, r3, 56		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: mtfprd f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f1, r4
; CHECK-BE-P9-NEXT: sldi r3, r4, 48		; CHECK-BE-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P9-NEXT: mtfprd f1, r3
; CHECK-BE-P9-NEXT: xxmrghd v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v16i8_v8i16:		; CHECK-AIX-64-P8-LABEL: test_v16i8_v8i16:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 56		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 48		; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P8-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P8-NEXT: mtfprd f1, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs1
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v16i8_v8i16:		; CHECK-AIX-64-P9-LABEL: test_v16i8_v8i16:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: sldi r3, r3, 56		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P9-NEXT: sldi r3, r4, 48		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: mtfprd f1, r3
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v16i8_v8i16:		; CHECK-AIX-32-P8-LABEL: test_v16i8_v8i16:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
Show All 19 Lines	entry:
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v8i16_v16i8(i8 %arg1, i16 %arg) {		define <2 x i64> @test_v8i16_v16i8(i8 %arg1, i16 %arg) {
; CHECK-LE-P8-LABEL: test_v8i16_v16i8:		; CHECK-LE-P8-LABEL: test_v8i16_v16i8:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs0, vs1
; CHECK-LE-P8-NEXT: xxswapd vs1, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v8i16_v16i8:		; CHECK-LE-P9-LABEL: test_v8i16_v16i8:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: mtfprd f1, r4		; CHECK-LE-P9-NEXT: mtfprd f1, r4
; CHECK-LE-P9-NEXT: xxswapd vs0, vs0		; CHECK-LE-P9-NEXT: xxmrghd v2, vs0, vs1
; CHECK-LE-P9-NEXT: xxswapd vs1, vs1
; CHECK-LE-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v8i16_v16i8:		; CHECK-BE-P8-LABEL: test_v8i16_v16i8:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 56		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: sldi r4, r4, 48		; CHECK-BE-P8-NEXT: mtfprwz f1, r4
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: xxmrgld v2, vs1, vs0
; CHECK-BE-P8-NEXT: mtfprd f1, r4
; CHECK-BE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v8i16_v16i8:		; CHECK-BE-P9-LABEL: test_v8i16_v16i8:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: sldi r3, r3, 56		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: mtfprd f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f1, r4
; CHECK-BE-P9-NEXT: sldi r3, r4, 48		; CHECK-BE-P9-NEXT: xxmrgld v2, vs1, vs0
; CHECK-BE-P9-NEXT: mtfprd f1, r3
; CHECK-BE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v8i16_v16i8:		; CHECK-AIX-64-P8-LABEL: test_v8i16_v16i8:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 56		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 48		; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P8-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, vs1, vs0
; CHECK-AIX-64-P8-NEXT: mtfprd f1, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v8i16_v16i8:		; CHECK-AIX-64-P9-LABEL: test_v8i16_v16i8:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: sldi r3, r3, 56		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P9-NEXT: sldi r3, r4, 48		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, vs1, vs0
; CHECK-AIX-64-P9-NEXT: mtfprd f1, r3
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v8i16_v16i8:		; CHECK-AIX-32-P8-LABEL: test_v8i16_v16i8:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
Show All 20 Lines
}		}

define <2 x i64> @test_v8i16_none(i16 %arg1, ptr nocapture noundef readonly %b) {		define <2 x i64> @test_v8i16_none(i16 %arg1, ptr nocapture noundef readonly %b) {
; CHECK-LE-P8-LABEL: test_v8i16_none:		; CHECK-LE-P8-LABEL: test_v8i16_none:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4		; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: xxswapd v2, vs0
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: xxmrgld v2, v2, vs0		; CHECK-LE-P8-NEXT: xxpermdi v2, v2, vs0, 2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v8i16_none:		; CHECK-LE-P9-LABEL: test_v8i16_none:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxv v2, 0(r4)		; CHECK-LE-P9-NEXT: lxv v2, 0(r4)
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: xxmrgld v2, v2, vs0		; CHECK-LE-P9-NEXT: xxpermdi v2, v2, vs0, 2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v8i16_none:		; CHECK-BE-P8-LABEL: test_v8i16_none:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-BE-P8-NEXT: mtfprwz f0, r3		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, v2		; CHECK-BE-P8-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v8i16_none:		; CHECK-BE-P9-LABEL: test_v8i16_none:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: lxv v2, 0(r4)		; CHECK-BE-P9-NEXT: lxv v2, 0(r4)
; CHECK-BE-P9-NEXT: mtfprwz f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: xxmrghd v2, vs0, v2		; CHECK-BE-P9-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v8i16_none:		; CHECK-AIX-64-P8-LABEL: test_v8i16_none:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, v2		; CHECK-AIX-64-P8-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v8i16_none:		; CHECK-AIX-64-P9-LABEL: test_v8i16_none:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)		; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs0, v2		; CHECK-AIX-64-P9-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v8i16_none:		; CHECK-AIX-32-P8-LABEL: test_v8i16_none:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4
Show All 16 Lines
}		}

define <2 x i64> @test_none_v8i16(i16 %arg1, ptr nocapture noundef readonly %b) {		define <2 x i64> @test_none_v8i16(i16 %arg1, ptr nocapture noundef readonly %b) {
; CHECK-LE-P8-LABEL: test_none_v8i16:		; CHECK-LE-P8-LABEL: test_none_v8i16:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4		; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: xxswapd v2, vs0
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: xxmrgld v2, vs0, v2		; CHECK-LE-P8-NEXT: xxpermdi v2, vs0, v2, 1
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_none_v8i16:		; CHECK-LE-P9-LABEL: test_none_v8i16:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxv v2, 0(r4)		; CHECK-LE-P9-NEXT: lxv v2, 0(r4)
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: xxmrgld v2, vs0, v2		; CHECK-LE-P9-NEXT: xxpermdi v2, vs0, v2, 1
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_none_v8i16:		; CHECK-BE-P8-LABEL: test_none_v8i16:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-BE-P8-NEXT: mtfprwz f0, r3		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P8-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_none_v8i16:		; CHECK-BE-P9-LABEL: test_none_v8i16:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: lxv v2, 0(r4)		; CHECK-BE-P9-NEXT: lxv v2, 0(r4)
; CHECK-BE-P9-NEXT: mtfprwz f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P9-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_none_v8i16:		; CHECK-AIX-64-P8-LABEL: test_none_v8i16:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P8-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_none_v8i16:		; CHECK-AIX-64-P9-LABEL: test_none_v8i16:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)		; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P9-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_none_v8i16:		; CHECK-AIX-32-P8-LABEL: test_none_v8i16:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4
Show All 14 Lines	entry:
%shuffle = shufflevector <2 x i64> %rhs, <2 x i64> %lhs, <2 x i32> <i32 0, i32 2>		%shuffle = shufflevector <2 x i64> %rhs, <2 x i64> %lhs, <2 x i32> <i32 0, i32 2>
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v16i8_v4i32(i8 %arg1, i32 %arg) {		define <2 x i64> @test_v16i8_v4i32(i8 %arg1, i32 %arg) {
; CHECK-LE-P8-LABEL: test_v16i8_v4i32:		; CHECK-LE-P8-LABEL: test_v16i8_v4i32:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprwz f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd vs1, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, vs1, vs0
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v16i8_v4i32:		; CHECK-LE-P9-LABEL: test_v16i8_v4i32:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: mtvsrws vs1, r4		; CHECK-LE-P9-NEXT: mtfprwz f1, r4
; CHECK-LE-P9-NEXT: xxswapd vs0, vs0		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: xxmrgld v2, vs1, vs0
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v16i8_v4i32:		; CHECK-BE-P8-LABEL: test_v16i8_v4i32:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 56		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: sldi r4, r4, 32		; CHECK-BE-P8-NEXT: mtfprwz f1, r4
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P8-NEXT: mtfprd f1, r4
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v16i8_v4i32:		; CHECK-BE-P9-LABEL: test_v16i8_v4i32:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: sldi r3, r3, 56		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: mtvsrws vs1, r4		; CHECK-BE-P9-NEXT: mtfprwz f1, r4
; CHECK-BE-P9-NEXT: mtfprd f0, r3		; CHECK-BE-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P9-NEXT: xxmrghd v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v16i8_v4i32:		; CHECK-AIX-64-P8-LABEL: test_v16i8_v4i32:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 56		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 32		; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P8-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P8-NEXT: mtfprd f1, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs1
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v16i8_v4i32:		; CHECK-AIX-64-P9-LABEL: test_v16i8_v4i32:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: sldi r3, r3, 56		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: mtvsrws vs1, r4		; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P9-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v16i8_v4i32:		; CHECK-AIX-32-P8-LABEL: test_v16i8_v4i32:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
Show All 18 Lines	entry:
%shuffle = shufflevector <2 x i64> %lhs, <2 x i64> %rhs, <2 x i32> <i32 0, i32 2>		%shuffle = shufflevector <2 x i64> %lhs, <2 x i64> %rhs, <2 x i32> <i32 0, i32 2>
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v4i32_v16i8(i8 %arg1, i32 %arg) {		define <2 x i64> @test_v4i32_v16i8(i8 %arg1, i32 %arg) {
; CHECK-LE-P8-LABEL: test_v4i32_v16i8:		; CHECK-LE-P8-LABEL: test_v4i32_v16i8:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprwz f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs0, vs1
; CHECK-LE-P8-NEXT: xxswapd vs1, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v4i32_v16i8:		; CHECK-LE-P9-LABEL: test_v4i32_v16i8:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: mtvsrws vs1, r4		; CHECK-LE-P9-NEXT: mtfprwz f1, r4
; CHECK-LE-P9-NEXT: xxswapd vs0, vs0		; CHECK-LE-P9-NEXT: xxmrghd v2, vs0, vs1
; CHECK-LE-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v4i32_v16i8:		; CHECK-BE-P8-LABEL: test_v4i32_v16i8:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 56		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: sldi r4, r4, 32		; CHECK-BE-P8-NEXT: mtfprwz f1, r4
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: xxmrgld v2, vs1, vs0
; CHECK-BE-P8-NEXT: mtfprd f1, r4
; CHECK-BE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v4i32_v16i8:		; CHECK-BE-P9-LABEL: test_v4i32_v16i8:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: sldi r3, r3, 56		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: mtvsrws vs1, r4		; CHECK-BE-P9-NEXT: mtfprwz f1, r4
; CHECK-BE-P9-NEXT: mtfprd f0, r3		; CHECK-BE-P9-NEXT: xxmrgld v2, vs1, vs0
; CHECK-BE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v4i32_v16i8:		; CHECK-AIX-64-P8-LABEL: test_v4i32_v16i8:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 56		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 32		; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P8-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, vs1, vs0
; CHECK-AIX-64-P8-NEXT: mtfprd f1, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v4i32_v16i8:		; CHECK-AIX-64-P9-LABEL: test_v4i32_v16i8:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: sldi r3, r3, 56		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: mtvsrws vs1, r4		; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P9-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, vs1, vs0
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v4i32_v16i8:		; CHECK-AIX-32-P8-LABEL: test_v4i32_v16i8:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
Show All 20 Lines
}		}

define <2 x i64> @test_none_v4i32(i32 %arg1, ptr nocapture noundef readonly %b) {		define <2 x i64> @test_none_v4i32(i32 %arg1, ptr nocapture noundef readonly %b) {
; CHECK-LE-P8-LABEL: test_none_v4i32:		; CHECK-LE-P8-LABEL: test_none_v4i32:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4		; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: xxswapd v2, vs0
; CHECK-LE-P8-NEXT: mtfprwz f0, r3		; CHECK-LE-P8-NEXT: mtfprwz f0, r3
; CHECK-LE-P8-NEXT: xxmrgld v2, vs0, v2		; CHECK-LE-P8-NEXT: xxpermdi v2, vs0, v2, 1
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_none_v4i32:		; CHECK-LE-P9-LABEL: test_none_v4i32:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxv v2, 0(r4)		; CHECK-LE-P9-NEXT: lxv v2, 0(r4)
; CHECK-LE-P9-NEXT: mtfprwz f0, r3		; CHECK-LE-P9-NEXT: mtfprwz f0, r3
; CHECK-LE-P9-NEXT: xxmrgld v2, vs0, v2		; CHECK-LE-P9-NEXT: xxpermdi v2, vs0, v2, 1
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_none_v4i32:		; CHECK-BE-P8-LABEL: test_none_v4i32:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-BE-P8-NEXT: mtfprwz f0, r3		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P8-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_none_v4i32:		; CHECK-BE-P9-LABEL: test_none_v4i32:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: lxv v2, 0(r4)		; CHECK-BE-P9-NEXT: lxv v2, 0(r4)
; CHECK-BE-P9-NEXT: mtfprwz f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P9-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_none_v4i32:		; CHECK-AIX-64-P8-LABEL: test_none_v4i32:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P8-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_none_v4i32:		; CHECK-AIX-64-P9-LABEL: test_none_v4i32:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)		; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P9-NEXT: xxpermdi v2, v2, vs0, 1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_none_v4i32:		; CHECK-AIX-32-P8-LABEL: test_none_v4i32:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4
Show All 16 Lines
}		}

define <2 x i64> @test_v4i32_none(i32 %arg1, ptr nocapture noundef readonly %b) {		define <2 x i64> @test_v4i32_none(i32 %arg1, ptr nocapture noundef readonly %b) {
; CHECK-LE-P8-LABEL: test_v4i32_none:		; CHECK-LE-P8-LABEL: test_v4i32_none:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4		; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: xxswapd v2, vs0
; CHECK-LE-P8-NEXT: mtfprwz f0, r3		; CHECK-LE-P8-NEXT: mtfprwz f0, r3
; CHECK-LE-P8-NEXT: xxmrgld v2, v2, vs0		; CHECK-LE-P8-NEXT: xxpermdi v2, v2, vs0, 2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v4i32_none:		; CHECK-LE-P9-LABEL: test_v4i32_none:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxv v2, 0(r4)		; CHECK-LE-P9-NEXT: lxv v2, 0(r4)
; CHECK-LE-P9-NEXT: mtfprwz f0, r3		; CHECK-LE-P9-NEXT: mtfprwz f0, r3
; CHECK-LE-P9-NEXT: xxmrgld v2, v2, vs0		; CHECK-LE-P9-NEXT: xxpermdi v2, v2, vs0, 2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v4i32_none:		; CHECK-BE-P8-LABEL: test_v4i32_none:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-BE-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-BE-P8-NEXT: mtfprwz f0, r3		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, v2		; CHECK-BE-P8-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v4i32_none:		; CHECK-BE-P9-LABEL: test_v4i32_none:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: lxv v2, 0(r4)		; CHECK-BE-P9-NEXT: lxv v2, 0(r4)
; CHECK-BE-P9-NEXT: mtfprwz f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: xxmrghd v2, vs0, v2		; CHECK-BE-P9-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v4i32_none:		; CHECK-AIX-64-P8-LABEL: test_v4i32_none:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvd2x v2, 0, r4
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, v2		; CHECK-AIX-64-P8-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v4i32_none:		; CHECK-AIX-64-P9-LABEL: test_v4i32_none:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)		; CHECK-AIX-64-P9-NEXT: lxv v2, 0(r4)
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs0, v2		; CHECK-AIX-64-P9-NEXT: xxpermdi v2, vs0, v2, 2
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v4i32_none:		; CHECK-AIX-32-P8-LABEL: test_v4i32_none:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4		; CHECK-AIX-32-P8-NEXT: lxvd2x v2, 0, r4
Show All 15 Lines	entry:
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v16i8_v2i64(i8 %arg1, i64 %arg) {		define <2 x i64> @test_v16i8_v2i64(i8 %arg1, i64 %arg) {
; CHECK-LE-P8-LABEL: test_v16i8_v2i64:		; CHECK-LE-P8-LABEL: test_v16i8_v2i64:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd v2, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, v2, vs0
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v16i8_v2i64:		; CHECK-LE-P9-LABEL: test_v16i8_v2i64:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: mtfprd f1, r4		; CHECK-LE-P9-NEXT: mtfprd f1, r4
; CHECK-LE-P9-NEXT: xxswapd vs0, vs0		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: xxswapd v2, vs1
; CHECK-LE-P9-NEXT: xxmrgld v2, v2, vs0
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v16i8_v2i64:		; CHECK-BE-P8-LABEL: test_v16i8_v2i64:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 56		; CHECK-BE-P8-NEXT: sldi r3, r3, 56
; CHECK-BE-P8-NEXT: mtfprd f1, r4		; CHECK-BE-P8-NEXT: mtfprd f1, r4
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: mtfprd f0, r3
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1		; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1
▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines	entry:
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v2i64_v16i8(i8 %arg1, i64 %arg) {		define <2 x i64> @test_v2i64_v16i8(i8 %arg1, i64 %arg) {
; CHECK-LE-P8-LABEL: test_v2i64_v16i8:		; CHECK-LE-P8-LABEL: test_v2i64_v16i8:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs0, vs1
; CHECK-LE-P8-NEXT: xxswapd v2, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, vs0, v2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v2i64_v16i8:		; CHECK-LE-P9-LABEL: test_v2i64_v16i8:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: mtfprd f1, r4		; CHECK-LE-P9-NEXT: mtfprd f1, r4
; CHECK-LE-P9-NEXT: xxswapd vs0, vs0		; CHECK-LE-P9-NEXT: xxmrghd v2, vs0, vs1
; CHECK-LE-P9-NEXT: xxswapd v2, vs1
; CHECK-LE-P9-NEXT: xxmrgld v2, vs0, v2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v2i64_v16i8:		; CHECK-BE-P8-LABEL: test_v2i64_v16i8:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: mtfprd f0, r4		; CHECK-BE-P8-NEXT: mtfprd f0, r4
; CHECK-BE-P8-NEXT: xxspltd v2, vs0, 0		; CHECK-BE-P8-NEXT: xxspltd v2, vs0, 0
; CHECK-BE-P8-NEXT: mtfprwz f0, r3		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P8-NEXT: xxmrgld v2, v2, vs0
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v2i64_v16i8:		; CHECK-BE-P9-LABEL: test_v2i64_v16i8:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: mtfprwz f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: mtvsrdd v2, r4, r4		; CHECK-BE-P9-NEXT: mtvsrdd v2, r4, r4
; CHECK-BE-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P9-NEXT: xxmrgld v2, v2, vs0
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v2i64_v16i8:		; CHECK-AIX-64-P8-LABEL: test_v2i64_v16i8:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: mtfprd f0, r4		; CHECK-AIX-64-P8-NEXT: mtfprd f0, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs0		; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs0
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, v2, vs0
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v2i64_v16i8:		; CHECK-AIX-64-P9-LABEL: test_v2i64_v16i8:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: mtvsrdd v2, r4, r4		; CHECK-AIX-64-P9-NEXT: mtvsrdd v2, r4, r4
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, v2, vs0
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v2i64_v16i8:		; CHECK-AIX-32-P8-LABEL: test_v2i64_v16i8:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r6, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r6, r1, -16
; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stb r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r6		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r6
▲ Show 20 Lines • Show All 178 Lines • ▼ Show 20 Lines	entry:
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v8i16_v8i16(i16 %arg1, i16 %arg) {		define <2 x i64> @test_v8i16_v8i16(i16 %arg1, i16 %arg) {
; CHECK-LE-P8-LABEL: test_v8i16_v8i16:		; CHECK-LE-P8-LABEL: test_v8i16_v8i16:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxmrgld v2, vs1, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v8i16_v8i16:		; CHECK-LE-P9-LABEL: test_v8i16_v8i16:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: mtfprd f1, r4		; CHECK-LE-P9-NEXT: mtfprd f1, r4
; CHECK-LE-P9-NEXT: xxmrgld v2, vs1, vs0		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v8i16_v8i16:		; CHECK-BE-P8-LABEL: test_v8i16_v8i16:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: mtfprwz f0, r3		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: mtfprwz f1, r4		; CHECK-BE-P8-NEXT: mtfprwz f1, r4
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1		; CHECK-BE-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v8i16_v8i16:		; CHECK-BE-P9-LABEL: test_v8i16_v8i16:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: mtfprwz f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: mtfprwz f1, r4		; CHECK-BE-P9-NEXT: mtfprwz f1, r4
; CHECK-BE-P9-NEXT: xxmrghd v2, vs0, vs1		; CHECK-BE-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v8i16_v8i16:		; CHECK-AIX-64-P8-LABEL: test_v8i16_v8i16:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4		; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs1		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v8i16_v8i16:		; CHECK-AIX-64-P9-LABEL: test_v8i16_v8i16:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4		; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs0, vs1		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v8i16_v8i16:		; CHECK-AIX-32-P8-LABEL: test_v8i16_v8i16:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
Show All 18 Lines	entry:
%shuffle = shufflevector <2 x i64> %lhs, <2 x i64> %rhs, <2 x i32> <i32 0, i32 2>		%shuffle = shufflevector <2 x i64> %lhs, <2 x i64> %rhs, <2 x i32> <i32 0, i32 2>
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v8i16_v4i32(i16 %arg1, i32 %arg) {		define <2 x i64> @test_v8i16_v4i32(i16 %arg1, i32 %arg) {
; CHECK-LE-P8-LABEL: test_v8i16_v4i32:		; CHECK-LE-P8-LABEL: test_v8i16_v4i32:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprwz f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd vs1, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, vs1, vs0
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v8i16_v4i32:		; CHECK-LE-P9-LABEL: test_v8i16_v4i32:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: mtvsrws vs1, r4		; CHECK-LE-P9-NEXT: mtfprwz f1, r4
; CHECK-LE-P9-NEXT: xxswapd vs0, vs0		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: xxmrgld v2, vs1, vs0
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v8i16_v4i32:		; CHECK-BE-P8-LABEL: test_v8i16_v4i32:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 48		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: sldi r4, r4, 32		; CHECK-BE-P8-NEXT: mtfprwz f1, r4
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P8-NEXT: mtfprd f1, r4
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v8i16_v4i32:		; CHECK-BE-P9-LABEL: test_v8i16_v4i32:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: sldi r3, r3, 48		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: mtvsrws vs1, r4		; CHECK-BE-P9-NEXT: mtfprwz f1, r4
; CHECK-BE-P9-NEXT: mtfprd f0, r3		; CHECK-BE-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P9-NEXT: xxmrghd v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v8i16_v4i32:		; CHECK-AIX-64-P8-LABEL: test_v8i16_v4i32:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 48		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 32		; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P8-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P8-NEXT: mtfprd f1, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs1
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v8i16_v4i32:		; CHECK-AIX-64-P9-LABEL: test_v8i16_v4i32:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: sldi r3, r3, 48		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: mtvsrws vs1, r4		; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P9-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v8i16_v4i32:		; CHECK-AIX-32-P8-LABEL: test_v8i16_v4i32:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: sth r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
Show All 19 Lines	entry:
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v8i16_v2i64(i16 %arg1, i64 %arg) {		define <2 x i64> @test_v8i16_v2i64(i16 %arg1, i64 %arg) {
; CHECK-LE-P8-LABEL: test_v8i16_v2i64:		; CHECK-LE-P8-LABEL: test_v8i16_v2i64:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd v2, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, v2, vs0
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v8i16_v2i64:		; CHECK-LE-P9-LABEL: test_v8i16_v2i64:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: mtfprd f1, r4		; CHECK-LE-P9-NEXT: mtfprd f1, r4
; CHECK-LE-P9-NEXT: xxswapd vs0, vs0		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: xxswapd v2, vs1
; CHECK-LE-P9-NEXT: xxmrgld v2, v2, vs0
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v8i16_v2i64:		; CHECK-BE-P8-LABEL: test_v8i16_v2i64:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 48		; CHECK-BE-P8-NEXT: sldi r3, r3, 48
; CHECK-BE-P8-NEXT: mtfprd f1, r4		; CHECK-BE-P8-NEXT: mtfprd f1, r4
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: mtfprd f0, r3
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1		; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1
▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines	entry:
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v4i32_v4i32(i32 %arg1, i32 %arg) {		define <2 x i64> @test_v4i32_v4i32(i32 %arg1, i32 %arg) {
; CHECK-LE-P8-LABEL: test_v4i32_v4i32:		; CHECK-LE-P8-LABEL: test_v4i32_v4i32:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprwz f0, r3		; CHECK-LE-P8-NEXT: mtfprwz f0, r3
; CHECK-LE-P8-NEXT: mtfprwz f1, r4		; CHECK-LE-P8-NEXT: mtfprwz f1, r4
; CHECK-LE-P8-NEXT: xxmrgld v2, vs1, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v4i32_v4i32:		; CHECK-LE-P9-LABEL: test_v4i32_v4i32:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprwz f0, r3		; CHECK-LE-P9-NEXT: mtfprwz f0, r3
; CHECK-LE-P9-NEXT: mtfprwz f1, r4		; CHECK-LE-P9-NEXT: mtfprwz f1, r4
; CHECK-LE-P9-NEXT: xxmrgld v2, vs1, vs0		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v4i32_v4i32:		; CHECK-BE-P8-LABEL: test_v4i32_v4i32:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: mtfprwz f0, r3		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: mtfprwz f1, r4		; CHECK-BE-P8-NEXT: mtfprwz f1, r4
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1		; CHECK-BE-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v4i32_v4i32:		; CHECK-BE-P9-LABEL: test_v4i32_v4i32:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: mtfprwz f0, r3		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: mtfprwz f1, r4		; CHECK-BE-P9-NEXT: mtfprwz f1, r4
; CHECK-BE-P9-NEXT: xxmrghd v2, vs0, vs1		; CHECK-BE-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v4i32_v4i32:		; CHECK-AIX-64-P8-LABEL: test_v4i32_v4i32:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4		; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs1		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v4i32_v4i32:		; CHECK-AIX-64-P9-LABEL: test_v4i32_v4i32:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4		; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs0, vs1		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v4i32_v4i32:		; CHECK-AIX-32-P8-LABEL: test_v4i32_v4i32:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
Show All 17 Lines	entry:
%rhs = bitcast <4 x i32> %rhs.tmp to <2 x i64>		%rhs = bitcast <4 x i32> %rhs.tmp to <2 x i64>
%shuffle = shufflevector <2 x i64> %lhs, <2 x i64> %rhs, <2 x i32> <i32 0, i32 2>		%shuffle = shufflevector <2 x i64> %lhs, <2 x i64> %rhs, <2 x i32> <i32 0, i32 2>
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v4i32_v8i16(i32 %arg1, i16 %arg) {		define <2 x i64> @test_v4i32_v8i16(i32 %arg1, i16 %arg) {
; CHECK-LE-P8-LABEL: test_v4i32_v8i16:		; CHECK-LE-P8-LABEL: test_v4i32_v8i16:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprwz f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd vs1, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, vs1, vs0
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v4i32_v8i16:		; CHECK-LE-P9-LABEL: test_v4i32_v8i16:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
		; CHECK-LE-P9-NEXT: mtfprwz f0, r3
; CHECK-LE-P9-NEXT: mtfprd f1, r4		; CHECK-LE-P9-NEXT: mtfprd f1, r4
; CHECK-LE-P9-NEXT: mtvsrws vs0, r3		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: xxswapd vs1, vs1
; CHECK-LE-P9-NEXT: xxmrgld v2, vs1, vs0
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v4i32_v8i16:		; CHECK-BE-P8-LABEL: test_v4i32_v8i16:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 32		; CHECK-BE-P8-NEXT: mtfprwz f0, r3
; CHECK-BE-P8-NEXT: sldi r4, r4, 48		; CHECK-BE-P8-NEXT: mtfprwz f1, r4
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P8-NEXT: mtfprd f1, r4
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v4i32_v8i16:		; CHECK-BE-P9-LABEL: test_v4i32_v8i16:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: mtvsrws vs0, r3		; CHECK-BE-P9-NEXT: mtfprwz f0, r3
; CHECK-BE-P9-NEXT: sldi r3, r4, 48		; CHECK-BE-P9-NEXT: mtfprwz f1, r4
; CHECK-BE-P9-NEXT: mtfprd f1, r3		; CHECK-BE-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-BE-P9-NEXT: xxmrghd v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v4i32_v8i16:		; CHECK-AIX-64-P8-LABEL: test_v4i32_v8i16:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 32		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P8-NEXT: sldi r4, r4, 48		; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P8-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P8-NEXT: mtfprd f1, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs1
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v4i32_v8i16:		; CHECK-AIX-64-P9-LABEL: test_v4i32_v8i16:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: mtvsrws vs0, r3		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r3
; CHECK-AIX-64-P9-NEXT: sldi r3, r4, 48		; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P9-NEXT: mtfprd f1, r3		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v4i32_v8i16:		; CHECK-AIX-32-P8-LABEL: test_v4i32_v8i16:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -32
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r5
Show All 17 Lines	entry:
%rhs = bitcast <8 x i16> %rhs.tmp to <2 x i64>		%rhs = bitcast <8 x i16> %rhs.tmp to <2 x i64>
%shuffle = shufflevector <2 x i64> %lhs, <2 x i64> %rhs, <2 x i32> <i32 0, i32 2>		%shuffle = shufflevector <2 x i64> %lhs, <2 x i64> %rhs, <2 x i32> <i32 0, i32 2>
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v4i32_v2i64(i32 %arg1, i64 %arg) {		define <2 x i64> @test_v4i32_v2i64(i32 %arg1, i64 %arg) {
; CHECK-LE-P8-LABEL: test_v4i32_v2i64:		; CHECK-LE-P8-LABEL: test_v4i32_v2i64:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprwz f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd v2, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, v2, vs0
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v4i32_v2i64:		; CHECK-LE-P9-LABEL: test_v4i32_v2i64:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
		; CHECK-LE-P9-NEXT: mtfprwz f0, r3
; CHECK-LE-P9-NEXT: mtfprd f1, r4		; CHECK-LE-P9-NEXT: mtfprd f1, r4
; CHECK-LE-P9-NEXT: mtvsrws vs0, r3		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: xxswapd v2, vs1
; CHECK-LE-P9-NEXT: xxmrgld v2, v2, vs0
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v4i32_v2i64:		; CHECK-BE-P8-LABEL: test_v4i32_v2i64:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: sldi r3, r3, 32		; CHECK-BE-P8-NEXT: sldi r3, r3, 32
; CHECK-BE-P8-NEXT: mtfprd f1, r4		; CHECK-BE-P8-NEXT: mtfprd f1, r4
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: mtfprd f0, r3
; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1		; CHECK-BE-P8-NEXT: xxmrghd v2, vs0, vs1
▲ Show 20 Lines • Show All 168 Lines • ▼ Show 20 Lines	entry:
%4 = add <2 x i64> %shuffle, %2		%4 = add <2 x i64> %shuffle, %2
ret <2 x i64> %4		ret <2 x i64> %4
}		}

define <2 x i64> @test_v2i64_v4i32(i64 %arg1, i32 %arg) {		define <2 x i64> @test_v2i64_v4i32(i64 %arg1, i32 %arg) {
; CHECK-LE-P8-LABEL: test_v2i64_v4i32:		; CHECK-LE-P8-LABEL: test_v2i64_v4i32:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprwz f1, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd vs0, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, vs0, v2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v2i64_v4i32:		; CHECK-LE-P9-LABEL: test_v2i64_v4i32:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: xxswapd v2, vs0		; CHECK-LE-P9-NEXT: mtfprwz f1, r4
; CHECK-LE-P9-NEXT: mtvsrws vs0, r4		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: xxmrgld v2, vs0, v2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v2i64_v4i32:		; CHECK-BE-P8-LABEL: test_v2i64_v4i32:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: mtfprd f0, r3
; CHECK-BE-P8-NEXT: xxspltd v2, vs0, 0		; CHECK-BE-P8-NEXT: xxspltd v2, vs0, 0
; CHECK-BE-P8-NEXT: mtfprwz f0, r4		; CHECK-BE-P8-NEXT: mtfprwz f0, r4
; CHECK-BE-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P8-NEXT: xxmrgld v2, v2, vs0
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v2i64_v4i32:		; CHECK-BE-P9-LABEL: test_v2i64_v4i32:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: mtfprwz f0, r4		; CHECK-BE-P9-NEXT: mtfprwz f0, r4
; CHECK-BE-P9-NEXT: mtvsrdd v2, r3, r3		; CHECK-BE-P9-NEXT: mtvsrdd v2, r3, r3
; CHECK-BE-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P9-NEXT: xxmrgld v2, v2, vs0
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v2i64_v4i32:		; CHECK-AIX-64-P8-LABEL: test_v2i64_v4i32:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprd f0, r3
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs0		; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs0
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r4		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, v2, vs0
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v2i64_v4i32:		; CHECK-AIX-64-P9-LABEL: test_v2i64_v4i32:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r4		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r4
; CHECK-AIX-64-P9-NEXT: mtvsrdd v2, r3, r3		; CHECK-AIX-64-P9-NEXT: mtvsrdd v2, r3, r3
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, v2, vs0
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v2i64_v4i32:		; CHECK-AIX-32-P8-LABEL: test_v2i64_v4i32:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r6, r1, -48		; CHECK-AIX-32-P8-NEXT: addi r6, r1, -48
; CHECK-AIX-32-P8-NEXT: stw r5, -48(r1)		; CHECK-AIX-32-P8-NEXT: stw r5, -48(r1)
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r6		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r6
; CHECK-AIX-32-P8-NEXT: stw r4, -16(r1)		; CHECK-AIX-32-P8-NEXT: stw r4, -16(r1)
Show All 26 Lines	entry:
ret <2 x i64> %shuffle		ret <2 x i64> %shuffle
}		}

define <2 x i64> @test_v2i64_v8i16(i64 %arg1, i16 %arg) {		define <2 x i64> @test_v2i64_v8i16(i64 %arg1, i16 %arg) {
; CHECK-LE-P8-LABEL: test_v2i64_v8i16:		; CHECK-LE-P8-LABEL: test_v2i64_v8i16:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: mtfprd f0, r3		; CHECK-LE-P8-NEXT: mtfprd f0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd vs0, vs1
; CHECK-LE-P8-NEXT: xxmrgld v2, vs0, v2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v2i64_v8i16:		; CHECK-LE-P9-LABEL: test_v2i64_v8i16:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: mtfprd f0, r3		; CHECK-LE-P9-NEXT: mtfprd f0, r3
; CHECK-LE-P9-NEXT: xxswapd v2, vs0		; CHECK-LE-P9-NEXT: mtfprd f1, r4
; CHECK-LE-P9-NEXT: mtfprd f0, r4		; CHECK-LE-P9-NEXT: xxmrghd v2, vs1, vs0
; CHECK-LE-P9-NEXT: xxswapd vs0, vs0
; CHECK-LE-P9-NEXT: xxmrgld v2, vs0, v2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v2i64_v8i16:		; CHECK-BE-P8-LABEL: test_v2i64_v8i16:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: mtfprd f0, r3		; CHECK-BE-P8-NEXT: mtfprd f0, r3
; CHECK-BE-P8-NEXT: xxspltd v2, vs0, 0		; CHECK-BE-P8-NEXT: xxspltd v2, vs0, 0
; CHECK-BE-P8-NEXT: mtfprwz f0, r4		; CHECK-BE-P8-NEXT: mtfprwz f0, r4
; CHECK-BE-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P8-NEXT: xxmrgld v2, v2, vs0
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v2i64_v8i16:		; CHECK-BE-P9-LABEL: test_v2i64_v8i16:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: mtfprwz f0, r4		; CHECK-BE-P9-NEXT: mtfprwz f0, r4
; CHECK-BE-P9-NEXT: mtvsrdd v2, r3, r3		; CHECK-BE-P9-NEXT: mtvsrdd v2, r3, r3
; CHECK-BE-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-BE-P9-NEXT: xxmrgld v2, v2, vs0
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v2i64_v8i16:		; CHECK-AIX-64-P8-LABEL: test_v2i64_v8i16:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: mtfprd f0, r3		; CHECK-AIX-64-P8-NEXT: mtfprd f0, r3
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs0		; CHECK-AIX-64-P8-NEXT: xxmrghd v2, vs0, vs0
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r4		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r4
; CHECK-AIX-64-P8-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P8-NEXT: xxmrgld v2, v2, vs0
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v2i64_v8i16:		; CHECK-AIX-64-P9-LABEL: test_v2i64_v8i16:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r4		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r4
; CHECK-AIX-64-P9-NEXT: mtvsrdd v2, r3, r3		; CHECK-AIX-64-P9-NEXT: mtvsrdd v2, r3, r3
; CHECK-AIX-64-P9-NEXT: xxmrghd v2, v2, vs0		; CHECK-AIX-64-P9-NEXT: xxmrgld v2, v2, vs0
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v2i64_v8i16:		; CHECK-AIX-32-P8-LABEL: test_v2i64_v8i16:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r6, r1, -48		; CHECK-AIX-32-P8-NEXT: addi r6, r1, -48
; CHECK-AIX-32-P8-NEXT: sth r5, -48(r1)		; CHECK-AIX-32-P8-NEXT: sth r5, -48(r1)
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r6		; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r6
; CHECK-AIX-32-P8-NEXT: stw r4, -16(r1)		; CHECK-AIX-32-P8-NEXT: stw r4, -16(r1)
Show All 29 Lines

llvm/test/CodeGen/PowerPC/v4i32_scalar_to_vector_shuffle.ll

Show All 22 Lines
; RUN: FileCheck %s --check-prefix=CHECK-AIX-32-P8		; RUN: FileCheck %s --check-prefix=CHECK-AIX-32-P8
; RUN: llc -verify-machineinstrs -mcpu=pwr9 -ppc-asm-full-reg-names \		; RUN: llc -verify-machineinstrs -mcpu=pwr9 -ppc-asm-full-reg-names \
; RUN: -ppc-vsr-nums-as-vr -mtriple=powerpc-ibm-aix < %s \| \		; RUN: -ppc-vsr-nums-as-vr -mtriple=powerpc-ibm-aix < %s \| \
; RUN: FileCheck %s --check-prefix=CHECK-AIX-32-P9		; RUN: FileCheck %s --check-prefix=CHECK-AIX-32-P9

define void @test_none_v8i16(ptr %a) {		define void @test_none_v8i16(ptr %a) {
; CHECK-LE-P8-LABEL: test_none_v8i16:		; CHECK-LE-P8-LABEL: test_none_v8i16:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: addis r4, r2, .LCPI0_0@toc@ha
; CHECK-LE-P8-NEXT: lxsdx v2, 0, r3
; CHECK-LE-P8-NEXT: addi r4, r4, .LCPI0_0@toc@l
; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4
; CHECK-LE-P8-NEXT: lhz r4, 0(r3)		; CHECK-LE-P8-NEXT: lhz r4, 0(r3)
; CHECK-LE-P8-NEXT: mtvsrd v4, r4		; CHECK-LE-P8-NEXT: lfdx f0, 0, r3
; CHECK-LE-P8-NEXT: xxswapd v3, vs0		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: vperm v2, v4, v2, v3		; CHECK-LE-P8-NEXT: xxmrghw vs0, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd vs0, v2		; CHECK-LE-P8-NEXT: xxswapd vs0, vs0
; CHECK-LE-P8-NEXT: stfdx f0, 0, r3		; CHECK-LE-P8-NEXT: stfdx f0, 0, r3
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_none_v8i16:		; CHECK-LE-P9-LABEL: test_none_v8i16:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxsihzx f0, 0, r3		; CHECK-LE-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-LE-P9-NEXT: lfd f1, 0(r3)		; CHECK-LE-P9-NEXT: lfd f1, 0(r3)
; CHECK-LE-P9-NEXT: addis r3, r2, .LCPI0_0@toc@ha		; CHECK-LE-P9-NEXT: xxmrghw vs0, vs0, vs1
; CHECK-LE-P9-NEXT: addi r3, r3, .LCPI0_0@toc@l		; CHECK-LE-P9-NEXT: xxswapd vs0, vs0
; CHECK-LE-P9-NEXT: lxv vs2, 0(r3)
; CHECK-LE-P9-NEXT: xxperm vs1, vs0, vs2
; CHECK-LE-P9-NEXT: xxswapd vs0, vs1
; CHECK-LE-P9-NEXT: stfd f0, 0(r3)		; CHECK-LE-P9-NEXT: stfd f0, 0(r3)
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_none_v8i16:		; CHECK-BE-P8-LABEL: test_none_v8i16:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lhz r4, 0(r3)		; CHECK-BE-P8-NEXT: lhz r4, 0(r3)
; CHECK-BE-P8-NEXT: lfdx f0, 0, r3		; CHECK-BE-P8-NEXT: lfdx f0, 0, r3
; CHECK-BE-P8-NEXT: sldi r3, r4, 48		; CHECK-BE-P8-NEXT: sldi r3, r4, 48
▲ Show 20 Lines • Show All 62 Lines • ▼ Show 20 Lines	entry:
%tmp0_3 = bitcast <8 x i16> %tmp0_2 to <4 x i32>		%tmp0_3 = bitcast <8 x i16> %tmp0_2 to <4 x i32>
%1 = load <2 x i32>, ptr %a		%1 = load <2 x i32>, ptr %a
%tmp1_1 = shufflevector <2 x i32> %1, <2 x i32> undef, <4 x i32> <i32 0, i32 1, i32 0, i32 1>		%tmp1_1 = shufflevector <2 x i32> %1, <2 x i32> undef, <4 x i32> <i32 0, i32 1, i32 0, i32 1>
%2 = shufflevector <4 x i32> %tmp0_3, <4 x i32> %tmp1_1, <2 x i32> <i32 4, i32 0>		%2 = shufflevector <4 x i32> %tmp0_3, <4 x i32> %tmp1_1, <2 x i32> <i32 4, i32 0>
store <2 x i32> %2, ptr undef, align 4		store <2 x i32> %2, ptr undef, align 4
ret void		ret void
}		}

define void @test_v8i16_none(ptr %a) {		define void @test_v8i16_none(ptr %a) {
		nemanjaiUnsubmitted Not Done Reply Inline Actions The code generated for this one gets worse on all subtargets. Do we know why? nemanjai: The code generated for this one gets worse on all subtargets. Do we know why?
; CHECK-LE-P8-LABEL: test_v8i16_none:		; CHECK-LE-P8-LABEL: test_v8i16_none:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
		; CHECK-LE-P8-NEXT: addis r4, r2, .LCPI1_0@toc@ha
; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r3		; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r3
; CHECK-LE-P8-NEXT: lhz r3, 0(r3)		; CHECK-LE-P8-NEXT: lhz r3, 0(r3)
; CHECK-LE-P8-NEXT: mtfprd f1, r3		; CHECK-LE-P8-NEXT: addi r4, r4, .LCPI1_0@toc@l
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: lxvd2x vs1, 0, r4
; CHECK-LE-P8-NEXT: xxmrglw vs0, vs0, vs1		; CHECK-LE-P8-NEXT: mtvsrd v4, r3
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxswapd v2, vs0
		; CHECK-LE-P8-NEXT: xxswapd v3, vs1
		; CHECK-LE-P8-NEXT: vperm v2, v2, v4, v3
		; CHECK-LE-P8-NEXT: xxswapd vs0, v2
; CHECK-LE-P8-NEXT: stxvd2x vs0, 0, r3		; CHECK-LE-P8-NEXT: stxvd2x vs0, 0, r3
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v8i16_none:		; CHECK-LE-P9-LABEL: test_v8i16_none:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxsihzx f0, 0, r3		; CHECK-LE-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-LE-P9-NEXT: lxv vs1, 0(r3)		; CHECK-LE-P9-NEXT: lxv vs1, 0(r3)
; CHECK-LE-P9-NEXT: xxmrglw vs0, vs1, vs0		; CHECK-LE-P9-NEXT: addis r3, r2, .LCPI1_0@toc@ha
		; CHECK-LE-P9-NEXT: addi r3, r3, .LCPI1_0@toc@l
		; CHECK-LE-P9-NEXT: lxv vs2, 0(r3)
		; CHECK-LE-P9-NEXT: xxperm vs0, vs1, vs2
; CHECK-LE-P9-NEXT: stxv vs0, 0(r3)		; CHECK-LE-P9-NEXT: stxv vs0, 0(r3)
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v8i16_none:		; CHECK-BE-P8-LABEL: test_v8i16_none:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lhz r4, 0(r3)		; CHECK-BE-P8-NEXT: addis r4, r2, .LCPI1_0@toc@ha
; CHECK-BE-P8-NEXT: lxvw4x vs0, 0, r3		; CHECK-BE-P8-NEXT: lhz r5, 0(r3)
; CHECK-BE-P8-NEXT: mtfprwz f1, r4		; CHECK-BE-P8-NEXT: lxvw4x v2, 0, r3
; CHECK-BE-P8-NEXT: xxmrghw vs0, vs1, vs0		; CHECK-BE-P8-NEXT: addi r4, r4, .LCPI1_0@toc@l
; CHECK-BE-P8-NEXT: stxvw4x vs0, 0, r3		; CHECK-BE-P8-NEXT: lxvw4x v3, 0, r4
		; CHECK-BE-P8-NEXT: mtvsrwz v4, r5
		; CHECK-BE-P8-NEXT: vperm v2, v4, v2, v3
		; CHECK-BE-P8-NEXT: stxvw4x v2, 0, r3
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v8i16_none:		; CHECK-BE-P9-LABEL: test_v8i16_none:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: lxsihzx f0, 0, r3		; CHECK-BE-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)		; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)
; CHECK-BE-P9-NEXT: xxmrghw vs0, vs0, vs1		; CHECK-BE-P9-NEXT: addis r3, r2, .LCPI1_0@toc@ha
; CHECK-BE-P9-NEXT: stxv vs0, 0(r3)		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI1_0@toc@l
		; CHECK-BE-P9-NEXT: lxv vs2, 0(r3)
		; CHECK-BE-P9-NEXT: xxperm vs1, vs0, vs2
		; CHECK-BE-P9-NEXT: stxv vs1, 0(r3)
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v8i16_none:		; CHECK-AIX-64-P8-LABEL: test_v8i16_none:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: lhz r4, 0(r3)		; CHECK-AIX-64-P8-NEXT: ld r4, L..C0(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: lxvw4x vs0, 0, r3		; CHECK-AIX-64-P8-NEXT: lhz r5, 0(r3)
; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r4		; CHECK-AIX-64-P8-NEXT: lxvw4x v2, 0, r3
; CHECK-AIX-64-P8-NEXT: xxmrghw vs0, vs1, vs0		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r5
; CHECK-AIX-64-P8-NEXT: stxvw4x vs0, 0, r3		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r4
		; CHECK-AIX-64-P8-NEXT: vperm v2, v4, v2, v3
		; CHECK-AIX-64-P8-NEXT: stxvw4x v2, 0, r3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v8i16_none:		; CHECK-AIX-64-P9-LABEL: test_v8i16_none:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lxsihzx f0, 0, r3		; CHECK-AIX-64-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)		; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-64-P9-NEXT: xxmrghw vs0, vs0, vs1		; CHECK-AIX-64-P9-NEXT: ld r3, L..C0(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: stxv vs0, 0(r3)		; CHECK-AIX-64-P9-NEXT: lxv vs2, 0(r3)
		; CHECK-AIX-64-P9-NEXT: xxperm vs1, vs0, vs2
		; CHECK-AIX-64-P9-NEXT: stxv vs1, 0(r3)
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v8i16_none:		; CHECK-AIX-32-P8-LABEL: test_v8i16_none:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: lhz r4, 0(r3)		; CHECK-AIX-32-P8-NEXT: lwz r4, L..C0(r2) # %const.0
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r3		; CHECK-AIX-32-P8-NEXT: lhz r5, 0(r3)
; CHECK-AIX-32-P8-NEXT: mtfprwz f1, r4		; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r3
; CHECK-AIX-32-P8-NEXT: xxmrghw vs0, vs1, vs0		; CHECK-AIX-32-P8-NEXT: mtvsrwz v4, r5
; CHECK-AIX-32-P8-NEXT: stxvw4x vs0, 0, r3		; CHECK-AIX-32-P8-NEXT: lxvw4x v3, 0, r4
		; CHECK-AIX-32-P8-NEXT: vperm v2, v4, v2, v3
		; CHECK-AIX-32-P8-NEXT: stxvw4x v2, 0, r3
; CHECK-AIX-32-P8-NEXT: blr		; CHECK-AIX-32-P8-NEXT: blr
;		;
; CHECK-AIX-32-P9-LABEL: test_v8i16_none:		; CHECK-AIX-32-P9-LABEL: test_v8i16_none:
; CHECK-AIX-32-P9: # %bb.0: # %entry		; CHECK-AIX-32-P9: # %bb.0: # %entry
; CHECK-AIX-32-P9-NEXT: lxsihzx f0, 0, r3		; CHECK-AIX-32-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-AIX-32-P9-NEXT: lxv vs1, 0(r3)		; CHECK-AIX-32-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-32-P9-NEXT: xxmrghw vs0, vs0, vs1		; CHECK-AIX-32-P9-NEXT: lwz r3, L..C0(r2) # %const.0
; CHECK-AIX-32-P9-NEXT: stxv vs0, 0(r3)		; CHECK-AIX-32-P9-NEXT: lxv vs2, 0(r3)
		; CHECK-AIX-32-P9-NEXT: xxperm vs1, vs0, vs2
		; CHECK-AIX-32-P9-NEXT: stxv vs1, 0(r3)
; CHECK-AIX-32-P9-NEXT: blr		; CHECK-AIX-32-P9-NEXT: blr
entry:		entry:
%0 = load <2 x i8>, ptr undef, align 1		%0 = load <2 x i8>, ptr undef, align 1
%tmp0_1 = bitcast <2 x i8> %0 to i16		%tmp0_1 = bitcast <2 x i8> %0 to i16
%tmp0_2 = insertelement <8 x i16> undef, i16 %tmp0_1, i32 0		%tmp0_2 = insertelement <8 x i16> undef, i16 %tmp0_1, i32 0
%tmp0_3 = bitcast <8 x i16> %tmp0_2 to <4 x i32>		%tmp0_3 = bitcast <8 x i16> %tmp0_2 to <4 x i32>
%1 = load <4 x i32>, ptr %a, align 1		%1 = load <4 x i32>, ptr %a, align 1
%2 = shufflevector <4 x i32> %tmp0_3, <4 x i32> %1, <4 x i32> <i32 0, i32 4, i32 1, i32 5>		%2 = shufflevector <4 x i32> %tmp0_3, <4 x i32> %1, <4 x i32> <i32 0, i32 4, i32 1, i32 5>
▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)		; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)
; CHECK-BE-P9-NEXT: xxperm vs0, v2, vs1		; CHECK-BE-P9-NEXT: xxperm vs0, v2, vs1
; CHECK-BE-P9-NEXT: stxv vs0, 0(r5)		; CHECK-BE-P9-NEXT: stxv vs0, 0(r5)
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_none_v4i32:		; CHECK-AIX-64-P8-LABEL: test_none_v4i32:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: xxsldwi vs0, v2, v2, 3		; CHECK-AIX-64-P8-NEXT: xxsldwi vs0, v2, v2, 3
; CHECK-AIX-64-P8-NEXT: ld r4, L..C0(r2) # %const.0		; CHECK-AIX-64-P8-NEXT: ld r4, L..C1(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: mffprwz r5, f0		; CHECK-AIX-64-P8-NEXT: mffprwz r5, f0
; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r4
; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r5		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r5
; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-AIX-64-P8-NEXT: stxvw4x v2, 0, r3		; CHECK-AIX-64-P8-NEXT: stxvw4x v2, 0, r3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_none_v4i32:		; CHECK-AIX-64-P9-LABEL: test_none_v4i32:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: li r4, 0		; CHECK-AIX-64-P9-NEXT: li r4, 0
; CHECK-AIX-64-P9-NEXT: vextuwlx r4, r4, v2		; CHECK-AIX-64-P9-NEXT: vextuwlx r4, r4, v2
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r4		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r4
; CHECK-AIX-64-P9-NEXT: ld r4, L..C0(r2) # %const.0		; CHECK-AIX-64-P9-NEXT: ld r4, L..C1(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r4)		; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r4)
; CHECK-AIX-64-P9-NEXT: xxperm vs0, v2, vs1		; CHECK-AIX-64-P9-NEXT: xxperm vs0, v2, vs1
; CHECK-AIX-64-P9-NEXT: stxv vs0, 0(r3)		; CHECK-AIX-64-P9-NEXT: stxv vs0, 0(r3)
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_none_v4i32:		; CHECK-AIX-32-P8-LABEL: test_none_v4i32:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: lwz r4, L..C0(r2) # %const.0		; CHECK-AIX-32-P8-NEXT: lwz r4, L..C1(r2) # %const.0
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stxvw4x v2, 0, r5		; CHECK-AIX-32-P8-NEXT: stxvw4x v2, 0, r5
; CHECK-AIX-32-P8-NEXT: lxsiwzx v3, 0, r5		; CHECK-AIX-32-P8-NEXT: lxsiwzx v3, 0, r5
; CHECK-AIX-32-P8-NEXT: lxvw4x v4, 0, r4		; CHECK-AIX-32-P8-NEXT: lxvw4x v4, 0, r4
; CHECK-AIX-32-P8-NEXT: vperm v2, v2, v3, v4		; CHECK-AIX-32-P8-NEXT: vperm v2, v2, v3, v4
; CHECK-AIX-32-P8-NEXT: stxvw4x v2, 0, r3		; CHECK-AIX-32-P8-NEXT: stxvw4x v2, 0, r3
; CHECK-AIX-32-P8-NEXT: blr		; CHECK-AIX-32-P8-NEXT: blr
;		;
; CHECK-AIX-32-P9-LABEL: test_none_v4i32:		; CHECK-AIX-32-P9-LABEL: test_none_v4i32:
; CHECK-AIX-32-P9: # %bb.0: # %entry		; CHECK-AIX-32-P9: # %bb.0: # %entry
; CHECK-AIX-32-P9-NEXT: addi r4, r1, -16		; CHECK-AIX-32-P9-NEXT: addi r4, r1, -16
; CHECK-AIX-32-P9-NEXT: stxv v2, -16(r1)		; CHECK-AIX-32-P9-NEXT: stxv v2, -16(r1)
; CHECK-AIX-32-P9-NEXT: lfiwzx f0, 0, r4		; CHECK-AIX-32-P9-NEXT: lfiwzx f0, 0, r4
; CHECK-AIX-32-P9-NEXT: lwz r4, L..C0(r2) # %const.0		; CHECK-AIX-32-P9-NEXT: lwz r4, L..C1(r2) # %const.0
; CHECK-AIX-32-P9-NEXT: lxv vs1, 0(r4)		; CHECK-AIX-32-P9-NEXT: lxv vs1, 0(r4)
; CHECK-AIX-32-P9-NEXT: xxperm vs0, v2, vs1		; CHECK-AIX-32-P9-NEXT: xxperm vs0, v2, vs1
; CHECK-AIX-32-P9-NEXT: stxv vs0, 0(r3)		; CHECK-AIX-32-P9-NEXT: stxv vs0, 0(r3)
; CHECK-AIX-32-P9-NEXT: blr		; CHECK-AIX-32-P9-NEXT: blr
entry:		entry:
%0 = extractelement <2 x i32> %vec, i64 0		%0 = extractelement <2 x i32> %vec, i64 0
%1 = bitcast i32 %0 to <2 x i16>		%1 = bitcast i32 %0 to <2 x i16>
%2 = shufflevector <2 x i16> %1, <2 x i16> %1, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3>		%2 = shufflevector <2 x i16> %1, <2 x i16> %1, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3>
▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines
; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)		; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)
; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1		; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-BE-P9-NEXT: stxv v2, 0(r5)		; CHECK-BE-P9-NEXT: stxv v2, 0(r5)
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v4i32_none:		; CHECK-AIX-64-P8-LABEL: test_v4i32_none:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: xxsldwi vs0, v2, v2, 3		; CHECK-AIX-64-P8-NEXT: xxsldwi vs0, v2, v2, 3
; CHECK-AIX-64-P8-NEXT: ld r4, L..C1(r2) # %const.0		; CHECK-AIX-64-P8-NEXT: ld r4, L..C2(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: mffprwz r5, f0		; CHECK-AIX-64-P8-NEXT: mffprwz r5, f0
; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r4
; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r5		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r5
; CHECK-AIX-64-P8-NEXT: vperm v2, v4, v2, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v4, v2, v3
; CHECK-AIX-64-P8-NEXT: stxvw4x v2, 0, r3		; CHECK-AIX-64-P8-NEXT: stxvw4x v2, 0, r3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v4i32_none:		; CHECK-AIX-64-P9-LABEL: test_v4i32_none:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: li r4, 0		; CHECK-AIX-64-P9-NEXT: li r4, 0
; CHECK-AIX-64-P9-NEXT: vextuwlx r4, r4, v2		; CHECK-AIX-64-P9-NEXT: vextuwlx r4, r4, v2
; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r4		; CHECK-AIX-64-P9-NEXT: mtfprwz f0, r4
; CHECK-AIX-64-P9-NEXT: ld r4, L..C1(r2) # %const.0		; CHECK-AIX-64-P9-NEXT: ld r4, L..C2(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r4)		; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r4)
; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1		; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: stxv v2, 0(r3)		; CHECK-AIX-64-P9-NEXT: stxv v2, 0(r3)
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v4i32_none:		; CHECK-AIX-32-P8-LABEL: test_v4i32_none:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: lwz r4, L..C1(r2) # %const.0		; CHECK-AIX-32-P8-NEXT: lwz r4, L..C2(r2) # %const.0
; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r5, r1, -16
; CHECK-AIX-32-P8-NEXT: stxvw4x v2, 0, r5		; CHECK-AIX-32-P8-NEXT: stxvw4x v2, 0, r5
; CHECK-AIX-32-P8-NEXT: lxsiwzx v3, 0, r5		; CHECK-AIX-32-P8-NEXT: lxsiwzx v3, 0, r5
; CHECK-AIX-32-P8-NEXT: lxvw4x v4, 0, r4		; CHECK-AIX-32-P8-NEXT: lxvw4x v4, 0, r4
; CHECK-AIX-32-P8-NEXT: vperm v2, v3, v2, v4		; CHECK-AIX-32-P8-NEXT: vperm v2, v3, v2, v4
; CHECK-AIX-32-P8-NEXT: stxvw4x v2, 0, r3		; CHECK-AIX-32-P8-NEXT: stxvw4x v2, 0, r3
; CHECK-AIX-32-P8-NEXT: blr		; CHECK-AIX-32-P8-NEXT: blr
;		;
; CHECK-AIX-32-P9-LABEL: test_v4i32_none:		; CHECK-AIX-32-P9-LABEL: test_v4i32_none:
; CHECK-AIX-32-P9: # %bb.0: # %entry		; CHECK-AIX-32-P9: # %bb.0: # %entry
; CHECK-AIX-32-P9-NEXT: addi r4, r1, -16		; CHECK-AIX-32-P9-NEXT: addi r4, r1, -16
; CHECK-AIX-32-P9-NEXT: stxv v2, -16(r1)		; CHECK-AIX-32-P9-NEXT: stxv v2, -16(r1)
; CHECK-AIX-32-P9-NEXT: lfiwzx f0, 0, r4		; CHECK-AIX-32-P9-NEXT: lfiwzx f0, 0, r4
; CHECK-AIX-32-P9-NEXT: lwz r4, L..C1(r2) # %const.0		; CHECK-AIX-32-P9-NEXT: lwz r4, L..C2(r2) # %const.0
; CHECK-AIX-32-P9-NEXT: lxv vs1, 0(r4)		; CHECK-AIX-32-P9-NEXT: lxv vs1, 0(r4)
; CHECK-AIX-32-P9-NEXT: xxperm v2, vs0, vs1		; CHECK-AIX-32-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-32-P9-NEXT: stxv v2, 0(r3)		; CHECK-AIX-32-P9-NEXT: stxv v2, 0(r3)
; CHECK-AIX-32-P9-NEXT: blr		; CHECK-AIX-32-P9-NEXT: blr
entry:		entry:
%0 = extractelement <2 x i32> %vec, i64 0		%0 = extractelement <2 x i32> %vec, i64 0
%1 = bitcast i32 %0 to <2 x i16>		%1 = bitcast i32 %0 to <2 x i16>
%2 = shufflevector <2 x i16> %1, <2 x i16> %1, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3>		%2 = shufflevector <2 x i16> %1, <2 x i16> %1, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3>
▲ Show 20 Lines • Show All 55 Lines • ▼ Show 20 Lines
; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI4_0@toc@l		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI4_0@toc@l
; CHECK-BE-P9-NEXT: xxinsertw v2, vs1, 0		; CHECK-BE-P9-NEXT: xxinsertw v2, vs1, 0
; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)		; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)
; CHECK-BE-P9-NEXT: xxperm vs0, v2, vs1		; CHECK-BE-P9-NEXT: xxperm vs0, v2, vs1
; CHECK-BE-P9-NEXT: stxv vs0, 0(r3)		; CHECK-BE-P9-NEXT: stxv vs0, 0(r3)
;		;
; CHECK-AIX-64-P8-LABEL: test_none_v2i64:		; CHECK-AIX-64-P8-LABEL: test_none_v2i64:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: ld r5, L..C2(r2) # %const.0		; CHECK-AIX-64-P8-NEXT: ld r5, L..C3(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r4		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r4
; CHECK-AIX-64-P8-NEXT: ld r4, L..C3(r2) # %const.1		; CHECK-AIX-64-P8-NEXT: ld r4, L..C4(r2) # %const.1
; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-64-P8-NEXT: vperm v2, v4, v2, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v4, v2, v3
; CHECK-AIX-64-P8-NEXT: lxsdx v3, 0, r3		; CHECK-AIX-64-P8-NEXT: lxsdx v3, 0, r3
; CHECK-AIX-64-P8-NEXT: lxvw4x v4, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvw4x v4, 0, r4
; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v3, v4		; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v3, v4
; CHECK-AIX-64-P8-NEXT: stxvw4x v2, 0, r3		; CHECK-AIX-64-P8-NEXT: stxvw4x v2, 0, r3
;		;
; CHECK-AIX-64-P9-LABEL: test_none_v2i64:		; CHECK-AIX-64-P9-LABEL: test_none_v2i64:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lfd f0, 0(r3)		; CHECK-AIX-64-P9-NEXT: lfd f0, 0(r3)
; CHECK-AIX-64-P9-NEXT: ld r3, L..C2(r2) # %const.0		; CHECK-AIX-64-P9-NEXT: ld r3, L..C3(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4		; CHECK-AIX-64-P9-NEXT: mtfprwz f1, r4
; CHECK-AIX-64-P9-NEXT: xxinsertw v2, vs1, 0		; CHECK-AIX-64-P9-NEXT: xxinsertw v2, vs1, 0
; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)		; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-64-P9-NEXT: xxperm vs0, v2, vs1		; CHECK-AIX-64-P9-NEXT: xxperm vs0, v2, vs1
; CHECK-AIX-64-P9-NEXT: stxv vs0, 0(r3)		; CHECK-AIX-64-P9-NEXT: stxv vs0, 0(r3)
;		;
; CHECK-AIX-32-P8-LABEL: test_none_v2i64:		; CHECK-AIX-32-P8-LABEL: test_none_v2i64:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: lwz r5, L..C2(r2) # %const.0		; CHECK-AIX-32-P8-NEXT: lwz r5, L..C3(r2) # %const.0
; CHECK-AIX-32-P8-NEXT: lxsiwzx v3, 0, r3		; CHECK-AIX-32-P8-NEXT: lxsiwzx v3, 0, r3
; CHECK-AIX-32-P8-NEXT: stw r4, -16(r1)		; CHECK-AIX-32-P8-NEXT: stw r4, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -16		; CHECK-AIX-32-P8-NEXT: addi r3, r1, -16
; CHECK-AIX-32-P8-NEXT: lxvw4x v5, 0, r3		; CHECK-AIX-32-P8-NEXT: lxvw4x v5, 0, r3
; CHECK-AIX-32-P8-NEXT: lwz r3, L..C3(r2) # %const.1		; CHECK-AIX-32-P8-NEXT: lwz r3, L..C4(r2) # %const.1
; CHECK-AIX-32-P8-NEXT: lxvw4x v4, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x v4, 0, r5
; CHECK-AIX-32-P8-NEXT: vperm v2, v5, v2, v4		; CHECK-AIX-32-P8-NEXT: vperm v2, v5, v2, v4
; CHECK-AIX-32-P8-NEXT: lxvw4x v4, 0, r3		; CHECK-AIX-32-P8-NEXT: lxvw4x v4, 0, r3
; CHECK-AIX-32-P8-NEXT: vperm v2, v2, v3, v4		; CHECK-AIX-32-P8-NEXT: vperm v2, v2, v3, v4
; CHECK-AIX-32-P8-NEXT: stxvw4x v2, 0, r3		; CHECK-AIX-32-P8-NEXT: stxvw4x v2, 0, r3
;		;
; CHECK-AIX-32-P9-LABEL: test_none_v2i64:		; CHECK-AIX-32-P9-LABEL: test_none_v2i64:
; CHECK-AIX-32-P9: # %bb.0: # %entry		; CHECK-AIX-32-P9: # %bb.0: # %entry
; CHECK-AIX-32-P9-NEXT: lfiwzx f0, 0, r3		; CHECK-AIX-32-P9-NEXT: lfiwzx f0, 0, r3
; CHECK-AIX-32-P9-NEXT: lwz r3, L..C2(r2) # %const.0		; CHECK-AIX-32-P9-NEXT: lwz r3, L..C3(r2) # %const.0
; CHECK-AIX-32-P9-NEXT: mtfprwz f1, r4		; CHECK-AIX-32-P9-NEXT: mtfprwz f1, r4
; CHECK-AIX-32-P9-NEXT: xxinsertw v2, vs1, 0		; CHECK-AIX-32-P9-NEXT: xxinsertw v2, vs1, 0
; CHECK-AIX-32-P9-NEXT: lxv vs1, 0(r3)		; CHECK-AIX-32-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-32-P9-NEXT: xxperm vs0, v2, vs1		; CHECK-AIX-32-P9-NEXT: xxperm vs0, v2, vs1
; CHECK-AIX-32-P9-NEXT: stxv vs0, 0(r3)		; CHECK-AIX-32-P9-NEXT: stxv vs0, 0(r3)
entry:		entry:
%0 = load <2 x i32>, ptr %ptr, align 4		%0 = load <2 x i32>, ptr %ptr, align 4
%tmp = insertelement <2 x i32> %vec, i32 %v1, i32 0		%tmp = insertelement <2 x i32> %vec, i32 %v1, i32 0
▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines

define void @test_v8i16_v8i16(ptr %a) {		define void @test_v8i16_v8i16(ptr %a) {
; CHECK-LE-P8-LABEL: test_v8i16_v8i16:		; CHECK-LE-P8-LABEL: test_v8i16_v8i16:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lhz r4, 0(r3)		; CHECK-LE-P8-NEXT: lhz r4, 0(r3)
; CHECK-LE-P8-NEXT: lhz r3, 0(r3)		; CHECK-LE-P8-NEXT: lhz r3, 0(r3)
; CHECK-LE-P8-NEXT: mtfprd f0, r4		; CHECK-LE-P8-NEXT: mtfprd f0, r4
; CHECK-LE-P8-NEXT: mtfprd f1, r3		; CHECK-LE-P8-NEXT: mtfprd f1, r3
; CHECK-LE-P8-NEXT: xxmrglw vs0, vs1, vs0		; CHECK-LE-P8-NEXT: xxmrghw vs0, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxswapd vs0, vs0
; CHECK-LE-P8-NEXT: stxvd2x vs0, 0, r3		; CHECK-LE-P8-NEXT: stxvd2x vs0, 0, r3
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v8i16_v8i16:		; CHECK-LE-P9-LABEL: test_v8i16_v8i16:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxsihzx f0, 0, r3		; CHECK-LE-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-LE-P9-NEXT: lxsihzx f1, 0, r3		; CHECK-LE-P9-NEXT: lxsihzx f1, 0, r3
; CHECK-LE-P9-NEXT: xxmrglw vs0, vs1, vs0		; CHECK-LE-P9-NEXT: xxmrghw vs0, vs1, vs0
; CHECK-LE-P9-NEXT: stxv vs0, 0(r3)		; CHECK-LE-P9-NEXT: stxv vs0, 0(r3)
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v8i16_v8i16:		; CHECK-BE-P8-LABEL: test_v8i16_v8i16:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lhz r4, 0(r3)		; CHECK-BE-P8-NEXT: lhz r4, 0(r3)
; CHECK-BE-P8-NEXT: lhz r3, 0(r3)		; CHECK-BE-P8-NEXT: lhz r3, 0(r3)
; CHECK-BE-P8-NEXT: mtfprwz f0, r4		; CHECK-BE-P8-NEXT: mtfprwz f0, r4
; CHECK-BE-P8-NEXT: mtfprwz f1, r3		; CHECK-BE-P8-NEXT: mtfprwz f1, r3
; CHECK-BE-P8-NEXT: xxmrghw vs0, vs0, vs1		; CHECK-BE-P8-NEXT: xxmrglw vs0, vs0, vs1
; CHECK-BE-P8-NEXT: stxvw4x vs0, 0, r3		; CHECK-BE-P8-NEXT: stxvw4x vs0, 0, r3
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v8i16_v8i16:		; CHECK-BE-P9-LABEL: test_v8i16_v8i16:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: lxsihzx f0, 0, r3		; CHECK-BE-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-BE-P9-NEXT: lxsihzx f1, 0, r3		; CHECK-BE-P9-NEXT: lxsihzx f1, 0, r3
; CHECK-BE-P9-NEXT: xxmrghw vs0, vs0, vs1		; CHECK-BE-P9-NEXT: xxmrglw vs0, vs0, vs1
; CHECK-BE-P9-NEXT: stxv vs0, 0(r3)		; CHECK-BE-P9-NEXT: stxv vs0, 0(r3)
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v8i16_v8i16:		; CHECK-AIX-64-P8-LABEL: test_v8i16_v8i16:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: lhz r4, 0(r3)		; CHECK-AIX-64-P8-NEXT: lhz r4, 0(r3)
; CHECK-AIX-64-P8-NEXT: lhz r3, 0(r3)		; CHECK-AIX-64-P8-NEXT: lhz r3, 0(r3)
; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r4		; CHECK-AIX-64-P8-NEXT: mtfprwz f0, r4
; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r3		; CHECK-AIX-64-P8-NEXT: mtfprwz f1, r3
; CHECK-AIX-64-P8-NEXT: xxmrghw vs0, vs0, vs1		; CHECK-AIX-64-P8-NEXT: xxmrglw vs0, vs0, vs1
; CHECK-AIX-64-P8-NEXT: stxvw4x vs0, 0, r3		; CHECK-AIX-64-P8-NEXT: stxvw4x vs0, 0, r3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v8i16_v8i16:		; CHECK-AIX-64-P9-LABEL: test_v8i16_v8i16:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lxsihzx f0, 0, r3		; CHECK-AIX-64-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-AIX-64-P9-NEXT: lxsihzx f1, 0, r3		; CHECK-AIX-64-P9-NEXT: lxsihzx f1, 0, r3
; CHECK-AIX-64-P9-NEXT: xxmrghw vs0, vs0, vs1		; CHECK-AIX-64-P9-NEXT: xxmrglw vs0, vs0, vs1
; CHECK-AIX-64-P9-NEXT: stxv vs0, 0(r3)		; CHECK-AIX-64-P9-NEXT: stxv vs0, 0(r3)
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v8i16_v8i16:		; CHECK-AIX-32-P8-LABEL: test_v8i16_v8i16:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: lhz r4, 0(r3)		; CHECK-AIX-32-P8-NEXT: lhz r4, 0(r3)
; CHECK-AIX-32-P8-NEXT: lhz r3, 0(r3)		; CHECK-AIX-32-P8-NEXT: lhz r3, 0(r3)
; CHECK-AIX-32-P8-NEXT: mtfprwz f0, r4		; CHECK-AIX-32-P8-NEXT: mtfprwz f0, r4
; CHECK-AIX-32-P8-NEXT: mtfprwz f1, r3		; CHECK-AIX-32-P8-NEXT: mtfprwz f1, r3
; CHECK-AIX-32-P8-NEXT: xxmrghw vs0, vs0, vs1		; CHECK-AIX-32-P8-NEXT: xxmrglw vs0, vs0, vs1
; CHECK-AIX-32-P8-NEXT: stxvw4x vs0, 0, r3		; CHECK-AIX-32-P8-NEXT: stxvw4x vs0, 0, r3
; CHECK-AIX-32-P8-NEXT: blr		; CHECK-AIX-32-P8-NEXT: blr
;		;
; CHECK-AIX-32-P9-LABEL: test_v8i16_v8i16:		; CHECK-AIX-32-P9-LABEL: test_v8i16_v8i16:
; CHECK-AIX-32-P9: # %bb.0: # %entry		; CHECK-AIX-32-P9: # %bb.0: # %entry
; CHECK-AIX-32-P9-NEXT: lxsihzx f0, 0, r3		; CHECK-AIX-32-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-AIX-32-P9-NEXT: lxsihzx f1, 0, r3		; CHECK-AIX-32-P9-NEXT: lxsihzx f1, 0, r3
; CHECK-AIX-32-P9-NEXT: xxmrghw vs0, vs0, vs1		; CHECK-AIX-32-P9-NEXT: xxmrglw vs0, vs0, vs1
; CHECK-AIX-32-P9-NEXT: stxv vs0, 0(r3)		; CHECK-AIX-32-P9-NEXT: stxv vs0, 0(r3)
; CHECK-AIX-32-P9-NEXT: blr		; CHECK-AIX-32-P9-NEXT: blr
entry:		entry:
%0 = load <2 x i8>, ptr undef, align 1		%0 = load <2 x i8>, ptr undef, align 1
%tmp0_1 = bitcast <2 x i8> %0 to i16		%tmp0_1 = bitcast <2 x i8> %0 to i16
%tmp0_2 = insertelement <8 x i16> undef, i16 %tmp0_1, i32 0		%tmp0_2 = insertelement <8 x i16> undef, i16 %tmp0_1, i32 0
%tmp0_3 = bitcast <8 x i16> %tmp0_2 to <4 x i32>		%tmp0_3 = bitcast <8 x i16> %tmp0_2 to <4 x i32>
%1 = load <2 x i8>, ptr %a, align 1		%1 = load <2 x i8>, ptr %a, align 1
%tmp1_1 = bitcast <2 x i8> %1 to i16		%tmp1_1 = bitcast <2 x i8> %1 to i16
%tmp1_2 = insertelement <8 x i16> undef, i16 %tmp1_1, i32 0		%tmp1_2 = insertelement <8 x i16> undef, i16 %tmp1_1, i32 0
%tmp1_3 = bitcast <8 x i16> %tmp1_2 to <4 x i32>		%tmp1_3 = bitcast <8 x i16> %tmp1_2 to <4 x i32>
%2 = shufflevector <4 x i32> %tmp0_3, <4 x i32> %tmp1_3, <4 x i32> <i32 0, i32 4, i32 1, i32 5>		%2 = shufflevector <4 x i32> %tmp0_3, <4 x i32> %tmp1_3, <4 x i32> <i32 0, i32 4, i32 1, i32 5>
store <4 x i32> %2, ptr undef, align 4		store <4 x i32> %2, ptr undef, align 4
ret void		ret void
}		}

define void @test_v8i16_v4i32(ptr %a) {		define void @test_v8i16_v4i32(ptr %a) {
; CHECK-LE-P8-LABEL: test_v8i16_v4i32:		; CHECK-LE-P8-LABEL: test_v8i16_v4i32:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lhz r4, 0(r3)		; CHECK-LE-P8-NEXT: lhz r4, 0(r3)
; CHECK-LE-P8-NEXT: lfiwzx f0, 0, r3		; CHECK-LE-P8-NEXT: lfiwzx f0, 0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, f0		; CHECK-LE-P8-NEXT: xxmrghw vs0, vs0, vs1
; CHECK-LE-P8-NEXT: xxswapd vs1, vs1
; CHECK-LE-P8-NEXT: xxmrglw vs0, vs0, vs1
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxswapd vs0, vs0
; CHECK-LE-P8-NEXT: stxvd2x vs0, 0, r3		; CHECK-LE-P8-NEXT: stxvd2x vs0, 0, r3
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v8i16_v4i32:		; CHECK-LE-P9-LABEL: test_v8i16_v4i32:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxsihzx v2, 0, r3		; CHECK-LE-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-LE-P9-NEXT: lfiwzx f0, 0, r3		; CHECK-LE-P9-NEXT: lfiwzx f1, 0, r3
; CHECK-LE-P9-NEXT: xxswapd vs0, f0		; CHECK-LE-P9-NEXT: xxmrghw vs0, vs1, vs0
; CHECK-LE-P9-NEXT: vsplth v2, v2, 3
; CHECK-LE-P9-NEXT: xxmrglw vs0, vs0, v2
; CHECK-LE-P9-NEXT: stxv vs0, 0(r3)		; CHECK-LE-P9-NEXT: stxv vs0, 0(r3)
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v8i16_v4i32:		; CHECK-BE-P8-LABEL: test_v8i16_v4i32:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lfiwzx f0, 0, r3		; CHECK-BE-P8-NEXT: addis r4, r2, .LCPI7_0@toc@ha
; CHECK-BE-P8-NEXT: lhz r4, 0(r3)		; CHECK-BE-P8-NEXT: lhz r5, 0(r3)
; CHECK-BE-P8-NEXT: sldi r3, r4, 48		; CHECK-BE-P8-NEXT: lxsiwzx v2, 0, r3
; CHECK-BE-P8-NEXT: xxsldwi vs0, f0, f0, 1		; CHECK-BE-P8-NEXT: addi r4, r4, .LCPI7_0@toc@l
; CHECK-BE-P8-NEXT: mtfprd f1, r3		; CHECK-BE-P8-NEXT: lxvw4x v3, 0, r4
; CHECK-BE-P8-NEXT: xxmrghw vs0, vs1, vs0		; CHECK-BE-P8-NEXT: mtvsrwz v4, r5
; CHECK-BE-P8-NEXT: stxvw4x vs0, 0, r3		; CHECK-BE-P8-NEXT: vperm v2, v4, v2, v3
		; CHECK-BE-P8-NEXT: stxvw4x v2, 0, r3
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v8i16_v4i32:		; CHECK-BE-P9-LABEL: test_v8i16_v4i32:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: lxsihzx v2, 0, r3		; CHECK-BE-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-BE-P9-NEXT: lfiwzx f0, 0, r3		; CHECK-BE-P9-NEXT: lfiwzx f1, 0, r3
; CHECK-BE-P9-NEXT: xxsldwi vs0, f0, f0, 1		; CHECK-BE-P9-NEXT: addis r3, r2, .LCPI7_0@toc@ha
; CHECK-BE-P9-NEXT: vsplth v2, v2, 3		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI7_0@toc@l
; CHECK-BE-P9-NEXT: xxmrghw vs0, v2, vs0		; CHECK-BE-P9-NEXT: lxv vs2, 0(r3)
; CHECK-BE-P9-NEXT: stxv vs0, 0(r3)		; CHECK-BE-P9-NEXT: xxperm vs1, vs0, vs2
		; CHECK-BE-P9-NEXT: stxv vs1, 0(r3)
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v8i16_v4i32:		; CHECK-AIX-64-P8-LABEL: test_v8i16_v4i32:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: lfiwzx f0, 0, r3		; CHECK-AIX-64-P8-NEXT: ld r4, L..C5(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: lhz r4, 0(r3)		; CHECK-AIX-64-P8-NEXT: lhz r5, 0(r3)
; CHECK-AIX-64-P8-NEXT: sldi r3, r4, 48		; CHECK-AIX-64-P8-NEXT: lxsiwzx v2, 0, r3
; CHECK-AIX-64-P8-NEXT: xxsldwi vs0, f0, f0, 1		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r5
; CHECK-AIX-64-P8-NEXT: mtfprd f1, r3		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r4
; CHECK-AIX-64-P8-NEXT: xxmrghw vs0, vs1, vs0		; CHECK-AIX-64-P8-NEXT: vperm v2, v4, v2, v3
; CHECK-AIX-64-P8-NEXT: stxvw4x vs0, 0, r3		; CHECK-AIX-64-P8-NEXT: stxvw4x v2, 0, r3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v8i16_v4i32:		; CHECK-AIX-64-P9-LABEL: test_v8i16_v4i32:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lxsihzx v2, 0, r3		; CHECK-AIX-64-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-AIX-64-P9-NEXT: lfiwzx f0, 0, r3		; CHECK-AIX-64-P9-NEXT: lfiwzx f1, 0, r3
; CHECK-AIX-64-P9-NEXT: xxsldwi vs0, f0, f0, 1		; CHECK-AIX-64-P9-NEXT: ld r3, L..C4(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: vsplth v2, v2, 3		; CHECK-AIX-64-P9-NEXT: lxv vs2, 0(r3)
; CHECK-AIX-64-P9-NEXT: xxmrghw vs0, v2, vs0		; CHECK-AIX-64-P9-NEXT: xxperm vs1, vs0, vs2
; CHECK-AIX-64-P9-NEXT: stxv vs0, 0(r3)		; CHECK-AIX-64-P9-NEXT: stxv vs1, 0(r3)
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v8i16_v4i32:		; CHECK-AIX-32-P8-LABEL: test_v8i16_v4i32:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: lhz r4, 0(r3)		; CHECK-AIX-32-P8-NEXT: lwz r4, L..C5(r2) # %const.0
; CHECK-AIX-32-P8-NEXT: sth r4, -32(r1)		; CHECK-AIX-32-P8-NEXT: lhz r5, 0(r3)
; CHECK-AIX-32-P8-NEXT: addi r4, r1, -32		; CHECK-AIX-32-P8-NEXT: lxsiwzx v2, 0, r3
; CHECK-AIX-32-P8-NEXT: lwz r3, 0(r3)		; CHECK-AIX-32-P8-NEXT: mtvsrwz v4, r5
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r4		; CHECK-AIX-32-P8-NEXT: lxvw4x v3, 0, r4
; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: vperm v2, v4, v2, v3
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -16		; CHECK-AIX-32-P8-NEXT: stxvw4x v2, 0, r3
; CHECK-AIX-32-P8-NEXT: lxvw4x vs1, 0, r3
; CHECK-AIX-32-P8-NEXT: xxmrghw vs0, vs0, vs1
; CHECK-AIX-32-P8-NEXT: stxvw4x vs0, 0, r3
; CHECK-AIX-32-P8-NEXT: blr		; CHECK-AIX-32-P8-NEXT: blr
;		;
; CHECK-AIX-32-P9-LABEL: test_v8i16_v4i32:		; CHECK-AIX-32-P9-LABEL: test_v8i16_v4i32:
; CHECK-AIX-32-P9: # %bb.0: # %entry		; CHECK-AIX-32-P9: # %bb.0: # %entry
; CHECK-AIX-32-P9-NEXT: lhz r4, 0(r3)		; CHECK-AIX-32-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-AIX-32-P9-NEXT: sth r4, -32(r1)		; CHECK-AIX-32-P9-NEXT: lfiwzx f1, 0, r3
; CHECK-AIX-32-P9-NEXT: lwz r3, 0(r3)		; CHECK-AIX-32-P9-NEXT: lwz r3, L..C4(r2) # %const.0
; CHECK-AIX-32-P9-NEXT: lxv vs0, -32(r1)		; CHECK-AIX-32-P9-NEXT: lxv vs2, 0(r3)
; CHECK-AIX-32-P9-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P9-NEXT: xxperm vs1, vs0, vs2
; CHECK-AIX-32-P9-NEXT: lxv vs1, -16(r1)		; CHECK-AIX-32-P9-NEXT: stxv vs1, 0(r3)
; CHECK-AIX-32-P9-NEXT: xxmrghw vs0, vs0, vs1
; CHECK-AIX-32-P9-NEXT: stxv vs0, 0(r3)
; CHECK-AIX-32-P9-NEXT: blr		; CHECK-AIX-32-P9-NEXT: blr
entry:		entry:
%0 = load <2 x i8>, ptr undef, align 1		%0 = load <2 x i8>, ptr undef, align 1
%tmp0_1 = bitcast <2 x i8> %0 to i16		%tmp0_1 = bitcast <2 x i8> %0 to i16
%tmp0_2 = insertelement <8 x i16> undef, i16 %tmp0_1, i32 0		%tmp0_2 = insertelement <8 x i16> undef, i16 %tmp0_1, i32 0
%tmp0_3 = bitcast <8 x i16> %tmp0_2 to <4 x i32>		%tmp0_3 = bitcast <8 x i16> %tmp0_2 to <4 x i32>
%1 = load <2 x i16>, ptr %a, align 4		%1 = load <2 x i16>, ptr %a, align 4
%tmp1_1 = bitcast <2 x i16> %1 to i32		%tmp1_1 = bitcast <2 x i16> %1 to i32
%tmp1_2 = insertelement <4 x i32> undef, i32 %tmp1_1, i32 0		%tmp1_2 = insertelement <4 x i32> undef, i32 %tmp1_1, i32 0
%2 = shufflevector <4 x i32> %tmp0_3, <4 x i32> %tmp1_2, <4 x i32> <i32 0, i32 4, i32 1, i32 5>		%2 = shufflevector <4 x i32> %tmp0_3, <4 x i32> %tmp1_2, <4 x i32> <i32 0, i32 4, i32 1, i32 5>
store <4 x i32> %2, ptr undef, align 4		store <4 x i32> %2, ptr undef, align 4
ret void		ret void
}		}

define void @test_v8i16_v2i64(ptr %a) {		define void @test_v8i16_v2i64(ptr %a) {
; CHECK-LE-P8-LABEL: test_v8i16_v2i64:		; CHECK-LE-P8-LABEL: test_v8i16_v2i64:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lhz r4, 0(r3)		; CHECK-LE-P8-NEXT: lhz r4, 0(r3)
; CHECK-LE-P8-NEXT: lfdx f0, 0, r3		; CHECK-LE-P8-NEXT: lfdx f0, 0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, f0		; CHECK-LE-P8-NEXT: xxmrghw vs0, vs0, vs1
; CHECK-LE-P8-NEXT: xxswapd vs1, vs1
; CHECK-LE-P8-NEXT: xxmrglw vs0, vs0, vs1
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxswapd vs0, vs0
; CHECK-LE-P8-NEXT: stxvd2x vs0, 0, r3		; CHECK-LE-P8-NEXT: stxvd2x vs0, 0, r3
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v8i16_v2i64:		; CHECK-LE-P9-LABEL: test_v8i16_v2i64:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxsihzx v2, 0, r3		; CHECK-LE-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-LE-P9-NEXT: lfd f0, 0(r3)		; CHECK-LE-P9-NEXT: lfd f1, 0(r3)
; CHECK-LE-P9-NEXT: xxswapd vs0, f0		; CHECK-LE-P9-NEXT: xxmrghw vs0, vs1, vs0
; CHECK-LE-P9-NEXT: vsplth v2, v2, 3
; CHECK-LE-P9-NEXT: xxmrglw vs0, vs0, v2
; CHECK-LE-P9-NEXT: stxv vs0, 0(r3)		; CHECK-LE-P9-NEXT: stxv vs0, 0(r3)
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v8i16_v2i64:		; CHECK-BE-P8-LABEL: test_v8i16_v2i64:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lhz r4, 0(r3)		; CHECK-BE-P8-NEXT: lhz r4, 0(r3)
; CHECK-BE-P8-NEXT: lfdx f0, 0, r3		; CHECK-BE-P8-NEXT: lfdx f0, 0, r3
; CHECK-BE-P8-NEXT: sldi r3, r4, 48		; CHECK-BE-P8-NEXT: sldi r3, r4, 48
Show All 27 Lines
; CHECK-AIX-64-P9-NEXT: lfd f0, 0(r3)		; CHECK-AIX-64-P9-NEXT: lfd f0, 0(r3)
; CHECK-AIX-64-P9-NEXT: vsplth v2, v2, 3		; CHECK-AIX-64-P9-NEXT: vsplth v2, v2, 3
; CHECK-AIX-64-P9-NEXT: xxmrghw vs0, v2, vs0		; CHECK-AIX-64-P9-NEXT: xxmrghw vs0, v2, vs0
; CHECK-AIX-64-P9-NEXT: stxv vs0, 0(r3)		; CHECK-AIX-64-P9-NEXT: stxv vs0, 0(r3)
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v8i16_v2i64:		; CHECK-AIX-32-P8-LABEL: test_v8i16_v2i64:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: lhz r4, 0(r3)		; CHECK-AIX-32-P8-NEXT: lwz r4, L..C6(r2) # %const.0
; CHECK-AIX-32-P8-NEXT: sth r4, -32(r1)		; CHECK-AIX-32-P8-NEXT: lhz r5, 0(r3)
; CHECK-AIX-32-P8-NEXT: addi r4, r1, -32		; CHECK-AIX-32-P8-NEXT: lxsiwzx v2, 0, r3
; CHECK-AIX-32-P8-NEXT: lwz r3, 0(r3)		; CHECK-AIX-32-P8-NEXT: mtvsrwz v4, r5
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r4		; CHECK-AIX-32-P8-NEXT: lxvw4x v3, 0, r4
; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: vperm v2, v4, v2, v3
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -16		; CHECK-AIX-32-P8-NEXT: stxvw4x v2, 0, r3
; CHECK-AIX-32-P8-NEXT: lxvw4x vs1, 0, r3
; CHECK-AIX-32-P8-NEXT: xxmrghw vs0, vs0, vs1
; CHECK-AIX-32-P8-NEXT: stxvw4x vs0, 0, r3
; CHECK-AIX-32-P8-NEXT: blr		; CHECK-AIX-32-P8-NEXT: blr
;		;
; CHECK-AIX-32-P9-LABEL: test_v8i16_v2i64:		; CHECK-AIX-32-P9-LABEL: test_v8i16_v2i64:
; CHECK-AIX-32-P9: # %bb.0: # %entry		; CHECK-AIX-32-P9: # %bb.0: # %entry
; CHECK-AIX-32-P9-NEXT: lhz r4, 0(r3)		; CHECK-AIX-32-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-AIX-32-P9-NEXT: sth r4, -32(r1)		; CHECK-AIX-32-P9-NEXT: lfiwzx f1, 0, r3
; CHECK-AIX-32-P9-NEXT: lwz r3, 0(r3)		; CHECK-AIX-32-P9-NEXT: lwz r3, L..C5(r2) # %const.0
; CHECK-AIX-32-P9-NEXT: lxv vs0, -32(r1)		; CHECK-AIX-32-P9-NEXT: lxv vs2, 0(r3)
; CHECK-AIX-32-P9-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P9-NEXT: xxperm vs1, vs0, vs2
; CHECK-AIX-32-P9-NEXT: lxv vs1, -16(r1)		; CHECK-AIX-32-P9-NEXT: stxv vs1, 0(r3)
; CHECK-AIX-32-P9-NEXT: xxmrghw vs0, vs0, vs1
; CHECK-AIX-32-P9-NEXT: stxv vs0, 0(r3)
; CHECK-AIX-32-P9-NEXT: blr		; CHECK-AIX-32-P9-NEXT: blr
entry:		entry:
%0 = load <2 x i8>, ptr undef, align 1		%0 = load <2 x i8>, ptr undef, align 1
%tmp0_1 = bitcast <2 x i8> %0 to i16		%tmp0_1 = bitcast <2 x i8> %0 to i16
%tmp0_2 = insertelement <8 x i16> undef, i16 %tmp0_1, i32 0		%tmp0_2 = insertelement <8 x i16> undef, i16 %tmp0_1, i32 0
%tmp0_3 = bitcast <8 x i16> %tmp0_2 to <4 x i32>		%tmp0_3 = bitcast <8 x i16> %tmp0_2 to <4 x i32>
%1 = load <2 x i16>, ptr %a, align 8		%1 = load <2 x i16>, ptr %a, align 8
%tmp1_1 = bitcast <2 x i16> %1 to i32		%tmp1_1 = bitcast <2 x i16> %1 to i32
▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
; CHECK-BE-P9-NEXT: lxsiwzx v2, 0, r4		; CHECK-BE-P9-NEXT: lxsiwzx v2, 0, r4
; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI9_0@toc@l		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI9_0@toc@l
; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)		; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)
; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1		; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v4i32_v4i32:		; CHECK-AIX-64-P8-LABEL: test_v4i32_v4i32:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: ld r5, L..C4(r2) # %const.0		; CHECK-AIX-64-P8-NEXT: ld r5, L..C6(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: lxsiwzx v2, 0, r3		; CHECK-AIX-64-P8-NEXT: lxsiwzx v2, 0, r3
; CHECK-AIX-64-P8-NEXT: lxsiwzx v3, 0, r4		; CHECK-AIX-64-P8-NEXT: lxsiwzx v3, 0, r4
; CHECK-AIX-64-P8-NEXT: lxvw4x v4, 0, r5		; CHECK-AIX-64-P8-NEXT: lxvw4x v4, 0, r5
; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v3, v4		; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v3, v4
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v4i32_v4i32:		; CHECK-AIX-64-P9-LABEL: test_v4i32_v4i32:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lfiwzx f0, 0, r3		; CHECK-AIX-64-P9-NEXT: lfiwzx f0, 0, r3
; CHECK-AIX-64-P9-NEXT: ld r3, L..C3(r2) # %const.0		; CHECK-AIX-64-P9-NEXT: ld r3, L..C5(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: lxsiwzx v2, 0, r4		; CHECK-AIX-64-P9-NEXT: lxsiwzx v2, 0, r4
; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)		; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1		; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v4i32_v4i32:		; CHECK-AIX-32-P8-LABEL: test_v4i32_v4i32:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: lwz r5, L..C4(r2) # %const.0		; CHECK-AIX-32-P8-NEXT: lwz r5, L..C7(r2) # %const.0
; CHECK-AIX-32-P8-NEXT: lxsiwzx v2, 0, r3		; CHECK-AIX-32-P8-NEXT: lxsiwzx v2, 0, r3
; CHECK-AIX-32-P8-NEXT: lxsiwzx v3, 0, r4		; CHECK-AIX-32-P8-NEXT: lxsiwzx v3, 0, r4
; CHECK-AIX-32-P8-NEXT: lxvw4x v4, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x v4, 0, r5
; CHECK-AIX-32-P8-NEXT: vperm v2, v2, v3, v4		; CHECK-AIX-32-P8-NEXT: vperm v2, v2, v3, v4
; CHECK-AIX-32-P8-NEXT: blr		; CHECK-AIX-32-P8-NEXT: blr
;		;
; CHECK-AIX-32-P9-LABEL: test_v4i32_v4i32:		; CHECK-AIX-32-P9-LABEL: test_v4i32_v4i32:
; CHECK-AIX-32-P9: # %bb.0: # %entry		; CHECK-AIX-32-P9: # %bb.0: # %entry
; CHECK-AIX-32-P9-NEXT: lfiwzx f0, 0, r3		; CHECK-AIX-32-P9-NEXT: lfiwzx f0, 0, r3
; CHECK-AIX-32-P9-NEXT: lwz r3, L..C3(r2) # %const.0		; CHECK-AIX-32-P9-NEXT: lwz r3, L..C6(r2) # %const.0
; CHECK-AIX-32-P9-NEXT: lxsiwzx v2, 0, r4		; CHECK-AIX-32-P9-NEXT: lxsiwzx v2, 0, r4
; CHECK-AIX-32-P9-NEXT: lxv vs1, 0(r3)		; CHECK-AIX-32-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-32-P9-NEXT: xxperm v2, vs0, vs1		; CHECK-AIX-32-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-32-P9-NEXT: blr		; CHECK-AIX-32-P9-NEXT: blr
entry:		entry:
%load1 = load <4 x i8>, ptr %a		%load1 = load <4 x i8>, ptr %a
%load2 = load <4 x i8>, ptr %b		%load2 = load <4 x i8>, ptr %b
%shuffle1 = shufflevector <4 x i8> %load1, <4 x i8> %load2, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>		%shuffle1 = shufflevector <4 x i8> %load1, <4 x i8> %load2, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>
%shuffle2 = shufflevector <8 x i8> %shuffle1, <8 x i8> %shuffle1, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15>		%shuffle2 = shufflevector <8 x i8> %shuffle1, <8 x i8> %shuffle1, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15>
ret <16 x i8> %shuffle2		ret <16 x i8> %shuffle2
}		}

define void @test_v4i32_v8i16(ptr %a) {		define void @test_v4i32_v8i16(ptr %a) {
; CHECK-LE-P8-LABEL: test_v4i32_v8i16:		; CHECK-LE-P8-LABEL: test_v4i32_v8i16:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lhz r4, 0(r3)		; CHECK-LE-P8-NEXT: lhz r4, 0(r3)
; CHECK-LE-P8-NEXT: lfiwzx f0, 0, r3		; CHECK-LE-P8-NEXT: lfiwzx f0, 0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, f0		; CHECK-LE-P8-NEXT: xxmrghw vs0, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd vs1, vs1
; CHECK-LE-P8-NEXT: xxmrglw vs0, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxswapd vs0, vs0
; CHECK-LE-P8-NEXT: stxvd2x vs0, 0, r3		; CHECK-LE-P8-NEXT: stxvd2x vs0, 0, r3
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v4i32_v8i16:		; CHECK-LE-P9-LABEL: test_v4i32_v8i16:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxsihzx v2, 0, r3		; CHECK-LE-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-LE-P9-NEXT: lfiwzx f0, 0, r3		; CHECK-LE-P9-NEXT: lfiwzx f1, 0, r3
; CHECK-LE-P9-NEXT: xxswapd vs0, f0		; CHECK-LE-P9-NEXT: xxmrghw vs0, vs0, vs1
; CHECK-LE-P9-NEXT: vsplth v2, v2, 3
; CHECK-LE-P9-NEXT: xxmrglw vs0, v2, vs0
; CHECK-LE-P9-NEXT: stxv vs0, 0(r3)		; CHECK-LE-P9-NEXT: stxv vs0, 0(r3)
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v4i32_v8i16:		; CHECK-BE-P8-LABEL: test_v4i32_v8i16:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lfiwzx f0, 0, r3		; CHECK-BE-P8-NEXT: addis r4, r2, .LCPI10_0@toc@ha
; CHECK-BE-P8-NEXT: lhz r4, 0(r3)		; CHECK-BE-P8-NEXT: lhz r5, 0(r3)
; CHECK-BE-P8-NEXT: sldi r3, r4, 48		; CHECK-BE-P8-NEXT: lxsiwzx v2, 0, r3
; CHECK-BE-P8-NEXT: xxsldwi vs0, f0, f0, 1		; CHECK-BE-P8-NEXT: addi r4, r4, .LCPI10_0@toc@l
; CHECK-BE-P8-NEXT: mtfprd f1, r3		; CHECK-BE-P8-NEXT: lxvw4x v3, 0, r4
; CHECK-BE-P8-NEXT: xxmrghw vs0, vs0, vs1		; CHECK-BE-P8-NEXT: mtvsrwz v4, r5
; CHECK-BE-P8-NEXT: stxvw4x vs0, 0, r3		; CHECK-BE-P8-NEXT: vperm v2, v2, v4, v3
		; CHECK-BE-P8-NEXT: stxvw4x v2, 0, r3
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v4i32_v8i16:		; CHECK-BE-P9-LABEL: test_v4i32_v8i16:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: lxsihzx v2, 0, r3		; CHECK-BE-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-BE-P9-NEXT: lfiwzx f0, 0, r3		; CHECK-BE-P9-NEXT: lfiwzx f1, 0, r3
; CHECK-BE-P9-NEXT: xxsldwi vs0, f0, f0, 1		; CHECK-BE-P9-NEXT: addis r3, r2, .LCPI10_0@toc@ha
; CHECK-BE-P9-NEXT: vsplth v2, v2, 3		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI10_0@toc@l
; CHECK-BE-P9-NEXT: xxmrghw vs0, vs0, v2		; CHECK-BE-P9-NEXT: lxv vs2, 0(r3)
		; CHECK-BE-P9-NEXT: xxperm vs0, vs1, vs2
; CHECK-BE-P9-NEXT: stxv vs0, 0(r3)		; CHECK-BE-P9-NEXT: stxv vs0, 0(r3)
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v4i32_v8i16:		; CHECK-AIX-64-P8-LABEL: test_v4i32_v8i16:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: lfiwzx f0, 0, r3		; CHECK-AIX-64-P8-NEXT: ld r4, L..C7(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: lhz r4, 0(r3)		; CHECK-AIX-64-P8-NEXT: lhz r5, 0(r3)
; CHECK-AIX-64-P8-NEXT: sldi r3, r4, 48		; CHECK-AIX-64-P8-NEXT: lxsiwzx v2, 0, r3
; CHECK-AIX-64-P8-NEXT: xxsldwi vs0, f0, f0, 1		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r5
; CHECK-AIX-64-P8-NEXT: mtfprd f1, r3		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r4
; CHECK-AIX-64-P8-NEXT: xxmrghw vs0, vs0, vs1		; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-AIX-64-P8-NEXT: stxvw4x vs0, 0, r3		; CHECK-AIX-64-P8-NEXT: stxvw4x v2, 0, r3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v4i32_v8i16:		; CHECK-AIX-64-P9-LABEL: test_v4i32_v8i16:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lxsihzx v2, 0, r3		; CHECK-AIX-64-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-AIX-64-P9-NEXT: lfiwzx f0, 0, r3		; CHECK-AIX-64-P9-NEXT: lfiwzx f1, 0, r3
; CHECK-AIX-64-P9-NEXT: xxsldwi vs0, f0, f0, 1		; CHECK-AIX-64-P9-NEXT: ld r3, L..C6(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: vsplth v2, v2, 3		; CHECK-AIX-64-P9-NEXT: lxv vs2, 0(r3)
; CHECK-AIX-64-P9-NEXT: xxmrghw vs0, vs0, v2		; CHECK-AIX-64-P9-NEXT: xxperm vs0, vs1, vs2
; CHECK-AIX-64-P9-NEXT: stxv vs0, 0(r3)		; CHECK-AIX-64-P9-NEXT: stxv vs0, 0(r3)
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v4i32_v8i16:		; CHECK-AIX-32-P8-LABEL: test_v4i32_v8i16:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: lhz r4, 0(r3)		; CHECK-AIX-32-P8-NEXT: lwz r4, L..C8(r2) # %const.0
; CHECK-AIX-32-P8-NEXT: sth r4, -32(r1)		; CHECK-AIX-32-P8-NEXT: lhz r5, 0(r3)
; CHECK-AIX-32-P8-NEXT: addi r4, r1, -32		; CHECK-AIX-32-P8-NEXT: lxsiwzx v2, 0, r3
; CHECK-AIX-32-P8-NEXT: lwz r3, 0(r3)		; CHECK-AIX-32-P8-NEXT: mtvsrwz v4, r5
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r4		; CHECK-AIX-32-P8-NEXT: lxvw4x v3, 0, r4
; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -16		; CHECK-AIX-32-P8-NEXT: stxvw4x v2, 0, r3
; CHECK-AIX-32-P8-NEXT: lxvw4x vs1, 0, r3
; CHECK-AIX-32-P8-NEXT: xxmrghw vs0, vs1, vs0
; CHECK-AIX-32-P8-NEXT: stxvw4x vs0, 0, r3
; CHECK-AIX-32-P8-NEXT: blr		; CHECK-AIX-32-P8-NEXT: blr
;		;
; CHECK-AIX-32-P9-LABEL: test_v4i32_v8i16:		; CHECK-AIX-32-P9-LABEL: test_v4i32_v8i16:
; CHECK-AIX-32-P9: # %bb.0: # %entry		; CHECK-AIX-32-P9: # %bb.0: # %entry
; CHECK-AIX-32-P9-NEXT: lhz r4, 0(r3)		; CHECK-AIX-32-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-AIX-32-P9-NEXT: sth r4, -32(r1)		; CHECK-AIX-32-P9-NEXT: lfiwzx f1, 0, r3
; CHECK-AIX-32-P9-NEXT: lwz r3, 0(r3)		; CHECK-AIX-32-P9-NEXT: lwz r3, L..C7(r2) # %const.0
; CHECK-AIX-32-P9-NEXT: lxv vs0, -32(r1)		; CHECK-AIX-32-P9-NEXT: lxv vs2, 0(r3)
; CHECK-AIX-32-P9-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P9-NEXT: xxperm vs0, vs1, vs2
; CHECK-AIX-32-P9-NEXT: lxv vs1, -16(r1)
; CHECK-AIX-32-P9-NEXT: xxmrghw vs0, vs1, vs0
; CHECK-AIX-32-P9-NEXT: stxv vs0, 0(r3)		; CHECK-AIX-32-P9-NEXT: stxv vs0, 0(r3)
; CHECK-AIX-32-P9-NEXT: blr		; CHECK-AIX-32-P9-NEXT: blr
entry:		entry:
%0 = load <2 x i8>, ptr undef, align 1		%0 = load <2 x i8>, ptr undef, align 1
%tmp0_1 = bitcast <2 x i8> %0 to i16		%tmp0_1 = bitcast <2 x i8> %0 to i16
%tmp0_2 = insertelement <8 x i16> undef, i16 %tmp0_1, i32 0		%tmp0_2 = insertelement <8 x i16> undef, i16 %tmp0_1, i32 0
%tmp0_3 = bitcast <8 x i16> %tmp0_2 to <4 x i32>		%tmp0_3 = bitcast <8 x i16> %tmp0_2 to <4 x i32>
%1 = load <2 x i16>, ptr %a, align 4		%1 = load <2 x i16>, ptr %a, align 4
%tmp1_1 = bitcast <2 x i16> %1 to i32		%tmp1_1 = bitcast <2 x i16> %1 to i32
%tmp1_2 = insertelement <4 x i32> undef, i32 %tmp1_1, i32 0		%tmp1_2 = insertelement <4 x i32> undef, i32 %tmp1_1, i32 0
%2 = shufflevector <4 x i32> %tmp1_2, <4 x i32> %tmp0_3, <4 x i32> <i32 0, i32 4, i32 1, i32 5>		%2 = shufflevector <4 x i32> %tmp1_2, <4 x i32> %tmp0_3, <4 x i32> <i32 0, i32 4, i32 1, i32 5>
store <4 x i32> %2, ptr undef, align 4		store <4 x i32> %2, ptr undef, align 4
ret void		ret void
}		}

define void @test_v4i32_v2i64(ptr %a) {		define void @test_v4i32_v2i64(ptr %a) {
; CHECK-LE-P8-LABEL: test_v4i32_v2i64:		; CHECK-LE-P8-LABEL: test_v4i32_v2i64:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lfdx f0, 0, r3		; CHECK-LE-P8-NEXT: lfdx f0, 0, r3
; CHECK-LE-P8-NEXT: lfiwzx f1, 0, r3		; CHECK-LE-P8-NEXT: lfiwzx f1, 0, r3
; CHECK-LE-P8-NEXT: xxswapd vs0, f0		; CHECK-LE-P8-NEXT: xxmrghw vs0, vs0, vs1
; CHECK-LE-P8-NEXT: xxswapd vs1, f1
; CHECK-LE-P8-NEXT: xxmrglw vs0, vs0, vs1
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxswapd vs0, vs0
; CHECK-LE-P8-NEXT: stxvd2x vs0, 0, r3		; CHECK-LE-P8-NEXT: stxvd2x vs0, 0, r3
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v4i32_v2i64:		; CHECK-LE-P9-LABEL: test_v4i32_v2i64:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lfd f0, 0(r3)		; CHECK-LE-P9-NEXT: lfd f0, 0(r3)
; CHECK-LE-P9-NEXT: lfiwzx f1, 0, r3		; CHECK-LE-P9-NEXT: lfiwzx f1, 0, r3
; CHECK-LE-P9-NEXT: xxswapd vs0, f0		; CHECK-LE-P9-NEXT: xxmrghw vs0, vs0, vs1
; CHECK-LE-P9-NEXT: xxswapd vs1, f1
; CHECK-LE-P9-NEXT: xxmrglw vs0, vs0, vs1
; CHECK-LE-P9-NEXT: stxv vs0, 0(r3)		; CHECK-LE-P9-NEXT: stxv vs0, 0(r3)
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v4i32_v2i64:		; CHECK-BE-P8-LABEL: test_v4i32_v2i64:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lfiwzx f1, 0, r3		; CHECK-BE-P8-NEXT: lfiwzx f1, 0, r3
; CHECK-BE-P8-NEXT: lfdx f0, 0, r3		; CHECK-BE-P8-NEXT: lfdx f0, 0, r3
; CHECK-BE-P8-NEXT: xxsldwi vs1, f1, f1, 1		; CHECK-BE-P8-NEXT: xxsldwi vs1, f1, f1, 1
▲ Show 20 Lines • Show All 153 Lines • ▼ Show 20 Lines	entry:
ret void		ret void
}		}

define void @test_v2i64_v4i32(ptr %a) {		define void @test_v2i64_v4i32(ptr %a) {
; CHECK-LE-P8-LABEL: test_v2i64_v4i32:		; CHECK-LE-P8-LABEL: test_v2i64_v4i32:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lfdx f0, 0, r3		; CHECK-LE-P8-NEXT: lfdx f0, 0, r3
; CHECK-LE-P8-NEXT: lfiwzx f1, 0, r3		; CHECK-LE-P8-NEXT: lfiwzx f1, 0, r3
; CHECK-LE-P8-NEXT: xxswapd vs0, f0		; CHECK-LE-P8-NEXT: xxmrghw vs0, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd vs1, f1
; CHECK-LE-P8-NEXT: xxmrglw vs0, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxswapd vs0, vs0
; CHECK-LE-P8-NEXT: stxvd2x vs0, 0, r3		; CHECK-LE-P8-NEXT: stxvd2x vs0, 0, r3
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v2i64_v4i32:		; CHECK-LE-P9-LABEL: test_v2i64_v4i32:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lfd f0, 0(r3)		; CHECK-LE-P9-NEXT: lfd f0, 0(r3)
; CHECK-LE-P9-NEXT: lfiwzx f1, 0, r3		; CHECK-LE-P9-NEXT: lfiwzx f1, 0, r3
; CHECK-LE-P9-NEXT: xxswapd vs0, f0		; CHECK-LE-P9-NEXT: xxmrghw vs0, vs1, vs0
; CHECK-LE-P9-NEXT: xxswapd vs1, f1
; CHECK-LE-P9-NEXT: xxmrglw vs0, vs1, vs0
; CHECK-LE-P9-NEXT: stxv vs0, 0(r3)		; CHECK-LE-P9-NEXT: stxv vs0, 0(r3)
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v2i64_v4i32:		; CHECK-BE-P8-LABEL: test_v2i64_v4i32:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lfiwzx f1, 0, r3		; CHECK-BE-P8-NEXT: lfiwzx f1, 0, r3
; CHECK-BE-P8-NEXT: lfdx f0, 0, r3		; CHECK-BE-P8-NEXT: lfdx f0, 0, r3
; CHECK-BE-P8-NEXT: xxsldwi vs1, f1, f1, 1		; CHECK-BE-P8-NEXT: xxsldwi vs1, f1, f1, 1
▲ Show 20 Lines • Show All 66 Lines • ▼ Show 20 Lines
}		}

define void @test_v2i64_v8i16(ptr %a) {		define void @test_v2i64_v8i16(ptr %a) {
; CHECK-LE-P8-LABEL: test_v2i64_v8i16:		; CHECK-LE-P8-LABEL: test_v2i64_v8i16:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lhz r4, 0(r3)		; CHECK-LE-P8-NEXT: lhz r4, 0(r3)
; CHECK-LE-P8-NEXT: lfdx f0, 0, r3		; CHECK-LE-P8-NEXT: lfdx f0, 0, r3
; CHECK-LE-P8-NEXT: mtfprd f1, r4		; CHECK-LE-P8-NEXT: mtfprd f1, r4
; CHECK-LE-P8-NEXT: xxswapd vs0, f0		; CHECK-LE-P8-NEXT: xxmrghw vs0, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd vs1, vs1
; CHECK-LE-P8-NEXT: xxmrglw vs0, vs1, vs0
; CHECK-LE-P8-NEXT: xxswapd vs0, vs0		; CHECK-LE-P8-NEXT: xxswapd vs0, vs0
; CHECK-LE-P8-NEXT: stxvd2x vs0, 0, r3		; CHECK-LE-P8-NEXT: stxvd2x vs0, 0, r3
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v2i64_v8i16:		; CHECK-LE-P9-LABEL: test_v2i64_v8i16:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxsihzx v2, 0, r3		; CHECK-LE-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-LE-P9-NEXT: lfd f0, 0(r3)		; CHECK-LE-P9-NEXT: lfd f1, 0(r3)
; CHECK-LE-P9-NEXT: xxswapd vs0, f0		; CHECK-LE-P9-NEXT: xxmrghw vs0, vs0, vs1
; CHECK-LE-P9-NEXT: vsplth v2, v2, 3
; CHECK-LE-P9-NEXT: xxmrglw vs0, v2, vs0
; CHECK-LE-P9-NEXT: stxv vs0, 0(r3)		; CHECK-LE-P9-NEXT: stxv vs0, 0(r3)
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v2i64_v8i16:		; CHECK-BE-P8-LABEL: test_v2i64_v8i16:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lhz r4, 0(r3)		; CHECK-BE-P8-NEXT: lhz r4, 0(r3)
; CHECK-BE-P8-NEXT: lfdx f0, 0, r3		; CHECK-BE-P8-NEXT: lfdx f0, 0, r3
; CHECK-BE-P8-NEXT: sldi r3, r4, 48		; CHECK-BE-P8-NEXT: sldi r3, r4, 48
Show All 27 Lines
; CHECK-AIX-64-P9-NEXT: lfd f0, 0(r3)		; CHECK-AIX-64-P9-NEXT: lfd f0, 0(r3)
; CHECK-AIX-64-P9-NEXT: vsplth v2, v2, 3		; CHECK-AIX-64-P9-NEXT: vsplth v2, v2, 3
; CHECK-AIX-64-P9-NEXT: xxmrghw vs0, vs0, v2		; CHECK-AIX-64-P9-NEXT: xxmrghw vs0, vs0, v2
; CHECK-AIX-64-P9-NEXT: stxv vs0, 0(r3)		; CHECK-AIX-64-P9-NEXT: stxv vs0, 0(r3)
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v2i64_v8i16:		; CHECK-AIX-32-P8-LABEL: test_v2i64_v8i16:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: lhz r4, 0(r3)		; CHECK-AIX-32-P8-NEXT: lwz r4, L..C9(r2) # %const.0
; CHECK-AIX-32-P8-NEXT: sth r4, -32(r1)		; CHECK-AIX-32-P8-NEXT: lhz r5, 0(r3)
; CHECK-AIX-32-P8-NEXT: addi r4, r1, -32		; CHECK-AIX-32-P8-NEXT: lxsiwzx v2, 0, r3
; CHECK-AIX-32-P8-NEXT: lwz r3, 0(r3)		; CHECK-AIX-32-P8-NEXT: mtvsrwz v4, r5
; CHECK-AIX-32-P8-NEXT: lxvw4x vs0, 0, r4		; CHECK-AIX-32-P8-NEXT: lxvw4x v3, 0, r4
; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -16		; CHECK-AIX-32-P8-NEXT: stxvw4x v2, 0, r3
; CHECK-AIX-32-P8-NEXT: lxvw4x vs1, 0, r3
; CHECK-AIX-32-P8-NEXT: xxmrghw vs0, vs1, vs0
; CHECK-AIX-32-P8-NEXT: stxvw4x vs0, 0, r3
; CHECK-AIX-32-P8-NEXT: blr		; CHECK-AIX-32-P8-NEXT: blr
;		;
; CHECK-AIX-32-P9-LABEL: test_v2i64_v8i16:		; CHECK-AIX-32-P9-LABEL: test_v2i64_v8i16:
; CHECK-AIX-32-P9: # %bb.0: # %entry		; CHECK-AIX-32-P9: # %bb.0: # %entry
; CHECK-AIX-32-P9-NEXT: lhz r4, 0(r3)		; CHECK-AIX-32-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-AIX-32-P9-NEXT: sth r4, -32(r1)		; CHECK-AIX-32-P9-NEXT: lfiwzx f1, 0, r3
; CHECK-AIX-32-P9-NEXT: lwz r3, 0(r3)		; CHECK-AIX-32-P9-NEXT: lwz r3, L..C8(r2) # %const.0
; CHECK-AIX-32-P9-NEXT: lxv vs0, -32(r1)		; CHECK-AIX-32-P9-NEXT: lxv vs2, 0(r3)
; CHECK-AIX-32-P9-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P9-NEXT: xxperm vs0, vs1, vs2
; CHECK-AIX-32-P9-NEXT: lxv vs1, -16(r1)
; CHECK-AIX-32-P9-NEXT: xxmrghw vs0, vs1, vs0
; CHECK-AIX-32-P9-NEXT: stxv vs0, 0(r3)		; CHECK-AIX-32-P9-NEXT: stxv vs0, 0(r3)
; CHECK-AIX-32-P9-NEXT: blr		; CHECK-AIX-32-P9-NEXT: blr
entry:		entry:
%0 = load <2 x i8>, ptr undef, align 1		%0 = load <2 x i8>, ptr undef, align 1
%tmp0_1 = bitcast <2 x i8> %0 to i16		%tmp0_1 = bitcast <2 x i8> %0 to i16
%tmp0_2 = insertelement <8 x i16> undef, i16 %tmp0_1, i32 0		%tmp0_2 = insertelement <8 x i16> undef, i16 %tmp0_1, i32 0
%tmp0_3 = bitcast <8 x i16> %tmp0_2 to <4 x i32>		%tmp0_3 = bitcast <8 x i16> %tmp0_2 to <4 x i32>
%1 = load <2 x i16>, ptr %a, align 8		%1 = load <2 x i16>, ptr %a, align 8
%tmp1_1 = bitcast <2 x i16> %1 to i32		%tmp1_1 = bitcast <2 x i16> %1 to i32
%tmp1_2 = insertelement <4 x i32> undef, i32 %tmp1_1, i32 0		%tmp1_2 = insertelement <4 x i32> undef, i32 %tmp1_1, i32 0
%2 = shufflevector <4 x i32> %tmp1_2, <4 x i32> %tmp0_3, <4 x i32> <i32 0, i32 4, i32 1, i32 5>		%2 = shufflevector <4 x i32> %tmp1_2, <4 x i32> %tmp0_3, <4 x i32> <i32 0, i32 4, i32 1, i32 5>
store <4 x i32> %2, ptr undef, align 4		store <4 x i32> %2, ptr undef, align 4
ret void		ret void
}		}

llvm/test/CodeGen/PowerPC/v8i16_scalar_to_vector_shuffle.ll

Show First 20 Lines • Show All 235 Lines • ▼ Show 20 Lines	entry:
%shuff = shufflevector <8 x i16> %load0, <8 x i16> %load1, <8 x i32> <i32 0, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14>		%shuff = shufflevector <8 x i16> %load0, <8 x i16> %load1, <8 x i32> <i32 0, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14>
store <8 x i16> %shuff, ptr undef		store <8 x i16> %shuff, ptr undef
ret void		ret void
}		}

define void @test_none_v4i32(ptr %ptr, ptr %ptr2, i8 %v3) local_unnamed_addr #0 {		define void @test_none_v4i32(ptr %ptr, ptr %ptr2, i8 %v3) local_unnamed_addr #0 {
; CHECK-LE-P8-LABEL: test_none_v4i32:		; CHECK-LE-P8-LABEL: test_none_v4i32:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
		; CHECK-LE-P8-NEXT: mtfprd f0, r5
; CHECK-LE-P8-NEXT: addis r4, r2, .LCPI2_0@toc@ha		; CHECK-LE-P8-NEXT: addis r4, r2, .LCPI2_0@toc@ha
; CHECK-LE-P8-NEXT: mtvsrd v3, r5		; CHECK-LE-P8-NEXT: lxsiwzx v3, 0, r3
; CHECK-LE-P8-NEXT: addi r4, r4, .LCPI2_0@toc@l		; CHECK-LE-P8-NEXT: addi r4, r4, .LCPI2_0@toc@l
; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4
; CHECK-LE-P8-NEXT: addis r4, r2, .LCPI2_1@toc@ha
; CHECK-LE-P8-NEXT: addi r4, r4, .LCPI2_1@toc@l
; CHECK-LE-P8-NEXT: xxswapd v2, vs0		; CHECK-LE-P8-NEXT: xxswapd v2, vs0
; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4		; CHECK-LE-P8-NEXT: lxvd2x vs0, 0, r4
; CHECK-LE-P8-NEXT: vperm v2, v3, v3, v2		; CHECK-LE-P8-NEXT: vmrglh v2, v2, v2
; CHECK-LE-P8-NEXT: lxsiwzx v3, 0, r3
; CHECK-LE-P8-NEXT: xxswapd v4, vs0		; CHECK-LE-P8-NEXT: xxswapd v4, vs0
; CHECK-LE-P8-NEXT: vperm v2, v2, v3, v4		; CHECK-LE-P8-NEXT: vperm v2, v2, v3, v4
; CHECK-LE-P8-NEXT: xxswapd vs0, v2		; CHECK-LE-P8-NEXT: xxswapd vs0, v2
; CHECK-LE-P8-NEXT: stfdx f0, 0, r3		; CHECK-LE-P8-NEXT: stfdx f0, 0, r3
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_none_v4i32:		; CHECK-LE-P9-LABEL: test_none_v4i32:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxsiwzx v2, 0, r3		; CHECK-LE-P9-NEXT: lxsiwzx v2, 0, r3
; CHECK-LE-P9-NEXT: addis r3, r2, .LCPI2_0@toc@ha		; CHECK-LE-P9-NEXT: addis r3, r2, .LCPI2_0@toc@ha
; CHECK-LE-P9-NEXT: mtvsrd v3, r5		; CHECK-LE-P9-NEXT: mtfprd f0, r5
; CHECK-LE-P9-NEXT: addi r3, r3, .LCPI2_0@toc@l		; CHECK-LE-P9-NEXT: addi r3, r3, .LCPI2_0@toc@l
; CHECK-LE-P9-NEXT: lxv vs0, 0(r3)		; CHECK-LE-P9-NEXT: xxswapd v3, vs0
; CHECK-LE-P9-NEXT: addis r3, r2, .LCPI2_1@toc@ha
; CHECK-LE-P9-NEXT: addi r3, r3, .LCPI2_1@toc@l
; CHECK-LE-P9-NEXT: lxv v4, 0(r3)		; CHECK-LE-P9-NEXT: lxv v4, 0(r3)
; CHECK-LE-P9-NEXT: xxperm v3, v3, vs0		; CHECK-LE-P9-NEXT: vmrglh v3, v3, v3
; CHECK-LE-P9-NEXT: vperm v2, v3, v2, v4		; CHECK-LE-P9-NEXT: vperm v2, v3, v2, v4
; CHECK-LE-P9-NEXT: xxswapd vs0, v2		; CHECK-LE-P9-NEXT: xxswapd vs0, v2
; CHECK-LE-P9-NEXT: stfd f0, 0(r3)		; CHECK-LE-P9-NEXT: stfd f0, 0(r3)
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_none_v4i32:		; CHECK-BE-P8-LABEL: test_none_v4i32:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
		; CHECK-BE-P8-NEXT: sldi r5, r5, 56
; CHECK-BE-P8-NEXT: addis r4, r2, .LCPI2_0@toc@ha		; CHECK-BE-P8-NEXT: addis r4, r2, .LCPI2_0@toc@ha
; CHECK-BE-P8-NEXT: mtvsrwz v3, r5		; CHECK-BE-P8-NEXT: lxsiwzx v3, 0, r3
		; CHECK-BE-P8-NEXT: mtvsrd v2, r5
; CHECK-BE-P8-NEXT: addi r4, r4, .LCPI2_0@toc@l		; CHECK-BE-P8-NEXT: addi r4, r4, .LCPI2_0@toc@l
; CHECK-BE-P8-NEXT: lxvw4x v2, 0, r4
; CHECK-BE-P8-NEXT: addis r4, r2, .LCPI2_1@toc@ha
; CHECK-BE-P8-NEXT: addi r4, r4, .LCPI2_1@toc@l
; CHECK-BE-P8-NEXT: lxvw4x v4, 0, r4		; CHECK-BE-P8-NEXT: lxvw4x v4, 0, r4
; CHECK-BE-P8-NEXT: vperm v2, v3, v3, v2		; CHECK-BE-P8-NEXT: vmrghh v2, v2, v2
; CHECK-BE-P8-NEXT: lxsiwzx v3, 0, r3
; CHECK-BE-P8-NEXT: vperm v2, v3, v2, v4		; CHECK-BE-P8-NEXT: vperm v2, v3, v2, v4
; CHECK-BE-P8-NEXT: stxsdx v2, 0, r3		; CHECK-BE-P8-NEXT: stxsdx v2, 0, r3
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_none_v4i32:		; CHECK-BE-P9-LABEL: test_none_v4i32:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: lxsiwzx v2, 0, r3		; CHECK-BE-P9-NEXT: lxsiwzx v2, 0, r3
		; CHECK-BE-P9-NEXT: sldi r3, r5, 56
		; CHECK-BE-P9-NEXT: mtvsrd v3, r3
; CHECK-BE-P9-NEXT: addis r3, r2, .LCPI2_0@toc@ha		; CHECK-BE-P9-NEXT: addis r3, r2, .LCPI2_0@toc@ha
; CHECK-BE-P9-NEXT: mtvsrwz v3, r5
; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI2_0@toc@l		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI2_0@toc@l
; CHECK-BE-P9-NEXT: lxv vs0, 0(r3)		; CHECK-BE-P9-NEXT: vmrghh v3, v3, v3
; CHECK-BE-P9-NEXT: addis r3, r2, .LCPI2_1@toc@ha
; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI2_1@toc@l
; CHECK-BE-P9-NEXT: lxv v4, 0(r3)		; CHECK-BE-P9-NEXT: lxv v4, 0(r3)
; CHECK-BE-P9-NEXT: xxperm v3, v3, vs0
; CHECK-BE-P9-NEXT: vperm v2, v2, v3, v4		; CHECK-BE-P9-NEXT: vperm v2, v2, v3, v4
; CHECK-BE-P9-NEXT: stxsd v2, 0(r3)		; CHECK-BE-P9-NEXT: stxsd v2, 0(r3)
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_none_v4i32:		; CHECK-AIX-64-P8-LABEL: test_none_v4i32:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
		; CHECK-AIX-64-P8-NEXT: sldi r5, r5, 56
; CHECK-AIX-64-P8-NEXT: ld r4, L..C3(r2) # %const.0		; CHECK-AIX-64-P8-NEXT: ld r4, L..C3(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: mtvsrwz v3, r5
; CHECK-AIX-64-P8-NEXT: lxvw4x v2, 0, r4
; CHECK-AIX-64-P8-NEXT: ld r4, L..C4(r2) # %const.1
; CHECK-AIX-64-P8-NEXT: vperm v2, v3, v3, v2
; CHECK-AIX-64-P8-NEXT: lxsiwzx v3, 0, r3		; CHECK-AIX-64-P8-NEXT: lxsiwzx v3, 0, r3
		; CHECK-AIX-64-P8-NEXT: mtvsrd v2, r5
		; CHECK-AIX-64-P8-NEXT: vmrghh v2, v2, v2
; CHECK-AIX-64-P8-NEXT: lxvw4x v4, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvw4x v4, 0, r4
; CHECK-AIX-64-P8-NEXT: vperm v2, v3, v2, v4		; CHECK-AIX-64-P8-NEXT: vperm v2, v3, v2, v4
; CHECK-AIX-64-P8-NEXT: stxsdx v2, 0, r3		; CHECK-AIX-64-P8-NEXT: stxsdx v2, 0, r3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_none_v4i32:		; CHECK-AIX-64-P9-LABEL: test_none_v4i32:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lxsiwzx v2, 0, r3		; CHECK-AIX-64-P9-NEXT: lxsiwzx v2, 0, r3
		; CHECK-AIX-64-P9-NEXT: sldi r3, r5, 56
		; CHECK-AIX-64-P9-NEXT: mtvsrd v3, r3
; CHECK-AIX-64-P9-NEXT: ld r3, L..C2(r2) # %const.0		; CHECK-AIX-64-P9-NEXT: ld r3, L..C2(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: mtvsrwz v3, r5		; CHECK-AIX-64-P9-NEXT: vmrghh v3, v3, v3
; CHECK-AIX-64-P9-NEXT: lxv vs0, 0(r3)
; CHECK-AIX-64-P9-NEXT: ld r3, L..C3(r2) # %const.1
; CHECK-AIX-64-P9-NEXT: lxv v4, 0(r3)		; CHECK-AIX-64-P9-NEXT: lxv v4, 0(r3)
; CHECK-AIX-64-P9-NEXT: xxperm v3, v3, vs0
; CHECK-AIX-64-P9-NEXT: vperm v2, v2, v3, v4		; CHECK-AIX-64-P9-NEXT: vperm v2, v2, v3, v4
; CHECK-AIX-64-P9-NEXT: stxsd v2, 0(r3)		; CHECK-AIX-64-P9-NEXT: stxsd v2, 0(r3)
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_none_v4i32:		; CHECK-AIX-32-P8-LABEL: test_none_v4i32:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: addi r4, r1, -32		; CHECK-AIX-32-P8-NEXT: addi r4, r1, -32
; CHECK-AIX-32-P8-NEXT: lxsiwzx v2, 0, r3		; CHECK-AIX-32-P8-NEXT: lxsiwzx v2, 0, r3
▲ Show 20 Lines • Show All 79 Lines • ▼ Show 20 Lines
; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI3_0@toc@l		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI3_0@toc@l
; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)		; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)
; CHECK-BE-P9-NEXT: xxperm vs0, vs2, vs1		; CHECK-BE-P9-NEXT: xxperm vs0, vs2, vs1
; CHECK-BE-P9-NEXT: stxv vs0, 0(r3)		; CHECK-BE-P9-NEXT: stxv vs0, 0(r3)
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v4i32_none:		; CHECK-AIX-64-P8-LABEL: test_v4i32_none:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: ld r4, L..C5(r2) # %const.0		; CHECK-AIX-64-P8-NEXT: ld r4, L..C4(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: lxsiwzx v2, 0, r3		; CHECK-AIX-64-P8-NEXT: lxsiwzx v2, 0, r3
; CHECK-AIX-64-P8-NEXT: xxlxor v4, v4, v4		; CHECK-AIX-64-P8-NEXT: xxlxor v4, v4, v4
; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r4
; CHECK-AIX-64-P8-NEXT: vperm v2, v4, v2, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v4, v2, v3
; CHECK-AIX-64-P8-NEXT: stxvw4x v2, 0, r3		; CHECK-AIX-64-P8-NEXT: stxvw4x v2, 0, r3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v4i32_none:		; CHECK-AIX-64-P9-LABEL: test_v4i32_none:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lfiwzx f0, 0, r3		; CHECK-AIX-64-P9-NEXT: lfiwzx f0, 0, r3
; CHECK-AIX-64-P9-NEXT: ld r3, L..C4(r2) # %const.0		; CHECK-AIX-64-P9-NEXT: ld r3, L..C3(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: xxlxor vs2, vs2, vs2		; CHECK-AIX-64-P9-NEXT: xxlxor vs2, vs2, vs2
; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)		; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-64-P9-NEXT: xxperm vs0, vs2, vs1		; CHECK-AIX-64-P9-NEXT: xxperm vs0, vs2, vs1
; CHECK-AIX-64-P9-NEXT: stxv vs0, 0(r3)		; CHECK-AIX-64-P9-NEXT: stxv vs0, 0(r3)
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v4i32_none:		; CHECK-AIX-32-P8-LABEL: test_v4i32_none:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
▲ Show 20 Lines • Show All 83 Lines • ▼ Show 20 Lines
; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)		; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)
; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1		; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-BE-P9-NEXT: vmrghh v2, v3, v2		; CHECK-BE-P9-NEXT: vmrghh v2, v3, v2
; CHECK-BE-P9-NEXT: stxv v2, 0(r3)		; CHECK-BE-P9-NEXT: stxv v2, 0(r3)
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_none_v2i64:		; CHECK-AIX-64-P8-LABEL: test_none_v2i64:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: ld r5, L..C6(r2) # %const.0		; CHECK-AIX-64-P8-NEXT: ld r5, L..C5(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: lxsdx v2, 0, r3		; CHECK-AIX-64-P8-NEXT: lxsdx v2, 0, r3
; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r4
; CHECK-AIX-64-P8-NEXT: lxvw4x v4, 0, r5		; CHECK-AIX-64-P8-NEXT: lxvw4x v4, 0, r5
; CHECK-AIX-64-P8-NEXT: vperm v2, v3, v2, v4		; CHECK-AIX-64-P8-NEXT: vperm v2, v3, v2, v4
; CHECK-AIX-64-P8-NEXT: xxlxor v3, v3, v3		; CHECK-AIX-64-P8-NEXT: xxlxor v3, v3, v3
; CHECK-AIX-64-P8-NEXT: vmrghh v2, v3, v2		; CHECK-AIX-64-P8-NEXT: vmrghh v2, v3, v2
; CHECK-AIX-64-P8-NEXT: stxvw4x v2, 0, r3		; CHECK-AIX-64-P8-NEXT: stxvw4x v2, 0, r3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_none_v2i64:		; CHECK-AIX-64-P9-LABEL: test_none_v2i64:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lxsd v2, 0(r3)		; CHECK-AIX-64-P9-NEXT: lxsd v2, 0(r3)
; CHECK-AIX-64-P9-NEXT: ld r3, L..C5(r2) # %const.0		; CHECK-AIX-64-P9-NEXT: ld r3, L..C4(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: lxv vs0, 0(r4)		; CHECK-AIX-64-P9-NEXT: lxv vs0, 0(r4)
; CHECK-AIX-64-P9-NEXT: xxlxor v3, v3, v3		; CHECK-AIX-64-P9-NEXT: xxlxor v3, v3, v3
; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)		; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1		; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: vmrghh v2, v3, v2		; CHECK-AIX-64-P9-NEXT: vmrghh v2, v3, v2
; CHECK-AIX-64-P9-NEXT: stxv v2, 0(r3)		; CHECK-AIX-64-P9-NEXT: stxv v2, 0(r3)
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
▲ Show 20 Lines • Show All 74 Lines • ▼ Show 20 Lines
; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI5_0@toc@l		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI5_0@toc@l
; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)		; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)
; CHECK-BE-P9-NEXT: xxperm vs0, vs2, vs1		; CHECK-BE-P9-NEXT: xxperm vs0, vs2, vs1
; CHECK-BE-P9-NEXT: stxv vs0, 0(r3)		; CHECK-BE-P9-NEXT: stxv vs0, 0(r3)
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v2i64_none:		; CHECK-AIX-64-P8-LABEL: test_v2i64_none:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: ld r4, L..C7(r2) # %const.0		; CHECK-AIX-64-P8-NEXT: ld r4, L..C6(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: lxsdx v2, 0, r3		; CHECK-AIX-64-P8-NEXT: lxsdx v2, 0, r3
; CHECK-AIX-64-P8-NEXT: xxlxor v4, v4, v4		; CHECK-AIX-64-P8-NEXT: xxlxor v4, v4, v4
; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r4		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r4
; CHECK-AIX-64-P8-NEXT: vperm v2, v4, v2, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v4, v2, v3
; CHECK-AIX-64-P8-NEXT: stxvw4x v2, 0, r3		; CHECK-AIX-64-P8-NEXT: stxvw4x v2, 0, r3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v2i64_none:		; CHECK-AIX-64-P9-LABEL: test_v2i64_none:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lfd f0, 0(r3)		; CHECK-AIX-64-P9-NEXT: lfd f0, 0(r3)
; CHECK-AIX-64-P9-NEXT: ld r3, L..C6(r2) # %const.0		; CHECK-AIX-64-P9-NEXT: ld r3, L..C5(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: xxlxor vs2, vs2, vs2		; CHECK-AIX-64-P9-NEXT: xxlxor vs2, vs2, vs2
; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)		; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-64-P9-NEXT: xxperm vs0, vs2, vs1		; CHECK-AIX-64-P9-NEXT: xxperm vs0, vs2, vs1
; CHECK-AIX-64-P9-NEXT: stxv vs0, 0(r3)		; CHECK-AIX-64-P9-NEXT: stxv vs0, 0(r3)
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v2i64_none:		; CHECK-AIX-32-P8-LABEL: test_v2i64_none:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
▲ Show 20 Lines • Show All 79 Lines • ▼ Show 20 Lines
; CHECK-BE-P9-NEXT: lxsihzx v2, 0, r4		; CHECK-BE-P9-NEXT: lxsihzx v2, 0, r4
; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI6_0@toc@l		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI6_0@toc@l
; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)		; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)
; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1		; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v8i16_v8i16:		; CHECK-AIX-64-P8-LABEL: test_v8i16_v8i16:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: ld r5, L..C8(r2) # %const.0		; CHECK-AIX-64-P8-NEXT: ld r5, L..C7(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: lhz r3, 0(r3)		; CHECK-AIX-64-P8-NEXT: lhz r3, 0(r3)
; CHECK-AIX-64-P8-NEXT: lhz r4, 0(r4)		; CHECK-AIX-64-P8-NEXT: lhz r4, 0(r4)
; CHECK-AIX-64-P8-NEXT: mtvsrwz v2, r3		; CHECK-AIX-64-P8-NEXT: mtvsrwz v2, r3
; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r4		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r4
; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v8i16_v8i16:		; CHECK-AIX-64-P9-LABEL: test_v8i16_v8i16:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lxsihzx f0, 0, r3		; CHECK-AIX-64-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-AIX-64-P9-NEXT: ld r3, L..C7(r2) # %const.0		; CHECK-AIX-64-P9-NEXT: ld r3, L..C6(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: lxsihzx v2, 0, r4		; CHECK-AIX-64-P9-NEXT: lxsihzx v2, 0, r4
; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)		; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1		; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v8i16_v8i16:		; CHECK-AIX-32-P8-LABEL: test_v8i16_v8i16:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: lwz r5, L..C7(r2) # %const.0		; CHECK-AIX-32-P8-NEXT: lwz r5, L..C7(r2) # %const.0
Show All 20 Lines	entry:
%shuffle2 = shufflevector <8 x i8> %shuffle1, <8 x i8> %shuffle1, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15>		%shuffle2 = shufflevector <8 x i8> %shuffle1, <8 x i8> %shuffle1, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15>
ret <16 x i8> %shuffle2		ret <16 x i8> %shuffle2
}		}

define <16 x i8> @test_v8i16_v4i32(ptr %a, ptr %b) local_unnamed_addr {		define <16 x i8> @test_v8i16_v4i32(ptr %a, ptr %b) local_unnamed_addr {
; CHECK-LE-P8-LABEL: test_v8i16_v4i32:		; CHECK-LE-P8-LABEL: test_v8i16_v4i32:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lhz r3, 0(r3)		; CHECK-LE-P8-NEXT: lhz r3, 0(r3)
; CHECK-LE-P8-NEXT: lfiwzx f0, 0, r4		; CHECK-LE-P8-NEXT: lxsiwzx v2, 0, r4
; CHECK-LE-P8-NEXT: mtfprd f1, r3		; CHECK-LE-P8-NEXT: mtvsrd v3, r3
; CHECK-LE-P8-NEXT: xxswapd v3, f0		; CHECK-LE-P8-NEXT: vmrghh v2, v2, v3
; CHECK-LE-P8-NEXT: xxswapd v2, vs1
; CHECK-LE-P8-NEXT: vmrglh v2, v3, v2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v8i16_v4i32:		; CHECK-LE-P9-LABEL: test_v8i16_v4i32:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxsihzx v2, 0, r3		; CHECK-LE-P9-NEXT: lxsihzx v2, 0, r3
; CHECK-LE-P9-NEXT: lfiwzx f0, 0, r4		; CHECK-LE-P9-NEXT: lxsiwzx v3, 0, r4
; CHECK-LE-P9-NEXT: xxswapd v3, f0		; CHECK-LE-P9-NEXT: vmrghh v2, v3, v2
; CHECK-LE-P9-NEXT: vsplth v2, v2, 3
; CHECK-LE-P9-NEXT: vmrglh v2, v3, v2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v8i16_v4i32:		; CHECK-BE-P8-LABEL: test_v8i16_v4i32:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lfiwzx f0, 0, r4		; CHECK-BE-P8-NEXT: addis r5, r2, .LCPI7_0@toc@ha
; CHECK-BE-P8-NEXT: lhz r3, 0(r3)		; CHECK-BE-P8-NEXT: lhz r3, 0(r3)
; CHECK-BE-P8-NEXT: sldi r3, r3, 48		; CHECK-BE-P8-NEXT: lxsiwzx v2, 0, r4
; CHECK-BE-P8-NEXT: xxsldwi v2, f0, f0, 1		; CHECK-BE-P8-NEXT: addi r5, r5, .LCPI7_0@toc@l
; CHECK-BE-P8-NEXT: mtvsrd v3, r3		; CHECK-BE-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-BE-P8-NEXT: vmrghh v2, v3, v2		; CHECK-BE-P8-NEXT: mtvsrwz v4, r3
		; CHECK-BE-P8-NEXT: vperm v2, v4, v2, v3
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v8i16_v4i32:		; CHECK-BE-P9-LABEL: test_v8i16_v4i32:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: lxsihzx v2, 0, r3		; CHECK-BE-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-BE-P9-NEXT: lfiwzx f0, 0, r4		; CHECK-BE-P9-NEXT: addis r3, r2, .LCPI7_0@toc@ha
; CHECK-BE-P9-NEXT: xxsldwi v3, f0, f0, 1		; CHECK-BE-P9-NEXT: lxsiwzx v2, 0, r4
; CHECK-BE-P9-NEXT: vsplth v2, v2, 3		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI7_0@toc@l
; CHECK-BE-P9-NEXT: vmrghh v2, v2, v3		; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)
		; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v8i16_v4i32:		; CHECK-AIX-64-P8-LABEL: test_v8i16_v4i32:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: lfiwzx f0, 0, r4		; CHECK-AIX-64-P8-NEXT: ld r5, L..C8(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: lhz r3, 0(r3)		; CHECK-AIX-64-P8-NEXT: lhz r3, 0(r3)
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 48		; CHECK-AIX-64-P8-NEXT: lxsiwzx v2, 0, r4
; CHECK-AIX-64-P8-NEXT: xxsldwi v2, f0, f0, 1		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3
; CHECK-AIX-64-P8-NEXT: mtvsrd v3, r3		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-64-P8-NEXT: vmrghh v2, v3, v2		; CHECK-AIX-64-P8-NEXT: vperm v2, v4, v2, v3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v8i16_v4i32:		; CHECK-AIX-64-P9-LABEL: test_v8i16_v4i32:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lxsihzx v2, 0, r3		; CHECK-AIX-64-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-AIX-64-P9-NEXT: lfiwzx f0, 0, r4		; CHECK-AIX-64-P9-NEXT: ld r3, L..C7(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: xxsldwi v3, f0, f0, 1		; CHECK-AIX-64-P9-NEXT: lxsiwzx v2, 0, r4
; CHECK-AIX-64-P9-NEXT: vsplth v2, v2, 3		; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-64-P9-NEXT: vmrghh v2, v2, v3		; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v8i16_v4i32:		; CHECK-AIX-32-P8-LABEL: test_v8i16_v4i32:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
		; CHECK-AIX-32-P8-NEXT: lwz r5, L..C8(r2) # %const.0
; CHECK-AIX-32-P8-NEXT: lhz r3, 0(r3)		; CHECK-AIX-32-P8-NEXT: lhz r3, 0(r3)
; CHECK-AIX-32-P8-NEXT: sth r3, -32(r1)		; CHECK-AIX-32-P8-NEXT: lxsiwzx v2, 0, r4
; CHECK-AIX-32-P8-NEXT: lwz r3, 0(r4)		; CHECK-AIX-32-P8-NEXT: mtvsrwz v4, r3
; CHECK-AIX-32-P8-NEXT: addi r4, r1, -32		; CHECK-AIX-32-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r4		; CHECK-AIX-32-P8-NEXT: vperm v2, v4, v2, v3
; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -16
; CHECK-AIX-32-P8-NEXT: lxvw4x v3, 0, r3
; CHECK-AIX-32-P8-NEXT: vmrghh v2, v2, v3
; CHECK-AIX-32-P8-NEXT: blr		; CHECK-AIX-32-P8-NEXT: blr
;		;
; CHECK-AIX-32-P9-LABEL: test_v8i16_v4i32:		; CHECK-AIX-32-P9-LABEL: test_v8i16_v4i32:
; CHECK-AIX-32-P9: # %bb.0: # %entry		; CHECK-AIX-32-P9: # %bb.0: # %entry
; CHECK-AIX-32-P9-NEXT: lhz r3, 0(r3)		; CHECK-AIX-32-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-AIX-32-P9-NEXT: sth r3, -32(r1)		; CHECK-AIX-32-P9-NEXT: lwz r3, L..C7(r2) # %const.0
; CHECK-AIX-32-P9-NEXT: lwz r3, 0(r4)		; CHECK-AIX-32-P9-NEXT: lxsiwzx v2, 0, r4
; CHECK-AIX-32-P9-NEXT: lxv v2, -32(r1)		; CHECK-AIX-32-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-32-P9-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-32-P9-NEXT: lxv v3, -16(r1)
; CHECK-AIX-32-P9-NEXT: vmrghh v2, v2, v3
; CHECK-AIX-32-P9-NEXT: blr		; CHECK-AIX-32-P9-NEXT: blr
entry:		entry:
%0 = load <2 x i8>, ptr %a		%0 = load <2 x i8>, ptr %a
%bc1 = bitcast <2 x i8> %0 to i16		%bc1 = bitcast <2 x i8> %0 to i16
%vecinit3 = insertelement <8 x i16> poison, i16 %bc1, i64 0		%vecinit3 = insertelement <8 x i16> poison, i16 %bc1, i64 0
%1 = load <2 x i8>, ptr %b, align 4		%1 = load <2 x i8>, ptr %b, align 4
%bc2 = bitcast <2 x i8> %1 to i16		%bc2 = bitcast <2 x i8> %1 to i16
%vecinit6 = insertelement <8 x i16> undef, i16 %bc2, i64 0		%vecinit6 = insertelement <8 x i16> undef, i16 %bc2, i64 0
%2 = bitcast <8 x i16> %vecinit3 to <16 x i8>		%2 = bitcast <8 x i16> %vecinit3 to <16 x i8>
%3 = bitcast <8 x i16> %vecinit6 to <16 x i8>		%3 = bitcast <8 x i16> %vecinit6 to <16 x i8>
%shuffle = shufflevector <16 x i8> %2, <16 x i8> %3, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %2, <16 x i8> %3, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v8i16_v2i64(ptr %a, ptr %b) local_unnamed_addr {		define <16 x i8> @test_v8i16_v2i64(ptr %a, ptr %b) local_unnamed_addr {
; CHECK-LE-P8-LABEL: test_v8i16_v2i64:		; CHECK-LE-P8-LABEL: test_v8i16_v2i64:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lhz r3, 0(r3)		; CHECK-LE-P8-NEXT: lhz r3, 0(r3)
; CHECK-LE-P8-NEXT: lfdx f0, 0, r4		; CHECK-LE-P8-NEXT: lxsdx v2, 0, r4
; CHECK-LE-P8-NEXT: mtfprd f1, r3		; CHECK-LE-P8-NEXT: mtvsrd v3, r3
; CHECK-LE-P8-NEXT: xxswapd v3, f0		; CHECK-LE-P8-NEXT: vmrghh v2, v2, v3
; CHECK-LE-P8-NEXT: xxswapd v2, vs1
; CHECK-LE-P8-NEXT: vmrglh v2, v3, v2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v8i16_v2i64:		; CHECK-LE-P9-LABEL: test_v8i16_v2i64:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxsihzx v2, 0, r3		; CHECK-LE-P9-NEXT: lxsihzx v2, 0, r3
; CHECK-LE-P9-NEXT: lfd f0, 0(r4)		; CHECK-LE-P9-NEXT: lxsd v3, 0(r4)
; CHECK-LE-P9-NEXT: xxswapd v3, f0		; CHECK-LE-P9-NEXT: vmrghh v2, v3, v2
; CHECK-LE-P9-NEXT: vsplth v2, v2, 3
; CHECK-LE-P9-NEXT: vmrglh v2, v3, v2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v8i16_v2i64:		; CHECK-BE-P8-LABEL: test_v8i16_v2i64:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lhz r3, 0(r3)		; CHECK-BE-P8-NEXT: lhz r3, 0(r3)
; CHECK-BE-P8-NEXT: lxsdx v2, 0, r4		; CHECK-BE-P8-NEXT: lxsdx v2, 0, r4
; CHECK-BE-P8-NEXT: sldi r3, r3, 48		; CHECK-BE-P8-NEXT: sldi r3, r3, 48
; CHECK-BE-P8-NEXT: mtvsrd v3, r3		; CHECK-BE-P8-NEXT: mtvsrd v3, r3
Show All 22 Lines
; CHECK-AIX-64-P9-NEXT: lxsihzx v2, 0, r3		; CHECK-AIX-64-P9-NEXT: lxsihzx v2, 0, r3
; CHECK-AIX-64-P9-NEXT: lxsd v3, 0(r4)		; CHECK-AIX-64-P9-NEXT: lxsd v3, 0(r4)
; CHECK-AIX-64-P9-NEXT: vsplth v2, v2, 3		; CHECK-AIX-64-P9-NEXT: vsplth v2, v2, 3
; CHECK-AIX-64-P9-NEXT: vmrghh v2, v2, v3		; CHECK-AIX-64-P9-NEXT: vmrghh v2, v2, v3
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v8i16_v2i64:		; CHECK-AIX-32-P8-LABEL: test_v8i16_v2i64:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
		; CHECK-AIX-32-P8-NEXT: lwz r5, L..C9(r2) # %const.0
; CHECK-AIX-32-P8-NEXT: lhz r3, 0(r3)		; CHECK-AIX-32-P8-NEXT: lhz r3, 0(r3)
; CHECK-AIX-32-P8-NEXT: sth r3, -32(r1)		; CHECK-AIX-32-P8-NEXT: lxsiwzx v2, 0, r4
; CHECK-AIX-32-P8-NEXT: lwz r3, 0(r4)		; CHECK-AIX-32-P8-NEXT: mtvsrwz v4, r3
; CHECK-AIX-32-P8-NEXT: addi r4, r1, -32		; CHECK-AIX-32-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r4		; CHECK-AIX-32-P8-NEXT: vperm v2, v4, v2, v3
; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -16
; CHECK-AIX-32-P8-NEXT: lxvw4x v3, 0, r3
; CHECK-AIX-32-P8-NEXT: vmrghh v2, v2, v3
; CHECK-AIX-32-P8-NEXT: blr		; CHECK-AIX-32-P8-NEXT: blr
;		;
; CHECK-AIX-32-P9-LABEL: test_v8i16_v2i64:		; CHECK-AIX-32-P9-LABEL: test_v8i16_v2i64:
; CHECK-AIX-32-P9: # %bb.0: # %entry		; CHECK-AIX-32-P9: # %bb.0: # %entry
; CHECK-AIX-32-P9-NEXT: lhz r3, 0(r3)		; CHECK-AIX-32-P9-NEXT: lxsihzx f0, 0, r3
; CHECK-AIX-32-P9-NEXT: sth r3, -32(r1)		; CHECK-AIX-32-P9-NEXT: lwz r3, L..C8(r2) # %const.0
; CHECK-AIX-32-P9-NEXT: lwz r3, 0(r4)		; CHECK-AIX-32-P9-NEXT: lxsiwzx v2, 0, r4
; CHECK-AIX-32-P9-NEXT: lxv v2, -32(r1)		; CHECK-AIX-32-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-32-P9-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-32-P9-NEXT: lxv v3, -16(r1)
; CHECK-AIX-32-P9-NEXT: vmrghh v2, v2, v3
; CHECK-AIX-32-P9-NEXT: blr		; CHECK-AIX-32-P9-NEXT: blr
entry:		entry:
%0 = load <2 x i8>, ptr %a		%0 = load <2 x i8>, ptr %a
%bc1 = bitcast <2 x i8> %0 to i16		%bc1 = bitcast <2 x i8> %0 to i16
%vecinit3 = insertelement <8 x i16> poison, i16 %bc1, i64 0		%vecinit3 = insertelement <8 x i16> poison, i16 %bc1, i64 0
%1 = load <2 x i8>, ptr %b, align 8		%1 = load <2 x i8>, ptr %b, align 8
%bc2 = bitcast <2 x i8> %1 to i16		%bc2 = bitcast <2 x i8> %1 to i16
%vecinit6 = insertelement <8 x i16> undef, i16 %bc2, i64 0		%vecinit6 = insertelement <8 x i16> undef, i16 %bc2, i64 0
▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines
; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)		; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1		; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: vmrghh v2, v3, v2		; CHECK-AIX-64-P9-NEXT: vmrghh v2, v3, v2
; CHECK-AIX-64-P9-NEXT: stxv v2, 0(r3)		; CHECK-AIX-64-P9-NEXT: stxv v2, 0(r3)
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v4i32_v4i32:		; CHECK-AIX-32-P8-LABEL: test_v4i32_v4i32:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: lwz r5, L..C8(r2) # %const.0		; CHECK-AIX-32-P8-NEXT: lwz r5, L..C10(r2) # %const.0
; CHECK-AIX-32-P8-NEXT: lxsiwzx v2, 0, r3		; CHECK-AIX-32-P8-NEXT: lxsiwzx v2, 0, r3
; CHECK-AIX-32-P8-NEXT: lxsiwzx v3, 0, r4		; CHECK-AIX-32-P8-NEXT: lxsiwzx v3, 0, r4
; CHECK-AIX-32-P8-NEXT: lxvw4x v4, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x v4, 0, r5
; CHECK-AIX-32-P8-NEXT: vperm v2, v3, v2, v4		; CHECK-AIX-32-P8-NEXT: vperm v2, v3, v2, v4
; CHECK-AIX-32-P8-NEXT: xxlxor v3, v3, v3		; CHECK-AIX-32-P8-NEXT: xxlxor v3, v3, v3
; CHECK-AIX-32-P8-NEXT: vmrghh v2, v3, v2		; CHECK-AIX-32-P8-NEXT: vmrghh v2, v3, v2
; CHECK-AIX-32-P8-NEXT: stxvw4x v2, 0, r3		; CHECK-AIX-32-P8-NEXT: stxvw4x v2, 0, r3
; CHECK-AIX-32-P8-NEXT: blr		; CHECK-AIX-32-P8-NEXT: blr
;		;
; CHECK-AIX-32-P9-LABEL: test_v4i32_v4i32:		; CHECK-AIX-32-P9-LABEL: test_v4i32_v4i32:
; CHECK-AIX-32-P9: # %bb.0: # %entry		; CHECK-AIX-32-P9: # %bb.0: # %entry
; CHECK-AIX-32-P9-NEXT: lxsiwzx v2, 0, r3		; CHECK-AIX-32-P9-NEXT: lxsiwzx v2, 0, r3
; CHECK-AIX-32-P9-NEXT: lwz r3, L..C7(r2) # %const.0		; CHECK-AIX-32-P9-NEXT: lwz r3, L..C9(r2) # %const.0
; CHECK-AIX-32-P9-NEXT: lfiwzx f0, 0, r4		; CHECK-AIX-32-P9-NEXT: lfiwzx f0, 0, r4
; CHECK-AIX-32-P9-NEXT: xxlxor v3, v3, v3		; CHECK-AIX-32-P9-NEXT: xxlxor v3, v3, v3
; CHECK-AIX-32-P9-NEXT: lxv vs1, 0(r3)		; CHECK-AIX-32-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-32-P9-NEXT: xxperm v2, vs0, vs1		; CHECK-AIX-32-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-32-P9-NEXT: vmrghh v2, v3, v2		; CHECK-AIX-32-P9-NEXT: vmrghh v2, v3, v2
; CHECK-AIX-32-P9-NEXT: stxv v2, 0(r3)		; CHECK-AIX-32-P9-NEXT: stxv v2, 0(r3)
; CHECK-AIX-32-P9-NEXT: blr		; CHECK-AIX-32-P9-NEXT: blr
entry:		entry:
%0 = load <2 x i16>, ptr %ptr1, align 1		%0 = load <2 x i16>, ptr %ptr1, align 1
%1 = load <2 x i16>, ptr %ptr2, align 1		%1 = load <2 x i16>, ptr %ptr2, align 1
%shuffle1 = shufflevector <2 x i16> %0, <2 x i16> %1, <4 x i32> <i32 2, i32 3, i32 1, i32 0>		%shuffle1 = shufflevector <2 x i16> %0, <2 x i16> %1, <4 x i32> <i32 2, i32 3, i32 1, i32 0>
%2 = zext <4 x i16> %shuffle1 to <4 x i32>		%2 = zext <4 x i16> %shuffle1 to <4 x i32>
store <4 x i32> %2, ptr undef, align 16		store <4 x i32> %2, ptr undef, align 16
ret void		ret void
}		}

define <16 x i8> @test_v4i32_v8i16(ptr %a, ptr %b) local_unnamed_addr {		define <16 x i8> @test_v4i32_v8i16(ptr %a, ptr %b) local_unnamed_addr {
; CHECK-LE-P8-LABEL: test_v4i32_v8i16:		; CHECK-LE-P8-LABEL: test_v4i32_v8i16:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lhz r3, 0(r3)		; CHECK-LE-P8-NEXT: lhz r3, 0(r3)
; CHECK-LE-P8-NEXT: lfiwzx f0, 0, r4		; CHECK-LE-P8-NEXT: lxsiwzx v2, 0, r4
; CHECK-LE-P8-NEXT: mtfprd f1, r3		; CHECK-LE-P8-NEXT: mtvsrd v3, r3
; CHECK-LE-P8-NEXT: xxswapd v3, f0		; CHECK-LE-P8-NEXT: vmrghh v2, v3, v2
; CHECK-LE-P8-NEXT: xxswapd v2, vs1
; CHECK-LE-P8-NEXT: vmrglh v2, v2, v3
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v4i32_v8i16:		; CHECK-LE-P9-LABEL: test_v4i32_v8i16:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxsihzx v2, 0, r3		; CHECK-LE-P9-NEXT: lxsihzx v2, 0, r3
; CHECK-LE-P9-NEXT: lfiwzx f0, 0, r4		; CHECK-LE-P9-NEXT: lxsiwzx v3, 0, r4
; CHECK-LE-P9-NEXT: xxswapd v3, f0		; CHECK-LE-P9-NEXT: vmrghh v2, v2, v3
; CHECK-LE-P9-NEXT: vsplth v2, v2, 3
; CHECK-LE-P9-NEXT: vmrglh v2, v2, v3
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v4i32_v8i16:		; CHECK-BE-P8-LABEL: test_v4i32_v8i16:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lfiwzx f0, 0, r4		; CHECK-BE-P8-NEXT: addis r5, r2, .LCPI10_0@toc@ha
; CHECK-BE-P8-NEXT: lhz r3, 0(r3)		; CHECK-BE-P8-NEXT: lhz r3, 0(r3)
; CHECK-BE-P8-NEXT: sldi r3, r3, 48		; CHECK-BE-P8-NEXT: lxsiwzx v2, 0, r4
; CHECK-BE-P8-NEXT: xxsldwi v2, f0, f0, 1		; CHECK-BE-P8-NEXT: addi r5, r5, .LCPI10_0@toc@l
; CHECK-BE-P8-NEXT: mtvsrd v3, r3		; CHECK-BE-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-BE-P8-NEXT: vmrghh v2, v2, v3		; CHECK-BE-P8-NEXT: mtvsrwz v4, r3
		; CHECK-BE-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-BE-P8-NEXT: blr		; CHECK-BE-P8-NEXT: blr
;		;
; CHECK-BE-P9-LABEL: test_v4i32_v8i16:		; CHECK-BE-P9-LABEL: test_v4i32_v8i16:
; CHECK-BE-P9: # %bb.0: # %entry		; CHECK-BE-P9: # %bb.0: # %entry
; CHECK-BE-P9-NEXT: lxsihzx v2, 0, r3		; CHECK-BE-P9-NEXT: lxsihzx v2, 0, r3
		; CHECK-BE-P9-NEXT: addis r3, r2, .LCPI10_0@toc@ha
; CHECK-BE-P9-NEXT: lfiwzx f0, 0, r4		; CHECK-BE-P9-NEXT: lfiwzx f0, 0, r4
; CHECK-BE-P9-NEXT: xxsldwi v3, f0, f0, 1		; CHECK-BE-P9-NEXT: addi r3, r3, .LCPI10_0@toc@l
; CHECK-BE-P9-NEXT: vsplth v2, v2, 3		; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)
; CHECK-BE-P9-NEXT: vmrghh v2, v3, v2		; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v4i32_v8i16:		; CHECK-AIX-64-P8-LABEL: test_v4i32_v8i16:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: lfiwzx f0, 0, r4		; CHECK-AIX-64-P8-NEXT: ld r5, L..C10(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: lhz r3, 0(r3)		; CHECK-AIX-64-P8-NEXT: lhz r3, 0(r3)
; CHECK-AIX-64-P8-NEXT: sldi r3, r3, 48		; CHECK-AIX-64-P8-NEXT: lxsiwzx v2, 0, r4
; CHECK-AIX-64-P8-NEXT: xxsldwi v2, f0, f0, 1		; CHECK-AIX-64-P8-NEXT: mtvsrwz v4, r3
; CHECK-AIX-64-P8-NEXT: mtvsrd v3, r3		; CHECK-AIX-64-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-64-P8-NEXT: vmrghh v2, v2, v3		; CHECK-AIX-64-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v4i32_v8i16:		; CHECK-AIX-64-P9-LABEL: test_v4i32_v8i16:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lxsihzx v2, 0, r3		; CHECK-AIX-64-P9-NEXT: lxsihzx v2, 0, r3
		; CHECK-AIX-64-P9-NEXT: ld r3, L..C9(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: lfiwzx f0, 0, r4		; CHECK-AIX-64-P9-NEXT: lfiwzx f0, 0, r4
; CHECK-AIX-64-P9-NEXT: xxsldwi v3, f0, f0, 1		; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-64-P9-NEXT: vsplth v2, v2, 3		; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: vmrghh v2, v3, v2
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v4i32_v8i16:		; CHECK-AIX-32-P8-LABEL: test_v4i32_v8i16:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
		; CHECK-AIX-32-P8-NEXT: lwz r5, L..C11(r2) # %const.0
; CHECK-AIX-32-P8-NEXT: lhz r3, 0(r3)		; CHECK-AIX-32-P8-NEXT: lhz r3, 0(r3)
; CHECK-AIX-32-P8-NEXT: sth r3, -32(r1)		; CHECK-AIX-32-P8-NEXT: lxsiwzx v2, 0, r4
; CHECK-AIX-32-P8-NEXT: lwz r3, 0(r4)		; CHECK-AIX-32-P8-NEXT: mtvsrwz v4, r3
; CHECK-AIX-32-P8-NEXT: addi r4, r1, -32		; CHECK-AIX-32-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r4		; CHECK-AIX-32-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -16
; CHECK-AIX-32-P8-NEXT: lxvw4x v3, 0, r3
; CHECK-AIX-32-P8-NEXT: vmrghh v2, v3, v2
; CHECK-AIX-32-P8-NEXT: blr		; CHECK-AIX-32-P8-NEXT: blr
;		;
; CHECK-AIX-32-P9-LABEL: test_v4i32_v8i16:		; CHECK-AIX-32-P9-LABEL: test_v4i32_v8i16:
; CHECK-AIX-32-P9: # %bb.0: # %entry		; CHECK-AIX-32-P9: # %bb.0: # %entry
; CHECK-AIX-32-P9-NEXT: lhz r3, 0(r3)		; CHECK-AIX-32-P9-NEXT: lxsihzx v2, 0, r3
; CHECK-AIX-32-P9-NEXT: sth r3, -32(r1)		; CHECK-AIX-32-P9-NEXT: lwz r3, L..C10(r2) # %const.0
; CHECK-AIX-32-P9-NEXT: lwz r3, 0(r4)		; CHECK-AIX-32-P9-NEXT: lfiwzx f0, 0, r4
; CHECK-AIX-32-P9-NEXT: lxv v2, -32(r1)		; CHECK-AIX-32-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-32-P9-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-32-P9-NEXT: lxv v3, -16(r1)
; CHECK-AIX-32-P9-NEXT: vmrghh v2, v3, v2
; CHECK-AIX-32-P9-NEXT: blr		; CHECK-AIX-32-P9-NEXT: blr
entry:		entry:
%0 = load <2 x i8>, ptr %a		%0 = load <2 x i8>, ptr %a
%bc1 = bitcast <2 x i8> %0 to i16		%bc1 = bitcast <2 x i8> %0 to i16
%vecinit3 = insertelement <8 x i16> poison, i16 %bc1, i64 0		%vecinit3 = insertelement <8 x i16> poison, i16 %bc1, i64 0
%1 = load <2 x i8>, ptr %b, align 4		%1 = load <2 x i8>, ptr %b, align 4
%bc2 = bitcast <2 x i8> %1 to i16		%bc2 = bitcast <2 x i8> %1 to i16
%vecinit6 = insertelement <8 x i16> undef, i16 %bc2, i64 0		%vecinit6 = insertelement <8 x i16> undef, i16 %bc2, i64 0
%2 = bitcast <8 x i16> %vecinit3 to <16 x i8>		%2 = bitcast <8 x i16> %vecinit3 to <16 x i8>
%3 = bitcast <8 x i16> %vecinit6 to <16 x i8>		%3 = bitcast <8 x i16> %vecinit6 to <16 x i8>
%shuffle = shufflevector <16 x i8> %3, <16 x i8> %2, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %3, <16 x i8> %2, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v4i32_v2i64(ptr %a, ptr %b) local_unnamed_addr {		define <16 x i8> @test_v4i32_v2i64(ptr %a, ptr %b) local_unnamed_addr {
; CHECK-LE-P8-LABEL: test_v4i32_v2i64:		; CHECK-LE-P8-LABEL: test_v4i32_v2i64:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lfiwzx f0, 0, r3		; CHECK-LE-P8-NEXT: lxsiwzx v2, 0, r3
; CHECK-LE-P8-NEXT: lfdx f1, 0, r4		; CHECK-LE-P8-NEXT: lxsdx v3, 0, r4
; CHECK-LE-P8-NEXT: xxswapd v2, f0		; CHECK-LE-P8-NEXT: vmrghh v2, v3, v2
; CHECK-LE-P8-NEXT: xxswapd v3, f1
; CHECK-LE-P8-NEXT: vmrglh v2, v3, v2
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v4i32_v2i64:		; CHECK-LE-P9-LABEL: test_v4i32_v2i64:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lfiwzx f0, 0, r3		; CHECK-LE-P9-NEXT: lxsiwzx v2, 0, r3
; CHECK-LE-P9-NEXT: xxswapd v2, f0		; CHECK-LE-P9-NEXT: lxsd v3, 0(r4)
; CHECK-LE-P9-NEXT: lfd f0, 0(r4)		; CHECK-LE-P9-NEXT: vmrghh v2, v3, v2
; CHECK-LE-P9-NEXT: xxswapd v3, f0
; CHECK-LE-P9-NEXT: vmrglh v2, v3, v2
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v4i32_v2i64:		; CHECK-BE-P8-LABEL: test_v4i32_v2i64:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lfiwzx f0, 0, r3		; CHECK-BE-P8-NEXT: lfiwzx f0, 0, r3
; CHECK-BE-P8-NEXT: lxsdx v3, 0, r4		; CHECK-BE-P8-NEXT: lxsdx v3, 0, r4
; CHECK-BE-P8-NEXT: xxsldwi v2, f0, f0, 1		; CHECK-BE-P8-NEXT: xxsldwi v2, f0, f0, 1
; CHECK-BE-P8-NEXT: vmrghh v2, v2, v3		; CHECK-BE-P8-NEXT: vmrghh v2, v2, v3
Show All 20 Lines
; CHECK-AIX-64-P9-NEXT: lfiwzx f0, 0, r3		; CHECK-AIX-64-P9-NEXT: lfiwzx f0, 0, r3
; CHECK-AIX-64-P9-NEXT: lxsd v3, 0(r4)		; CHECK-AIX-64-P9-NEXT: lxsd v3, 0(r4)
; CHECK-AIX-64-P9-NEXT: xxsldwi v2, f0, f0, 1		; CHECK-AIX-64-P9-NEXT: xxsldwi v2, f0, f0, 1
; CHECK-AIX-64-P9-NEXT: vmrghh v2, v2, v3		; CHECK-AIX-64-P9-NEXT: vmrghh v2, v2, v3
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v4i32_v2i64:		; CHECK-AIX-32-P8-LABEL: test_v4i32_v2i64:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: lwz r5, L..C9(r2) # %const.0		; CHECK-AIX-32-P8-NEXT: lwz r5, L..C12(r2) # %const.0
; CHECK-AIX-32-P8-NEXT: lxsiwzx v2, 0, r3		; CHECK-AIX-32-P8-NEXT: lxsiwzx v2, 0, r3
; CHECK-AIX-32-P8-NEXT: lxsiwzx v3, 0, r4		; CHECK-AIX-32-P8-NEXT: lxsiwzx v3, 0, r4
; CHECK-AIX-32-P8-NEXT: lxvw4x v4, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x v4, 0, r5
; CHECK-AIX-32-P8-NEXT: vperm v2, v2, v3, v4		; CHECK-AIX-32-P8-NEXT: vperm v2, v2, v3, v4
; CHECK-AIX-32-P8-NEXT: blr		; CHECK-AIX-32-P8-NEXT: blr
;		;
; CHECK-AIX-32-P9-LABEL: test_v4i32_v2i64:		; CHECK-AIX-32-P9-LABEL: test_v4i32_v2i64:
; CHECK-AIX-32-P9: # %bb.0: # %entry		; CHECK-AIX-32-P9: # %bb.0: # %entry
; CHECK-AIX-32-P9-NEXT: lfiwzx f0, 0, r3		; CHECK-AIX-32-P9-NEXT: lfiwzx f0, 0, r3
; CHECK-AIX-32-P9-NEXT: lwz r3, L..C8(r2) # %const.0		; CHECK-AIX-32-P9-NEXT: lwz r3, L..C11(r2) # %const.0
; CHECK-AIX-32-P9-NEXT: lxsiwzx v2, 0, r4		; CHECK-AIX-32-P9-NEXT: lxsiwzx v2, 0, r4
; CHECK-AIX-32-P9-NEXT: lxv vs1, 0(r3)		; CHECK-AIX-32-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-32-P9-NEXT: xxperm v2, vs0, vs1		; CHECK-AIX-32-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-32-P9-NEXT: blr		; CHECK-AIX-32-P9-NEXT: blr
entry:		entry:
%0 = load <2 x i8>, ptr %a, align 4		%0 = load <2 x i8>, ptr %a, align 4
%bc1 = bitcast <2 x i8> %0 to i16		%bc1 = bitcast <2 x i8> %0 to i16
%vecinit3 = insertelement <8 x i16> poison, i16 %bc1, i64 0		%vecinit3 = insertelement <8 x i16> poison, i16 %bc1, i64 0
▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)		; CHECK-BE-P9-NEXT: lxv vs1, 0(r3)
; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1		; CHECK-BE-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-BE-P9-NEXT: vmrghh v2, v3, v2		; CHECK-BE-P9-NEXT: vmrghh v2, v3, v2
; CHECK-BE-P9-NEXT: stxv v2, 0(r3)		; CHECK-BE-P9-NEXT: stxv v2, 0(r3)
; CHECK-BE-P9-NEXT: blr		; CHECK-BE-P9-NEXT: blr
;		;
; CHECK-AIX-64-P8-LABEL: test_v2i64_v2i64:		; CHECK-AIX-64-P8-LABEL: test_v2i64_v2i64:
; CHECK-AIX-64-P8: # %bb.0: # %entry		; CHECK-AIX-64-P8: # %bb.0: # %entry
; CHECK-AIX-64-P8-NEXT: ld r5, L..C10(r2) # %const.0		; CHECK-AIX-64-P8-NEXT: ld r5, L..C11(r2) # %const.0
; CHECK-AIX-64-P8-NEXT: lxsdx v2, 0, r3		; CHECK-AIX-64-P8-NEXT: lxsdx v2, 0, r3
; CHECK-AIX-64-P8-NEXT: lxsdx v3, 0, r4		; CHECK-AIX-64-P8-NEXT: lxsdx v3, 0, r4
; CHECK-AIX-64-P8-NEXT: lxvw4x v4, 0, r5		; CHECK-AIX-64-P8-NEXT: lxvw4x v4, 0, r5
; CHECK-AIX-64-P8-NEXT: vperm v2, v3, v2, v4		; CHECK-AIX-64-P8-NEXT: vperm v2, v3, v2, v4
; CHECK-AIX-64-P8-NEXT: xxlxor v3, v3, v3		; CHECK-AIX-64-P8-NEXT: xxlxor v3, v3, v3
; CHECK-AIX-64-P8-NEXT: vmrghh v2, v3, v2		; CHECK-AIX-64-P8-NEXT: vmrghh v2, v3, v2
; CHECK-AIX-64-P8-NEXT: stxvw4x v2, 0, r3		; CHECK-AIX-64-P8-NEXT: stxvw4x v2, 0, r3
; CHECK-AIX-64-P8-NEXT: blr		; CHECK-AIX-64-P8-NEXT: blr
;		;
; CHECK-AIX-64-P9-LABEL: test_v2i64_v2i64:		; CHECK-AIX-64-P9-LABEL: test_v2i64_v2i64:
; CHECK-AIX-64-P9: # %bb.0: # %entry		; CHECK-AIX-64-P9: # %bb.0: # %entry
; CHECK-AIX-64-P9-NEXT: lxsd v2, 0(r3)		; CHECK-AIX-64-P9-NEXT: lxsd v2, 0(r3)
; CHECK-AIX-64-P9-NEXT: ld r3, L..C9(r2) # %const.0		; CHECK-AIX-64-P9-NEXT: ld r3, L..C10(r2) # %const.0
; CHECK-AIX-64-P9-NEXT: lfd f0, 0(r4)		; CHECK-AIX-64-P9-NEXT: lfd f0, 0(r4)
; CHECK-AIX-64-P9-NEXT: xxlxor v3, v3, v3		; CHECK-AIX-64-P9-NEXT: xxlxor v3, v3, v3
; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)		; CHECK-AIX-64-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1		; CHECK-AIX-64-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-64-P9-NEXT: vmrghh v2, v3, v2		; CHECK-AIX-64-P9-NEXT: vmrghh v2, v3, v2
; CHECK-AIX-64-P9-NEXT: stxv v2, 0(r3)		; CHECK-AIX-64-P9-NEXT: stxv v2, 0(r3)
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v2i64_v2i64:		; CHECK-AIX-32-P8-LABEL: test_v2i64_v2i64:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: lwz r5, L..C10(r2) # %const.0		; CHECK-AIX-32-P8-NEXT: lwz r5, L..C13(r2) # %const.0
; CHECK-AIX-32-P8-NEXT: lxsiwzx v2, 0, r3		; CHECK-AIX-32-P8-NEXT: lxsiwzx v2, 0, r3
; CHECK-AIX-32-P8-NEXT: lxsiwzx v3, 0, r4		; CHECK-AIX-32-P8-NEXT: lxsiwzx v3, 0, r4
; CHECK-AIX-32-P8-NEXT: lxvw4x v4, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x v4, 0, r5
; CHECK-AIX-32-P8-NEXT: vperm v2, v3, v2, v4		; CHECK-AIX-32-P8-NEXT: vperm v2, v3, v2, v4
; CHECK-AIX-32-P8-NEXT: xxlxor v3, v3, v3		; CHECK-AIX-32-P8-NEXT: xxlxor v3, v3, v3
; CHECK-AIX-32-P8-NEXT: vmrghh v2, v3, v2		; CHECK-AIX-32-P8-NEXT: vmrghh v2, v3, v2
; CHECK-AIX-32-P8-NEXT: stxvw4x v2, 0, r3		; CHECK-AIX-32-P8-NEXT: stxvw4x v2, 0, r3
; CHECK-AIX-32-P8-NEXT: blr		; CHECK-AIX-32-P8-NEXT: blr
;		;
; CHECK-AIX-32-P9-LABEL: test_v2i64_v2i64:		; CHECK-AIX-32-P9-LABEL: test_v2i64_v2i64:
; CHECK-AIX-32-P9: # %bb.0: # %entry		; CHECK-AIX-32-P9: # %bb.0: # %entry
; CHECK-AIX-32-P9-NEXT: lxsiwzx v2, 0, r3		; CHECK-AIX-32-P9-NEXT: lxsiwzx v2, 0, r3
; CHECK-AIX-32-P9-NEXT: lwz r3, L..C9(r2) # %const.0		; CHECK-AIX-32-P9-NEXT: lwz r3, L..C12(r2) # %const.0
; CHECK-AIX-32-P9-NEXT: lfiwzx f0, 0, r4		; CHECK-AIX-32-P9-NEXT: lfiwzx f0, 0, r4
; CHECK-AIX-32-P9-NEXT: xxlxor v3, v3, v3		; CHECK-AIX-32-P9-NEXT: xxlxor v3, v3, v3
; CHECK-AIX-32-P9-NEXT: lxv vs1, 0(r3)		; CHECK-AIX-32-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-32-P9-NEXT: xxperm v2, vs0, vs1		; CHECK-AIX-32-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-32-P9-NEXT: vmrghh v2, v3, v2		; CHECK-AIX-32-P9-NEXT: vmrghh v2, v3, v2
; CHECK-AIX-32-P9-NEXT: stxv v2, 0(r3)		; CHECK-AIX-32-P9-NEXT: stxv v2, 0(r3)
; CHECK-AIX-32-P9-NEXT: blr		; CHECK-AIX-32-P9-NEXT: blr
entry:		entry:
%0 = load <4 x i16>, ptr %ptr1, align 1		%0 = load <4 x i16>, ptr %ptr1, align 1
%1 = load <4 x i16>, ptr %ptr2, align 1		%1 = load <4 x i16>, ptr %ptr2, align 1
%shuffle1 = shufflevector <4 x i16> %0, <4 x i16> %1, <4 x i32> <i32 4, i32 5, i32 1, i32 0>		%shuffle1 = shufflevector <4 x i16> %0, <4 x i16> %1, <4 x i32> <i32 4, i32 5, i32 1, i32 0>
%2 = zext <4 x i16> %shuffle1 to <4 x i32>		%2 = zext <4 x i16> %shuffle1 to <4 x i32>
store <4 x i32> %2, ptr undef, align 16		store <4 x i32> %2, ptr undef, align 16
ret void		ret void
}		}

define <16 x i8> @test_v2i64_v4i32(ptr %a, ptr %b) local_unnamed_addr {		define <16 x i8> @test_v2i64_v4i32(ptr %a, ptr %b) local_unnamed_addr {
; CHECK-LE-P8-LABEL: test_v2i64_v4i32:		; CHECK-LE-P8-LABEL: test_v2i64_v4i32:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lfiwzx f0, 0, r3		; CHECK-LE-P8-NEXT: lxsiwzx v2, 0, r3
; CHECK-LE-P8-NEXT: lfdx f1, 0, r4		; CHECK-LE-P8-NEXT: lxsdx v3, 0, r4
; CHECK-LE-P8-NEXT: xxswapd v2, f0		; CHECK-LE-P8-NEXT: vmrghh v2, v2, v3
; CHECK-LE-P8-NEXT: xxswapd v3, f1
; CHECK-LE-P8-NEXT: vmrglh v2, v2, v3
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v2i64_v4i32:		; CHECK-LE-P9-LABEL: test_v2i64_v4i32:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lfiwzx f0, 0, r3		; CHECK-LE-P9-NEXT: lxsiwzx v2, 0, r3
; CHECK-LE-P9-NEXT: xxswapd v2, f0		; CHECK-LE-P9-NEXT: lxsd v3, 0(r4)
; CHECK-LE-P9-NEXT: lfd f0, 0(r4)		; CHECK-LE-P9-NEXT: vmrghh v2, v2, v3
; CHECK-LE-P9-NEXT: xxswapd v3, f0
; CHECK-LE-P9-NEXT: vmrglh v2, v2, v3
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v2i64_v4i32:		; CHECK-BE-P8-LABEL: test_v2i64_v4i32:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lfiwzx f0, 0, r3		; CHECK-BE-P8-NEXT: lfiwzx f0, 0, r3
; CHECK-BE-P8-NEXT: lxsdx v3, 0, r4		; CHECK-BE-P8-NEXT: lxsdx v3, 0, r4
; CHECK-BE-P8-NEXT: xxsldwi v2, f0, f0, 1		; CHECK-BE-P8-NEXT: xxsldwi v2, f0, f0, 1
; CHECK-BE-P8-NEXT: vmrghh v2, v3, v2		; CHECK-BE-P8-NEXT: vmrghh v2, v3, v2
Show All 20 Lines
; CHECK-AIX-64-P9-NEXT: lfiwzx f0, 0, r3		; CHECK-AIX-64-P9-NEXT: lfiwzx f0, 0, r3
; CHECK-AIX-64-P9-NEXT: lxsd v3, 0(r4)		; CHECK-AIX-64-P9-NEXT: lxsd v3, 0(r4)
; CHECK-AIX-64-P9-NEXT: xxsldwi v2, f0, f0, 1		; CHECK-AIX-64-P9-NEXT: xxsldwi v2, f0, f0, 1
; CHECK-AIX-64-P9-NEXT: vmrghh v2, v3, v2		; CHECK-AIX-64-P9-NEXT: vmrghh v2, v3, v2
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v2i64_v4i32:		; CHECK-AIX-32-P8-LABEL: test_v2i64_v4i32:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
; CHECK-AIX-32-P8-NEXT: lwz r5, L..C11(r2) # %const.0		; CHECK-AIX-32-P8-NEXT: lwz r5, L..C14(r2) # %const.0
; CHECK-AIX-32-P8-NEXT: lxsiwzx v2, 0, r3		; CHECK-AIX-32-P8-NEXT: lxsiwzx v2, 0, r3
; CHECK-AIX-32-P8-NEXT: lxsiwzx v3, 0, r4		; CHECK-AIX-32-P8-NEXT: lxsiwzx v3, 0, r4
; CHECK-AIX-32-P8-NEXT: lxvw4x v4, 0, r5		; CHECK-AIX-32-P8-NEXT: lxvw4x v4, 0, r5
; CHECK-AIX-32-P8-NEXT: vperm v2, v3, v2, v4		; CHECK-AIX-32-P8-NEXT: vperm v2, v3, v2, v4
; CHECK-AIX-32-P8-NEXT: blr		; CHECK-AIX-32-P8-NEXT: blr
;		;
; CHECK-AIX-32-P9-LABEL: test_v2i64_v4i32:		; CHECK-AIX-32-P9-LABEL: test_v2i64_v4i32:
; CHECK-AIX-32-P9: # %bb.0: # %entry		; CHECK-AIX-32-P9: # %bb.0: # %entry
; CHECK-AIX-32-P9-NEXT: lxsiwzx v2, 0, r3		; CHECK-AIX-32-P9-NEXT: lxsiwzx v2, 0, r3
; CHECK-AIX-32-P9-NEXT: lwz r3, L..C10(r2) # %const.0		; CHECK-AIX-32-P9-NEXT: lwz r3, L..C13(r2) # %const.0
; CHECK-AIX-32-P9-NEXT: lfiwzx f0, 0, r4		; CHECK-AIX-32-P9-NEXT: lfiwzx f0, 0, r4
; CHECK-AIX-32-P9-NEXT: lxv vs1, 0(r3)		; CHECK-AIX-32-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-32-P9-NEXT: xxperm v2, vs0, vs1		; CHECK-AIX-32-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-32-P9-NEXT: blr		; CHECK-AIX-32-P9-NEXT: blr
entry:		entry:
%0 = load <2 x i8>, ptr %a, align 4		%0 = load <2 x i8>, ptr %a, align 4
%bc1 = bitcast <2 x i8> %0 to i16		%bc1 = bitcast <2 x i8> %0 to i16
%vecinit3 = insertelement <8 x i16> poison, i16 %bc1, i64 0		%vecinit3 = insertelement <8 x i16> poison, i16 %bc1, i64 0
%1 = load <2 x i8>, ptr %b, align 8		%1 = load <2 x i8>, ptr %b, align 8
%bc2 = bitcast <2 x i8> %1 to i16		%bc2 = bitcast <2 x i8> %1 to i16
%vecinit6 = insertelement <8 x i16> undef, i16 %bc2, i64 0		%vecinit6 = insertelement <8 x i16> undef, i16 %bc2, i64 0
%2 = bitcast <8 x i16> %vecinit3 to <16 x i8>		%2 = bitcast <8 x i16> %vecinit3 to <16 x i8>
%3 = bitcast <8 x i16> %vecinit6 to <16 x i8>		%3 = bitcast <8 x i16> %vecinit6 to <16 x i8>
%shuffle = shufflevector <16 x i8> %3, <16 x i8> %2, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %3, <16 x i8> %2, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

define <16 x i8> @test_v2i64_v8i16(ptr %a, ptr %b) local_unnamed_addr {		define <16 x i8> @test_v2i64_v8i16(ptr %a, ptr %b) local_unnamed_addr {
; CHECK-LE-P8-LABEL: test_v2i64_v8i16:		; CHECK-LE-P8-LABEL: test_v2i64_v8i16:
; CHECK-LE-P8: # %bb.0: # %entry		; CHECK-LE-P8: # %bb.0: # %entry
; CHECK-LE-P8-NEXT: lhz r3, 0(r3)		; CHECK-LE-P8-NEXT: lhz r3, 0(r3)
; CHECK-LE-P8-NEXT: lfdx f0, 0, r4		; CHECK-LE-P8-NEXT: lxsdx v2, 0, r4
; CHECK-LE-P8-NEXT: mtfprd f1, r3		; CHECK-LE-P8-NEXT: mtvsrd v3, r3
; CHECK-LE-P8-NEXT: xxswapd v3, f0		; CHECK-LE-P8-NEXT: vmrghh v2, v3, v2
; CHECK-LE-P8-NEXT: xxswapd v2, vs1
; CHECK-LE-P8-NEXT: vmrglh v2, v2, v3
; CHECK-LE-P8-NEXT: blr		; CHECK-LE-P8-NEXT: blr
;		;
; CHECK-LE-P9-LABEL: test_v2i64_v8i16:		; CHECK-LE-P9-LABEL: test_v2i64_v8i16:
; CHECK-LE-P9: # %bb.0: # %entry		; CHECK-LE-P9: # %bb.0: # %entry
; CHECK-LE-P9-NEXT: lxsihzx v2, 0, r3		; CHECK-LE-P9-NEXT: lxsihzx v2, 0, r3
; CHECK-LE-P9-NEXT: lfd f0, 0(r4)		; CHECK-LE-P9-NEXT: lxsd v3, 0(r4)
; CHECK-LE-P9-NEXT: xxswapd v3, f0		; CHECK-LE-P9-NEXT: vmrghh v2, v2, v3
; CHECK-LE-P9-NEXT: vsplth v2, v2, 3
; CHECK-LE-P9-NEXT: vmrglh v2, v2, v3
; CHECK-LE-P9-NEXT: blr		; CHECK-LE-P9-NEXT: blr
;		;
; CHECK-BE-P8-LABEL: test_v2i64_v8i16:		; CHECK-BE-P8-LABEL: test_v2i64_v8i16:
; CHECK-BE-P8: # %bb.0: # %entry		; CHECK-BE-P8: # %bb.0: # %entry
; CHECK-BE-P8-NEXT: lhz r3, 0(r3)		; CHECK-BE-P8-NEXT: lhz r3, 0(r3)
; CHECK-BE-P8-NEXT: lxsdx v2, 0, r4		; CHECK-BE-P8-NEXT: lxsdx v2, 0, r4
; CHECK-BE-P8-NEXT: sldi r3, r3, 48		; CHECK-BE-P8-NEXT: sldi r3, r3, 48
; CHECK-BE-P8-NEXT: mtvsrd v3, r3		; CHECK-BE-P8-NEXT: mtvsrd v3, r3
Show All 22 Lines
; CHECK-AIX-64-P9-NEXT: lxsihzx v2, 0, r3		; CHECK-AIX-64-P9-NEXT: lxsihzx v2, 0, r3
; CHECK-AIX-64-P9-NEXT: lxsd v3, 0(r4)		; CHECK-AIX-64-P9-NEXT: lxsd v3, 0(r4)
; CHECK-AIX-64-P9-NEXT: vsplth v2, v2, 3		; CHECK-AIX-64-P9-NEXT: vsplth v2, v2, 3
; CHECK-AIX-64-P9-NEXT: vmrghh v2, v3, v2		; CHECK-AIX-64-P9-NEXT: vmrghh v2, v3, v2
; CHECK-AIX-64-P9-NEXT: blr		; CHECK-AIX-64-P9-NEXT: blr
;		;
; CHECK-AIX-32-P8-LABEL: test_v2i64_v8i16:		; CHECK-AIX-32-P8-LABEL: test_v2i64_v8i16:
; CHECK-AIX-32-P8: # %bb.0: # %entry		; CHECK-AIX-32-P8: # %bb.0: # %entry
		; CHECK-AIX-32-P8-NEXT: lwz r5, L..C15(r2) # %const.0
; CHECK-AIX-32-P8-NEXT: lhz r3, 0(r3)		; CHECK-AIX-32-P8-NEXT: lhz r3, 0(r3)
; CHECK-AIX-32-P8-NEXT: sth r3, -32(r1)		; CHECK-AIX-32-P8-NEXT: lxsiwzx v2, 0, r4
; CHECK-AIX-32-P8-NEXT: lwz r3, 0(r4)		; CHECK-AIX-32-P8-NEXT: mtvsrwz v4, r3
; CHECK-AIX-32-P8-NEXT: addi r4, r1, -32		; CHECK-AIX-32-P8-NEXT: lxvw4x v3, 0, r5
; CHECK-AIX-32-P8-NEXT: lxvw4x v2, 0, r4		; CHECK-AIX-32-P8-NEXT: vperm v2, v2, v4, v3
; CHECK-AIX-32-P8-NEXT: stw r3, -16(r1)
; CHECK-AIX-32-P8-NEXT: addi r3, r1, -16
; CHECK-AIX-32-P8-NEXT: lxvw4x v3, 0, r3
; CHECK-AIX-32-P8-NEXT: vmrghh v2, v3, v2
; CHECK-AIX-32-P8-NEXT: blr		; CHECK-AIX-32-P8-NEXT: blr
;		;
; CHECK-AIX-32-P9-LABEL: test_v2i64_v8i16:		; CHECK-AIX-32-P9-LABEL: test_v2i64_v8i16:
; CHECK-AIX-32-P9: # %bb.0: # %entry		; CHECK-AIX-32-P9: # %bb.0: # %entry
; CHECK-AIX-32-P9-NEXT: lhz r3, 0(r3)		; CHECK-AIX-32-P9-NEXT: lxsihzx v2, 0, r3
; CHECK-AIX-32-P9-NEXT: sth r3, -32(r1)		; CHECK-AIX-32-P9-NEXT: lwz r3, L..C14(r2) # %const.0
; CHECK-AIX-32-P9-NEXT: lwz r3, 0(r4)		; CHECK-AIX-32-P9-NEXT: lfiwzx f0, 0, r4
; CHECK-AIX-32-P9-NEXT: lxv v2, -32(r1)		; CHECK-AIX-32-P9-NEXT: lxv vs1, 0(r3)
; CHECK-AIX-32-P9-NEXT: stw r3, -16(r1)		; CHECK-AIX-32-P9-NEXT: xxperm v2, vs0, vs1
; CHECK-AIX-32-P9-NEXT: lxv v3, -16(r1)
; CHECK-AIX-32-P9-NEXT: vmrghh v2, v3, v2
; CHECK-AIX-32-P9-NEXT: blr		; CHECK-AIX-32-P9-NEXT: blr
entry:		entry:
%0 = load <2 x i8>, ptr %a		%0 = load <2 x i8>, ptr %a
%bc1 = bitcast <2 x i8> %0 to i16		%bc1 = bitcast <2 x i8> %0 to i16
%vecinit3 = insertelement <8 x i16> poison, i16 %bc1, i64 0		%vecinit3 = insertelement <8 x i16> poison, i16 %bc1, i64 0
%1 = load <2 x i8>, ptr %b, align 8		%1 = load <2 x i8>, ptr %b, align 8
%bc2 = bitcast <2 x i8> %1 to i16		%bc2 = bitcast <2 x i8> %1 to i16
%vecinit6 = insertelement <8 x i16> undef, i16 %bc2, i64 0		%vecinit6 = insertelement <8 x i16> undef, i16 %bc2, i64 0
%2 = bitcast <8 x i16> %vecinit3 to <16 x i8>		%2 = bitcast <8 x i16> %vecinit3 to <16 x i8>
%3 = bitcast <8 x i16> %vecinit6 to <16 x i8>		%3 = bitcast <8 x i16> %vecinit6 to <16 x i8>
%shuffle = shufflevector <16 x i8> %3, <16 x i8> %2, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>		%shuffle = shufflevector <16 x i8> %3, <16 x i8> %2, <16 x i32> <i32 0, i32 1, i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
ret <16 x i8> %shuffle		ret <16 x i8> %shuffle
}		}

This is an archive of the discontinued LLVM Phabricator instance.

[PowerPC] Fix vector_shuffle combines when inputs are scalar_to_vector of differing types.Needs RevisionPublic

Details

Diff Detail

Unit TestsFailed

Event Timeline

Revision Contents

Diff 479927

llvm/lib/Target/PowerPC/PPCISelLowering.cpp

llvm/test/CodeGen/PowerPC/p8-scalar_vector_conversions.ll

llvm/test/CodeGen/PowerPC/v16i8_scalar_to_vector_shuffle.ll

llvm/test/CodeGen/PowerPC/v2i64_scalar_to_vector_shuffle.ll

llvm/test/CodeGen/PowerPC/v4i32_scalar_to_vector_shuffle.ll

llvm/test/CodeGen/PowerPC/v8i16_scalar_to_vector_shuffle.ll

[PowerPC] Fix vector_shuffle combines when inputs are scalar_to_vector of differing types.
Needs RevisionPublic