This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
lib/CodeGen/SelectionDAG/
-
CodeGen/
-
SelectionDAG/
2
DAGCombiner.cpp
-
LegalizeIntegerTypes.cpp
-
LegalizeTypes.h
2
LegalizeTypesGeneric.cpp
1/8
LegalizeVectorTypes.cpp
-
test/CodeGen/
-
CodeGen/
-
ARM/
1
vuzp.ll
-
NVPTX/
1/3
f16x2-instructions.ll
-
SystemZ/
-
vec-cmp-cmp-logic-select.ll
-
vec-cmpsel.ll
-
X86/
-
2011-10-19-widen_vselect.ll
-
2011-10-21-widen-cmp.ll
-
psubus.ll
-
vselect-pcmp.ll
-
utils/
2
update_llc_test_checks.py

Differential D29489

Optimize SETCC + VSEL of incompatible or illegal types
ClosedPublic

Authored by jonpa on Feb 3 2017, 5:13 AM.

Download Raw Diff

Details

Reviewers

RKSimon
uweigand
eli.friedman
hfinkel
efriedma

Summary

I noticed that SETCC+VSELECT resulted in unnecessary sign-extensions and truncations on SystemZ. On SystemZ, TypeWidenVec is returned for any legal vector type, and the boolean contents is zero or negative one (all one's or zero's).

The SETCC vector mask type is originally with element type i1. The type legalizer then promotes this vector to a legal vector type. For two elements, this always becomes v2i64, four elements always becomes v4i32, etc (same number of elements promoted to a legal vector type). The type legalizer then in turn fixes VSELECT to work with this promoted mask

This works well when the widths of the elements compared by SETCC matches those that are selected by VSELECT. However, in all the cases where those widths do not match, for example SETCC(v2i32) + VSELECT(v2i64), the promotion of the SETCC result remains unoptimized, as well as the truncation / extension of it to suit VSELECT.

For example:

define <16 x i8> @fun(<16 x i8> %val1, <16 x i8> %val2,
                                      <16 x i8> %val3, <16 x i8> %val4) {
  %cmp = icmp eq <16 x i8> %val1, %val2
  %ret = select <16 x i1> %cmp, <16 x i8> %val3, <16 x i8> %val4
  ret <16 x i8> %ret
}

->

# BB#0:
    vceqb    %v0, %v24, %v26
    vsel    %v24, %v28, %v30, %v0
    br    %r14

while having just two elements:

define <2 x i8> @fun(<2 x i8> %val1, <2 x i8> %val2,
                                    <2 x i8> %val3, <2 x i8> %val4) {
  %cmp = icmp eq <2 x i8> %val1, %val2
  %ret = select <2 x i1> %cmp, <2 x i8> %val3, <2 x i8> %val4
  ret <2 x i8> %ret
}

->

# BB#0:
    vceqb    %v0, %v24, %v26
    vuphb    %v0, %v0
    vuphh    %v0, %v0
    vuphf    %v0, %v0
    vrepih    %v1, 1807
    vperm    %v0, %v0, %v0, %v1
    veslb    %v0, %v0, 7
    vesrab    %v0, %v0, 7
    vsel    %v24, %v28, %v30, %v0
    br    %r14

This should really have been the same code as in the case of full vectors. In the longer version, there is first the vector compare element, then three unpacks to make the SETCC result legal, then a truncation (which gets the original vector back). Then, the second problem I have found is also highlighted here: after the truncation (vperm) there is an inreg sign extension of i1 (vector element shift left + artim. shift right). This is also completely unnecessary, due to the defined boolean contents of the target.

I have tried to tackle these two problems, and while not being sure of exactly how this should be done, the first attempt here at least achieves the right optimizations in simple tests for all these cases.

For the extensions / truncations back and forth produced by the type legalizer, I saw three alternatives.

Try to improve the legalizer to not do this. I thought this seemed bad because we probably don't want any optimizations happening in a legalize phase, right? That would however be simpler than trying to detect the cases during DAGCombiner.
Add code to handle this in DAGCombiner.
Do a custom lowering for the SystemZ target. It seems other targets do this, and perhaps this is what is expected?

I tried first to experiment with the DAGCombiner::visitVSELECT() method. It was not as simple as one would have hoped to detect these cases. I am not sure at all if this code is acceptable. For instance, can it be assumed that a BUILD_VECTOR used by VSELECT is always using the "normal" elements order from the vector(s) produced by SETCC(s)? Or should this (and other things) be verified?

For the second problem, of the unneeded sign extension, I added a handling for this in DAGCombiner::visitSIGN_EXTEND_INREG(). I am with this code saying that it is always true that a vector of i1's is always correct if the boolean contents is ZeroOrNegativeOneBooleanContent. So there is never a need to fix this up with a sign extension from i1. I am however neither sure here if i1 really can be treated like this. It makes sense in the examples I have worked with.

This is a first attempt, and I am not sure what the best way to improve on this is. Would it for instance be worth trying SELECT_CC instead for this target? I even tried to return TypeWidenVector in getPreferredVectorAction() for vectors of i1, but that didn't work at all in this case.

Feedback on this much appreciated.

Diff Detail

Event Timeline

jonpa created this revision.Feb 3 2017, 5:13 AM

efriedma added a subscriber: efriedma.Feb 3 2017, 12:40 PM

efriedma added inline comments.

lib/CodeGen/SelectionDAG/DAGCombiner.cpp
6485	It seems like it would be simpler to produce the correct code in the first place, rather than vectorize the result which was scalarized by legalization.
7754	This doesn't make any sense; you can't assume an arbitrary vector is all zeros or all ones.

It seems like it would be simpler to produce the correct code in the first place, rather than vectorize the result which was scalarized by legalization.

I agree, so this time I have tried to do it during type legalization.

This doesn't make any sense; you can't assume an arbitrary vector is all zeros or all ones.

I was hoping maybe some check might make this legal. Anyway, this isn't needed anymore because the extend is not anymore generated in the first place.

I made a new method that handles VSELECT early and get the same results as with the previous version of the patch, in a simpler way. This is basically an extension of the handling of VSELECT during type legalization. I am not sure of what the best place to insert this function would be, but currently I need to call it from both PromoteIntOp_SELECT() and WidenVecRes_SELECT(), both called on the VSELECT.

Again, this patch is at a stage where I get the needed results, but where there might be missing legality checks and so on. This might even have to go into a custom lowering for the SystemZ backend if this disrupts other targets somehow.

Regression tests are now failing, but I would appreciate more feedback at this point.

I am not sure of what the best place to insert this function would be, but currently I need to call it from both PromoteIntOp_SELECT() and WidenVecRes_SELECT(), both called on the VSELECT.

You land in WidenVecRes_SELECT if the VSELECT result type is illegal, and PromoteIntOp_SELECT if the VSELECT result type is legal. I'm surprised PromoteIntOp_SELECT doesn't do the right thing without your special-case code, though; could you trace through and figure out what's happening? What goes wrong after PromoteTargetBoolean promotes the SETCC to an appropriate type?

You land in WidenVecRes_SELECT if the VSELECT result type is illegal, and PromoteIntOp_SELECT if the VSELECT result type is legal. I'm surprised PromoteIntOp_SELECT doesn't do the right thing without your special-case code, though; could you trace through and figure out what's happening? What goes wrong after PromoteTargetBoolean promotes the SETCC to an appropriate type?

In PromoteIntOp_SELECT() (trunk), PromoteTargetBoolean() promotes the boolean result vector by creating a new SIGN_EXTEND node for it.

This new SIGN_EXTEND is then legalized immediately after, and the SETCC result vector again produces a call to PromoteIntegerOperand(). The SETCC has however been handled before, and GetPromotedInteger() returns here a SIGN_EXTEND_VECTOR_INREG of the previously handled SETCC. The SETCC here has a legal (widened) integer vector type. PromoteIntOp_SIGN_EXTEND then adds two more extensions: ANY_EXTEND and SIGN_EXTEND_INREG of this. This results in:

Type-legalized selection DAG: BB#0 'fun:'
SelectionDAG has 18 nodes:
  t0: ch = EntryToken
            t2: v8i16,ch = CopyFromReg t0, Register:v8i16 %vreg0
            t4: v8i16,ch = CopyFromReg t0, Register:v8i16 %vreg1
          t19: v8i16 = setcc t2, t4, seteq:ch
        t22: v4i32 = sign_extend_vector_inreg t19
      t25: v4i32 = sign_extend_inreg t22, ValueType:ch:v4i1
      t6: v4i32,ch = CopyFromReg t0, Register:v4i32 %vreg2
      t8: v4i32,ch = CopyFromReg t0, Register:v4i32 %vreg3
    t14: v4i32 = vselect t25, t6, t8
  t16: ch,glue = CopyToReg t0, Register:v4i32 %V24, t14
  t17: ch = SystemZISD::RET_FLAG t16, Register:v4i32 %V24, t16:1

Here then is the extra SIGN_EXTEND_INREG (t25) that I tried to explicitly eliminate in my first version of the patch, which results in two unnecessary shifts on SystemZ.

As far as I can see now this is the only reason for handling in PromoteIntOp_SELECT(). Could perhaps this extra SIGN_EXTEND_INREG be avoided in the first place instead somehow?

I think we'll eliminate the redundant sign-extend if you extend SelectionDAG::ComputeNumSignBits to handle SIGN_EXTEND_VECTOR_INREG the same way it handles SIGN_EXTEND.

Fixing ComputeNumSignBits() per your suggestion eliminates the unnecessary SIGN_EXTEND_VECTOR_INREG in several cases, but not in all.

In cases where the SETCC gets split, a VECTOR_SHUFFLE or BUILD_VECTOR is generated. I experimented with handling these cases by extending ComputeNumSignBits() for several more nodes, which seems to work. It resembles a bit the situation from before, where we also handled scalarized code after type legalization.

I also recall that the new method kind of depends on the fact that VSELECTs get split in DAGCombiner (line 6218). If that is not done, the mask adjustments in the end (extension / truncate) would not make sense. Should perhaps a check be added for this in the new method that this is indeed correct (or alternatively, update the comment in DAGCombiner)?

Feel free to keep this together for now if it's easier, but eventually the changes to ComputeNumSignBits should be split into separate commits, with their own testcases.

lib/CodeGen/SelectionDAG/LegalizeVectorTypes.cpp
2873	Have you tried simplifying the handling of Cond using WidenTargetBoolean?
lib/CodeGen/SelectionDAG/SelectionDAG.cpp
3026 ↗	(On Diff #87602)	It doesn't really make sense to handle VECTOR_SHUFFLE and BUILD_VECTOR together. Maybe for VECTOR_SHUFFLE you can reuse the code from CONCAT_VECTORS?
3036 ↗	(On Diff #87602)	You aren't handling the case where ExtrOpBits > VTBits correctly (you have to subtract "ExtrOpBits - VTBits" bits from the result). Can we avoid making BUILD_VECTORS in the cases where this would be necessary?
3049 ↗	(On Diff #87602)	Bitcasts aren't transparent in general: the integer width changes, or the operand might not even be an integer.

Eli, are you saying you think it is the right thing to handle these cases "after the fact" in ComputeNumSignBits(), as opposed to avoiding this per the previous version of the patch? I first wanted to check your opinion on this, since you earlier wanted things done early when you said we shouldn't handle scalarized code and then vectorize it again.

There is a bit more work in ComputeNumSignBits() to handle these nodes. Would the patch(es) of this function be useful regardless of how we handle VSELECT..?

lib/CodeGen/SelectionDAG/LegalizeVectorTypes.cpp
2873	Calling WidenTargetBoolean() instead of making a new SETCC results in a CONCAT_VECTORS and SIGN_EXTEND nodes of the original SETCC. This is not good, because the SIGN_EXTEND never disappears. WidenTargetBoolean() and PromoteTargetBoolean() seem to have as the only behavior to extend the boolean vectors, which doesn't get folded properly by the SystemZ backend. It works very well for SystemZ to assume here that the VSELECT will be lowered to an instruction which produces a bitmask of the same type as its operands, but I guess this may be SystemZ specific, so would it be better to match the SIGN_EXTEND->SETCC in the SystemZ backend rather than trying to avoid it during type legalization?

Type legalization for SIGN_EXTEND(SETCC) should do the right thing, as opposed to special-casing VSELECT(SETCC), because it's more general. For example, consider the IR sext(icmp <4 x i32>...).

Legalization should avoid scalarizing the inputs where possible; scalarization is the ultimate fallback when we can't figure out some other reasonable way to lower an operation, but it's never a good thing (both for compile-time and runtime performance).

Where it makes sense, we should improve our analysis of DAG nodes, rather than adding special cases; if an existing transform does the right thing given a higher-quality ComputeNumSignBits, it makes sense to fix ComputeNumSignBits rather than add more transforms. We have a lot of existing transforms using ComputeNumSignBits, so it's better to make them all more powerful.

Does that make sense?

Patch updated according to suggestions.

Type legalization for SIGN_EXTEND(SETCC) should do the right thing, as opposed to special-casing VSELECT(SETCC), because it's more general. For example, consider the IR sext(icmp <4 x i32>...).

With the improvements in ComputeNumSignBits(), the call to the special-case VSELECT(SETCC) handling is not as needed as before (called in one place).

I tried again to get rid of it, and did another attempt in using the DAGCombiner to handle SIGN_EXTEND_VECTOR_INREG. It removes BUILD_VECTOR -> EXTRACT_VECTOR_ELTs -> SIGN_EXTEND_VECTOR_INREG when the types of BUILD_VECTOR and the operand of SIGN_EXTEND_VECTOR_INREG are the same. Unfortunately, there were a few cases of VSELECT result widening that this didn't handle, so I could not remove that call still. Therefore, this new attempt in the DAGCombiner was fruitless and not part of the patch.

Bitcasts aren't transparent in general: the integer width changes, or the operand might not even be an integer.

These have to be handled here. Do you think the update patch is making sense? If we can't handle the bistcasts like this, I think I would have to go back to calling the new method also for these cases. I suppose then these improvements in ComputeNumSignBits() are not needed here anymore, but could still perhaps be part of a separate patch. (btw I think I see an assert in that method that this is indeed an integer type).

jonpa marked 3 inline comments as done.Feb 15 2017, 5:01 AM

jonpa added inline comments.

lib/CodeGen/SelectionDAG/SelectionDAG.cpp
3036 ↗	(On Diff #87602)	Well, we don't have to handle them if we handle the VSELECT early...
3049 ↗	(On Diff #87602)	Does this look ok now?

RKSimon added a reviewer: RKSimon.Feb 17 2017, 6:43 AM

RKSimon added a subscriber: RKSimon.

RKSimon added inline comments.

lib/CodeGen/SelectionDAG/SelectionDAG.cpp
3042 ↗	(On Diff #88511)	Shuffle can't safely reuse the concat implementation - if any mask index is set to -1 (UNDEF) then we know nothing about the sign bits. Typically it will be a random element from one of the sources but it could just as easily be something else depending on shuffle lowering.

In ComputeNumSignBits():
Handle VECTOR_SHUFFLE separately.
Check that input type is an integer vector for BITCAST.

I suppose that this handling of BITCAST could possibly work, although it looks like it probably shouldn't be there. I would therefore suggest that that I go back to Eli's original suggestion of handling this early, by calling WidenVSELECT_SETCC() also in PromoteIntOp_SELECT(). That way, this never gets scalarized, and we then don't need any of the new handlings in ComputeNumSignBits(), even though they may be useful in other contexts.

I first show now what the patch looks like with the latest updates per your review, before I change it back. What do you think?

RKSimon added inline comments.Feb 20 2017, 5:15 AM

lib/CodeGen/SelectionDAG/SelectionDAG.cpp
3049 ↗	(On Diff #89088)	This isn't going to work - you need to check through the shuffle mask elements looking for -ve indices (which represent undefs) - if it occurs then NumSignBits = 1. You also need to determine which of the 2 input operands are actually referenced: Op0/LHS => 0 <= index < NumElts Op1/RHS => NumElts <= index < (2*NumElts) And then determine the minimum NumSignBits of those operand(s). Look at the SelectionDAG::computeKnownBits ISD::VECTOR_SHUFFLE implementation for reference.

Ooops! Fixed now, hopefully.

However, it seems that the handling for VECTOR_SHUFFLE is actually not needed anymore. My only guess is that this is due to some other recent change. This would actually be removed at least from my first commit(s), then.

Again, are you fine with handling all these cases early per my previous comment?

In D29489#681552, @jonpa wrote:

Ooops! Fixed now, hopefully.

However, it seems that the handling for VECTOR_SHUFFLE is actually not needed anymore. My only guess is that this is due to some other recent change. This would actually be removed at least from my first commit(s), then.

Not needed possibly due to D29454 - please drop it then as its almost certainly not being tested properly.

Again, are you fine with handling all these cases early per my previous comment?

Yes if promotion can stop all of these cases then its probably a better place to handle it.

Yes if promotion can stop all of these cases then its probably a better place to handle it.

OK, I changed back so this is handled early, and the ComputeNumSignBits() changes are removed.

I got regressions on several targets when applying this. I could eliminate a few by adding more checks before transformation. Left are target tests that I can't really judge if things have improved for that target and if so the test should be updated, or if the patch is flawed. These are failing with the patch as it is:

LLVM :: CodeGen/ARM/vuzp.ll
LLVM :: CodeGen/X86/2011-10-19-widen_vselect.ll
LLVM :: CodeGen/X86/2011-10-21-widen-cmp.ll
LLVM :: CodeGen/X86/psubus.ll

To be honest, at the moment this method is working well basically under the assumptions of the SystemZ target, which for one thing only has vector registers of 128 bits. It also has its way of using a vector register as a bitmask to perform vector selects, and I am not sure if other targets do this the same way. So I would actually suggest that I move this to a custom lowering for SystemZ of VSELECT instead for now. Unless of course this is also a known issue on some other target, and somebody wants to jump in and help me finish the patch right away.

It would have been nice to just improve common code by improving DAGCombines of SEXT_INREG etc, but after trying all of that, it turns out that in order to handle all the cases, it is really preferred to do it early before it gets scalarized.

What do you think?

In D29489#681999, @jonpa wrote:
I got regressions on several targets when applying this. I could eliminate a few by adding more checks before transformation. Left are target tests that I can't really judge if things have improved for that target and if so the test should be updated, or if the patch is flawed. These are failing with the patch as it is:
LLVM :: CodeGen/ARM/vuzp.ll
LLVM :: CodeGen/X86/2011-10-19-widen_vselect.ll
LLVM :: CodeGen/X86/2011-10-21-widen-cmp.ll
LLVM :: CodeGen/X86/psubus.ll

From a local build I've just ran all those regressions (remove unnecessary sign manipulations) look like improvements to me! Please can you include them to show the deltas, all of them can be regenerated by running llvm\utils\update_llc_test_checks.py

To be honest, at the moment this method is working well basically under the assumptions of the SystemZ target, which for one thing only has vector registers of 128 bits. It also has its way of using a vector register as a bitmask to perform vector selects, and I am not sure if other targets do this the same way. So I would actually suggest that I move this to a custom lowering for SystemZ of VSELECT instead for now. Unless of course this is also a known issue on some other target, and somebody wants to jump in and help me finish the patch right away.

You at least need to add some SystemZ specific tests before making that decision but nothing I've seen so far makes me think it has to be target specific.

It would have been nice to just improve common code by improving DAGCombines of SEXT_INREG etc, but after trying all of that, it turns out that in order to handle all the cases, it is really preferred to do it early before it gets scalarized.

Can you give some examples of the patterns that we're missing? I'm trying to improve combining *_EXTEND_VECTOR_INREG instructions which probably has a lot of crossover.

Tests added for SystemZ.

Regenerated tests:
test/CodeGen/ARM/vuzp.ll
test/CodeGen/X86/2011-10-19-widen_vselect.ll
test/CodeGen/X86/2011-10-21-widen-cmp.ll
test/CodeGen/X86/psubus.ll

Can you give some examples of the patterns that we're missing? I'm trying to improve combining *_EXTEND_VECTOR_INREG instructions which probably has a lot of crossover.

As I remember it, it was not possible to get around the fact that if type-legalization widened a VSELECT with the previous behaviour, bad things happened which were not possible to handle in the DAGCombiner. So, the point was that the best thing was to avoid the scalarization by handling it early per this patch. This seems to be the right thing regardless of how the DAGCombiner is improved in the future. I could try to check back and get the details if you wish, or at least see if the ComputeNumSignBits() improvements would be useful generally.

Is this ok to commit now, or is there any assert or check that is needed in the new method in the case of any arbitrary target? Are the regenerated tests really ok, or should they be checked by respective target maintainers?

ARM and x86 test changes look fine.

lib/CodeGen/SelectionDAG/LegalizeVectorTypes.cpp
2875	I still don't like that you're special-casing SETCC here... it isn't the only source of i1 vectors.

I still don't like that you're special-casing SETCC here... it isn't the only source of i1 vectors.

I see your point, but it appears to me that the current code should handle the majority of cases. Would it be acceptable to add a TODO comment about this for now, as done below?

I also removed the check for SETCC in PromoteIntOp_SELECT(), to pave the way for future extensions.

jonpa added inline comments.Feb 24 2017, 5:14 AM

lib/CodeGen/SelectionDAG/LegalizeVectorTypes.cpp
2875	If there is anything that really should be handled and commited at the same as the SETCC, please give more details.

RKSimon added inline comments.Feb 24 2017, 9:56 AM

test/CodeGen/ARM/vuzp.ll
324–325	This comment and the test name need updating as vuzp isn't used anymore.

efriedma added inline comments.Feb 24 2017, 10:46 AM

lib/CodeGen/SelectionDAG/LegalizeVectorTypes.cpp
2875	It would be nice to handle VSELECT(AND(SETCC, SETCC), X, Y). I can't think of anything else that's likely to come up frequently.

OK, I reworked this so that it can also handle logical combinations (and/or/xor) of two SETCCs.

I again thought it would have been nice to do this during pre type-legalize DAGCombiner, but it really must wait due to the necessity of widening, which isn't done in DAGCombiner. So this is done now in three places: when a VSELECT is handled for result widening, arg promotion or result splitting.

There was previously a handling for VSELECT in DAGCombiner, which also aimed to avoid scalarization. It didn't handle any other operand than SETCC (e.g. the AND), so I started experimenting and found that I could actually remove the splitting in DAGCombiner entirely, with improved results even. The scalarization is avoided with the new method instead.

The new WidenVSELECTAndMask() method minimizes the number of conversions between the two SETCCs and the logical op, and between the logical op and the VSELECT.

convertMask() is called to convert a e.g. SETCC or AND to the right VT.

New SystemZ tests for the AND / OR / XORs of two SETCCs:
To test all combinations would have been 480 tests per opcode, so I instead tried to find a mix that tested

For each vector element type, at least one compare each of Widen / Legal / Split.
Selects of either smaller, same, in-between or greater vector type.

This is now 180 tests without (systematic) commutation, for all three opcodes.
Is commutation needed? Should I instead test everything? (~1500 tests)

The vec-cmpsel with just cmp/select, has 109 tests.

Other tests:
AMDGPU/fmax_legacy.ll/@test_fmax_legacy_ogt_v3f32
Crashed, because it didn't work with the v3f32 type.
Added check in patch to avoid vector types which are not sized with a power of 2.

AMDGPU/vselect64.ll
Crashed, because the VSELECT should be scalarized, and type legalizer couldn't handle the output of the new method.
Added a check in patch VTWillScalarize(), which checks if a VT will be split all the way to 1 element. If so, it aborts.

NVPTX/f16x2-instructions.ll
improved and solved a TODO vectorization problem :-)

X86/2011-10-19-widen_vselect.ll:
one instruction changed place (pshufd)

X86/avx512-mask-op.ll
X86/psubus.ll
Don't know - big diff - need help.

X86/vselect-pcmp.ll
two instructions removed - legal?

Herald added a subscriber: jholewinski. · View Herald TranscriptFeb 28 2017, 5:51 AM

X86/avx512-mask-op.ll

You're making this substantially worse because i1 vectors are legal in avx-512, so you're forcing unnatural transforms.

The other changes look fine, at a glance.

For your new SystemZ tests, CHECK-NOT can be useful to make sure you aren't generating something unexpected, but please make sure each test at least CHECKs that the compares/blends you expect are being correctly generated.

I'll look at the new code later.

Thank you for the patch.

test/CodeGen/NVPTX/f16x2-instructions.ll
425–426	I think these are still needed (see cvt.f32... below) and should become CHECK-NOF16-DAG now.

You're making this substantially worse because i1 vectors are legal in avx-512, so you're forcing unnatural transforms.

Aha.
I would then expect getSetCCResultType() to return a vector of i1's. But since v32i1 is not a simple type, v32i32 is returned instead. So I had to split the VT and then check, and if a i1-vector then is returned from getSetCCResultType(), abort. I added this check to the new method.

I found that there still was a slight diff, because earlier the DAGCombiner split a VSELECT and VSETCC by making two new narrow SETCCs. The DAGTypeLegalizer instead just splits the SETCC's result vector. When I changed this behaviour so that it instead does what DAGCombiner used to do, the regression disappears. This is done by SplitVSETCC(), which is copied from DAGCombiner. I suppose it should go in as a common utility function somewhere?

Tests updated per review.

jonpa marked an inline comment as done.Mar 1 2017, 3:28 AM

jonpa added inline comments.

test/CodeGen/NVPTX/f16x2-instructions.ll
425–426	Is this looking ok?

tra added inline comments.Mar 1 2017, 10:29 AM

test/CodeGen/NVPTX/f16x2-instructions.ll
425–426	LGTM.

ping.

For the SystemZ tests, would it make sense to auto-generate the CHECK lines use update_llc_test_checks.py?

Please clang-format the new code.

lib/CodeGen/SelectionDAG/LegalizeTypesGeneric.cpp
546	Does SplitVSETCC do something different from just calling SplitVector? Your patch doesn't show any changes to avx512-mask-op.ll.
lib/CodeGen/SelectionDAG/LegalizeVectorTypes.cpp
2937	Could you just perform the SIGN_EXTEND/TRUNCATE to match the scalar size, then EXTRACT_SUBVECTOR/CONCAT_SUBVECTORS to match the number of elements? The invariants involving the relationship between the number of elements and the scalar sizes of MaskVT and ToMaskVT are confusing at best.

Thanks for review - patch updated.

Please clang-format the new code.

done.

For the SystemZ tests, would it make sense to auto-generate the CHECK lines use update_llc_test_checks.py?

This results in

KeyError: "Triple 's390x-linux-gnu' is not supported"

Is the script expected to support SystemZ?

In any case, I have generated the tests so that they first CHECK the expected sequence, and then CHECK-NOT what is supposed to not be there. I could change this to a sequence of CHECK-NEXTs, instead if that's better...

lib/CodeGen/SelectionDAG/LegalizeTypesGeneric.cpp
546	Yes, it creates two SETCCs of half the size, instead of splitting the result vector of the wide SETCC. There is now change to that test anymore. See my comment from March 1st above.
lib/CodeGen/SelectionDAG/LegalizeVectorTypes.cpp
2937	Yes, this seems better, thanks :-)

In D29489#696529, @jonpa wrote:

Is the script expected to support SystemZ?

Not by default, but adding a target tends to be quite trivial - you should be able to copy + tweak the arm or powerpc targets very easily.

It'd be great if you could use the script and then commit the new systemz tests with the current codegen to trunk so that this patch can show the diff.

Not by default, but adding a target tends to be quite trivial - you should be able to copy + tweak the arm or powerpc targets very easily.
It'd be great if you could use the script and then commit the new systemz tests with the current codegen to trunk so that this patch can show the diff.

I am new to python, but I tried your suggestion, and it seems to work at least for these two test files. A minus is that the CHECKs end up between the two lines of arguments. I suppose I should rewrite the tests to have them on a single line and then re-generate? Do the changes to the script look ok?

I am still waiting for approval of the common code changes. Eli, are you happy with it now after I rewrote it per your suggestion?

/Jonas

Please commit the new SystemZ tests separately from the code changes, so the commit shows how the generated code changes.

Otherwise LGTM.

lib/CodeGen/SelectionDAG/LegalizeVectorTypes.cpp
2880	Needs to be #ifndef NDEBUG to avoid warnings in Release mode.
utils/update_llc_test_checks.py
74	You probably want to keep the BB#0 comment; that lets you verify that the first instruction in the function is actually the one you expect.
123	?

This revision is now accepted and ready to land.Mar 15 2017, 12:35 PM

Commited as r297930.

Thanks for review!

Just to make sure: I actually asked during review if the SplitVSETCC() function I copied into LegalizeTypesGeneric.cpp from DAGCombiner should become a class member instead somewhere. Did we miss that? I wasn't sure where the best place would be for it.

@uli: Do the new SystemZ tests and the script update look fine to you?

In D29489#702570, @jonpa wrote:

@uli: Do the new SystemZ tests and the script update look fine to you?

LGTM.

In D29489#702771, @uweigand wrote:

In D29489#702570, @jonpa wrote:

@uli: Do the new SystemZ tests and the script update look fine to you?

LGTM.

If possible please can you add the script changes as a separate (pre) commit?

In D29489#702772, @RKSimon wrote:

In D29489#702771, @uweigand wrote:

In D29489#702570, @jonpa wrote:

@uli: Do the new SystemZ tests and the script update look fine to you?

LGTM.

If possible please can you add the script changes as a separate (pre) commit?

Committed r298048
M utils/update_llc_test_checks.py

LGTM.

tests commited as r298049

Revision Contents

Path

Size

lib/

CodeGen/

SelectionDAG/

DAGCombiner.cpp

28 lines

LegalizeIntegerTypes.cpp

4 lines

LegalizeTypes.h

8 lines

LegalizeTypesGeneric.cpp

29 lines

LegalizeVectorTypes.cpp

207 lines

test/

CodeGen/

ARM/

vuzp.ll

22 lines

NVPTX/

f16x2-instructions.ll

13 lines

SystemZ/

vec-cmp-cmp-logic-select.ll

5676 lines

vec-cmpsel.ll

2658 lines

X86/

2011-10-19-widen_vselect.ll

3 lines

2011-10-21-widen-cmp.ll

1 line

psubus.ll

280 lines

vselect-pcmp.ll

2 lines

utils/

update_llc_test_checks.py

22 lines

Diff 91521

lib/CodeGen/SelectionDAG/DAGCombiner.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 6,449 Lines • ▼ Show 20 Lines	if (isAbs) {
AddToWorklist(Add.getNode());		AddToWorklist(Add.getNode());
return DAG.getNode(ISD::XOR, DL, VT, Add, Shift);		return DAG.getNode(ISD::XOR, DL, VT, Add, Shift);
}		}
}		}

if (SimplifySelectOps(N, N1, N2))		if (SimplifySelectOps(N, N1, N2))
return SDValue(N, 0); // Don't revisit N.		return SDValue(N, 0); // Don't revisit N.

// If the VSELECT result requires splitting and the mask is provided by a
// SETCC, then split both nodes and its operands before legalization. This
// prevents the type legalizer from unrolling SETCC into scalar comparisons
// and enables future optimizations (e.g. min/max pattern matching on X86).
if (N0.getOpcode() == ISD::SETCC) {
EVT VT = N->getValueType(0);

// Check if any splitting is required.
if (TLI.getTypeAction(*DAG.getContext(), VT) !=
TargetLowering::TypeSplitVector)
return SDValue();

SDValue Lo, Hi, CCLo, CCHi, LL, LH, RL, RH;
std::tie(CCLo, CCHi) = SplitVSETCC(N0.getNode(), DAG);
std::tie(LL, LH) = DAG.SplitVectorOperand(N, 1);
std::tie(RL, RH) = DAG.SplitVectorOperand(N, 2);

Lo = DAG.getNode(N->getOpcode(), DL, LL.getValueType(), CCLo, LL, RL);
Hi = DAG.getNode(N->getOpcode(), DL, LH.getValueType(), CCHi, LH, RH);

// Add the new VSELECT nodes to the work list in case they need to be split
// again.
AddToWorklist(Lo.getNode());
AddToWorklist(Hi.getNode());

return DAG.getNode(ISD::CONCAT_VECTORS, DL, VT, Lo, Hi);
}

// Fold (vselect (build_vector all_ones), N1, N2) -> N1		// Fold (vselect (build_vector all_ones), N1, N2) -> N1
if (ISD::isBuildVectorAllOnes(N0.getNode()))		if (ISD::isBuildVectorAllOnes(N0.getNode()))
return N1;		return N1;
// Fold (vselect (build_vector all_zeros), N1, N2) -> N2		// Fold (vselect (build_vector all_zeros), N1, N2) -> N2
if (ISD::isBuildVectorAllZeros(N0.getNode()))		if (ISD::isBuildVectorAllZeros(N0.getNode()))
return N2;		return N2;

// The ConvertSelectToConcatVector function is assuming both the above		// The ConvertSelectToConcatVector function is assuming both the above
Show All 11 Lines

SDValue DAGCombiner::visitSELECT_CC(SDNode *N) {		SDValue DAGCombiner::visitSELECT_CC(SDNode *N) {
SDValue N0 = N->getOperand(0);		SDValue N0 = N->getOperand(0);
SDValue N1 = N->getOperand(1);		SDValue N1 = N->getOperand(1);
SDValue N2 = N->getOperand(2);		SDValue N2 = N->getOperand(2);
SDValue N3 = N->getOperand(3);		SDValue N3 = N->getOperand(3);
SDValue N4 = N->getOperand(4);		SDValue N4 = N->getOperand(4);
ISD::CondCode CC = cast<CondCodeSDNode>(N4)->get();		ISD::CondCode CC = cast<CondCodeSDNode>(N4)->get();

		efriedmaUnsubmitted Not Done Reply Inline Actions It seems like it would be simpler to produce the correct code in the first place, rather than vectorize the result which was scalarized by legalization. efriedma: It seems like it would be simpler to produce the correct code in the first place, rather than…
// fold select_cc lhs, rhs, x, x, cc -> x		// fold select_cc lhs, rhs, x, x, cc -> x
if (N2 == N3)		if (N2 == N3)
return N2;		return N2;

// Determine if the condition we're dealing with is constant		// Determine if the condition we're dealing with is constant
if (SDValue SCC = SimplifySetCC(getSetCCResultType(N0.getValueType()), N0, N1,		if (SDValue SCC = SimplifySetCC(getSetCCResultType(N0.getValueType()), N0, N1,
CC, SDLoc(N), false)) {		CC, SDLoc(N), false)) {
AddToWorklist(SCC.getNode());		AddToWorklist(SCC.getNode());
▲ Show 20 Lines • Show All 1,252 Lines • ▼ Show 20 Lines	SDValue DAGCombiner::visitSIGN_EXTEND_INREG(SDNode *N) {
// If the input is already sign extended, just drop the extension.		// If the input is already sign extended, just drop the extension.
if (DAG.ComputeNumSignBits(N0) >= VTBits-EVTBits+1)		if (DAG.ComputeNumSignBits(N0) >= VTBits-EVTBits+1)
return N0;		return N0;

// fold (sext_in_reg (sext_in_reg x, VT2), VT1) -> (sext_in_reg x, minVT) pt2		// fold (sext_in_reg (sext_in_reg x, VT2), VT1) -> (sext_in_reg x, minVT) pt2
if (N0.getOpcode() == ISD::SIGN_EXTEND_INREG &&		if (N0.getOpcode() == ISD::SIGN_EXTEND_INREG &&
EVT.bitsLT(cast<VTSDNode>(N0.getOperand(1))->getVT()))		EVT.bitsLT(cast<VTSDNode>(N0.getOperand(1))->getVT()))
return DAG.getNode(ISD::SIGN_EXTEND_INREG, SDLoc(N), VT,		return DAG.getNode(ISD::SIGN_EXTEND_INREG, SDLoc(N), VT,
N0.getOperand(0), N1);		N0.getOperand(0), N1);
		efriedmaUnsubmitted Not Done Reply Inline Actions This doesn't make any sense; you can't assume an arbitrary vector is all zeros or all ones. efriedma: This doesn't make any sense; you can't assume an arbitrary vector is all zeros or all ones.

// fold (sext_in_reg (sext x)) -> (sext x)		// fold (sext_in_reg (sext x)) -> (sext x)
// fold (sext_in_reg (aext x)) -> (sext x)		// fold (sext_in_reg (aext x)) -> (sext x)
// if x is small enough.		// if x is small enough.
if (N0.getOpcode() == ISD::SIGN_EXTEND \|\| N0.getOpcode() == ISD::ANY_EXTEND) {		if (N0.getOpcode() == ISD::SIGN_EXTEND \|\| N0.getOpcode() == ISD::ANY_EXTEND) {
SDValue N00 = N0.getOperand(0);		SDValue N00 = N0.getOperand(0);
if (N00.getScalarValueSizeInBits() <= EVTBits &&		if (N00.getScalarValueSizeInBits() <= EVTBits &&
(!LegalOperations \|\| TLI.isOperationLegal(ISD::SIGN_EXTEND, VT)))		(!LegalOperations \|\| TLI.isOperationLegal(ISD::SIGN_EXTEND, VT)))
▲ Show 20 Lines • Show All 8,508 Lines • Show Last 20 Lines

lib/CodeGen/SelectionDAG/LegalizeIntegerTypes.cpp

Show First 20 Lines • Show All 1,083 Lines • ▼ Show 20 Lines	return SDValue(DAG.UpdateNodeOperands(N,
GetPromotedInteger(N->getOperand(0))), 0);		GetPromotedInteger(N->getOperand(0))), 0);
}		}

SDValue DAGTypeLegalizer::PromoteIntOp_SELECT(SDNode *N, unsigned OpNo) {		SDValue DAGTypeLegalizer::PromoteIntOp_SELECT(SDNode *N, unsigned OpNo) {
assert(OpNo == 0 && "Only know how to promote the condition!");		assert(OpNo == 0 && "Only know how to promote the condition!");
SDValue Cond = N->getOperand(0);		SDValue Cond = N->getOperand(0);
EVT OpTy = N->getOperand(1).getValueType();		EVT OpTy = N->getOperand(1).getValueType();

		if (N->getOpcode() == ISD::VSELECT)
		if (SDValue Res = WidenVSELECTAndMask(N))
		return Res;

// Promote all the way up to the canonical SetCC type.		// Promote all the way up to the canonical SetCC type.
EVT OpVT = N->getOpcode() == ISD::SELECT ? OpTy.getScalarType() : OpTy;		EVT OpVT = N->getOpcode() == ISD::SELECT ? OpTy.getScalarType() : OpTy;
Cond = PromoteTargetBoolean(Cond, OpVT);		Cond = PromoteTargetBoolean(Cond, OpVT);

return SDValue(DAG.UpdateNodeOperands(N, Cond, N->getOperand(1),		return SDValue(DAG.UpdateNodeOperands(N, Cond, N->getOperand(1),
N->getOperand(2)), 0);		N->getOperand(2)), 0);
}		}

▲ Show 20 Lines • Show All 2,325 Lines • Show Last 20 Lines

lib/CodeGen/SelectionDAG/LegalizeTypes.h

Show First 20 Lines • Show All 713 Lines • ▼ Show 20 Lines	private:
SDValue WidenVecRes_EXTEND_VECTOR_INREG(SDNode* N);		SDValue WidenVecRes_EXTEND_VECTOR_INREG(SDNode* N);
SDValue WidenVecRes_EXTRACT_SUBVECTOR(SDNode* N);		SDValue WidenVecRes_EXTRACT_SUBVECTOR(SDNode* N);
SDValue WidenVecRes_INSERT_VECTOR_ELT(SDNode* N);		SDValue WidenVecRes_INSERT_VECTOR_ELT(SDNode* N);
SDValue WidenVecRes_LOAD(SDNode* N);		SDValue WidenVecRes_LOAD(SDNode* N);
SDValue WidenVecRes_MLOAD(MaskedLoadSDNode* N);		SDValue WidenVecRes_MLOAD(MaskedLoadSDNode* N);
SDValue WidenVecRes_MGATHER(MaskedGatherSDNode* N);		SDValue WidenVecRes_MGATHER(MaskedGatherSDNode* N);
SDValue WidenVecRes_SCALAR_TO_VECTOR(SDNode* N);		SDValue WidenVecRes_SCALAR_TO_VECTOR(SDNode* N);
SDValue WidenVecRes_SELECT(SDNode* N);		SDValue WidenVecRes_SELECT(SDNode* N);
		SDValue WidenVSELECTAndMask(SDNode *N);
SDValue WidenVecRes_SELECT_CC(SDNode* N);		SDValue WidenVecRes_SELECT_CC(SDNode* N);
SDValue WidenVecRes_SETCC(SDNode* N);		SDValue WidenVecRes_SETCC(SDNode* N);
SDValue WidenVecRes_UNDEF(SDNode *N);		SDValue WidenVecRes_UNDEF(SDNode *N);
SDValue WidenVecRes_VECTOR_SHUFFLE(ShuffleVectorSDNode *N);		SDValue WidenVecRes_VECTOR_SHUFFLE(ShuffleVectorSDNode *N);
SDValue WidenVecRes_VSETCC(SDNode* N);		SDValue WidenVecRes_VSETCC(SDNode* N);

SDValue WidenVecRes_Ternary(SDNode *N);		SDValue WidenVecRes_Ternary(SDNode *N);
SDValue WidenVecRes_Binary(SDNode *N);		SDValue WidenVecRes_Binary(SDNode *N);
▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines	void GenWidenVectorTruncStores(SmallVectorImpl<SDValue> &StChain,
StoreSDNode *ST);		StoreSDNode *ST);

/// Modifies a vector input (widen or narrows) to a vector of NVT. The		/// Modifies a vector input (widen or narrows) to a vector of NVT. The
/// input vector must have the same element type as NVT.		/// input vector must have the same element type as NVT.
/// When FillWithZeroes is "on" the vector will be widened with zeroes.		/// When FillWithZeroes is "on" the vector will be widened with zeroes.
/// By default, the vector will be widened with undefined values.		/// By default, the vector will be widened with undefined values.
SDValue ModifyToType(SDValue InOp, EVT NVT, bool FillWithZeroes = false);		SDValue ModifyToType(SDValue InOp, EVT NVT, bool FillWithZeroes = false);

		/// Return a mask of vector type MaskVT to replace InMask. Also adjust
		/// MaskVT to ToMaskVT if needed with vector extension or truncation.
		SDValue convertMask(SDValue InMask, EVT MaskVT, EVT ToMaskVT);

		/// Get the target mask VT, and widen if needed.
		EVT getSETCCWidenedResultTy(SDValue SetCC);

//===--------------------------------------------------------------------===//		//===--------------------------------------------------------------------===//
// Generic Splitting: LegalizeTypesGeneric.cpp		// Generic Splitting: LegalizeTypesGeneric.cpp
//===--------------------------------------------------------------------===//		//===--------------------------------------------------------------------===//

// Legalization methods which only use that the illegal type is split into two		// Legalization methods which only use that the illegal type is split into two
// not necessarily identical types. As such they can be used for splitting		// not necessarily identical types. As such they can be used for splitting
// vectors and expanding integers and floats.		// vectors and expanding integers and floats.

▲ Show 20 Lines • Show All 64 Lines • Show Last 20 Lines

lib/CodeGen/SelectionDAG/LegalizeTypesGeneric.cpp

	Show First 20 Lines • Show All 506 Lines • ▼ Show 20 Lines
	// little-endian).			// little-endian).

	void DAGTypeLegalizer::SplitRes_MERGE_VALUES(SDNode *N, unsigned ResNo,			void DAGTypeLegalizer::SplitRes_MERGE_VALUES(SDNode *N, unsigned ResNo,
	SDValue &Lo, SDValue &Hi) {			SDValue &Lo, SDValue &Hi) {
	SDValue Op = DisintegrateMERGE_VALUES(N, ResNo);			SDValue Op = DisintegrateMERGE_VALUES(N, ResNo);
	GetSplitOp(Op, Lo, Hi);			GetSplitOp(Op, Lo, Hi);
	}			}

	void DAGTypeLegalizer::SplitRes_SELECT(SDNode *N, SDValue &Lo,			static std::pair<SDValue, SDValue> SplitVSETCC(const SDNode *N,
	SDValue &Hi) {			SelectionDAG &DAG) {
				SDLoc DL(N);
				EVT LoVT, HiVT;
				std::tie(LoVT, HiVT) = DAG.GetSplitDestVTs(N->getValueType(0));

				// Split the inputs.
				SDValue Lo, Hi, LL, LH, RL, RH;
				std::tie(LL, LH) = DAG.SplitVectorOperand(N, 0);
				std::tie(RL, RH) = DAG.SplitVectorOperand(N, 1);

				Lo = DAG.getNode(N->getOpcode(), DL, LoVT, LL, RL, N->getOperand(2));
				Hi = DAG.getNode(N->getOpcode(), DL, HiVT, LH, RH, N->getOperand(2));

				return std::make_pair(Lo, Hi);
				}

				void DAGTypeLegalizer::SplitRes_SELECT(SDNode *N, SDValue &Lo, SDValue &Hi) {
	SDValue LL, LH, RL, RH, CL, CH;			SDValue LL, LH, RL, RH, CL, CH;
	SDLoc dl(N);			SDLoc dl(N);
	GetSplitOp(N->getOperand(1), LL, LH);			GetSplitOp(N->getOperand(1), LL, LH);
	GetSplitOp(N->getOperand(2), RL, RH);			GetSplitOp(N->getOperand(2), RL, RH);

	SDValue Cond = N->getOperand(0);			SDValue Cond = N->getOperand(0);
	CL = CH = Cond;			CL = CH = Cond;
	if (Cond.getValueType().isVector()) {			if (Cond.getValueType().isVector()) {
				if (SDValue Res = WidenVSELECTAndMask(N))
				std::tie(CL, CH) = DAG.SplitVector(Res->getOperand(0), dl);
				// It seems to improve code to generate two narrow SETCCs as opposed to
				// splitting a wide result vector.
				else if (Cond.getOpcode() == ISD::SETCC)
				std::tie(CL, CH) = SplitVSETCC(Cond.getNode(), DAG);
				efriedmaUnsubmitted Not Done Reply Inline Actions Does SplitVSETCC do something different from just calling SplitVector? Your patch doesn't show any changes to avx512-mask-op.ll. efriedma: Does SplitVSETCC do something different from just calling SplitVector? Your patch doesn't show…
				jonpaAuthorUnsubmitted Not Done Reply Inline Actions Yes, it creates two SETCCs of half the size, instead of splitting the result vector of the wide SETCC. There is now change to that test anymore. See my comment from March 1st above. jonpa: Yes, it creates two SETCCs of half the size, instead of splitting the result vector of the wide…
	// Check if there are already splitted versions of the vector available and			// Check if there are already splitted versions of the vector available and
	// use those instead of splitting the mask operand again.			// use those instead of splitting the mask operand again.
	if (getTypeAction(Cond.getValueType()) == TargetLowering::TypeSplitVector)			else if (getTypeAction(Cond.getValueType()) ==
				TargetLowering::TypeSplitVector)
	GetSplitVector(Cond, CL, CH);			GetSplitVector(Cond, CL, CH);
	else			else
	std::tie(CL, CH) = DAG.SplitVector(Cond, dl);			std::tie(CL, CH) = DAG.SplitVector(Cond, dl);
	}			}

	Lo = DAG.getNode(N->getOpcode(), dl, LL.getValueType(), CL, LL, RL);			Lo = DAG.getNode(N->getOpcode(), dl, LL.getValueType(), CL, LL, RL);
	Hi = DAG.getNode(N->getOpcode(), dl, LH.getValueType(), CH, LH, RH);			Hi = DAG.getNode(N->getOpcode(), dl, LH.getValueType(), CH, LH, RH);
	}			}
	Show All 20 Lines

lib/CodeGen/SelectionDAG/LegalizeVectorTypes.cpp

	Show First 20 Lines • Show All 2,858 Lines • ▼ Show 20 Lines
	}			}

	SDValue DAGTypeLegalizer::WidenVecRes_SCALAR_TO_VECTOR(SDNode *N) {			SDValue DAGTypeLegalizer::WidenVecRes_SCALAR_TO_VECTOR(SDNode *N) {
	EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));			EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));
	return DAG.getNode(ISD::SCALAR_TO_VECTOR, SDLoc(N),			return DAG.getNode(ISD::SCALAR_TO_VECTOR, SDLoc(N),
	WidenVT, N->getOperand(0));			WidenVT, N->getOperand(0));
	}			}

				// Return true if this is a node that could have two SETCCs as operands.
				static inline bool isLogicalMaskOp(unsigned Opcode) {
				switch (Opcode) {
				case ISD::AND:
				case ISD::OR:
				case ISD::XOR:
				return true;
				efriedmaUnsubmitted Not Done Reply Inline Actions Have you tried simplifying the handling of Cond using WidenTargetBoolean? efriedma: Have you tried simplifying the handling of Cond using WidenTargetBoolean?
				jonpaAuthorUnsubmitted Not Done Reply Inline Actions Calling WidenTargetBoolean() instead of making a new SETCC results in a CONCAT_VECTORS and SIGN_EXTEND nodes of the original SETCC. This is not good, because the SIGN_EXTEND never disappears. WidenTargetBoolean() and PromoteTargetBoolean() seem to have as the only behavior to extend the boolean vectors, which doesn't get folded properly by the SystemZ backend. It works very well for SystemZ to assume here that the VSELECT will be lowered to an instruction which produces a bitmask of the same type as its operands, but I guess this may be SystemZ specific, so would it be better to match the SIGN_EXTEND->SETCC in the SystemZ backend rather than trying to avoid it during type legalization? jonpa: Calling WidenTargetBoolean() instead of making a new SETCC results in a CONCAT_VECTORS and…
				}
				return false;
				efriedmaUnsubmitted Not Done Reply Inline Actions I still don't like that you're special-casing SETCC here... it isn't the only source of i1 vectors. efriedma: I still don't like that you're special-casing SETCC here... it isn't the only source of i1…
				jonpaAuthorUnsubmitted Not Done Reply Inline Actions If there is anything that really should be handled and commited at the same as the SETCC, please give more details. jonpa: If there is anything that really should be handled and commited at the same as the SETCC…
				efriedmaUnsubmitted Not Done Reply Inline Actions It would be nice to handle VSELECT(AND(SETCC, SETCC), X, Y). I can't think of anything else that's likely to come up frequently. efriedma: It would be nice to handle VSELECT(AND(SETCC, SETCC), X, Y). I can't think of anything else…
				}

				// This is used just for the assert in convertMask(). Check that this either
				// a SETCC or a previously handled SETCC by convertMask().
				static inline bool isSETCCorConvertedSETCC(SDValue N) {
				efriedmaUnsubmitted Not Done Reply Inline Actions Needs to be #ifndef NDEBUG to avoid warnings in Release mode. efriedma: Needs to be #ifndef NDEBUG to avoid warnings in Release mode.
				if (N.getOpcode() == ISD::EXTRACT_SUBVECTOR)
				N = N.getOperand(0);
				else if (N.getOpcode() == ISD::CONCAT_VECTORS) {
				for (unsigned i = 1; i < N->getNumOperands(); ++i)
				if (!N->getOperand(i)->isUndef())
				return false;
				N = N.getOperand(0);
				}

				if (N.getOpcode() == ISD::TRUNCATE)
				N = N.getOperand(0);
				else if (N.getOpcode() == ISD::SIGN_EXTEND)
				N = N.getOperand(0);

				return (N.getOpcode() == ISD::SETCC);
				}

				// Return a mask of vector type MaskVT to replace InMask. Also adjust MaskVT
				// to ToMaskVT if needed with vector extension or truncation.
				SDValue DAGTypeLegalizer::convertMask(SDValue InMask, EVT MaskVT,
				EVT ToMaskVT) {
				LLVMContext &Ctx = *DAG.getContext();

				// Currently a SETCC or a AND/OR/XOR with two SETCCs are handled.
				unsigned InMaskOpc = InMask->getOpcode();
				assert((InMaskOpc == ISD::SETCC \|\|
				(isLogicalMaskOp(InMaskOpc) &&
				isSETCCorConvertedSETCC(InMask->getOperand(0)) &&
				isSETCCorConvertedSETCC(InMask->getOperand(1)))) &&
				"Unexpected mask argument.");

				// Make a new Mask node, with a legal result VT.
				SmallVector<SDValue, 4> Ops;
				for (unsigned i = 0; i < InMask->getNumOperands(); ++i)
				Ops.push_back(InMask->getOperand(i));
				SDValue Mask = DAG.getNode(InMaskOpc, SDLoc(InMask), MaskVT, Ops);

				// If MaskVT has smaller or bigger elements than ToMaskVT, a vector sign
				// extend or truncate is needed.
				unsigned MaskScalarBits = MaskVT.getScalarSizeInBits();
				unsigned ToMaskScalBits = ToMaskVT.getScalarSizeInBits();
				if (MaskScalarBits < ToMaskScalBits) {
				EVT ExtVT = EVT::getVectorVT(Ctx, ToMaskVT.getVectorElementType(),
				MaskVT.getVectorNumElements());
				Mask = DAG.getNode(ISD::SIGN_EXTEND, SDLoc(Mask), ExtVT, Mask);
				} else if (MaskScalarBits > ToMaskScalBits) {
				EVT TruncVT = EVT::getVectorVT(Ctx, ToMaskVT.getVectorElementType(),
				MaskVT.getVectorNumElements());
				Mask = DAG.getNode(ISD::TRUNCATE, SDLoc(Mask), TruncVT, Mask);
				}

				assert(Mask->getValueType(0).getScalarSizeInBits() ==
				ToMaskVT.getScalarSizeInBits() &&
				"Mask should have the right element size by now.");

				// Adjust Mask to the right number of elements.
				unsigned CurrMaskNumEls = Mask->getValueType(0).getVectorNumElements();
				efriedmaUnsubmitted Done Reply Inline Actions Could you just perform the SIGN_EXTEND/TRUNCATE to match the scalar size, then EXTRACT_SUBVECTOR/CONCAT_SUBVECTORS to match the number of elements? The invariants involving the relationship between the number of elements and the scalar sizes of MaskVT and ToMaskVT are confusing at best. efriedma: Could you just perform the SIGN_EXTEND/TRUNCATE to match the scalar size, then…
				jonpaAuthorUnsubmitted Not Done Reply Inline Actions Yes, this seems better, thanks :-) jonpa: Yes, this seems better, thanks :-)
				if (CurrMaskNumEls > ToMaskVT.getVectorNumElements()) {
				MVT IdxTy = TLI.getVectorIdxTy(DAG.getDataLayout());
				SDValue ZeroIdx = DAG.getConstant(0, SDLoc(Mask), IdxTy);
				Mask = DAG.getNode(ISD::EXTRACT_SUBVECTOR, SDLoc(Mask), ToMaskVT, Mask,
				ZeroIdx);
				} else if (CurrMaskNumEls < ToMaskVT.getVectorNumElements()) {
				unsigned NumSubVecs = (ToMaskVT.getVectorNumElements() / CurrMaskNumEls);
				EVT SubVT = Mask->getValueType(0);
				SmallVector<SDValue, 16> SubConcatOps(NumSubVecs);
				SubConcatOps[0] = Mask;
				for (unsigned i = 1; i < NumSubVecs; ++i)
				SubConcatOps[i] = DAG.getUNDEF(SubVT);
				Mask =
				DAG.getNode(ISD::CONCAT_VECTORS, SDLoc(Mask), ToMaskVT, SubConcatOps);
				}

				assert((Mask->getValueType(0) == ToMaskVT) &&
				"A mask of ToMaskVT should have been produced by now.");

				return Mask;
				}

				// Get the target mask VT, and widen if needed.
				EVT DAGTypeLegalizer::getSETCCWidenedResultTy(SDValue SetCC) {
				assert(SetCC->getOpcode() == ISD::SETCC);
				LLVMContext &Ctx = *DAG.getContext();
				EVT MaskVT = getSetCCResultType(SetCC->getOperand(0).getValueType());
				if (getTypeAction(MaskVT) == TargetLowering::TypeWidenVector)
				MaskVT = TLI.getTypeToTransformTo(Ctx, MaskVT);
				return MaskVT;
				}

				// This method tries to handle VSELECT and its mask by legalizing operands
				// (which may require widening) and if needed adjusting the mask vector type
				// to match that of the VSELECT. Without it, many cases end up with
				// scalarization of the SETCC, with many unnecessary instructions.
				SDValue DAGTypeLegalizer::WidenVSELECTAndMask(SDNode *N) {
				LLVMContext &Ctx = *DAG.getContext();
				SDValue Cond = N->getOperand(0);

				if (N->getOpcode() != ISD::VSELECT)
				return SDValue();

				if (Cond->getOpcode() != ISD::SETCC && !isLogicalMaskOp(Cond->getOpcode()))
				return SDValue();

				// If this is a splitted VSELECT that was previously already handled, do
				// nothing.
				if (Cond->getValueType(0).getScalarSizeInBits() != 1)
				return SDValue();

				EVT VSelVT = N->getValueType(0);
				// Only handle vector types which are a power of 2.
				if (!isPowerOf2_64(VSelVT.getSizeInBits()))
				return SDValue();

				// Don't touch if this will be scalarized.
				EVT FinalVT = VSelVT;
				while (getTypeAction(FinalVT) == TargetLowering::TypeSplitVector)
				FinalVT = EVT::getVectorVT(Ctx, FinalVT.getVectorElementType(),
				FinalVT.getVectorNumElements() / 2);
				if (FinalVT.getVectorNumElements() == 1)
				return SDValue();

				// If there is support for an i1 vector mask, don't touch.
				if (Cond.getOpcode() == ISD::SETCC) {
				EVT SetCCOpVT = Cond->getOperand(0).getValueType();
				while (TLI.getTypeAction(Ctx, SetCCOpVT) != TargetLowering::TypeLegal)
				SetCCOpVT = TLI.getTypeToTransformTo(Ctx, SetCCOpVT);
				EVT SetCCResVT = getSetCCResultType(SetCCOpVT);
				if (SetCCResVT.getScalarSizeInBits() == 1)
				return SDValue();
				}

				// Get the VT and operands for VSELECT, and widen if needed.
				SDValue VSelOp1 = N->getOperand(1);
				SDValue VSelOp2 = N->getOperand(2);
				if (getTypeAction(VSelVT) == TargetLowering::TypeWidenVector) {
				VSelVT = TLI.getTypeToTransformTo(Ctx, VSelVT);
				VSelOp1 = GetWidenedVector(VSelOp1);
				VSelOp2 = GetWidenedVector(VSelOp2);
				}

				// The mask of the VSELECT should have integer elements.
				EVT ToMaskVT = VSelVT;
				if (!ToMaskVT.getScalarType().isInteger())
				ToMaskVT = ToMaskVT.changeVectorElementTypeToInteger();

				SDValue Mask;
				if (Cond->getOpcode() == ISD::SETCC) {
				EVT MaskVT = getSETCCWidenedResultTy(Cond);
				Mask = convertMask(Cond, MaskVT, ToMaskVT);
				} else if (isLogicalMaskOp(Cond->getOpcode()) &&
				Cond->getOperand(0).getOpcode() == ISD::SETCC &&
				Cond->getOperand(1).getOpcode() == ISD::SETCC) {
				// Cond is (AND/OR/XOR (SETCC, SETCC))
				SDValue SETCC0 = Cond->getOperand(0);
				SDValue SETCC1 = Cond->getOperand(1);
				EVT VT0 = getSETCCWidenedResultTy(SETCC0);
				EVT VT1 = getSETCCWidenedResultTy(SETCC1);
				unsigned ScalarBits0 = VT0.getScalarSizeInBits();
				unsigned ScalarBits1 = VT1.getScalarSizeInBits();
				unsigned ScalarBits_ToMask = ToMaskVT.getScalarSizeInBits();
				EVT MaskVT;
				// If the two SETCCs have different VTs, either extend/truncate one of
				// them to the other "towards" ToMaskVT, or truncate one and extend the
				// other to ToMaskVT.
				if (ScalarBits0 != ScalarBits1) {
				EVT NarrowVT = ((ScalarBits0 < ScalarBits1) ? VT0 : VT1);
				EVT WideVT = ((NarrowVT == VT0) ? VT1 : VT0);
				if (ScalarBits_ToMask >= WideVT.getScalarSizeInBits())
				MaskVT = WideVT;
				else if (ScalarBits_ToMask <= NarrowVT.getScalarSizeInBits())
				MaskVT = NarrowVT;
				else
				MaskVT = ToMaskVT;
				} else
				// If the two SETCCs have the same VT, don't change it.
				MaskVT = VT0;

				// Make new SETCCs and logical nodes.
				SETCC0 = convertMask(SETCC0, VT0, MaskVT);
				SETCC1 = convertMask(SETCC1, VT1, MaskVT);
				Cond = DAG.getNode(Cond->getOpcode(), SDLoc(Cond), MaskVT, SETCC0, SETCC1);

				// Convert the logical op for VSELECT if needed.
				Mask = convertMask(Cond, MaskVT, ToMaskVT);
				} else
				return SDValue();

				return DAG.getNode(ISD::VSELECT, SDLoc(N), VSelVT, Mask, VSelOp1, VSelOp2);
				}

	SDValue DAGTypeLegalizer::WidenVecRes_SELECT(SDNode *N) {			SDValue DAGTypeLegalizer::WidenVecRes_SELECT(SDNode *N) {
	EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));			EVT WidenVT = TLI.getTypeToTransformTo(*DAG.getContext(), N->getValueType(0));
	unsigned WidenNumElts = WidenVT.getVectorNumElements();			unsigned WidenNumElts = WidenVT.getVectorNumElements();

	SDValue Cond1 = N->getOperand(0);			SDValue Cond1 = N->getOperand(0);
	EVT CondVT = Cond1.getValueType();			EVT CondVT = Cond1.getValueType();
	if (CondVT.isVector()) {			if (CondVT.isVector()) {
				if (SDValue Res = WidenVSELECTAndMask(N))
				return Res;

	EVT CondEltVT = CondVT.getVectorElementType();			EVT CondEltVT = CondVT.getVectorElementType();
	EVT CondWidenVT = EVT::getVectorVT(*DAG.getContext(),			EVT CondWidenVT = EVT::getVectorVT(*DAG.getContext(),
	CondEltVT, WidenNumElts);			CondEltVT, WidenNumElts);
	if (getTypeAction(CondVT) == TargetLowering::TypeWidenVector)			if (getTypeAction(CondVT) == TargetLowering::TypeWidenVector)
	Cond1 = GetWidenedVector(Cond1);			Cond1 = GetWidenedVector(Cond1);

	// If we have to split the condition there is no point in widening the			// If we have to split the condition there is no point in widening the
	// select. This would result in an cycle of widening the select ->			// select. This would result in an cycle of widening the select ->
	▲ Show 20 Lines • Show All 909 Lines • Show Last 20 Lines

test/CodeGen/ARM/vuzp.ll

	Show First 20 Lines • Show All 312 Lines • ▼ Show 20 Lines
	entry:			entry:
	%tmp1 = load <2 x i32>, <2 x i32>* %A			%tmp1 = load <2 x i32>, <2 x i32>* %A
	%tmp2 = load <2 x i32>, <2 x i32>* %B			%tmp2 = load <2 x i32>, <2 x i32>* %B
	%0 = shufflevector <2 x i32> %tmp1, <2 x i32> %tmp2, <4 x i32> <i32 1, i32 3, i32 0, i32 2>			%0 = shufflevector <2 x i32> %tmp1, <2 x i32> %tmp2, <4 x i32> <i32 1, i32 3, i32 0, i32 2>
	store <4 x i32> %0, <4 x i32>* %C			store <4 x i32> %0, <4 x i32>* %C
	ret void			ret void
	}			}

	define <8 x i8> @vuzp_trunc(<8 x i8> %in0, <8 x i8> %in1, <8 x i32> %cmp0, <8 x i32> %cmp1) {			define <8 x i8> @cmpsel_trunc(<8 x i8> %in0, <8 x i8> %in1, <8 x i32> %cmp0, <8 x i32> %cmp1) {
	; In order to create the select we need to truncate the vcgt result from a vector of i32 to a vector of i8.			; In order to create the select we need to truncate the vcgt result from a vector of i32 to a vector of i8.
	; This results in a build_vector with mismatched types. We will generate two vmovn.i32 instructions to			; This results in a build_vector with mismatched types. We will generate two vmovn.i32 instructions to
	; truncate from i32 to i16 and one vuzp to perform the final truncation for i8.			; truncate from i32 to i16 and one vmovn.i16 to perform the final truncation for i8.
	; CHECK-LABEL: vuzp_trunc:			; CHECK-LABEL: cmpsel_trunc:
				RKSimonUnsubmitted Not Done Reply Inline Actions This comment and the test name need updating as vuzp isn't used anymore. RKSimon: This comment and the test name need updating as vuzp isn't used anymore.
	; CHECK: @ BB#0:			; CHECK: @ BB#0:
	; CHECK-NEXT: .save {r4, r5, r11, lr}			; CHECK-NEXT: .save {r4, r5, r11, lr}
	; CHECK-NEXT: push {r4, r5, r11, lr}			; CHECK-NEXT: push {r4, r5, r11, lr}
	; CHECK-NEXT: add r12, sp, #48
	; CHECK-NEXT: add lr, sp, #16
	; CHECK-NEXT: add r4, sp, #64			; CHECK-NEXT: add r4, sp, #64
	; CHECK-NEXT: add r5, sp, #32			; CHECK-NEXT: add r5, sp, #32
				; CHECK-NEXT: add r12, sp, #48
				; CHECK-NEXT: add lr, sp, #16
	; CHECK-NEXT: vld1.64 {d16, d17}, [r5]			; CHECK-NEXT: vld1.64 {d16, d17}, [r5]
	; CHECK-NEXT: vld1.64 {d18, d19}, [r4]			; CHECK-NEXT: vld1.64 {d18, d19}, [r4]
	; CHECK-NEXT: vld1.64 {d20, d21}, [lr]			; CHECK-NEXT: vld1.64 {d20, d21}, [lr]
	; CHECK-NEXT: vld1.64 {d22, d23}, [r12]			; CHECK-NEXT: vld1.64 {d22, d23}, [r12]
	; CHECK-NEXT: vcgt.u32 q8, q9, q8			; CHECK-NEXT: vcgt.u32 q8, q9, q8
	; CHECK-NEXT: vcgt.u32 q9, q11, q10			; CHECK-NEXT: vcgt.u32 q9, q11, q10
	; CHECK-NEXT: vmovn.i32 d16, q8			; CHECK-NEXT: vmovn.i32 d17, q8
	; CHECK-NEXT: vmovn.i32 d17, q9			; CHECK-NEXT: vmovn.i32 d16, q9
	; CHECK-NEXT: vmov.i8 d18, #0x7
	; CHECK-NEXT: vmov d19, r0, r1
	; CHECK-NEXT: vuzp.8 d17, d16
	; CHECK-NEXT: vneg.s8 d16, d18
	; CHECK-NEXT: vshl.i8 d17, d17, #7
	; CHECK-NEXT: vmov d18, r2, r3			; CHECK-NEXT: vmov d18, r2, r3
	; CHECK-NEXT: vshl.s8 d16, d17, d16			; CHECK-NEXT: vmov d19, r0, r1
				; CHECK-NEXT: vmovn.i16 d16, q8
	; CHECK-NEXT: vbsl d16, d19, d18			; CHECK-NEXT: vbsl d16, d19, d18
	; CHECK-NEXT: vmov r0, r1, d16			; CHECK-NEXT: vmov r0, r1, d16
	; CHECK-NEXT: pop {r4, r5, r11, lr}			; CHECK-NEXT: pop {r4, r5, r11, lr}
	; CHECK-NEXT: mov pc, lr			; CHECK-NEXT: mov pc, lr
	%c = icmp ult <8 x i32> %cmp0, %cmp1			%c = icmp ult <8 x i32> %cmp0, %cmp1
	%res = select <8 x i1> %c, <8 x i8> %in0, <8 x i8> %in1			%res = select <8 x i1> %c, <8 x i8> %in0, <8 x i8> %in1
	ret <8 x i8> %res			ret <8 x i8> %res
	}			}
	▲ Show 20 Lines • Show All 216 Lines • Show Last 20 Lines

test/CodeGen/NVPTX/f16x2-instructions.ll

Show First 20 Lines • Show All 416 Lines • ▼ Show 20 Lines	define <2 x half> @test_select_cc(<2 x half> %a, <2 x half> %b, <2 x half> %c, <2 x half> %d) #0 {
ret <2 x half> %r		ret <2 x half> %r
}		}

; CHECK-LABEL: test_select_cc_f32_f16(		; CHECK-LABEL: test_select_cc_f32_f16(
; CHECK-DAG: ld.param.v2.f32 {[[A0:%f[0-9]+]], [[A1:%f[0-9]+]]}, [test_select_cc_f32_f16_param_0];		; CHECK-DAG: ld.param.v2.f32 {[[A0:%f[0-9]+]], [[A1:%f[0-9]+]]}, [test_select_cc_f32_f16_param_0];
; CHECK-DAG: ld.param.v2.f32 {[[B0:%f[0-9]+]], [[B1:%f[0-9]+]]}, [test_select_cc_f32_f16_param_1];		; CHECK-DAG: ld.param.v2.f32 {[[B0:%f[0-9]+]], [[B1:%f[0-9]+]]}, [test_select_cc_f32_f16_param_1];
; CHECK-DAG: ld.param.b32 [[C:%hh[0-9]+]], [test_select_cc_f32_f16_param_2];		; CHECK-DAG: ld.param.b32 [[C:%hh[0-9]+]], [test_select_cc_f32_f16_param_2];
; CHECK-DAG: ld.param.b32 [[D:%hh[0-9]+]], [test_select_cc_f32_f16_param_3];		; CHECK-DAG: ld.param.b32 [[D:%hh[0-9]+]], [test_select_cc_f32_f16_param_3];
; CHECK-DAG: mov.b32 {[[C0:%h[0-9]+]], [[C1:%h[0-9]+]]}, [[C]]
; CHECK-DAG: mov.b32 {[[D0:%h[0-9]+]], [[D1:%h[0-9]+]]}, [[D]]
traUnsubmitted Done Reply Inline Actions I think these are still needed (see cvt.f32... below) and should become CHECK-NOF16-DAG now. tra: I think these are still needed (see cvt.f32... below) and should become CHECK-NOF16-DAG now.
jonpaAuthorUnsubmitted Not Done Reply Inline Actions Is this looking ok? jonpa: Is this looking ok?
traUnsubmitted Not Done Reply Inline Actions LGTM. tra: LGTM.
;		;
; TODO: Currently DAG combiner scalarizes setcc before we can lower it to setp.f16x2.		; CHECK-F16: setp.neu.f16x2 [[P0:%p[0-9]+]]\|[[P1:%p[0-9]+]], [[C]], [[D]]
; We'd like to see this instruction:		; CHECK-NOF16-DAG: mov.b32 {[[C0:%h[0-9]+]], [[C1:%h[0-9]+]]}, [[C]]
; CHECK-F16-NOTYET: setp.neu.f16x2 [[P0:%p[0-9]+]]\|[[P1:%p[0-9]+]], [[C]], [[D]]		; CHECK-NOF16-DAG: mov.b32 {[[D0:%h[0-9]+]], [[D1:%h[0-9]+]]}, [[D]]
; But we end up with a pair of scalar instances of it instead:
; CHECK-F16-DAG: setp.neu.f16 [[P0:%p[0-9]+]], [[C0]], [[D0]]
; CHECK-F16-DAG: setp.neu.f16 [[P1:%p[0-9]+]], [[C1]], [[D1]]


; CHECK-NOF16-DAG: cvt.f32.f16 [[DF0:%f[0-9]+]], [[D0]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[DF0:%f[0-9]+]], [[D0]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[CF0:%f[0-9]+]], [[C0]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[CF0:%f[0-9]+]], [[C0]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[DF1:%f[0-9]+]], [[D1]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[DF1:%f[0-9]+]], [[D1]];
; CHECK-NOF16-DAG: cvt.f32.f16 [[CF1:%f[0-9]+]], [[C1]];		; CHECK-NOF16-DAG: cvt.f32.f16 [[CF1:%f[0-9]+]], [[C1]];
; CHECK-NOF16-DAG: setp.neu.f32 [[P0:%p[0-9]+]], [[CF0]], [[DF0]]		; CHECK-NOF16-DAG: setp.neu.f32 [[P0:%p[0-9]+]], [[CF0]], [[DF0]]
; CHECK-NOF16-DAG: setp.neu.f32 [[P1:%p[0-9]+]], [[CF1]], [[DF1]]		; CHECK-NOF16-DAG: setp.neu.f32 [[P1:%p[0-9]+]], [[CF1]], [[DF1]]
;		;
; CHECK-DAG: selp.f32 [[R0:%f[0-9]+]], [[A0]], [[B0]], [[P0]];		; CHECK-DAG: selp.f32 [[R0:%f[0-9]+]], [[A0]], [[B0]], [[P0]];
▲ Show 20 Lines • Show All 990 Lines • Show Last 20 Lines

test/CodeGen/SystemZ/vec-cmp-cmp-logic-select.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; Test that a select with a logic combination of two compares do not produce
				; any unnecessary pack /unpack / shift instructions. And / Or / Xor are tested.
				;
				; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z13 \| FileCheck %s

				define <2 x i8> @fun0(<2 x i8> %val1, <2 x i8> %val2, <2 x i8> %val3, <2 x i8> %val4,
				; CHECK-LABEL: fun0:
				; CHECK: vceqb %v0, %v28, %v30
				; CHECK-NEXT: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i8> %val5, <2 x i8> %val6) {
				%cmp0 = icmp eq <2 x i8> %val1, %val2
				%cmp1 = icmp eq <2 x i8> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i8> %val5, <2 x i8> %val6
				ret <2 x i8> %sel

				}

				define <2 x i16> @fun1(<2 x i8> %val1, <2 x i8> %val2, <2 x i8> %val3, <2 x i8> %val4,
				; CHECK-LABEL: fun1:
				; CHECK: vceqb %v0, %v28, %v30
				; CHECK-NEXT: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i8> %val1, %val2
				%cmp1 = icmp eq <2 x i8> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x i8> @fun2(<2 x i8> %val1, <2 x i8> %val2, <2 x i16> %val3, <2 x i16> %val4,
				; CHECK-LABEL: fun2:
				; CHECK: vceqh %v1, %v28, %v30
				; CHECK-NEXT: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vpkh %v1, %v1, %v1
				; CHECK-NEXT: vn %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i8> %val5, <2 x i8> %val6) {
				%cmp0 = icmp eq <2 x i8> %val1, %val2
				%cmp1 = icmp eq <2 x i16> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i8> %val5, <2 x i8> %val6
				ret <2 x i8> %sel

				}

				define <2 x i32> @fun3(<2 x i8> %val1, <2 x i8> %val2, <2 x i32> %val3, <2 x i32> %val4,
				; CHECK-LABEL: fun3:
				; CHECK: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vceqf %v0, %v28, %v30
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i32> %val5, <2 x i32> %val6) {
				%cmp0 = icmp eq <2 x i8> %val1, %val2
				%cmp1 = icmp eq <2 x i32> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i32> %val5, <2 x i32> %val6
				ret <2 x i32> %sel

				}

				define <2 x i32> @fun4(<2 x i8> %val1, <2 x i8> %val2, <2 x i64> %val3, <2 x i64> %val4,
				; CHECK-LABEL: fun4:
				; CHECK: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vceqg %v0, %v28, %v30
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vpkg %v0, %v0, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i32> %val5, <2 x i32> %val6) {
				%cmp0 = icmp eq <2 x i8> %val1, %val2
				%cmp1 = icmp eq <2 x i64> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i32> %val5, <2 x i32> %val6
				ret <2 x i32> %sel

				}

				define <2 x i16> @fun5(<2 x i8> %val1, <2 x i8> %val2, <2 x float> %val3, <2 x float> %val4,
				; CHECK-LABEL: fun5:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i8> %val1, %val2
				%cmp1 = fcmp ogt <2 x float> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x i64> @fun6(<2 x i8> %val1, <2 x i8> %val2, <2 x double> %val3, <2 x double> %val4,
				; CHECK-LABEL: fun6:
				; CHECK: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v28, %v30
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i64> %val5, <2 x i64> %val6) {
				%cmp0 = icmp eq <2 x i8> %val1, %val2
				%cmp1 = fcmp ogt <2 x double> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i64> %val5, <2 x i64> %val6
				ret <2 x i64> %sel

				}

				define <2 x i8> @fun7(<2 x i16> %val1, <2 x i16> %val2, <2 x i16> %val3, <2 x i16> %val4,
				; CHECK-LABEL: fun7:
				; CHECK: vceqh %v0, %v28, %v30
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vpkh %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i8> %val5, <2 x i8> %val6) {
				%cmp0 = icmp eq <2 x i16> %val1, %val2
				%cmp1 = icmp eq <2 x i16> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i8> %val5, <2 x i8> %val6
				ret <2 x i8> %sel

				}

				define <2 x i16> @fun8(<2 x i16> %val1, <2 x i16> %val2, <2 x i16> %val3, <2 x i16> %val4,
				; CHECK-LABEL: fun8:
				; CHECK: vceqh %v0, %v28, %v30
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i16> %val1, %val2
				%cmp1 = icmp eq <2 x i16> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x i32> @fun9(<2 x i16> %val1, <2 x i16> %val2, <2 x i16> %val3, <2 x i16> %val4,
				; CHECK-LABEL: fun9:
				; CHECK: vceqh %v0, %v28, %v30
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i32> %val5, <2 x i32> %val6) {
				%cmp0 = icmp eq <2 x i16> %val1, %val2
				%cmp1 = icmp eq <2 x i16> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i32> %val5, <2 x i32> %val6
				ret <2 x i32> %sel

				}

				define <2 x i8> @fun10(<2 x i16> %val1, <2 x i16> %val2, <2 x i32> %val3, <2 x i32> %val4,
				; CHECK-LABEL: fun10:
				; CHECK: vceqf %v1, %v28, %v30
				; CHECK-NEXT: vceqh %v0, %v24, %v26
				; CHECK-NEXT: vpkf %v1, %v1, %v1
				; CHECK-NEXT: vn %v0, %v0, %v1
				; CHECK-NEXT: vpkh %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i8> %val5, <2 x i8> %val6) {
				%cmp0 = icmp eq <2 x i16> %val1, %val2
				%cmp1 = icmp eq <2 x i32> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i8> %val5, <2 x i8> %val6
				ret <2 x i8> %sel

				}

				define <2 x i8> @fun11(<2 x i16> %val1, <2 x i16> %val2, <2 x i64> %val3, <2 x i64> %val4,
				; CHECK-LABEL: fun11:
				; CHECK: larl %r1, .LCPI11_0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vceqg %v0, %v28, %v30
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vpkh %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i8> %val5, <2 x i8> %val6) {
				%cmp0 = icmp eq <2 x i16> %val1, %val2
				%cmp1 = icmp eq <2 x i64> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i8> %val5, <2 x i8> %val6
				ret <2 x i8> %sel

				}

				define <2 x double> @fun12(<2 x i16> %val1, <2 x i16> %val2, <2 x float> %val3, <2 x float> %val4,
				; CHECK-LABEL: fun12:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x double> %val5, <2 x double> %val6) {
				%cmp0 = icmp eq <2 x i16> %val1, %val2
				%cmp1 = fcmp ogt <2 x float> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x double> %val5, <2 x double> %val6
				ret <2 x double> %sel

				}

				define <2 x i16> @fun13(<2 x i16> %val1, <2 x i16> %val2, <2 x double> %val3, <2 x double> %val4,
				; CHECK-LABEL: fun13:
				; CHECK: larl %r1, .LCPI13_0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vfchdb %v0, %v28, %v30
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i16> %val1, %val2
				%cmp1 = fcmp ogt <2 x double> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x i16> @fun14(<2 x i32> %val1, <2 x i32> %val2, <2 x i32> %val3, <2 x i32> %val4,
				; CHECK-LABEL: fun14:
				; CHECK: vceqf %v0, %v28, %v30
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i32> %val1, %val2
				%cmp1 = icmp eq <2 x i32> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x i32> @fun15(<2 x i32> %val1, <2 x i32> %val2, <2 x i32> %val3, <2 x i32> %val4,
				; CHECK-LABEL: fun15:
				; CHECK: vceqf %v0, %v28, %v30
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i32> %val5, <2 x i32> %val6) {
				%cmp0 = icmp eq <2 x i32> %val1, %val2
				%cmp1 = icmp eq <2 x i32> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i32> %val5, <2 x i32> %val6
				ret <2 x i32> %sel

				}

				define <2 x i64> @fun16(<2 x i32> %val1, <2 x i32> %val2, <2 x i32> %val3, <2 x i32> %val4,
				; CHECK-LABEL: fun16:
				; CHECK: vceqf %v0, %v28, %v30
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i64> %val5, <2 x i64> %val6) {
				%cmp0 = icmp eq <2 x i32> %val1, %val2
				%cmp1 = icmp eq <2 x i32> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i64> %val5, <2 x i64> %val6
				ret <2 x i64> %sel

				}

				define <2 x i64> @fun17(<2 x i32> %val1, <2 x i32> %val2, <2 x i64> %val3, <2 x i64> %val4,
				; CHECK-LABEL: fun17:
				; CHECK: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vceqg %v0, %v28, %v30
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i64> %val5, <2 x i64> %val6) {
				%cmp0 = icmp eq <2 x i32> %val1, %val2
				%cmp1 = icmp eq <2 x i64> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i64> %val5, <2 x i64> %val6
				ret <2 x i64> %sel

				}

				define <2 x i16> @fun18(<2 x i32> %val1, <2 x i32> %val2, <2 x float> %val3, <2 x float> %val4,
				; CHECK-LABEL: fun18:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i32> %val1, %val2
				%cmp1 = fcmp ogt <2 x float> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x float> @fun19(<2 x i32> %val1, <2 x i32> %val2, <2 x double> %val3, <2 x double> %val4,
				; CHECK-LABEL: fun19:
				; CHECK: vfchdb %v1, %v28, %v30
				; CHECK-NEXT: vceqf %v0, %v24, %v26
				; CHECK-NEXT: vpkg %v1, %v1, %v1
				; CHECK-NEXT: vn %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x float> %val5, <2 x float> %val6) {
				%cmp0 = icmp eq <2 x i32> %val1, %val2
				%cmp1 = fcmp ogt <2 x double> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x float> %val5, <2 x float> %val6
				ret <2 x float> %sel

				}

				define <2 x i16> @fun20(<2 x i64> %val1, <2 x i64> %val2, <2 x i64> %val3, <2 x i64> %val4,
				; CHECK-LABEL: fun20:
				; CHECK: vceqg %v0, %v28, %v30
				; CHECK-NEXT: vceqg %v1, %v24, %v26
				; CHECK-NEXT: larl %r1, .LCPI20_0
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i64> %val1, %val2
				%cmp1 = icmp eq <2 x i64> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x i64> @fun21(<2 x i64> %val1, <2 x i64> %val2, <2 x float> %val3, <2 x float> %val4,
				; CHECK-LABEL: fun21:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vceqg %v1, %v24, %v26
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i64> %val5, <2 x i64> %val6) {
				%cmp0 = icmp eq <2 x i64> %val1, %val2
				%cmp1 = fcmp ogt <2 x float> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i64> %val5, <2 x i64> %val6
				ret <2 x i64> %sel

				}

				define <2 x i16> @fun22(<2 x i64> %val1, <2 x i64> %val2, <2 x double> %val3, <2 x double> %val4,
				; CHECK-LABEL: fun22:
				; CHECK: vfchdb %v0, %v28, %v30
				; CHECK-NEXT: vceqg %v1, %v24, %v26
				; CHECK-NEXT: larl %r1, .LCPI22_0
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i64> %val1, %val2
				%cmp1 = fcmp ogt <2 x double> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x float> @fun23(<2 x float> %val1, <2 x float> %val2, <2 x float> %val3, <2 x float> %val4,
				; CHECK-LABEL: fun23:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vmrhf %v3, %v24, %v24
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v26, %v26
				; CHECK-NEXT: vmrlf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v26, %v26
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x float> %val5, <2 x float> %val6) {
				%cmp0 = fcmp ogt <2 x float> %val1, %val2
				%cmp1 = fcmp ogt <2 x float> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x float> %val5, <2 x float> %val6
				ret <2 x float> %sel

				}

				define <2 x i32> @fun24(<2 x float> %val1, <2 x float> %val2, <2 x double> %val3, <2 x double> %val4,
				; CHECK-LABEL: fun24:
				; CHECK: vmrlf %v0, %v26, %v26
				; CHECK-NEXT: vmrlf %v1, %v24, %v24
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v26, %v26
				; CHECK-NEXT: vmrhf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vfchdb %v1, %v28, %v30
				; CHECK-NEXT: vpkg %v1, %v1, %v1
				; CHECK-NEXT: vn %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i32> %val5, <2 x i32> %val6) {
				%cmp0 = fcmp ogt <2 x float> %val1, %val2
				%cmp1 = fcmp ogt <2 x double> %val3, %val4
				%and = and <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i32> %val5, <2 x i32> %val6
				ret <2 x i32> %sel

				}

				define <4 x i16> @fun25(<4 x i32> %val1, <4 x i32> %val2, <4 x i32> %val3, <4 x i32> %val4,
				; CHECK-LABEL: fun25:
				; CHECK: vceqf %v0, %v28, %v30
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x i16> %val5, <4 x i16> %val6) {
				%cmp0 = icmp eq <4 x i32> %val1, %val2
				%cmp1 = icmp eq <4 x i32> %val3, %val4
				%and = and <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i16> %val5, <4 x i16> %val6
				ret <4 x i16> %sel

				}

				define <4 x i64> @fun26(<4 x i32> %val1, <4 x i32> %val2, <4 x i32> %val3, <4 x i32> %val4,
				; CHECK-LABEL: fun26:
				; CHECK: vceqf %v0, %v28, %v30
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v29, %v1
				; CHECK-NEXT: vsel %v26, %v27, %v31, %v0
				; CHECK-NEXT: br %r14
				<4 x i64> %val5, <4 x i64> %val6) {
				%cmp0 = icmp eq <4 x i32> %val1, %val2
				%cmp1 = icmp eq <4 x i32> %val3, %val4
				%and = and <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i64> %val5, <4 x i64> %val6
				ret <4 x i64> %sel

				}

				define <4 x i32> @fun27(<4 x i32> %val1, <4 x i32> %val2, <4 x i64> %val3, <4 x i64> %val4,
				; CHECK-LABEL: fun27:
				; CHECK: vceqg %v0, %v30, %v27
				; CHECK-NEXT: vceqg %v1, %v28, %v25
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v29, %v31, %v0
				; CHECK-NEXT: br %r14
				<4 x i32> %val5, <4 x i32> %val6) {
				%cmp0 = icmp eq <4 x i32> %val1, %val2
				%cmp1 = icmp eq <4 x i64> %val3, %val4
				%and = and <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i32> %val5, <4 x i32> %val6
				ret <4 x i32> %sel

				}

				define <4 x i16> @fun28(<4 x i32> %val1, <4 x i32> %val2, <4 x float> %val3, <4 x float> %val4,
				; CHECK-LABEL: fun28:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x i16> %val5, <4 x i16> %val6) {
				%cmp0 = icmp eq <4 x i32> %val1, %val2
				%cmp1 = fcmp ogt <4 x float> %val3, %val4
				%and = and <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i16> %val5, <4 x i16> %val6
				ret <4 x i16> %sel

				}

				define <4 x i8> @fun29(<4 x i32> %val1, <4 x i32> %val2, <4 x double> %val3, <4 x double> %val4,
				; CHECK-LABEL: fun29:
				; CHECK: vfchdb %v0, %v30, %v27
				; CHECK-NEXT: vfchdb %v1, %v28, %v25
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: larl %r1, .LCPI29_0
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v29, %v31, %v0
				; CHECK-NEXT: br %r14
				<4 x i8> %val5, <4 x i8> %val6) {
				%cmp0 = icmp eq <4 x i32> %val1, %val2
				%cmp1 = fcmp ogt <4 x double> %val3, %val4
				%and = and <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i8> %val5, <4 x i8> %val6
				ret <4 x i8> %sel

				}

				define <4 x i32> @fun30(<4 x i64> %val1, <4 x i64> %val2, <4 x i64> %val3, <4 x i64> %val4,
				; CHECK-LABEL: fun30:
				; CHECK: vceqg %v0, %v27, %v31
				; CHECK-NEXT: vceqg %v1, %v26, %v30
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vceqg %v1, %v25, %v29
				; CHECK-NEXT: vceqg %v2, %v24, %v28
				; CHECK-NEXT: vn %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<4 x i32> %val5, <4 x i32> %val6) {
				%cmp0 = icmp eq <4 x i64> %val1, %val2
				%cmp1 = icmp eq <4 x i64> %val3, %val4
				%and = and <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i32> %val5, <4 x i32> %val6
				ret <4 x i32> %sel

				}

				define <4 x i64> @fun31(<4 x i64> %val1, <4 x i64> %val2, <4 x i64> %val3, <4 x i64> %val4,
				; CHECK-LABEL: fun31:
				; CHECK: vceqg %v0, %v25, %v29
				; CHECK-NEXT: vceqg %v1, %v24, %v28
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: vceqg %v0, %v27, %v31
				; CHECK-NEXT: vceqg %v1, %v26, %v30
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<4 x i64> %val5, <4 x i64> %val6) {
				%cmp0 = icmp eq <4 x i64> %val1, %val2
				%cmp1 = icmp eq <4 x i64> %val3, %val4
				%and = and <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i64> %val5, <4 x i64> %val6
				ret <4 x i64> %sel

				}

				define <4 x i64> @fun32(<4 x i64> %val1, <4 x i64> %val2, <4 x float> %val3, <4 x float> %val4,
				; CHECK-LABEL: fun32:
				; CHECK: vmrlf %v0, %v27, %v27
				; CHECK-NEXT: vmrlf %v1, %v25, %v25
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v27, %v27
				; CHECK-NEXT: vmrhf %v2, %v25, %v25
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vceqg %v2, %v24, %v28
				; CHECK-NEXT: vn %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v29, %v2, %v1
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vceqg %v1, %v26, %v30
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vsel %v26, %v31, %v1, %v0
				; CHECK-NEXT: br %r14
				<4 x i64> %val5, <4 x i64> %val6) {
				%cmp0 = icmp eq <4 x i64> %val1, %val2
				%cmp1 = fcmp ogt <4 x float> %val3, %val4
				%and = and <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i64> %val5, <4 x i64> %val6
				ret <4 x i64> %sel

				}

				define <4 x float> @fun33(<4 x i64> %val1, <4 x i64> %val2, <4 x double> %val3, <4 x double> %val4,
				; CHECK-LABEL: fun33:
				; CHECK: vfchdb %v0, %v27, %v31
				; CHECK-NEXT: vceqg %v1, %v26, %v30
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vfchdb %v1, %v25, %v29
				; CHECK-NEXT: vceqg %v2, %v24, %v28
				; CHECK-NEXT: vn %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<4 x float> %val5, <4 x float> %val6) {
				%cmp0 = icmp eq <4 x i64> %val1, %val2
				%cmp1 = fcmp ogt <4 x double> %val3, %val4
				%and = and <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x float> %val5, <4 x float> %val6
				ret <4 x float> %sel

				}

				define <4 x i16> @fun34(<4 x float> %val1, <4 x float> %val2, <4 x float> %val3, <4 x float> %val4,
				; CHECK-LABEL: fun34:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vmrhf %v3, %v24, %v24
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v26, %v26
				; CHECK-NEXT: vmrlf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v26, %v26
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x i16> %val5, <4 x i16> %val6) {
				%cmp0 = fcmp ogt <4 x float> %val1, %val2
				%cmp1 = fcmp ogt <4 x float> %val3, %val4
				%and = and <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i16> %val5, <4 x i16> %val6
				ret <4 x i16> %sel

				}

				define <4 x double> @fun35(<4 x float> %val1, <4 x float> %val2, <4 x float> %val3, <4 x float> %val4,
				; CHECK-LABEL: fun35:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vmrhf %v3, %v24, %v24
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v26, %v26
				; CHECK-NEXT: vmrlf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v26, %v26
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v29, %v1
				; CHECK-NEXT: vsel %v26, %v27, %v31, %v0
				; CHECK-NEXT: br %r14
				<4 x double> %val5, <4 x double> %val6) {
				%cmp0 = fcmp ogt <4 x float> %val1, %val2
				%cmp1 = fcmp ogt <4 x float> %val3, %val4
				%and = and <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x double> %val5, <4 x double> %val6
				ret <4 x double> %sel

				}

				define <4 x i8> @fun36(<4 x float> %val1, <4 x float> %val2, <4 x double> %val3, <4 x double> %val4,
				; CHECK-LABEL: fun36:
				; CHECK: vfchdb %v0, %v30, %v27
				; CHECK-NEXT: vfchdb %v1, %v28, %v25
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v26, %v26
				; CHECK-NEXT: vmrlf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v26, %v26
				; CHECK-NEXT: vmrhf %v3, %v24, %v24
				; CHECK-NEXT: larl %r1, .LCPI36_0
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v29, %v31, %v0
				; CHECK-NEXT: br %r14
				<4 x i8> %val5, <4 x i8> %val6) {
				%cmp0 = fcmp ogt <4 x float> %val1, %val2
				%cmp1 = fcmp ogt <4 x double> %val3, %val4
				%and = and <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i8> %val5, <4 x i8> %val6
				ret <4 x i8> %sel

				}

				define <8 x i8> @fun37(<8 x i16> %val1, <8 x i16> %val2, <8 x i16> %val3, <8 x i16> %val4,
				; CHECK-LABEL: fun37:
				; CHECK: vceqh %v0, %v28, %v30
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vpkh %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<8 x i8> %val5, <8 x i8> %val6) {
				%cmp0 = icmp eq <8 x i16> %val1, %val2
				%cmp1 = icmp eq <8 x i16> %val3, %val4
				%and = and <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i8> %val5, <8 x i8> %val6
				ret <8 x i8> %sel

				}

				define <8 x i32> @fun38(<8 x i16> %val1, <8 x i16> %val2, <8 x i16> %val3, <8 x i16> %val4,
				; CHECK-LABEL: fun38:
				; CHECK: vceqh %v0, %v28, %v30
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vuphh %v1, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v29, %v1
				; CHECK-NEXT: vsel %v26, %v27, %v31, %v0
				; CHECK-NEXT: br %r14
				<8 x i32> %val5, <8 x i32> %val6) {
				%cmp0 = icmp eq <8 x i16> %val1, %val2
				%cmp1 = icmp eq <8 x i16> %val3, %val4
				%and = and <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i32> %val5, <8 x i32> %val6
				ret <8 x i32> %sel

				}

				define <8 x i64> @fun39(<8 x i16> %val1, <8 x i16> %val2, <8 x i32> %val3, <8 x i32> %val4,
				; CHECK-LABEL: fun39:
				; CHECK: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vceqf %v0, %v28, %v25
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vn %v0, %v2, %v0
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vuphf %v2, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v29, %v3, %v2
				; CHECK-NEXT: vl %v2, 208(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vsel %v26, %v31, %v2, %v0
				; CHECK-NEXT: vceqf %v0, %v30, %v27
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vl %v3, 160(%r15)
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v28, %v3, %v2, %v1
				; CHECK-NEXT: vl %v1, 240(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i64> %val5, <8 x i64> %val6) {
				%cmp0 = icmp eq <8 x i16> %val1, %val2
				%cmp1 = icmp eq <8 x i32> %val3, %val4
				%and = and <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i64> %val5, <8 x i64> %val6
				ret <8 x i64> %sel

				}

				define <8 x i8> @fun40(<8 x i16> %val1, <8 x i16> %val2, <8 x i64> %val3, <8 x i64> %val4,
				; CHECK-LABEL: fun40:
				; CHECK: vl %v0, 176(%r15)
				; CHECK-NEXT: vl %v1, 160(%r15)
				; CHECK-NEXT: vceqg %v0, %v27, %v0
				; CHECK-NEXT: vceqg %v1, %v25, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqg %v1, %v30, %v31
				; CHECK-NEXT: vceqg %v2, %v28, %v29
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vlrepg %v1, 200(%r15)
				; CHECK-NEXT: vlrepg %v2, 192(%r15)
				; CHECK-NEXT: vpkh %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i8> %val5, <8 x i8> %val6) {
				%cmp0 = icmp eq <8 x i16> %val1, %val2
				%cmp1 = icmp eq <8 x i64> %val3, %val4
				%and = and <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i8> %val5, <8 x i8> %val6
				ret <8 x i8> %sel

				}

				define <8 x i16> @fun41(<8 x i16> %val1, <8 x i16> %val2, <8 x float> %val3, <8 x float> %val4,
				; CHECK-LABEL: fun41:
				; CHECK: vmrlf %v0, %v27, %v27
				; CHECK-NEXT: vmrlf %v1, %v30, %v30
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v27, %v27
				; CHECK-NEXT: vmrhf %v2, %v30, %v30
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vmrhf %v3, %v28, %v28
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v25, %v25
				; CHECK-NEXT: vmrlf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v25, %v25
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v29, %v31, %v0
				; CHECK-NEXT: br %r14
				<8 x i16> %val5, <8 x i16> %val6) {
				%cmp0 = icmp eq <8 x i16> %val1, %val2
				%cmp1 = fcmp ogt <8 x float> %val3, %val4
				%and = and <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i16> %val5, <8 x i16> %val6
				ret <8 x i16> %sel

				}

				define <8 x i32> @fun42(<8 x i16> %val1, <8 x i16> %val2, <8 x double> %val3, <8 x double> %val4,
				; CHECK-LABEL: fun42:
				; CHECK: vfchdb %v0, %v30, %v31
				; CHECK-NEXT: vfchdb %v1, %v28, %v29
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vn %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v0
				; CHECK-NEXT: vl %v0, 176(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vfchdb %v0, %v27, %v0
				; CHECK-NEXT: vfchdb %v2, %v25, %v2
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vpkg %v0, %v2, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 240(%r15)
				; CHECK-NEXT: vl %v2, 208(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i32> %val5, <8 x i32> %val6) {
				%cmp0 = icmp eq <8 x i16> %val1, %val2
				%cmp1 = fcmp ogt <8 x double> %val3, %val4
				%and = and <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i32> %val5, <8 x i32> %val6
				ret <8 x i32> %sel

				}

				define <8 x i32> @fun43(<8 x i32> %val1, <8 x i32> %val2, <8 x i64> %val3, <8 x i64> %val4,
				; CHECK-LABEL: fun43:
				; CHECK: vl %v0, 176(%r15)
				; CHECK-NEXT: vl %v1, 160(%r15)
				; CHECK-NEXT: vceqg %v0, %v27, %v0
				; CHECK-NEXT: vceqg %v1, %v25, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqf %v1, %v24, %v28
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 256(%r15)
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: vl %v0, 208(%r15)
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vceqg %v0, %v31, %v0
				; CHECK-NEXT: vceqg %v1, %v29, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqf %v1, %v26, %v30
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 272(%r15)
				; CHECK-NEXT: vl %v2, 240(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i32> %val5, <8 x i32> %val6) {
				%cmp0 = icmp eq <8 x i32> %val1, %val2
				%cmp1 = icmp eq <8 x i64> %val3, %val4
				%and = and <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i32> %val5, <8 x i32> %val6
				ret <8 x i32> %sel

				}

				define <8 x double> @fun44(<8 x i32> %val1, <8 x i32> %val2, <8 x float> %val3, <8 x float> %val4,
				; CHECK-LABEL: fun44:
				; CHECK: vmrlf %v0, %v29, %v29
				; CHECK-NEXT: vmrlf %v1, %v25, %v25
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v29, %v29
				; CHECK-NEXT: vmrhf %v2, %v25, %v25
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vl %v3, 160(%r15)
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vl %v4, 192(%r15)
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqf %v1, %v24, %v28
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v1
				; CHECK-NEXT: vmrlf %v1, %v31, %v31
				; CHECK-NEXT: vmrlf %v2, %v27, %v27
				; CHECK-NEXT: vmrhf %v3, %v27, %v27
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v31, %v31
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vl %v3, 256(%r15)
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vceqf %v2, %v26, %v30
				; CHECK-NEXT: vn %v1, %v2, %v1
				; CHECK-NEXT: vuphf %v2, %v1
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 240(%r15)
				; CHECK-NEXT: vl %v3, 176(%r15)
				; CHECK-NEXT: vsel %v26, %v3, %v2, %v0
				; CHECK-NEXT: vl %v2, 208(%r15)
				; CHECK-NEXT: vmrlg %v0, %v1, %v1
				; CHECK-NEXT: vl %v1, 272(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x double> %val5, <8 x double> %val6) {
				%cmp0 = icmp eq <8 x i32> %val1, %val2
				%cmp1 = fcmp ogt <8 x float> %val3, %val4
				%and = and <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x double> %val5, <8 x double> %val6
				ret <8 x double> %sel

				}

				define <8 x double> @fun45(<8 x i32> %val1, <8 x i32> %val2, <8 x double> %val3, <8 x double> %val4,
				; CHECK-LABEL: fun45:
				; CHECK: vl %v0, 160(%r15)
				; CHECK-NEXT: vceqf %v1, %v24, %v28
				; CHECK-NEXT: vfchdb %v0, %v25, %v0
				; CHECK-NEXT: vuphf %v2, %v1
				; CHECK-NEXT: vn %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vl %v3, 224(%r15)
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v0
				; CHECK-NEXT: vl %v0, 192(%r15)
				; CHECK-NEXT: vceqf %v2, %v26, %v30
				; CHECK-NEXT: vfchdb %v0, %v29, %v0
				; CHECK-NEXT: vuphf %v3, %v2
				; CHECK-NEXT: vn %v0, %v3, %v0
				; CHECK-NEXT: vl %v3, 320(%r15)
				; CHECK-NEXT: vl %v4, 256(%r15)
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v0
				; CHECK-NEXT: vl %v0, 176(%r15)
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v27, %v0
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 304(%r15)
				; CHECK-NEXT: vl %v3, 240(%r15)
				; CHECK-NEXT: vsel %v26, %v3, %v1, %v0
				; CHECK-NEXT: vl %v0, 208(%r15)
				; CHECK-NEXT: vmrlg %v1, %v2, %v2
				; CHECK-NEXT: vfchdb %v0, %v31, %v0
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vl %v2, 272(%r15)
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 336(%r15)
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x double> %val5, <8 x double> %val6) {
				%cmp0 = icmp eq <8 x i32> %val1, %val2
				%cmp1 = fcmp ogt <8 x double> %val3, %val4
				%and = and <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x double> %val5, <8 x double> %val6
				ret <8 x double> %sel

				}

				define <8 x i64> @fun46(<8 x float> %val1, <8 x float> %val2, <8 x double> %val3, <8 x double> %val4,
				; CHECK-LABEL: fun46:
				; CHECK: vmrlf %v0, %v28, %v28
				; CHECK-NEXT: vmrlf %v1, %v24, %v24
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v28, %v28
				; CHECK-NEXT: vmrhf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vl %v3, 224(%r15)
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vl %v4, 256(%r15)
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vfchdb %v2, %v25, %v2
				; CHECK-NEXT: vn %v1, %v1, %v2
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v1
				; CHECK-NEXT: vmrlf %v1, %v30, %v30
				; CHECK-NEXT: vmrlf %v2, %v26, %v26
				; CHECK-NEXT: vmrhf %v3, %v26, %v26
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v30, %v30
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vuphf %v2, %v1
				; CHECK-NEXT: vfchdb %v3, %v29, %v3
				; CHECK-NEXT: vn %v2, %v2, %v3
				; CHECK-NEXT: vl %v3, 320(%r15)
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vl %v3, 240(%r15)
				; CHECK-NEXT: vfchdb %v2, %v27, %v2
				; CHECK-NEXT: vn %v0, %v0, %v2
				; CHECK-NEXT: vl %v2, 304(%r15)
				; CHECK-NEXT: vsel %v26, %v3, %v2, %v0
				; CHECK-NEXT: vl %v2, 272(%r15)
				; CHECK-NEXT: vmrlg %v0, %v1, %v1
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vfchdb %v1, %v31, %v1
				; CHECK-NEXT: vn %v0, %v0, %v1
				; CHECK-NEXT: vl %v1, 336(%r15)
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i64> %val5, <8 x i64> %val6) {
				%cmp0 = fcmp ogt <8 x float> %val1, %val2
				%cmp1 = fcmp ogt <8 x double> %val3, %val4
				%and = and <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i64> %val5, <8 x i64> %val6
				ret <8 x i64> %sel

				}

				define <16 x i16> @fun47(<16 x i8> %val1, <16 x i8> %val2, <16 x i8> %val3, <16 x i8> %val4,
				; CHECK-LABEL: fun47:
				; CHECK: vceqb %v0, %v28, %v30
				; CHECK-NEXT: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vuphb %v1, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v29, %v1
				; CHECK-NEXT: vsel %v26, %v27, %v31, %v0
				; CHECK-NEXT: br %r14
				<16 x i16> %val5, <16 x i16> %val6) {
				%cmp0 = icmp eq <16 x i8> %val1, %val2
				%cmp1 = icmp eq <16 x i8> %val3, %val4
				%and = and <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i16> %val5, <16 x i16> %val6
				ret <16 x i16> %sel

				}

				define <16 x i64> @fun48(<16 x i8> %val1, <16 x i8> %val2, <16 x i16> %val3, <16 x i16> %val4,
				; CHECK-LABEL: fun48:
				; CHECK: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vceqh %v0, %v28, %v25
				; CHECK-NEXT: vuphb %v2, %v1
				; CHECK-NEXT: vn %v0, %v2, %v0
				; CHECK-NEXT: vuphh %v2, %v0
				; CHECK-NEXT: vl %v3, 256(%r15)
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vsel %v24, %v29, %v3, %v2
				; CHECK-NEXT: vpkg %v2, %v0, %v0
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vl %v3, 272(%r15)
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vsel %v26, %v31, %v3, %v2
				; CHECK-NEXT: vmrlg %v2, %v0, %v0
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vsldb %v0, %v0, %v0, 12
				; CHECK-NEXT: vl %v3, 288(%r15)
				; CHECK-NEXT: vl %v4, 160(%r15)
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 304(%r15)
				; CHECK-NEXT: vl %v3, 176(%r15)
				; CHECK-NEXT: vl %v4, 192(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vsel %v0, %v3, %v2, %v0
				; CHECK-NEXT: vl %v3, 320(%r15)
				; CHECK-NEXT: vceqh %v2, %v30, %v27
				; CHECK-NEXT: vlr %v30, %v0
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vn %v1, %v1, %v2
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vsel %v25, %v4, %v3, %v2
				; CHECK-NEXT: vl %v3, 336(%r15)
				; CHECK-NEXT: vl %v4, 208(%r15)
				; CHECK-NEXT: vpkg %v2, %v1, %v1
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vsel %v27, %v4, %v3, %v2
				; CHECK-NEXT: vl %v3, 352(%r15)
				; CHECK-NEXT: vl %v4, 224(%r15)
				; CHECK-NEXT: vmrlg %v2, %v1, %v1
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vsldb %v1, %v1, %v1, 12
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vsel %v29, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 368(%r15)
				; CHECK-NEXT: vl %v3, 240(%r15)
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v31, %v3, %v2, %v1
				; CHECK-NEXT: br %r14
				<16 x i64> %val5, <16 x i64> %val6) {
				%cmp0 = icmp eq <16 x i8> %val1, %val2
				%cmp1 = icmp eq <16 x i16> %val3, %val4
				%and = and <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i64> %val5, <16 x i64> %val6
				ret <16 x i64> %sel

				}

				define <16 x i64> @fun49(<16 x i8> %val1, <16 x i8> %val2, <16 x i32> %val3, <16 x i32> %val4,
				; CHECK-LABEL: fun49:
				; CHECK: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vuphb %v2, %v1
				; CHECK-NEXT: vceqf %v0, %v28, %v29
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vn %v0, %v2, %v0
				; CHECK-NEXT: vl %v3, 320(%r15)
				; CHECK-NEXT: vl %v4, 192(%r15)
				; CHECK-NEXT: vuphf %v2, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 336(%r15)
				; CHECK-NEXT: vl %v3, 208(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v26, %v3, %v2, %v0
				; CHECK-NEXT: vpkg %v2, %v1, %v1
				; CHECK-NEXT: vuphb %v2, %v2
				; CHECK-NEXT: vceqf %v0, %v30, %v31
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vn %v0, %v2, %v0
				; CHECK-NEXT: vl %v3, 352(%r15)
				; CHECK-NEXT: vl %v4, 224(%r15)
				; CHECK-NEXT: vuphf %v2, %v0
				; CHECK-NEXT: vl %v5, 256(%r15)
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vl %v4, 384(%r15)
				; CHECK-NEXT: vmrlg %v3, %v1, %v1
				; CHECK-NEXT: vuphb %v3, %v3
				; CHECK-NEXT: vceqf %v2, %v25, %v2
				; CHECK-NEXT: vuphh %v3, %v3
				; CHECK-NEXT: vn %v2, %v3, %v2
				; CHECK-NEXT: vuphf %v3, %v2
				; CHECK-NEXT: vsldb %v1, %v1, %v1, 12
				; CHECK-NEXT: vsel %v25, %v5, %v4, %v3
				; CHECK-NEXT: vl %v3, 176(%r15)
				; CHECK-NEXT: vl %v4, 416(%r15)
				; CHECK-NEXT: vl %v5, 288(%r15)
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vceqf %v3, %v27, %v3
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vn %v1, %v1, %v3
				; CHECK-NEXT: vuphf %v3, %v1
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v29, %v5, %v4, %v3
				; CHECK-NEXT: vl %v3, 368(%r15)
				; CHECK-NEXT: vl %v4, 240(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v30, %v4, %v3, %v0
				; CHECK-NEXT: vl %v3, 272(%r15)
				; CHECK-NEXT: vmrlg %v0, %v2, %v2
				; CHECK-NEXT: vl %v2, 400(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v27, %v3, %v2, %v0
				; CHECK-NEXT: vl %v2, 304(%r15)
				; CHECK-NEXT: vmrlg %v0, %v1, %v1
				; CHECK-NEXT: vl %v1, 432(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v31, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i64> %val5, <16 x i64> %val6) {
				%cmp0 = icmp eq <16 x i8> %val1, %val2
				%cmp1 = icmp eq <16 x i32> %val3, %val4
				%and = and <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i64> %val5, <16 x i64> %val6
				ret <16 x i64> %sel

				}

				define <16 x i64> @fun50(<16 x i8> %val1, <16 x i8> %val2, <16 x i64> %val3, <16 x i64> %val4,
				; CHECK-LABEL: fun50:
				; CHECK: vl %v0, 192(%r15)
				; CHECK-NEXT: vceqg %v1, %v28, %v0
				; CHECK-NEXT: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vuphb %v2, %v0
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vn %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 448(%r15)
				; CHECK-NEXT: vl %v3, 320(%r15)
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v1
				; CHECK-NEXT: vpkf %v2, %v0, %v0
				; CHECK-NEXT: vuphb %v2, %v2
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vceqg %v1, %v30, %v1
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vn %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 464(%r15)
				; CHECK-NEXT: vl %v3, 336(%r15)
				; CHECK-NEXT: vsel %v26, %v3, %v2, %v1
				; CHECK-NEXT: vpkg %v2, %v0, %v0
				; CHECK-NEXT: vuphb %v2, %v2
				; CHECK-NEXT: vl %v1, 224(%r15)
				; CHECK-NEXT: vl %v3, 352(%r15)
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vceqg %v1, %v25, %v1
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vn %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 480(%r15)
				; CHECK-NEXT: vsel %v28, %v3, %v2, %v1
				; CHECK-NEXT: vl %v1, 240(%r15)
				; CHECK-NEXT: vl %v3, 368(%r15)
				; CHECK-NEXT: vsldb %v2, %v0, %v0, 6
				; CHECK-NEXT: vuphb %v2, %v2
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vceqg %v1, %v27, %v1
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vn %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 496(%r15)
				; CHECK-NEXT: vsel %v30, %v3, %v2, %v1
				; CHECK-NEXT: vl %v1, 256(%r15)
				; CHECK-NEXT: vl %v3, 384(%r15)
				; CHECK-NEXT: vmrlg %v2, %v0, %v0
				; CHECK-NEXT: vuphb %v2, %v2
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vceqg %v1, %v29, %v1
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vn %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 512(%r15)
				; CHECK-NEXT: vsel %v25, %v3, %v2, %v1
				; CHECK-NEXT: vl %v1, 272(%r15)
				; CHECK-NEXT: vl %v3, 400(%r15)
				; CHECK-NEXT: vsldb %v2, %v0, %v0, 10
				; CHECK-NEXT: vuphb %v2, %v2
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vceqg %v1, %v31, %v1
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vn %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 528(%r15)
				; CHECK-NEXT: vsel %v27, %v3, %v2, %v1
				; CHECK-NEXT: vl %v1, 288(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vl %v3, 416(%r15)
				; CHECK-NEXT: vceqg %v1, %v2, %v1
				; CHECK-NEXT: vsldb %v2, %v0, %v0, 12
				; CHECK-NEXT: vuphb %v2, %v2
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vsldb %v0, %v0, %v0, 14
				; CHECK-NEXT: vn %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 544(%r15)
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vsel %v29, %v3, %v2, %v1
				; CHECK-NEXT: vl %v1, 304(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vceqg %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 432(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vn %v0, %v0, %v1
				; CHECK-NEXT: vl %v1, 560(%r15)
				; CHECK-NEXT: vsel %v31, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i64> %val5, <16 x i64> %val6) {
				%cmp0 = icmp eq <16 x i8> %val1, %val2
				%cmp1 = icmp eq <16 x i64> %val3, %val4
				%and = and <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i64> %val5, <16 x i64> %val6
				ret <16 x i64> %sel

				}

				define <16 x i16> @fun51(<16 x i8> %val1, <16 x i8> %val2, <16 x float> %val3, <16 x float> %val4,
				; CHECK-LABEL: fun51:
				; CHECK: vmrlf %v0, %v31, %v31
				; CHECK-NEXT: vmrlf %v1, %v30, %v30
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v31, %v31
				; CHECK-NEXT: vmrhf %v2, %v30, %v30
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vmrhf %v3, %v28, %v28
				; CHECK-NEXT: vmrlf %v4, %v25, %v25
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v29, %v29
				; CHECK-NEXT: vmrlf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v29, %v29
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vuphb %v2, %v1
				; CHECK-NEXT: vn %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v0
				; CHECK-NEXT: vl %v0, 176(%r15)
				; CHECK-NEXT: vmrlf %v2, %v0, %v0
				; CHECK-NEXT: vmrlf %v3, %v27, %v27
				; CHECK-NEXT: vmrhf %v0, %v0, %v0
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vmrhf %v3, %v27, %v27
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v0, %v3, %v0
				; CHECK-NEXT: vpkg %v0, %v0, %v2
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vmrlf %v3, %v2, %v2
				; CHECK-NEXT: vmrhf %v2, %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vfchdb %v3, %v4, %v3
				; CHECK-NEXT: vmrhf %v4, %v25, %v25
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vfchdb %v2, %v4, %v2
				; CHECK-NEXT: vpkg %v2, %v2, %v3
				; CHECK-NEXT: vpkf %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 208(%r15)
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 240(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i16> %val5, <16 x i16> %val6) {
				%cmp0 = icmp eq <16 x i8> %val1, %val2
				%cmp1 = fcmp ogt <16 x float> %val3, %val4
				%and = and <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i16> %val5, <16 x i16> %val6
				ret <16 x i16> %sel

				}

				define <16 x i8> @fun52(<16 x i8> %val1, <16 x i8> %val2, <16 x double> %val3, <16 x double> %val4,
				; CHECK-LABEL: fun52:
				; CHECK: vl %v0, 304(%r15)
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 288(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 272(%r15)
				; CHECK-NEXT: vl %v2, 256(%r15)
				; CHECK-NEXT: vfchdb %v1, %v31, %v1
				; CHECK-NEXT: vfchdb %v2, %v29, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 240(%r15)
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vfchdb %v1, %v27, %v1
				; CHECK-NEXT: vfchdb %v2, %v25, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 208(%r15)
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vfchdb %v2, %v30, %v2
				; CHECK-NEXT: vfchdb %v3, %v28, %v3
				; CHECK-NEXT: vpkg %v2, %v3, %v2
				; CHECK-NEXT: vpkf %v1, %v2, %v1
				; CHECK-NEXT: vpkh %v0, %v1, %v0
				; CHECK-NEXT: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 336(%r15)
				; CHECK-NEXT: vl %v2, 320(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i8> %val5, <16 x i8> %val6) {
				%cmp0 = icmp eq <16 x i8> %val1, %val2
				%cmp1 = fcmp ogt <16 x double> %val3, %val4
				%and = and <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i8> %val5, <16 x i8> %val6
				ret <16 x i8> %sel

				}

				define <16 x i8> @fun53(<16 x i16> %val1, <16 x i16> %val2, <16 x i16> %val3, <16 x i16> %val4,
				; CHECK-LABEL: fun53:
				; CHECK: vceqh %v0, %v27, %v31
				; CHECK-NEXT: vceqh %v1, %v26, %v30
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v25, %v29
				; CHECK-NEXT: vceqh %v2, %v24, %v28
				; CHECK-NEXT: vn %v1, %v2, %v1
				; CHECK-NEXT: vpkh %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i8> %val5, <16 x i8> %val6) {
				%cmp0 = icmp eq <16 x i16> %val1, %val2
				%cmp1 = icmp eq <16 x i16> %val3, %val4
				%and = and <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i8> %val5, <16 x i8> %val6
				ret <16 x i8> %sel

				}

				define <16 x i16> @fun54(<16 x i16> %val1, <16 x i16> %val2, <16 x i16> %val3, <16 x i16> %val4,
				; CHECK-LABEL: fun54:
				; CHECK: vceqh %v0, %v25, %v29
				; CHECK-NEXT: vceqh %v1, %v24, %v28
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: vceqh %v0, %v27, %v31
				; CHECK-NEXT: vceqh %v1, %v26, %v30
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i16> %val5, <16 x i16> %val6) {
				%cmp0 = icmp eq <16 x i16> %val1, %val2
				%cmp1 = icmp eq <16 x i16> %val3, %val4
				%and = and <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i16> %val5, <16 x i16> %val6
				ret <16 x i16> %sel

				}

				define <16 x i32> @fun55(<16 x i16> %val1, <16 x i16> %val2, <16 x i16> %val3, <16 x i16> %val4,
				; CHECK-LABEL: fun55:
				; CHECK: vceqh %v0, %v25, %v29
				; CHECK-NEXT: vceqh %v1, %v24, %v28
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vl %v3, 160(%r15)
				; CHECK-NEXT: vuphh %v1, %v0
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v1
				; CHECK-NEXT: vceqh %v1, %v27, %v31
				; CHECK-NEXT: vceqh %v2, %v26, %v30
				; CHECK-NEXT: vn %v1, %v2, %v1
				; CHECK-NEXT: vl %v3, 256(%r15)
				; CHECK-NEXT: vl %v4, 192(%r15)
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 240(%r15)
				; CHECK-NEXT: vl %v3, 176(%r15)
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v26, %v3, %v2, %v0
				; CHECK-NEXT: vmrlg %v0, %v1, %v1
				; CHECK-NEXT: vl %v1, 272(%r15)
				; CHECK-NEXT: vl %v2, 208(%r15)
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i32> %val5, <16 x i32> %val6) {
				%cmp0 = icmp eq <16 x i16> %val1, %val2
				%cmp1 = icmp eq <16 x i16> %val3, %val4
				%and = and <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i32> %val5, <16 x i32> %val6
				ret <16 x i32> %sel

				}

				define <16 x i8> @fun56(<16 x i16> %val1, <16 x i16> %val2, <16 x i32> %val3, <16 x i32> %val4,
				; CHECK-LABEL: fun56:
				; CHECK: vl %v0, 208(%r15)
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vceqf %v0, %v31, %v0
				; CHECK-NEXT: vceqf %v1, %v29, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v26, %v30
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vceqf %v1, %v27, %v1
				; CHECK-NEXT: vceqf %v2, %v25, %v2
				; CHECK-NEXT: vpkf %v1, %v2, %v1
				; CHECK-NEXT: vceqh %v2, %v24, %v28
				; CHECK-NEXT: vn %v1, %v2, %v1
				; CHECK-NEXT: vpkh %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 240(%r15)
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i8> %val5, <16 x i8> %val6) {
				%cmp0 = icmp eq <16 x i16> %val1, %val2
				%cmp1 = icmp eq <16 x i32> %val3, %val4
				%and = and <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i8> %val5, <16 x i8> %val6
				ret <16 x i8> %sel

				}

				define <16 x i32> @fun57(<16 x i16> %val1, <16 x i16> %val2, <16 x i64> %val3, <16 x i64> %val4,
				; CHECK-LABEL: fun57:
				; CHECK: vl %v0, 240(%r15)
				; CHECK-NEXT: vl %v1, 224(%r15)
				; CHECK-NEXT: vceqg %v0, %v27, %v0
				; CHECK-NEXT: vceqg %v1, %v25, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v24, %v28
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vn %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 416(%r15)
				; CHECK-NEXT: vl %v3, 352(%r15)
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v0
				; CHECK-NEXT: vl %v0, 304(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vceqg %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vl %v3, 160(%r15)
				; CHECK-NEXT: vceqg %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v0, %v2, %v0
				; CHECK-NEXT: vceqh %v2, %v26, %v30
				; CHECK-NEXT: vuphh %v3, %v2
				; CHECK-NEXT: vn %v0, %v3, %v0
				; CHECK-NEXT: vl %v3, 448(%r15)
				; CHECK-NEXT: vl %v4, 384(%r15)
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v0
				; CHECK-NEXT: vl %v0, 272(%r15)
				; CHECK-NEXT: vl %v3, 256(%r15)
				; CHECK-NEXT: vceqg %v0, %v31, %v0
				; CHECK-NEXT: vceqg %v3, %v29, %v3
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vpkg %v0, %v3, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vl %v3, 368(%r15)
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 432(%r15)
				; CHECK-NEXT: vsel %v26, %v3, %v1, %v0
				; CHECK-NEXT: vl %v0, 336(%r15)
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vceqg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 320(%r15)
				; CHECK-NEXT: vceqg %v1, %v3, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlg %v1, %v2, %v2
				; CHECK-NEXT: vl %v2, 400(%r15)
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 464(%r15)
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i32> %val5, <16 x i32> %val6) {
				%cmp0 = icmp eq <16 x i16> %val1, %val2
				%cmp1 = icmp eq <16 x i64> %val3, %val4
				%and = and <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i32> %val5, <16 x i32> %val6
				ret <16 x i32> %sel

				}

				define <16 x double> @fun58(<16 x i16> %val1, <16 x i16> %val2, <16 x float> %val3, <16 x float> %val4,
				; CHECK-LABEL: fun58:
				; CHECK: vl %v0, 160(%r15)
				; CHECK-NEXT: vmrlf %v1, %v0, %v0
				; CHECK-NEXT: vmrlf %v2, %v25, %v25
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v0, %v0, %v0
				; CHECK-NEXT: vmrhf %v2, %v25, %v25
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vl %v3, 352(%r15)
				; CHECK-NEXT: vl %v4, 224(%r15)
				; CHECK-NEXT: vl %v5, 416(%r15)
				; CHECK-NEXT: vl %v6, 288(%r15)
				; CHECK-NEXT: vfchdb %v0, %v2, %v0
				; CHECK-NEXT: vpkg %v0, %v0, %v1
				; CHECK-NEXT: vceqh %v1, %v24, %v28
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vn %v0, %v2, %v0
				; CHECK-NEXT: vuphf %v2, %v0
				; CHECK-NEXT: vsel %v24, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vmrlf %v3, %v2, %v2
				; CHECK-NEXT: vmrlf %v4, %v27, %v27
				; CHECK-NEXT: vmrhf %v2, %v2, %v2
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vfchdb %v3, %v4, %v3
				; CHECK-NEXT: vmrhf %v4, %v27, %v27
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vfchdb %v2, %v4, %v2
				; CHECK-NEXT: vl %v4, 256(%r15)
				; CHECK-NEXT: vpkg %v2, %v2, %v3
				; CHECK-NEXT: vl %v3, 384(%r15)
				; CHECK-NEXT: vn %v1, %v1, %v2
				; CHECK-NEXT: vuphf %v2, %v1
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 192(%r15)
				; CHECK-NEXT: vmrlf %v3, %v2, %v2
				; CHECK-NEXT: vmrlf %v4, %v29, %v29
				; CHECK-NEXT: vmrhf %v2, %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vfchdb %v3, %v4, %v3
				; CHECK-NEXT: vmrhf %v4, %v29, %v29
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vfchdb %v2, %v4, %v2
				; CHECK-NEXT: vpkg %v2, %v2, %v3
				; CHECK-NEXT: vceqh %v3, %v26, %v30
				; CHECK-NEXT: vuphh %v4, %v3
				; CHECK-NEXT: vn %v2, %v4, %v2
				; CHECK-NEXT: vuphf %v4, %v2
				; CHECK-NEXT: vsel %v25, %v6, %v5, %v4
				; CHECK-NEXT: vl %v4, 208(%r15)
				; CHECK-NEXT: vmrlf %v5, %v4, %v4
				; CHECK-NEXT: vmrlf %v6, %v31, %v31
				; CHECK-NEXT: vmrhf %v4, %v4, %v4
				; CHECK-NEXT: vmrlg %v3, %v3, %v3
				; CHECK-NEXT: vuphh %v3, %v3
				; CHECK-NEXT: vldeb %v5, %v5
				; CHECK-NEXT: vldeb %v6, %v6
				; CHECK-NEXT: vfchdb %v5, %v6, %v5
				; CHECK-NEXT: vmrhf %v6, %v31, %v31
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vldeb %v6, %v6
				; CHECK-NEXT: vfchdb %v4, %v6, %v4
				; CHECK-NEXT: vl %v6, 320(%r15)
				; CHECK-NEXT: vpkg %v4, %v4, %v5
				; CHECK-NEXT: vl %v5, 448(%r15)
				; CHECK-NEXT: vn %v3, %v3, %v4
				; CHECK-NEXT: vuphf %v4, %v3
				; CHECK-NEXT: vsel %v29, %v6, %v5, %v4
				; CHECK-NEXT: vl %v4, 368(%r15)
				; CHECK-NEXT: vl %v5, 240(%r15)
				; CHECK-NEXT: vsel %v26, %v5, %v4, %v0
				; CHECK-NEXT: vl %v4, 272(%r15)
				; CHECK-NEXT: vmrlg %v0, %v1, %v1
				; CHECK-NEXT: vl %v1, 400(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v30, %v4, %v1, %v0
				; CHECK-NEXT: vl %v1, 432(%r15)
				; CHECK-NEXT: vmrlg %v0, %v2, %v2
				; CHECK-NEXT: vl %v2, 304(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v27, %v2, %v1, %v0
				; CHECK-NEXT: vl %v1, 464(%r15)
				; CHECK-NEXT: vl %v2, 336(%r15)
				; CHECK-NEXT: vmrlg %v0, %v3, %v3
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v31, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x double> %val5, <16 x double> %val6) {
				%cmp0 = icmp eq <16 x i16> %val1, %val2
				%cmp1 = fcmp ogt <16 x float> %val3, %val4
				%and = and <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x double> %val5, <16 x double> %val6
				ret <16 x double> %sel

				}

				define <16 x i32> @fun59(<16 x i16> %val1, <16 x i16> %val2, <16 x double> %val3, <16 x double> %val4,
				; CHECK-LABEL: fun59:
				; CHECK: vl %v0, 240(%r15)
				; CHECK-NEXT: vl %v1, 224(%r15)
				; CHECK-NEXT: vfchdb %v0, %v27, %v0
				; CHECK-NEXT: vfchdb %v1, %v25, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v24, %v28
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vn %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 416(%r15)
				; CHECK-NEXT: vl %v3, 352(%r15)
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v0
				; CHECK-NEXT: vl %v0, 304(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vfchdb %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vl %v3, 160(%r15)
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v0, %v2, %v0
				; CHECK-NEXT: vceqh %v2, %v26, %v30
				; CHECK-NEXT: vuphh %v3, %v2
				; CHECK-NEXT: vn %v0, %v3, %v0
				; CHECK-NEXT: vl %v3, 448(%r15)
				; CHECK-NEXT: vl %v4, 384(%r15)
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v0
				; CHECK-NEXT: vl %v0, 272(%r15)
				; CHECK-NEXT: vl %v3, 256(%r15)
				; CHECK-NEXT: vfchdb %v0, %v31, %v0
				; CHECK-NEXT: vfchdb %v3, %v29, %v3
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vpkg %v0, %v3, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vl %v3, 368(%r15)
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 432(%r15)
				; CHECK-NEXT: vsel %v26, %v3, %v1, %v0
				; CHECK-NEXT: vl %v0, 336(%r15)
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 320(%r15)
				; CHECK-NEXT: vfchdb %v1, %v3, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlg %v1, %v2, %v2
				; CHECK-NEXT: vl %v2, 400(%r15)
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vn %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 464(%r15)
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i32> %val5, <16 x i32> %val6) {
				%cmp0 = icmp eq <16 x i16> %val1, %val2
				%cmp1 = fcmp ogt <16 x double> %val3, %val4
				%and = and <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i32> %val5, <16 x i32> %val6
				ret <16 x i32> %sel

				}

				define <2 x i8> @fun60(<2 x i8> %val1, <2 x i8> %val2, <2 x i8> %val3, <2 x i8> %val4,
				; CHECK-LABEL: fun60:
				; CHECK: vceqb %v0, %v28, %v30
				; CHECK-NEXT: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i8> %val5, <2 x i8> %val6) {
				%cmp0 = icmp eq <2 x i8> %val1, %val2
				%cmp1 = icmp eq <2 x i8> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i8> %val5, <2 x i8> %val6
				ret <2 x i8> %sel

				}

				define <2 x i16> @fun61(<2 x i8> %val1, <2 x i8> %val2, <2 x i8> %val3, <2 x i8> %val4,
				; CHECK-LABEL: fun61:
				; CHECK: vceqb %v0, %v28, %v30
				; CHECK-NEXT: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i8> %val1, %val2
				%cmp1 = icmp eq <2 x i8> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x i8> @fun62(<2 x i8> %val1, <2 x i8> %val2, <2 x i16> %val3, <2 x i16> %val4,
				; CHECK-LABEL: fun62:
				; CHECK: vceqh %v1, %v28, %v30
				; CHECK-NEXT: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vpkh %v1, %v1, %v1
				; CHECK-NEXT: vo %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i8> %val5, <2 x i8> %val6) {
				%cmp0 = icmp eq <2 x i8> %val1, %val2
				%cmp1 = icmp eq <2 x i16> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i8> %val5, <2 x i8> %val6
				ret <2 x i8> %sel

				}

				define <2 x i32> @fun63(<2 x i8> %val1, <2 x i8> %val2, <2 x i32> %val3, <2 x i32> %val4,
				; CHECK-LABEL: fun63:
				; CHECK: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vceqf %v0, %v28, %v30
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i32> %val5, <2 x i32> %val6) {
				%cmp0 = icmp eq <2 x i8> %val1, %val2
				%cmp1 = icmp eq <2 x i32> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i32> %val5, <2 x i32> %val6
				ret <2 x i32> %sel

				}

				define <2 x i32> @fun64(<2 x i8> %val1, <2 x i8> %val2, <2 x i64> %val3, <2 x i64> %val4,
				; CHECK-LABEL: fun64:
				; CHECK: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vceqg %v0, %v28, %v30
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vpkg %v0, %v0, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i32> %val5, <2 x i32> %val6) {
				%cmp0 = icmp eq <2 x i8> %val1, %val2
				%cmp1 = icmp eq <2 x i64> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i32> %val5, <2 x i32> %val6
				ret <2 x i32> %sel

				}

				define <2 x i16> @fun65(<2 x i8> %val1, <2 x i8> %val2, <2 x float> %val3, <2 x float> %val4,
				; CHECK-LABEL: fun65:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i8> %val1, %val2
				%cmp1 = fcmp ogt <2 x float> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x i64> @fun66(<2 x i8> %val1, <2 x i8> %val2, <2 x double> %val3, <2 x double> %val4,
				; CHECK-LABEL: fun66:
				; CHECK: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v28, %v30
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i64> %val5, <2 x i64> %val6) {
				%cmp0 = icmp eq <2 x i8> %val1, %val2
				%cmp1 = fcmp ogt <2 x double> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i64> %val5, <2 x i64> %val6
				ret <2 x i64> %sel

				}

				define <2 x i8> @fun67(<2 x i16> %val1, <2 x i16> %val2, <2 x i16> %val3, <2 x i16> %val4,
				; CHECK-LABEL: fun67:
				; CHECK: vceqh %v0, %v28, %v30
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vpkh %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i8> %val5, <2 x i8> %val6) {
				%cmp0 = icmp eq <2 x i16> %val1, %val2
				%cmp1 = icmp eq <2 x i16> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i8> %val5, <2 x i8> %val6
				ret <2 x i8> %sel

				}

				define <2 x i16> @fun68(<2 x i16> %val1, <2 x i16> %val2, <2 x i16> %val3, <2 x i16> %val4,
				; CHECK-LABEL: fun68:
				; CHECK: vceqh %v0, %v28, %v30
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i16> %val1, %val2
				%cmp1 = icmp eq <2 x i16> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x i32> @fun69(<2 x i16> %val1, <2 x i16> %val2, <2 x i16> %val3, <2 x i16> %val4,
				; CHECK-LABEL: fun69:
				; CHECK: vceqh %v0, %v28, %v30
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i32> %val5, <2 x i32> %val6) {
				%cmp0 = icmp eq <2 x i16> %val1, %val2
				%cmp1 = icmp eq <2 x i16> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i32> %val5, <2 x i32> %val6
				ret <2 x i32> %sel

				}

				define <2 x i8> @fun70(<2 x i16> %val1, <2 x i16> %val2, <2 x i32> %val3, <2 x i32> %val4,
				; CHECK-LABEL: fun70:
				; CHECK: vceqf %v1, %v28, %v30
				; CHECK-NEXT: vceqh %v0, %v24, %v26
				; CHECK-NEXT: vpkf %v1, %v1, %v1
				; CHECK-NEXT: vo %v0, %v0, %v1
				; CHECK-NEXT: vpkh %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i8> %val5, <2 x i8> %val6) {
				%cmp0 = icmp eq <2 x i16> %val1, %val2
				%cmp1 = icmp eq <2 x i32> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i8> %val5, <2 x i8> %val6
				ret <2 x i8> %sel

				}

				define <2 x i8> @fun71(<2 x i16> %val1, <2 x i16> %val2, <2 x i64> %val3, <2 x i64> %val4,
				; CHECK-LABEL: fun71:
				; CHECK: larl %r1, .LCPI71_0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vceqg %v0, %v28, %v30
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vpkh %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i8> %val5, <2 x i8> %val6) {
				%cmp0 = icmp eq <2 x i16> %val1, %val2
				%cmp1 = icmp eq <2 x i64> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i8> %val5, <2 x i8> %val6
				ret <2 x i8> %sel

				}

				define <2 x double> @fun72(<2 x i16> %val1, <2 x i16> %val2, <2 x float> %val3, <2 x float> %val4,
				; CHECK-LABEL: fun72:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x double> %val5, <2 x double> %val6) {
				%cmp0 = icmp eq <2 x i16> %val1, %val2
				%cmp1 = fcmp ogt <2 x float> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x double> %val5, <2 x double> %val6
				ret <2 x double> %sel

				}

				define <2 x i16> @fun73(<2 x i16> %val1, <2 x i16> %val2, <2 x double> %val3, <2 x double> %val4,
				; CHECK-LABEL: fun73:
				; CHECK: larl %r1, .LCPI73_0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vfchdb %v0, %v28, %v30
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i16> %val1, %val2
				%cmp1 = fcmp ogt <2 x double> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x i16> @fun74(<2 x i32> %val1, <2 x i32> %val2, <2 x i32> %val3, <2 x i32> %val4,
				; CHECK-LABEL: fun74:
				; CHECK: vceqf %v0, %v28, %v30
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i32> %val1, %val2
				%cmp1 = icmp eq <2 x i32> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x i32> @fun75(<2 x i32> %val1, <2 x i32> %val2, <2 x i32> %val3, <2 x i32> %val4,
				; CHECK-LABEL: fun75:
				; CHECK: vceqf %v0, %v28, %v30
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i32> %val5, <2 x i32> %val6) {
				%cmp0 = icmp eq <2 x i32> %val1, %val2
				%cmp1 = icmp eq <2 x i32> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i32> %val5, <2 x i32> %val6
				ret <2 x i32> %sel

				}

				define <2 x i64> @fun76(<2 x i32> %val1, <2 x i32> %val2, <2 x i32> %val3, <2 x i32> %val4,
				; CHECK-LABEL: fun76:
				; CHECK: vceqf %v0, %v28, %v30
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i64> %val5, <2 x i64> %val6) {
				%cmp0 = icmp eq <2 x i32> %val1, %val2
				%cmp1 = icmp eq <2 x i32> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i64> %val5, <2 x i64> %val6
				ret <2 x i64> %sel

				}

				define <2 x i64> @fun77(<2 x i32> %val1, <2 x i32> %val2, <2 x i64> %val3, <2 x i64> %val4,
				; CHECK-LABEL: fun77:
				; CHECK: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vceqg %v0, %v28, %v30
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i64> %val5, <2 x i64> %val6) {
				%cmp0 = icmp eq <2 x i32> %val1, %val2
				%cmp1 = icmp eq <2 x i64> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i64> %val5, <2 x i64> %val6
				ret <2 x i64> %sel

				}

				define <2 x i16> @fun78(<2 x i32> %val1, <2 x i32> %val2, <2 x float> %val3, <2 x float> %val4,
				; CHECK-LABEL: fun78:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i32> %val1, %val2
				%cmp1 = fcmp ogt <2 x float> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x float> @fun79(<2 x i32> %val1, <2 x i32> %val2, <2 x double> %val3, <2 x double> %val4,
				; CHECK-LABEL: fun79:
				; CHECK: vfchdb %v1, %v28, %v30
				; CHECK-NEXT: vceqf %v0, %v24, %v26
				; CHECK-NEXT: vpkg %v1, %v1, %v1
				; CHECK-NEXT: vo %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x float> %val5, <2 x float> %val6) {
				%cmp0 = icmp eq <2 x i32> %val1, %val2
				%cmp1 = fcmp ogt <2 x double> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x float> %val5, <2 x float> %val6
				ret <2 x float> %sel

				}

				define <2 x i16> @fun80(<2 x i64> %val1, <2 x i64> %val2, <2 x i64> %val3, <2 x i64> %val4,
				; CHECK-LABEL: fun80:
				; CHECK: vceqg %v0, %v28, %v30
				; CHECK-NEXT: vceqg %v1, %v24, %v26
				; CHECK-NEXT: larl %r1, .LCPI80_0
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i64> %val1, %val2
				%cmp1 = icmp eq <2 x i64> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x i64> @fun81(<2 x i64> %val1, <2 x i64> %val2, <2 x float> %val3, <2 x float> %val4,
				; CHECK-LABEL: fun81:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vceqg %v1, %v24, %v26
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i64> %val5, <2 x i64> %val6) {
				%cmp0 = icmp eq <2 x i64> %val1, %val2
				%cmp1 = fcmp ogt <2 x float> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i64> %val5, <2 x i64> %val6
				ret <2 x i64> %sel

				}

				define <2 x i16> @fun82(<2 x i64> %val1, <2 x i64> %val2, <2 x double> %val3, <2 x double> %val4,
				; CHECK-LABEL: fun82:
				; CHECK: vfchdb %v0, %v28, %v30
				; CHECK-NEXT: vceqg %v1, %v24, %v26
				; CHECK-NEXT: larl %r1, .LCPI82_0
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i64> %val1, %val2
				%cmp1 = fcmp ogt <2 x double> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x float> @fun83(<2 x float> %val1, <2 x float> %val2, <2 x float> %val3, <2 x float> %val4,
				; CHECK-LABEL: fun83:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vmrhf %v3, %v24, %v24
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v26, %v26
				; CHECK-NEXT: vmrlf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v26, %v26
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x float> %val5, <2 x float> %val6) {
				%cmp0 = fcmp ogt <2 x float> %val1, %val2
				%cmp1 = fcmp ogt <2 x float> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x float> %val5, <2 x float> %val6
				ret <2 x float> %sel

				}

				define <2 x i32> @fun84(<2 x float> %val1, <2 x float> %val2, <2 x double> %val3, <2 x double> %val4,
				; CHECK-LABEL: fun84:
				; CHECK: vmrlf %v0, %v26, %v26
				; CHECK-NEXT: vmrlf %v1, %v24, %v24
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v26, %v26
				; CHECK-NEXT: vmrhf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vfchdb %v1, %v28, %v30
				; CHECK-NEXT: vpkg %v1, %v1, %v1
				; CHECK-NEXT: vo %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i32> %val5, <2 x i32> %val6) {
				%cmp0 = fcmp ogt <2 x float> %val1, %val2
				%cmp1 = fcmp ogt <2 x double> %val3, %val4
				%and = or <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i32> %val5, <2 x i32> %val6
				ret <2 x i32> %sel

				}

				define <4 x i16> @fun85(<4 x i32> %val1, <4 x i32> %val2, <4 x i32> %val3, <4 x i32> %val4,
				; CHECK-LABEL: fun85:
				; CHECK: vceqf %v0, %v28, %v30
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x i16> %val5, <4 x i16> %val6) {
				%cmp0 = icmp eq <4 x i32> %val1, %val2
				%cmp1 = icmp eq <4 x i32> %val3, %val4
				%and = or <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i16> %val5, <4 x i16> %val6
				ret <4 x i16> %sel

				}

				define <4 x i64> @fun86(<4 x i32> %val1, <4 x i32> %val2, <4 x i32> %val3, <4 x i32> %val4,
				; CHECK-LABEL: fun86:
				; CHECK: vceqf %v0, %v28, %v30
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v29, %v1
				; CHECK-NEXT: vsel %v26, %v27, %v31, %v0
				; CHECK-NEXT: br %r14
				<4 x i64> %val5, <4 x i64> %val6) {
				%cmp0 = icmp eq <4 x i32> %val1, %val2
				%cmp1 = icmp eq <4 x i32> %val3, %val4
				%and = or <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i64> %val5, <4 x i64> %val6
				ret <4 x i64> %sel

				}

				define <4 x i32> @fun87(<4 x i32> %val1, <4 x i32> %val2, <4 x i64> %val3, <4 x i64> %val4,
				; CHECK-LABEL: fun87:
				; CHECK: vceqg %v0, %v30, %v27
				; CHECK-NEXT: vceqg %v1, %v28, %v25
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v29, %v31, %v0
				; CHECK-NEXT: br %r14
				<4 x i32> %val5, <4 x i32> %val6) {
				%cmp0 = icmp eq <4 x i32> %val1, %val2
				%cmp1 = icmp eq <4 x i64> %val3, %val4
				%and = or <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i32> %val5, <4 x i32> %val6
				ret <4 x i32> %sel

				}

				define <4 x i16> @fun88(<4 x i32> %val1, <4 x i32> %val2, <4 x float> %val3, <4 x float> %val4,
				; CHECK-LABEL: fun88:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x i16> %val5, <4 x i16> %val6) {
				%cmp0 = icmp eq <4 x i32> %val1, %val2
				%cmp1 = fcmp ogt <4 x float> %val3, %val4
				%and = or <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i16> %val5, <4 x i16> %val6
				ret <4 x i16> %sel

				}

				define <4 x i8> @fun89(<4 x i32> %val1, <4 x i32> %val2, <4 x double> %val3, <4 x double> %val4,
				; CHECK-LABEL: fun89:
				; CHECK: vfchdb %v0, %v30, %v27
				; CHECK-NEXT: vfchdb %v1, %v28, %v25
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: larl %r1, .LCPI89_0
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v29, %v31, %v0
				; CHECK-NEXT: br %r14
				<4 x i8> %val5, <4 x i8> %val6) {
				%cmp0 = icmp eq <4 x i32> %val1, %val2
				%cmp1 = fcmp ogt <4 x double> %val3, %val4
				%and = or <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i8> %val5, <4 x i8> %val6
				ret <4 x i8> %sel

				}

				define <4 x i32> @fun90(<4 x i64> %val1, <4 x i64> %val2, <4 x i64> %val3, <4 x i64> %val4,
				; CHECK-LABEL: fun90:
				; CHECK: vceqg %v0, %v27, %v31
				; CHECK-NEXT: vceqg %v1, %v26, %v30
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vceqg %v1, %v25, %v29
				; CHECK-NEXT: vceqg %v2, %v24, %v28
				; CHECK-NEXT: vo %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<4 x i32> %val5, <4 x i32> %val6) {
				%cmp0 = icmp eq <4 x i64> %val1, %val2
				%cmp1 = icmp eq <4 x i64> %val3, %val4
				%and = or <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i32> %val5, <4 x i32> %val6
				ret <4 x i32> %sel

				}

				define <4 x i64> @fun91(<4 x i64> %val1, <4 x i64> %val2, <4 x i64> %val3, <4 x i64> %val4,
				; CHECK-LABEL: fun91:
				; CHECK: vceqg %v0, %v25, %v29
				; CHECK-NEXT: vceqg %v1, %v24, %v28
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: vceqg %v0, %v27, %v31
				; CHECK-NEXT: vceqg %v1, %v26, %v30
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<4 x i64> %val5, <4 x i64> %val6) {
				%cmp0 = icmp eq <4 x i64> %val1, %val2
				%cmp1 = icmp eq <4 x i64> %val3, %val4
				%and = or <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i64> %val5, <4 x i64> %val6
				ret <4 x i64> %sel

				}

				define <4 x i64> @fun92(<4 x i64> %val1, <4 x i64> %val2, <4 x float> %val3, <4 x float> %val4,
				; CHECK-LABEL: fun92:
				; CHECK: vmrlf %v0, %v27, %v27
				; CHECK-NEXT: vmrlf %v1, %v25, %v25
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v27, %v27
				; CHECK-NEXT: vmrhf %v2, %v25, %v25
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vceqg %v2, %v24, %v28
				; CHECK-NEXT: vo %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v29, %v2, %v1
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vceqg %v1, %v26, %v30
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vsel %v26, %v31, %v1, %v0
				; CHECK-NEXT: br %r14
				<4 x i64> %val5, <4 x i64> %val6) {
				%cmp0 = icmp eq <4 x i64> %val1, %val2
				%cmp1 = fcmp ogt <4 x float> %val3, %val4
				%and = or <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i64> %val5, <4 x i64> %val6
				ret <4 x i64> %sel

				}

				define <4 x float> @fun93(<4 x i64> %val1, <4 x i64> %val2, <4 x double> %val3, <4 x double> %val4,
				; CHECK-LABEL: fun93:
				; CHECK: vfchdb %v0, %v27, %v31
				; CHECK-NEXT: vceqg %v1, %v26, %v30
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vfchdb %v1, %v25, %v29
				; CHECK-NEXT: vceqg %v2, %v24, %v28
				; CHECK-NEXT: vo %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<4 x float> %val5, <4 x float> %val6) {
				%cmp0 = icmp eq <4 x i64> %val1, %val2
				%cmp1 = fcmp ogt <4 x double> %val3, %val4
				%and = or <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x float> %val5, <4 x float> %val6
				ret <4 x float> %sel

				}

				define <4 x i16> @fun94(<4 x float> %val1, <4 x float> %val2, <4 x float> %val3, <4 x float> %val4,
				; CHECK-LABEL: fun94:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vmrhf %v3, %v24, %v24
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v26, %v26
				; CHECK-NEXT: vmrlf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v26, %v26
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x i16> %val5, <4 x i16> %val6) {
				%cmp0 = fcmp ogt <4 x float> %val1, %val2
				%cmp1 = fcmp ogt <4 x float> %val3, %val4
				%and = or <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i16> %val5, <4 x i16> %val6
				ret <4 x i16> %sel

				}

				define <4 x double> @fun95(<4 x float> %val1, <4 x float> %val2, <4 x float> %val3, <4 x float> %val4,
				; CHECK-LABEL: fun95:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vmrhf %v3, %v24, %v24
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v26, %v26
				; CHECK-NEXT: vmrlf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v26, %v26
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v29, %v1
				; CHECK-NEXT: vsel %v26, %v27, %v31, %v0
				; CHECK-NEXT: br %r14
				<4 x double> %val5, <4 x double> %val6) {
				%cmp0 = fcmp ogt <4 x float> %val1, %val2
				%cmp1 = fcmp ogt <4 x float> %val3, %val4
				%and = or <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x double> %val5, <4 x double> %val6
				ret <4 x double> %sel

				}

				define <4 x i8> @fun96(<4 x float> %val1, <4 x float> %val2, <4 x double> %val3, <4 x double> %val4,
				; CHECK-LABEL: fun96:
				; CHECK: vfchdb %v0, %v30, %v27
				; CHECK-NEXT: vfchdb %v1, %v28, %v25
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v26, %v26
				; CHECK-NEXT: vmrlf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v26, %v26
				; CHECK-NEXT: vmrhf %v3, %v24, %v24
				; CHECK-NEXT: larl %r1, .LCPI96_0
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v29, %v31, %v0
				; CHECK-NEXT: br %r14
				<4 x i8> %val5, <4 x i8> %val6) {
				%cmp0 = fcmp ogt <4 x float> %val1, %val2
				%cmp1 = fcmp ogt <4 x double> %val3, %val4
				%and = or <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i8> %val5, <4 x i8> %val6
				ret <4 x i8> %sel

				}

				define <8 x i8> @fun97(<8 x i16> %val1, <8 x i16> %val2, <8 x i16> %val3, <8 x i16> %val4,
				; CHECK-LABEL: fun97:
				; CHECK: vceqh %v0, %v28, %v30
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vpkh %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<8 x i8> %val5, <8 x i8> %val6) {
				%cmp0 = icmp eq <8 x i16> %val1, %val2
				%cmp1 = icmp eq <8 x i16> %val3, %val4
				%and = or <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i8> %val5, <8 x i8> %val6
				ret <8 x i8> %sel

				}

				define <8 x i32> @fun98(<8 x i16> %val1, <8 x i16> %val2, <8 x i16> %val3, <8 x i16> %val4,
				; CHECK-LABEL: fun98:
				; CHECK: vceqh %v0, %v28, %v30
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vuphh %v1, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v29, %v1
				; CHECK-NEXT: vsel %v26, %v27, %v31, %v0
				; CHECK-NEXT: br %r14
				<8 x i32> %val5, <8 x i32> %val6) {
				%cmp0 = icmp eq <8 x i16> %val1, %val2
				%cmp1 = icmp eq <8 x i16> %val3, %val4
				%and = or <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i32> %val5, <8 x i32> %val6
				ret <8 x i32> %sel

				}

				define <8 x i64> @fun99(<8 x i16> %val1, <8 x i16> %val2, <8 x i32> %val3, <8 x i32> %val4,
				; CHECK-LABEL: fun99:
				; CHECK: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vceqf %v0, %v28, %v25
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vo %v0, %v2, %v0
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vuphf %v2, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v29, %v3, %v2
				; CHECK-NEXT: vl %v2, 208(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vsel %v26, %v31, %v2, %v0
				; CHECK-NEXT: vceqf %v0, %v30, %v27
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vl %v3, 160(%r15)
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v28, %v3, %v2, %v1
				; CHECK-NEXT: vl %v1, 240(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i64> %val5, <8 x i64> %val6) {
				%cmp0 = icmp eq <8 x i16> %val1, %val2
				%cmp1 = icmp eq <8 x i32> %val3, %val4
				%and = or <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i64> %val5, <8 x i64> %val6
				ret <8 x i64> %sel

				}

				define <8 x i8> @fun100(<8 x i16> %val1, <8 x i16> %val2, <8 x i64> %val3, <8 x i64> %val4,
				; CHECK-LABEL: fun100:
				; CHECK: vl %v0, 176(%r15)
				; CHECK-NEXT: vl %v1, 160(%r15)
				; CHECK-NEXT: vceqg %v0, %v27, %v0
				; CHECK-NEXT: vceqg %v1, %v25, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqg %v1, %v30, %v31
				; CHECK-NEXT: vceqg %v2, %v28, %v29
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vlrepg %v1, 200(%r15)
				; CHECK-NEXT: vlrepg %v2, 192(%r15)
				; CHECK-NEXT: vpkh %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i8> %val5, <8 x i8> %val6) {
				%cmp0 = icmp eq <8 x i16> %val1, %val2
				%cmp1 = icmp eq <8 x i64> %val3, %val4
				%and = or <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i8> %val5, <8 x i8> %val6
				ret <8 x i8> %sel

				}

				define <8 x i16> @fun101(<8 x i16> %val1, <8 x i16> %val2, <8 x float> %val3, <8 x float> %val4,
				; CHECK-LABEL: fun101:
				; CHECK: vmrlf %v0, %v27, %v27
				; CHECK-NEXT: vmrlf %v1, %v30, %v30
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v27, %v27
				; CHECK-NEXT: vmrhf %v2, %v30, %v30
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vmrhf %v3, %v28, %v28
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v25, %v25
				; CHECK-NEXT: vmrlf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v25, %v25
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v29, %v31, %v0
				; CHECK-NEXT: br %r14
				<8 x i16> %val5, <8 x i16> %val6) {
				%cmp0 = icmp eq <8 x i16> %val1, %val2
				%cmp1 = fcmp ogt <8 x float> %val3, %val4
				%and = or <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i16> %val5, <8 x i16> %val6
				ret <8 x i16> %sel

				}

				define <8 x i32> @fun102(<8 x i16> %val1, <8 x i16> %val2, <8 x double> %val3, <8 x double> %val4,
				; CHECK-LABEL: fun102:
				; CHECK: vfchdb %v0, %v30, %v31
				; CHECK-NEXT: vfchdb %v1, %v28, %v29
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vo %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v0
				; CHECK-NEXT: vl %v0, 176(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vfchdb %v0, %v27, %v0
				; CHECK-NEXT: vfchdb %v2, %v25, %v2
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vpkg %v0, %v2, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 240(%r15)
				; CHECK-NEXT: vl %v2, 208(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i32> %val5, <8 x i32> %val6) {
				%cmp0 = icmp eq <8 x i16> %val1, %val2
				%cmp1 = fcmp ogt <8 x double> %val3, %val4
				%and = or <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i32> %val5, <8 x i32> %val6
				ret <8 x i32> %sel

				}

				define <8 x i32> @fun103(<8 x i32> %val1, <8 x i32> %val2, <8 x i64> %val3, <8 x i64> %val4,
				; CHECK-LABEL: fun103:
				; CHECK: vl %v0, 176(%r15)
				; CHECK-NEXT: vl %v1, 160(%r15)
				; CHECK-NEXT: vceqg %v0, %v27, %v0
				; CHECK-NEXT: vceqg %v1, %v25, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqf %v1, %v24, %v28
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 256(%r15)
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: vl %v0, 208(%r15)
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vceqg %v0, %v31, %v0
				; CHECK-NEXT: vceqg %v1, %v29, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqf %v1, %v26, %v30
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 272(%r15)
				; CHECK-NEXT: vl %v2, 240(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i32> %val5, <8 x i32> %val6) {
				%cmp0 = icmp eq <8 x i32> %val1, %val2
				%cmp1 = icmp eq <8 x i64> %val3, %val4
				%and = or <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i32> %val5, <8 x i32> %val6
				ret <8 x i32> %sel

				}

				define <8 x double> @fun104(<8 x i32> %val1, <8 x i32> %val2, <8 x float> %val3, <8 x float> %val4,
				; CHECK-LABEL: fun104:
				; CHECK: vmrlf %v0, %v29, %v29
				; CHECK-NEXT: vmrlf %v1, %v25, %v25
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v29, %v29
				; CHECK-NEXT: vmrhf %v2, %v25, %v25
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vl %v3, 160(%r15)
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vl %v4, 192(%r15)
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqf %v1, %v24, %v28
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v1
				; CHECK-NEXT: vmrlf %v1, %v31, %v31
				; CHECK-NEXT: vmrlf %v2, %v27, %v27
				; CHECK-NEXT: vmrhf %v3, %v27, %v27
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v31, %v31
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vl %v3, 256(%r15)
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vceqf %v2, %v26, %v30
				; CHECK-NEXT: vo %v1, %v2, %v1
				; CHECK-NEXT: vuphf %v2, %v1
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 240(%r15)
				; CHECK-NEXT: vl %v3, 176(%r15)
				; CHECK-NEXT: vsel %v26, %v3, %v2, %v0
				; CHECK-NEXT: vl %v2, 208(%r15)
				; CHECK-NEXT: vmrlg %v0, %v1, %v1
				; CHECK-NEXT: vl %v1, 272(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x double> %val5, <8 x double> %val6) {
				%cmp0 = icmp eq <8 x i32> %val1, %val2
				%cmp1 = fcmp ogt <8 x float> %val3, %val4
				%and = or <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x double> %val5, <8 x double> %val6
				ret <8 x double> %sel

				}

				define <8 x double> @fun105(<8 x i32> %val1, <8 x i32> %val2, <8 x double> %val3, <8 x double> %val4,
				; CHECK-LABEL: fun105:
				; CHECK: vl %v0, 160(%r15)
				; CHECK-NEXT: vceqf %v1, %v24, %v28
				; CHECK-NEXT: vfchdb %v0, %v25, %v0
				; CHECK-NEXT: vuphf %v2, %v1
				; CHECK-NEXT: vo %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vl %v3, 224(%r15)
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v0
				; CHECK-NEXT: vl %v0, 192(%r15)
				; CHECK-NEXT: vceqf %v2, %v26, %v30
				; CHECK-NEXT: vfchdb %v0, %v29, %v0
				; CHECK-NEXT: vuphf %v3, %v2
				; CHECK-NEXT: vo %v0, %v3, %v0
				; CHECK-NEXT: vl %v3, 320(%r15)
				; CHECK-NEXT: vl %v4, 256(%r15)
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v0
				; CHECK-NEXT: vl %v0, 176(%r15)
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v27, %v0
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 304(%r15)
				; CHECK-NEXT: vl %v3, 240(%r15)
				; CHECK-NEXT: vsel %v26, %v3, %v1, %v0
				; CHECK-NEXT: vl %v0, 208(%r15)
				; CHECK-NEXT: vmrlg %v1, %v2, %v2
				; CHECK-NEXT: vfchdb %v0, %v31, %v0
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vl %v2, 272(%r15)
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 336(%r15)
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x double> %val5, <8 x double> %val6) {
				%cmp0 = icmp eq <8 x i32> %val1, %val2
				%cmp1 = fcmp ogt <8 x double> %val3, %val4
				%and = or <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x double> %val5, <8 x double> %val6
				ret <8 x double> %sel

				}

				define <8 x i64> @fun106(<8 x float> %val1, <8 x float> %val2, <8 x double> %val3, <8 x double> %val4,
				; CHECK-LABEL: fun106:
				; CHECK: vmrlf %v0, %v28, %v28
				; CHECK-NEXT: vmrlf %v1, %v24, %v24
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v28, %v28
				; CHECK-NEXT: vmrhf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vl %v3, 224(%r15)
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vl %v4, 256(%r15)
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vfchdb %v2, %v25, %v2
				; CHECK-NEXT: vo %v1, %v1, %v2
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v1
				; CHECK-NEXT: vmrlf %v1, %v30, %v30
				; CHECK-NEXT: vmrlf %v2, %v26, %v26
				; CHECK-NEXT: vmrhf %v3, %v26, %v26
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v30, %v30
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vuphf %v2, %v1
				; CHECK-NEXT: vfchdb %v3, %v29, %v3
				; CHECK-NEXT: vo %v2, %v2, %v3
				; CHECK-NEXT: vl %v3, 320(%r15)
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vl %v3, 240(%r15)
				; CHECK-NEXT: vfchdb %v2, %v27, %v2
				; CHECK-NEXT: vo %v0, %v0, %v2
				; CHECK-NEXT: vl %v2, 304(%r15)
				; CHECK-NEXT: vsel %v26, %v3, %v2, %v0
				; CHECK-NEXT: vl %v2, 272(%r15)
				; CHECK-NEXT: vmrlg %v0, %v1, %v1
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vfchdb %v1, %v31, %v1
				; CHECK-NEXT: vo %v0, %v0, %v1
				; CHECK-NEXT: vl %v1, 336(%r15)
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i64> %val5, <8 x i64> %val6) {
				%cmp0 = fcmp ogt <8 x float> %val1, %val2
				%cmp1 = fcmp ogt <8 x double> %val3, %val4
				%and = or <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i64> %val5, <8 x i64> %val6
				ret <8 x i64> %sel

				}

				define <16 x i16> @fun107(<16 x i8> %val1, <16 x i8> %val2, <16 x i8> %val3, <16 x i8> %val4,
				; CHECK-LABEL: fun107:
				; CHECK: vceqb %v0, %v28, %v30
				; CHECK-NEXT: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vuphb %v1, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v29, %v1
				; CHECK-NEXT: vsel %v26, %v27, %v31, %v0
				; CHECK-NEXT: br %r14
				<16 x i16> %val5, <16 x i16> %val6) {
				%cmp0 = icmp eq <16 x i8> %val1, %val2
				%cmp1 = icmp eq <16 x i8> %val3, %val4
				%and = or <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i16> %val5, <16 x i16> %val6
				ret <16 x i16> %sel

				}

				define <16 x i64> @fun108(<16 x i8> %val1, <16 x i8> %val2, <16 x i16> %val3, <16 x i16> %val4,
				; CHECK-LABEL: fun108:
				; CHECK: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vceqh %v0, %v28, %v25
				; CHECK-NEXT: vuphb %v2, %v1
				; CHECK-NEXT: vo %v0, %v2, %v0
				; CHECK-NEXT: vuphh %v2, %v0
				; CHECK-NEXT: vl %v3, 256(%r15)
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vsel %v24, %v29, %v3, %v2
				; CHECK-NEXT: vpkg %v2, %v0, %v0
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vl %v3, 272(%r15)
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vsel %v26, %v31, %v3, %v2
				; CHECK-NEXT: vmrlg %v2, %v0, %v0
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vsldb %v0, %v0, %v0, 12
				; CHECK-NEXT: vl %v3, 288(%r15)
				; CHECK-NEXT: vl %v4, 160(%r15)
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 304(%r15)
				; CHECK-NEXT: vl %v3, 176(%r15)
				; CHECK-NEXT: vl %v4, 192(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vsel %v0, %v3, %v2, %v0
				; CHECK-NEXT: vl %v3, 320(%r15)
				; CHECK-NEXT: vceqh %v2, %v30, %v27
				; CHECK-NEXT: vlr %v30, %v0
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vo %v1, %v1, %v2
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vsel %v25, %v4, %v3, %v2
				; CHECK-NEXT: vl %v3, 336(%r15)
				; CHECK-NEXT: vl %v4, 208(%r15)
				; CHECK-NEXT: vpkg %v2, %v1, %v1
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vsel %v27, %v4, %v3, %v2
				; CHECK-NEXT: vl %v3, 352(%r15)
				; CHECK-NEXT: vl %v4, 224(%r15)
				; CHECK-NEXT: vmrlg %v2, %v1, %v1
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vsldb %v1, %v1, %v1, 12
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vsel %v29, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 368(%r15)
				; CHECK-NEXT: vl %v3, 240(%r15)
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v31, %v3, %v2, %v1
				; CHECK-NEXT: br %r14
				<16 x i64> %val5, <16 x i64> %val6) {
				%cmp0 = icmp eq <16 x i8> %val1, %val2
				%cmp1 = icmp eq <16 x i16> %val3, %val4
				%and = or <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i64> %val5, <16 x i64> %val6
				ret <16 x i64> %sel

				}

				define <16 x i64> @fun109(<16 x i8> %val1, <16 x i8> %val2, <16 x i32> %val3, <16 x i32> %val4,
				; CHECK-LABEL: fun109:
				; CHECK: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vuphb %v2, %v1
				; CHECK-NEXT: vceqf %v0, %v28, %v29
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vo %v0, %v2, %v0
				; CHECK-NEXT: vl %v3, 320(%r15)
				; CHECK-NEXT: vl %v4, 192(%r15)
				; CHECK-NEXT: vuphf %v2, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 336(%r15)
				; CHECK-NEXT: vl %v3, 208(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v26, %v3, %v2, %v0
				; CHECK-NEXT: vpkg %v2, %v1, %v1
				; CHECK-NEXT: vuphb %v2, %v2
				; CHECK-NEXT: vceqf %v0, %v30, %v31
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vo %v0, %v2, %v0
				; CHECK-NEXT: vl %v3, 352(%r15)
				; CHECK-NEXT: vl %v4, 224(%r15)
				; CHECK-NEXT: vuphf %v2, %v0
				; CHECK-NEXT: vl %v5, 256(%r15)
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vl %v4, 384(%r15)
				; CHECK-NEXT: vmrlg %v3, %v1, %v1
				; CHECK-NEXT: vuphb %v3, %v3
				; CHECK-NEXT: vceqf %v2, %v25, %v2
				; CHECK-NEXT: vuphh %v3, %v3
				; CHECK-NEXT: vo %v2, %v3, %v2
				; CHECK-NEXT: vuphf %v3, %v2
				; CHECK-NEXT: vsldb %v1, %v1, %v1, 12
				; CHECK-NEXT: vsel %v25, %v5, %v4, %v3
				; CHECK-NEXT: vl %v3, 176(%r15)
				; CHECK-NEXT: vl %v4, 416(%r15)
				; CHECK-NEXT: vl %v5, 288(%r15)
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vceqf %v3, %v27, %v3
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vo %v1, %v1, %v3
				; CHECK-NEXT: vuphf %v3, %v1
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v29, %v5, %v4, %v3
				; CHECK-NEXT: vl %v3, 368(%r15)
				; CHECK-NEXT: vl %v4, 240(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v30, %v4, %v3, %v0
				; CHECK-NEXT: vl %v3, 272(%r15)
				; CHECK-NEXT: vmrlg %v0, %v2, %v2
				; CHECK-NEXT: vl %v2, 400(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v27, %v3, %v2, %v0
				; CHECK-NEXT: vl %v2, 304(%r15)
				; CHECK-NEXT: vmrlg %v0, %v1, %v1
				; CHECK-NEXT: vl %v1, 432(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v31, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i64> %val5, <16 x i64> %val6) {
				%cmp0 = icmp eq <16 x i8> %val1, %val2
				%cmp1 = icmp eq <16 x i32> %val3, %val4
				%and = or <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i64> %val5, <16 x i64> %val6
				ret <16 x i64> %sel

				}

				define <16 x i64> @fun110(<16 x i8> %val1, <16 x i8> %val2, <16 x i64> %val3, <16 x i64> %val4,
				; CHECK-LABEL: fun110:
				; CHECK: vl %v0, 192(%r15)
				; CHECK-NEXT: vceqg %v1, %v28, %v0
				; CHECK-NEXT: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vuphb %v2, %v0
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vo %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 448(%r15)
				; CHECK-NEXT: vl %v3, 320(%r15)
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v1
				; CHECK-NEXT: vpkf %v2, %v0, %v0
				; CHECK-NEXT: vuphb %v2, %v2
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vceqg %v1, %v30, %v1
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vo %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 464(%r15)
				; CHECK-NEXT: vl %v3, 336(%r15)
				; CHECK-NEXT: vsel %v26, %v3, %v2, %v1
				; CHECK-NEXT: vpkg %v2, %v0, %v0
				; CHECK-NEXT: vuphb %v2, %v2
				; CHECK-NEXT: vl %v1, 224(%r15)
				; CHECK-NEXT: vl %v3, 352(%r15)
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vceqg %v1, %v25, %v1
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vo %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 480(%r15)
				; CHECK-NEXT: vsel %v28, %v3, %v2, %v1
				; CHECK-NEXT: vl %v1, 240(%r15)
				; CHECK-NEXT: vl %v3, 368(%r15)
				; CHECK-NEXT: vsldb %v2, %v0, %v0, 6
				; CHECK-NEXT: vuphb %v2, %v2
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vceqg %v1, %v27, %v1
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vo %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 496(%r15)
				; CHECK-NEXT: vsel %v30, %v3, %v2, %v1
				; CHECK-NEXT: vl %v1, 256(%r15)
				; CHECK-NEXT: vl %v3, 384(%r15)
				; CHECK-NEXT: vmrlg %v2, %v0, %v0
				; CHECK-NEXT: vuphb %v2, %v2
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vceqg %v1, %v29, %v1
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vo %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 512(%r15)
				; CHECK-NEXT: vsel %v25, %v3, %v2, %v1
				; CHECK-NEXT: vl %v1, 272(%r15)
				; CHECK-NEXT: vl %v3, 400(%r15)
				; CHECK-NEXT: vsldb %v2, %v0, %v0, 10
				; CHECK-NEXT: vuphb %v2, %v2
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vceqg %v1, %v31, %v1
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vo %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 528(%r15)
				; CHECK-NEXT: vsel %v27, %v3, %v2, %v1
				; CHECK-NEXT: vl %v1, 288(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vl %v3, 416(%r15)
				; CHECK-NEXT: vceqg %v1, %v2, %v1
				; CHECK-NEXT: vsldb %v2, %v0, %v0, 12
				; CHECK-NEXT: vuphb %v2, %v2
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vsldb %v0, %v0, %v0, 14
				; CHECK-NEXT: vo %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 544(%r15)
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vsel %v29, %v3, %v2, %v1
				; CHECK-NEXT: vl %v1, 304(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vceqg %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 432(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vo %v0, %v0, %v1
				; CHECK-NEXT: vl %v1, 560(%r15)
				; CHECK-NEXT: vsel %v31, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i64> %val5, <16 x i64> %val6) {
				%cmp0 = icmp eq <16 x i8> %val1, %val2
				%cmp1 = icmp eq <16 x i64> %val3, %val4
				%and = or <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i64> %val5, <16 x i64> %val6
				ret <16 x i64> %sel

				}

				define <16 x i16> @fun111(<16 x i8> %val1, <16 x i8> %val2, <16 x float> %val3, <16 x float> %val4,
				; CHECK-LABEL: fun111:
				; CHECK: vmrlf %v0, %v31, %v31
				; CHECK-NEXT: vmrlf %v1, %v30, %v30
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v31, %v31
				; CHECK-NEXT: vmrhf %v2, %v30, %v30
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vmrhf %v3, %v28, %v28
				; CHECK-NEXT: vmrlf %v4, %v25, %v25
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v29, %v29
				; CHECK-NEXT: vmrlf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v29, %v29
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vuphb %v2, %v1
				; CHECK-NEXT: vo %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v0
				; CHECK-NEXT: vl %v0, 176(%r15)
				; CHECK-NEXT: vmrlf %v2, %v0, %v0
				; CHECK-NEXT: vmrlf %v3, %v27, %v27
				; CHECK-NEXT: vmrhf %v0, %v0, %v0
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vmrhf %v3, %v27, %v27
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v0, %v3, %v0
				; CHECK-NEXT: vpkg %v0, %v0, %v2
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vmrlf %v3, %v2, %v2
				; CHECK-NEXT: vmrhf %v2, %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vfchdb %v3, %v4, %v3
				; CHECK-NEXT: vmrhf %v4, %v25, %v25
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vfchdb %v2, %v4, %v2
				; CHECK-NEXT: vpkg %v2, %v2, %v3
				; CHECK-NEXT: vpkf %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 208(%r15)
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 240(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i16> %val5, <16 x i16> %val6) {
				%cmp0 = icmp eq <16 x i8> %val1, %val2
				%cmp1 = fcmp ogt <16 x float> %val3, %val4
				%and = or <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i16> %val5, <16 x i16> %val6
				ret <16 x i16> %sel

				}

				define <16 x i8> @fun112(<16 x i8> %val1, <16 x i8> %val2, <16 x double> %val3, <16 x double> %val4,
				; CHECK-LABEL: fun112:
				; CHECK: vl %v0, 304(%r15)
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 288(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 272(%r15)
				; CHECK-NEXT: vl %v2, 256(%r15)
				; CHECK-NEXT: vfchdb %v1, %v31, %v1
				; CHECK-NEXT: vfchdb %v2, %v29, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 240(%r15)
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vfchdb %v1, %v27, %v1
				; CHECK-NEXT: vfchdb %v2, %v25, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 208(%r15)
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vfchdb %v2, %v30, %v2
				; CHECK-NEXT: vfchdb %v3, %v28, %v3
				; CHECK-NEXT: vpkg %v2, %v3, %v2
				; CHECK-NEXT: vpkf %v1, %v2, %v1
				; CHECK-NEXT: vpkh %v0, %v1, %v0
				; CHECK-NEXT: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 336(%r15)
				; CHECK-NEXT: vl %v2, 320(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i8> %val5, <16 x i8> %val6) {
				%cmp0 = icmp eq <16 x i8> %val1, %val2
				%cmp1 = fcmp ogt <16 x double> %val3, %val4
				%and = or <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i8> %val5, <16 x i8> %val6
				ret <16 x i8> %sel

				}

				define <16 x i8> @fun113(<16 x i16> %val1, <16 x i16> %val2, <16 x i16> %val3, <16 x i16> %val4,
				; CHECK-LABEL: fun113:
				; CHECK: vceqh %v0, %v27, %v31
				; CHECK-NEXT: vceqh %v1, %v26, %v30
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v25, %v29
				; CHECK-NEXT: vceqh %v2, %v24, %v28
				; CHECK-NEXT: vo %v1, %v2, %v1
				; CHECK-NEXT: vpkh %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i8> %val5, <16 x i8> %val6) {
				%cmp0 = icmp eq <16 x i16> %val1, %val2
				%cmp1 = icmp eq <16 x i16> %val3, %val4
				%and = or <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i8> %val5, <16 x i8> %val6
				ret <16 x i8> %sel

				}

				define <16 x i16> @fun114(<16 x i16> %val1, <16 x i16> %val2, <16 x i16> %val3, <16 x i16> %val4,
				; CHECK-LABEL: fun114:
				; CHECK: vceqh %v0, %v25, %v29
				; CHECK-NEXT: vceqh %v1, %v24, %v28
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: vceqh %v0, %v27, %v31
				; CHECK-NEXT: vceqh %v1, %v26, %v30
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i16> %val5, <16 x i16> %val6) {
				%cmp0 = icmp eq <16 x i16> %val1, %val2
				%cmp1 = icmp eq <16 x i16> %val3, %val4
				%and = or <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i16> %val5, <16 x i16> %val6
				ret <16 x i16> %sel

				}

				define <16 x i32> @fun115(<16 x i16> %val1, <16 x i16> %val2, <16 x i16> %val3, <16 x i16> %val4,
				; CHECK-LABEL: fun115:
				; CHECK: vceqh %v0, %v25, %v29
				; CHECK-NEXT: vceqh %v1, %v24, %v28
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vl %v3, 160(%r15)
				; CHECK-NEXT: vuphh %v1, %v0
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v1
				; CHECK-NEXT: vceqh %v1, %v27, %v31
				; CHECK-NEXT: vceqh %v2, %v26, %v30
				; CHECK-NEXT: vo %v1, %v2, %v1
				; CHECK-NEXT: vl %v3, 256(%r15)
				; CHECK-NEXT: vl %v4, 192(%r15)
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 240(%r15)
				; CHECK-NEXT: vl %v3, 176(%r15)
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v26, %v3, %v2, %v0
				; CHECK-NEXT: vmrlg %v0, %v1, %v1
				; CHECK-NEXT: vl %v1, 272(%r15)
				; CHECK-NEXT: vl %v2, 208(%r15)
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i32> %val5, <16 x i32> %val6) {
				%cmp0 = icmp eq <16 x i16> %val1, %val2
				%cmp1 = icmp eq <16 x i16> %val3, %val4
				%and = or <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i32> %val5, <16 x i32> %val6
				ret <16 x i32> %sel

				}

				define <16 x i8> @fun116(<16 x i16> %val1, <16 x i16> %val2, <16 x i32> %val3, <16 x i32> %val4,
				; CHECK-LABEL: fun116:
				; CHECK: vl %v0, 208(%r15)
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vceqf %v0, %v31, %v0
				; CHECK-NEXT: vceqf %v1, %v29, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v26, %v30
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vceqf %v1, %v27, %v1
				; CHECK-NEXT: vceqf %v2, %v25, %v2
				; CHECK-NEXT: vpkf %v1, %v2, %v1
				; CHECK-NEXT: vceqh %v2, %v24, %v28
				; CHECK-NEXT: vo %v1, %v2, %v1
				; CHECK-NEXT: vpkh %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 240(%r15)
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i8> %val5, <16 x i8> %val6) {
				%cmp0 = icmp eq <16 x i16> %val1, %val2
				%cmp1 = icmp eq <16 x i32> %val3, %val4
				%and = or <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i8> %val5, <16 x i8> %val6
				ret <16 x i8> %sel

				}

				define <16 x i32> @fun117(<16 x i16> %val1, <16 x i16> %val2, <16 x i64> %val3, <16 x i64> %val4,
				; CHECK-LABEL: fun117:
				; CHECK: vl %v0, 240(%r15)
				; CHECK-NEXT: vl %v1, 224(%r15)
				; CHECK-NEXT: vceqg %v0, %v27, %v0
				; CHECK-NEXT: vceqg %v1, %v25, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v24, %v28
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vo %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 416(%r15)
				; CHECK-NEXT: vl %v3, 352(%r15)
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v0
				; CHECK-NEXT: vl %v0, 304(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vceqg %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vl %v3, 160(%r15)
				; CHECK-NEXT: vceqg %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v0, %v2, %v0
				; CHECK-NEXT: vceqh %v2, %v26, %v30
				; CHECK-NEXT: vuphh %v3, %v2
				; CHECK-NEXT: vo %v0, %v3, %v0
				; CHECK-NEXT: vl %v3, 448(%r15)
				; CHECK-NEXT: vl %v4, 384(%r15)
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v0
				; CHECK-NEXT: vl %v0, 272(%r15)
				; CHECK-NEXT: vl %v3, 256(%r15)
				; CHECK-NEXT: vceqg %v0, %v31, %v0
				; CHECK-NEXT: vceqg %v3, %v29, %v3
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vpkg %v0, %v3, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vl %v3, 368(%r15)
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 432(%r15)
				; CHECK-NEXT: vsel %v26, %v3, %v1, %v0
				; CHECK-NEXT: vl %v0, 336(%r15)
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vceqg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 320(%r15)
				; CHECK-NEXT: vceqg %v1, %v3, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlg %v1, %v2, %v2
				; CHECK-NEXT: vl %v2, 400(%r15)
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 464(%r15)
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i32> %val5, <16 x i32> %val6) {
				%cmp0 = icmp eq <16 x i16> %val1, %val2
				%cmp1 = icmp eq <16 x i64> %val3, %val4
				%and = or <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i32> %val5, <16 x i32> %val6
				ret <16 x i32> %sel

				}

				define <16 x double> @fun118(<16 x i16> %val1, <16 x i16> %val2, <16 x float> %val3, <16 x float> %val4,
				; CHECK-LABEL: fun118:
				; CHECK: vl %v0, 160(%r15)
				; CHECK-NEXT: vmrlf %v1, %v0, %v0
				; CHECK-NEXT: vmrlf %v2, %v25, %v25
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v0, %v0, %v0
				; CHECK-NEXT: vmrhf %v2, %v25, %v25
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vl %v3, 352(%r15)
				; CHECK-NEXT: vl %v4, 224(%r15)
				; CHECK-NEXT: vl %v5, 416(%r15)
				; CHECK-NEXT: vl %v6, 288(%r15)
				; CHECK-NEXT: vfchdb %v0, %v2, %v0
				; CHECK-NEXT: vpkg %v0, %v0, %v1
				; CHECK-NEXT: vceqh %v1, %v24, %v28
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vo %v0, %v2, %v0
				; CHECK-NEXT: vuphf %v2, %v0
				; CHECK-NEXT: vsel %v24, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vmrlf %v3, %v2, %v2
				; CHECK-NEXT: vmrlf %v4, %v27, %v27
				; CHECK-NEXT: vmrhf %v2, %v2, %v2
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vfchdb %v3, %v4, %v3
				; CHECK-NEXT: vmrhf %v4, %v27, %v27
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vfchdb %v2, %v4, %v2
				; CHECK-NEXT: vl %v4, 256(%r15)
				; CHECK-NEXT: vpkg %v2, %v2, %v3
				; CHECK-NEXT: vl %v3, 384(%r15)
				; CHECK-NEXT: vo %v1, %v1, %v2
				; CHECK-NEXT: vuphf %v2, %v1
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 192(%r15)
				; CHECK-NEXT: vmrlf %v3, %v2, %v2
				; CHECK-NEXT: vmrlf %v4, %v29, %v29
				; CHECK-NEXT: vmrhf %v2, %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vfchdb %v3, %v4, %v3
				; CHECK-NEXT: vmrhf %v4, %v29, %v29
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vfchdb %v2, %v4, %v2
				; CHECK-NEXT: vpkg %v2, %v2, %v3
				; CHECK-NEXT: vceqh %v3, %v26, %v30
				; CHECK-NEXT: vuphh %v4, %v3
				; CHECK-NEXT: vo %v2, %v4, %v2
				; CHECK-NEXT: vuphf %v4, %v2
				; CHECK-NEXT: vsel %v25, %v6, %v5, %v4
				; CHECK-NEXT: vl %v4, 208(%r15)
				; CHECK-NEXT: vmrlf %v5, %v4, %v4
				; CHECK-NEXT: vmrlf %v6, %v31, %v31
				; CHECK-NEXT: vmrhf %v4, %v4, %v4
				; CHECK-NEXT: vmrlg %v3, %v3, %v3
				; CHECK-NEXT: vuphh %v3, %v3
				; CHECK-NEXT: vldeb %v5, %v5
				; CHECK-NEXT: vldeb %v6, %v6
				; CHECK-NEXT: vfchdb %v5, %v6, %v5
				; CHECK-NEXT: vmrhf %v6, %v31, %v31
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vldeb %v6, %v6
				; CHECK-NEXT: vfchdb %v4, %v6, %v4
				; CHECK-NEXT: vl %v6, 320(%r15)
				; CHECK-NEXT: vpkg %v4, %v4, %v5
				; CHECK-NEXT: vl %v5, 448(%r15)
				; CHECK-NEXT: vo %v3, %v3, %v4
				; CHECK-NEXT: vuphf %v4, %v3
				; CHECK-NEXT: vsel %v29, %v6, %v5, %v4
				; CHECK-NEXT: vl %v4, 368(%r15)
				; CHECK-NEXT: vl %v5, 240(%r15)
				; CHECK-NEXT: vsel %v26, %v5, %v4, %v0
				; CHECK-NEXT: vl %v4, 272(%r15)
				; CHECK-NEXT: vmrlg %v0, %v1, %v1
				; CHECK-NEXT: vl %v1, 400(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v30, %v4, %v1, %v0
				; CHECK-NEXT: vl %v1, 432(%r15)
				; CHECK-NEXT: vmrlg %v0, %v2, %v2
				; CHECK-NEXT: vl %v2, 304(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v27, %v2, %v1, %v0
				; CHECK-NEXT: vl %v1, 464(%r15)
				; CHECK-NEXT: vl %v2, 336(%r15)
				; CHECK-NEXT: vmrlg %v0, %v3, %v3
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v31, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x double> %val5, <16 x double> %val6) {
				%cmp0 = icmp eq <16 x i16> %val1, %val2
				%cmp1 = fcmp ogt <16 x float> %val3, %val4
				%and = or <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x double> %val5, <16 x double> %val6
				ret <16 x double> %sel

				}

				define <16 x i32> @fun119(<16 x i16> %val1, <16 x i16> %val2, <16 x double> %val3, <16 x double> %val4,
				; CHECK-LABEL: fun119:
				; CHECK: vl %v0, 240(%r15)
				; CHECK-NEXT: vl %v1, 224(%r15)
				; CHECK-NEXT: vfchdb %v0, %v27, %v0
				; CHECK-NEXT: vfchdb %v1, %v25, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v24, %v28
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vo %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 416(%r15)
				; CHECK-NEXT: vl %v3, 352(%r15)
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v0
				; CHECK-NEXT: vl %v0, 304(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vfchdb %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vl %v3, 160(%r15)
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v0, %v2, %v0
				; CHECK-NEXT: vceqh %v2, %v26, %v30
				; CHECK-NEXT: vuphh %v3, %v2
				; CHECK-NEXT: vo %v0, %v3, %v0
				; CHECK-NEXT: vl %v3, 448(%r15)
				; CHECK-NEXT: vl %v4, 384(%r15)
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v0
				; CHECK-NEXT: vl %v0, 272(%r15)
				; CHECK-NEXT: vl %v3, 256(%r15)
				; CHECK-NEXT: vfchdb %v0, %v31, %v0
				; CHECK-NEXT: vfchdb %v3, %v29, %v3
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vpkg %v0, %v3, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vl %v3, 368(%r15)
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 432(%r15)
				; CHECK-NEXT: vsel %v26, %v3, %v1, %v0
				; CHECK-NEXT: vl %v0, 336(%r15)
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 320(%r15)
				; CHECK-NEXT: vfchdb %v1, %v3, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlg %v1, %v2, %v2
				; CHECK-NEXT: vl %v2, 400(%r15)
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vo %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 464(%r15)
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i32> %val5, <16 x i32> %val6) {
				%cmp0 = icmp eq <16 x i16> %val1, %val2
				%cmp1 = fcmp ogt <16 x double> %val3, %val4
				%and = or <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i32> %val5, <16 x i32> %val6
				ret <16 x i32> %sel

				}

				define <2 x i8> @fun120(<2 x i8> %val1, <2 x i8> %val2, <2 x i8> %val3, <2 x i8> %val4,
				; CHECK-LABEL: fun120:
				; CHECK: vceqb %v0, %v28, %v30
				; CHECK-NEXT: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i8> %val5, <2 x i8> %val6) {
				%cmp0 = icmp eq <2 x i8> %val1, %val2
				%cmp1 = icmp eq <2 x i8> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i8> %val5, <2 x i8> %val6
				ret <2 x i8> %sel

				}

				define <2 x i16> @fun121(<2 x i8> %val1, <2 x i8> %val2, <2 x i8> %val3, <2 x i8> %val4,
				; CHECK-LABEL: fun121:
				; CHECK: vceqb %v0, %v28, %v30
				; CHECK-NEXT: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i8> %val1, %val2
				%cmp1 = icmp eq <2 x i8> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x i8> @fun122(<2 x i8> %val1, <2 x i8> %val2, <2 x i16> %val3, <2 x i16> %val4,
				; CHECK-LABEL: fun122:
				; CHECK: vceqh %v1, %v28, %v30
				; CHECK-NEXT: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vpkh %v1, %v1, %v1
				; CHECK-NEXT: vx %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i8> %val5, <2 x i8> %val6) {
				%cmp0 = icmp eq <2 x i8> %val1, %val2
				%cmp1 = icmp eq <2 x i16> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i8> %val5, <2 x i8> %val6
				ret <2 x i8> %sel

				}

				define <2 x i32> @fun123(<2 x i8> %val1, <2 x i8> %val2, <2 x i32> %val3, <2 x i32> %val4,
				; CHECK-LABEL: fun123:
				; CHECK: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vceqf %v0, %v28, %v30
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i32> %val5, <2 x i32> %val6) {
				%cmp0 = icmp eq <2 x i8> %val1, %val2
				%cmp1 = icmp eq <2 x i32> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i32> %val5, <2 x i32> %val6
				ret <2 x i32> %sel

				}

				define <2 x i32> @fun124(<2 x i8> %val1, <2 x i8> %val2, <2 x i64> %val3, <2 x i64> %val4,
				; CHECK-LABEL: fun124:
				; CHECK: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vceqg %v0, %v28, %v30
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vpkg %v0, %v0, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i32> %val5, <2 x i32> %val6) {
				%cmp0 = icmp eq <2 x i8> %val1, %val2
				%cmp1 = icmp eq <2 x i64> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i32> %val5, <2 x i32> %val6
				ret <2 x i32> %sel

				}

				define <2 x i16> @fun125(<2 x i8> %val1, <2 x i8> %val2, <2 x float> %val3, <2 x float> %val4,
				; CHECK-LABEL: fun125:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i8> %val1, %val2
				%cmp1 = fcmp ogt <2 x float> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x i64> @fun126(<2 x i8> %val1, <2 x i8> %val2, <2 x double> %val3, <2 x double> %val4,
				; CHECK-LABEL: fun126:
				; CHECK: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v28, %v30
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i64> %val5, <2 x i64> %val6) {
				%cmp0 = icmp eq <2 x i8> %val1, %val2
				%cmp1 = fcmp ogt <2 x double> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i64> %val5, <2 x i64> %val6
				ret <2 x i64> %sel

				}

				define <2 x i8> @fun127(<2 x i16> %val1, <2 x i16> %val2, <2 x i16> %val3, <2 x i16> %val4,
				; CHECK-LABEL: fun127:
				; CHECK: vceqh %v0, %v28, %v30
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vpkh %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i8> %val5, <2 x i8> %val6) {
				%cmp0 = icmp eq <2 x i16> %val1, %val2
				%cmp1 = icmp eq <2 x i16> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i8> %val5, <2 x i8> %val6
				ret <2 x i8> %sel

				}

				define <2 x i16> @fun128(<2 x i16> %val1, <2 x i16> %val2, <2 x i16> %val3, <2 x i16> %val4,
				; CHECK-LABEL: fun128:
				; CHECK: vceqh %v0, %v28, %v30
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i16> %val1, %val2
				%cmp1 = icmp eq <2 x i16> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x i32> @fun129(<2 x i16> %val1, <2 x i16> %val2, <2 x i16> %val3, <2 x i16> %val4,
				; CHECK-LABEL: fun129:
				; CHECK: vceqh %v0, %v28, %v30
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i32> %val5, <2 x i32> %val6) {
				%cmp0 = icmp eq <2 x i16> %val1, %val2
				%cmp1 = icmp eq <2 x i16> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i32> %val5, <2 x i32> %val6
				ret <2 x i32> %sel

				}

				define <2 x i8> @fun130(<2 x i16> %val1, <2 x i16> %val2, <2 x i32> %val3, <2 x i32> %val4,
				; CHECK-LABEL: fun130:
				; CHECK: vceqf %v1, %v28, %v30
				; CHECK-NEXT: vceqh %v0, %v24, %v26
				; CHECK-NEXT: vpkf %v1, %v1, %v1
				; CHECK-NEXT: vx %v0, %v0, %v1
				; CHECK-NEXT: vpkh %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i8> %val5, <2 x i8> %val6) {
				%cmp0 = icmp eq <2 x i16> %val1, %val2
				%cmp1 = icmp eq <2 x i32> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i8> %val5, <2 x i8> %val6
				ret <2 x i8> %sel

				}

				define <2 x i8> @fun131(<2 x i16> %val1, <2 x i16> %val2, <2 x i64> %val3, <2 x i64> %val4,
				; CHECK-LABEL: fun131:
				; CHECK: larl %r1, .LCPI131_0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vceqg %v0, %v28, %v30
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vpkh %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i8> %val5, <2 x i8> %val6) {
				%cmp0 = icmp eq <2 x i16> %val1, %val2
				%cmp1 = icmp eq <2 x i64> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i8> %val5, <2 x i8> %val6
				ret <2 x i8> %sel

				}

				define <2 x double> @fun132(<2 x i16> %val1, <2 x i16> %val2, <2 x float> %val3, <2 x float> %val4,
				; CHECK-LABEL: fun132:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x double> %val5, <2 x double> %val6) {
				%cmp0 = icmp eq <2 x i16> %val1, %val2
				%cmp1 = fcmp ogt <2 x float> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x double> %val5, <2 x double> %val6
				ret <2 x double> %sel

				}

				define <2 x i16> @fun133(<2 x i16> %val1, <2 x i16> %val2, <2 x double> %val3, <2 x double> %val4,
				; CHECK-LABEL: fun133:
				; CHECK: larl %r1, .LCPI133_0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vfchdb %v0, %v28, %v30
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i16> %val1, %val2
				%cmp1 = fcmp ogt <2 x double> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x i16> @fun134(<2 x i32> %val1, <2 x i32> %val2, <2 x i32> %val3, <2 x i32> %val4,
				; CHECK-LABEL: fun134:
				; CHECK: vceqf %v0, %v28, %v30
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i32> %val1, %val2
				%cmp1 = icmp eq <2 x i32> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x i32> @fun135(<2 x i32> %val1, <2 x i32> %val2, <2 x i32> %val3, <2 x i32> %val4,
				; CHECK-LABEL: fun135:
				; CHECK: vceqf %v0, %v28, %v30
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i32> %val5, <2 x i32> %val6) {
				%cmp0 = icmp eq <2 x i32> %val1, %val2
				%cmp1 = icmp eq <2 x i32> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i32> %val5, <2 x i32> %val6
				ret <2 x i32> %sel

				}

				define <2 x i64> @fun136(<2 x i32> %val1, <2 x i32> %val2, <2 x i32> %val3, <2 x i32> %val4,
				; CHECK-LABEL: fun136:
				; CHECK: vceqf %v0, %v28, %v30
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i64> %val5, <2 x i64> %val6) {
				%cmp0 = icmp eq <2 x i32> %val1, %val2
				%cmp1 = icmp eq <2 x i32> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i64> %val5, <2 x i64> %val6
				ret <2 x i64> %sel

				}

				define <2 x i64> @fun137(<2 x i32> %val1, <2 x i32> %val2, <2 x i64> %val3, <2 x i64> %val4,
				; CHECK-LABEL: fun137:
				; CHECK: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vceqg %v0, %v28, %v30
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i64> %val5, <2 x i64> %val6) {
				%cmp0 = icmp eq <2 x i32> %val1, %val2
				%cmp1 = icmp eq <2 x i64> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i64> %val5, <2 x i64> %val6
				ret <2 x i64> %sel

				}

				define <2 x i16> @fun138(<2 x i32> %val1, <2 x i32> %val2, <2 x float> %val3, <2 x float> %val4,
				; CHECK-LABEL: fun138:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i32> %val1, %val2
				%cmp1 = fcmp ogt <2 x float> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x float> @fun139(<2 x i32> %val1, <2 x i32> %val2, <2 x double> %val3, <2 x double> %val4,
				; CHECK-LABEL: fun139:
				; CHECK: vfchdb %v1, %v28, %v30
				; CHECK-NEXT: vceqf %v0, %v24, %v26
				; CHECK-NEXT: vpkg %v1, %v1, %v1
				; CHECK-NEXT: vx %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x float> %val5, <2 x float> %val6) {
				%cmp0 = icmp eq <2 x i32> %val1, %val2
				%cmp1 = fcmp ogt <2 x double> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x float> %val5, <2 x float> %val6
				ret <2 x float> %sel

				}

				define <2 x i16> @fun140(<2 x i64> %val1, <2 x i64> %val2, <2 x i64> %val3, <2 x i64> %val4,
				; CHECK-LABEL: fun140:
				; CHECK: vceqg %v0, %v28, %v30
				; CHECK-NEXT: vceqg %v1, %v24, %v26
				; CHECK-NEXT: larl %r1, .LCPI140_0
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i64> %val1, %val2
				%cmp1 = icmp eq <2 x i64> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x i64> @fun141(<2 x i64> %val1, <2 x i64> %val2, <2 x float> %val3, <2 x float> %val4,
				; CHECK-LABEL: fun141:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vceqg %v1, %v24, %v26
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i64> %val5, <2 x i64> %val6) {
				%cmp0 = icmp eq <2 x i64> %val1, %val2
				%cmp1 = fcmp ogt <2 x float> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i64> %val5, <2 x i64> %val6
				ret <2 x i64> %sel

				}

				define <2 x i16> @fun142(<2 x i64> %val1, <2 x i64> %val2, <2 x double> %val3, <2 x double> %val4,
				; CHECK-LABEL: fun142:
				; CHECK: vfchdb %v0, %v28, %v30
				; CHECK-NEXT: vceqg %v1, %v24, %v26
				; CHECK-NEXT: larl %r1, .LCPI142_0
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val5, <2 x i16> %val6) {
				%cmp0 = icmp eq <2 x i64> %val1, %val2
				%cmp1 = fcmp ogt <2 x double> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i16> %val5, <2 x i16> %val6
				ret <2 x i16> %sel

				}

				define <2 x float> @fun143(<2 x float> %val1, <2 x float> %val2, <2 x float> %val3, <2 x float> %val4,
				; CHECK-LABEL: fun143:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vmrhf %v3, %v24, %v24
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v26, %v26
				; CHECK-NEXT: vmrlf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v26, %v26
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x float> %val5, <2 x float> %val6) {
				%cmp0 = fcmp ogt <2 x float> %val1, %val2
				%cmp1 = fcmp ogt <2 x float> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x float> %val5, <2 x float> %val6
				ret <2 x float> %sel

				}

				define <2 x i32> @fun144(<2 x float> %val1, <2 x float> %val2, <2 x double> %val3, <2 x double> %val4,
				; CHECK-LABEL: fun144:
				; CHECK: vmrlf %v0, %v26, %v26
				; CHECK-NEXT: vmrlf %v1, %v24, %v24
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v26, %v26
				; CHECK-NEXT: vmrhf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vfchdb %v1, %v28, %v30
				; CHECK-NEXT: vpkg %v1, %v1, %v1
				; CHECK-NEXT: vx %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<2 x i32> %val5, <2 x i32> %val6) {
				%cmp0 = fcmp ogt <2 x float> %val1, %val2
				%cmp1 = fcmp ogt <2 x double> %val3, %val4
				%and = xor <2 x i1> %cmp0, %cmp1
				%sel = select <2 x i1> %and, <2 x i32> %val5, <2 x i32> %val6
				ret <2 x i32> %sel

				}

				define <4 x i16> @fun145(<4 x i32> %val1, <4 x i32> %val2, <4 x i32> %val3, <4 x i32> %val4,
				; CHECK-LABEL: fun145:
				; CHECK: vceqf %v0, %v28, %v30
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x i16> %val5, <4 x i16> %val6) {
				%cmp0 = icmp eq <4 x i32> %val1, %val2
				%cmp1 = icmp eq <4 x i32> %val3, %val4
				%and = xor <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i16> %val5, <4 x i16> %val6
				ret <4 x i16> %sel

				}

				define <4 x i64> @fun146(<4 x i32> %val1, <4 x i32> %val2, <4 x i32> %val3, <4 x i32> %val4,
				; CHECK-LABEL: fun146:
				; CHECK: vceqf %v0, %v28, %v30
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v29, %v1
				; CHECK-NEXT: vsel %v26, %v27, %v31, %v0
				; CHECK-NEXT: br %r14
				<4 x i64> %val5, <4 x i64> %val6) {
				%cmp0 = icmp eq <4 x i32> %val1, %val2
				%cmp1 = icmp eq <4 x i32> %val3, %val4
				%and = xor <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i64> %val5, <4 x i64> %val6
				ret <4 x i64> %sel

				}

				define <4 x i32> @fun147(<4 x i32> %val1, <4 x i32> %val2, <4 x i64> %val3, <4 x i64> %val4,
				; CHECK-LABEL: fun147:
				; CHECK: vceqg %v0, %v30, %v27
				; CHECK-NEXT: vceqg %v1, %v28, %v25
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v29, %v31, %v0
				; CHECK-NEXT: br %r14
				<4 x i32> %val5, <4 x i32> %val6) {
				%cmp0 = icmp eq <4 x i32> %val1, %val2
				%cmp1 = icmp eq <4 x i64> %val3, %val4
				%and = xor <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i32> %val5, <4 x i32> %val6
				ret <4 x i32> %sel

				}

				define <4 x i16> @fun148(<4 x i32> %val1, <4 x i32> %val2, <4 x float> %val3, <4 x float> %val4,
				; CHECK-LABEL: fun148:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x i16> %val5, <4 x i16> %val6) {
				%cmp0 = icmp eq <4 x i32> %val1, %val2
				%cmp1 = fcmp ogt <4 x float> %val3, %val4
				%and = xor <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i16> %val5, <4 x i16> %val6
				ret <4 x i16> %sel

				}

				define <4 x i8> @fun149(<4 x i32> %val1, <4 x i32> %val2, <4 x double> %val3, <4 x double> %val4,
				; CHECK-LABEL: fun149:
				; CHECK: vfchdb %v0, %v30, %v27
				; CHECK-NEXT: vfchdb %v1, %v28, %v25
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqf %v1, %v24, %v26
				; CHECK-NEXT: larl %r1, .LCPI149_0
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v29, %v31, %v0
				; CHECK-NEXT: br %r14
				<4 x i8> %val5, <4 x i8> %val6) {
				%cmp0 = icmp eq <4 x i32> %val1, %val2
				%cmp1 = fcmp ogt <4 x double> %val3, %val4
				%and = xor <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i8> %val5, <4 x i8> %val6
				ret <4 x i8> %sel

				}

				define <4 x i32> @fun150(<4 x i64> %val1, <4 x i64> %val2, <4 x i64> %val3, <4 x i64> %val4,
				; CHECK-LABEL: fun150:
				; CHECK: vceqg %v0, %v27, %v31
				; CHECK-NEXT: vceqg %v1, %v26, %v30
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vceqg %v1, %v25, %v29
				; CHECK-NEXT: vceqg %v2, %v24, %v28
				; CHECK-NEXT: vx %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<4 x i32> %val5, <4 x i32> %val6) {
				%cmp0 = icmp eq <4 x i64> %val1, %val2
				%cmp1 = icmp eq <4 x i64> %val3, %val4
				%and = xor <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i32> %val5, <4 x i32> %val6
				ret <4 x i32> %sel

				}

				define <4 x i64> @fun151(<4 x i64> %val1, <4 x i64> %val2, <4 x i64> %val3, <4 x i64> %val4,
				; CHECK-LABEL: fun151:
				; CHECK: vceqg %v0, %v25, %v29
				; CHECK-NEXT: vceqg %v1, %v24, %v28
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: vceqg %v0, %v27, %v31
				; CHECK-NEXT: vceqg %v1, %v26, %v30
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<4 x i64> %val5, <4 x i64> %val6) {
				%cmp0 = icmp eq <4 x i64> %val1, %val2
				%cmp1 = icmp eq <4 x i64> %val3, %val4
				%and = xor <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i64> %val5, <4 x i64> %val6
				ret <4 x i64> %sel

				}

				define <4 x i64> @fun152(<4 x i64> %val1, <4 x i64> %val2, <4 x float> %val3, <4 x float> %val4,
				; CHECK-LABEL: fun152:
				; CHECK: vmrlf %v0, %v27, %v27
				; CHECK-NEXT: vmrlf %v1, %v25, %v25
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v27, %v27
				; CHECK-NEXT: vmrhf %v2, %v25, %v25
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vceqg %v2, %v24, %v28
				; CHECK-NEXT: vx %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v29, %v2, %v1
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vceqg %v1, %v26, %v30
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vsel %v26, %v31, %v1, %v0
				; CHECK-NEXT: br %r14
				<4 x i64> %val5, <4 x i64> %val6) {
				%cmp0 = icmp eq <4 x i64> %val1, %val2
				%cmp1 = fcmp ogt <4 x float> %val3, %val4
				%and = xor <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i64> %val5, <4 x i64> %val6
				ret <4 x i64> %sel

				}

				define <4 x float> @fun153(<4 x i64> %val1, <4 x i64> %val2, <4 x double> %val3, <4 x double> %val4,
				; CHECK-LABEL: fun153:
				; CHECK: vfchdb %v0, %v27, %v31
				; CHECK-NEXT: vceqg %v1, %v26, %v30
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vfchdb %v1, %v25, %v29
				; CHECK-NEXT: vceqg %v2, %v24, %v28
				; CHECK-NEXT: vx %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<4 x float> %val5, <4 x float> %val6) {
				%cmp0 = icmp eq <4 x i64> %val1, %val2
				%cmp1 = fcmp ogt <4 x double> %val3, %val4
				%and = xor <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x float> %val5, <4 x float> %val6
				ret <4 x float> %sel

				}

				define <4 x i16> @fun154(<4 x float> %val1, <4 x float> %val2, <4 x float> %val3, <4 x float> %val4,
				; CHECK-LABEL: fun154:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vmrhf %v3, %v24, %v24
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v26, %v26
				; CHECK-NEXT: vmrlf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v26, %v26
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x i16> %val5, <4 x i16> %val6) {
				%cmp0 = fcmp ogt <4 x float> %val1, %val2
				%cmp1 = fcmp ogt <4 x float> %val3, %val4
				%and = xor <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i16> %val5, <4 x i16> %val6
				ret <4 x i16> %sel

				}

				define <4 x double> @fun155(<4 x float> %val1, <4 x float> %val2, <4 x float> %val3, <4 x float> %val4,
				; CHECK-LABEL: fun155:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vmrhf %v3, %v24, %v24
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v26, %v26
				; CHECK-NEXT: vmrlf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v26, %v26
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v29, %v1
				; CHECK-NEXT: vsel %v26, %v27, %v31, %v0
				; CHECK-NEXT: br %r14
				<4 x double> %val5, <4 x double> %val6) {
				%cmp0 = fcmp ogt <4 x float> %val1, %val2
				%cmp1 = fcmp ogt <4 x float> %val3, %val4
				%and = xor <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x double> %val5, <4 x double> %val6
				ret <4 x double> %sel

				}

				define <4 x i8> @fun156(<4 x float> %val1, <4 x float> %val2, <4 x double> %val3, <4 x double> %val4,
				; CHECK-LABEL: fun156:
				; CHECK: vfchdb %v0, %v30, %v27
				; CHECK-NEXT: vfchdb %v1, %v28, %v25
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v26, %v26
				; CHECK-NEXT: vmrlf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v26, %v26
				; CHECK-NEXT: vmrhf %v3, %v24, %v24
				; CHECK-NEXT: larl %r1, .LCPI156_0
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v29, %v31, %v0
				; CHECK-NEXT: br %r14
				<4 x i8> %val5, <4 x i8> %val6) {
				%cmp0 = fcmp ogt <4 x float> %val1, %val2
				%cmp1 = fcmp ogt <4 x double> %val3, %val4
				%and = xor <4 x i1> %cmp0, %cmp1
				%sel = select <4 x i1> %and, <4 x i8> %val5, <4 x i8> %val6
				ret <4 x i8> %sel

				}

				define <8 x i8> @fun157(<8 x i16> %val1, <8 x i16> %val2, <8 x i16> %val3, <8 x i16> %val4,
				; CHECK-LABEL: fun157:
				; CHECK: vceqh %v0, %v28, %v30
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vpkh %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<8 x i8> %val5, <8 x i8> %val6) {
				%cmp0 = icmp eq <8 x i16> %val1, %val2
				%cmp1 = icmp eq <8 x i16> %val3, %val4
				%and = xor <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i8> %val5, <8 x i8> %val6
				ret <8 x i8> %sel

				}

				define <8 x i32> @fun158(<8 x i16> %val1, <8 x i16> %val2, <8 x i16> %val3, <8 x i16> %val4,
				; CHECK-LABEL: fun158:
				; CHECK: vceqh %v0, %v28, %v30
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vuphh %v1, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v29, %v1
				; CHECK-NEXT: vsel %v26, %v27, %v31, %v0
				; CHECK-NEXT: br %r14
				<8 x i32> %val5, <8 x i32> %val6) {
				%cmp0 = icmp eq <8 x i16> %val1, %val2
				%cmp1 = icmp eq <8 x i16> %val3, %val4
				%and = xor <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i32> %val5, <8 x i32> %val6
				ret <8 x i32> %sel

				}

				define <8 x i64> @fun159(<8 x i16> %val1, <8 x i16> %val2, <8 x i32> %val3, <8 x i32> %val4,
				; CHECK-LABEL: fun159:
				; CHECK: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vceqf %v0, %v28, %v25
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vx %v0, %v2, %v0
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vuphf %v2, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v29, %v3, %v2
				; CHECK-NEXT: vl %v2, 208(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vsel %v26, %v31, %v2, %v0
				; CHECK-NEXT: vceqf %v0, %v30, %v27
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vl %v3, 160(%r15)
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v28, %v3, %v2, %v1
				; CHECK-NEXT: vl %v1, 240(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i64> %val5, <8 x i64> %val6) {
				%cmp0 = icmp eq <8 x i16> %val1, %val2
				%cmp1 = icmp eq <8 x i32> %val3, %val4
				%and = xor <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i64> %val5, <8 x i64> %val6
				ret <8 x i64> %sel

				}

				define <8 x i8> @fun160(<8 x i16> %val1, <8 x i16> %val2, <8 x i64> %val3, <8 x i64> %val4,
				; CHECK-LABEL: fun160:
				; CHECK: vl %v0, 176(%r15)
				; CHECK-NEXT: vl %v1, 160(%r15)
				; CHECK-NEXT: vceqg %v0, %v27, %v0
				; CHECK-NEXT: vceqg %v1, %v25, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqg %v1, %v30, %v31
				; CHECK-NEXT: vceqg %v2, %v28, %v29
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vlrepg %v1, 200(%r15)
				; CHECK-NEXT: vlrepg %v2, 192(%r15)
				; CHECK-NEXT: vpkh %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i8> %val5, <8 x i8> %val6) {
				%cmp0 = icmp eq <8 x i16> %val1, %val2
				%cmp1 = icmp eq <8 x i64> %val3, %val4
				%and = xor <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i8> %val5, <8 x i8> %val6
				ret <8 x i8> %sel

				}

				define <8 x i16> @fun161(<8 x i16> %val1, <8 x i16> %val2, <8 x float> %val3, <8 x float> %val4,
				; CHECK-LABEL: fun161:
				; CHECK: vmrlf %v0, %v27, %v27
				; CHECK-NEXT: vmrlf %v1, %v30, %v30
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v27, %v27
				; CHECK-NEXT: vmrhf %v2, %v30, %v30
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vmrhf %v3, %v28, %v28
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v25, %v25
				; CHECK-NEXT: vmrlf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v25, %v25
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v29, %v31, %v0
				; CHECK-NEXT: br %r14
				<8 x i16> %val5, <8 x i16> %val6) {
				%cmp0 = icmp eq <8 x i16> %val1, %val2
				%cmp1 = fcmp ogt <8 x float> %val3, %val4
				%and = xor <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i16> %val5, <8 x i16> %val6
				ret <8 x i16> %sel

				}

				define <8 x i32> @fun162(<8 x i16> %val1, <8 x i16> %val2, <8 x double> %val3, <8 x double> %val4,
				; CHECK-LABEL: fun162:
				; CHECK: vfchdb %v0, %v30, %v31
				; CHECK-NEXT: vfchdb %v1, %v28, %v29
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v24, %v26
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vx %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v0
				; CHECK-NEXT: vl %v0, 176(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vfchdb %v0, %v27, %v0
				; CHECK-NEXT: vfchdb %v2, %v25, %v2
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vpkg %v0, %v2, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 240(%r15)
				; CHECK-NEXT: vl %v2, 208(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i32> %val5, <8 x i32> %val6) {
				%cmp0 = icmp eq <8 x i16> %val1, %val2
				%cmp1 = fcmp ogt <8 x double> %val3, %val4
				%and = xor <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i32> %val5, <8 x i32> %val6
				ret <8 x i32> %sel

				}

				define <8 x i32> @fun163(<8 x i32> %val1, <8 x i32> %val2, <8 x i64> %val3, <8 x i64> %val4,
				; CHECK-LABEL: fun163:
				; CHECK: vl %v0, 176(%r15)
				; CHECK-NEXT: vl %v1, 160(%r15)
				; CHECK-NEXT: vceqg %v0, %v27, %v0
				; CHECK-NEXT: vceqg %v1, %v25, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqf %v1, %v24, %v28
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 256(%r15)
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: vl %v0, 208(%r15)
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vceqg %v0, %v31, %v0
				; CHECK-NEXT: vceqg %v1, %v29, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqf %v1, %v26, %v30
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 272(%r15)
				; CHECK-NEXT: vl %v2, 240(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i32> %val5, <8 x i32> %val6) {
				%cmp0 = icmp eq <8 x i32> %val1, %val2
				%cmp1 = icmp eq <8 x i64> %val3, %val4
				%and = xor <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i32> %val5, <8 x i32> %val6
				ret <8 x i32> %sel

				}

				define <8 x double> @fun164(<8 x i32> %val1, <8 x i32> %val2, <8 x float> %val3, <8 x float> %val4,
				; CHECK-LABEL: fun164:
				; CHECK: vmrlf %v0, %v29, %v29
				; CHECK-NEXT: vmrlf %v1, %v25, %v25
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v29, %v29
				; CHECK-NEXT: vmrhf %v2, %v25, %v25
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vl %v3, 160(%r15)
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vl %v4, 192(%r15)
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqf %v1, %v24, %v28
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v1
				; CHECK-NEXT: vmrlf %v1, %v31, %v31
				; CHECK-NEXT: vmrlf %v2, %v27, %v27
				; CHECK-NEXT: vmrhf %v3, %v27, %v27
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v31, %v31
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vl %v3, 256(%r15)
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vceqf %v2, %v26, %v30
				; CHECK-NEXT: vx %v1, %v2, %v1
				; CHECK-NEXT: vuphf %v2, %v1
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 240(%r15)
				; CHECK-NEXT: vl %v3, 176(%r15)
				; CHECK-NEXT: vsel %v26, %v3, %v2, %v0
				; CHECK-NEXT: vl %v2, 208(%r15)
				; CHECK-NEXT: vmrlg %v0, %v1, %v1
				; CHECK-NEXT: vl %v1, 272(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x double> %val5, <8 x double> %val6) {
				%cmp0 = icmp eq <8 x i32> %val1, %val2
				%cmp1 = fcmp ogt <8 x float> %val3, %val4
				%and = xor <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x double> %val5, <8 x double> %val6
				ret <8 x double> %sel

				}

				define <8 x double> @fun165(<8 x i32> %val1, <8 x i32> %val2, <8 x double> %val3, <8 x double> %val4,
				; CHECK-LABEL: fun165:
				; CHECK: vl %v0, 160(%r15)
				; CHECK-NEXT: vceqf %v1, %v24, %v28
				; CHECK-NEXT: vfchdb %v0, %v25, %v0
				; CHECK-NEXT: vuphf %v2, %v1
				; CHECK-NEXT: vx %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vl %v3, 224(%r15)
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v0
				; CHECK-NEXT: vl %v0, 192(%r15)
				; CHECK-NEXT: vceqf %v2, %v26, %v30
				; CHECK-NEXT: vfchdb %v0, %v29, %v0
				; CHECK-NEXT: vuphf %v3, %v2
				; CHECK-NEXT: vx %v0, %v3, %v0
				; CHECK-NEXT: vl %v3, 320(%r15)
				; CHECK-NEXT: vl %v4, 256(%r15)
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v0
				; CHECK-NEXT: vl %v0, 176(%r15)
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v27, %v0
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 304(%r15)
				; CHECK-NEXT: vl %v3, 240(%r15)
				; CHECK-NEXT: vsel %v26, %v3, %v1, %v0
				; CHECK-NEXT: vl %v0, 208(%r15)
				; CHECK-NEXT: vmrlg %v1, %v2, %v2
				; CHECK-NEXT: vfchdb %v0, %v31, %v0
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vl %v2, 272(%r15)
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 336(%r15)
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x double> %val5, <8 x double> %val6) {
				%cmp0 = icmp eq <8 x i32> %val1, %val2
				%cmp1 = fcmp ogt <8 x double> %val3, %val4
				%and = xor <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x double> %val5, <8 x double> %val6
				ret <8 x double> %sel

				}

				define <8 x i64> @fun166(<8 x float> %val1, <8 x float> %val2, <8 x double> %val3, <8 x double> %val4,
				; CHECK-LABEL: fun166:
				; CHECK: vmrlf %v0, %v28, %v28
				; CHECK-NEXT: vmrlf %v1, %v24, %v24
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v28, %v28
				; CHECK-NEXT: vmrhf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vl %v3, 224(%r15)
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vl %v4, 256(%r15)
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vfchdb %v2, %v25, %v2
				; CHECK-NEXT: vx %v1, %v1, %v2
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v1
				; CHECK-NEXT: vmrlf %v1, %v30, %v30
				; CHECK-NEXT: vmrlf %v2, %v26, %v26
				; CHECK-NEXT: vmrhf %v3, %v26, %v26
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v30, %v30
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vuphf %v2, %v1
				; CHECK-NEXT: vfchdb %v3, %v29, %v3
				; CHECK-NEXT: vx %v2, %v2, %v3
				; CHECK-NEXT: vl %v3, 320(%r15)
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vl %v3, 240(%r15)
				; CHECK-NEXT: vfchdb %v2, %v27, %v2
				; CHECK-NEXT: vx %v0, %v0, %v2
				; CHECK-NEXT: vl %v2, 304(%r15)
				; CHECK-NEXT: vsel %v26, %v3, %v2, %v0
				; CHECK-NEXT: vl %v2, 272(%r15)
				; CHECK-NEXT: vmrlg %v0, %v1, %v1
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vfchdb %v1, %v31, %v1
				; CHECK-NEXT: vx %v0, %v0, %v1
				; CHECK-NEXT: vl %v1, 336(%r15)
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i64> %val5, <8 x i64> %val6) {
				%cmp0 = fcmp ogt <8 x float> %val1, %val2
				%cmp1 = fcmp ogt <8 x double> %val3, %val4
				%and = xor <8 x i1> %cmp0, %cmp1
				%sel = select <8 x i1> %and, <8 x i64> %val5, <8 x i64> %val6
				ret <8 x i64> %sel

				}

				define <16 x i16> @fun167(<16 x i8> %val1, <16 x i8> %val2, <16 x i8> %val3, <16 x i8> %val4,
				; CHECK-LABEL: fun167:
				; CHECK: vceqb %v0, %v28, %v30
				; CHECK-NEXT: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vuphb %v1, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v29, %v1
				; CHECK-NEXT: vsel %v26, %v27, %v31, %v0
				; CHECK-NEXT: br %r14
				<16 x i16> %val5, <16 x i16> %val6) {
				%cmp0 = icmp eq <16 x i8> %val1, %val2
				%cmp1 = icmp eq <16 x i8> %val3, %val4
				%and = xor <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i16> %val5, <16 x i16> %val6
				ret <16 x i16> %sel

				}

				define <16 x i64> @fun168(<16 x i8> %val1, <16 x i8> %val2, <16 x i16> %val3, <16 x i16> %val4,
				; CHECK-LABEL: fun168:
				; CHECK: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vceqh %v0, %v28, %v25
				; CHECK-NEXT: vuphb %v2, %v1
				; CHECK-NEXT: vx %v0, %v2, %v0
				; CHECK-NEXT: vuphh %v2, %v0
				; CHECK-NEXT: vl %v3, 256(%r15)
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vsel %v24, %v29, %v3, %v2
				; CHECK-NEXT: vpkg %v2, %v0, %v0
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vl %v3, 272(%r15)
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vsel %v26, %v31, %v3, %v2
				; CHECK-NEXT: vmrlg %v2, %v0, %v0
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vsldb %v0, %v0, %v0, 12
				; CHECK-NEXT: vl %v3, 288(%r15)
				; CHECK-NEXT: vl %v4, 160(%r15)
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 304(%r15)
				; CHECK-NEXT: vl %v3, 176(%r15)
				; CHECK-NEXT: vl %v4, 192(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vsel %v0, %v3, %v2, %v0
				; CHECK-NEXT: vl %v3, 320(%r15)
				; CHECK-NEXT: vceqh %v2, %v30, %v27
				; CHECK-NEXT: vlr %v30, %v0
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vx %v1, %v1, %v2
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vsel %v25, %v4, %v3, %v2
				; CHECK-NEXT: vl %v3, 336(%r15)
				; CHECK-NEXT: vl %v4, 208(%r15)
				; CHECK-NEXT: vpkg %v2, %v1, %v1
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vsel %v27, %v4, %v3, %v2
				; CHECK-NEXT: vl %v3, 352(%r15)
				; CHECK-NEXT: vl %v4, 224(%r15)
				; CHECK-NEXT: vmrlg %v2, %v1, %v1
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vsldb %v1, %v1, %v1, 12
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vsel %v29, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 368(%r15)
				; CHECK-NEXT: vl %v3, 240(%r15)
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v31, %v3, %v2, %v1
				; CHECK-NEXT: br %r14
				<16 x i64> %val5, <16 x i64> %val6) {
				%cmp0 = icmp eq <16 x i8> %val1, %val2
				%cmp1 = icmp eq <16 x i16> %val3, %val4
				%and = xor <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i64> %val5, <16 x i64> %val6
				ret <16 x i64> %sel

				}

				define <16 x i64> @fun169(<16 x i8> %val1, <16 x i8> %val2, <16 x i32> %val3, <16 x i32> %val4,
				; CHECK-LABEL: fun169:
				; CHECK: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vuphb %v2, %v1
				; CHECK-NEXT: vceqf %v0, %v28, %v29
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vx %v0, %v2, %v0
				; CHECK-NEXT: vl %v3, 320(%r15)
				; CHECK-NEXT: vl %v4, 192(%r15)
				; CHECK-NEXT: vuphf %v2, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 336(%r15)
				; CHECK-NEXT: vl %v3, 208(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v26, %v3, %v2, %v0
				; CHECK-NEXT: vpkg %v2, %v1, %v1
				; CHECK-NEXT: vuphb %v2, %v2
				; CHECK-NEXT: vceqf %v0, %v30, %v31
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vx %v0, %v2, %v0
				; CHECK-NEXT: vl %v3, 352(%r15)
				; CHECK-NEXT: vl %v4, 224(%r15)
				; CHECK-NEXT: vuphf %v2, %v0
				; CHECK-NEXT: vl %v5, 256(%r15)
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vl %v4, 384(%r15)
				; CHECK-NEXT: vmrlg %v3, %v1, %v1
				; CHECK-NEXT: vuphb %v3, %v3
				; CHECK-NEXT: vceqf %v2, %v25, %v2
				; CHECK-NEXT: vuphh %v3, %v3
				; CHECK-NEXT: vx %v2, %v3, %v2
				; CHECK-NEXT: vuphf %v3, %v2
				; CHECK-NEXT: vsldb %v1, %v1, %v1, 12
				; CHECK-NEXT: vsel %v25, %v5, %v4, %v3
				; CHECK-NEXT: vl %v3, 176(%r15)
				; CHECK-NEXT: vl %v4, 416(%r15)
				; CHECK-NEXT: vl %v5, 288(%r15)
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vceqf %v3, %v27, %v3
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vx %v1, %v1, %v3
				; CHECK-NEXT: vuphf %v3, %v1
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v29, %v5, %v4, %v3
				; CHECK-NEXT: vl %v3, 368(%r15)
				; CHECK-NEXT: vl %v4, 240(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v30, %v4, %v3, %v0
				; CHECK-NEXT: vl %v3, 272(%r15)
				; CHECK-NEXT: vmrlg %v0, %v2, %v2
				; CHECK-NEXT: vl %v2, 400(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v27, %v3, %v2, %v0
				; CHECK-NEXT: vl %v2, 304(%r15)
				; CHECK-NEXT: vmrlg %v0, %v1, %v1
				; CHECK-NEXT: vl %v1, 432(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v31, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i64> %val5, <16 x i64> %val6) {
				%cmp0 = icmp eq <16 x i8> %val1, %val2
				%cmp1 = icmp eq <16 x i32> %val3, %val4
				%and = xor <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i64> %val5, <16 x i64> %val6
				ret <16 x i64> %sel

				}

				define <16 x i64> @fun170(<16 x i8> %val1, <16 x i8> %val2, <16 x i64> %val3, <16 x i64> %val4,
				; CHECK-LABEL: fun170:
				; CHECK: vl %v0, 192(%r15)
				; CHECK-NEXT: vceqg %v1, %v28, %v0
				; CHECK-NEXT: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vuphb %v2, %v0
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vx %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 448(%r15)
				; CHECK-NEXT: vl %v3, 320(%r15)
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v1
				; CHECK-NEXT: vpkf %v2, %v0, %v0
				; CHECK-NEXT: vuphb %v2, %v2
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vceqg %v1, %v30, %v1
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vx %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 464(%r15)
				; CHECK-NEXT: vl %v3, 336(%r15)
				; CHECK-NEXT: vsel %v26, %v3, %v2, %v1
				; CHECK-NEXT: vpkg %v2, %v0, %v0
				; CHECK-NEXT: vuphb %v2, %v2
				; CHECK-NEXT: vl %v1, 224(%r15)
				; CHECK-NEXT: vl %v3, 352(%r15)
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vceqg %v1, %v25, %v1
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vx %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 480(%r15)
				; CHECK-NEXT: vsel %v28, %v3, %v2, %v1
				; CHECK-NEXT: vl %v1, 240(%r15)
				; CHECK-NEXT: vl %v3, 368(%r15)
				; CHECK-NEXT: vsldb %v2, %v0, %v0, 6
				; CHECK-NEXT: vuphb %v2, %v2
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vceqg %v1, %v27, %v1
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vx %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 496(%r15)
				; CHECK-NEXT: vsel %v30, %v3, %v2, %v1
				; CHECK-NEXT: vl %v1, 256(%r15)
				; CHECK-NEXT: vl %v3, 384(%r15)
				; CHECK-NEXT: vmrlg %v2, %v0, %v0
				; CHECK-NEXT: vuphb %v2, %v2
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vceqg %v1, %v29, %v1
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vx %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 512(%r15)
				; CHECK-NEXT: vsel %v25, %v3, %v2, %v1
				; CHECK-NEXT: vl %v1, 272(%r15)
				; CHECK-NEXT: vl %v3, 400(%r15)
				; CHECK-NEXT: vsldb %v2, %v0, %v0, 10
				; CHECK-NEXT: vuphb %v2, %v2
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vceqg %v1, %v31, %v1
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vx %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 528(%r15)
				; CHECK-NEXT: vsel %v27, %v3, %v2, %v1
				; CHECK-NEXT: vl %v1, 288(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vl %v3, 416(%r15)
				; CHECK-NEXT: vceqg %v1, %v2, %v1
				; CHECK-NEXT: vsldb %v2, %v0, %v0, 12
				; CHECK-NEXT: vuphb %v2, %v2
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vsldb %v0, %v0, %v0, 14
				; CHECK-NEXT: vx %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 544(%r15)
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vsel %v29, %v3, %v2, %v1
				; CHECK-NEXT: vl %v1, 304(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vceqg %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 432(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vx %v0, %v0, %v1
				; CHECK-NEXT: vl %v1, 560(%r15)
				; CHECK-NEXT: vsel %v31, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i64> %val5, <16 x i64> %val6) {
				%cmp0 = icmp eq <16 x i8> %val1, %val2
				%cmp1 = icmp eq <16 x i64> %val3, %val4
				%and = xor <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i64> %val5, <16 x i64> %val6
				ret <16 x i64> %sel

				}

				define <16 x i16> @fun171(<16 x i8> %val1, <16 x i8> %val2, <16 x float> %val3, <16 x float> %val4,
				; CHECK-LABEL: fun171:
				; CHECK: vmrlf %v0, %v31, %v31
				; CHECK-NEXT: vmrlf %v1, %v30, %v30
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v31, %v31
				; CHECK-NEXT: vmrhf %v2, %v30, %v30
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vmrhf %v3, %v28, %v28
				; CHECK-NEXT: vmrlf %v4, %v25, %v25
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v29, %v29
				; CHECK-NEXT: vmrlf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v29, %v29
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vuphb %v2, %v1
				; CHECK-NEXT: vx %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v0
				; CHECK-NEXT: vl %v0, 176(%r15)
				; CHECK-NEXT: vmrlf %v2, %v0, %v0
				; CHECK-NEXT: vmrlf %v3, %v27, %v27
				; CHECK-NEXT: vmrhf %v0, %v0, %v0
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vmrhf %v3, %v27, %v27
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v0, %v3, %v0
				; CHECK-NEXT: vpkg %v0, %v0, %v2
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vmrlf %v3, %v2, %v2
				; CHECK-NEXT: vmrhf %v2, %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vfchdb %v3, %v4, %v3
				; CHECK-NEXT: vmrhf %v4, %v25, %v25
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vfchdb %v2, %v4, %v2
				; CHECK-NEXT: vpkg %v2, %v2, %v3
				; CHECK-NEXT: vpkf %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 208(%r15)
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 240(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i16> %val5, <16 x i16> %val6) {
				%cmp0 = icmp eq <16 x i8> %val1, %val2
				%cmp1 = fcmp ogt <16 x float> %val3, %val4
				%and = xor <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i16> %val5, <16 x i16> %val6
				ret <16 x i16> %sel

				}

				define <16 x i8> @fun172(<16 x i8> %val1, <16 x i8> %val2, <16 x double> %val3, <16 x double> %val4,
				; CHECK-LABEL: fun172:
				; CHECK: vl %v0, 304(%r15)
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 288(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 272(%r15)
				; CHECK-NEXT: vl %v2, 256(%r15)
				; CHECK-NEXT: vfchdb %v1, %v31, %v1
				; CHECK-NEXT: vfchdb %v2, %v29, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 240(%r15)
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vfchdb %v1, %v27, %v1
				; CHECK-NEXT: vfchdb %v2, %v25, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 208(%r15)
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vfchdb %v2, %v30, %v2
				; CHECK-NEXT: vfchdb %v3, %v28, %v3
				; CHECK-NEXT: vpkg %v2, %v3, %v2
				; CHECK-NEXT: vpkf %v1, %v2, %v1
				; CHECK-NEXT: vpkh %v0, %v1, %v0
				; CHECK-NEXT: vceqb %v1, %v24, %v26
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 336(%r15)
				; CHECK-NEXT: vl %v2, 320(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i8> %val5, <16 x i8> %val6) {
				%cmp0 = icmp eq <16 x i8> %val1, %val2
				%cmp1 = fcmp ogt <16 x double> %val3, %val4
				%and = xor <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i8> %val5, <16 x i8> %val6
				ret <16 x i8> %sel

				}

				define <16 x i8> @fun173(<16 x i16> %val1, <16 x i16> %val2, <16 x i16> %val3, <16 x i16> %val4,
				; CHECK-LABEL: fun173:
				; CHECK: vceqh %v0, %v27, %v31
				; CHECK-NEXT: vceqh %v1, %v26, %v30
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v25, %v29
				; CHECK-NEXT: vceqh %v2, %v24, %v28
				; CHECK-NEXT: vx %v1, %v2, %v1
				; CHECK-NEXT: vpkh %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i8> %val5, <16 x i8> %val6) {
				%cmp0 = icmp eq <16 x i16> %val1, %val2
				%cmp1 = icmp eq <16 x i16> %val3, %val4
				%and = xor <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i8> %val5, <16 x i8> %val6
				ret <16 x i8> %sel

				}

				define <16 x i16> @fun174(<16 x i16> %val1, <16 x i16> %val2, <16 x i16> %val3, <16 x i16> %val4,
				; CHECK-LABEL: fun174:
				; CHECK: vceqh %v0, %v25, %v29
				; CHECK-NEXT: vceqh %v1, %v24, %v28
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: vceqh %v0, %v27, %v31
				; CHECK-NEXT: vceqh %v1, %v26, %v30
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i16> %val5, <16 x i16> %val6) {
				%cmp0 = icmp eq <16 x i16> %val1, %val2
				%cmp1 = icmp eq <16 x i16> %val3, %val4
				%and = xor <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i16> %val5, <16 x i16> %val6
				ret <16 x i16> %sel

				}

				define <16 x i32> @fun175(<16 x i16> %val1, <16 x i16> %val2, <16 x i16> %val3, <16 x i16> %val4,
				; CHECK-LABEL: fun175:
				; CHECK: vceqh %v0, %v25, %v29
				; CHECK-NEXT: vceqh %v1, %v24, %v28
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vl %v3, 160(%r15)
				; CHECK-NEXT: vuphh %v1, %v0
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v1
				; CHECK-NEXT: vceqh %v1, %v27, %v31
				; CHECK-NEXT: vceqh %v2, %v26, %v30
				; CHECK-NEXT: vx %v1, %v2, %v1
				; CHECK-NEXT: vl %v3, 256(%r15)
				; CHECK-NEXT: vl %v4, 192(%r15)
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 240(%r15)
				; CHECK-NEXT: vl %v3, 176(%r15)
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v26, %v3, %v2, %v0
				; CHECK-NEXT: vmrlg %v0, %v1, %v1
				; CHECK-NEXT: vl %v1, 272(%r15)
				; CHECK-NEXT: vl %v2, 208(%r15)
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i32> %val5, <16 x i32> %val6) {
				%cmp0 = icmp eq <16 x i16> %val1, %val2
				%cmp1 = icmp eq <16 x i16> %val3, %val4
				%and = xor <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i32> %val5, <16 x i32> %val6
				ret <16 x i32> %sel

				}

				define <16 x i8> @fun176(<16 x i16> %val1, <16 x i16> %val2, <16 x i32> %val3, <16 x i32> %val4,
				; CHECK-LABEL: fun176:
				; CHECK: vl %v0, 208(%r15)
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vceqf %v0, %v31, %v0
				; CHECK-NEXT: vceqf %v1, %v29, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v26, %v30
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vceqf %v1, %v27, %v1
				; CHECK-NEXT: vceqf %v2, %v25, %v2
				; CHECK-NEXT: vpkf %v1, %v2, %v1
				; CHECK-NEXT: vceqh %v2, %v24, %v28
				; CHECK-NEXT: vx %v1, %v2, %v1
				; CHECK-NEXT: vpkh %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 240(%r15)
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i8> %val5, <16 x i8> %val6) {
				%cmp0 = icmp eq <16 x i16> %val1, %val2
				%cmp1 = icmp eq <16 x i32> %val3, %val4
				%and = xor <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i8> %val5, <16 x i8> %val6
				ret <16 x i8> %sel

				}

				define <16 x i32> @fun177(<16 x i16> %val1, <16 x i16> %val2, <16 x i64> %val3, <16 x i64> %val4,
				; CHECK-LABEL: fun177:
				; CHECK: vl %v0, 240(%r15)
				; CHECK-NEXT: vl %v1, 224(%r15)
				; CHECK-NEXT: vceqg %v0, %v27, %v0
				; CHECK-NEXT: vceqg %v1, %v25, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v24, %v28
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vx %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 416(%r15)
				; CHECK-NEXT: vl %v3, 352(%r15)
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v0
				; CHECK-NEXT: vl %v0, 304(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vceqg %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vl %v3, 160(%r15)
				; CHECK-NEXT: vceqg %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v0, %v2, %v0
				; CHECK-NEXT: vceqh %v2, %v26, %v30
				; CHECK-NEXT: vuphh %v3, %v2
				; CHECK-NEXT: vx %v0, %v3, %v0
				; CHECK-NEXT: vl %v3, 448(%r15)
				; CHECK-NEXT: vl %v4, 384(%r15)
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v0
				; CHECK-NEXT: vl %v0, 272(%r15)
				; CHECK-NEXT: vl %v3, 256(%r15)
				; CHECK-NEXT: vceqg %v0, %v31, %v0
				; CHECK-NEXT: vceqg %v3, %v29, %v3
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vpkg %v0, %v3, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vl %v3, 368(%r15)
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 432(%r15)
				; CHECK-NEXT: vsel %v26, %v3, %v1, %v0
				; CHECK-NEXT: vl %v0, 336(%r15)
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vceqg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 320(%r15)
				; CHECK-NEXT: vceqg %v1, %v3, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlg %v1, %v2, %v2
				; CHECK-NEXT: vl %v2, 400(%r15)
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 464(%r15)
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i32> %val5, <16 x i32> %val6) {
				%cmp0 = icmp eq <16 x i16> %val1, %val2
				%cmp1 = icmp eq <16 x i64> %val3, %val4
				%and = xor <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i32> %val5, <16 x i32> %val6
				ret <16 x i32> %sel

				}

				define <16 x double> @fun178(<16 x i16> %val1, <16 x i16> %val2, <16 x float> %val3, <16 x float> %val4,
				; CHECK-LABEL: fun178:
				; CHECK: vl %v0, 160(%r15)
				; CHECK-NEXT: vmrlf %v1, %v0, %v0
				; CHECK-NEXT: vmrlf %v2, %v25, %v25
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v0, %v0, %v0
				; CHECK-NEXT: vmrhf %v2, %v25, %v25
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vl %v3, 352(%r15)
				; CHECK-NEXT: vl %v4, 224(%r15)
				; CHECK-NEXT: vl %v5, 416(%r15)
				; CHECK-NEXT: vl %v6, 288(%r15)
				; CHECK-NEXT: vfchdb %v0, %v2, %v0
				; CHECK-NEXT: vpkg %v0, %v0, %v1
				; CHECK-NEXT: vceqh %v1, %v24, %v28
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vx %v0, %v2, %v0
				; CHECK-NEXT: vuphf %v2, %v0
				; CHECK-NEXT: vsel %v24, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vmrlf %v3, %v2, %v2
				; CHECK-NEXT: vmrlf %v4, %v27, %v27
				; CHECK-NEXT: vmrhf %v2, %v2, %v2
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vfchdb %v3, %v4, %v3
				; CHECK-NEXT: vmrhf %v4, %v27, %v27
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vfchdb %v2, %v4, %v2
				; CHECK-NEXT: vl %v4, 256(%r15)
				; CHECK-NEXT: vpkg %v2, %v2, %v3
				; CHECK-NEXT: vl %v3, 384(%r15)
				; CHECK-NEXT: vx %v1, %v1, %v2
				; CHECK-NEXT: vuphf %v2, %v1
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v2
				; CHECK-NEXT: vl %v2, 192(%r15)
				; CHECK-NEXT: vmrlf %v3, %v2, %v2
				; CHECK-NEXT: vmrlf %v4, %v29, %v29
				; CHECK-NEXT: vmrhf %v2, %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vfchdb %v3, %v4, %v3
				; CHECK-NEXT: vmrhf %v4, %v29, %v29
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vfchdb %v2, %v4, %v2
				; CHECK-NEXT: vpkg %v2, %v2, %v3
				; CHECK-NEXT: vceqh %v3, %v26, %v30
				; CHECK-NEXT: vuphh %v4, %v3
				; CHECK-NEXT: vx %v2, %v4, %v2
				; CHECK-NEXT: vuphf %v4, %v2
				; CHECK-NEXT: vsel %v25, %v6, %v5, %v4
				; CHECK-NEXT: vl %v4, 208(%r15)
				; CHECK-NEXT: vmrlf %v5, %v4, %v4
				; CHECK-NEXT: vmrlf %v6, %v31, %v31
				; CHECK-NEXT: vmrhf %v4, %v4, %v4
				; CHECK-NEXT: vmrlg %v3, %v3, %v3
				; CHECK-NEXT: vuphh %v3, %v3
				; CHECK-NEXT: vldeb %v5, %v5
				; CHECK-NEXT: vldeb %v6, %v6
				; CHECK-NEXT: vfchdb %v5, %v6, %v5
				; CHECK-NEXT: vmrhf %v6, %v31, %v31
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vldeb %v6, %v6
				; CHECK-NEXT: vfchdb %v4, %v6, %v4
				; CHECK-NEXT: vl %v6, 320(%r15)
				; CHECK-NEXT: vpkg %v4, %v4, %v5
				; CHECK-NEXT: vl %v5, 448(%r15)
				; CHECK-NEXT: vx %v3, %v3, %v4
				; CHECK-NEXT: vuphf %v4, %v3
				; CHECK-NEXT: vsel %v29, %v6, %v5, %v4
				; CHECK-NEXT: vl %v4, 368(%r15)
				; CHECK-NEXT: vl %v5, 240(%r15)
				; CHECK-NEXT: vsel %v26, %v5, %v4, %v0
				; CHECK-NEXT: vl %v4, 272(%r15)
				; CHECK-NEXT: vmrlg %v0, %v1, %v1
				; CHECK-NEXT: vl %v1, 400(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v30, %v4, %v1, %v0
				; CHECK-NEXT: vl %v1, 432(%r15)
				; CHECK-NEXT: vmrlg %v0, %v2, %v2
				; CHECK-NEXT: vl %v2, 304(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v27, %v2, %v1, %v0
				; CHECK-NEXT: vl %v1, 464(%r15)
				; CHECK-NEXT: vl %v2, 336(%r15)
				; CHECK-NEXT: vmrlg %v0, %v3, %v3
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v31, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x double> %val5, <16 x double> %val6) {
				%cmp0 = icmp eq <16 x i16> %val1, %val2
				%cmp1 = fcmp ogt <16 x float> %val3, %val4
				%and = xor <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x double> %val5, <16 x double> %val6
				ret <16 x double> %sel

				}

				define <16 x i32> @fun179(<16 x i16> %val1, <16 x i16> %val2, <16 x double> %val3, <16 x double> %val4,
				; CHECK-LABEL: fun179:
				; CHECK: vl %v0, 240(%r15)
				; CHECK-NEXT: vl %v1, 224(%r15)
				; CHECK-NEXT: vfchdb %v0, %v27, %v0
				; CHECK-NEXT: vfchdb %v1, %v25, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqh %v1, %v24, %v28
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vx %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 416(%r15)
				; CHECK-NEXT: vl %v3, 352(%r15)
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v0
				; CHECK-NEXT: vl %v0, 304(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vfchdb %v0, %v2, %v0
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vl %v3, 160(%r15)
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v0, %v2, %v0
				; CHECK-NEXT: vceqh %v2, %v26, %v30
				; CHECK-NEXT: vuphh %v3, %v2
				; CHECK-NEXT: vx %v0, %v3, %v0
				; CHECK-NEXT: vl %v3, 448(%r15)
				; CHECK-NEXT: vl %v4, 384(%r15)
				; CHECK-NEXT: vsel %v28, %v4, %v3, %v0
				; CHECK-NEXT: vl %v0, 272(%r15)
				; CHECK-NEXT: vl %v3, 256(%r15)
				; CHECK-NEXT: vfchdb %v0, %v31, %v0
				; CHECK-NEXT: vfchdb %v3, %v29, %v3
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vpkg %v0, %v3, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vl %v3, 368(%r15)
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 432(%r15)
				; CHECK-NEXT: vsel %v26, %v3, %v1, %v0
				; CHECK-NEXT: vl %v0, 336(%r15)
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 320(%r15)
				; CHECK-NEXT: vfchdb %v1, %v3, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlg %v1, %v2, %v2
				; CHECK-NEXT: vl %v2, 400(%r15)
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vx %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 464(%r15)
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i32> %val5, <16 x i32> %val6) {
				%cmp0 = icmp eq <16 x i16> %val1, %val2
				%cmp1 = fcmp ogt <16 x double> %val3, %val4
				%and = xor <16 x i1> %cmp0, %cmp1
				%sel = select <16 x i1> %and, <16 x i32> %val5, <16 x i32> %val6
				ret <16 x i32> %sel

				}

test/CodeGen/SystemZ/vec-cmpsel.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; Test that vector compare / select combinations do not produce any
				; unnecessary pack /unpack / shift instructions.
				;
				; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z13 \| FileCheck %s

				define <2 x i8> @fun0(<2 x i8> %val1, <2 x i8> %val2,
				; CHECK-LABEL: fun0:
				; CHECK: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x i8> %val3, <2 x i8> %val4) {
				%cmp = icmp eq <2 x i8> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x i8> %val3, <2 x i8> %val4
				ret <2 x i8> %sel

				}

				define <2 x i16> @fun1(<2 x i8> %val1, <2 x i8> %val2,
				; CHECK-LABEL: fun1:
				; CHECK: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val3, <2 x i16> %val4) {
				%cmp = icmp eq <2 x i8> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x i16> %val3, <2 x i16> %val4
				ret <2 x i16> %sel

				}

				define <2 x i32> @fun2(<2 x i8> %val1, <2 x i8> %val2,
				; CHECK-LABEL: fun2:
				; CHECK: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x i32> %val3, <2 x i32> %val4) {
				%cmp = icmp eq <2 x i8> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x i32> %val3, <2 x i32> %val4
				ret <2 x i32> %sel

				}

				define <2 x i64> @fun3(<2 x i8> %val1, <2 x i8> %val2,
				; CHECK-LABEL: fun3:
				; CHECK: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x i64> %val3, <2 x i64> %val4) {
				%cmp = icmp eq <2 x i8> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x i64> %val3, <2 x i64> %val4
				ret <2 x i64> %sel

				}

				define <2 x float> @fun4(<2 x i8> %val1, <2 x i8> %val2,
				; CHECK-LABEL: fun4:
				; CHECK: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x float> %val3, <2 x float> %val4) {
				%cmp = icmp eq <2 x i8> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x float> %val3, <2 x float> %val4
				ret <2 x float> %sel

				}

				define <2 x double> @fun5(<2 x i8> %val1, <2 x i8> %val2,
				; CHECK-LABEL: fun5:
				; CHECK: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x double> %val3, <2 x double> %val4) {
				%cmp = icmp eq <2 x i8> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x double> %val3, <2 x double> %val4
				ret <2 x double> %sel

				}

				define <2 x i8> @fun6(<2 x i16> %val1, <2 x i16> %val2,
				; CHECK-LABEL: fun6:
				; CHECK: vceqh %v0, %v24, %v26
				; CHECK-NEXT: vpkh %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x i8> %val3, <2 x i8> %val4) {
				%cmp = icmp eq <2 x i16> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x i8> %val3, <2 x i8> %val4
				ret <2 x i8> %sel

				}

				define <2 x i16> @fun7(<2 x i16> %val1, <2 x i16> %val2,
				; CHECK-LABEL: fun7:
				; CHECK: vceqh %v0, %v24, %v26
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val3, <2 x i16> %val4) {
				%cmp = icmp eq <2 x i16> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x i16> %val3, <2 x i16> %val4
				ret <2 x i16> %sel

				}

				define <2 x i32> @fun8(<2 x i16> %val1, <2 x i16> %val2,
				; CHECK-LABEL: fun8:
				; CHECK: vceqh %v0, %v24, %v26
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x i32> %val3, <2 x i32> %val4) {
				%cmp = icmp eq <2 x i16> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x i32> %val3, <2 x i32> %val4
				ret <2 x i32> %sel

				}

				define <2 x i64> @fun9(<2 x i16> %val1, <2 x i16> %val2,
				; CHECK-LABEL: fun9:
				; CHECK: vceqh %v0, %v24, %v26
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x i64> %val3, <2 x i64> %val4) {
				%cmp = icmp eq <2 x i16> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x i64> %val3, <2 x i64> %val4
				ret <2 x i64> %sel

				}

				define <2 x float> @fun10(<2 x i16> %val1, <2 x i16> %val2,
				; CHECK-LABEL: fun10:
				; CHECK: vceqh %v0, %v24, %v26
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x float> %val3, <2 x float> %val4) {
				%cmp = icmp eq <2 x i16> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x float> %val3, <2 x float> %val4
				ret <2 x float> %sel

				}

				define <2 x double> @fun11(<2 x i16> %val1, <2 x i16> %val2,
				; CHECK-LABEL: fun11:
				; CHECK: vceqh %v0, %v24, %v26
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x double> %val3, <2 x double> %val4) {
				%cmp = icmp eq <2 x i16> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x double> %val3, <2 x double> %val4
				ret <2 x double> %sel

				}

				define <2 x i8> @fun12(<2 x i32> %val1, <2 x i32> %val2,
				; CHECK-LABEL: fun12:
				; CHECK: larl %r1, .LCPI12_0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vceqf %v0, %v24, %v26
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x i8> %val3, <2 x i8> %val4) {
				%cmp = icmp eq <2 x i32> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x i8> %val3, <2 x i8> %val4
				ret <2 x i8> %sel

				}

				define <2 x i16> @fun13(<2 x i32> %val1, <2 x i32> %val2,
				; CHECK-LABEL: fun13:
				; CHECK: vceqf %v0, %v24, %v26
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val3, <2 x i16> %val4) {
				%cmp = icmp eq <2 x i32> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x i16> %val3, <2 x i16> %val4
				ret <2 x i16> %sel

				}

				define <2 x i64> @fun14(<2 x i32> %val1, <2 x i32> %val2,
				; CHECK-LABEL: fun14:
				; CHECK: vceqf %v0, %v24, %v26
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x i64> %val3, <2 x i64> %val4) {
				%cmp = icmp eq <2 x i32> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x i64> %val3, <2 x i64> %val4
				ret <2 x i64> %sel

				}

				define <2 x double> @fun15(<2 x i32> %val1, <2 x i32> %val2,
				; CHECK-LABEL: fun15:
				; CHECK: vceqf %v0, %v24, %v26
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x double> %val3, <2 x double> %val4) {
				%cmp = icmp eq <2 x i32> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x double> %val3, <2 x double> %val4
				ret <2 x double> %sel

				}

				define <2 x i8> @fun16(<2 x i64> %val1, <2 x i64> %val2,
				; CHECK-LABEL: fun16:
				; CHECK: vceqg %v0, %v24, %v26
				; CHECK-NEXT: vrepih %v1, 1807
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x i8> %val3, <2 x i8> %val4) {
				%cmp = icmp eq <2 x i64> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x i8> %val3, <2 x i8> %val4
				ret <2 x i8> %sel

				}

				define <2 x i16> @fun17(<2 x i64> %val1, <2 x i64> %val2,
				; CHECK-LABEL: fun17:
				; CHECK: larl %r1, .LCPI17_0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vceqg %v0, %v24, %v26
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val3, <2 x i16> %val4) {
				%cmp = icmp eq <2 x i64> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x i16> %val3, <2 x i16> %val4
				ret <2 x i16> %sel

				}

				define <2 x i32> @fun18(<2 x i64> %val1, <2 x i64> %val2,
				; CHECK-LABEL: fun18:
				; CHECK: vceqg %v0, %v24, %v26
				; CHECK-NEXT: vpkg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x i32> %val3, <2 x i32> %val4) {
				%cmp = icmp eq <2 x i64> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x i32> %val3, <2 x i32> %val4
				ret <2 x i32> %sel

				}

				define <2 x float> @fun19(<2 x i64> %val1, <2 x i64> %val2,
				; CHECK-LABEL: fun19:
				; CHECK: vceqg %v0, %v24, %v26
				; CHECK-NEXT: vpkg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x float> %val3, <2 x float> %val4) {
				%cmp = icmp eq <2 x i64> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x float> %val3, <2 x float> %val4
				ret <2 x float> %sel

				}

				define <4 x i8> @fun20(<4 x i8> %val1, <4 x i8> %val2,
				; CHECK-LABEL: fun20:
				; CHECK: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<4 x i8> %val3, <4 x i8> %val4) {
				%cmp = icmp eq <4 x i8> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x i8> %val3, <4 x i8> %val4
				ret <4 x i8> %sel

				}

				define <4 x i16> @fun21(<4 x i8> %val1, <4 x i8> %val2,
				; CHECK-LABEL: fun21:
				; CHECK: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<4 x i16> %val3, <4 x i16> %val4) {
				%cmp = icmp eq <4 x i8> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x i16> %val3, <4 x i16> %val4
				ret <4 x i16> %sel

				}

				define <4 x i32> @fun22(<4 x i8> %val1, <4 x i8> %val2,
				; CHECK-LABEL: fun22:
				; CHECK: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<4 x i32> %val3, <4 x i32> %val4) {
				%cmp = icmp eq <4 x i8> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x i32> %val3, <4 x i32> %val4
				ret <4 x i32> %sel

				}

				define <4 x i64> @fun23(<4 x i8> %val1, <4 x i8> %val2,
				; CHECK-LABEL: fun23:
				; CHECK: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vuphb %v1, %v0
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v25, %v1
				; CHECK-NEXT: vsel %v26, %v30, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x i64> %val3, <4 x i64> %val4) {
				%cmp = icmp eq <4 x i8> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x i64> %val3, <4 x i64> %val4
				ret <4 x i64> %sel

				}

				define <4 x float> @fun24(<4 x i8> %val1, <4 x i8> %val2,
				; CHECK-LABEL: fun24:
				; CHECK: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<4 x float> %val3, <4 x float> %val4) {
				%cmp = icmp eq <4 x i8> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x float> %val3, <4 x float> %val4
				ret <4 x float> %sel

				}

				define <4 x double> @fun25(<4 x i8> %val1, <4 x i8> %val2,
				; CHECK-LABEL: fun25:
				; CHECK: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vuphb %v1, %v0
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v25, %v1
				; CHECK-NEXT: vsel %v26, %v30, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x double> %val3, <4 x double> %val4) {
				%cmp = icmp eq <4 x i8> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x double> %val3, <4 x double> %val4
				ret <4 x double> %sel

				}

				define <4 x i8> @fun26(<4 x i16> %val1, <4 x i16> %val2,
				; CHECK-LABEL: fun26:
				; CHECK: vceqh %v0, %v24, %v26
				; CHECK-NEXT: vpkh %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<4 x i8> %val3, <4 x i8> %val4) {
				%cmp = icmp eq <4 x i16> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x i8> %val3, <4 x i8> %val4
				ret <4 x i8> %sel

				}

				define <4 x i16> @fun27(<4 x i16> %val1, <4 x i16> %val2,
				; CHECK-LABEL: fun27:
				; CHECK: vceqh %v0, %v24, %v26
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<4 x i16> %val3, <4 x i16> %val4) {
				%cmp = icmp eq <4 x i16> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x i16> %val3, <4 x i16> %val4
				ret <4 x i16> %sel

				}

				define <4 x i32> @fun28(<4 x i16> %val1, <4 x i16> %val2,
				; CHECK-LABEL: fun28:
				; CHECK: vceqh %v0, %v24, %v26
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<4 x i32> %val3, <4 x i32> %val4) {
				%cmp = icmp eq <4 x i16> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x i32> %val3, <4 x i32> %val4
				ret <4 x i32> %sel

				}

				define <4 x i64> @fun29(<4 x i16> %val1, <4 x i16> %val2,
				; CHECK-LABEL: fun29:
				; CHECK: vceqh %v0, %v24, %v26
				; CHECK-NEXT: vuphh %v1, %v0
				; CHECK-NEXT: vpkg %v0, %v0, %v0
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v25, %v1
				; CHECK-NEXT: vsel %v26, %v30, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x i64> %val3, <4 x i64> %val4) {
				%cmp = icmp eq <4 x i16> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x i64> %val3, <4 x i64> %val4
				ret <4 x i64> %sel

				}

				define <4 x float> @fun30(<4 x i16> %val1, <4 x i16> %val2,
				; CHECK-LABEL: fun30:
				; CHECK: vceqh %v0, %v24, %v26
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<4 x float> %val3, <4 x float> %val4) {
				%cmp = icmp eq <4 x i16> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x float> %val3, <4 x float> %val4
				ret <4 x float> %sel

				}

				define <4 x double> @fun31(<4 x i16> %val1, <4 x i16> %val2,
				; CHECK-LABEL: fun31:
				; CHECK: vceqh %v0, %v24, %v26
				; CHECK-NEXT: vuphh %v1, %v0
				; CHECK-NEXT: vpkg %v0, %v0, %v0
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v25, %v1
				; CHECK-NEXT: vsel %v26, %v30, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x double> %val3, <4 x double> %val4) {
				%cmp = icmp eq <4 x i16> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x double> %val3, <4 x double> %val4
				ret <4 x double> %sel

				}

				define <4 x i8> @fun32(<4 x i32> %val1, <4 x i32> %val2,
				; CHECK-LABEL: fun32:
				; CHECK: larl %r1, .LCPI32_0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vceqf %v0, %v24, %v26
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<4 x i8> %val3, <4 x i8> %val4) {
				%cmp = icmp eq <4 x i32> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x i8> %val3, <4 x i8> %val4
				ret <4 x i8> %sel

				}

				define <4 x i16> @fun33(<4 x i32> %val1, <4 x i32> %val2,
				; CHECK-LABEL: fun33:
				; CHECK: vceqf %v0, %v24, %v26
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<4 x i16> %val3, <4 x i16> %val4) {
				%cmp = icmp eq <4 x i32> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x i16> %val3, <4 x i16> %val4
				ret <4 x i16> %sel

				}

				define <4 x i64> @fun34(<4 x i32> %val1, <4 x i32> %val2,
				; CHECK-LABEL: fun34:
				; CHECK: vceqf %v0, %v24, %v26
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v25, %v1
				; CHECK-NEXT: vsel %v26, %v30, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x i64> %val3, <4 x i64> %val4) {
				%cmp = icmp eq <4 x i32> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x i64> %val3, <4 x i64> %val4
				ret <4 x i64> %sel

				}

				define <4 x double> @fun35(<4 x i32> %val1, <4 x i32> %val2,
				; CHECK-LABEL: fun35:
				; CHECK: vceqf %v0, %v24, %v26
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v25, %v1
				; CHECK-NEXT: vsel %v26, %v30, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x double> %val3, <4 x double> %val4) {
				%cmp = icmp eq <4 x i32> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x double> %val3, <4 x double> %val4
				ret <4 x double> %sel

				}

				define <4 x i8> @fun36(<4 x i64> %val1, <4 x i64> %val2,
				; CHECK-LABEL: fun36:
				; CHECK: larl %r1, .LCPI36_0
				; CHECK-NEXT: vl %v2, 0(%r1)
				; CHECK-NEXT: vceqg %v0, %v26, %v30
				; CHECK-NEXT: vceqg %v1, %v24, %v28
				; CHECK-NEXT: vperm %v0, %v1, %v0, %v2
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x i8> %val3, <4 x i8> %val4) {
				%cmp = icmp eq <4 x i64> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x i8> %val3, <4 x i8> %val4
				ret <4 x i8> %sel

				}

				define <4 x i16> @fun37(<4 x i64> %val1, <4 x i64> %val2,
				; CHECK-LABEL: fun37:
				; CHECK: larl %r1, .LCPI37_0
				; CHECK-NEXT: vl %v2, 0(%r1)
				; CHECK-NEXT: vceqg %v0, %v26, %v30
				; CHECK-NEXT: vceqg %v1, %v24, %v28
				; CHECK-NEXT: vperm %v0, %v1, %v0, %v2
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x i16> %val3, <4 x i16> %val4) {
				%cmp = icmp eq <4 x i64> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x i16> %val3, <4 x i16> %val4
				ret <4 x i16> %sel

				}

				define <4 x i32> @fun38(<4 x i64> %val1, <4 x i64> %val2,
				; CHECK-LABEL: fun38:
				; CHECK: vceqg %v0, %v26, %v30
				; CHECK-NEXT: vceqg %v1, %v24, %v28
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x i32> %val3, <4 x i32> %val4) {
				%cmp = icmp eq <4 x i64> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x i32> %val3, <4 x i32> %val4
				ret <4 x i32> %sel

				}

				define <4 x float> @fun39(<4 x i64> %val1, <4 x i64> %val2,
				; CHECK-LABEL: fun39:
				; CHECK: vceqg %v0, %v26, %v30
				; CHECK-NEXT: vceqg %v1, %v24, %v28
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x float> %val3, <4 x float> %val4) {
				%cmp = icmp eq <4 x i64> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x float> %val3, <4 x float> %val4
				ret <4 x float> %sel

				}

				define <8 x i8> @fun40(<8 x i8> %val1, <8 x i8> %val2,
				; CHECK-LABEL: fun40:
				; CHECK: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<8 x i8> %val3, <8 x i8> %val4) {
				%cmp = icmp eq <8 x i8> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x i8> %val3, <8 x i8> %val4
				ret <8 x i8> %sel

				}

				define <8 x i16> @fun41(<8 x i8> %val1, <8 x i8> %val2,
				; CHECK-LABEL: fun41:
				; CHECK: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<8 x i16> %val3, <8 x i16> %val4) {
				%cmp = icmp eq <8 x i8> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x i16> %val3, <8 x i16> %val4
				ret <8 x i16> %sel

				}

				define <8 x i32> @fun42(<8 x i8> %val1, <8 x i8> %val2,
				; CHECK-LABEL: fun42:
				; CHECK: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vuphb %v1, %v0
				; CHECK-NEXT: vpkg %v0, %v0, %v0
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v25, %v1
				; CHECK-NEXT: vsel %v26, %v30, %v27, %v0
				; CHECK-NEXT: br %r14
				<8 x i32> %val3, <8 x i32> %val4) {
				%cmp = icmp eq <8 x i8> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x i32> %val3, <8 x i32> %val4
				ret <8 x i32> %sel

				}

				define <8 x i64> @fun43(<8 x i8> %val1, <8 x i8> %val2,
				; CHECK-LABEL: fun43:
				; CHECK: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vuphb %v1, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v24, %v28, %v29, %v1
				; CHECK-NEXT: vpkf %v1, %v0, %v0
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v26, %v30, %v31, %v1
				; CHECK-NEXT: vpkg %v1, %v0, %v0
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vsldb %v0, %v0, %v0, 6
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v28, %v25, %v2, %v1
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v30, %v27, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i64> %val3, <8 x i64> %val4) {
				%cmp = icmp eq <8 x i8> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x i64> %val3, <8 x i64> %val4
				ret <8 x i64> %sel

				}

				define <8 x float> @fun44(<8 x i8> %val1, <8 x i8> %val2,
				; CHECK-LABEL: fun44:
				; CHECK: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vuphb %v1, %v0
				; CHECK-NEXT: vpkg %v0, %v0, %v0
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v25, %v1
				; CHECK-NEXT: vsel %v26, %v30, %v27, %v0
				; CHECK-NEXT: br %r14
				<8 x float> %val3, <8 x float> %val4) {
				%cmp = icmp eq <8 x i8> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x float> %val3, <8 x float> %val4
				ret <8 x float> %sel

				}

				define <8 x double> @fun45(<8 x i8> %val1, <8 x i8> %val2,
				; CHECK-LABEL: fun45:
				; CHECK: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vuphb %v1, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v24, %v28, %v29, %v1
				; CHECK-NEXT: vpkf %v1, %v0, %v0
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v26, %v30, %v31, %v1
				; CHECK-NEXT: vpkg %v1, %v0, %v0
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vsldb %v0, %v0, %v0, 6
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v28, %v25, %v2, %v1
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v30, %v27, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x double> %val3, <8 x double> %val4) {
				%cmp = icmp eq <8 x i8> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x double> %val3, <8 x double> %val4
				ret <8 x double> %sel

				}

				define <8 x i8> @fun46(<8 x i16> %val1, <8 x i16> %val2,
				; CHECK-LABEL: fun46:
				; CHECK: vceqh %v0, %v24, %v26
				; CHECK-NEXT: vpkh %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<8 x i8> %val3, <8 x i8> %val4) {
				%cmp = icmp eq <8 x i16> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x i8> %val3, <8 x i8> %val4
				ret <8 x i8> %sel

				}

				define <8 x i32> @fun47(<8 x i16> %val1, <8 x i16> %val2,
				; CHECK-LABEL: fun47:
				; CHECK: vceqh %v0, %v24, %v26
				; CHECK-NEXT: vuphh %v1, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v25, %v1
				; CHECK-NEXT: vsel %v26, %v30, %v27, %v0
				; CHECK-NEXT: br %r14
				<8 x i32> %val3, <8 x i32> %val4) {
				%cmp = icmp eq <8 x i16> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x i32> %val3, <8 x i32> %val4
				ret <8 x i32> %sel

				}

				define <8 x i64> @fun48(<8 x i16> %val1, <8 x i16> %val2,
				; CHECK-LABEL: fun48:
				; CHECK: vceqh %v0, %v24, %v26
				; CHECK-NEXT: vuphh %v1, %v0
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v24, %v28, %v29, %v1
				; CHECK-NEXT: vpkg %v1, %v0, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v26, %v30, %v31, %v1
				; CHECK-NEXT: vmrlg %v1, %v0, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vsldb %v0, %v0, %v0, 12
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v28, %v25, %v2, %v1
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v30, %v27, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i64> %val3, <8 x i64> %val4) {
				%cmp = icmp eq <8 x i16> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x i64> %val3, <8 x i64> %val4
				ret <8 x i64> %sel

				}

				define <8 x float> @fun49(<8 x i16> %val1, <8 x i16> %val2,
				; CHECK-LABEL: fun49:
				; CHECK: vceqh %v0, %v24, %v26
				; CHECK-NEXT: vuphh %v1, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v25, %v1
				; CHECK-NEXT: vsel %v26, %v30, %v27, %v0
				; CHECK-NEXT: br %r14
				<8 x float> %val3, <8 x float> %val4) {
				%cmp = icmp eq <8 x i16> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x float> %val3, <8 x float> %val4
				ret <8 x float> %sel

				}

				define <8 x double> @fun50(<8 x i16> %val1, <8 x i16> %val2,
				; CHECK-LABEL: fun50:
				; CHECK: vceqh %v0, %v24, %v26
				; CHECK-NEXT: vuphh %v1, %v0
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v24, %v28, %v29, %v1
				; CHECK-NEXT: vpkg %v1, %v0, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v26, %v30, %v31, %v1
				; CHECK-NEXT: vmrlg %v1, %v0, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vsldb %v0, %v0, %v0, 12
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v28, %v25, %v2, %v1
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v30, %v27, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x double> %val3, <8 x double> %val4) {
				%cmp = icmp eq <8 x i16> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x double> %val3, <8 x double> %val4
				ret <8 x double> %sel

				}

				define <8 x i8> @fun51(<8 x i32> %val1, <8 x i32> %val2,
				; CHECK-LABEL: fun51:
				; CHECK: larl %r1, .LCPI51_0
				; CHECK-NEXT: vl %v2, 0(%r1)
				; CHECK-NEXT: vceqf %v0, %v26, %v30
				; CHECK-NEXT: vceqf %v1, %v24, %v28
				; CHECK-NEXT: vperm %v0, %v1, %v0, %v2
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<8 x i8> %val3, <8 x i8> %val4) {
				%cmp = icmp eq <8 x i32> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x i8> %val3, <8 x i8> %val4
				ret <8 x i8> %sel

				}

				define <8 x i16> @fun52(<8 x i32> %val1, <8 x i32> %val2,
				; CHECK-LABEL: fun52:
				; CHECK: vceqf %v0, %v26, %v30
				; CHECK-NEXT: vceqf %v1, %v24, %v28
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<8 x i16> %val3, <8 x i16> %val4) {
				%cmp = icmp eq <8 x i32> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x i16> %val3, <8 x i16> %val4
				ret <8 x i16> %sel

				}

				define <8 x i64> @fun53(<8 x i32> %val1, <8 x i32> %val2,
				; CHECK-LABEL: fun53:
				; CHECK: vceqf %v0, %v24, %v28
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v2, %v1
				; CHECK-NEXT: vceqf %v1, %v26, %v30
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vuphf %v2, %v1
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v28, %v29, %v3, %v2
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v26, %v27, %v2, %v0
				; CHECK-NEXT: vmrlg %v0, %v1, %v1
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v30, %v31, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i64> %val3, <8 x i64> %val4) {
				%cmp = icmp eq <8 x i32> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x i64> %val3, <8 x i64> %val4
				ret <8 x i64> %sel

				}

				define <8 x double> @fun54(<8 x i32> %val1, <8 x i32> %val2,
				; CHECK-LABEL: fun54:
				; CHECK: vceqf %v0, %v24, %v28
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v2, %v1
				; CHECK-NEXT: vceqf %v1, %v26, %v30
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vuphf %v2, %v1
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v28, %v29, %v3, %v2
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v26, %v27, %v2, %v0
				; CHECK-NEXT: vmrlg %v0, %v1, %v1
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v30, %v31, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x double> %val3, <8 x double> %val4) {
				%cmp = icmp eq <8 x i32> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x double> %val3, <8 x double> %val4
				ret <8 x double> %sel

				}

				define <8 x i8> @fun55(<8 x i64> %val1, <8 x i64> %val2,
				; CHECK-LABEL: fun55:
				; CHECK: vceqg %v0, %v30, %v31
				; CHECK-NEXT: vceqg %v1, %v28, %v29
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqg %v1, %v26, %v27
				; CHECK-NEXT: vceqg %v2, %v24, %v25
				; CHECK-NEXT: larl %r1, .LCPI55_0
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 0(%r1)
				; CHECK-NEXT: vperm %v0, %v1, %v0, %v2
				; CHECK-NEXT: vlrepg %v1, 168(%r15)
				; CHECK-NEXT: vlrepg %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i8> %val3, <8 x i8> %val4) {
				%cmp = icmp eq <8 x i64> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x i8> %val3, <8 x i8> %val4
				ret <8 x i8> %sel

				}

				define <8 x i16> @fun56(<8 x i64> %val1, <8 x i64> %val2,
				; CHECK-LABEL: fun56:
				; CHECK: vceqg %v0, %v30, %v31
				; CHECK-NEXT: vceqg %v1, %v28, %v29
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vceqg %v1, %v26, %v27
				; CHECK-NEXT: vceqg %v2, %v24, %v25
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i16> %val3, <8 x i16> %val4) {
				%cmp = icmp eq <8 x i64> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x i16> %val3, <8 x i16> %val4
				ret <8 x i16> %sel

				}

				define <8 x i32> @fun57(<8 x i64> %val1, <8 x i64> %val2,
				; CHECK-LABEL: fun57:
				; CHECK: vceqg %v0, %v26, %v27
				; CHECK-NEXT: vceqg %v1, %v24, %v25
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: vceqg %v0, %v30, %v31
				; CHECK-NEXT: vceqg %v1, %v28, %v29
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i32> %val3, <8 x i32> %val4) {
				%cmp = icmp eq <8 x i64> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x i32> %val3, <8 x i32> %val4
				ret <8 x i32> %sel

				}

				define <8 x float> @fun58(<8 x i64> %val1, <8 x i64> %val2,
				; CHECK-LABEL: fun58:
				; CHECK: vceqg %v0, %v26, %v27
				; CHECK-NEXT: vceqg %v1, %v24, %v25
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: vceqg %v0, %v30, %v31
				; CHECK-NEXT: vceqg %v1, %v28, %v29
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x float> %val3, <8 x float> %val4) {
				%cmp = icmp eq <8 x i64> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x float> %val3, <8 x float> %val4
				ret <8 x float> %sel

				}

				define <16 x i16> @fun59(<16 x i8> %val1, <16 x i8> %val2,
				; CHECK-LABEL: fun59:
				; CHECK: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vuphb %v1, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v25, %v1
				; CHECK-NEXT: vsel %v26, %v30, %v27, %v0
				; CHECK-NEXT: br %r14
				<16 x i16> %val3, <16 x i16> %val4) {
				%cmp = icmp eq <16 x i8> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x i16> %val3, <16 x i16> %val4
				ret <16 x i16> %sel

				}

				define <16 x i32> @fun60(<16 x i8> %val1, <16 x i8> %val2,
				; CHECK-LABEL: fun60:
				; CHECK: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vuphb %v1, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vsel %v24, %v28, %v29, %v1
				; CHECK-NEXT: vpkg %v1, %v0, %v0
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vsel %v26, %v30, %v31, %v1
				; CHECK-NEXT: vmrlg %v1, %v0, %v0
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vsldb %v0, %v0, %v0, 12
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vsel %v28, %v25, %v2, %v1
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v30, %v27, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i32> %val3, <16 x i32> %val4) {
				%cmp = icmp eq <16 x i8> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x i32> %val3, <16 x i32> %val4
				ret <16 x i32> %sel

				}

				define <16 x i64> @fun61(<16 x i8> %val1, <16 x i8> %val2,
				; CHECK-LABEL: fun61:
				; CHECK: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vuphb %v1, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vl %v2, 192(%r15)
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v24, %v28, %v2, %v1
				; CHECK-NEXT: vpkf %v1, %v0, %v0
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vl %v2, 208(%r15)
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v26, %v30, %v2, %v1
				; CHECK-NEXT: vpkg %v1, %v0, %v0
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vl %v3, 160(%r15)
				; CHECK-NEXT: vsel %v28, %v25, %v2, %v1
				; CHECK-NEXT: vl %v2, 240(%r15)
				; CHECK-NEXT: vsldb %v1, %v0, %v0, 6
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v30, %v27, %v2, %v1
				; CHECK-NEXT: vl %v2, 256(%r15)
				; CHECK-NEXT: vmrlg %v1, %v0, %v0
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v25, %v29, %v2, %v1
				; CHECK-NEXT: vl %v2, 272(%r15)
				; CHECK-NEXT: vsldb %v1, %v0, %v0, 10
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v27, %v31, %v2, %v1
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vsldb %v1, %v0, %v0, 12
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vsldb %v0, %v0, %v0, 14
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v29, %v3, %v2, %v1
				; CHECK-NEXT: vl %v1, 304(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v31, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i64> %val3, <16 x i64> %val4) {
				%cmp = icmp eq <16 x i8> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x i64> %val3, <16 x i64> %val4
				ret <16 x i64> %sel

				}

				define <16 x float> @fun62(<16 x i8> %val1, <16 x i8> %val2,
				; CHECK-LABEL: fun62:
				; CHECK: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vuphb %v1, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vsel %v24, %v28, %v29, %v1
				; CHECK-NEXT: vpkg %v1, %v0, %v0
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vsel %v26, %v30, %v31, %v1
				; CHECK-NEXT: vmrlg %v1, %v0, %v0
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vsldb %v0, %v0, %v0, 12
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vsel %v28, %v25, %v2, %v1
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v30, %v27, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x float> %val3, <16 x float> %val4) {
				%cmp = icmp eq <16 x i8> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x float> %val3, <16 x float> %val4
				ret <16 x float> %sel

				}

				define <16 x double> @fun63(<16 x i8> %val1, <16 x i8> %val2,
				; CHECK-LABEL: fun63:
				; CHECK: vceqb %v0, %v24, %v26
				; CHECK-NEXT: vuphb %v1, %v0
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vl %v2, 192(%r15)
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v24, %v28, %v2, %v1
				; CHECK-NEXT: vpkf %v1, %v0, %v0
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vl %v2, 208(%r15)
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v26, %v30, %v2, %v1
				; CHECK-NEXT: vpkg %v1, %v0, %v0
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vl %v3, 160(%r15)
				; CHECK-NEXT: vsel %v28, %v25, %v2, %v1
				; CHECK-NEXT: vl %v2, 240(%r15)
				; CHECK-NEXT: vsldb %v1, %v0, %v0, 6
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v30, %v27, %v2, %v1
				; CHECK-NEXT: vl %v2, 256(%r15)
				; CHECK-NEXT: vmrlg %v1, %v0, %v0
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v25, %v29, %v2, %v1
				; CHECK-NEXT: vl %v2, 272(%r15)
				; CHECK-NEXT: vsldb %v1, %v0, %v0, 10
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v27, %v31, %v2, %v1
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vsldb %v1, %v0, %v0, 12
				; CHECK-NEXT: vuphb %v1, %v1
				; CHECK-NEXT: vsldb %v0, %v0, %v0, 14
				; CHECK-NEXT: vuphh %v1, %v1
				; CHECK-NEXT: vuphb %v0, %v0
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v29, %v3, %v2, %v1
				; CHECK-NEXT: vl %v1, 304(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v31, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x double> %val3, <16 x double> %val4) {
				%cmp = icmp eq <16 x i8> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x double> %val3, <16 x double> %val4
				ret <16 x double> %sel

				}

				define <16 x i8> @fun64(<16 x i16> %val1, <16 x i16> %val2,
				; CHECK-LABEL: fun64:
				; CHECK: vceqh %v0, %v26, %v30
				; CHECK-NEXT: vceqh %v1, %v24, %v28
				; CHECK-NEXT: vpkh %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<16 x i8> %val3, <16 x i8> %val4) {
				%cmp = icmp eq <16 x i16> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x i8> %val3, <16 x i8> %val4
				ret <16 x i8> %sel

				}

				define <16 x i32> @fun65(<16 x i16> %val1, <16 x i16> %val2,
				; CHECK-LABEL: fun65:
				; CHECK: vceqh %v0, %v24, %v28
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vuphh %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v2, %v1
				; CHECK-NEXT: vceqh %v1, %v26, %v30
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v28, %v29, %v3, %v2
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v26, %v27, %v2, %v0
				; CHECK-NEXT: vmrlg %v0, %v1, %v1
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v30, %v31, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i32> %val3, <16 x i32> %val4) {
				%cmp = icmp eq <16 x i16> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x i32> %val3, <16 x i32> %val4
				ret <16 x i32> %sel

				}

				define <16 x i64> @fun66(<16 x i16> %val1, <16 x i16> %val2,
				; CHECK-LABEL: fun66:
				; CHECK: vceqh %v0, %v24, %v28
				; CHECK-NEXT: vuphh %v1, %v0
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v24, %v25, %v2, %v1
				; CHECK-NEXT: vceqh %v1, %v26, %v30
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vl %v3, 288(%r15)
				; CHECK-NEXT: vl %v4, 160(%r15)
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vsel %v25, %v4, %v3, %v2
				; CHECK-NEXT: vpkg %v2, %v0, %v0
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vl %v3, 240(%r15)
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vsel %v26, %v27, %v3, %v2
				; CHECK-NEXT: vmrlg %v2, %v0, %v0
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vsldb %v0, %v0, %v0, 12
				; CHECK-NEXT: vl %v3, 256(%r15)
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v28, %v29, %v3, %v2
				; CHECK-NEXT: vl %v2, 272(%r15)
				; CHECK-NEXT: vl %v3, 176(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v30, %v31, %v2, %v0
				; CHECK-NEXT: vl %v2, 304(%r15)
				; CHECK-NEXT: vpkg %v0, %v1, %v1
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v27, %v3, %v2, %v0
				; CHECK-NEXT: vl %v2, 320(%r15)
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vmrlg %v0, %v1, %v1
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v29, %v3, %v2, %v0
				; CHECK-NEXT: vl %v2, 208(%r15)
				; CHECK-NEXT: vsldb %v0, %v1, %v1, 12
				; CHECK-NEXT: vl %v1, 336(%r15)
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v31, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i64> %val3, <16 x i64> %val4) {
				%cmp = icmp eq <16 x i16> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x i64> %val3, <16 x i64> %val4
				ret <16 x i64> %sel

				}

				define <16 x float> @fun67(<16 x i16> %val1, <16 x i16> %val2,
				; CHECK-LABEL: fun67:
				; CHECK: vceqh %v0, %v24, %v28
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vuphh %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v2, %v1
				; CHECK-NEXT: vceqh %v1, %v26, %v30
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v28, %v29, %v3, %v2
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v26, %v27, %v2, %v0
				; CHECK-NEXT: vmrlg %v0, %v1, %v1
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v30, %v31, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x float> %val3, <16 x float> %val4) {
				%cmp = icmp eq <16 x i16> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x float> %val3, <16 x float> %val4
				ret <16 x float> %sel

				}

				define <16 x double> @fun68(<16 x i16> %val1, <16 x i16> %val2,
				; CHECK-LABEL: fun68:
				; CHECK: vceqh %v0, %v24, %v28
				; CHECK-NEXT: vuphh %v1, %v0
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v24, %v25, %v2, %v1
				; CHECK-NEXT: vceqh %v1, %v26, %v30
				; CHECK-NEXT: vuphh %v2, %v1
				; CHECK-NEXT: vl %v3, 288(%r15)
				; CHECK-NEXT: vl %v4, 160(%r15)
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vsel %v25, %v4, %v3, %v2
				; CHECK-NEXT: vpkg %v2, %v0, %v0
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vl %v3, 240(%r15)
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vsel %v26, %v27, %v3, %v2
				; CHECK-NEXT: vmrlg %v2, %v0, %v0
				; CHECK-NEXT: vuphh %v2, %v2
				; CHECK-NEXT: vsldb %v0, %v0, %v0, 12
				; CHECK-NEXT: vl %v3, 256(%r15)
				; CHECK-NEXT: vuphf %v2, %v2
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vsel %v28, %v29, %v3, %v2
				; CHECK-NEXT: vl %v2, 272(%r15)
				; CHECK-NEXT: vl %v3, 176(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v30, %v31, %v2, %v0
				; CHECK-NEXT: vl %v2, 304(%r15)
				; CHECK-NEXT: vpkg %v0, %v1, %v1
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v27, %v3, %v2, %v0
				; CHECK-NEXT: vl %v2, 320(%r15)
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vmrlg %v0, %v1, %v1
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v29, %v3, %v2, %v0
				; CHECK-NEXT: vl %v2, 208(%r15)
				; CHECK-NEXT: vsldb %v0, %v1, %v1, 12
				; CHECK-NEXT: vl %v1, 336(%r15)
				; CHECK-NEXT: vuphh %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v31, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x double> %val3, <16 x double> %val4) {
				%cmp = icmp eq <16 x i16> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x double> %val3, <16 x double> %val4
				ret <16 x double> %sel

				}

				define <16 x i8> @fun69(<16 x i32> %val1, <16 x i32> %val2,
				; CHECK-LABEL: fun69:
				; CHECK: vceqf %v0, %v30, %v31
				; CHECK-NEXT: vceqf %v1, %v28, %v29
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vceqf %v1, %v26, %v27
				; CHECK-NEXT: vceqf %v2, %v24, %v25
				; CHECK-NEXT: vpkf %v1, %v2, %v1
				; CHECK-NEXT: vpkh %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i8> %val3, <16 x i8> %val4) {
				%cmp = icmp eq <16 x i32> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x i8> %val3, <16 x i8> %val4
				ret <16 x i8> %sel

				}

				define <16 x i16> @fun70(<16 x i32> %val1, <16 x i32> %val2,
				; CHECK-LABEL: fun70:
				; CHECK: vceqf %v0, %v26, %v27
				; CHECK-NEXT: vceqf %v1, %v24, %v25
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: vceqf %v0, %v30, %v31
				; CHECK-NEXT: vceqf %v1, %v28, %v29
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i16> %val3, <16 x i16> %val4) {
				%cmp = icmp eq <16 x i32> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x i16> %val3, <16 x i16> %val4
				ret <16 x i16> %sel

				}

				define <16 x i64> @fun71(<16 x i32> %val1, <16 x i32> %val2,
				; CHECK-LABEL: fun71:
				; CHECK: vceqf %v1, %v24, %v25
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vl %v3, 160(%r15)
				; CHECK-NEXT: vuphf %v0, %v1
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v0
				; CHECK-NEXT: vceqf %v2, %v26, %v27
				; CHECK-NEXT: vl %v3, 320(%r15)
				; CHECK-NEXT: vl %v4, 192(%r15)
				; CHECK-NEXT: vuphf %v0, %v2
				; CHECK-NEXT: vsel %v0, %v4, %v3, %v0
				; CHECK-NEXT: vceqf %v3, %v28, %v29
				; CHECK-NEXT: vl %v5, 352(%r15)
				; CHECK-NEXT: vl %v6, 224(%r15)
				; CHECK-NEXT: vuphf %v4, %v3
				; CHECK-NEXT: vsel %v25, %v6, %v5, %v4
				; CHECK-NEXT: vceqf %v4, %v30, %v31
				; CHECK-NEXT: vl %v6, 384(%r15)
				; CHECK-NEXT: vl %v7, 256(%r15)
				; CHECK-NEXT: vuphf %v5, %v4
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vsel %v29, %v7, %v6, %v5
				; CHECK-NEXT: vl %v5, 304(%r15)
				; CHECK-NEXT: vl %v6, 176(%r15)
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v26, %v6, %v5, %v1
				; CHECK-NEXT: vmrlg %v1, %v2, %v2
				; CHECK-NEXT: vl %v2, 336(%r15)
				; CHECK-NEXT: vl %v5, 208(%r15)
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v30, %v5, %v2, %v1
				; CHECK-NEXT: vmrlg %v1, %v3, %v3
				; CHECK-NEXT: vl %v2, 368(%r15)
				; CHECK-NEXT: vl %v3, 240(%r15)
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vlr %v28, %v0
				; CHECK-NEXT: vsel %v27, %v3, %v2, %v1
				; CHECK-NEXT: vl %v2, 400(%r15)
				; CHECK-NEXT: vl %v3, 272(%r15)
				; CHECK-NEXT: vmrlg %v1, %v4, %v4
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v31, %v3, %v2, %v1
				; CHECK-NEXT: br %r14
				<16 x i64> %val3, <16 x i64> %val4) {
				%cmp = icmp eq <16 x i32> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x i64> %val3, <16 x i64> %val4
				ret <16 x i64> %sel

				}

				define <16 x double> @fun72(<16 x i32> %val1, <16 x i32> %val2,
				; CHECK-LABEL: fun72:
				; CHECK: vceqf %v1, %v24, %v25
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vl %v3, 160(%r15)
				; CHECK-NEXT: vuphf %v0, %v1
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v0
				; CHECK-NEXT: vceqf %v2, %v26, %v27
				; CHECK-NEXT: vl %v3, 320(%r15)
				; CHECK-NEXT: vl %v4, 192(%r15)
				; CHECK-NEXT: vuphf %v0, %v2
				; CHECK-NEXT: vsel %v0, %v4, %v3, %v0
				; CHECK-NEXT: vceqf %v3, %v28, %v29
				; CHECK-NEXT: vl %v5, 352(%r15)
				; CHECK-NEXT: vl %v6, 224(%r15)
				; CHECK-NEXT: vuphf %v4, %v3
				; CHECK-NEXT: vsel %v25, %v6, %v5, %v4
				; CHECK-NEXT: vceqf %v4, %v30, %v31
				; CHECK-NEXT: vl %v6, 384(%r15)
				; CHECK-NEXT: vl %v7, 256(%r15)
				; CHECK-NEXT: vuphf %v5, %v4
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vsel %v29, %v7, %v6, %v5
				; CHECK-NEXT: vl %v5, 304(%r15)
				; CHECK-NEXT: vl %v6, 176(%r15)
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v26, %v6, %v5, %v1
				; CHECK-NEXT: vmrlg %v1, %v2, %v2
				; CHECK-NEXT: vl %v2, 336(%r15)
				; CHECK-NEXT: vl %v5, 208(%r15)
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v30, %v5, %v2, %v1
				; CHECK-NEXT: vmrlg %v1, %v3, %v3
				; CHECK-NEXT: vl %v2, 368(%r15)
				; CHECK-NEXT: vl %v3, 240(%r15)
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vlr %v28, %v0
				; CHECK-NEXT: vsel %v27, %v3, %v2, %v1
				; CHECK-NEXT: vl %v2, 400(%r15)
				; CHECK-NEXT: vl %v3, 272(%r15)
				; CHECK-NEXT: vmrlg %v1, %v4, %v4
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v31, %v3, %v2, %v1
				; CHECK-NEXT: br %r14
				<16 x double> %val3, <16 x double> %val4) {
				%cmp = icmp eq <16 x i32> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x double> %val3, <16 x double> %val4
				ret <16 x double> %sel

				}

				define <16 x i8> @fun73(<16 x i64> %val1, <16 x i64> %val2,
				; CHECK-LABEL: fun73:
				; CHECK: vl %v0, 272(%r15)
				; CHECK-NEXT: vl %v1, 256(%r15)
				; CHECK-NEXT: vceqg %v0, %v31, %v0
				; CHECK-NEXT: vceqg %v1, %v29, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 240(%r15)
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vceqg %v1, %v27, %v1
				; CHECK-NEXT: vceqg %v2, %v25, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vl %v2, 192(%r15)
				; CHECK-NEXT: vceqg %v1, %v30, %v1
				; CHECK-NEXT: vceqg %v2, %v28, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vl %v3, 160(%r15)
				; CHECK-NEXT: vceqg %v2, %v26, %v2
				; CHECK-NEXT: vceqg %v3, %v24, %v3
				; CHECK-NEXT: vpkg %v2, %v3, %v2
				; CHECK-NEXT: vpkf %v1, %v2, %v1
				; CHECK-NEXT: vpkh %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 304(%r15)
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i8> %val3, <16 x i8> %val4) {
				%cmp = icmp eq <16 x i64> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x i8> %val3, <16 x i8> %val4
				ret <16 x i8> %sel

				}

				define <16 x i16> @fun74(<16 x i64> %val1, <16 x i64> %val2,
				; CHECK-LABEL: fun74:
				; CHECK: vl %v0, 208(%r15)
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vceqg %v0, %v30, %v0
				; CHECK-NEXT: vceqg %v1, %v28, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vceqg %v1, %v26, %v1
				; CHECK-NEXT: vceqg %v2, %v24, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 320(%r15)
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: vl %v0, 272(%r15)
				; CHECK-NEXT: vl %v1, 256(%r15)
				; CHECK-NEXT: vceqg %v0, %v31, %v0
				; CHECK-NEXT: vceqg %v1, %v29, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 240(%r15)
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vceqg %v1, %v27, %v1
				; CHECK-NEXT: vceqg %v2, %v25, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 336(%r15)
				; CHECK-NEXT: vl %v2, 304(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i16> %val3, <16 x i16> %val4) {
				%cmp = icmp eq <16 x i64> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x i16> %val3, <16 x i16> %val4
				ret <16 x i16> %sel

				}

				define <16 x i32> @fun75(<16 x i64> %val1, <16 x i64> %val2,
				; CHECK-LABEL: fun75:
				; CHECK: vl %v0, 176(%r15)
				; CHECK-NEXT: vl %v1, 160(%r15)
				; CHECK-NEXT: vceqg %v0, %v26, %v0
				; CHECK-NEXT: vceqg %v1, %v24, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 352(%r15)
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: vl %v0, 208(%r15)
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vceqg %v0, %v30, %v0
				; CHECK-NEXT: vceqg %v1, %v28, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 368(%r15)
				; CHECK-NEXT: vl %v2, 304(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: vl %v0, 240(%r15)
				; CHECK-NEXT: vl %v1, 224(%r15)
				; CHECK-NEXT: vceqg %v0, %v27, %v0
				; CHECK-NEXT: vceqg %v1, %v25, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 384(%r15)
				; CHECK-NEXT: vl %v2, 320(%r15)
				; CHECK-NEXT: vsel %v28, %v2, %v1, %v0
				; CHECK-NEXT: vl %v0, 272(%r15)
				; CHECK-NEXT: vl %v1, 256(%r15)
				; CHECK-NEXT: vceqg %v0, %v31, %v0
				; CHECK-NEXT: vceqg %v1, %v29, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 400(%r15)
				; CHECK-NEXT: vl %v2, 336(%r15)
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i32> %val3, <16 x i32> %val4) {
				%cmp = icmp eq <16 x i64> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x i32> %val3, <16 x i32> %val4
				ret <16 x i32> %sel

				}

				define <16 x float> @fun76(<16 x i64> %val1, <16 x i64> %val2,
				; CHECK-LABEL: fun76:
				; CHECK: vl %v0, 176(%r15)
				; CHECK-NEXT: vl %v1, 160(%r15)
				; CHECK-NEXT: vceqg %v0, %v26, %v0
				; CHECK-NEXT: vceqg %v1, %v24, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 352(%r15)
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: vl %v0, 208(%r15)
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vceqg %v0, %v30, %v0
				; CHECK-NEXT: vceqg %v1, %v28, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 368(%r15)
				; CHECK-NEXT: vl %v2, 304(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: vl %v0, 240(%r15)
				; CHECK-NEXT: vl %v1, 224(%r15)
				; CHECK-NEXT: vceqg %v0, %v27, %v0
				; CHECK-NEXT: vceqg %v1, %v25, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 384(%r15)
				; CHECK-NEXT: vl %v2, 320(%r15)
				; CHECK-NEXT: vsel %v28, %v2, %v1, %v0
				; CHECK-NEXT: vl %v0, 272(%r15)
				; CHECK-NEXT: vl %v1, 256(%r15)
				; CHECK-NEXT: vceqg %v0, %v31, %v0
				; CHECK-NEXT: vceqg %v1, %v29, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 400(%r15)
				; CHECK-NEXT: vl %v2, 336(%r15)
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x float> %val3, <16 x float> %val4) {
				%cmp = icmp eq <16 x i64> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x float> %val3, <16 x float> %val4
				ret <16 x float> %sel

				}

				define <2 x i8> @fun77(<2 x float> %val1, <2 x float> %val2,
				; CHECK-LABEL: fun77:
				; CHECK: vmrlf %v0, %v26, %v26
				; CHECK-NEXT: vmrlf %v1, %v24, %v24
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v26, %v26
				; CHECK-NEXT: vmrhf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: larl %r1, .LCPI77_0
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x i8> %val3, <2 x i8> %val4) {
				%cmp = fcmp ogt <2 x float> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x i8> %val3, <2 x i8> %val4
				ret <2 x i8> %sel

				}

				define <2 x i16> @fun78(<2 x float> %val1, <2 x float> %val2,
				; CHECK-LABEL: fun78:
				; CHECK: vmrlf %v0, %v26, %v26
				; CHECK-NEXT: vmrlf %v1, %v24, %v24
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v26, %v26
				; CHECK-NEXT: vmrhf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val3, <2 x i16> %val4) {
				%cmp = fcmp ogt <2 x float> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x i16> %val3, <2 x i16> %val4
				ret <2 x i16> %sel

				}

				define <2 x i64> @fun79(<2 x float> %val1, <2 x float> %val2,
				; CHECK-LABEL: fun79:
				; CHECK: vmrlf %v0, %v26, %v26
				; CHECK-NEXT: vmrlf %v1, %v24, %v24
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v26, %v26
				; CHECK-NEXT: vmrhf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x i64> %val3, <2 x i64> %val4) {
				%cmp = fcmp ogt <2 x float> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x i64> %val3, <2 x i64> %val4
				ret <2 x i64> %sel

				}

				define <2 x double> @fun80(<2 x float> %val1, <2 x float> %val2,
				; CHECK-LABEL: fun80:
				; CHECK: vmrlf %v0, %v26, %v26
				; CHECK-NEXT: vmrlf %v1, %v24, %v24
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v26, %v26
				; CHECK-NEXT: vmrhf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x double> %val3, <2 x double> %val4) {
				%cmp = fcmp ogt <2 x float> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x double> %val3, <2 x double> %val4
				ret <2 x double> %sel

				}

				define <2 x i8> @fun81(<2 x double> %val1, <2 x double> %val2,
				; CHECK-LABEL: fun81:
				; CHECK: vfchdb %v0, %v24, %v26
				; CHECK-NEXT: vrepih %v1, 1807
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x i8> %val3, <2 x i8> %val4) {
				%cmp = fcmp ogt <2 x double> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x i8> %val3, <2 x i8> %val4
				ret <2 x i8> %sel

				}

				define <2 x i16> @fun82(<2 x double> %val1, <2 x double> %val2,
				; CHECK-LABEL: fun82:
				; CHECK: larl %r1, .LCPI82_0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vfchdb %v0, %v24, %v26
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x i16> %val3, <2 x i16> %val4) {
				%cmp = fcmp ogt <2 x double> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x i16> %val3, <2 x i16> %val4
				ret <2 x i16> %sel

				}

				define <2 x i32> @fun83(<2 x double> %val1, <2 x double> %val2,
				; CHECK-LABEL: fun83:
				; CHECK: vfchdb %v0, %v24, %v26
				; CHECK-NEXT: vpkg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x i32> %val3, <2 x i32> %val4) {
				%cmp = fcmp ogt <2 x double> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x i32> %val3, <2 x i32> %val4
				ret <2 x i32> %sel

				}

				define <2 x float> @fun84(<2 x double> %val1, <2 x double> %val2,
				; CHECK-LABEL: fun84:
				; CHECK: vfchdb %v0, %v24, %v26
				; CHECK-NEXT: vpkg %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<2 x float> %val3, <2 x float> %val4) {
				%cmp = fcmp ogt <2 x double> %val1, %val2
				%sel = select <2 x i1> %cmp, <2 x float> %val3, <2 x float> %val4
				ret <2 x float> %sel

				}

				define <4 x i8> @fun85(<4 x float> %val1, <4 x float> %val2,
				; CHECK-LABEL: fun85:
				; CHECK: vmrlf %v0, %v26, %v26
				; CHECK-NEXT: vmrlf %v1, %v24, %v24
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v26, %v26
				; CHECK-NEXT: vmrhf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: larl %r1, .LCPI85_0
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 0(%r1)
				; CHECK-NEXT: vperm %v0, %v0, %v0, %v1
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<4 x i8> %val3, <4 x i8> %val4) {
				%cmp = fcmp ogt <4 x float> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x i8> %val3, <4 x i8> %val4
				ret <4 x i8> %sel

				}

				define <4 x i16> @fun86(<4 x float> %val1, <4 x float> %val2,
				; CHECK-LABEL: fun86:
				; CHECK: vmrlf %v0, %v26, %v26
				; CHECK-NEXT: vmrlf %v1, %v24, %v24
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v26, %v26
				; CHECK-NEXT: vmrhf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vpkf %v0, %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v30, %v0
				; CHECK-NEXT: br %r14
				<4 x i16> %val3, <4 x i16> %val4) {
				%cmp = fcmp ogt <4 x float> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x i16> %val3, <4 x i16> %val4
				ret <4 x i16> %sel

				}

				define <4 x i64> @fun87(<4 x float> %val1, <4 x float> %val2,
				; CHECK-LABEL: fun87:
				; CHECK: vmrlf %v0, %v26, %v26
				; CHECK-NEXT: vmrlf %v1, %v24, %v24
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v26, %v26
				; CHECK-NEXT: vmrhf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v25, %v1
				; CHECK-NEXT: vsel %v26, %v30, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x i64> %val3, <4 x i64> %val4) {
				%cmp = fcmp ogt <4 x float> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x i64> %val3, <4 x i64> %val4
				ret <4 x i64> %sel

				}

				define <4 x double> @fun88(<4 x float> %val1, <4 x float> %val2,
				; CHECK-LABEL: fun88:
				; CHECK: vmrlf %v0, %v26, %v26
				; CHECK-NEXT: vmrlf %v1, %v24, %v24
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v26, %v26
				; CHECK-NEXT: vmrhf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v24, %v28, %v25, %v1
				; CHECK-NEXT: vsel %v26, %v30, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x double> %val3, <4 x double> %val4) {
				%cmp = fcmp ogt <4 x float> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x double> %val3, <4 x double> %val4
				ret <4 x double> %sel

				}

				define <4 x i8> @fun89(<4 x double> %val1, <4 x double> %val2,
				; CHECK-LABEL: fun89:
				; CHECK: larl %r1, .LCPI89_0
				; CHECK-NEXT: vl %v2, 0(%r1)
				; CHECK-NEXT: vfchdb %v0, %v26, %v30
				; CHECK-NEXT: vfchdb %v1, %v24, %v28
				; CHECK-NEXT: vperm %v0, %v1, %v0, %v2
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x i8> %val3, <4 x i8> %val4) {
				%cmp = fcmp ogt <4 x double> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x i8> %val3, <4 x i8> %val4
				ret <4 x i8> %sel

				}

				define <4 x i16> @fun90(<4 x double> %val1, <4 x double> %val2,
				; CHECK-LABEL: fun90:
				; CHECK: larl %r1, .LCPI90_0
				; CHECK-NEXT: vl %v2, 0(%r1)
				; CHECK-NEXT: vfchdb %v0, %v26, %v30
				; CHECK-NEXT: vfchdb %v1, %v24, %v28
				; CHECK-NEXT: vperm %v0, %v1, %v0, %v2
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x i16> %val3, <4 x i16> %val4) {
				%cmp = fcmp ogt <4 x double> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x i16> %val3, <4 x i16> %val4
				ret <4 x i16> %sel

				}

				define <4 x i32> @fun91(<4 x double> %val1, <4 x double> %val2,
				; CHECK-LABEL: fun91:
				; CHECK: vfchdb %v0, %v26, %v30
				; CHECK-NEXT: vfchdb %v1, %v24, %v28
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x i32> %val3, <4 x i32> %val4) {
				%cmp = fcmp ogt <4 x double> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x i32> %val3, <4 x i32> %val4
				ret <4 x i32> %sel

				}

				define <4 x float> @fun92(<4 x double> %val1, <4 x double> %val2,
				; CHECK-LABEL: fun92:
				; CHECK: vfchdb %v0, %v26, %v30
				; CHECK-NEXT: vfchdb %v1, %v24, %v28
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<4 x float> %val3, <4 x float> %val4) {
				%cmp = fcmp ogt <4 x double> %val1, %val2
				%sel = select <4 x i1> %cmp, <4 x float> %val3, <4 x float> %val4
				ret <4 x float> %sel

				}

				define <8 x i8> @fun93(<8 x float> %val1, <8 x float> %val2,
				; CHECK-LABEL: fun93:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v26, %v26
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v26, %v26
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: larl %r1, .LCPI93_0
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vmrlf %v2, %v24, %v24
				; CHECK-NEXT: vmrhf %v3, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 0(%r1)
				; CHECK-NEXT: vperm %v0, %v1, %v0, %v2
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<8 x i8> %val3, <8 x i8> %val4) {
				%cmp = fcmp ogt <8 x float> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x i8> %val3, <8 x i8> %val4
				ret <8 x i8> %sel

				}

				define <8 x i16> @fun94(<8 x float> %val1, <8 x float> %val2,
				; CHECK-LABEL: fun94:
				; CHECK: vmrlf %v0, %v30, %v30
				; CHECK-NEXT: vmrlf %v1, %v26, %v26
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v26, %v26
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vmrhf %v3, %v24, %v24
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v28, %v28
				; CHECK-NEXT: vmrlf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v27, %v0
				; CHECK-NEXT: br %r14
				<8 x i16> %val3, <8 x i16> %val4) {
				%cmp = fcmp ogt <8 x float> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x i16> %val3, <8 x i16> %val4
				ret <8 x i16> %sel

				}

				define <8 x i64> @fun95(<8 x float> %val1, <8 x float> %val2,
				; CHECK-LABEL: fun95:
				; CHECK: vmrlf %v0, %v28, %v28
				; CHECK-NEXT: vmrlf %v1, %v24, %v24
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v28, %v28
				; CHECK-NEXT: vmrhf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vmrhf %v3, %v26, %v26
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v2, %v1
				; CHECK-NEXT: vmrlf %v1, %v30, %v30
				; CHECK-NEXT: vmrlf %v2, %v26, %v26
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v30, %v30
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vuphf %v2, %v1
				; CHECK-NEXT: vsel %v28, %v29, %v3, %v2
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vsel %v26, %v27, %v2, %v0
				; CHECK-NEXT: vmrlg %v0, %v1, %v1
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v30, %v31, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i64> %val3, <8 x i64> %val4) {
				%cmp = fcmp ogt <8 x float> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x i64> %val3, <8 x i64> %val4
				ret <8 x i64> %sel

				}

				define <8 x double> @fun96(<8 x float> %val1, <8 x float> %val2,
				; CHECK-LABEL: fun96:
				; CHECK: vmrlf %v0, %v28, %v28
				; CHECK-NEXT: vmrlf %v1, %v24, %v24
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v28, %v28
				; CHECK-NEXT: vmrhf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vmrhf %v3, %v26, %v26
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vuphf %v1, %v0
				; CHECK-NEXT: vsel %v24, %v25, %v2, %v1
				; CHECK-NEXT: vmrlf %v1, %v30, %v30
				; CHECK-NEXT: vmrlf %v2, %v26, %v26
				; CHECK-NEXT: vmrlg %v0, %v0, %v0
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v30, %v30
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vl %v3, 192(%r15)
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vuphf %v2, %v1
				; CHECK-NEXT: vsel %v28, %v29, %v3, %v2
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vsel %v26, %v27, %v2, %v0
				; CHECK-NEXT: vmrlg %v0, %v1, %v1
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vuphf %v0, %v0
				; CHECK-NEXT: vsel %v30, %v31, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x double> %val3, <8 x double> %val4) {
				%cmp = fcmp ogt <8 x float> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x double> %val3, <8 x double> %val4
				ret <8 x double> %sel

				}

				define <8 x i8> @fun97(<8 x double> %val1, <8 x double> %val2,
				; CHECK-LABEL: fun97:
				; CHECK: vfchdb %v0, %v30, %v31
				; CHECK-NEXT: vfchdb %v1, %v28, %v29
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vfchdb %v1, %v26, %v27
				; CHECK-NEXT: vfchdb %v2, %v24, %v25
				; CHECK-NEXT: larl %r1, .LCPI97_0
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 0(%r1)
				; CHECK-NEXT: vperm %v0, %v1, %v0, %v2
				; CHECK-NEXT: vlrepg %v1, 168(%r15)
				; CHECK-NEXT: vlrepg %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i8> %val3, <8 x i8> %val4) {
				%cmp = fcmp ogt <8 x double> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x i8> %val3, <8 x i8> %val4
				ret <8 x i8> %sel

				}

				define <8 x i16> @fun98(<8 x double> %val1, <8 x double> %val2,
				; CHECK-LABEL: fun98:
				; CHECK: vfchdb %v0, %v30, %v31
				; CHECK-NEXT: vfchdb %v1, %v28, %v29
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vfchdb %v1, %v26, %v27
				; CHECK-NEXT: vfchdb %v2, %v24, %v25
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i16> %val3, <8 x i16> %val4) {
				%cmp = fcmp ogt <8 x double> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x i16> %val3, <8 x i16> %val4
				ret <8 x i16> %sel

				}

				define <8 x i32> @fun99(<8 x double> %val1, <8 x double> %val2,
				; CHECK-LABEL: fun99:
				; CHECK: vfchdb %v0, %v26, %v27
				; CHECK-NEXT: vfchdb %v1, %v24, %v25
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: vfchdb %v0, %v30, %v31
				; CHECK-NEXT: vfchdb %v1, %v28, %v29
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x i32> %val3, <8 x i32> %val4) {
				%cmp = fcmp ogt <8 x double> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x i32> %val3, <8 x i32> %val4
				ret <8 x i32> %sel

				}

				define <8 x float> @fun100(<8 x double> %val1, <8 x double> %val2,
				; CHECK-LABEL: fun100:
				; CHECK: vfchdb %v0, %v26, %v27
				; CHECK-NEXT: vfchdb %v1, %v24, %v25
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: vfchdb %v0, %v30, %v31
				; CHECK-NEXT: vfchdb %v1, %v28, %v29
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<8 x float> %val3, <8 x float> %val4) {
				%cmp = fcmp ogt <8 x double> %val1, %val2
				%sel = select <8 x i1> %cmp, <8 x float> %val3, <8 x float> %val4
				ret <8 x float> %sel

				}

				define <16 x i8> @fun101(<16 x float> %val1, <16 x float> %val2,
				; CHECK-LABEL: fun101:
				; CHECK: vmrlf %v0, %v31, %v31
				; CHECK-NEXT: vmrlf %v1, %v30, %v30
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v31, %v31
				; CHECK-NEXT: vmrhf %v2, %v30, %v30
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vmrhf %v3, %v28, %v28
				; CHECK-NEXT: vmrhf %v4, %v24, %v24
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v29, %v29
				; CHECK-NEXT: vmrlf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v29, %v29
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v27, %v27
				; CHECK-NEXT: vmrlf %v2, %v26, %v26
				; CHECK-NEXT: vmrhf %v3, %v26, %v26
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v27, %v27
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vmrlf %v2, %v25, %v25
				; CHECK-NEXT: vmrlf %v3, %v24, %v24
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vmrhf %v3, %v25, %v25
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vfchdb %v3, %v4, %v3
				; CHECK-NEXT: vpkg %v2, %v3, %v2
				; CHECK-NEXT: vpkf %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vpkh %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i8> %val3, <16 x i8> %val4) {
				%cmp = fcmp ogt <16 x float> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x i8> %val3, <16 x i8> %val4
				ret <16 x i8> %sel

				}

				define <16 x i16> @fun102(<16 x float> %val1, <16 x float> %val2,
				; CHECK-LABEL: fun102:
				; CHECK: vmrlf %v0, %v27, %v27
				; CHECK-NEXT: vmrlf %v1, %v26, %v26
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v27, %v27
				; CHECK-NEXT: vmrhf %v2, %v26, %v26
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vmrhf %v3, %v24, %v24
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v25, %v25
				; CHECK-NEXT: vmrlf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v25, %v25
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: vmrlf %v0, %v31, %v31
				; CHECK-NEXT: vmrlf %v1, %v30, %v30
				; CHECK-NEXT: vmrhf %v2, %v30, %v30
				; CHECK-NEXT: vmrhf %v3, %v28, %v28
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v31, %v31
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vmrlf %v1, %v29, %v29
				; CHECK-NEXT: vmrlf %v2, %v28, %v28
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vmrhf %v2, %v29, %v29
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i16> %val3, <16 x i16> %val4) {
				%cmp = fcmp ogt <16 x float> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x i16> %val3, <16 x i16> %val4
				ret <16 x i16> %sel

				}

				define <16 x i64> @fun103(<16 x float> %val1, <16 x float> %val2,
				; CHECK-LABEL: fun103:
				; CHECK: vmrlf %v0, %v25, %v25
				; CHECK-NEXT: vmrlf %v1, %v24, %v24
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v25, %v25
				; CHECK-NEXT: vmrhf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vl %v3, 160(%r15)
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vl %v4, 192(%r15)
				; CHECK-NEXT: vl %v6, 224(%r15)
				; CHECK-NEXT: vl %v7, 256(%r15)
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vpkg %v1, %v1, %v0
				; CHECK-NEXT: vuphf %v0, %v1
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v0
				; CHECK-NEXT: vmrlf %v0, %v27, %v27
				; CHECK-NEXT: vmrlf %v2, %v26, %v26
				; CHECK-NEXT: vmrhf %v3, %v26, %v26
				; CHECK-NEXT: vmrhf %v5, %v28, %v28
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v0, %v2, %v0
				; CHECK-NEXT: vmrhf %v2, %v27, %v27
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vl %v3, 320(%r15)
				; CHECK-NEXT: vpkg %v2, %v2, %v0
				; CHECK-NEXT: vuphf %v0, %v2
				; CHECK-NEXT: vsel %v0, %v4, %v3, %v0
				; CHECK-NEXT: vmrlf %v3, %v29, %v29
				; CHECK-NEXT: vmrlf %v4, %v28, %v28
				; CHECK-NEXT: vlr %v28, %v0
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vfchdb %v3, %v4, %v3
				; CHECK-NEXT: vmrhf %v4, %v29, %v29
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vldeb %v5, %v5
				; CHECK-NEXT: vfchdb %v4, %v5, %v4
				; CHECK-NEXT: vl %v5, 352(%r15)
				; CHECK-NEXT: vpkg %v3, %v4, %v3
				; CHECK-NEXT: vuphf %v4, %v3
				; CHECK-NEXT: vsel %v25, %v6, %v5, %v4
				; CHECK-NEXT: vmrlf %v4, %v31, %v31
				; CHECK-NEXT: vmrlf %v5, %v30, %v30
				; CHECK-NEXT: vmrhf %v6, %v30, %v30
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vldeb %v5, %v5
				; CHECK-NEXT: vfchdb %v4, %v5, %v4
				; CHECK-NEXT: vmrhf %v5, %v31, %v31
				; CHECK-NEXT: vldeb %v5, %v5
				; CHECK-NEXT: vldeb %v6, %v6
				; CHECK-NEXT: vfchdb %v5, %v6, %v5
				; CHECK-NEXT: vl %v6, 384(%r15)
				; CHECK-NEXT: vpkg %v4, %v5, %v4
				; CHECK-NEXT: vuphf %v5, %v4
				; CHECK-NEXT: vsel %v29, %v7, %v6, %v5
				; CHECK-NEXT: vl %v5, 304(%r15)
				; CHECK-NEXT: vl %v6, 176(%r15)
				; CHECK-NEXT: vsel %v26, %v6, %v5, %v1
				; CHECK-NEXT: vl %v5, 208(%r15)
				; CHECK-NEXT: vmrlg %v1, %v2, %v2
				; CHECK-NEXT: vl %v2, 336(%r15)
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v30, %v5, %v2, %v1
				; CHECK-NEXT: vl %v2, 368(%r15)
				; CHECK-NEXT: vmrlg %v1, %v3, %v3
				; CHECK-NEXT: vl %v3, 240(%r15)
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v27, %v3, %v2, %v1
				; CHECK-NEXT: vl %v2, 400(%r15)
				; CHECK-NEXT: vl %v3, 272(%r15)
				; CHECK-NEXT: vmrlg %v1, %v4, %v4
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v31, %v3, %v2, %v1
				; CHECK-NEXT: br %r14
				<16 x i64> %val3, <16 x i64> %val4) {
				%cmp = fcmp ogt <16 x float> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x i64> %val3, <16 x i64> %val4
				ret <16 x i64> %sel

				}

				define <16 x double> @fun104(<16 x float> %val1, <16 x float> %val2,
				; CHECK-LABEL: fun104:
				; CHECK: vmrlf %v0, %v25, %v25
				; CHECK-NEXT: vmrlf %v1, %v24, %v24
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vfchdb %v0, %v1, %v0
				; CHECK-NEXT: vmrhf %v1, %v25, %v25
				; CHECK-NEXT: vmrhf %v2, %v24, %v24
				; CHECK-NEXT: vldeb %v1, %v1
				; CHECK-NEXT: vl %v3, 160(%r15)
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vl %v4, 192(%r15)
				; CHECK-NEXT: vl %v6, 224(%r15)
				; CHECK-NEXT: vl %v7, 256(%r15)
				; CHECK-NEXT: vfchdb %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vpkg %v1, %v1, %v0
				; CHECK-NEXT: vuphf %v0, %v1
				; CHECK-NEXT: vsel %v24, %v3, %v2, %v0
				; CHECK-NEXT: vmrlf %v0, %v27, %v27
				; CHECK-NEXT: vmrlf %v2, %v26, %v26
				; CHECK-NEXT: vmrhf %v3, %v26, %v26
				; CHECK-NEXT: vmrhf %v5, %v28, %v28
				; CHECK-NEXT: vmrlg %v1, %v1, %v1
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vldeb %v0, %v0
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vfchdb %v0, %v2, %v0
				; CHECK-NEXT: vmrhf %v2, %v27, %v27
				; CHECK-NEXT: vldeb %v2, %v2
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vfchdb %v2, %v3, %v2
				; CHECK-NEXT: vl %v3, 320(%r15)
				; CHECK-NEXT: vpkg %v2, %v2, %v0
				; CHECK-NEXT: vuphf %v0, %v2
				; CHECK-NEXT: vsel %v0, %v4, %v3, %v0
				; CHECK-NEXT: vmrlf %v3, %v29, %v29
				; CHECK-NEXT: vmrlf %v4, %v28, %v28
				; CHECK-NEXT: vlr %v28, %v0
				; CHECK-NEXT: vldeb %v3, %v3
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vfchdb %v3, %v4, %v3
				; CHECK-NEXT: vmrhf %v4, %v29, %v29
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vldeb %v5, %v5
				; CHECK-NEXT: vfchdb %v4, %v5, %v4
				; CHECK-NEXT: vl %v5, 352(%r15)
				; CHECK-NEXT: vpkg %v3, %v4, %v3
				; CHECK-NEXT: vuphf %v4, %v3
				; CHECK-NEXT: vsel %v25, %v6, %v5, %v4
				; CHECK-NEXT: vmrlf %v4, %v31, %v31
				; CHECK-NEXT: vmrlf %v5, %v30, %v30
				; CHECK-NEXT: vmrhf %v6, %v30, %v30
				; CHECK-NEXT: vldeb %v4, %v4
				; CHECK-NEXT: vldeb %v5, %v5
				; CHECK-NEXT: vfchdb %v4, %v5, %v4
				; CHECK-NEXT: vmrhf %v5, %v31, %v31
				; CHECK-NEXT: vldeb %v5, %v5
				; CHECK-NEXT: vldeb %v6, %v6
				; CHECK-NEXT: vfchdb %v5, %v6, %v5
				; CHECK-NEXT: vl %v6, 384(%r15)
				; CHECK-NEXT: vpkg %v4, %v5, %v4
				; CHECK-NEXT: vuphf %v5, %v4
				; CHECK-NEXT: vsel %v29, %v7, %v6, %v5
				; CHECK-NEXT: vl %v5, 304(%r15)
				; CHECK-NEXT: vl %v6, 176(%r15)
				; CHECK-NEXT: vsel %v26, %v6, %v5, %v1
				; CHECK-NEXT: vl %v5, 208(%r15)
				; CHECK-NEXT: vmrlg %v1, %v2, %v2
				; CHECK-NEXT: vl %v2, 336(%r15)
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v30, %v5, %v2, %v1
				; CHECK-NEXT: vl %v2, 368(%r15)
				; CHECK-NEXT: vmrlg %v1, %v3, %v3
				; CHECK-NEXT: vl %v3, 240(%r15)
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v27, %v3, %v2, %v1
				; CHECK-NEXT: vl %v2, 400(%r15)
				; CHECK-NEXT: vl %v3, 272(%r15)
				; CHECK-NEXT: vmrlg %v1, %v4, %v4
				; CHECK-NEXT: vuphf %v1, %v1
				; CHECK-NEXT: vsel %v31, %v3, %v2, %v1
				; CHECK-NEXT: br %r14
				<16 x double> %val3, <16 x double> %val4) {
				%cmp = fcmp ogt <16 x float> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x double> %val3, <16 x double> %val4
				ret <16 x double> %sel

				}

				define <16 x i8> @fun105(<16 x double> %val1, <16 x double> %val2,
				; CHECK-LABEL: fun105:
				; CHECK: vl %v0, 272(%r15)
				; CHECK-NEXT: vl %v1, 256(%r15)
				; CHECK-NEXT: vfchdb %v0, %v31, %v0
				; CHECK-NEXT: vfchdb %v1, %v29, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 240(%r15)
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vfchdb %v1, %v27, %v1
				; CHECK-NEXT: vfchdb %v2, %v25, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 208(%r15)
				; CHECK-NEXT: vl %v2, 192(%r15)
				; CHECK-NEXT: vfchdb %v1, %v30, %v1
				; CHECK-NEXT: vfchdb %v2, %v28, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vl %v2, 176(%r15)
				; CHECK-NEXT: vl %v3, 160(%r15)
				; CHECK-NEXT: vfchdb %v2, %v26, %v2
				; CHECK-NEXT: vfchdb %v3, %v24, %v3
				; CHECK-NEXT: vpkg %v2, %v3, %v2
				; CHECK-NEXT: vpkf %v1, %v2, %v1
				; CHECK-NEXT: vpkh %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 304(%r15)
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i8> %val3, <16 x i8> %val4) {
				%cmp = fcmp ogt <16 x double> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x i8> %val3, <16 x i8> %val4
				ret <16 x i8> %sel

				}

				define <16 x i16> @fun106(<16 x double> %val1, <16 x double> %val2,
				; CHECK-LABEL: fun106:
				; CHECK: vl %v0, 208(%r15)
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vfchdb %v0, %v30, %v0
				; CHECK-NEXT: vfchdb %v1, %v28, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 176(%r15)
				; CHECK-NEXT: vl %v2, 160(%r15)
				; CHECK-NEXT: vfchdb %v1, %v26, %v1
				; CHECK-NEXT: vfchdb %v2, %v24, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 320(%r15)
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: vl %v0, 272(%r15)
				; CHECK-NEXT: vl %v1, 256(%r15)
				; CHECK-NEXT: vfchdb %v0, %v31, %v0
				; CHECK-NEXT: vfchdb %v1, %v29, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 240(%r15)
				; CHECK-NEXT: vl %v2, 224(%r15)
				; CHECK-NEXT: vfchdb %v1, %v27, %v1
				; CHECK-NEXT: vfchdb %v2, %v25, %v2
				; CHECK-NEXT: vpkg %v1, %v2, %v1
				; CHECK-NEXT: vpkf %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 336(%r15)
				; CHECK-NEXT: vl %v2, 304(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i16> %val3, <16 x i16> %val4) {
				%cmp = fcmp ogt <16 x double> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x i16> %val3, <16 x i16> %val4
				ret <16 x i16> %sel

				}

				define <16 x i32> @fun107(<16 x double> %val1, <16 x double> %val2,
				; CHECK-LABEL: fun107:
				; CHECK: vl %v0, 176(%r15)
				; CHECK-NEXT: vl %v1, 160(%r15)
				; CHECK-NEXT: vfchdb %v0, %v26, %v0
				; CHECK-NEXT: vfchdb %v1, %v24, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 352(%r15)
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: vl %v0, 208(%r15)
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vfchdb %v0, %v30, %v0
				; CHECK-NEXT: vfchdb %v1, %v28, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 368(%r15)
				; CHECK-NEXT: vl %v2, 304(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: vl %v0, 240(%r15)
				; CHECK-NEXT: vl %v1, 224(%r15)
				; CHECK-NEXT: vfchdb %v0, %v27, %v0
				; CHECK-NEXT: vfchdb %v1, %v25, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 384(%r15)
				; CHECK-NEXT: vl %v2, 320(%r15)
				; CHECK-NEXT: vsel %v28, %v2, %v1, %v0
				; CHECK-NEXT: vl %v0, 272(%r15)
				; CHECK-NEXT: vl %v1, 256(%r15)
				; CHECK-NEXT: vfchdb %v0, %v31, %v0
				; CHECK-NEXT: vfchdb %v1, %v29, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 400(%r15)
				; CHECK-NEXT: vl %v2, 336(%r15)
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x i32> %val3, <16 x i32> %val4) {
				%cmp = fcmp ogt <16 x double> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x i32> %val3, <16 x i32> %val4
				ret <16 x i32> %sel

				}

				define <16 x float> @fun108(<16 x double> %val1, <16 x double> %val2,
				; CHECK-LABEL: fun108:
				; CHECK: vl %v0, 176(%r15)
				; CHECK-NEXT: vl %v1, 160(%r15)
				; CHECK-NEXT: vfchdb %v0, %v26, %v0
				; CHECK-NEXT: vfchdb %v1, %v24, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 352(%r15)
				; CHECK-NEXT: vl %v2, 288(%r15)
				; CHECK-NEXT: vsel %v24, %v2, %v1, %v0
				; CHECK-NEXT: vl %v0, 208(%r15)
				; CHECK-NEXT: vl %v1, 192(%r15)
				; CHECK-NEXT: vfchdb %v0, %v30, %v0
				; CHECK-NEXT: vfchdb %v1, %v28, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 368(%r15)
				; CHECK-NEXT: vl %v2, 304(%r15)
				; CHECK-NEXT: vsel %v26, %v2, %v1, %v0
				; CHECK-NEXT: vl %v0, 240(%r15)
				; CHECK-NEXT: vl %v1, 224(%r15)
				; CHECK-NEXT: vfchdb %v0, %v27, %v0
				; CHECK-NEXT: vfchdb %v1, %v25, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 384(%r15)
				; CHECK-NEXT: vl %v2, 320(%r15)
				; CHECK-NEXT: vsel %v28, %v2, %v1, %v0
				; CHECK-NEXT: vl %v0, 272(%r15)
				; CHECK-NEXT: vl %v1, 256(%r15)
				; CHECK-NEXT: vfchdb %v0, %v31, %v0
				; CHECK-NEXT: vfchdb %v1, %v29, %v1
				; CHECK-NEXT: vpkg %v0, %v1, %v0
				; CHECK-NEXT: vl %v1, 400(%r15)
				; CHECK-NEXT: vl %v2, 336(%r15)
				; CHECK-NEXT: vsel %v30, %v2, %v1, %v0
				; CHECK-NEXT: br %r14
				<16 x float> %val3, <16 x float> %val4) {
				%cmp = fcmp ogt <16 x double> %val1, %val2
				%sel = select <16 x i1> %cmp, <16 x float> %val3, <16 x float> %val4
				ret <16 x float> %sel

				}

test/CodeGen/X86/2011-10-19-widen_vselect.ll

Show All 21 Lines	entry:
ret void		ret void
}		}

define void @complex_inreg_work(<2 x float> %a, <2 x float> %b) {		define void @complex_inreg_work(<2 x float> %a, <2 x float> %b) {
; X32-LABEL: complex_inreg_work:		; X32-LABEL: complex_inreg_work:
; X32: # BB#0: # %entry		; X32: # BB#0: # %entry
; X32-NEXT: movaps %xmm0, %xmm2		; X32-NEXT: movaps %xmm0, %xmm2
; X32-NEXT: cmpordps %xmm0, %xmm0		; X32-NEXT: cmpordps %xmm0, %xmm0
; X32-NEXT: pslld $31, %xmm0
; X32-NEXT: blendvps %xmm0, %xmm2, %xmm1		; X32-NEXT: blendvps %xmm0, %xmm2, %xmm1
; X32-NEXT: extractps $1, %xmm1, (%eax)		; X32-NEXT: extractps $1, %xmm1, (%eax)
; X32-NEXT: movss %xmm1, (%eax)		; X32-NEXT: movss %xmm1, (%eax)
; X32-NEXT: retl		; X32-NEXT: retl
;		;
; X64-LABEL: complex_inreg_work:		; X64-LABEL: complex_inreg_work:
; X64: # BB#0: # %entry		; X64: # BB#0: # %entry
; X64-NEXT: movaps %xmm0, %xmm2		; X64-NEXT: movaps %xmm0, %xmm2
; X64-NEXT: cmpordps %xmm0, %xmm0		; X64-NEXT: cmpordps %xmm0, %xmm0
; X64-NEXT: pslld $31, %xmm0
; X64-NEXT: blendvps %xmm0, %xmm2, %xmm1		; X64-NEXT: blendvps %xmm0, %xmm2, %xmm1
; X64-NEXT: movlps %xmm1, (%rax)		; X64-NEXT: movlps %xmm1, (%rax)
; X64-NEXT: retq		; X64-NEXT: retq
entry:		entry:
%0 = fcmp oeq <2 x float> undef, undef		%0 = fcmp oeq <2 x float> undef, undef
%1 = select <2 x i1> %0, <2 x float> %a, <2 x float> %b		%1 = select <2 x i1> %0, <2 x float> %a, <2 x float> %b
store <2 x float> %1, <2 x float>* undef		store <2 x float> %1, <2 x float>* undef
ret void		ret void
Show All 24 Lines
; X32-NEXT: subl $60, %esp		; X32-NEXT: subl $60, %esp
; X32-NEXT: .Lcfi0:		; X32-NEXT: .Lcfi0:
; X32-NEXT: .cfi_def_cfa_offset 64		; X32-NEXT: .cfi_def_cfa_offset 64
; X32-NEXT: movsd {{.*#+}} xmm2 = mem[0],zero		; X32-NEXT: movsd {{.*#+}} xmm2 = mem[0],zero
; X32-NEXT: cvttps2dq %xmm2, %xmm0		; X32-NEXT: cvttps2dq %xmm2, %xmm0
; X32-NEXT: cvtdq2ps %xmm0, %xmm1		; X32-NEXT: cvtdq2ps %xmm0, %xmm1
; X32-NEXT: xorps %xmm0, %xmm0		; X32-NEXT: xorps %xmm0, %xmm0
; X32-NEXT: cmpltps %xmm2, %xmm0		; X32-NEXT: cmpltps %xmm2, %xmm0
; X32-NEXT: pslld $31, %xmm0
; X32-NEXT: movaps {{.*#+}} xmm3 = <1,1,u,u>		; X32-NEXT: movaps {{.*#+}} xmm3 = <1,1,u,u>
; X32-NEXT: addps %xmm1, %xmm3		; X32-NEXT: addps %xmm1, %xmm3
; X32-NEXT: movaps %xmm1, %xmm4		; X32-NEXT: movaps %xmm1, %xmm4
; X32-NEXT: blendvps %xmm0, %xmm3, %xmm4		; X32-NEXT: blendvps %xmm0, %xmm3, %xmm4
; X32-NEXT: cmpeqps %xmm2, %xmm1		; X32-NEXT: cmpeqps %xmm2, %xmm1
; X32-NEXT: movaps %xmm1, %xmm0		; X32-NEXT: movaps %xmm1, %xmm0
; X32-NEXT: blendvps %xmm0, %xmm2, %xmm4		; X32-NEXT: blendvps %xmm0, %xmm2, %xmm4
; X32-NEXT: extractps $1, %xmm4, {{[0-9]+}}(%esp)		; X32-NEXT: extractps $1, %xmm4, {{[0-9]+}}(%esp)
▲ Show 20 Lines • Show All 44 Lines • Show Last 20 Lines

test/CodeGen/X86/2011-10-21-widen-cmp.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-linux-gnu -mcpu=corei7 \| FileCheck %s			; RUN: llc < %s -mtriple=x86_64-unknown-linux-gnu -mcpu=corei7 \| FileCheck %s

	; Check that a <4 x float> compare is generated and that we are			; Check that a <4 x float> compare is generated and that we are
	; not stuck in an endless loop.			; not stuck in an endless loop.

	define void @cmp_2_floats(<2 x float> %a, <2 x float> %b) {			define void @cmp_2_floats(<2 x float> %a, <2 x float> %b) {
	; CHECK-LABEL: cmp_2_floats:			; CHECK-LABEL: cmp_2_floats:
	; CHECK: # BB#0: # %entry			; CHECK: # BB#0: # %entry
	; CHECK-NEXT: movaps %xmm0, %xmm2			; CHECK-NEXT: movaps %xmm0, %xmm2
	; CHECK-NEXT: cmpordps %xmm0, %xmm0			; CHECK-NEXT: cmpordps %xmm0, %xmm0
	; CHECK-NEXT: pslld $31, %xmm0
	; CHECK-NEXT: blendvps %xmm0, %xmm2, %xmm1			; CHECK-NEXT: blendvps %xmm0, %xmm2, %xmm1
	; CHECK-NEXT: movlps %xmm1, (%rax)			; CHECK-NEXT: movlps %xmm1, (%rax)
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%0 = fcmp oeq <2 x float> undef, undef			%0 = fcmp oeq <2 x float> undef, undef
	%1 = select <2 x i1> %0, <2 x float> %a, <2 x float> %b			%1 = select <2 x i1> %0, <2 x float> %a, <2 x float> %b
	store <2 x float> %1, <2 x float>* undef			store <2 x float> %1, <2 x float>* undef
	ret void			ret void
	Show All 31 Lines

test/CodeGen/X86/psubus.ll

Show First 20 Lines • Show All 536 Lines • ▼ Show 20 Lines
; SSE2-NEXT: movdqa %xmm2, %xmm5		; SSE2-NEXT: movdqa %xmm2, %xmm5
; SSE2-NEXT: pxor %xmm4, %xmm5		; SSE2-NEXT: pxor %xmm4, %xmm5
; SSE2-NEXT: pxor %xmm1, %xmm4		; SSE2-NEXT: pxor %xmm1, %xmm4
; SSE2-NEXT: pcmpgtd %xmm4, %xmm5		; SSE2-NEXT: pcmpgtd %xmm4, %xmm5
; SSE2-NEXT: pshuflw {{.*#+}} xmm4 = xmm5[0,2,2,3,4,5,6,7]		; SSE2-NEXT: pshuflw {{.*#+}} xmm4 = xmm5[0,2,2,3,4,5,6,7]
; SSE2-NEXT: pshufhw {{.*#+}} xmm4 = xmm4[0,1,2,3,4,6,6,7]		; SSE2-NEXT: pshufhw {{.*#+}} xmm4 = xmm4[0,1,2,3,4,6,6,7]
; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm4[0,2,2,3]		; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm4[0,2,2,3]
; SSE2-NEXT: punpcklqdq {{.*#+}} xmm4 = xmm4[0],xmm3[0]		; SSE2-NEXT: punpcklqdq {{.*#+}} xmm4 = xmm4[0],xmm3[0]
; SSE2-NEXT: psllw $15, %xmm4
; SSE2-NEXT: psraw $15, %xmm4
; SSE2-NEXT: psubd %xmm2, %xmm1		; SSE2-NEXT: psubd %xmm2, %xmm1
; SSE2-NEXT: pslld $16, %xmm0		; SSE2-NEXT: pslld $16, %xmm0
; SSE2-NEXT: psrad $16, %xmm0		; SSE2-NEXT: psrad $16, %xmm0
; SSE2-NEXT: pslld $16, %xmm1		; SSE2-NEXT: pslld $16, %xmm1
; SSE2-NEXT: psrad $16, %xmm1		; SSE2-NEXT: psrad $16, %xmm1
; SSE2-NEXT: packssdw %xmm0, %xmm1		; SSE2-NEXT: packssdw %xmm0, %xmm1
; SSE2-NEXT: pandn %xmm1, %xmm4		; SSE2-NEXT: pandn %xmm1, %xmm4
; SSE2-NEXT: movdqu %xmm4, (%rdi)		; SSE2-NEXT: movdqu %xmm4, (%rdi)
Show All 17 Lines
; SSSE3-NEXT: movdqa {{.*#+}} xmm5 = [0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15]		; SSSE3-NEXT: movdqa {{.*#+}} xmm5 = [0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15]
; SSSE3-NEXT: pshufb %xmm5, %xmm3		; SSSE3-NEXT: pshufb %xmm5, %xmm3
; SSSE3-NEXT: movdqa %xmm2, %xmm6		; SSSE3-NEXT: movdqa %xmm2, %xmm6
; SSSE3-NEXT: pxor %xmm4, %xmm6		; SSSE3-NEXT: pxor %xmm4, %xmm6
; SSSE3-NEXT: pxor %xmm1, %xmm4		; SSSE3-NEXT: pxor %xmm1, %xmm4
; SSSE3-NEXT: pcmpgtd %xmm4, %xmm6		; SSSE3-NEXT: pcmpgtd %xmm4, %xmm6
; SSSE3-NEXT: pshufb %xmm5, %xmm6		; SSSE3-NEXT: pshufb %xmm5, %xmm6
; SSSE3-NEXT: punpcklqdq {{.*#+}} xmm6 = xmm6[0],xmm3[0]		; SSSE3-NEXT: punpcklqdq {{.*#+}} xmm6 = xmm6[0],xmm3[0]
; SSSE3-NEXT: psllw $15, %xmm6
; SSSE3-NEXT: psraw $15, %xmm6
; SSSE3-NEXT: psubd %xmm2, %xmm1		; SSSE3-NEXT: psubd %xmm2, %xmm1
; SSSE3-NEXT: pshufb %xmm5, %xmm0		; SSSE3-NEXT: pshufb %xmm5, %xmm0
; SSSE3-NEXT: pshufb %xmm5, %xmm1		; SSSE3-NEXT: pshufb %xmm5, %xmm1
; SSSE3-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]		; SSSE3-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]
; SSSE3-NEXT: pandn %xmm1, %xmm6		; SSSE3-NEXT: pandn %xmm1, %xmm6
; SSSE3-NEXT: movdqu %xmm6, (%rdi)		; SSSE3-NEXT: movdqu %xmm6, (%rdi)
; SSSE3-NEXT: retq		; SSSE3-NEXT: retq
;		;
▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines	vector.ph:
%10 = select <8 x i1> %7, <8 x i16> zeroinitializer, <8 x i16> %9		%10 = select <8 x i1> %7, <8 x i16> zeroinitializer, <8 x i16> %9
store <8 x i16> %10, <8 x i16>* %1, align 1		store <8 x i16> %10, <8 x i16>* %1, align 1
ret void		ret void
}		}

define void @test14(i8* nocapture %head, i32* nocapture %w) nounwind {		define void @test14(i8* nocapture %head, i32* nocapture %w) nounwind {
; SSE2-LABEL: test14:		; SSE2-LABEL: test14:
; SSE2: ## BB#0: ## %vector.ph		; SSE2: ## BB#0: ## %vector.ph
; SSE2-NEXT: movdqu (%rdi), %xmm1		; SSE2-NEXT: movdqu (%rdi), %xmm0
; SSE2-NEXT: movdqu (%rsi), %xmm8		; SSE2-NEXT: movdqu (%rsi), %xmm8
; SSE2-NEXT: movdqu 16(%rsi), %xmm9		; SSE2-NEXT: movdqu 16(%rsi), %xmm9
; SSE2-NEXT: movdqu 32(%rsi), %xmm10		; SSE2-NEXT: movdqu 32(%rsi), %xmm10
; SSE2-NEXT: movdqu 48(%rsi), %xmm6		; SSE2-NEXT: movdqu 48(%rsi), %xmm7
; SSE2-NEXT: pxor %xmm11, %xmm11		; SSE2-NEXT: pxor %xmm3, %xmm3
; SSE2-NEXT: movdqa %xmm1, %xmm0		; SSE2-NEXT: movdqa %xmm0, %xmm1
; SSE2-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm11[0],xmm0[1],xmm11[1],xmm0[2],xmm11[2],xmm0[3],xmm11[3],xmm0[4],xmm11[4],xmm0[5],xmm11[5],xmm0[6],xmm11[6],xmm0[7],xmm11[7]		; SSE2-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0],xmm3[0],xmm1[1],xmm3[1],xmm1[2],xmm3[2],xmm1[3],xmm3[3],xmm1[4],xmm3[4],xmm1[5],xmm3[5],xmm1[6],xmm3[6],xmm1[7],xmm3[7]
; SSE2-NEXT: movdqa %xmm0, %xmm3		; SSE2-NEXT: movdqa %xmm1, %xmm2
; SSE2-NEXT: punpcklwd {{.*#+}} xmm3 = xmm3[0],xmm11[0],xmm3[1],xmm11[1],xmm3[2],xmm11[2],xmm3[3],xmm11[3]		; SSE2-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0],xmm3[0],xmm2[1],xmm3[1],xmm2[2],xmm3[2],xmm2[3],xmm3[3]
; SSE2-NEXT: punpckhwd {{.*#+}} xmm0 = xmm0[4],xmm11[4],xmm0[5],xmm11[5],xmm0[6],xmm11[6],xmm0[7],xmm11[7]		; SSE2-NEXT: punpckhwd {{.*#+}} xmm1 = xmm1[4],xmm3[4],xmm1[5],xmm3[5],xmm1[6],xmm3[6],xmm1[7],xmm3[7]
; SSE2-NEXT: punpckhbw {{.*#+}} xmm1 = xmm1[8],xmm11[8],xmm1[9],xmm11[9],xmm1[10],xmm11[10],xmm1[11],xmm11[11],xmm1[12],xmm11[12],xmm1[13],xmm11[13],xmm1[14],xmm11[14],xmm1[15],xmm11[15]		; SSE2-NEXT: punpckhbw {{.*#+}} xmm0 = xmm0[8],xmm3[8],xmm0[9],xmm3[9],xmm0[10],xmm3[10],xmm0[11],xmm3[11],xmm0[12],xmm3[12],xmm0[13],xmm3[13],xmm0[14],xmm3[14],xmm0[15],xmm3[15]
; SSE2-NEXT: movdqa %xmm1, %xmm5		; SSE2-NEXT: movdqa %xmm0, %xmm6
; SSE2-NEXT: punpcklwd {{.*#+}} xmm5 = xmm5[0],xmm11[0],xmm5[1],xmm11[1],xmm5[2],xmm11[2],xmm5[3],xmm11[3]		; SSE2-NEXT: punpcklwd {{.*#+}} xmm6 = xmm6[0],xmm3[0],xmm6[1],xmm3[1],xmm6[2],xmm3[2],xmm6[3],xmm3[3]
; SSE2-NEXT: punpckhwd {{.*#+}} xmm1 = xmm1[4],xmm11[4],xmm1[5],xmm11[5],xmm1[6],xmm11[6],xmm1[7],xmm11[7]		; SSE2-NEXT: punpckhwd {{.*#+}} xmm0 = xmm0[4],xmm3[4],xmm0[5],xmm3[5],xmm0[6],xmm3[6],xmm0[7],xmm3[7]
; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [2147483648,2147483648,2147483648,2147483648]		; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648,2147483648,2147483648]
; SSE2-NEXT: movdqa %xmm1, %xmm7		; SSE2-NEXT: movdqa %xmm0, %xmm5
; SSE2-NEXT: psubd %xmm6, %xmm1		; SSE2-NEXT: psubd %xmm7, %xmm0
; SSE2-NEXT: pxor %xmm4, %xmm6		; SSE2-NEXT: pxor %xmm3, %xmm7
; SSE2-NEXT: pxor %xmm4, %xmm7		; SSE2-NEXT: pxor %xmm3, %xmm5
; SSE2-NEXT: pcmpgtd %xmm7, %xmm6		; SSE2-NEXT: pcmpgtd %xmm5, %xmm7
; SSE2-NEXT: pshuflw {{.*#+}} xmm6 = xmm6[0,2,2,3,4,5,6,7]		; SSE2-NEXT: movdqa {{.*#+}} xmm5 = [255,255,255,255]
; SSE2-NEXT: pshufhw {{.*#+}} xmm6 = xmm6[0,1,2,3,4,6,6,7]		; SSE2-NEXT: pand %xmm5, %xmm7
; SSE2-NEXT: pshufd {{.*#+}} xmm6 = xmm6[0,2,2,3]		; SSE2-NEXT: movdqa %xmm6, %xmm4
; SSE2-NEXT: movdqa %xmm5, %xmm7		; SSE2-NEXT: psubd %xmm10, %xmm6
; SSE2-NEXT: psubd %xmm10, %xmm5		; SSE2-NEXT: pxor %xmm3, %xmm10
; SSE2-NEXT: pxor %xmm4, %xmm10
; SSE2-NEXT: pxor %xmm4, %xmm7
; SSE2-NEXT: pcmpgtd %xmm7, %xmm10
; SSE2-NEXT: pshuflw {{.*#+}} xmm7 = xmm10[0,2,2,3,4,5,6,7]
; SSE2-NEXT: pshufhw {{.*#+}} xmm7 = xmm7[0,1,2,3,4,6,6,7]
; SSE2-NEXT: pshufd {{.*#+}} xmm7 = xmm7[0,2,2,3]
; SSE2-NEXT: punpcklqdq {{.*#+}} xmm7 = xmm7[0],xmm6[0]
; SSE2-NEXT: psllw $15, %xmm7
; SSE2-NEXT: psraw $15, %xmm7
; SSE2-NEXT: movdqa {{.*#+}} xmm10 = [255,255,255,255,255,255,255,255]
; SSE2-NEXT: pand %xmm10, %xmm7
; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: psubd %xmm9, %xmm0
; SSE2-NEXT: pxor %xmm4, %xmm9
; SSE2-NEXT: pxor %xmm4, %xmm2
; SSE2-NEXT: pcmpgtd %xmm2, %xmm9
; SSE2-NEXT: pshuflw {{.*#+}} xmm2 = xmm9[0,2,2,3,4,5,6,7]
; SSE2-NEXT: pshufhw {{.*#+}} xmm2 = xmm2[0,1,2,3,4,6,6,7]
; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,2,2,3]
; SSE2-NEXT: movdqa %xmm8, %xmm6
; SSE2-NEXT: pxor %xmm4, %xmm6
; SSE2-NEXT: pxor %xmm3, %xmm4		; SSE2-NEXT: pxor %xmm3, %xmm4
; SSE2-NEXT: pcmpgtd %xmm4, %xmm6		; SSE2-NEXT: pcmpgtd %xmm4, %xmm10
; SSE2-NEXT: pshuflw {{.*#+}} xmm4 = xmm6[0,2,2,3,4,5,6,7]		; SSE2-NEXT: pand %xmm5, %xmm10
; SSE2-NEXT: pshufhw {{.*#+}} xmm4 = xmm4[0,1,2,3,4,6,6,7]		; SSE2-NEXT: packuswb %xmm7, %xmm10
; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm4[0,2,2,3]		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: punpcklqdq {{.*#+}} xmm4 = xmm4[0],xmm2[0]		; SSE2-NEXT: psubd %xmm9, %xmm1
; SSE2-NEXT: psllw $15, %xmm4		; SSE2-NEXT: pxor %xmm3, %xmm9
; SSE2-NEXT: psraw $15, %xmm4		; SSE2-NEXT: pxor %xmm3, %xmm4
; SSE2-NEXT: pand %xmm10, %xmm4		; SSE2-NEXT: pcmpgtd %xmm4, %xmm9
; SSE2-NEXT: packuswb %xmm7, %xmm4		; SSE2-NEXT: pand %xmm5, %xmm9
; SSE2-NEXT: psllw $7, %xmm4		; SSE2-NEXT: movdqa %xmm8, %xmm4
; SSE2-NEXT: pand {{.*}}(%rip), %xmm4		; SSE2-NEXT: pxor %xmm3, %xmm4
; SSE2-NEXT: pcmpgtb %xmm4, %xmm11		; SSE2-NEXT: pxor %xmm2, %xmm3
; SSE2-NEXT: psubd %xmm8, %xmm3		; SSE2-NEXT: pcmpgtd %xmm3, %xmm4
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [255,0,0,0,255,0,0,0,255,0,0,0,255,0,0,0]		; SSE2-NEXT: pand %xmm5, %xmm4
; SSE2-NEXT: pand %xmm2, %xmm1		; SSE2-NEXT: packuswb %xmm9, %xmm4
; SSE2-NEXT: pand %xmm2, %xmm5		; SSE2-NEXT: packuswb %xmm10, %xmm4
; SSE2-NEXT: packuswb %xmm1, %xmm5		; SSE2-NEXT: psubd %xmm8, %xmm2
; SSE2-NEXT: pand %xmm2, %xmm0		; SSE2-NEXT: pand %xmm5, %xmm0
; SSE2-NEXT: pand %xmm2, %xmm3		; SSE2-NEXT: pand %xmm5, %xmm6
; SSE2-NEXT: packuswb %xmm0, %xmm3		; SSE2-NEXT: packuswb %xmm0, %xmm6
; SSE2-NEXT: packuswb %xmm5, %xmm3		; SSE2-NEXT: pand %xmm5, %xmm1
; SSE2-NEXT: pandn %xmm3, %xmm11		; SSE2-NEXT: pand %xmm5, %xmm2
; SSE2-NEXT: movdqu %xmm11, (%rdi)		; SSE2-NEXT: packuswb %xmm1, %xmm2
		; SSE2-NEXT: packuswb %xmm6, %xmm2
		; SSE2-NEXT: pandn %xmm2, %xmm4
		; SSE2-NEXT: movdqu %xmm4, (%rdi)
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSSE3-LABEL: test14:		; SSSE3-LABEL: test14:
; SSSE3: ## BB#0: ## %vector.ph		; SSSE3: ## BB#0: ## %vector.ph
; SSSE3-NEXT: movdqu (%rdi), %xmm1		; SSSE3-NEXT: movdqu (%rdi), %xmm0
; SSSE3-NEXT: movdqu (%rsi), %xmm8		; SSSE3-NEXT: movdqu (%rsi), %xmm8
; SSSE3-NEXT: movdqu 16(%rsi), %xmm9		; SSSE3-NEXT: movdqu 16(%rsi), %xmm9
; SSSE3-NEXT: movdqu 32(%rsi), %xmm10		; SSSE3-NEXT: movdqu 32(%rsi), %xmm10
; SSSE3-NEXT: movdqu 48(%rsi), %xmm4		; SSSE3-NEXT: movdqu 48(%rsi), %xmm7
; SSSE3-NEXT: pxor %xmm0, %xmm0		; SSSE3-NEXT: pxor %xmm3, %xmm3
		; SSSE3-NEXT: movdqa %xmm0, %xmm1
		; SSSE3-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0],xmm3[0],xmm1[1],xmm3[1],xmm1[2],xmm3[2],xmm1[3],xmm3[3],xmm1[4],xmm3[4],xmm1[5],xmm3[5],xmm1[6],xmm3[6],xmm1[7],xmm3[7]
; SSSE3-NEXT: movdqa %xmm1, %xmm2		; SSSE3-NEXT: movdqa %xmm1, %xmm2
; SSSE3-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1],xmm2[2],xmm0[2],xmm2[3],xmm0[3],xmm2[4],xmm0[4],xmm2[5],xmm0[5],xmm2[6],xmm0[6],xmm2[7],xmm0[7]		; SSSE3-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0],xmm3[0],xmm2[1],xmm3[1],xmm2[2],xmm3[2],xmm2[3],xmm3[3]
; SSSE3-NEXT: movdqa %xmm2, %xmm3		; SSSE3-NEXT: punpckhwd {{.*#+}} xmm1 = xmm1[4],xmm3[4],xmm1[5],xmm3[5],xmm1[6],xmm3[6],xmm1[7],xmm3[7]
; SSSE3-NEXT: punpcklwd {{.*#+}} xmm3 = xmm3[0],xmm0[0],xmm3[1],xmm0[1],xmm3[2],xmm0[2],xmm3[3],xmm0[3]		; SSSE3-NEXT: punpckhbw {{.*#+}} xmm0 = xmm0[8],xmm3[8],xmm0[9],xmm3[9],xmm0[10],xmm3[10],xmm0[11],xmm3[11],xmm0[12],xmm3[12],xmm0[13],xmm3[13],xmm0[14],xmm3[14],xmm0[15],xmm3[15]
; SSSE3-NEXT: punpckhwd {{.*#+}} xmm2 = xmm2[4],xmm0[4],xmm2[5],xmm0[5],xmm2[6],xmm0[6],xmm2[7],xmm0[7]		; SSSE3-NEXT: movdqa %xmm0, %xmm6
; SSSE3-NEXT: punpckhbw {{.*#+}} xmm1 = xmm1[8],xmm0[8],xmm1[9],xmm0[9],xmm1[10],xmm0[10],xmm1[11],xmm0[11],xmm1[12],xmm0[12],xmm1[13],xmm0[13],xmm1[14],xmm0[14],xmm1[15],xmm0[15]		; SSSE3-NEXT: punpcklwd {{.*#+}} xmm6 = xmm6[0],xmm3[0],xmm6[1],xmm3[1],xmm6[2],xmm3[2],xmm6[3],xmm3[3]
; SSSE3-NEXT: movdqa %xmm1, %xmm7		; SSSE3-NEXT: punpckhwd {{.*#+}} xmm0 = xmm0[4],xmm3[4],xmm0[5],xmm3[5],xmm0[6],xmm3[6],xmm0[7],xmm3[7]
; SSSE3-NEXT: punpcklwd {{.*#+}} xmm7 = xmm7[0],xmm0[0],xmm7[1],xmm0[1],xmm7[2],xmm0[2],xmm7[3],xmm0[3]		; SSSE3-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648,2147483648,2147483648]
; SSSE3-NEXT: punpckhwd {{.*#+}} xmm1 = xmm1[4],xmm0[4],xmm1[5],xmm0[5],xmm1[6],xmm0[6],xmm1[7],xmm0[7]		; SSSE3-NEXT: movdqa %xmm0, %xmm5
; SSSE3-NEXT: movdqa {{.*#+}} xmm6 = [2147483648,2147483648,2147483648,2147483648]		; SSSE3-NEXT: psubd %xmm7, %xmm0
; SSSE3-NEXT: movdqa %xmm1, %xmm5		; SSSE3-NEXT: pxor %xmm3, %xmm7
; SSSE3-NEXT: psubd %xmm4, %xmm1		; SSSE3-NEXT: pxor %xmm3, %xmm5
; SSSE3-NEXT: pxor %xmm6, %xmm4		; SSSE3-NEXT: pcmpgtd %xmm5, %xmm7
; SSSE3-NEXT: pxor %xmm6, %xmm5		; SSSE3-NEXT: movdqa {{.*#+}} xmm5 = <u,u,u,u,0,4,8,12,u,u,u,u,u,u,u,u>
; SSSE3-NEXT: pcmpgtd %xmm5, %xmm4		; SSSE3-NEXT: pshufb %xmm5, %xmm7
; SSSE3-NEXT: movdqa {{.*#+}} xmm11 = [0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15]		; SSSE3-NEXT: movdqa %xmm6, %xmm4
; SSSE3-NEXT: pshufb %xmm11, %xmm4		; SSSE3-NEXT: psubd %xmm10, %xmm6
; SSSE3-NEXT: movdqa %xmm7, %xmm5		; SSSE3-NEXT: pxor %xmm3, %xmm10
; SSSE3-NEXT: psubd %xmm10, %xmm7		; SSSE3-NEXT: pxor %xmm3, %xmm4
; SSSE3-NEXT: pxor %xmm6, %xmm10		; SSSE3-NEXT: pcmpgtd %xmm4, %xmm10
; SSSE3-NEXT: pxor %xmm6, %xmm5		; SSSE3-NEXT: pshufb %xmm5, %xmm10
; SSSE3-NEXT: pcmpgtd %xmm5, %xmm10		; SSSE3-NEXT: punpckldq {{.*#+}} xmm10 = xmm10[0],xmm7[0],xmm10[1],xmm7[1]
; SSSE3-NEXT: pshufb %xmm11, %xmm10		; SSSE3-NEXT: movdqa %xmm1, %xmm4
; SSSE3-NEXT: punpcklqdq {{.*#+}} xmm10 = xmm10[0],xmm4[0]		; SSSE3-NEXT: psubd %xmm9, %xmm1
; SSSE3-NEXT: psllw $15, %xmm10		; SSSE3-NEXT: pxor %xmm3, %xmm9
; SSSE3-NEXT: psraw $15, %xmm10		; SSSE3-NEXT: pxor %xmm3, %xmm4
; SSSE3-NEXT: movdqa {{.*#+}} xmm4 = <0,2,4,6,8,10,12,14,u,u,u,u,u,u,u,u>		; SSSE3-NEXT: pcmpgtd %xmm4, %xmm9
; SSSE3-NEXT: pshufb %xmm4, %xmm10		; SSSE3-NEXT: movdqa {{.*#+}} xmm4 = <0,4,8,12,u,u,u,u,u,u,u,u,u,u,u,u>
; SSSE3-NEXT: movdqa %xmm2, %xmm5		; SSSE3-NEXT: pshufb %xmm4, %xmm9
; SSSE3-NEXT: psubd %xmm9, %xmm2
; SSSE3-NEXT: pxor %xmm6, %xmm9
; SSSE3-NEXT: pxor %xmm6, %xmm5
; SSSE3-NEXT: pcmpgtd %xmm5, %xmm9
; SSSE3-NEXT: pshufb %xmm11, %xmm9
; SSSE3-NEXT: movdqa %xmm8, %xmm5		; SSSE3-NEXT: movdqa %xmm8, %xmm5
; SSSE3-NEXT: pxor %xmm6, %xmm5		; SSSE3-NEXT: pxor %xmm3, %xmm5
; SSSE3-NEXT: pxor %xmm3, %xmm6		; SSSE3-NEXT: pxor %xmm2, %xmm3
; SSSE3-NEXT: pcmpgtd %xmm6, %xmm5		; SSSE3-NEXT: pcmpgtd %xmm3, %xmm5
; SSSE3-NEXT: pshufb %xmm11, %xmm5
; SSSE3-NEXT: punpcklqdq {{.*#+}} xmm5 = xmm5[0],xmm9[0]
; SSSE3-NEXT: psllw $15, %xmm5
; SSSE3-NEXT: psraw $15, %xmm5
; SSSE3-NEXT: pshufb %xmm4, %xmm5		; SSSE3-NEXT: pshufb %xmm4, %xmm5
; SSSE3-NEXT: punpcklqdq {{.*#+}} xmm5 = xmm5[0],xmm10[0]		; SSSE3-NEXT: punpckldq {{.*#+}} xmm5 = xmm5[0],xmm9[0],xmm5[1],xmm9[1]
; SSSE3-NEXT: psllw $7, %xmm5		; SSSE3-NEXT: movsd {{.*#+}} xmm10 = xmm5[0],xmm10[1]
; SSSE3-NEXT: pand {{.*}}(%rip), %xmm5		; SSSE3-NEXT: psubd %xmm8, %xmm2
; SSSE3-NEXT: pcmpgtb %xmm5, %xmm0		; SSSE3-NEXT: movdqa {{.*#+}} xmm3 = [255,0,0,0,255,0,0,0,255,0,0,0,255,0,0,0]
; SSSE3-NEXT: psubd %xmm8, %xmm3		; SSSE3-NEXT: pand %xmm3, %xmm0
; SSSE3-NEXT: movdqa {{.*#+}} xmm4 = [255,0,0,0,255,0,0,0,255,0,0,0,255,0,0,0]		; SSSE3-NEXT: pand %xmm3, %xmm6
; SSSE3-NEXT: pand %xmm4, %xmm1		; SSSE3-NEXT: packuswb %xmm0, %xmm6
; SSSE3-NEXT: pand %xmm4, %xmm7		; SSSE3-NEXT: pand %xmm3, %xmm1
; SSSE3-NEXT: packuswb %xmm1, %xmm7		; SSSE3-NEXT: pand %xmm3, %xmm2
; SSSE3-NEXT: pand %xmm4, %xmm2		; SSSE3-NEXT: packuswb %xmm1, %xmm2
; SSSE3-NEXT: pand %xmm4, %xmm3		; SSSE3-NEXT: packuswb %xmm6, %xmm2
; SSSE3-NEXT: packuswb %xmm2, %xmm3		; SSSE3-NEXT: andnpd %xmm2, %xmm10
; SSSE3-NEXT: packuswb %xmm7, %xmm3		; SSSE3-NEXT: movupd %xmm10, (%rdi)
; SSSE3-NEXT: pandn %xmm3, %xmm0
; SSSE3-NEXT: movdqu %xmm0, (%rdi)
; SSSE3-NEXT: retq		; SSSE3-NEXT: retq
;		;
; AVX1-LABEL: test14:		; AVX1-LABEL: test14:
; AVX1: ## BB#0: ## %vector.ph		; AVX1: ## BB#0: ## %vector.ph
; AVX1-NEXT: vmovdqu (%rsi), %ymm0		; AVX1-NEXT: vmovdqu (%rsi), %ymm0
; AVX1-NEXT: vmovdqu 32(%rsi), %ymm1		; AVX1-NEXT: vmovdqu 32(%rsi), %ymm1
; AVX1-NEXT: vpmovzxbd {{.*#+}} xmm8 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero		; AVX1-NEXT: vpmovzxbd {{.*#+}} xmm8 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero
; AVX1-NEXT: vpmovzxbd {{.*#+}} xmm9 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero		; AVX1-NEXT: vpmovzxbd {{.*#+}} xmm9 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero
; AVX1-NEXT: vpmovzxbd {{.*#+}} xmm10 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero		; AVX1-NEXT: vpmovzxbd {{.*#+}} xmm10 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero
; AVX1-NEXT: vpmovzxbd {{.*#+}} xmm5 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero		; AVX1-NEXT: vpmovzxbd {{.*#+}} xmm5 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero
; AVX1-NEXT: vmovdqa {{.*#+}} xmm6 = [2147483648,2147483648,2147483648,2147483648]		; AVX1-NEXT: vmovdqa {{.*#+}} xmm6 = [2147483648,2147483648,2147483648,2147483648]
; AVX1-NEXT: vpxor %xmm6, %xmm5, %xmm7		; AVX1-NEXT: vpxor %xmm6, %xmm5, %xmm7
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
; AVX1-NEXT: vpxor %xmm6, %xmm2, %xmm3		; AVX1-NEXT: vpxor %xmm6, %xmm2, %xmm3
; AVX1-NEXT: vpcmpgtd %xmm7, %xmm3, %xmm3		; AVX1-NEXT: vpcmpgtd %xmm7, %xmm3, %xmm3
; AVX1-NEXT: vpxor %xmm6, %xmm10, %xmm7		; AVX1-NEXT: vpxor %xmm6, %xmm10, %xmm7
; AVX1-NEXT: vpxor %xmm6, %xmm1, %xmm4		; AVX1-NEXT: vpxor %xmm6, %xmm1, %xmm4
; AVX1-NEXT: vpcmpgtd %xmm7, %xmm4, %xmm4		; AVX1-NEXT: vpcmpgtd %xmm7, %xmm4, %xmm4
; AVX1-NEXT: vpacksswb %xmm3, %xmm4, %xmm3		; AVX1-NEXT: vpacksswb %xmm3, %xmm4, %xmm11
; AVX1-NEXT: vmovdqa {{.*#+}} xmm11 = <0,2,4,6,8,10,12,14,u,u,u,u,u,u,u,u>		; AVX1-NEXT: vpxor %xmm6, %xmm9, %xmm4
; AVX1-NEXT: vpshufb %xmm11, %xmm3, %xmm12		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm7
; AVX1-NEXT: vpxor %xmm6, %xmm9, %xmm7		; AVX1-NEXT: vpxor %xmm6, %xmm7, %xmm3
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4		; AVX1-NEXT: vpcmpgtd %xmm4, %xmm3, %xmm3
; AVX1-NEXT: vpxor %xmm6, %xmm4, %xmm3		; AVX1-NEXT: vpxor %xmm6, %xmm8, %xmm4
; AVX1-NEXT: vpcmpgtd %xmm7, %xmm3, %xmm3
; AVX1-NEXT: vpxor %xmm6, %xmm8, %xmm7
; AVX1-NEXT: vpxor %xmm6, %xmm0, %xmm6		; AVX1-NEXT: vpxor %xmm6, %xmm0, %xmm6
; AVX1-NEXT: vpcmpgtd %xmm7, %xmm6, %xmm6		; AVX1-NEXT: vpcmpgtd %xmm4, %xmm6, %xmm4
; AVX1-NEXT: vpacksswb %xmm3, %xmm6, %xmm3		; AVX1-NEXT: vpacksswb %xmm3, %xmm4, %xmm3
; AVX1-NEXT: vpshufb %xmm11, %xmm3, %xmm3		; AVX1-NEXT: vpacksswb %xmm11, %xmm3, %xmm3
; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm3 = xmm3[0],xmm12[0]
; AVX1-NEXT: vpsllw $7, %xmm3, %xmm3
; AVX1-NEXT: vpand {{.*}}(%rip), %xmm3, %xmm3
; AVX1-NEXT: vpsubd %xmm0, %xmm8, %xmm0		; AVX1-NEXT: vpsubd %xmm0, %xmm8, %xmm0
; AVX1-NEXT: vpsubd %xmm4, %xmm9, %xmm4		; AVX1-NEXT: vpsubd %xmm7, %xmm9, %xmm4
; AVX1-NEXT: vpsubd %xmm1, %xmm10, %xmm1		; AVX1-NEXT: vpsubd %xmm1, %xmm10, %xmm1
; AVX1-NEXT: vpsubd %xmm2, %xmm5, %xmm2		; AVX1-NEXT: vpsubd %xmm2, %xmm5, %xmm2
; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [255,0,0,0,255,0,0,0,255,0,0,0,255,0,0,0]		; AVX1-NEXT: vmovdqa {{.*#+}} xmm5 = [255,0,0,0,255,0,0,0,255,0,0,0,255,0,0,0]
; AVX1-NEXT: vpand %xmm5, %xmm2, %xmm2		; AVX1-NEXT: vpand %xmm5, %xmm2, %xmm2
; AVX1-NEXT: vpand %xmm5, %xmm1, %xmm1		; AVX1-NEXT: vpand %xmm5, %xmm1, %xmm1
; AVX1-NEXT: vpackuswb %xmm2, %xmm1, %xmm1		; AVX1-NEXT: vpackuswb %xmm2, %xmm1, %xmm1
; AVX1-NEXT: vpand %xmm5, %xmm4, %xmm2		; AVX1-NEXT: vpand %xmm5, %xmm4, %xmm2
; AVX1-NEXT: vpand %xmm5, %xmm0, %xmm0		; AVX1-NEXT: vpand %xmm5, %xmm0, %xmm0
Show All 12 Lines
; AVX2-NEXT: vpmovzxbd {{.*#+}} ymm2 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero,mem[4],zero,zero,zero,mem[5],zero,zero,zero,mem[6],zero,zero,zero,mem[7],zero,zero,zero		; AVX2-NEXT: vpmovzxbd {{.*#+}} ymm2 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero,mem[4],zero,zero,zero,mem[5],zero,zero,zero,mem[6],zero,zero,zero,mem[7],zero,zero,zero
; AVX2-NEXT: vpmovzxbd {{.*#+}} ymm3 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero,mem[4],zero,zero,zero,mem[5],zero,zero,zero,mem[6],zero,zero,zero,mem[7],zero,zero,zero		; AVX2-NEXT: vpmovzxbd {{.*#+}} ymm3 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero,mem[4],zero,zero,zero,mem[5],zero,zero,zero,mem[6],zero,zero,zero,mem[7],zero,zero,zero
; AVX2-NEXT: vpbroadcastd {{.*}}(%rip), %ymm4		; AVX2-NEXT: vpbroadcastd {{.*}}(%rip), %ymm4
; AVX2-NEXT: vpxor %ymm4, %ymm3, %ymm5		; AVX2-NEXT: vpxor %ymm4, %ymm3, %ymm5
; AVX2-NEXT: vpxor %ymm4, %ymm1, %ymm6		; AVX2-NEXT: vpxor %ymm4, %ymm1, %ymm6
; AVX2-NEXT: vpcmpgtd %ymm5, %ymm6, %ymm5		; AVX2-NEXT: vpcmpgtd %ymm5, %ymm6, %ymm5
; AVX2-NEXT: vextracti128 $1, %ymm5, %xmm6		; AVX2-NEXT: vextracti128 $1, %ymm5, %xmm6
; AVX2-NEXT: vpacksswb %xmm6, %xmm5, %xmm5		; AVX2-NEXT: vpacksswb %xmm6, %xmm5, %xmm5
; AVX2-NEXT: vmovdqa {{.*#+}} xmm6 = <0,2,4,6,8,10,12,14,u,u,u,u,u,u,u,u>		; AVX2-NEXT: vpxor %ymm4, %ymm2, %ymm6
; AVX2-NEXT: vpshufb %xmm6, %xmm5, %xmm5
; AVX2-NEXT: vpxor %ymm4, %ymm2, %ymm7
; AVX2-NEXT: vpxor %ymm4, %ymm0, %ymm4		; AVX2-NEXT: vpxor %ymm4, %ymm0, %ymm4
; AVX2-NEXT: vpcmpgtd %ymm7, %ymm4, %ymm4		; AVX2-NEXT: vpcmpgtd %ymm6, %ymm4, %ymm4
; AVX2-NEXT: vextracti128 $1, %ymm4, %xmm7		; AVX2-NEXT: vextracti128 $1, %ymm4, %xmm6
; AVX2-NEXT: vpacksswb %xmm7, %xmm4, %xmm4		; AVX2-NEXT: vpacksswb %xmm6, %xmm4, %xmm4
; AVX2-NEXT: vpshufb %xmm6, %xmm4, %xmm4		; AVX2-NEXT: vpacksswb %xmm5, %xmm4, %xmm4
; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm4 = xmm4[0],xmm5[0]
; AVX2-NEXT: vpsllw $7, %xmm4, %xmm4
; AVX2-NEXT: vpand {{.*}}(%rip), %xmm4, %xmm4
; AVX2-NEXT: vpsubd %ymm0, %ymm2, %ymm0		; AVX2-NEXT: vpsubd %ymm0, %ymm2, %ymm0
; AVX2-NEXT: vpsubd %ymm1, %ymm3, %ymm1		; AVX2-NEXT: vpsubd %ymm1, %ymm3, %ymm1
; AVX2-NEXT: vmovdqa {{.*#+}} ymm2 = [0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15,16,17,20,21,24,25,28,29,24,25,28,29,28,29,30,31]		; AVX2-NEXT: vmovdqa {{.*#+}} ymm2 = [0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15,16,17,20,21,24,25,28,29,24,25,28,29,28,29,30,31]
; AVX2-NEXT: vpshufb %ymm2, %ymm1, %ymm1		; AVX2-NEXT: vpshufb %ymm2, %ymm1, %ymm1
; AVX2-NEXT: vpermq {{.*#+}} ymm1 = ymm1[0,2,2,3]		; AVX2-NEXT: vpermq {{.*#+}} ymm1 = ymm1[0,2,2,3]
; AVX2-NEXT: vpshufb %xmm6, %xmm1, %xmm1		; AVX2-NEXT: vmovdqa {{.*#+}} xmm3 = <0,2,4,6,8,10,12,14,u,u,u,u,u,u,u,u>
		; AVX2-NEXT: vpshufb %xmm3, %xmm1, %xmm1
; AVX2-NEXT: vpshufb %ymm2, %ymm0, %ymm0		; AVX2-NEXT: vpshufb %ymm2, %ymm0, %ymm0
; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,2,3]		; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,2,3]
; AVX2-NEXT: vpshufb %xmm6, %xmm0, %xmm0		; AVX2-NEXT: vpshufb %xmm3, %xmm0, %xmm0
; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]		; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1		; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
; AVX2-NEXT: vpblendvb %xmm4, %xmm1, %xmm0, %xmm0		; AVX2-NEXT: vpblendvb %xmm4, %xmm1, %xmm0, %xmm0
; AVX2-NEXT: vmovdqu %xmm0, (%rdi)		; AVX2-NEXT: vmovdqu %xmm0, (%rdi)
; AVX2-NEXT: vzeroupper		; AVX2-NEXT: vzeroupper
; AVX2-NEXT: retq		; AVX2-NEXT: retq
vector.ph:		vector.ph:
%0 = getelementptr inbounds i8, i8* %head, i64 0		%0 = getelementptr inbounds i8, i8* %head, i64 0
Show All 33 Lines
; SSE2-NEXT: movdqa %xmm2, %xmm5		; SSE2-NEXT: movdqa %xmm2, %xmm5
; SSE2-NEXT: pxor %xmm4, %xmm5		; SSE2-NEXT: pxor %xmm4, %xmm5
; SSE2-NEXT: pxor %xmm1, %xmm4		; SSE2-NEXT: pxor %xmm1, %xmm4
; SSE2-NEXT: pcmpgtd %xmm5, %xmm4		; SSE2-NEXT: pcmpgtd %xmm5, %xmm4
; SSE2-NEXT: pshuflw {{.*#+}} xmm4 = xmm4[0,2,2,3,4,5,6,7]		; SSE2-NEXT: pshuflw {{.*#+}} xmm4 = xmm4[0,2,2,3,4,5,6,7]
; SSE2-NEXT: pshufhw {{.*#+}} xmm4 = xmm4[0,1,2,3,4,6,6,7]		; SSE2-NEXT: pshufhw {{.*#+}} xmm4 = xmm4[0,1,2,3,4,6,6,7]
; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm4[0,2,2,3]		; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm4[0,2,2,3]
; SSE2-NEXT: punpcklqdq {{.*#+}} xmm4 = xmm4[0],xmm3[0]		; SSE2-NEXT: punpcklqdq {{.*#+}} xmm4 = xmm4[0],xmm3[0]
; SSE2-NEXT: psllw $15, %xmm4
; SSE2-NEXT: psraw $15, %xmm4
; SSE2-NEXT: psubd %xmm2, %xmm1		; SSE2-NEXT: psubd %xmm2, %xmm1
; SSE2-NEXT: pslld $16, %xmm0		; SSE2-NEXT: pslld $16, %xmm0
; SSE2-NEXT: psrad $16, %xmm0		; SSE2-NEXT: psrad $16, %xmm0
; SSE2-NEXT: pslld $16, %xmm1		; SSE2-NEXT: pslld $16, %xmm1
; SSE2-NEXT: psrad $16, %xmm1		; SSE2-NEXT: psrad $16, %xmm1
; SSE2-NEXT: packssdw %xmm0, %xmm1		; SSE2-NEXT: packssdw %xmm0, %xmm1
; SSE2-NEXT: pand %xmm4, %xmm1		; SSE2-NEXT: pand %xmm4, %xmm1
; SSE2-NEXT: movdqu %xmm1, (%rdi)		; SSE2-NEXT: movdqu %xmm1, (%rdi)
Show All 17 Lines
; SSSE3-NEXT: movdqa {{.*#+}} xmm4 = [0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15]		; SSSE3-NEXT: movdqa {{.*#+}} xmm4 = [0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15]
; SSSE3-NEXT: pshufb %xmm4, %xmm5		; SSSE3-NEXT: pshufb %xmm4, %xmm5
; SSSE3-NEXT: movdqa %xmm2, %xmm6		; SSSE3-NEXT: movdqa %xmm2, %xmm6
; SSSE3-NEXT: pxor %xmm3, %xmm6		; SSSE3-NEXT: pxor %xmm3, %xmm6
; SSSE3-NEXT: pxor %xmm1, %xmm3		; SSSE3-NEXT: pxor %xmm1, %xmm3
; SSSE3-NEXT: pcmpgtd %xmm6, %xmm3		; SSSE3-NEXT: pcmpgtd %xmm6, %xmm3
; SSSE3-NEXT: pshufb %xmm4, %xmm3		; SSSE3-NEXT: pshufb %xmm4, %xmm3
; SSSE3-NEXT: punpcklqdq {{.*#+}} xmm3 = xmm3[0],xmm5[0]		; SSSE3-NEXT: punpcklqdq {{.*#+}} xmm3 = xmm3[0],xmm5[0]
; SSSE3-NEXT: psllw $15, %xmm3
; SSSE3-NEXT: psraw $15, %xmm3
; SSSE3-NEXT: psubd %xmm2, %xmm1		; SSSE3-NEXT: psubd %xmm2, %xmm1
; SSSE3-NEXT: pshufb %xmm4, %xmm0		; SSSE3-NEXT: pshufb %xmm4, %xmm0
; SSSE3-NEXT: pshufb %xmm4, %xmm1		; SSSE3-NEXT: pshufb %xmm4, %xmm1
; SSSE3-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]		; SSSE3-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]
; SSSE3-NEXT: pand %xmm3, %xmm1		; SSSE3-NEXT: pand %xmm3, %xmm1
; SSSE3-NEXT: movdqu %xmm1, (%rdi)		; SSSE3-NEXT: movdqu %xmm1, (%rdi)
; SSSE3-NEXT: retq		; SSSE3-NEXT: retq
;		;
▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
; SSE2-NEXT: movdqa %xmm2, %xmm5		; SSE2-NEXT: movdqa %xmm2, %xmm5
; SSE2-NEXT: pxor %xmm4, %xmm5		; SSE2-NEXT: pxor %xmm4, %xmm5
; SSE2-NEXT: pxor %xmm1, %xmm4		; SSE2-NEXT: pxor %xmm1, %xmm4
; SSE2-NEXT: pcmpgtd %xmm5, %xmm4		; SSE2-NEXT: pcmpgtd %xmm5, %xmm4
; SSE2-NEXT: pshuflw {{.*#+}} xmm4 = xmm4[0,2,2,3,4,5,6,7]		; SSE2-NEXT: pshuflw {{.*#+}} xmm4 = xmm4[0,2,2,3,4,5,6,7]
; SSE2-NEXT: pshufhw {{.*#+}} xmm4 = xmm4[0,1,2,3,4,6,6,7]		; SSE2-NEXT: pshufhw {{.*#+}} xmm4 = xmm4[0,1,2,3,4,6,6,7]
; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm4[0,2,2,3]		; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm4[0,2,2,3]
; SSE2-NEXT: punpcklqdq {{.*#+}} xmm4 = xmm4[0],xmm3[0]		; SSE2-NEXT: punpcklqdq {{.*#+}} xmm4 = xmm4[0],xmm3[0]
; SSE2-NEXT: psllw $15, %xmm4
; SSE2-NEXT: psraw $15, %xmm4
; SSE2-NEXT: psubd %xmm2, %xmm1		; SSE2-NEXT: psubd %xmm2, %xmm1
; SSE2-NEXT: pslld $16, %xmm0		; SSE2-NEXT: pslld $16, %xmm0
; SSE2-NEXT: psrad $16, %xmm0		; SSE2-NEXT: psrad $16, %xmm0
; SSE2-NEXT: pslld $16, %xmm1		; SSE2-NEXT: pslld $16, %xmm1
; SSE2-NEXT: psrad $16, %xmm1		; SSE2-NEXT: psrad $16, %xmm1
; SSE2-NEXT: packssdw %xmm0, %xmm1		; SSE2-NEXT: packssdw %xmm0, %xmm1
; SSE2-NEXT: pand %xmm4, %xmm1		; SSE2-NEXT: pand %xmm4, %xmm1
; SSE2-NEXT: movdqu %xmm1, (%rdi)		; SSE2-NEXT: movdqu %xmm1, (%rdi)
Show All 17 Lines
; SSSE3-NEXT: movdqa {{.*#+}} xmm4 = [0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15]		; SSSE3-NEXT: movdqa {{.*#+}} xmm4 = [0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15]
; SSSE3-NEXT: pshufb %xmm4, %xmm5		; SSSE3-NEXT: pshufb %xmm4, %xmm5
; SSSE3-NEXT: movdqa %xmm2, %xmm6		; SSSE3-NEXT: movdqa %xmm2, %xmm6
; SSSE3-NEXT: pxor %xmm3, %xmm6		; SSSE3-NEXT: pxor %xmm3, %xmm6
; SSSE3-NEXT: pxor %xmm1, %xmm3		; SSSE3-NEXT: pxor %xmm1, %xmm3
; SSSE3-NEXT: pcmpgtd %xmm6, %xmm3		; SSSE3-NEXT: pcmpgtd %xmm6, %xmm3
; SSSE3-NEXT: pshufb %xmm4, %xmm3		; SSSE3-NEXT: pshufb %xmm4, %xmm3
; SSSE3-NEXT: punpcklqdq {{.*#+}} xmm3 = xmm3[0],xmm5[0]		; SSSE3-NEXT: punpcklqdq {{.*#+}} xmm3 = xmm3[0],xmm5[0]
; SSSE3-NEXT: psllw $15, %xmm3
; SSSE3-NEXT: psraw $15, %xmm3
; SSSE3-NEXT: psubd %xmm2, %xmm1		; SSSE3-NEXT: psubd %xmm2, %xmm1
; SSSE3-NEXT: pshufb %xmm4, %xmm0		; SSSE3-NEXT: pshufb %xmm4, %xmm0
; SSSE3-NEXT: pshufb %xmm4, %xmm1		; SSSE3-NEXT: pshufb %xmm4, %xmm1
; SSSE3-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]		; SSSE3-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]
; SSSE3-NEXT: pand %xmm3, %xmm1		; SSSE3-NEXT: pand %xmm3, %xmm1
; SSSE3-NEXT: movdqu %xmm1, (%rdi)		; SSSE3-NEXT: movdqu %xmm1, (%rdi)
; SSSE3-NEXT: retq		; SSSE3-NEXT: retq
;		;
▲ Show 20 Lines • Show All 57 Lines • Show Last 20 Lines

test/CodeGen/X86/vselect-pcmp.ll

Show First 20 Lines • Show All 241 Lines • ▼ Show 20 Lines	; AVX512VL-NEXT: retq
ret <4 x double> %z		ret <4 x double> %z
}		}

; Try a condition with a different type than the select operands.		; Try a condition with a different type than the select operands.

define <4 x double> @signbit_sel_v4f64_small_mask(<4 x double> %x, <4 x double> %y, <4 x i32> %mask) {		define <4 x double> @signbit_sel_v4f64_small_mask(<4 x double> %x, <4 x double> %y, <4 x i32> %mask) {
; AVX1-LABEL: signbit_sel_v4f64_small_mask:		; AVX1-LABEL: signbit_sel_v4f64_small_mask:
; AVX1: # BB#0:		; AVX1: # BB#0:
; AVX1-NEXT: vpxor %xmm3, %xmm3, %xmm3
; AVX1-NEXT: vpcmpgtd %xmm2, %xmm3, %xmm2
; AVX1-NEXT: vpmovsxdq %xmm2, %xmm3		; AVX1-NEXT: vpmovsxdq %xmm2, %xmm3
; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm2[2,3,0,1]		; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm2[2,3,0,1]
; AVX1-NEXT: vpmovsxdq %xmm2, %xmm2		; AVX1-NEXT: vpmovsxdq %xmm2, %xmm2
; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2		; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2
; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0		; AVX1-NEXT: vblendvpd %ymm2, %ymm0, %ymm1, %ymm0
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: signbit_sel_v4f64_small_mask:		; AVX2-LABEL: signbit_sel_v4f64_small_mask:
▲ Show 20 Lines • Show All 66 Lines • Show Last 20 Lines

utils/update_llc_test_checks.py

Show First 20 Lines • Show All 62 Lines • ▼ Show 20 Lines	ASM_FUNCTION_PPC_RE = re.compile(
r'[ \t]+.cfi_startproc\n'		r'[ \t]+.cfi_startproc\n'
r'(?:\.Lfunc_[gl]ep[0-9]+:\n(?:[ \t]+.?\n))*'		r'(?:\.Lfunc_[gl]ep[0-9]+:\n(?:[ \t]+.?\n))*'
r'(?P<body>.*?)\n'		r'(?P<body>.*?)\n'
# This list is incomplete		# This list is incomplete
r'(?:^[ \t](?:\.long[ \t]+[^\n]+\|\.quad[ \t]+[^\n]+)\n)'		r'(?:^[ \t](?:\.long[ \t]+[^\n]+\|\.quad[ \t]+[^\n]+)\n)'
r'.Lfunc_end[0-9]+:\n',		r'.Lfunc_end[0-9]+:\n',
flags=(re.M \| re.S))		flags=(re.M \| re.S))

		ASM_FUNCTION_SYSTEMZ_RE = re.compile(
		r'^_?(?P<func>[^:]+):[ \t]#+[ \t]@(?P=func)\n'
		r'[ \t]+.cfi_startproc\n'
		r'# BB#0:\n'
		efriedmaUnsubmitted Not Done Reply Inline Actions You probably want to keep the BB#0 comment; that lets you verify that the first instruction in the function is actually the one you expect. efriedma: You probably want to keep the BB#0 comment; that lets you verify that the first instruction in…
		r'(?P<body>.*?)\n'
		r'.Lfunc_end[0-9]+:\n',
		flags=(re.M \| re.S))


def scrub_asm_x86(asm):		def scrub_asm_x86(asm):
# Scrub runs of whitespace out of the assembly, but leave the leading		# Scrub runs of whitespace out of the assembly, but leave the leading
# whitespace in place.		# whitespace in place.
asm = SCRUB_WHITESPACE_RE.sub(r' ', asm)		asm = SCRUB_WHITESPACE_RE.sub(r' ', asm)
# Expand the tabs used for indentation.		# Expand the tabs used for indentation.
asm = string.expandtabs(asm, 2)		asm = string.expandtabs(asm, 2)
# Detect shuffle asm comments and hide the operands in favor of the comments.		# Detect shuffle asm comments and hide the operands in favor of the comments.
Show All 27 Lines	def scrub_asm_powerpc64le(asm):
# whitespace in place.		# whitespace in place.
asm = SCRUB_WHITESPACE_RE.sub(r' ', asm)		asm = SCRUB_WHITESPACE_RE.sub(r' ', asm)
# Expand the tabs used for indentation.		# Expand the tabs used for indentation.
asm = string.expandtabs(asm, 2)		asm = string.expandtabs(asm, 2)
# Strip trailing whitespace.		# Strip trailing whitespace.
asm = SCRUB_TRAILING_WHITESPACE_RE.sub(r'', asm)		asm = SCRUB_TRAILING_WHITESPACE_RE.sub(r'', asm)
return asm		return asm

		def scrub_asm_systemz(asm):
		print "xxxx"
		efriedmaUnsubmitted Not Done Reply Inline Actions ? efriedma: ?
		print >>sys.stderr, asm
		# Scrub runs of whitespace out of the assembly, but leave the leading
		# whitespace in place.
		asm = SCRUB_WHITESPACE_RE.sub(r' ', asm)
		# Expand the tabs used for indentation.
		asm = string.expandtabs(asm, 2)
		# Strip trailing whitespace.
		asm = SCRUB_TRAILING_WHITESPACE_RE.sub(r'', asm)
		print >>sys.stderr, asm
		return asm


# Build up a dictionary of all the function bodies.		# Build up a dictionary of all the function bodies.
def build_function_body_dictionary(raw_tool_output, triple, prefixes, func_dict,		def build_function_body_dictionary(raw_tool_output, triple, prefixes, func_dict,
verbose):		verbose):
target_handlers = {		target_handlers = {
'x86_64': (scrub_asm_x86, ASM_FUNCTION_X86_RE),		'x86_64': (scrub_asm_x86, ASM_FUNCTION_X86_RE),
'i686': (scrub_asm_x86, ASM_FUNCTION_X86_RE),		'i686': (scrub_asm_x86, ASM_FUNCTION_X86_RE),
'x86': (scrub_asm_x86, ASM_FUNCTION_X86_RE),		'x86': (scrub_asm_x86, ASM_FUNCTION_X86_RE),
'i386': (scrub_asm_x86, ASM_FUNCTION_X86_RE),		'i386': (scrub_asm_x86, ASM_FUNCTION_X86_RE),
'arm-eabi': (scrub_asm_arm_eabi, ASM_FUNCTION_ARM_RE),		'arm-eabi': (scrub_asm_arm_eabi, ASM_FUNCTION_ARM_RE),
'thumb-eabi': (scrub_asm_arm_eabi, ASM_FUNCTION_ARM_RE),		'thumb-eabi': (scrub_asm_arm_eabi, ASM_FUNCTION_ARM_RE),
'thumbv8-eabi': (scrub_asm_arm_eabi, ASM_FUNCTION_ARM_RE),		'thumbv8-eabi': (scrub_asm_arm_eabi, ASM_FUNCTION_ARM_RE),
'armeb-eabi': (scrub_asm_arm_eabi, ASM_FUNCTION_ARM_RE),		'armeb-eabi': (scrub_asm_arm_eabi, ASM_FUNCTION_ARM_RE),
'powerpc64le': (scrub_asm_powerpc64le, ASM_FUNCTION_PPC_RE),		'powerpc64le': (scrub_asm_powerpc64le, ASM_FUNCTION_PPC_RE),
		's390x': (scrub_asm_systemz, ASM_FUNCTION_SYSTEMZ_RE),
}		}
handlers = None		handlers = None
for prefix, s in target_handlers.items():		for prefix, s in target_handlers.items():
if triple.startswith(prefix):		if triple.startswith(prefix):
handlers = s		handlers = s
break		break
else:		else:
raise KeyError('Triple %r is not supported' % (triple))		raise KeyError('Triple %r is not supported' % (triple))
▲ Show 20 Lines • Show All 213 Lines • Show Last 20 Lines