This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/CodeGen/
-
CodeGen/
4/7
TwoAddressInstructionPass.cpp
-
test/CodeGen/
-
CodeGen/
-
ARM/
-
ssat.ll
-
usat.ll
-
AVR/
-
ctpop.ll
-
hardware-mul.ll
-
SystemZ/
-
int-cmp-57.ll
-
Thumb/
-
pr35836_2.ll
-
X86/
-
DynamicCalleeSavedRegisters.ll
-
abs.ll
-
add-cmov.ll
1/2
addsub-constant-folding.ll
-
align-down.ll
-
arithmetic_fence2.ll
-
avg.ll
-
avx512-inc-dec.ll
-
avx512-mask-op.ll
1/2
avx512-regcall-NoMask.ll
-
avx512bw-mask-op.ll
-
avx512dq-mask-op.ll
-
bitreverse.ll
-
bswap_tree2.ll
-
cmp-concat.ll
-
combine-mul.ll
-
combine-mulo.ll
-
combine-or.ll
-
combine-sdiv.ll
-
combine-smax.ll
-
combine-smin.ll
-
combine-sra.ll
-
combine-srem.ll
-
combine-srl.ll
-
combine-udiv.ll
-
ctpop-combine.ll
-
fshl.ll
-
fshr.ll
-
funnel-shift.ll
-
haddsub-shuf.ll
-
haddsub-undef.ll
-
haddsub.ll
-
horizontal-reduce-fadd.ll
-
horizontal-sum.ll
-
i128-mul.ll
-
iabs.ll
-
imul.ll
-
midpoint-int-vec-128.ll
-
mul-constant-i16.ll
-
mul-constant-i32.ll
-
mul-constant-i64.ll
-
mul-constant-i8.ll
-
mul128.ll
-
overflow.ll
-
palignr.ll
-
phaddsub.ll
-
pmul.ll
-
pmulh.ll
-
popcnt.ll
-
powi.ll
-
pr42998.ll
-
recip-fastmath.ll
-
rev16.ll
-
rot16.ll
-
rotate-extract.ll
-
rotate-multi.ll
-
sat-add.ll
-
sdiv_fix.ll
-
select-constant-xor.ll
-
select.ll
-
shift-logic.ll
-
smax.ll
-
smin.ll
-
smul_fix_sat.ll
-
sqrt-fastmath-tune.ll
-
sqrt-fastmath.ll
-
sse-minmax.ll
-
sshl_sat.ll
-
ssub_sat.ll
-
ssub_sat_vec.ll
-
stack-folding-fp-avx512.ll
-
stack-folding-int-avx512.ll
-
tbm-intrinsics-fast-isel-x86_64.ll
-
tbm-intrinsics-fast-isel.ll
-
udiv_fix_sat.ll
-
umax.ll
-
umin.ll
-
umul_fix.ll
-
umul_fix_sat.ll
-
umulo-128-legalisation-lowering.ll
-
umulo-64-legalisation-lowering.ll
-
unfold-masked-merge-scalar-variablemask.ll
-
urem-lkk.ll
-
urem-seteq-vec-nonzero.ll
-
vec-strict-fptoint-128.ll
-
vec_ctbits.ll
-
vec_minmax_sint.ll
-
vec_minmax_uint.ll
-
vec_saddo.ll
-
vec_sdiv_to_shift.ll
-
vec_shift6.ll
1/2
vec_smulo.ll
-
vec_ssubo.ll
-
vec_umulo.ll
-
vector-bitreverse.ll
-
vector-ext-logic.ll
-
vector-fshl-128.ll
-
vector-fshl-rot-128.ll
-
vector-fshl-rot-sub128.ll
-
vector-fshr-128.ll
-
vector-fshr-rot-128.ll
-
vector-fshr-rot-sub128.ll
-
vector-idiv-udiv-128.ll
-
vector-lzcnt-128.ll
-
vector-mul.ll
-
vector-popcnt-128-ult-ugt.ll
-
vector-popcnt-128.ll
-
vector-reduce-fadd-fast.ll
-
vector-reduce-fadd.ll
-
vector-reduce-fmax.ll
-
vector-reduce-fmul-fast.ll
-
vector-reduce-fmul.ll
-
vector-reduce-smax.ll
-
vector-reduce-umax.ll
-
vector-rotate-128.ll
-
vector-shift-ashr-128.ll
-
vector-shift-ashr-sub128.ll
-
vector-shuffle-combining.ll
-
vector-trunc-math.ll
-
vector-tzcnt-128.ll
-
vector-unsigned-cmp.ll
-
vselect-minmax.ll
-
vselect-zero.ll
-
x86-no_caller_saved_registers-preserve.ll
-
x86-shifts.ll

Differential D108731

[TwoAddressInstructionPass] Improve the SrcRegMap and DstRegMap computation
ClosedPublic

Authored by Carrot on Aug 25 2021, 2:40 PM.

Download Raw Diff

Details

Reviewers

stoklund
craig.topper
pengfei
RKSimon

Commits

rG6599961c1707: [TwoAddressInstructionPass] Improve the SrcRegMap and DstRegMap computation

Summary

This patch contains following enhancements to SrcRegMap and DstRegMap:

1 In findOnlyInterestingUse not only check if the Reg is two address usage, but also check after commutation can it be two address usage.

2 If a physical register is clobbered, remove SrcRegMap entries that are mapped to it.

3 In processTiedPairs, when create a new COPY instruction, add a SrcRegMap entry only when the COPY instruction is coalescable. (The COPY src is killed)

With these enhancements isProfitableToCommute can do better commute decision, and finally more register copies are removed.

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

Carrot created this revision.Aug 25 2021, 2:40 PM

Herald added subscribers: mstorsjo, pengfei, Jim and 2 others. · View Herald TranscriptAug 25 2021, 2:40 PM

Carrot requested review of this revision.Aug 25 2021, 2:40 PM

Herald added a project: Restricted Project. · View Herald TranscriptAug 25 2021, 2:40 PM

Herald added a subscriber: llvm-commits. · View Herald Transcript

Harbormaster completed remote builds in B121239: Diff 368727.Aug 25 2021, 2:41 PM

craig.topper added reviewers: pengfei, RKSimon.Aug 25 2021, 2:56 PM

lkail added a subscriber: lkail.Aug 25 2021, 5:06 PM

ping

Description makes it sound there are several changes here - do they stand on their own, or must they all happen all at once?

In D108731#2977721, @lebedev.ri wrote:

Description makes it sound there are several changes here - do they stand on their own, or must they all happen all at once?

In theory it can be divided into 3 individual changes. But they have the same purpose and impact. And two of them (findOnlyInterestingUse and processTiedPairs) are very small. So I sent them as a single patch. The total changes is 78 lines, still not a big one. A lot of test cases are impacted, so it caused the patch looks very large.

Worth to mention also https://reviews.llvm.org/D52109

xbolva00 added inline comments.Sep 2 2021, 11:23 AM

llvm/test/CodeGen/X86/vec_smulo.ll
118	https://reviews.llvm.org/D52109#inline-545876

Carrot added inline comments.Sep 3 2021, 6:30 PM

llvm/test/CodeGen/X86/vec_smulo.ll

118

With this patch, TwoAddressInstructionPass generates

liveins: $xmm0, $xmm1, $rdi
%2:gr64 = COPY killed $rdi
%1:vr128 = COPY killed $xmm1
%0:vr128 = COPY killed $xmm0
%3:vr128 = PSHUFDri %1:vr128, -11
%4:vr128 = PSHUFDri %0:vr128, -11
%5:vr128 = COPY killed %4:vr128
%5:vr128 = PMULDQrr %5:vr128(tied-def 0), killed %3:vr128
%6:vr128 = COPY %0:vr128
%6:vr128 = PMULDQrr %6:vr128(tied-def 0), %1:vr128
%7:vr128 = PSHUFDri killed %6:vr128, -11
%8:vr128 = COPY killed %7:vr128
%8:vr128 = PBLENDWrri %8:vr128(tied-def 0), killed %5:vr128, -52
%9:vr128 = COPY killed %0:vr128
%9:vr128 = PMULLDrr %9:vr128(tied-def 0), killed %1:vr128
%10:vr128 = COPY %9:vr128
%10:vr128 = PSRADri %10:vr128(tied-def 0), 31
%11:vr128 = COPY killed %10:vr128
%11:vr128 = PCMPEQDrr %11:vr128(tied-def 0), killed %8:vr128
%12:vr128 = V_SETALLONES
%13:vr128 = COPY killed %12:vr128
%13:vr128 = PXORrr %13:vr128(tied-def 0), killed %11:vr128
MOVPQI2QImr killed %2:gr64, 1, $noreg, 0, $noreg, killed %9:vr128 :: (store (s64) into %ir.p2)
$xmm0 = COPY killed %13:vr128
RET 0, killed $xmm0

Without this patch, TwoAddressInstructionPass generates:

liveins: $xmm0, $xmm1, $rdi 
%2:gr64 = COPY killed $rdi 
%1:vr128 = COPY killed $xmm1
%0:vr128 = COPY killed $xmm0
%3:vr128 = PSHUFDri %1:vr128, -11
%4:vr128 = PSHUFDri %0:vr128, -11
%5:vr128 = COPY killed %4:vr128
%5:vr128 = PMULDQrr %5:vr128(tied-def 0), killed %3:vr128
%6:vr128 = COPY %0:vr128
%6:vr128 = PMULDQrr %6:vr128(tied-def 0), %1:vr128
%7:vr128 = PSHUFDri killed %6:vr128, -11
%8:vr128 = COPY killed %7:vr128
%8:vr128 = PBLENDWrri %8:vr128(tied-def 0), killed %5:vr128, -52
%9:vr128 = COPY killed %0:vr128
%9:vr128 = PMULLDrr %9:vr128(tied-def 0), killed %1:vr128
%10:vr128 = COPY %9:vr128
%10:vr128 = PSRADri %10:vr128(tied-def 0), 31
%11:vr128 = COPY killed %10:vr128
%11:vr128 = PCMPEQDrr %11:vr128(tied-def 0), killed %8:vr128
%12:vr128 = V_SETALLONES
%13:vr128 = COPY killed %11:vr128
%13:vr128 = PXORrr %13:vr128(tied-def 0), killed %12:vr128
MOVPQI2QImr killed %2:gr64, 1, $noreg, 0, $noreg, killed %9:vr128 :: (store (s64) into %ir.p2)
$xmm0 = COPY killed %13:vr128
RET 0, killed $xmm0

The only difference is the PXOR instruction and related COPY. The operands order(commuting decision) of PXOR is actually impacted the mapping of SrcRegMap[%10] = %9. In this instruction sequence, the old result is worse. Here we have SrcRegMap[%9] = xmm0, it lives until the memory store, so %10 must be assigned to a different physical register, and the COPY is a real one. And later %10 must be copied back to xmm0. In the new result, the %9 -> %10 is also a real copy, but the last %13 -> xmm0 COPY can be removed because %13 can be assigned to xmm0.

What makes the old result generate better final instructions? The answer is instruction scheduling. The memory store is moved before the %9 -> %10 copy, so in the COPY %9 is the last use, can be coalesced with %10 and assigned to xmm0, then both COPY instructions are removed. So the better old result is just lucky.

It implies a pass order problem here, different operands are killed in different instruction sequences, it impacts the optimal commuting decisions.

ping

Rebase.

MaskRay added a subscriber: MaskRay.Sep 17 2021, 11:49 AM

Harbormaster completed remote builds in B124451: Diff 373295.Sep 17 2021, 12:35 PM

craig.topper added inline comments.Sep 17 2021, 8:46 PM

llvm/lib/CodeGen/TwoAddressInstructionPass.cpp
401	Use `TargetInstrInfo::CommuteAnyOperandIndex` so this doesn't look like a member access?
437	Why not check isReg() inside the loop and call getReg() in the loop. That wouldn't be that expensive would it?
675	Is this assert no longer valid?

pengfei added inline comments.Sep 17 2021, 11:32 PM

llvm/lib/CodeGen/TwoAddressInstructionPass.cpp
402	I'm confused about the code here. `findRegisterUseOperandIdx` return `-1` when the function fails. But `-1` is equal to `CommuteAnyOperandIndex`, which means we allow any operand to be commutable?

craig.topper added inline comments.Sep 17 2021, 11:57 PM

llvm/lib/CodeGen/TwoAddressInstructionPass.cpp
402	I think it should never fail, UseMI is already known to use Reg.

craig.topper added inline comments.Sep 18 2021, 12:05 AM

llvm/lib/CodeGen/TwoAddressInstructionPass.cpp
402	Maybe we should use `use_nodbg_begin` instead of `use_instr_nodbg_begin` earlier to get the `MachineOperand`, then use `MachineOperand::getParent()` to get `UseMI`. Then we can use the `MachineOperand` and `MachineInstr::getOperandNo()` here?

StephenFan added a subscriber: StephenFan.Sep 18 2021, 1:18 AM

Carrot updated this revision to Diff 373666.Sep 20 2021, 11:29 AM

Carrot marked 3 inline comments as done.

Carrot added inline comments.

llvm/lib/CodeGen/TwoAddressInstructionPass.cpp
675	Yes. Suppose we have instruction %102 = ADD killed %100, killed %101 When we process Reg=%100, findOnlyInterestingUse returns NewReg=%102, so a map entry SrcRegMap[%102] = %100 is added. Later when we process Reg=%101, since now we consider commuting operands, findOnlyInterestingUse also returns NewReg=%102, so %102 is mapped to a different register. SrcRegMap[%102] = %101

Harbormaster completed remote builds in B124720: Diff 373666.Sep 20 2021, 12:05 PM

craig.topper added inline comments.Sep 21 2021, 9:03 AM

llvm/test/CodeGen/X86/addsub-constant-folding.ll
54–55	What happened here?
llvm/test/CodeGen/X86/avx512-regcall-NoMask.ll
1080	Is this test using a lot more leas now?
llvm/test/CodeGen/X86/hhvm-cc.ll
106 ↗	(On Diff #373666)	This looks worse

Carrot added inline comments.Sep 21 2021, 2:33 PM

llvm/test/CodeGen/X86/hhvm-cc.ll

106 ↗

(On Diff #373666)

The code before TwoAddress pass is:

bb.0.entry:

liveins: $rbx, $r12, $rbp
%2:gr64 = COPY killed $rbp
%1:gr64 = COPY killed $r12
%0:gr64 = COPY killed $rbx
ADJCALLSTACKDOWN64 0, 0, 0, implicit-def dead $rsp, implicit-def dead $eflags, implicit-def dead $ssp, implicit $rsp, implicit $ssp
%3:gr64 = MOV32ri64 42
$rbx = COPY killed %0:gr64
$r12 = COPY %1:gr64
$rbp = COPY killed %2:gr64
$r15 = COPY killed %3:gr64
CALL64pcrel32 target-flags(x86-plt) @php_short, <regmask $r12 $r12b $r12bh $r12d $r12w $r12wh>, implicit $rsp, implicit $ssp, implicit killed $rbx, implicit killed $r12, implicit killed $rbp, implicit killed $r15, implicit-def $rsp, implicit-def $ssp, implicit-def dead $rbx, implicit-def $rbp
ADJCALLSTACKUP64 0, 0, implicit-def dead $rsp, implicit-def dead $eflags, implicit-def dead $ssp, implicit $rsp, implicit $ssp 
%5:gr64 = COPY killed $rbp 
%6:gr64 = ADD64rr killed %5:gr64(tied-def 0), killed %1:gr64, implicit-def dead $eflags
$rbx = COPY killed %6:gr64
RET 0, killed $rbx

In function call to php_short, $r12 is clobbered, with my patch, the map SrcRegMap[%1] = $r12 is cleared, it causes the following ADD instruction commuted. And later different registers are passed to isProfitableToConv3Addr, so different result is returned, and different lea/add instruction is generated.

I'm also surprised by the RA result, the live range of %1 crosses the function call, $r12 is killed and clobbered by the function call, why does $r12 still allocated to %1? The direct usage of $r12 after the function call looks wrong to me.

LuoYuanke added a subscriber: LuoYuanke.Sep 22 2021, 2:23 AM

craig.topper added inline comments.Sep 22 2021, 9:37 AM

llvm/test/CodeGen/X86/hhvm-cc.ll
106 ↗	(On Diff #373666)	The regmask for the function says r12 is preserved. All other registers are clobbered.

Carrot updated this revision to Diff 374410.Sep 22 2021, 5:51 PM

Carrot added inline comments.

llvm/test/CodeGen/X86/hhvm-cc.ll
106 ↗	(On Diff #373666)	Thanks for the explanation! Now I understand the problem is at $r12 = COPY %1:gr64 Before this instruction %1 is already mapped to $r12, copy it back to $r12 should not invalidate the map entry SrcRegMap[%1] = $r12. I should make the check in function removeClobberedSrcRegMap.

Harbormaster completed remote builds in B125258: Diff 374410.Sep 22 2021, 6:09 PM

Carrot added inline comments.Sep 23 2021, 5:17 PM

llvm/test/CodeGen/X86/addsub-constant-folding.ll
54–55	The code before TwoAddress pass is: %0:gr32 = COPY killed $edi %1:gr32 = ADD32ri8 %0:gr32(tied-def 0), 8, implicit-def dead $eflags ADJCALLSTACKDOWN64 0, 0, 0, implicit-def dead $rsp, implicit-def dead $eflags, implicit-def dead $ssp, implicit $rsp, implicit $ssp $edi = COPY killed %1:gr32 CALL64pcrel32 target-flags(x86-plt) @use, <regmask $bh $bl $bp $bph $bpl $bx $ebp $ebx $hbp $hbx $rbp $rbx $r12 $r13 $r14 $r15 $r12b $r13b $r14b $r15b $r12bh $r13bh $r14bh $r15bh $r12d $r13d $r14d $r15d $r12w $r13w $r14w $r15w $r12wh and 3 more...>, implicit $rsp, implicit $ssp, implicit killed $edi, implicit-def $rsp, implicit-def $ssp ADJCALLSTACKUP64 0, 0, implicit-def dead $rsp, implicit-def dead $eflags, implicit-def dead $ssp, implicit $rsp, implicit $ssp %2:gr32 = ADD32ri8 killed %0:gr32(tied-def 0), 10, implicit-def dead $eflags $eax = COPY killed %2:gr32 RET 0, killed $eax Without my patch LLVM generates LEA instructions because function isProfitableToConv3Addr returns true, with my patch function isProfitableToConv3Addr returns false. Although the original code generates good result, the reasoning process is wrong. Function isProfitableToConv3Addr returns true only when the src/dst registers mapped from/to different physical registers. In the ADD instruction we can see %2 is mapped to $eax, %0 is mapped from $edi, this is wrong because of the following instruction prevents coalescing of %0 and $edi. $edi = COPY killed %1:gr32 With this patch LLVM correctly removes the mapping from %0 to $edi, but it causes worse result because this pass doesn't consider other RA constraints, live range interference in this case. In the ADD instruction now %0 doesn't map from any physical register, so this pass hopes it can be allocated to the same physical register as %2($eax), and keeps the two address ADD instruction. Unfortunately $eax is clobbered by the CALL instruction, so it is interfere with %0, $eax can't be allocated to %0, so the last COPY instruction becomes MOV.

Carrot added inline comments.Sep 27 2021, 7:32 PM

llvm/test/CodeGen/X86/avx512-regcall-NoMask.ll
1080	In this case there are many commutable instructions, with my code in findOnlyInterestingUse, more virtual registers can be mapped to %eax now, so more instructions can satisfy the last condition in isProfitableToConv3Addr return (ToRegA && !regsAreCompatible(FromRegB, ToRegA, TRI)); The difficult part in this test case is there are so many commutable instructions, and 11 physical registers are copied from, each commutable instruction generates two map from possibilities, the total number of possible map from relations is a huge number. Also almost every virtual register can map to the result %eax. But in our implementation of SrcRegMap and DstRegMap, for each virtual register there is only one mapped from/to register. Also there is no sophisticated algorithm to choose a good mapping, we simply process each instruction one by one and update the mapping. So it is difficult to find the best mapping to guide instruction commute and 3-address instruction conversion.

foad added a subscriber: foad.Sep 28 2021, 7:07 AM

rebase.
Any other comments?

Harbormaster completed remote builds in B126473: Diff 376074.Sep 29 2021, 5:33 PM

I can see you analyzed several regressions and thought the root causes are not the patch. I still have concern about the overall performance. Do you have any results on spec or benchmark that proves we are getting more gain with this patch?

I ran spec2006 on a skylake desktop, the result is 38.2 vs 38.3, so no difference.
I also checked the overall impact on impacted test case

carrot@carrot:~$ grep "\+\;" /tmp/patch | wc

2787   14813  114855

carrot@carrot:~$ grep "\-\;" /tmp/patch | wc

3138   16706  128560

About 351 instructions are deleted by this patch.

ping

LGTM

This revision is now accepted and ready to land.Oct 8 2021, 10:02 AM

This revision was landed with ongoing or failed builds.Oct 11 2021, 3:32 PM

Closed by commit rG6599961c1707: [TwoAddressInstructionPass] Improve the SrcRegMap and DstRegMap computation (authored by Carrot). · Explain Why

This revision was automatically updated to reflect the committed changes.

Carrot added a commit: rG6599961c1707: [TwoAddressInstructionPass] Improve the SrcRegMap and DstRegMap computation.

Revision Contents

Path

Size

llvm/

lib/

CodeGen/

TwoAddressInstructionPass.cpp

100 lines

test/

CodeGen/

ARM/

ssat.ll

12 lines

usat.ll

16 lines

AVR/

ctpop.ll

5 lines

hardware-mul.ll

11 lines

SystemZ/

int-cmp-57.ll

4 lines

Thumb/

pr35836_2.ll

12 lines

X86/

DynamicCalleeSavedRegisters.ll

5 lines

abs.ll

13 lines

add-cmov.ll

16 lines

addsub-constant-folding.ll

12 lines

8 lines

21 lines

20 lines

7 lines

7 lines

avx512-regcall-NoMask.ll

198 lines

14 lines

8 lines

8 lines

17 lines

5 lines

9 lines

3 lines

5 lines

326 lines

12 lines

12 lines

10 lines

3 lines

35 lines

79 lines

4 lines

25 lines

35 lines

25 lines

4 lines

13 lines

47 lines

horizontal-reduce-fadd.ll

12 lines

30 lines

23 lines

13 lines

3 lines

midpoint-int-vec-128.ll

292 lines

1 line

2 lines

76 lines

1 line

4 lines

3 lines

4 lines

3 lines

46 lines

29 lines

4 lines

3 lines

30 lines

36 lines

6 lines

7 lines

5 lines

65 lines

28 lines

13 lines

select-constant-xor.ll

1 line

7 lines

8 lines

26 lines

8 lines

167 lines

sqrt-fastmath-tune.ll

69 lines

28 lines

50 lines

16 lines

21 lines

288 lines

stack-folding-fp-avx512.ll

12 lines

stack-folding-int-avx512.ll

9 lines

tbm-intrinsics-fast-isel-x86_64.ll

32 lines

tbm-intrinsics-fast-isel.ll

16 lines

16 lines

41 lines

8 lines

11 lines

72 lines

umulo-128-legalisation-lowering.ll

5 lines

umulo-64-legalisation-lowering.ll

11 lines

unfold-masked-merge-scalar-variablemask.ll

61 lines

urem-lkk.ll

21 lines

urem-seteq-vec-nonzero.ll

6 lines

vec-strict-fptoint-128.ll

34 lines

18 lines

72 lines

102 lines

49 lines

47 lines

6 lines

35 lines

49 lines

34 lines

28 lines

48 lines

231 lines

vector-fshl-rot-128.ll

65 lines

vector-fshl-rot-sub128.ll

33 lines

vector-fshr-128.ll

324 lines

vector-fshr-rot-128.ll

79 lines

vector-fshr-rot-sub128.ll

33 lines

vector-idiv-udiv-128.ll

9 lines

vector-lzcnt-128.ll

278 lines

vector-mul.ll

61 lines

vector-popcnt-128-ult-ugt.ll

130 lines

vector-popcnt-128.ll

145 lines

vector-reduce-fadd-fast.ll

42 lines

vector-reduce-fadd.ll

30 lines

vector-reduce-fmax.ll

60 lines

vector-reduce-fmul-fast.ll

42 lines

vector-reduce-fmul.ll

30 lines

vector-reduce-smax.ll

74 lines

vector-reduce-umax.ll

74 lines

vector-rotate-128.ll

65 lines

vector-shift-ashr-128.ll

16 lines

vector-shift-ashr-sub128.ll

16 lines

vector-shuffle-combining.ll

6 lines

vector-trunc-math.ll

8 lines

vector-tzcnt-128.ll

56 lines

vector-unsigned-cmp.ll

12 lines

vselect-minmax.ll

676 lines

vselect-zero.ll

9 lines

x86-no_caller_saved_registers-preserve.ll

3 lines

x86-shifts.ll

13 lines

Diff 378815

llvm/lib/CodeGen/TwoAddressInstructionPass.cpp

Show First 20 Lines • Show All 112 Lines • ▼ Show 20 Lines	class TwoAddressInstructionPass : public MachineFunctionPass {
// registers. e.g. v1024 = move r0.		// registers. e.g. v1024 = move r0.
DenseMap<Register, Register> SrcRegMap;		DenseMap<Register, Register> SrcRegMap;

// A map from virtual registers to physical registers which are likely targets		// A map from virtual registers to physical registers which are likely targets
// to be coalesced to due to copies to physical registers from virtual		// to be coalesced to due to copies to physical registers from virtual
// registers. e.g. r1 = move v1024.		// registers. e.g. r1 = move v1024.
DenseMap<Register, Register> DstRegMap;		DenseMap<Register, Register> DstRegMap;

		void removeClobberedSrcRegMap(MachineInstr *MI);

bool isRevCopyChain(Register FromReg, Register ToReg, int Maxlen);		bool isRevCopyChain(Register FromReg, Register ToReg, int Maxlen);

bool noUseAfterLastDef(Register Reg, unsigned Dist, unsigned &LastDef);		bool noUseAfterLastDef(Register Reg, unsigned Dist, unsigned &LastDef);

bool isProfitableToCommute(Register RegA, Register RegB, Register RegC,		bool isProfitableToCommute(Register RegA, Register RegB, Register RegC,
MachineInstr *MI, unsigned Dist);		MachineInstr *MI, unsigned Dist);

bool commuteInstruction(MachineInstr *MI, unsigned DstIdx,		bool commuteInstruction(MachineInstr *MI, unsigned DstIdx,
▲ Show 20 Lines • Show All 246 Lines • ▼ Show 20 Lines
/// instruction if it's a copy or a two-address use.		/// instruction if it's a copy or a two-address use.
static MachineInstr *		static MachineInstr *
findOnlyInterestingUse(Register Reg, MachineBasicBlock *MBB,		findOnlyInterestingUse(Register Reg, MachineBasicBlock *MBB,
MachineRegisterInfo MRI, const TargetInstrInfo TII,		MachineRegisterInfo MRI, const TargetInstrInfo TII,
bool &IsCopy, Register &DstReg, bool &IsDstPhys) {		bool &IsCopy, Register &DstReg, bool &IsDstPhys) {
if (!MRI->hasOneNonDBGUse(Reg))		if (!MRI->hasOneNonDBGUse(Reg))
// None or more than one use.		// None or more than one use.
return nullptr;		return nullptr;
MachineInstr &UseMI = *MRI->use_instr_nodbg_begin(Reg);		MachineOperand &UseOp = *MRI->use_nodbg_begin(Reg);
		MachineInstr &UseMI = *UseOp.getParent();
if (UseMI.getParent() != MBB)		if (UseMI.getParent() != MBB)
return nullptr;		return nullptr;
Register SrcReg;		Register SrcReg;
bool IsSrcPhys;		bool IsSrcPhys;
if (isCopyToReg(UseMI, TII, SrcReg, DstReg, IsSrcPhys, IsDstPhys)) {		if (isCopyToReg(UseMI, TII, SrcReg, DstReg, IsSrcPhys, IsDstPhys)) {
IsCopy = true;		IsCopy = true;
return &UseMI;		return &UseMI;
}		}
IsDstPhys = false;		IsDstPhys = false;
if (isTwoAddrUse(UseMI, Reg, DstReg)) {		if (isTwoAddrUse(UseMI, Reg, DstReg)) {
IsDstPhys = DstReg.isPhysical();		IsDstPhys = DstReg.isPhysical();
return &UseMI;		return &UseMI;
}		}
		if (UseMI.isCommutable()) {
		unsigned Src1 = TargetInstrInfo::CommuteAnyOperandIndex;
		craig.topperUnsubmitted Done Reply Inline Actions Use `TargetInstrInfo::CommuteAnyOperandIndex` so this doesn't look like a member access? craig.topper: Use `TargetInstrInfo::CommuteAnyOperandIndex` so this doesn't look like a member access?
		unsigned Src2 = UseMI.getOperandNo(&UseOp);
		pengfeiUnsubmitted Not Done Reply Inline Actions I'm confused about the code here. `findRegisterUseOperandIdx` return `-1` when the function fails. But `-1` is equal to `CommuteAnyOperandIndex`, which means we allow any operand to be commutable? pengfei: I'm confused about the code here. `findRegisterUseOperandIdx` return `-1` when the function…
		craig.topperUnsubmitted Not Done Reply Inline Actions I think it should never fail, UseMI is already known to use Reg. craig.topper: I think it should never fail, UseMI is already known to use Reg.
		craig.topperUnsubmitted Done Reply Inline Actions Maybe we should use `use_nodbg_begin` instead of `use_instr_nodbg_begin` earlier to get the `MachineOperand`, then use `MachineOperand::getParent()` to get `UseMI`. Then we can use the `MachineOperand` and `MachineInstr::getOperandNo()` here? craig.topper: Maybe we should use `use_nodbg_begin` instead of `use_instr_nodbg_begin` earlier to get the…
		if (TII->findCommutedOpIndices(UseMI, Src1, Src2)) {
		MachineOperand &MO = UseMI.getOperand(Src1);
		if (MO.isReg() && MO.isUse() &&
		isTwoAddrUse(UseMI, MO.getReg(), DstReg)) {
		IsDstPhys = DstReg.isPhysical();
		return &UseMI;
		}
		}
		}
return nullptr;		return nullptr;
}		}

/// Return the physical register the specified virtual register might be mapped		/// Return the physical register the specified virtual register might be mapped
/// to.		/// to.
static MCRegister getMappedReg(Register Reg,		static MCRegister getMappedReg(Register Reg,
DenseMap<Register, Register> &RegMap) {		DenseMap<Register, Register> &RegMap) {
while (Reg.isVirtual()) {		while (Reg.isVirtual()) {
Show All 9 Lines

/// Return true if the two registers are equal or aliased.		/// Return true if the two registers are equal or aliased.
static bool regsAreCompatible(Register RegA, Register RegB,		static bool regsAreCompatible(Register RegA, Register RegB,
const TargetRegisterInfo *TRI) {		const TargetRegisterInfo *TRI) {
if (RegA == RegB)		if (RegA == RegB)
return true;		return true;
if (!RegA \|\| !RegB)		if (!RegA \|\| !RegB)
return false;		return false;
return TRI->regsOverlap(RegA, RegB);		return TRI->regsOverlap(RegA, RegB);
		craig.topperUnsubmitted Done Reply Inline Actions Why not check isReg() inside the loop and call getReg() in the loop. That wouldn't be that expensive would it? craig.topper: Why not check isReg() inside the loop and call getReg() in the loop. That wouldn't be that…
}		}

		/// From RegMap remove entries mapped to a physical register which overlaps MO.
		static void removeMapRegEntry(const MachineOperand &MO,
		DenseMap<Register, Register> &RegMap,
		const TargetRegisterInfo *TRI) {
		assert(
		(MO.isReg() \|\| MO.isRegMask()) &&
		"removeMapRegEntry must be called with a register or regmask operand.");

		SmallVector<Register, 2> Srcs;
		for (auto SI : RegMap) {
		Register ToReg = SI.second;
		if (ToReg.isVirtual())
		continue;

		if (MO.isReg()) {
		Register Reg = MO.getReg();
		if (TRI->regsOverlap(ToReg, Reg))
		Srcs.push_back(SI.first);
		} else if (MO.clobbersPhysReg(ToReg))
		Srcs.push_back(SI.first);
		}

		for (auto SrcReg : Srcs)
		RegMap.erase(SrcReg);
		}

		/// If a physical register is clobbered, old entries mapped to it should be
		/// deleted. For example
		///
		/// %2:gr64 = COPY killed $rdx
		/// MUL64r %3:gr64, implicit-def $rax, implicit-def $rdx
		///
		/// After the MUL instruction, $rdx contains different value than in the COPY
		/// instruction. So %2 should not map to $rdx after MUL.
		void TwoAddressInstructionPass::removeClobberedSrcRegMap(MachineInstr *MI) {
		if (MI->isCopy()) {
		// If a virtual register is copied to its mapped physical register, it
		// doesn't change the potential coalescing between them, so we don't remove
		// entries mapped to the physical register. For example
		//
		// %100 = COPY $r8
		// ...
		// $r8 = COPY %100
		//
		// The first copy constructs SrcRegMap[%100] = $r8, the second copy doesn't
		// destroy the content of $r8, and should not impact SrcRegMap.
		Register Dst = MI->getOperand(0).getReg();
		if (!Dst \|\| Dst.isVirtual())
		return;

		Register Src = MI->getOperand(1).getReg();
		if (regsAreCompatible(Dst, getMappedReg(Src, SrcRegMap), TRI))
		return;
		}

		for (unsigned i = 0, NumOps = MI->getNumOperands(); i != NumOps; ++i) {
		const MachineOperand &MO = MI->getOperand(i);
		if (MO.isRegMask()) {
		removeMapRegEntry(MO, SrcRegMap, TRI);
		continue;
		}
		if (!MO.isReg() \|\| !MO.isDef())
		continue;
		Register Reg = MO.getReg();
		if (!Reg \|\| Reg.isVirtual())
		continue;
		removeMapRegEntry(MO, SrcRegMap, TRI);
		}
		}

// Returns true if Reg is equal or aliased to at least one register in Set.		// Returns true if Reg is equal or aliased to at least one register in Set.
static bool regOverlapsSet(const SmallVectorImpl<Register> &Set, Register Reg,		static bool regOverlapsSet(const SmallVectorImpl<Register> &Set, Register Reg,
const TargetRegisterInfo *TRI) {		const TargetRegisterInfo *TRI) {
for (unsigned R : Set)		for (unsigned R : Set)
if (TRI->regsOverlap(R, Reg))		if (TRI->regsOverlap(R, Reg))
return true;		return true;

return false;		return false;
▲ Show 20 Lines • Show All 232 Lines • ▼ Show 20 Lines	while (MachineInstr *UseMI = findOnlyInterestingUse(Reg, MBB, MRI, TII,IsCopy,
if (DI != DistanceMap.end())		if (DI != DistanceMap.end())
// Earlier in the same MBB.Reached via a back edge.		// Earlier in the same MBB.Reached via a back edge.
break;		break;

if (IsDstPhys) {		if (IsDstPhys) {
VirtRegPairs.push_back(NewReg);		VirtRegPairs.push_back(NewReg);
break;		break;
}		}
bool isNew = SrcRegMap.insert(std::make_pair(NewReg, Reg)).second;		SrcRegMap[NewReg] = Reg;
if (!isNew)
assert(SrcRegMap[NewReg] == Reg && "Can't map to two src registers!");
craig.topperUnsubmitted Not Done Reply Inline Actions Is this assert no longer valid? craig.topper: Is this assert no longer valid?
CarrotAuthorUnsubmitted Done Reply Inline Actions Yes. Suppose we have instruction %102 = ADD killed %100, killed %101 When we process Reg=%100, findOnlyInterestingUse returns NewReg=%102, so a map entry SrcRegMap[%102] = %100 is added. Later when we process Reg=%101, since now we consider commuting operands, findOnlyInterestingUse also returns NewReg=%102, so %102 is mapped to a different register. SrcRegMap[%102] = %101 Carrot: Yes. Suppose we have instruction %102 = ADD killed %100, killed %101 When we process Reg=%100…
VirtRegPairs.push_back(NewReg);		VirtRegPairs.push_back(NewReg);
Reg = NewReg;		Reg = NewReg;
}		}

if (!VirtRegPairs.empty()) {		if (!VirtRegPairs.empty()) {
unsigned ToReg = VirtRegPairs.back();		unsigned ToReg = VirtRegPairs.back();
VirtRegPairs.pop_back();		VirtRegPairs.pop_back();
while (!VirtRegPairs.empty()) {		while (!VirtRegPairs.empty()) {
▲ Show 20 Lines • Show All 790 Lines • ▼ Show 20 Lines	#endif
// Make sure regA is a legal regclass for the SrcIdx operand.		// Make sure regA is a legal regclass for the SrcIdx operand.
if (RegA.isVirtual() && RegB.isVirtual())		if (RegA.isVirtual() && RegB.isVirtual())
MRI->constrainRegClass(RegA, RC);		MRI->constrainRegClass(RegA, RC);
MO.setReg(RegA);		MO.setReg(RegA);
// The getMatchingSuper asserts guarantee that the register class projected		// The getMatchingSuper asserts guarantee that the register class projected
// by SubRegB is compatible with RegA with no subregister. So regardless of		// by SubRegB is compatible with RegA with no subregister. So regardless of
// whether the dest oper writes a subreg, the source oper should not.		// whether the dest oper writes a subreg, the source oper should not.
MO.setSubReg(0);		MO.setSubReg(0);

// Propagate SrcRegMap.
SrcRegMap[RegA] = RegB;
}		}

if (AllUsesCopied) {		if (AllUsesCopied) {
bool ReplacedAllUntiedUses = false;		bool ReplacedAllUntiedUses = false;
if (!IsEarlyClobber) {		if (!IsEarlyClobber) {
// Replace other (un-tied) uses of regB with LastCopiedReg.		// Replace other (un-tied) uses of regB with LastCopiedReg.
ReplacedAllUntiedUses = true;		ReplacedAllUntiedUses = true;
for (MachineOperand &MO : MI->operands()) {		for (MachineOperand &MO : MI->operands()) {
Show All 15 Lines	if (AllUsesCopied) {
// Update live variables for regB.		// Update live variables for regB.
if (RemovedKillFlag && ReplacedAllUntiedUses &&		if (RemovedKillFlag && ReplacedAllUntiedUses &&
LV && LV->getVarInfo(RegB).removeKill(*MI)) {		LV && LV->getVarInfo(RegB).removeKill(*MI)) {
MachineBasicBlock::iterator PrevMI = MI;		MachineBasicBlock::iterator PrevMI = MI;
--PrevMI;		--PrevMI;
LV->addVirtualRegisterKilled(RegB, *PrevMI);		LV->addVirtualRegisterKilled(RegB, *PrevMI);
}		}

		if (RemovedKillFlag && ReplacedAllUntiedUses)
		SrcRegMap[LastCopiedReg] = RegB;

// Update LiveIntervals.		// Update LiveIntervals.
if (LIS) {		if (LIS) {
LiveInterval &LI = LIS->getInterval(RegB);		LiveInterval &LI = LIS->getInterval(RegB);
SlotIndex MIIdx = LIS->getInstructionIndex(*MI);		SlotIndex MIIdx = LIS->getInstructionIndex(*MI);
LiveInterval::const_iterator I = LI.find(MIIdx);		LiveInterval::const_iterator I = LI.find(MIIdx);
assert(I != LI.end() && "RegB must be live-in to use.");		assert(I != LI.end() && "RegB must be live-in to use.");

SlotIndex UseIdx = MIIdx.getRegSlot(IsEarlyClobber);		SlotIndex UseIdx = MIIdx.getRegSlot(IsEarlyClobber);
▲ Show 20 Lines • Show All 70 Lines • ▼ Show 20 Lines	for (MachineBasicBlock::iterator mi = MBB->begin(), me = MBB->end();

DistanceMap.insert(std::make_pair(&*mi, ++Dist));		DistanceMap.insert(std::make_pair(&*mi, ++Dist));

processCopy(&*mi);		processCopy(&*mi);

// First scan through all the tied register uses in this instruction		// First scan through all the tied register uses in this instruction
// and record a list of pairs of tied operands for each register.		// and record a list of pairs of tied operands for each register.
if (!collectTiedOperands(&*mi, TiedOperands)) {		if (!collectTiedOperands(&*mi, TiedOperands)) {
		removeClobberedSrcRegMap(&*mi);
mi = nmi;		mi = nmi;
continue;		continue;
}		}

++NumTwoAddressInstrs;		++NumTwoAddressInstrs;
MadeChange = true;		MadeChange = true;
LLVM_DEBUG(dbgs() << '\t' << *mi);		LLVM_DEBUG(dbgs() << '\t' << *mi);

// If the instruction has a single pair of tied operands, try some		// If the instruction has a single pair of tied operands, try some
// transformations that may either eliminate the tied operands or		// transformations that may either eliminate the tied operands or
// improve the opportunities for coalescing away the register copy.		// improve the opportunities for coalescing away the register copy.
if (TiedOperands.size() == 1) {		if (TiedOperands.size() == 1) {
SmallVectorImpl<std::pair<unsigned, unsigned>> &TiedPairs		SmallVectorImpl<std::pair<unsigned, unsigned>> &TiedPairs
= TiedOperands.begin()->second;		= TiedOperands.begin()->second;
if (TiedPairs.size() == 1) {		if (TiedPairs.size() == 1) {
unsigned SrcIdx = TiedPairs[0].first;		unsigned SrcIdx = TiedPairs[0].first;
unsigned DstIdx = TiedPairs[0].second;		unsigned DstIdx = TiedPairs[0].second;
Register SrcReg = mi->getOperand(SrcIdx).getReg();		Register SrcReg = mi->getOperand(SrcIdx).getReg();
Register DstReg = mi->getOperand(DstIdx).getReg();		Register DstReg = mi->getOperand(DstIdx).getReg();
if (SrcReg != DstReg &&		if (SrcReg != DstReg &&
tryInstructionTransform(mi, nmi, SrcIdx, DstIdx, Dist, false)) {		tryInstructionTransform(mi, nmi, SrcIdx, DstIdx, Dist, false)) {
// The tied operands have been eliminated or shifted further down		// The tied operands have been eliminated or shifted further down
// the block to ease elimination. Continue processing with 'nmi'.		// the block to ease elimination. Continue processing with 'nmi'.
TiedOperands.clear();		TiedOperands.clear();
		removeClobberedSrcRegMap(&*mi);
mi = nmi;		mi = nmi;
continue;		continue;
}		}
}		}
}		}

// Now iterate over the information collected above.		// Now iterate over the information collected above.
for (auto &TO : TiedOperands) {		for (auto &TO : TiedOperands) {
Show All 13 Lines	for (MachineBasicBlock::iterator mi = MBB->begin(), me = MBB->end();
mi->RemoveOperand(1);		mi->RemoveOperand(1);
mi->setDesc(TII->get(TargetOpcode::COPY));		mi->setDesc(TII->get(TargetOpcode::COPY));
LLVM_DEBUG(dbgs() << "\t\tconvert to:\t" << *mi);		LLVM_DEBUG(dbgs() << "\t\tconvert to:\t" << *mi);
}		}

// Clear TiedOperands here instead of at the top of the loop		// Clear TiedOperands here instead of at the top of the loop
// since most instructions do not have tied operands.		// since most instructions do not have tied operands.
TiedOperands.clear();		TiedOperands.clear();
		removeClobberedSrcRegMap(&*mi);
mi = nmi;		mi = nmi;
}		}
}		}

if (LIS)		if (LIS)
MF->verify(this, "After two-address instruction pass");		MF->verify(this, "After two-address instruction pass");

return MadeChange;		return MadeChange;
▲ Show 20 Lines • Show All 92 Lines • Show Last 20 Lines

llvm/test/CodeGen/ARM/ssat.ll

Show First 20 Lines • Show All 388 Lines • ▼ Show 20 Lines	entry:
%saturateUp = select i1 %cmpUp, i32 8388607, i32 %saturateLow		%saturateUp = select i1 %cmpUp, i32 8388607, i32 %saturateLow
ret i32 %saturateUp		ret i32 %saturateUp
}		}

; Lower constant is different in the select and in the compare		; Lower constant is different in the select and in the compare
define i32 @no_sat_incorrect_constant(i32 %x) #0 {		define i32 @no_sat_incorrect_constant(i32 %x) #0 {
; V4T-LABEL: no_sat_incorrect_constant:		; V4T-LABEL: no_sat_incorrect_constant:
; V4T: @ %bb.0: @ %entry		; V4T: @ %bb.0: @ %entry
; V4T-NEXT: mov r2, #1065353216		; V4T-NEXT: mov r1, #1065353216
; V4T-NEXT: cmn r0, #8388608		; V4T-NEXT: cmn r0, #8388608
; V4T-NEXT: orr r2, r2, #-1073741824		; V4T-NEXT: orr r1, r1, #-1073741824
; V4T-NEXT: mov r1, r0		; V4T-NEXT: mov r2, r0
; V4T-NEXT: orrlt r1, r2, #1		; V4T-NEXT: orrlt r2, r1, #1
; V4T-NEXT: ldr r2, .LCPI11_0		; V4T-NEXT: ldr r1, .LCPI11_0
; V4T-NEXT: cmp r0, #8388608		; V4T-NEXT: cmp r0, #8388608
; V4T-NEXT: movge r1, r2		; V4T-NEXT: movlt r1, r2
; V4T-NEXT: mov r0, r1		; V4T-NEXT: mov r0, r1
; V4T-NEXT: bx lr		; V4T-NEXT: bx lr
; V4T-NEXT: .p2align 2		; V4T-NEXT: .p2align 2
; V4T-NEXT: @ %bb.1:		; V4T-NEXT: @ %bb.1:
; V4T-NEXT: .LCPI11_0:		; V4T-NEXT: .LCPI11_0:
; V4T-NEXT: .long 8388607 @ 0x7fffff		; V4T-NEXT: .long 8388607 @ 0x7fffff
;		;
; V6T2-LABEL: no_sat_incorrect_constant:		; V6T2-LABEL: no_sat_incorrect_constant:
▲ Show 20 Lines • Show All 245 Lines • Show Last 20 Lines

llvm/test/CodeGen/ARM/usat.ll

Show First 20 Lines • Show All 560 Lines • ▼ Show 20 Lines	entry:
ret i32 %saturateUp		ret i32 %saturateUp
}		}

; One of the values in a compare (y) is not the same as the rest		; One of the values in a compare (y) is not the same as the rest
; of the compare and select values (x).		; of the compare and select values (x).
define i32 @no_unsigned_sat_incorrect_compare(i32 %x, i32 %y) #0 {		define i32 @no_unsigned_sat_incorrect_compare(i32 %x, i32 %y) #0 {
; V4T-LABEL: no_unsigned_sat_incorrect_compare:		; V4T-LABEL: no_unsigned_sat_incorrect_compare:
; V4T: @ %bb.0: @ %entry		; V4T: @ %bb.0: @ %entry
; V4T-NEXT: ldr r2, .LCPI14_0
; V4T-NEXT: cmp r1, #0		; V4T-NEXT: cmp r1, #0
; V4T-NEXT: mov r1, r0		; V4T-NEXT: mov r2, r0
; V4T-NEXT: movmi r1, #0		; V4T-NEXT: movmi r2, #0
		; V4T-NEXT: ldr r1, .LCPI14_0
; V4T-NEXT: cmp r0, #8388608		; V4T-NEXT: cmp r0, #8388608
; V4T-NEXT: movge r1, r2		; V4T-NEXT: movlt r1, r2
; V4T-NEXT: mov r0, r1		; V4T-NEXT: mov r0, r1
; V4T-NEXT: bx lr		; V4T-NEXT: bx lr
; V4T-NEXT: .p2align 2		; V4T-NEXT: .p2align 2
; V4T-NEXT: @ %bb.1:		; V4T-NEXT: @ %bb.1:
; V4T-NEXT: .LCPI14_0:		; V4T-NEXT: .LCPI14_0:
; V4T-NEXT: .long 8388607 @ 0x7fffff		; V4T-NEXT: .long 8388607 @ 0x7fffff
;		;
; V6-LABEL: no_unsigned_sat_incorrect_compare:		; V6-LABEL: no_unsigned_sat_incorrect_compare:
; V6: @ %bb.0: @ %entry		; V6: @ %bb.0: @ %entry
; V6-NEXT: ldr r2, .LCPI14_0
; V6-NEXT: cmp r1, #0		; V6-NEXT: cmp r1, #0
; V6-NEXT: mov r1, r0		; V6-NEXT: mov r2, r0
; V6-NEXT: movmi r1, #0		; V6-NEXT: movmi r2, #0
		; V6-NEXT: ldr r1, .LCPI14_0
; V6-NEXT: cmp r0, #8388608		; V6-NEXT: cmp r0, #8388608
; V6-NEXT: movge r1, r2		; V6-NEXT: movlt r1, r2
; V6-NEXT: mov r0, r1		; V6-NEXT: mov r0, r1
; V6-NEXT: bx lr		; V6-NEXT: bx lr
; V6-NEXT: .p2align 2		; V6-NEXT: .p2align 2
; V6-NEXT: @ %bb.1:		; V6-NEXT: @ %bb.1:
; V6-NEXT: .LCPI14_0:		; V6-NEXT: .LCPI14_0:
; V6-NEXT: .long 8388607 @ 0x7fffff		; V6-NEXT: .long 8388607 @ 0x7fffff
;		;
; V6T2-LABEL: no_unsigned_sat_incorrect_compare:		; V6T2-LABEL: no_unsigned_sat_incorrect_compare:
Show All 16 Lines

llvm/test/CodeGen/AVR/ctpop.ll

	Show All 15 Lines
	; CHECK: mov {{.}}[[SCRATCH]], {{.}}[[RESULT]]			; CHECK: mov {{.}}[[SCRATCH]], {{.}}[[RESULT]]
	; CHECK: andi {{.*}}[[SCRATCH]], 51			; CHECK: andi {{.*}}[[SCRATCH]], 51
	; CHECK: lsr {{.*}}[[RESULT]]			; CHECK: lsr {{.*}}[[RESULT]]
	; CHECK: lsr {{.*}}[[RESULT]]			; CHECK: lsr {{.*}}[[RESULT]]
	; CHECK: andi {{.*}}[[RESULT]], 51			; CHECK: andi {{.*}}[[RESULT]], 51
	; CHECK: add {{.}}[[RESULT]], {{.}}[[SCRATCH]]			; CHECK: add {{.}}[[RESULT]], {{.}}[[SCRATCH]]
	; CHECK: mov {{.}}[[SCRATCH]], {{.}}[[RESULT]]			; CHECK: mov {{.}}[[SCRATCH]], {{.}}[[RESULT]]
	; CHECK: swap {{.*}}[[SCRATCH]]			; CHECK: swap {{.*}}[[SCRATCH]]
	; CHECK: add {{.}}[[SCRATCH]], {{.}}[[RESULT]]			; CHECK: add {{.}}[[RESULT]], {{.}}[[SCRATCH]]
	; CHECK: andi {{.*}}[[SCRATCH]], 15			; CHECK: andi {{.*}}[[RESULT]], 15
	; CHECK: mov {{.}}[[RESULT]], {{.}}[[SCRATCH]]
	; CHECK: ret			; CHECK: ret

llvm/test/CodeGen/AVR/hardware-mul.ll

	; RUN: llc -mattr=mul,movw < %s -march=avr \| FileCheck %s			; RUN: llc -mattr=mul,movw < %s -march=avr \| FileCheck %s

	; Tests lowering of multiplication to hardware instructions.			; Tests lowering of multiplication to hardware instructions.

	define i8 @mult8(i8 %a, i8 %b) {			define i8 @mult8(i8 %a, i8 %b) {
	; CHECK-LABEL: mult8:			; CHECK-LABEL: mult8:
	; CHECK: muls r22, r24			; CHECK: muls r22, r24
	; CHECK: clr r1			; CHECK: clr r1
	; CHECK: mov r24, r0			; CHECK: mov r24, r0
	%mul = mul i8 %b, %a			%mul = mul i8 %b, %a
	ret i8 %mul			ret i8 %mul
	}			}

	define i16 @mult16(i16 %a, i16 %b) {			define i16 @mult16(i16 %a, i16 %b) {
	; CHECK-LABEL: mult16:			; CHECK-LABEL: mult16:
	; CHECK: muls r22, r25			; CHECK: muls r22, r25
	; CHECK: mov r18, r0			; CHECK: mov r20, r0
	; CHECK: mul r22, r24			; CHECK: mul r22, r24
	; CHECK: mov r19, r0			; CHECK: mov r21, r0
	; CHECK: mov r20, r1			; CHECK: mov r18, r1
	; CHECK: clr r1			; CHECK: clr r1
	; CHECK: add r20, r18			; CHECK: add r18, r20
	; CHECK: muls r23, r24			; CHECK: muls r23, r24
	; CHECK: clr r1			; CHECK: clr r1
	; CHECK: mov r22, r0			; CHECK: add r18, r0
	; CHECK: add r22, r20
	; :TODO: finish after reworking shift instructions			; :TODO: finish after reworking shift instructions
	%mul = mul nsw i16 %b, %a			%mul = mul nsw i16 %b, %a
	ret i16 %mul			ret i16 %mul
	}			}

llvm/test/CodeGen/SystemZ/int-cmp-57.ll

Show First 20 Lines • Show All 76 Lines • ▼ Show 20 Lines	bb:
ret i32 %res		ret i32 %res
}		}

; Addition of the minimum value gives a positive or zero result.		; Addition of the minimum value gives a positive or zero result.
define i32 @fun6(i32 %arg) {		define i32 @fun6(i32 %arg) {
; CHECK-LABEL: fun6:		; CHECK-LABEL: fun6:
; CHECK: afi		; CHECK: afi
; CHECK-NEXT: chi		; CHECK-NEXT: chi
; CHECK-NEXT: locrlh		; CHECK-NEXT: locre
bb:		bb:
%tmp = add i32 %arg, -2147483648		%tmp = add i32 %arg, -2147483648
%tmp1 = icmp eq i32 %tmp, 0		%tmp1 = icmp eq i32 %tmp, 0
%res = select i1 %tmp1, i32 %tmp, i32 %arg		%res = select i1 %tmp1, i32 %tmp, i32 %arg
ret i32 %res		ret i32 %res
}		}

define i32 @fun7(i32 %arg) {		define i32 @fun7(i32 %arg) {
; CHECK-LABEL: fun7:		; CHECK-LABEL: fun7:
; CHECK: afi		; CHECK: afi
; CHECK-NEXT: chi		; CHECK-NEXT: chi
; CHECK-NEXT: locrle		; CHECK-NEXT: locrh
bb:		bb:
%tmp = add i32 %arg, -2147483648		%tmp = add i32 %arg, -2147483648
%tmp1 = icmp sgt i32 %tmp, 0		%tmp1 = icmp sgt i32 %tmp, 0
%res = select i1 %tmp1, i32 %tmp, i32 %arg		%res = select i1 %tmp1, i32 %tmp, i32 %arg
ret i32 %res		ret i32 %res
}		}

llvm/test/CodeGen/Thumb/pr35836_2.ll

Show All 30 Lines	entry:
%conv.i30 = zext i64 %5 to i128		%conv.i30 = zext i64 %5 to i128
%shl.i = shl nuw i128 %conv.i30, 64		%shl.i = shl nuw i128 %conv.i30, 64
%or17 = or i128 %shl.i, %conv.i37		%or17 = or i128 %shl.i, %conv.i37
%add = add i128 %or7, %or		%add = add i128 %or7, %or
%add18 = add i128 %or17, %or12		%add18 = add i128 %or17, %or12
%mul = mul i128 %add18, %add		%mul = mul i128 %add18, %add
ret i128 %mul		ret i128 %mul
}		}
; CHECK: adds r5, r1, r7		; CHECK: adds r5, r1, r6
; CHECK: mov r5, r4		; CHECK: mov r5, r4
; CHECK: adcs r5, r6		; CHECK: adcs r5, r7
; CHECK: ldr r5, [sp, #12] @ 4-byte Reload		; CHECK: ldr r5, [sp, #12] @ 4-byte Reload
; CHECK: adcs r2, r5		; CHECK: adcs r2, r5
; CHECK: ldr r5, [sp, #16] @ 4-byte Reload		; CHECK: ldr r5, [sp, #16] @ 4-byte Reload
; CHECK: adcs r3, r5		; CHECK: adcs r3, r5
; CHECK: adds r5, r1, r7		; CHECK: adds r6, r1, r6
; CHECK: adcs r4, r6		; CHECK: adcs r4, r7
; CHECK: ldr r1, [r0, #20]		; CHECK: ldr r1, [r0, #20]
; CHECK: str r1, [sp, #16] @ 4-byte Spill		; CHECK: str r1, [sp, #16] @ 4-byte Spill
; CHECK: ldr r6, [r0, #28]		; CHECK: ldr r5, [r0, #28]
; CHECK: ldr r1, [r0, #16]		; CHECK: ldr r1, [r0, #16]
; CHECK: ldr r7, [r0, #24]		; CHECK: ldr r7, [r0, #24]
; CHECK: adcs r7, r1		; CHECK: adcs r7, r1
; CHECK: ldr r0, [sp, #16] @ 4-byte Reload		; CHECK: ldr r0, [sp, #16] @ 4-byte Reload
; CHECK: adcs r6, r0		; CHECK: adcs r5, r0

llvm/test/CodeGen/X86/DynamicCalleeSavedRegisters.ll

	Show All 22 Lines
	; CHECK-NEXT: movl %edx, %ebx			; CHECK-NEXT: movl %edx, %ebx
	; CHECK-NEXT: movl %eax, %edx			; CHECK-NEXT: movl %eax, %edx
	; CHECK-NEXT: movl %esi, %eax			; CHECK-NEXT: movl %esi, %eax
	; CHECK-NEXT: movl %ebp, %ecx			; CHECK-NEXT: movl %ebp, %ecx
	; CHECK-NEXT: movl %ebx, %edi			; CHECK-NEXT: movl %ebx, %edi
	; CHECK-NEXT: movl {{[-0-9]+}}(%e{{[sb]}}p), %ebp # 4-byte Reload			; CHECK-NEXT: movl {{[-0-9]+}}(%e{{[sb]}}p), %ebp # 4-byte Reload
	; CHECK-NEXT: movl %ebp, %esi			; CHECK-NEXT: movl %ebp, %esi
	; CHECK-NEXT: calll callee@PLT			; CHECK-NEXT: calll callee@PLT
	; CHECK-NEXT: leal (%eax,%ebx), %esi			; CHECK-NEXT: addl %eax, %ebx
	; CHECK-NEXT: addl %ebp, %esi			; CHECK-NEXT: addl %ebp, %ebx
				; CHECK-NEXT: movl %ebx, %esi
	; CHECK-NEXT: addl $12, %esp			; CHECK-NEXT: addl $12, %esp
	; CHECK-NEXT: retl			; CHECK-NEXT: retl
	%b1 = call x86_regcallcc i32 @callee(i32 %a0, i32 %b0, i32 %c0, i32 %d0, i32 %e0)			%b1 = call x86_regcallcc i32 @callee(i32 %a0, i32 %b0, i32 %c0, i32 %d0, i32 %e0)
	%b2 = add i32 %b1, %d0			%b2 = add i32 %b1, %d0
	%b3 = add i32 %b2, %e0			%b3 = add i32 %b2, %e0
	ret i32 %b3			ret i32 %b3
	}			}
	!hipe.literals = !{ !0, !1, !2 }			!hipe.literals = !{ !0, !1, !2 }
	Show All 30 Lines

llvm/test/CodeGen/X86/abs.ll

	Show First 20 Lines • Show All 126 Lines • ▼ Show 20 Lines
	; X86-NEXT: retl			; X86-NEXT: retl
	%r = call i64 @llvm.abs.i64(i64 %a, i1 false)			%r = call i64 @llvm.abs.i64(i64 %a, i1 false)
	ret i64 %r			ret i64 %r
	}			}

	define i128 @test_i128(i128 %a) nounwind {			define i128 @test_i128(i128 %a) nounwind {
	; X64-LABEL: test_i128:			; X64-LABEL: test_i128:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: movq %rsi, %rdx
	; X64-NEXT: movq %rdi, %rax			; X64-NEXT: movq %rdi, %rax
	; X64-NEXT: movq %rsi, %rcx			; X64-NEXT: movq %rsi, %rdx
	; X64-NEXT: sarq $63, %rcx			; X64-NEXT: sarq $63, %rdx
	; X64-NEXT: addq %rcx, %rax			; X64-NEXT: addq %rdx, %rax
	; X64-NEXT: adcq %rcx, %rdx			; X64-NEXT: adcq %rdx, %rsi
	; X64-NEXT: xorq %rcx, %rax			; X64-NEXT: xorq %rdx, %rax
	; X64-NEXT: xorq %rcx, %rdx			; X64-NEXT: xorq %rsi, %rdx
	; X64-NEXT: retq			; X64-NEXT: retq
	;			;
	; X86-LABEL: test_i128:			; X86-LABEL: test_i128:
	; X86: # %bb.0:			; X86: # %bb.0:
	; X86-NEXT: pushl %ebx			; X86-NEXT: pushl %ebx
	; X86-NEXT: pushl %edi			; X86-NEXT: pushl %edi
	; X86-NEXT: pushl %esi			; X86-NEXT: pushl %esi
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	▲ Show 20 Lines • Show All 463 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/add-cmov.ll

Show First 20 Lines • Show All 130 Lines • ▼ Show 20 Lines	; CHECK-NEXT: retq
%r = add i32 %offset, %s		%r = add i32 %offset, %s
ret i32 %r		ret i32 %r
}		}

define i64 @select_max32_2_i64(i64 %offset, i64 %x) {		define i64 @select_max32_2_i64(i64 %offset, i64 %x) {
; CHECK-LABEL: select_max32_2_i64:		; CHECK-LABEL: select_max32_2_i64:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: leaq 2(%rdi), %rax		; CHECK-NEXT: leaq 2(%rdi), %rax
; CHECK-NEXT: addq $2147483647, %rdi # imm = 0x7FFFFFFF		; CHECK-NEXT: 2147483647(%rdi), %rcx
; CHECK-NEXT: cmpq $41, %rsi		; CHECK-NEXT: cmpq $41, %rsi
; CHECK-NEXT: cmovneq %rdi, %rax		; CHECK-NEXT: cmovneq %rcx, %rax
; CHECK-NEXT: retq		; CHECK-NEXT: retq
%b = icmp ne i64 %x, 41		%b = icmp ne i64 %x, 41
%s = select i1 %b, i64 2147483647, i64 2		%s = select i1 %b, i64 2147483647, i64 2
%r = add i64 %offset, %s		%r = add i64 %offset, %s
ret i64 %r		ret i64 %r
}		}

define i64 @select_42_min32_i64(i64 %offset, i1 %b) {		define i64 @select_42_min32_i64(i64 %offset, i1 %b) {
▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines	; CHECK-NEXT: retq
%r = add i64 %s, %offset		%r = add i64 %s, %offset
ret i64 %r		ret i64 %r
}		}

define i32 @select_20_43_i32(i32 %offset, i64 %x) {		define i32 @select_20_43_i32(i32 %offset, i64 %x) {
; CHECK-LABEL: select_20_43_i32:		; CHECK-LABEL: select_20_43_i32:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: # kill: def $edi killed $edi def $rdi		; CHECK-NEXT: # kill: def $edi killed $edi def $rdi
; CHECK-NEXT: leal 43(%rdi), %eax		; CHECK-NEXT: leal 43(%rdi), %ecx
; CHECK-NEXT: addl $20, %edi		; CHECK-NEXT: 20(%rdi), %eax
; CHECK-NEXT: cmpq $42, %rsi		; CHECK-NEXT: cmpq $42, %rsi
; CHECK-NEXT: cmovgel %edi, %eax		; CHECK-NEXT: cmovll %ecx, %eax
; CHECK-NEXT: retq		; CHECK-NEXT: retq
%b = icmp sgt i64 %x, 41		%b = icmp sgt i64 %x, 41
%s = select i1 %b, i32 20, i32 43		%s = select i1 %b, i32 20, i32 43
%r = add i32 %offset, %s		%r = add i32 %offset, %s
ret i32 %r		ret i32 %r
}		}

define i16 @select_n2_17_i16(i16 %offset, i1 %b) {		define i16 @select_n2_17_i16(i16 %offset, i1 %b) {
; CHECK-LABEL: select_n2_17_i16:		; CHECK-LABEL: select_n2_17_i16:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: # kill: def $edi killed $edi def $rdi		; CHECK-NEXT: # kill: def $edi killed $edi def $rdi
; CHECK-NEXT: leal 17(%rdi), %eax		; CHECK-NEXT: leal 17(%rdi), %ecx
; CHECK-NEXT: addl $65534, %edi # imm = 0xFFFE		; CHECK-NEXT: leal 65534(%rdi), %eax
; CHECK-NEXT: testb $1, %sil		; CHECK-NEXT: testb $1, %sil
; CHECK-NEXT: cmovnel %edi, %eax		; CHECK-NEXT: cmovel %ecx, %eax
; CHECK-NEXT: # kill: def $ax killed $ax killed $eax		; CHECK-NEXT: # kill: def $ax killed $ax killed $eax
; CHECK-NEXT: retq		; CHECK-NEXT: retq
%s = select i1 %b, i16 -2, i16 17		%s = select i1 %b, i16 -2, i16 17
%r = add i16 %offset, %s		%r = add i16 %offset, %s
ret i16 %r		ret i16 %r
}		}

%class.btAxis = type { %struct.btBroadphaseProxy.base, [3 x i16], [3 x i16], %struct.btBroadphaseProxy* }		%class.btAxis = type { %struct.btBroadphaseProxy.base, [3 x i16], [3 x i16], %struct.btBroadphaseProxy* }
▲ Show 20 Lines • Show All 237 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/addsub-constant-folding.ll

	Show First 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; X64-LABEL: add_const_add_const_extrause:			; X64-LABEL: add_const_add_const_extrause:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: pushq %rbx			; X64-NEXT: pushq %rbx
	; X64-NEXT: .cfi_def_cfa_offset 16			; X64-NEXT: .cfi_def_cfa_offset 16
	; X64-NEXT: .cfi_offset %rbx, -16			; X64-NEXT: .cfi_offset %rbx, -16
	; X64-NEXT: movl %edi, %ebx			; X64-NEXT: movl %edi, %ebx
	; X64-NEXT: leal 8(%rbx), %edi			; X64-NEXT: leal 8(%rbx), %edi
	; X64-NEXT: callq use@PLT			; X64-NEXT: callq use@PLT
	; X64-NEXT: leal 10(%rbx), %eax			; X64-NEXT: addl $10, %ebx
				; X64-NEXT: movl %ebx, %eax
				craig.topperUnsubmitted Not Done Reply Inline Actions What happened here? craig.topper: What happened here?
				CarrotAuthorUnsubmitted Done Reply Inline Actions The code before TwoAddress pass is: %0:gr32 = COPY killed $edi %1:gr32 = ADD32ri8 %0:gr32(tied-def 0), 8, implicit-def dead $eflags ADJCALLSTACKDOWN64 0, 0, 0, implicit-def dead $rsp, implicit-def dead $eflags, implicit-def dead $ssp, implicit $rsp, implicit $ssp $edi = COPY killed %1:gr32 CALL64pcrel32 target-flags(x86-plt) @use, <regmask $bh $bl $bp $bph $bpl $bx $ebp $ebx $hbp $hbx $rbp $rbx $r12 $r13 $r14 $r15 $r12b $r13b $r14b $r15b $r12bh $r13bh $r14bh $r15bh $r12d $r13d $r14d $r15d $r12w $r13w $r14w $r15w $r12wh and 3 more...>, implicit $rsp, implicit $ssp, implicit killed $edi, implicit-def $rsp, implicit-def $ssp ADJCALLSTACKUP64 0, 0, implicit-def dead $rsp, implicit-def dead $eflags, implicit-def dead $ssp, implicit $rsp, implicit $ssp %2:gr32 = ADD32ri8 killed %0:gr32(tied-def 0), 10, implicit-def dead $eflags $eax = COPY killed %2:gr32 RET 0, killed $eax Without my patch LLVM generates LEA instructions because function isProfitableToConv3Addr returns true, with my patch function isProfitableToConv3Addr returns false. Although the original code generates good result, the reasoning process is wrong. Function isProfitableToConv3Addr returns true only when the src/dst registers mapped from/to different physical registers. In the ADD instruction we can see %2 is mapped to $eax, %0 is mapped from $edi, this is wrong because of the following instruction prevents coalescing of %0 and $edi. $edi = COPY killed %1:gr32 With this patch LLVM correctly removes the mapping from %0 to $edi, but it causes worse result because this pass doesn't consider other RA constraints, live range interference in this case. In the ADD instruction now %0 doesn't map from any physical register, so this pass hopes it can be allocated to the same physical register as %2($eax), and keeps the two address ADD instruction. Unfortunately $eax is clobbered by the CALL instruction, so it is interfere with %0, $eax can't be allocated to %0, so the last COPY instruction becomes MOV. Carrot: The code before TwoAddress pass is: ``` %0:gr32 = COPY killed $edi %1:gr32 = ADD32ri8 %0…
	; X64-NEXT: popq %rbx			; X64-NEXT: popq %rbx
	; X64-NEXT: .cfi_def_cfa_offset 8			; X64-NEXT: .cfi_def_cfa_offset 8
	; X64-NEXT: retq			; X64-NEXT: retq
	%t0 = add i32 %arg, 8			%t0 = add i32 %arg, 8
	call void @use(i32 %t0)			call void @use(i32 %t0)
	%t1 = add i32 %t0, 2			%t1 = add i32 %t0, 2
	ret i32 %t1			ret i32 %t1
	}			}
	▲ Show 20 Lines • Show All 105 Lines • ▼ Show 20 Lines
	; X64-LABEL: add_const_sub_const_extrause:			; X64-LABEL: add_const_sub_const_extrause:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: pushq %rbx			; X64-NEXT: pushq %rbx
	; X64-NEXT: .cfi_def_cfa_offset 16			; X64-NEXT: .cfi_def_cfa_offset 16
	; X64-NEXT: .cfi_offset %rbx, -16			; X64-NEXT: .cfi_offset %rbx, -16
	; X64-NEXT: movl %edi, %ebx			; X64-NEXT: movl %edi, %ebx
	; X64-NEXT: leal 8(%rbx), %edi			; X64-NEXT: leal 8(%rbx), %edi
	; X64-NEXT: callq use@PLT			; X64-NEXT: callq use@PLT
	; X64-NEXT: leal 6(%rbx), %eax			; X64-NEXT: addl $6, %ebx
				; X64-NEXT: movl %ebx, %eax
	; X64-NEXT: popq %rbx			; X64-NEXT: popq %rbx
	; X64-NEXT: .cfi_def_cfa_offset 8			; X64-NEXT: .cfi_def_cfa_offset 8
	; X64-NEXT: retq			; X64-NEXT: retq
	%t0 = add i32 %arg, 8			%t0 = add i32 %arg, 8
	call void @use(i32 %t0)			call void @use(i32 %t0)
	%t1 = sub i32 %t0, 2			%t1 = sub i32 %t0, 2
	ret i32 %t1			ret i32 %t1
	}			}
	▲ Show 20 Lines • Show All 237 Lines • ▼ Show 20 Lines
	; X64-LABEL: sub_const_add_const_extrause:			; X64-LABEL: sub_const_add_const_extrause:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: pushq %rbx			; X64-NEXT: pushq %rbx
	; X64-NEXT: .cfi_def_cfa_offset 16			; X64-NEXT: .cfi_def_cfa_offset 16
	; X64-NEXT: .cfi_offset %rbx, -16			; X64-NEXT: .cfi_offset %rbx, -16
	; X64-NEXT: movl %edi, %ebx			; X64-NEXT: movl %edi, %ebx
	; X64-NEXT: leal -8(%rbx), %edi			; X64-NEXT: leal -8(%rbx), %edi
	; X64-NEXT: callq use@PLT			; X64-NEXT: callq use@PLT
	; X64-NEXT: leal -6(%rbx), %eax			; X64-NEXT: addl $-6, %ebx
				; X64-NEXT: movl %ebx, %eax
	; X64-NEXT: popq %rbx			; X64-NEXT: popq %rbx
	; X64-NEXT: .cfi_def_cfa_offset 8			; X64-NEXT: .cfi_def_cfa_offset 8
	; X64-NEXT: retq			; X64-NEXT: retq
	%t0 = sub i32 %arg, 8			%t0 = sub i32 %arg, 8
	call void @use(i32 %t0)			call void @use(i32 %t0)
	%t1 = add i32 %t0, 2			%t1 = add i32 %t0, 2
	ret i32 %t1			ret i32 %t1
	}			}
	▲ Show 20 Lines • Show All 101 Lines • ▼ Show 20 Lines
	; X64-LABEL: sub_const_sub_const_extrause:			; X64-LABEL: sub_const_sub_const_extrause:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: pushq %rbx			; X64-NEXT: pushq %rbx
	; X64-NEXT: .cfi_def_cfa_offset 16			; X64-NEXT: .cfi_def_cfa_offset 16
	; X64-NEXT: .cfi_offset %rbx, -16			; X64-NEXT: .cfi_offset %rbx, -16
	; X64-NEXT: movl %edi, %ebx			; X64-NEXT: movl %edi, %ebx
	; X64-NEXT: leal -8(%rbx), %edi			; X64-NEXT: leal -8(%rbx), %edi
	; X64-NEXT: callq use@PLT			; X64-NEXT: callq use@PLT
	; X64-NEXT: leal -10(%rbx), %eax			; X64-NEXT: addl $-10, %ebx
				; X64-NEXT: movl %ebx, %eax
	; X64-NEXT: popq %rbx			; X64-NEXT: popq %rbx
	; X64-NEXT: .cfi_def_cfa_offset 8			; X64-NEXT: .cfi_def_cfa_offset 8
	; X64-NEXT: retq			; X64-NEXT: retq
	%t0 = sub i32 %arg, 8			%t0 = sub i32 %arg, 8
	call void @use(i32 %t0)			call void @use(i32 %t0)
	%t1 = sub i32 %t0, 2			%t1 = sub i32 %t0, 2
	ret i32 %t1			ret i32 %t1
	}			}
	▲ Show 20 Lines • Show All 583 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/align-down.ll

	Show First 20 Lines • Show All 225 Lines • ▼ Show 20 Lines
	; BMI-X86: # %bb.0:			; BMI-X86: # %bb.0:
	; BMI-X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; BMI-X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; BMI-X86-NEXT: incl %eax			; BMI-X86-NEXT: incl %eax
	; BMI-X86-NEXT: andnl {{[0-9]+}}(%esp), %eax, %eax			; BMI-X86-NEXT: andnl {{[0-9]+}}(%esp), %eax, %eax
	; BMI-X86-NEXT: retl			; BMI-X86-NEXT: retl
	;			;
	; NOBMI-X64-LABEL: n8_not_lowbit_mask:			; NOBMI-X64-LABEL: n8_not_lowbit_mask:
	; NOBMI-X64: # %bb.0:			; NOBMI-X64: # %bb.0:
	; NOBMI-X64-NEXT: movl %esi, %eax			; NOBMI-X64-NEXT: # kill: def $esi killed $esi def $rsi
	; NOBMI-X64-NEXT: incl %eax			; NOBMI-X64-NEXT: leal 1(%rsi), %eax
	; NOBMI-X64-NEXT: notl %eax			; NOBMI-X64-NEXT: notl %eax
	; NOBMI-X64-NEXT: andl %edi, %eax			; NOBMI-X64-NEXT: andl %edi, %eax
	; NOBMI-X64-NEXT: retq			; NOBMI-X64-NEXT: retq
	;			;
	; BMI-X64-LABEL: n8_not_lowbit_mask:			; BMI-X64-LABEL: n8_not_lowbit_mask:
	; BMI-X64: # %bb.0:			; BMI-X64: # %bb.0:
	; BMI-X64-NEXT: incl %esi			; BMI-X64-NEXT: incl %esi
	; BMI-X64-NEXT: andnl %edi, %esi, %eax			; BMI-X64-NEXT: andnl %edi, %esi, %eax
	Show All 11 Lines
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: decl %eax			; X86-NEXT: decl %eax
	; X86-NEXT: andl %ecx, %eax			; X86-NEXT: andl %ecx, %eax
	; X86-NEXT: subl %ecx, %eax			; X86-NEXT: subl %ecx, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: n9_sub_is_not_commutative:			; X64-LABEL: n9_sub_is_not_commutative:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: movl %esi, %eax			; X64-NEXT: # kill: def $esi killed $esi def $rsi
	; X64-NEXT: decl %eax			; X64-NEXT: leal -1(%rsi), %eax
	; X64-NEXT: andl %edi, %eax			; X64-NEXT: andl %edi, %eax
	; X64-NEXT: subl %edi, %eax			; X64-NEXT: subl %edi, %eax
	; X64-NEXT: retq			; X64-NEXT: retq
	%mask = add i32 %alignment, -1			%mask = add i32 %alignment, -1
	%bias = and i32 %ptr, %mask			%bias = and i32 %ptr, %mask
	%r = sub i32 %bias, %ptr ; wrong order			%r = sub i32 %bias, %ptr ; wrong order
	ret i32 %r			ret i32 %r
	}			}

llvm/test/CodeGen/X86/arithmetic_fence2.ll

	Show First 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; X86-NEXT: .cfi_def_cfa %esp, 4			; X86-NEXT: .cfi_def_cfa %esp, 4
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: f2:			; X64-LABEL: f2:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: addsd %xmm0, %xmm0			; X64-NEXT: addsd %xmm0, %xmm0
	; X64-NEXT: movapd %xmm0, %xmm1			; X64-NEXT: movapd %xmm0, %xmm1
	; X64-NEXT: #ARITH_FENCE			; X64-NEXT: #ARITH_FENCE
	; X64-NEXT: addsd %xmm0, %xmm1			; X64-NEXT: addsd %xmm1, %xmm0
	; X64-NEXT: movapd %xmm1, %xmm0
	; X64-NEXT: retq			; X64-NEXT: retq
	%1 = fadd fast double %a, %a			%1 = fadd fast double %a, %a
	%t = call double @llvm.arithmetic.fence.f64(double %1)			%t = call double @llvm.arithmetic.fence.f64(double %1)
	%2 = fadd fast double %a, %a			%2 = fadd fast double %a, %a
	%3 = fadd fast double %t, %2			%3 = fadd fast double %t, %2
	ret double %3			ret double %3
	}			}

	Show All 14 Lines
	}			}

	define <2 x float> @f4(<2 x float> %a) {			define <2 x float> @f4(<2 x float> %a) {
	; X86-LABEL: f4:			; X86-LABEL: f4:
	; X86: # %bb.0:			; X86: # %bb.0:
	; X86-NEXT: addps %xmm0, %xmm0			; X86-NEXT: addps %xmm0, %xmm0
	; X86-NEXT: movaps %xmm0, %xmm1			; X86-NEXT: movaps %xmm0, %xmm1
	; X86-NEXT: #ARITH_FENCE			; X86-NEXT: #ARITH_FENCE
	; X86-NEXT: addps %xmm0, %xmm1			; X86-NEXT: addps %xmm1, %xmm0
	; X86-NEXT: movaps %xmm1, %xmm0
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: f4:			; X64-LABEL: f4:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: addps %xmm0, %xmm0			; X64-NEXT: addps %xmm0, %xmm0
	; X64-NEXT: movaps %xmm0, %xmm1			; X64-NEXT: movaps %xmm0, %xmm1
	; X64-NEXT: #ARITH_FENCE			; X64-NEXT: #ARITH_FENCE
	; X64-NEXT: addps %xmm0, %xmm1			; X64-NEXT: addps %xmm1, %xmm0
	; X64-NEXT: movaps %xmm1, %xmm0
	; X64-NEXT: retq			; X64-NEXT: retq
	%1 = fadd fast <2 x float> %a, %a			%1 = fadd fast <2 x float> %a, %a
	%t = call <2 x float> @llvm.arithmetic.fence.v2f32(<2 x float> %1)			%t = call <2 x float> @llvm.arithmetic.fence.v2f32(<2 x float> %1)
	%2 = fadd fast <2 x float> %a, %a			%2 = fadd fast <2 x float> %a, %a
	%3 = fadd fast <2 x float> %t, %2			%3 = fadd fast <2 x float> %t, %2
	ret <2 x float> %3			ret <2 x float> %3
	}			}

	Show All 21 Lines
	; X86-LABEL: f6:			; X86-LABEL: f6:
	; X86: # %bb.0:			; X86: # %bb.0:
	; X86-NEXT: addps %xmm0, %xmm0			; X86-NEXT: addps %xmm0, %xmm0
	; X86-NEXT: addps %xmm1, %xmm1			; X86-NEXT: addps %xmm1, %xmm1
	; X86-NEXT: movaps %xmm1, %xmm2			; X86-NEXT: movaps %xmm1, %xmm2
	; X86-NEXT: #ARITH_FENCE			; X86-NEXT: #ARITH_FENCE
	; X86-NEXT: movaps %xmm0, %xmm3			; X86-NEXT: movaps %xmm0, %xmm3
	; X86-NEXT: #ARITH_FENCE			; X86-NEXT: #ARITH_FENCE
	; X86-NEXT: addps %xmm0, %xmm3			; X86-NEXT: addps %xmm3, %xmm0
	; X86-NEXT: addps %xmm1, %xmm2			; X86-NEXT: addps %xmm2, %xmm1
	; X86-NEXT: movaps %xmm3, %xmm0
	; X86-NEXT: movaps %xmm2, %xmm1
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: f6:			; X64-LABEL: f6:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: addps %xmm0, %xmm0			; X64-NEXT: addps %xmm0, %xmm0
	; X64-NEXT: addps %xmm1, %xmm1			; X64-NEXT: addps %xmm1, %xmm1
	; X64-NEXT: movaps %xmm1, %xmm2			; X64-NEXT: movaps %xmm1, %xmm2
	; X64-NEXT: #ARITH_FENCE			; X64-NEXT: #ARITH_FENCE
	; X64-NEXT: movaps %xmm0, %xmm3			; X64-NEXT: movaps %xmm0, %xmm3
	; X64-NEXT: #ARITH_FENCE			; X64-NEXT: #ARITH_FENCE
	; X64-NEXT: addps %xmm0, %xmm3			; X64-NEXT: addps %xmm3, %xmm0
	; X64-NEXT: addps %xmm1, %xmm2			; X64-NEXT: addps %xmm2, %xmm1
	; X64-NEXT: movaps %xmm3, %xmm0
	; X64-NEXT: movaps %xmm2, %xmm1
	; X64-NEXT: retq			; X64-NEXT: retq
	%1 = fadd fast <8 x float> %a, %a			%1 = fadd fast <8 x float> %a, %a
	%t = call <8 x float> @llvm.arithmetic.fence.v8f32(<8 x float> %1)			%t = call <8 x float> @llvm.arithmetic.fence.v8f32(<8 x float> %1)
	%2 = fadd fast <8 x float> %a, %a			%2 = fadd fast <8 x float> %a, %a
	%3 = fadd fast <8 x float> %t, %2			%3 = fadd fast <8 x float> %t, %2
	ret <8 x float> %3			ret <8 x float> %3
	}			}

	declare float @llvm.arithmetic.fence.f32(float)			declare float @llvm.arithmetic.fence.f32(float)
	declare double @llvm.arithmetic.fence.f64(double)			declare double @llvm.arithmetic.fence.f64(double)
	declare <2 x float> @llvm.arithmetic.fence.v2f32(<2 x float>)			declare <2 x float> @llvm.arithmetic.fence.v2f32(<2 x float>)
	declare <8 x float> @llvm.arithmetic.fence.v8f32(<8 x float>)			declare <8 x float> @llvm.arithmetic.fence.v8f32(<8 x float>)

llvm/test/CodeGen/X86/avg.ll

	Show First 20 Lines • Show All 2,714 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: pxor %xmm3, %xmm3			; SSE2-NEXT: pxor %xmm3, %xmm3
	; SSE2-NEXT: movdqa %xmm0, %xmm4			; SSE2-NEXT: movdqa %xmm0, %xmm4
	; SSE2-NEXT: punpckhwd {{.*#+}} xmm4 = xmm4[4],xmm3[4],xmm4[5],xmm3[5],xmm4[6],xmm3[6],xmm4[7],xmm3[7]			; SSE2-NEXT: punpckhwd {{.*#+}} xmm4 = xmm4[4],xmm3[4],xmm4[5],xmm3[5],xmm4[6],xmm3[6],xmm4[7],xmm3[7]
	; SSE2-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0],xmm3[0],xmm0[1],xmm3[1],xmm0[2],xmm3[2],xmm0[3],xmm3[3]			; SSE2-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0],xmm3[0],xmm0[1],xmm3[1],xmm0[2],xmm3[2],xmm0[3],xmm3[3]
	; SSE2-NEXT: movdqa %xmm1, %xmm5			; SSE2-NEXT: movdqa %xmm1, %xmm5
	; SSE2-NEXT: punpckhwd {{.*#+}} xmm5 = xmm5[4],xmm3[4],xmm5[5],xmm3[5],xmm5[6],xmm3[6],xmm5[7],xmm3[7]			; SSE2-NEXT: punpckhwd {{.*#+}} xmm5 = xmm5[4],xmm3[4],xmm5[5],xmm3[5],xmm5[6],xmm3[6],xmm5[7],xmm3[7]
	; SSE2-NEXT: paddd %xmm4, %xmm5			; SSE2-NEXT: paddd %xmm4, %xmm5
	; SSE2-NEXT: punpcklwd {{.*#+}} xmm1 = xmm1[0],xmm3[0],xmm1[1],xmm3[1],xmm1[2],xmm3[2],xmm1[3],xmm3[3]			; SSE2-NEXT: punpcklwd {{.*#+}} xmm1 = xmm1[0],xmm3[0],xmm1[1],xmm3[1],xmm1[2],xmm3[2],xmm1[3],xmm3[3]
	; SSE2-NEXT: paddd %xmm0, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm4, %xmm4
	; SSE2-NEXT: psubd %xmm4, %xmm5
	; SSE2-NEXT: psubd %xmm4, %xmm1
	; SSE2-NEXT: psrld $1, %xmm1
	; SSE2-NEXT: psrld $1, %xmm5
	; SSE2-NEXT: movdqa %xmm2, %xmm0
	; SSE2-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0],xmm3[0],xmm0[1],xmm3[1],xmm0[2],xmm3[2],xmm0[3],xmm3[3]
	; SSE2-NEXT: paddd %xmm1, %xmm0			; SSE2-NEXT: paddd %xmm1, %xmm0
				; SSE2-NEXT: pcmpeqd %xmm1, %xmm1
				; SSE2-NEXT: psubd %xmm1, %xmm5
				; SSE2-NEXT: psubd %xmm1, %xmm0
				; SSE2-NEXT: psrld $1, %xmm0
				; SSE2-NEXT: psrld $1, %xmm5
				; SSE2-NEXT: movdqa %xmm2, %xmm4
				; SSE2-NEXT: punpcklwd {{.*#+}} xmm4 = xmm4[0],xmm3[0],xmm4[1],xmm3[1],xmm4[2],xmm3[2],xmm4[3],xmm3[3]
				; SSE2-NEXT: paddd %xmm4, %xmm0
	; SSE2-NEXT: punpckhwd {{.*#+}} xmm2 = xmm2[4],xmm3[4],xmm2[5],xmm3[5],xmm2[6],xmm3[6],xmm2[7],xmm3[7]			; SSE2-NEXT: punpckhwd {{.*#+}} xmm2 = xmm2[4],xmm3[4],xmm2[5],xmm3[5],xmm2[6],xmm3[6],xmm2[7],xmm3[7]
	; SSE2-NEXT: paddd %xmm5, %xmm2			; SSE2-NEXT: paddd %xmm5, %xmm2
	; SSE2-NEXT: psubd %xmm4, %xmm0			; SSE2-NEXT: psubd %xmm1, %xmm0
	; SSE2-NEXT: psubd %xmm4, %xmm2			; SSE2-NEXT: psubd %xmm1, %xmm2
	; SSE2-NEXT: pslld $15, %xmm2			; SSE2-NEXT: pslld $15, %xmm2
	; SSE2-NEXT: psrad $16, %xmm2			; SSE2-NEXT: psrad $16, %xmm2
	; SSE2-NEXT: pslld $15, %xmm0			; SSE2-NEXT: pslld $15, %xmm0
	; SSE2-NEXT: psrad $16, %xmm0			; SSE2-NEXT: psrad $16, %xmm0
	; SSE2-NEXT: packssdw %xmm2, %xmm0			; SSE2-NEXT: packssdw %xmm2, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; AVX1-LABEL: PR52131_pavg_chainlike_but_not_zext:			; AVX1-LABEL: PR52131_pavg_chainlike_but_not_zext:
	▲ Show 20 Lines • Show All 154 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/avx512-inc-dec.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-apple-darwin -mcpu=knl \| FileCheck %s			; RUN: llc < %s -mtriple=x86_64-apple-darwin -mcpu=knl \| FileCheck %s

	define i32 @test(i32 %a, i32 %b) {			define i32 @test(i32 %a, i32 %b) {
	; CHECK-LABEL: test:			; CHECK-LABEL: test:
	; CHECK: ## %bb.0:			; CHECK: ## %bb.0:
				; CHECK-NEXT: ## kill: def $esi killed $esi def $rsi
	; CHECK-NEXT: ## kill: def $edi killed $edi def $rdi			; CHECK-NEXT: ## kill: def $edi killed $edi def $rdi
	; CHECK-NEXT: leal -1(%rdi), %eax			; CHECK-NEXT: leal -1(%rdi), %ecx
	; CHECK-NEXT: addl $1, %esi			; CHECK-NEXT: leal 1(%rsi), %eax
	; CHECK-NEXT: imull %esi, %eax			; CHECK-NEXT: imull %ecx, %eax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%a1 = add i32 %a, -1			%a1 = add i32 %a, -1
	%b1 = add i32 %b, 1			%b1 = add i32 %b, 1
	%res = mul i32 %a1, %b1			%res = mul i32 %a1, %b1
	ret i32 %res			ret i32 %res
	}			}

llvm/test/CodeGen/X86/avx512-mask-op.ll

Show First 20 Lines • Show All 145 Lines • ▼ Show 20 Lines	; X86-NEXT: retl
store i8 %ret, i8* %ptr, align 4		store i8 %ret, i8* %ptr, align 4
ret void		ret void
}		}

define i16 @mand16(i16 %x, i16 %y) {		define i16 @mand16(i16 %x, i16 %y) {
; CHECK-LABEL: mand16:		; CHECK-LABEL: mand16:
; CHECK: ## %bb.0:		; CHECK: ## %bb.0:
; CHECK-NEXT: movl %edi, %eax		; CHECK-NEXT: movl %edi, %eax
; CHECK-NEXT: movl %edi, %ecx		; CHECK-NEXT: andl %esi, %eax
; CHECK-NEXT: andl %esi, %ecx		; CHECK-NEXT: xorl %esi, %edi
; CHECK-NEXT: xorl %esi, %eax		; CHECK-NEXT: orl %edi, %eax
; CHECK-NEXT: orl %ecx, %eax
; CHECK-NEXT: ## kill: def $ax killed $ax killed $eax		; CHECK-NEXT: ## kill: def $ax killed $ax killed $eax
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; X86-LABEL: mand16:		; X86-LABEL: mand16:
; X86: ## %bb.0:		; X86: ## %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx		; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx
; X86-NEXT: movl {{[0-9]+}}(%esp), %eax		; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
; X86-NEXT: movl %eax, %edx		; X86-NEXT: movl %eax, %edx
▲ Show 20 Lines • Show All 5,093 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/avx512-regcall-NoMask.ll

	Show First 20 Lines • Show All 933 Lines • ▼ Show 20 Lines
	}			}

	; Test regcall when running multiple input parameters - callee saved GPRs			; Test regcall when running multiple input parameters - callee saved GPRs
	define dso_local x86_regcallcc i32 @testi32_inp(i32 %a1, i32 %a2, i32 %a3, i32 %a4, i32 %a5, i32 %a6, i32 %b1, i32 %b2, i32 %b3, i32 %b4, i32 %b5, i32 %b6) nounwind {			define dso_local x86_regcallcc i32 @testi32_inp(i32 %a1, i32 %a2, i32 %a3, i32 %a4, i32 %a5, i32 %a6, i32 %b1, i32 %b2, i32 %b3, i32 %b4, i32 %b5, i32 %b6) nounwind {
	; X32-LABEL: testi32_inp:			; X32-LABEL: testi32_inp:
	; X32: # %bb.0:			; X32: # %bb.0:
	; X32-NEXT: pushl %ebp			; X32-NEXT: pushl %ebp
	; X32-NEXT: pushl %ebx			; X32-NEXT: pushl %ebx
	; X32-NEXT: subl $20, %esp			; X32-NEXT: subl $12, %esp
	; X32-NEXT: movl %esi, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill			; X32-NEXT: movl %esi, (%esp) # 4-byte Spill
	; X32-NEXT: movl %edi, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill			; X32-NEXT: movl %edi, %esi
	; X32-NEXT: movl %edx, (%esp) # 4-byte Spill			; X32-NEXT: movl %edx, %ebx
	; X32-NEXT: movl %ecx, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill			; X32-NEXT: movl %ecx, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
	; X32-NEXT: movl %eax, %ebx			; X32-NEXT: movl %eax, %edi
				; X32-NEXT: leal (%edx,%esi), %eax
	; X32-NEXT: movl %eax, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill			; X32-NEXT: movl %eax, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
	; X32-NEXT: subl %ecx, %ebx			; X32-NEXT: subl %esi, %ebx
				; X32-NEXT: movl %edi, %eax
				; X32-NEXT: subl %ecx, %eax
	; X32-NEXT: movl {{[0-9]+}}(%esp), %ebp			; X32-NEXT: movl {{[0-9]+}}(%esp), %ebp
	; X32-NEXT: movl %ebp, %eax			; X32-NEXT: movl %ebp, %ecx
				; X32-NEXT: subl {{[0-9]+}}(%esp), %ecx
				; X32-NEXT: imull %eax, %ecx
				; X32-NEXT: movl {{[0-9]+}}(%esp), %esi
				; X32-NEXT: movl %esi, %eax
	; X32-NEXT: subl {{[0-9]+}}(%esp), %eax			; X32-NEXT: subl {{[0-9]+}}(%esp), %eax
	; X32-NEXT: imull %eax, %ebx			; X32-NEXT: imull %ebx, %eax
	; X32-NEXT: movl %edx, %eax			; X32-NEXT: addl %ecx, %eax
	; X32-NEXT: subl %edi, %eax			; X32-NEXT: movl (%esp), %ebx # 4-byte Reload
				; X32-NEXT: subl {{[0-9]+}}(%esp), %ebx
	; X32-NEXT: movl {{[0-9]+}}(%esp), %edx			; X32-NEXT: movl {{[0-9]+}}(%esp), %edx
	; X32-NEXT: movl %edx, %ecx			; X32-NEXT: movl %edx, %ecx
	; X32-NEXT: subl {{[0-9]+}}(%esp), %ecx			; X32-NEXT: subl {{[0-9]+}}(%esp), %ecx
	; X32-NEXT: imull %eax, %ecx			; X32-NEXT: imull %ebx, %ecx
	; X32-NEXT: addl %ecx, %ebx			; X32-NEXT: addl %eax, %ecx
	; X32-NEXT: movl {{[-0-9]+}}(%e{{[sb]}}p), %edi # 4-byte Reload			; X32-NEXT: addl {{[-0-9]+}}(%e{{[sb]}}p), %edi # 4-byte Folded Reload
	; X32-NEXT: movl %edi, %esi			; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X32-NEXT: subl {{[0-9]+}}(%esp), %esi			; X32-NEXT: addl (%esp), %eax # 4-byte Folded Reload
	; X32-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X32-NEXT: movl %ecx, %eax
	; X32-NEXT: subl {{[0-9]+}}(%esp), %eax
	; X32-NEXT: imull %esi, %eax
	; X32-NEXT: addl %eax, %ebx
	; X32-NEXT: movl {{[-0-9]+}}(%e{{[sb]}}p), %eax # 4-byte Reload
	; X32-NEXT: addl {{[-0-9]+}}(%e{{[sb]}}p), %eax # 4-byte Folded Reload
	; X32-NEXT: movl (%esp), %esi # 4-byte Reload
	; X32-NEXT: addl {{[-0-9]+}}(%e{{[sb]}}p), %esi # 4-byte Folded Reload
	; X32-NEXT: addl {{[0-9]+}}(%esp), %edi
	; X32-NEXT: addl {{[0-9]+}}(%esp), %ebp			; X32-NEXT: addl {{[0-9]+}}(%esp), %ebp
	; X32-NEXT: imull %eax, %ebp			; X32-NEXT: imull %ebp, %edi
				; X32-NEXT: addl {{[0-9]+}}(%esp), %esi
				; X32-NEXT: imull {{[0-9]+}}(%esp), %esi
				; X32-NEXT: addl %esi, %edi
	; X32-NEXT: addl {{[0-9]+}}(%esp), %edx			; X32-NEXT: addl {{[0-9]+}}(%esp), %edx
	; X32-NEXT: imull %esi, %edx			; X32-NEXT: imull %eax, %edx
	; X32-NEXT: addl %ebp, %edx			; X32-NEXT: addl %edx, %edi
	; X32-NEXT: addl {{[0-9]+}}(%esp), %ecx			; X32-NEXT: addl %ecx, %edi
	; X32-NEXT: imull %edi, %ecx			; X32-NEXT: movl %edi, %eax
	; X32-NEXT: addl %edx, %ecx			; X32-NEXT: addl $12, %esp
	; X32-NEXT: addl %ecx, %ebx
	; X32-NEXT: movl %ebx, %eax
	; X32-NEXT: addl $20, %esp
	; X32-NEXT: popl %ebx			; X32-NEXT: popl %ebx
	; X32-NEXT: popl %ebp			; X32-NEXT: popl %ebp
	; X32-NEXT: retl			; X32-NEXT: retl
	;			;
	; WIN64-LABEL: testi32_inp:			; WIN64-LABEL: testi32_inp:
	; WIN64: # %bb.0:			; WIN64: # %bb.0:
	; WIN64-NEXT: pushq %r13			; WIN64-NEXT: pushq %r13
	; WIN64-NEXT: pushq %rbp			; WIN64-NEXT: pushq %rbp
	; WIN64-NEXT: pushq %rbx			; WIN64-NEXT: pushq %rbx
	; WIN64-NEXT: movl %eax, %r13d			; WIN64-NEXT: # kill: def $edx killed $edx def $rdx
	; WIN64-NEXT: subl %ecx, %eax			; WIN64-NEXT: movl %ecx, %ebx
	; WIN64-NEXT: movl %edx, %ebp			; WIN64-NEXT: # kill: def $esi killed $esi def $rsi
	; WIN64-NEXT: subl %edi, %ebp			; WIN64-NEXT: # kill: def $r15d killed $r15d def $r15
	; WIN64-NEXT: movl %r9d, %ebx			; WIN64-NEXT: # kill: def $r14d killed $r14d def $r14
	; WIN64-NEXT: subl %r10d, %ebx			; WIN64-NEXT: # kill: def $r12d killed $r12d def $r12
	; WIN64-NEXT: imull %ebx, %eax			; WIN64-NEXT: # kill: def $r11d killed $r11d def $r11
				; WIN64-NEXT: # kill: def $r10d killed $r10d def $r10
				; WIN64-NEXT: # kill: def $r9d killed $r9d def $r9
				; WIN64-NEXT: # kill: def $r8d killed $r8d def $r8
				; WIN64-NEXT: # kill: def $edi killed $edi def $rdi
				; WIN64-NEXT: leal (%rdx,%rdi), %r13d
				; WIN64-NEXT: # kill: def $edx killed $edx killed $rdx
				; WIN64-NEXT: subl %edi, %edx
				; WIN64-NEXT: leal (%rsi,%r8), %ecx
				; WIN64-NEXT: # kill: def $esi killed $esi killed $rsi
				; WIN64-NEXT: subl %r8d, %esi
				; WIN64-NEXT: leal (%r9,%r10), %r8d
				; WIN64-NEXT: movl %r9d, %ebp
				; WIN64-NEXT: subl %r10d, %ebp
				; WIN64-NEXT: movl %eax, %edi
				; WIN64-NEXT: movl %ebx, %r9d
				; WIN64-NEXT: subl %ebx, %edi
				; WIN64-NEXT: imull %edi, %ebp
				; WIN64-NEXT: leal (%r11,%r12), %edi
	; WIN64-NEXT: movl %r11d, %ebx			; WIN64-NEXT: movl %r11d, %ebx
	; WIN64-NEXT: subl %r12d, %ebx			; WIN64-NEXT: subl %r12d, %ebx
	; WIN64-NEXT: imull %ebp, %ebx			; WIN64-NEXT: imull %edx, %ebx
	; WIN64-NEXT: movl %esi, %ebp			; WIN64-NEXT: addl %ebp, %ebx
	; WIN64-NEXT: subl %r8d, %ebp			; WIN64-NEXT: leal (%r14,%r15), %edx
	; WIN64-NEXT: addl %ebx, %eax			; WIN64-NEXT: movl %r14d, %ebp
	; WIN64-NEXT: movl %r14d, %ebx			; WIN64-NEXT: subl %r15d, %ebp
	; WIN64-NEXT: subl %r15d, %ebx			; WIN64-NEXT: imull %esi, %ebp
	; WIN64-NEXT: imull %ebp, %ebx			; WIN64-NEXT: addl %ebx, %ebp
	; WIN64-NEXT: addl %ebx, %eax			; WIN64-NEXT: addl %r9d, %eax
	; WIN64-NEXT: addl %ecx, %r13d			; WIN64-NEXT: imull %r8d, %eax
	; WIN64-NEXT: addl %edi, %edx			; WIN64-NEXT: imull %r13d, %edi
	; WIN64-NEXT: addl %r8d, %esi			; WIN64-NEXT: addl %edi, %eax
	; WIN64-NEXT: addl %r10d, %r9d			; WIN64-NEXT: imull %ecx, %edx
	; WIN64-NEXT: imull %r13d, %r9d			; WIN64-NEXT: addl %edx, %eax
	; WIN64-NEXT: addl %r12d, %r11d			; WIN64-NEXT: addl %ebp, %eax
	; WIN64-NEXT: imull %edx, %r11d
	; WIN64-NEXT: addl %r9d, %r11d
	; WIN64-NEXT: addl %r15d, %r14d
	; WIN64-NEXT: imull %esi, %r14d
	; WIN64-NEXT: addl %r11d, %r14d
	; WIN64-NEXT: addl %r14d, %eax
	; WIN64-NEXT: popq %rbx			; WIN64-NEXT: popq %rbx
	; WIN64-NEXT: popq %rbp			; WIN64-NEXT: popq %rbp
	; WIN64-NEXT: popq %r13			; WIN64-NEXT: popq %r13
	; WIN64-NEXT: retq			; WIN64-NEXT: retq
	;			;
	; LINUXOSX64-LABEL: testi32_inp:			; LINUXOSX64-LABEL: testi32_inp:
	; LINUXOSX64: # %bb.0:			; LINUXOSX64: # %bb.0:
	; LINUXOSX64-NEXT: pushq %rbp			; LINUXOSX64-NEXT: pushq %rbp
	; LINUXOSX64-NEXT: pushq %rbx			; LINUXOSX64-NEXT: pushq %rbx
	; LINUXOSX64-NEXT: movl %eax, %r10d			; LINUXOSX64-NEXT: # kill: def $edx killed $edx def $rdx
	; LINUXOSX64-NEXT: movl {{[0-9]+}}(%rsp), %r11d			; LINUXOSX64-NEXT: # kill: def $esi killed $esi def $rsi
	; LINUXOSX64-NEXT: subl %ecx, %eax			; LINUXOSX64-NEXT: # kill: def $r14d killed $r14d def $r14
	; LINUXOSX64-NEXT: movl %edx, %ebx			; LINUXOSX64-NEXT: # kill: def $r13d killed $r13d def $r13
	; LINUXOSX64-NEXT: subl %edi, %ebx			; LINUXOSX64-NEXT: # kill: def $r12d killed $r12d def $r12
	; LINUXOSX64-NEXT: movl %r9d, %ebp			; LINUXOSX64-NEXT: # kill: def $r9d killed $r9d def $r9
	; LINUXOSX64-NEXT: subl %r12d, %ebp			; LINUXOSX64-NEXT: # kill: def $r8d killed $r8d def $r8
	; LINUXOSX64-NEXT: imull %ebp, %eax			; LINUXOSX64-NEXT: # kill: def $edi killed $edi def $rdi
	; LINUXOSX64-NEXT: movl %r13d, %ebp			; LINUXOSX64-NEXT: leal (%rdx,%rdi), %r10d
	; LINUXOSX64-NEXT: subl %r14d, %ebp			; LINUXOSX64-NEXT: movl %edx, %ebp
	; LINUXOSX64-NEXT: imull %ebx, %ebp			; LINUXOSX64-NEXT: subl %edi, %ebp
	; LINUXOSX64-NEXT: movl %esi, %ebx			; LINUXOSX64-NEXT: leal (%rsi,%r8), %r11d
	; LINUXOSX64-NEXT: subl %r8d, %ebx			; LINUXOSX64-NEXT: # kill: def $esi killed $esi killed $rsi
	; LINUXOSX64-NEXT: addl %ebp, %eax			; LINUXOSX64-NEXT: subl %r8d, %esi
	; LINUXOSX64-NEXT: movl %r15d, %ebp			; LINUXOSX64-NEXT: leal (%r9,%r12), %r8d
	; LINUXOSX64-NEXT: subl %r11d, %ebp			; LINUXOSX64-NEXT: movl %r9d, %edi
	; LINUXOSX64-NEXT: imull %ebx, %ebp			; LINUXOSX64-NEXT: subl %r12d, %edi
				; LINUXOSX64-NEXT: movl %eax, %edx
				; LINUXOSX64-NEXT: subl %ecx, %edx
				; LINUXOSX64-NEXT: imull %edx, %edi
				; LINUXOSX64-NEXT: leal (%r13,%r14), %edx
				; LINUXOSX64-NEXT: movl %r13d, %ebx
				; LINUXOSX64-NEXT: subl %r14d, %ebx
				; LINUXOSX64-NEXT: imull %ebp, %ebx
				; LINUXOSX64-NEXT: movl 24(%rsp), %ebp
				; LINUXOSX64-NEXT: addl %edi, %ebx
				; LINUXOSX64-NEXT: movl %r15d, %edi
				; LINUXOSX64-NEXT: subl %ebp, %edi
				; LINUXOSX64-NEXT: imull %esi, %edi
				; LINUXOSX64-NEXT: addl %ebx, %edi
				; LINUXOSX64-NEXT: addl %ecx, %eax
				; LINUXOSX64-NEXT: imull %r8d, %eax
				; LINUXOSX64-NEXT: imull %r10d, %edx
				; LINUXOSX64-NEXT: addl %edx, %eax
				; LINUXOSX64-NEXT: addl %r15d, %ebp
				; LINUXOSX64-NEXT: imull %r11d, %ebp
	; LINUXOSX64-NEXT: addl %ebp, %eax			; LINUXOSX64-NEXT: addl %ebp, %eax
	; LINUXOSX64-NEXT: addl %ecx, %r10d			; LINUXOSX64-NEXT: addl %edi, %eax
	; LINUXOSX64-NEXT: addl %edi, %edx
	; LINUXOSX64-NEXT: addl %r8d, %esi
	; LINUXOSX64-NEXT: addl %r12d, %r9d
	; LINUXOSX64-NEXT: imull %r10d, %r9d
	; LINUXOSX64-NEXT: addl %r14d, %r13d
	; LINUXOSX64-NEXT: imull %edx, %r13d
	; LINUXOSX64-NEXT: addl %r9d, %r13d
	; LINUXOSX64-NEXT: addl %r11d, %r15d
	; LINUXOSX64-NEXT: imull %esi, %r15d
	; LINUXOSX64-NEXT: addl %r13d, %r15d
	; LINUXOSX64-NEXT: addl %r15d, %eax
	; LINUXOSX64-NEXT: popq %rbx			; LINUXOSX64-NEXT: popq %rbx
				craig.topperUnsubmitted Not Done Reply Inline Actions Is this test using a lot more leas now? craig.topper: Is this test using a lot more leas now?
				CarrotAuthorUnsubmitted Done Reply Inline Actions In this case there are many commutable instructions, with my code in findOnlyInterestingUse, more virtual registers can be mapped to %eax now, so more instructions can satisfy the last condition in isProfitableToConv3Addr return (ToRegA && !regsAreCompatible(FromRegB, ToRegA, TRI)); The difficult part in this test case is there are so many commutable instructions, and 11 physical registers are copied from, each commutable instruction generates two map from possibilities, the total number of possible map from relations is a huge number. Also almost every virtual register can map to the result %eax. But in our implementation of SrcRegMap and DstRegMap, for each virtual register there is only one mapped from/to register. Also there is no sophisticated algorithm to choose a good mapping, we simply process each instruction one by one and update the mapping. So it is difficult to find the best mapping to guide instruction commute and 3-address instruction conversion. Carrot: In this case there are many commutable instructions, with my code in findOnlyInterestingUse…
	; LINUXOSX64-NEXT: popq %rbp			; LINUXOSX64-NEXT: popq %rbp
	; LINUXOSX64-NEXT: retq			; LINUXOSX64-NEXT: retq
	%x1 = sub i32 %a1, %a2			%x1 = sub i32 %a1, %a2
	%x2 = sub i32 %a3, %a4			%x2 = sub i32 %a3, %a4
	%x3 = sub i32 %a5, %a6			%x3 = sub i32 %a5, %a6
	%y1 = sub i32 %b1, %b2			%y1 = sub i32 %b1, %b2
	%y2 = sub i32 %b3, %b4			%y2 = sub i32 %b3, %b4
	%y3 = sub i32 %b5, %b6			%y3 = sub i32 %b5, %b6
	▲ Show 20 Lines • Show All 220 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/avx512bw-mask-op.ll

Show First 20 Lines • Show All 73 Lines • ▼ Show 20 Lines	; CHECK-NEXT: retq
store i64 %ret, i64* %ptr, align 4		store i64 %ret, i64* %ptr, align 4
ret void		ret void
}		}

define i32 @mand32(i32 %x, i32 %y) {		define i32 @mand32(i32 %x, i32 %y) {
; CHECK-LABEL: mand32:		; CHECK-LABEL: mand32:
; CHECK: ## %bb.0:		; CHECK: ## %bb.0:
; CHECK-NEXT: movl %edi, %eax		; CHECK-NEXT: movl %edi, %eax
; CHECK-NEXT: movl %edi, %ecx		; CHECK-NEXT: andl %esi, %eax
; CHECK-NEXT: andl %esi, %ecx		; CHECK-NEXT: xorl %esi, %edi
; CHECK-NEXT: xorl %esi, %eax		; CHECK-NEXT: orl %edi, %eax
; CHECK-NEXT: orl %ecx, %eax
; CHECK-NEXT: retq		; CHECK-NEXT: retq
%ma = bitcast i32 %x to <32 x i1>		%ma = bitcast i32 %x to <32 x i1>
%mb = bitcast i32 %y to <32 x i1>		%mb = bitcast i32 %y to <32 x i1>
%mc = and <32 x i1> %ma, %mb		%mc = and <32 x i1> %ma, %mb
%md = xor <32 x i1> %ma, %mb		%md = xor <32 x i1> %ma, %mb
%me = or <32 x i1> %mc, %md		%me = or <32 x i1> %mc, %md
%ret = bitcast <32 x i1> %me to i32		%ret = bitcast <32 x i1> %me to i32
ret i32 %ret		ret i32 %ret
Show All 17 Lines	; CHECK-NEXT: retq
%ret = bitcast <32 x i1> %me to i32		%ret = bitcast <32 x i1> %me to i32
ret i32 %ret		ret i32 %ret
}		}

define i64 @mand64(i64 %x, i64 %y) {		define i64 @mand64(i64 %x, i64 %y) {
; CHECK-LABEL: mand64:		; CHECK-LABEL: mand64:
; CHECK: ## %bb.0:		; CHECK: ## %bb.0:
; CHECK-NEXT: movq %rdi, %rax		; CHECK-NEXT: movq %rdi, %rax
; CHECK-NEXT: movq %rdi, %rcx		; CHECK-NEXT: andq %rsi, %rax
; CHECK-NEXT: andq %rsi, %rcx		; CHECK-NEXT: xorq %rsi, %rdi
; CHECK-NEXT: xorq %rsi, %rax		; CHECK-NEXT: orq %rdi, %rax
; CHECK-NEXT: orq %rcx, %rax
; CHECK-NEXT: retq		; CHECK-NEXT: retq
%ma = bitcast i64 %x to <64 x i1>		%ma = bitcast i64 %x to <64 x i1>
%mb = bitcast i64 %y to <64 x i1>		%mb = bitcast i64 %y to <64 x i1>
%mc = and <64 x i1> %ma, %mb		%mc = and <64 x i1> %ma, %mb
%md = xor <64 x i1> %ma, %mb		%md = xor <64 x i1> %ma, %mb
%me = or <64 x i1> %mc, %md		%me = or <64 x i1> %mc, %md
%ret = bitcast <64 x i1> %me to i64		%ret = bitcast <64 x i1> %me to i64
ret i64 %ret		ret i64 %ret
▲ Show 20 Lines • Show All 146 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/avx512dq-mask-op.ll

Show All 27 Lines	; CHECK-NEXT: retq
store i8 %ret, i8* %ptr, align 4		store i8 %ret, i8* %ptr, align 4
ret void		ret void
}		}

define i8 @mand8(i8 %x, i8 %y) {		define i8 @mand8(i8 %x, i8 %y) {
; CHECK-LABEL: mand8:		; CHECK-LABEL: mand8:
; CHECK: ## %bb.0:		; CHECK: ## %bb.0:
; CHECK-NEXT: movl %edi, %eax		; CHECK-NEXT: movl %edi, %eax
; CHECK-NEXT: movl %eax, %ecx		; CHECK-NEXT: andb %sil, %al
; CHECK-NEXT: andb %sil, %cl		; CHECK-NEXT: xorb %sil, %dil
; CHECK-NEXT: xorb %sil, %al		; CHECK-NEXT: orb %dil, %al
; CHECK-NEXT: orb %cl, %al
; CHECK-NEXT: ## kill: def $al killed $al killed $eax
; CHECK-NEXT: retq		; CHECK-NEXT: retq
%ma = bitcast i8 %x to <8 x i1>		%ma = bitcast i8 %x to <8 x i1>
%mb = bitcast i8 %y to <8 x i1>		%mb = bitcast i8 %y to <8 x i1>
%mc = and <8 x i1> %ma, %mb		%mc = and <8 x i1> %ma, %mb
%md = xor <8 x i1> %ma, %mb		%md = xor <8 x i1> %ma, %mb
%me = or <8 x i1> %mc, %md		%me = or <8 x i1> %mc, %md
%ret = bitcast <8 x i1> %me to i8		%ret = bitcast <8 x i1> %me to i8
ret i8 %ret		ret i8 %ret
Show All 21 Lines

llvm/test/CodeGen/X86/bitreverse.ll

	Show First 20 Lines • Show All 359 Lines • ▼ Show 20 Lines
	; X86-NEXT: addb %cl, %cl			; X86-NEXT: addb %cl, %cl
	; X86-NEXT: shrb %al			; X86-NEXT: shrb %al
	; X86-NEXT: andb $85, %al			; X86-NEXT: andb $85, %al
	; X86-NEXT: orb %cl, %al			; X86-NEXT: orb %cl, %al
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: test_bitreverse_i8:			; X64-LABEL: test_bitreverse_i8:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: # kill: def $edi killed $edi def $rdi
	; X64-NEXT: rolb $4, %dil			; X64-NEXT: rolb $4, %dil
	; X64-NEXT: movl %edi, %eax			; X64-NEXT: movl %edi, %eax
	; X64-NEXT: andb $51, %al			; X64-NEXT: andb $51, %al
	; X64-NEXT: shlb $2, %al			; X64-NEXT: shlb $2, %al
	; X64-NEXT: shrb $2, %dil			; X64-NEXT: shrb $2, %dil
	; X64-NEXT: andb $51, %dil			; X64-NEXT: andb $51, %dil
	; X64-NEXT: orb %al, %dil			; X64-NEXT: orb %al, %dil
	; X64-NEXT: movl %edi, %eax			; X64-NEXT: movl %edi, %eax
	; X64-NEXT: andb $85, %al			; X64-NEXT: andb $85, %al
	; X64-NEXT: addb %al, %al			; X64-NEXT: addb %al, %al
	; X64-NEXT: shrb %dil			; X64-NEXT: shrb %dil
	; X64-NEXT: andb $85, %dil			; X64-NEXT: andb $85, %dil
	; X64-NEXT: addl %edi, %eax			; X64-NEXT: orb %dil, %al
	; X64-NEXT: # kill: def $al killed $al killed $eax
	; X64-NEXT: retq			; X64-NEXT: retq
	;			;
	; X86XOP-LABEL: test_bitreverse_i8:			; X86XOP-LABEL: test_bitreverse_i8:
	; X86XOP: # %bb.0:			; X86XOP: # %bb.0:
	; X86XOP-NEXT: vmovd {{.*#+}} xmm0 = mem[0],zero,zero,zero			; X86XOP-NEXT: vmovd {{.*#+}} xmm0 = mem[0],zero,zero,zero
	; X86XOP-NEXT: vpperm {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0, %xmm0			; X86XOP-NEXT: vpperm {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0, %xmm0
	; X86XOP-NEXT: vmovd %xmm0, %eax			; X86XOP-NEXT: vmovd %xmm0, %eax
	; X86XOP-NEXT: # kill: def $al killed $al killed $eax			; X86XOP-NEXT: # kill: def $al killed $al killed $eax
	Show All 21 Lines
	; X86-NEXT: shrb %al			; X86-NEXT: shrb %al
	; X86-NEXT: andb $80, %al			; X86-NEXT: andb $80, %al
	; X86-NEXT: orb %cl, %al			; X86-NEXT: orb %cl, %al
	; X86-NEXT: shrb $4, %al			; X86-NEXT: shrb $4, %al
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: test_bitreverse_i4:			; X64-LABEL: test_bitreverse_i4:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: # kill: def $edi killed $edi def $rdi
	; X64-NEXT: rolb $4, %dil			; X64-NEXT: rolb $4, %dil
	; X64-NEXT: movl %edi, %eax			; X64-NEXT: movl %edi, %eax
	; X64-NEXT: andb $51, %al			; X64-NEXT: andb $51, %al
	; X64-NEXT: shlb $2, %al			; X64-NEXT: shlb $2, %al
	; X64-NEXT: shrb $2, %dil			; X64-NEXT: shrb $2, %dil
	; X64-NEXT: andb $51, %dil			; X64-NEXT: andb $51, %dil
	; X64-NEXT: orb %al, %dil			; X64-NEXT: orb %al, %dil
	; X64-NEXT: movl %edi, %eax			; X64-NEXT: movl %edi, %eax
	; X64-NEXT: andb $80, %al			; X64-NEXT: andb $80, %al
	; X64-NEXT: addb %al, %al			; X64-NEXT: addb %al, %al
	; X64-NEXT: shrb %dil			; X64-NEXT: shrb %dil
	; X64-NEXT: andb $80, %dil			; X64-NEXT: andb $80, %dil
	; X64-NEXT: addl %edi, %eax			; X64-NEXT: orb %dil, %al
	; X64-NEXT: shrb $4, %al			; X64-NEXT: shrb $4, %al
	; X64-NEXT: # kill: def $al killed $al killed $eax
	; X64-NEXT: retq			; X64-NEXT: retq
	;			;
	; X86XOP-LABEL: test_bitreverse_i4:			; X86XOP-LABEL: test_bitreverse_i4:
	; X86XOP: # %bb.0:			; X86XOP: # %bb.0:
	; X86XOP-NEXT: vmovd {{.*#+}} xmm0 = mem[0],zero,zero,zero			; X86XOP-NEXT: vmovd {{.*#+}} xmm0 = mem[0],zero,zero,zero
	; X86XOP-NEXT: vpperm {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0, %xmm0			; X86XOP-NEXT: vpperm {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0, %xmm0, %xmm0
	; X86XOP-NEXT: vmovd %xmm0, %eax			; X86XOP-NEXT: vmovd %xmm0, %eax
	; X86XOP-NEXT: shrb $4, %al			; X86XOP-NEXT: shrb $4, %al
	▲ Show 20 Lines • Show All 877 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/bswap_tree2.ll

	Show All 18 Lines
	; CHECK-NEXT: orl %ecx, %edx			; CHECK-NEXT: orl %ecx, %edx
	; CHECK-NEXT: bswapl %eax			; CHECK-NEXT: bswapl %eax
	; CHECK-NEXT: shrl $16, %eax			; CHECK-NEXT: shrl $16, %eax
	; CHECK-NEXT: orl %edx, %eax			; CHECK-NEXT: orl %edx, %eax
	; CHECK-NEXT: retl			; CHECK-NEXT: retl
	;			;
	; CHECK64-LABEL: test1:			; CHECK64-LABEL: test1:
	; CHECK64: # %bb.0:			; CHECK64: # %bb.0:
	; CHECK64-NEXT: movl %edi, %eax
	; CHECK64-NEXT: movl %edi, %ecx			; CHECK64-NEXT: movl %edi, %ecx
	; CHECK64-NEXT: andl $16711680, %ecx # imm = 0xFF0000			; CHECK64-NEXT: andl $16711680, %ecx # imm = 0xFF0000
	; CHECK64-NEXT: movl %edi, %edx			; CHECK64-NEXT: movl %edi, %eax
	; CHECK64-NEXT: orl $-16777216, %edx # imm = 0xFF000000			; CHECK64-NEXT: orl $-16777216, %eax # imm = 0xFF000000
	; CHECK64-NEXT: shll $8, %ecx			; CHECK64-NEXT: shll $8, %ecx
	; CHECK64-NEXT: shrl $8, %edx			; CHECK64-NEXT: shrl $8, %eax
	; CHECK64-NEXT: orl %ecx, %edx			; CHECK64-NEXT: orl %ecx, %eax
	; CHECK64-NEXT: bswapl %eax			; CHECK64-NEXT: bswapl %edi
	; CHECK64-NEXT: shrl $16, %eax			; CHECK64-NEXT: shrl $16, %edi
	; CHECK64-NEXT: orl %edx, %eax			; CHECK64-NEXT: orl %edi, %eax
	; CHECK64-NEXT: retq			; CHECK64-NEXT: retq
	%byte0 = and i32 %x, 255 ; 0x000000ff			%byte0 = and i32 %x, 255 ; 0x000000ff
	%byte1 = and i32 %x, 65280 ; 0x0000ff00			%byte1 = and i32 %x, 65280 ; 0x0000ff00
	%byte2 = and i32 %x, 16711680 ; 0x00ff0000			%byte2 = and i32 %x, 16711680 ; 0x00ff0000
	%byte3 = or i32 %x, 4278190080 ; 0xff000000			%byte3 = or i32 %x, 4278190080 ; 0xff000000
	%tmp0 = shl i32 %byte0, 8			%tmp0 = shl i32 %byte0, 8
	%tmp1 = lshr i32 %byte1, 8			%tmp1 = lshr i32 %byte1, 8
	%tmp2 = shl i32 %byte2, 8			%tmp2 = shl i32 %byte2, 8
	Show All 30 Lines
	; CHECK64-NEXT: movl %edi, %eax			; CHECK64-NEXT: movl %edi, %eax
	; CHECK64-NEXT: shrl $8, %eax			; CHECK64-NEXT: shrl $8, %eax
	; CHECK64-NEXT: shll $8, %edi			; CHECK64-NEXT: shll $8, %edi
	; CHECK64-NEXT: movl %eax, %ecx			; CHECK64-NEXT: movl %eax, %ecx
	; CHECK64-NEXT: andl $65280, %ecx # imm = 0xFF00			; CHECK64-NEXT: andl $65280, %ecx # imm = 0xFF00
	; CHECK64-NEXT: andl $-16777216, %edi # imm = 0xFF000000			; CHECK64-NEXT: andl $-16777216, %edi # imm = 0xFF000000
	; CHECK64-NEXT: andl $16711680, %eax # imm = 0xFF0000			; CHECK64-NEXT: andl $16711680, %eax # imm = 0xFF0000
	; CHECK64-NEXT: orl %edi, %eax			; CHECK64-NEXT: orl %edi, %eax
	; CHECK64-NEXT: addl %ecx, %eax			; CHECK64-NEXT: orl %ecx, %eax
	; CHECK64-NEXT: retq			; CHECK64-NEXT: retq
	%byte1 = lshr i32 %x, 8			%byte1 = lshr i32 %x, 8
	%byte0 = shl i32 %x, 8			%byte0 = shl i32 %x, 8
	%byte3 = shl i32 %x, 8			%byte3 = shl i32 %x, 8
	%byte2 = lshr i32 %x, 8			%byte2 = lshr i32 %x, 8
	%tmp1 = and i32 %byte1, 65280 ; 0x0000ff00			%tmp1 = and i32 %byte1, 65280 ; 0x0000ff00
	%tmp0 = and i32 %byte0, 255 ; 0x000000ff			%tmp0 = and i32 %byte0, 255 ; 0x000000ff
	%tmp3 = and i32 %byte3, 4278190080 ; 0xff000000			%tmp3 = and i32 %byte3, 4278190080 ; 0xff000000
	▲ Show 20 Lines • Show All 59 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/cmp-concat.ll

	Show First 20 Lines • Show All 75 Lines • ▼ Show 20 Lines
	define <16 x i8> @cmp_allbits_concat_v16i8(<16 x i8> %x, <16 x i8> %y) {			define <16 x i8> @cmp_allbits_concat_v16i8(<16 x i8> %x, <16 x i8> %y) {
	; CHECK-LABEL: cmp_allbits_concat_v16i8:			; CHECK-LABEL: cmp_allbits_concat_v16i8:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: movdqa %xmm1, %xmm2			; CHECK-NEXT: movdqa %xmm1, %xmm2
	; CHECK-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1],xmm2[2],xmm0[2],xmm2[3],xmm0[3],xmm2[4],xmm0[4],xmm2[5],xmm0[5],xmm2[6],xmm0[6],xmm2[7],xmm0[7]			; CHECK-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1],xmm2[2],xmm0[2],xmm2[3],xmm0[3],xmm2[4],xmm0[4],xmm2[5],xmm0[5],xmm2[6],xmm0[6],xmm2[7],xmm0[7]
	; CHECK-NEXT: punpckhbw {{.*#+}} xmm1 = xmm1[8],xmm0[8],xmm1[9],xmm0[9],xmm1[10],xmm0[10],xmm1[11],xmm0[11],xmm1[12],xmm0[12],xmm1[13],xmm0[13],xmm1[14],xmm0[14],xmm1[15],xmm0[15]			; CHECK-NEXT: punpckhbw {{.*#+}} xmm1 = xmm1[8],xmm0[8],xmm1[9],xmm0[9],xmm1[10],xmm0[10],xmm1[11],xmm0[11],xmm1[12],xmm0[12],xmm1[13],xmm0[13],xmm1[14],xmm0[14],xmm1[15],xmm0[15]
	; CHECK-NEXT: pcmpeqd %xmm0, %xmm0			; CHECK-NEXT: pcmpeqd %xmm0, %xmm0
	; CHECK-NEXT: pcmpeqw %xmm0, %xmm1			; CHECK-NEXT: pcmpeqw %xmm0, %xmm1
	; CHECK-NEXT: pcmpeqw %xmm2, %xmm0			; CHECK-NEXT: pcmpeqw %xmm0, %xmm2
	; CHECK-NEXT: packsswb %xmm1, %xmm0			; CHECK-NEXT: packsswb %xmm1, %xmm2
				; CHECK-NEXT: movdqa %xmm2, %xmm0
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%zx = zext <16 x i8> %x to <16 x i16>			%zx = zext <16 x i8> %x to <16 x i16>
	%zy = zext <16 x i8> %y to <16 x i16>			%zy = zext <16 x i8> %y to <16 x i16>
	%sh = shl <16 x i16> %zx, <i16 8, i16 8, i16 8, i16 8, i16 8, i16 8, i16 8, i16 8, i16 8, i16 8, i16 8, i16 8, i16 8, i16 8, i16 8, i16 8>			%sh = shl <16 x i16> %zx, <i16 8, i16 8, i16 8, i16 8, i16 8, i16 8, i16 8, i16 8, i16 8, i16 8, i16 8, i16 8, i16 8, i16 8, i16 8, i16 8>
	%or = or <16 x i16> %zy, %sh			%or = or <16 x i16> %zy, %sh
	%r = icmp eq <16 x i16> %or, <i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1>			%r = icmp eq <16 x i16> %or, <i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1>
	%s = sext <16 x i1> %r to <16 x i8>			%s = sext <16 x i1> %r to <16 x i8>
	ret <16 x i8> %s			ret <16 x i8> %s
	Show All 29 Lines

llvm/test/CodeGen/X86/combine-mul.ll

Show First 20 Lines • Show All 76 Lines • ▼ Show 20 Lines	; AVX-NEXT: retq
ret <4 x i32> %1		ret <4 x i32> %1
}		}

define <4 x i64> @combine_vec_mul_pow2c(<4 x i64> %x) {		define <4 x i64> @combine_vec_mul_pow2c(<4 x i64> %x) {
; SSE-LABEL: combine_vec_mul_pow2c:		; SSE-LABEL: combine_vec_mul_pow2c:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movdqa %xmm0, %xmm2		; SSE-NEXT: movdqa %xmm0, %xmm2
; SSE-NEXT: psllq $1, %xmm2		; SSE-NEXT: psllq $1, %xmm2
; SSE-NEXT: pblendw {{.*#+}} xmm2 = xmm0[0,1,2,3],xmm2[4,5,6,7]		; SSE-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm2[4,5,6,7]
; SSE-NEXT: movdqa %xmm1, %xmm0		; SSE-NEXT: movdqa %xmm1, %xmm2
; SSE-NEXT: psllq $4, %xmm0		; SSE-NEXT: psllq $4, %xmm2
; SSE-NEXT: psllq $2, %xmm1		; SSE-NEXT: psllq $2, %xmm1
; SSE-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1,2,3],xmm0[4,5,6,7]		; SSE-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1,2,3],xmm2[4,5,6,7]
; SSE-NEXT: movdqa %xmm2, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: combine_vec_mul_pow2c:		; AVX-LABEL: combine_vec_mul_pow2c:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpsllvq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0		; AVX-NEXT: vpsllvq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0
; AVX-NEXT: retq		; AVX-NEXT: retq
%1 = mul <4 x i64> %x, <i64 1, i64 2, i64 4, i64 16>		%1 = mul <4 x i64> %x, <i64 1, i64 2, i64 4, i64 16>
ret <4 x i64> %1		ret <4 x i64> %1
▲ Show 20 Lines • Show All 320 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/combine-mulo.ll

	Show All 31 Lines

	define <4 x i32> @combine_vec_smul_two(<4 x i32> %a0, <4 x i32> %a1) {			define <4 x i32> @combine_vec_smul_two(<4 x i32> %a0, <4 x i32> %a1) {
	; SSE-LABEL: combine_vec_smul_two:			; SSE-LABEL: combine_vec_smul_two:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movdqa %xmm0, %xmm2			; SSE-NEXT: movdqa %xmm0, %xmm2
	; SSE-NEXT: paddd %xmm0, %xmm2			; SSE-NEXT: paddd %xmm0, %xmm2
	; SSE-NEXT: movdqa %xmm0, %xmm3			; SSE-NEXT: movdqa %xmm0, %xmm3
	; SSE-NEXT: pcmpgtd %xmm2, %xmm3			; SSE-NEXT: pcmpgtd %xmm2, %xmm3
	; SSE-NEXT: pxor %xmm0, %xmm3			; SSE-NEXT: pxor %xmm3, %xmm0
	; SSE-NEXT: movdqa %xmm3, %xmm0
	; SSE-NEXT: blendvps %xmm0, %xmm1, %xmm2			; SSE-NEXT: blendvps %xmm0, %xmm1, %xmm2
	; SSE-NEXT: movaps %xmm2, %xmm0			; SSE-NEXT: movaps %xmm2, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: combine_vec_smul_two:			; AVX-LABEL: combine_vec_smul_two:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpaddd %xmm0, %xmm0, %xmm2			; AVX-NEXT: vpaddd %xmm0, %xmm0, %xmm2
	; AVX-NEXT: vpcmpgtd %xmm2, %xmm0, %xmm3			; AVX-NEXT: vpcmpgtd %xmm2, %xmm0, %xmm3
	▲ Show 20 Lines • Show All 56 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/combine-or.ll

	Show First 20 Lines • Show All 234 Lines • ▼ Show 20 Lines


	define <4 x i32> @test18(<4 x i32> %a, <4 x i32> %b) {			define <4 x i32> @test18(<4 x i32> %a, <4 x i32> %b) {
	; CHECK-LABEL: test18:			; CHECK-LABEL: test18:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: pxor %xmm2, %xmm2			; CHECK-NEXT: pxor %xmm2, %xmm2
	; CHECK-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm2[2,3,4,5,6,7]			; CHECK-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm2[2,3,4,5,6,7]
	; CHECK-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,0,1,1]			; CHECK-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,0,1,1]
	; CHECK-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm2[2,3,4,5,6,7]			; CHECK-NEXT: pblendw {{.*#+}} xmm2 = xmm1[0,1],xmm2[2,3,4,5,6,7]
	; CHECK-NEXT: por %xmm1, %xmm0			; CHECK-NEXT: por %xmm0, %xmm2
				; CHECK-NEXT: movdqa %xmm2, %xmm0
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%shuf1 = shufflevector <4 x i32> %a, <4 x i32> zeroinitializer, <4 x i32><i32 4, i32 0, i32 4, i32 4>			%shuf1 = shufflevector <4 x i32> %a, <4 x i32> zeroinitializer, <4 x i32><i32 4, i32 0, i32 4, i32 4>
	%shuf2 = shufflevector <4 x i32> %b, <4 x i32> zeroinitializer, <4 x i32><i32 0, i32 4, i32 4, i32 4>			%shuf2 = shufflevector <4 x i32> %b, <4 x i32> zeroinitializer, <4 x i32><i32 0, i32 4, i32 4, i32 4>
	%or = or <4 x i32> %shuf1, %shuf2			%or = or <4 x i32> %shuf1, %shuf2
	ret <4 x i32> %or			ret <4 x i32> %or
	}			}


	▲ Show 20 Lines • Show All 238 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/combine-sdiv.ll

	Show First 20 Lines • Show All 195 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: psrld $2, %xmm1			; SSE2-NEXT: psrld $2, %xmm1
	; SSE2-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]			; SSE2-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
	; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,3],xmm2[0,3]			; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,3],xmm2[0,3]
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: combine_vec_sdiv_by_pos1:			; SSE41-LABEL: combine_vec_sdiv_by_pos1:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; SSE41-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
				; SSE41-NEXT: movdqa %xmm0, %xmm1
				; SSE41-NEXT: psrld $4, %xmm1
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
				; SSE41-NEXT: psrld $2, %xmm2
				; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1,2,3],xmm1[4,5,6,7]
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: psrld $3, %xmm1			; SSE41-NEXT: psrld $3, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0,1,2,3],xmm1[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
	; SSE41-NEXT: psrld $4, %xmm0			; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm2[2,3],xmm0[4,5],xmm2[6,7]
	; SSE41-NEXT: psrld $2, %xmm2
	; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1,2,3],xmm0[4,5,6,7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm2[2,3],xmm1[4,5],xmm2[6,7]
	; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: combine_vec_sdiv_by_pos1:			; AVX1-LABEL: combine_vec_sdiv_by_pos1:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX1-NEXT: vpsrld $4, %xmm0, %xmm1			; AVX1-NEXT: vpsrld $4, %xmm0, %xmm1
	; AVX1-NEXT: vpsrld $2, %xmm0, %xmm2			; AVX1-NEXT: vpsrld $2, %xmm0, %xmm2
	; AVX1-NEXT: vpblendw {{.*#+}} xmm1 = xmm2[0,1,2,3],xmm1[4,5,6,7]			; AVX1-NEXT: vpblendw {{.*#+}} xmm1 = xmm2[0,1,2,3],xmm1[4,5,6,7]
	Show All 20 Lines

	; fold (sdiv x, (1 << c)) -> x >>u c			; fold (sdiv x, (1 << c)) -> x >>u c
	define <4 x i32> @combine_vec_sdiv_by_pow2a(<4 x i32> %x) {			define <4 x i32> @combine_vec_sdiv_by_pow2a(<4 x i32> %x) {
	; SSE-LABEL: combine_vec_sdiv_by_pow2a:			; SSE-LABEL: combine_vec_sdiv_by_pow2a:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE-NEXT: movdqa %xmm0, %xmm1
	; SSE-NEXT: psrad $31, %xmm1			; SSE-NEXT: psrad $31, %xmm1
	; SSE-NEXT: psrld $30, %xmm1			; SSE-NEXT: psrld $30, %xmm1
	; SSE-NEXT: paddd %xmm0, %xmm1			; SSE-NEXT: paddd %xmm1, %xmm0
	; SSE-NEXT: psrad $2, %xmm1			; SSE-NEXT: psrad $2, %xmm0
	; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: combine_vec_sdiv_by_pow2a:			; AVX-LABEL: combine_vec_sdiv_by_pow2a:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpsrad $31, %xmm0, %xmm1			; AVX-NEXT: vpsrad $31, %xmm0, %xmm1
	; AVX-NEXT: vpsrld $30, %xmm1, %xmm1			; AVX-NEXT: vpsrld $30, %xmm1, %xmm1
	; AVX-NEXT: vpaddd %xmm1, %xmm0, %xmm0			; AVX-NEXT: vpaddd %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpsrad $2, %xmm0, %xmm0			; AVX-NEXT: vpsrad $2, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 224 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: psraw $15, %xmm1			; SSE41-NEXT: psraw $15, %xmm1
	; SSE41-NEXT: pmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE41-NEXT: pmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE41-NEXT: paddw %xmm0, %xmm1			; SSE41-NEXT: paddw %xmm0, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm2			; SSE41-NEXT: movdqa %xmm1, %xmm2
	; SSE41-NEXT: psraw $1, %xmm2			; SSE41-NEXT: psraw $1, %xmm2
	; SSE41-NEXT: pmulhw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE41-NEXT: pmulhw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm2[2],xmm1[3,4,5,6],xmm2[7]			; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm2[2],xmm1[3,4,5,6],xmm2[7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0],xmm1[1,2,3,4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0],xmm1[1,2,3,4,5,6,7]
	; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: combine_vec_sdiv_by_pow2b_v8i16:			; AVX1-LABEL: combine_vec_sdiv_by_pow2b_v8i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsraw $15, %xmm0, %xmm1			; AVX1-NEXT: vpsraw $15, %xmm0, %xmm1
	; AVX1-NEXT: vpmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX1-NEXT: vpmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX1-NEXT: vpaddw %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpaddw %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpsraw $1, %xmm1, %xmm2			; AVX1-NEXT: vpsraw $1, %xmm1, %xmm2
	▲ Show 20 Lines • Show All 104 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: por %xmm7, %xmm2			; SSE2-NEXT: por %xmm7, %xmm2
	; SSE2-NEXT: movdqa %xmm2, %xmm1			; SSE2-NEXT: movdqa %xmm2, %xmm1
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: combine_vec_sdiv_by_pow2b_v16i16:			; SSE41-LABEL: combine_vec_sdiv_by_pow2b_v16i16:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: psraw $15, %xmm2			; SSE41-NEXT: psraw $15, %xmm2
	; SSE41-NEXT: movdqa {{.*#+}} xmm4 = <u,4,2,16,8,32,64,2>			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = <u,4,2,16,8,32,64,2>
	; SSE41-NEXT: pmulhuw %xmm4, %xmm2			; SSE41-NEXT: pmulhuw %xmm3, %xmm2
	; SSE41-NEXT: paddw %xmm0, %xmm2			; SSE41-NEXT: paddw %xmm0, %xmm2
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = <u,16384,32768,4096,8192,2048,1024,32768>			; SSE41-NEXT: movdqa {{.*#+}} xmm4 = <u,16384,32768,4096,8192,2048,1024,32768>
	; SSE41-NEXT: movdqa %xmm2, %xmm3			; SSE41-NEXT: movdqa %xmm2, %xmm5
	; SSE41-NEXT: pmulhw %xmm5, %xmm3			; SSE41-NEXT: pmulhw %xmm4, %xmm5
	; SSE41-NEXT: psraw $1, %xmm2			; SSE41-NEXT: psraw $1, %xmm2
	; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm3[0,1],xmm2[2],xmm3[3,4,5,6],xmm2[7]			; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm5[0,1],xmm2[2],xmm5[3,4,5,6],xmm2[7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm0[0],xmm2[1,2,3,4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0],xmm2[1,2,3,4,5,6,7]
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm2
	; SSE41-NEXT: psraw $15, %xmm3			; SSE41-NEXT: psraw $15, %xmm2
	; SSE41-NEXT: pmulhuw %xmm4, %xmm3			; SSE41-NEXT: pmulhuw %xmm3, %xmm2
	; SSE41-NEXT: paddw %xmm1, %xmm3			; SSE41-NEXT: paddw %xmm1, %xmm2
	; SSE41-NEXT: pmulhw %xmm3, %xmm5			; SSE41-NEXT: pmulhw %xmm2, %xmm4
	; SSE41-NEXT: psraw $1, %xmm3			; SSE41-NEXT: psraw $1, %xmm2
	; SSE41-NEXT: pblendw {{.*#+}} xmm3 = xmm5[0,1],xmm3[2],xmm5[3,4,5,6],xmm3[7]			; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm4[0,1],xmm2[2],xmm4[3,4,5,6],xmm2[7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm3 = xmm1[0],xmm3[1,2,3,4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1,2,3,4,5,6,7]
	; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: movdqa %xmm3, %xmm1
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: combine_vec_sdiv_by_pow2b_v16i16:			; AVX1-LABEL: combine_vec_sdiv_by_pow2b_v16i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vpsraw $15, %xmm1, %xmm2			; AVX1-NEXT: vpsraw $15, %xmm1, %xmm2
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = <u,4,2,16,8,32,64,2>			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = <u,4,2,16,8,32,64,2>
	; AVX1-NEXT: vpmulhuw %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpmulhuw %xmm3, %xmm2, %xmm2
	▲ Show 20 Lines • Show All 179 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: pandn %xmm3, %xmm12			; SSE2-NEXT: pandn %xmm3, %xmm12
	; SSE2-NEXT: por %xmm10, %xmm12			; SSE2-NEXT: por %xmm10, %xmm12
	; SSE2-NEXT: movdqa %xmm8, %xmm2			; SSE2-NEXT: movdqa %xmm8, %xmm2
	; SSE2-NEXT: movdqa %xmm12, %xmm3			; SSE2-NEXT: movdqa %xmm12, %xmm3
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: combine_vec_sdiv_by_pow2b_v32i16:			; SSE41-LABEL: combine_vec_sdiv_by_pow2b_v32i16:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm1, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm6
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: psraw $15, %xmm6
	; SSE41-NEXT: psraw $15, %xmm0			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = <u,4,2,16,8,32,64,2>
	; SSE41-NEXT: movdqa {{.*#+}} xmm7 = <u,4,2,16,8,32,64,2>			; SSE41-NEXT: pmulhuw %xmm5, %xmm6
	; SSE41-NEXT: pmulhuw %xmm7, %xmm0			; SSE41-NEXT: paddw %xmm0, %xmm6
	; SSE41-NEXT: paddw %xmm1, %xmm0			; SSE41-NEXT: movdqa {{.*#+}} xmm4 = <u,16384,32768,4096,8192,2048,1024,32768>
	; SSE41-NEXT: movdqa {{.*#+}} xmm6 = <u,16384,32768,4096,8192,2048,1024,32768>			; SSE41-NEXT: movdqa %xmm6, %xmm7
	; SSE41-NEXT: movdqa %xmm0, %xmm5			; SSE41-NEXT: pmulhw %xmm4, %xmm7
	; SSE41-NEXT: pmulhw %xmm6, %xmm5			; SSE41-NEXT: psraw $1, %xmm6
	; SSE41-NEXT: psraw $1, %xmm0			; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm7[0,1],xmm6[2],xmm7[3,4,5,6],xmm6[7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm5[0,1],xmm0[2],xmm5[3,4,5,6],xmm0[7]			; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0],xmm6[1,2,3,4,5,6,7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm1[0],xmm0[1,2,3,4,5,6,7]			; SSE41-NEXT: movdqa %xmm1, %xmm6
	; SSE41-NEXT: movdqa %xmm4, %xmm1			; SSE41-NEXT: psraw $15, %xmm6
	; SSE41-NEXT: psraw $15, %xmm1			; SSE41-NEXT: pmulhuw %xmm5, %xmm6
	; SSE41-NEXT: pmulhuw %xmm7, %xmm1			; SSE41-NEXT: paddw %xmm1, %xmm6
	; SSE41-NEXT: paddw %xmm4, %xmm1			; SSE41-NEXT: movdqa %xmm6, %xmm7
	; SSE41-NEXT: movdqa %xmm1, %xmm5			; SSE41-NEXT: pmulhw %xmm4, %xmm7
	; SSE41-NEXT: pmulhw %xmm6, %xmm5			; SSE41-NEXT: psraw $1, %xmm6
	; SSE41-NEXT: psraw $1, %xmm1			; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm7[0,1],xmm6[2],xmm7[3,4,5,6],xmm6[7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm5[0,1],xmm1[2],xmm5[3,4,5,6],xmm1[7]			; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0],xmm6[1,2,3,4,5,6,7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm4[0],xmm1[1,2,3,4,5,6,7]			; SSE41-NEXT: movdqa %xmm2, %xmm6
	; SSE41-NEXT: movdqa %xmm2, %xmm4			; SSE41-NEXT: psraw $15, %xmm6
	; SSE41-NEXT: psraw $15, %xmm4			; SSE41-NEXT: pmulhuw %xmm5, %xmm6
	; SSE41-NEXT: pmulhuw %xmm7, %xmm4			; SSE41-NEXT: paddw %xmm2, %xmm6
	; SSE41-NEXT: paddw %xmm2, %xmm4			; SSE41-NEXT: movdqa %xmm6, %xmm7
	; SSE41-NEXT: movdqa %xmm4, %xmm5			; SSE41-NEXT: pmulhw %xmm4, %xmm7
	; SSE41-NEXT: pmulhw %xmm6, %xmm5			; SSE41-NEXT: psraw $1, %xmm6
	; SSE41-NEXT: psraw $1, %xmm4			; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm7[0,1],xmm6[2],xmm7[3,4,5,6],xmm6[7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm5[0,1],xmm4[2],xmm5[3,4,5,6],xmm4[7]			; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0],xmm6[1,2,3,4,5,6,7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm2[0],xmm4[1,2,3,4,5,6,7]			; SSE41-NEXT: movdqa %xmm3, %xmm6
	; SSE41-NEXT: movdqa %xmm3, %xmm5			; SSE41-NEXT: psraw $15, %xmm6
	; SSE41-NEXT: psraw $15, %xmm5			; SSE41-NEXT: pmulhuw %xmm5, %xmm6
	; SSE41-NEXT: pmulhuw %xmm7, %xmm5			; SSE41-NEXT: paddw %xmm3, %xmm6
	; SSE41-NEXT: paddw %xmm3, %xmm5			; SSE41-NEXT: pmulhw %xmm6, %xmm4
	; SSE41-NEXT: pmulhw %xmm5, %xmm6			; SSE41-NEXT: psraw $1, %xmm6
	; SSE41-NEXT: psraw $1, %xmm5			; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm4[0,1],xmm6[2],xmm4[3,4,5,6],xmm6[7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm5 = xmm6[0,1],xmm5[2],xmm6[3,4,5,6],xmm5[7]			; SSE41-NEXT: pblendw {{.*#+}} xmm3 = xmm3[0],xmm6[1,2,3,4,5,6,7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm5 = xmm3[0],xmm5[1,2,3,4,5,6,7]
	; SSE41-NEXT: movdqa %xmm4, %xmm2
	; SSE41-NEXT: movdqa %xmm5, %xmm3
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: combine_vec_sdiv_by_pow2b_v32i16:			; AVX1-LABEL: combine_vec_sdiv_by_pow2b_v32i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
	; AVX1-NEXT: vpsraw $15, %xmm2, %xmm3			; AVX1-NEXT: vpsraw $15, %xmm2, %xmm3
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = <u,4,2,16,8,32,64,2>			; AVX1-NEXT: vmovdqa {{.*#+}} xmm4 = <u,4,2,16,8,32,64,2>
	; AVX1-NEXT: vpmulhuw %xmm4, %xmm3, %xmm3			; AVX1-NEXT: vpmulhuw %xmm4, %xmm3, %xmm3
	▲ Show 20 Lines • Show All 163 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: paddd %xmm0, %xmm1			; SSE41-NEXT: paddd %xmm0, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm2			; SSE41-NEXT: movdqa %xmm1, %xmm2
	; SSE41-NEXT: psrad $4, %xmm2			; SSE41-NEXT: psrad $4, %xmm2
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: psrad $2, %xmm3			; SSE41-NEXT: psrad $2, %xmm3
	; SSE41-NEXT: pblendw {{.*#+}} xmm3 = xmm3[0,1,2,3],xmm2[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm3 = xmm3[0,1,2,3],xmm2[4,5,6,7]
	; SSE41-NEXT: psrad $3, %xmm1			; SSE41-NEXT: psrad $3, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm3[2,3],xmm1[4,5],xmm3[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm3[2,3],xmm1[4,5],xmm3[6,7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0,1],xmm1[2,3,4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm1[2,3,4,5,6,7]
	; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: combine_vec_sdiv_by_pow2b_v4i32:			; AVX1-LABEL: combine_vec_sdiv_by_pow2b_v4i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsrad $31, %xmm0, %xmm1			; AVX1-NEXT: vpsrad $31, %xmm0, %xmm1
	; AVX1-NEXT: vpsrld $28, %xmm1, %xmm2			; AVX1-NEXT: vpsrld $28, %xmm1, %xmm2
	; AVX1-NEXT: vpsrld $30, %xmm1, %xmm3			; AVX1-NEXT: vpsrld $30, %xmm1, %xmm3
	; AVX1-NEXT: vpblendw {{.*#+}} xmm2 = xmm3[0,1,2,3],xmm2[4,5,6,7]			; AVX1-NEXT: vpblendw {{.*#+}} xmm2 = xmm3[0,1,2,3],xmm2[4,5,6,7]
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,1],xmm4[0,3]			; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,1],xmm4[0,3]
	; SSE2-NEXT: movss {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3]			; SSE2-NEXT: movss {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3]
	; SSE2-NEXT: movaps %xmm2, %xmm1			; SSE2-NEXT: movaps %xmm2, %xmm1
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: combine_vec_sdiv_by_pow2b_v8i32:			; SSE41-LABEL: combine_vec_sdiv_by_pow2b_v8i32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: psrad $31, %xmm0			; SSE41-NEXT: psrad $31, %xmm2
	; SSE41-NEXT: movdqa %xmm0, %xmm3			; SSE41-NEXT: movdqa %xmm2, %xmm3
	; SSE41-NEXT: psrld $28, %xmm3			; SSE41-NEXT: psrld $28, %xmm3
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm2, %xmm4
	; SSE41-NEXT: psrld $30, %xmm4			; SSE41-NEXT: psrld $30, %xmm4
	; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm4[0,1,2,3],xmm3[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm4[0,1,2,3],xmm3[4,5,6,7]
	; SSE41-NEXT: psrld $29, %xmm0			; SSE41-NEXT: psrld $29, %xmm2
	; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm4[2,3],xmm0[4,5],xmm4[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm4[2,3],xmm2[4,5],xmm4[6,7]
	; SSE41-NEXT: paddd %xmm2, %xmm0			; SSE41-NEXT: paddd %xmm0, %xmm2
	; SSE41-NEXT: movdqa %xmm0, %xmm3			; SSE41-NEXT: movdqa %xmm2, %xmm3
	; SSE41-NEXT: psrad $4, %xmm3			; SSE41-NEXT: psrad $4, %xmm3
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm2, %xmm4
	; SSE41-NEXT: psrad $2, %xmm4			; SSE41-NEXT: psrad $2, %xmm4
	; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm4[0,1,2,3],xmm3[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm4[0,1,2,3],xmm3[4,5,6,7]
	; SSE41-NEXT: psrad $3, %xmm0			; SSE41-NEXT: psrad $3, %xmm2
	; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm4[2,3],xmm0[4,5],xmm4[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm4[2,3],xmm2[4,5],xmm4[6,7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm2[0,1],xmm0[2,3,4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm2[2,3,4,5,6,7]
	; SSE41-NEXT: movdqa %xmm1, %xmm2			; SSE41-NEXT: movdqa %xmm1, %xmm2
	; SSE41-NEXT: psrad $31, %xmm2			; SSE41-NEXT: psrad $31, %xmm2
	; SSE41-NEXT: movdqa %xmm2, %xmm3			; SSE41-NEXT: movdqa %xmm2, %xmm3
	; SSE41-NEXT: psrld $28, %xmm3			; SSE41-NEXT: psrld $28, %xmm3
	; SSE41-NEXT: movdqa %xmm2, %xmm4			; SSE41-NEXT: movdqa %xmm2, %xmm4
	; SSE41-NEXT: psrld $30, %xmm4			; SSE41-NEXT: psrld $30, %xmm4
	; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm4[0,1,2,3],xmm3[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm4[0,1,2,3],xmm3[4,5,6,7]
	; SSE41-NEXT: psrld $29, %xmm2			; SSE41-NEXT: psrld $29, %xmm2
	; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm4[2,3],xmm2[4,5],xmm4[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm4[2,3],xmm2[4,5],xmm4[6,7]
	; SSE41-NEXT: paddd %xmm1, %xmm2			; SSE41-NEXT: paddd %xmm1, %xmm2
	; SSE41-NEXT: movdqa %xmm2, %xmm3			; SSE41-NEXT: movdqa %xmm2, %xmm3
	; SSE41-NEXT: psrad $4, %xmm3			; SSE41-NEXT: psrad $4, %xmm3
	; SSE41-NEXT: movdqa %xmm2, %xmm4			; SSE41-NEXT: movdqa %xmm2, %xmm4
	; SSE41-NEXT: psrad $2, %xmm4			; SSE41-NEXT: psrad $2, %xmm4
	; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm4[0,1,2,3],xmm3[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm4[0,1,2,3],xmm3[4,5,6,7]
	; SSE41-NEXT: psrad $3, %xmm2			; SSE41-NEXT: psrad $3, %xmm2
	; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm4[2,3],xmm2[4,5],xmm4[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm4[2,3],xmm2[4,5],xmm4[6,7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm1[0,1],xmm2[2,3,4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm2[2,3,4,5,6,7]
	; SSE41-NEXT: movdqa %xmm2, %xmm1
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: combine_vec_sdiv_by_pow2b_v8i32:			; AVX1-LABEL: combine_vec_sdiv_by_pow2b_v8i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vpsrad $31, %xmm1, %xmm2			; AVX1-NEXT: vpsrad $31, %xmm1, %xmm2
	; AVX1-NEXT: vpsrld $28, %xmm2, %xmm3			; AVX1-NEXT: vpsrld $28, %xmm2, %xmm3
	; AVX1-NEXT: vpsrld $30, %xmm2, %xmm4			; AVX1-NEXT: vpsrld $30, %xmm2, %xmm4
	▲ Show 20 Lines • Show All 128 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: shufps {{.*#+}} xmm5 = xmm5[0,1],xmm6[0,3]			; SSE2-NEXT: shufps {{.*#+}} xmm5 = xmm5[0,1],xmm6[0,3]
	; SSE2-NEXT: movss {{.*#+}} xmm5 = xmm3[0],xmm5[1,2,3]			; SSE2-NEXT: movss {{.*#+}} xmm5 = xmm3[0],xmm5[1,2,3]
	; SSE2-NEXT: movaps %xmm4, %xmm2			; SSE2-NEXT: movaps %xmm4, %xmm2
	; SSE2-NEXT: movaps %xmm5, %xmm3			; SSE2-NEXT: movaps %xmm5, %xmm3
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: combine_vec_sdiv_by_pow2b_v16i32:			; SSE41-LABEL: combine_vec_sdiv_by_pow2b_v16i32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm1, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: psrad $31, %xmm4
	; SSE41-NEXT: psrad $31, %xmm0			; SSE41-NEXT: movdqa %xmm4, %xmm5
	; SSE41-NEXT: movdqa %xmm0, %xmm5
	; SSE41-NEXT: psrld $28, %xmm5			; SSE41-NEXT: psrld $28, %xmm5
	; SSE41-NEXT: movdqa %xmm0, %xmm6			; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: psrld $30, %xmm6			; SSE41-NEXT: psrld $30, %xmm6
	; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm6[0,1,2,3],xmm5[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm6[0,1,2,3],xmm5[4,5,6,7]
	; SSE41-NEXT: psrld $29, %xmm0			; SSE41-NEXT: psrld $29, %xmm4
	; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm6[2,3],xmm0[4,5],xmm6[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm4[0,1],xmm6[2,3],xmm4[4,5],xmm6[6,7]
	; SSE41-NEXT: paddd %xmm1, %xmm0			; SSE41-NEXT: paddd %xmm0, %xmm4
	; SSE41-NEXT: movdqa %xmm0, %xmm5			; SSE41-NEXT: movdqa %xmm4, %xmm5
	; SSE41-NEXT: psrad $4, %xmm5			; SSE41-NEXT: psrad $4, %xmm5
	; SSE41-NEXT: movdqa %xmm0, %xmm6			; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: psrad $2, %xmm6			; SSE41-NEXT: psrad $2, %xmm6
	; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm6[0,1,2,3],xmm5[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm6[0,1,2,3],xmm5[4,5,6,7]
	; SSE41-NEXT: psrad $3, %xmm0			; SSE41-NEXT: psrad $3, %xmm4
	; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm6[2,3],xmm0[4,5],xmm6[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm4[0,1],xmm6[2,3],xmm4[4,5],xmm6[6,7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm1[0,1],xmm0[2,3,4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm4[2,3,4,5,6,7]
	; SSE41-NEXT: movdqa %xmm4, %xmm1			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: psrad $31, %xmm1			; SSE41-NEXT: psrad $31, %xmm4
	; SSE41-NEXT: movdqa %xmm1, %xmm5			; SSE41-NEXT: movdqa %xmm4, %xmm5
	; SSE41-NEXT: psrld $28, %xmm5			; SSE41-NEXT: psrld $28, %xmm5
	; SSE41-NEXT: movdqa %xmm1, %xmm6			; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: psrld $30, %xmm6			; SSE41-NEXT: psrld $30, %xmm6
	; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm6[0,1,2,3],xmm5[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm6[0,1,2,3],xmm5[4,5,6,7]
	; SSE41-NEXT: psrld $29, %xmm1			; SSE41-NEXT: psrld $29, %xmm4
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm6[2,3],xmm1[4,5],xmm6[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm4[0,1],xmm6[2,3],xmm4[4,5],xmm6[6,7]
	; SSE41-NEXT: paddd %xmm4, %xmm1			; SSE41-NEXT: paddd %xmm1, %xmm4
	; SSE41-NEXT: movdqa %xmm1, %xmm5			; SSE41-NEXT: movdqa %xmm4, %xmm5
	; SSE41-NEXT: psrad $4, %xmm5			; SSE41-NEXT: psrad $4, %xmm5
	; SSE41-NEXT: movdqa %xmm1, %xmm6			; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: psrad $2, %xmm6			; SSE41-NEXT: psrad $2, %xmm6
	; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm6[0,1,2,3],xmm5[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm6[0,1,2,3],xmm5[4,5,6,7]
	; SSE41-NEXT: psrad $3, %xmm1			; SSE41-NEXT: psrad $3, %xmm4
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm6[2,3],xmm1[4,5],xmm6[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm4[0,1],xmm6[2,3],xmm4[4,5],xmm6[6,7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm4[0,1],xmm1[2,3,4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm4[2,3,4,5,6,7]
	; SSE41-NEXT: movdqa %xmm2, %xmm4			; SSE41-NEXT: movdqa %xmm2, %xmm4
	; SSE41-NEXT: psrad $31, %xmm4			; SSE41-NEXT: psrad $31, %xmm4
	; SSE41-NEXT: movdqa %xmm4, %xmm5			; SSE41-NEXT: movdqa %xmm4, %xmm5
	; SSE41-NEXT: psrld $28, %xmm5			; SSE41-NEXT: psrld $28, %xmm5
	; SSE41-NEXT: movdqa %xmm4, %xmm6			; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: psrld $30, %xmm6			; SSE41-NEXT: psrld $30, %xmm6
	; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm6[0,1,2,3],xmm5[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm6[0,1,2,3],xmm5[4,5,6,7]
	; SSE41-NEXT: psrld $29, %xmm4			; SSE41-NEXT: psrld $29, %xmm4
	; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm4[0,1],xmm6[2,3],xmm4[4,5],xmm6[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm4[0,1],xmm6[2,3],xmm4[4,5],xmm6[6,7]
	; SSE41-NEXT: paddd %xmm2, %xmm4			; SSE41-NEXT: paddd %xmm2, %xmm4
	; SSE41-NEXT: movdqa %xmm4, %xmm5			; SSE41-NEXT: movdqa %xmm4, %xmm5
	; SSE41-NEXT: psrad $4, %xmm5			; SSE41-NEXT: psrad $4, %xmm5
	; SSE41-NEXT: movdqa %xmm4, %xmm6			; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: psrad $2, %xmm6			; SSE41-NEXT: psrad $2, %xmm6
	; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm6[0,1,2,3],xmm5[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm6[0,1,2,3],xmm5[4,5,6,7]
	; SSE41-NEXT: psrad $3, %xmm4			; SSE41-NEXT: psrad $3, %xmm4
	; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm4[0,1],xmm6[2,3],xmm4[4,5],xmm6[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm4[0,1],xmm6[2,3],xmm4[4,5],xmm6[6,7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm2[0,1],xmm4[2,3,4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm4[2,3,4,5,6,7]
	; SSE41-NEXT: movdqa %xmm3, %xmm5			; SSE41-NEXT: movdqa %xmm3, %xmm4
	; SSE41-NEXT: psrad $31, %xmm5			; SSE41-NEXT: psrad $31, %xmm4
	; SSE41-NEXT: movdqa %xmm5, %xmm2			; SSE41-NEXT: movdqa %xmm4, %xmm5
	; SSE41-NEXT: psrld $28, %xmm2			; SSE41-NEXT: psrld $28, %xmm5
	; SSE41-NEXT: movdqa %xmm5, %xmm6			; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: psrld $30, %xmm6			; SSE41-NEXT: psrld $30, %xmm6
	; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm6[0,1,2,3],xmm2[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm6[0,1,2,3],xmm5[4,5,6,7]
	; SSE41-NEXT: psrld $29, %xmm5			; SSE41-NEXT: psrld $29, %xmm4
	; SSE41-NEXT: pblendw {{.*#+}} xmm5 = xmm5[0,1],xmm6[2,3],xmm5[4,5],xmm6[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm4[0,1],xmm6[2,3],xmm4[4,5],xmm6[6,7]
	; SSE41-NEXT: paddd %xmm3, %xmm5			; SSE41-NEXT: paddd %xmm3, %xmm4
	; SSE41-NEXT: movdqa %xmm5, %xmm2			; SSE41-NEXT: movdqa %xmm4, %xmm5
	; SSE41-NEXT: psrad $4, %xmm2			; SSE41-NEXT: psrad $4, %xmm5
	; SSE41-NEXT: movdqa %xmm5, %xmm6			; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: psrad $2, %xmm6			; SSE41-NEXT: psrad $2, %xmm6
	; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm6[0,1,2,3],xmm2[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm6[0,1,2,3],xmm5[4,5,6,7]
	; SSE41-NEXT: psrad $3, %xmm5			; SSE41-NEXT: psrad $3, %xmm4
	; SSE41-NEXT: pblendw {{.*#+}} xmm5 = xmm5[0,1],xmm6[2,3],xmm5[4,5],xmm6[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm4[0,1],xmm6[2,3],xmm4[4,5],xmm6[6,7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm5 = xmm3[0,1],xmm5[2,3,4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm3 = xmm3[0,1],xmm4[2,3,4,5,6,7]
	; SSE41-NEXT: movdqa %xmm4, %xmm2
	; SSE41-NEXT: movdqa %xmm5, %xmm3
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: combine_vec_sdiv_by_pow2b_v16i32:			; AVX1-LABEL: combine_vec_sdiv_by_pow2b_v16i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
	; AVX1-NEXT: vpsrad $31, %xmm2, %xmm3			; AVX1-NEXT: vpsrad $31, %xmm2, %xmm3
	; AVX1-NEXT: vpsrld $28, %xmm3, %xmm4			; AVX1-NEXT: vpsrld $28, %xmm3, %xmm4
	; AVX1-NEXT: vpsrld $30, %xmm3, %xmm5			; AVX1-NEXT: vpsrld $30, %xmm3, %xmm5
	▲ Show 20 Lines • Show All 143 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: psrad $31, %xmm1			; SSE41-NEXT: psrad $31, %xmm1
	; SSE41-NEXT: psrlq $62, %xmm1			; SSE41-NEXT: psrlq $62, %xmm1
	; SSE41-NEXT: paddq %xmm0, %xmm1			; SSE41-NEXT: paddq %xmm0, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm2			; SSE41-NEXT: movdqa %xmm1, %xmm2
	; SSE41-NEXT: psrad $2, %xmm2			; SSE41-NEXT: psrad $2, %xmm2
	; SSE41-NEXT: psrlq $2, %xmm1			; SSE41-NEXT: psrlq $2, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm2[2,3],xmm1[4,5],xmm2[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm2[2,3],xmm1[4,5],xmm2[6,7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0,1,2,3],xmm1[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
	; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: combine_vec_sdiv_by_pow2b_v2i64:			; AVX1-LABEL: combine_vec_sdiv_by_pow2b_v2i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm1			; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm1
	; AVX1-NEXT: vpsrlq $62, %xmm1, %xmm1			; AVX1-NEXT: vpsrlq $62, %xmm1, %xmm1
	; AVX1-NEXT: vpaddq %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpaddq %xmm1, %xmm0, %xmm1
	▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: xorpd %xmm1, %xmm2			; SSE2-NEXT: xorpd %xmm1, %xmm2
	; SSE2-NEXT: psubq %xmm1, %xmm2			; SSE2-NEXT: psubq %xmm1, %xmm2
	; SSE2-NEXT: movdqa %xmm2, %xmm1			; SSE2-NEXT: movdqa %xmm2, %xmm1
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: combine_vec_sdiv_by_pow2b_v4i64:			; SSE41-LABEL: combine_vec_sdiv_by_pow2b_v4i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: psrad $31, %xmm0			; SSE41-NEXT: psrad $31, %xmm2
	; SSE41-NEXT: psrlq $62, %xmm0			; SSE41-NEXT: psrlq $62, %xmm2
	; SSE41-NEXT: paddq %xmm2, %xmm0			; SSE41-NEXT: paddq %xmm0, %xmm2
	; SSE41-NEXT: movdqa %xmm0, %xmm3			; SSE41-NEXT: movdqa %xmm2, %xmm3
	; SSE41-NEXT: psrad $2, %xmm3			; SSE41-NEXT: psrad $2, %xmm3
	; SSE41-NEXT: psrlq $2, %xmm0			; SSE41-NEXT: psrlq $2, %xmm2
	; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm3[2,3],xmm0[4,5],xmm3[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm3[2,3],xmm2[4,5],xmm3[6,7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm2[0,1,2,3],xmm0[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm2[4,5,6,7]
	; SSE41-NEXT: movdqa %xmm1, %xmm2			; SSE41-NEXT: movdqa %xmm1, %xmm2
	; SSE41-NEXT: psrad $31, %xmm2			; SSE41-NEXT: psrad $31, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]
	; SSE41-NEXT: movdqa %xmm2, %xmm3			; SSE41-NEXT: movdqa %xmm2, %xmm3
	; SSE41-NEXT: psrlq $60, %xmm3			; SSE41-NEXT: psrlq $60, %xmm3
	; SSE41-NEXT: psrlq $61, %xmm2			; SSE41-NEXT: psrlq $61, %xmm2
	; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1,2,3],xmm3[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1,2,3],xmm3[4,5,6,7]
	; SSE41-NEXT: paddq %xmm1, %xmm2			; SSE41-NEXT: paddq %xmm1, %xmm2
	▲ Show 20 Lines • Show All 139 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: xorpd %xmm1, %xmm5			; SSE2-NEXT: xorpd %xmm1, %xmm5
	; SSE2-NEXT: psubq %xmm1, %xmm5			; SSE2-NEXT: psubq %xmm1, %xmm5
	; SSE2-NEXT: movdqa %xmm4, %xmm1			; SSE2-NEXT: movdqa %xmm4, %xmm1
	; SSE2-NEXT: movdqa %xmm5, %xmm3			; SSE2-NEXT: movdqa %xmm5, %xmm3
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: combine_vec_sdiv_by_pow2b_v8i64:			; SSE41-LABEL: combine_vec_sdiv_by_pow2b_v8i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm2, %xmm5
	; SSE41-NEXT: movdqa %xmm1, %xmm4			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: psrad $31, %xmm0			; SSE41-NEXT: psrad $31, %xmm1
	; SSE41-NEXT: psrlq $62, %xmm0			; SSE41-NEXT: psrlq $62, %xmm1
	; SSE41-NEXT: paddq %xmm1, %xmm0			; SSE41-NEXT: paddq %xmm0, %xmm1
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm1, %xmm5
	; SSE41-NEXT: psrad $2, %xmm2			; SSE41-NEXT: psrad $2, %xmm5
	; SSE41-NEXT: psrlq $2, %xmm0			; SSE41-NEXT: psrlq $2, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm2[2,3],xmm0[4,5],xmm2[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm5[2,3],xmm1[4,5],xmm5[6,7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm1[0,1,2,3],xmm0[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
	; SSE41-NEXT: movdqa %xmm5, %xmm2
	; SSE41-NEXT: psrad $31, %xmm2
	; SSE41-NEXT: psrlq $62, %xmm2
	; SSE41-NEXT: paddq %xmm5, %xmm2
	; SSE41-NEXT: movdqa %xmm2, %xmm1			; SSE41-NEXT: movdqa %xmm2, %xmm1
	; SSE41-NEXT: psrad $2, %xmm1			; SSE41-NEXT: psrad $31, %xmm1
	; SSE41-NEXT: psrlq $2, %xmm2			; SSE41-NEXT: psrlq $62, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm1[2,3],xmm2[4,5],xmm1[6,7]			; SSE41-NEXT: paddq %xmm2, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm5[0,1,2,3],xmm2[4,5,6,7]			; SSE41-NEXT: movdqa %xmm1, %xmm5
				; SSE41-NEXT: psrad $2, %xmm5
				; SSE41-NEXT: psrlq $2, %xmm1
				; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm5[2,3],xmm1[4,5],xmm5[6,7]
				; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1,2,3],xmm1[4,5,6,7]
	; SSE41-NEXT: movdqa %xmm4, %xmm1			; SSE41-NEXT: movdqa %xmm4, %xmm1
	; SSE41-NEXT: psrad $31, %xmm1			; SSE41-NEXT: psrad $31, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]
	; SSE41-NEXT: movdqa %xmm1, %xmm5			; SSE41-NEXT: movdqa %xmm1, %xmm5
	; SSE41-NEXT: psrlq $60, %xmm5			; SSE41-NEXT: psrlq $60, %xmm5
	; SSE41-NEXT: psrlq $61, %xmm1			; SSE41-NEXT: psrlq $61, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1,2,3],xmm5[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1,2,3],xmm5[4,5,6,7]
	; SSE41-NEXT: paddq %xmm4, %xmm1			; SSE41-NEXT: paddq %xmm4, %xmm1
	▲ Show 20 Lines • Show All 188 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm1, %xmm2			; SSE41-NEXT: movdqa %xmm1, %xmm2
	; SSE41-NEXT: psrad $4, %xmm2			; SSE41-NEXT: psrad $4, %xmm2
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: psrad $2, %xmm3			; SSE41-NEXT: psrad $2, %xmm3
	; SSE41-NEXT: pblendw {{.*#+}} xmm3 = xmm3[0,1,2,3],xmm2[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm3 = xmm3[0,1,2,3],xmm2[4,5,6,7]
	; SSE41-NEXT: pxor %xmm2, %xmm2			; SSE41-NEXT: pxor %xmm2, %xmm2
	; SSE41-NEXT: psubd %xmm3, %xmm2			; SSE41-NEXT: psubd %xmm3, %xmm2
	; SSE41-NEXT: psrad $3, %xmm1			; SSE41-NEXT: psrad $3, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0,1,2,3],xmm1[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm2[2,3],xmm1[4,5],xmm2[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm2[2,3],xmm0[4,5],xmm2[6,7]
	; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: combine_vec_sdiv_by_pow2b_PosAndNeg:			; AVX1-LABEL: combine_vec_sdiv_by_pow2b_PosAndNeg:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsrad $31, %xmm0, %xmm1			; AVX1-NEXT: vpsrad $31, %xmm0, %xmm1
	; AVX1-NEXT: vpsrld $28, %xmm1, %xmm2			; AVX1-NEXT: vpsrld $28, %xmm1, %xmm2
	; AVX1-NEXT: vpsrld $30, %xmm1, %xmm3			; AVX1-NEXT: vpsrld $30, %xmm1, %xmm3
	; AVX1-NEXT: vpblendw {{.*#+}} xmm2 = xmm3[0,1,2,3],xmm2[4,5,6,7]			; AVX1-NEXT: vpblendw {{.*#+}} xmm2 = xmm3[0,1,2,3],xmm2[4,5,6,7]
	▲ Show 20 Lines • Show All 312 Lines • ▼ Show 20 Lines
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: psrld $31, %xmm1			; SSE41-NEXT: psrld $31, %xmm1
	; SSE41-NEXT: paddd %xmm0, %xmm1			; SSE41-NEXT: paddd %xmm0, %xmm1
	; SSE41-NEXT: psrad $1, %xmm1			; SSE41-NEXT: psrad $1, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0,1,2,3],xmm1[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0,1,2,3],xmm1[4,5,6,7]
	; SSE41-NEXT: pxor %xmm0, %xmm0			; SSE41-NEXT: pxor %xmm0, %xmm0
	; SSE41-NEXT: psubd %xmm1, %xmm0			; SSE41-NEXT: psubd %xmm1, %xmm0
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0,1],xmm1[2,3,4,5],xmm0[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm1[2,3,4,5],xmm0[6,7]
	; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: non_splat_minus_one_divisor_2:			; AVX1-LABEL: non_splat_minus_one_divisor_2:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsrld $31, %xmm0, %xmm1			; AVX1-NEXT: vpsrld $31, %xmm0, %xmm1
	; AVX1-NEXT: vpaddd %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpaddd %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpsrad $1, %xmm1, %xmm1			; AVX1-NEXT: vpsrad $1, %xmm1, %xmm1
	; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]			; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
	Show All 28 Lines
	}			}

	define <8 x i16> @combine_vec_sdiv_nonuniform(<8 x i16> %x) {			define <8 x i16> @combine_vec_sdiv_nonuniform(<8 x i16> %x) {
	; SSE-LABEL: combine_vec_sdiv_nonuniform:			; SSE-LABEL: combine_vec_sdiv_nonuniform:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: pmulhw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; SSE-NEXT: pmulhw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE-NEXT: movdqa %xmm0, %xmm1
	; SSE-NEXT: psrlw $15, %xmm1			; SSE-NEXT: psrlw $15, %xmm1
	; SSE-NEXT: paddw %xmm0, %xmm1			; SSE-NEXT: paddw %xmm1, %xmm0
	; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: combine_vec_sdiv_nonuniform:			; AVX-LABEL: combine_vec_sdiv_nonuniform:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpmulhw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX-NEXT: vpmulhw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX-NEXT: vpsrlw $15, %xmm0, %xmm1			; AVX-NEXT: vpsrlw $15, %xmm0, %xmm1
	; AVX-NEXT: vpaddw %xmm1, %xmm0, %xmm0			; AVX-NEXT: vpaddw %xmm1, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	▲ Show 20 Lines • Show All 395 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: combine_vec_sdiv_nonuniform6:			; SSE41-LABEL: combine_vec_sdiv_nonuniform6:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa {{.*#+}} xmm1 = [65535,65535,65535,65535,1,1,1,0]			; SSE41-NEXT: movdqa {{.*#+}} xmm1 = [65535,65535,65535,65535,1,1,1,0]
	; SSE41-NEXT: pmullw %xmm0, %xmm1			; SSE41-NEXT: pmullw %xmm0, %xmm1
	; SSE41-NEXT: pmulhw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; SSE41-NEXT: pmulhw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE41-NEXT: paddw %xmm1, %xmm0			; SSE41-NEXT: paddw %xmm1, %xmm0
	; SSE41-NEXT: movdqa {{.*#+}} xmm2 = <4,256,256,u,u,512,256,8>			; SSE41-NEXT: movdqa {{.*#+}} xmm1 = <4,256,256,u,u,512,256,8>
	; SSE41-NEXT: pmulhw %xmm0, %xmm2			; SSE41-NEXT: pmulhw %xmm0, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1,2],xmm0[3,4],xmm2[5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1,2],xmm0[3,4],xmm1[5,6,7]
	; SSE41-NEXT: psrlw $15, %xmm0			; SSE41-NEXT: psrlw $15, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm1			; SSE41-NEXT: pxor %xmm2, %xmm2
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0,1,2],xmm1[3,4],xmm0[5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2],xmm2[3,4],xmm0[5,6,7]
	; SSE41-NEXT: paddw %xmm2, %xmm1			; SSE41-NEXT: paddw %xmm1, %xmm0
	; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: combine_vec_sdiv_nonuniform6:			; AVX1-LABEL: combine_vec_sdiv_nonuniform6:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpmullw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm1			; AVX1-NEXT: vpmullw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm1
	; AVX1-NEXT: vpmulhw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX1-NEXT: vpmulhw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX1-NEXT: vpaddw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpaddw %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpmulhw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm1			; AVX1-NEXT: vpmulhw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm1
	▲ Show 20 Lines • Show All 252 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%r = sdiv <4 x i1> %x, %y			%r = sdiv <4 x i1> %x, %y
	ret <4 x i1> %r			ret <4 x i1> %r
	}			}

	define i32 @combine_sdiv_two(i32 %x) {			define i32 @combine_sdiv_two(i32 %x) {
	; CHECK-LABEL: combine_sdiv_two:			; CHECK-LABEL: combine_sdiv_two:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: # kill: def $edi killed $edi def $rdi
	; CHECK-NEXT: movl %edi, %eax			; CHECK-NEXT: movl %edi, %eax
	; CHECK-NEXT: shrl $31, %eax			; CHECK-NEXT: shrl $31, %eax
	; CHECK-NEXT: addl %edi, %eax			; CHECK-NEXT: addl %edi, %eax
	; CHECK-NEXT: sarl %eax			; CHECK-NEXT: sarl %eax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%1 = sdiv i32 %x, 2			%1 = sdiv i32 %x, 2
	ret i32 %1			ret i32 %1
	}			}

	define i32 @combine_sdiv_negtwo(i32 %x) {			define i32 @combine_sdiv_negtwo(i32 %x) {
	; CHECK-LABEL: combine_sdiv_negtwo:			; CHECK-LABEL: combine_sdiv_negtwo:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: # kill: def $edi killed $edi def $rdi
	; CHECK-NEXT: movl %edi, %eax			; CHECK-NEXT: movl %edi, %eax
	; CHECK-NEXT: shrl $31, %eax			; CHECK-NEXT: shrl $31, %eax
	; CHECK-NEXT: addl %edi, %eax			; CHECK-NEXT: addl %edi, %eax
	; CHECK-NEXT: sarl %eax			; CHECK-NEXT: sarl %eax
	; CHECK-NEXT: negl %eax			; CHECK-NEXT: negl %eax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%1 = sdiv i32 %x, -2			%1 = sdiv i32 %x, -2
	ret i32 %1			ret i32 %1
	}			}

	define i8 @combine_i8_sdiv_pow2(i8 %x) {			define i8 @combine_i8_sdiv_pow2(i8 %x) {
	; CHECK-LABEL: combine_i8_sdiv_pow2:			; CHECK-LABEL: combine_i8_sdiv_pow2:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: # kill: def $edi killed $edi def $rdi
	; CHECK-NEXT: movl %edi, %eax			; CHECK-NEXT: movl %edi, %eax
	; CHECK-NEXT: sarb $7, %al			; CHECK-NEXT: sarb $7, %al
	; CHECK-NEXT: shrb $4, %al			; CHECK-NEXT: shrb $4, %al
	; CHECK-NEXT: addl %edi, %eax			; CHECK-NEXT: addb %dil, %al
	; CHECK-NEXT: sarb $4, %al			; CHECK-NEXT: sarb $4, %al
	; CHECK-NEXT: # kill: def $al killed $al killed $eax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%1 = sdiv i8 %x, 16			%1 = sdiv i8 %x, 16
	ret i8 %1			ret i8 %1
	}			}

	define i8 @combine_i8_sdiv_negpow2(i8 %x) {			define i8 @combine_i8_sdiv_negpow2(i8 %x) {
	; CHECK-LABEL: combine_i8_sdiv_negpow2:			; CHECK-LABEL: combine_i8_sdiv_negpow2:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: # kill: def $edi killed $edi def $rdi
	; CHECK-NEXT: movl %edi, %eax			; CHECK-NEXT: movl %edi, %eax
	; CHECK-NEXT: sarb $7, %al			; CHECK-NEXT: sarb $7, %al
	; CHECK-NEXT: shrb $2, %al			; CHECK-NEXT: shrb $2, %al
	; CHECK-NEXT: addl %edi, %eax			; CHECK-NEXT: addb %dil, %al
	; CHECK-NEXT: sarb $6, %al			; CHECK-NEXT: sarb $6, %al
	; CHECK-NEXT: negb %al			; CHECK-NEXT: negb %al
	; CHECK-NEXT: # kill: def $al killed $al killed $eax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%1 = sdiv i8 %x, -64			%1 = sdiv i8 %x, -64
	ret i8 %1			ret i8 %1
	}			}

	define i16 @combine_i16_sdiv_pow2(i16 %x) {			define i16 @combine_i16_sdiv_pow2(i16 %x) {
	; CHECK-LABEL: combine_i16_sdiv_pow2:			; CHECK-LABEL: combine_i16_sdiv_pow2:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	▲ Show 20 Lines • Show All 79 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/combine-smax.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse2 \| FileCheck %s --check-prefix=SSE2			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse2 \| FileCheck %s --check-prefix=SSE2
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 \| FileCheck %s --check-prefix=SSE41			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 \| FileCheck %s --check-prefix=SSE41
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 \| FileCheck %s --check-prefix=SSE42			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 \| FileCheck %s --check-prefix=SSE42
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefix=AVX			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefix=AVX
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=AVX			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=AVX
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f \| FileCheck %s --check-prefix=AVX			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f \| FileCheck %s --check-prefix=AVX
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw \| FileCheck %s --check-prefix=AVX			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw \| FileCheck %s --check-prefix=AVX

	define <16 x i8> @test_v16i8_nosignbit(<16 x i8> %a, <16 x i8> %b) {			define <16 x i8> @test_v16i8_nosignbit(<16 x i8> %a, <16 x i8> %b) {
	; SSE2-LABEL: test_v16i8_nosignbit:			; SSE2-LABEL: test_v16i8_nosignbit:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]			; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	; SSE2-NEXT: pand %xmm2, %xmm0			; SSE2-NEXT: pand %xmm2, %xmm0
	; SSE2-NEXT: pand %xmm2, %xmm1			; SSE2-NEXT: pand %xmm1, %xmm2
	; SSE2-NEXT: pmaxub %xmm1, %xmm0			; SSE2-NEXT: pmaxub %xmm2, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v16i8_nosignbit:			; SSE41-LABEL: test_v16i8_nosignbit:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]			; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	; SSE41-NEXT: pand %xmm2, %xmm0			; SSE41-NEXT: pand %xmm2, %xmm0
	; SSE41-NEXT: pand %xmm2, %xmm1			; SSE41-NEXT: pand %xmm1, %xmm2
	; SSE41-NEXT: pmaxsb %xmm1, %xmm0			; SSE41-NEXT: pmaxsb %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: test_v16i8_nosignbit:			; SSE42-LABEL: test_v16i8_nosignbit:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]			; SSE42-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	; SSE42-NEXT: pand %xmm2, %xmm0			; SSE42-NEXT: pand %xmm2, %xmm0
	; SSE42-NEXT: pand %xmm2, %xmm1			; SSE42-NEXT: pand %xmm1, %xmm2
	; SSE42-NEXT: pmaxsb %xmm1, %xmm0			; SSE42-NEXT: pmaxsb %xmm2, %xmm0
	; SSE42-NEXT: retq			; SSE42-NEXT: retq
	;			;
	; AVX-LABEL: test_v16i8_nosignbit:			; AVX-LABEL: test_v16i8_nosignbit:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]			; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	; AVX-NEXT: vpand %xmm2, %xmm0, %xmm0			; AVX-NEXT: vpand %xmm2, %xmm0, %xmm0
	; AVX-NEXT: vpand %xmm2, %xmm1, %xmm1			; AVX-NEXT: vpand %xmm2, %xmm1, %xmm1
	; AVX-NEXT: vpmaxsb %xmm1, %xmm0, %xmm0			; AVX-NEXT: vpmaxsb %xmm1, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = and <16 x i8> %a, <i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15>			%1 = and <16 x i8> %a, <i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15>
	%2 = and <16 x i8> %b, <i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15>			%2 = and <16 x i8> %b, <i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15>
	%3 = icmp sgt <16 x i8> %1, %2			%3 = icmp sgt <16 x i8> %1, %2
	%4 = select <16 x i1> %3, <16 x i8> %1, <16 x i8> %2			%4 = select <16 x i1> %3, <16 x i8> %1, <16 x i8> %2
	ret <16 x i8> %4			ret <16 x i8> %4
	}			}

llvm/test/CodeGen/X86/combine-smin.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse2 \| FileCheck %s --check-prefix=SSE2			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse2 \| FileCheck %s --check-prefix=SSE2
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 \| FileCheck %s --check-prefix=SSE41			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 \| FileCheck %s --check-prefix=SSE41
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 \| FileCheck %s --check-prefix=SSE42			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 \| FileCheck %s --check-prefix=SSE42
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefix=AVX			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefix=AVX
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=AVX			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=AVX
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f \| FileCheck %s --check-prefix=AVX			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f \| FileCheck %s --check-prefix=AVX
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw \| FileCheck %s --check-prefix=AVX			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw \| FileCheck %s --check-prefix=AVX

	define <16 x i8> @test_v16i8_nosignbit(<16 x i8> %a, <16 x i8> %b) {			define <16 x i8> @test_v16i8_nosignbit(<16 x i8> %a, <16 x i8> %b) {
	; SSE2-LABEL: test_v16i8_nosignbit:			; SSE2-LABEL: test_v16i8_nosignbit:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]			; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	; SSE2-NEXT: pand %xmm2, %xmm0			; SSE2-NEXT: pand %xmm2, %xmm0
	; SSE2-NEXT: pand %xmm2, %xmm1			; SSE2-NEXT: pand %xmm1, %xmm2
	; SSE2-NEXT: pminub %xmm1, %xmm0			; SSE2-NEXT: pminub %xmm2, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v16i8_nosignbit:			; SSE41-LABEL: test_v16i8_nosignbit:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]			; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	; SSE41-NEXT: pand %xmm2, %xmm0			; SSE41-NEXT: pand %xmm2, %xmm0
	; SSE41-NEXT: pand %xmm2, %xmm1			; SSE41-NEXT: pand %xmm1, %xmm2
	; SSE41-NEXT: pminsb %xmm1, %xmm0			; SSE41-NEXT: pminsb %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: test_v16i8_nosignbit:			; SSE42-LABEL: test_v16i8_nosignbit:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]			; SSE42-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	; SSE42-NEXT: pand %xmm2, %xmm0			; SSE42-NEXT: pand %xmm2, %xmm0
	; SSE42-NEXT: pand %xmm2, %xmm1			; SSE42-NEXT: pand %xmm1, %xmm2
	; SSE42-NEXT: pminsb %xmm1, %xmm0			; SSE42-NEXT: pminsb %xmm2, %xmm0
	; SSE42-NEXT: retq			; SSE42-NEXT: retq
	;			;
	; AVX-LABEL: test_v16i8_nosignbit:			; AVX-LABEL: test_v16i8_nosignbit:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]			; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	; AVX-NEXT: vpand %xmm2, %xmm0, %xmm0			; AVX-NEXT: vpand %xmm2, %xmm0, %xmm0
	; AVX-NEXT: vpand %xmm2, %xmm1, %xmm1			; AVX-NEXT: vpand %xmm2, %xmm1, %xmm1
	; AVX-NEXT: vpminsb %xmm1, %xmm0, %xmm0			; AVX-NEXT: vpminsb %xmm1, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%1 = and <16 x i8> %a, <i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15>			%1 = and <16 x i8> %a, <i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15>
	%2 = and <16 x i8> %b, <i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15>			%2 = and <16 x i8> %b, <i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15>
	%3 = icmp slt <16 x i8> %1, %2			%3 = icmp slt <16 x i8> %1, %2
	%4 = select <16 x i1> %3, <16 x i8> %1, <16 x i8> %2			%4 = select <16 x i1> %3, <16 x i8> %1, <16 x i8> %2
	ret <16 x i8> %4			ret <16 x i8> %4
	}			}

llvm/test/CodeGen/X86/combine-sra.ll

	Show First 20 Lines • Show All 204 Lines • ▼ Show 20 Lines
	; SSE-LABEL: combine_vec_ashr_trunc_lshr:			; SSE-LABEL: combine_vec_ashr_trunc_lshr:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,3],xmm1[1,3]			; SSE-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,3],xmm1[1,3]
	; SSE-NEXT: movaps %xmm0, %xmm2			; SSE-NEXT: movaps %xmm0, %xmm2
	; SSE-NEXT: psrad $2, %xmm2			; SSE-NEXT: psrad $2, %xmm2
	; SSE-NEXT: pblendw {{.*#+}} xmm2 = xmm0[0,1,2,3],xmm2[4,5,6,7]			; SSE-NEXT: pblendw {{.*#+}} xmm2 = xmm0[0,1,2,3],xmm2[4,5,6,7]
	; SSE-NEXT: psrad $1, %xmm0			; SSE-NEXT: psrad $1, %xmm0
	; SSE-NEXT: psrad $3, %xmm1			; SSE-NEXT: psrad $3, %xmm1
	; SSE-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0,1,2,3],xmm1[4,5,6,7]			; SSE-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
	; SSE-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm1[2,3],xmm2[4,5],xmm1[6,7]			; SSE-NEXT: pblendw {{.*#+}} xmm0 = xmm2[0,1],xmm0[2,3],xmm2[4,5],xmm0[6,7]
	; SSE-NEXT: movdqa %xmm2, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX2-SLOW-LABEL: combine_vec_ashr_trunc_lshr:			; AVX2-SLOW-LABEL: combine_vec_ashr_trunc_lshr:
	; AVX2-SLOW: # %bb.0:			; AVX2-SLOW: # %bb.0:
	; AVX2-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX2-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX2-SLOW-NEXT: vshufps {{.*#+}} xmm0 = xmm0[1,3],xmm1[1,3]			; AVX2-SLOW-NEXT: vshufps {{.*#+}} xmm0 = xmm0[1,3],xmm1[1,3]
	; AVX2-SLOW-NEXT: vpsravd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-SLOW-NEXT: vpsravd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX2-SLOW-NEXT: vzeroupper			; AVX2-SLOW-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	; SSE-LABEL: combine_vec_ashr_trunc_ashr:			; SSE-LABEL: combine_vec_ashr_trunc_ashr:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,3],xmm1[1,3]			; SSE-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,3],xmm1[1,3]
	; SSE-NEXT: movaps %xmm0, %xmm2			; SSE-NEXT: movaps %xmm0, %xmm2
	; SSE-NEXT: psrad $2, %xmm2			; SSE-NEXT: psrad $2, %xmm2
	; SSE-NEXT: pblendw {{.*#+}} xmm2 = xmm0[0,1,2,3],xmm2[4,5,6,7]			; SSE-NEXT: pblendw {{.*#+}} xmm2 = xmm0[0,1,2,3],xmm2[4,5,6,7]
	; SSE-NEXT: psrad $1, %xmm0			; SSE-NEXT: psrad $1, %xmm0
	; SSE-NEXT: psrad $3, %xmm1			; SSE-NEXT: psrad $3, %xmm1
	; SSE-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0,1,2,3],xmm1[4,5,6,7]			; SSE-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
	; SSE-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm1[2,3],xmm2[4,5],xmm1[6,7]			; SSE-NEXT: pblendw {{.*#+}} xmm0 = xmm2[0,1],xmm0[2,3],xmm2[4,5],xmm0[6,7]
	; SSE-NEXT: movdqa %xmm2, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX2-SLOW-LABEL: combine_vec_ashr_trunc_ashr:			; AVX2-SLOW-LABEL: combine_vec_ashr_trunc_ashr:
	; AVX2-SLOW: # %bb.0:			; AVX2-SLOW: # %bb.0:
	; AVX2-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX2-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX2-SLOW-NEXT: vshufps {{.*#+}} xmm0 = xmm0[1,3],xmm1[1,3]			; AVX2-SLOW-NEXT: vshufps {{.*#+}} xmm0 = xmm0[1,3],xmm1[1,3]
	; AVX2-SLOW-NEXT: vpsravd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX2-SLOW-NEXT: vpsravd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX2-SLOW-NEXT: vzeroupper			; AVX2-SLOW-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 90 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/combine-srem.ll

	Show First 20 Lines • Show All 327 Lines • ▼ Show 20 Lines
	; SSE-NEXT: psrad $2, %xmm3			; SSE-NEXT: psrad $2, %xmm3
	; SSE-NEXT: pblendw {{.*#+}} xmm3 = xmm3[0,1,2,3],xmm2[4,5,6,7]			; SSE-NEXT: pblendw {{.*#+}} xmm3 = xmm3[0,1,2,3],xmm2[4,5,6,7]
	; SSE-NEXT: movdqa %xmm1, %xmm2			; SSE-NEXT: movdqa %xmm1, %xmm2
	; SSE-NEXT: psrad $3, %xmm2			; SSE-NEXT: psrad $3, %xmm2
	; SSE-NEXT: psrad $1, %xmm1			; SSE-NEXT: psrad $1, %xmm1
	; SSE-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1,2,3],xmm2[4,5,6,7]			; SSE-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1,2,3],xmm2[4,5,6,7]
	; SSE-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm3[2,3],xmm1[4,5],xmm3[6,7]			; SSE-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm3[2,3],xmm1[4,5],xmm3[6,7]
	; SSE-NEXT: pmulld {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE-NEXT: pmulld {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE-NEXT: paddd %xmm0, %xmm1			; SSE-NEXT: paddd %xmm1, %xmm0
	; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-LABEL: combine_vec_srem_by_pow2b_neg:			; AVX1-LABEL: combine_vec_srem_by_pow2b_neg:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsrad $31, %xmm0, %xmm1			; AVX1-NEXT: vpsrad $31, %xmm0, %xmm1
	; AVX1-NEXT: vpsrld $28, %xmm1, %xmm2			; AVX1-NEXT: vpsrld $28, %xmm1, %xmm2
	; AVX1-NEXT: vpsrld $30, %xmm1, %xmm3			; AVX1-NEXT: vpsrld $30, %xmm1, %xmm3
	; AVX1-NEXT: vpblendw {{.*#+}} xmm2 = xmm3[0,1,2,3],xmm2[4,5,6,7]			; AVX1-NEXT: vpblendw {{.*#+}} xmm2 = xmm3[0,1,2,3],xmm2[4,5,6,7]
	▲ Show 20 Lines • Show All 220 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/combine-srl.ll

Show First 20 Lines • Show All 340 Lines • ▼ Show 20 Lines	; AVX-NEXT: retq
%3 = lshr <4 x i32> %2, <i32 5, i32 5, i32 5, i32 5>		%3 = lshr <4 x i32> %2, <i32 5, i32 5, i32 5, i32 5>
ret <4 x i32> %3		ret <4 x i32> %3
}		}

define <4 x i32> @combine_vec_lshr_lzcnt_bit1(<4 x i32> %x) {		define <4 x i32> @combine_vec_lshr_lzcnt_bit1(<4 x i32> %x) {
; SSE-LABEL: combine_vec_lshr_lzcnt_bit1:		; SSE-LABEL: combine_vec_lshr_lzcnt_bit1:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0		; SSE-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE-NEXT: movdqa {{.*#+}} xmm2 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]		; SSE-NEXT: movdqa {{.*#+}} xmm1 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]
; SSE-NEXT: movdqa %xmm2, %xmm3		; SSE-NEXT: movdqa %xmm1, %xmm2
; SSE-NEXT: pshufb %xmm0, %xmm3		; SSE-NEXT: pshufb %xmm0, %xmm2
; SSE-NEXT: movdqa %xmm0, %xmm1		; SSE-NEXT: movdqa %xmm0, %xmm3
; SSE-NEXT: psrlw $4, %xmm1		; SSE-NEXT: psrlw $4, %xmm3
; SSE-NEXT: pxor %xmm4, %xmm4		; SSE-NEXT: pxor %xmm4, %xmm4
; SSE-NEXT: pshufb %xmm1, %xmm2		; SSE-NEXT: pshufb %xmm3, %xmm1
		; SSE-NEXT: pcmpeqb %xmm4, %xmm3
		; SSE-NEXT: pand %xmm2, %xmm3
		; SSE-NEXT: paddb %xmm1, %xmm3
		; SSE-NEXT: movdqa %xmm0, %xmm1
; SSE-NEXT: pcmpeqb %xmm4, %xmm1		; SSE-NEXT: pcmpeqb %xmm4, %xmm1
; SSE-NEXT: pand %xmm3, %xmm1
; SSE-NEXT: paddb %xmm2, %xmm1
; SSE-NEXT: movdqa %xmm0, %xmm2
; SSE-NEXT: pcmpeqb %xmm4, %xmm2
; SSE-NEXT: psrlw $8, %xmm2
; SSE-NEXT: pand %xmm1, %xmm2
; SSE-NEXT: psrlw $8, %xmm1		; SSE-NEXT: psrlw $8, %xmm1
; SSE-NEXT: paddw %xmm2, %xmm1		; SSE-NEXT: pand %xmm3, %xmm1
		; SSE-NEXT: psrlw $8, %xmm3
		; SSE-NEXT: paddw %xmm1, %xmm3
; SSE-NEXT: pcmpeqw %xmm4, %xmm0		; SSE-NEXT: pcmpeqw %xmm4, %xmm0
; SSE-NEXT: psrld $16, %xmm0		; SSE-NEXT: psrld $16, %xmm0
; SSE-NEXT: pand %xmm1, %xmm0		; SSE-NEXT: pand %xmm3, %xmm0
; SSE-NEXT: psrld $16, %xmm1		; SSE-NEXT: psrld $16, %xmm3
; SSE-NEXT: paddd %xmm0, %xmm1		; SSE-NEXT: paddd %xmm3, %xmm0
; SSE-NEXT: psrld $5, %xmm1		; SSE-NEXT: psrld $5, %xmm0
; SSE-NEXT: movdqa %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: combine_vec_lshr_lzcnt_bit1:		; AVX-LABEL: combine_vec_lshr_lzcnt_bit1:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0		; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]		; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]
; AVX-NEXT: vpshufb %xmm0, %xmm1, %xmm2		; AVX-NEXT: vpshufb %xmm0, %xmm1, %xmm2
; AVX-NEXT: vpsrlw $4, %xmm0, %xmm3		; AVX-NEXT: vpsrlw $4, %xmm0, %xmm3
▲ Show 20 Lines • Show All 78 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/combine-udiv.ll

	Show First 20 Lines • Show All 183 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: movdqa %xmm0, %xmm1
	; SSE2-NEXT: psrld $2, %xmm1			; SSE2-NEXT: psrld $2, %xmm1
	; SSE2-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]			; SSE2-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
	; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,3],xmm2[0,3]			; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,3],xmm2[0,3]
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: combine_vec_udiv_by_pow2b:			; SSE41-LABEL: combine_vec_udiv_by_pow2b:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
				; SSE41-NEXT: movdqa %xmm0, %xmm1
				; SSE41-NEXT: psrld $4, %xmm1
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
				; SSE41-NEXT: psrld $2, %xmm2
				; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1,2,3],xmm1[4,5,6,7]
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: psrld $3, %xmm1			; SSE41-NEXT: psrld $3, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0,1,2,3],xmm1[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
	; SSE41-NEXT: psrld $4, %xmm0			; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm2[2,3],xmm0[4,5],xmm2[6,7]
	; SSE41-NEXT: psrld $2, %xmm2
	; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1,2,3],xmm0[4,5,6,7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm2[2,3],xmm1[4,5],xmm2[6,7]
	; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: combine_vec_udiv_by_pow2b:			; AVX1-LABEL: combine_vec_udiv_by_pow2b:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsrld $4, %xmm0, %xmm1			; AVX1-NEXT: vpsrld $4, %xmm0, %xmm1
	; AVX1-NEXT: vpsrld $2, %xmm0, %xmm2			; AVX1-NEXT: vpsrld $2, %xmm0, %xmm2
	; AVX1-NEXT: vpblendw {{.*#+}} xmm1 = xmm2[0,1,2,3],xmm1[4,5,6,7]			; AVX1-NEXT: vpblendw {{.*#+}} xmm1 = xmm2[0,1,2,3],xmm1[4,5,6,7]
	; AVX1-NEXT: vpsrld $3, %xmm0, %xmm2			; AVX1-NEXT: vpsrld $3, %xmm0, %xmm2
	▲ Show 20 Lines • Show All 345 Lines • ▼ Show 20 Lines
	; XOP-NEXT: retq			; XOP-NEXT: retq
	%1 = udiv <8 x i16> %x, <i16 23, i16 34, i16 -23, i16 56, i16 128, i16 -1, i16 -256, i16 -32768>			%1 = udiv <8 x i16> %x, <i16 23, i16 34, i16 -23, i16 56, i16 128, i16 -1, i16 -256, i16 -32768>
	ret <8 x i16> %1			ret <8 x i16> %1
	}			}

	define <8 x i16> @combine_vec_udiv_nonuniform2(<8 x i16> %x) {			define <8 x i16> @combine_vec_udiv_nonuniform2(<8 x i16> %x) {
	; SSE2-LABEL: combine_vec_udiv_nonuniform2:			; SSE2-LABEL: combine_vec_udiv_nonuniform2:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [0,65535,65535,65535,65535,65535,65535,65535]			; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [0,65535,65535,65535,65535,65535,65535,65535]
	; SSE2-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: movdqa %xmm0, %xmm2
	; SSE2-NEXT: pand %xmm2, %xmm1			; SSE2-NEXT: pand %xmm1, %xmm2
	; SSE2-NEXT: psrlw $1, %xmm0			; SSE2-NEXT: psrlw $1, %xmm0
	; SSE2-NEXT: pandn %xmm0, %xmm2			; SSE2-NEXT: pandn %xmm0, %xmm1
	; SSE2-NEXT: por %xmm2, %xmm1			; SSE2-NEXT: por %xmm2, %xmm1
	; SSE2-NEXT: pmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE2-NEXT: pmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE2-NEXT: pmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE2-NEXT: pmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE2-NEXT: movdqa %xmm1, %xmm0			; SSE2-NEXT: movdqa %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: combine_vec_udiv_nonuniform2:			; SSE41-LABEL: combine_vec_udiv_nonuniform2:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: psrlw $1, %xmm1			; SSE41-NEXT: psrlw $1, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0],xmm0[1,2,3,4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm1[0],xmm0[1,2,3,4,5,6,7]
	; SSE41-NEXT: pmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE41-NEXT: pmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE41-NEXT: pmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE41-NEXT: pmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: combine_vec_udiv_nonuniform2:			; AVX-LABEL: combine_vec_udiv_nonuniform2:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpsrlw $1, %xmm0, %xmm1			; AVX-NEXT: vpsrlw $1, %xmm0, %xmm1
	; AVX-NEXT: vpblendw {{.*#+}} xmm0 = xmm1[0],xmm0[1,2,3,4,5,6,7]			; AVX-NEXT: vpblendw {{.*#+}} xmm0 = xmm1[0],xmm0[1,2,3,4,5,6,7]
	; AVX-NEXT: vpmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX-NEXT: vpmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX-NEXT: vpmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX-NEXT: vpmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	Show All 39 Lines
	; XOP-NEXT: retq			; XOP-NEXT: retq
	%1 = udiv <8 x i16> %x, <i16 7, i16 23, i16 25, i16 27, i16 31, i16 47, i16 63, i16 127>			%1 = udiv <8 x i16> %x, <i16 7, i16 23, i16 25, i16 27, i16 31, i16 47, i16 63, i16 127>
	ret <8 x i16> %1			ret <8 x i16> %1
	}			}

	define <16 x i8> @combine_vec_udiv_nonuniform4(<16 x i8> %x) {			define <16 x i8> @combine_vec_udiv_nonuniform4(<16 x i8> %x) {
	; SSE2-LABEL: combine_vec_udiv_nonuniform4:			; SSE2-LABEL: combine_vec_udiv_nonuniform4:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]			; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [0,255,255,255,255,255,255,255,255,255,255,255,255,255,255,255]
	; SSE2-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: movdqa %xmm0, %xmm2
	; SSE2-NEXT: pand %xmm2, %xmm1			; SSE2-NEXT: pand %xmm1, %xmm2
	; SSE2-NEXT: pxor %xmm3, %xmm3			; SSE2-NEXT: pxor %xmm3, %xmm3
	; SSE2-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm3[0],xmm0[1],xmm3[1],xmm0[2],xmm3[2],xmm0[3],xmm3[3],xmm0[4],xmm3[4],xmm0[5],xmm3[5],xmm0[6],xmm3[6],xmm0[7],xmm3[7]			; SSE2-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm3[0],xmm0[1],xmm3[1],xmm0[2],xmm3[2],xmm0[3],xmm3[3],xmm0[4],xmm3[4],xmm0[5],xmm3[5],xmm0[6],xmm3[6],xmm0[7],xmm3[7]
	; SSE2-NEXT: pmullw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; SSE2-NEXT: pmullw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE2-NEXT: psrlw $8, %xmm0			; SSE2-NEXT: psrlw $8, %xmm0
	; SSE2-NEXT: packuswb %xmm0, %xmm0			; SSE2-NEXT: packuswb %xmm0, %xmm0
	; SSE2-NEXT: psrlw $7, %xmm0			; SSE2-NEXT: psrlw $7, %xmm0
	; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE2-NEXT: pandn %xmm0, %xmm2			; SSE2-NEXT: pandn %xmm0, %xmm1
	; SSE2-NEXT: por %xmm2, %xmm1			; SSE2-NEXT: por %xmm2, %xmm1
	; SSE2-NEXT: movdqa %xmm1, %xmm0			; SSE2-NEXT: movdqa %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: combine_vec_udiv_nonuniform4:			; SSE41-LABEL: combine_vec_udiv_nonuniform4:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: pmovzxbw {{.*#+}} xmm2 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero			; SSE41-NEXT: pmovzxbw {{.*#+}} xmm2 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero
	Show All 33 Lines
	; XOP-NEXT: retq			; XOP-NEXT: retq
	%div = udiv <16 x i8> %x, <i8 -64, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>			%div = udiv <16 x i8> %x, <i8 -64, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>
	ret <16 x i8> %div			ret <16 x i8> %div
	}			}

	define <8 x i16> @pr38477(<8 x i16> %a0) {			define <8 x i16> @pr38477(<8 x i16> %a0) {
	; SSE2-LABEL: pr38477:			; SSE2-LABEL: pr38477:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [0,4957,57457,4103,16385,35545,2048,2115]			; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [0,4957,57457,4103,16385,35545,2048,2115]
	; SSE2-NEXT: pmulhuw %xmm0, %xmm1			; SSE2-NEXT: pmulhuw %xmm0, %xmm2
	; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [0,65535,65535,65535,65535,65535,65535,65535]			; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [0,65535,65535,65535,65535,65535,65535,65535]
	; SSE2-NEXT: pandn %xmm0, %xmm2			; SSE2-NEXT: pandn %xmm0, %xmm1
	; SSE2-NEXT: psubw %xmm1, %xmm0			; SSE2-NEXT: psubw %xmm2, %xmm0
	; SSE2-NEXT: pmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; SSE2-NEXT: pmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE2-NEXT: paddw %xmm1, %xmm0			; SSE2-NEXT: paddw %xmm2, %xmm0
	; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [65535,65535,65535,65535,65535,65535,0,65535]			; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [65535,65535,65535,65535,65535,65535,0,65535]
	; SSE2-NEXT: movdqa %xmm1, %xmm3			; SSE2-NEXT: movdqa %xmm2, %xmm3
	; SSE2-NEXT: pandn %xmm0, %xmm3			; SSE2-NEXT: pandn %xmm0, %xmm3
	; SSE2-NEXT: pmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; SSE2-NEXT: pmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE2-NEXT: pand %xmm1, %xmm0			; SSE2-NEXT: pand %xmm2, %xmm0
	; SSE2-NEXT: por %xmm3, %xmm2			; SSE2-NEXT: por %xmm3, %xmm1
	; SSE2-NEXT: por %xmm2, %xmm0			; SSE2-NEXT: por %xmm0, %xmm1
				; SSE2-NEXT: movdqa %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: pr38477:			; SSE41-LABEL: pr38477:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [0,4957,57457,4103,16385,35545,2048,2115]			; SSE41-NEXT: movdqa {{.*#+}} xmm1 = [0,4957,57457,4103,16385,35545,2048,2115]
	; SSE41-NEXT: pmulhuw %xmm0, %xmm2			; SSE41-NEXT: pmulhuw %xmm0, %xmm1
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: psubw %xmm2, %xmm1			; SSE41-NEXT: psubw %xmm1, %xmm2
	; SSE41-NEXT: pmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE41-NEXT: pmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
	; SSE41-NEXT: paddw %xmm2, %xmm1			; SSE41-NEXT: paddw %xmm1, %xmm2
	; SSE41-NEXT: movdqa {{.*#+}} xmm2 = <u,1024,1024,16,4,1024,u,4096>			; SSE41-NEXT: movdqa {{.*#+}} xmm1 = <u,1024,1024,16,4,1024,u,4096>
	; SSE41-NEXT: pmulhuw %xmm1, %xmm2			; SSE41-NEXT: pmulhuw %xmm2, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm2[0,1,2,3,4,5],xmm1[6],xmm2[7]			; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1,2,3,4,5],xmm2[6],xmm1[7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0],xmm1[1,2,3,4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0],xmm1[1,2,3,4,5,6,7]
	; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: pr38477:			; AVX-LABEL: pr38477:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm1			; AVX-NEXT: vpmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm1
	; AVX-NEXT: vpsubw %xmm1, %xmm0, %xmm2			; AVX-NEXT: vpsubw %xmm1, %xmm0, %xmm2
	; AVX-NEXT: vpmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm2			; AVX-NEXT: vpmulhuw {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm2
	; AVX-NEXT: vpaddw %xmm1, %xmm2, %xmm1			; AVX-NEXT: vpaddw %xmm1, %xmm2, %xmm1
	Show All 35 Lines

llvm/test/CodeGen/X86/ctpop-combine.ll

	Show First 20 Lines • Show All 82 Lines • ▼ Show 20 Lines
	; POPCOUNT: # %bb.0:			; POPCOUNT: # %bb.0:
	; POPCOUNT-NEXT: andl $127, %edi			; POPCOUNT-NEXT: andl $127, %edi
	; POPCOUNT-NEXT: popcntl %edi, %eax			; POPCOUNT-NEXT: popcntl %edi, %eax
	; POPCOUNT-NEXT: # kill: def $al killed $al killed $eax			; POPCOUNT-NEXT: # kill: def $al killed $al killed $eax
	; POPCOUNT-NEXT: retq			; POPCOUNT-NEXT: retq
	;			;
	; NO-POPCOUNT-LABEL: test4:			; NO-POPCOUNT-LABEL: test4:
	; NO-POPCOUNT: # %bb.0:			; NO-POPCOUNT: # %bb.0:
	; NO-POPCOUNT-NEXT: # kill: def $edi killed $edi def $rdi
	; NO-POPCOUNT-NEXT: andb $127, %dil			; NO-POPCOUNT-NEXT: andb $127, %dil
	; NO-POPCOUNT-NEXT: movl %edi, %eax			; NO-POPCOUNT-NEXT: movl %edi, %eax
	; NO-POPCOUNT-NEXT: shrb %al			; NO-POPCOUNT-NEXT: shrb %al
	; NO-POPCOUNT-NEXT: andb $21, %al			; NO-POPCOUNT-NEXT: andb $21, %al
	; NO-POPCOUNT-NEXT: subb %al, %dil			; NO-POPCOUNT-NEXT: subb %al, %dil
	; NO-POPCOUNT-NEXT: movl %edi, %eax			; NO-POPCOUNT-NEXT: movl %edi, %eax
	; NO-POPCOUNT-NEXT: andb $51, %al			; NO-POPCOUNT-NEXT: andb $51, %al
	; NO-POPCOUNT-NEXT: shrb $2, %dil			; NO-POPCOUNT-NEXT: shrb $2, %dil
	; NO-POPCOUNT-NEXT: andb $51, %dil			; NO-POPCOUNT-NEXT: andb $51, %dil
	; NO-POPCOUNT-NEXT: addb %al, %dil			; NO-POPCOUNT-NEXT: addb %al, %dil
	; NO-POPCOUNT-NEXT: movl %edi, %eax			; NO-POPCOUNT-NEXT: movl %edi, %eax
	; NO-POPCOUNT-NEXT: shrb $4, %al			; NO-POPCOUNT-NEXT: shrb $4, %al
	; NO-POPCOUNT-NEXT: addl %edi, %eax			; NO-POPCOUNT-NEXT: addb %dil, %al
	; NO-POPCOUNT-NEXT: andb $15, %al			; NO-POPCOUNT-NEXT: andb $15, %al
	; NO-POPCOUNT-NEXT: # kill: def $al killed $al killed $eax
	; NO-POPCOUNT-NEXT: retq			; NO-POPCOUNT-NEXT: retq
	%x2 = and i8 %x, 127			%x2 = and i8 %x, 127
	%count = tail call i8 @llvm.ctpop.i8(i8 %x2)			%count = tail call i8 @llvm.ctpop.i8(i8 %x2)
	%and = and i8 %count, 7			%and = and i8 %count, 7
	ret i8 %and			ret i8 %and
	}			}

	define i32 @ctpop_eq_one(i64 %x) nounwind readnone {			define i32 @ctpop_eq_one(i64 %x) nounwind readnone {
	▲ Show 20 Lines • Show All 86 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/fshl.ll

	Show First 20 Lines • Show All 825 Lines • ▼ Show 20 Lines
	; X86-SLOW-NEXT: popl %edi			; X86-SLOW-NEXT: popl %edi
	; X86-SLOW-NEXT: popl %ebx			; X86-SLOW-NEXT: popl %ebx
	; X86-SLOW-NEXT: popl %ebp			; X86-SLOW-NEXT: popl %ebp
	; X86-SLOW-NEXT: retl $4			; X86-SLOW-NEXT: retl $4
	;			;
	; X64-FAST-LABEL: var_shift_i128:			; X64-FAST-LABEL: var_shift_i128:
	; X64-FAST: # %bb.0:			; X64-FAST: # %bb.0:
	; X64-FAST-NEXT: movq %r8, %r9			; X64-FAST-NEXT: movq %r8, %r9
	; X64-FAST-NEXT: movq %rcx, %r10			; X64-FAST-NEXT: movq %rcx, %r8
	; X64-FAST-NEXT: movq %rdx, %r8
	; X64-FAST-NEXT: movq %rsi, %rdx
	; X64-FAST-NEXT: movl %r9d, %ecx			; X64-FAST-NEXT: movl %r9d, %ecx
	; X64-FAST-NEXT: shldq %cl, %rdi, %rdx			; X64-FAST-NEXT: shldq %cl, %rdi, %rsi
	; X64-FAST-NEXT: shrdq $1, %r10, %r8			; X64-FAST-NEXT: shrdq $1, %r8, %rdx
	; X64-FAST-NEXT: shrq %r10			; X64-FAST-NEXT: shrq %r8
	; X64-FAST-NEXT: notb %cl			; X64-FAST-NEXT: notb %cl
	; X64-FAST-NEXT: shrdq %cl, %r10, %r8			; X64-FAST-NEXT: shrdq %cl, %r8, %rdx
	; X64-FAST-NEXT: shrq %cl, %r10			; X64-FAST-NEXT: shrq %cl, %r8
	; X64-FAST-NEXT: xorl %eax, %eax			; X64-FAST-NEXT: xorl %eax, %eax
	; X64-FAST-NEXT: testb $64, %cl			; X64-FAST-NEXT: testb $64, %cl
	; X64-FAST-NEXT: cmovneq %r10, %r8			; X64-FAST-NEXT: cmovneq %r8, %rdx
	; X64-FAST-NEXT: cmovneq %rax, %r10			; X64-FAST-NEXT: cmovneq %rax, %r8
	; X64-FAST-NEXT: movl %r9d, %ecx			; X64-FAST-NEXT: movl %r9d, %ecx
	; X64-FAST-NEXT: shlq %cl, %rdi			; X64-FAST-NEXT: shlq %cl, %rdi
	; X64-FAST-NEXT: testb $64, %r9b			; X64-FAST-NEXT: testb $64, %r9b
	; X64-FAST-NEXT: cmovneq %rdi, %rdx			; X64-FAST-NEXT: cmovneq %rdi, %rsi
	; X64-FAST-NEXT: cmoveq %rdi, %rax			; X64-FAST-NEXT: cmoveq %rdi, %rax
	; X64-FAST-NEXT: orq %r8, %rax			; X64-FAST-NEXT: orq %rdx, %rax
	; X64-FAST-NEXT: orq %r10, %rdx			; X64-FAST-NEXT: orq %rsi, %r8
				; X64-FAST-NEXT: movq %r8, %rdx
	; X64-FAST-NEXT: retq			; X64-FAST-NEXT: retq
	;			;
	; X64-SLOW-LABEL: var_shift_i128:			; X64-SLOW-LABEL: var_shift_i128:
	; X64-SLOW: # %bb.0:			; X64-SLOW: # %bb.0:
	; X64-SLOW-NEXT: movq %rcx, %r11			; X64-SLOW-NEXT: movq %rcx, %r11
	; X64-SLOW-NEXT: movq %rdx, %r9			; X64-SLOW-NEXT: movq %rdx, %r9
	; X64-SLOW-NEXT: movl %r8d, %ecx			; X64-SLOW-NEXT: movl %r8d, %ecx
	; X64-SLOW-NEXT: shlq %cl, %rsi			; X64-SLOW-NEXT: shlq %cl, %rsi
	▲ Show 20 Lines • Show All 272 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/fshr.ll

	Show First 20 Lines • Show All 833 Lines • ▼ Show 20 Lines
	; X86-SLOW-NEXT: popl %esi			; X86-SLOW-NEXT: popl %esi
	; X86-SLOW-NEXT: popl %edi			; X86-SLOW-NEXT: popl %edi
	; X86-SLOW-NEXT: popl %ebx			; X86-SLOW-NEXT: popl %ebx
	; X86-SLOW-NEXT: popl %ebp			; X86-SLOW-NEXT: popl %ebp
	; X86-SLOW-NEXT: retl $4			; X86-SLOW-NEXT: retl $4
	;			;
	; X64-FAST-LABEL: var_shift_i128:			; X64-FAST-LABEL: var_shift_i128:
	; X64-FAST: # %bb.0:			; X64-FAST: # %bb.0:
	; X64-FAST-NEXT: movq %r8, %r10			; X64-FAST-NEXT: movq %r8, %r9
	; X64-FAST-NEXT: movq %rcx, %r9			; X64-FAST-NEXT: movq %rcx, %r8
	; X64-FAST-NEXT: movq %rdx, %r8			; X64-FAST-NEXT: movl %r9d, %ecx
	; X64-FAST-NEXT: movq %rsi, %rdx			; X64-FAST-NEXT: shrdq %cl, %r8, %rdx
	; X64-FAST-NEXT: movl %r10d, %ecx			; X64-FAST-NEXT: shrq %cl, %r8
	; X64-FAST-NEXT: shrdq %cl, %r9, %r8
	; X64-FAST-NEXT: shrq %cl, %r9
	; X64-FAST-NEXT: xorl %eax, %eax			; X64-FAST-NEXT: xorl %eax, %eax
	; X64-FAST-NEXT: testb $64, %r10b			; X64-FAST-NEXT: testb $64, %r9b
	; X64-FAST-NEXT: cmovneq %r9, %r8			; X64-FAST-NEXT: cmovneq %r8, %rdx
	; X64-FAST-NEXT: cmovneq %rax, %r9			; X64-FAST-NEXT: cmovneq %rax, %r8
	; X64-FAST-NEXT: shldq $1, %rdi, %rdx			; X64-FAST-NEXT: shldq $1, %rdi, %rsi
	; X64-FAST-NEXT: addq %rdi, %rdi			; X64-FAST-NEXT: addq %rdi, %rdi
	; X64-FAST-NEXT: notb %r10b			; X64-FAST-NEXT: notb %r9b
	; X64-FAST-NEXT: movl %r10d, %ecx			; X64-FAST-NEXT: movl %r9d, %ecx
	; X64-FAST-NEXT: shldq %cl, %rdi, %rdx			; X64-FAST-NEXT: shldq %cl, %rdi, %rsi
	; X64-FAST-NEXT: shlq %cl, %rdi			; X64-FAST-NEXT: shlq %cl, %rdi
	; X64-FAST-NEXT: testb $64, %r10b			; X64-FAST-NEXT: testb $64, %r9b
	; X64-FAST-NEXT: cmovneq %rdi, %rdx			; X64-FAST-NEXT: cmovneq %rdi, %rsi
	; X64-FAST-NEXT: cmoveq %rdi, %rax			; X64-FAST-NEXT: cmoveq %rdi, %rax
	; X64-FAST-NEXT: orq %r8, %rax			; X64-FAST-NEXT: orq %rdx, %rax
	; X64-FAST-NEXT: orq %r9, %rdx			; X64-FAST-NEXT: orq %rsi, %r8
				; X64-FAST-NEXT: movq %r8, %rdx
	; X64-FAST-NEXT: retq			; X64-FAST-NEXT: retq
	;			;
	; X64-SLOW-LABEL: var_shift_i128:			; X64-SLOW-LABEL: var_shift_i128:
	; X64-SLOW: # %bb.0:			; X64-SLOW: # %bb.0:
	; X64-SLOW-NEXT: movq %rcx, %r9			; X64-SLOW-NEXT: movq %rcx, %r9
	; X64-SLOW-NEXT: movq %rdx, %r10			; X64-SLOW-NEXT: movq %rdx, %r10
	; X64-SLOW-NEXT: movabsq $9223372036854775807, %rax # imm = 0x7FFFFFFFFFFFFFFF			; X64-SLOW-NEXT: movabsq $9223372036854775807, %rax # imm = 0x7FFFFFFFFFFFFFFF
	; X64-SLOW-NEXT: andq %rdi, %rax			; X64-SLOW-NEXT: andq %rdi, %rax
	▲ Show 20 Lines • Show All 271 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/funnel-shift.ll

	Show First 20 Lines • Show All 258 Lines • ▼ Show 20 Lines
	; X32-SSE2-NEXT: popl %edi			; X32-SSE2-NEXT: popl %edi
	; X32-SSE2-NEXT: popl %ebx			; X32-SSE2-NEXT: popl %ebx
	; X32-SSE2-NEXT: popl %ebp			; X32-SSE2-NEXT: popl %ebp
	; X32-SSE2-NEXT: retl $4			; X32-SSE2-NEXT: retl $4
	;			;
	; X64-AVX2-LABEL: fshl_i128:			; X64-AVX2-LABEL: fshl_i128:
	; X64-AVX2: # %bb.0:			; X64-AVX2: # %bb.0:
	; X64-AVX2-NEXT: movq %r8, %r9			; X64-AVX2-NEXT: movq %r8, %r9
	; X64-AVX2-NEXT: movq %rcx, %r10			; X64-AVX2-NEXT: movq %rcx, %r8
	; X64-AVX2-NEXT: movq %rdx, %r8
	; X64-AVX2-NEXT: movq %rsi, %rdx
	; X64-AVX2-NEXT: movl %r9d, %ecx			; X64-AVX2-NEXT: movl %r9d, %ecx
	; X64-AVX2-NEXT: shldq %cl, %rdi, %rdx			; X64-AVX2-NEXT: shldq %cl, %rdi, %rsi
	; X64-AVX2-NEXT: shrdq $1, %r10, %r8			; X64-AVX2-NEXT: shrdq $1, %r8, %rdx
	; X64-AVX2-NEXT: shrq %r10			; X64-AVX2-NEXT: shrq %r8
	; X64-AVX2-NEXT: notb %cl			; X64-AVX2-NEXT: notb %cl
	; X64-AVX2-NEXT: shrdq %cl, %r10, %r8			; X64-AVX2-NEXT: shrdq %cl, %r8, %rdx
	; X64-AVX2-NEXT: shrq %cl, %r10			; X64-AVX2-NEXT: shrq %cl, %r8
	; X64-AVX2-NEXT: xorl %eax, %eax			; X64-AVX2-NEXT: xorl %eax, %eax
	; X64-AVX2-NEXT: testb $64, %cl			; X64-AVX2-NEXT: testb $64, %cl
	; X64-AVX2-NEXT: cmovneq %r10, %r8			; X64-AVX2-NEXT: cmovneq %r8, %rdx
	; X64-AVX2-NEXT: cmovneq %rax, %r10			; X64-AVX2-NEXT: cmovneq %rax, %r8
	; X64-AVX2-NEXT: movl %r9d, %ecx			; X64-AVX2-NEXT: movl %r9d, %ecx
	; X64-AVX2-NEXT: shlq %cl, %rdi			; X64-AVX2-NEXT: shlq %cl, %rdi
	; X64-AVX2-NEXT: testb $64, %r9b			; X64-AVX2-NEXT: testb $64, %r9b
	; X64-AVX2-NEXT: cmovneq %rdi, %rdx			; X64-AVX2-NEXT: cmovneq %rdi, %rsi
	; X64-AVX2-NEXT: cmoveq %rdi, %rax			; X64-AVX2-NEXT: cmoveq %rdi, %rax
	; X64-AVX2-NEXT: orq %r8, %rax			; X64-AVX2-NEXT: orq %rdx, %rax
	; X64-AVX2-NEXT: orq %r10, %rdx			; X64-AVX2-NEXT: orq %rsi, %r8
				; X64-AVX2-NEXT: movq %r8, %rdx
	; X64-AVX2-NEXT: retq			; X64-AVX2-NEXT: retq
	%f = call i128 @llvm.fshl.i128(i128 %x, i128 %y, i128 %z)			%f = call i128 @llvm.fshl.i128(i128 %x, i128 %y, i128 %z)
	ret i128 %f			ret i128 %f
	}			}

	; Verify that weird types are minimally supported.			; Verify that weird types are minimally supported.
	declare i37 @llvm.fshl.i37(i37, i37, i37)			declare i37 @llvm.fshl.i37(i37, i37, i37)
	define i37 @fshl_i37(i37 %x, i37 %y, i37 %z) nounwind {			define i37 @fshl_i37(i37 %x, i37 %y, i37 %z) nounwind {
	▲ Show 20 Lines • Show All 923 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/haddsub-shuf.ll

	Show First 20 Lines • Show All 1,290 Lines • ▼ Show 20 Lines
	define <8 x i32> @hadd_8i32_v8i32_shuffle(<8 x i32> %a0, <8 x i32> %a1) {			define <8 x i32> @hadd_8i32_v8i32_shuffle(<8 x i32> %a0, <8 x i32> %a1) {
	; SSE3-LABEL: hadd_8i32_v8i32_shuffle:			; SSE3-LABEL: hadd_8i32_v8i32_shuffle:
	; SSE3: # %bb.0:			; SSE3: # %bb.0:
	; SSE3-NEXT: movaps %xmm2, %xmm4			; SSE3-NEXT: movaps %xmm2, %xmm4
	; SSE3-NEXT: shufps {{.*#+}} xmm4 = xmm4[0,2],xmm3[0,2]			; SSE3-NEXT: shufps {{.*#+}} xmm4 = xmm4[0,2],xmm3[0,2]
	; SSE3-NEXT: movaps %xmm0, %xmm5			; SSE3-NEXT: movaps %xmm0, %xmm5
	; SSE3-NEXT: shufps {{.*#+}} xmm5 = xmm5[0,2],xmm1[0,2]			; SSE3-NEXT: shufps {{.*#+}} xmm5 = xmm5[0,2],xmm1[0,2]
	; SSE3-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,3],xmm3[1,3]			; SSE3-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,3],xmm3[1,3]
	; SSE3-NEXT: paddd %xmm4, %xmm2			; SSE3-NEXT: paddd %xmm2, %xmm4
	; SSE3-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,3],xmm1[1,3]			; SSE3-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,3],xmm1[1,3]
	; SSE3-NEXT: paddd %xmm5, %xmm0			; SSE3-NEXT: paddd %xmm5, %xmm0
	; SSE3-NEXT: movdqa %xmm2, %xmm1			; SSE3-NEXT: movdqa %xmm4, %xmm1
	; SSE3-NEXT: retq			; SSE3-NEXT: retq
	;			;
	; SSSE3-LABEL: hadd_8i32_v8i32_shuffle:			; SSSE3-LABEL: hadd_8i32_v8i32_shuffle:
	; SSSE3: # %bb.0:			; SSSE3: # %bb.0:
	; SSSE3-NEXT: phaddd %xmm1, %xmm0			; SSSE3-NEXT: phaddd %xmm1, %xmm0
	; SSSE3-NEXT: phaddd %xmm3, %xmm2			; SSSE3-NEXT: phaddd %xmm3, %xmm2
	; SSSE3-NEXT: movdqa %xmm2, %xmm1			; SSSE3-NEXT: movdqa %xmm2, %xmm1
	; SSSE3-NEXT: retq			; SSSE3-NEXT: retq
	▲ Show 20 Lines • Show All 135 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/haddsub-undef.ll

Show First 20 Lines • Show All 111 Lines • ▼ Show 20 Lines	; AVX-FAST-NEXT: retq
ret <4 x float> %vecinit		ret <4 x float> %vecinit
}		}

define <2 x double> @test5_undef(<2 x double> %a, <2 x double> %b) {		define <2 x double> @test5_undef(<2 x double> %a, <2 x double> %b) {
; SSE-SLOW-LABEL: test5_undef:		; SSE-SLOW-LABEL: test5_undef:
; SSE-SLOW: # %bb.0:		; SSE-SLOW: # %bb.0:
; SSE-SLOW-NEXT: movapd %xmm0, %xmm1		; SSE-SLOW-NEXT: movapd %xmm0, %xmm1
; SSE-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]		; SSE-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-SLOW-NEXT: addsd %xmm0, %xmm1		; SSE-SLOW-NEXT: addsd %xmm1, %xmm0
; SSE-SLOW-NEXT: movapd %xmm1, %xmm0
; SSE-SLOW-NEXT: retq		; SSE-SLOW-NEXT: retq
;		;
; SSE-FAST-LABEL: test5_undef:		; SSE-FAST-LABEL: test5_undef:
; SSE-FAST: # %bb.0:		; SSE-FAST: # %bb.0:
; SSE-FAST-NEXT: haddpd %xmm0, %xmm0		; SSE-FAST-NEXT: haddpd %xmm0, %xmm0
; SSE-FAST-NEXT: retq		; SSE-FAST-NEXT: retq
;		;
; AVX-SLOW-LABEL: test5_undef:		; AVX-SLOW-LABEL: test5_undef:
▲ Show 20 Lines • Show All 307 Lines • ▼ Show 20 Lines

; Change shuffle mask - no undefs.		; Change shuffle mask - no undefs.

define <2 x double> @add_pd_003_2(<2 x double> %x) {		define <2 x double> @add_pd_003_2(<2 x double> %x) {
; SSE-SLOW-LABEL: add_pd_003_2:		; SSE-SLOW-LABEL: add_pd_003_2:
; SSE-SLOW: # %bb.0:		; SSE-SLOW: # %bb.0:
; SSE-SLOW-NEXT: movapd %xmm0, %xmm1		; SSE-SLOW-NEXT: movapd %xmm0, %xmm1
; SSE-SLOW-NEXT: shufpd {{.*#+}} xmm1 = xmm1[1],xmm0[0]		; SSE-SLOW-NEXT: shufpd {{.*#+}} xmm1 = xmm1[1],xmm0[0]
; SSE-SLOW-NEXT: addpd %xmm0, %xmm1		; SSE-SLOW-NEXT: addpd %xmm1, %xmm0
; SSE-SLOW-NEXT: movapd %xmm1, %xmm0
; SSE-SLOW-NEXT: retq		; SSE-SLOW-NEXT: retq
;		;
; SSE-FAST-LABEL: add_pd_003_2:		; SSE-FAST-LABEL: add_pd_003_2:
; SSE-FAST: # %bb.0:		; SSE-FAST: # %bb.0:
; SSE-FAST-NEXT: haddpd %xmm0, %xmm0		; SSE-FAST-NEXT: haddpd %xmm0, %xmm0
; SSE-FAST-NEXT: retq		; SSE-FAST-NEXT: retq
;		;
; AVX-SLOW-LABEL: add_pd_003_2:		; AVX-SLOW-LABEL: add_pd_003_2:
▲ Show 20 Lines • Show All 216 Lines • ▼ Show 20 Lines

define <4 x double> @add_pd_011(<4 x double> %0, <4 x double> %1) {		define <4 x double> @add_pd_011(<4 x double> %0, <4 x double> %1) {
; SSE-SLOW-LABEL: add_pd_011:		; SSE-SLOW-LABEL: add_pd_011:
; SSE-SLOW: # %bb.0:		; SSE-SLOW: # %bb.0:
; SSE-SLOW-NEXT: movapd %xmm2, %xmm1		; SSE-SLOW-NEXT: movapd %xmm2, %xmm1
; SSE-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm2[1]		; SSE-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm2[1]
; SSE-SLOW-NEXT: movapd %xmm0, %xmm3		; SSE-SLOW-NEXT: movapd %xmm0, %xmm3
; SSE-SLOW-NEXT: unpckhpd {{.*#+}} xmm3 = xmm3[1],xmm0[1]		; SSE-SLOW-NEXT: unpckhpd {{.*#+}} xmm3 = xmm3[1],xmm0[1]
; SSE-SLOW-NEXT: addpd %xmm0, %xmm3		; SSE-SLOW-NEXT: addpd %xmm3, %xmm0
; SSE-SLOW-NEXT: addpd %xmm2, %xmm1		; SSE-SLOW-NEXT: addpd %xmm2, %xmm1
; SSE-SLOW-NEXT: movapd %xmm3, %xmm0
; SSE-SLOW-NEXT: retq		; SSE-SLOW-NEXT: retq
;		;
; SSE-FAST-LABEL: add_pd_011:		; SSE-FAST-LABEL: add_pd_011:
; SSE-FAST: # %bb.0:		; SSE-FAST: # %bb.0:
; SSE-FAST-NEXT: movapd %xmm2, %xmm1		; SSE-FAST-NEXT: movapd %xmm2, %xmm1
; SSE-FAST-NEXT: haddpd %xmm0, %xmm0		; SSE-FAST-NEXT: haddpd %xmm0, %xmm0
; SSE-FAST-NEXT: haddpd %xmm2, %xmm1		; SSE-FAST-NEXT: haddpd %xmm2, %xmm1
; SSE-FAST-NEXT: retq		; SSE-FAST-NEXT: retq
▲ Show 20 Lines • Show All 270 Lines • ▼ Show 20 Lines	; AVX-FAST-NEXT: retq
%shuffle = shufflevector <4 x float> %t1, <4 x float> undef, <4 x i32> <i32 undef, i32 2, i32 undef, i32 undef>		%shuffle = shufflevector <4 x float> %t1, <4 x float> undef, <4 x i32> <i32 undef, i32 2, i32 undef, i32 undef>
ret <4 x float> %shuffle		ret <4 x float> %shuffle
}		}

define <4 x float> @PR45747_2(<4 x float> %a, <4 x float> %b) nounwind {		define <4 x float> @PR45747_2(<4 x float> %a, <4 x float> %b) nounwind {
; SSE-SLOW-LABEL: PR45747_2:		; SSE-SLOW-LABEL: PR45747_2:
; SSE-SLOW: # %bb.0:		; SSE-SLOW: # %bb.0:
; SSE-SLOW-NEXT: movaps %xmm1, %xmm0		; SSE-SLOW-NEXT: movaps %xmm1, %xmm0
; SSE-SLOW-NEXT: movhlps {{.*#+}} xmm1 = xmm1[1,1]		; SSE-SLOW-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1]
; SSE-SLOW-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,3,3,3]		; SSE-SLOW-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,3,3,3]
; SSE-SLOW-NEXT: addps %xmm1, %xmm0		; SSE-SLOW-NEXT: addps %xmm1, %xmm0
; SSE-SLOW-NEXT: retq		; SSE-SLOW-NEXT: retq
;		;
; SSE-FAST-LABEL: PR45747_2:		; SSE-FAST-LABEL: PR45747_2:
; SSE-FAST: # %bb.0:		; SSE-FAST: # %bb.0:
; SSE-FAST-NEXT: haddps %xmm1, %xmm1		; SSE-FAST-NEXT: haddps %xmm1, %xmm1
; SSE-FAST-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]		; SSE-FAST-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
; SSE-FAST-NEXT: retq		; SSE-FAST-NEXT: retq
▲ Show 20 Lines • Show All 356 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/haddsub.ll

Show All 39 Lines	; AVX-NEXT: retq
ret <2 x double> %r		ret <2 x double> %r
}		}

define <2 x double> @haddpd3(<2 x double> %x) {		define <2 x double> @haddpd3(<2 x double> %x) {
; SSE3-SLOW-LABEL: haddpd3:		; SSE3-SLOW-LABEL: haddpd3:
; SSE3-SLOW: # %bb.0:		; SSE3-SLOW: # %bb.0:
; SSE3-SLOW-NEXT: movapd %xmm0, %xmm1		; SSE3-SLOW-NEXT: movapd %xmm0, %xmm1
; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]		; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE3-SLOW-NEXT: addpd %xmm0, %xmm1		; SSE3-SLOW-NEXT: addpd %xmm1, %xmm0
; SSE3-SLOW-NEXT: movapd %xmm1, %xmm0
; SSE3-SLOW-NEXT: retq		; SSE3-SLOW-NEXT: retq
;		;
; SSE3-FAST-LABEL: haddpd3:		; SSE3-FAST-LABEL: haddpd3:
; SSE3-FAST: # %bb.0:		; SSE3-FAST: # %bb.0:
; SSE3-FAST-NEXT: haddpd %xmm0, %xmm0		; SSE3-FAST-NEXT: haddpd %xmm0, %xmm0
; SSE3-FAST-NEXT: retq		; SSE3-FAST-NEXT: retq
;		;
; AVX-SLOW-LABEL: haddpd3:		; AVX-SLOW-LABEL: haddpd3:
▲ Show 20 Lines • Show All 521 Lines • ▼ Show 20 Lines	; AVX-FAST-NEXT: retq
ret float %x01		ret float %x01
}		}

define double @extract_extract01_v2f64_fadd_f64(<2 x double> %x) {		define double @extract_extract01_v2f64_fadd_f64(<2 x double> %x) {
; SSE3-SLOW-LABEL: extract_extract01_v2f64_fadd_f64:		; SSE3-SLOW-LABEL: extract_extract01_v2f64_fadd_f64:
; SSE3-SLOW: # %bb.0:		; SSE3-SLOW: # %bb.0:
; SSE3-SLOW-NEXT: movapd %xmm0, %xmm1		; SSE3-SLOW-NEXT: movapd %xmm0, %xmm1
; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]		; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE3-SLOW-NEXT: addsd %xmm0, %xmm1		; SSE3-SLOW-NEXT: addsd %xmm1, %xmm0
; SSE3-SLOW-NEXT: movapd %xmm1, %xmm0
; SSE3-SLOW-NEXT: retq		; SSE3-SLOW-NEXT: retq
;		;
; SSE3-FAST-LABEL: extract_extract01_v2f64_fadd_f64:		; SSE3-FAST-LABEL: extract_extract01_v2f64_fadd_f64:
; SSE3-FAST: # %bb.0:		; SSE3-FAST: # %bb.0:
; SSE3-FAST-NEXT: haddpd %xmm0, %xmm0		; SSE3-FAST-NEXT: haddpd %xmm0, %xmm0
; SSE3-FAST-NEXT: retq		; SSE3-FAST-NEXT: retq
;		;
; AVX-SLOW-LABEL: extract_extract01_v2f64_fadd_f64:		; AVX-SLOW-LABEL: extract_extract01_v2f64_fadd_f64:
Show All 12 Lines	; AVX-FAST-NEXT: retq
ret double %x01		ret double %x01
}		}

define double @extract_extract01_v2f64_fadd_f64_commute(<2 x double> %x) {		define double @extract_extract01_v2f64_fadd_f64_commute(<2 x double> %x) {
; SSE3-SLOW-LABEL: extract_extract01_v2f64_fadd_f64_commute:		; SSE3-SLOW-LABEL: extract_extract01_v2f64_fadd_f64_commute:
; SSE3-SLOW: # %bb.0:		; SSE3-SLOW: # %bb.0:
; SSE3-SLOW-NEXT: movapd %xmm0, %xmm1		; SSE3-SLOW-NEXT: movapd %xmm0, %xmm1
; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]		; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE3-SLOW-NEXT: addsd %xmm0, %xmm1		; SSE3-SLOW-NEXT: addsd %xmm1, %xmm0
; SSE3-SLOW-NEXT: movapd %xmm1, %xmm0
; SSE3-SLOW-NEXT: retq		; SSE3-SLOW-NEXT: retq
;		;
; SSE3-FAST-LABEL: extract_extract01_v2f64_fadd_f64_commute:		; SSE3-FAST-LABEL: extract_extract01_v2f64_fadd_f64_commute:
; SSE3-FAST: # %bb.0:		; SSE3-FAST: # %bb.0:
; SSE3-FAST-NEXT: haddpd %xmm0, %xmm0		; SSE3-FAST-NEXT: haddpd %xmm0, %xmm0
; SSE3-FAST-NEXT: retq		; SSE3-FAST-NEXT: retq
;		;
; AVX-SLOW-LABEL: extract_extract01_v2f64_fadd_f64_commute:		; AVX-SLOW-LABEL: extract_extract01_v2f64_fadd_f64_commute:
▲ Show 20 Lines • Show All 229 Lines • ▼ Show 20 Lines	; AVX-FAST-NEXT: retq
%x01 = fadd float %x0, %x1		%x01 = fadd float %x0, %x1
ret float %x01		ret float %x01
}		}

define float @extract_extract67_v8f32_fadd_f32(<8 x float> %x) {		define float @extract_extract67_v8f32_fadd_f32(<8 x float> %x) {
; SSE3-SLOW-LABEL: extract_extract67_v8f32_fadd_f32:		; SSE3-SLOW-LABEL: extract_extract67_v8f32_fadd_f32:
; SSE3-SLOW: # %bb.0:		; SSE3-SLOW: # %bb.0:
; SSE3-SLOW-NEXT: movaps %xmm1, %xmm0		; SSE3-SLOW-NEXT: movaps %xmm1, %xmm0
; SSE3-SLOW-NEXT: movhlps {{.*#+}} xmm1 = xmm1[1,1]		; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1]
; SSE3-SLOW-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,3,3,3]		; SSE3-SLOW-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,3,3,3]
; SSE3-SLOW-NEXT: addss %xmm1, %xmm0		; SSE3-SLOW-NEXT: addss %xmm1, %xmm0
; SSE3-SLOW-NEXT: retq		; SSE3-SLOW-NEXT: retq
;		;
; SSE3-FAST-LABEL: extract_extract67_v8f32_fadd_f32:		; SSE3-FAST-LABEL: extract_extract67_v8f32_fadd_f32:
; SSE3-FAST: # %bb.0:		; SSE3-FAST: # %bb.0:
; SSE3-FAST-NEXT: haddps %xmm1, %xmm1		; SSE3-FAST-NEXT: haddps %xmm1, %xmm1
; SSE3-FAST-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]		; SSE3-FAST-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
; SSE3-FAST-NEXT: retq		; SSE3-FAST-NEXT: retq
▲ Show 20 Lines • Show All 84 Lines • ▼ Show 20 Lines	; AVX-FAST-NEXT: retq
%x01 = fadd float %x1, %x0		%x01 = fadd float %x1, %x0
ret float %x01		ret float %x01
}		}

define float @extract_extract67_v8f32_fadd_f32_commute(<8 x float> %x) {		define float @extract_extract67_v8f32_fadd_f32_commute(<8 x float> %x) {
; SSE3-SLOW-LABEL: extract_extract67_v8f32_fadd_f32_commute:		; SSE3-SLOW-LABEL: extract_extract67_v8f32_fadd_f32_commute:
; SSE3-SLOW: # %bb.0:		; SSE3-SLOW: # %bb.0:
; SSE3-SLOW-NEXT: movaps %xmm1, %xmm0		; SSE3-SLOW-NEXT: movaps %xmm1, %xmm0
; SSE3-SLOW-NEXT: movhlps {{.*#+}} xmm1 = xmm1[1,1]		; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1]
; SSE3-SLOW-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,3,3,3]		; SSE3-SLOW-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,3,3,3]
; SSE3-SLOW-NEXT: addss %xmm1, %xmm0		; SSE3-SLOW-NEXT: addss %xmm1, %xmm0
; SSE3-SLOW-NEXT: retq		; SSE3-SLOW-NEXT: retq
;		;
; SSE3-FAST-LABEL: extract_extract67_v8f32_fadd_f32_commute:		; SSE3-FAST-LABEL: extract_extract67_v8f32_fadd_f32_commute:
; SSE3-FAST: # %bb.0:		; SSE3-FAST: # %bb.0:
; SSE3-FAST-NEXT: haddps %xmm1, %xmm1		; SSE3-FAST-NEXT: haddps %xmm1, %xmm1
; SSE3-FAST-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]		; SSE3-FAST-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
; SSE3-FAST-NEXT: retq		; SSE3-FAST-NEXT: retq
Show All 20 Lines	; AVX-FAST-NEXT: retq
ret float %x01		ret float %x01
}		}

define double @extract_extract01_v4f64_fadd_f64(<4 x double> %x) {		define double @extract_extract01_v4f64_fadd_f64(<4 x double> %x) {
; SSE3-SLOW-LABEL: extract_extract01_v4f64_fadd_f64:		; SSE3-SLOW-LABEL: extract_extract01_v4f64_fadd_f64:
; SSE3-SLOW: # %bb.0:		; SSE3-SLOW: # %bb.0:
; SSE3-SLOW-NEXT: movapd %xmm0, %xmm1		; SSE3-SLOW-NEXT: movapd %xmm0, %xmm1
; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]		; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE3-SLOW-NEXT: addsd %xmm0, %xmm1		; SSE3-SLOW-NEXT: addsd %xmm1, %xmm0
; SSE3-SLOW-NEXT: movapd %xmm1, %xmm0
; SSE3-SLOW-NEXT: retq		; SSE3-SLOW-NEXT: retq
;		;
; SSE3-FAST-LABEL: extract_extract01_v4f64_fadd_f64:		; SSE3-FAST-LABEL: extract_extract01_v4f64_fadd_f64:
; SSE3-FAST: # %bb.0:		; SSE3-FAST: # %bb.0:
; SSE3-FAST-NEXT: haddpd %xmm0, %xmm0		; SSE3-FAST-NEXT: haddpd %xmm0, %xmm0
; SSE3-FAST-NEXT: retq		; SSE3-FAST-NEXT: retq
;		;
; AVX-SLOW-LABEL: extract_extract01_v4f64_fadd_f64:		; AVX-SLOW-LABEL: extract_extract01_v4f64_fadd_f64:
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; AVX-FAST-NEXT: retq
ret double %x01		ret double %x01
}		}

define double @extract_extract01_v4f64_fadd_f64_commute(<4 x double> %x) {		define double @extract_extract01_v4f64_fadd_f64_commute(<4 x double> %x) {
; SSE3-SLOW-LABEL: extract_extract01_v4f64_fadd_f64_commute:		; SSE3-SLOW-LABEL: extract_extract01_v4f64_fadd_f64_commute:
; SSE3-SLOW: # %bb.0:		; SSE3-SLOW: # %bb.0:
; SSE3-SLOW-NEXT: movapd %xmm0, %xmm1		; SSE3-SLOW-NEXT: movapd %xmm0, %xmm1
; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]		; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE3-SLOW-NEXT: addsd %xmm0, %xmm1		; SSE3-SLOW-NEXT: addsd %xmm1, %xmm0
; SSE3-SLOW-NEXT: movapd %xmm1, %xmm0
; SSE3-SLOW-NEXT: retq		; SSE3-SLOW-NEXT: retq
;		;
; SSE3-FAST-LABEL: extract_extract01_v4f64_fadd_f64_commute:		; SSE3-FAST-LABEL: extract_extract01_v4f64_fadd_f64_commute:
; SSE3-FAST: # %bb.0:		; SSE3-FAST: # %bb.0:
; SSE3-FAST-NEXT: haddpd %xmm0, %xmm0		; SSE3-FAST-NEXT: haddpd %xmm0, %xmm0
; SSE3-FAST-NEXT: retq		; SSE3-FAST-NEXT: retq
;		;
; AVX-SLOW-LABEL: extract_extract01_v4f64_fadd_f64_commute:		; AVX-SLOW-LABEL: extract_extract01_v4f64_fadd_f64_commute:
▲ Show 20 Lines • Show All 286 Lines • ▼ Show 20 Lines	; AVX-FAST-NEXT: retq
ret float %x01		ret float %x01
}		}

define double @extract_extract01_v8f64_fadd_f64(<8 x double> %x) {		define double @extract_extract01_v8f64_fadd_f64(<8 x double> %x) {
; SSE3-SLOW-LABEL: extract_extract01_v8f64_fadd_f64:		; SSE3-SLOW-LABEL: extract_extract01_v8f64_fadd_f64:
; SSE3-SLOW: # %bb.0:		; SSE3-SLOW: # %bb.0:
; SSE3-SLOW-NEXT: movapd %xmm0, %xmm1		; SSE3-SLOW-NEXT: movapd %xmm0, %xmm1
; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]		; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE3-SLOW-NEXT: addsd %xmm0, %xmm1		; SSE3-SLOW-NEXT: addsd %xmm1, %xmm0
; SSE3-SLOW-NEXT: movapd %xmm1, %xmm0
; SSE3-SLOW-NEXT: retq		; SSE3-SLOW-NEXT: retq
;		;
; SSE3-FAST-LABEL: extract_extract01_v8f64_fadd_f64:		; SSE3-FAST-LABEL: extract_extract01_v8f64_fadd_f64:
; SSE3-FAST: # %bb.0:		; SSE3-FAST: # %bb.0:
; SSE3-FAST-NEXT: haddpd %xmm0, %xmm0		; SSE3-FAST-NEXT: haddpd %xmm0, %xmm0
; SSE3-FAST-NEXT: retq		; SSE3-FAST-NEXT: retq
;		;
; AVX-SLOW-LABEL: extract_extract01_v8f64_fadd_f64:		; AVX-SLOW-LABEL: extract_extract01_v8f64_fadd_f64:
Show All 14 Lines	; AVX-FAST-NEXT: retq
ret double %x01		ret double %x01
}		}

define double @extract_extract01_v8f64_fadd_f64_commute(<8 x double> %x) {		define double @extract_extract01_v8f64_fadd_f64_commute(<8 x double> %x) {
; SSE3-SLOW-LABEL: extract_extract01_v8f64_fadd_f64_commute:		; SSE3-SLOW-LABEL: extract_extract01_v8f64_fadd_f64_commute:
; SSE3-SLOW: # %bb.0:		; SSE3-SLOW: # %bb.0:
; SSE3-SLOW-NEXT: movapd %xmm0, %xmm1		; SSE3-SLOW-NEXT: movapd %xmm0, %xmm1
; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]		; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE3-SLOW-NEXT: addsd %xmm0, %xmm1		; SSE3-SLOW-NEXT: addsd %xmm1, %xmm0
; SSE3-SLOW-NEXT: movapd %xmm1, %xmm0
; SSE3-SLOW-NEXT: retq		; SSE3-SLOW-NEXT: retq
;		;
; SSE3-FAST-LABEL: extract_extract01_v8f64_fadd_f64_commute:		; SSE3-FAST-LABEL: extract_extract01_v8f64_fadd_f64_commute:
; SSE3-FAST: # %bb.0:		; SSE3-FAST: # %bb.0:
; SSE3-FAST-NEXT: haddpd %xmm0, %xmm0		; SSE3-FAST-NEXT: haddpd %xmm0, %xmm0
; SSE3-FAST-NEXT: retq		; SSE3-FAST-NEXT: retq
;		;
; AVX-SLOW-LABEL: extract_extract01_v8f64_fadd_f64_commute:		; AVX-SLOW-LABEL: extract_extract01_v8f64_fadd_f64_commute:
▲ Show 20 Lines • Show All 365 Lines • ▼ Show 20 Lines

define float @hadd32_4(<4 x float> %x225) {		define float @hadd32_4(<4 x float> %x225) {
; SSE3-SLOW-LABEL: hadd32_4:		; SSE3-SLOW-LABEL: hadd32_4:
; SSE3-SLOW: # %bb.0:		; SSE3-SLOW: # %bb.0:
; SSE3-SLOW-NEXT: movaps %xmm0, %xmm1		; SSE3-SLOW-NEXT: movaps %xmm0, %xmm1
; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]		; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE3-SLOW-NEXT: addps %xmm0, %xmm1		; SSE3-SLOW-NEXT: addps %xmm0, %xmm1
; SSE3-SLOW-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]		; SSE3-SLOW-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
; SSE3-SLOW-NEXT: addss %xmm0, %xmm1		; SSE3-SLOW-NEXT: addss %xmm1, %xmm0
; SSE3-SLOW-NEXT: movaps %xmm1, %xmm0
; SSE3-SLOW-NEXT: retq		; SSE3-SLOW-NEXT: retq
;		;
; SSE3-FAST-LABEL: hadd32_4:		; SSE3-FAST-LABEL: hadd32_4:
; SSE3-FAST: # %bb.0:		; SSE3-FAST: # %bb.0:
; SSE3-FAST-NEXT: movaps %xmm0, %xmm1		; SSE3-FAST-NEXT: movaps %xmm0, %xmm1
; SSE3-FAST-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]		; SSE3-FAST-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE3-FAST-NEXT: addps %xmm0, %xmm1		; SSE3-FAST-NEXT: addps %xmm0, %xmm1
; SSE3-FAST-NEXT: haddps %xmm1, %xmm1		; SSE3-FAST-NEXT: haddps %xmm1, %xmm1
Show All 24 Lines

define float @hadd32_8(<8 x float> %x225) {		define float @hadd32_8(<8 x float> %x225) {
; SSE3-SLOW-LABEL: hadd32_8:		; SSE3-SLOW-LABEL: hadd32_8:
; SSE3-SLOW: # %bb.0:		; SSE3-SLOW: # %bb.0:
; SSE3-SLOW-NEXT: movaps %xmm0, %xmm1		; SSE3-SLOW-NEXT: movaps %xmm0, %xmm1
; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]		; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE3-SLOW-NEXT: addps %xmm0, %xmm1		; SSE3-SLOW-NEXT: addps %xmm0, %xmm1
; SSE3-SLOW-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]		; SSE3-SLOW-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
; SSE3-SLOW-NEXT: addss %xmm0, %xmm1		; SSE3-SLOW-NEXT: addss %xmm1, %xmm0
; SSE3-SLOW-NEXT: movaps %xmm1, %xmm0
; SSE3-SLOW-NEXT: retq		; SSE3-SLOW-NEXT: retq
;		;
; SSE3-FAST-LABEL: hadd32_8:		; SSE3-FAST-LABEL: hadd32_8:
; SSE3-FAST: # %bb.0:		; SSE3-FAST: # %bb.0:
; SSE3-FAST-NEXT: movaps %xmm0, %xmm1		; SSE3-FAST-NEXT: movaps %xmm0, %xmm1
; SSE3-FAST-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]		; SSE3-FAST-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE3-FAST-NEXT: addps %xmm0, %xmm1		; SSE3-FAST-NEXT: addps %xmm0, %xmm1
; SSE3-FAST-NEXT: haddps %xmm1, %xmm1		; SSE3-FAST-NEXT: haddps %xmm1, %xmm1
Show All 26 Lines

define float @hadd32_16(<16 x float> %x225) {		define float @hadd32_16(<16 x float> %x225) {
; SSE3-SLOW-LABEL: hadd32_16:		; SSE3-SLOW-LABEL: hadd32_16:
; SSE3-SLOW: # %bb.0:		; SSE3-SLOW: # %bb.0:
; SSE3-SLOW-NEXT: movaps %xmm0, %xmm1		; SSE3-SLOW-NEXT: movaps %xmm0, %xmm1
; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]		; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE3-SLOW-NEXT: addps %xmm0, %xmm1		; SSE3-SLOW-NEXT: addps %xmm0, %xmm1
; SSE3-SLOW-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]		; SSE3-SLOW-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
; SSE3-SLOW-NEXT: addss %xmm0, %xmm1		; SSE3-SLOW-NEXT: addss %xmm1, %xmm0
; SSE3-SLOW-NEXT: movaps %xmm1, %xmm0
; SSE3-SLOW-NEXT: retq		; SSE3-SLOW-NEXT: retq
;		;
; SSE3-FAST-LABEL: hadd32_16:		; SSE3-FAST-LABEL: hadd32_16:
; SSE3-FAST: # %bb.0:		; SSE3-FAST: # %bb.0:
; SSE3-FAST-NEXT: movaps %xmm0, %xmm1		; SSE3-FAST-NEXT: movaps %xmm0, %xmm1
; SSE3-FAST-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]		; SSE3-FAST-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE3-FAST-NEXT: addps %xmm0, %xmm1		; SSE3-FAST-NEXT: addps %xmm0, %xmm1
; SSE3-FAST-NEXT: haddps %xmm1, %xmm1		; SSE3-FAST-NEXT: haddps %xmm1, %xmm1
▲ Show 20 Lines • Show All 174 Lines • ▼ Show 20 Lines

define float @partial_reduction_fadd_v8f32(<8 x float> %x) {		define float @partial_reduction_fadd_v8f32(<8 x float> %x) {
; SSE3-SLOW-LABEL: partial_reduction_fadd_v8f32:		; SSE3-SLOW-LABEL: partial_reduction_fadd_v8f32:
; SSE3-SLOW: # %bb.0:		; SSE3-SLOW: # %bb.0:
; SSE3-SLOW-NEXT: movaps %xmm0, %xmm1		; SSE3-SLOW-NEXT: movaps %xmm0, %xmm1
; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]		; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE3-SLOW-NEXT: addps %xmm0, %xmm1		; SSE3-SLOW-NEXT: addps %xmm0, %xmm1
; SSE3-SLOW-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]		; SSE3-SLOW-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
; SSE3-SLOW-NEXT: addss %xmm0, %xmm1		; SSE3-SLOW-NEXT: addss %xmm1, %xmm0
; SSE3-SLOW-NEXT: movaps %xmm1, %xmm0
; SSE3-SLOW-NEXT: retq		; SSE3-SLOW-NEXT: retq
;		;
; SSE3-FAST-LABEL: partial_reduction_fadd_v8f32:		; SSE3-FAST-LABEL: partial_reduction_fadd_v8f32:
; SSE3-FAST: # %bb.0:		; SSE3-FAST: # %bb.0:
; SSE3-FAST-NEXT: movaps %xmm0, %xmm1		; SSE3-FAST-NEXT: movaps %xmm0, %xmm1
; SSE3-FAST-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]		; SSE3-FAST-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE3-FAST-NEXT: addps %xmm0, %xmm1		; SSE3-FAST-NEXT: addps %xmm0, %xmm1
; SSE3-FAST-NEXT: haddps %xmm1, %xmm1		; SSE3-FAST-NEXT: haddps %xmm1, %xmm1
Show All 28 Lines

define float @partial_reduction_fadd_v8f32_wrong_flags(<8 x float> %x) {		define float @partial_reduction_fadd_v8f32_wrong_flags(<8 x float> %x) {
; SSE3-SLOW-LABEL: partial_reduction_fadd_v8f32_wrong_flags:		; SSE3-SLOW-LABEL: partial_reduction_fadd_v8f32_wrong_flags:
; SSE3-SLOW: # %bb.0:		; SSE3-SLOW: # %bb.0:
; SSE3-SLOW-NEXT: movaps %xmm0, %xmm1		; SSE3-SLOW-NEXT: movaps %xmm0, %xmm1
; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]		; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE3-SLOW-NEXT: addps %xmm0, %xmm1		; SSE3-SLOW-NEXT: addps %xmm0, %xmm1
; SSE3-SLOW-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]		; SSE3-SLOW-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
; SSE3-SLOW-NEXT: addss %xmm0, %xmm1		; SSE3-SLOW-NEXT: addss %xmm1, %xmm0
; SSE3-SLOW-NEXT: movaps %xmm1, %xmm0
; SSE3-SLOW-NEXT: retq		; SSE3-SLOW-NEXT: retq
;		;
; SSE3-FAST-LABEL: partial_reduction_fadd_v8f32_wrong_flags:		; SSE3-FAST-LABEL: partial_reduction_fadd_v8f32_wrong_flags:
; SSE3-FAST: # %bb.0:		; SSE3-FAST: # %bb.0:
; SSE3-FAST-NEXT: movaps %xmm0, %xmm1		; SSE3-FAST-NEXT: movaps %xmm0, %xmm1
; SSE3-FAST-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]		; SSE3-FAST-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE3-FAST-NEXT: addps %xmm0, %xmm1		; SSE3-FAST-NEXT: addps %xmm0, %xmm1
; SSE3-FAST-NEXT: haddps %xmm1, %xmm1		; SSE3-FAST-NEXT: haddps %xmm1, %xmm1
Show All 26 Lines

define float @partial_reduction_fadd_v16f32(<16 x float> %x) {		define float @partial_reduction_fadd_v16f32(<16 x float> %x) {
; SSE3-SLOW-LABEL: partial_reduction_fadd_v16f32:		; SSE3-SLOW-LABEL: partial_reduction_fadd_v16f32:
; SSE3-SLOW: # %bb.0:		; SSE3-SLOW: # %bb.0:
; SSE3-SLOW-NEXT: movaps %xmm0, %xmm1		; SSE3-SLOW-NEXT: movaps %xmm0, %xmm1
; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]		; SSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE3-SLOW-NEXT: addps %xmm0, %xmm1		; SSE3-SLOW-NEXT: addps %xmm0, %xmm1
; SSE3-SLOW-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]		; SSE3-SLOW-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
; SSE3-SLOW-NEXT: addss %xmm0, %xmm1		; SSE3-SLOW-NEXT: addss %xmm1, %xmm0
; SSE3-SLOW-NEXT: movaps %xmm1, %xmm0
; SSE3-SLOW-NEXT: retq		; SSE3-SLOW-NEXT: retq
;		;
; SSE3-FAST-LABEL: partial_reduction_fadd_v16f32:		; SSE3-FAST-LABEL: partial_reduction_fadd_v16f32:
; SSE3-FAST: # %bb.0:		; SSE3-FAST: # %bb.0:
; SSE3-FAST-NEXT: movaps %xmm0, %xmm1		; SSE3-FAST-NEXT: movaps %xmm0, %xmm1
; SSE3-FAST-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]		; SSE3-FAST-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE3-FAST-NEXT: addps %xmm0, %xmm1		; SSE3-FAST-NEXT: addps %xmm0, %xmm1
; SSE3-FAST-NEXT: haddps %xmm1, %xmm1		; SSE3-FAST-NEXT: haddps %xmm1, %xmm1
▲ Show 20 Lines • Show All 42 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/horizontal-reduce-fadd.ll

	Show All 19 Lines
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSSE3-SLOW-LABEL: PR37890_v4f32:			; SSSE3-SLOW-LABEL: PR37890_v4f32:
	; SSSE3-SLOW: # %bb.0:			; SSSE3-SLOW: # %bb.0:
	; SSSE3-SLOW-NEXT: movaps %xmm0, %xmm1			; SSSE3-SLOW-NEXT: movaps %xmm0, %xmm1
	; SSSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSSE3-SLOW-NEXT: addps %xmm0, %xmm1			; SSSE3-SLOW-NEXT: addps %xmm0, %xmm1
	; SSSE3-SLOW-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSSE3-SLOW-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSSE3-SLOW-NEXT: addss %xmm0, %xmm1			; SSSE3-SLOW-NEXT: addss %xmm1, %xmm0
	; SSSE3-SLOW-NEXT: movaps %xmm1, %xmm0
	; SSSE3-SLOW-NEXT: retq			; SSSE3-SLOW-NEXT: retq
	;			;
	; SSSE3-FAST-LABEL: PR37890_v4f32:			; SSSE3-FAST-LABEL: PR37890_v4f32:
	; SSSE3-FAST: # %bb.0:			; SSSE3-FAST: # %bb.0:
	; SSSE3-FAST-NEXT: haddps %xmm0, %xmm0			; SSSE3-FAST-NEXT: haddps %xmm0, %xmm0
	; SSSE3-FAST-NEXT: haddps %xmm0, %xmm0			; SSSE3-FAST-NEXT: haddps %xmm0, %xmm0
	; SSSE3-FAST-NEXT: retq			; SSSE3-FAST-NEXT: retq
	;			;
	Show All 28 Lines
	}			}

	define double @PR37890_v4f64(<4 x double> %a) {			define double @PR37890_v4f64(<4 x double> %a) {
	; SSE2-LABEL: PR37890_v4f64:			; SSE2-LABEL: PR37890_v4f64:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: addpd %xmm1, %xmm0			; SSE2-NEXT: addpd %xmm1, %xmm0
	; SSE2-NEXT: movapd %xmm0, %xmm1			; SSE2-NEXT: movapd %xmm0, %xmm1
	; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE2-NEXT: addsd %xmm0, %xmm1			; SSE2-NEXT: addsd %xmm1, %xmm0
	; SSE2-NEXT: movapd %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSSE3-SLOW-LABEL: PR37890_v4f64:			; SSSE3-SLOW-LABEL: PR37890_v4f64:
	; SSSE3-SLOW: # %bb.0:			; SSSE3-SLOW: # %bb.0:
	; SSSE3-SLOW-NEXT: addpd %xmm1, %xmm0			; SSSE3-SLOW-NEXT: addpd %xmm1, %xmm0
	; SSSE3-SLOW-NEXT: movapd %xmm0, %xmm1			; SSSE3-SLOW-NEXT: movapd %xmm0, %xmm1
	; SSSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSSE3-SLOW-NEXT: addsd %xmm0, %xmm1			; SSSE3-SLOW-NEXT: addsd %xmm1, %xmm0
	; SSSE3-SLOW-NEXT: movapd %xmm1, %xmm0
	; SSSE3-SLOW-NEXT: retq			; SSSE3-SLOW-NEXT: retq
	;			;
	; SSSE3-FAST-LABEL: PR37890_v4f64:			; SSSE3-FAST-LABEL: PR37890_v4f64:
	; SSSE3-FAST: # %bb.0:			; SSSE3-FAST: # %bb.0:
	; SSSE3-FAST-NEXT: addpd %xmm1, %xmm0			; SSSE3-FAST-NEXT: addpd %xmm1, %xmm0
	; SSSE3-FAST-NEXT: haddpd %xmm0, %xmm0			; SSSE3-FAST-NEXT: haddpd %xmm0, %xmm0
	; SSSE3-FAST-NEXT: retq			; SSSE3-FAST-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	;			;
	; SSSE3-SLOW-LABEL: PR37890_v8f32:			; SSSE3-SLOW-LABEL: PR37890_v8f32:
	; SSSE3-SLOW: # %bb.0:			; SSSE3-SLOW: # %bb.0:
	; SSSE3-SLOW-NEXT: addps %xmm1, %xmm0			; SSSE3-SLOW-NEXT: addps %xmm1, %xmm0
	; SSSE3-SLOW-NEXT: movaps %xmm0, %xmm1			; SSSE3-SLOW-NEXT: movaps %xmm0, %xmm1
	; SSSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSSE3-SLOW-NEXT: addps %xmm0, %xmm1			; SSSE3-SLOW-NEXT: addps %xmm0, %xmm1
	; SSSE3-SLOW-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSSE3-SLOW-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSSE3-SLOW-NEXT: addss %xmm0, %xmm1			; SSSE3-SLOW-NEXT: addss %xmm1, %xmm0
	; SSSE3-SLOW-NEXT: movaps %xmm1, %xmm0
	; SSSE3-SLOW-NEXT: retq			; SSSE3-SLOW-NEXT: retq
	;			;
	; SSSE3-FAST-LABEL: PR37890_v8f32:			; SSSE3-FAST-LABEL: PR37890_v8f32:
	; SSSE3-FAST: # %bb.0:			; SSSE3-FAST: # %bb.0:
	; SSSE3-FAST-NEXT: addps %xmm1, %xmm0			; SSSE3-FAST-NEXT: addps %xmm1, %xmm0
	; SSSE3-FAST-NEXT: haddps %xmm0, %xmm0			; SSSE3-FAST-NEXT: haddps %xmm0, %xmm0
	; SSSE3-FAST-NEXT: haddps %xmm0, %xmm0			; SSSE3-FAST-NEXT: haddps %xmm0, %xmm0
	; SSSE3-FAST-NEXT: retq			; SSSE3-FAST-NEXT: retq
	▲ Show 20 Lines • Show All 197 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/horizontal-sum.ll

	Show First 20 Lines • Show All 974 Lines • ▼ Show 20 Lines
	; SSSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm3[1]			; SSSE3-SLOW-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm3[1]
	; SSSE3-SLOW-NEXT: addps %xmm3, %xmm2			; SSSE3-SLOW-NEXT: addps %xmm3, %xmm2
	; SSSE3-SLOW-NEXT: movaps %xmm2, %xmm3			; SSSE3-SLOW-NEXT: movaps %xmm2, %xmm3
	; SSSE3-SLOW-NEXT: movlhps {{.*#+}} xmm3 = xmm3[0],xmm1[0]			; SSSE3-SLOW-NEXT: movlhps {{.*#+}} xmm3 = xmm3[0],xmm1[0]
	; SSSE3-SLOW-NEXT: unpcklps {{.*#+}} xmm4 = xmm4[0],xmm5[0],xmm4[1],xmm5[1]			; SSSE3-SLOW-NEXT: unpcklps {{.*#+}} xmm4 = xmm4[0],xmm5[0],xmm4[1],xmm5[1]
	; SSSE3-SLOW-NEXT: shufps {{.*#+}} xmm4 = xmm4[0,1],xmm3[2,0]			; SSSE3-SLOW-NEXT: shufps {{.*#+}} xmm4 = xmm4[0,1],xmm3[2,0]
	; SSSE3-SLOW-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1],xmm1[1,1]			; SSSE3-SLOW-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1],xmm1[1,1]
	; SSSE3-SLOW-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,1],xmm2[2,0]			; SSSE3-SLOW-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,1],xmm2[2,0]
	; SSSE3-SLOW-NEXT: addps %xmm0, %xmm4			; SSSE3-SLOW-NEXT: addps %xmm4, %xmm0
	; SSSE3-SLOW-NEXT: movaps %xmm4, %xmm0
	; SSSE3-SLOW-NEXT: retq			; SSSE3-SLOW-NEXT: retq
	;			;
	; SSSE3-FAST-LABEL: reduction_sum_v4f32_v4f32_reassoc:			; SSSE3-FAST-LABEL: reduction_sum_v4f32_v4f32_reassoc:
	; SSSE3-FAST: # %bb.0:			; SSSE3-FAST: # %bb.0:
	; SSSE3-FAST-NEXT: movaps %xmm0, %xmm4			; SSSE3-FAST-NEXT: movaps %xmm0, %xmm4
	; SSSE3-FAST-NEXT: unpckhpd {{.*#+}} xmm4 = xmm4[1],xmm0[1]			; SSSE3-FAST-NEXT: unpckhpd {{.*#+}} xmm4 = xmm4[1],xmm0[1]
	; SSSE3-FAST-NEXT: addps %xmm0, %xmm4			; SSSE3-FAST-NEXT: addps %xmm4, %xmm0
	; SSSE3-FAST-NEXT: movaps %xmm1, %xmm0			; SSSE3-FAST-NEXT: movaps %xmm1, %xmm4
	; SSSE3-FAST-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1]			; SSSE3-FAST-NEXT: unpckhpd {{.*#+}} xmm4 = xmm4[1],xmm1[1]
	; SSSE3-FAST-NEXT: addps %xmm1, %xmm0			; SSSE3-FAST-NEXT: addps %xmm1, %xmm4
	; SSSE3-FAST-NEXT: haddps %xmm0, %xmm4			; SSSE3-FAST-NEXT: haddps %xmm4, %xmm0
	; SSSE3-FAST-NEXT: movaps %xmm2, %xmm0			; SSSE3-FAST-NEXT: movaps %xmm2, %xmm1
	; SSSE3-FAST-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm2[1]			; SSSE3-FAST-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm2[1]
	; SSSE3-FAST-NEXT: addps %xmm2, %xmm0			; SSSE3-FAST-NEXT: addps %xmm2, %xmm1
	; SSSE3-FAST-NEXT: movaps %xmm3, %xmm1			; SSSE3-FAST-NEXT: movaps %xmm3, %xmm2
	; SSSE3-FAST-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm3[1]			; SSSE3-FAST-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm3[1]
	; SSSE3-FAST-NEXT: addps %xmm3, %xmm1			; SSSE3-FAST-NEXT: addps %xmm3, %xmm2
	; SSSE3-FAST-NEXT: haddps %xmm1, %xmm0			; SSSE3-FAST-NEXT: haddps %xmm2, %xmm1
	; SSSE3-FAST-NEXT: shufps {{.*#+}} xmm4 = xmm4[0,2],xmm0[0,2]			; SSSE3-FAST-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,2],xmm1[0,2]
	; SSSE3-FAST-NEXT: movaps %xmm4, %xmm0
	; SSSE3-FAST-NEXT: retq			; SSSE3-FAST-NEXT: retq
	;			;
	; AVX-SLOW-LABEL: reduction_sum_v4f32_v4f32_reassoc:			; AVX-SLOW-LABEL: reduction_sum_v4f32_v4f32_reassoc:
	; AVX-SLOW: # %bb.0:			; AVX-SLOW: # %bb.0:
	; AVX-SLOW-NEXT: vpermilpd {{.*#+}} xmm4 = xmm0[1,0]			; AVX-SLOW-NEXT: vpermilpd {{.*#+}} xmm4 = xmm0[1,0]
	; AVX-SLOW-NEXT: vaddps %xmm4, %xmm0, %xmm0			; AVX-SLOW-NEXT: vaddps %xmm4, %xmm0, %xmm0
	; AVX-SLOW-NEXT: vpermilpd {{.*#+}} xmm4 = xmm1[1,0]			; AVX-SLOW-NEXT: vpermilpd {{.*#+}} xmm4 = xmm1[1,0]
	; AVX-SLOW-NEXT: vaddps %xmm4, %xmm1, %xmm1			; AVX-SLOW-NEXT: vaddps %xmm4, %xmm1, %xmm1
	▲ Show 20 Lines • Show All 148 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/i128-mul.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=i686-unknown-unknown \| FileCheck %s --check-prefix=X86-NOBMI			; RUN: llc < %s -mtriple=i686-unknown-unknown \| FileCheck %s --check-prefix=X86-NOBMI
	; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=+bmi2 \| FileCheck %s --check-prefix=X86-BMI			; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=+bmi2 \| FileCheck %s --check-prefix=X86-BMI
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown \| FileCheck %s --check-prefix=X64-NOBMI			; RUN: llc < %s -mtriple=x86_64-unknown-unknown \| FileCheck %s --check-prefix=X64-NOBMI
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+bmi2 \| FileCheck %s --check-prefix=X64-BMI			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+bmi2 \| FileCheck %s --check-prefix=X64-BMI

	; PR1198			; PR1198

	define i64 @foo(i64 %x, i64 %y) nounwind {			define i64 @foo(i64 %x, i64 %y) nounwind {
	; X86-NOBMI-LABEL: foo:			; X86-NOBMI-LABEL: foo:
	; X86-NOBMI: # %bb.0:			; X86-NOBMI: # %bb.0:
	; X86-NOBMI-NEXT: pushl %ebp			; X86-NOBMI-NEXT: pushl %ebp
	; X86-NOBMI-NEXT: pushl %ebx			; X86-NOBMI-NEXT: pushl %ebx
	; X86-NOBMI-NEXT: pushl %edi			; X86-NOBMI-NEXT: pushl %edi
	; X86-NOBMI-NEXT: pushl %esi			; X86-NOBMI-NEXT: pushl %esi
	; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %esi			; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %edi
	; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %ebp			; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %ebp
	; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %ebx			; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %esi
	; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %ecx			; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X86-NOBMI-NEXT: movl %esi, %eax			; X86-NOBMI-NEXT: movl %edi, %eax
	; X86-NOBMI-NEXT: mull %ebx			; X86-NOBMI-NEXT: mull %esi
	; X86-NOBMI-NEXT: movl %edx, %edi
	; X86-NOBMI-NEXT: movl %ebp, %eax
	; X86-NOBMI-NEXT: mull %ebx
	; X86-NOBMI-NEXT: movl %edx, %ebx			; X86-NOBMI-NEXT: movl %edx, %ebx
				; X86-NOBMI-NEXT: movl %ebp, %eax
				; X86-NOBMI-NEXT: mull %esi
				; X86-NOBMI-NEXT: movl %edx, %esi
	; X86-NOBMI-NEXT: movl %eax, %ebp			; X86-NOBMI-NEXT: movl %eax, %ebp
	; X86-NOBMI-NEXT: addl %edi, %ebp			; X86-NOBMI-NEXT: addl %ebx, %ebp
	; X86-NOBMI-NEXT: adcl $0, %ebx			; X86-NOBMI-NEXT: adcl $0, %esi
	; X86-NOBMI-NEXT: movl %esi, %eax			; X86-NOBMI-NEXT: movl %edi, %eax
	; X86-NOBMI-NEXT: mull %ecx			; X86-NOBMI-NEXT: mull %ecx
	; X86-NOBMI-NEXT: movl %edx, %esi
	; X86-NOBMI-NEXT: addl %ebp, %eax			; X86-NOBMI-NEXT: addl %ebp, %eax
	; X86-NOBMI-NEXT: adcl %ebx, %esi			; X86-NOBMI-NEXT: adcl %edx, %esi
	; X86-NOBMI-NEXT: setb %al			; X86-NOBMI-NEXT: setb %al
	; X86-NOBMI-NEXT: movzbl %al, %edi			; X86-NOBMI-NEXT: movzbl %al, %edi
	; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NOBMI-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NOBMI-NEXT: mull %ecx			; X86-NOBMI-NEXT: mull %ecx
	; X86-NOBMI-NEXT: addl %esi, %eax			; X86-NOBMI-NEXT: addl %esi, %eax
	; X86-NOBMI-NEXT: adcl %edi, %edx			; X86-NOBMI-NEXT: adcl %edi, %edx
	; X86-NOBMI-NEXT: popl %esi			; X86-NOBMI-NEXT: popl %esi
	; X86-NOBMI-NEXT: popl %edi			; X86-NOBMI-NEXT: popl %edi
	▲ Show 20 Lines • Show All 292 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/iabs.ll

	Show First 20 Lines • Show All 146 Lines • ▼ Show 20 Lines
	; X86-NEXT: movl %ecx, 12(%eax)			; X86-NEXT: movl %ecx, 12(%eax)
	; X86-NEXT: popl %esi			; X86-NEXT: popl %esi
	; X86-NEXT: popl %edi			; X86-NEXT: popl %edi
	; X86-NEXT: popl %ebx			; X86-NEXT: popl %ebx
	; X86-NEXT: retl $4			; X86-NEXT: retl $4
	;			;
	; X64-LABEL: test_i128:			; X64-LABEL: test_i128:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: movq %rsi, %rdx
	; X64-NEXT: movq %rdi, %rax			; X64-NEXT: movq %rdi, %rax
	; X64-NEXT: movq %rsi, %rcx			; X64-NEXT: movq %rsi, %rdx
	; X64-NEXT: sarq $63, %rcx			; X64-NEXT: sarq $63, %rdx
	; X64-NEXT: addq %rcx, %rax			; X64-NEXT: addq %rdx, %rax
	; X64-NEXT: adcq %rcx, %rdx			; X64-NEXT: adcq %rdx, %rsi
	; X64-NEXT: xorq %rcx, %rax			; X64-NEXT: xorq %rdx, %rax
	; X64-NEXT: xorq %rcx, %rdx			; X64-NEXT: xorq %rsi, %rdx
	; X64-NEXT: retq			; X64-NEXT: retq
	%tmp1neg = sub i128 0, %a			%tmp1neg = sub i128 0, %a
	%b = icmp sgt i128 %a, -1			%b = icmp sgt i128 %a, -1
	%abs = select i1 %b, i128 %a, i128 %tmp1neg			%abs = select i1 %b, i128 %a, i128 %tmp1neg
	ret i128 %abs			ret i128 %abs
	}			}

llvm/test/CodeGen/X86/imul.ll

Show First 20 Lines • Show All 211 Lines • ▼ Show 20 Lines
; X86-NEXT: retl		; X86-NEXT: retl
%mul = mul i32 %A, 40		%mul = mul i32 %A, 40
ret i32 %mul		ret i32 %mul
}		}

define i32 @mul33_32(i32 %A) {		define i32 @mul33_32(i32 %A) {
; X64-LABEL: mul33_32:		; X64-LABEL: mul33_32:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: # kill: def $edi killed $edi def $rdi
; X64-NEXT: movl %edi, %eax		; X64-NEXT: movl %edi, %eax
; X64-NEXT: shll $5, %eax		; X64-NEXT: shll $5, %eax
; X64-NEXT: addl %edi, %eax		; X64-NEXT: addl %edi, %eax
; X64-NEXT: retq		; X64-NEXT: retq
;		;
; X86-LABEL: mul33_32:		; X86-LABEL: mul33_32:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx		; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx
▲ Show 20 Lines • Show All 112 Lines • ▼ Show 20 Lines	entry:
%tmp3 = mul i32 %a, -31		%tmp3 = mul i32 %a, -31
ret i32 %tmp3		ret i32 %tmp3
}		}


define i32 @test2(i32 %a) {		define i32 @test2(i32 %a) {
; X64-LABEL: test2:		; X64-LABEL: test2:
; X64: # %bb.0: # %entry		; X64: # %bb.0: # %entry
; X64-NEXT: # kill: def $edi killed $edi def $rdi
; X64-NEXT: movl %edi, %eax		; X64-NEXT: movl %edi, %eax
; X64-NEXT: shll $5, %eax		; X64-NEXT: shll $5, %eax
; X64-NEXT: addl %edi, %eax		; X64-NEXT: addl %edi, %eax
; X64-NEXT: retq		; X64-NEXT: retq
;		;
; X86-LABEL: test2:		; X86-LABEL: test2:
; X86: # %bb.0: # %entry		; X86: # %bb.0: # %entry
; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx		; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx
; X86-NEXT: movl %ecx, %eax		; X86-NEXT: movl %ecx, %eax
; X86-NEXT: shll $5, %eax		; X86-NEXT: shll $5, %eax
; X86-NEXT: addl %ecx, %eax		; X86-NEXT: addl %ecx, %eax
; X86-NEXT: retl		; X86-NEXT: retl
entry:		entry:
%tmp3 = mul i32 %a, 33		%tmp3 = mul i32 %a, 33
ret i32 %tmp3		ret i32 %tmp3
}		}

define i32 @test3(i32 %a) {		define i32 @test3(i32 %a) {
; X64-LABEL: test3:		; X64-LABEL: test3:
; X64: # %bb.0: # %entry		; X64: # %bb.0: # %entry
; X64-NEXT: # kill: def $edi killed $edi def $rdi
; X64-NEXT: movl %edi, %eax		; X64-NEXT: movl %edi, %eax
; X64-NEXT: shll $5, %eax		; X64-NEXT: shll $5, %eax
; X64-NEXT: addl %edi, %eax		; X64-NEXT: addl %edi, %eax
; X64-NEXT: negl %eax		; X64-NEXT: negl %eax
; X64-NEXT: retq		; X64-NEXT: retq
;		;
; X86-LABEL: test3:		; X86-LABEL: test3:
; X86: # %bb.0: # %entry		; X86: # %bb.0: # %entry
▲ Show 20 Lines • Show All 172 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/midpoint-int-vec-128.ll

Show First 20 Lines • Show All 56 Lines • ▼ Show 20 Lines
; SSE41-NEXT: pcmpgtd %xmm1, %xmm2		; SSE41-NEXT: pcmpgtd %xmm1, %xmm2
; SSE41-NEXT: por {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2		; SSE41-NEXT: por {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
; SSE41-NEXT: movdqa %xmm0, %xmm3		; SSE41-NEXT: movdqa %xmm0, %xmm3
; SSE41-NEXT: pminsd %xmm1, %xmm3		; SSE41-NEXT: pminsd %xmm1, %xmm3
; SSE41-NEXT: pmaxsd %xmm0, %xmm1		; SSE41-NEXT: pmaxsd %xmm0, %xmm1
; SSE41-NEXT: psubd %xmm3, %xmm1		; SSE41-NEXT: psubd %xmm3, %xmm1
; SSE41-NEXT: psrld $1, %xmm1		; SSE41-NEXT: psrld $1, %xmm1
; SSE41-NEXT: pmulld %xmm1, %xmm2		; SSE41-NEXT: pmulld %xmm1, %xmm2
; SSE41-NEXT: paddd %xmm0, %xmm2		; SSE41-NEXT: paddd %xmm2, %xmm0
; SSE41-NEXT: movdqa %xmm2, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX1-FALLBACK-LABEL: vec128_i32_signed_reg_reg:		; AVX1-FALLBACK-LABEL: vec128_i32_signed_reg_reg:
; AVX1-FALLBACK: # %bb.0:		; AVX1-FALLBACK: # %bb.0:
; AVX1-FALLBACK-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm2		; AVX1-FALLBACK-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm2
; AVX1-FALLBACK-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm2		; AVX1-FALLBACK-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm2
; AVX1-FALLBACK-NEXT: vpminsd %xmm1, %xmm0, %xmm3		; AVX1-FALLBACK-NEXT: vpminsd %xmm1, %xmm0, %xmm3
; AVX1-FALLBACK-NEXT: vpmaxsd %xmm1, %xmm0, %xmm1		; AVX1-FALLBACK-NEXT: vpmaxsd %xmm1, %xmm0, %xmm1
▲ Show 20 Lines • Show All 475 Lines • ▼ Show 20 Lines
; SSE2-NEXT: pmuludq %xmm1, %xmm3		; SSE2-NEXT: pmuludq %xmm1, %xmm3
; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm3[0,2,2,3]		; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm3[0,2,2,3]
; SSE2-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1]		; SSE2-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1]
; SSE2-NEXT: paddd %xmm2, %xmm0		; SSE2-NEXT: paddd %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: vec128_i32_signed_reg_mem:		; SSE41-LABEL: vec128_i32_signed_reg_mem:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movdqa (%rdi), %xmm2		; SSE41-NEXT: movdqa (%rdi), %xmm1
; SSE41-NEXT: movdqa %xmm0, %xmm1		; SSE41-NEXT: movdqa %xmm0, %xmm2
; SSE41-NEXT: pcmpgtd %xmm2, %xmm1		; SSE41-NEXT: pcmpgtd %xmm1, %xmm2
; SSE41-NEXT: por {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE41-NEXT: por {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
; SSE41-NEXT: movdqa %xmm0, %xmm3		; SSE41-NEXT: movdqa %xmm0, %xmm3
; SSE41-NEXT: pminsd %xmm2, %xmm3		; SSE41-NEXT: pminsd %xmm1, %xmm3
; SSE41-NEXT: pmaxsd %xmm0, %xmm2		; SSE41-NEXT: pmaxsd %xmm0, %xmm1
; SSE41-NEXT: psubd %xmm3, %xmm2		; SSE41-NEXT: psubd %xmm3, %xmm1
; SSE41-NEXT: psrld $1, %xmm2		; SSE41-NEXT: psrld $1, %xmm1
; SSE41-NEXT: pmulld %xmm2, %xmm1		; SSE41-NEXT: pmulld %xmm2, %xmm1
; SSE41-NEXT: paddd %xmm0, %xmm1		; SSE41-NEXT: paddd %xmm1, %xmm0
; SSE41-NEXT: movdqa %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX1-FALLBACK-LABEL: vec128_i32_signed_reg_mem:		; AVX1-FALLBACK-LABEL: vec128_i32_signed_reg_mem:
; AVX1-FALLBACK: # %bb.0:		; AVX1-FALLBACK: # %bb.0:
; AVX1-FALLBACK-NEXT: vmovdqa (%rdi), %xmm1		; AVX1-FALLBACK-NEXT: vmovdqa (%rdi), %xmm1
; AVX1-FALLBACK-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm2		; AVX1-FALLBACK-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm2
; AVX1-FALLBACK-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm2		; AVX1-FALLBACK-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm2
; AVX1-FALLBACK-NEXT: vpminsd %xmm1, %xmm0, %xmm3		; AVX1-FALLBACK-NEXT: vpminsd %xmm1, %xmm0, %xmm3
▲ Show 20 Lines • Show All 326 Lines • ▼ Show 20 Lines
; SSE2-NEXT: pand %xmm5, %xmm4		; SSE2-NEXT: pand %xmm5, %xmm4
; SSE2-NEXT: pandn %xmm1, %xmm5		; SSE2-NEXT: pandn %xmm1, %xmm5
; SSE2-NEXT: por %xmm4, %xmm5		; SSE2-NEXT: por %xmm4, %xmm5
; SSE2-NEXT: movdqa %xmm0, %xmm4		; SSE2-NEXT: movdqa %xmm0, %xmm4
; SSE2-NEXT: pand %xmm3, %xmm4		; SSE2-NEXT: pand %xmm3, %xmm4
; SSE2-NEXT: pandn %xmm1, %xmm3		; SSE2-NEXT: pandn %xmm1, %xmm3
; SSE2-NEXT: por %xmm4, %xmm3		; SSE2-NEXT: por %xmm4, %xmm3
; SSE2-NEXT: psubq %xmm5, %xmm3		; SSE2-NEXT: psubq %xmm5, %xmm3
; SSE2-NEXT: movdqa %xmm3, %xmm4		; SSE2-NEXT: movdqa %xmm3, %xmm1
; SSE2-NEXT: psrlq $1, %xmm4		; SSE2-NEXT: psrlq $1, %xmm1
; SSE2-NEXT: psrlq $33, %xmm3		; SSE2-NEXT: psrlq $33, %xmm3
; SSE2-NEXT: pmuludq %xmm2, %xmm3		; SSE2-NEXT: pmuludq %xmm2, %xmm3
; SSE2-NEXT: movdqa %xmm2, %xmm1		; SSE2-NEXT: movdqa %xmm2, %xmm4
; SSE2-NEXT: psrlq $32, %xmm1		; SSE2-NEXT: psrlq $32, %xmm4
; SSE2-NEXT: pmuludq %xmm4, %xmm1		; SSE2-NEXT: pmuludq %xmm1, %xmm4
; SSE2-NEXT: paddq %xmm3, %xmm1		; SSE2-NEXT: paddq %xmm3, %xmm4
; SSE2-NEXT: psllq $32, %xmm1		; SSE2-NEXT: psllq $32, %xmm4
; SSE2-NEXT: pmuludq %xmm2, %xmm4		; SSE2-NEXT: pmuludq %xmm2, %xmm1
; SSE2-NEXT: paddq %xmm0, %xmm1		; SSE2-NEXT: paddq %xmm4, %xmm0
; SSE2-NEXT: paddq %xmm4, %xmm1		; SSE2-NEXT: paddq %xmm1, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: vec128_i64_signed_reg_reg:		; SSE41-LABEL: vec128_i64_signed_reg_reg:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movdqa %xmm0, %xmm2		; SSE41-NEXT: movdqa %xmm0, %xmm2
; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]		; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]
; SSE41-NEXT: movdqa %xmm1, %xmm5		; SSE41-NEXT: movdqa %xmm1, %xmm5
; SSE41-NEXT: pxor %xmm0, %xmm5		; SSE41-NEXT: pxor %xmm0, %xmm5
Show All 22 Lines
; SSE41-NEXT: psrlq $1, %xmm3		; SSE41-NEXT: psrlq $1, %xmm3
; SSE41-NEXT: psrlq $33, %xmm1		; SSE41-NEXT: psrlq $33, %xmm1
; SSE41-NEXT: pmuludq %xmm4, %xmm1		; SSE41-NEXT: pmuludq %xmm4, %xmm1
; SSE41-NEXT: movdqa %xmm4, %xmm0		; SSE41-NEXT: movdqa %xmm4, %xmm0
; SSE41-NEXT: psrlq $32, %xmm0		; SSE41-NEXT: psrlq $32, %xmm0
; SSE41-NEXT: pmuludq %xmm3, %xmm0		; SSE41-NEXT: pmuludq %xmm3, %xmm0
; SSE41-NEXT: paddq %xmm1, %xmm0		; SSE41-NEXT: paddq %xmm1, %xmm0
; SSE41-NEXT: psllq $32, %xmm0		; SSE41-NEXT: psllq $32, %xmm0
; SSE41-NEXT: pmuludq %xmm3, %xmm4		; SSE41-NEXT: pmuludq %xmm4, %xmm3
; SSE41-NEXT: paddq %xmm2, %xmm0		; SSE41-NEXT: paddq %xmm2, %xmm0
; SSE41-NEXT: paddq %xmm4, %xmm0		; SSE41-NEXT: paddq %xmm3, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX1-FALLBACK-LABEL: vec128_i64_signed_reg_reg:		; AVX1-FALLBACK-LABEL: vec128_i64_signed_reg_reg:
; AVX1-FALLBACK: # %bb.0:		; AVX1-FALLBACK: # %bb.0:
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm2
; AVX1-FALLBACK-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm3		; AVX1-FALLBACK-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm3
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm4		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm4
; AVX1-FALLBACK-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4		; AVX1-FALLBACK-NEXT: vblendvpd %xmm4, %xmm0, %xmm1, %xmm4
▲ Show 20 Lines • Show All 157 Lines • ▼ Show 20 Lines
; SSE2-NEXT: pand %xmm5, %xmm4		; SSE2-NEXT: pand %xmm5, %xmm4
; SSE2-NEXT: pandn %xmm1, %xmm5		; SSE2-NEXT: pandn %xmm1, %xmm5
; SSE2-NEXT: por %xmm4, %xmm5		; SSE2-NEXT: por %xmm4, %xmm5
; SSE2-NEXT: movdqa %xmm0, %xmm4		; SSE2-NEXT: movdqa %xmm0, %xmm4
; SSE2-NEXT: pand %xmm3, %xmm4		; SSE2-NEXT: pand %xmm3, %xmm4
; SSE2-NEXT: pandn %xmm1, %xmm3		; SSE2-NEXT: pandn %xmm1, %xmm3
; SSE2-NEXT: por %xmm4, %xmm3		; SSE2-NEXT: por %xmm4, %xmm3
; SSE2-NEXT: psubq %xmm5, %xmm3		; SSE2-NEXT: psubq %xmm5, %xmm3
; SSE2-NEXT: movdqa %xmm3, %xmm4		; SSE2-NEXT: movdqa %xmm3, %xmm1
; SSE2-NEXT: psrlq $1, %xmm4		; SSE2-NEXT: psrlq $1, %xmm1
; SSE2-NEXT: psrlq $33, %xmm3		; SSE2-NEXT: psrlq $33, %xmm3
; SSE2-NEXT: pmuludq %xmm2, %xmm3		; SSE2-NEXT: pmuludq %xmm2, %xmm3
; SSE2-NEXT: movdqa %xmm2, %xmm1		; SSE2-NEXT: movdqa %xmm2, %xmm4
; SSE2-NEXT: psrlq $32, %xmm1		; SSE2-NEXT: psrlq $32, %xmm4
; SSE2-NEXT: pmuludq %xmm4, %xmm1		; SSE2-NEXT: pmuludq %xmm1, %xmm4
; SSE2-NEXT: paddq %xmm3, %xmm1		; SSE2-NEXT: paddq %xmm3, %xmm4
; SSE2-NEXT: psllq $32, %xmm1		; SSE2-NEXT: psllq $32, %xmm4
; SSE2-NEXT: pmuludq %xmm2, %xmm4		; SSE2-NEXT: pmuludq %xmm2, %xmm1
; SSE2-NEXT: paddq %xmm0, %xmm1		; SSE2-NEXT: paddq %xmm4, %xmm0
; SSE2-NEXT: paddq %xmm4, %xmm1		; SSE2-NEXT: paddq %xmm1, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: vec128_i64_unsigned_reg_reg:		; SSE41-LABEL: vec128_i64_unsigned_reg_reg:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movdqa %xmm0, %xmm2		; SSE41-NEXT: movdqa %xmm0, %xmm2
; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]		; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]
; SSE41-NEXT: movdqa %xmm1, %xmm5		; SSE41-NEXT: movdqa %xmm1, %xmm5
; SSE41-NEXT: pxor %xmm0, %xmm5		; SSE41-NEXT: pxor %xmm0, %xmm5
Show All 22 Lines
; SSE41-NEXT: psrlq $1, %xmm3		; SSE41-NEXT: psrlq $1, %xmm3
; SSE41-NEXT: psrlq $33, %xmm1		; SSE41-NEXT: psrlq $33, %xmm1
; SSE41-NEXT: pmuludq %xmm4, %xmm1		; SSE41-NEXT: pmuludq %xmm4, %xmm1
; SSE41-NEXT: movdqa %xmm4, %xmm0		; SSE41-NEXT: movdqa %xmm4, %xmm0
; SSE41-NEXT: psrlq $32, %xmm0		; SSE41-NEXT: psrlq $32, %xmm0
; SSE41-NEXT: pmuludq %xmm3, %xmm0		; SSE41-NEXT: pmuludq %xmm3, %xmm0
; SSE41-NEXT: paddq %xmm1, %xmm0		; SSE41-NEXT: paddq %xmm1, %xmm0
; SSE41-NEXT: psllq $32, %xmm0		; SSE41-NEXT: psllq $32, %xmm0
; SSE41-NEXT: pmuludq %xmm3, %xmm4		; SSE41-NEXT: pmuludq %xmm4, %xmm3
; SSE41-NEXT: paddq %xmm2, %xmm0		; SSE41-NEXT: paddq %xmm2, %xmm0
; SSE41-NEXT: paddq %xmm4, %xmm0		; SSE41-NEXT: paddq %xmm3, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX1-FALLBACK-LABEL: vec128_i64_unsigned_reg_reg:		; AVX1-FALLBACK-LABEL: vec128_i64_unsigned_reg_reg:
; AVX1-FALLBACK: # %bb.0:		; AVX1-FALLBACK: # %bb.0:
; AVX1-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]		; AVX1-FALLBACK-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
; AVX1-FALLBACK-NEXT: vpxor %xmm2, %xmm1, %xmm3		; AVX1-FALLBACK-NEXT: vpxor %xmm2, %xmm1, %xmm3
; AVX1-FALLBACK-NEXT: vpxor %xmm2, %xmm0, %xmm2		; AVX1-FALLBACK-NEXT: vpxor %xmm2, %xmm0, %xmm2
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm4		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm4
▲ Show 20 Lines • Show All 184 Lines • ▼ Show 20 Lines
; SSE2-NEXT: paddq %xmm1, %xmm0		; SSE2-NEXT: paddq %xmm1, %xmm0
; SSE2-NEXT: paddq %xmm4, %xmm0		; SSE2-NEXT: paddq %xmm4, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: vec128_i64_signed_mem_reg:		; SSE41-LABEL: vec128_i64_signed_mem_reg:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movdqa %xmm0, %xmm1		; SSE41-NEXT: movdqa %xmm0, %xmm1
; SSE41-NEXT: movdqa (%rdi), %xmm3		; SSE41-NEXT: movdqa (%rdi), %xmm3
; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]		; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]
; SSE41-NEXT: pxor %xmm5, %xmm0		; SSE41-NEXT: movdqa %xmm1, %xmm5
; SSE41-NEXT: pxor %xmm3, %xmm5		; SSE41-NEXT: pxor %xmm0, %xmm5
; SSE41-NEXT: movdqa %xmm5, %xmm2		; SSE41-NEXT: pxor %xmm3, %xmm0
; SSE41-NEXT: pcmpgtd %xmm0, %xmm2		; SSE41-NEXT: movdqa %xmm0, %xmm2
		; SSE41-NEXT: pcmpgtd %xmm5, %xmm2
; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]		; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
; SSE41-NEXT: movdqa %xmm5, %xmm6		; SSE41-NEXT: movdqa %xmm0, %xmm6
; SSE41-NEXT: pcmpeqd %xmm0, %xmm6		; SSE41-NEXT: pcmpeqd %xmm5, %xmm6
; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[1,1,3,3]		; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[1,1,3,3]
; SSE41-NEXT: pand %xmm4, %xmm7		; SSE41-NEXT: pand %xmm4, %xmm7
; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]		; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]
; SSE41-NEXT: por %xmm7, %xmm2		; SSE41-NEXT: por %xmm7, %xmm2
; SSE41-NEXT: movdqa {{.*#+}} xmm4 = [1,1]		; SSE41-NEXT: movdqa {{.*#+}} xmm4 = [1,1]
; SSE41-NEXT: por %xmm2, %xmm4		; SSE41-NEXT: por %xmm2, %xmm4
; SSE41-NEXT: pcmpgtd %xmm5, %xmm0		; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
; SSE41-NEXT: pshufd {{.*#+}} xmm5 = xmm0[0,0,2,2]		; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[0,0,2,2]
; SSE41-NEXT: pand %xmm6, %xmm5		; SSE41-NEXT: pand %xmm6, %xmm0
; SSE41-NEXT: por %xmm5, %xmm0		; SSE41-NEXT: por %xmm5, %xmm0
; SSE41-NEXT: movdqa %xmm1, %xmm5		; SSE41-NEXT: movdqa %xmm1, %xmm5
; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm5		; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm5
; SSE41-NEXT: movdqa %xmm2, %xmm0		; SSE41-NEXT: movdqa %xmm2, %xmm0
; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1		; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm1
; SSE41-NEXT: psubq %xmm5, %xmm1		; SSE41-NEXT: psubq %xmm5, %xmm1
; SSE41-NEXT: movdqa %xmm1, %xmm0		; SSE41-NEXT: movdqa %xmm1, %xmm2
; SSE41-NEXT: psrlq $1, %xmm0		; SSE41-NEXT: psrlq $1, %xmm2
; SSE41-NEXT: psrlq $33, %xmm1		; SSE41-NEXT: psrlq $33, %xmm1
; SSE41-NEXT: pmuludq %xmm4, %xmm1		; SSE41-NEXT: pmuludq %xmm4, %xmm1
; SSE41-NEXT: movdqa %xmm4, %xmm2		; SSE41-NEXT: movdqa %xmm4, %xmm0
; SSE41-NEXT: psrlq $32, %xmm2		; SSE41-NEXT: psrlq $32, %xmm0
; SSE41-NEXT: pmuludq %xmm0, %xmm2		; SSE41-NEXT: pmuludq %xmm2, %xmm0
; SSE41-NEXT: paddq %xmm1, %xmm2		; SSE41-NEXT: paddq %xmm1, %xmm0
; SSE41-NEXT: psllq $32, %xmm2		; SSE41-NEXT: psllq $32, %xmm0
; SSE41-NEXT: pmuludq %xmm4, %xmm0		; SSE41-NEXT: pmuludq %xmm4, %xmm2
; SSE41-NEXT: paddq %xmm3, %xmm2		; SSE41-NEXT: paddq %xmm3, %xmm0
; SSE41-NEXT: paddq %xmm2, %xmm0		; SSE41-NEXT: paddq %xmm2, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX1-FALLBACK-LABEL: vec128_i64_signed_mem_reg:		; AVX1-FALLBACK-LABEL: vec128_i64_signed_mem_reg:
; AVX1-FALLBACK: # %bb.0:		; AVX1-FALLBACK: # %bb.0:
; AVX1-FALLBACK-NEXT: vmovdqa (%rdi), %xmm1		; AVX1-FALLBACK-NEXT: vmovdqa (%rdi), %xmm1
; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2		; AVX1-FALLBACK-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm2
; AVX1-FALLBACK-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm3		; AVX1-FALLBACK-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm3
▲ Show 20 Lines • Show All 134 Lines • ▼ Show 20 Lines	; AVX512BW-FALLBACK-NEXT: retq
%t9 = mul nsw <2 x i64> %t8, %t4 ; signed		%t9 = mul nsw <2 x i64> %t8, %t4 ; signed
%a10 = add nsw <2 x i64> %t9, %a1 ; signed		%a10 = add nsw <2 x i64> %t9, %a1 ; signed
ret <2 x i64> %a10		ret <2 x i64> %a10
}		}

define <2 x i64> @vec128_i64_signed_reg_mem(<2 x i64> %a1, <2 x i64>* %a2_addr) nounwind {		define <2 x i64> @vec128_i64_signed_reg_mem(<2 x i64> %a1, <2 x i64>* %a2_addr) nounwind {
; SSE2-LABEL: vec128_i64_signed_reg_mem:		; SSE2-LABEL: vec128_i64_signed_reg_mem:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa (%rdi), %xmm1		; SSE2-NEXT: movdqa (%rdi), %xmm3
; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [2147483648,2147483648]		; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [2147483648,2147483648]
; SSE2-NEXT: movdqa %xmm0, %xmm5		; SSE2-NEXT: movdqa %xmm0, %xmm5
; SSE2-NEXT: pxor %xmm4, %xmm5		; SSE2-NEXT: pxor %xmm4, %xmm5
; SSE2-NEXT: pxor %xmm1, %xmm4		; SSE2-NEXT: pxor %xmm3, %xmm4
		; SSE2-NEXT: movdqa %xmm5, %xmm1
		; SSE2-NEXT: pcmpgtd %xmm4, %xmm1
		; SSE2-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,0,2,2]
; SSE2-NEXT: movdqa %xmm5, %xmm2		; SSE2-NEXT: movdqa %xmm5, %xmm2
; SSE2-NEXT: pcmpgtd %xmm4, %xmm2		; SSE2-NEXT: pcmpeqd %xmm4, %xmm2
; SSE2-NEXT: pshufd {{.*#+}} xmm6 = xmm2[0,0,2,2]		; SSE2-NEXT: pshufd {{.*#+}} xmm7 = xmm2[1,1,3,3]
; SSE2-NEXT: movdqa %xmm5, %xmm3
; SSE2-NEXT: pcmpeqd %xmm4, %xmm3
; SSE2-NEXT: pshufd {{.*#+}} xmm7 = xmm3[1,1,3,3]
; SSE2-NEXT: pand %xmm7, %xmm6		; SSE2-NEXT: pand %xmm7, %xmm6
; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm2[1,1,3,3]		; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm1[1,1,3,3]
; SSE2-NEXT: por %xmm6, %xmm3		; SSE2-NEXT: por %xmm6, %xmm2
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [1,1]		; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [1,1]
; SSE2-NEXT: por %xmm3, %xmm2		; SSE2-NEXT: por %xmm2, %xmm1
; SSE2-NEXT: pcmpgtd %xmm5, %xmm4		; SSE2-NEXT: pcmpgtd %xmm5, %xmm4
; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]		; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
; SSE2-NEXT: pand %xmm7, %xmm5		; SSE2-NEXT: pand %xmm7, %xmm5
; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm4[1,1,3,3]		; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm4[1,1,3,3]
; SSE2-NEXT: por %xmm5, %xmm4		; SSE2-NEXT: por %xmm5, %xmm4
; SSE2-NEXT: movdqa %xmm0, %xmm5		; SSE2-NEXT: movdqa %xmm0, %xmm5
; SSE2-NEXT: pand %xmm4, %xmm5		; SSE2-NEXT: pand %xmm4, %xmm5
; SSE2-NEXT: pandn %xmm1, %xmm4		; SSE2-NEXT: pandn %xmm3, %xmm4
; SSE2-NEXT: por %xmm5, %xmm4		; SSE2-NEXT: por %xmm5, %xmm4
; SSE2-NEXT: movdqa %xmm0, %xmm5		; SSE2-NEXT: movdqa %xmm0, %xmm5
; SSE2-NEXT: pand %xmm3, %xmm5		; SSE2-NEXT: pand %xmm2, %xmm5
; SSE2-NEXT: pandn %xmm1, %xmm3		; SSE2-NEXT: pandn %xmm3, %xmm2
; SSE2-NEXT: por %xmm5, %xmm3		; SSE2-NEXT: por %xmm5, %xmm2
; SSE2-NEXT: psubq %xmm4, %xmm3		; SSE2-NEXT: psubq %xmm4, %xmm2
; SSE2-NEXT: movdqa %xmm3, %xmm4		; SSE2-NEXT: movdqa %xmm2, %xmm3
; SSE2-NEXT: psrlq $1, %xmm4		; SSE2-NEXT: psrlq $1, %xmm3
; SSE2-NEXT: psrlq $33, %xmm3		; SSE2-NEXT: psrlq $33, %xmm2
; SSE2-NEXT: pmuludq %xmm2, %xmm3		; SSE2-NEXT: pmuludq %xmm1, %xmm2
; SSE2-NEXT: movdqa %xmm2, %xmm1		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: psrlq $32, %xmm1		; SSE2-NEXT: psrlq $32, %xmm4
; SSE2-NEXT: pmuludq %xmm4, %xmm1		; SSE2-NEXT: pmuludq %xmm3, %xmm4
; SSE2-NEXT: paddq %xmm3, %xmm1		; SSE2-NEXT: paddq %xmm2, %xmm4
; SSE2-NEXT: psllq $32, %xmm1		; SSE2-NEXT: psllq $32, %xmm4
; SSE2-NEXT: pmuludq %xmm2, %xmm4		; SSE2-NEXT: pmuludq %xmm1, %xmm3
; SSE2-NEXT: paddq %xmm0, %xmm1		; SSE2-NEXT: paddq %xmm4, %xmm0
; SSE2-NEXT: paddq %xmm4, %xmm1		; SSE2-NEXT: paddq %xmm3, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: vec128_i64_signed_reg_mem:		; SSE41-LABEL: vec128_i64_signed_reg_mem:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movdqa %xmm0, %xmm1		; SSE41-NEXT: movdqa %xmm0, %xmm1
; SSE41-NEXT: movdqa (%rdi), %xmm3		; SSE41-NEXT: movdqa (%rdi), %xmm3
; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]		; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]
; SSE41-NEXT: movdqa %xmm0, %xmm6		; SSE41-NEXT: pxor %xmm5, %xmm0
; SSE41-NEXT: pxor %xmm5, %xmm6
; SSE41-NEXT: pxor %xmm3, %xmm5		; SSE41-NEXT: pxor %xmm3, %xmm5
; SSE41-NEXT: movdqa %xmm6, %xmm2		; SSE41-NEXT: movdqa %xmm0, %xmm2
; SSE41-NEXT: pcmpgtd %xmm5, %xmm2		; SSE41-NEXT: pcmpgtd %xmm5, %xmm2
; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]		; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm2[0,0,2,2]
; SSE41-NEXT: movdqa %xmm6, %xmm0		; SSE41-NEXT: movdqa %xmm0, %xmm6
; SSE41-NEXT: pcmpeqd %xmm5, %xmm0		; SSE41-NEXT: pcmpeqd %xmm5, %xmm6
; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm0[1,1,3,3]		; SSE41-NEXT: pshufd {{.*#+}} xmm7 = xmm6[1,1,3,3]
; SSE41-NEXT: pand %xmm4, %xmm7		; SSE41-NEXT: pand %xmm4, %xmm7
; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]		; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]
; SSE41-NEXT: por %xmm7, %xmm2		; SSE41-NEXT: por %xmm7, %xmm2
; SSE41-NEXT: movdqa {{.*#+}} xmm4 = [1,1]		; SSE41-NEXT: movdqa {{.*#+}} xmm4 = [1,1]
; SSE41-NEXT: por %xmm2, %xmm4		; SSE41-NEXT: por %xmm2, %xmm4
; SSE41-NEXT: pcmpgtd %xmm6, %xmm5		; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm5[0,0,2,2]		; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[0,0,2,2]
; SSE41-NEXT: pand %xmm6, %xmm0		; SSE41-NEXT: pand %xmm6, %xmm0
; SSE41-NEXT: por %xmm5, %xmm0		; SSE41-NEXT: por %xmm5, %xmm0
; SSE41-NEXT: movdqa %xmm3, %xmm5		; SSE41-NEXT: movdqa %xmm3, %xmm5
; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5		; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm5
; SSE41-NEXT: movdqa %xmm2, %xmm0		; SSE41-NEXT: movdqa %xmm2, %xmm0
; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3		; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm3
; SSE41-NEXT: psubq %xmm5, %xmm3		; SSE41-NEXT: psubq %xmm5, %xmm3
; SSE41-NEXT: movdqa %xmm3, %xmm2		; SSE41-NEXT: movdqa %xmm3, %xmm2
▲ Show 20 Lines • Show All 406 Lines • ▼ Show 20 Lines
; SSE-NEXT: pcmpgtw %xmm1, %xmm2		; SSE-NEXT: pcmpgtw %xmm1, %xmm2
; SSE-NEXT: por {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2		; SSE-NEXT: por {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
; SSE-NEXT: movdqa %xmm0, %xmm3		; SSE-NEXT: movdqa %xmm0, %xmm3
; SSE-NEXT: pminsw %xmm1, %xmm3		; SSE-NEXT: pminsw %xmm1, %xmm3
; SSE-NEXT: pmaxsw %xmm0, %xmm1		; SSE-NEXT: pmaxsw %xmm0, %xmm1
; SSE-NEXT: psubw %xmm3, %xmm1		; SSE-NEXT: psubw %xmm3, %xmm1
; SSE-NEXT: psrlw $1, %xmm1		; SSE-NEXT: psrlw $1, %xmm1
; SSE-NEXT: pmullw %xmm1, %xmm2		; SSE-NEXT: pmullw %xmm1, %xmm2
; SSE-NEXT: paddw %xmm0, %xmm2		; SSE-NEXT: paddw %xmm2, %xmm0
; SSE-NEXT: movdqa %xmm2, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-FALLBACK-LABEL: vec128_i16_signed_reg_reg:		; AVX1-FALLBACK-LABEL: vec128_i16_signed_reg_reg:
; AVX1-FALLBACK: # %bb.0:		; AVX1-FALLBACK: # %bb.0:
; AVX1-FALLBACK-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm2		; AVX1-FALLBACK-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm2
; AVX1-FALLBACK-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm2		; AVX1-FALLBACK-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm2
; AVX1-FALLBACK-NEXT: vpminsw %xmm1, %xmm0, %xmm3		; AVX1-FALLBACK-NEXT: vpminsw %xmm1, %xmm0, %xmm3
; AVX1-FALLBACK-NEXT: vpmaxsw %xmm1, %xmm0, %xmm1		; AVX1-FALLBACK-NEXT: vpmaxsw %xmm1, %xmm0, %xmm1
▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines	; AVX512VLBW-NEXT: retq
%t9 = mul nsw <8 x i16> %t8, %t4 ; signed		%t9 = mul nsw <8 x i16> %t8, %t4 ; signed
%a10 = add nsw <8 x i16> %t9, %a1 ; signed		%a10 = add nsw <8 x i16> %t9, %a1 ; signed
ret <8 x i16> %a10		ret <8 x i16> %a10
}		}

define <8 x i16> @vec128_i16_unsigned_reg_reg(<8 x i16> %a1, <8 x i16> %a2) nounwind {		define <8 x i16> @vec128_i16_unsigned_reg_reg(<8 x i16> %a1, <8 x i16> %a2) nounwind {
; SSE2-LABEL: vec128_i16_unsigned_reg_reg:		; SSE2-LABEL: vec128_i16_unsigned_reg_reg:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [32768,32768,32768,32768,32768,32768,32768,32768]		; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]
; SSE2-NEXT: movdqa %xmm1, %xmm2		; SSE2-NEXT: movdqa %xmm1, %xmm3
; SSE2-NEXT: pxor %xmm3, %xmm2		; SSE2-NEXT: pxor %xmm2, %xmm3
; SSE2-NEXT: pxor %xmm0, %xmm3		; SSE2-NEXT: pxor %xmm0, %xmm2
; SSE2-NEXT: pcmpgtw %xmm2, %xmm3		; SSE2-NEXT: pcmpgtw %xmm3, %xmm2
; SSE2-NEXT: por {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3		; SSE2-NEXT: por {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
; SSE2-NEXT: movdqa %xmm0, %xmm2		; SSE2-NEXT: movdqa %xmm0, %xmm3
; SSE2-NEXT: psubusw %xmm1, %xmm2		; SSE2-NEXT: psubusw %xmm1, %xmm3
; SSE2-NEXT: psubusw %xmm0, %xmm1		; SSE2-NEXT: psubusw %xmm0, %xmm1
; SSE2-NEXT: psubw %xmm0, %xmm2		; SSE2-NEXT: psubw %xmm0, %xmm3
; SSE2-NEXT: paddw %xmm1, %xmm2		; SSE2-NEXT: paddw %xmm1, %xmm3
; SSE2-NEXT: paddw %xmm0, %xmm2		; SSE2-NEXT: paddw %xmm0, %xmm3
; SSE2-NEXT: psrlw $1, %xmm2		; SSE2-NEXT: psrlw $1, %xmm3
; SSE2-NEXT: pmullw %xmm3, %xmm2		; SSE2-NEXT: pmullw %xmm2, %xmm3
; SSE2-NEXT: paddw %xmm0, %xmm2		; SSE2-NEXT: paddw %xmm3, %xmm0
; SSE2-NEXT: movdqa %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: vec128_i16_unsigned_reg_reg:		; SSE41-LABEL: vec128_i16_unsigned_reg_reg:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movdqa %xmm0, %xmm2		; SSE41-NEXT: movdqa %xmm0, %xmm2
; SSE41-NEXT: pminuw %xmm1, %xmm2		; SSE41-NEXT: pminuw %xmm1, %xmm2
; SSE41-NEXT: movdqa %xmm0, %xmm3		; SSE41-NEXT: movdqa %xmm0, %xmm3
; SSE41-NEXT: pcmpeqw %xmm2, %xmm3		; SSE41-NEXT: pcmpeqw %xmm2, %xmm3
▲ Show 20 Lines • Show All 237 Lines • ▼ Show 20 Lines	; AVX512VLBW-NEXT: retq
%t9 = mul nsw <8 x i16> %t8, %t4 ; signed		%t9 = mul nsw <8 x i16> %t8, %t4 ; signed
%a10 = add nsw <8 x i16> %t9, %a1 ; signed		%a10 = add nsw <8 x i16> %t9, %a1 ; signed
ret <8 x i16> %a10		ret <8 x i16> %a10
}		}

define <8 x i16> @vec128_i16_signed_reg_mem(<8 x i16> %a1, <8 x i16>* %a2_addr) nounwind {		define <8 x i16> @vec128_i16_signed_reg_mem(<8 x i16> %a1, <8 x i16>* %a2_addr) nounwind {
; SSE-LABEL: vec128_i16_signed_reg_mem:		; SSE-LABEL: vec128_i16_signed_reg_mem:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movdqa (%rdi), %xmm2		; SSE-NEXT: movdqa (%rdi), %xmm1
; SSE-NEXT: movdqa %xmm0, %xmm1		; SSE-NEXT: movdqa %xmm0, %xmm2
; SSE-NEXT: pcmpgtw %xmm2, %xmm1		; SSE-NEXT: pcmpgtw %xmm1, %xmm2
; SSE-NEXT: por {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE-NEXT: por {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
; SSE-NEXT: movdqa %xmm0, %xmm3		; SSE-NEXT: movdqa %xmm0, %xmm3
; SSE-NEXT: pminsw %xmm2, %xmm3		; SSE-NEXT: pminsw %xmm1, %xmm3
; SSE-NEXT: pmaxsw %xmm0, %xmm2		; SSE-NEXT: pmaxsw %xmm0, %xmm1
; SSE-NEXT: psubw %xmm3, %xmm2		; SSE-NEXT: psubw %xmm3, %xmm1
; SSE-NEXT: psrlw $1, %xmm2		; SSE-NEXT: psrlw $1, %xmm1
; SSE-NEXT: pmullw %xmm2, %xmm1		; SSE-NEXT: pmullw %xmm2, %xmm1
; SSE-NEXT: paddw %xmm0, %xmm1		; SSE-NEXT: paddw %xmm1, %xmm0
; SSE-NEXT: movdqa %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-FALLBACK-LABEL: vec128_i16_signed_reg_mem:		; AVX1-FALLBACK-LABEL: vec128_i16_signed_reg_mem:
; AVX1-FALLBACK: # %bb.0:		; AVX1-FALLBACK: # %bb.0:
; AVX1-FALLBACK-NEXT: vmovdqa (%rdi), %xmm1		; AVX1-FALLBACK-NEXT: vmovdqa (%rdi), %xmm1
; AVX1-FALLBACK-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm2		; AVX1-FALLBACK-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm2
; AVX1-FALLBACK-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm2		; AVX1-FALLBACK-NEXT: vpor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm2
; AVX1-FALLBACK-NEXT: vpminsw %xmm1, %xmm0, %xmm3		; AVX1-FALLBACK-NEXT: vpminsw %xmm1, %xmm0, %xmm3
▲ Show 20 Lines • Show All 233 Lines • ▼ Show 20 Lines
; 8-bit width. 128 / 8 = 16 elts.		; 8-bit width. 128 / 8 = 16 elts.
; ---------------------------------------------------------------------------- ;		; ---------------------------------------------------------------------------- ;

; Values come from regs		; Values come from regs

define <16 x i8> @vec128_i8_signed_reg_reg(<16 x i8> %a1, <16 x i8> %a2) nounwind {		define <16 x i8> @vec128_i8_signed_reg_reg(<16 x i8> %a1, <16 x i8> %a2) nounwind {
; SSE2-LABEL: vec128_i8_signed_reg_reg:		; SSE2-LABEL: vec128_i8_signed_reg_reg:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa %xmm0, %xmm2		; SSE2-NEXT: movdqa %xmm0, %xmm3
; SSE2-NEXT: pcmpgtb %xmm1, %xmm2		; SSE2-NEXT: pcmpgtb %xmm1, %xmm3
; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]		; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]
; SSE2-NEXT: por %xmm2, %xmm3		; SSE2-NEXT: por %xmm3, %xmm2
; SSE2-NEXT: movdqa %xmm1, %xmm4		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: pcmpgtb %xmm0, %xmm4		; SSE2-NEXT: pcmpgtb %xmm0, %xmm4
; SSE2-NEXT: movdqa %xmm0, %xmm5		; SSE2-NEXT: movdqa %xmm0, %xmm5
; SSE2-NEXT: pand %xmm4, %xmm5		; SSE2-NEXT: pand %xmm4, %xmm5
; SSE2-NEXT: pandn %xmm1, %xmm4		; SSE2-NEXT: pandn %xmm1, %xmm4
; SSE2-NEXT: por %xmm5, %xmm4		; SSE2-NEXT: por %xmm5, %xmm4
; SSE2-NEXT: movdqa %xmm0, %xmm5		; SSE2-NEXT: movdqa %xmm0, %xmm5
; SSE2-NEXT: pand %xmm2, %xmm5		; SSE2-NEXT: pand %xmm3, %xmm5
; SSE2-NEXT: pandn %xmm1, %xmm2		; SSE2-NEXT: pandn %xmm1, %xmm3
; SSE2-NEXT: por %xmm5, %xmm2		; SSE2-NEXT: por %xmm5, %xmm3
; SSE2-NEXT: psubb %xmm4, %xmm2		; SSE2-NEXT: psubb %xmm4, %xmm3
; SSE2-NEXT: psrlw $1, %xmm2		; SSE2-NEXT: psrlw $1, %xmm3
; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2		; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3
; SSE2-NEXT: movdqa %xmm2, %xmm1		; SSE2-NEXT: movdqa %xmm3, %xmm1
; SSE2-NEXT: punpckhbw {{.*#+}} xmm1 = xmm1[8,8,9,9,10,10,11,11,12,12,13,13,14,14,15,15]		; SSE2-NEXT: punpckhbw {{.*#+}} xmm1 = xmm1[8,8,9,9,10,10,11,11,12,12,13,13,14,14,15,15]
; SSE2-NEXT: movdqa %xmm3, %xmm4		; SSE2-NEXT: movdqa %xmm2, %xmm4
; SSE2-NEXT: punpckhbw {{.*#+}} xmm4 = xmm4[8,8,9,9,10,10,11,11,12,12,13,13,14,14,15,15]		; SSE2-NEXT: punpckhbw {{.*#+}} xmm4 = xmm4[8,8,9,9,10,10,11,11,12,12,13,13,14,14,15,15]
; SSE2-NEXT: pmullw %xmm1, %xmm4		; SSE2-NEXT: pmullw %xmm1, %xmm4
; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [255,255,255,255,255,255,255,255]		; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [255,255,255,255,255,255,255,255]
; SSE2-NEXT: pand %xmm1, %xmm4		; SSE2-NEXT: pand %xmm1, %xmm4
; SSE2-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
; SSE2-NEXT: punpcklbw {{.*#+}} xmm3 = xmm3[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]		; SSE2-NEXT: punpcklbw {{.*#+}} xmm3 = xmm3[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
		; SSE2-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
; SSE2-NEXT: pmullw %xmm3, %xmm2		; SSE2-NEXT: pmullw %xmm3, %xmm2
; SSE2-NEXT: pand %xmm1, %xmm2		; SSE2-NEXT: pand %xmm1, %xmm2
; SSE2-NEXT: packuswb %xmm4, %xmm2		; SSE2-NEXT: packuswb %xmm4, %xmm2
; SSE2-NEXT: paddb %xmm0, %xmm2		; SSE2-NEXT: paddb %xmm2, %xmm0
; SSE2-NEXT: movdqa %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: vec128_i8_signed_reg_reg:		; SSE41-LABEL: vec128_i8_signed_reg_reg:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movdqa %xmm0, %xmm2		; SSE41-NEXT: movdqa %xmm0, %xmm2
; SSE41-NEXT: pcmpgtb %xmm1, %xmm2		; SSE41-NEXT: pcmpgtb %xmm1, %xmm2
; SSE41-NEXT: por {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2		; SSE41-NEXT: por {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
; SSE41-NEXT: movdqa %xmm0, %xmm3		; SSE41-NEXT: movdqa %xmm0, %xmm3
▲ Show 20 Lines • Show All 701 Lines • ▼ Show 20 Lines	; AVX512VLBW-NEXT: retq
%a10 = add nsw <16 x i8> %t9, %a1 ; signed		%a10 = add nsw <16 x i8> %t9, %a1 ; signed
ret <16 x i8> %a10		ret <16 x i8> %a10
}		}

define <16 x i8> @vec128_i8_signed_reg_mem(<16 x i8> %a1, <16 x i8>* %a2_addr) nounwind {		define <16 x i8> @vec128_i8_signed_reg_mem(<16 x i8> %a1, <16 x i8>* %a2_addr) nounwind {
; SSE2-LABEL: vec128_i8_signed_reg_mem:		; SSE2-LABEL: vec128_i8_signed_reg_mem:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa (%rdi), %xmm3		; SSE2-NEXT: movdqa (%rdi), %xmm3
; SSE2-NEXT: movdqa %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pcmpgtb %xmm3, %xmm1		; SSE2-NEXT: pcmpgtb %xmm3, %xmm2
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]		; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]
; SSE2-NEXT: por %xmm1, %xmm2		; SSE2-NEXT: por %xmm2, %xmm1
; SSE2-NEXT: movdqa %xmm3, %xmm4		; SSE2-NEXT: movdqa %xmm3, %xmm4
; SSE2-NEXT: pcmpgtb %xmm0, %xmm4		; SSE2-NEXT: pcmpgtb %xmm0, %xmm4
; SSE2-NEXT: movdqa %xmm0, %xmm5		; SSE2-NEXT: movdqa %xmm0, %xmm5
; SSE2-NEXT: pand %xmm4, %xmm5		; SSE2-NEXT: pand %xmm4, %xmm5
; SSE2-NEXT: pandn %xmm3, %xmm4		; SSE2-NEXT: pandn %xmm3, %xmm4
; SSE2-NEXT: por %xmm5, %xmm4		; SSE2-NEXT: por %xmm5, %xmm4
; SSE2-NEXT: movdqa %xmm0, %xmm5		; SSE2-NEXT: movdqa %xmm0, %xmm5
; SSE2-NEXT: pand %xmm1, %xmm5		; SSE2-NEXT: pand %xmm2, %xmm5
; SSE2-NEXT: pandn %xmm3, %xmm1		; SSE2-NEXT: pandn %xmm3, %xmm2
; SSE2-NEXT: por %xmm5, %xmm1		; SSE2-NEXT: por %xmm5, %xmm2
; SSE2-NEXT: psubb %xmm4, %xmm1		; SSE2-NEXT: psubb %xmm4, %xmm2
; SSE2-NEXT: psrlw $1, %xmm1		; SSE2-NEXT: psrlw $1, %xmm2
; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
; SSE2-NEXT: movdqa %xmm1, %xmm3		; SSE2-NEXT: movdqa %xmm2, %xmm3
; SSE2-NEXT: punpckhbw {{.*#+}} xmm3 = xmm3[8,8,9,9,10,10,11,11,12,12,13,13,14,14,15,15]		; SSE2-NEXT: punpckhbw {{.*#+}} xmm3 = xmm3[8,8,9,9,10,10,11,11,12,12,13,13,14,14,15,15]
; SSE2-NEXT: movdqa %xmm2, %xmm4		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: punpckhbw {{.*#+}} xmm4 = xmm4[8,8,9,9,10,10,11,11,12,12,13,13,14,14,15,15]		; SSE2-NEXT: punpckhbw {{.*#+}} xmm4 = xmm4[8,8,9,9,10,10,11,11,12,12,13,13,14,14,15,15]
; SSE2-NEXT: pmullw %xmm3, %xmm4		; SSE2-NEXT: pmullw %xmm3, %xmm4
; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [255,255,255,255,255,255,255,255]		; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [255,255,255,255,255,255,255,255]
; SSE2-NEXT: pand %xmm3, %xmm4		; SSE2-NEXT: pand %xmm3, %xmm4
; SSE2-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
; SSE2-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]		; SSE2-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
		; SSE2-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
; SSE2-NEXT: pmullw %xmm2, %xmm1		; SSE2-NEXT: pmullw %xmm2, %xmm1
; SSE2-NEXT: pand %xmm3, %xmm1		; SSE2-NEXT: pand %xmm3, %xmm1
; SSE2-NEXT: packuswb %xmm4, %xmm1		; SSE2-NEXT: packuswb %xmm4, %xmm1
; SSE2-NEXT: paddb %xmm0, %xmm1		; SSE2-NEXT: paddb %xmm1, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: vec128_i8_signed_reg_mem:		; SSE41-LABEL: vec128_i8_signed_reg_mem:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movdqa (%rdi), %xmm1		; SSE41-NEXT: movdqa (%rdi), %xmm1
; SSE41-NEXT: movdqa %xmm0, %xmm2		; SSE41-NEXT: movdqa %xmm0, %xmm2
; SSE41-NEXT: pcmpgtb %xmm1, %xmm2		; SSE41-NEXT: pcmpgtb %xmm1, %xmm2
; SSE41-NEXT: por {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2		; SSE41-NEXT: por {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
▲ Show 20 Lines • Show All 476 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/mul-constant-i16.ll

	Show First 20 Lines • Show All 312 Lines • ▼ Show 20 Lines
	; X86-NEXT: movl %ecx, %eax			; X86-NEXT: movl %ecx, %eax
	; X86-NEXT: shll $4, %eax			; X86-NEXT: shll $4, %eax
	; X86-NEXT: addl %ecx, %eax			; X86-NEXT: addl %ecx, %eax
	; X86-NEXT: # kill: def $ax killed $ax killed $eax			; X86-NEXT: # kill: def $ax killed $ax killed $eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: test_mul_by_17:			; X64-LABEL: test_mul_by_17:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: # kill: def $edi killed $edi def $rdi
	; X64-NEXT: movl %edi, %eax			; X64-NEXT: movl %edi, %eax
	; X64-NEXT: shll $4, %eax			; X64-NEXT: shll $4, %eax
	; X64-NEXT: addl %edi, %eax			; X64-NEXT: addl %edi, %eax
	; X64-NEXT: # kill: def $ax killed $ax killed $eax			; X64-NEXT: # kill: def $ax killed $ax killed $eax
	; X64-NEXT: retq			; X64-NEXT: retq
	%mul = mul nsw i16 %x, 17			%mul = mul nsw i16 %x, 17
	ret i16 %mul			ret i16 %mul
	}			}
	▲ Show 20 Lines • Show All 512 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/mul-constant-i32.ll

	Show First 20 Lines • Show All 481 Lines • ▼ Show 20 Lines
	; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx			; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X86-NEXT: movl %ecx, %eax			; X86-NEXT: movl %ecx, %eax
	; X86-NEXT: shll $4, %eax			; X86-NEXT: shll $4, %eax
	; X86-NEXT: addl %ecx, %eax			; X86-NEXT: addl %ecx, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: test_mul_by_17:			; X64-LABEL: test_mul_by_17:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: # kill: def $edi killed $edi def $rdi
	; X64-NEXT: movl %edi, %eax			; X64-NEXT: movl %edi, %eax
	; X64-NEXT: shll $4, %eax			; X64-NEXT: shll $4, %eax
	; X64-NEXT: addl %edi, %eax			; X64-NEXT: addl %edi, %eax
	; X64-NEXT: retq			; X64-NEXT: retq
	;			;
	; X86-NOOPT-LABEL: test_mul_by_17:			; X86-NOOPT-LABEL: test_mul_by_17:
	; X86-NOOPT: # %bb.0:			; X86-NOOPT: # %bb.0:
	; X86-NOOPT-NEXT: imull $17, {{[0-9]+}}(%esp), %eax			; X86-NOOPT-NEXT: imull $17, {{[0-9]+}}(%esp), %eax
	▲ Show 20 Lines • Show All 676 Lines • ▼ Show 20 Lines
	;			;
	; X64-NOOPT-LABEL: test_mul_by_66:			; X64-NOOPT-LABEL: test_mul_by_66:
	; X64-NOOPT: # %bb.0:			; X64-NOOPT: # %bb.0:
	; X64-NOOPT-NEXT: imull $66, %edi, %eax			; X64-NOOPT-NEXT: imull $66, %edi, %eax
	; X64-NOOPT-NEXT: retq			; X64-NOOPT-NEXT: retq
	;			;
	; X64-SLM-LABEL: test_mul_by_66:			; X64-SLM-LABEL: test_mul_by_66:
	; X64-SLM: # %bb.0:			; X64-SLM: # %bb.0:
	; X64-SLM-NEXT: # kill: def $edi killed $edi def $rdi
	; X64-SLM-NEXT: movl %edi, %eax			; X64-SLM-NEXT: movl %edi, %eax
	; X64-SLM-NEXT: shll $6, %eax			; X64-SLM-NEXT: shll $6, %eax
	; X64-SLM-NEXT: addl %edi, %eax			; X64-SLM-NEXT: addl %edi, %eax
	; X64-SLM-NEXT: addl %edi, %eax			; X64-SLM-NEXT: addl %edi, %eax
	; X64-SLM-NEXT: retq			; X64-SLM-NEXT: retq
	%mul = mul nsw i32 %x, 66			%mul = mul nsw i32 %x, 66
	ret i32 %mul			ret i32 %mul
	}			}
	▲ Show 20 Lines • Show All 272 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/mul-constant-i64.ll

Show First 20 Lines • Show All 1,470 Lines • ▼ Show 20 Lines	; X64-NOOPT-NEXT: retq
%mul = mul nsw i64 %x, -36		%mul = mul nsw i64 %x, -36
ret i64 %mul		ret i64 %mul
}		}

; (x9+42)(x*5+2)		; (x9+42)(x*5+2)
define i64 @test_mul_spec(i64 %x) nounwind {		define i64 @test_mul_spec(i64 %x) nounwind {
; X86-LABEL: test_mul_spec:		; X86-LABEL: test_mul_spec:
; X86: # %bb.0:		; X86: # %bb.0:
		; X86-NEXT: pushl %ebp
; X86-NEXT: pushl %ebx		; X86-NEXT: pushl %ebx
; X86-NEXT: pushl %edi		; X86-NEXT: pushl %edi
; X86-NEXT: pushl %esi		; X86-NEXT: pushl %esi
; X86-NEXT: movl {{[0-9]+}}(%esp), %esi		; X86-NEXT: movl {{[0-9]+}}(%esp), %edi
; X86-NEXT: movl {{[0-9]+}}(%esp), %ebx		; X86-NEXT: movl {{[0-9]+}}(%esp), %ebp
; X86-NEXT: movl $9, %ecx		; X86-NEXT: movl $9, %ecx
; X86-NEXT: movl %esi, %eax		; X86-NEXT: movl %edi, %eax
; X86-NEXT: mull %ecx		; X86-NEXT: mull %ecx
; X86-NEXT: movl %eax, %ecx		; X86-NEXT: movl %eax, %esi
; X86-NEXT: leal (%ebx,%ebx,8), %edi		; X86-NEXT: movl %edx, %ecx
; X86-NEXT: addl $42, %ecx		; X86-NEXT: leal (%ebp,%ebp,8), %eax
; X86-NEXT: adcl %edx, %edi		; X86-NEXT: addl $42, %esi
		; X86-NEXT: adcl %eax, %ecx
; X86-NEXT: movl $5, %edx		; X86-NEXT: movl $5, %edx
; X86-NEXT: movl %esi, %eax		; X86-NEXT: movl %edi, %eax
; X86-NEXT: mull %edx		; X86-NEXT: mull %edx
; X86-NEXT: movl %eax, %esi		; X86-NEXT: movl %eax, %edi
; X86-NEXT: leal (%ebx,%ebx,4), %ebx		; X86-NEXT: movl %edx, %ebx
; X86-NEXT: addl $2, %esi		; X86-NEXT: leal (%ebp,%ebp,4), %eax
; X86-NEXT: adcl %edx, %ebx		; X86-NEXT: addl $2, %edi
; X86-NEXT: movl %ecx, %eax		; X86-NEXT: adcl %eax, %ebx
; X86-NEXT: mull %esi		; X86-NEXT: movl %esi, %eax
; X86-NEXT: imull %ecx, %ebx		; X86-NEXT: mull %edi
		; X86-NEXT: imull %esi, %ebx
; X86-NEXT: addl %ebx, %edx		; X86-NEXT: addl %ebx, %edx
; X86-NEXT: imull %edi, %esi		; X86-NEXT: imull %ecx, %edi
; X86-NEXT: addl %esi, %edx		; X86-NEXT: addl %edi, %edx
; X86-NEXT: popl %esi		; X86-NEXT: popl %esi
; X86-NEXT: popl %edi		; X86-NEXT: popl %edi
; X86-NEXT: popl %ebx		; X86-NEXT: popl %ebx
		; X86-NEXT: popl %ebp
; X86-NEXT: retl		; X86-NEXT: retl
;		;
; X86-NOOPT-LABEL: test_mul_spec:		; X86-NOOPT-LABEL: test_mul_spec:
; X86-NOOPT: # %bb.0:		; X86-NOOPT: # %bb.0:
		; X86-NOOPT-NEXT: pushl %ebp
; X86-NOOPT-NEXT: pushl %ebx		; X86-NOOPT-NEXT: pushl %ebx
; X86-NOOPT-NEXT: pushl %edi		; X86-NOOPT-NEXT: pushl %edi
; X86-NOOPT-NEXT: pushl %esi		; X86-NOOPT-NEXT: pushl %esi
; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %esi		; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %edi
; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %ebx		; X86-NOOPT-NEXT: movl {{[0-9]+}}(%esp), %ebp
; X86-NOOPT-NEXT: movl $9, %ecx		; X86-NOOPT-NEXT: movl $9, %ecx
; X86-NOOPT-NEXT: movl %esi, %eax		; X86-NOOPT-NEXT: movl %edi, %eax
; X86-NOOPT-NEXT: mull %ecx		; X86-NOOPT-NEXT: mull %ecx
; X86-NOOPT-NEXT: movl %eax, %ecx		; X86-NOOPT-NEXT: movl %eax, %esi
; X86-NOOPT-NEXT: leal (%ebx,%ebx,8), %edi		; X86-NOOPT-NEXT: movl %edx, %ecx
; X86-NOOPT-NEXT: addl $42, %ecx		; X86-NOOPT-NEXT: leal (%ebp,%ebp,8), %eax
; X86-NOOPT-NEXT: adcl %edx, %edi		; X86-NOOPT-NEXT: addl $42, %esi
		; X86-NOOPT-NEXT: adcl %eax, %ecx
; X86-NOOPT-NEXT: movl $5, %edx		; X86-NOOPT-NEXT: movl $5, %edx
; X86-NOOPT-NEXT: movl %esi, %eax		; X86-NOOPT-NEXT: movl %edi, %eax
; X86-NOOPT-NEXT: mull %edx		; X86-NOOPT-NEXT: mull %edx
; X86-NOOPT-NEXT: movl %eax, %esi		; X86-NOOPT-NEXT: movl %eax, %edi
; X86-NOOPT-NEXT: leal (%ebx,%ebx,4), %ebx		; X86-NOOPT-NEXT: movl %edx, %ebx
; X86-NOOPT-NEXT: addl $2, %esi		; X86-NOOPT-NEXT: leal (%ebp,%ebp,4), %eax
; X86-NOOPT-NEXT: adcl %edx, %ebx		; X86-NOOPT-NEXT: addl $2, %edi
; X86-NOOPT-NEXT: movl %ecx, %eax		; X86-NOOPT-NEXT: adcl %eax, %ebx
; X86-NOOPT-NEXT: mull %esi		; X86-NOOPT-NEXT: movl %esi, %eax
; X86-NOOPT-NEXT: imull %ecx, %ebx		; X86-NOOPT-NEXT: mull %edi
		; X86-NOOPT-NEXT: imull %esi, %ebx
; X86-NOOPT-NEXT: addl %ebx, %edx		; X86-NOOPT-NEXT: addl %ebx, %edx
; X86-NOOPT-NEXT: imull %edi, %esi		; X86-NOOPT-NEXT: imull %ecx, %edi
; X86-NOOPT-NEXT: addl %esi, %edx		; X86-NOOPT-NEXT: addl %edi, %edx
; X86-NOOPT-NEXT: popl %esi		; X86-NOOPT-NEXT: popl %esi
; X86-NOOPT-NEXT: popl %edi		; X86-NOOPT-NEXT: popl %edi
; X86-NOOPT-NEXT: popl %ebx		; X86-NOOPT-NEXT: popl %ebx
		; X86-NOOPT-NEXT: popl %ebp
; X86-NOOPT-NEXT: retl		; X86-NOOPT-NEXT: retl
;		;
; X64-HSW-LABEL: test_mul_spec:		; X64-HSW-LABEL: test_mul_spec:
; X64-HSW: # %bb.0:		; X64-HSW: # %bb.0:
; X64-HSW-NEXT: leaq (%rdi,%rdi,8), %rcx		; X64-HSW-NEXT: leaq (%rdi,%rdi,8), %rcx
; X64-HSW-NEXT: addq $42, %rcx		; X64-HSW-NEXT: addq $42, %rcx
; X64-HSW-NEXT: leaq (%rdi,%rdi,4), %rax		; X64-HSW-NEXT: leaq (%rdi,%rdi,4), %rax
; X64-HSW-NEXT: addq $2, %rax		; X64-HSW-NEXT: addq $2, %rax
▲ Show 20 Lines • Show All 46 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/mul-constant-i8.ll

	Show First 20 Lines • Show All 182 Lines • ▼ Show 20 Lines
	; X64-NEXT: retq			; X64-NEXT: retq
	%m = mul i8 %x, 16			%m = mul i8 %x, 16
	ret i8 %m			ret i8 %m
	}			}

	define i8 @test_mul_by_17(i8 %x) {			define i8 @test_mul_by_17(i8 %x) {
	; X64-LABEL: test_mul_by_17:			; X64-LABEL: test_mul_by_17:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: # kill: def $edi killed $edi def $rdi
	; X64-NEXT: movl %edi, %eax			; X64-NEXT: movl %edi, %eax
	; X64-NEXT: shll $4, %eax			; X64-NEXT: shll $4, %eax
	; X64-NEXT: addl %edi, %eax			; X64-NEXT: addl %edi, %eax
	; X64-NEXT: # kill: def $al killed $al killed $eax			; X64-NEXT: # kill: def $al killed $al killed $eax
	; X64-NEXT: retq			; X64-NEXT: retq
	%m = mul i8 %x, 17			%m = mul i8 %x, 17
	ret i8 %m			ret i8 %m
	}			}
	▲ Show 20 Lines • Show All 286 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/mul128.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown \| FileCheck %s --check-prefix=X64			; RUN: llc < %s -mtriple=x86_64-unknown \| FileCheck %s --check-prefix=X64
	; RUN: llc < %s -mtriple=i386-unknown \| FileCheck %s --check-prefix=X86			; RUN: llc < %s -mtriple=i386-unknown \| FileCheck %s --check-prefix=X86

	define i128 @foo(i128 %t, i128 %u) {			define i128 @foo(i128 %t, i128 %u) {
	; X64-LABEL: foo:			; X64-LABEL: foo:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: movq %rdx, %r8			; X64-NEXT: movq %rdx, %r8
	; X64-NEXT: movq %rdi, %rax			; X64-NEXT: movq %rdi, %rax
	; X64-NEXT: imulq %rdi, %rcx			; X64-NEXT: imulq %rdi, %rcx
	; X64-NEXT: mulq %rdx			; X64-NEXT: mulq %rdx
	; X64-NEXT: addq %rcx, %rdx			; X64-NEXT: addq %rcx, %rdx
	; X64-NEXT: imulq %r8, %rsi			; X64-NEXT: imulq %rsi, %r8
	; X64-NEXT: addq %rsi, %rdx			; X64-NEXT: addq %r8, %rdx
	; X64-NEXT: retq			; X64-NEXT: retq
	;			;
	; X86-LABEL: foo:			; X86-LABEL: foo:
	; X86: # %bb.0:			; X86: # %bb.0:
	; X86-NEXT: pushl %ebp			; X86-NEXT: pushl %ebp
	; X86-NEXT: .cfi_def_cfa_offset 8			; X86-NEXT: .cfi_def_cfa_offset 8
	; X86-NEXT: pushl %ebx			; X86-NEXT: pushl %ebx
	; X86-NEXT: .cfi_def_cfa_offset 12			; X86-NEXT: .cfi_def_cfa_offset 12
	▲ Show 20 Lines • Show All 115 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/overflow.ll

	Show First 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	; X32-NEXT: retl $4			; X32-NEXT: retl $4
	;			;
	; X64-LABEL: mulhioverflow:			; X64-LABEL: mulhioverflow:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: movq %rdx, %rcx			; X64-NEXT: movq %rdx, %rcx
	; X64-NEXT: movq %rdi, %rax			; X64-NEXT: movq %rdi, %rax
	; X64-NEXT: mulq %rsi			; X64-NEXT: mulq %rsi
	; X64-NEXT: andl $1, %ecx			; X64-NEXT: andl $1, %ecx
	; X64-NEXT: leaq (%rcx,%rdx), %rax			; X64-NEXT: addq %rdx, %rcx
				; X64-NEXT: movq %rcx, %rax
	; X64-NEXT: xorl %edx, %edx			; X64-NEXT: xorl %edx, %edx
	; X64-NEXT: retq			; X64-NEXT: retq
	%1 = zext i64 %a to i128			%1 = zext i64 %a to i128
	%2 = zext i64 %b to i128			%2 = zext i64 %b to i128
	%3 = mul i128 %1, %2			%3 = mul i128 %1, %2
	%4 = lshr i128 %3, 64			%4 = lshr i128 %3, 64
	%5 = and i64 %c, 1			%5 = and i64 %c, 1
	%6 = zext i64 %5 to i128			%6 = zext i64 %5 to i128
	%7 = add i128 %4, %6			%7 = add i128 %4, %6
	ret i128 %7			ret i128 %7
	}			}

llvm/test/CodeGen/X86/palignr.ll

	Show First 20 Lines • Show All 161 Lines • ▼ Show 20 Lines
	; Check that we don't do unary (circular on single operand) palignr incorrectly.			; Check that we don't do unary (circular on single operand) palignr incorrectly.
	; (It is possible, but before this testcase was committed, it was being done			; (It is possible, but before this testcase was committed, it was being done
	; incorrectly. In particular, one of the operands of the palignr node			; incorrectly. In particular, one of the operands of the palignr node
	; was an UNDEF.)			; was an UNDEF.)
	define <8 x i16> @test9(<8 x i16> %A, <8 x i16> %B) nounwind {			define <8 x i16> @test9(<8 x i16> %A, <8 x i16> %B) nounwind {
	; CHECK-SSE2-LABEL: test9:			; CHECK-SSE2-LABEL: test9:
	; CHECK-SSE2: # %bb.0:			; CHECK-SSE2: # %bb.0:
	; CHECK-SSE2-NEXT: movdqa %xmm1, %xmm0			; CHECK-SSE2-NEXT: movdqa %xmm1, %xmm0
	; CHECK-SSE2-NEXT: psrldq {{.*#+}} xmm1 = xmm1[2,3,4,5,6,7,8,9,10,11,12,13,14,15],zero,zero			; CHECK-SSE2-NEXT: psrldq {{.*#+}} xmm0 = xmm0[2,3,4,5,6,7,8,9,10,11,12,13,14,15],zero,zero
	; CHECK-SSE2-NEXT: pslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm0[0,1]			; CHECK-SSE2-NEXT: pslldq {{.*#+}} xmm1 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm1[0,1]
	; CHECK-SSE2-NEXT: por %xmm1, %xmm0			; CHECK-SSE2-NEXT: por %xmm1, %xmm0
	; CHECK-SSE2-NEXT: retl			; CHECK-SSE2-NEXT: retl
	;			;
	; CHECK-SSSE3-LABEL: test9:			; CHECK-SSSE3-LABEL: test9:
	; CHECK-SSSE3: # %bb.0:			; CHECK-SSSE3: # %bb.0:
	; CHECK-SSSE3-NEXT: movdqa %xmm1, %xmm0			; CHECK-SSSE3-NEXT: movdqa %xmm1, %xmm0
	; CHECK-SSSE3-NEXT: palignr {{.*#+}} xmm0 = xmm1[2,3,4,5,6,7,8,9,10,11,12,13,14,15],xmm0[0,1]			; CHECK-SSSE3-NEXT: palignr {{.*#+}} xmm0 = xmm1[2,3,4,5,6,7,8,9,10,11,12,13,14,15],xmm0[0,1]
	; CHECK-SSSE3-NEXT: retl			; CHECK-SSSE3-NEXT: retl
	Show All 9 Lines

llvm/test/CodeGen/X86/phaddsub.ll

Show First 20 Lines • Show All 559 Lines • ▼ Show 20 Lines	; AVX-NEXT: retq
ret <8 x i16> %add		ret <8 x i16> %add
}		}

define <8 x i16> @phaddw_single_source4(<8 x i16> %x) {		define <8 x i16> @phaddw_single_source4(<8 x i16> %x) {
; SSSE3-SLOW-LABEL: phaddw_single_source4:		; SSSE3-SLOW-LABEL: phaddw_single_source4:
; SSSE3-SLOW: # %bb.0:		; SSSE3-SLOW: # %bb.0:
; SSSE3-SLOW-NEXT: movdqa %xmm0, %xmm1		; SSSE3-SLOW-NEXT: movdqa %xmm0, %xmm1
; SSSE3-SLOW-NEXT: pslld $16, %xmm1		; SSSE3-SLOW-NEXT: pslld $16, %xmm1
; SSSE3-SLOW-NEXT: paddw %xmm0, %xmm1		; SSSE3-SLOW-NEXT: paddw %xmm1, %xmm0
; SSSE3-SLOW-NEXT: movdqa %xmm1, %xmm0
; SSSE3-SLOW-NEXT: retq		; SSSE3-SLOW-NEXT: retq
;		;
; SSSE3-FAST-LABEL: phaddw_single_source4:		; SSSE3-FAST-LABEL: phaddw_single_source4:
; SSSE3-FAST: # %bb.0:		; SSSE3-FAST: # %bb.0:
; SSSE3-FAST-NEXT: phaddw %xmm0, %xmm0		; SSSE3-FAST-NEXT: phaddw %xmm0, %xmm0
; SSSE3-FAST-NEXT: retq		; SSSE3-FAST-NEXT: retq
;		;
; AVX-SLOW-LABEL: phaddw_single_source4:		; AVX-SLOW-LABEL: phaddw_single_source4:
▲ Show 20 Lines • Show All 122 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/pmul.ll

Show First 20 Lines • Show All 1,056 Lines • ▼ Show 20 Lines	entry:
%rescast = bitcast <4 x i64> %res64 to <8 x i32>		%rescast = bitcast <4 x i64> %res64 to <8 x i32>
%res = shufflevector <8 x i32> %rescast, <8 x i32> undef, <4 x i32> <i32 1, i32 3, i32 5, i32 7>		%res = shufflevector <8 x i32> %rescast, <8 x i32> undef, <4 x i32> <i32 1, i32 3, i32 5, i32 7>
ret <4 x i32> %res		ret <4 x i32> %res
}		}

define <4 x i32> @mul_v4i64_zero_upper_left(<4 x i32> %val1, <4 x i64> %val2) {		define <4 x i32> @mul_v4i64_zero_upper_left(<4 x i32> %val1, <4 x i64> %val2) {
; SSE2-LABEL: mul_v4i64_zero_upper_left:		; SSE2-LABEL: mul_v4i64_zero_upper_left:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: pxor %xmm3, %xmm3		; SSE2-NEXT: pxor %xmm4, %xmm4
; SSE2-NEXT: movdqa %xmm0, %xmm4
; SSE2-NEXT: punpckldq {{.*#+}} xmm4 = xmm4[0],xmm3[0],xmm4[1],xmm3[1]
; SSE2-NEXT: punpckhdq {{.*#+}} xmm0 = xmm0[2],xmm3[2],xmm0[3],xmm3[3]
; SSE2-NEXT: movdqa %xmm0, %xmm3		; SSE2-NEXT: movdqa %xmm0, %xmm3
; SSE2-NEXT: pmuludq %xmm2, %xmm3		; SSE2-NEXT: punpckldq {{.*#+}} xmm3 = xmm3[0],xmm4[0],xmm3[1],xmm4[1]
		; SSE2-NEXT: punpckhdq {{.*#+}} xmm0 = xmm0[2],xmm4[2],xmm0[3],xmm4[3]
		; SSE2-NEXT: movdqa %xmm0, %xmm4
		; SSE2-NEXT: pmuludq %xmm2, %xmm4
; SSE2-NEXT: psrlq $32, %xmm2		; SSE2-NEXT: psrlq $32, %xmm2
; SSE2-NEXT: pmuludq %xmm0, %xmm2		; SSE2-NEXT: pmuludq %xmm0, %xmm2
; SSE2-NEXT: psllq $32, %xmm2		; SSE2-NEXT: psllq $32, %xmm2
; SSE2-NEXT: paddq %xmm3, %xmm2		; SSE2-NEXT: paddq %xmm4, %xmm2
; SSE2-NEXT: movdqa %xmm4, %xmm0		; SSE2-NEXT: movdqa %xmm3, %xmm0
; SSE2-NEXT: pmuludq %xmm1, %xmm0		; SSE2-NEXT: pmuludq %xmm1, %xmm0
; SSE2-NEXT: psrlq $32, %xmm1		; SSE2-NEXT: psrlq $32, %xmm1
; SSE2-NEXT: pmuludq %xmm4, %xmm1		; SSE2-NEXT: pmuludq %xmm1, %xmm3
; SSE2-NEXT: psllq $32, %xmm1		; SSE2-NEXT: psllq $32, %xmm3
; SSE2-NEXT: paddq %xmm1, %xmm0		; SSE2-NEXT: paddq %xmm0, %xmm3
; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,3],xmm2[1,3]		; SSE2-NEXT: shufps {{.*#+}} xmm3 = xmm3[1,3],xmm2[1,3]
		; SSE2-NEXT: movaps %xmm3, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: mul_v4i64_zero_upper_left:		; SSE41-LABEL: mul_v4i64_zero_upper_left:
; SSE41: # %bb.0: # %entry		; SSE41: # %bb.0: # %entry
; SSE41-NEXT: pxor %xmm3, %xmm3		; SSE41-NEXT: pxor %xmm4, %xmm4
; SSE41-NEXT: pmovzxdq {{.*#+}} xmm4 = xmm0[0],zero,xmm0[1],zero		; SSE41-NEXT: pmovzxdq {{.*#+}} xmm3 = xmm0[0],zero,xmm0[1],zero
; SSE41-NEXT: punpckhdq {{.*#+}} xmm0 = xmm0[2],xmm3[2],xmm0[3],xmm3[3]		; SSE41-NEXT: punpckhdq {{.*#+}} xmm0 = xmm0[2],xmm4[2],xmm0[3],xmm4[3]
; SSE41-NEXT: movdqa %xmm0, %xmm3		; SSE41-NEXT: movdqa %xmm0, %xmm4
; SSE41-NEXT: pmuludq %xmm2, %xmm3		; SSE41-NEXT: pmuludq %xmm2, %xmm4
; SSE41-NEXT: psrlq $32, %xmm2		; SSE41-NEXT: psrlq $32, %xmm2
; SSE41-NEXT: pmuludq %xmm0, %xmm2		; SSE41-NEXT: pmuludq %xmm0, %xmm2
; SSE41-NEXT: psllq $32, %xmm2		; SSE41-NEXT: psllq $32, %xmm2
; SSE41-NEXT: paddq %xmm3, %xmm2		; SSE41-NEXT: paddq %xmm4, %xmm2
; SSE41-NEXT: movdqa %xmm4, %xmm0		; SSE41-NEXT: movdqa %xmm3, %xmm0
; SSE41-NEXT: pmuludq %xmm1, %xmm0		; SSE41-NEXT: pmuludq %xmm1, %xmm0
; SSE41-NEXT: psrlq $32, %xmm1		; SSE41-NEXT: psrlq $32, %xmm1
; SSE41-NEXT: pmuludq %xmm4, %xmm1		; SSE41-NEXT: pmuludq %xmm1, %xmm3
; SSE41-NEXT: psllq $32, %xmm1		; SSE41-NEXT: psllq $32, %xmm3
; SSE41-NEXT: paddq %xmm1, %xmm0		; SSE41-NEXT: paddq %xmm0, %xmm3
; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,3],xmm2[1,3]		; SSE41-NEXT: shufps {{.*#+}} xmm3 = xmm3[1,3],xmm2[1,3]
		; SSE41-NEXT: movaps %xmm3, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: mul_v4i64_zero_upper_left:		; AVX-LABEL: mul_v4i64_zero_upper_left:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vpmovzxdq {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero		; AVX-NEXT: vpmovzxdq {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero
; AVX-NEXT: vpmuludq %ymm1, %ymm0, %ymm2		; AVX-NEXT: vpmuludq %ymm1, %ymm0, %ymm2
; AVX-NEXT: vpsrlq $32, %ymm1, %ymm1		; AVX-NEXT: vpsrlq $32, %ymm1, %ymm1
; AVX-NEXT: vpmuludq %ymm1, %ymm0, %ymm0		; AVX-NEXT: vpmuludq %ymm1, %ymm0, %ymm0
▲ Show 20 Lines • Show All 281 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/pmulh.ll

	Show First 20 Lines • Show All 350 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: punpcklwd {{.*#+}} xmm4 = xmm4[0],xmm0[0],xmm4[1],xmm0[1],xmm4[2],xmm0[2],xmm4[3],xmm0[3]			; SSE2-NEXT: punpcklwd {{.*#+}} xmm4 = xmm4[0],xmm0[0],xmm4[1],xmm0[1],xmm4[2],xmm0[2],xmm4[3],xmm0[3]
	; SSE2-NEXT: packssdw %xmm1, %xmm4			; SSE2-NEXT: packssdw %xmm1, %xmm4
	; SSE2-NEXT: movdqa %xmm4, %xmm0			; SSE2-NEXT: movdqa %xmm4, %xmm0
	; SSE2-NEXT: movdqa %xmm6, %xmm1			; SSE2-NEXT: movdqa %xmm6, %xmm1
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: and_mulhuw_v16i16:			; SSE41-LABEL: and_mulhuw_v16i16:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa {{.*#+}} xmm8 = [32767,32767,32767,32767]			; SSE41-NEXT: movdqa %xmm6, %xmm8
	; SSE41-NEXT: pand %xmm8, %xmm3			; SSE41-NEXT: movdqa {{.*#+}} xmm6 = [32767,32767,32767,32767]
	; SSE41-NEXT: pand %xmm8, %xmm2			; SSE41-NEXT: pand %xmm6, %xmm3
	; SSE41-NEXT: pand %xmm8, %xmm1			; SSE41-NEXT: pand %xmm6, %xmm2
	; SSE41-NEXT: pand %xmm8, %xmm0			; SSE41-NEXT: pand %xmm6, %xmm1
	; SSE41-NEXT: pand %xmm8, %xmm7			; SSE41-NEXT: pand %xmm6, %xmm0
				; SSE41-NEXT: pand %xmm6, %xmm7
	; SSE41-NEXT: pmaddwd %xmm3, %xmm7			; SSE41-NEXT: pmaddwd %xmm3, %xmm7
	; SSE41-NEXT: pand %xmm8, %xmm6			; SSE41-NEXT: pand %xmm6, %xmm8
	; SSE41-NEXT: pmaddwd %xmm2, %xmm6			; SSE41-NEXT: pmaddwd %xmm2, %xmm8
	; SSE41-NEXT: pand %xmm8, %xmm5			; SSE41-NEXT: pand %xmm6, %xmm5
	; SSE41-NEXT: pmaddwd %xmm1, %xmm5			; SSE41-NEXT: pmaddwd %xmm1, %xmm5
	; SSE41-NEXT: pand %xmm8, %xmm4			; SSE41-NEXT: pand %xmm4, %xmm6
	; SSE41-NEXT: pmaddwd %xmm4, %xmm0			; SSE41-NEXT: pmaddwd %xmm6, %xmm0
	; SSE41-NEXT: psrld $16, %xmm7			; SSE41-NEXT: psrld $16, %xmm7
	; SSE41-NEXT: psrld $16, %xmm6			; SSE41-NEXT: psrld $16, %xmm8
	; SSE41-NEXT: packusdw %xmm7, %xmm6			; SSE41-NEXT: packusdw %xmm7, %xmm8
	; SSE41-NEXT: psrld $16, %xmm5			; SSE41-NEXT: psrld $16, %xmm5
	; SSE41-NEXT: psrld $16, %xmm0			; SSE41-NEXT: psrld $16, %xmm0
	; SSE41-NEXT: packusdw %xmm5, %xmm0			; SSE41-NEXT: packusdw %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm6, %xmm1			; SSE41-NEXT: movdqa %xmm8, %xmm1
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX2-LABEL: and_mulhuw_v16i16:			; AVX2-LABEL: and_mulhuw_v16i16:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpbroadcastd {{.*#+}} ymm4 = [32767,32767,32767,32767,32767,32767,32767,32767]			; AVX2-NEXT: vpbroadcastd {{.*#+}} ymm4 = [32767,32767,32767,32767,32767,32767,32767,32767]
	; AVX2-NEXT: vpand %ymm4, %ymm1, %ymm1			; AVX2-NEXT: vpand %ymm4, %ymm1, %ymm1
	; AVX2-NEXT: vpand %ymm4, %ymm0, %ymm0			; AVX2-NEXT: vpand %ymm4, %ymm0, %ymm0
	; AVX2-NEXT: vpand %ymm4, %ymm3, %ymm3			; AVX2-NEXT: vpand %ymm4, %ymm3, %ymm3
	▲ Show 20 Lines • Show All 1,699 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/popcnt.ll

	Show All 21 Lines
	; X86-NEXT: movl %ecx, %eax			; X86-NEXT: movl %ecx, %eax
	; X86-NEXT: shrb $4, %al			; X86-NEXT: shrb $4, %al
	; X86-NEXT: addb %cl, %al			; X86-NEXT: addb %cl, %al
	; X86-NEXT: andb $15, %al			; X86-NEXT: andb $15, %al
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: cnt8:			; X64-LABEL: cnt8:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: # kill: def $edi killed $edi def $rdi
	; X64-NEXT: movl %edi, %eax			; X64-NEXT: movl %edi, %eax
	; X64-NEXT: shrb %al			; X64-NEXT: shrb %al
	; X64-NEXT: andb $85, %al			; X64-NEXT: andb $85, %al
	; X64-NEXT: subb %al, %dil			; X64-NEXT: subb %al, %dil
	; X64-NEXT: movl %edi, %eax			; X64-NEXT: movl %edi, %eax
	; X64-NEXT: andb $51, %al			; X64-NEXT: andb $51, %al
	; X64-NEXT: shrb $2, %dil			; X64-NEXT: shrb $2, %dil
	; X64-NEXT: andb $51, %dil			; X64-NEXT: andb $51, %dil
	; X64-NEXT: addb %al, %dil			; X64-NEXT: addb %al, %dil
	; X64-NEXT: movl %edi, %eax			; X64-NEXT: movl %edi, %eax
	; X64-NEXT: shrb $4, %al			; X64-NEXT: shrb $4, %al
	; X64-NEXT: addl %edi, %eax			; X64-NEXT: addb %dil, %al
	; X64-NEXT: andb $15, %al			; X64-NEXT: andb $15, %al
	; X64-NEXT: # kill: def $al killed $al killed $eax
	; X64-NEXT: retq			; X64-NEXT: retq
	;			;
	; X86-POPCNT-LABEL: cnt8:			; X86-POPCNT-LABEL: cnt8:
	; X86-POPCNT: # %bb.0:			; X86-POPCNT: # %bb.0:
	; X86-POPCNT-NEXT: movzbl {{[0-9]+}}(%esp), %eax			; X86-POPCNT-NEXT: movzbl {{[0-9]+}}(%esp), %eax
	; X86-POPCNT-NEXT: popcntl %eax, %eax			; X86-POPCNT-NEXT: popcntl %eax, %eax
	; X86-POPCNT-NEXT: # kill: def $al killed $al killed $eax			; X86-POPCNT-NEXT: # kill: def $al killed $al killed $eax
	; X86-POPCNT-NEXT: retl			; X86-POPCNT-NEXT: retl
	▲ Show 20 Lines • Show All 1,552 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/powi.ll

	Show All 40 Lines
	; X64-LABEL: pow_wrapper:			; X64-LABEL: pow_wrapper:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: movapd %xmm0, %xmm1			; X64-NEXT: movapd %xmm0, %xmm1
	; X64-NEXT: mulsd %xmm0, %xmm1			; X64-NEXT: mulsd %xmm0, %xmm1
	; X64-NEXT: mulsd %xmm1, %xmm0			; X64-NEXT: mulsd %xmm1, %xmm0
	; X64-NEXT: mulsd %xmm1, %xmm1			; X64-NEXT: mulsd %xmm1, %xmm1
	; X64-NEXT: mulsd %xmm1, %xmm0			; X64-NEXT: mulsd %xmm1, %xmm0
	; X64-NEXT: mulsd %xmm1, %xmm1			; X64-NEXT: mulsd %xmm1, %xmm1
	; X64-NEXT: mulsd %xmm0, %xmm1			; X64-NEXT: mulsd %xmm1, %xmm0
	; X64-NEXT: movapd %xmm1, %xmm0
	; X64-NEXT: retq			; X64-NEXT: retq
	%ret = tail call double @llvm.powi.f64.i32(double %a, i32 15) nounwind ; <double> [#uses=1]			%ret = tail call double @llvm.powi.f64.i32(double %a, i32 15) nounwind ; <double> [#uses=1]
	ret double %ret			ret double %ret
	}			}

	define double @pow_wrapper_optsize(double %a) optsize {			define double @pow_wrapper_optsize(double %a) optsize {
	; X86-X87-LABEL: pow_wrapper_optsize:			; X86-X87-LABEL: pow_wrapper_optsize:
	; X86-X87: # %bb.0:			; X86-X87: # %bb.0:
	▲ Show 20 Lines • Show All 117 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/pr42998.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mcpu=skx \| FileCheck %s --check-prefixes=CHECK,FAST-INCDEC			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mcpu=skx \| FileCheck %s --check-prefixes=CHECK,FAST-INCDEC
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mcpu=goldmont \| FileCheck %s --check-prefixes=CHECK,SLOW-INCDEC			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mcpu=goldmont \| FileCheck %s --check-prefixes=CHECK,SLOW-INCDEC

	define i64 @imm1_Oz(i32 %x, i32 %y) minsize nounwind {			define i64 @imm1_Oz(i32 %x, i32 %y) minsize nounwind {
	; CHECK-LABEL: imm1_Oz:			; CHECK-LABEL: imm1_Oz:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: # kill: def $esi killed $esi def $rsi			; CHECK: incl %edi
	; CHECK-NEXT: # kill: def $edi killed $edi def $rdi			; CHECK-NEXT: leal 1(%rsi), %eax
	; CHECK-NEXT: leal 1(%rdi), %eax			; CHECK-NEXT: addq %rdi, %rax
	; CHECK-NEXT: incl %esi
	; CHECK-NEXT: addq %rsi, %rax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%x1 = add i32 %x, 1			%x1 = add i32 %x, 1
	%y1 = add i32 %y, 1			%y1 = add i32 %y, 1
	%x1z = zext i32 %x1 to i64			%x1z = zext i32 %x1 to i64
	%y1z = zext i32 %y1 to i64			%y1z = zext i32 %y1 to i64
	%r = add i64 %x1z, %y1z			%r = add i64 %x1z, %y1z
	ret i64 %r			ret i64 %r
	}			}

	define i64 @imm1_Os(i32 %x, i32 %y) optsize nounwind {			define i64 @imm1_Os(i32 %x, i32 %y) optsize nounwind {
	; CHECK-LABEL: imm1_Os:			; CHECK-LABEL: imm1_Os:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: # kill: def $esi killed $esi def $rsi			; CHECK: incl %edi
	; CHECK-NEXT: # kill: def $edi killed $edi def $rdi			; CHECK-NEXT: leal 1(%rsi), %eax
	; CHECK-NEXT: leal 1(%rdi), %eax			; CHECK-NEXT: addq %rdi, %rax
	; CHECK-NEXT: incl %esi
	; CHECK-NEXT: addq %rsi, %rax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%x1 = add i32 %x, 1			%x1 = add i32 %x, 1
	%y1 = add i32 %y, 1			%y1 = add i32 %y, 1
	%x1z = zext i32 %x1 to i64			%x1z = zext i32 %x1 to i64
	%y1z = zext i32 %y1 to i64			%y1z = zext i32 %y1 to i64
	%r = add i64 %x1z, %y1z			%r = add i64 %x1z, %y1z
	ret i64 %r			ret i64 %r
	}			}

	define i64 @imm1_O2(i32 %x, i32 %y) nounwind {			define i64 @imm1_O2(i32 %x, i32 %y) nounwind {
	; FAST-INCDEC-LABEL: imm1_O2:			; FAST-INCDEC-LABEL: imm1_O2:
	; FAST-INCDEC: # %bb.0:			; FAST-INCDEC: # %bb.0:
	; FAST-INCDEC-NEXT: # kill: def $esi killed $esi def $rsi			; FAST-INCDEC-NEXT: # kill: def $esi killed $esi def $rsi
	; FAST-INCDEC-NEXT: # kill: def $edi killed $edi def $rdi			; FAST-INCDEC-NEXT: # kill: def $edi killed $edi def $rdi
	; FAST-INCDEC-NEXT: leal 1(%rdi), %eax			; FAST-INCDEC-NEXT: incl %edi
	; FAST-INCDEC-NEXT: incl %esi			; FAST-INCDEC-NEXT: leal 1(%rsi), %eax
	; FAST-INCDEC-NEXT: addq %rsi, %rax			; FAST-INCDEC-NEXT: addq %rdi, %rax
	; FAST-INCDEC-NEXT: retq			; FAST-INCDEC-NEXT: retq
	;			;
	; SLOW-INCDEC-LABEL: imm1_O2:			; SLOW-INCDEC-LABEL: imm1_O2:
	; SLOW-INCDEC: # %bb.0:			; SLOW-INCDEC: # %bb.0:
	; SLOW-INCDEC-NEXT: # kill: def $esi killed $esi def $rsi
	; SLOW-INCDEC-NEXT: # kill: def $edi killed $edi def $rdi			; SLOW-INCDEC-NEXT: # kill: def $edi killed $edi def $rdi
	; SLOW-INCDEC-NEXT: leal 1(%rdi), %eax			; SLOW-INCDEC-NEXT: # kill: def $esi killed $esi def $rsi
	; SLOW-INCDEC-NEXT: addl $1, %esi			; SLOW-INCDEC-NEXT: addl $1, %edi
	; SLOW-INCDEC-NEXT: addq %rsi, %rax			; SLOW-INCDEC-NEXT: leal 1(%rsi), %eax
				; SLOW-INCDEC-NEXT: addq %rdi, %rax
	; SLOW-INCDEC-NEXT: retq			; SLOW-INCDEC-NEXT: retq
	%x1 = add i32 %x, 1			%x1 = add i32 %x, 1
	%y1 = add i32 %y, 1			%y1 = add i32 %y, 1
	%x1z = zext i32 %x1 to i64			%x1z = zext i32 %x1 to i64
	%y1z = zext i32 %y1 to i64			%y1z = zext i32 %y1 to i64
	%r = add i64 %x1z, %y1z			%r = add i64 %x1z, %y1z
	ret i64 %r			ret i64 %r
	}			}

llvm/test/CodeGen/X86/recip-fastmath.ll

	Show First 20 Lines • Show All 436 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vmovaps {{.*#+}} xmm2 = [1.0E+0,1.0E+0,1.0E+0,1.0E+0]			; SANDY-NEXT: vmovaps {{.*#+}} xmm2 = [1.0E+0,1.0E+0,1.0E+0,1.0E+0]
	; SANDY-NEXT: vsubps %xmm0, %xmm2, %xmm0			; SANDY-NEXT: vsubps %xmm0, %xmm2, %xmm0
	; SANDY-NEXT: vmulps %xmm0, %xmm1, %xmm0			; SANDY-NEXT: vmulps %xmm0, %xmm1, %xmm0
	; SANDY-NEXT: vaddps %xmm0, %xmm1, %xmm0			; SANDY-NEXT: vaddps %xmm0, %xmm1, %xmm0
	; SANDY-NEXT: retq			; SANDY-NEXT: retq
	;			;
	; HASWELL-LABEL: v4f32_one_step:			; HASWELL-LABEL: v4f32_one_step:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: vrcpps %xmm0, %xmm2			; HASWELL-NEXT: vrcpps %xmm0, %xmm1
	; HASWELL-NEXT: vbroadcastss {{.*#+}} xmm1 = [1.0E+0,1.0E+0,1.0E+0,1.0E+0]			; HASWELL-NEXT: vbroadcastss {{.*#+}} xmm2 = [1.0E+0,1.0E+0,1.0E+0,1.0E+0]
	; HASWELL-NEXT: vfmsub231ps {{.#+}} xmm1 = (xmm2 xmm0) - xmm1			; HASWELL-NEXT: vfmsub213ps {{.#+}} xmm0 = (xmm1 xmm0) - xmm2
	; HASWELL-NEXT: vfnmadd132ps {{.#+}} xmm1 = -(xmm1 xmm2) + xmm2			; HASWELL-NEXT: vfnmadd132ps {{.#+}} xmm0 = -(xmm0 xmm1) + xmm1
	; HASWELL-NEXT: vmovaps %xmm1, %xmm0
	; HASWELL-NEXT: retq			; HASWELL-NEXT: retq
	;			;
	; HASWELL-NO-FMA-LABEL: v4f32_one_step:			; HASWELL-NO-FMA-LABEL: v4f32_one_step:
	; HASWELL-NO-FMA: # %bb.0:			; HASWELL-NO-FMA: # %bb.0:
	; HASWELL-NO-FMA-NEXT: vrcpps %xmm0, %xmm1			; HASWELL-NO-FMA-NEXT: vrcpps %xmm0, %xmm1
	; HASWELL-NO-FMA-NEXT: vmulps %xmm1, %xmm0, %xmm0			; HASWELL-NO-FMA-NEXT: vmulps %xmm1, %xmm0, %xmm0
	; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} xmm2 = [1.0E+0,1.0E+0,1.0E+0,1.0E+0]			; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} xmm2 = [1.0E+0,1.0E+0,1.0E+0,1.0E+0]
	; HASWELL-NO-FMA-NEXT: vsubps %xmm0, %xmm2, %xmm0			; HASWELL-NO-FMA-NEXT: vsubps %xmm0, %xmm2, %xmm0
	; HASWELL-NO-FMA-NEXT: vmulps %xmm0, %xmm1, %xmm0			; HASWELL-NO-FMA-NEXT: vmulps %xmm0, %xmm1, %xmm0
	; HASWELL-NO-FMA-NEXT: vaddps %xmm0, %xmm1, %xmm0			; HASWELL-NO-FMA-NEXT: vaddps %xmm0, %xmm1, %xmm0
	; HASWELL-NO-FMA-NEXT: retq			; HASWELL-NO-FMA-NEXT: retq
	;			;
	; KNL-LABEL: v4f32_one_step:			; KNL-LABEL: v4f32_one_step:
	; KNL: # %bb.0:			; KNL: # %bb.0:
	; KNL-NEXT: vrcpps %xmm0, %xmm2			; KNL-NEXT: vrcpps %xmm0, %xmm1
	; KNL-NEXT: vbroadcastss {{.*#+}} xmm1 = [1.0E+0,1.0E+0,1.0E+0,1.0E+0]			; KNL-NEXT: vbroadcastss {{.*#+}} xmm2 = [1.0E+0,1.0E+0,1.0E+0,1.0E+0]
	; KNL-NEXT: vfmsub231ps {{.#+}} xmm1 = (xmm2 xmm0) - xmm1			; KNL-NEXT: vfmsub213ps {{.#+}} xmm0 = (xmm1 xmm0) - xmm2
	; KNL-NEXT: vfnmadd132ps {{.#+}} xmm1 = -(xmm1 xmm2) + xmm2			; KNL-NEXT: vfnmadd132ps {{.#+}} xmm0 = -(xmm0 xmm1) + xmm1
	; KNL-NEXT: vmovaps %xmm1, %xmm0
	; KNL-NEXT: retq			; KNL-NEXT: retq
	;			;
	; SKX-LABEL: v4f32_one_step:			; SKX-LABEL: v4f32_one_step:
	; SKX: # %bb.0:			; SKX: # %bb.0:
	; SKX-NEXT: vrcpps %xmm0, %xmm1			; SKX-NEXT: vrcpps %xmm0, %xmm1
	; SKX-NEXT: vfmsub213ps {{.#+}} xmm0 = (xmm1 xmm0) - mem			; SKX-NEXT: vfmsub213ps {{.#+}} xmm0 = (xmm1 xmm0) - mem
	; SKX-NEXT: vfnmadd132ps {{.#+}} xmm0 = -(xmm0 xmm1) + xmm1			; SKX-NEXT: vfnmadd132ps {{.#+}} xmm0 = -(xmm0 xmm1) + xmm1
	; SKX-NEXT: retq			; SKX-NEXT: retq
	▲ Show 20 Lines • Show All 330 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: vmovaps {{.*#+}} ymm2 = [1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0]			; SANDY-NEXT: vmovaps {{.*#+}} ymm2 = [1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0]
	; SANDY-NEXT: vsubps %ymm0, %ymm2, %ymm0			; SANDY-NEXT: vsubps %ymm0, %ymm2, %ymm0
	; SANDY-NEXT: vmulps %ymm0, %ymm1, %ymm0			; SANDY-NEXT: vmulps %ymm0, %ymm1, %ymm0
	; SANDY-NEXT: vaddps %ymm0, %ymm1, %ymm0			; SANDY-NEXT: vaddps %ymm0, %ymm1, %ymm0
	; SANDY-NEXT: retq			; SANDY-NEXT: retq
	;			;
	; HASWELL-LABEL: v8f32_one_step:			; HASWELL-LABEL: v8f32_one_step:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: vrcpps %ymm0, %ymm2			; HASWELL-NEXT: vrcpps %ymm0, %ymm1
	; HASWELL-NEXT: vbroadcastss {{.*#+}} ymm1 = [1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0]			; HASWELL-NEXT: vbroadcastss {{.*#+}} ymm2 = [1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0]
	; HASWELL-NEXT: vfmsub231ps {{.#+}} ymm1 = (ymm2 ymm0) - ymm1			; HASWELL-NEXT: vfmsub213ps {{.#+}} ymm0 = (ymm1 ymm0) - ymm2
	; HASWELL-NEXT: vfnmadd132ps {{.#+}} ymm1 = -(ymm1 ymm2) + ymm2			; HASWELL-NEXT: vfnmadd132ps {{.#+}} ymm0 = -(ymm0 ymm1) + ymm1
	; HASWELL-NEXT: vmovaps %ymm1, %ymm0
	; HASWELL-NEXT: retq			; HASWELL-NEXT: retq
	;			;
	; HASWELL-NO-FMA-LABEL: v8f32_one_step:			; HASWELL-NO-FMA-LABEL: v8f32_one_step:
	; HASWELL-NO-FMA: # %bb.0:			; HASWELL-NO-FMA: # %bb.0:
	; HASWELL-NO-FMA-NEXT: vrcpps %ymm0, %ymm1			; HASWELL-NO-FMA-NEXT: vrcpps %ymm0, %ymm1
	; HASWELL-NO-FMA-NEXT: vmulps %ymm1, %ymm0, %ymm0			; HASWELL-NO-FMA-NEXT: vmulps %ymm1, %ymm0, %ymm0
	; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} ymm2 = [1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0]			; HASWELL-NO-FMA-NEXT: vbroadcastss {{.*#+}} ymm2 = [1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0]
	; HASWELL-NO-FMA-NEXT: vsubps %ymm0, %ymm2, %ymm0			; HASWELL-NO-FMA-NEXT: vsubps %ymm0, %ymm2, %ymm0
	; HASWELL-NO-FMA-NEXT: vmulps %ymm0, %ymm1, %ymm0			; HASWELL-NO-FMA-NEXT: vmulps %ymm0, %ymm1, %ymm0
	; HASWELL-NO-FMA-NEXT: vaddps %ymm0, %ymm1, %ymm0			; HASWELL-NO-FMA-NEXT: vaddps %ymm0, %ymm1, %ymm0
	; HASWELL-NO-FMA-NEXT: retq			; HASWELL-NO-FMA-NEXT: retq
	;			;
	; KNL-LABEL: v8f32_one_step:			; KNL-LABEL: v8f32_one_step:
	; KNL: # %bb.0:			; KNL: # %bb.0:
	; KNL-NEXT: vrcpps %ymm0, %ymm2			; KNL-NEXT: vrcpps %ymm0, %ymm1
	; KNL-NEXT: vbroadcastss {{.*#+}} ymm1 = [1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0]			; KNL-NEXT: vbroadcastss {{.*#+}} ymm2 = [1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0,1.0E+0]
	; KNL-NEXT: vfmsub231ps {{.#+}} ymm1 = (ymm2 ymm0) - ymm1			; KNL-NEXT: vfmsub213ps {{.#+}} ymm0 = (ymm1 ymm0) - ymm2
	; KNL-NEXT: vfnmadd132ps {{.#+}} ymm1 = -(ymm1 ymm2) + ymm2			; KNL-NEXT: vfnmadd132ps {{.#+}} ymm0 = -(ymm0 ymm1) + ymm1
	; KNL-NEXT: vmovaps %ymm1, %ymm0
	; KNL-NEXT: retq			; KNL-NEXT: retq
	;			;
	; SKX-LABEL: v8f32_one_step:			; SKX-LABEL: v8f32_one_step:
	; SKX: # %bb.0:			; SKX: # %bb.0:
	; SKX-NEXT: vrcpps %ymm0, %ymm1			; SKX-NEXT: vrcpps %ymm0, %ymm1
	; SKX-NEXT: vfmsub213ps {{.#+}} ymm0 = (ymm1 ymm0) - mem			; SKX-NEXT: vfmsub213ps {{.#+}} ymm0 = (ymm1 ymm0) - mem
	; SKX-NEXT: vfnmadd132ps {{.#+}} ymm0 = -(ymm0 ymm1) + ymm1			; SKX-NEXT: vfnmadd132ps {{.#+}} ymm0 = -(ymm0 ymm1) + ymm1
	; SKX-NEXT: retq			; SKX-NEXT: retq
	▲ Show 20 Lines • Show All 564 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/rev16.ll

	Show All 34 Lines
	; X86-NEXT: shrl $8, %ecx			; X86-NEXT: shrl $8, %ecx
	; X86-NEXT: andl $65280, %ecx # imm = 0xFF00			; X86-NEXT: andl $65280, %ecx # imm = 0xFF00
	; X86-NEXT: andl $16711680, %eax # imm = 0xFF0000			; X86-NEXT: andl $16711680, %eax # imm = 0xFF0000
	; X86-NEXT: orl %ecx, %eax			; X86-NEXT: orl %ecx, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: not_rev16:			; X64-LABEL: not_rev16:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: # kill: def $edi killed $edi def $rdi
	; X64-NEXT: movl %edi, %eax			; X64-NEXT: movl %edi, %eax
	; X64-NEXT: shll $8, %eax			; X64-NEXT: shll $8, %eax
	; X64-NEXT: shrl $8, %edi			; X64-NEXT: shrl $8, %edi
	; X64-NEXT: andl $65280, %edi # imm = 0xFF00			; X64-NEXT: andl $65280, %edi # imm = 0xFF00
	; X64-NEXT: andl $16711680, %eax # imm = 0xFF0000			; X64-NEXT: andl $16711680, %eax # imm = 0xFF0000
	; X64-NEXT: addl %edi, %eax			; X64-NEXT: orl %edi, %eax
	; X64-NEXT: retq			; X64-NEXT: retq
	%l8 = shl i32 %a, 8			%l8 = shl i32 %a, 8
	%r8 = lshr i32 %a, 8			%r8 = lshr i32 %a, 8
	%mask_r8 = and i32 %r8, 4278255360			%mask_r8 = and i32 %r8, 4278255360
	%mask_l8 = and i32 %l8, 16711935			%mask_l8 = and i32 %l8, 16711935
	%tmp = or i32 %mask_r8, %mask_l8			%tmp = or i32 %mask_r8, %mask_l8
	ret i32 %tmp			ret i32 %tmp
	}			}
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; X86-NEXT: shrl $8, %eax			; X86-NEXT: shrl $8, %eax
	; X86-NEXT: andl $-16712192, %ecx # imm = 0xFF00FE00			; X86-NEXT: andl $-16712192, %ecx # imm = 0xFF00FE00
	; X86-NEXT: andl $16711935, %eax # imm = 0xFF00FF			; X86-NEXT: andl $16711935, %eax # imm = 0xFF00FF
	; X86-NEXT: orl %ecx, %eax			; X86-NEXT: orl %ecx, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: different_shift_amount:			; X64-LABEL: different_shift_amount:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: # kill: def $edi killed $edi def $rdi
	; X64-NEXT: movl %edi, %eax			; X64-NEXT: movl %edi, %eax
	; X64-NEXT: shll $9, %eax			; X64-NEXT: shll $9, %eax
	; X64-NEXT: shrl $8, %edi			; X64-NEXT: shrl $8, %edi
	; X64-NEXT: andl $-16712192, %eax # imm = 0xFF00FE00			; X64-NEXT: andl $-16712192, %eax # imm = 0xFF00FE00
	; X64-NEXT: andl $16711935, %edi # imm = 0xFF00FF			; X64-NEXT: andl $16711935, %edi # imm = 0xFF00FF
	; X64-NEXT: addl %edi, %eax			; X64-NEXT: orl %edi, %eax
	; X64-NEXT: retq			; X64-NEXT: retq
	%l8 = shl i32 %a, 9			%l8 = shl i32 %a, 9
	%r8 = lshr i32 %a, 8			%r8 = lshr i32 %a, 8
	%mask_l8 = and i32 %l8, 4278255360			%mask_l8 = and i32 %l8, 4278255360
	%mask_r8 = and i32 %r8, 16711935			%mask_r8 = and i32 %r8, 16711935
	%tmp = or i32 %mask_l8, %mask_r8			%tmp = or i32 %mask_l8, %mask_r8
	ret i32 %tmp			ret i32 %tmp
	}			}
	▲ Show 20 Lines • Show All 111 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/rot16.ll

	Show First 20 Lines • Show All 214 Lines • ▼ Show 20 Lines
	; X86-NEXT: shll $5, %eax			; X86-NEXT: shll $5, %eax
	; X86-NEXT: orl %ecx, %eax			; X86-NEXT: orl %ecx, %eax
	; X86-NEXT: # kill: def $ax killed $ax killed $eax			; X86-NEXT: # kill: def $ax killed $ax killed $eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: rot16_trunc:			; X64-LABEL: rot16_trunc:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: movl %edi, %eax			; X64-NEXT: movl %edi, %eax
	; X64-NEXT: movl %edi, %ecx			; X64-NEXT: shrl $11, %eax
	; X64-NEXT: shrl $11, %ecx			; X64-NEXT: shll $5, %edi
	; X64-NEXT: shll $5, %eax			; X64-NEXT: orl %edi, %eax
	; X64-NEXT: orl %ecx, %eax
	; X64-NEXT: # kill: def $ax killed $ax killed $eax			; X64-NEXT: # kill: def $ax killed $ax killed $eax
	; X64-NEXT: retq			; X64-NEXT: retq
	%t0 = lshr i32 %x, 11			%t0 = lshr i32 %x, 11
	%t1 = shl i32 %x, 5			%t1 = shl i32 %x, 5
	%t2 = or i32 %t0, %t1			%t2 = or i32 %t0, %t1
	%t3 = trunc i32 %t2 to i16			%t3 = trunc i32 %t2 to i16
	ret i16 %t3			ret i16 %t3
	}			}
	▲ Show 20 Lines • Show All 100 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/rotate-extract.ll

	Show First 20 Lines • Show All 150 Lines • ▼ Show 20 Lines
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: no_extract_shl:			; X64-LABEL: no_extract_shl:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: movq %rdi, %rax			; X64-NEXT: movq %rdi, %rax
	; X64-NEXT: shlq $5, %rax			; X64-NEXT: shlq $5, %rax
	; X64-NEXT: shlq $10, %rdi			; X64-NEXT: shlq $10, %rdi
	; X64-NEXT: shrq $57, %rax			; X64-NEXT: shrq $57, %rax
	; X64-NEXT: addq %rdi, %rax			; X64-NEXT: orq %rdi, %rax
	; X64-NEXT: retq			; X64-NEXT: retq
	%lhs_mul = shl i64 %i, 5			%lhs_mul = shl i64 %i, 5
	%rhs_mul = shl i64 %i, 10			%rhs_mul = shl i64 %i, 10
	%lhs_shift = lshr i64 %lhs_mul, 57			%lhs_shift = lshr i64 %lhs_mul, 57
	%out = or i64 %lhs_shift, %rhs_mul			%out = or i64 %lhs_shift, %rhs_mul
	ret i64 %out			ret i64 %out
	}			}

	; Result would overshift			; Result would overshift
	define i32 @no_extract_shrl(i32 %i) nounwind {			define i32 @no_extract_shrl(i32 %i) nounwind {
	; X86-LABEL: no_extract_shrl:			; X86-LABEL: no_extract_shrl:
	; X86: # %bb.0:			; X86: # %bb.0:
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: movl %eax, %ecx			; X86-NEXT: movl %eax, %ecx
	; X86-NEXT: andl $-8, %ecx			; X86-NEXT: andl $-8, %ecx
	; X86-NEXT: shll $25, %ecx			; X86-NEXT: shll $25, %ecx
	; X86-NEXT: shrl $9, %eax			; X86-NEXT: shrl $9, %eax
	; X86-NEXT: orl %ecx, %eax			; X86-NEXT: orl %ecx, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: no_extract_shrl:			; X64-LABEL: no_extract_shrl:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: # kill: def $edi killed $edi def $rdi
	; X64-NEXT: movl %edi, %eax			; X64-NEXT: movl %edi, %eax
	; X64-NEXT: andl $-8, %eax			; X64-NEXT: andl $-8, %eax
	; X64-NEXT: shll $25, %eax			; X64-NEXT: shll $25, %eax
	; X64-NEXT: shrl $9, %edi			; X64-NEXT: shrl $9, %edi
	; X64-NEXT: addl %edi, %eax			; X64-NEXT: orl %edi, %eax
	; X64-NEXT: retq			; X64-NEXT: retq
	%lhs_div = lshr i32 %i, 3			%lhs_div = lshr i32 %i, 3
	%rhs_div = lshr i32 %i, 9			%rhs_div = lshr i32 %i, 9
	%lhs_shift = shl i32 %lhs_div, 28			%lhs_shift = shl i32 %lhs_div, 28
	%out = or i32 %lhs_shift, %rhs_div			%out = or i32 %lhs_shift, %rhs_div
	ret i32 %out			ret i32 %out
	}			}

	▲ Show 20 Lines • Show All 131 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/rotate-multi.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc -mtriple=x86_64-- < %s \| FileCheck %s			; RUN: llc -mtriple=x86_64-- < %s \| FileCheck %s

	; OR of two rotates of %a0(edi).			; OR of two rotates of %a0(edi).
	define i32 @f0(i32 %a0) #0 {			define i32 @f0(i32 %a0) #0 {
	; CHECK-LABEL: f0:			; CHECK-LABEL: f0:
	; CHECK: # %bb.0: # %b0			; CHECK: # %bb.0: # %b0
	; CHECK-NEXT: movl %edi, %eax			; CHECK-NEXT: movl %edi, %eax
	; CHECK-NEXT: movl %edi, %ecx			; CHECK-NEXT: roll $7, %eax
	; CHECK-NEXT: roll $7, %ecx			; CHECK-NEXT: roll $9, %edi
	; CHECK-NEXT: roll $9, %eax			; CHECK-NEXT: orl %edi, %eax
	; CHECK-NEXT: orl %ecx, %eax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	b0:			b0:
	%v0 = shl i32 %a0, 7			%v0 = shl i32 %a0, 7
	%v1 = lshr i32 %a0, 25			%v1 = lshr i32 %a0, 25
	%v2 = or i32 %v0, %v1			%v2 = or i32 %v0, %v1
	%v3 = shl i32 %a0, 9			%v3 = shl i32 %a0, 9
	%v4 = lshr i32 %a0, 23			%v4 = lshr i32 %a0, 23
	%v5 = or i32 %v3, %v4			%v5 = or i32 %v3, %v4
	%v6 = or i32 %v2, %v5			%v6 = or i32 %v2, %v5
	ret i32 %v6			ret i32 %v6
	}			}

	; OR of two rotates of %a0(edi) with an extra input %a1(esi).			; OR of two rotates of %a0(edi) with an extra input %a1(esi).
	define i32 @f1(i32 %a0, i32 %a1) #0 {			define i32 @f1(i32 %a0, i32 %a1) #0 {
	; CHECK-LABEL: f1:			; CHECK-LABEL: f1:
	; CHECK: # %bb.0: # %b0			; CHECK: # %bb.0: # %b0
	; CHECK-NEXT: movl %edi, %eax			; CHECK-NEXT: movl %edi, %eax
	; CHECK-NEXT: movl %edi, %ecx			; CHECK-NEXT: shll $7, %eax
	; CHECK-NEXT: shll $7, %ecx			; CHECK-NEXT: roll $9, %edi
	; CHECK-NEXT: roll $9, %eax			; CHECK-NEXT: orl %esi, %edi
	; CHECK-NEXT: orl %esi, %eax			; CHECK-NEXT: orl %edi, %eax
	; CHECK-NEXT: orl %ecx, %eax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	b0:			b0:
	%v0 = shl i32 %a0, 7			%v0 = shl i32 %a0, 7
	%v1 = lshr i32 %a0, 25			%v1 = lshr i32 %a0, 25
	%v2 = or i32 %v0, %a1			%v2 = or i32 %v0, %a1
	%v3 = shl i32 %a0, 9			%v3 = shl i32 %a0, 9
	%v4 = lshr i32 %a0, 23			%v4 = lshr i32 %a0, 23
	%v5 = or i32 %v3, %v4			%v5 = or i32 %v3, %v4
	%v6 = or i32 %v2, %v5			%v6 = or i32 %v2, %v5
	%v7 = or i32 %v6, %v1			%v7 = or i32 %v6, %v1
	ret i32 %v6			ret i32 %v6
	}			}

	; OR of two rotates of two different inputs: %a0(edi) and %a1(esi).			; OR of two rotates of two different inputs: %a0(edi) and %a1(esi).
	define i32 @f2(i32 %a0, i32 %a1) #0 {			define i32 @f2(i32 %a0, i32 %a1) #0 {
	; CHECK-LABEL: f2:			; CHECK-LABEL: f2:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: movl %esi, %eax
	; CHECK-NEXT: movl %edi, %ecx			; CHECK-NEXT: movl %edi, %ecx
	; CHECK-NEXT: shll $11, %ecx			; CHECK-NEXT: shll $11, %ecx
	; CHECK-NEXT: shrl $21, %edi			; CHECK-NEXT: shrl $21, %edi
	; CHECK-NEXT: movl %esi, %edx			; CHECK-NEXT: movl %esi, %eax
	; CHECK-NEXT: shll $19, %edx			; CHECK-NEXT: shll $19, %eax
	; CHECK-NEXT: shrl $13, %eax			; CHECK-NEXT: shrl $13, %esi
	; CHECK-NEXT: orl %edi, %eax			; CHECK-NEXT: orl %edi, %esi
	; CHECK-NEXT: orl %edx, %eax			; CHECK-NEXT: orl %esi, %eax
	; CHECK-NEXT: orl %ecx, %eax			; CHECK-NEXT: orl %ecx, %eax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%v0 = shl i32 %a0, 11			%v0 = shl i32 %a0, 11
	%v1 = lshr i32 %a0, 21			%v1 = lshr i32 %a0, 21
	%v2 = shl i32 %a1, 19			%v2 = shl i32 %a1, 19
	%v3 = lshr i32 %a1, 13			%v3 = lshr i32 %a1, 13
	%v4 = or i32 %v0, %v2			%v4 = or i32 %v0, %v2
	%v5 = or i32 %v1, %v3			%v5 = or i32 %v1, %v3
	%v6 = or i32 %v4, %v5			%v6 = or i32 %v4, %v5
	ret i32 %v6			ret i32 %v6
	}			}

	; ORs of multiple shifts of the same value with only one pair actually			; ORs of multiple shifts of the same value with only one pair actually
	; matching a rotate.			; matching a rotate.
	define i32 @f3(i32 %a0) #0 {			define i32 @f3(i32 %a0) #0 {
	; CHECK-LABEL: f3:			; CHECK-LABEL: f3:
	; CHECK: # %bb.0: # %b0			; CHECK: # %bb.0: # %b0
	; CHECK-NEXT: # kill: def $edi killed $edi def $rdi			; CHECK-NEXT: # kill: def $edi killed $edi def $rdi
	; CHECK-NEXT: leal (,%rdi,8), %eax			; CHECK-NEXT: leal (,%rdi,8), %ecx
	; CHECK-NEXT: movl %edi, %ecx			; CHECK-NEXT: movl %edi, %eax
	; CHECK-NEXT: shll $5, %ecx			; CHECK-NEXT: shll $5, %eax
	; CHECK-NEXT: movl %edi, %edx			; CHECK-NEXT: movl %edi, %edx
	; CHECK-NEXT: shll $7, %edx			; CHECK-NEXT: shll $7, %edx
	; CHECK-NEXT: orl %ecx, %edx			; CHECK-NEXT: orl %eax, %edx
	; CHECK-NEXT: movl %edi, %ecx			; CHECK-NEXT: movl %edi, %eax
	; CHECK-NEXT: shll $13, %ecx			; CHECK-NEXT: shll $13, %eax
	; CHECK-NEXT: orl %edx, %ecx			; CHECK-NEXT: orl %edx, %eax
	; CHECK-NEXT: movl %edi, %edx			; CHECK-NEXT: movl %edi, %edx
	; CHECK-NEXT: shll $19, %edx			; CHECK-NEXT: shll $19, %edx
	; CHECK-NEXT: orl %ecx, %edx			; CHECK-NEXT: orl %eax, %edx
	; CHECK-NEXT: movl %edi, %ecx			; CHECK-NEXT: movl %edi, %eax
	; CHECK-NEXT: shrl $2, %ecx			; CHECK-NEXT: shrl $2, %eax
	; CHECK-NEXT: orl %edx, %ecx			; CHECK-NEXT: orl %edx, %eax
	; CHECK-NEXT: movl %edi, %edx			; CHECK-NEXT: movl %edi, %edx
	; CHECK-NEXT: shrl $15, %edx			; CHECK-NEXT: shrl $15, %edx
	; CHECK-NEXT: orl %ecx, %edx			; CHECK-NEXT: orl %eax, %edx
	; CHECK-NEXT: movl %edi, %ecx			; CHECK-NEXT: movl %edi, %esi
	; CHECK-NEXT: shrl $23, %ecx			; CHECK-NEXT: shrl $23, %esi
	; CHECK-NEXT: orl %edx, %ecx			; CHECK-NEXT: orl %edx, %esi
	; CHECK-NEXT: movl %edi, %edx			; CHECK-NEXT: movl %edi, %eax
	; CHECK-NEXT: shrl $25, %edx			; CHECK-NEXT: shrl $25, %eax
	; CHECK-NEXT: orl %ecx, %edx			; CHECK-NEXT: orl %esi, %eax
	; CHECK-NEXT: shrl $30, %edi			; CHECK-NEXT: shrl $30, %edi
	; CHECK-NEXT: orl %edx, %edi
	; CHECK-NEXT: orl %edi, %eax			; CHECK-NEXT: orl %edi, %eax
				; CHECK-NEXT: orl %ecx, %eax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	b0:			b0:
	%v0 = shl i32 %a0, 3			%v0 = shl i32 %a0, 3
	%v1 = shl i32 %a0, 5			%v1 = shl i32 %a0, 5
	%v2 = shl i32 %a0, 7 ; rotate			%v2 = shl i32 %a0, 7 ; rotate
	%v3 = shl i32 %a0, 13			%v3 = shl i32 %a0, 13
	%v4 = shl i32 %a0, 19			%v4 = shl i32 %a0, 19
	%v5 = lshr i32 %a0, 2			%v5 = lshr i32 %a0, 2
	Show All 17 Lines

llvm/test/CodeGen/X86/sat-add.ll

Show First 20 Lines • Show All 224 Lines • ▼ Show 20 Lines	; ANY-NEXT: retq
%c = icmp ugt i8 %x, %noty		%c = icmp ugt i8 %x, %noty
%r = select i1 %c, i8 -1, i8 %a		%r = select i1 %c, i8 -1, i8 %a
ret i8 %r		ret i8 %r
}		}

define i16 @unsigned_sat_variable_i16_using_min(i16 %x, i16 %y) {		define i16 @unsigned_sat_variable_i16_using_min(i16 %x, i16 %y) {
; ANY-LABEL: unsigned_sat_variable_i16_using_min:		; ANY-LABEL: unsigned_sat_variable_i16_using_min:
; ANY: # %bb.0:		; ANY: # %bb.0:
; ANY-NEXT: # kill: def $esi killed $esi def $rsi
; ANY-NEXT: movl %esi, %eax		; ANY-NEXT: movl %esi, %eax
; ANY-NEXT: notl %eax		; ANY-NEXT: notl %eax
; ANY-NEXT: cmpw %ax, %di		; ANY-NEXT: cmpw %ax, %di
; ANY-NEXT: cmovbl %edi, %eax		; ANY-NEXT: cmovbl %edi, %eax
; ANY-NEXT: addl %esi, %eax		; ANY-NEXT: addl %esi, %eax
; ANY-NEXT: # kill: def $ax killed $ax killed $eax		; ANY-NEXT: # kill: def $ax killed $ax killed $eax
; ANY-NEXT: retq		; ANY-NEXT: retq
%noty = xor i16 %y, -1		%noty = xor i16 %y, -1
Show All 30 Lines	; ANY-NEXT: retq
%c = icmp ugt i16 %x, %noty		%c = icmp ugt i16 %x, %noty
%r = select i1 %c, i16 -1, i16 %a		%r = select i1 %c, i16 -1, i16 %a
ret i16 %r		ret i16 %r
}		}

define i32 @unsigned_sat_variable_i32_using_min(i32 %x, i32 %y) {		define i32 @unsigned_sat_variable_i32_using_min(i32 %x, i32 %y) {
; ANY-LABEL: unsigned_sat_variable_i32_using_min:		; ANY-LABEL: unsigned_sat_variable_i32_using_min:
; ANY: # %bb.0:		; ANY: # %bb.0:
; ANY-NEXT: # kill: def $esi killed $esi def $rsi
; ANY-NEXT: movl %esi, %eax		; ANY-NEXT: movl %esi, %eax
; ANY-NEXT: notl %eax		; ANY-NEXT: notl %eax
; ANY-NEXT: cmpl %eax, %edi		; ANY-NEXT: cmpl %eax, %edi
; ANY-NEXT: cmovbl %edi, %eax		; ANY-NEXT: cmovbl %edi, %eax
; ANY-NEXT: addl %esi, %eax		; ANY-NEXT: addl %esi, %eax
; ANY-NEXT: retq		; ANY-NEXT: retq
%noty = xor i32 %y, -1		%noty = xor i32 %y, -1
%c = icmp ult i32 %x, %noty		%c = icmp ult i32 %x, %noty
▲ Show 20 Lines • Show All 423 Lines • ▼ Show 20 Lines
; SSE41-NEXT: pand %xmm4, %xmm2		; SSE41-NEXT: pand %xmm4, %xmm2
; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]		; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]
; SSE41-NEXT: por %xmm1, %xmm0		; SSE41-NEXT: por %xmm1, %xmm0
; SSE41-NEXT: por %xmm2, %xmm0		; SSE41-NEXT: por %xmm2, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; SSE42-LABEL: unsigned_sat_constant_v2i64_using_cmp_sum:		; SSE42-LABEL: unsigned_sat_constant_v2i64_using_cmp_sum:
; SSE42: # %bb.0:		; SSE42: # %bb.0:
; SSE42-NEXT: movdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]		; SSE42-NEXT: movdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]
; SSE42-NEXT: movdqa %xmm0, %xmm1		; SSE42-NEXT: movdqa %xmm0, %xmm2
; SSE42-NEXT: pxor %xmm2, %xmm1		; SSE42-NEXT: pxor %xmm1, %xmm2
; SSE42-NEXT: paddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0		; SSE42-NEXT: paddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE42-NEXT: pxor %xmm0, %xmm2		; SSE42-NEXT: pxor %xmm0, %xmm1
; SSE42-NEXT: pcmpgtq %xmm2, %xmm1		; SSE42-NEXT: pcmpgtq %xmm1, %xmm2
; SSE42-NEXT: por %xmm0, %xmm1		; SSE42-NEXT: por %xmm2, %xmm0
; SSE42-NEXT: movdqa %xmm1, %xmm0
; SSE42-NEXT: retq		; SSE42-NEXT: retq
;		;
; AVX2-LABEL: unsigned_sat_constant_v2i64_using_cmp_sum:		; AVX2-LABEL: unsigned_sat_constant_v2i64_using_cmp_sum:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]		; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]
; AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm2		; AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm2
; AVX2-NEXT: vpaddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0		; AVX2-NEXT: vpaddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
; AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm1		; AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm1
▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
; SSE41-NEXT: pand %xmm4, %xmm2		; SSE41-NEXT: pand %xmm4, %xmm2
; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]		; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,1,3,3]
; SSE41-NEXT: por %xmm1, %xmm0		; SSE41-NEXT: por %xmm1, %xmm0
; SSE41-NEXT: por %xmm2, %xmm0		; SSE41-NEXT: por %xmm2, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; SSE42-LABEL: unsigned_sat_constant_v2i64_using_cmp_notval:		; SSE42-LABEL: unsigned_sat_constant_v2i64_using_cmp_notval:
; SSE42: # %bb.0:		; SSE42: # %bb.0:
; SSE42-NEXT: movdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]		; SSE42-NEXT: movdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]
; SSE42-NEXT: movdqa %xmm0, %xmm1		; SSE42-NEXT: movdqa %xmm0, %xmm2
; SSE42-NEXT: pxor %xmm2, %xmm1		; SSE42-NEXT: pxor %xmm1, %xmm2
; SSE42-NEXT: paddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0		; SSE42-NEXT: paddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE42-NEXT: pxor %xmm0, %xmm2		; SSE42-NEXT: pxor %xmm0, %xmm1
; SSE42-NEXT: pcmpgtq %xmm2, %xmm1		; SSE42-NEXT: pcmpgtq %xmm1, %xmm2
; SSE42-NEXT: por %xmm0, %xmm1		; SSE42-NEXT: por %xmm2, %xmm0
; SSE42-NEXT: movdqa %xmm1, %xmm0
; SSE42-NEXT: retq		; SSE42-NEXT: retq
;		;
; AVX2-LABEL: unsigned_sat_constant_v2i64_using_cmp_notval:		; AVX2-LABEL: unsigned_sat_constant_v2i64_using_cmp_notval:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]		; AVX2-NEXT: vmovdqa {{.*#+}} xmm1 = [9223372036854775808,9223372036854775808]
; AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm2		; AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm2
; AVX2-NEXT: vpaddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0		; AVX2-NEXT: vpaddq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
; AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm1		; AVX2-NEXT: vpxor %xmm1, %xmm0, %xmm1
▲ Show 20 Lines • Show All 568 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/sdiv_fix.ll

	Show First 20 Lines • Show All 271 Lines • ▼ Show 20 Lines
	; X64-NEXT: shlq $31, %r15			; X64-NEXT: shlq $31, %r15
	; X64-NEXT: movq %rsi, %r12			; X64-NEXT: movq %rsi, %r12
	; X64-NEXT: sarq $63, %r12			; X64-NEXT: sarq $63, %r12
	; X64-NEXT: movq %r15, %rdi			; X64-NEXT: movq %r15, %rdi
	; X64-NEXT: movq %rbx, %rsi			; X64-NEXT: movq %rbx, %rsi
	; X64-NEXT: movq %r14, %rdx			; X64-NEXT: movq %r14, %rdx
	; X64-NEXT: movq %r12, %rcx			; X64-NEXT: movq %r12, %rcx
	; X64-NEXT: callq __divti3@PLT			; X64-NEXT: callq __divti3@PLT
	; X64-NEXT: movq %rax, %r13
	; X64-NEXT: decq %rax
	; X64-NEXT: movq %rax, (%rsp) # 8-byte Spill			; X64-NEXT: movq %rax, (%rsp) # 8-byte Spill
				; X64-NEXT: leaq -1(%rax), %rbp
	; X64-NEXT: testq %rbx, %rbx			; X64-NEXT: testq %rbx, %rbx
	; X64-NEXT: sets %al			; X64-NEXT: sets %al
	; X64-NEXT: testq %r12, %r12			; X64-NEXT: testq %r12, %r12
	; X64-NEXT: sets %bpl			; X64-NEXT: sets %r13b
	; X64-NEXT: xorb %al, %bpl			; X64-NEXT: xorb %al, %r13b
	; X64-NEXT: movq %r15, %rdi			; X64-NEXT: movq %r15, %rdi
	; X64-NEXT: movq %rbx, %rsi			; X64-NEXT: movq %rbx, %rsi
	; X64-NEXT: movq %r14, %rdx			; X64-NEXT: movq %r14, %rdx
	; X64-NEXT: movq %r12, %rcx			; X64-NEXT: movq %r12, %rcx
	; X64-NEXT: callq __modti3@PLT			; X64-NEXT: callq __modti3@PLT
	; X64-NEXT: orq %rax, %rdx			; X64-NEXT: orq %rax, %rdx
	; X64-NEXT: setne %al			; X64-NEXT: setne %al
	; X64-NEXT: testb %bpl, %al			; X64-NEXT: testb %r13b, %al
	; X64-NEXT: cmovneq (%rsp), %r13 # 8-byte Folded Reload			; X64-NEXT: cmoveq (%rsp), %rbp # 8-byte Folded Reload
	; X64-NEXT: movq %r13, %rax			; X64-NEXT: movq %rbp, %rax
	; X64-NEXT: addq $8, %rsp			; X64-NEXT: addq $8, %rsp
	; X64-NEXT: popq %rbx			; X64-NEXT: popq %rbx
	; X64-NEXT: popq %r12			; X64-NEXT: popq %r12
	; X64-NEXT: popq %r13			; X64-NEXT: popq %r13
	; X64-NEXT: popq %r14			; X64-NEXT: popq %r14
	; X64-NEXT: popq %r15			; X64-NEXT: popq %r15
	; X64-NEXT: popq %rbp			; X64-NEXT: popq %rbp
	; X64-NEXT: retq			; X64-NEXT: retq
	▲ Show 20 Lines • Show All 407 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/select-constant-xor.ll

Show First 20 Lines • Show All 129 Lines • ▼ Show 20 Lines	; CHECK-NEXT: retq
%c = icmp ne i32 %sh, -1		%c = icmp ne i32 %sh, -1
%s = select i1 %c, i32 %a, i32 %b		%s = select i1 %c, i32 %a, i32 %b
ret i32 %s		ret i32 %s
}		}

define i32 @oneusecmp(i32 %a, i32 %b, i32 %d) {		define i32 @oneusecmp(i32 %a, i32 %b, i32 %d) {
; CHECK-LABEL: oneusecmp:		; CHECK-LABEL: oneusecmp:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: # kill: def $esi killed $esi def $rsi
; CHECK-NEXT: movl %edi, %eax		; CHECK-NEXT: movl %edi, %eax
; CHECK-NEXT: sarl $31, %eax		; CHECK-NEXT: sarl $31, %eax
; CHECK-NEXT: xorl $127, %eax		; CHECK-NEXT: xorl $127, %eax
; CHECK-NEXT: testl %edi, %edi		; CHECK-NEXT: testl %edi, %edi
; CHECK-NEXT: cmovsl %edx, %esi		; CHECK-NEXT: cmovsl %edx, %esi
; CHECK-NEXT: addl %esi, %eax		; CHECK-NEXT: addl %esi, %eax
; CHECK-NEXT: retq		; CHECK-NEXT: retq
%c = icmp sle i32 %a, -1		%c = icmp sle i32 %a, -1
%s = select i1 %c, i32 -128, i32 127		%s = select i1 %c, i32 -128, i32 127
%s2 = select i1 %c, i32 %d, i32 %b		%s2 = select i1 %c, i32 %d, i32 %b
%x = add i32 %s, %s2		%x = add i32 %s, %s2
ret i32 %x		ret i32 %x
}		}

llvm/test/CodeGen/X86/select.ll

	Show First 20 Lines • Show All 1,542 Lines • ▼ Show 20 Lines
	%0 = or i32 %B, %A			%0 = or i32 %B, %A
	%1 = select i1 %cmp10, i32 %A, i32 %0			%1 = select i1 %cmp10, i32 %A, i32 %0
	ret i32 %1			ret i32 %1
	}			}

	define i64 @PR51612(i64 %x, i64 %y) {			define i64 @PR51612(i64 %x, i64 %y) {
	; CHECK-LABEL: PR51612:			; CHECK-LABEL: PR51612:
	; CHECK: ## %bb.0:			; CHECK: ## %bb.0:
	; CHECK-NEXT: movq %rdi, %rax			; CHECK-NEXT: leal 1(%rsi), %eax
	; CHECK-NEXT: incl %esi			; CHECK-NEXT: incq %rdi
	; CHECK-NEXT: incq %rax			; CHECK-NEXT: cmovnel %edi, %eax
	; CHECK-NEXT: cmovel %esi, %eax
	; CHECK-NEXT: andl 10, %eax			; CHECK-NEXT: andl 10, %eax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	;			;
	; ATHLON-LABEL: PR51612:			; ATHLON-LABEL: PR51612:
	; ATHLON: ## %bb.0:			; ATHLON: ## %bb.0:
	; ATHLON-NEXT: movl {{[0-9]+}}(%esp), %eax			; ATHLON-NEXT: movl {{[0-9]+}}(%esp), %eax
	; ATHLON-NEXT: movl {{[0-9]+}}(%esp), %ecx			; ATHLON-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; ATHLON-NEXT: movl {{[0-9]+}}(%esp), %edx			; ATHLON-NEXT: movl {{[0-9]+}}(%esp), %edx
	▲ Show 20 Lines • Show All 133 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/shift-logic.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-- \| FileCheck %s			; RUN: llc < %s -mtriple=x86_64-- \| FileCheck %s

	define i8 @shl_and(i8 %x, i8 %y) nounwind {			define i8 @shl_and(i8 %x, i8 %y) nounwind {
	; CHECK-LABEL: shl_and:			; CHECK-LABEL: shl_and:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: movl %edi, %eax			; CHECK-NEXT: # kill: def $esi killed $esi def $rsi
	; CHECK-NEXT: shlb $2, %sil			; CHECK-NEXT: leal (,%rsi,4), %eax
	; CHECK-NEXT: shlb $5, %al			; CHECK-NEXT: shlb $5, %dil
	; CHECK-NEXT: andb %sil, %al			; CHECK-NEXT: andb %dil, %al
	; CHECK-NEXT: # kill: def $al killed $al killed $eax			; CHECK-NEXT: # kill: def $al killed $al killed $eax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%sh0 = shl i8 %x, 3			%sh0 = shl i8 %x, 3
	%r = and i8 %sh0, %y			%r = and i8 %sh0, %y
	%sh1 = shl i8 %r, 2			%sh1 = shl i8 %r, 2
	ret i8 %sh1			ret i8 %sh1
	}			}

	▲ Show 20 Lines • Show All 171 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/smax.ll

	Show First 20 Lines • Show All 135 Lines • ▼ Show 20 Lines
	; X86-NEXT: retl			; X86-NEXT: retl
	%r = call i64 @llvm.smax.i64(i64 %a, i64 %b)			%r = call i64 @llvm.smax.i64(i64 %a, i64 %b)
	ret i64 %r			ret i64 %r
	}			}

	define i128 @test_i128(i128 %a, i128 %b) nounwind {			define i128 @test_i128(i128 %a, i128 %b) nounwind {
	; X64-LABEL: test_i128:			; X64-LABEL: test_i128:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: movq %rdx, %rax
	; X64-NEXT: cmpq %rdx, %rdi			; X64-NEXT: cmpq %rdx, %rdi
	; X64-NEXT: cmovaq %rdi, %rdx			; X64-NEXT: movq %rdx, %rax
				; X64-NEXT: cmovaq %rdi, %rax
	; X64-NEXT: cmpq %rcx, %rsi			; X64-NEXT: cmpq %rcx, %rsi
	; X64-NEXT: cmovgq %rdi, %rax			; X64-NEXT: cmovgq %rdi, %rdx
	; X64-NEXT: cmoveq %rdx, %rax			; X64-NEXT: cmovneq %rdx, %rax
	; X64-NEXT: cmovgq %rsi, %rcx			; X64-NEXT: cmovgq %rsi, %rcx
	; X64-NEXT: movq %rcx, %rdx			; X64-NEXT: movq %rcx, %rdx
	; X64-NEXT: retq			; X64-NEXT: retq
	;			;
	; X86-LABEL: test_i128:			; X86-LABEL: test_i128:
	; X86: # %bb.0:			; X86: # %bb.0:
	; X86-NEXT: pushl %ebp			; X86-NEXT: pushl %ebp
	; X86-NEXT: pushl %ebx			; X86-NEXT: pushl %ebx
	▲ Show 20 Lines • Show All 75 Lines • ▼ Show 20 Lines

	define <2 x i32> @test_v2i32(<2 x i32> %a, <2 x i32> %b) nounwind {			define <2 x i32> @test_v2i32(<2 x i32> %a, <2 x i32> %b) nounwind {
	; SSE-LABEL: test_v2i32:			; SSE-LABEL: test_v2i32:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movdqa %xmm0, %xmm2			; SSE-NEXT: movdqa %xmm0, %xmm2
	; SSE-NEXT: pcmpgtd %xmm1, %xmm2			; SSE-NEXT: pcmpgtd %xmm1, %xmm2
	; SSE-NEXT: pand %xmm2, %xmm0			; SSE-NEXT: pand %xmm2, %xmm0
	; SSE-NEXT: pandn %xmm1, %xmm2			; SSE-NEXT: pandn %xmm1, %xmm2
	; SSE-NEXT: por %xmm0, %xmm2			; SSE-NEXT: por %xmm2, %xmm0
	; SSE-NEXT: movdqa %xmm2, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v2i32:			; AVX-LABEL: test_v2i32:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpmaxsd %xmm1, %xmm0, %xmm0			; AVX-NEXT: vpmaxsd %xmm1, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; X86-LABEL: test_v2i32:			; X86-LABEL: test_v2i32:
	Show All 15 Lines

	define <3 x i32> @test_v3i32(<3 x i32> %a, <3 x i32> %b) nounwind {			define <3 x i32> @test_v3i32(<3 x i32> %a, <3 x i32> %b) nounwind {
	; SSE-LABEL: test_v3i32:			; SSE-LABEL: test_v3i32:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movdqa %xmm0, %xmm2			; SSE-NEXT: movdqa %xmm0, %xmm2
	; SSE-NEXT: pcmpgtd %xmm1, %xmm2			; SSE-NEXT: pcmpgtd %xmm1, %xmm2
	; SSE-NEXT: pand %xmm2, %xmm0			; SSE-NEXT: pand %xmm2, %xmm0
	; SSE-NEXT: pandn %xmm1, %xmm2			; SSE-NEXT: pandn %xmm1, %xmm2
	; SSE-NEXT: por %xmm0, %xmm2			; SSE-NEXT: por %xmm2, %xmm0
	; SSE-NEXT: movdqa %xmm2, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v3i32:			; AVX-LABEL: test_v3i32:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpmaxsd %xmm1, %xmm0, %xmm0			; AVX-NEXT: vpmaxsd %xmm1, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; X86-LABEL: test_v3i32:			; X86-LABEL: test_v3i32:
	Show All 23 Lines

	define <4 x i32> @test_v4i32(<4 x i32> %a, <4 x i32> %b) nounwind {			define <4 x i32> @test_v4i32(<4 x i32> %a, <4 x i32> %b) nounwind {
	; SSE-LABEL: test_v4i32:			; SSE-LABEL: test_v4i32:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movdqa %xmm0, %xmm2			; SSE-NEXT: movdqa %xmm0, %xmm2
	; SSE-NEXT: pcmpgtd %xmm1, %xmm2			; SSE-NEXT: pcmpgtd %xmm1, %xmm2
	; SSE-NEXT: pand %xmm2, %xmm0			; SSE-NEXT: pand %xmm2, %xmm0
	; SSE-NEXT: pandn %xmm1, %xmm2			; SSE-NEXT: pandn %xmm1, %xmm2
	; SSE-NEXT: por %xmm0, %xmm2			; SSE-NEXT: por %xmm2, %xmm0
	; SSE-NEXT: movdqa %xmm2, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v4i32:			; AVX-LABEL: test_v4i32:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpmaxsd %xmm1, %xmm0, %xmm0			; AVX-NEXT: vpmaxsd %xmm1, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; X86-LABEL: test_v4i32:			; X86-LABEL: test_v4i32:
	Show All 30 Lines

	define <8 x i32> @test_v8i32(<8 x i32> %a, <8 x i32> %b) nounwind {			define <8 x i32> @test_v8i32(<8 x i32> %a, <8 x i32> %b) nounwind {
	; SSE-LABEL: test_v8i32:			; SSE-LABEL: test_v8i32:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movdqa %xmm0, %xmm4			; SSE-NEXT: movdqa %xmm0, %xmm4
	; SSE-NEXT: pcmpgtd %xmm2, %xmm4			; SSE-NEXT: pcmpgtd %xmm2, %xmm4
	; SSE-NEXT: pand %xmm4, %xmm0			; SSE-NEXT: pand %xmm4, %xmm0
	; SSE-NEXT: pandn %xmm2, %xmm4			; SSE-NEXT: pandn %xmm2, %xmm4
	; SSE-NEXT: por %xmm0, %xmm4			; SSE-NEXT: por %xmm4, %xmm0
	; SSE-NEXT: movdqa %xmm1, %xmm2			; SSE-NEXT: movdqa %xmm1, %xmm2
	; SSE-NEXT: pcmpgtd %xmm3, %xmm2			; SSE-NEXT: pcmpgtd %xmm3, %xmm2
	; SSE-NEXT: pand %xmm2, %xmm1			; SSE-NEXT: pand %xmm2, %xmm1
	; SSE-NEXT: pandn %xmm3, %xmm2			; SSE-NEXT: pandn %xmm3, %xmm2
	; SSE-NEXT: por %xmm1, %xmm2			; SSE-NEXT: por %xmm2, %xmm1
	; SSE-NEXT: movdqa %xmm4, %xmm0
	; SSE-NEXT: movdqa %xmm2, %xmm1
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-LABEL: test_v8i32:			; AVX1-LABEL: test_v8i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vpmaxsd %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpmaxsd %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpmaxsd %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpmaxsd %xmm1, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 144 Lines • ▼ Show 20 Lines

	define <16 x i8> @test_v16i8(<16 x i8> %a, <16 x i8> %b) nounwind {			define <16 x i8> @test_v16i8(<16 x i8> %a, <16 x i8> %b) nounwind {
	; SSE-LABEL: test_v16i8:			; SSE-LABEL: test_v16i8:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movdqa %xmm0, %xmm2			; SSE-NEXT: movdqa %xmm0, %xmm2
	; SSE-NEXT: pcmpgtb %xmm1, %xmm2			; SSE-NEXT: pcmpgtb %xmm1, %xmm2
	; SSE-NEXT: pand %xmm2, %xmm0			; SSE-NEXT: pand %xmm2, %xmm0
	; SSE-NEXT: pandn %xmm1, %xmm2			; SSE-NEXT: pandn %xmm1, %xmm2
	; SSE-NEXT: por %xmm0, %xmm2			; SSE-NEXT: por %xmm2, %xmm0
	; SSE-NEXT: movdqa %xmm2, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v16i8:			; AVX-LABEL: test_v16i8:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpmaxsb %xmm1, %xmm0, %xmm0			; AVX-NEXT: vpmaxsb %xmm1, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; X86-LABEL: test_v16i8:			; X86-LABEL: test_v16i8:
	▲ Show 20 Lines • Show All 122 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/smin.ll

	Show First 20 Lines • Show All 135 Lines • ▼ Show 20 Lines
	; X86-NEXT: retl			; X86-NEXT: retl
	%r = call i64 @llvm.smin.i64(i64 %a, i64 %b)			%r = call i64 @llvm.smin.i64(i64 %a, i64 %b)
	ret i64 %r			ret i64 %r
	}			}

	define i128 @test_i128(i128 %a, i128 %b) nounwind {			define i128 @test_i128(i128 %a, i128 %b) nounwind {
	; X64-LABEL: test_i128:			; X64-LABEL: test_i128:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: movq %rdx, %rax
	; X64-NEXT: cmpq %rdx, %rdi			; X64-NEXT: cmpq %rdx, %rdi
	; X64-NEXT: cmovbq %rdi, %rdx			; X64-NEXT: movq %rdx, %rax
				; X64-NEXT: cmovbq %rdi, %rax
	; X64-NEXT: cmpq %rcx, %rsi			; X64-NEXT: cmpq %rcx, %rsi
	; X64-NEXT: cmovlq %rdi, %rax			; X64-NEXT: cmovlq %rdi, %rdx
	; X64-NEXT: cmoveq %rdx, %rax			; X64-NEXT: cmovneq %rdx, %rax
	; X64-NEXT: cmovlq %rsi, %rcx			; X64-NEXT: cmovlq %rsi, %rcx
	; X64-NEXT: movq %rcx, %rdx			; X64-NEXT: movq %rcx, %rdx
	; X64-NEXT: retq			; X64-NEXT: retq
	;			;
	; X86-LABEL: test_i128:			; X86-LABEL: test_i128:
	; X86: # %bb.0:			; X86: # %bb.0:
	; X86-NEXT: pushl %ebp			; X86-NEXT: pushl %ebp
	; X86-NEXT: pushl %ebx			; X86-NEXT: pushl %ebx
	▲ Show 20 Lines • Show All 498 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/smul_fix_sat.ll

	Show First 20 Lines • Show All 59 Lines • ▼ Show 20 Lines
	; X86-NEXT: pushl %ebx			; X86-NEXT: pushl %ebx
	; X86-NEXT: pushl %edi			; X86-NEXT: pushl %edi
	; X86-NEXT: pushl %esi			; X86-NEXT: pushl %esi
	; X86-NEXT: pushl %eax			; X86-NEXT: pushl %eax
	; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx			; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X86-NEXT: movl {{[0-9]+}}(%esp), %esi			; X86-NEXT: movl {{[0-9]+}}(%esp), %esi
	; X86-NEXT: movl %ecx, %eax			; X86-NEXT: movl %ecx, %eax
	; X86-NEXT: mull %esi			; X86-NEXT: mull %esi
	; X86-NEXT: movl %esi, %ebx
	; X86-NEXT: movl %edx, %ebp			; X86-NEXT: movl %edx, %ebp
	; X86-NEXT: movl %eax, %edi			; X86-NEXT: movl %eax, %edi
	; X86-NEXT: movl %ecx, %eax			; X86-NEXT: movl %ecx, %eax
	; X86-NEXT: mull {{[0-9]+}}(%esp)			; X86-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NEXT: movl %eax, (%esp) # 4-byte Spill			; X86-NEXT: movl %eax, (%esp) # 4-byte Spill
	; X86-NEXT: movl %edx, %ecx			; X86-NEXT: movl %edx, %ecx
	; X86-NEXT: addl %edi, %ecx			; X86-NEXT: addl %edi, %ecx
	; X86-NEXT: movl {{[0-9]+}}(%esp), %esi			; X86-NEXT: movl {{[0-9]+}}(%esp), %edi
	; X86-NEXT: adcl $0, %ebp			; X86-NEXT: adcl $0, %ebp
	; X86-NEXT: movl %esi, %eax			; X86-NEXT: movl %edi, %eax
	; X86-NEXT: imull %ebx			; X86-NEXT: imull %esi
	; X86-NEXT: movl %edx, %ebx			; X86-NEXT: movl %edx, %ebx
	; X86-NEXT: movl %eax, %edi
	; X86-NEXT: movl %esi, %eax
	; X86-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NEXT: movl %eax, %esi			; X86-NEXT: movl %eax, %esi
	; X86-NEXT: addl %ecx, %esi			; X86-NEXT: movl %edi, %eax
				; X86-NEXT: mull {{[0-9]+}}(%esp)
				; X86-NEXT: addl %ecx, %eax
	; X86-NEXT: adcl %ebp, %edx			; X86-NEXT: adcl %ebp, %edx
	; X86-NEXT: adcl $0, %ebx			; X86-NEXT: adcl $0, %ebx
	; X86-NEXT: addl %edi, %edx			; X86-NEXT: addl %esi, %edx
	; X86-NEXT: adcl $0, %ebx			; X86-NEXT: adcl $0, %ebx
	; X86-NEXT: movl %edx, %edi			; X86-NEXT: movl %edx, %esi
	; X86-NEXT: subl {{[0-9]+}}(%esp), %edi			; X86-NEXT: subl {{[0-9]+}}(%esp), %esi
	; X86-NEXT: movl %ebx, %ebp			; X86-NEXT: movl %ebx, %ebp
	; X86-NEXT: sbbl $0, %ebp			; X86-NEXT: sbbl $0, %ebp
	; X86-NEXT: cmpl $0, {{[0-9]+}}(%esp)			; X86-NEXT: testl %edi, %edi
	; X86-NEXT: cmovnsl %ebx, %ebp			; X86-NEXT: cmovnsl %ebx, %ebp
	; X86-NEXT: cmovnsl %edx, %edi			; X86-NEXT: cmovnsl %edx, %esi
	; X86-NEXT: movl %edi, %ecx			; X86-NEXT: movl %esi, %ecx
	; X86-NEXT: subl {{[0-9]+}}(%esp), %ecx			; X86-NEXT: subl {{[0-9]+}}(%esp), %ecx
	; X86-NEXT: movl %ebp, %edx			; X86-NEXT: movl %ebp, %edi
	; X86-NEXT: sbbl $0, %edx			; X86-NEXT: sbbl $0, %edi
	; X86-NEXT: cmpl $0, {{[0-9]+}}(%esp)			; X86-NEXT: cmpl $0, {{[0-9]+}}(%esp)
	; X86-NEXT: cmovnsl %ebp, %edx			; X86-NEXT: cmovnsl %ebp, %edi
	; X86-NEXT: cmovnsl %edi, %ecx			; X86-NEXT: cmovnsl %esi, %ecx
	; X86-NEXT: testl %edx, %edx			; X86-NEXT: testl %edi, %edi
	; X86-NEXT: setg %bl			; X86-NEXT: setg %bl
	; X86-NEXT: sete %bh			; X86-NEXT: sete %bh
	; X86-NEXT: cmpl $2, %ecx			; X86-NEXT: cmpl $2, %ecx
	; X86-NEXT: setae %al			; X86-NEXT: setae %dl
	; X86-NEXT: andb %bh, %al			; X86-NEXT: andb %bh, %dl
	; X86-NEXT: orb %bl, %al			; X86-NEXT: orb %bl, %dl
	; X86-NEXT: movl (%esp), %ebx # 4-byte Reload			; X86-NEXT: movl (%esp), %ebx
	; X86-NEXT: shrdl $2, %esi, %ebx			; X86-NEXT: shrdl $2, %eax, %ebx
	; X86-NEXT: shrdl $2, %ecx, %esi			; X86-NEXT: shrdl $2, %ecx, %eax
	; X86-NEXT: testb %al, %al			; X86-NEXT: testb %dl, %dl
	; X86-NEXT: movl $2147483647, %edi # imm = 0x7FFFFFFF			; X86-NEXT: movl $2147483647, %esi # imm = 0x7FFFFFFF
	; X86-NEXT: cmovel %esi, %edi			; X86-NEXT: cmovel %eax, %esi
	; X86-NEXT: movl $-1, %eax			; X86-NEXT: movl $-1, %edx
	; X86-NEXT: cmovnel %eax, %ebx			; X86-NEXT: cmovel %ebx, %edx
	; X86-NEXT: movl %ebx, %eax			; X86-NEXT: cmpl $-1, %edi
	; X86-NEXT: cmpl $-1, %edx
	; X86-NEXT: setl %bl			; X86-NEXT: setl %bl
	; X86-NEXT: sete %dl			; X86-NEXT: sete %al
	; X86-NEXT: cmpl $-2, %ecx			; X86-NEXT: cmpl $-2, %ecx
	; X86-NEXT: setb %cl			; X86-NEXT: setb %cl
	; X86-NEXT: andb %dl, %cl			; X86-NEXT: andb %al, %cl
	; X86-NEXT: xorl %edx, %edx			; X86-NEXT: xorl %eax, %eax
	; X86-NEXT: orb %bl, %cl			; X86-NEXT: orb %bl, %cl
	; X86-NEXT: cmovnel %edx, %eax			; X86-NEXT: cmovel %edx, %eax
	; X86-NEXT: movl $-2147483648, %edx # imm = 0x80000000			; X86-NEXT: movl $-2147483648, %edx # imm = 0x80000000
	; X86-NEXT: cmovel %edi, %edx			; X86-NEXT: cmovel %esi, %edx
	; X86-NEXT: addl $4, %esp			; X86-NEXT: addl $4, %esp
	; X86-NEXT: popl %esi			; X86-NEXT: popl %esi
	; X86-NEXT: popl %edi			; X86-NEXT: popl %edi
	; X86-NEXT: popl %ebx			; X86-NEXT: popl %ebx
	; X86-NEXT: popl %ebp			; X86-NEXT: popl %ebp
	; X86-NEXT: retl			; X86-NEXT: retl
	%tmp = call i64 @llvm.smul.fix.sat.i64(i64 %x, i64 %y, i32 2)			%tmp = call i64 @llvm.smul.fix.sat.i64(i64 %x, i64 %y, i32 2)
	ret i64 %tmp			ret i64 %tmp
	▲ Show 20 Lines • Show All 234 Lines • ▼ Show 20 Lines
	; X86-NEXT: .cfi_def_cfa_offset 20			; X86-NEXT: .cfi_def_cfa_offset 20
	; X86-NEXT: subl $12, %esp			; X86-NEXT: subl $12, %esp
	; X86-NEXT: .cfi_def_cfa_offset 32			; X86-NEXT: .cfi_def_cfa_offset 32
	; X86-NEXT: .cfi_offset %esi, -20			; X86-NEXT: .cfi_offset %esi, -20
	; X86-NEXT: .cfi_offset %edi, -16			; X86-NEXT: .cfi_offset %edi, -16
	; X86-NEXT: .cfi_offset %ebx, -12			; X86-NEXT: .cfi_offset %ebx, -12
	; X86-NEXT: .cfi_offset %ebp, -8			; X86-NEXT: .cfi_offset %ebp, -8
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: movl {{[0-9]+}}(%esp), %ebp			; X86-NEXT: movl {{[0-9]+}}(%esp), %ebx
	; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx			; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X86-NEXT: movl %ecx, %ebx			; X86-NEXT: movl %ecx, %edi
	; X86-NEXT: sarl $31, %ebx
	; X86-NEXT: movl %eax, %edi
	; X86-NEXT: imull %ebx, %edi
	; X86-NEXT: mull %ebx
	; X86-NEXT: movl %eax, (%esp) # 4-byte Spill
	; X86-NEXT: addl %edi, %edx
	; X86-NEXT: movl %ebp, %edi
	; X86-NEXT: imull %ebp, %ebx
	; X86-NEXT: addl %edx, %ebx
	; X86-NEXT: sarl $31, %edi			; X86-NEXT: sarl $31, %edi
	; X86-NEXT: movl %edi, %ebp			; X86-NEXT: movl %eax, %esi
	; X86-NEXT: imull %ecx, %ebp			; X86-NEXT: imull %edi, %esi
	; X86-NEXT: movl {{[0-9]+}}(%esp), %esi			; X86-NEXT: mull %edi
	; X86-NEXT: movl %edi, %eax			; X86-NEXT: movl %eax, (%esp) # 4-byte Spill
	; X86-NEXT: mull %esi			; X86-NEXT: addl %esi, %edx
	; X86-NEXT: addl %ebp, %edx			; X86-NEXT: movl %ebx, %esi
	; X86-NEXT: imull %esi, %edi			; X86-NEXT: imull %ebx, %edi
	; X86-NEXT: addl %edx, %edi			; X86-NEXT: addl %edx, %edi
				; X86-NEXT: sarl $31, %esi
				; X86-NEXT: movl %esi, %ebx
				; X86-NEXT: imull %ecx, %ebx
				; X86-NEXT: movl {{[0-9]+}}(%esp), %ebp
				; X86-NEXT: movl %esi, %eax
				; X86-NEXT: mull %ebp
				; X86-NEXT: addl %ebx, %edx
				; X86-NEXT: imull %ebp, %esi
				; X86-NEXT: addl %edx, %esi
	; X86-NEXT: addl (%esp), %eax # 4-byte Folded Reload			; X86-NEXT: addl (%esp), %eax # 4-byte Folded Reload
	; X86-NEXT: movl %eax, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill			; X86-NEXT: movl %eax, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
	; X86-NEXT: adcl %ebx, %edi			; X86-NEXT: adcl %edi, %esi
	; X86-NEXT: movl %esi, %eax			; X86-NEXT: movl %ebp, %eax
	; X86-NEXT: movl {{[0-9]+}}(%esp), %esi			; X86-NEXT: movl {{[0-9]+}}(%esp), %edi
	; X86-NEXT: mull %esi			; X86-NEXT: mull %edi
	; X86-NEXT: movl %edx, %ebp			; X86-NEXT: movl %edx, %ebp
	; X86-NEXT: movl %eax, (%esp) # 4-byte Spill			; X86-NEXT: movl %eax, (%esp) # 4-byte Spill
	; X86-NEXT: movl %ecx, %eax			; X86-NEXT: movl %ecx, %eax
	; X86-NEXT: mull %esi			; X86-NEXT: mull %edi
	; X86-NEXT: movl %edx, %ebx			; X86-NEXT: movl %edx, %ebx
	; X86-NEXT: movl %eax, %esi			; X86-NEXT: movl %eax, %edi
	; X86-NEXT: addl %ebp, %esi			; X86-NEXT: addl %ebp, %edi
	; X86-NEXT: adcl $0, %ebx			; X86-NEXT: adcl $0, %ebx
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: mull {{[0-9]+}}(%esp)			; X86-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NEXT: movl %edx, %ebp			; X86-NEXT: movl %edx, %ebp
	; X86-NEXT: addl %esi, %eax			; X86-NEXT: addl %edi, %eax
	; X86-NEXT: movl %eax, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill			; X86-NEXT: movl %eax, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
	; X86-NEXT: adcl %ebx, %ebp			; X86-NEXT: adcl %ebx, %ebp
	; X86-NEXT: setb %bl			; X86-NEXT: setb %bl
	; X86-NEXT: movl %ecx, %eax			; X86-NEXT: movl %ecx, %eax
	; X86-NEXT: movl {{[0-9]+}}(%esp), %edx			; X86-NEXT: movl {{[0-9]+}}(%esp), %edx
	; X86-NEXT: mull %edx			; X86-NEXT: mull %edx
	; X86-NEXT: addl %ebp, %eax			; X86-NEXT: addl %ebp, %eax
	; X86-NEXT: movzbl %bl, %esi			; X86-NEXT: movzbl %bl, %edi
	; X86-NEXT: adcl %esi, %edx
	; X86-NEXT: addl {{[-0-9]+}}(%e{{[sb]}}p), %eax # 4-byte Folded Reload
	; X86-NEXT: adcl %edi, %edx			; X86-NEXT: adcl %edi, %edx
				; X86-NEXT: addl {{[-0-9]+}}(%e{{[sb]}}p), %eax # 4-byte Folded Reload
				; X86-NEXT: adcl %esi, %edx
	; X86-NEXT: movl {{[-0-9]+}}(%e{{[sb]}}p), %ebx # 4-byte Reload			; X86-NEXT: movl {{[-0-9]+}}(%e{{[sb]}}p), %ebx # 4-byte Reload
	; X86-NEXT: movl %ebx, %edi			; X86-NEXT: movl %ebx, %edi
	; X86-NEXT: sarl $31, %edi			; X86-NEXT: sarl $31, %edi
	; X86-NEXT: xorl %edi, %edx			; X86-NEXT: xorl %edi, %edx
	; X86-NEXT: xorl %eax, %edi			; X86-NEXT: xorl %eax, %edi
	; X86-NEXT: xorl {{[0-9]+}}(%esp), %ecx			; X86-NEXT: xorl {{[0-9]+}}(%esp), %ecx
	; X86-NEXT: sarl $31, %ecx			; X86-NEXT: sarl $31, %ecx
	; X86-NEXT: movl %ecx, %esi			; X86-NEXT: movl %ecx, %esi
	; X86-NEXT: xorl $2147483647, %esi # imm = 0x7FFFFFFF			; X86-NEXT: xorl $2147483647, %esi # imm = 0x7FFFFFFF
	; X86-NEXT: orl %edx, %edi			; X86-NEXT: orl %edx, %edi
	; X86-NEXT: notl %ecx			; X86-NEXT: notl %ecx
	; X86-NEXT: movl (%esp), %eax # 4-byte Reload			; X86-NEXT: cmovel (%esp), %ecx # 4-byte Folded Reload
	; X86-NEXT: cmovnel %ecx, %eax
	; X86-NEXT: cmovel %ebx, %esi			; X86-NEXT: cmovel %ebx, %esi
				; X86-NEXT: movl %ecx, %eax
	; X86-NEXT: movl %esi, %edx			; X86-NEXT: movl %esi, %edx
	; X86-NEXT: addl $12, %esp			; X86-NEXT: addl $12, %esp
	; X86-NEXT: .cfi_def_cfa_offset 20			; X86-NEXT: .cfi_def_cfa_offset 20
	; X86-NEXT: popl %esi			; X86-NEXT: popl %esi
	; X86-NEXT: .cfi_def_cfa_offset 16			; X86-NEXT: .cfi_def_cfa_offset 16
	; X86-NEXT: popl %edi			; X86-NEXT: popl %edi
	; X86-NEXT: .cfi_def_cfa_offset 12			; X86-NEXT: .cfi_def_cfa_offset 12
	; X86-NEXT: popl %ebx			; X86-NEXT: popl %ebx
	▲ Show 20 Lines • Show All 219 Lines • ▼ Show 20 Lines
	; X86-NEXT: setns {{[-0-9]+}}(%e{{[sb]}}p) # 1-byte Folded Spill			; X86-NEXT: setns {{[-0-9]+}}(%e{{[sb]}}p) # 1-byte Folded Spill
	; X86-NEXT: sets %bh			; X86-NEXT: sets %bh
	; X86-NEXT: testl %ecx, %ecx			; X86-NEXT: testl %ecx, %ecx
	; X86-NEXT: setg {{[-0-9]+}}(%e{{[sb]}}p) # 1-byte Folded Spill			; X86-NEXT: setg {{[-0-9]+}}(%e{{[sb]}}p) # 1-byte Folded Spill
	; X86-NEXT: sete %bl			; X86-NEXT: sete %bl
	; X86-NEXT: andb %bh, %bl			; X86-NEXT: andb %bh, %bl
	; X86-NEXT: orb {{[-0-9]+}}(%e{{[sb]}}p), %bl # 1-byte Folded Reload			; X86-NEXT: orb {{[-0-9]+}}(%e{{[sb]}}p), %bl # 1-byte Folded Reload
	; X86-NEXT: movl $2147483647, %esi # imm = 0x7FFFFFFF			; X86-NEXT: movl $2147483647, %esi # imm = 0x7FFFFFFF
	; X86-NEXT: cmovnel %esi, %edx			; X86-NEXT: cmovel %edx, %esi
	; X86-NEXT: movl $-1, %esi			; X86-NEXT: movl $-1, %edx
	; X86-NEXT: cmovnel %esi, %eax			; X86-NEXT: cmovnel %edx, %eax
	; X86-NEXT: cmpl $-1, %ecx			; X86-NEXT: cmpl $-1, %ecx
	; X86-NEXT: setl %cl			; X86-NEXT: setl %cl
	; X86-NEXT: sete %ch			; X86-NEXT: sete %dl
	; X86-NEXT: andb {{[-0-9]+}}(%e{{[sb]}}p), %ch # 1-byte Folded Reload			; X86-NEXT: andb {{[-0-9]+}}(%e{{[sb]}}p), %dl # 1-byte Folded Reload
	; X86-NEXT: xorl %esi, %esi			; X86-NEXT: xorl %edi, %edi
	; X86-NEXT: orb %cl, %ch			; X86-NEXT: orb %cl, %dl
	; X86-NEXT: cmovnel %esi, %eax			; X86-NEXT: cmovnel %edi, %eax
	; X86-NEXT: movl $-2147483648, %ecx # imm = 0x80000000			; X86-NEXT: movl $-2147483648, %edx # imm = 0x80000000
	; X86-NEXT: cmovnel %ecx, %edx			; X86-NEXT: cmovel %esi, %edx
	; X86-NEXT: addl $4, %esp			; X86-NEXT: addl $4, %esp
	; X86-NEXT: popl %esi			; X86-NEXT: popl %esi
	; X86-NEXT: popl %edi			; X86-NEXT: popl %edi
	; X86-NEXT: popl %ebx			; X86-NEXT: popl %ebx
	; X86-NEXT: popl %ebp			; X86-NEXT: popl %ebp
	; X86-NEXT: retl			; X86-NEXT: retl
	%tmp = call i64 @llvm.smul.fix.sat.i64(i64 %x, i64 %y, i32 32)			%tmp = call i64 @llvm.smul.fix.sat.i64(i64 %x, i64 %y, i32 32)
	ret i64 %tmp			ret i64 %tmp
	▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines
	; X86-NEXT: sbbl $0, %ecx			; X86-NEXT: sbbl $0, %ecx
	; X86-NEXT: cmpl $0, {{[0-9]+}}(%esp)			; X86-NEXT: cmpl $0, {{[0-9]+}}(%esp)
	; X86-NEXT: cmovnsl %esi, %ecx			; X86-NEXT: cmovnsl %esi, %ecx
	; X86-NEXT: cmovnsl %ebx, %edx			; X86-NEXT: cmovnsl %ebx, %edx
	; X86-NEXT: shrdl $31, %edx, %eax			; X86-NEXT: shrdl $31, %edx, %eax
	; X86-NEXT: shrdl $31, %ecx, %edx			; X86-NEXT: shrdl $31, %ecx, %edx
	; X86-NEXT: cmpl $1073741824, %ecx # imm = 0x40000000			; X86-NEXT: cmpl $1073741824, %ecx # imm = 0x40000000
	; X86-NEXT: movl $2147483647, %esi # imm = 0x7FFFFFFF			; X86-NEXT: movl $2147483647, %esi # imm = 0x7FFFFFFF
	; X86-NEXT: cmovgel %esi, %edx			; X86-NEXT: cmovll %edx, %esi
	; X86-NEXT: movl $-1, %esi			; X86-NEXT: movl $-1, %edx
	; X86-NEXT: cmovgel %esi, %eax			; X86-NEXT: cmovgel %edx, %eax
	; X86-NEXT: xorl %esi, %esi			; X86-NEXT: xorl %edx, %edx
	; X86-NEXT: cmpl $-1073741824, %ecx # imm = 0xC0000000			; X86-NEXT: cmpl $-1073741824, %ecx # imm = 0xC0000000
	; X86-NEXT: cmovll %esi, %eax			; X86-NEXT: cmovll %edx, %eax
	; X86-NEXT: movl $-2147483648, %ecx # imm = 0x80000000			; X86-NEXT: movl $-2147483648, %edx # imm = 0x80000000
	; X86-NEXT: cmovll %ecx, %edx			; X86-NEXT: cmovgel %esi, %edx
	; X86-NEXT: popl %esi			; X86-NEXT: popl %esi
	; X86-NEXT: popl %edi			; X86-NEXT: popl %edi
	; X86-NEXT: popl %ebx			; X86-NEXT: popl %ebx
	; X86-NEXT: popl %ebp			; X86-NEXT: popl %ebp
	; X86-NEXT: retl			; X86-NEXT: retl
	%tmp = call i64 @llvm.smul.fix.sat.i64(i64 %x, i64 %y, i32 63)			%tmp = call i64 @llvm.smul.fix.sat.i64(i64 %x, i64 %y, i32 63)
	ret i64 %tmp			ret i64 %tmp
	}			}

llvm/test/CodeGen/X86/sqrt-fastmath-tune.ll

	Show All 25 Lines
	; FAST-SCALAR-NEXT: retq			; FAST-SCALAR-NEXT: retq
	%call = tail call fast float @llvm.sqrt.f32(float %f) #2			%call = tail call fast float @llvm.sqrt.f32(float %f) #2
	ret float %call			ret float %call
	}			}

	define <4 x float> @v4f32_no_daz(<4 x float> %f) #0 {			define <4 x float> @v4f32_no_daz(<4 x float> %f) #0 {
	; NHM-LABEL: v4f32_no_daz:			; NHM-LABEL: v4f32_no_daz:
	; NHM: # %bb.0:			; NHM: # %bb.0:
	; NHM-NEXT: rsqrtps %xmm0, %xmm2			; NHM-NEXT: rsqrtps %xmm0, %xmm1
	; NHM-NEXT: movaps %xmm0, %xmm1			; NHM-NEXT: movaps %xmm0, %xmm2
	; NHM-NEXT: mulps %xmm2, %xmm1			; NHM-NEXT: mulps %xmm1, %xmm2
	; NHM-NEXT: movaps {{.*#+}} xmm3 = [-5.0E-1,-5.0E-1,-5.0E-1,-5.0E-1]			; NHM-NEXT: movaps {{.*#+}} xmm3 = [-5.0E-1,-5.0E-1,-5.0E-1,-5.0E-1]
	; NHM-NEXT: mulps %xmm1, %xmm3			; NHM-NEXT: mulps %xmm2, %xmm3
	; NHM-NEXT: mulps %xmm2, %xmm1			; NHM-NEXT: mulps %xmm1, %xmm2
	; NHM-NEXT: addps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; NHM-NEXT: addps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
	; NHM-NEXT: andps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; NHM-NEXT: andps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; NHM-NEXT: mulps %xmm3, %xmm1			; NHM-NEXT: mulps %xmm3, %xmm2
	; NHM-NEXT: movaps {{.*#+}} xmm2 = [1.17549435E-38,1.17549435E-38,1.17549435E-38,1.17549435E-38]			; NHM-NEXT: movaps {{.*#+}} xmm1 = [1.17549435E-38,1.17549435E-38,1.17549435E-38,1.17549435E-38]
	; NHM-NEXT: cmpleps %xmm0, %xmm2			; NHM-NEXT: cmpleps %xmm0, %xmm1
	; NHM-NEXT: andps %xmm2, %xmm1			; NHM-NEXT: andps %xmm2, %xmm1
	; NHM-NEXT: movaps %xmm1, %xmm0			; NHM-NEXT: movaps %xmm1, %xmm0
	; NHM-NEXT: retq			; NHM-NEXT: retq
	;			;
	; SNB-LABEL: v4f32_no_daz:			; SNB-LABEL: v4f32_no_daz:
	; SNB: # %bb.0:			; SNB: # %bb.0:
	; SNB-NEXT: vrsqrtps %xmm0, %xmm1			; SNB-NEXT: vrsqrtps %xmm0, %xmm1
	; SNB-NEXT: vmulps %xmm1, %xmm0, %xmm2			; SNB-NEXT: vmulps %xmm1, %xmm0, %xmm2
	Show All 29 Lines
	; SKL-NEXT: retq			; SKL-NEXT: retq
	%call = tail call fast <4 x float> @llvm.sqrt.v4f32(<4 x float> %f) #2			%call = tail call fast <4 x float> @llvm.sqrt.v4f32(<4 x float> %f) #2
	ret <4 x float> %call			ret <4 x float> %call
	}			}

	define <8 x float> @v8f32_no_daz(<8 x float> %f) #0 {			define <8 x float> @v8f32_no_daz(<8 x float> %f) #0 {
	; NHM-LABEL: v8f32_no_daz:			; NHM-LABEL: v8f32_no_daz:
	; NHM: # %bb.0:			; NHM: # %bb.0:
	; NHM-NEXT: movaps %xmm0, %xmm2			; NHM-NEXT: rsqrtps %xmm0, %xmm2
	; NHM-NEXT: rsqrtps %xmm0, %xmm3			; NHM-NEXT: movaps %xmm0, %xmm4
	; NHM-NEXT: mulps %xmm3, %xmm0
	; NHM-NEXT: movaps {{.*#+}} xmm4 = [-5.0E-1,-5.0E-1,-5.0E-1,-5.0E-1]
	; NHM-NEXT: movaps %xmm0, %xmm5
	; NHM-NEXT: mulps %xmm4, %xmm5
	; NHM-NEXT: mulps %xmm3, %xmm0
	; NHM-NEXT: movaps {{.*#+}} xmm3 = [-3.0E+0,-3.0E+0,-3.0E+0,-3.0E+0]
	; NHM-NEXT: addps %xmm3, %xmm0
	; NHM-NEXT: mulps %xmm5, %xmm0
	; NHM-NEXT: movaps {{.*#+}} xmm5 = [NaN,NaN,NaN,NaN]
	; NHM-NEXT: andps %xmm5, %xmm2
	; NHM-NEXT: movaps {{.*#+}} xmm6 = [1.17549435E-38,1.17549435E-38,1.17549435E-38,1.17549435E-38]
	; NHM-NEXT: movaps %xmm6, %xmm7
	; NHM-NEXT: cmpleps %xmm2, %xmm7
	; NHM-NEXT: andps %xmm7, %xmm0
	; NHM-NEXT: rsqrtps %xmm1, %xmm7
	; NHM-NEXT: movaps %xmm1, %xmm2
	; NHM-NEXT: mulps %xmm7, %xmm2
	; NHM-NEXT: mulps %xmm2, %xmm4			; NHM-NEXT: mulps %xmm2, %xmm4
	; NHM-NEXT: mulps %xmm7, %xmm2			; NHM-NEXT: movaps {{.*#+}} xmm5 = [-5.0E-1,-5.0E-1,-5.0E-1,-5.0E-1]
	; NHM-NEXT: addps %xmm3, %xmm2			; NHM-NEXT: movaps %xmm4, %xmm3
	; NHM-NEXT: mulps %xmm4, %xmm2			; NHM-NEXT: mulps %xmm5, %xmm3
	; NHM-NEXT: andps %xmm5, %xmm1			; NHM-NEXT: mulps %xmm2, %xmm4
	; NHM-NEXT: cmpleps %xmm1, %xmm6			; NHM-NEXT: movaps {{.*#+}} xmm6 = [-3.0E+0,-3.0E+0,-3.0E+0,-3.0E+0]
	; NHM-NEXT: andps %xmm6, %xmm2			; NHM-NEXT: addps %xmm6, %xmm4
				; NHM-NEXT: mulps %xmm3, %xmm4
				; NHM-NEXT: movaps {{.*#+}} xmm7 = [NaN,NaN,NaN,NaN]
				; NHM-NEXT: andps %xmm7, %xmm0
				; NHM-NEXT: movaps {{.*#+}} xmm2 = [1.17549435E-38,1.17549435E-38,1.17549435E-38,1.17549435E-38]
				; NHM-NEXT: movaps %xmm2, %xmm3
				; NHM-NEXT: cmpleps %xmm0, %xmm3
				; NHM-NEXT: andps %xmm4, %xmm3
				; NHM-NEXT: rsqrtps %xmm1, %xmm0
				; NHM-NEXT: movaps %xmm1, %xmm4
				; NHM-NEXT: mulps %xmm0, %xmm4
				; NHM-NEXT: mulps %xmm4, %xmm5
				; NHM-NEXT: mulps %xmm0, %xmm4
				; NHM-NEXT: addps %xmm6, %xmm4
				; NHM-NEXT: mulps %xmm5, %xmm4
				; NHM-NEXT: andps %xmm7, %xmm1
				; NHM-NEXT: cmpleps %xmm1, %xmm2
				; NHM-NEXT: andps %xmm4, %xmm2
				; NHM-NEXT: movaps %xmm3, %xmm0
	; NHM-NEXT: movaps %xmm2, %xmm1			; NHM-NEXT: movaps %xmm2, %xmm1
	; NHM-NEXT: retq			; NHM-NEXT: retq
	;			;
	; SNB-LABEL: v8f32_no_daz:			; SNB-LABEL: v8f32_no_daz:
	; SNB: # %bb.0:			; SNB: # %bb.0:
	; SNB-NEXT: vrsqrtps %ymm0, %ymm1			; SNB-NEXT: vrsqrtps %ymm0, %ymm1
	; SNB-NEXT: vmulps %ymm1, %ymm0, %ymm2			; SNB-NEXT: vmulps %ymm1, %ymm0, %ymm2
	; SNB-NEXT: vmulps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm2, %ymm3			; SNB-NEXT: vmulps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm2, %ymm3
	▲ Show 20 Lines • Show All 179 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/sqrt-fastmath.ll

	Show First 20 Lines • Show All 277 Lines • ▼ Show 20 Lines
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%call = tail call <4 x float> @llvm.sqrt.v4f32(<4 x float> %x) #2			%call = tail call <4 x float> @llvm.sqrt.v4f32(<4 x float> %x) #2
	ret <4 x float> %call			ret <4 x float> %call
	}			}

	define <4 x float> @sqrt_v4f32_check_denorms_ninf(<4 x float> %x) #3 {			define <4 x float> @sqrt_v4f32_check_denorms_ninf(<4 x float> %x) #3 {
	; SSE-LABEL: sqrt_v4f32_check_denorms_ninf:			; SSE-LABEL: sqrt_v4f32_check_denorms_ninf:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: rsqrtps %xmm0, %xmm2			; SSE-NEXT: rsqrtps %xmm0, %xmm1
	; SSE-NEXT: movaps %xmm0, %xmm1			; SSE-NEXT: movaps %xmm0, %xmm2
	; SSE-NEXT: mulps %xmm2, %xmm1			; SSE-NEXT: mulps %xmm1, %xmm2
	; SSE-NEXT: movaps {{.*#+}} xmm3 = [-5.0E-1,-5.0E-1,-5.0E-1,-5.0E-1]			; SSE-NEXT: movaps {{.*#+}} xmm3 = [-5.0E-1,-5.0E-1,-5.0E-1,-5.0E-1]
	; SSE-NEXT: mulps %xmm1, %xmm3			; SSE-NEXT: mulps %xmm2, %xmm3
	; SSE-NEXT: mulps %xmm2, %xmm1			; SSE-NEXT: mulps %xmm1, %xmm2
	; SSE-NEXT: addps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE-NEXT: addps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
	; SSE-NEXT: andps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; SSE-NEXT: andps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE-NEXT: mulps %xmm3, %xmm1			; SSE-NEXT: mulps %xmm3, %xmm2
	; SSE-NEXT: movaps {{.*#+}} xmm2 = [1.17549435E-38,1.17549435E-38,1.17549435E-38,1.17549435E-38]			; SSE-NEXT: movaps {{.*#+}} xmm1 = [1.17549435E-38,1.17549435E-38,1.17549435E-38,1.17549435E-38]
	; SSE-NEXT: cmpleps %xmm0, %xmm2			; SSE-NEXT: cmpleps %xmm0, %xmm1
	; SSE-NEXT: andps %xmm2, %xmm1			; SSE-NEXT: andps %xmm2, %xmm1
	; SSE-NEXT: movaps %xmm1, %xmm0			; SSE-NEXT: movaps %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-LABEL: sqrt_v4f32_check_denorms_ninf:			; AVX1-LABEL: sqrt_v4f32_check_denorms_ninf:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vrsqrtps %xmm0, %xmm1			; AVX1-NEXT: vrsqrtps %xmm0, %xmm1
	; AVX1-NEXT: vmulps %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vmulps %xmm1, %xmm0, %xmm2
	▲ Show 20 Lines • Show All 322 Lines • ▼ Show 20 Lines
	; SSE-NEXT: mulss %xmm1, %xmm1			; SSE-NEXT: mulss %xmm1, %xmm1
	; SSE-NEXT: mulss %xmm2, %xmm1			; SSE-NEXT: mulss %xmm2, %xmm1
	; SSE-NEXT: xorps %xmm2, %xmm2			; SSE-NEXT: xorps %xmm2, %xmm2
	; SSE-NEXT: rsqrtss %xmm1, %xmm2			; SSE-NEXT: rsqrtss %xmm1, %xmm2
	; SSE-NEXT: mulss %xmm2, %xmm1			; SSE-NEXT: mulss %xmm2, %xmm1
	; SSE-NEXT: mulss %xmm2, %xmm1			; SSE-NEXT: mulss %xmm2, %xmm1
	; SSE-NEXT: addss {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE-NEXT: addss {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE-NEXT: mulss {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2			; SSE-NEXT: mulss {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
	; SSE-NEXT: mulss %xmm0, %xmm2			; SSE-NEXT: mulss %xmm2, %xmm0
	; SSE-NEXT: mulss %xmm1, %xmm2			; SSE-NEXT: mulss %xmm1, %xmm0
	; SSE-NEXT: movaps %xmm2, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-LABEL: div_sqrt_fabs_f32:			; AVX1-LABEL: div_sqrt_fabs_f32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmulss %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vmulss %xmm1, %xmm1, %xmm1
	; AVX1-NEXT: vmulss %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vmulss %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vrsqrtss %xmm1, %xmm1, %xmm2			; AVX1-NEXT: vrsqrtss %xmm1, %xmm1, %xmm2
	; AVX1-NEXT: vmulss %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vmulss %xmm2, %xmm1, %xmm1
	▲ Show 20 Lines • Show All 162 Lines • ▼ Show 20 Lines
	; SSE-NEXT: mulss %xmm1, %xmm2			; SSE-NEXT: mulss %xmm1, %xmm2
	; SSE-NEXT: mulss %xmm1, %xmm2			; SSE-NEXT: mulss %xmm1, %xmm2
	; SSE-NEXT: xorps %xmm1, %xmm1			; SSE-NEXT: xorps %xmm1, %xmm1
	; SSE-NEXT: rsqrtss %xmm2, %xmm1			; SSE-NEXT: rsqrtss %xmm2, %xmm1
	; SSE-NEXT: mulss %xmm1, %xmm2			; SSE-NEXT: mulss %xmm1, %xmm2
	; SSE-NEXT: mulss %xmm1, %xmm2			; SSE-NEXT: mulss %xmm1, %xmm2
	; SSE-NEXT: addss {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2			; SSE-NEXT: addss {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
	; SSE-NEXT: mulss {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE-NEXT: mulss {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE-NEXT: mulss %xmm0, %xmm1			; SSE-NEXT: mulss %xmm1, %xmm0
	; SSE-NEXT: mulss %xmm2, %xmm1			; SSE-NEXT: mulss %xmm2, %xmm0
	; SSE-NEXT: movaps %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-LABEL: div_sqrt_f32:			; AVX1-LABEL: div_sqrt_f32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmulss %xmm1, %xmm1, %xmm2			; AVX1-NEXT: vmulss %xmm1, %xmm1, %xmm2
	; AVX1-NEXT: vmulss %xmm1, %xmm2, %xmm1			; AVX1-NEXT: vmulss %xmm1, %xmm2, %xmm1
	; AVX1-NEXT: vrsqrtss %xmm1, %xmm1, %xmm2			; AVX1-NEXT: vrsqrtss %xmm1, %xmm1, %xmm2
	; AVX1-NEXT: vmulss %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vmulss %xmm2, %xmm1, %xmm1
	▲ Show 20 Lines • Show All 198 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/sse-minmax.ll

Show First 20 Lines • Show All 97 Lines • ▼ Show 20 Lines

define double @ole(double %x, double %y) {		define double @ole(double %x, double %y) {
; STRICT-LABEL: ole:		; STRICT-LABEL: ole:
; STRICT: # %bb.0:		; STRICT: # %bb.0:
; STRICT-NEXT: movapd %xmm0, %xmm2		; STRICT-NEXT: movapd %xmm0, %xmm2
; STRICT-NEXT: cmplesd %xmm1, %xmm2		; STRICT-NEXT: cmplesd %xmm1, %xmm2
; STRICT-NEXT: andpd %xmm2, %xmm0		; STRICT-NEXT: andpd %xmm2, %xmm0
; STRICT-NEXT: andnpd %xmm1, %xmm2		; STRICT-NEXT: andnpd %xmm1, %xmm2
; STRICT-NEXT: orpd %xmm0, %xmm2		; STRICT-NEXT: orpd %xmm2, %xmm0
; STRICT-NEXT: movapd %xmm2, %xmm0
; STRICT-NEXT: retq		; STRICT-NEXT: retq
;		;
; RELAX-LABEL: ole:		; RELAX-LABEL: ole:
; RELAX: # %bb.0:		; RELAX: # %bb.0:
; RELAX-NEXT: minsd %xmm1, %xmm0		; RELAX-NEXT: minsd %xmm1, %xmm0
; RELAX-NEXT: retq		; RELAX-NEXT: retq
%c = fcmp ole double %x, %y		%c = fcmp ole double %x, %y
%d = select i1 %c, double %x, double %y		%d = select i1 %c, double %x, double %y
▲ Show 20 Lines • Show All 140 Lines • ▼ Show 20 Lines	; RELAX-NEXT: retq
%c = fcmp oge double %x, 0.000000e+00		%c = fcmp oge double %x, 0.000000e+00
%d = select i1 %c, double %x, double 0.000000e+00		%d = select i1 %c, double %x, double 0.000000e+00
ret double %d		ret double %d
}		}

define double @ole_x(double %x) {		define double @ole_x(double %x) {
; STRICT-LABEL: ole_x:		; STRICT-LABEL: ole_x:
; STRICT: # %bb.0:		; STRICT: # %bb.0:
; STRICT-NEXT: xorpd %xmm2, %xmm2		; STRICT-NEXT: xorpd %xmm1, %xmm1
; STRICT-NEXT: movapd %xmm0, %xmm1		; STRICT-NEXT: movapd %xmm0, %xmm2
; STRICT-NEXT: cmplesd %xmm2, %xmm1		; STRICT-NEXT: cmplesd %xmm1, %xmm2
; STRICT-NEXT: andpd %xmm0, %xmm1		; STRICT-NEXT: andpd %xmm2, %xmm0
; STRICT-NEXT: movapd %xmm1, %xmm0
; STRICT-NEXT: retq		; STRICT-NEXT: retq
;		;
; RELAX-LABEL: ole_x:		; RELAX-LABEL: ole_x:
; RELAX: # %bb.0:		; RELAX: # %bb.0:
; RELAX-NEXT: xorpd %xmm1, %xmm1		; RELAX-NEXT: xorpd %xmm1, %xmm1
; RELAX-NEXT: minsd %xmm1, %xmm0		; RELAX-NEXT: minsd %xmm1, %xmm0
; RELAX-NEXT: retq		; RELAX-NEXT: retq
%c = fcmp ole double %x, 0.000000e+00		%c = fcmp ole double %x, 0.000000e+00
▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines

define double @ugt(double %x, double %y) {		define double @ugt(double %x, double %y) {
; STRICT-LABEL: ugt:		; STRICT-LABEL: ugt:
; STRICT: # %bb.0:		; STRICT: # %bb.0:
; STRICT-NEXT: movapd %xmm0, %xmm2		; STRICT-NEXT: movapd %xmm0, %xmm2
; STRICT-NEXT: cmpnlesd %xmm1, %xmm2		; STRICT-NEXT: cmpnlesd %xmm1, %xmm2
; STRICT-NEXT: andpd %xmm2, %xmm0		; STRICT-NEXT: andpd %xmm2, %xmm0
; STRICT-NEXT: andnpd %xmm1, %xmm2		; STRICT-NEXT: andnpd %xmm1, %xmm2
; STRICT-NEXT: orpd %xmm0, %xmm2		; STRICT-NEXT: orpd %xmm2, %xmm0
; STRICT-NEXT: movapd %xmm2, %xmm0
; STRICT-NEXT: retq		; STRICT-NEXT: retq
;		;
; RELAX-LABEL: ugt:		; RELAX-LABEL: ugt:
; RELAX: # %bb.0:		; RELAX: # %bb.0:
; RELAX-NEXT: maxsd %xmm1, %xmm0		; RELAX-NEXT: maxsd %xmm1, %xmm0
; RELAX-NEXT: retq		; RELAX-NEXT: retq
%c = fcmp ugt double %x, %y		%c = fcmp ugt double %x, %y
%d = select i1 %c, double %x, double %y		%d = select i1 %c, double %x, double %y
▲ Show 20 Lines • Show All 143 Lines • ▼ Show 20 Lines	; FINITE-NEXT: retq
%c = fcmp ule double %x, %y		%c = fcmp ule double %x, %y
%d = select i1 %c, double %y, double %x		%d = select i1 %c, double %y, double %x
ret double %d		ret double %d
}		}

define double @ugt_x(double %x) {		define double @ugt_x(double %x) {
; STRICT-LABEL: ugt_x:		; STRICT-LABEL: ugt_x:
; STRICT: # %bb.0:		; STRICT: # %bb.0:
; STRICT-NEXT: xorpd %xmm2, %xmm2		; STRICT-NEXT: xorpd %xmm1, %xmm1
; STRICT-NEXT: movapd %xmm0, %xmm1		; STRICT-NEXT: movapd %xmm0, %xmm2
; STRICT-NEXT: cmpnlesd %xmm2, %xmm1		; STRICT-NEXT: cmpnlesd %xmm1, %xmm2
; STRICT-NEXT: andpd %xmm0, %xmm1		; STRICT-NEXT: andpd %xmm2, %xmm0
; STRICT-NEXT: movapd %xmm1, %xmm0
; STRICT-NEXT: retq		; STRICT-NEXT: retq
;		;
; RELAX-LABEL: ugt_x:		; RELAX-LABEL: ugt_x:
; RELAX: # %bb.0:		; RELAX: # %bb.0:
; RELAX-NEXT: xorpd %xmm1, %xmm1		; RELAX-NEXT: xorpd %xmm1, %xmm1
; RELAX-NEXT: maxsd %xmm1, %xmm0		; RELAX-NEXT: maxsd %xmm1, %xmm0
; RELAX-NEXT: retq		; RELAX-NEXT: retq
%c = fcmp ugt double %x, 0.000000e+00		%c = fcmp ugt double %x, 0.000000e+00
▲ Show 20 Lines • Show All 242 Lines • ▼ Show 20 Lines	; RELAX-NEXT: retq
%c = fcmp oge double %x, -0.000000e+00		%c = fcmp oge double %x, -0.000000e+00
%d = select i1 %c, double %x, double -0.000000e+00		%d = select i1 %c, double %x, double -0.000000e+00
ret double %d		ret double %d
}		}

define double @ole_y(double %x) {		define double @ole_y(double %x) {
; STRICT-LABEL: ole_y:		; STRICT-LABEL: ole_y:
; STRICT: # %bb.0:		; STRICT: # %bb.0:
; STRICT-NEXT: movsd {{.*#+}} xmm2 = mem[0],zero		; STRICT-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
; STRICT-NEXT: movapd %xmm0, %xmm1		; STRICT-NEXT: movapd %xmm0, %xmm2
; STRICT-NEXT: cmplesd %xmm2, %xmm1		; STRICT-NEXT: cmplesd %xmm1, %xmm2
; STRICT-NEXT: andpd %xmm1, %xmm0		; STRICT-NEXT: andpd %xmm2, %xmm0
; STRICT-NEXT: andnpd %xmm2, %xmm1		; STRICT-NEXT: andnpd %xmm1, %xmm2
; STRICT-NEXT: orpd %xmm0, %xmm1		; STRICT-NEXT: orpd %xmm2, %xmm0
; STRICT-NEXT: movapd %xmm1, %xmm0
; STRICT-NEXT: retq		; STRICT-NEXT: retq
;		;
; RELAX-LABEL: ole_y:		; RELAX-LABEL: ole_y:
; RELAX: # %bb.0:		; RELAX: # %bb.0:
; RELAX-NEXT: minsd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0		; RELAX-NEXT: minsd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; RELAX-NEXT: retq		; RELAX-NEXT: retq
%c = fcmp ole double %x, -0.000000e+00		%c = fcmp ole double %x, -0.000000e+00
%d = select i1 %c, double %x, double -0.000000e+00		%d = select i1 %c, double %x, double -0.000000e+00
▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines	; FINITE-NEXT: retq
%c = fcmp ole double %x, -0.000000e+00		%c = fcmp ole double %x, -0.000000e+00
%d = select i1 %c, double -0.000000e+00, double %x		%d = select i1 %c, double -0.000000e+00, double %x
ret double %d		ret double %d
}		}

define double @ugt_y(double %x) {		define double @ugt_y(double %x) {
; STRICT-LABEL: ugt_y:		; STRICT-LABEL: ugt_y:
; STRICT: # %bb.0:		; STRICT: # %bb.0:
; STRICT-NEXT: movsd {{.*#+}} xmm2 = mem[0],zero		; STRICT-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
; STRICT-NEXT: movapd %xmm0, %xmm1		; STRICT-NEXT: movapd %xmm0, %xmm2
; STRICT-NEXT: cmpnlesd %xmm2, %xmm1		; STRICT-NEXT: cmpnlesd %xmm1, %xmm2
; STRICT-NEXT: andpd %xmm1, %xmm0		; STRICT-NEXT: andpd %xmm2, %xmm0
; STRICT-NEXT: andnpd %xmm2, %xmm1		; STRICT-NEXT: andnpd %xmm1, %xmm2
; STRICT-NEXT: orpd %xmm0, %xmm1		; STRICT-NEXT: orpd %xmm2, %xmm0
; STRICT-NEXT: movapd %xmm1, %xmm0
; STRICT-NEXT: retq		; STRICT-NEXT: retq
;		;
; RELAX-LABEL: ugt_y:		; RELAX-LABEL: ugt_y:
; RELAX: # %bb.0:		; RELAX: # %bb.0:
; RELAX-NEXT: maxsd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0		; RELAX-NEXT: maxsd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; RELAX-NEXT: retq		; RELAX-NEXT: retq
%c = fcmp ugt double %x, -0.000000e+00		%c = fcmp ugt double %x, -0.000000e+00
%d = select i1 %c, double %x, double -0.000000e+00		%d = select i1 %c, double %x, double -0.000000e+00
▲ Show 20 Lines • Show All 507 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/sshl_sat.ll

Show First 20 Lines • Show All 199 Lines • ▼ Show 20 Lines	; X86-NEXT: retl
%tmp = call i4 @llvm.sshl.sat.i4(i4 %x, i4 %y)		%tmp = call i4 @llvm.sshl.sat.i4(i4 %x, i4 %y)
ret i4 %tmp		ret i4 %tmp
}		}

define i64 @func5(i64 %x, i64 %y) nounwind {		define i64 @func5(i64 %x, i64 %y) nounwind {
; X64-LABEL: func5:		; X64-LABEL: func5:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: movq %rsi, %rcx		; X64-NEXT: movq %rsi, %rcx
; X64-NEXT: xorl %edx, %edx		; X64-NEXT: xorl %eax, %eax
; X64-NEXT: testq %rdi, %rdi		; X64-NEXT: testq %rdi, %rdi
; X64-NEXT: sets %dl		; X64-NEXT: sets %al
; X64-NEXT: movabsq $9223372036854775807, %rax # imm = 0x7FFFFFFFFFFFFFFF		; X64-NEXT: movabsq $9223372036854775807, %rdx # imm = 0x7FFFFFFFFFFFFFFF
; X64-NEXT: addq %rdx, %rax		; X64-NEXT: addq %rax, %rdx
; X64-NEXT: movq %rdi, %rdx		; X64-NEXT: movq %rdi, %rax
; X64-NEXT: shlq %cl, %rdx		; X64-NEXT: shlq %cl, %rax
; X64-NEXT: movq %rdx, %rsi		; X64-NEXT: movq %rax, %rsi
; X64-NEXT: # kill: def $cl killed $cl killed $rcx		; X64-NEXT: # kill: def $cl killed $cl killed $rcx
; X64-NEXT: sarq %cl, %rsi		; X64-NEXT: sarq %cl, %rsi
; X64-NEXT: cmpq %rsi, %rdi		; X64-NEXT: cmpq %rsi, %rdi
; X64-NEXT: cmoveq %rdx, %rax		; X64-NEXT: cmovneq %rdx, %rax
; X64-NEXT: retq		; X64-NEXT: retq
;		;
; X86-LABEL: func5:		; X86-LABEL: func5:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: pushl %ebp		; X86-NEXT: pushl %ebp
; X86-NEXT: pushl %ebx		; X86-NEXT: pushl %ebx
; X86-NEXT: pushl %edi		; X86-NEXT: pushl %edi
; X86-NEXT: pushl %esi		; X86-NEXT: pushl %esi
▲ Show 20 Lines • Show All 166 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/ssub_sat.ll

	Show First 20 Lines • Show All 201 Lines • ▼ Show 20 Lines
	; X86-NEXT: movl %edi, (%eax)			; X86-NEXT: movl %edi, (%eax)
	; X86-NEXT: popl %esi			; X86-NEXT: popl %esi
	; X86-NEXT: popl %edi			; X86-NEXT: popl %edi
	; X86-NEXT: popl %ebx			; X86-NEXT: popl %ebx
	; X86-NEXT: retl $4			; X86-NEXT: retl $4
	;			;
	; X64-LABEL: vec:			; X64-LABEL: vec:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: pxor %xmm3, %xmm3			; X64-NEXT: pxor %xmm2, %xmm2
	; X64-NEXT: movdqa %xmm0, %xmm2			; X64-NEXT: movdqa %xmm0, %xmm3
	; X64-NEXT: psubd %xmm1, %xmm2			; X64-NEXT: psubd %xmm1, %xmm3
	; X64-NEXT: pcmpgtd %xmm3, %xmm1			; X64-NEXT: pcmpgtd %xmm2, %xmm1
	; X64-NEXT: pcmpgtd %xmm2, %xmm0			; X64-NEXT: pcmpgtd %xmm3, %xmm0
	; X64-NEXT: pxor %xmm1, %xmm0			; X64-NEXT: pxor %xmm1, %xmm0
	; X64-NEXT: movdqa %xmm0, %xmm1			; X64-NEXT: movdqa %xmm0, %xmm1
	; X64-NEXT: pandn %xmm2, %xmm1			; X64-NEXT: pandn %xmm3, %xmm1
	; X64-NEXT: psrad $31, %xmm2			; X64-NEXT: psrad $31, %xmm3
	; X64-NEXT: pxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2			; X64-NEXT: pxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3
	; X64-NEXT: pand %xmm0, %xmm2			; X64-NEXT: pand %xmm3, %xmm0
	; X64-NEXT: por %xmm1, %xmm2			; X64-NEXT: por %xmm1, %xmm0
	; X64-NEXT: movdqa %xmm2, %xmm0
	; X64-NEXT: retq			; X64-NEXT: retq
	%tmp = call <4 x i32> @llvm.ssub.sat.v4i32(<4 x i32> %x, <4 x i32> %y)			%tmp = call <4 x i32> @llvm.ssub.sat.v4i32(<4 x i32> %x, <4 x i32> %y)
	ret <4 x i32> %tmp			ret <4 x i32> %tmp
	}			}

llvm/test/CodeGen/X86/ssub_sat_vec.ll

Show First 20 Lines • Show All 606 Lines • ▼ Show 20 Lines	; AVX512BW-NEXT: retq
ret <16 x i1> %z		ret <16 x i1> %z
}		}

; Expanded		; Expanded

define <2 x i32> @v2i32(<2 x i32> %x, <2 x i32> %y) nounwind {		define <2 x i32> @v2i32(<2 x i32> %x, <2 x i32> %y) nounwind {
; SSE2-LABEL: v2i32:		; SSE2-LABEL: v2i32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: pxor %xmm3, %xmm3		; SSE2-NEXT: pxor %xmm2, %xmm2
; SSE2-NEXT: movdqa %xmm0, %xmm2		; SSE2-NEXT: movdqa %xmm0, %xmm3
; SSE2-NEXT: psubd %xmm1, %xmm2		; SSE2-NEXT: psubd %xmm1, %xmm3
; SSE2-NEXT: pcmpgtd %xmm3, %xmm1		; SSE2-NEXT: pcmpgtd %xmm2, %xmm1
; SSE2-NEXT: pcmpgtd %xmm2, %xmm0		; SSE2-NEXT: pcmpgtd %xmm3, %xmm0
; SSE2-NEXT: pxor %xmm1, %xmm0		; SSE2-NEXT: pxor %xmm1, %xmm0
; SSE2-NEXT: movdqa %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm1
; SSE2-NEXT: pandn %xmm2, %xmm1		; SSE2-NEXT: pandn %xmm3, %xmm1
; SSE2-NEXT: psrad $31, %xmm2		; SSE2-NEXT: psrad $31, %xmm3
; SSE2-NEXT: pxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2		; SSE2-NEXT: pxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3
; SSE2-NEXT: pand %xmm0, %xmm2		; SSE2-NEXT: pand %xmm3, %xmm0
; SSE2-NEXT: por %xmm1, %xmm2		; SSE2-NEXT: por %xmm1, %xmm0
; SSE2-NEXT: movdqa %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSSE3-LABEL: v2i32:		; SSSE3-LABEL: v2i32:
; SSSE3: # %bb.0:		; SSSE3: # %bb.0:
; SSSE3-NEXT: pxor %xmm3, %xmm3		; SSSE3-NEXT: pxor %xmm2, %xmm2
; SSSE3-NEXT: movdqa %xmm0, %xmm2		; SSSE3-NEXT: movdqa %xmm0, %xmm3
; SSSE3-NEXT: psubd %xmm1, %xmm2		; SSSE3-NEXT: psubd %xmm1, %xmm3
; SSSE3-NEXT: pcmpgtd %xmm3, %xmm1		; SSSE3-NEXT: pcmpgtd %xmm2, %xmm1
; SSSE3-NEXT: pcmpgtd %xmm2, %xmm0		; SSSE3-NEXT: pcmpgtd %xmm3, %xmm0
; SSSE3-NEXT: pxor %xmm1, %xmm0		; SSSE3-NEXT: pxor %xmm1, %xmm0
; SSSE3-NEXT: movdqa %xmm0, %xmm1		; SSSE3-NEXT: movdqa %xmm0, %xmm1
; SSSE3-NEXT: pandn %xmm2, %xmm1		; SSSE3-NEXT: pandn %xmm3, %xmm1
; SSSE3-NEXT: psrad $31, %xmm2		; SSSE3-NEXT: psrad $31, %xmm3
; SSSE3-NEXT: pxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2		; SSSE3-NEXT: pxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3
; SSSE3-NEXT: pand %xmm0, %xmm2		; SSSE3-NEXT: pand %xmm3, %xmm0
; SSSE3-NEXT: por %xmm1, %xmm2		; SSSE3-NEXT: por %xmm1, %xmm0
; SSSE3-NEXT: movdqa %xmm2, %xmm0
; SSSE3-NEXT: retq		; SSSE3-NEXT: retq
;		;
; SSE41-LABEL: v2i32:		; SSE41-LABEL: v2i32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: pxor %xmm3, %xmm3		; SSE41-NEXT: pxor %xmm3, %xmm3
; SSE41-NEXT: movdqa %xmm0, %xmm2		; SSE41-NEXT: movdqa %xmm0, %xmm2
; SSE41-NEXT: psubd %xmm1, %xmm2		; SSE41-NEXT: psubd %xmm1, %xmm2
; SSE41-NEXT: pcmpgtd %xmm3, %xmm1		; SSE41-NEXT: pcmpgtd %xmm3, %xmm1
▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
; AVX512BW-NEXT: retq		; AVX512BW-NEXT: retq
%z = call <2 x i32> @llvm.ssub.sat.v2i32(<2 x i32> %x, <2 x i32> %y)		%z = call <2 x i32> @llvm.ssub.sat.v2i32(<2 x i32> %x, <2 x i32> %y)
ret <2 x i32> %z		ret <2 x i32> %z
}		}

define <4 x i32> @v4i32(<4 x i32> %x, <4 x i32> %y) nounwind {		define <4 x i32> @v4i32(<4 x i32> %x, <4 x i32> %y) nounwind {
; SSE2-LABEL: v4i32:		; SSE2-LABEL: v4i32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: pxor %xmm3, %xmm3		; SSE2-NEXT: pxor %xmm2, %xmm2
; SSE2-NEXT: movdqa %xmm0, %xmm2		; SSE2-NEXT: movdqa %xmm0, %xmm3
; SSE2-NEXT: psubd %xmm1, %xmm2		; SSE2-NEXT: psubd %xmm1, %xmm3
; SSE2-NEXT: pcmpgtd %xmm3, %xmm1		; SSE2-NEXT: pcmpgtd %xmm2, %xmm1
; SSE2-NEXT: pcmpgtd %xmm2, %xmm0		; SSE2-NEXT: pcmpgtd %xmm3, %xmm0
; SSE2-NEXT: pxor %xmm1, %xmm0		; SSE2-NEXT: pxor %xmm1, %xmm0
; SSE2-NEXT: movdqa %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm1
; SSE2-NEXT: pandn %xmm2, %xmm1		; SSE2-NEXT: pandn %xmm3, %xmm1
; SSE2-NEXT: psrad $31, %xmm2		; SSE2-NEXT: psrad $31, %xmm3
; SSE2-NEXT: pxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2		; SSE2-NEXT: pxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3
; SSE2-NEXT: pand %xmm0, %xmm2		; SSE2-NEXT: pand %xmm3, %xmm0
; SSE2-NEXT: por %xmm1, %xmm2		; SSE2-NEXT: por %xmm1, %xmm0
; SSE2-NEXT: movdqa %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSSE3-LABEL: v4i32:		; SSSE3-LABEL: v4i32:
; SSSE3: # %bb.0:		; SSSE3: # %bb.0:
; SSSE3-NEXT: pxor %xmm3, %xmm3		; SSSE3-NEXT: pxor %xmm2, %xmm2
; SSSE3-NEXT: movdqa %xmm0, %xmm2		; SSSE3-NEXT: movdqa %xmm0, %xmm3
; SSSE3-NEXT: psubd %xmm1, %xmm2		; SSSE3-NEXT: psubd %xmm1, %xmm3
; SSSE3-NEXT: pcmpgtd %xmm3, %xmm1		; SSSE3-NEXT: pcmpgtd %xmm2, %xmm1
; SSSE3-NEXT: pcmpgtd %xmm2, %xmm0		; SSSE3-NEXT: pcmpgtd %xmm3, %xmm0
; SSSE3-NEXT: pxor %xmm1, %xmm0		; SSSE3-NEXT: pxor %xmm1, %xmm0
; SSSE3-NEXT: movdqa %xmm0, %xmm1		; SSSE3-NEXT: movdqa %xmm0, %xmm1
; SSSE3-NEXT: pandn %xmm2, %xmm1		; SSSE3-NEXT: pandn %xmm3, %xmm1
; SSSE3-NEXT: psrad $31, %xmm2		; SSSE3-NEXT: psrad $31, %xmm3
; SSSE3-NEXT: pxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2		; SSSE3-NEXT: pxor {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3
; SSSE3-NEXT: pand %xmm0, %xmm2		; SSSE3-NEXT: pand %xmm3, %xmm0
; SSSE3-NEXT: por %xmm1, %xmm2		; SSSE3-NEXT: por %xmm1, %xmm0
; SSSE3-NEXT: movdqa %xmm2, %xmm0
; SSSE3-NEXT: retq		; SSSE3-NEXT: retq
;		;
; SSE41-LABEL: v4i32:		; SSE41-LABEL: v4i32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: pxor %xmm3, %xmm3		; SSE41-NEXT: pxor %xmm3, %xmm3
; SSE41-NEXT: movdqa %xmm0, %xmm2		; SSE41-NEXT: movdqa %xmm0, %xmm2
; SSE41-NEXT: psubd %xmm1, %xmm2		; SSE41-NEXT: psubd %xmm1, %xmm2
; SSE41-NEXT: pcmpgtd %xmm3, %xmm1		; SSE41-NEXT: pcmpgtd %xmm3, %xmm1
▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
; AVX512BW-NEXT: retq		; AVX512BW-NEXT: retq
%z = call <4 x i32> @llvm.ssub.sat.v4i32(<4 x i32> %x, <4 x i32> %y)		%z = call <4 x i32> @llvm.ssub.sat.v4i32(<4 x i32> %x, <4 x i32> %y)
ret <4 x i32> %z		ret <4 x i32> %z
}		}

define <8 x i32> @v8i32(<8 x i32> %x, <8 x i32> %y) nounwind {		define <8 x i32> @v8i32(<8 x i32> %x, <8 x i32> %y) nounwind {
; SSE2-LABEL: v8i32:		; SSE2-LABEL: v8i32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa %xmm0, %xmm4		; SSE2-NEXT: pxor %xmm4, %xmm4
; SSE2-NEXT: pxor %xmm5, %xmm5		; SSE2-NEXT: movdqa %xmm0, %xmm5
; SSE2-NEXT: psubd %xmm2, %xmm0		; SSE2-NEXT: psubd %xmm2, %xmm5
; SSE2-NEXT: pcmpgtd %xmm5, %xmm2		; SSE2-NEXT: pcmpgtd %xmm4, %xmm2
; SSE2-NEXT: pcmpgtd %xmm0, %xmm4		; SSE2-NEXT: pcmpgtd %xmm5, %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm4		; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: movdqa %xmm4, %xmm2		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pandn %xmm0, %xmm2		; SSE2-NEXT: pandn %xmm5, %xmm2
; SSE2-NEXT: psrad $31, %xmm0		; SSE2-NEXT: psrad $31, %xmm5
; SSE2-NEXT: movdqa {{.*#+}} xmm6 = [2147483648,2147483648,2147483648,2147483648]		; SSE2-NEXT: movdqa {{.*#+}} xmm6 = [2147483648,2147483648,2147483648,2147483648]
; SSE2-NEXT: pxor %xmm6, %xmm0		; SSE2-NEXT: pxor %xmm6, %xmm5
; SSE2-NEXT: pand %xmm4, %xmm0		; SSE2-NEXT: pand %xmm5, %xmm0
; SSE2-NEXT: por %xmm2, %xmm0		; SSE2-NEXT: por %xmm2, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm2		; SSE2-NEXT: movdqa %xmm1, %xmm2
; SSE2-NEXT: psubd %xmm3, %xmm2		; SSE2-NEXT: psubd %xmm3, %xmm2
; SSE2-NEXT: pcmpgtd %xmm5, %xmm3		; SSE2-NEXT: pcmpgtd %xmm4, %xmm3
; SSE2-NEXT: pcmpgtd %xmm2, %xmm1		; SSE2-NEXT: pcmpgtd %xmm2, %xmm1
; SSE2-NEXT: pxor %xmm3, %xmm1		; SSE2-NEXT: pxor %xmm3, %xmm1
; SSE2-NEXT: movdqa %xmm1, %xmm3		; SSE2-NEXT: movdqa %xmm1, %xmm3
; SSE2-NEXT: pandn %xmm2, %xmm3		; SSE2-NEXT: pandn %xmm2, %xmm3
; SSE2-NEXT: psrad $31, %xmm2		; SSE2-NEXT: psrad $31, %xmm2
; SSE2-NEXT: pxor %xmm6, %xmm2		; SSE2-NEXT: pxor %xmm6, %xmm2
; SSE2-NEXT: pand %xmm1, %xmm2		; SSE2-NEXT: pand %xmm2, %xmm1
; SSE2-NEXT: por %xmm3, %xmm2		; SSE2-NEXT: por %xmm3, %xmm1
; SSE2-NEXT: movdqa %xmm2, %xmm1
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSSE3-LABEL: v8i32:		; SSSE3-LABEL: v8i32:
; SSSE3: # %bb.0:		; SSSE3: # %bb.0:
; SSSE3-NEXT: movdqa %xmm0, %xmm4		; SSSE3-NEXT: pxor %xmm4, %xmm4
; SSSE3-NEXT: pxor %xmm5, %xmm5		; SSSE3-NEXT: movdqa %xmm0, %xmm5
; SSSE3-NEXT: psubd %xmm2, %xmm0		; SSSE3-NEXT: psubd %xmm2, %xmm5
; SSSE3-NEXT: pcmpgtd %xmm5, %xmm2		; SSSE3-NEXT: pcmpgtd %xmm4, %xmm2
; SSSE3-NEXT: pcmpgtd %xmm0, %xmm4		; SSSE3-NEXT: pcmpgtd %xmm5, %xmm0
; SSSE3-NEXT: pxor %xmm2, %xmm4		; SSSE3-NEXT: pxor %xmm2, %xmm0
; SSSE3-NEXT: movdqa %xmm4, %xmm2		; SSSE3-NEXT: movdqa %xmm0, %xmm2
; SSSE3-NEXT: pandn %xmm0, %xmm2		; SSSE3-NEXT: pandn %xmm5, %xmm2
; SSSE3-NEXT: psrad $31, %xmm0		; SSSE3-NEXT: psrad $31, %xmm5
; SSSE3-NEXT: movdqa {{.*#+}} xmm6 = [2147483648,2147483648,2147483648,2147483648]		; SSSE3-NEXT: movdqa {{.*#+}} xmm6 = [2147483648,2147483648,2147483648,2147483648]
; SSSE3-NEXT: pxor %xmm6, %xmm0		; SSSE3-NEXT: pxor %xmm6, %xmm5
; SSSE3-NEXT: pand %xmm4, %xmm0		; SSSE3-NEXT: pand %xmm5, %xmm0
; SSSE3-NEXT: por %xmm2, %xmm0		; SSSE3-NEXT: por %xmm2, %xmm0
; SSSE3-NEXT: movdqa %xmm1, %xmm2		; SSSE3-NEXT: movdqa %xmm1, %xmm2
; SSSE3-NEXT: psubd %xmm3, %xmm2		; SSSE3-NEXT: psubd %xmm3, %xmm2
; SSSE3-NEXT: pcmpgtd %xmm5, %xmm3		; SSSE3-NEXT: pcmpgtd %xmm4, %xmm3
; SSSE3-NEXT: pcmpgtd %xmm2, %xmm1		; SSSE3-NEXT: pcmpgtd %xmm2, %xmm1
; SSSE3-NEXT: pxor %xmm3, %xmm1		; SSSE3-NEXT: pxor %xmm3, %xmm1
; SSSE3-NEXT: movdqa %xmm1, %xmm3		; SSSE3-NEXT: movdqa %xmm1, %xmm3
; SSSE3-NEXT: pandn %xmm2, %xmm3		; SSSE3-NEXT: pandn %xmm2, %xmm3
; SSSE3-NEXT: psrad $31, %xmm2		; SSSE3-NEXT: psrad $31, %xmm2
; SSSE3-NEXT: pxor %xmm6, %xmm2		; SSSE3-NEXT: pxor %xmm6, %xmm2
; SSSE3-NEXT: pand %xmm1, %xmm2		; SSSE3-NEXT: pand %xmm2, %xmm1
; SSSE3-NEXT: por %xmm3, %xmm2		; SSSE3-NEXT: por %xmm3, %xmm1
; SSSE3-NEXT: movdqa %xmm2, %xmm1
; SSSE3-NEXT: retq		; SSSE3-NEXT: retq
;		;
; SSE41-LABEL: v8i32:		; SSE41-LABEL: v8i32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movdqa %xmm1, %xmm5		; SSE41-NEXT: movdqa %xmm1, %xmm5
; SSE41-NEXT: pxor %xmm6, %xmm6		; SSE41-NEXT: pxor %xmm6, %xmm6
; SSE41-NEXT: movdqa %xmm0, %xmm4		; SSE41-NEXT: movdqa %xmm0, %xmm4
; SSE41-NEXT: psubd %xmm2, %xmm4		; SSE41-NEXT: psubd %xmm2, %xmm4
▲ Show 20 Lines • Show All 79 Lines • ▼ Show 20 Lines
; AVX512BW-NEXT: retq		; AVX512BW-NEXT: retq
%z = call <8 x i32> @llvm.ssub.sat.v8i32(<8 x i32> %x, <8 x i32> %y)		%z = call <8 x i32> @llvm.ssub.sat.v8i32(<8 x i32> %x, <8 x i32> %y)
ret <8 x i32> %z		ret <8 x i32> %z
}		}

define <16 x i32> @v16i32(<16 x i32> %x, <16 x i32> %y) nounwind {		define <16 x i32> @v16i32(<16 x i32> %x, <16 x i32> %y) nounwind {
; SSE2-LABEL: v16i32:		; SSE2-LABEL: v16i32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa %xmm1, %xmm8		; SSE2-NEXT: pxor %xmm8, %xmm8
; SSE2-NEXT: movdqa %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm9
; SSE2-NEXT: pxor %xmm9, %xmm9		; SSE2-NEXT: psubd %xmm4, %xmm9
; SSE2-NEXT: psubd %xmm4, %xmm0		; SSE2-NEXT: pcmpgtd %xmm8, %xmm4
; SSE2-NEXT: pcmpgtd %xmm9, %xmm4		; SSE2-NEXT: pcmpgtd %xmm9, %xmm0
; SSE2-NEXT: pcmpgtd %xmm0, %xmm1		; SSE2-NEXT: pxor %xmm4, %xmm0
; SSE2-NEXT: pxor %xmm4, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm4
; SSE2-NEXT: movdqa %xmm1, %xmm4		; SSE2-NEXT: pandn %xmm9, %xmm4
; SSE2-NEXT: pandn %xmm0, %xmm4		; SSE2-NEXT: psrad $31, %xmm9
; SSE2-NEXT: psrad $31, %xmm0
; SSE2-NEXT: movdqa {{.*#+}} xmm10 = [2147483648,2147483648,2147483648,2147483648]		; SSE2-NEXT: movdqa {{.*#+}} xmm10 = [2147483648,2147483648,2147483648,2147483648]
; SSE2-NEXT: pxor %xmm10, %xmm0		; SSE2-NEXT: pxor %xmm10, %xmm9
; SSE2-NEXT: pand %xmm1, %xmm0		; SSE2-NEXT: pand %xmm9, %xmm0
; SSE2-NEXT: por %xmm4, %xmm0		; SSE2-NEXT: por %xmm4, %xmm0
; SSE2-NEXT: movdqa %xmm8, %xmm1		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: psubd %xmm5, %xmm1		; SSE2-NEXT: psubd %xmm5, %xmm4
; SSE2-NEXT: pcmpgtd %xmm9, %xmm5		; SSE2-NEXT: pcmpgtd %xmm8, %xmm5
; SSE2-NEXT: pcmpgtd %xmm1, %xmm8		; SSE2-NEXT: pcmpgtd %xmm4, %xmm1
; SSE2-NEXT: pxor %xmm5, %xmm8		; SSE2-NEXT: pxor %xmm5, %xmm1
; SSE2-NEXT: movdqa %xmm8, %xmm4		; SSE2-NEXT: movdqa %xmm1, %xmm5
; SSE2-NEXT: pandn %xmm1, %xmm4		; SSE2-NEXT: pandn %xmm4, %xmm5
; SSE2-NEXT: psrad $31, %xmm1		; SSE2-NEXT: psrad $31, %xmm4
; SSE2-NEXT: pxor %xmm10, %xmm1		; SSE2-NEXT: pxor %xmm10, %xmm4
; SSE2-NEXT: pand %xmm8, %xmm1		; SSE2-NEXT: pand %xmm4, %xmm1
; SSE2-NEXT: por %xmm4, %xmm1		; SSE2-NEXT: por %xmm5, %xmm1
; SSE2-NEXT: movdqa %xmm2, %xmm4		; SSE2-NEXT: movdqa %xmm2, %xmm4
; SSE2-NEXT: psubd %xmm6, %xmm4		; SSE2-NEXT: psubd %xmm6, %xmm4
; SSE2-NEXT: pcmpgtd %xmm9, %xmm6		; SSE2-NEXT: pcmpgtd %xmm8, %xmm6
; SSE2-NEXT: pcmpgtd %xmm4, %xmm2		; SSE2-NEXT: pcmpgtd %xmm4, %xmm2
; SSE2-NEXT: pxor %xmm6, %xmm2		; SSE2-NEXT: pxor %xmm6, %xmm2
; SSE2-NEXT: movdqa %xmm2, %xmm5		; SSE2-NEXT: movdqa %xmm2, %xmm5
; SSE2-NEXT: pandn %xmm4, %xmm5		; SSE2-NEXT: pandn %xmm4, %xmm5
; SSE2-NEXT: psrad $31, %xmm4		; SSE2-NEXT: psrad $31, %xmm4
; SSE2-NEXT: pxor %xmm10, %xmm4		; SSE2-NEXT: pxor %xmm10, %xmm4
; SSE2-NEXT: pand %xmm2, %xmm4		; SSE2-NEXT: pand %xmm4, %xmm2
; SSE2-NEXT: por %xmm5, %xmm4		; SSE2-NEXT: por %xmm5, %xmm2
; SSE2-NEXT: movdqa %xmm3, %xmm5		; SSE2-NEXT: movdqa %xmm3, %xmm4
; SSE2-NEXT: psubd %xmm7, %xmm5		; SSE2-NEXT: psubd %xmm7, %xmm4
; SSE2-NEXT: pcmpgtd %xmm9, %xmm7		; SSE2-NEXT: pcmpgtd %xmm8, %xmm7
; SSE2-NEXT: pcmpgtd %xmm5, %xmm3		; SSE2-NEXT: pcmpgtd %xmm4, %xmm3
; SSE2-NEXT: pxor %xmm7, %xmm3		; SSE2-NEXT: pxor %xmm7, %xmm3
; SSE2-NEXT: movdqa %xmm3, %xmm2		; SSE2-NEXT: movdqa %xmm3, %xmm5
; SSE2-NEXT: pandn %xmm5, %xmm2		; SSE2-NEXT: pandn %xmm4, %xmm5
; SSE2-NEXT: psrad $31, %xmm5		; SSE2-NEXT: psrad $31, %xmm4
; SSE2-NEXT: pxor %xmm10, %xmm5		; SSE2-NEXT: pxor %xmm10, %xmm4
; SSE2-NEXT: pand %xmm3, %xmm5		; SSE2-NEXT: pand %xmm4, %xmm3
; SSE2-NEXT: por %xmm2, %xmm5		; SSE2-NEXT: por %xmm5, %xmm3
; SSE2-NEXT: movdqa %xmm4, %xmm2
; SSE2-NEXT: movdqa %xmm5, %xmm3
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSSE3-LABEL: v16i32:		; SSSE3-LABEL: v16i32:
; SSSE3: # %bb.0:		; SSSE3: # %bb.0:
; SSSE3-NEXT: movdqa %xmm1, %xmm8		; SSSE3-NEXT: pxor %xmm8, %xmm8
; SSSE3-NEXT: movdqa %xmm0, %xmm1		; SSSE3-NEXT: movdqa %xmm0, %xmm9
; SSSE3-NEXT: pxor %xmm9, %xmm9		; SSSE3-NEXT: psubd %xmm4, %xmm9
; SSSE3-NEXT: psubd %xmm4, %xmm0		; SSSE3-NEXT: pcmpgtd %xmm8, %xmm4
; SSSE3-NEXT: pcmpgtd %xmm9, %xmm4		; SSSE3-NEXT: pcmpgtd %xmm9, %xmm0
; SSSE3-NEXT: pcmpgtd %xmm0, %xmm1		; SSSE3-NEXT: pxor %xmm4, %xmm0
; SSSE3-NEXT: pxor %xmm4, %xmm1		; SSSE3-NEXT: movdqa %xmm0, %xmm4
; SSSE3-NEXT: movdqa %xmm1, %xmm4		; SSSE3-NEXT: pandn %xmm9, %xmm4
; SSSE3-NEXT: pandn %xmm0, %xmm4		; SSSE3-NEXT: psrad $31, %xmm9
; SSSE3-NEXT: psrad $31, %xmm0
; SSSE3-NEXT: movdqa {{.*#+}} xmm10 = [2147483648,2147483648,2147483648,2147483648]		; SSSE3-NEXT: movdqa {{.*#+}} xmm10 = [2147483648,2147483648,2147483648,2147483648]
; SSSE3-NEXT: pxor %xmm10, %xmm0		; SSSE3-NEXT: pxor %xmm10, %xmm9
; SSSE3-NEXT: pand %xmm1, %xmm0		; SSSE3-NEXT: pand %xmm9, %xmm0
; SSSE3-NEXT: por %xmm4, %xmm0		; SSSE3-NEXT: por %xmm4, %xmm0
; SSSE3-NEXT: movdqa %xmm8, %xmm1		; SSSE3-NEXT: movdqa %xmm1, %xmm4
; SSSE3-NEXT: psubd %xmm5, %xmm1		; SSSE3-NEXT: psubd %xmm5, %xmm4
; SSSE3-NEXT: pcmpgtd %xmm9, %xmm5		; SSSE3-NEXT: pcmpgtd %xmm8, %xmm5
; SSSE3-NEXT: pcmpgtd %xmm1, %xmm8		; SSSE3-NEXT: pcmpgtd %xmm4, %xmm1
; SSSE3-NEXT: pxor %xmm5, %xmm8		; SSSE3-NEXT: pxor %xmm5, %xmm1
; SSSE3-NEXT: movdqa %xmm8, %xmm4		; SSSE3-NEXT: movdqa %xmm1, %xmm5
; SSSE3-NEXT: pandn %xmm1, %xmm4		; SSSE3-NEXT: pandn %xmm4, %xmm5
; SSSE3-NEXT: psrad $31, %xmm1		; SSSE3-NEXT: psrad $31, %xmm4
; SSSE3-NEXT: pxor %xmm10, %xmm1		; SSSE3-NEXT: pxor %xmm10, %xmm4
; SSSE3-NEXT: pand %xmm8, %xmm1		; SSSE3-NEXT: pand %xmm4, %xmm1
; SSSE3-NEXT: por %xmm4, %xmm1		; SSSE3-NEXT: por %xmm5, %xmm1
; SSSE3-NEXT: movdqa %xmm2, %xmm4		; SSSE3-NEXT: movdqa %xmm2, %xmm4
; SSSE3-NEXT: psubd %xmm6, %xmm4		; SSSE3-NEXT: psubd %xmm6, %xmm4
; SSSE3-NEXT: pcmpgtd %xmm9, %xmm6		; SSSE3-NEXT: pcmpgtd %xmm8, %xmm6
; SSSE3-NEXT: pcmpgtd %xmm4, %xmm2		; SSSE3-NEXT: pcmpgtd %xmm4, %xmm2
; SSSE3-NEXT: pxor %xmm6, %xmm2		; SSSE3-NEXT: pxor %xmm6, %xmm2
; SSSE3-NEXT: movdqa %xmm2, %xmm5		; SSSE3-NEXT: movdqa %xmm2, %xmm5
; SSSE3-NEXT: pandn %xmm4, %xmm5		; SSSE3-NEXT: pandn %xmm4, %xmm5
; SSSE3-NEXT: psrad $31, %xmm4		; SSSE3-NEXT: psrad $31, %xmm4
; SSSE3-NEXT: pxor %xmm10, %xmm4		; SSSE3-NEXT: pxor %xmm10, %xmm4
; SSSE3-NEXT: pand %xmm2, %xmm4		; SSSE3-NEXT: pand %xmm4, %xmm2
; SSSE3-NEXT: por %xmm5, %xmm4		; SSSE3-NEXT: por %xmm5, %xmm2
; SSSE3-NEXT: movdqa %xmm3, %xmm5		; SSSE3-NEXT: movdqa %xmm3, %xmm4
; SSSE3-NEXT: psubd %xmm7, %xmm5		; SSSE3-NEXT: psubd %xmm7, %xmm4
; SSSE3-NEXT: pcmpgtd %xmm9, %xmm7		; SSSE3-NEXT: pcmpgtd %xmm8, %xmm7
; SSSE3-NEXT: pcmpgtd %xmm5, %xmm3		; SSSE3-NEXT: pcmpgtd %xmm4, %xmm3
; SSSE3-NEXT: pxor %xmm7, %xmm3		; SSSE3-NEXT: pxor %xmm7, %xmm3
; SSSE3-NEXT: movdqa %xmm3, %xmm2		; SSSE3-NEXT: movdqa %xmm3, %xmm5
; SSSE3-NEXT: pandn %xmm5, %xmm2		; SSSE3-NEXT: pandn %xmm4, %xmm5
; SSSE3-NEXT: psrad $31, %xmm5		; SSSE3-NEXT: psrad $31, %xmm4
; SSSE3-NEXT: pxor %xmm10, %xmm5		; SSSE3-NEXT: pxor %xmm10, %xmm4
; SSSE3-NEXT: pand %xmm3, %xmm5		; SSSE3-NEXT: pand %xmm4, %xmm3
; SSSE3-NEXT: por %xmm2, %xmm5		; SSSE3-NEXT: por %xmm5, %xmm3
; SSSE3-NEXT: movdqa %xmm4, %xmm2
; SSSE3-NEXT: movdqa %xmm5, %xmm3
; SSSE3-NEXT: retq		; SSSE3-NEXT: retq
;		;
; SSE41-LABEL: v16i32:		; SSE41-LABEL: v16i32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movdqa %xmm3, %xmm8		; SSE41-NEXT: movdqa %xmm3, %xmm8
; SSE41-NEXT: movdqa %xmm2, %xmm10		; SSE41-NEXT: movdqa %xmm2, %xmm10
; SSE41-NEXT: movdqa %xmm1, %xmm3		; SSE41-NEXT: movdqa %xmm1, %xmm3
; SSE41-NEXT: pxor %xmm11, %xmm11		; SSE41-NEXT: pxor %xmm11, %xmm11
▲ Show 20 Lines • Show All 1,022 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/stack-folding-fp-avx512.ll

	Show First 20 Lines • Show All 330 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: nop			; CHECK-NEXT: nop
	; CHECK-NEXT: #NO_APP			; CHECK-NEXT: #NO_APP
	; CHECK-NEXT: vmovupd {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload			; CHECK-NEXT: vmovupd {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload
	; CHECK-NEXT: vaddpd (%rdi), %zmm0, %zmm0			; CHECK-NEXT: vaddpd (%rdi), %zmm0, %zmm0
	; CHECK-NEXT: vcmpeqpd {{[-0-9]+}}(%r{{[sb]}}p), %zmm0, %k0 # 64-byte Folded Reload			; CHECK-NEXT: vcmpeqpd {{[-0-9]+}}(%r{{[sb]}}p), %zmm0, %k0 # 64-byte Folded Reload
	; CHECK-NEXT: kmovw %esi, %k1			; CHECK-NEXT: kmovw %esi, %k1
	; CHECK-NEXT: kandb %k0, %k1, %k1			; CHECK-NEXT: kandb %k0, %k1, %k1
	; CHECK-NEXT: vmovupd {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload			; CHECK-NEXT: vmovupd {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload
	; CHECK-NEXT: vblendmpd (%rsp), %zmm0, %zmm0 {%k1} # 64-byte Folded Reload			; CHECK-NEXT: vmovupd (%rsp), %zmm1 # 64-byte Reload
				; CHECK-NEXT: vmovapd %zmm1, %zmm0 {%k1}
	; CHECK-NEXT: addq $136, %rsp			; CHECK-NEXT: addq $136, %rsp
	; CHECK-NEXT: .cfi_def_cfa_offset 8			; CHECK-NEXT: .cfi_def_cfa_offset 8
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%1 = tail call <2 x i64> asm sideeffect "nop", "=x,~{xmm1},~{xmm2},~{xmm3},~{xmm4},~{xmm5},~{xmm6},~{xmm7},~{xmm8},~{xmm9},~{xmm10},~{xmm11},~{xmm12},~{xmm13},~{xmm14},~{xmm15},~{xmm16},~{xmm17},~{xmm18},~{xmm19},~{xmm20},~{xmm21},~{xmm22},~{xmm23},~{xmm24},~{xmm25},~{xmm26},~{xmm27},~{xmm28},~{xmm29},~{xmm30},~{xmm31},~{flags}"()			%1 = tail call <2 x i64> asm sideeffect "nop", "=x,~{xmm1},~{xmm2},~{xmm3},~{xmm4},~{xmm5},~{xmm6},~{xmm7},~{xmm8},~{xmm9},~{xmm10},~{xmm11},~{xmm12},~{xmm13},~{xmm14},~{xmm15},~{xmm16},~{xmm17},~{xmm18},~{xmm19},~{xmm20},~{xmm21},~{xmm22},~{xmm23},~{xmm24},~{xmm25},~{xmm26},~{xmm27},~{xmm28},~{xmm29},~{xmm30},~{xmm31},~{flags}"()
	; load and fadd are here to keep the operations below the side effecting block and to avoid folding the wrong load			; load and fadd are here to keep the operations below the side effecting block and to avoid folding the wrong load
	%2 = load <8 x double>, <8 x double>* %a2			%2 = load <8 x double>, <8 x double>* %a2
	%3 = fadd <8 x double> %a1, %2			%3 = fadd <8 x double> %a1, %2
	%4 = bitcast i8 %mask to <8 x i1>			%4 = bitcast i8 %mask to <8 x i1>
	Show All 16 Lines
	; CHECK-NEXT: nop			; CHECK-NEXT: nop
	; CHECK-NEXT: #NO_APP			; CHECK-NEXT: #NO_APP
	; CHECK-NEXT: vmovupd {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload			; CHECK-NEXT: vmovupd {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload
	; CHECK-NEXT: vaddpd (%rdi), %zmm0, %zmm0			; CHECK-NEXT: vaddpd (%rdi), %zmm0, %zmm0
	; CHECK-NEXT: vcmpeqpd {{[-0-9]+}}(%r{{[sb]}}p), %zmm0, %k0 # 64-byte Folded Reload			; CHECK-NEXT: vcmpeqpd {{[-0-9]+}}(%r{{[sb]}}p), %zmm0, %k0 # 64-byte Folded Reload
	; CHECK-NEXT: kmovw %esi, %k1			; CHECK-NEXT: kmovw %esi, %k1
	; CHECK-NEXT: kandb %k0, %k1, %k1			; CHECK-NEXT: kandb %k0, %k1, %k1
	; CHECK-NEXT: vmovupd {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload			; CHECK-NEXT: vmovupd {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload
	; CHECK-NEXT: vblendmpd (%rsp), %zmm0, %zmm0 {%k1} # 64-byte Folded Reload			; CHECK-NEXT: vmovupd (%rsp), %zmm1 # 64-byte Reload
				; CHECK-NEXT: vmovapd %zmm1, %zmm0 {%k1}
	; CHECK-NEXT: addq $136, %rsp			; CHECK-NEXT: addq $136, %rsp
	; CHECK-NEXT: .cfi_def_cfa_offset 8			; CHECK-NEXT: .cfi_def_cfa_offset 8
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%1 = tail call <2 x i64> asm sideeffect "nop", "=x,~{xmm1},~{xmm2},~{xmm3},~{xmm4},~{xmm5},~{xmm6},~{xmm7},~{xmm8},~{xmm9},~{xmm10},~{xmm11},~{xmm12},~{xmm13},~{xmm14},~{xmm15},~{xmm16},~{xmm17},~{xmm18},~{xmm19},~{xmm20},~{xmm21},~{xmm22},~{xmm23},~{xmm24},~{xmm25},~{xmm26},~{xmm27},~{xmm28},~{xmm29},~{xmm30},~{xmm31},~{flags}"()			%1 = tail call <2 x i64> asm sideeffect "nop", "=x,~{xmm1},~{xmm2},~{xmm3},~{xmm4},~{xmm5},~{xmm6},~{xmm7},~{xmm8},~{xmm9},~{xmm10},~{xmm11},~{xmm12},~{xmm13},~{xmm14},~{xmm15},~{xmm16},~{xmm17},~{xmm18},~{xmm19},~{xmm20},~{xmm21},~{xmm22},~{xmm23},~{xmm24},~{xmm25},~{xmm26},~{xmm27},~{xmm28},~{xmm29},~{xmm30},~{xmm31},~{flags}"()
	; load and fadd are here to keep the operations below the side effecting block and to avoid folding the wrong load			; load and fadd are here to keep the operations below the side effecting block and to avoid folding the wrong load
	%2 = load <8 x double>, <8 x double>* %a2			%2 = load <8 x double>, <8 x double>* %a2
	%3 = fadd <8 x double> %a1, %2			%3 = fadd <8 x double> %a1, %2
	%4 = bitcast i8 %mask to <8 x i1>			%4 = bitcast i8 %mask to <8 x i1>
	Show All 35 Lines
	; CHECK-NEXT: nop			; CHECK-NEXT: nop
	; CHECK-NEXT: #NO_APP			; CHECK-NEXT: #NO_APP
	; CHECK-NEXT: vmovups {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload			; CHECK-NEXT: vmovups {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload
	; CHECK-NEXT: vaddps (%rdi), %zmm0, %zmm0			; CHECK-NEXT: vaddps (%rdi), %zmm0, %zmm0
	; CHECK-NEXT: vcmpeqps {{[-0-9]+}}(%r{{[sb]}}p), %zmm0, %k0 # 64-byte Folded Reload			; CHECK-NEXT: vcmpeqps {{[-0-9]+}}(%r{{[sb]}}p), %zmm0, %k0 # 64-byte Folded Reload
	; CHECK-NEXT: kmovw %esi, %k1			; CHECK-NEXT: kmovw %esi, %k1
	; CHECK-NEXT: kandw %k0, %k1, %k1			; CHECK-NEXT: kandw %k0, %k1, %k1
	; CHECK-NEXT: vmovups {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload			; CHECK-NEXT: vmovups {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload
	; CHECK-NEXT: vblendmps (%rsp), %zmm0, %zmm0 {%k1} # 64-byte Folded Reload			; CHECK-NEXT: vmovups (%rsp), %zmm1 # 64-byte Reload
				; CHECK-NEXT: vmovaps %zmm1, %zmm0 {%k1}
	; CHECK-NEXT: addq $136, %rsp			; CHECK-NEXT: addq $136, %rsp
	; CHECK-NEXT: .cfi_def_cfa_offset 8			; CHECK-NEXT: .cfi_def_cfa_offset 8
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%1 = tail call <2 x i64> asm sideeffect "nop", "=x,~{xmm1},~{xmm2},~{xmm3},~{xmm4},~{xmm5},~{xmm6},~{xmm7},~{xmm8},~{xmm9},~{xmm10},~{xmm11},~{xmm12},~{xmm13},~{xmm14},~{xmm15},~{xmm16},~{xmm17},~{xmm18},~{xmm19},~{xmm20},~{xmm21},~{xmm22},~{xmm23},~{xmm24},~{xmm25},~{xmm26},~{xmm27},~{xmm28},~{xmm29},~{xmm30},~{xmm31},~{flags}"()			%1 = tail call <2 x i64> asm sideeffect "nop", "=x,~{xmm1},~{xmm2},~{xmm3},~{xmm4},~{xmm5},~{xmm6},~{xmm7},~{xmm8},~{xmm9},~{xmm10},~{xmm11},~{xmm12},~{xmm13},~{xmm14},~{xmm15},~{xmm16},~{xmm17},~{xmm18},~{xmm19},~{xmm20},~{xmm21},~{xmm22},~{xmm23},~{xmm24},~{xmm25},~{xmm26},~{xmm27},~{xmm28},~{xmm29},~{xmm30},~{xmm31},~{flags}"()
	; load and fadd are here to keep the operations below the side effecting block and to avoid folding the wrong load			; load and fadd are here to keep the operations below the side effecting block and to avoid folding the wrong load
	%2 = load <16 x float>, <16 x float>* %a2			%2 = load <16 x float>, <16 x float>* %a2
	%3 = fadd <16 x float> %a1, %2			%3 = fadd <16 x float> %a1, %2
	%4 = bitcast i16 %mask to <16 x i1>			%4 = bitcast i16 %mask to <16 x i1>
	Show All 16 Lines
	; CHECK-NEXT: nop			; CHECK-NEXT: nop
	; CHECK-NEXT: #NO_APP			; CHECK-NEXT: #NO_APP
	; CHECK-NEXT: vmovups {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload			; CHECK-NEXT: vmovups {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload
	; CHECK-NEXT: vaddps (%rdi), %zmm0, %zmm0			; CHECK-NEXT: vaddps (%rdi), %zmm0, %zmm0
	; CHECK-NEXT: vcmpeqps {{[-0-9]+}}(%r{{[sb]}}p), %zmm0, %k0 # 64-byte Folded Reload			; CHECK-NEXT: vcmpeqps {{[-0-9]+}}(%r{{[sb]}}p), %zmm0, %k0 # 64-byte Folded Reload
	; CHECK-NEXT: kmovw %esi, %k1			; CHECK-NEXT: kmovw %esi, %k1
	; CHECK-NEXT: kandw %k0, %k1, %k1			; CHECK-NEXT: kandw %k0, %k1, %k1
	; CHECK-NEXT: vmovups {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload			; CHECK-NEXT: vmovups {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload
	; CHECK-NEXT: vblendmps (%rsp), %zmm0, %zmm0 {%k1} # 64-byte Folded Reload			; CHECK-NEXT: vmovups (%rsp), %zmm1 # 64-byte Reload
				; CHECK-NEXT: vmovaps %zmm1, %zmm0 {%k1}
	; CHECK-NEXT: addq $136, %rsp			; CHECK-NEXT: addq $136, %rsp
	; CHECK-NEXT: .cfi_def_cfa_offset 8			; CHECK-NEXT: .cfi_def_cfa_offset 8
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%1 = tail call <2 x i64> asm sideeffect "nop", "=x,~{xmm1},~{xmm2},~{xmm3},~{xmm4},~{xmm5},~{xmm6},~{xmm7},~{xmm8},~{xmm9},~{xmm10},~{xmm11},~{xmm12},~{xmm13},~{xmm14},~{xmm15},~{xmm16},~{xmm17},~{xmm18},~{xmm19},~{xmm20},~{xmm21},~{xmm22},~{xmm23},~{xmm24},~{xmm25},~{xmm26},~{xmm27},~{xmm28},~{xmm29},~{xmm30},~{xmm31},~{flags}"()			%1 = tail call <2 x i64> asm sideeffect "nop", "=x,~{xmm1},~{xmm2},~{xmm3},~{xmm4},~{xmm5},~{xmm6},~{xmm7},~{xmm8},~{xmm9},~{xmm10},~{xmm11},~{xmm12},~{xmm13},~{xmm14},~{xmm15},~{xmm16},~{xmm17},~{xmm18},~{xmm19},~{xmm20},~{xmm21},~{xmm22},~{xmm23},~{xmm24},~{xmm25},~{xmm26},~{xmm27},~{xmm28},~{xmm29},~{xmm30},~{xmm31},~{flags}"()
	; load and fadd are here to keep the operations below the side effecting block and to avoid folding the wrong load			; load and fadd are here to keep the operations below the side effecting block and to avoid folding the wrong load
	%2 = load <16 x float>, <16 x float>* %a2			%2 = load <16 x float>, <16 x float>* %a2
	%3 = fadd <16 x float> %a1, %2			%3 = fadd <16 x float> %a1, %2
	%4 = bitcast i16 %mask to <16 x i1>			%4 = bitcast i16 %mask to <16 x i1>
	▲ Show 20 Lines • Show All 1,593 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/stack-folding-int-avx512.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 2,031 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: #APP			; CHECK-NEXT: #APP
	; CHECK-NEXT: nop			; CHECK-NEXT: nop
	; CHECK-NEXT: #NO_APP			; CHECK-NEXT: #NO_APP
	; CHECK-NEXT: vmovdqu64 {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload			; CHECK-NEXT: vmovdqu64 {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload
	; CHECK-NEXT: vpaddd (%rdi), %zmm0, %zmm0			; CHECK-NEXT: vpaddd (%rdi), %zmm0, %zmm0
	; CHECK-NEXT: kmovd %esi, %k1			; CHECK-NEXT: kmovd %esi, %k1
	; CHECK-NEXT: vpcmpeqd {{[-0-9]+}}(%r{{[sb]}}p), %zmm0, %k1 {%k1} # 64-byte Folded Reload			; CHECK-NEXT: vpcmpeqd {{[-0-9]+}}(%r{{[sb]}}p), %zmm0, %k1 {%k1} # 64-byte Folded Reload
	; CHECK-NEXT: vmovdqu64 {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload			; CHECK-NEXT: vmovdqu64 {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload
	; CHECK-NEXT: vpblendmd (%rsp), %zmm0, %zmm0 {%k1} # 64-byte Folded Reload			; CHECK-NEXT: vmovdqu64 (%rsp), %zmm1 # 64-byte Reload
				; CHECK-NEXT: vmovdqa32 %zmm1, %zmm0 {%k1}
	; CHECK-NEXT: addq $136, %rsp			; CHECK-NEXT: addq $136, %rsp
	; CHECK-NEXT: .cfi_def_cfa_offset 8			; CHECK-NEXT: .cfi_def_cfa_offset 8
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%1 = tail call <2 x i64> asm sideeffect "nop", "=x,~{xmm1},~{xmm2},~{xmm3},~{xmm4},~{xmm5},~{xmm6},~{xmm7},~{xmm8},~{xmm9},~{xmm10},~{xmm11},~{xmm12},~{xmm13},~{xmm14},~{xmm15},~{xmm16},~{xmm17},~{xmm18},~{xmm19},~{xmm20},~{xmm21},~{xmm22},~{xmm23},~{xmm24},~{xmm25},~{xmm26},~{xmm27},~{xmm28},~{xmm29},~{xmm30},~{xmm31},~{flags}"()			%1 = tail call <2 x i64> asm sideeffect "nop", "=x,~{xmm1},~{xmm2},~{xmm3},~{xmm4},~{xmm5},~{xmm6},~{xmm7},~{xmm8},~{xmm9},~{xmm10},~{xmm11},~{xmm12},~{xmm13},~{xmm14},~{xmm15},~{xmm16},~{xmm17},~{xmm18},~{xmm19},~{xmm20},~{xmm21},~{xmm22},~{xmm23},~{xmm24},~{xmm25},~{xmm26},~{xmm27},~{xmm28},~{xmm29},~{xmm30},~{xmm31},~{flags}"()
	; load and add are here to keep the operations below the side effecting block and to avoid folding the wrong load			; load and add are here to keep the operations below the side effecting block and to avoid folding the wrong load
	%2 = load <16 x i32>, <16 x i32>* %a2			%2 = load <16 x i32>, <16 x i32>* %a2
	%3 = add <16 x i32> %a1, %2			%3 = add <16 x i32> %a1, %2
	%4 = bitcast i16 %mask to <16 x i1>			%4 = bitcast i16 %mask to <16 x i1>
	Show All 15 Lines
	; CHECK-NEXT: #APP			; CHECK-NEXT: #APP
	; CHECK-NEXT: nop			; CHECK-NEXT: nop
	; CHECK-NEXT: #NO_APP			; CHECK-NEXT: #NO_APP
	; CHECK-NEXT: vmovdqu64 {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload			; CHECK-NEXT: vmovdqu64 {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload
	; CHECK-NEXT: vpaddd (%rdi), %zmm0, %zmm0			; CHECK-NEXT: vpaddd (%rdi), %zmm0, %zmm0
	; CHECK-NEXT: kmovd %esi, %k1			; CHECK-NEXT: kmovd %esi, %k1
	; CHECK-NEXT: vpcmpeqd {{[-0-9]+}}(%r{{[sb]}}p), %zmm0, %k1 {%k1} # 64-byte Folded Reload			; CHECK-NEXT: vpcmpeqd {{[-0-9]+}}(%r{{[sb]}}p), %zmm0, %k1 {%k1} # 64-byte Folded Reload
	; CHECK-NEXT: vmovdqu64 {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload			; CHECK-NEXT: vmovdqu64 {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload
	; CHECK-NEXT: vpblendmd (%rsp), %zmm0, %zmm0 {%k1} # 64-byte Folded Reload			; CHECK-NEXT: vmovdqu64 (%rsp), %zmm1 # 64-byte Reload
				; CHECK-NEXT: vmovdqa32 %zmm1, %zmm0 {%k1}
	; CHECK-NEXT: addq $136, %rsp			; CHECK-NEXT: addq $136, %rsp
	; CHECK-NEXT: .cfi_def_cfa_offset 8			; CHECK-NEXT: .cfi_def_cfa_offset 8
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%1 = tail call <2 x i64> asm sideeffect "nop", "=x,~{xmm1},~{xmm2},~{xmm3},~{xmm4},~{xmm5},~{xmm6},~{xmm7},~{xmm8},~{xmm9},~{xmm10},~{xmm11},~{xmm12},~{xmm13},~{xmm14},~{xmm15},~{xmm16},~{xmm17},~{xmm18},~{xmm19},~{xmm20},~{xmm21},~{xmm22},~{xmm23},~{xmm24},~{xmm25},~{xmm26},~{xmm27},~{xmm28},~{xmm29},~{xmm30},~{xmm31},~{flags}"()			%1 = tail call <2 x i64> asm sideeffect "nop", "=x,~{xmm1},~{xmm2},~{xmm3},~{xmm4},~{xmm5},~{xmm6},~{xmm7},~{xmm8},~{xmm9},~{xmm10},~{xmm11},~{xmm12},~{xmm13},~{xmm14},~{xmm15},~{xmm16},~{xmm17},~{xmm18},~{xmm19},~{xmm20},~{xmm21},~{xmm22},~{xmm23},~{xmm24},~{xmm25},~{xmm26},~{xmm27},~{xmm28},~{xmm29},~{xmm30},~{xmm31},~{flags}"()
	; load and add are here to keep the operations below the side effecting block and to avoid folding the wrong load			; load and add are here to keep the operations below the side effecting block and to avoid folding the wrong load
	%2 = load <16 x i32>, <16 x i32>* %a2			%2 = load <16 x i32>, <16 x i32>* %a2
	%3 = add <16 x i32> %a1, %2			%3 = add <16 x i32> %a1, %2
	%4 = bitcast i16 %mask to <16 x i1>			%4 = bitcast i16 %mask to <16 x i1>
	Show All 15 Lines
	; CHECK-NEXT: #APP			; CHECK-NEXT: #APP
	; CHECK-NEXT: nop			; CHECK-NEXT: nop
	; CHECK-NEXT: #NO_APP			; CHECK-NEXT: #NO_APP
	; CHECK-NEXT: vmovdqu64 {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload			; CHECK-NEXT: vmovdqu64 {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload
	; CHECK-NEXT: vpaddd (%rdi), %zmm0, %zmm0			; CHECK-NEXT: vpaddd (%rdi), %zmm0, %zmm0
	; CHECK-NEXT: kmovd %esi, %k1			; CHECK-NEXT: kmovd %esi, %k1
	; CHECK-NEXT: vpcmpled {{[-0-9]+}}(%r{{[sb]}}p), %zmm0, %k1 {%k1} # 64-byte Folded Reload			; CHECK-NEXT: vpcmpled {{[-0-9]+}}(%r{{[sb]}}p), %zmm0, %k1 {%k1} # 64-byte Folded Reload
	; CHECK-NEXT: vmovdqu64 {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload			; CHECK-NEXT: vmovdqu64 {{[-0-9]+}}(%r{{[sb]}}p), %zmm0 # 64-byte Reload
	; CHECK-NEXT: vpblendmd (%rsp), %zmm0, %zmm0 {%k1} # 64-byte Folded Reload			; CHECK-NEXT: vmovdqu64 (%rsp), %zmm1 # 64-byte Reload
				; CHECK-NEXT: vmovdqa32 %zmm1, %zmm0 {%k1}
	; CHECK-NEXT: addq $136, %rsp			; CHECK-NEXT: addq $136, %rsp
	; CHECK-NEXT: .cfi_def_cfa_offset 8			; CHECK-NEXT: .cfi_def_cfa_offset 8
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%1 = tail call <2 x i64> asm sideeffect "nop", "=x,~{xmm1},~{xmm2},~{xmm3},~{xmm4},~{xmm5},~{xmm6},~{xmm7},~{xmm8},~{xmm9},~{xmm10},~{xmm11},~{xmm12},~{xmm13},~{xmm14},~{xmm15},~{xmm16},~{xmm17},~{xmm18},~{xmm19},~{xmm20},~{xmm21},~{xmm22},~{xmm23},~{xmm24},~{xmm25},~{xmm26},~{xmm27},~{xmm28},~{xmm29},~{xmm30},~{xmm31},~{flags}"()			%1 = tail call <2 x i64> asm sideeffect "nop", "=x,~{xmm1},~{xmm2},~{xmm3},~{xmm4},~{xmm5},~{xmm6},~{xmm7},~{xmm8},~{xmm9},~{xmm10},~{xmm11},~{xmm12},~{xmm13},~{xmm14},~{xmm15},~{xmm16},~{xmm17},~{xmm18},~{xmm19},~{xmm20},~{xmm21},~{xmm22},~{xmm23},~{xmm24},~{xmm25},~{xmm26},~{xmm27},~{xmm28},~{xmm29},~{xmm30},~{xmm31},~{flags}"()
	; load and add are here to keep the operations below the side effecting block and to avoid folding the wrong load			; load and add are here to keep the operations below the side effecting block and to avoid folding the wrong load
	%2 = load <16 x i32>, <16 x i32>* %a2			%2 = load <16 x i32>, <16 x i32>* %a2
	%3 = add <16 x i32> %a1, %2			%3 = add <16 x i32> %a1, %2
	%4 = bitcast i16 %mask to <16 x i1>			%4 = bitcast i16 %mask to <16 x i1>
	▲ Show 20 Lines • Show All 5,232 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/tbm-intrinsics-fast-isel-x86_64.ll

Show All 33 Lines	; X64-NEXT: retq
%2 = xor i64 %1, -1		%2 = xor i64 %1, -1
%3 = or i64 %a0, %2		%3 = or i64 %a0, %2
ret i64 %3		ret i64 %3
}		}

define i64 @test__blcic_u64(i64 %a0) {		define i64 @test__blcic_u64(i64 %a0) {
; X64-LABEL: test__blcic_u64:		; X64-LABEL: test__blcic_u64:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: movq %rdi, %rax		; X64-NEXT: leaq 1(%rdi), %rax
; X64-NEXT: movq %rdi, %rcx		; X64-NEXT: xorq $-1, %rdi
; X64-NEXT: xorq $-1, %rcx		; X64-NEXT: andq %rdi, %rax
; X64-NEXT: addq $1, %rax
; X64-NEXT: andq %rcx, %rax
; X64-NEXT: retq		; X64-NEXT: retq
%1 = xor i64 %a0, -1		%1 = xor i64 %a0, -1
%2 = add i64 %a0, 1		%2 = add i64 %a0, 1
%3 = and i64 %1, %2		%3 = and i64 %1, %2
ret i64 %3		ret i64 %3
}		}

define i64 @test__blcmsk_u64(i64 %a0) {		define i64 @test__blcmsk_u64(i64 %a0) {
Show All 27 Lines	; X64-NEXT: retq
%1 = sub i64 %a0, 1		%1 = sub i64 %a0, 1
%2 = or i64 %a0, %1		%2 = or i64 %a0, %1
ret i64 %2		ret i64 %2
}		}

define i64 @test__blsic_u64(i64 %a0) {		define i64 @test__blsic_u64(i64 %a0) {
; X64-LABEL: test__blsic_u64:		; X64-LABEL: test__blsic_u64:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: movq %rdi, %rax		; X64-NEXT: leaq -1(%rdi), %rax
; X64-NEXT: movq %rdi, %rcx		; X64-NEXT: xorq $-1, %rdi
; X64-NEXT: xorq $-1, %rcx		; X64-NEXT: orq %rdi, %rax
; X64-NEXT: subq $1, %rax
; X64-NEXT: orq %rcx, %rax
; X64-NEXT: retq		; X64-NEXT: retq
%1 = xor i64 %a0, -1		%1 = xor i64 %a0, -1
%2 = sub i64 %a0, 1		%2 = sub i64 %a0, 1
%3 = or i64 %1, %2		%3 = or i64 %1, %2
ret i64 %3		ret i64 %3
}		}

define i64 @test__t1mskc_u64(i64 %a0) {		define i64 @test__t1mskc_u64(i64 %a0) {
; X64-LABEL: test__t1mskc_u64:		; X64-LABEL: test__t1mskc_u64:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: movq %rdi, %rax		; X64-NEXT: leaq 1(%rdi), %rax
; X64-NEXT: movq %rdi, %rcx		; X64-NEXT: xorq $-1, %rdi
; X64-NEXT: xorq $-1, %rcx		; X64-NEXT: orq %rdi, %rax
; X64-NEXT: addq $1, %rax
; X64-NEXT: orq %rcx, %rax
; X64-NEXT: retq		; X64-NEXT: retq
%1 = xor i64 %a0, -1		%1 = xor i64 %a0, -1
%2 = add i64 %a0, 1		%2 = add i64 %a0, 1
%3 = or i64 %1, %2		%3 = or i64 %1, %2
ret i64 %3		ret i64 %3
}		}

define i64 @test__tzmsk_u64(i64 %a0) {		define i64 @test__tzmsk_u64(i64 %a0) {
; X64-LABEL: test__tzmsk_u64:		; X64-LABEL: test__tzmsk_u64:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: movq %rdi, %rax		; X64-NEXT: leaq -1(%rdi), %rax
; X64-NEXT: movq %rdi, %rcx		; X64-NEXT: xorq $-1, %rdi
; X64-NEXT: xorq $-1, %rcx		; X64-NEXT: andq %rdi, %rax
; X64-NEXT: subq $1, %rax
; X64-NEXT: andq %rcx, %rax
; X64-NEXT: retq		; X64-NEXT: retq
%1 = xor i64 %a0, -1		%1 = xor i64 %a0, -1
%2 = sub i64 %a0, 1		%2 = sub i64 %a0, 1
%3 = and i64 %1, %2		%3 = and i64 %1, %2
ret i64 %3		ret i64 %3
}		}

declare i64 @llvm.x86.tbm.bextri.u64(i64, i64)		declare i64 @llvm.x86.tbm.bextri.u64(i64, i64)

llvm/test/CodeGen/X86/tbm-intrinsics-fast-isel.ll

	Show First 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; X86-NEXT: movl %eax, %ecx			; X86-NEXT: movl %eax, %ecx
	; X86-NEXT: xorl $-1, %ecx			; X86-NEXT: xorl $-1, %ecx
	; X86-NEXT: addl $1, %eax			; X86-NEXT: addl $1, %eax
	; X86-NEXT: andl %ecx, %eax			; X86-NEXT: andl %ecx, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: test__blcic_u32:			; X64-LABEL: test__blcic_u32:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: movl %edi, %eax			; X64-NEXT: # kill: def $edi killed $edi def $rdi
				; X64-NEXT: leal 1(%rdi), %eax
	; X64-NEXT: movl %edi, %ecx			; X64-NEXT: movl %edi, %ecx
	; X64-NEXT: xorl $-1, %ecx			; X64-NEXT: xorl $-1, %ecx
	; X64-NEXT: addl $1, %eax
	; X64-NEXT: andl %ecx, %eax			; X64-NEXT: andl %ecx, %eax
	; X64-NEXT: retq			; X64-NEXT: retq
	%1 = xor i32 %a0, -1			%1 = xor i32 %a0, -1
	%2 = add i32 %a0, 1			%2 = add i32 %a0, 1
	%3 = and i32 %1, %2			%3 = and i32 %1, %2
	ret i32 %3			ret i32 %3
	}			}

	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; X86-NEXT: movl %eax, %ecx			; X86-NEXT: movl %eax, %ecx
	; X86-NEXT: xorl $-1, %ecx			; X86-NEXT: xorl $-1, %ecx
	; X86-NEXT: subl $1, %eax			; X86-NEXT: subl $1, %eax
	; X86-NEXT: orl %ecx, %eax			; X86-NEXT: orl %ecx, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: test__blsic_u32:			; X64-LABEL: test__blsic_u32:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: movl %edi, %eax			; X64-NEXT: # kill: def $edi killed $edi def $rdi
				; X64-NEXT: leal -1(%rdi), %eax
	; X64-NEXT: movl %edi, %ecx			; X64-NEXT: movl %edi, %ecx
	; X64-NEXT: xorl $-1, %ecx			; X64-NEXT: xorl $-1, %ecx
	; X64-NEXT: subl $1, %eax
	; X64-NEXT: orl %ecx, %eax			; X64-NEXT: orl %ecx, %eax
	; X64-NEXT: retq			; X64-NEXT: retq
	%1 = xor i32 %a0, -1			%1 = xor i32 %a0, -1
	%2 = sub i32 %a0, 1			%2 = sub i32 %a0, 1
	%3 = or i32 %1, %2			%3 = or i32 %1, %2
	ret i32 %3			ret i32 %3
	}			}

	define i32 @test__t1mskc_u32(i32 %a0) {			define i32 @test__t1mskc_u32(i32 %a0) {
	; X86-LABEL: test__t1mskc_u32:			; X86-LABEL: test__t1mskc_u32:
	; X86: # %bb.0:			; X86: # %bb.0:
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: movl %eax, %ecx			; X86-NEXT: movl %eax, %ecx
	; X86-NEXT: xorl $-1, %ecx			; X86-NEXT: xorl $-1, %ecx
	; X86-NEXT: addl $1, %eax			; X86-NEXT: addl $1, %eax
	; X86-NEXT: orl %ecx, %eax			; X86-NEXT: orl %ecx, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: test__t1mskc_u32:			; X64-LABEL: test__t1mskc_u32:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: movl %edi, %eax			; X64-NEXT: # kill: def $edi killed $edi def $rdi
				; X64-NEXT: leal 1(%rdi), %eax
	; X64-NEXT: movl %edi, %ecx			; X64-NEXT: movl %edi, %ecx
	; X64-NEXT: xorl $-1, %ecx			; X64-NEXT: xorl $-1, %ecx
	; X64-NEXT: addl $1, %eax
	; X64-NEXT: orl %ecx, %eax			; X64-NEXT: orl %ecx, %eax
	; X64-NEXT: retq			; X64-NEXT: retq
	%1 = xor i32 %a0, -1			%1 = xor i32 %a0, -1
	%2 = add i32 %a0, 1			%2 = add i32 %a0, 1
	%3 = or i32 %1, %2			%3 = or i32 %1, %2
	ret i32 %3			ret i32 %3
	}			}

	define i32 @test__tzmsk_u32(i32 %a0) {			define i32 @test__tzmsk_u32(i32 %a0) {
	; X86-LABEL: test__tzmsk_u32:			; X86-LABEL: test__tzmsk_u32:
	; X86: # %bb.0:			; X86: # %bb.0:
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: movl %eax, %ecx			; X86-NEXT: movl %eax, %ecx
	; X86-NEXT: xorl $-1, %ecx			; X86-NEXT: xorl $-1, %ecx
	; X86-NEXT: subl $1, %eax			; X86-NEXT: subl $1, %eax
	; X86-NEXT: andl %ecx, %eax			; X86-NEXT: andl %ecx, %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: test__tzmsk_u32:			; X64-LABEL: test__tzmsk_u32:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: movl %edi, %eax			; X64-NEXT: # kill: def $edi killed $edi def $rdi
				; X64-NEXT: leal -1(%rdi), %eax
	; X64-NEXT: movl %edi, %ecx			; X64-NEXT: movl %edi, %ecx
	; X64-NEXT: xorl $-1, %ecx			; X64-NEXT: xorl $-1, %ecx
	; X64-NEXT: subl $1, %eax
	; X64-NEXT: andl %ecx, %eax			; X64-NEXT: andl %ecx, %eax
	; X64-NEXT: retq			; X64-NEXT: retq
	%1 = xor i32 %a0, -1			%1 = xor i32 %a0, -1
	%2 = sub i32 %a0, 1			%2 = sub i32 %a0, 1
	%3 = and i32 %1, %2			%3 = and i32 %1, %2
	ret i32 %3			ret i32 %3
	}			}

	declare i32 @llvm.x86.tbm.bextri.u32(i32, i32)			declare i32 @llvm.x86.tbm.bextri.u32(i32, i32)

llvm/test/CodeGen/X86/udiv_fix_sat.ll

Show First 20 Lines • Show All 166 Lines • ▼ Show 20 Lines	; X86-NEXT: retl
ret i4 %tmp		ret i4 %tmp
}		}

define i64 @func5(i64 %x, i64 %y) nounwind {		define i64 @func5(i64 %x, i64 %y) nounwind {
; X64-LABEL: func5:		; X64-LABEL: func5:
; X64: # %bb.0:		; X64: # %bb.0:
; X64-NEXT: pushq %rax		; X64-NEXT: pushq %rax
; X64-NEXT: movq %rsi, %rdx		; X64-NEXT: movq %rsi, %rdx
; X64-NEXT: leaq (%rdi,%rdi), %rsi		; X64-NEXT: leaq (%rdi,%rdi), %rax
; X64-NEXT: movq %rdi, %rax		; X64-NEXT: movq %rdi, %rsi
; X64-NEXT: shrq $63, %rax		; X64-NEXT: shrq $63, %rsi
; X64-NEXT: shrdq $33, %rax, %rsi		; X64-NEXT: shldq $31, %rax, %rsi
; X64-NEXT: shlq $32, %rdi		; X64-NEXT: shlq $32, %rdi
; X64-NEXT: xorl %ecx, %ecx		; X64-NEXT: xorl %ecx, %ecx
; X64-NEXT: callq __udivti3@PLT		; X64-NEXT: callq __udivti3@PLT
; X64-NEXT: cmpq $2, %rdx		; X64-NEXT: cmpq $2, %rdx
; X64-NEXT: movq $-1, %rcx		; X64-NEXT: movq $-1, %rcx
; X64-NEXT: cmovbq %rax, %rcx		; X64-NEXT: cmovaeq %rcx, %rax
; X64-NEXT: cmpq $1, %rdx		; X64-NEXT: cmpq $1, %rdx
; X64-NEXT: movl $1, %eax		; X64-NEXT: movl $1, %ecx
; X64-NEXT: cmovbq %rdx, %rax		; X64-NEXT: cmovbq %rdx, %rcx
; X64-NEXT: shldq $63, %rcx, %rax		; X64-NEXT: shrdq $1, %rcx, %rax
; X64-NEXT: popq %rcx		; X64-NEXT: popq %rcx
; X64-NEXT: retq		; X64-NEXT: retq
;		;
; X86-LABEL: func5:		; X86-LABEL: func5:
; X86: # %bb.0:		; X86: # %bb.0:
; X86-NEXT: pushl %ebp		; X86-NEXT: pushl %ebp
; X86-NEXT: movl %esp, %ebp		; X86-NEXT: movl %esp, %ebp
; X86-NEXT: pushl %esi		; X86-NEXT: pushl %esi
▲ Show 20 Lines • Show All 288 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/umax.ll

	Show First 20 Lines • Show All 131 Lines • ▼ Show 20 Lines
	; X86-NEXT: retl			; X86-NEXT: retl
	%r = call i64 @llvm.umax.i64(i64 %a, i64 %b)			%r = call i64 @llvm.umax.i64(i64 %a, i64 %b)
	ret i64 %r			ret i64 %r
	}			}

	define i128 @test_i128(i128 %a, i128 %b) nounwind {			define i128 @test_i128(i128 %a, i128 %b) nounwind {
	; X64-LABEL: test_i128:			; X64-LABEL: test_i128:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: movq %rdx, %rax
	; X64-NEXT: cmpq %rdx, %rdi			; X64-NEXT: cmpq %rdx, %rdi
	; X64-NEXT: cmovaq %rdi, %rdx			; X64-NEXT: movq %rdx, %rax
	; X64-NEXT: cmpq %rcx, %rsi
	; X64-NEXT: cmovaq %rdi, %rax			; X64-NEXT: cmovaq %rdi, %rax
	; X64-NEXT: cmoveq %rdx, %rax			; X64-NEXT: cmpq %rcx, %rsi
				; X64-NEXT: cmovaq %rdi, %rdx
				; X64-NEXT: cmovneq %rdx, %rax
	; X64-NEXT: cmovaq %rsi, %rcx			; X64-NEXT: cmovaq %rsi, %rcx
	; X64-NEXT: movq %rcx, %rdx			; X64-NEXT: movq %rcx, %rdx
	; X64-NEXT: retq			; X64-NEXT: retq
	;			;
	; X86-LABEL: test_i128:			; X86-LABEL: test_i128:
	; X86: # %bb.0:			; X86: # %bb.0:
	; X86-NEXT: pushl %ebp			; X86-NEXT: pushl %ebp
	; X86-NEXT: pushl %ebx			; X86-NEXT: pushl %ebx
	▲ Show 20 Lines • Show All 199 Lines • ▼ Show 20 Lines
	; X86-NEXT: retl $4			; X86-NEXT: retl $4
	%r = call <4 x i32> @llvm.umax.v4i32(<4 x i32> %a, <4 x i32> %b)			%r = call <4 x i32> @llvm.umax.v4i32(<4 x i32> %a, <4 x i32> %b)
	ret <4 x i32> %r			ret <4 x i32> %r
	}			}

	define <8 x i32> @test_v8i32(<8 x i32> %a, <8 x i32> %b) nounwind {			define <8 x i32> @test_v8i32(<8 x i32> %a, <8 x i32> %b) nounwind {
	; SSE-LABEL: test_v8i32:			; SSE-LABEL: test_v8i32:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648,2147483648,2147483648]			; SSE-NEXT: movdqa {{.*#+}} xmm4 = [2147483648,2147483648,2147483648,2147483648]
	; SSE-NEXT: movdqa %xmm2, %xmm6			; SSE-NEXT: movdqa %xmm2, %xmm5
	; SSE-NEXT: pxor %xmm5, %xmm6			; SSE-NEXT: pxor %xmm4, %xmm5
	; SSE-NEXT: movdqa %xmm0, %xmm4			; SSE-NEXT: movdqa %xmm0, %xmm6
	; SSE-NEXT: pxor %xmm5, %xmm4			; SSE-NEXT: pxor %xmm4, %xmm6
	; SSE-NEXT: pcmpgtd %xmm6, %xmm4			; SSE-NEXT: pcmpgtd %xmm5, %xmm6
	; SSE-NEXT: pand %xmm4, %xmm0			; SSE-NEXT: pand %xmm6, %xmm0
	; SSE-NEXT: pandn %xmm2, %xmm4			; SSE-NEXT: pandn %xmm2, %xmm6
	; SSE-NEXT: por %xmm0, %xmm4			; SSE-NEXT: por %xmm6, %xmm0
	; SSE-NEXT: movdqa %xmm3, %xmm0			; SSE-NEXT: movdqa %xmm3, %xmm2
	; SSE-NEXT: pxor %xmm5, %xmm0			; SSE-NEXT: pxor %xmm4, %xmm2
	; SSE-NEXT: pxor %xmm1, %xmm5			; SSE-NEXT: pxor %xmm1, %xmm4
	; SSE-NEXT: pcmpgtd %xmm0, %xmm5			; SSE-NEXT: pcmpgtd %xmm2, %xmm4
	; SSE-NEXT: pand %xmm5, %xmm1			; SSE-NEXT: pand %xmm4, %xmm1
	; SSE-NEXT: pandn %xmm3, %xmm5			; SSE-NEXT: pandn %xmm3, %xmm4
	; SSE-NEXT: por %xmm5, %xmm1			; SSE-NEXT: por %xmm4, %xmm1
	; SSE-NEXT: movdqa %xmm4, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-LABEL: test_v8i32:			; AVX1-LABEL: test_v8i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX1-NEXT: vpmaxud %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpmaxud %xmm2, %xmm3, %xmm2
	; AVX1-NEXT: vpmaxud %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpmaxud %xmm1, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 280 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/umin.ll

	Show First 20 Lines • Show All 131 Lines • ▼ Show 20 Lines
	; X86-NEXT: retl			; X86-NEXT: retl
	%r = call i64 @llvm.umin.i64(i64 %a, i64 %b)			%r = call i64 @llvm.umin.i64(i64 %a, i64 %b)
	ret i64 %r			ret i64 %r
	}			}

	define i128 @test_i128(i128 %a, i128 %b) nounwind {			define i128 @test_i128(i128 %a, i128 %b) nounwind {
	; X64-LABEL: test_i128:			; X64-LABEL: test_i128:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: movq %rdx, %rax
	; X64-NEXT: cmpq %rdx, %rdi			; X64-NEXT: cmpq %rdx, %rdi
	; X64-NEXT: cmovbq %rdi, %rdx			; X64-NEXT: movq %rdx, %rax
	; X64-NEXT: cmpq %rcx, %rsi
	; X64-NEXT: cmovbq %rdi, %rax			; X64-NEXT: cmovbq %rdi, %rax
	; X64-NEXT: cmoveq %rdx, %rax			; X64-NEXT: cmpq %rcx, %rsi
				; X64-NEXT: cmovbq %rdi, %rdx
				; X64-NEXT: cmovneq %rdx, %rax
	; X64-NEXT: cmovbq %rsi, %rcx			; X64-NEXT: cmovbq %rsi, %rcx
	; X64-NEXT: movq %rcx, %rdx			; X64-NEXT: movq %rcx, %rdx
	; X64-NEXT: retq			; X64-NEXT: retq
	;			;
	; X86-LABEL: test_i128:			; X86-LABEL: test_i128:
	; X86: # %bb.0:			; X86: # %bb.0:
	; X86-NEXT: pushl %ebp			; X86-NEXT: pushl %ebp
	; X86-NEXT: pushl %ebx			; X86-NEXT: pushl %ebx
	▲ Show 20 Lines • Show All 511 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/umul_fix.ll

	Show First 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	; X86-NEXT: movl %edx, %ebp			; X86-NEXT: movl %edx, %ebp
	; X86-NEXT: addl %ebx, %ebp			; X86-NEXT: addl %ebx, %ebp
	; X86-NEXT: adcl $0, %edi			; X86-NEXT: adcl $0, %edi
	; X86-NEXT: movl %ecx, %eax			; X86-NEXT: movl %ecx, %eax
	; X86-NEXT: mull {{[0-9]+}}(%esp)			; X86-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NEXT: addl %ebp, %eax			; X86-NEXT: addl %ebp, %eax
	; X86-NEXT: adcl %edi, %edx			; X86-NEXT: adcl %edi, %edx
	; X86-NEXT: imull {{[0-9]+}}(%esp), %ecx			; X86-NEXT: imull {{[0-9]+}}(%esp), %ecx
	; X86-NEXT: addl %edx, %ecx			; X86-NEXT: addl %ecx, %edx
	; X86-NEXT: shldl $30, %eax, %ecx			; X86-NEXT: shldl $30, %eax, %edx
	; X86-NEXT: shldl $30, %esi, %eax			; X86-NEXT: shldl $30, %esi, %eax
	; X86-NEXT: movl %ecx, %edx
	; X86-NEXT: popl %esi			; X86-NEXT: popl %esi
	; X86-NEXT: popl %edi			; X86-NEXT: popl %edi
	; X86-NEXT: popl %ebx			; X86-NEXT: popl %ebx
	; X86-NEXT: popl %ebp			; X86-NEXT: popl %ebp
	; X86-NEXT: retl			; X86-NEXT: retl
	%tmp = call i64 @llvm.umul.fix.i64(i64 %x, i64 %y, i32 2)			%tmp = call i64 @llvm.umul.fix.i64(i64 %x, i64 %y, i32 2)
	ret i64 %tmp			ret i64 %tmp
	}			}
	▲ Show 20 Lines • Show All 293 Lines • ▼ Show 20 Lines
	; X86-NEXT: adcl $0, %ecx			; X86-NEXT: adcl $0, %ecx
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: mull %esi			; X86-NEXT: mull %esi
	; X86-NEXT: movl %edx, %edi			; X86-NEXT: movl %edx, %edi
	; X86-NEXT: movl %eax, %ebx			; X86-NEXT: movl %eax, %ebx
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: mull {{[0-9]+}}(%esp)			; X86-NEXT: mull {{[0-9]+}}(%esp)
	; X86-NEXT: addl %ebp, %eax			; X86-NEXT: addl %ebp, %eax
	; X86-NEXT: adcl %ecx, %edx			; X86-NEXT: adcl %edx, %ecx
	; X86-NEXT: adcl $0, %edi			; X86-NEXT: adcl $0, %edi
	; X86-NEXT: addl %edx, %ebx			; X86-NEXT: addl %ebx, %ecx
	; X86-NEXT: adcl $0, %edi			; X86-NEXT: adcl $0, %edi
	; X86-NEXT: movl %ebx, %eax			; X86-NEXT: movl %ecx, %eax
	; X86-NEXT: movl %edi, %edx			; X86-NEXT: movl %edi, %edx
	; X86-NEXT: popl %esi			; X86-NEXT: popl %esi
	; X86-NEXT: popl %edi			; X86-NEXT: popl %edi
	; X86-NEXT: popl %ebx			; X86-NEXT: popl %ebx
	; X86-NEXT: popl %ebp			; X86-NEXT: popl %ebp
	; X86-NEXT: retl			; X86-NEXT: retl
	%tmp = call i64 @llvm.umul.fix.i64(i64 %x, i64 %y, i32 64)			%tmp = call i64 @llvm.umul.fix.i64(i64 %x, i64 %y, i32 64)
	ret i64 %tmp			ret i64 %tmp
	}			}

llvm/test/CodeGen/X86/umul_fix_sat.ll

	Show First 20 Lines • Show All 276 Lines • ▼ Show 20 Lines
	; X86-NEXT: .cfi_def_cfa_offset 20			; X86-NEXT: .cfi_def_cfa_offset 20
	; X86-NEXT: .cfi_offset %esi, -20			; X86-NEXT: .cfi_offset %esi, -20
	; X86-NEXT: .cfi_offset %edi, -16			; X86-NEXT: .cfi_offset %edi, -16
	; X86-NEXT: .cfi_offset %ebx, -12			; X86-NEXT: .cfi_offset %ebx, -12
	; X86-NEXT: .cfi_offset %ebp, -8			; X86-NEXT: .cfi_offset %ebp, -8
	; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx			; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: movl {{[0-9]+}}(%esp), %ebp			; X86-NEXT: movl {{[0-9]+}}(%esp), %ebp
	; X86-NEXT: movl {{[0-9]+}}(%esp), %esi			; X86-NEXT: movl {{[0-9]+}}(%esp), %edi
	; X86-NEXT: testl %esi, %esi			; X86-NEXT: testl %edi, %edi
	; X86-NEXT: setne %dl			; X86-NEXT: setne %dl
	; X86-NEXT: testl %eax, %eax			; X86-NEXT: testl %eax, %eax
	; X86-NEXT: setne %bl			; X86-NEXT: setne %bl
	; X86-NEXT: andb %dl, %bl			; X86-NEXT: andb %dl, %bl
	; X86-NEXT: mull %ebp			; X86-NEXT: mull %ebp
	; X86-NEXT: movl %eax, %edi			; X86-NEXT: movl %eax, %esi
	; X86-NEXT: seto %bh			; X86-NEXT: seto %bh
	; X86-NEXT: movl %esi, %eax			; X86-NEXT: movl %edi, %eax
	; X86-NEXT: mull %ecx			; X86-NEXT: mull %ecx
	; X86-NEXT: movl %ecx, %edx			; X86-NEXT: movl %ecx, %edx
	; X86-NEXT: movl %eax, %esi
	; X86-NEXT: seto %cl			; X86-NEXT: seto %cl
	; X86-NEXT: orb %bh, %cl			; X86-NEXT: orb %bh, %cl
	; X86-NEXT: addl %edi, %esi			; X86-NEXT: addl %eax, %esi
	; X86-NEXT: movl %edx, %eax			; X86-NEXT: movl %edx, %eax
	; X86-NEXT: mull %ebp			; X86-NEXT: mull %ebp
	; X86-NEXT: addl %esi, %edx			; X86-NEXT: addl %esi, %edx
	; X86-NEXT: setb %ch			; X86-NEXT: setb %ch
	; X86-NEXT: orb %cl, %ch			; X86-NEXT: orb %cl, %ch
	; X86-NEXT: orb %bl, %ch			; X86-NEXT: orb %bl, %ch
	; X86-NEXT: movl $-1, %ecx			; X86-NEXT: movl $-1, %ecx
	; X86-NEXT: cmovnel %ecx, %eax			; X86-NEXT: cmovnel %ecx, %eax
	▲ Show 20 Lines • Show All 131 Lines • ▼ Show 20 Lines
	; X64-NEXT: retq			; X64-NEXT: retq
	;			;
	; X86-LABEL: func7:			; X86-LABEL: func7:
	; X86: # %bb.0:			; X86: # %bb.0:
	; X86-NEXT: pushl %ebp			; X86-NEXT: pushl %ebp
	; X86-NEXT: pushl %ebx			; X86-NEXT: pushl %ebx
	; X86-NEXT: pushl %edi			; X86-NEXT: pushl %edi
	; X86-NEXT: pushl %esi			; X86-NEXT: pushl %esi
				; X86-NEXT: movl {{[0-9]+}}(%esp), %ebx
	; X86-NEXT: movl {{[0-9]+}}(%esp), %edi			; X86-NEXT: movl {{[0-9]+}}(%esp), %edi
	; X86-NEXT: movl {{[0-9]+}}(%esp), %esi			; X86-NEXT: movl {{[0-9]+}}(%esp), %ebp
	; X86-NEXT: movl %edi, %eax			; X86-NEXT: movl %ebx, %eax
	; X86-NEXT: mull %esi			; X86-NEXT: mull %ebp
	; X86-NEXT: movl %edx, %ecx			; X86-NEXT: movl %edx, %ecx
	; X86-NEXT: movl %eax, %ebx			; X86-NEXT: movl %eax, %esi
	; X86-NEXT: movl %edi, %eax			; X86-NEXT: movl %ebx, %eax
	; X86-NEXT: mull {{[0-9]+}}(%esp)			; X86-NEXT: mull %edi
	; X86-NEXT: movl %edx, %ebp			; X86-NEXT: addl %edx, %esi
	; X86-NEXT: addl %ebx, %ebp
	; X86-NEXT: adcl $0, %ecx			; X86-NEXT: adcl $0, %ecx
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: mull %esi			; X86-NEXT: mull %ebp
	; X86-NEXT: movl %edx, %edi			; X86-NEXT: movl %edx, %ebx
	; X86-NEXT: movl %eax, %ebx			; X86-NEXT: movl %eax, %ebp
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: mull {{[0-9]+}}(%esp)			; X86-NEXT: mull %edi
	; X86-NEXT: addl %ebp, %eax			; X86-NEXT: addl %esi, %eax
	; X86-NEXT: adcl %ecx, %edx			; X86-NEXT: adcl %ecx, %edx
	; X86-NEXT: adcl $0, %edi			; X86-NEXT: adcl $0, %ebx
	; X86-NEXT: addl %ebx, %edx			; X86-NEXT: addl %ebp, %edx
	; X86-NEXT: adcl $0, %edi			; X86-NEXT: adcl $0, %ebx
	; X86-NEXT: xorl %ecx, %ecx			; X86-NEXT: xorl %ecx, %ecx
	; X86-NEXT: cmpl $1, %edi			; X86-NEXT: cmpl $1, %ebx
	; X86-NEXT: sbbl %ecx, %ecx			; X86-NEXT: sbbl %ecx, %ecx
	; X86-NEXT: notl %ecx			; X86-NEXT: notl %ecx
	; X86-NEXT: orl %ecx, %eax			; X86-NEXT: orl %ecx, %eax
	; X86-NEXT: orl %ecx, %edx			; X86-NEXT: orl %ecx, %edx
	; X86-NEXT: popl %esi			; X86-NEXT: popl %esi
	; X86-NEXT: popl %edi			; X86-NEXT: popl %edi
	; X86-NEXT: popl %ebx			; X86-NEXT: popl %ebx
	; X86-NEXT: popl %ebp			; X86-NEXT: popl %ebp
	Show All 16 Lines
	;			;
	; X86-LABEL: func8:			; X86-LABEL: func8:
	; X86: # %bb.0:			; X86: # %bb.0:
	; X86-NEXT: pushl %ebp			; X86-NEXT: pushl %ebp
	; X86-NEXT: pushl %ebx			; X86-NEXT: pushl %ebx
	; X86-NEXT: pushl %edi			; X86-NEXT: pushl %edi
	; X86-NEXT: pushl %esi			; X86-NEXT: pushl %esi
	; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx			; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X86-NEXT: movl {{[0-9]+}}(%esp), %edi			; X86-NEXT: movl {{[0-9]+}}(%esp), %ebx
				; X86-NEXT: movl {{[0-9]+}}(%esp), %ebp
	; X86-NEXT: movl %ecx, %eax			; X86-NEXT: movl %ecx, %eax
	; X86-NEXT: mull %edi			; X86-NEXT: mull %ebp
	; X86-NEXT: movl %edx, %esi			; X86-NEXT: movl %edx, %esi
	; X86-NEXT: movl %eax, %ebx			; X86-NEXT: movl %eax, %edi
	; X86-NEXT: movl %ecx, %eax			; X86-NEXT: movl %ecx, %eax
	; X86-NEXT: mull {{[0-9]+}}(%esp)			; X86-NEXT: mull %ebx
	; X86-NEXT: movl %edx, %ebp			; X86-NEXT: addl %edx, %edi
	; X86-NEXT: addl %ebx, %ebp
	; X86-NEXT: adcl $0, %esi			; X86-NEXT: adcl $0, %esi
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: mull %edi			; X86-NEXT: mull %ebp
	; X86-NEXT: movl %edx, %ecx			; X86-NEXT: movl %edx, %ecx
	; X86-NEXT: movl %eax, %ebx			; X86-NEXT: movl %eax, %ebp
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: mull {{[0-9]+}}(%esp)			; X86-NEXT: mull %ebx
	; X86-NEXT: addl %ebp, %eax			; X86-NEXT: addl %edi, %eax
	; X86-NEXT: adcl %esi, %edx			; X86-NEXT: adcl %esi, %edx
	; X86-NEXT: adcl $0, %ecx			; X86-NEXT: adcl $0, %ecx
	; X86-NEXT: addl %ebx, %edx			; X86-NEXT: addl %ebp, %edx
	; X86-NEXT: adcl $0, %ecx			; X86-NEXT: adcl $0, %ecx
	; X86-NEXT: shrdl $31, %edx, %eax			; X86-NEXT: shrdl $31, %edx, %eax
	; X86-NEXT: movl %edx, %esi			; X86-NEXT: movl %edx, %esi
	; X86-NEXT: shrl $31, %esi			; X86-NEXT: shrl $31, %esi
	; X86-NEXT: xorl %edi, %edi			; X86-NEXT: xorl %edi, %edi
	; X86-NEXT: cmpl $1, %esi			; X86-NEXT: cmpl $1, %esi
	; X86-NEXT: sbbl %edi, %edi			; X86-NEXT: sbbl %edi, %edi
	; X86-NEXT: notl %edi			; X86-NEXT: notl %edi
	; X86-NEXT: orl %edi, %eax			; X86-NEXT: orl %edi, %eax
	; X86-NEXT: shldl $1, %edx, %ecx			; X86-NEXT: shrdl $31, %ecx, %edx
	; X86-NEXT: orl %edi, %ecx			; X86-NEXT: orl %edi, %edx
	; X86-NEXT: movl %ecx, %edx
	; X86-NEXT: popl %esi			; X86-NEXT: popl %esi
	; X86-NEXT: popl %edi			; X86-NEXT: popl %edi
	; X86-NEXT: popl %ebx			; X86-NEXT: popl %ebx
	; X86-NEXT: popl %ebp			; X86-NEXT: popl %ebp
	; X86-NEXT: retl			; X86-NEXT: retl
	%tmp = call i64 @llvm.umul.fix.sat.i64(i64 %x, i64 %y, i32 63)			%tmp = call i64 @llvm.umul.fix.sat.i64(i64 %x, i64 %y, i32 63)
	ret i64 %tmp			ret i64 %tmp
	}			}

llvm/test/CodeGen/X86/umulo-128-legalisation-lowering.ll

	Show All 11 Lines
	; X64-NEXT: testq %rsi, %rsi			; X64-NEXT: testq %rsi, %rsi
	; X64-NEXT: setne %r9b			; X64-NEXT: setne %r9b
	; X64-NEXT: andb %dl, %r9b			; X64-NEXT: andb %dl, %r9b
	; X64-NEXT: mulq %r8			; X64-NEXT: mulq %r8
	; X64-NEXT: movq %rax, %rsi			; X64-NEXT: movq %rax, %rsi
	; X64-NEXT: seto %r10b			; X64-NEXT: seto %r10b
	; X64-NEXT: movq %rcx, %rax			; X64-NEXT: movq %rcx, %rax
	; X64-NEXT: mulq %rdi			; X64-NEXT: mulq %rdi
	; X64-NEXT: movq %rax, %rcx
	; X64-NEXT: seto %r11b			; X64-NEXT: seto %r11b
	; X64-NEXT: orb %r10b, %r11b			; X64-NEXT: orb %r10b, %r11b
	; X64-NEXT: addq %rsi, %rcx			; X64-NEXT: addq %rax, %rsi
	; X64-NEXT: movq %rdi, %rax			; X64-NEXT: movq %rdi, %rax
	; X64-NEXT: mulq %r8			; X64-NEXT: mulq %r8
	; X64-NEXT: addq %rcx, %rdx			; X64-NEXT: addq %rsi, %rdx
	; X64-NEXT: setb %cl			; X64-NEXT: setb %cl
	; X64-NEXT: orb %r11b, %cl			; X64-NEXT: orb %r11b, %cl
	; X64-NEXT: orb %r9b, %cl			; X64-NEXT: orb %r9b, %cl
	; X64-NEXT: retq			; X64-NEXT: retq
	;			;
	; X86-LABEL: muloti_test:			; X86-LABEL: muloti_test:
	; X86: # %bb.0: # %start			; X86: # %bb.0: # %start
	; X86-NEXT: pushl %ebp			; X86-NEXT: pushl %ebp
	▲ Show 20 Lines • Show All 149 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/umulo-64-legalisation-lowering.ll

	Show All 13 Lines
	; X86-NEXT: .cfi_def_cfa_offset 20			; X86-NEXT: .cfi_def_cfa_offset 20
	; X86-NEXT: .cfi_offset %esi, -20			; X86-NEXT: .cfi_offset %esi, -20
	; X86-NEXT: .cfi_offset %edi, -16			; X86-NEXT: .cfi_offset %edi, -16
	; X86-NEXT: .cfi_offset %ebx, -12			; X86-NEXT: .cfi_offset %ebx, -12
	; X86-NEXT: .cfi_offset %ebp, -8			; X86-NEXT: .cfi_offset %ebp, -8
	; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx			; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: movl {{[0-9]+}}(%esp), %ebp			; X86-NEXT: movl {{[0-9]+}}(%esp), %ebp
	; X86-NEXT: movl {{[0-9]+}}(%esp), %esi			; X86-NEXT: movl {{[0-9]+}}(%esp), %edi
	; X86-NEXT: testl %esi, %esi			; X86-NEXT: testl %edi, %edi
	; X86-NEXT: setne %dl			; X86-NEXT: setne %dl
	; X86-NEXT: testl %eax, %eax			; X86-NEXT: testl %eax, %eax
	; X86-NEXT: setne %bl			; X86-NEXT: setne %bl
	; X86-NEXT: andb %dl, %bl			; X86-NEXT: andb %dl, %bl
	; X86-NEXT: mull %ebp			; X86-NEXT: mull %ebp
	; X86-NEXT: movl %eax, %edi			; X86-NEXT: movl %eax, %esi
	; X86-NEXT: seto %bh			; X86-NEXT: seto %bh
	; X86-NEXT: movl %esi, %eax			; X86-NEXT: movl %edi, %eax
	; X86-NEXT: mull %ecx			; X86-NEXT: mull %ecx
	; X86-NEXT: movl %ecx, %edx			; X86-NEXT: movl %ecx, %edx
	; X86-NEXT: movl %eax, %esi
	; X86-NEXT: seto %ch			; X86-NEXT: seto %ch
	; X86-NEXT: orb %bh, %ch			; X86-NEXT: orb %bh, %ch
	; X86-NEXT: addl %edi, %esi			; X86-NEXT: addl %eax, %esi
	; X86-NEXT: movl %edx, %eax			; X86-NEXT: movl %edx, %eax
	; X86-NEXT: mull %ebp			; X86-NEXT: mull %ebp
	; X86-NEXT: addl %esi, %edx			; X86-NEXT: addl %esi, %edx
	; X86-NEXT: setb %cl			; X86-NEXT: setb %cl
	; X86-NEXT: orb %ch, %cl			; X86-NEXT: orb %ch, %cl
	; X86-NEXT: orb %bl, %cl			; X86-NEXT: orb %bl, %cl
	; X86-NEXT: popl %esi			; X86-NEXT: popl %esi
	; X86-NEXT: .cfi_def_cfa_offset 16			; X86-NEXT: .cfi_def_cfa_offset 16
	Show All 23 Lines

llvm/test/CodeGen/X86/unfold-masked-merge-scalar-variablemask.ll

Show First 20 Lines • Show All 539 Lines • ▼ Show 20 Lines	; CHECK-BMI-NEXT: retq
ret i32 %r		ret i32 %r
}		}
; ============================================================================ ;		; ============================================================================ ;
; Various cases with %x and/or %y being a constant		; Various cases with %x and/or %y being a constant
; ============================================================================ ;		; ============================================================================ ;
define i32 @out_constant_varx_mone(i32 %x, i32 %y, i32 %mask) {		define i32 @out_constant_varx_mone(i32 %x, i32 %y, i32 %mask) {
; CHECK-NOBMI-LABEL: out_constant_varx_mone:		; CHECK-NOBMI-LABEL: out_constant_varx_mone:
; CHECK-NOBMI: # %bb.0:		; CHECK-NOBMI: # %bb.0:
; CHECK-NOBMI-NEXT: movl %edi, %eax		; CHECK-NOBMI-NEXT: andl %edx, %edi
; CHECK-NOBMI-NEXT: andl %edx, %eax		; CHECK-NOBMI-NEXT: movl %edx, %eax
; CHECK-NOBMI-NEXT: notl %edx		; CHECK-NOBMI-NEXT: notl %eax
; CHECK-NOBMI-NEXT: orl %edx, %eax		; CHECK-NOBMI-NEXT: orl %edi, %eax
; CHECK-NOBMI-NEXT: retq		; CHECK-NOBMI-NEXT: retq
;		;
; CHECK-BMI-LABEL: out_constant_varx_mone:		; CHECK-BMI-LABEL: out_constant_varx_mone:
; CHECK-BMI: # %bb.0:		; CHECK-BMI: # %bb.0:
; CHECK-BMI-NEXT: movl %edi, %eax		; CHECK-BMI-NEXT: andl %edx, %edi
; CHECK-BMI-NEXT: andl %edx, %eax		; CHECK-BMI-NEXT: movl %edx, %eax
; CHECK-BMI-NEXT: notl %edx		; CHECK-BMI-NEXT: notl %eax
; CHECK-BMI-NEXT: orl %edx, %eax		; CHECK-BMI-NEXT: orl %edi, %eax
; CHECK-BMI-NEXT: retq		; CHECK-BMI-NEXT: retq
%notmask = xor i32 %mask, -1		%notmask = xor i32 %mask, -1
%mx = and i32 %mask, %x		%mx = and i32 %mask, %x
%my = and i32 %notmask, -1		%my = and i32 %notmask, -1
%r = or i32 %mx, %my		%r = or i32 %mx, %my
ret i32 %r		ret i32 %r
}		}
define i32 @in_constant_varx_mone(i32 %x, i32 %y, i32 %mask) {		define i32 @in_constant_varx_mone(i32 %x, i32 %y, i32 %mask) {
▲ Show 20 Lines • Show All 101 Lines • ▼ Show 20 Lines	; CHECK-BMI-NEXT: retq
%r = xor i32 %n1, 42		%r = xor i32 %n1, 42
ret i32 %r		ret i32 %r
}		}
; This is not a canonical form. Testing for completeness only.		; This is not a canonical form. Testing for completeness only.
define i32 @out_constant_varx_42_invmask(i32 %x, i32 %y, i32 %mask) {		define i32 @out_constant_varx_42_invmask(i32 %x, i32 %y, i32 %mask) {
; CHECK-NOBMI-LABEL: out_constant_varx_42_invmask:		; CHECK-NOBMI-LABEL: out_constant_varx_42_invmask:
; CHECK-NOBMI: # %bb.0:		; CHECK-NOBMI: # %bb.0:
; CHECK-NOBMI-NEXT: movl %edx, %eax		; CHECK-NOBMI-NEXT: movl %edx, %eax
; CHECK-NOBMI-NEXT: movl %edx, %ecx		; CHECK-NOBMI-NEXT: notl %eax
; CHECK-NOBMI-NEXT: notl %ecx		; CHECK-NOBMI-NEXT: andl %edi, %eax
; CHECK-NOBMI-NEXT: andl %edi, %ecx		; CHECK-NOBMI-NEXT: andl $42, %edx
; CHECK-NOBMI-NEXT: andl $42, %eax		; CHECK-NOBMI-NEXT: orl %edx, %eax
; CHECK-NOBMI-NEXT: orl %ecx, %eax
; CHECK-NOBMI-NEXT: retq		; CHECK-NOBMI-NEXT: retq
;		;
; CHECK-BMI-LABEL: out_constant_varx_42_invmask:		; CHECK-BMI-LABEL: out_constant_varx_42_invmask:
; CHECK-BMI: # %bb.0:		; CHECK-BMI: # %bb.0:
; CHECK-BMI-NEXT: andnl %edi, %edx, %eax		; CHECK-BMI-NEXT: andnl %edi, %edx, %eax
; CHECK-BMI-NEXT: andl $42, %edx		; CHECK-BMI-NEXT: andl $42, %edx
; CHECK-BMI-NEXT: orl %edx, %eax		; CHECK-BMI-NEXT: orl %edx, %eax
; CHECK-BMI-NEXT: retq		; CHECK-BMI-NEXT: retq
▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines	; CHECK-BMI-NEXT: retq
%n1 = and i32 %n0, %mask		%n1 = and i32 %n0, %mask
%r = xor i32 %n1, %y		%r = xor i32 %n1, %y
ret i32 %r		ret i32 %r
}		}
; This is not a canonical form. Testing for completeness only.		; This is not a canonical form. Testing for completeness only.
define i32 @out_constant_mone_vary_invmask(i32 %x, i32 %y, i32 %mask) {		define i32 @out_constant_mone_vary_invmask(i32 %x, i32 %y, i32 %mask) {
; CHECK-NOBMI-LABEL: out_constant_mone_vary_invmask:		; CHECK-NOBMI-LABEL: out_constant_mone_vary_invmask:
; CHECK-NOBMI: # %bb.0:		; CHECK-NOBMI: # %bb.0:
; CHECK-NOBMI-NEXT: movl %esi, %eax		; CHECK-NOBMI-NEXT: andl %edx, %esi
; CHECK-NOBMI-NEXT: andl %edx, %eax		; CHECK-NOBMI-NEXT: movl %edx, %eax
; CHECK-NOBMI-NEXT: notl %edx		; CHECK-NOBMI-NEXT: notl %eax
; CHECK-NOBMI-NEXT: orl %edx, %eax		; CHECK-NOBMI-NEXT: orl %esi, %eax
; CHECK-NOBMI-NEXT: retq		; CHECK-NOBMI-NEXT: retq
;		;
; CHECK-BMI-LABEL: out_constant_mone_vary_invmask:		; CHECK-BMI-LABEL: out_constant_mone_vary_invmask:
; CHECK-BMI: # %bb.0:		; CHECK-BMI: # %bb.0:
; CHECK-BMI-NEXT: movl %esi, %eax		; CHECK-BMI-NEXT: andl %edx, %esi
; CHECK-BMI-NEXT: andl %edx, %eax		; CHECK-BMI-NEXT: movl %edx, %eax
; CHECK-BMI-NEXT: notl %edx		; CHECK-BMI-NEXT: notl %eax
; CHECK-BMI-NEXT: orl %edx, %eax		; CHECK-BMI-NEXT: orl %esi, %eax
; CHECK-BMI-NEXT: retq		; CHECK-BMI-NEXT: retq
%notmask = xor i32 %mask, -1		%notmask = xor i32 %mask, -1
%mx = and i32 %notmask, -1		%mx = and i32 %notmask, -1
%my = and i32 %mask, %y		%my = and i32 %mask, %y
%r = or i32 %mx, %my		%r = or i32 %mx, %my
ret i32 %r		ret i32 %r
}		}
; This is not a canonical form. Testing for completeness only.		; This is not a canonical form. Testing for completeness only.
▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines	; CHECK-BMI-NEXT: retq
%n1 = and i32 %n0, %mask		%n1 = and i32 %n0, %mask
%r = xor i32 %n1, %y		%r = xor i32 %n1, %y
ret i32 %r		ret i32 %r
}		}
; This is not a canonical form. Testing for completeness only.		; This is not a canonical form. Testing for completeness only.
define i32 @out_constant_42_vary_invmask(i32 %x, i32 %y, i32 %mask) {		define i32 @out_constant_42_vary_invmask(i32 %x, i32 %y, i32 %mask) {
; CHECK-NOBMI-LABEL: out_constant_42_vary_invmask:		; CHECK-NOBMI-LABEL: out_constant_42_vary_invmask:
; CHECK-NOBMI: # %bb.0:		; CHECK-NOBMI: # %bb.0:
; CHECK-NOBMI-NEXT: movl %esi, %eax		; CHECK-NOBMI-NEXT: andl %edx, %esi
; CHECK-NOBMI-NEXT: andl %edx, %eax		; CHECK-NOBMI-NEXT: movl %edx, %eax
; CHECK-NOBMI-NEXT: notl %edx		; CHECK-NOBMI-NEXT: notl %eax
; CHECK-NOBMI-NEXT: andl $42, %edx		; CHECK-NOBMI-NEXT: andl $42, %eax
; CHECK-NOBMI-NEXT: orl %edx, %eax		; CHECK-NOBMI-NEXT: orl %esi, %eax
; CHECK-NOBMI-NEXT: retq		; CHECK-NOBMI-NEXT: retq
;		;
; CHECK-BMI-LABEL: out_constant_42_vary_invmask:		; CHECK-BMI-LABEL: out_constant_42_vary_invmask:
; CHECK-BMI: # %bb.0:		; CHECK-BMI: # %bb.0:
; CHECK-BMI-NEXT: movl %esi, %eax		; CHECK-BMI-NEXT: andl %edx, %esi
; CHECK-BMI-NEXT: andl %edx, %eax		; CHECK-BMI-NEXT: movl %edx, %eax
; CHECK-BMI-NEXT: notl %edx		; CHECK-BMI-NEXT: notl %eax
; CHECK-BMI-NEXT: andl $42, %edx		; CHECK-BMI-NEXT: andl $42, %eax
; CHECK-BMI-NEXT: orl %edx, %eax		; CHECK-BMI-NEXT: orl %esi, %eax
; CHECK-BMI-NEXT: retq		; CHECK-BMI-NEXT: retq
%notmask = xor i32 %mask, -1		%notmask = xor i32 %mask, -1
%mx = and i32 %notmask, 42		%mx = and i32 %notmask, 42
%my = and i32 %mask, %y		%my = and i32 %mask, %y
%r = or i32 %mx, %my		%r = or i32 %mx, %my
ret i32 %r		ret i32 %r
}		}
; This is not a canonical form. Testing for completeness only.		; This is not a canonical form. Testing for completeness only.
▲ Show 20 Lines • Show All 179 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/urem-lkk.ll

Show All 35 Lines	; CHECK-NEXT: retq
ret i32 %1		ret i32 %1
}		}


; Don't fold if we can combine urem with udiv.		; Don't fold if we can combine urem with udiv.
define i32 @combine_urem_udiv(i32 %x) {		define i32 @combine_urem_udiv(i32 %x) {
; CHECK-LABEL: combine_urem_udiv:		; CHECK-LABEL: combine_urem_udiv:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: # kill: def $edi killed $edi def $rdi
; CHECK-NEXT: movl %edi, %eax		; CHECK-NEXT: movl %edi, %eax
; CHECK-NEXT: imulq $1491936009, %rax, %rax # imm = 0x58ED2309		; CHECK-NEXT: imulq $1491936009, %rax, %rcx # imm = 0x58ED2309
; CHECK-NEXT: shrq $32, %rax		; CHECK-NEXT: shrq $32, %rcx
; CHECK-NEXT: movl %edi, %ecx		; CHECK-NEXT: movl %edi, %eax
; CHECK-NEXT: subl %eax, %ecx		; CHECK-NEXT: subl %ecx, %eax
; CHECK-NEXT: shrl %ecx		; CHECK-NEXT: shrl %eax
; CHECK-NEXT: addl %eax, %ecx		; CHECK-NEXT: addl %ecx, %eax
; CHECK-NEXT: shrl $6, %ecx		; CHECK-NEXT: shrl $6, %eax
; CHECK-NEXT: imull $95, %ecx, %eax		; CHECK-NEXT: imull $95, %eax, %ecx
; CHECK-NEXT: subl %eax, %edi		; CHECK-NEXT: subl %ecx, %edi
; CHECK-NEXT: leal (%rdi,%rcx), %eax		; CHECK-NEXT: addl %edi, %eax
; CHECK-NEXT: retq		; CHECK-NEXT: retq
%1 = urem i32 %x, 95		%1 = urem i32 %x, 95
%2 = udiv i32 %x, 95		%2 = udiv i32 %x, 95
%3 = add i32 %1, %2		%3 = add i32 %1, %2
ret i32 %3		ret i32 %3
}		}

; Don't fold for divisors that are a power of two.		; Don't fold for divisors that are a power of two.
▲ Show 20 Lines • Show All 45 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/urem-seteq-vec-nonzero.ll

	Show First 20 Lines • Show All 273 Lines • ▼ Show 20 Lines
	; CHECK-SSE2-NEXT: retq			; CHECK-SSE2-NEXT: retq
	;			;
	; CHECK-SSE41-LABEL: t32_tautological:			; CHECK-SSE41-LABEL: t32_tautological:
	; CHECK-SSE41: # %bb.0:			; CHECK-SSE41: # %bb.0:
	; CHECK-SSE41-NEXT: psubd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; CHECK-SSE41-NEXT: psubd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; CHECK-SSE41-NEXT: pmulld {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; CHECK-SSE41-NEXT: pmulld {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; CHECK-SSE41-NEXT: movdqa {{.*#+}} xmm1 = [4294967295,4294967295,4294967295,1431655764]			; CHECK-SSE41-NEXT: movdqa {{.*#+}} xmm1 = [4294967295,4294967295,4294967295,1431655764]
	; CHECK-SSE41-NEXT: pminud %xmm0, %xmm1			; CHECK-SSE41-NEXT: pminud %xmm0, %xmm1
	; CHECK-SSE41-NEXT: pcmpeqd %xmm0, %xmm1			; CHECK-SSE41-NEXT: pcmpeqd %xmm1, %xmm0
	; CHECK-SSE41-NEXT: pxor %xmm0, %xmm0			; CHECK-SSE41-NEXT: pxor %xmm1, %xmm1
	; CHECK-SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm1[0,1],xmm0[2,3,4,5],xmm1[6,7]			; CHECK-SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm1[2,3,4,5],xmm0[6,7]
	; CHECK-SSE41-NEXT: retq			; CHECK-SSE41-NEXT: retq
	;			;
	; CHECK-AVX1-LABEL: t32_tautological:			; CHECK-AVX1-LABEL: t32_tautological:
	; CHECK-AVX1: # %bb.0:			; CHECK-AVX1: # %bb.0:
	; CHECK-AVX1-NEXT: vpsubd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; CHECK-AVX1-NEXT: vpsubd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; CHECK-AVX1-NEXT: vpmulld {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; CHECK-AVX1-NEXT: vpmulld {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; CHECK-AVX1-NEXT: vpminud {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm1			; CHECK-AVX1-NEXT: vpminud {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm1
	; CHECK-AVX1-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0			; CHECK-AVX1-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0
	Show All 28 Lines

llvm/test/CodeGen/X86/vec-strict-fptoint-128.ll

Show First 20 Lines • Show All 3,031 Lines • ▼ Show 20 Lines	; AVX512VLDQ-NEXT: ret{{[l\|q]}}
%ret = call <4 x i32> @llvm.experimental.constrained.fptosi.v4i32.v4f32(<4 x float> %a,		%ret = call <4 x i32> @llvm.experimental.constrained.fptosi.v4i32.v4f32(<4 x float> %a,
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <4 x i32> %ret		ret <4 x i32> %ret
}		}

define <4 x i32> @strict_vector_fptoui_v4f32_to_v4i32(<4 x float> %a) #0 {		define <4 x i32> @strict_vector_fptoui_v4f32_to_v4i32(<4 x float> %a) #0 {
; SSE-32-LABEL: strict_vector_fptoui_v4f32_to_v4i32:		; SSE-32-LABEL: strict_vector_fptoui_v4f32_to_v4i32:
; SSE-32: # %bb.0:		; SSE-32: # %bb.0:
; SSE-32-NEXT: movaps {{.*#+}} xmm2 = [2.14748365E+9,2.14748365E+9,2.14748365E+9,2.14748365E+9]		; SSE-32-NEXT: movaps {{.*#+}} xmm1 = [2.14748365E+9,2.14748365E+9,2.14748365E+9,2.14748365E+9]
; SSE-32-NEXT: movaps %xmm0, %xmm3		; SSE-32-NEXT: movaps %xmm0, %xmm2
; SSE-32-NEXT: cmpltps %xmm2, %xmm3		; SSE-32-NEXT: cmpltps %xmm1, %xmm2
; SSE-32-NEXT: movaps %xmm3, %xmm1		; SSE-32-NEXT: movaps %xmm2, %xmm3
; SSE-32-NEXT: andnps {{\.?LCPI[0-9]+_[0-9]+}}, %xmm1		; SSE-32-NEXT: andnps {{\.?LCPI[0-9]+_[0-9]+}}, %xmm3
; SSE-32-NEXT: andnps %xmm2, %xmm3		; SSE-32-NEXT: andnps %xmm1, %xmm2
; SSE-32-NEXT: subps %xmm3, %xmm0		; SSE-32-NEXT: subps %xmm2, %xmm0
; SSE-32-NEXT: cvttps2dq %xmm0, %xmm0		; SSE-32-NEXT: cvttps2dq %xmm0, %xmm0
; SSE-32-NEXT: xorps %xmm0, %xmm1		; SSE-32-NEXT: xorps %xmm3, %xmm0
; SSE-32-NEXT: movaps %xmm1, %xmm0
; SSE-32-NEXT: retl		; SSE-32-NEXT: retl
;		;
; SSE-64-LABEL: strict_vector_fptoui_v4f32_to_v4i32:		; SSE-64-LABEL: strict_vector_fptoui_v4f32_to_v4i32:
; SSE-64: # %bb.0:		; SSE-64: # %bb.0:
; SSE-64-NEXT: movaps {{.*#+}} xmm2 = [2.14748365E+9,2.14748365E+9,2.14748365E+9,2.14748365E+9]		; SSE-64-NEXT: movaps {{.*#+}} xmm1 = [2.14748365E+9,2.14748365E+9,2.14748365E+9,2.14748365E+9]
; SSE-64-NEXT: movaps %xmm0, %xmm3		; SSE-64-NEXT: movaps %xmm0, %xmm2
; SSE-64-NEXT: cmpltps %xmm2, %xmm3		; SSE-64-NEXT: cmpltps %xmm1, %xmm2
; SSE-64-NEXT: movaps %xmm3, %xmm1		; SSE-64-NEXT: movaps %xmm2, %xmm3
; SSE-64-NEXT: andnps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE-64-NEXT: andnps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3
; SSE-64-NEXT: andnps %xmm2, %xmm3		; SSE-64-NEXT: andnps %xmm1, %xmm2
; SSE-64-NEXT: subps %xmm3, %xmm0		; SSE-64-NEXT: subps %xmm2, %xmm0
; SSE-64-NEXT: cvttps2dq %xmm0, %xmm0		; SSE-64-NEXT: cvttps2dq %xmm0, %xmm0
; SSE-64-NEXT: xorps %xmm0, %xmm1		; SSE-64-NEXT: xorps %xmm3, %xmm0
; SSE-64-NEXT: movaps %xmm1, %xmm0
; SSE-64-NEXT: retq		; SSE-64-NEXT: retq
;		;
; AVX-LABEL: strict_vector_fptoui_v4f32_to_v4i32:		; AVX-LABEL: strict_vector_fptoui_v4f32_to_v4i32:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vmovaps {{.*#+}} xmm1 = [2.14748365E+9,2.14748365E+9,2.14748365E+9,2.14748365E+9]		; AVX-NEXT: vmovaps {{.*#+}} xmm1 = [2.14748365E+9,2.14748365E+9,2.14748365E+9,2.14748365E+9]
; AVX-NEXT: vcmpltps %xmm1, %xmm0, %xmm2		; AVX-NEXT: vcmpltps %xmm1, %xmm0, %xmm2
; AVX-NEXT: vxorps %xmm3, %xmm3, %xmm3		; AVX-NEXT: vxorps %xmm3, %xmm3, %xmm3
; AVX-NEXT: vmovaps {{.*#+}} xmm4 = [2147483648,2147483648,2147483648,2147483648]		; AVX-NEXT: vmovaps {{.*#+}} xmm4 = [2147483648,2147483648,2147483648,2147483648]
▲ Show 20 Lines • Show All 252 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vec_ctbits.ll

	Show All 17 Lines
	; CHECK-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]			; CHECK-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
	; CHECK-NEXT: movdqa %xmm0, %xmm2			; CHECK-NEXT: movdqa %xmm0, %xmm2
	; CHECK-NEXT: pand %xmm1, %xmm2			; CHECK-NEXT: pand %xmm1, %xmm2
	; CHECK-NEXT: psrlw $2, %xmm0			; CHECK-NEXT: psrlw $2, %xmm0
	; CHECK-NEXT: pand %xmm1, %xmm0			; CHECK-NEXT: pand %xmm1, %xmm0
	; CHECK-NEXT: paddb %xmm2, %xmm0			; CHECK-NEXT: paddb %xmm2, %xmm0
	; CHECK-NEXT: movdqa %xmm0, %xmm1			; CHECK-NEXT: movdqa %xmm0, %xmm1
	; CHECK-NEXT: psrlw $4, %xmm1			; CHECK-NEXT: psrlw $4, %xmm1
	; CHECK-NEXT: paddb %xmm0, %xmm1			; CHECK-NEXT: paddb %xmm1, %xmm0
	; CHECK-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; CHECK-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; CHECK-NEXT: pxor %xmm0, %xmm0			; CHECK-NEXT: pxor %xmm1, %xmm1
	; CHECK-NEXT: psadbw %xmm0, %xmm1			; CHECK-NEXT: psadbw %xmm1, %xmm0
	; CHECK-NEXT: movdqa %xmm1, %xmm0
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%c = call <2 x i64> @llvm.cttz.v2i64(<2 x i64> %a, i1 true)			%c = call <2 x i64> @llvm.cttz.v2i64(<2 x i64> %a, i1 true)
	ret <2 x i64> %c			ret <2 x i64> %c

	}			}
	define <2 x i64> @foolz(<2 x i64> %a) nounwind {			define <2 x i64> @foolz(<2 x i64> %a) nounwind {
	; CHECK-LABEL: foolz:			; CHECK-LABEL: foolz:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	; CHECK-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]			; CHECK-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
	; CHECK-NEXT: movdqa %xmm0, %xmm2			; CHECK-NEXT: movdqa %xmm0, %xmm2
	; CHECK-NEXT: pand %xmm1, %xmm2			; CHECK-NEXT: pand %xmm1, %xmm2
	; CHECK-NEXT: psrlw $2, %xmm0			; CHECK-NEXT: psrlw $2, %xmm0
	; CHECK-NEXT: pand %xmm1, %xmm0			; CHECK-NEXT: pand %xmm1, %xmm0
	; CHECK-NEXT: paddb %xmm2, %xmm0			; CHECK-NEXT: paddb %xmm2, %xmm0
	; CHECK-NEXT: movdqa %xmm0, %xmm1			; CHECK-NEXT: movdqa %xmm0, %xmm1
	; CHECK-NEXT: psrlw $4, %xmm1			; CHECK-NEXT: psrlw $4, %xmm1
	; CHECK-NEXT: paddb %xmm0, %xmm1			; CHECK-NEXT: paddb %xmm1, %xmm0
	; CHECK-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; CHECK-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; CHECK-NEXT: pxor %xmm0, %xmm0			; CHECK-NEXT: pxor %xmm1, %xmm1
	; CHECK-NEXT: psadbw %xmm0, %xmm1			; CHECK-NEXT: psadbw %xmm1, %xmm0
	; CHECK-NEXT: movdqa %xmm1, %xmm0
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%c = call <2 x i64> @llvm.ctpop.v2i64(<2 x i64> %a)			%c = call <2 x i64> @llvm.ctpop.v2i64(<2 x i64> %a)
	ret <2 x i64> %c			ret <2 x i64> %c
	}			}

	declare <2 x i32> @llvm.cttz.v2i32(<2 x i32>, i1)			declare <2 x i32> @llvm.cttz.v2i32(<2 x i32>, i1)
	declare <2 x i32> @llvm.ctlz.v2i32(<2 x i32>, i1)			declare <2 x i32> @llvm.ctlz.v2i32(<2 x i32>, i1)
	declare <2 x i32> @llvm.ctpop.v2i32(<2 x i32>)			declare <2 x i32> @llvm.ctpop.v2i32(<2 x i32>)
	▲ Show 20 Lines • Show All 110 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vec_minmax_sint.ll

	Show First 20 Lines • Show All 114 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: pandn %xmm3, %xmm4			; SSE2-NEXT: pandn %xmm3, %xmm4
	; SSE2-NEXT: por %xmm4, %xmm1			; SSE2-NEXT: por %xmm4, %xmm1
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: max_gt_v4i64:			; SSE41-LABEL: max_gt_v4i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm2, %xmm6			; SSE41-NEXT: movdqa %xmm2, %xmm0
				; SSE41-NEXT: pxor %xmm5, %xmm0
				; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm6			; SSE41-NEXT: pxor %xmm5, %xmm6
	; SSE41-NEXT: movdqa %xmm0, %xmm7			; SSE41-NEXT: movdqa %xmm6, %xmm7
	; SSE41-NEXT: pxor %xmm5, %xmm7			; SSE41-NEXT: pcmpeqd %xmm0, %xmm7
	; SSE41-NEXT: movdqa %xmm7, %xmm0			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pcmpeqd %xmm6, %xmm0			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpgtd %xmm6, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm7[0,0,2,2]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm5			; SSE41-NEXT: pxor %xmm1, %xmm5
	; SSE41-NEXT: movdqa %xmm5, %xmm4			; SSE41-NEXT: movdqa %xmm5, %xmm4
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm4			; SSE41-NEXT: pcmpeqd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm5			; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[0,0,2,2]
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines

	define <4 x i32> @max_gt_v4i32(<4 x i32> %a, <4 x i32> %b) {			define <4 x i32> @max_gt_v4i32(<4 x i32> %a, <4 x i32> %b) {
	; SSE2-LABEL: max_gt_v4i32:			; SSE2-LABEL: max_gt_v4i32:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa %xmm0, %xmm2			; SSE2-NEXT: movdqa %xmm0, %xmm2
	; SSE2-NEXT: pcmpgtd %xmm1, %xmm2			; SSE2-NEXT: pcmpgtd %xmm1, %xmm2
	; SSE2-NEXT: pand %xmm2, %xmm0			; SSE2-NEXT: pand %xmm2, %xmm0
	; SSE2-NEXT: pandn %xmm1, %xmm2			; SSE2-NEXT: pandn %xmm1, %xmm2
	; SSE2-NEXT: por %xmm0, %xmm2			; SSE2-NEXT: por %xmm2, %xmm0
	; SSE2-NEXT: movdqa %xmm2, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: max_gt_v4i32:			; SSE41-LABEL: max_gt_v4i32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: pmaxsd %xmm1, %xmm0			; SSE41-NEXT: pmaxsd %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: max_gt_v4i32:			; SSE42-LABEL: max_gt_v4i32:
	Show All 12 Lines

	define <8 x i32> @max_gt_v8i32(<8 x i32> %a, <8 x i32> %b) {			define <8 x i32> @max_gt_v8i32(<8 x i32> %a, <8 x i32> %b) {
	; SSE2-LABEL: max_gt_v8i32:			; SSE2-LABEL: max_gt_v8i32:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa %xmm0, %xmm4			; SSE2-NEXT: movdqa %xmm0, %xmm4
	; SSE2-NEXT: pcmpgtd %xmm2, %xmm4			; SSE2-NEXT: pcmpgtd %xmm2, %xmm4
	; SSE2-NEXT: pand %xmm4, %xmm0			; SSE2-NEXT: pand %xmm4, %xmm0
	; SSE2-NEXT: pandn %xmm2, %xmm4			; SSE2-NEXT: pandn %xmm2, %xmm4
	; SSE2-NEXT: por %xmm0, %xmm4			; SSE2-NEXT: por %xmm4, %xmm0
	; SSE2-NEXT: movdqa %xmm1, %xmm2			; SSE2-NEXT: movdqa %xmm1, %xmm2
	; SSE2-NEXT: pcmpgtd %xmm3, %xmm2			; SSE2-NEXT: pcmpgtd %xmm3, %xmm2
	; SSE2-NEXT: pand %xmm2, %xmm1			; SSE2-NEXT: pand %xmm2, %xmm1
	; SSE2-NEXT: pandn %xmm3, %xmm2			; SSE2-NEXT: pandn %xmm3, %xmm2
	; SSE2-NEXT: por %xmm1, %xmm2			; SSE2-NEXT: por %xmm2, %xmm1
	; SSE2-NEXT: movdqa %xmm4, %xmm0
	; SSE2-NEXT: movdqa %xmm2, %xmm1
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: max_gt_v8i32:			; SSE41-LABEL: max_gt_v8i32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: pmaxsd %xmm2, %xmm0			; SSE41-NEXT: pmaxsd %xmm2, %xmm0
	; SSE41-NEXT: pmaxsd %xmm3, %xmm1			; SSE41-NEXT: pmaxsd %xmm3, %xmm1
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 73 Lines • ▼ Show 20 Lines

	define <16 x i8> @max_gt_v16i8(<16 x i8> %a, <16 x i8> %b) {			define <16 x i8> @max_gt_v16i8(<16 x i8> %a, <16 x i8> %b) {
	; SSE2-LABEL: max_gt_v16i8:			; SSE2-LABEL: max_gt_v16i8:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa %xmm0, %xmm2			; SSE2-NEXT: movdqa %xmm0, %xmm2
	; SSE2-NEXT: pcmpgtb %xmm1, %xmm2			; SSE2-NEXT: pcmpgtb %xmm1, %xmm2
	; SSE2-NEXT: pand %xmm2, %xmm0			; SSE2-NEXT: pand %xmm2, %xmm0
	; SSE2-NEXT: pandn %xmm1, %xmm2			; SSE2-NEXT: pandn %xmm1, %xmm2
	; SSE2-NEXT: por %xmm0, %xmm2			; SSE2-NEXT: por %xmm2, %xmm0
	; SSE2-NEXT: movdqa %xmm2, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: max_gt_v16i8:			; SSE41-LABEL: max_gt_v16i8:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: pmaxsb %xmm1, %xmm0			; SSE41-NEXT: pmaxsb %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: max_gt_v16i8:			; SSE42-LABEL: max_gt_v16i8:
	Show All 12 Lines

	define <32 x i8> @max_gt_v32i8(<32 x i8> %a, <32 x i8> %b) {			define <32 x i8> @max_gt_v32i8(<32 x i8> %a, <32 x i8> %b) {
	; SSE2-LABEL: max_gt_v32i8:			; SSE2-LABEL: max_gt_v32i8:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa %xmm0, %xmm4			; SSE2-NEXT: movdqa %xmm0, %xmm4
	; SSE2-NEXT: pcmpgtb %xmm2, %xmm4			; SSE2-NEXT: pcmpgtb %xmm2, %xmm4
	; SSE2-NEXT: pand %xmm4, %xmm0			; SSE2-NEXT: pand %xmm4, %xmm0
	; SSE2-NEXT: pandn %xmm2, %xmm4			; SSE2-NEXT: pandn %xmm2, %xmm4
	; SSE2-NEXT: por %xmm0, %xmm4			; SSE2-NEXT: por %xmm4, %xmm0
	; SSE2-NEXT: movdqa %xmm1, %xmm2			; SSE2-NEXT: movdqa %xmm1, %xmm2
	; SSE2-NEXT: pcmpgtb %xmm3, %xmm2			; SSE2-NEXT: pcmpgtb %xmm3, %xmm2
	; SSE2-NEXT: pand %xmm2, %xmm1			; SSE2-NEXT: pand %xmm2, %xmm1
	; SSE2-NEXT: pandn %xmm3, %xmm2			; SSE2-NEXT: pandn %xmm3, %xmm2
	; SSE2-NEXT: por %xmm1, %xmm2			; SSE2-NEXT: por %xmm2, %xmm1
	; SSE2-NEXT: movdqa %xmm4, %xmm0
	; SSE2-NEXT: movdqa %xmm2, %xmm1
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: max_gt_v32i8:			; SSE41-LABEL: max_gt_v32i8:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: pmaxsb %xmm2, %xmm0			; SSE41-NEXT: pmaxsb %xmm2, %xmm0
	; SSE41-NEXT: pmaxsb %xmm3, %xmm1			; SSE41-NEXT: pmaxsb %xmm3, %xmm1
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 134 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: pandn %xmm3, %xmm4			; SSE2-NEXT: pandn %xmm3, %xmm4
	; SSE2-NEXT: por %xmm4, %xmm1			; SSE2-NEXT: por %xmm4, %xmm1
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: max_ge_v4i64:			; SSE41-LABEL: max_ge_v4i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm2, %xmm6			; SSE41-NEXT: movdqa %xmm2, %xmm0
				; SSE41-NEXT: pxor %xmm5, %xmm0
				; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm6			; SSE41-NEXT: pxor %xmm5, %xmm6
	; SSE41-NEXT: movdqa %xmm0, %xmm7			; SSE41-NEXT: movdqa %xmm6, %xmm7
	; SSE41-NEXT: pxor %xmm5, %xmm7			; SSE41-NEXT: pcmpeqd %xmm0, %xmm7
	; SSE41-NEXT: movdqa %xmm7, %xmm0			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pcmpeqd %xmm6, %xmm0			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpgtd %xmm6, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm7[0,0,2,2]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm5			; SSE41-NEXT: pxor %xmm1, %xmm5
	; SSE41-NEXT: movdqa %xmm5, %xmm4			; SSE41-NEXT: movdqa %xmm5, %xmm4
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm4			; SSE41-NEXT: pcmpeqd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm5			; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[0,0,2,2]
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines

	define <4 x i32> @max_ge_v4i32(<4 x i32> %a, <4 x i32> %b) {			define <4 x i32> @max_ge_v4i32(<4 x i32> %a, <4 x i32> %b) {
	; SSE2-LABEL: max_ge_v4i32:			; SSE2-LABEL: max_ge_v4i32:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa %xmm0, %xmm2			; SSE2-NEXT: movdqa %xmm0, %xmm2
	; SSE2-NEXT: pcmpgtd %xmm1, %xmm2			; SSE2-NEXT: pcmpgtd %xmm1, %xmm2
	; SSE2-NEXT: pand %xmm2, %xmm0			; SSE2-NEXT: pand %xmm2, %xmm0
	; SSE2-NEXT: pandn %xmm1, %xmm2			; SSE2-NEXT: pandn %xmm1, %xmm2
	; SSE2-NEXT: por %xmm0, %xmm2			; SSE2-NEXT: por %xmm2, %xmm0
	; SSE2-NEXT: movdqa %xmm2, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: max_ge_v4i32:			; SSE41-LABEL: max_ge_v4i32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: pmaxsd %xmm1, %xmm0			; SSE41-NEXT: pmaxsd %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: max_ge_v4i32:			; SSE42-LABEL: max_ge_v4i32:
	Show All 12 Lines

	define <8 x i32> @max_ge_v8i32(<8 x i32> %a, <8 x i32> %b) {			define <8 x i32> @max_ge_v8i32(<8 x i32> %a, <8 x i32> %b) {
	; SSE2-LABEL: max_ge_v8i32:			; SSE2-LABEL: max_ge_v8i32:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa %xmm0, %xmm4			; SSE2-NEXT: movdqa %xmm0, %xmm4
	; SSE2-NEXT: pcmpgtd %xmm2, %xmm4			; SSE2-NEXT: pcmpgtd %xmm2, %xmm4
	; SSE2-NEXT: pand %xmm4, %xmm0			; SSE2-NEXT: pand %xmm4, %xmm0
	; SSE2-NEXT: pandn %xmm2, %xmm4			; SSE2-NEXT: pandn %xmm2, %xmm4
	; SSE2-NEXT: por %xmm0, %xmm4			; SSE2-NEXT: por %xmm4, %xmm0
	; SSE2-NEXT: movdqa %xmm1, %xmm2			; SSE2-NEXT: movdqa %xmm1, %xmm2
	; SSE2-NEXT: pcmpgtd %xmm3, %xmm2			; SSE2-NEXT: pcmpgtd %xmm3, %xmm2
	; SSE2-NEXT: pand %xmm2, %xmm1			; SSE2-NEXT: pand %xmm2, %xmm1
	; SSE2-NEXT: pandn %xmm3, %xmm2			; SSE2-NEXT: pandn %xmm3, %xmm2
	; SSE2-NEXT: por %xmm1, %xmm2			; SSE2-NEXT: por %xmm2, %xmm1
	; SSE2-NEXT: movdqa %xmm4, %xmm0
	; SSE2-NEXT: movdqa %xmm2, %xmm1
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: max_ge_v8i32:			; SSE41-LABEL: max_ge_v8i32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: pmaxsd %xmm2, %xmm0			; SSE41-NEXT: pmaxsd %xmm2, %xmm0
	; SSE41-NEXT: pmaxsd %xmm3, %xmm1			; SSE41-NEXT: pmaxsd %xmm3, %xmm1
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 73 Lines • ▼ Show 20 Lines

	define <16 x i8> @max_ge_v16i8(<16 x i8> %a, <16 x i8> %b) {			define <16 x i8> @max_ge_v16i8(<16 x i8> %a, <16 x i8> %b) {
	; SSE2-LABEL: max_ge_v16i8:			; SSE2-LABEL: max_ge_v16i8:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa %xmm0, %xmm2			; SSE2-NEXT: movdqa %xmm0, %xmm2
	; SSE2-NEXT: pcmpgtb %xmm1, %xmm2			; SSE2-NEXT: pcmpgtb %xmm1, %xmm2
	; SSE2-NEXT: pand %xmm2, %xmm0			; SSE2-NEXT: pand %xmm2, %xmm0
	; SSE2-NEXT: pandn %xmm1, %xmm2			; SSE2-NEXT: pandn %xmm1, %xmm2
	; SSE2-NEXT: por %xmm0, %xmm2			; SSE2-NEXT: por %xmm2, %xmm0
	; SSE2-NEXT: movdqa %xmm2, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: max_ge_v16i8:			; SSE41-LABEL: max_ge_v16i8:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: pmaxsb %xmm1, %xmm0			; SSE41-NEXT: pmaxsb %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: max_ge_v16i8:			; SSE42-LABEL: max_ge_v16i8:
	Show All 12 Lines

	define <32 x i8> @max_ge_v32i8(<32 x i8> %a, <32 x i8> %b) {			define <32 x i8> @max_ge_v32i8(<32 x i8> %a, <32 x i8> %b) {
	; SSE2-LABEL: max_ge_v32i8:			; SSE2-LABEL: max_ge_v32i8:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa %xmm0, %xmm4			; SSE2-NEXT: movdqa %xmm0, %xmm4
	; SSE2-NEXT: pcmpgtb %xmm2, %xmm4			; SSE2-NEXT: pcmpgtb %xmm2, %xmm4
	; SSE2-NEXT: pand %xmm4, %xmm0			; SSE2-NEXT: pand %xmm4, %xmm0
	; SSE2-NEXT: pandn %xmm2, %xmm4			; SSE2-NEXT: pandn %xmm2, %xmm4
	; SSE2-NEXT: por %xmm0, %xmm4			; SSE2-NEXT: por %xmm4, %xmm0
	; SSE2-NEXT: movdqa %xmm1, %xmm2			; SSE2-NEXT: movdqa %xmm1, %xmm2
	; SSE2-NEXT: pcmpgtb %xmm3, %xmm2			; SSE2-NEXT: pcmpgtb %xmm3, %xmm2
	; SSE2-NEXT: pand %xmm2, %xmm1			; SSE2-NEXT: pand %xmm2, %xmm1
	; SSE2-NEXT: pandn %xmm3, %xmm2			; SSE2-NEXT: pandn %xmm3, %xmm2
	; SSE2-NEXT: por %xmm1, %xmm2			; SSE2-NEXT: por %xmm2, %xmm1
	; SSE2-NEXT: movdqa %xmm4, %xmm0
	; SSE2-NEXT: movdqa %xmm2, %xmm1
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: max_ge_v32i8:			; SSE41-LABEL: max_ge_v32i8:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: pmaxsb %xmm2, %xmm0			; SSE41-NEXT: pmaxsb %xmm2, %xmm0
	; SSE41-NEXT: pmaxsb %xmm3, %xmm1			; SSE41-NEXT: pmaxsb %xmm3, %xmm1
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 1,282 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vec_minmax_uint.ll

Show First 20 Lines • Show All 124 Lines • ▼ Show 20 Lines
; SSE2-NEXT: pandn %xmm3, %xmm4		; SSE2-NEXT: pandn %xmm3, %xmm4
; SSE2-NEXT: por %xmm4, %xmm1		; SSE2-NEXT: por %xmm4, %xmm1
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: max_gt_v4i64:		; SSE41-LABEL: max_gt_v4i64:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movdqa %xmm0, %xmm4		; SSE41-NEXT: movdqa %xmm0, %xmm4
; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [9223372039002259456,9223372039002259456]		; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [9223372039002259456,9223372039002259456]
; SSE41-NEXT: movdqa %xmm2, %xmm6		; SSE41-NEXT: movdqa %xmm2, %xmm0
		; SSE41-NEXT: pxor %xmm5, %xmm0
		; SSE41-NEXT: movdqa %xmm4, %xmm6
; SSE41-NEXT: pxor %xmm5, %xmm6		; SSE41-NEXT: pxor %xmm5, %xmm6
; SSE41-NEXT: movdqa %xmm0, %xmm7		; SSE41-NEXT: movdqa %xmm6, %xmm7
; SSE41-NEXT: pxor %xmm5, %xmm7		; SSE41-NEXT: pcmpeqd %xmm0, %xmm7
; SSE41-NEXT: movdqa %xmm7, %xmm0		; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
; SSE41-NEXT: pcmpeqd %xmm6, %xmm0		; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[0,0,2,2]
; SSE41-NEXT: pcmpgtd %xmm6, %xmm7		; SSE41-NEXT: pand %xmm7, %xmm0
; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm7[0,0,2,2]		; SSE41-NEXT: por %xmm6, %xmm0
; SSE41-NEXT: pand %xmm6, %xmm0
; SSE41-NEXT: por %xmm7, %xmm0
; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2		; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
; SSE41-NEXT: movdqa %xmm3, %xmm0		; SSE41-NEXT: movdqa %xmm3, %xmm0
; SSE41-NEXT: pxor %xmm5, %xmm0		; SSE41-NEXT: pxor %xmm5, %xmm0
; SSE41-NEXT: pxor %xmm1, %xmm5		; SSE41-NEXT: pxor %xmm1, %xmm5
; SSE41-NEXT: movdqa %xmm5, %xmm4		; SSE41-NEXT: movdqa %xmm5, %xmm4
; SSE41-NEXT: pcmpeqd %xmm0, %xmm4		; SSE41-NEXT: pcmpeqd %xmm0, %xmm4
; SSE41-NEXT: pcmpgtd %xmm0, %xmm5		; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[0,0,2,2]		; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[0,0,2,2]
▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines	; AVX-NEXT: retq
%1 = icmp ugt <4 x i32> %a, %b		%1 = icmp ugt <4 x i32> %a, %b
%2 = select <4 x i1> %1, <4 x i32> %a, <4 x i32> %b		%2 = select <4 x i1> %1, <4 x i32> %a, <4 x i32> %b
ret <4 x i32> %2		ret <4 x i32> %2
}		}

define <8 x i32> @max_gt_v8i32(<8 x i32> %a, <8 x i32> %b) {		define <8 x i32> @max_gt_v8i32(<8 x i32> %a, <8 x i32> %b) {
; SSE2-LABEL: max_gt_v8i32:		; SSE2-LABEL: max_gt_v8i32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648,2147483648,2147483648]		; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [2147483648,2147483648,2147483648,2147483648]
; SSE2-NEXT: movdqa %xmm2, %xmm6		; SSE2-NEXT: movdqa %xmm2, %xmm5
; SSE2-NEXT: pxor %xmm5, %xmm6		; SSE2-NEXT: pxor %xmm4, %xmm5
; SSE2-NEXT: movdqa %xmm0, %xmm4		; SSE2-NEXT: movdqa %xmm0, %xmm6
; SSE2-NEXT: pxor %xmm5, %xmm4		; SSE2-NEXT: pxor %xmm4, %xmm6
; SSE2-NEXT: pcmpgtd %xmm6, %xmm4		; SSE2-NEXT: pcmpgtd %xmm5, %xmm6
; SSE2-NEXT: pand %xmm4, %xmm0		; SSE2-NEXT: pand %xmm6, %xmm0
; SSE2-NEXT: pandn %xmm2, %xmm4		; SSE2-NEXT: pandn %xmm2, %xmm6
; SSE2-NEXT: por %xmm0, %xmm4		; SSE2-NEXT: por %xmm6, %xmm0
; SSE2-NEXT: movdqa %xmm3, %xmm0		; SSE2-NEXT: movdqa %xmm3, %xmm2
; SSE2-NEXT: pxor %xmm5, %xmm0		; SSE2-NEXT: pxor %xmm4, %xmm2
; SSE2-NEXT: pxor %xmm1, %xmm5		; SSE2-NEXT: pxor %xmm1, %xmm4
; SSE2-NEXT: pcmpgtd %xmm0, %xmm5		; SSE2-NEXT: pcmpgtd %xmm2, %xmm4
; SSE2-NEXT: pand %xmm5, %xmm1		; SSE2-NEXT: pand %xmm4, %xmm1
; SSE2-NEXT: pandn %xmm3, %xmm5		; SSE2-NEXT: pandn %xmm3, %xmm4
; SSE2-NEXT: por %xmm5, %xmm1		; SSE2-NEXT: por %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm4, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: max_gt_v8i32:		; SSE41-LABEL: max_gt_v8i32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: pmaxud %xmm2, %xmm0		; SSE41-NEXT: pmaxud %xmm2, %xmm0
; SSE41-NEXT: pmaxud %xmm3, %xmm1		; SSE41-NEXT: pmaxud %xmm3, %xmm1
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
▲ Show 20 Lines • Show All 259 Lines • ▼ Show 20 Lines
; SSE2-NEXT: pandn %xmm3, %xmm4		; SSE2-NEXT: pandn %xmm3, %xmm4
; SSE2-NEXT: por %xmm4, %xmm1		; SSE2-NEXT: por %xmm4, %xmm1
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: max_ge_v4i64:		; SSE41-LABEL: max_ge_v4i64:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movdqa %xmm0, %xmm4		; SSE41-NEXT: movdqa %xmm0, %xmm4
; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [9223372039002259456,9223372039002259456]		; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [9223372039002259456,9223372039002259456]
; SSE41-NEXT: movdqa %xmm2, %xmm6		; SSE41-NEXT: movdqa %xmm2, %xmm0
		; SSE41-NEXT: pxor %xmm5, %xmm0
		; SSE41-NEXT: movdqa %xmm4, %xmm6
; SSE41-NEXT: pxor %xmm5, %xmm6		; SSE41-NEXT: pxor %xmm5, %xmm6
; SSE41-NEXT: movdqa %xmm0, %xmm7		; SSE41-NEXT: movdqa %xmm6, %xmm7
; SSE41-NEXT: pxor %xmm5, %xmm7		; SSE41-NEXT: pcmpeqd %xmm0, %xmm7
; SSE41-NEXT: movdqa %xmm7, %xmm0		; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
; SSE41-NEXT: pcmpeqd %xmm6, %xmm0		; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[0,0,2,2]
; SSE41-NEXT: pcmpgtd %xmm6, %xmm7		; SSE41-NEXT: pand %xmm7, %xmm0
; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm7[0,0,2,2]		; SSE41-NEXT: por %xmm6, %xmm0
; SSE41-NEXT: pand %xmm6, %xmm0
; SSE41-NEXT: por %xmm7, %xmm0
; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2		; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
; SSE41-NEXT: movdqa %xmm3, %xmm0		; SSE41-NEXT: movdqa %xmm3, %xmm0
; SSE41-NEXT: pxor %xmm5, %xmm0		; SSE41-NEXT: pxor %xmm5, %xmm0
; SSE41-NEXT: pxor %xmm1, %xmm5		; SSE41-NEXT: pxor %xmm1, %xmm5
; SSE41-NEXT: movdqa %xmm5, %xmm4		; SSE41-NEXT: movdqa %xmm5, %xmm4
; SSE41-NEXT: pcmpeqd %xmm0, %xmm4		; SSE41-NEXT: pcmpeqd %xmm0, %xmm4
; SSE41-NEXT: pcmpgtd %xmm0, %xmm5		; SSE41-NEXT: pcmpgtd %xmm0, %xmm5
; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[0,0,2,2]		; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm5[0,0,2,2]
▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines	; AVX-NEXT: retq
%1 = icmp uge <4 x i32> %a, %b		%1 = icmp uge <4 x i32> %a, %b
%2 = select <4 x i1> %1, <4 x i32> %a, <4 x i32> %b		%2 = select <4 x i1> %1, <4 x i32> %a, <4 x i32> %b
ret <4 x i32> %2		ret <4 x i32> %2
}		}

define <8 x i32> @max_ge_v8i32(<8 x i32> %a, <8 x i32> %b) {		define <8 x i32> @max_ge_v8i32(<8 x i32> %a, <8 x i32> %b) {
; SSE2-LABEL: max_ge_v8i32:		; SSE2-LABEL: max_ge_v8i32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648,2147483648,2147483648]		; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [2147483648,2147483648,2147483648,2147483648]
; SSE2-NEXT: movdqa %xmm2, %xmm6		; SSE2-NEXT: movdqa %xmm2, %xmm5
; SSE2-NEXT: pxor %xmm5, %xmm6		; SSE2-NEXT: pxor %xmm4, %xmm5
; SSE2-NEXT: movdqa %xmm0, %xmm4		; SSE2-NEXT: movdqa %xmm0, %xmm6
; SSE2-NEXT: pxor %xmm5, %xmm4		; SSE2-NEXT: pxor %xmm4, %xmm6
; SSE2-NEXT: pcmpgtd %xmm6, %xmm4		; SSE2-NEXT: pcmpgtd %xmm5, %xmm6
; SSE2-NEXT: pand %xmm4, %xmm0		; SSE2-NEXT: pand %xmm6, %xmm0
; SSE2-NEXT: pandn %xmm2, %xmm4		; SSE2-NEXT: pandn %xmm2, %xmm6
; SSE2-NEXT: por %xmm0, %xmm4		; SSE2-NEXT: por %xmm6, %xmm0
; SSE2-NEXT: movdqa %xmm3, %xmm0		; SSE2-NEXT: movdqa %xmm3, %xmm2
; SSE2-NEXT: pxor %xmm5, %xmm0		; SSE2-NEXT: pxor %xmm4, %xmm2
; SSE2-NEXT: pxor %xmm1, %xmm5		; SSE2-NEXT: pxor %xmm1, %xmm4
; SSE2-NEXT: pcmpgtd %xmm0, %xmm5		; SSE2-NEXT: pcmpgtd %xmm2, %xmm4
; SSE2-NEXT: pand %xmm5, %xmm1		; SSE2-NEXT: pand %xmm4, %xmm1
; SSE2-NEXT: pandn %xmm3, %xmm5		; SSE2-NEXT: pandn %xmm3, %xmm4
; SSE2-NEXT: por %xmm5, %xmm1		; SSE2-NEXT: por %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm4, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: max_ge_v8i32:		; SSE41-LABEL: max_ge_v8i32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: pmaxud %xmm2, %xmm0		; SSE41-NEXT: pmaxud %xmm2, %xmm0
; SSE41-NEXT: pmaxud %xmm3, %xmm1		; SSE41-NEXT: pmaxud %xmm3, %xmm1
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
▲ Show 20 Lines • Show All 1,451 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vec_saddo.ll

	Show First 20 Lines • Show All 811 Lines • ▼ Show 20 Lines
	; SSE2-LABEL: saddo_v4i24:			; SSE2-LABEL: saddo_v4i24:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa %xmm0, %xmm2			; SSE2-NEXT: movdqa %xmm0, %xmm2
	; SSE2-NEXT: pslld $8, %xmm1			; SSE2-NEXT: pslld $8, %xmm1
	; SSE2-NEXT: psrad $8, %xmm1			; SSE2-NEXT: psrad $8, %xmm1
	; SSE2-NEXT: pslld $8, %xmm2			; SSE2-NEXT: pslld $8, %xmm2
	; SSE2-NEXT: psrad $8, %xmm2			; SSE2-NEXT: psrad $8, %xmm2
	; SSE2-NEXT: paddd %xmm1, %xmm2			; SSE2-NEXT: paddd %xmm1, %xmm2
	; SSE2-NEXT: movdqa %xmm2, %xmm0			; SSE2-NEXT: movdqa %xmm2, %xmm1
	; SSE2-NEXT: pslld $8, %xmm0			; SSE2-NEXT: pslld $8, %xmm1
	; SSE2-NEXT: psrad $8, %xmm0			; SSE2-NEXT: psrad $8, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm2, %xmm0			; SSE2-NEXT: pcmpeqd %xmm2, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm1			; SSE2-NEXT: pcmpeqd %xmm0, %xmm0
	; SSE2-NEXT: pxor %xmm1, %xmm0			; SSE2-NEXT: pxor %xmm1, %xmm0
	; SSE2-NEXT: movd %xmm2, %eax			; SSE2-NEXT: movd %xmm2, %eax
	; SSE2-NEXT: movw %ax, (%rdi)			; SSE2-NEXT: movw %ax, (%rdi)
	; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm2[3,3,3,3]			; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm2[3,3,3,3]
	; SSE2-NEXT: movd %xmm1, %ecx			; SSE2-NEXT: movd %xmm1, %ecx
	; SSE2-NEXT: movw %cx, 9(%rdi)			; SSE2-NEXT: movw %cx, 9(%rdi)
	; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm2[2,3,2,3]			; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm2[2,3,2,3]
	; SSE2-NEXT: movd %xmm1, %edx			; SSE2-NEXT: movd %xmm1, %edx
	Show All 14 Lines
	; SSSE3-LABEL: saddo_v4i24:			; SSSE3-LABEL: saddo_v4i24:
	; SSSE3: # %bb.0:			; SSSE3: # %bb.0:
	; SSSE3-NEXT: movdqa %xmm0, %xmm2			; SSSE3-NEXT: movdqa %xmm0, %xmm2
	; SSSE3-NEXT: pslld $8, %xmm1			; SSSE3-NEXT: pslld $8, %xmm1
	; SSSE3-NEXT: psrad $8, %xmm1			; SSSE3-NEXT: psrad $8, %xmm1
	; SSSE3-NEXT: pslld $8, %xmm2			; SSSE3-NEXT: pslld $8, %xmm2
	; SSSE3-NEXT: psrad $8, %xmm2			; SSSE3-NEXT: psrad $8, %xmm2
	; SSSE3-NEXT: paddd %xmm1, %xmm2			; SSSE3-NEXT: paddd %xmm1, %xmm2
	; SSSE3-NEXT: movdqa %xmm2, %xmm0			; SSSE3-NEXT: movdqa %xmm2, %xmm1
	; SSSE3-NEXT: pslld $8, %xmm0			; SSSE3-NEXT: pslld $8, %xmm1
	; SSSE3-NEXT: psrad $8, %xmm0			; SSSE3-NEXT: psrad $8, %xmm1
	; SSSE3-NEXT: pcmpeqd %xmm2, %xmm0			; SSSE3-NEXT: pcmpeqd %xmm2, %xmm1
	; SSSE3-NEXT: pcmpeqd %xmm1, %xmm1			; SSSE3-NEXT: pcmpeqd %xmm0, %xmm0
	; SSSE3-NEXT: pxor %xmm1, %xmm0			; SSSE3-NEXT: pxor %xmm1, %xmm0
	; SSSE3-NEXT: movd %xmm2, %eax			; SSSE3-NEXT: movd %xmm2, %eax
	; SSSE3-NEXT: movw %ax, (%rdi)			; SSSE3-NEXT: movw %ax, (%rdi)
	; SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm2[3,3,3,3]			; SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm2[3,3,3,3]
	; SSSE3-NEXT: movd %xmm1, %ecx			; SSSE3-NEXT: movd %xmm1, %ecx
	; SSSE3-NEXT: movw %cx, 9(%rdi)			; SSSE3-NEXT: movw %cx, 9(%rdi)
	; SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm2[2,3,2,3]			; SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm2[2,3,2,3]
	; SSSE3-NEXT: movd %xmm1, %edx			; SSSE3-NEXT: movd %xmm1, %edx
	; SSSE3-NEXT: movw %dx, 6(%rdi)			; SSSE3-NEXT: movw %dx, 6(%rdi)
	; SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm2[1,1,1,1]			; SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm2[1,1,1,1]
	; SSSE3-NEXT: movd %xmm1, %esi			; SSSE3-NEXT: movd %xmm1, %esi
	; SSSE3-NEXT: movw %si, 3(%rdi)			; SSSE3-NEXT: movw %si, 3(%rdi)
	; SSSE3-NEXT: shrl $16, %eax			; SSSE3-NEXT: shrl $16, %eax
	; SSSE3-NEXT: movb %al, 2(%rdi)			; SSSE3-NEXT: movb %al, 2(%rdi)
	; SSSE3-NEXT: shrl $16, %ecx			; SSSE3-NEXT: shrl $16, %ecx
	; SSSE3-NEXT: movb %cl, 11(%rdi)			; SSSE3-NEXT: movb %cl, 11(%rdi)
	; SSSE3-NEXT: shrl $16, %edx			; SSSE3-NEXT: shrl $16, %edx
	; SSSE3-NEXT: movb %dl, 8(%rdi)			; SSSE3-NEXT: movb %dl, 8(%rdi)
	; SSSE3-NEXT: shrl $16, %esi			; SSSE3-NEXT: shrl $16, %esi
	; SSSE3-NEXT: movb %sil, 5(%rdi)			; SSSE3-NEXT: movb %sil, 5(%rdi)
	; SSSE3-NEXT: retq			; SSSE3-NEXT: retq
	;			;
	; SSE41-LABEL: saddo_v4i24:			; SSE41-LABEL: saddo_v4i24:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: pslld $8, %xmm1			; SSE41-NEXT: pslld $8, %xmm1
	; SSE41-NEXT: psrad $8, %xmm1			; SSE41-NEXT: psrad $8, %xmm1
	; SSE41-NEXT: pslld $8, %xmm2
	; SSE41-NEXT: psrad $8, %xmm2
	; SSE41-NEXT: paddd %xmm1, %xmm2
	; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pslld $8, %xmm0			; SSE41-NEXT: pslld $8, %xmm0
	; SSE41-NEXT: psrad $8, %xmm0			; SSE41-NEXT: psrad $8, %xmm0
	; SSE41-NEXT: pcmpeqd %xmm2, %xmm0			; SSE41-NEXT: paddd %xmm1, %xmm0
				; SSE41-NEXT: movdqa %xmm0, %xmm2
				; SSE41-NEXT: pslld $8, %xmm2
				; SSE41-NEXT: psrad $8, %xmm2
				; SSE41-NEXT: pcmpeqd %xmm0, %xmm2
	; SSE41-NEXT: pcmpeqd %xmm1, %xmm1			; SSE41-NEXT: pcmpeqd %xmm1, %xmm1
	; SSE41-NEXT: pxor %xmm1, %xmm0			; SSE41-NEXT: pxor %xmm2, %xmm1
	; SSE41-NEXT: pextrd $3, %xmm2, %eax			; SSE41-NEXT: pextrd $3, %xmm0, %eax
	; SSE41-NEXT: movw %ax, 9(%rdi)			; SSE41-NEXT: movw %ax, 9(%rdi)
	; SSE41-NEXT: pextrd $2, %xmm2, %ecx			; SSE41-NEXT: pextrd $2, %xmm0, %ecx
	; SSE41-NEXT: movw %cx, 6(%rdi)			; SSE41-NEXT: movw %cx, 6(%rdi)
	; SSE41-NEXT: pextrd $1, %xmm2, %edx			; SSE41-NEXT: pextrd $1, %xmm0, %edx
	; SSE41-NEXT: movw %dx, 3(%rdi)			; SSE41-NEXT: movw %dx, 3(%rdi)
	; SSE41-NEXT: movd %xmm2, %esi			; SSE41-NEXT: movd %xmm0, %esi
	; SSE41-NEXT: movw %si, (%rdi)			; SSE41-NEXT: movw %si, (%rdi)
	; SSE41-NEXT: shrl $16, %eax			; SSE41-NEXT: shrl $16, %eax
	; SSE41-NEXT: movb %al, 11(%rdi)			; SSE41-NEXT: movb %al, 11(%rdi)
	; SSE41-NEXT: shrl $16, %ecx			; SSE41-NEXT: shrl $16, %ecx
	; SSE41-NEXT: movb %cl, 8(%rdi)			; SSE41-NEXT: movb %cl, 8(%rdi)
	; SSE41-NEXT: shrl $16, %edx			; SSE41-NEXT: shrl $16, %edx
	; SSE41-NEXT: movb %dl, 5(%rdi)			; SSE41-NEXT: movb %dl, 5(%rdi)
	; SSE41-NEXT: shrl $16, %esi			; SSE41-NEXT: shrl $16, %esi
	; SSE41-NEXT: movb %sil, 2(%rdi)			; SSE41-NEXT: movb %sil, 2(%rdi)
				; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: saddo_v4i24:			; AVX-LABEL: saddo_v4i24:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpslld $8, %xmm1, %xmm1			; AVX-NEXT: vpslld $8, %xmm1, %xmm1
	; AVX-NEXT: vpsrad $8, %xmm1, %xmm1			; AVX-NEXT: vpsrad $8, %xmm1, %xmm1
	; AVX-NEXT: vpslld $8, %xmm0, %xmm0			; AVX-NEXT: vpslld $8, %xmm0, %xmm0
	; AVX-NEXT: vpsrad $8, %xmm0, %xmm0			; AVX-NEXT: vpsrad $8, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; SSE-NEXT: psrad $31, %xmm1			; SSE-NEXT: psrad $31, %xmm1
	; SSE-NEXT: pslld $31, %xmm0			; SSE-NEXT: pslld $31, %xmm0
	; SSE-NEXT: psrad $31, %xmm0			; SSE-NEXT: psrad $31, %xmm0
	; SSE-NEXT: paddd %xmm1, %xmm0			; SSE-NEXT: paddd %xmm1, %xmm0
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE-NEXT: movdqa %xmm0, %xmm1
	; SSE-NEXT: pslld $31, %xmm1			; SSE-NEXT: pslld $31, %xmm1
	; SSE-NEXT: movmskps %xmm1, %eax			; SSE-NEXT: movmskps %xmm1, %eax
	; SSE-NEXT: psrad $31, %xmm1			; SSE-NEXT: psrad $31, %xmm1
	; SSE-NEXT: pcmpeqd %xmm0, %xmm1			; SSE-NEXT: pcmpeqd %xmm1, %xmm0
	; SSE-NEXT: pcmpeqd %xmm0, %xmm0			; SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; SSE-NEXT: pxor %xmm0, %xmm1			; SSE-NEXT: pxor %xmm1, %xmm0
	; SSE-NEXT: movb %al, (%rdi)			; SSE-NEXT: movb %al, (%rdi)
	; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: saddo_v4i1:			; AVX-LABEL: saddo_v4i1:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpslld $31, %xmm1, %xmm1			; AVX-NEXT: vpslld $31, %xmm1, %xmm1
	; AVX-NEXT: vpsrad $31, %xmm1, %xmm1			; AVX-NEXT: vpsrad $31, %xmm1, %xmm1
	; AVX-NEXT: vpslld $31, %xmm0, %xmm0			; AVX-NEXT: vpslld $31, %xmm0, %xmm0
	; AVX-NEXT: vpsrad $31, %xmm0, %xmm0			; AVX-NEXT: vpsrad $31, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 149 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vec_sdiv_to_shift.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+sse4.1 \| FileCheck %s --check-prefix=SSE			; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+sse4.1 \| FileCheck %s --check-prefix=SSE
	; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+avx \| FileCheck %s --check-prefixes=AVX,AVX1			; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+avx \| FileCheck %s --check-prefixes=AVX,AVX1
	; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+avx2 \| FileCheck %s --check-prefixes=AVX,AVX2			; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+avx2 \| FileCheck %s --check-prefixes=AVX,AVX2

	define <8 x i16> @sdiv_vec8x16(<8 x i16> %var) {			define <8 x i16> @sdiv_vec8x16(<8 x i16> %var) {
	; SSE-LABEL: sdiv_vec8x16:			; SSE-LABEL: sdiv_vec8x16:
	; SSE: # %bb.0: # %entry			; SSE: # %bb.0: # %entry
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE-NEXT: movdqa %xmm0, %xmm1
	; SSE-NEXT: psraw $15, %xmm1			; SSE-NEXT: psraw $15, %xmm1
	; SSE-NEXT: psrlw $11, %xmm1			; SSE-NEXT: psrlw $11, %xmm1
	; SSE-NEXT: paddw %xmm0, %xmm1			; SSE-NEXT: paddw %xmm1, %xmm0
	; SSE-NEXT: psraw $5, %xmm1			; SSE-NEXT: psraw $5, %xmm0
	; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: sdiv_vec8x16:			; AVX-LABEL: sdiv_vec8x16:
	; AVX: # %bb.0: # %entry			; AVX: # %bb.0: # %entry
	; AVX-NEXT: vpsraw $15, %xmm0, %xmm1			; AVX-NEXT: vpsraw $15, %xmm0, %xmm1
	; AVX-NEXT: vpsrlw $11, %xmm1, %xmm1			; AVX-NEXT: vpsrlw $11, %xmm1, %xmm1
	; AVX-NEXT: vpaddw %xmm1, %xmm0, %xmm0			; AVX-NEXT: vpaddw %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpsraw $5, %xmm0, %xmm0			; AVX-NEXT: vpsraw $5, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	entry:			entry:
	%0 = sdiv <8 x i16> %var, <i16 32, i16 32, i16 32, i16 32, i16 32, i16 32, i16 32, i16 32>			%0 = sdiv <8 x i16> %var, <i16 32, i16 32, i16 32, i16 32, i16 32, i16 32, i16 32, i16 32>
	ret <8 x i16> %0			ret <8 x i16> %0
	}			}

	define <8 x i16> @sdiv_vec8x16_minsize(<8 x i16> %var) minsize {			define <8 x i16> @sdiv_vec8x16_minsize(<8 x i16> %var) minsize {
	; SSE-LABEL: sdiv_vec8x16_minsize:			; SSE-LABEL: sdiv_vec8x16_minsize:
	; SSE: # %bb.0: # %entry			; SSE: # %bb.0: # %entry
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE-NEXT: movdqa %xmm0, %xmm1
	; SSE-NEXT: psraw $15, %xmm1			; SSE-NEXT: psraw $15, %xmm1
	; SSE-NEXT: psrlw $11, %xmm1			; SSE-NEXT: psrlw $11, %xmm1
	; SSE-NEXT: paddw %xmm0, %xmm1			; SSE-NEXT: paddw %xmm1, %xmm0
	; SSE-NEXT: psraw $5, %xmm1			; SSE-NEXT: psraw $5, %xmm0
	; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: sdiv_vec8x16_minsize:			; AVX-LABEL: sdiv_vec8x16_minsize:
	; AVX: # %bb.0: # %entry			; AVX: # %bb.0: # %entry
	; AVX-NEXT: vpsraw $15, %xmm0, %xmm1			; AVX-NEXT: vpsraw $15, %xmm0, %xmm1
	; AVX-NEXT: vpsrlw $11, %xmm1, %xmm1			; AVX-NEXT: vpsrlw $11, %xmm1, %xmm1
	; AVX-NEXT: vpaddw %xmm1, %xmm0, %xmm0			; AVX-NEXT: vpaddw %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpsraw $5, %xmm0, %xmm0			; AVX-NEXT: vpsraw $5, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	entry:			entry:
	%0 = sdiv <8 x i16> %var, <i16 32, i16 32, i16 32, i16 32, i16 32, i16 32, i16 32, i16 32>			%0 = sdiv <8 x i16> %var, <i16 32, i16 32, i16 32, i16 32, i16 32, i16 32, i16 32, i16 32>
	ret <8 x i16> %0			ret <8 x i16> %0
	}			}

	define <4 x i32> @sdiv_vec4x32(<4 x i32> %var) {			define <4 x i32> @sdiv_vec4x32(<4 x i32> %var) {
	; SSE-LABEL: sdiv_vec4x32:			; SSE-LABEL: sdiv_vec4x32:
	; SSE: # %bb.0: # %entry			; SSE: # %bb.0: # %entry
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE-NEXT: movdqa %xmm0, %xmm1
	; SSE-NEXT: psrad $31, %xmm1			; SSE-NEXT: psrad $31, %xmm1
	; SSE-NEXT: psrld $28, %xmm1			; SSE-NEXT: psrld $28, %xmm1
	; SSE-NEXT: paddd %xmm0, %xmm1			; SSE-NEXT: paddd %xmm1, %xmm0
	; SSE-NEXT: psrad $4, %xmm1			; SSE-NEXT: psrad $4, %xmm0
	; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: sdiv_vec4x32:			; AVX-LABEL: sdiv_vec4x32:
	; AVX: # %bb.0: # %entry			; AVX: # %bb.0: # %entry
	; AVX-NEXT: vpsrad $31, %xmm0, %xmm1			; AVX-NEXT: vpsrad $31, %xmm0, %xmm1
	; AVX-NEXT: vpsrld $28, %xmm1, %xmm1			; AVX-NEXT: vpsrld $28, %xmm1, %xmm1
	; AVX-NEXT: vpaddd %xmm1, %xmm0, %xmm0			; AVX-NEXT: vpaddd %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpsrad $4, %xmm0, %xmm0			; AVX-NEXT: vpsrad $4, %xmm0, %xmm0
	Show All 30 Lines
	}			}

	define <8 x i32> @sdiv8x32(<8 x i32> %var) {			define <8 x i32> @sdiv8x32(<8 x i32> %var) {
	; SSE-LABEL: sdiv8x32:			; SSE-LABEL: sdiv8x32:
	; SSE: # %bb.0: # %entry			; SSE: # %bb.0: # %entry
	; SSE-NEXT: movdqa %xmm0, %xmm2			; SSE-NEXT: movdqa %xmm0, %xmm2
	; SSE-NEXT: psrad $31, %xmm2			; SSE-NEXT: psrad $31, %xmm2
	; SSE-NEXT: psrld $26, %xmm2			; SSE-NEXT: psrld $26, %xmm2
	; SSE-NEXT: paddd %xmm0, %xmm2			; SSE-NEXT: paddd %xmm2, %xmm0
	; SSE-NEXT: psrad $6, %xmm2			; SSE-NEXT: psrad $6, %xmm0
	; SSE-NEXT: movdqa %xmm1, %xmm3			; SSE-NEXT: movdqa %xmm1, %xmm2
	; SSE-NEXT: psrad $31, %xmm3			; SSE-NEXT: psrad $31, %xmm2
	; SSE-NEXT: psrld $26, %xmm3			; SSE-NEXT: psrld $26, %xmm2
	; SSE-NEXT: paddd %xmm1, %xmm3			; SSE-NEXT: paddd %xmm2, %xmm1
	; SSE-NEXT: psrad $6, %xmm3			; SSE-NEXT: psrad $6, %xmm1
	; SSE-NEXT: movdqa %xmm2, %xmm0
	; SSE-NEXT: movdqa %xmm3, %xmm1
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-LABEL: sdiv8x32:			; AVX1-LABEL: sdiv8x32:
	; AVX1: # %bb.0: # %entry			; AVX1: # %bb.0: # %entry
	; AVX1-NEXT: vpsrad $31, %xmm0, %xmm1			; AVX1-NEXT: vpsrad $31, %xmm0, %xmm1
	; AVX1-NEXT: vpsrld $26, %xmm1, %xmm1			; AVX1-NEXT: vpsrld $26, %xmm1, %xmm1
	; AVX1-NEXT: vpaddd %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpaddd %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpsrad $6, %xmm1, %xmm1			; AVX1-NEXT: vpsrad $6, %xmm1, %xmm1
	Show All 18 Lines
	}			}

	define <16 x i16> @sdiv16x16(<16 x i16> %var) {			define <16 x i16> @sdiv16x16(<16 x i16> %var) {
	; SSE-LABEL: sdiv16x16:			; SSE-LABEL: sdiv16x16:
	; SSE: # %bb.0: # %entry			; SSE: # %bb.0: # %entry
	; SSE-NEXT: movdqa %xmm0, %xmm2			; SSE-NEXT: movdqa %xmm0, %xmm2
	; SSE-NEXT: psraw $15, %xmm2			; SSE-NEXT: psraw $15, %xmm2
	; SSE-NEXT: psrlw $14, %xmm2			; SSE-NEXT: psrlw $14, %xmm2
	; SSE-NEXT: paddw %xmm0, %xmm2			; SSE-NEXT: paddw %xmm2, %xmm0
	; SSE-NEXT: psraw $2, %xmm2			; SSE-NEXT: psraw $2, %xmm0
	; SSE-NEXT: movdqa %xmm1, %xmm3			; SSE-NEXT: movdqa %xmm1, %xmm2
	; SSE-NEXT: psraw $15, %xmm3			; SSE-NEXT: psraw $15, %xmm2
	; SSE-NEXT: psrlw $14, %xmm3			; SSE-NEXT: psrlw $14, %xmm2
	; SSE-NEXT: paddw %xmm1, %xmm3			; SSE-NEXT: paddw %xmm2, %xmm1
	; SSE-NEXT: psraw $2, %xmm3			; SSE-NEXT: psraw $2, %xmm1
	; SSE-NEXT: movdqa %xmm2, %xmm0
	; SSE-NEXT: movdqa %xmm3, %xmm1
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-LABEL: sdiv16x16:			; AVX1-LABEL: sdiv16x16:
	; AVX1: # %bb.0: # %entry			; AVX1: # %bb.0: # %entry
	; AVX1-NEXT: vpsraw $15, %xmm0, %xmm1			; AVX1-NEXT: vpsraw $15, %xmm0, %xmm1
	; AVX1-NEXT: vpsrlw $14, %xmm1, %xmm1			; AVX1-NEXT: vpsrlw $14, %xmm1, %xmm1
	; AVX1-NEXT: vpaddw %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpaddw %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpsraw $2, %xmm1, %xmm1			; AVX1-NEXT: vpsraw $2, %xmm1, %xmm1
	Show All 33 Lines

llvm/test/CodeGen/X86/vec_shift6.ll

Show First 20 Lines • Show All 63 Lines • ▼ Show 20 Lines	; AVX-NEXT: retq
ret <4 x i32> %shl		ret <4 x i32> %shl
}		}

define <4 x i32> @test4(<4 x i32> %a) {		define <4 x i32> @test4(<4 x i32> %a) {
; SSE2-LABEL: test4:		; SSE2-LABEL: test4:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm1
; SSE2-NEXT: pslld $1, %xmm1		; SSE2-NEXT: pslld $1, %xmm1
; SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm0[0],xmm1[1]		; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,1],xmm1[2,3]
; SSE2-NEXT: movapd %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test4:		; SSE41-LABEL: test4:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movdqa %xmm0, %xmm1		; SSE41-NEXT: movdqa %xmm0, %xmm1
; SSE41-NEXT: pslld $1, %xmm1		; SSE41-NEXT: pslld $1, %xmm1
; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0,1,2,3],xmm1[4,5,6,7]		; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
; SSE41-NEXT: movdqa %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test4:		; AVX-LABEL: test4:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpsllvd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0		; AVX-NEXT: vpsllvd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
%shl = shl <4 x i32> %a, <i32 0, i32 0, i32 1, i32 1>		%shl = shl <4 x i32> %a, <i32 0, i32 0, i32 1, i32 1>
ret <4 x i32> %shl		ret <4 x i32> %shl
▲ Show 20 Lines • Show All 201 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vec_smulo.ll

	Show First 20 Lines • Show All 106 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]
	; SSE41-NEXT: pmuldq %xmm2, %xmm3			; SSE41-NEXT: pmuldq %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: pmuldq %xmm1, %xmm2			; SSE41-NEXT: pmuldq %xmm1, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]
	; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm3[2,3],xmm2[4,5],xmm3[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm3[2,3],xmm2[4,5],xmm3[6,7]
	; SSE41-NEXT: pmulld %xmm1, %xmm0			; SSE41-NEXT: pmulld %xmm1, %xmm0
	; SSE41-NEXT: movq %xmm0, (%rdi)			; SSE41-NEXT: movq %xmm0, (%rdi)
	; SSE41-NEXT: psrad $31, %xmm0			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: pcmpeqd %xmm2, %xmm0			; SSE41-NEXT: psrad $31, %xmm1
	; SSE41-NEXT: pcmpeqd %xmm1, %xmm1			; SSE41-NEXT: pcmpeqd %xmm2, %xmm1
				; SSE41-NEXT: pcmpeqd %xmm0, %xmm0
				xbolva00Unsubmitted Not Done Reply Inline Actions https://reviews.llvm.org/D52109#inline-545876 xbolva00: https://reviews.llvm.org/D52109#inline-545876
				CarrotAuthorUnsubmitted Done Reply Inline Actions With this patch, TwoAddressInstructionPass generates liveins: $xmm0, $xmm1, $rdi %2:gr64 = COPY killed $rdi %1:vr128 = COPY killed $xmm1 %0:vr128 = COPY killed $xmm0 %3:vr128 = PSHUFDri %1:vr128, -11 %4:vr128 = PSHUFDri %0:vr128, -11 %5:vr128 = COPY killed %4:vr128 %5:vr128 = PMULDQrr %5:vr128(tied-def 0), killed %3:vr128 %6:vr128 = COPY %0:vr128 %6:vr128 = PMULDQrr %6:vr128(tied-def 0), %1:vr128 %7:vr128 = PSHUFDri killed %6:vr128, -11 %8:vr128 = COPY killed %7:vr128 %8:vr128 = PBLENDWrri %8:vr128(tied-def 0), killed %5:vr128, -52 %9:vr128 = COPY killed %0:vr128 %9:vr128 = PMULLDrr %9:vr128(tied-def 0), killed %1:vr128 %10:vr128 = COPY %9:vr128 %10:vr128 = PSRADri %10:vr128(tied-def 0), 31 %11:vr128 = COPY killed %10:vr128 %11:vr128 = PCMPEQDrr %11:vr128(tied-def 0), killed %8:vr128 %12:vr128 = V_SETALLONES %13:vr128 = COPY killed %12:vr128 %13:vr128 = PXORrr %13:vr128(tied-def 0), killed %11:vr128 MOVPQI2QImr killed %2:gr64, 1, $noreg, 0, $noreg, killed %9:vr128 :: (store (s64) into %ir.p2) $xmm0 = COPY killed %13:vr128 RET 0, killed $xmm0 Without this patch, TwoAddressInstructionPass generates: liveins: $xmm0, $xmm1, $rdi %2:gr64 = COPY killed $rdi %1:vr128 = COPY killed $xmm1 %0:vr128 = COPY killed $xmm0 %3:vr128 = PSHUFDri %1:vr128, -11 %4:vr128 = PSHUFDri %0:vr128, -11 %5:vr128 = COPY killed %4:vr128 %5:vr128 = PMULDQrr %5:vr128(tied-def 0), killed %3:vr128 %6:vr128 = COPY %0:vr128 %6:vr128 = PMULDQrr %6:vr128(tied-def 0), %1:vr128 %7:vr128 = PSHUFDri killed %6:vr128, -11 %8:vr128 = COPY killed %7:vr128 %8:vr128 = PBLENDWrri %8:vr128(tied-def 0), killed %5:vr128, -52 %9:vr128 = COPY killed %0:vr128 %9:vr128 = PMULLDrr %9:vr128(tied-def 0), killed %1:vr128 %10:vr128 = COPY %9:vr128 %10:vr128 = PSRADri %10:vr128(tied-def 0), 31 %11:vr128 = COPY killed %10:vr128 %11:vr128 = PCMPEQDrr %11:vr128(tied-def 0), killed %8:vr128 %12:vr128 = V_SETALLONES %13:vr128 = COPY killed %11:vr128 %13:vr128 = PXORrr %13:vr128(tied-def 0), killed %12:vr128 MOVPQI2QImr killed %2:gr64, 1, $noreg, 0, $noreg, killed %9:vr128 :: (store (s64) into %ir.p2) $xmm0 = COPY killed %13:vr128 RET 0, killed $xmm0 The only difference is the PXOR instruction and related COPY. The operands order(commuting decision) of PXOR is actually impacted the mapping of SrcRegMap[%10] = %9. In this instruction sequence, the old result is worse. Here we have SrcRegMap[%9] = xmm0, it lives until the memory store, so %10 must be assigned to a different physical register, and the COPY is a real one. And later %10 must be copied back to xmm0. In the new result, the %9 -> %10 is also a real copy, but the last %13 -> xmm0 COPY can be removed because %13 can be assigned to xmm0. What makes the old result generate better final instructions? The answer is instruction scheduling. The memory store is moved before the %9 -> %10 copy, so in the COPY %9 is the last use, can be coalesced with %10 and assigned to xmm0, then both COPY instructions are removed. So the better old result is just lucky. It implies a pass order problem here, different operands are killed in different instruction sequences, it impacts the optimal commuting decisions. Carrot: With this patch, TwoAddressInstructionPass generates ``` liveins: $xmm0, $xmm1, $rdi %2…
	; SSE41-NEXT: pxor %xmm1, %xmm0			; SSE41-NEXT: pxor %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: smulo_v2i32:			; AVX1-LABEL: smulo_v2i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm1[1,1,3,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm1[1,1,3,3]
	; AVX1-NEXT: vpshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]
	; AVX1-NEXT: vpmuldq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpmuldq %xmm2, %xmm3, %xmm2
	▲ Show 20 Lines • Show All 115 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pmuldq %xmm2, %xmm3			; SSE41-NEXT: pmuldq %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: pmuldq %xmm1, %xmm2			; SSE41-NEXT: pmuldq %xmm1, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]
	; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm3[2,3],xmm2[4,5],xmm3[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm3[2,3],xmm2[4,5],xmm3[6,7]
	; SSE41-NEXT: pmulld %xmm1, %xmm0			; SSE41-NEXT: pmulld %xmm1, %xmm0
	; SSE41-NEXT: pextrd $2, %xmm0, 8(%rdi)			; SSE41-NEXT: pextrd $2, %xmm0, 8(%rdi)
	; SSE41-NEXT: movq %xmm0, (%rdi)			; SSE41-NEXT: movq %xmm0, (%rdi)
	; SSE41-NEXT: psrad $31, %xmm0			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: pcmpeqd %xmm2, %xmm0			; SSE41-NEXT: psrad $31, %xmm1
	; SSE41-NEXT: pcmpeqd %xmm1, %xmm1			; SSE41-NEXT: pcmpeqd %xmm2, %xmm1
				; SSE41-NEXT: pcmpeqd %xmm0, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm0			; SSE41-NEXT: pxor %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: smulo_v3i32:			; AVX1-LABEL: smulo_v3i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm1[1,1,3,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm1[1,1,3,3]
	; AVX1-NEXT: vpshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]
	; AVX1-NEXT: vpmuldq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpmuldq %xmm2, %xmm3, %xmm2
	▲ Show 20 Lines • Show All 113 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]
	; SSE41-NEXT: pmuldq %xmm2, %xmm3			; SSE41-NEXT: pmuldq %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: pmuldq %xmm1, %xmm2			; SSE41-NEXT: pmuldq %xmm1, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]
	; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm3[2,3],xmm2[4,5],xmm3[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm3[2,3],xmm2[4,5],xmm3[6,7]
	; SSE41-NEXT: pmulld %xmm1, %xmm0			; SSE41-NEXT: pmulld %xmm1, %xmm0
	; SSE41-NEXT: movdqa %xmm0, (%rdi)			; SSE41-NEXT: movdqa %xmm0, (%rdi)
	; SSE41-NEXT: psrad $31, %xmm0			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: pcmpeqd %xmm2, %xmm0			; SSE41-NEXT: psrad $31, %xmm1
	; SSE41-NEXT: pcmpeqd %xmm1, %xmm1			; SSE41-NEXT: pcmpeqd %xmm2, %xmm1
				; SSE41-NEXT: pcmpeqd %xmm0, %xmm0
	; SSE41-NEXT: pxor %xmm1, %xmm0			; SSE41-NEXT: pxor %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: smulo_v4i32:			; AVX1-LABEL: smulo_v4i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm1[1,1,3,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm2 = xmm1[1,1,3,3]
	; AVX1-NEXT: vpshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]
	; AVX1-NEXT: vpmuldq %xmm2, %xmm3, %xmm2			; AVX1-NEXT: vpmuldq %xmm2, %xmm3, %xmm2
	▲ Show 20 Lines • Show All 2,697 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[1,1,3,3]
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]
	; SSE41-NEXT: pmuldq %xmm2, %xmm3			; SSE41-NEXT: pmuldq %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: pmuldq %xmm1, %xmm2			; SSE41-NEXT: pmuldq %xmm1, %xmm2
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]
	; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm3[2,3],xmm2[4,5],xmm3[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm3[2,3],xmm2[4,5],xmm3[6,7]
	; SSE41-NEXT: pmulld %xmm0, %xmm1			; SSE41-NEXT: pmulld %xmm0, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pslld $8, %xmm3			; SSE41-NEXT: pslld $8, %xmm0
	; SSE41-NEXT: psrad $8, %xmm3			; SSE41-NEXT: psrad $8, %xmm0
	; SSE41-NEXT: pcmpeqd %xmm1, %xmm3			; SSE41-NEXT: pcmpeqd %xmm1, %xmm0
	; SSE41-NEXT: pextrd $3, %xmm1, %eax			; SSE41-NEXT: pextrd $3, %xmm1, %eax
	; SSE41-NEXT: pextrd $2, %xmm1, %ecx			; SSE41-NEXT: pextrd $2, %xmm1, %ecx
	; SSE41-NEXT: pextrd $1, %xmm1, %edx			; SSE41-NEXT: pextrd $1, %xmm1, %edx
	; SSE41-NEXT: movd %xmm1, %esi			; SSE41-NEXT: movd %xmm1, %esi
	; SSE41-NEXT: psrad $31, %xmm1			; SSE41-NEXT: psrad $31, %xmm1
	; SSE41-NEXT: pcmpeqd %xmm2, %xmm1			; SSE41-NEXT: pcmpeqd %xmm2, %xmm1
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm0			; SSE41-NEXT: pcmpeqd %xmm2, %xmm2
	; SSE41-NEXT: pxor %xmm0, %xmm1			; SSE41-NEXT: pxor %xmm2, %xmm1
	; SSE41-NEXT: pxor %xmm3, %xmm0			; SSE41-NEXT: pxor %xmm2, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: movw %ax, 9(%rdi)			; SSE41-NEXT: movw %ax, 9(%rdi)
	; SSE41-NEXT: movw %cx, 6(%rdi)			; SSE41-NEXT: movw %cx, 6(%rdi)
	; SSE41-NEXT: movw %dx, 3(%rdi)			; SSE41-NEXT: movw %dx, 3(%rdi)
	; SSE41-NEXT: movw %si, (%rdi)			; SSE41-NEXT: movw %si, (%rdi)
	; SSE41-NEXT: shrl $16, %eax			; SSE41-NEXT: shrl $16, %eax
	; SSE41-NEXT: movb %al, 11(%rdi)			; SSE41-NEXT: movb %al, 11(%rdi)
	; SSE41-NEXT: shrl $16, %ecx			; SSE41-NEXT: shrl $16, %ecx
	▲ Show 20 Lines • Show All 1,028 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vec_ssubo.ll

	Show First 20 Lines • Show All 820 Lines • ▼ Show 20 Lines
	; SSE2-LABEL: ssubo_v4i24:			; SSE2-LABEL: ssubo_v4i24:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa %xmm0, %xmm2			; SSE2-NEXT: movdqa %xmm0, %xmm2
	; SSE2-NEXT: pslld $8, %xmm1			; SSE2-NEXT: pslld $8, %xmm1
	; SSE2-NEXT: psrad $8, %xmm1			; SSE2-NEXT: psrad $8, %xmm1
	; SSE2-NEXT: pslld $8, %xmm2			; SSE2-NEXT: pslld $8, %xmm2
	; SSE2-NEXT: psrad $8, %xmm2			; SSE2-NEXT: psrad $8, %xmm2
	; SSE2-NEXT: psubd %xmm1, %xmm2			; SSE2-NEXT: psubd %xmm1, %xmm2
	; SSE2-NEXT: movdqa %xmm2, %xmm0			; SSE2-NEXT: movdqa %xmm2, %xmm1
	; SSE2-NEXT: pslld $8, %xmm0			; SSE2-NEXT: pslld $8, %xmm1
	; SSE2-NEXT: psrad $8, %xmm0			; SSE2-NEXT: psrad $8, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm2, %xmm0			; SSE2-NEXT: pcmpeqd %xmm2, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm1			; SSE2-NEXT: pcmpeqd %xmm0, %xmm0
	; SSE2-NEXT: pxor %xmm1, %xmm0			; SSE2-NEXT: pxor %xmm1, %xmm0
	; SSE2-NEXT: movd %xmm2, %eax			; SSE2-NEXT: movd %xmm2, %eax
	; SSE2-NEXT: movw %ax, (%rdi)			; SSE2-NEXT: movw %ax, (%rdi)
	; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm2[3,3,3,3]			; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm2[3,3,3,3]
	; SSE2-NEXT: movd %xmm1, %ecx			; SSE2-NEXT: movd %xmm1, %ecx
	; SSE2-NEXT: movw %cx, 9(%rdi)			; SSE2-NEXT: movw %cx, 9(%rdi)
	; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm2[2,3,2,3]			; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm2[2,3,2,3]
	; SSE2-NEXT: movd %xmm1, %edx			; SSE2-NEXT: movd %xmm1, %edx
	Show All 14 Lines
	; SSSE3-LABEL: ssubo_v4i24:			; SSSE3-LABEL: ssubo_v4i24:
	; SSSE3: # %bb.0:			; SSSE3: # %bb.0:
	; SSSE3-NEXT: movdqa %xmm0, %xmm2			; SSSE3-NEXT: movdqa %xmm0, %xmm2
	; SSSE3-NEXT: pslld $8, %xmm1			; SSSE3-NEXT: pslld $8, %xmm1
	; SSSE3-NEXT: psrad $8, %xmm1			; SSSE3-NEXT: psrad $8, %xmm1
	; SSSE3-NEXT: pslld $8, %xmm2			; SSSE3-NEXT: pslld $8, %xmm2
	; SSSE3-NEXT: psrad $8, %xmm2			; SSSE3-NEXT: psrad $8, %xmm2
	; SSSE3-NEXT: psubd %xmm1, %xmm2			; SSSE3-NEXT: psubd %xmm1, %xmm2
	; SSSE3-NEXT: movdqa %xmm2, %xmm0			; SSSE3-NEXT: movdqa %xmm2, %xmm1
	; SSSE3-NEXT: pslld $8, %xmm0			; SSSE3-NEXT: pslld $8, %xmm1
	; SSSE3-NEXT: psrad $8, %xmm0			; SSSE3-NEXT: psrad $8, %xmm1
	; SSSE3-NEXT: pcmpeqd %xmm2, %xmm0			; SSSE3-NEXT: pcmpeqd %xmm2, %xmm1
	; SSSE3-NEXT: pcmpeqd %xmm1, %xmm1			; SSSE3-NEXT: pcmpeqd %xmm0, %xmm0
	; SSSE3-NEXT: pxor %xmm1, %xmm0			; SSSE3-NEXT: pxor %xmm1, %xmm0
	; SSSE3-NEXT: movd %xmm2, %eax			; SSSE3-NEXT: movd %xmm2, %eax
	; SSSE3-NEXT: movw %ax, (%rdi)			; SSSE3-NEXT: movw %ax, (%rdi)
	; SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm2[3,3,3,3]			; SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm2[3,3,3,3]
	; SSSE3-NEXT: movd %xmm1, %ecx			; SSSE3-NEXT: movd %xmm1, %ecx
	; SSSE3-NEXT: movw %cx, 9(%rdi)			; SSSE3-NEXT: movw %cx, 9(%rdi)
	; SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm2[2,3,2,3]			; SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm2[2,3,2,3]
	; SSSE3-NEXT: movd %xmm1, %edx			; SSSE3-NEXT: movd %xmm1, %edx
	; SSSE3-NEXT: movw %dx, 6(%rdi)			; SSSE3-NEXT: movw %dx, 6(%rdi)
	; SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm2[1,1,1,1]			; SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm2[1,1,1,1]
	; SSSE3-NEXT: movd %xmm1, %esi			; SSSE3-NEXT: movd %xmm1, %esi
	; SSSE3-NEXT: movw %si, 3(%rdi)			; SSSE3-NEXT: movw %si, 3(%rdi)
	; SSSE3-NEXT: shrl $16, %eax			; SSSE3-NEXT: shrl $16, %eax
	; SSSE3-NEXT: movb %al, 2(%rdi)			; SSSE3-NEXT: movb %al, 2(%rdi)
	; SSSE3-NEXT: shrl $16, %ecx			; SSSE3-NEXT: shrl $16, %ecx
	; SSSE3-NEXT: movb %cl, 11(%rdi)			; SSSE3-NEXT: movb %cl, 11(%rdi)
	; SSSE3-NEXT: shrl $16, %edx			; SSSE3-NEXT: shrl $16, %edx
	; SSSE3-NEXT: movb %dl, 8(%rdi)			; SSSE3-NEXT: movb %dl, 8(%rdi)
	; SSSE3-NEXT: shrl $16, %esi			; SSSE3-NEXT: shrl $16, %esi
	; SSSE3-NEXT: movb %sil, 5(%rdi)			; SSSE3-NEXT: movb %sil, 5(%rdi)
	; SSSE3-NEXT: retq			; SSSE3-NEXT: retq
	;			;
	; SSE41-LABEL: ssubo_v4i24:			; SSE41-LABEL: ssubo_v4i24:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: pslld $8, %xmm1			; SSE41-NEXT: pslld $8, %xmm1
	; SSE41-NEXT: psrad $8, %xmm1			; SSE41-NEXT: psrad $8, %xmm1
	; SSE41-NEXT: pslld $8, %xmm2
	; SSE41-NEXT: psrad $8, %xmm2
	; SSE41-NEXT: psubd %xmm1, %xmm2
	; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pslld $8, %xmm0			; SSE41-NEXT: pslld $8, %xmm0
	; SSE41-NEXT: psrad $8, %xmm0			; SSE41-NEXT: psrad $8, %xmm0
	; SSE41-NEXT: pcmpeqd %xmm2, %xmm0			; SSE41-NEXT: psubd %xmm1, %xmm0
				; SSE41-NEXT: movdqa %xmm0, %xmm2
				; SSE41-NEXT: pslld $8, %xmm2
				; SSE41-NEXT: psrad $8, %xmm2
				; SSE41-NEXT: pcmpeqd %xmm0, %xmm2
	; SSE41-NEXT: pcmpeqd %xmm1, %xmm1			; SSE41-NEXT: pcmpeqd %xmm1, %xmm1
	; SSE41-NEXT: pxor %xmm1, %xmm0			; SSE41-NEXT: pxor %xmm2, %xmm1
	; SSE41-NEXT: pextrd $3, %xmm2, %eax			; SSE41-NEXT: pextrd $3, %xmm0, %eax
	; SSE41-NEXT: movw %ax, 9(%rdi)			; SSE41-NEXT: movw %ax, 9(%rdi)
	; SSE41-NEXT: pextrd $2, %xmm2, %ecx			; SSE41-NEXT: pextrd $2, %xmm0, %ecx
	; SSE41-NEXT: movw %cx, 6(%rdi)			; SSE41-NEXT: movw %cx, 6(%rdi)
	; SSE41-NEXT: pextrd $1, %xmm2, %edx			; SSE41-NEXT: pextrd $1, %xmm0, %edx
	; SSE41-NEXT: movw %dx, 3(%rdi)			; SSE41-NEXT: movw %dx, 3(%rdi)
	; SSE41-NEXT: movd %xmm2, %esi			; SSE41-NEXT: movd %xmm0, %esi
	; SSE41-NEXT: movw %si, (%rdi)			; SSE41-NEXT: movw %si, (%rdi)
	; SSE41-NEXT: shrl $16, %eax			; SSE41-NEXT: shrl $16, %eax
	; SSE41-NEXT: movb %al, 11(%rdi)			; SSE41-NEXT: movb %al, 11(%rdi)
	; SSE41-NEXT: shrl $16, %ecx			; SSE41-NEXT: shrl $16, %ecx
	; SSE41-NEXT: movb %cl, 8(%rdi)			; SSE41-NEXT: movb %cl, 8(%rdi)
	; SSE41-NEXT: shrl $16, %edx			; SSE41-NEXT: shrl $16, %edx
	; SSE41-NEXT: movb %dl, 5(%rdi)			; SSE41-NEXT: movb %dl, 5(%rdi)
	; SSE41-NEXT: shrl $16, %esi			; SSE41-NEXT: shrl $16, %esi
	; SSE41-NEXT: movb %sil, 2(%rdi)			; SSE41-NEXT: movb %sil, 2(%rdi)
				; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: ssubo_v4i24:			; AVX-LABEL: ssubo_v4i24:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpslld $8, %xmm1, %xmm1			; AVX-NEXT: vpslld $8, %xmm1, %xmm1
	; AVX-NEXT: vpsrad $8, %xmm1, %xmm1			; AVX-NEXT: vpsrad $8, %xmm1, %xmm1
	; AVX-NEXT: vpslld $8, %xmm0, %xmm0			; AVX-NEXT: vpslld $8, %xmm0, %xmm0
	; AVX-NEXT: vpsrad $8, %xmm0, %xmm0			; AVX-NEXT: vpsrad $8, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; SSE-NEXT: psrad $31, %xmm1			; SSE-NEXT: psrad $31, %xmm1
	; SSE-NEXT: pslld $31, %xmm0			; SSE-NEXT: pslld $31, %xmm0
	; SSE-NEXT: psrad $31, %xmm0			; SSE-NEXT: psrad $31, %xmm0
	; SSE-NEXT: psubd %xmm1, %xmm0			; SSE-NEXT: psubd %xmm1, %xmm0
	; SSE-NEXT: movdqa %xmm0, %xmm1			; SSE-NEXT: movdqa %xmm0, %xmm1
	; SSE-NEXT: pslld $31, %xmm1			; SSE-NEXT: pslld $31, %xmm1
	; SSE-NEXT: movmskps %xmm1, %eax			; SSE-NEXT: movmskps %xmm1, %eax
	; SSE-NEXT: psrad $31, %xmm1			; SSE-NEXT: psrad $31, %xmm1
	; SSE-NEXT: pcmpeqd %xmm0, %xmm1			; SSE-NEXT: pcmpeqd %xmm1, %xmm0
	; SSE-NEXT: pcmpeqd %xmm0, %xmm0			; SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; SSE-NEXT: pxor %xmm0, %xmm1			; SSE-NEXT: pxor %xmm1, %xmm0
	; SSE-NEXT: movb %al, (%rdi)			; SSE-NEXT: movb %al, (%rdi)
	; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: ssubo_v4i1:			; AVX-LABEL: ssubo_v4i1:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpslld $31, %xmm1, %xmm1			; AVX-NEXT: vpslld $31, %xmm1, %xmm1
	; AVX-NEXT: vpsrad $31, %xmm1, %xmm1			; AVX-NEXT: vpsrad $31, %xmm1, %xmm1
	; AVX-NEXT: vpslld $31, %xmm0, %xmm0			; AVX-NEXT: vpslld $31, %xmm0, %xmm0
	; AVX-NEXT: vpsrad $31, %xmm0, %xmm0			; AVX-NEXT: vpsrad $31, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 148 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vec_umulo.ll

	Show First 20 Lines • Show All 2,734 Lines • ▼ Show 20 Lines
	; SSSE3-NEXT: shrl $16, %edx			; SSSE3-NEXT: shrl $16, %edx
	; SSSE3-NEXT: movb %dl, 5(%rdi)			; SSSE3-NEXT: movb %dl, 5(%rdi)
	; SSSE3-NEXT: shrl $16, %eax			; SSSE3-NEXT: shrl $16, %eax
	; SSSE3-NEXT: movb %al, 11(%rdi)			; SSSE3-NEXT: movb %al, 11(%rdi)
	; SSSE3-NEXT: retq			; SSSE3-NEXT: retq
	;			;
	; SSE41-LABEL: umulo_v4i24:			; SSE41-LABEL: umulo_v4i24:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
				; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [255,255,255,0,255,255,255,0,255,255,255,0,255,255,255,0]
				; SSE41-NEXT: pand %xmm2, %xmm0
				; SSE41-NEXT: pand %xmm2, %xmm1
				; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[1,1,3,3]
				; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]
				; SSE41-NEXT: pmuludq %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [255,255,255,0,255,255,255,0,255,255,255,0,255,255,255,0]			; SSE41-NEXT: pmuludq %xmm1, %xmm2
	; SSE41-NEXT: pand %xmm0, %xmm2			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]
	; SSE41-NEXT: pand %xmm0, %xmm1			; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm3[2,3],xmm2[4,5],xmm3[6,7]
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[1,1,3,3]
	; SSE41-NEXT: pmuludq %xmm0, %xmm3
	; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pmuludq %xmm1, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]
	; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm4[0,1],xmm3[2,3],xmm4[4,5],xmm3[6,7]
	; SSE41-NEXT: pxor %xmm3, %xmm3			; SSE41-NEXT: pxor %xmm3, %xmm3
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm4			; SSE41-NEXT: pcmpeqd %xmm3, %xmm2
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm0			; SSE41-NEXT: pcmpeqd %xmm4, %xmm4
	; SSE41-NEXT: pxor %xmm4, %xmm0			; SSE41-NEXT: pxor %xmm2, %xmm4
	; SSE41-NEXT: pmulld %xmm2, %xmm1			; SSE41-NEXT: pmulld %xmm0, %xmm1
	; SSE41-NEXT: pextrd $3, %xmm1, %eax			; SSE41-NEXT: pextrd $3, %xmm1, %eax
	; SSE41-NEXT: pextrd $2, %xmm1, %ecx			; SSE41-NEXT: pextrd $2, %xmm1, %ecx
	; SSE41-NEXT: pextrd $1, %xmm1, %edx			; SSE41-NEXT: pextrd $1, %xmm1, %edx
	; SSE41-NEXT: movd %xmm1, %esi			; SSE41-NEXT: movd %xmm1, %esi
	; SSE41-NEXT: psrld $24, %xmm1			; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm1			; SSE41-NEXT: psrld $24, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: pcmpgtd %xmm3, %xmm0
				; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: movw %ax, 9(%rdi)			; SSE41-NEXT: movw %ax, 9(%rdi)
	; SSE41-NEXT: movw %cx, 6(%rdi)			; SSE41-NEXT: movw %cx, 6(%rdi)
	; SSE41-NEXT: movw %dx, 3(%rdi)			; SSE41-NEXT: movw %dx, 3(%rdi)
	; SSE41-NEXT: movw %si, (%rdi)			; SSE41-NEXT: movw %si, (%rdi)
	; SSE41-NEXT: shrl $16, %eax			; SSE41-NEXT: shrl $16, %eax
	; SSE41-NEXT: movb %al, 11(%rdi)			; SSE41-NEXT: movb %al, 11(%rdi)
	; SSE41-NEXT: shrl $16, %ecx			; SSE41-NEXT: shrl $16, %ecx
	; SSE41-NEXT: movb %cl, 8(%rdi)			; SSE41-NEXT: movb %cl, 8(%rdi)
	▲ Show 20 Lines • Show All 633 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-bitreverse.ll

	Show All 13 Lines
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw,+gfni \| FileCheck %s --check-prefix=ALL --check-prefix=GFNIAVX512BW			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw,+gfni \| FileCheck %s --check-prefix=ALL --check-prefix=GFNIAVX512BW

	; Make sure we don't crash with avx512bw and xop			; Make sure we don't crash with avx512bw and xop
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+xop,+avx512bw			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+xop,+avx512bw

	define i8 @test_bitreverse_i8(i8 %a) nounwind {			define i8 @test_bitreverse_i8(i8 %a) nounwind {
	; SSE-LABEL: test_bitreverse_i8:			; SSE-LABEL: test_bitreverse_i8:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: # kill: def $edi killed $edi def $rdi
	; SSE-NEXT: rolb $4, %dil			; SSE-NEXT: rolb $4, %dil
	; SSE-NEXT: movl %edi, %eax			; SSE-NEXT: movl %edi, %eax
	; SSE-NEXT: andb $51, %al			; SSE-NEXT: andb $51, %al
	; SSE-NEXT: shlb $2, %al			; SSE-NEXT: shlb $2, %al
	; SSE-NEXT: shrb $2, %dil			; SSE-NEXT: shrb $2, %dil
	; SSE-NEXT: andb $51, %dil			; SSE-NEXT: andb $51, %dil
	; SSE-NEXT: orb %al, %dil			; SSE-NEXT: orb %al, %dil
	; SSE-NEXT: movl %edi, %eax			; SSE-NEXT: movl %edi, %eax
	; SSE-NEXT: andb $85, %al			; SSE-NEXT: andb $85, %al
	; SSE-NEXT: addb %al, %al			; SSE-NEXT: addb %al, %al
	; SSE-NEXT: shrb %dil			; SSE-NEXT: shrb %dil
	; SSE-NEXT: andb $85, %dil			; SSE-NEXT: andb $85, %dil
	; SSE-NEXT: addl %edi, %eax			; SSE-NEXT: orb %dil, %al
	; SSE-NEXT: # kill: def $al killed $al killed $eax
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_bitreverse_i8:			; AVX-LABEL: test_bitreverse_i8:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: # kill: def $edi killed $edi def $rdi
	; AVX-NEXT: rolb $4, %dil			; AVX-NEXT: rolb $4, %dil
	; AVX-NEXT: movl %edi, %eax			; AVX-NEXT: movl %edi, %eax
	; AVX-NEXT: andb $51, %al			; AVX-NEXT: andb $51, %al
	; AVX-NEXT: shlb $2, %al			; AVX-NEXT: shlb $2, %al
	; AVX-NEXT: shrb $2, %dil			; AVX-NEXT: shrb $2, %dil
	; AVX-NEXT: andb $51, %dil			; AVX-NEXT: andb $51, %dil
	; AVX-NEXT: orb %al, %dil			; AVX-NEXT: orb %al, %dil
	; AVX-NEXT: movl %edi, %eax			; AVX-NEXT: movl %edi, %eax
	; AVX-NEXT: andb $85, %al			; AVX-NEXT: andb $85, %al
	; AVX-NEXT: addb %al, %al			; AVX-NEXT: addb %al, %al
	; AVX-NEXT: shrb %dil			; AVX-NEXT: shrb %dil
	; AVX-NEXT: andb $85, %dil			; AVX-NEXT: andb $85, %dil
	; AVX-NEXT: addl %edi, %eax			; AVX-NEXT: orb %dil, %al
	; AVX-NEXT: # kill: def $al killed $al killed $eax
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; XOP-LABEL: test_bitreverse_i8:			; XOP-LABEL: test_bitreverse_i8:
	; XOP: # %bb.0:			; XOP: # %bb.0:
	; XOP-NEXT: vmovd %edi, %xmm0			; XOP-NEXT: vmovd %edi, %xmm0
	; XOP-NEXT: vpperm {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0, %xmm0			; XOP-NEXT: vpperm {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0, %xmm0
	; XOP-NEXT: vmovd %xmm0, %eax			; XOP-NEXT: vmovd %xmm0, %eax
	; XOP-NEXT: # kill: def $al killed $al killed $eax			; XOP-NEXT: # kill: def $al killed $al killed $eax
	; XOP-NEXT: retq			; XOP-NEXT: retq
	;			;
	; GFNISSE-LABEL: test_bitreverse_i8:			; GFNISSE-LABEL: test_bitreverse_i8:
	; GFNISSE: # %bb.0:			; GFNISSE: # %bb.0:
	; GFNISSE-NEXT: # kill: def $edi killed $edi def $rdi
	; GFNISSE-NEXT: rolb $4, %dil			; GFNISSE-NEXT: rolb $4, %dil
	; GFNISSE-NEXT: movl %edi, %eax			; GFNISSE-NEXT: movl %edi, %eax
	; GFNISSE-NEXT: andb $51, %al			; GFNISSE-NEXT: andb $51, %al
	; GFNISSE-NEXT: shlb $2, %al			; GFNISSE-NEXT: shlb $2, %al
	; GFNISSE-NEXT: shrb $2, %dil			; GFNISSE-NEXT: shrb $2, %dil
	; GFNISSE-NEXT: andb $51, %dil			; GFNISSE-NEXT: andb $51, %dil
	; GFNISSE-NEXT: orb %al, %dil			; GFNISSE-NEXT: orb %al, %dil
	; GFNISSE-NEXT: movl %edi, %eax			; GFNISSE-NEXT: movl %edi, %eax
	; GFNISSE-NEXT: andb $85, %al			; GFNISSE-NEXT: andb $85, %al
	; GFNISSE-NEXT: addb %al, %al			; GFNISSE-NEXT: addb %al, %al
	; GFNISSE-NEXT: shrb %dil			; GFNISSE-NEXT: shrb %dil
	; GFNISSE-NEXT: andb $85, %dil			; GFNISSE-NEXT: andb $85, %dil
	; GFNISSE-NEXT: addl %edi, %eax			; GFNISSE-NEXT: orb %dil, %al
	; GFNISSE-NEXT: # kill: def $al killed $al killed $eax
	; GFNISSE-NEXT: retq			; GFNISSE-NEXT: retq
	;			;
	; GFNIAVX-LABEL: test_bitreverse_i8:			; GFNIAVX-LABEL: test_bitreverse_i8:
	; GFNIAVX: # %bb.0:			; GFNIAVX: # %bb.0:
	; GFNIAVX-NEXT: # kill: def $edi killed $edi def $rdi
	; GFNIAVX-NEXT: rolb $4, %dil			; GFNIAVX-NEXT: rolb $4, %dil
	; GFNIAVX-NEXT: movl %edi, %eax			; GFNIAVX-NEXT: movl %edi, %eax
	; GFNIAVX-NEXT: andb $51, %al			; GFNIAVX-NEXT: andb $51, %al
	; GFNIAVX-NEXT: shlb $2, %al			; GFNIAVX-NEXT: shlb $2, %al
	; GFNIAVX-NEXT: shrb $2, %dil			; GFNIAVX-NEXT: shrb $2, %dil
	; GFNIAVX-NEXT: andb $51, %dil			; GFNIAVX-NEXT: andb $51, %dil
	; GFNIAVX-NEXT: orb %al, %dil			; GFNIAVX-NEXT: orb %al, %dil
	; GFNIAVX-NEXT: movl %edi, %eax			; GFNIAVX-NEXT: movl %edi, %eax
	; GFNIAVX-NEXT: andb $85, %al			; GFNIAVX-NEXT: andb $85, %al
	; GFNIAVX-NEXT: addb %al, %al			; GFNIAVX-NEXT: addb %al, %al
	; GFNIAVX-NEXT: shrb %dil			; GFNIAVX-NEXT: shrb %dil
	; GFNIAVX-NEXT: andb $85, %dil			; GFNIAVX-NEXT: andb $85, %dil
	; GFNIAVX-NEXT: addl %edi, %eax			; GFNIAVX-NEXT: orb %dil, %al
	; GFNIAVX-NEXT: # kill: def $al killed $al killed $eax
	; GFNIAVX-NEXT: retq			; GFNIAVX-NEXT: retq
	;			;
	; GFNIAVX2-LABEL: test_bitreverse_i8:			; GFNIAVX2-LABEL: test_bitreverse_i8:
	; GFNIAVX2: # %bb.0:			; GFNIAVX2: # %bb.0:
	; GFNIAVX2-NEXT: # kill: def $edi killed $edi def $rdi
	; GFNIAVX2-NEXT: rolb $4, %dil			; GFNIAVX2-NEXT: rolb $4, %dil
	; GFNIAVX2-NEXT: movl %edi, %eax			; GFNIAVX2-NEXT: movl %edi, %eax
	; GFNIAVX2-NEXT: andb $51, %al			; GFNIAVX2-NEXT: andb $51, %al
	; GFNIAVX2-NEXT: shlb $2, %al			; GFNIAVX2-NEXT: shlb $2, %al
	; GFNIAVX2-NEXT: shrb $2, %dil			; GFNIAVX2-NEXT: shrb $2, %dil
	; GFNIAVX2-NEXT: andb $51, %dil			; GFNIAVX2-NEXT: andb $51, %dil
	; GFNIAVX2-NEXT: orb %al, %dil			; GFNIAVX2-NEXT: orb %al, %dil
	; GFNIAVX2-NEXT: movl %edi, %eax			; GFNIAVX2-NEXT: movl %edi, %eax
	; GFNIAVX2-NEXT: andb $85, %al			; GFNIAVX2-NEXT: andb $85, %al
	; GFNIAVX2-NEXT: addb %al, %al			; GFNIAVX2-NEXT: addb %al, %al
	; GFNIAVX2-NEXT: shrb %dil			; GFNIAVX2-NEXT: shrb %dil
	; GFNIAVX2-NEXT: andb $85, %dil			; GFNIAVX2-NEXT: andb $85, %dil
	; GFNIAVX2-NEXT: addl %edi, %eax			; GFNIAVX2-NEXT: orb %dil, %al
	; GFNIAVX2-NEXT: # kill: def $al killed $al killed $eax
	; GFNIAVX2-NEXT: retq			; GFNIAVX2-NEXT: retq
	;			;
	; GFNIAVX512F-LABEL: test_bitreverse_i8:			; GFNIAVX512F-LABEL: test_bitreverse_i8:
	; GFNIAVX512F: # %bb.0:			; GFNIAVX512F: # %bb.0:
	; GFNIAVX512F-NEXT: # kill: def $edi killed $edi def $rdi
	; GFNIAVX512F-NEXT: rolb $4, %dil			; GFNIAVX512F-NEXT: rolb $4, %dil
	; GFNIAVX512F-NEXT: movl %edi, %eax			; GFNIAVX512F-NEXT: movl %edi, %eax
	; GFNIAVX512F-NEXT: andb $51, %al			; GFNIAVX512F-NEXT: andb $51, %al
	; GFNIAVX512F-NEXT: shlb $2, %al			; GFNIAVX512F-NEXT: shlb $2, %al
	; GFNIAVX512F-NEXT: shrb $2, %dil			; GFNIAVX512F-NEXT: shrb $2, %dil
	; GFNIAVX512F-NEXT: andb $51, %dil			; GFNIAVX512F-NEXT: andb $51, %dil
	; GFNIAVX512F-NEXT: orb %al, %dil			; GFNIAVX512F-NEXT: orb %al, %dil
	; GFNIAVX512F-NEXT: movl %edi, %eax			; GFNIAVX512F-NEXT: movl %edi, %eax
	; GFNIAVX512F-NEXT: andb $85, %al			; GFNIAVX512F-NEXT: andb $85, %al
	; GFNIAVX512F-NEXT: addb %al, %al			; GFNIAVX512F-NEXT: addb %al, %al
	; GFNIAVX512F-NEXT: shrb %dil			; GFNIAVX512F-NEXT: shrb %dil
	; GFNIAVX512F-NEXT: andb $85, %dil			; GFNIAVX512F-NEXT: andb $85, %dil
	; GFNIAVX512F-NEXT: addl %edi, %eax			; GFNIAVX512F-NEXT: orb %dil, %al
	; GFNIAVX512F-NEXT: # kill: def $al killed $al killed $eax
	; GFNIAVX512F-NEXT: retq			; GFNIAVX512F-NEXT: retq
	;			;
	; GFNIAVX512BW-LABEL: test_bitreverse_i8:			; GFNIAVX512BW-LABEL: test_bitreverse_i8:
	; GFNIAVX512BW: # %bb.0:			; GFNIAVX512BW: # %bb.0:
	; GFNIAVX512BW-NEXT: # kill: def $edi killed $edi def $rdi
	; GFNIAVX512BW-NEXT: rolb $4, %dil			; GFNIAVX512BW-NEXT: rolb $4, %dil
	; GFNIAVX512BW-NEXT: movl %edi, %eax			; GFNIAVX512BW-NEXT: movl %edi, %eax
	; GFNIAVX512BW-NEXT: andb $51, %al			; GFNIAVX512BW-NEXT: andb $51, %al
	; GFNIAVX512BW-NEXT: shlb $2, %al			; GFNIAVX512BW-NEXT: shlb $2, %al
	; GFNIAVX512BW-NEXT: shrb $2, %dil			; GFNIAVX512BW-NEXT: shrb $2, %dil
	; GFNIAVX512BW-NEXT: andb $51, %dil			; GFNIAVX512BW-NEXT: andb $51, %dil
	; GFNIAVX512BW-NEXT: orb %al, %dil			; GFNIAVX512BW-NEXT: orb %al, %dil
	; GFNIAVX512BW-NEXT: movl %edi, %eax			; GFNIAVX512BW-NEXT: movl %edi, %eax
	; GFNIAVX512BW-NEXT: andb $85, %al			; GFNIAVX512BW-NEXT: andb $85, %al
	; GFNIAVX512BW-NEXT: addb %al, %al			; GFNIAVX512BW-NEXT: addb %al, %al
	; GFNIAVX512BW-NEXT: shrb %dil			; GFNIAVX512BW-NEXT: shrb %dil
	; GFNIAVX512BW-NEXT: andb $85, %dil			; GFNIAVX512BW-NEXT: andb $85, %dil
	; GFNIAVX512BW-NEXT: addl %edi, %eax			; GFNIAVX512BW-NEXT: orb %dil, %al
	; GFNIAVX512BW-NEXT: # kill: def $al killed $al killed $eax
	; GFNIAVX512BW-NEXT: retq			; GFNIAVX512BW-NEXT: retq
	%b = call i8 @llvm.bitreverse.i8(i8 %a)			%b = call i8 @llvm.bitreverse.i8(i8 %a)
	ret i8 %b			ret i8 %b
	}			}

	define i16 @test_bitreverse_i16(i16 %a) nounwind {			define i16 @test_bitreverse_i16(i16 %a) nounwind {
	; SSE-LABEL: test_bitreverse_i16:			; SSE-LABEL: test_bitreverse_i16:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	▲ Show 20 Lines • Show All 3,226 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-ext-logic.ll

Show First 20 Lines • Show All 342 Lines • ▼ Show 20 Lines	; AVX2-NEXT: retq
%yz = zext <8 x i1> %y to <8 x i32>		%yz = zext <8 x i1> %y to <8 x i32>
%r = xor <8 x i32> %xz, %yz		%r = xor <8 x i32> %xz, %yz
ret <8 x i32> %r		ret <8 x i32> %r
}		}

define <8 x i32> @bool_sext_and(<8 x i1> %x, <8 x i1> %y) {		define <8 x i32> @bool_sext_and(<8 x i1> %x, <8 x i1> %y) {
; SSE2-LABEL: bool_sext_and:		; SSE2-LABEL: bool_sext_and:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa %xmm1, %xmm3		; SSE2-NEXT: movdqa %xmm1, %xmm2
; SSE2-NEXT: punpcklwd {{.*#+}} xmm3 = xmm3[0,0,1,1,2,2,3,3]
; SSE2-NEXT: punpckhwd {{.*#+}} xmm1 = xmm1[4,4,5,5,6,6,7,7]
; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0,0,1,1,2,2,3,3]		; SSE2-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0,0,1,1,2,2,3,3]
		; SSE2-NEXT: punpckhwd {{.*#+}} xmm1 = xmm1[4,4,5,5,6,6,7,7]
		; SSE2-NEXT: movdqa %xmm0, %xmm3
		; SSE2-NEXT: punpcklwd {{.*#+}} xmm3 = xmm3[0,0,1,1,2,2,3,3]
; SSE2-NEXT: punpckhwd {{.*#+}} xmm0 = xmm0[4,4,5,5,6,6,7,7]		; SSE2-NEXT: punpckhwd {{.*#+}} xmm0 = xmm0[4,4,5,5,6,6,7,7]
; SSE2-NEXT: pslld $31, %xmm0		; SSE2-NEXT: pslld $31, %xmm0
; SSE2-NEXT: psrad $31, %xmm0		; SSE2-NEXT: psrad $31, %xmm0
; SSE2-NEXT: pslld $31, %xmm2		; SSE2-NEXT: pslld $31, %xmm3
; SSE2-NEXT: psrad $31, %xmm2		; SSE2-NEXT: psrad $31, %xmm3
; SSE2-NEXT: pslld $31, %xmm1		; SSE2-NEXT: pslld $31, %xmm1
; SSE2-NEXT: psrad $31, %xmm1		; SSE2-NEXT: psrad $31, %xmm1
; SSE2-NEXT: pand %xmm0, %xmm1		; SSE2-NEXT: pand %xmm0, %xmm1
; SSE2-NEXT: pslld $31, %xmm3		; SSE2-NEXT: pslld $31, %xmm2
; SSE2-NEXT: psrad $31, %xmm3		; SSE2-NEXT: psrad $31, %xmm2
; SSE2-NEXT: pand %xmm3, %xmm2		; SSE2-NEXT: pand %xmm3, %xmm2
; SSE2-NEXT: movdqa %xmm2, %xmm0		; SSE2-NEXT: movdqa %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; AVX2-LABEL: bool_sext_and:		; AVX2-LABEL: bool_sext_and:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpmovzxwd {{.*#+}} ymm1 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1[5],zero,xmm1[6],zero,xmm1[7],zero		; AVX2-NEXT: vpmovzxwd {{.*#+}} ymm1 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1[5],zero,xmm1[6],zero,xmm1[7],zero
; AVX2-NEXT: vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero		; AVX2-NEXT: vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero
; AVX2-NEXT: vpslld $31, %ymm0, %ymm0		; AVX2-NEXT: vpslld $31, %ymm0, %ymm0
; AVX2-NEXT: vpsrad $31, %ymm0, %ymm0		; AVX2-NEXT: vpsrad $31, %ymm0, %ymm0
; AVX2-NEXT: vpslld $31, %ymm1, %ymm1		; AVX2-NEXT: vpslld $31, %ymm1, %ymm1
; AVX2-NEXT: vpsrad $31, %ymm1, %ymm1		; AVX2-NEXT: vpsrad $31, %ymm1, %ymm1
; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0		; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
; AVX2-NEXT: retq		; AVX2-NEXT: retq
%xs = sext <8 x i1> %x to <8 x i32>		%xs = sext <8 x i1> %x to <8 x i32>
%ys = sext <8 x i1> %y to <8 x i32>		%ys = sext <8 x i1> %y to <8 x i32>
%r = and <8 x i32> %xs, %ys		%r = and <8 x i32> %xs, %ys
ret <8 x i32> %r		ret <8 x i32> %r
}		}

define <8 x i32> @bool_sext_or(<8 x i1> %x, <8 x i1> %y) {		define <8 x i32> @bool_sext_or(<8 x i1> %x, <8 x i1> %y) {
; SSE2-LABEL: bool_sext_or:		; SSE2-LABEL: bool_sext_or:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa %xmm1, %xmm3		; SSE2-NEXT: movdqa %xmm1, %xmm2
; SSE2-NEXT: punpcklwd {{.*#+}} xmm3 = xmm3[0,0,1,1,2,2,3,3]
; SSE2-NEXT: punpckhwd {{.*#+}} xmm1 = xmm1[4,4,5,5,6,6,7,7]
; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0,0,1,1,2,2,3,3]		; SSE2-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0,0,1,1,2,2,3,3]
		; SSE2-NEXT: punpckhwd {{.*#+}} xmm1 = xmm1[4,4,5,5,6,6,7,7]
		; SSE2-NEXT: movdqa %xmm0, %xmm3
		; SSE2-NEXT: punpcklwd {{.*#+}} xmm3 = xmm3[0,0,1,1,2,2,3,3]
; SSE2-NEXT: punpckhwd {{.*#+}} xmm0 = xmm0[4,4,5,5,6,6,7,7]		; SSE2-NEXT: punpckhwd {{.*#+}} xmm0 = xmm0[4,4,5,5,6,6,7,7]
; SSE2-NEXT: pslld $31, %xmm0		; SSE2-NEXT: pslld $31, %xmm0
; SSE2-NEXT: psrad $31, %xmm0		; SSE2-NEXT: psrad $31, %xmm0
; SSE2-NEXT: pslld $31, %xmm2		; SSE2-NEXT: pslld $31, %xmm3
; SSE2-NEXT: psrad $31, %xmm2		; SSE2-NEXT: psrad $31, %xmm3
; SSE2-NEXT: pslld $31, %xmm1		; SSE2-NEXT: pslld $31, %xmm1
; SSE2-NEXT: psrad $31, %xmm1		; SSE2-NEXT: psrad $31, %xmm1
; SSE2-NEXT: por %xmm0, %xmm1		; SSE2-NEXT: por %xmm0, %xmm1
; SSE2-NEXT: pslld $31, %xmm3		; SSE2-NEXT: pslld $31, %xmm2
; SSE2-NEXT: psrad $31, %xmm3		; SSE2-NEXT: psrad $31, %xmm2
; SSE2-NEXT: por %xmm3, %xmm2		; SSE2-NEXT: por %xmm3, %xmm2
; SSE2-NEXT: movdqa %xmm2, %xmm0		; SSE2-NEXT: movdqa %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; AVX2-LABEL: bool_sext_or:		; AVX2-LABEL: bool_sext_or:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpmovzxwd {{.*#+}} ymm1 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1[5],zero,xmm1[6],zero,xmm1[7],zero		; AVX2-NEXT: vpmovzxwd {{.*#+}} ymm1 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1[5],zero,xmm1[6],zero,xmm1[7],zero
; AVX2-NEXT: vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero		; AVX2-NEXT: vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero
; AVX2-NEXT: vpslld $31, %ymm0, %ymm0		; AVX2-NEXT: vpslld $31, %ymm0, %ymm0
; AVX2-NEXT: vpsrad $31, %ymm0, %ymm0		; AVX2-NEXT: vpsrad $31, %ymm0, %ymm0
; AVX2-NEXT: vpslld $31, %ymm1, %ymm1		; AVX2-NEXT: vpslld $31, %ymm1, %ymm1
; AVX2-NEXT: vpsrad $31, %ymm1, %ymm1		; AVX2-NEXT: vpsrad $31, %ymm1, %ymm1
; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0		; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
; AVX2-NEXT: retq		; AVX2-NEXT: retq
%xs = sext <8 x i1> %x to <8 x i32>		%xs = sext <8 x i1> %x to <8 x i32>
%ys = sext <8 x i1> %y to <8 x i32>		%ys = sext <8 x i1> %y to <8 x i32>
%r = or <8 x i32> %xs, %ys		%r = or <8 x i32> %xs, %ys
ret <8 x i32> %r		ret <8 x i32> %r
}		}

define <8 x i32> @bool_sext_xor(<8 x i1> %x, <8 x i1> %y) {		define <8 x i32> @bool_sext_xor(<8 x i1> %x, <8 x i1> %y) {
; SSE2-LABEL: bool_sext_xor:		; SSE2-LABEL: bool_sext_xor:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa %xmm1, %xmm3		; SSE2-NEXT: movdqa %xmm1, %xmm2
; SSE2-NEXT: punpcklwd {{.*#+}} xmm3 = xmm3[0,0,1,1,2,2,3,3]
; SSE2-NEXT: punpckhwd {{.*#+}} xmm1 = xmm1[4,4,5,5,6,6,7,7]
; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0,0,1,1,2,2,3,3]		; SSE2-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0,0,1,1,2,2,3,3]
		; SSE2-NEXT: punpckhwd {{.*#+}} xmm1 = xmm1[4,4,5,5,6,6,7,7]
		; SSE2-NEXT: movdqa %xmm0, %xmm3
		; SSE2-NEXT: punpcklwd {{.*#+}} xmm3 = xmm3[0,0,1,1,2,2,3,3]
; SSE2-NEXT: punpckhwd {{.*#+}} xmm0 = xmm0[4,4,5,5,6,6,7,7]		; SSE2-NEXT: punpckhwd {{.*#+}} xmm0 = xmm0[4,4,5,5,6,6,7,7]
; SSE2-NEXT: pslld $31, %xmm0		; SSE2-NEXT: pslld $31, %xmm0
; SSE2-NEXT: psrad $31, %xmm0		; SSE2-NEXT: psrad $31, %xmm0
; SSE2-NEXT: pslld $31, %xmm2		; SSE2-NEXT: pslld $31, %xmm3
; SSE2-NEXT: psrad $31, %xmm2		; SSE2-NEXT: psrad $31, %xmm3
; SSE2-NEXT: pslld $31, %xmm1		; SSE2-NEXT: pslld $31, %xmm1
; SSE2-NEXT: psrad $31, %xmm1		; SSE2-NEXT: psrad $31, %xmm1
; SSE2-NEXT: pxor %xmm0, %xmm1		; SSE2-NEXT: pxor %xmm0, %xmm1
; SSE2-NEXT: pslld $31, %xmm3		; SSE2-NEXT: pslld $31, %xmm2
; SSE2-NEXT: psrad $31, %xmm3		; SSE2-NEXT: psrad $31, %xmm2
; SSE2-NEXT: pxor %xmm3, %xmm2		; SSE2-NEXT: pxor %xmm3, %xmm2
; SSE2-NEXT: movdqa %xmm2, %xmm0		; SSE2-NEXT: movdqa %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; AVX2-LABEL: bool_sext_xor:		; AVX2-LABEL: bool_sext_xor:
; AVX2: # %bb.0:		; AVX2: # %bb.0:
; AVX2-NEXT: vpmovzxwd {{.*#+}} ymm1 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1[5],zero,xmm1[6],zero,xmm1[7],zero		; AVX2-NEXT: vpmovzxwd {{.*#+}} ymm1 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1[5],zero,xmm1[6],zero,xmm1[7],zero
; AVX2-NEXT: vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero		; AVX2-NEXT: vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero
Show All 12 Lines

llvm/test/CodeGen/X86/vector-fshl-128.ll

	Show All 29 Lines
	; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [63,63]			; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [63,63]
	; SSE2-NEXT: movdqa %xmm2, %xmm4			; SSE2-NEXT: movdqa %xmm2, %xmm4
	; SSE2-NEXT: pandn %xmm3, %xmm4			; SSE2-NEXT: pandn %xmm3, %xmm4
	; SSE2-NEXT: psrlq $1, %xmm1			; SSE2-NEXT: psrlq $1, %xmm1
	; SSE2-NEXT: movdqa %xmm1, %xmm5			; SSE2-NEXT: movdqa %xmm1, %xmm5
	; SSE2-NEXT: psrlq %xmm4, %xmm5			; SSE2-NEXT: psrlq %xmm4, %xmm5
	; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm4[2,3,2,3]			; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm4[2,3,2,3]
	; SSE2-NEXT: psrlq %xmm4, %xmm1			; SSE2-NEXT: psrlq %xmm4, %xmm1
	; SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm5[0],xmm1[1]			; SSE2-NEXT: shufpd{{.*#+}} xmm5 = xmm5[0],xmm1[1]
	; SSE2-NEXT: pand %xmm3, %xmm2			; SSE2-NEXT: pand %xmm3, %xmm2
	; SSE2-NEXT: movdqa %xmm0, %xmm3			; SSE2-NEXT: movdqa %xmm0, %xmm1
	; SSE2-NEXT: psllq %xmm2, %xmm3			; SSE2-NEXT: psllq %xmm2, %xmm1
	; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[2,3,2,3]			; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[2,3,2,3]
	; SSE2-NEXT: psllq %xmm2, %xmm0			; SSE2-NEXT: psllq %xmm2, %xmm0
	; SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm3[0],xmm0[1]			; SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
	; SSE2-NEXT: orpd %xmm1, %xmm0			; SSE2-NEXT: orpd %xmm5, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: var_funnnel_v2i64:			; SSE41-LABEL: var_funnnel_v2i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [63,63]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [63,63]
	; SSE41-NEXT: movdqa %xmm2, %xmm4			; SSE41-NEXT: movdqa %xmm2, %xmm4
	; SSE41-NEXT: pandn %xmm3, %xmm4			; SSE41-NEXT: pandn %xmm3, %xmm4
	; SSE41-NEXT: psrlq $1, %xmm1			; SSE41-NEXT: psrlq $1, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm5			; SSE41-NEXT: movdqa %xmm1, %xmm5
	; SSE41-NEXT: psrlq %xmm4, %xmm5			; SSE41-NEXT: psrlq %xmm4, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm4[2,3,2,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm4[2,3,2,3]
	; SSE41-NEXT: psrlq %xmm4, %xmm1			; SSE41-NEXT: psrlq %xmm4, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm5[0,1,2,3],xmm1[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm5 = xmm5[0,1,2,3],xmm1[4,5,6,7]
	; SSE41-NEXT: pand %xmm3, %xmm2			; SSE41-NEXT: pand %xmm3, %xmm2
	; SSE41-NEXT: movdqa %xmm0, %xmm3			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: psllq %xmm2, %xmm3			; SSE41-NEXT: psllq %xmm2, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[2,3,2,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[2,3,2,3]
	; SSE41-NEXT: psllq %xmm2, %xmm0			; SSE41-NEXT: psllq %xmm2, %xmm0
	; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm3[0,1,2,3],xmm0[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm1[0,1,2,3],xmm0[4,5,6,7]
	; SSE41-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: var_funnnel_v2i64:			; AVX1-LABEL: var_funnnel_v2i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]
	; AVX1-NEXT: vpandn %xmm3, %xmm2, %xmm4			; AVX1-NEXT: vpandn %xmm3, %xmm2, %xmm4
	; AVX1-NEXT: vpsrlq $1, %xmm1, %xmm1			; AVX1-NEXT: vpsrlq $1, %xmm1, %xmm1
	; AVX1-NEXT: vpsrlq %xmm4, %xmm1, %xmm5			; AVX1-NEXT: vpsrlq %xmm4, %xmm1, %xmm5
	▲ Show 20 Lines • Show All 99 Lines • ▼ Show 20 Lines
	; XOPAVX2-NEXT: vpsrlvq %xmm4, %xmm1, %xmm1			; XOPAVX2-NEXT: vpsrlvq %xmm4, %xmm1, %xmm1
	; XOPAVX2-NEXT: vpand %xmm3, %xmm2, %xmm2			; XOPAVX2-NEXT: vpand %xmm3, %xmm2, %xmm2
	; XOPAVX2-NEXT: vpsllvq %xmm2, %xmm0, %xmm0			; XOPAVX2-NEXT: vpsllvq %xmm2, %xmm0, %xmm0
	; XOPAVX2-NEXT: vpor %xmm1, %xmm0, %xmm0			; XOPAVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; XOPAVX2-NEXT: retq			; XOPAVX2-NEXT: retq
	;			;
	; X86-SSE2-LABEL: var_funnnel_v2i64:			; X86-SSE2-LABEL: var_funnnel_v2i64:
	; X86-SSE2: # %bb.0:			; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: movdqa {{.*#+}} xmm3 = [63,0,63,0]			; X86-SSE2-NEXT: movdqa {{.*#+}} xmm4 = [63,0,63,0]
	; X86-SSE2-NEXT: movdqa %xmm2, %xmm4			; X86-SSE2-NEXT: movdqa %xmm2, %xmm5
	; X86-SSE2-NEXT: pandn %xmm3, %xmm4			; X86-SSE2-NEXT: pandn %xmm4, %xmm5
	; X86-SSE2-NEXT: psrlq $1, %xmm1			; X86-SSE2-NEXT: psrlq $1, %xmm1
	; X86-SSE2-NEXT: movdqa %xmm1, %xmm5			; X86-SSE2-NEXT: movdqa %xmm1, %xmm3
	; X86-SSE2-NEXT: psrlq %xmm4, %xmm5			; X86-SSE2-NEXT: psrlq %xmm5, %xmm3
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm4[2,3,2,3]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm5[2,3,2,3]
	; X86-SSE2-NEXT: psrlq %xmm4, %xmm1			; X86-SSE2-NEXT: psrlq %xmm5, %xmm1
	; X86-SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm5[0],xmm1[1]			; X86-SSE2-NEXT: shufpd {{.*#+}} xmm3 = xmm3[0],xmm1[1]
	; X86-SSE2-NEXT: pand %xmm3, %xmm2			; X86-SSE2-NEXT: pand %xmm4, %xmm2
	; X86-SSE2-NEXT: movdqa %xmm0, %xmm3			; X86-SSE2-NEXT: movdqa %xmm0, %xmm1
	; X86-SSE2-NEXT: psllq %xmm2, %xmm3			; X86-SSE2-NEXT: psllq %xmm2, %xmm1
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[2,3,2,3]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[2,3,2,3]
	; X86-SSE2-NEXT: psllq %xmm2, %xmm0			; X86-SSE2-NEXT: psllq %xmm2, %xmm0
	; X86-SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm3[0],xmm0[1]			; X86-SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
	; X86-SSE2-NEXT: orpd %xmm1, %xmm0			; X86-SSE2-NEXT: orpd %xmm3, %xmm0
	; X86-SSE2-NEXT: retl			; X86-SSE2-NEXT: retl
	%res = call <2 x i64> @llvm.fshl.v2i64(<2 x i64> %x, <2 x i64> %y, <2 x i64> %amt)			%res = call <2 x i64> @llvm.fshl.v2i64(<2 x i64> %x, <2 x i64> %y, <2 x i64> %amt)
	ret <2 x i64> %res			ret <2 x i64> %res
	}			}

	define <4 x i32> @var_funnnel_v4i32(<4 x i32> %x, <4 x i32> %y, <4 x i32> %amt) nounwind {			define <4 x i32> @var_funnnel_v4i32(<4 x i32> %x, <4 x i32> %y, <4 x i32> %amt) nounwind {
	; SSE2-LABEL: var_funnnel_v4i32:			; SSE2-LABEL: var_funnnel_v4i32:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: psrld %xmm7, %xmm3			; SSE41-NEXT: psrld %xmm7, %xmm3
	; SSE41-NEXT: pblendw {{.*#+}} xmm3 = xmm6[0,1,2,3],xmm3[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm3 = xmm6[0,1,2,3],xmm3[4,5,6,7]
	; SSE41-NEXT: pshuflw {{.*#+}} xmm4 = xmm4[0,1,1,1,4,5,6,7]			; SSE41-NEXT: pshuflw {{.*#+}} xmm4 = xmm4[0,1,1,1,4,5,6,7]
	; SSE41-NEXT: movdqa %xmm1, %xmm6			; SSE41-NEXT: movdqa %xmm1, %xmm6
	; SSE41-NEXT: psrld %xmm4, %xmm6			; SSE41-NEXT: psrld %xmm4, %xmm6
	; SSE41-NEXT: pshuflw {{.*#+}} xmm4 = xmm5[0,1,1,1,4,5,6,7]			; SSE41-NEXT: pshuflw {{.*#+}} xmm4 = xmm5[0,1,1,1,4,5,6,7]
	; SSE41-NEXT: psrld %xmm4, %xmm1			; SSE41-NEXT: psrld %xmm4, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm6[0,1,2,3],xmm1[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm6[0,1,2,3],xmm1[4,5,6,7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm3[2,3],xmm1[4,5],xmm3[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm6[0,1],xmm3[2,3],xmm6[4,5],xmm3[6,7]
	; SSE41-NEXT: pand %xmm8, %xmm2			; SSE41-NEXT: pand %xmm8, %xmm2
	; SSE41-NEXT: pslld $23, %xmm2			; SSE41-NEXT: pslld $23, %xmm2
	; SSE41-NEXT: paddd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2			; SSE41-NEXT: paddd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
	; SSE41-NEXT: cvttps2dq %xmm2, %xmm2			; SSE41-NEXT: cvttps2dq %xmm2, %xmm1
	; SSE41-NEXT: pmulld %xmm2, %xmm0			; SSE41-NEXT: pmulld %xmm1, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: var_funnnel_v4i32:			; AVX1-LABEL: var_funnnel_v4i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [31,31,31,31]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [31,31,31,31]
	; AVX1-NEXT: vpandn %xmm3, %xmm2, %xmm4			; AVX1-NEXT: vpandn %xmm3, %xmm2, %xmm4
	; AVX1-NEXT: vpsrldq {{.*#+}} xmm5 = xmm4[12,13,14,15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; AVX1-NEXT: vpsrldq {{.*#+}} xmm5 = xmm4[12,13,14,15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; AVX1-NEXT: vpsrld $1, %xmm1, %xmm1			; AVX1-NEXT: vpsrld $1, %xmm1, %xmm1
	▲ Show 20 Lines • Show All 175 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: psraw $15, %xmm1			; SSE2-NEXT: psraw $15, %xmm1
	; SSE2-NEXT: movdqa %xmm1, %xmm5			; SSE2-NEXT: movdqa %xmm1, %xmm5
	; SSE2-NEXT: pandn %xmm3, %xmm5			; SSE2-NEXT: pandn %xmm3, %xmm5
	; SSE2-NEXT: psrlw $2, %xmm3			; SSE2-NEXT: psrlw $2, %xmm3
	; SSE2-NEXT: pand %xmm1, %xmm3			; SSE2-NEXT: pand %xmm1, %xmm3
	; SSE2-NEXT: por %xmm5, %xmm3			; SSE2-NEXT: por %xmm5, %xmm3
	; SSE2-NEXT: paddw %xmm4, %xmm4			; SSE2-NEXT: paddw %xmm4, %xmm4
	; SSE2-NEXT: psraw $15, %xmm4			; SSE2-NEXT: psraw $15, %xmm4
	; SSE2-NEXT: movdqa %xmm4, %xmm5			; SSE2-NEXT: movdqa %xmm4, %xmm1
	; SSE2-NEXT: pandn %xmm3, %xmm5			; SSE2-NEXT: pandn %xmm3, %xmm1
	; SSE2-NEXT: psrlw $1, %xmm3			; SSE2-NEXT: psrlw $1, %xmm3
	; SSE2-NEXT: pand %xmm4, %xmm3			; SSE2-NEXT: pand %xmm4, %xmm3
	; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2			; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
	; SSE2-NEXT: movdqa %xmm2, %xmm1			; SSE2-NEXT: movdqa %xmm2, %xmm4
	; SSE2-NEXT: punpckhwd {{.*#+}} xmm1 = xmm1[4,4,5,5,6,6,7,7]			; SSE2-NEXT: punpckhwd {{.*#+}} xmm4 = xmm4[4,4,5,5,6,6,7,7]
	; SSE2-NEXT: pslld $23, %xmm1			; SSE2-NEXT: pslld $23, %xmm4
	; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [1065353216,1065353216,1065353216,1065353216]			; SSE2-NEXT: movdqa {{.*#+}} xmm5 = [1065353216,1065353216,1065353216,1065353216]
	; SSE2-NEXT: paddd %xmm4, %xmm1			; SSE2-NEXT: paddd %xmm5, %xmm4
	; SSE2-NEXT: cvttps2dq %xmm1, %xmm1			; SSE2-NEXT: cvttps2dq %xmm4, %xmm4
	; SSE2-NEXT: pshuflw {{.*#+}} xmm1 = xmm1[0,2,2,3,4,5,6,7]			; SSE2-NEXT: pshuflw {{.*#+}} xmm4 = xmm4[0,2,2,3,4,5,6,7]
	; SSE2-NEXT: pshufhw {{.*#+}} xmm1 = xmm1[0,1,2,3,4,6,6,7]			; SSE2-NEXT: pshufhw {{.*#+}} xmm4 = xmm4[0,1,2,3,4,6,6,7]
	; SSE2-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,2,2,3]			; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm4[0,2,2,3]
	; SSE2-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0,0,1,1,2,2,3,3]			; SSE2-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0,0,1,1,2,2,3,3]
	; SSE2-NEXT: pslld $23, %xmm2			; SSE2-NEXT: pslld $23, %xmm2
	; SSE2-NEXT: paddd %xmm4, %xmm2			; SSE2-NEXT: paddd %xmm5, %xmm2
	; SSE2-NEXT: cvttps2dq %xmm2, %xmm1			; SSE2-NEXT: cvttps2dq %xmm2, %xmm2
	; SSE2-NEXT: pshuflw {{.*#+}} xmm1 = xmm1[0,2,2,3,4,5,6,7]			; SSE2-NEXT: pshuflw {{.*#+}} xmm2 = xmm2[0,2,2,3,4,5,6,7]
	; SSE2-NEXT: pshufhw {{.*#+}} xmm1 = xmm1[0,1,2,3,4,6,6,7]			; SSE2-NEXT: pshufhw {{.*#+}} xmm2 = xmm2[0,1,2,3,4,6,6,7]
	; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,2,2,3]			; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,2,2,3]
	; SSE2-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm6[0]			; SSE2-NEXT: punpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm4[0]
	; SSE2-NEXT: pmullw %xmm0, %xmm1			; SSE2-NEXT: pmullw %xmm2, %xmm0
	; SSE2-NEXT: por %xmm5, %xmm1			; SSE2-NEXT: por %xmm1, %xmm0
	; SSE2-NEXT: por %xmm3, %xmm1			; SSE2-NEXT: por %xmm3, %xmm0
	; SSE2-NEXT: movdqa %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: var_funnnel_v8i16:			; SSE41-LABEL: var_funnnel_v8i16:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm3			; SSE41-NEXT: movdqa %xmm0, %xmm3
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [15,15,15,15,15,15,15,15]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [15,15,15,15,15,15,15,15]
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pandn %xmm5, %xmm0			; SSE41-NEXT: pandn %xmm5, %xmm0
	Show All 27 Lines
	; SSE41-NEXT: pslld $23, %xmm2			; SSE41-NEXT: pslld $23, %xmm2
	; SSE41-NEXT: movdqa {{.*#+}} xmm4 = [1065353216,1065353216,1065353216,1065353216]			; SSE41-NEXT: movdqa {{.*#+}} xmm4 = [1065353216,1065353216,1065353216,1065353216]
	; SSE41-NEXT: paddd %xmm4, %xmm2			; SSE41-NEXT: paddd %xmm4, %xmm2
	; SSE41-NEXT: cvttps2dq %xmm2, %xmm2			; SSE41-NEXT: cvttps2dq %xmm2, %xmm2
	; SSE41-NEXT: pslld $23, %xmm0			; SSE41-NEXT: pslld $23, %xmm0
	; SSE41-NEXT: paddd %xmm4, %xmm0			; SSE41-NEXT: paddd %xmm4, %xmm0
	; SSE41-NEXT: cvttps2dq %xmm0, %xmm0			; SSE41-NEXT: cvttps2dq %xmm0, %xmm0
	; SSE41-NEXT: packusdw %xmm2, %xmm0			; SSE41-NEXT: packusdw %xmm2, %xmm0
	; SSE41-NEXT: pmullw %xmm0, %xmm3			; SSE41-NEXT: pmullw %xmm3, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm3			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: var_funnnel_v8i16:			; AVX1-LABEL: var_funnnel_v8i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [15,15,15,15,15,15,15,15]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [15,15,15,15,15,15,15,15]
	; AVX1-NEXT: vpandn %xmm3, %xmm2, %xmm4			; AVX1-NEXT: vpandn %xmm3, %xmm2, %xmm4
	; AVX1-NEXT: vpsllw $12, %xmm4, %xmm5			; AVX1-NEXT: vpsllw $12, %xmm4, %xmm5
	; AVX1-NEXT: vpsllw $4, %xmm4, %xmm4			; AVX1-NEXT: vpsllw $4, %xmm4, %xmm4
	▲ Show 20 Lines • Show All 158 Lines • ▼ Show 20 Lines
	; X86-SSE2-NEXT: psraw $15, %xmm1			; X86-SSE2-NEXT: psraw $15, %xmm1
	; X86-SSE2-NEXT: movdqa %xmm1, %xmm5			; X86-SSE2-NEXT: movdqa %xmm1, %xmm5
	; X86-SSE2-NEXT: pandn %xmm3, %xmm5			; X86-SSE2-NEXT: pandn %xmm3, %xmm5
	; X86-SSE2-NEXT: psrlw $2, %xmm3			; X86-SSE2-NEXT: psrlw $2, %xmm3
	; X86-SSE2-NEXT: pand %xmm1, %xmm3			; X86-SSE2-NEXT: pand %xmm1, %xmm3
	; X86-SSE2-NEXT: por %xmm5, %xmm3			; X86-SSE2-NEXT: por %xmm5, %xmm3
	; X86-SSE2-NEXT: paddw %xmm4, %xmm4			; X86-SSE2-NEXT: paddw %xmm4, %xmm4
	; X86-SSE2-NEXT: psraw $15, %xmm4			; X86-SSE2-NEXT: psraw $15, %xmm4
	; X86-SSE2-NEXT: movdqa %xmm4, %xmm5			; X86-SSE2-NEXT: movdqa %xmm4, %xmm1
	; X86-SSE2-NEXT: pandn %xmm3, %xmm5			; X86-SSE2-NEXT: pandn %xmm3, %xmm1
	; X86-SSE2-NEXT: psrlw $1, %xmm3			; X86-SSE2-NEXT: psrlw $1, %xmm3
	; X86-SSE2-NEXT: pand %xmm4, %xmm3			; X86-SSE2-NEXT: pand %xmm4, %xmm3
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm2			; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm2
	; X86-SSE2-NEXT: movdqa %xmm2, %xmm1			; X86-SSE2-NEXT: movdqa %xmm2, %xmm4
	; X86-SSE2-NEXT: punpckhwd {{.*#+}} xmm1 = xmm1[4,4,5,5,6,6,7,7]			; X86-SSE2-NEXT: punpckhwd {{.*#+}} xmm4 = xmm4[4,4,5,5,6,6,7,7]
	; X86-SSE2-NEXT: pslld $23, %xmm1			; X86-SSE2-NEXT: pslld $23, %xmm4
	; X86-SSE2-NEXT: movdqa {{.*#+}} xmm4 = [1065353216,1065353216,1065353216,1065353216]			; X86-SSE2-NEXT: movdqa {{.*#+}} xmm5 = [1065353216,1065353216,1065353216,1065353216]
	; X86-SSE2-NEXT: paddd %xmm4, %xmm1			; X86-SSE2-NEXT: paddd %xmm5, %xmm4
	; X86-SSE2-NEXT: cvttps2dq %xmm1, %xmm1			; X86-SSE2-NEXT: cvttps2dq %xmm4, %xmm4
	; X86-SSE2-NEXT: pshuflw {{.*#+}} xmm1 = xmm1[0,2,2,3,4,5,6,7]			; X86-SSE2-NEXT: pshuflw {{.*#+}} xmm4 = xmm4[0,2,2,3,4,5,6,7]
	; X86-SSE2-NEXT: pshufhw {{.*#+}} xmm1 = xmm1[0,1,2,3,4,6,6,7]			; X86-SSE2-NEXT: pshufhw {{.*#+}} xmm4 = xmm4[0,1,2,3,4,6,6,7]
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm6 = xmm1[0,2,2,3]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm4[0,2,2,3]
	; X86-SSE2-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0,0,1,1,2,2,3,3]			; X86-SSE2-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0,0,1,1,2,2,3,3]
	; X86-SSE2-NEXT: pslld $23, %xmm2			; X86-SSE2-NEXT: pslld $23, %xmm2
	; X86-SSE2-NEXT: paddd %xmm4, %xmm2			; X86-SSE2-NEXT: paddd %xmm5, %xmm2
	; X86-SSE2-NEXT: cvttps2dq %xmm2, %xmm1			; X86-SSE2-NEXT: cvttps2dq %xmm2, %xmm2
	; X86-SSE2-NEXT: pshuflw {{.*#+}} xmm1 = xmm1[0,2,2,3,4,5,6,7]			; X86-SSE2-NEXT: pshuflw {{.*#+}} xmm2 = xmm2[0,2,2,3,4,5,6,7]
	; X86-SSE2-NEXT: pshufhw {{.*#+}} xmm1 = xmm1[0,1,2,3,4,6,6,7]			; X86-SSE2-NEXT: pshufhw {{.*#+}} xmm2 = xmm2[0,1,2,3,4,6,6,7]
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,2,2,3]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,2,2,3]
	; X86-SSE2-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm6[0]			; X86-SSE2-NEXT: punpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm4[0]
	; X86-SSE2-NEXT: pmullw %xmm0, %xmm1			; X86-SSE2-NEXT: pmullw %xmm2, %xmm0
	; X86-SSE2-NEXT: por %xmm5, %xmm1			; X86-SSE2-NEXT: por %xmm1, %xmm0
	; X86-SSE2-NEXT: por %xmm3, %xmm1			; X86-SSE2-NEXT: por %xmm3, %xmm0
	; X86-SSE2-NEXT: movdqa %xmm1, %xmm0
	; X86-SSE2-NEXT: retl			; X86-SSE2-NEXT: retl
	%res = call <8 x i16> @llvm.fshl.v8i16(<8 x i16> %x, <8 x i16> %y, <8 x i16> %amt)			%res = call <8 x i16> @llvm.fshl.v8i16(<8 x i16> %x, <8 x i16> %y, <8 x i16> %amt)
	ret <8 x i16> %res			ret <8 x i16> %res
	}			}

	define <16 x i8> @var_funnnel_v16i8(<16 x i8> %x, <16 x i8> %y, <16 x i8> %amt) nounwind {			define <16 x i8> @var_funnnel_v16i8(<16 x i8> %x, <16 x i8> %y, <16 x i8> %amt) nounwind {
	; SSE2-LABEL: var_funnnel_v16i8:			; SSE2-LABEL: var_funnnel_v16i8:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	▲ Show 20 Lines • Show All 430 Lines • ▼ Show 20 Lines
	; XOP-NEXT: vpsrlq %xmm4, %xmm1, %xmm1			; XOP-NEXT: vpsrlq %xmm4, %xmm1, %xmm1
	; XOP-NEXT: vpand %xmm3, %xmm2, %xmm2			; XOP-NEXT: vpand %xmm3, %xmm2, %xmm2
	; XOP-NEXT: vpsllq %xmm2, %xmm0, %xmm0			; XOP-NEXT: vpsllq %xmm2, %xmm0, %xmm0
	; XOP-NEXT: vpor %xmm1, %xmm0, %xmm0			; XOP-NEXT: vpor %xmm1, %xmm0, %xmm0
	; XOP-NEXT: retq			; XOP-NEXT: retq
	;			;
	; X86-SSE2-LABEL: splatvar_funnnel_v2i64:			; X86-SSE2-LABEL: splatvar_funnnel_v2i64:
	; X86-SSE2: # %bb.0:			; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,1,0,1]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,1,0,1]
	; X86-SSE2-NEXT: movdqa {{.*#+}} xmm3 = [63,0,63,0]			; X86-SSE2-NEXT: movdqa {{.*#+}} xmm4 = [63,0,63,0]
	; X86-SSE2-NEXT: movdqa %xmm2, %xmm4			; X86-SSE2-NEXT: movdqa %xmm3, %xmm5
	; X86-SSE2-NEXT: pandn %xmm3, %xmm4			; X86-SSE2-NEXT: pandn %xmm4, %xmm5
	; X86-SSE2-NEXT: psrlq $1, %xmm1			; X86-SSE2-NEXT: psrlq $1, %xmm1
	; X86-SSE2-NEXT: movdqa %xmm1, %xmm5			; X86-SSE2-NEXT: movdqa %xmm1, %xmm2
	; X86-SSE2-NEXT: psrlq %xmm4, %xmm5			; X86-SSE2-NEXT: psrlq %xmm5, %xmm2
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm4[2,3,2,3]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm5[2,3,2,3]
	; X86-SSE2-NEXT: psrlq %xmm4, %xmm1			; X86-SSE2-NEXT: psrlq %xmm5, %xmm1
	; X86-SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm5[0],xmm1[1]			; X86-SSE2-NEXT: shufpd {{.*#+}} xmm2 = xmm2[0],xmm1[1]
	; X86-SSE2-NEXT: pand %xmm3, %xmm2			; X86-SSE2-NEXT: pand %xmm4, %xmm3
	; X86-SSE2-NEXT: movdqa %xmm0, %xmm3			; X86-SSE2-NEXT: movdqa %xmm0, %xmm1
	; X86-SSE2-NEXT: psllq %xmm2, %xmm3			; X86-SSE2-NEXT: psllq %xmm3, %xmm1
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[2,3,2,3]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm3[2,3,2,3]
	; X86-SSE2-NEXT: psllq %xmm2, %xmm0			; X86-SSE2-NEXT: psllq %xmm3, %xmm0
	; X86-SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm3[0],xmm0[1]			; X86-SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
	; X86-SSE2-NEXT: orpd %xmm1, %xmm0			; X86-SSE2-NEXT: orpd %xmm2, %xmm0
	; X86-SSE2-NEXT: retl			; X86-SSE2-NEXT: retl
	%splat = shufflevector <2 x i64> %amt, <2 x i64> undef, <2 x i32> zeroinitializer			%splat = shufflevector <2 x i64> %amt, <2 x i64> undef, <2 x i32> zeroinitializer
	%res = call <2 x i64> @llvm.fshl.v2i64(<2 x i64> %x, <2 x i64> %y, <2 x i64> %splat)			%res = call <2 x i64> @llvm.fshl.v2i64(<2 x i64> %x, <2 x i64> %y, <2 x i64> %splat)
	ret <2 x i64> %res			ret <2 x i64> %res
	}			}

	define <4 x i32> @splatvar_funnnel_v4i32(<4 x i32> %x, <4 x i32> %y, <4 x i32> %amt) nounwind {			define <4 x i32> @splatvar_funnnel_v4i32(<4 x i32> %x, <4 x i32> %y, <4 x i32> %amt) nounwind {
	; SSE2-LABEL: splatvar_funnnel_v4i32:			; SSE2-LABEL: splatvar_funnnel_v4i32:
	▲ Show 20 Lines • Show All 862 Lines • ▼ Show 20 Lines
	;			;

	define <2 x i64> @constant_funnnel_v2i64(<2 x i64> %x, <2 x i64> %y) nounwind {			define <2 x i64> @constant_funnnel_v2i64(<2 x i64> %x, <2 x i64> %y) nounwind {
	; SSE2-LABEL: constant_funnnel_v2i64:			; SSE2-LABEL: constant_funnnel_v2i64:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa %xmm1, %xmm2			; SSE2-NEXT: movdqa %xmm1, %xmm2
	; SSE2-NEXT: psrlq $60, %xmm2			; SSE2-NEXT: psrlq $60, %xmm2
	; SSE2-NEXT: psrlq $50, %xmm1			; SSE2-NEXT: psrlq $50, %xmm1
	; SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm2[0],xmm1[1]			; SSE2-NEXT: shufpd {{.*#+}} xmm2 = xmm2[0],xmm1[1]
	; SSE2-NEXT: movdqa %xmm0, %xmm2			; SSE2-NEXT: movdqa %xmm0, %xmm1
	; SSE2-NEXT: psllq $4, %xmm2			; SSE2-NEXT: psllq $4, %xmm1
	; SSE2-NEXT: psllq $14, %xmm0			; SSE2-NEXT: psllq $14, %xmm0
	; SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm2[0],xmm0[1]			; SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
	; SSE2-NEXT: orpd %xmm1, %xmm0			; SSE2-NEXT: orpd %xmm2, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: constant_funnnel_v2i64:			; SSE41-LABEL: constant_funnnel_v2i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm1, %xmm2			; SSE41-NEXT: movdqa %xmm1, %xmm2
	; SSE41-NEXT: psrlq $50, %xmm2			; SSE41-NEXT: psrlq $50, %xmm2
	; SSE41-NEXT: psrlq $60, %xmm1			; SSE41-NEXT: psrlq $60, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1,2,3],xmm2[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm1[0,1,2,3],xmm2[4,5,6,7]
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: psllq $14, %xmm2			; SSE41-NEXT: psllq $14, %xmm1
	; SSE41-NEXT: psllq $4, %xmm0			; SSE41-NEXT: psllq $4, %xmm0
	; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm2[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
	; SSE41-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: constant_funnnel_v2i64:			; AVX1-LABEL: constant_funnnel_v2i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsrlq $50, %xmm1, %xmm2			; AVX1-NEXT: vpsrlq $50, %xmm1, %xmm2
	; AVX1-NEXT: vpsrlq $60, %xmm1, %xmm1			; AVX1-NEXT: vpsrlq $60, %xmm1, %xmm1
	; AVX1-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0,1,2,3],xmm2[4,5,6,7]			; AVX1-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0,1,2,3],xmm2[4,5,6,7]
	; AVX1-NEXT: vpsllq $14, %xmm0, %xmm2			; AVX1-NEXT: vpsllq $14, %xmm0, %xmm2
	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; XOPAVX2: # %bb.0:			; XOPAVX2: # %bb.0:
	; XOPAVX2-NEXT: vpsrlvq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; XOPAVX2-NEXT: vpsrlvq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; XOPAVX2-NEXT: vpsllvq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; XOPAVX2-NEXT: vpsllvq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; XOPAVX2-NEXT: vpor %xmm1, %xmm0, %xmm0			; XOPAVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; XOPAVX2-NEXT: retq			; XOPAVX2-NEXT: retq
	;			;
	; X86-SSE2-LABEL: constant_funnnel_v2i64:			; X86-SSE2-LABEL: constant_funnnel_v2i64:
	; X86-SSE2: # %bb.0:			; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: movdqa {{.*#+}} xmm2 = [63,0,63,0]			; X86-SSE2-NEXT: movdqa {{.*#+}} xmm3 = [63,0,63,0]
	; X86-SSE2-NEXT: movdqa {{.*#+}} xmm3 = <4,u,14,u>			; X86-SSE2-NEXT: movdqa {{.*#+}} xmm4 = <4,u,14,u>
	; X86-SSE2-NEXT: movdqa %xmm3, %xmm4			; X86-SSE2-NEXT: movdqa %xmm4, %xmm5
	; X86-SSE2-NEXT: pandn %xmm2, %xmm4			; X86-SSE2-NEXT: pandn %xmm3, %xmm5
	; X86-SSE2-NEXT: psrlq $1, %xmm1			; X86-SSE2-NEXT: psrlq $1, %xmm1
	; X86-SSE2-NEXT: movdqa %xmm1, %xmm5			; X86-SSE2-NEXT: movdqa %xmm1, %xmm2
	; X86-SSE2-NEXT: psrlq %xmm4, %xmm5			; X86-SSE2-NEXT: psrlq %xmm5, %xmm2
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm4[2,3,2,3]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm5[2,3,2,3]
	; X86-SSE2-NEXT: psrlq %xmm4, %xmm1			; X86-SSE2-NEXT: psrlq %xmm5, %xmm1
	; X86-SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm5[0],xmm1[1]			; X86-SSE2-NEXT: shufpd {{.*#+}} xmm2 = xmm2[0],xmm1[1]
	; X86-SSE2-NEXT: pand %xmm2, %xmm3			; X86-SSE2-NEXT: pand %xmm3, %xmm4
	; X86-SSE2-NEXT: movdqa %xmm0, %xmm2			; X86-SSE2-NEXT: movdqa %xmm0, %xmm1
	; X86-SSE2-NEXT: psllq %xmm3, %xmm2			; X86-SSE2-NEXT: psllq %xmm4, %xmm1
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm3[2,3,2,3]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm4[2,3,2,3]
	; X86-SSE2-NEXT: psllq %xmm3, %xmm0			; X86-SSE2-NEXT: psllq %xmm3, %xmm0
	; X86-SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm2[0],xmm0[1]			; X86-SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
	; X86-SSE2-NEXT: orpd %xmm1, %xmm0			; X86-SSE2-NEXT: orpd %xmm2, %xmm0
	; X86-SSE2-NEXT: retl			; X86-SSE2-NEXT: retl
	%res = call <2 x i64> @llvm.fshl.v2i64(<2 x i64> %x, <2 x i64> %y, <2 x i64> <i64 4, i64 14>)			%res = call <2 x i64> @llvm.fshl.v2i64(<2 x i64> %x, <2 x i64> %y, <2 x i64> <i64 4, i64 14>)
	ret <2 x i64> %res			ret <2 x i64> %res
	}			}

	define <4 x i32> @constant_funnnel_v4i32(<4 x i32> %x, <4 x i32> %y) nounwind {			define <4 x i32> @constant_funnnel_v4i32(<4 x i32> %x, <4 x i32> %y) nounwind {
	; SSE2-LABEL: constant_funnnel_v4i32:			; SSE2-LABEL: constant_funnnel_v4i32:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	Show All 23 Lines
	; SSE41-NEXT: movdqa %xmm1, %xmm2			; SSE41-NEXT: movdqa %xmm1, %xmm2
	; SSE41-NEXT: psrld $25, %xmm2			; SSE41-NEXT: psrld $25, %xmm2
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: psrld $27, %xmm3			; SSE41-NEXT: psrld $27, %xmm3
	; SSE41-NEXT: pblendw {{.*#+}} xmm3 = xmm3[0,1,2,3],xmm2[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm3 = xmm3[0,1,2,3],xmm2[4,5,6,7]
	; SSE41-NEXT: movdqa %xmm1, %xmm2			; SSE41-NEXT: movdqa %xmm1, %xmm2
	; SSE41-NEXT: psrld $26, %xmm2			; SSE41-NEXT: psrld $26, %xmm2
	; SSE41-NEXT: psrld $28, %xmm1			; SSE41-NEXT: psrld $28, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1,2,3],xmm2[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm1[0,1,2,3],xmm2[4,5,6,7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm3[2,3],xmm1[4,5],xmm3[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm3[2,3],xmm2[4,5],xmm3[6,7]
	; SSE41-NEXT: pmulld {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; SSE41-NEXT: pmulld {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: constant_funnnel_v4i32:			; AVX1-LABEL: constant_funnnel_v4i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsrld $25, %xmm1, %xmm2			; AVX1-NEXT: vpsrld $25, %xmm1, %xmm2
	; AVX1-NEXT: vpsrld $27, %xmm1, %xmm3			; AVX1-NEXT: vpsrld $27, %xmm1, %xmm3
	; AVX1-NEXT: vpblendw {{.*#+}} xmm2 = xmm3[0,1,2,3],xmm2[4,5,6,7]			; AVX1-NEXT: vpblendw {{.*#+}} xmm2 = xmm3[0,1,2,3],xmm2[4,5,6,7]
	; AVX1-NEXT: vpsrld $26, %xmm1, %xmm3			; AVX1-NEXT: vpsrld $26, %xmm1, %xmm3
	▲ Show 20 Lines • Show All 708 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-fshl-rot-128.ll

	Show First 20 Lines • Show All 1,120 Lines • ▼ Show 20 Lines
	}			}

	define <16 x i8> @splatvar_funnnel_v16i8(<16 x i8> %x, <16 x i8> %amt) nounwind {			define <16 x i8> @splatvar_funnnel_v16i8(<16 x i8> %x, <16 x i8> %amt) nounwind {
	; SSE2-LABEL: splatvar_funnnel_v16i8:			; SSE2-LABEL: splatvar_funnnel_v16i8:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]			; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]
	; SSE2-NEXT: psubb %xmm1, %xmm2			; SSE2-NEXT: psubb %xmm1, %xmm2
	; SSE2-NEXT: movdqa %xmm1, %xmm3			; SSE2-NEXT: pslldq {{.*#+}} xmm1 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm1[0]
	; SSE2-NEXT: pslldq {{.*#+}} xmm3 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm3[0]			; SSE2-NEXT: psrldq {{.*#+}} xmm1 = xmm1[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; SSE2-NEXT: psrldq {{.*#+}} xmm3 = xmm3[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; SSE2-NEXT: movdqa %xmm0, %xmm3
	; SSE2-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: psllw %xmm1, %xmm3
	; SSE2-NEXT: psllw %xmm3, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm4, %xmm4			; SSE2-NEXT: pcmpeqd %xmm4, %xmm4
	; SSE2-NEXT: pcmpeqd %xmm5, %xmm5			; SSE2-NEXT: pcmpeqd %xmm5, %xmm5
	; SSE2-NEXT: psllw %xmm3, %xmm5			; SSE2-NEXT: psllw %xmm1, %xmm5
	; SSE2-NEXT: punpcklbw {{.*#+}} xmm5 = xmm5[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]			; SSE2-NEXT: punpcklbw {{.*#+}} xmm5 = xmm5[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
	; SSE2-NEXT: pshuflw {{.*#+}} xmm3 = xmm5[0,0,0,0,4,5,6,7]			; SSE2-NEXT: pshuflw {{.*#+}} xmm1 = xmm5[0,0,0,0,4,5,6,7]
	; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm3[0,0,0,0]			; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,0,0,0]
	; SSE2-NEXT: pand %xmm3, %xmm1			; SSE2-NEXT: pand %xmm3, %xmm1
	; SSE2-NEXT: pslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0]			; SSE2-NEXT: pslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0]
	; SSE2-NEXT: psrldq {{.*#+}} xmm2 = xmm2[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; SSE2-NEXT: psrldq {{.*#+}} xmm2 = xmm2[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; SSE2-NEXT: psrlw %xmm2, %xmm0			; SSE2-NEXT: psrlw %xmm2, %xmm0
	; SSE2-NEXT: psrlw %xmm2, %xmm4			; SSE2-NEXT: psrlw %xmm2, %xmm4
	; SSE2-NEXT: psrlw $8, %xmm4			; SSE2-NEXT: psrlw $8, %xmm4
	; SSE2-NEXT: punpcklbw {{.*#+}} xmm4 = xmm4[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]			; SSE2-NEXT: punpcklbw {{.*#+}} xmm4 = xmm4[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
	; SSE2-NEXT: pshuflw {{.*#+}} xmm2 = xmm4[0,0,0,0,4,5,6,7]			; SSE2-NEXT: pshuflw {{.*#+}} xmm2 = xmm4[0,0,0,0,4,5,6,7]
	; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,0,0,0]			; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,0,0,0]
	; SSE2-NEXT: pand %xmm0, %xmm2			; SSE2-NEXT: pand %xmm2, %xmm0
	; SSE2-NEXT: por %xmm2, %xmm1			; SSE2-NEXT: por %xmm1, %xmm0
	; SSE2-NEXT: movdqa %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: splatvar_funnnel_v16i8:			; SSE41-LABEL: splatvar_funnnel_v16i8:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE41-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE41-NEXT: pmovzxbq {{.*#+}} xmm3 = xmm1[0],zero,zero,zero,zero,zero,zero,zero,xmm1[1],zero,zero,zero,zero,zero,zero,zero			; SSE41-NEXT: pmovzxbq {{.*#+}} xmm2 = xmm1[0],zero,zero,zero,zero,zero,zero,zero,xmm1[1],zero,zero,zero,zero,zero,zero,zero
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm3
	; SSE41-NEXT: psllw %xmm3, %xmm2			; SSE41-NEXT: psllw %xmm2, %xmm3
	; SSE41-NEXT: pcmpeqd %xmm4, %xmm4			; SSE41-NEXT: pcmpeqd %xmm4, %xmm4
	; SSE41-NEXT: pcmpeqd %xmm5, %xmm5			; SSE41-NEXT: pcmpeqd %xmm5, %xmm5
	; SSE41-NEXT: psllw %xmm3, %xmm5			; SSE41-NEXT: psllw %xmm2, %xmm5
	; SSE41-NEXT: pxor %xmm3, %xmm3			; SSE41-NEXT: pxor %xmm2, %xmm2
	; SSE41-NEXT: pshufb %xmm3, %xmm5			; SSE41-NEXT: pshufb %xmm2, %xmm5
	; SSE41-NEXT: pand %xmm5, %xmm2			; SSE41-NEXT: pand %xmm3, %xmm5
	; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]			; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]
	; SSE41-NEXT: psubb %xmm1, %xmm3			; SSE41-NEXT: psubb %xmm1, %xmm2
	; SSE41-NEXT: pmovzxbq {{.*#+}} xmm1 = xmm3[0],zero,zero,zero,zero,zero,zero,zero,xmm3[1],zero,zero,zero,zero,zero,zero,zero			; SSE41-NEXT: pmovzxbq {{.*#+}} xmm1 = xmm2[0],zero,zero,zero,zero,zero,zero,zero,xmm2[1],zero,zero,zero,zero,zero,zero,zero
	; SSE41-NEXT: psrlw %xmm1, %xmm0			; SSE41-NEXT: psrlw %xmm1, %xmm0
	; SSE41-NEXT: psrlw %xmm1, %xmm4			; SSE41-NEXT: psrlw %xmm1, %xmm4
	; SSE41-NEXT: pshufb {{.*#+}} xmm4 = xmm4[1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]			; SSE41-NEXT: pshufb {{.*#+}} xmm4 = xmm4[1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]
	; SSE41-NEXT: pand %xmm0, %xmm4			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm2			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: splatvar_funnnel_v16i8:			; AVX1-LABEL: splatvar_funnnel_v16i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX1-NEXT: vpmovzxbq {{.*#+}} xmm2 = xmm1[0],zero,zero,zero,zero,zero,zero,zero,xmm1[1],zero,zero,zero,zero,zero,zero,zero			; AVX1-NEXT: vpmovzxbq {{.*#+}} xmm2 = xmm1[0],zero,zero,zero,zero,zero,zero,zero,xmm1[1],zero,zero,zero,zero,zero,zero,zero
	; AVX1-NEXT: vpsllw %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpsllw %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vpcmpeqd %xmm4, %xmm4, %xmm4			; AVX1-NEXT: vpcmpeqd %xmm4, %xmm4, %xmm4
	▲ Show 20 Lines • Show All 148 Lines • ▼ Show 20 Lines
	; XOPAVX2-NEXT: vprotb %xmm1, %xmm0, %xmm0			; XOPAVX2-NEXT: vprotb %xmm1, %xmm0, %xmm0
	; XOPAVX2-NEXT: retq			; XOPAVX2-NEXT: retq
	;			;
	; X86-SSE2-LABEL: splatvar_funnnel_v16i8:			; X86-SSE2-LABEL: splatvar_funnnel_v16i8:
	; X86-SSE2: # %bb.0:			; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm1			; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm1
	; X86-SSE2-NEXT: movdqa {{.*#+}} xmm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]			; X86-SSE2-NEXT: movdqa {{.*#+}} xmm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]
	; X86-SSE2-NEXT: psubb %xmm1, %xmm2			; X86-SSE2-NEXT: psubb %xmm1, %xmm2
	; X86-SSE2-NEXT: movdqa %xmm1, %xmm3			; X86-SSE2-NEXT: pslldq {{.*#+}} xmm1 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm1[0]
	; X86-SSE2-NEXT: pslldq {{.*#+}} xmm3 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm3[0]			; X86-SSE2-NEXT: psrldq {{.*#+}} xmm1 = xmm1[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; X86-SSE2-NEXT: psrldq {{.*#+}} xmm3 = xmm3[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; X86-SSE2-NEXT: movdqa %xmm0, %xmm3
	; X86-SSE2-NEXT: movdqa %xmm0, %xmm1			; X86-SSE2-NEXT: psllw %xmm1, %xmm3
	; X86-SSE2-NEXT: psllw %xmm3, %xmm1
	; X86-SSE2-NEXT: pcmpeqd %xmm4, %xmm4			; X86-SSE2-NEXT: pcmpeqd %xmm4, %xmm4
	; X86-SSE2-NEXT: pcmpeqd %xmm5, %xmm5			; X86-SSE2-NEXT: pcmpeqd %xmm5, %xmm5
	; X86-SSE2-NEXT: psllw %xmm3, %xmm5			; X86-SSE2-NEXT: psllw %xmm1, %xmm5
	; X86-SSE2-NEXT: punpcklbw {{.*#+}} xmm5 = xmm5[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]			; X86-SSE2-NEXT: punpcklbw {{.*#+}} xmm5 = xmm5[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
	; X86-SSE2-NEXT: pshuflw {{.*#+}} xmm3 = xmm5[0,0,0,0,4,5,6,7]			; X86-SSE2-NEXT: pshuflw {{.*#+}} xmm1 = xmm5[0,0,0,0,4,5,6,7]
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm3[0,0,0,0]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,0,0,0]
	; X86-SSE2-NEXT: pand %xmm3, %xmm1			; X86-SSE2-NEXT: pand %xmm3, %xmm1
	; X86-SSE2-NEXT: pslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0]			; X86-SSE2-NEXT: pslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0]
	; X86-SSE2-NEXT: psrldq {{.*#+}} xmm2 = xmm2[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; X86-SSE2-NEXT: psrldq {{.*#+}} xmm2 = xmm2[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; X86-SSE2-NEXT: psrlw %xmm2, %xmm0			; X86-SSE2-NEXT: psrlw %xmm2, %xmm0
	; X86-SSE2-NEXT: psrlw %xmm2, %xmm4			; X86-SSE2-NEXT: psrlw %xmm2, %xmm4
	; X86-SSE2-NEXT: psrlw $8, %xmm4			; X86-SSE2-NEXT: psrlw $8, %xmm4
	; X86-SSE2-NEXT: punpcklbw {{.*#+}} xmm4 = xmm4[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]			; X86-SSE2-NEXT: punpcklbw {{.*#+}} xmm4 = xmm4[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
	; X86-SSE2-NEXT: pshuflw {{.*#+}} xmm2 = xmm4[0,0,0,0,4,5,6,7]			; X86-SSE2-NEXT: pshuflw {{.*#+}} xmm2 = xmm4[0,0,0,0,4,5,6,7]
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,0,0,0]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,0,0,0]
	; X86-SSE2-NEXT: pand %xmm0, %xmm2			; X86-SSE2-NEXT: pand %xmm2, %xmm0
	; X86-SSE2-NEXT: por %xmm2, %xmm1			; X86-SSE2-NEXT: por %xmm1, %xmm0
	; X86-SSE2-NEXT: movdqa %xmm1, %xmm0
	; X86-SSE2-NEXT: retl			; X86-SSE2-NEXT: retl
	%splat = shufflevector <16 x i8> %amt, <16 x i8> undef, <16 x i32> zeroinitializer			%splat = shufflevector <16 x i8> %amt, <16 x i8> undef, <16 x i32> zeroinitializer
	%res = call <16 x i8> @llvm.fshl.v16i8(<16 x i8> %x, <16 x i8> %x, <16 x i8> %splat)			%res = call <16 x i8> @llvm.fshl.v16i8(<16 x i8> %x, <16 x i8> %x, <16 x i8> %splat)
	ret <16 x i8> %res			ret <16 x i8> %res
	}			}

	;			;
	; Constant Shifts			; Constant Shifts
	▲ Show 20 Lines • Show All 809 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-fshl-rot-sub128.ll

	Show First 20 Lines • Show All 433 Lines • ▼ Show 20 Lines

	;			;
	; Uniform Constant Shifts			; Uniform Constant Shifts
	;			;

	define <2 x i32> @splatconstant_funnnel_v2i32(<2 x i32> %x) nounwind {			define <2 x i32> @splatconstant_funnnel_v2i32(<2 x i32> %x) nounwind {
	; SSE2-LABEL: splatconstant_funnnel_v2i32:			; SSE2-LABEL: splatconstant_funnnel_v2i32:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa %xmm0, %xmm2
	; SSE2-NEXT: psrld $28, %xmm2
	; SSE2-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: movdqa %xmm0, %xmm1
	; SSE2-NEXT: pslld $4, %xmm1			; SSE2-NEXT: psrld $28, %xmm1
	; SSE2-NEXT: por %xmm2, %xmm1			; SSE2-NEXT: movdqa %xmm0, %xmm2
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,1],xmm0[2,3]			; SSE2-NEXT: pslld $4, %xmm2
	; SSE2-NEXT: movaps %xmm1, %xmm0			; SSE2-NEXT: por %xmm1, %xmm2
				; SSE2-NEXT: movsd %xmm2, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: splatconstant_funnnel_v2i32:			; SSE41-LABEL: splatconstant_funnnel_v2i32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: psrld $28, %xmm2
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: pslld $4, %xmm1			; SSE41-NEXT: psrld $28, %xmm1
	; SSE41-NEXT: por %xmm2, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1,2,3],xmm0[4,5,6,7]			; SSE41-NEXT: pslld $4, %xmm2
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: por %xmm1, %xmm2
				; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm2[0,1,2,3],xmm0[4,5,6,7]
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: splatconstant_funnnel_v2i32:			; AVX1-LABEL: splatconstant_funnnel_v2i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsrld $28, %xmm0, %xmm1			; AVX1-NEXT: vpsrld $28, %xmm0, %xmm1
	; AVX1-NEXT: vpslld $4, %xmm0, %xmm2			; AVX1-NEXT: vpslld $4, %xmm0, %xmm2
	; AVX1-NEXT: vpor %xmm1, %xmm2, %xmm1			; AVX1-NEXT: vpor %xmm1, %xmm2, %xmm1
	; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm1[0,1,2,3],xmm0[4,5,6,7]			; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm1[0,1,2,3],xmm0[4,5,6,7]
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	;			;
	; XOP-LABEL: splatconstant_funnnel_v2i32:			; XOP-LABEL: splatconstant_funnnel_v2i32:
	; XOP: # %bb.0:			; XOP: # %bb.0:
	; XOP-NEXT: vprotd $4, %xmm0, %xmm0			; XOP-NEXT: vprotd $4, %xmm0, %xmm0
	; XOP-NEXT: retq			; XOP-NEXT: retq
	;			;
	; X86-SSE2-LABEL: splatconstant_funnnel_v2i32:			; X86-SSE2-LABEL: splatconstant_funnnel_v2i32:
	; X86-SSE2: # %bb.0:			; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: movdqa %xmm0, %xmm2
	; X86-SSE2-NEXT: psrld $28, %xmm2
	; X86-SSE2-NEXT: movdqa %xmm0, %xmm1			; X86-SSE2-NEXT: movdqa %xmm0, %xmm1
	; X86-SSE2-NEXT: pslld $4, %xmm1			; X86-SSE2-NEXT: psrld $28, %xmm1
	; X86-SSE2-NEXT: por %xmm2, %xmm1			; X86-SSE2-NEXT: movdqa %xmm0, %xmm2
	; X86-SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,1],xmm0[2,3]			; X86-SSE2-NEXT: pslld $4, %xmm2
	; X86-SSE2-NEXT: movaps %xmm1, %xmm0			; X86-SSE2-NEXT: por %xmm1, %xmm2
				; X86-SSE2-NEXT: movsd %xmm2, %xmm0
	; X86-SSE2-NEXT: retl			; X86-SSE2-NEXT: retl
	%res = call <2 x i32> @llvm.fshl.v2i32(<2 x i32> %x, <2 x i32> %x, <2 x i32> <i32 4, i32 4>)			%res = call <2 x i32> @llvm.fshl.v2i32(<2 x i32> %x, <2 x i32> %x, <2 x i32> <i32 4, i32 4>)
	ret <2 x i32> %res			ret <2 x i32> %res
	}			}

llvm/test/CodeGen/X86/vector-fshr-128.ll

	Show All 28 Lines
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [63,63]			; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [63,63]
	; SSE2-NEXT: movdqa %xmm2, %xmm4			; SSE2-NEXT: movdqa %xmm2, %xmm4
	; SSE2-NEXT: pand %xmm3, %xmm4			; SSE2-NEXT: pand %xmm3, %xmm4
	; SSE2-NEXT: movdqa %xmm1, %xmm5			; SSE2-NEXT: movdqa %xmm1, %xmm5
	; SSE2-NEXT: psrlq %xmm4, %xmm5			; SSE2-NEXT: psrlq %xmm4, %xmm5
	; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm4[2,3,2,3]			; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm4[2,3,2,3]
	; SSE2-NEXT: psrlq %xmm4, %xmm1			; SSE2-NEXT: psrlq %xmm4, %xmm1
	; SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm5[0],xmm1[1]			; SSE2-NEXT: shufpd {{.*#+}} xmm5 = xmm5[0],xmm1[1]
	; SSE2-NEXT: pandn %xmm3, %xmm2			; SSE2-NEXT: pandn %xmm3, %xmm2
	; SSE2-NEXT: psllq $1, %xmm0			; SSE2-NEXT: psllq $1, %xmm0
	; SSE2-NEXT: movdqa %xmm0, %xmm3			; SSE2-NEXT: movdqa %xmm0, %xmm1
	; SSE2-NEXT: psllq %xmm2, %xmm3			; SSE2-NEXT: psllq %xmm2, %xmm1
	; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[2,3,2,3]			; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[2,3,2,3]
	; SSE2-NEXT: psllq %xmm2, %xmm0			; SSE2-NEXT: psllq %xmm2, %xmm0
	; SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm3[0],xmm0[1]			; SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
	; SSE2-NEXT: orpd %xmm1, %xmm0			; SSE2-NEXT: orpd %xmm5, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: var_funnnel_v2i64:			; SSE41-LABEL: var_funnnel_v2i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [63,63]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [63,63]
	; SSE41-NEXT: movdqa %xmm2, %xmm4			; SSE41-NEXT: movdqa %xmm2, %xmm4
	; SSE41-NEXT: pand %xmm3, %xmm4			; SSE41-NEXT: pand %xmm3, %xmm4
	; SSE41-NEXT: movdqa %xmm1, %xmm5			; SSE41-NEXT: movdqa %xmm1, %xmm5
	; SSE41-NEXT: psrlq %xmm4, %xmm5			; SSE41-NEXT: psrlq %xmm4, %xmm5
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm4[2,3,2,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm4[2,3,2,3]
	; SSE41-NEXT: psrlq %xmm4, %xmm1			; SSE41-NEXT: psrlq %xmm4, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm5[0,1,2,3],xmm1[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm5 = xmm5[0,1,2,3],xmm1[4,5,6,7]
	; SSE41-NEXT: pandn %xmm3, %xmm2			; SSE41-NEXT: pandn %xmm3, %xmm2
	; SSE41-NEXT: psllq $1, %xmm0			; SSE41-NEXT: psllq $1, %xmm0
	; SSE41-NEXT: movdqa %xmm0, %xmm3			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: psllq %xmm2, %xmm3			; SSE41-NEXT: psllq %xmm2, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[2,3,2,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[2,3,2,3]
	; SSE41-NEXT: psllq %xmm2, %xmm0			; SSE41-NEXT: psllq %xmm2, %xmm0
	; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm3[0,1,2,3],xmm0[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm1[0,1,2,3],xmm0[4,5,6,7]
	; SSE41-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: var_funnnel_v2i64:			; AVX1-LABEL: var_funnnel_v2i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [63,63]
	; AVX1-NEXT: vpand %xmm3, %xmm2, %xmm4			; AVX1-NEXT: vpand %xmm3, %xmm2, %xmm4
	; AVX1-NEXT: vpsrlq %xmm4, %xmm1, %xmm5			; AVX1-NEXT: vpsrlq %xmm4, %xmm1, %xmm5
	; AVX1-NEXT: vpshufd {{.*#+}} xmm4 = xmm4[2,3,2,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm4 = xmm4[2,3,2,3]
	▲ Show 20 Lines • Show All 100 Lines • ▼ Show 20 Lines
	; XOPAVX2-NEXT: vpandn %xmm3, %xmm2, %xmm2			; XOPAVX2-NEXT: vpandn %xmm3, %xmm2, %xmm2
	; XOPAVX2-NEXT: vpsllq $1, %xmm0, %xmm0			; XOPAVX2-NEXT: vpsllq $1, %xmm0, %xmm0
	; XOPAVX2-NEXT: vpsllvq %xmm2, %xmm0, %xmm0			; XOPAVX2-NEXT: vpsllvq %xmm2, %xmm0, %xmm0
	; XOPAVX2-NEXT: vpor %xmm1, %xmm0, %xmm0			; XOPAVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; XOPAVX2-NEXT: retq			; XOPAVX2-NEXT: retq
	;			;
	; X86-SSE2-LABEL: var_funnnel_v2i64:			; X86-SSE2-LABEL: var_funnnel_v2i64:
	; X86-SSE2: # %bb.0:			; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: movdqa {{.*#+}} xmm3 = [63,0,63,0]			; X86-SSE2-NEXT: movdqa {{.*#+}} xmm4 = [63,0,63,0]
	; X86-SSE2-NEXT: movdqa %xmm2, %xmm4			; X86-SSE2-NEXT: movdqa %xmm2, %xmm5
	; X86-SSE2-NEXT: pand %xmm3, %xmm4			; X86-SSE2-NEXT: pand %xmm4, %xmm5
	; X86-SSE2-NEXT: movdqa %xmm1, %xmm5			; X86-SSE2-NEXT: movdqa %xmm1, %xmm3
	; X86-SSE2-NEXT: psrlq %xmm4, %xmm5			; X86-SSE2-NEXT: psrlq %xmm5, %xmm3
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm4[2,3,2,3]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm5[2,3,2,3]
	; X86-SSE2-NEXT: psrlq %xmm4, %xmm1			; X86-SSE2-NEXT: psrlq %xmm5, %xmm1
	; X86-SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm5[0],xmm1[1]			; X86-SSE2-NEXT: shufpd {{.*#+}} xmm3 = xmm3[0],xmm1[1]
	; X86-SSE2-NEXT: pandn %xmm3, %xmm2			; X86-SSE2-NEXT: pandn %xmm4, %xmm2
	; X86-SSE2-NEXT: psllq $1, %xmm0			; X86-SSE2-NEXT: psllq $1, %xmm0
	; X86-SSE2-NEXT: movdqa %xmm0, %xmm3			; X86-SSE2-NEXT: movdqa %xmm0, %xmm1
	; X86-SSE2-NEXT: psllq %xmm2, %xmm3			; X86-SSE2-NEXT: psllq %xmm2, %xmm1
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[2,3,2,3]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[2,3,2,3]
	; X86-SSE2-NEXT: psllq %xmm2, %xmm0			; X86-SSE2-NEXT: psllq %xmm2, %xmm0
	; X86-SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm3[0],xmm0[1]			; X86-SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
	; X86-SSE2-NEXT: orpd %xmm1, %xmm0			; X86-SSE2-NEXT: orpd %xmm3, %xmm0
	; X86-SSE2-NEXT: retl			; X86-SSE2-NEXT: retl
	%res = call <2 x i64> @llvm.fshr.v2i64(<2 x i64> %x, <2 x i64> %y, <2 x i64> %amt)			%res = call <2 x i64> @llvm.fshr.v2i64(<2 x i64> %x, <2 x i64> %y, <2 x i64> %amt)
	ret <2 x i64> %res			ret <2 x i64> %res
	}			}

	define <4 x i32> @var_funnnel_v4i32(<4 x i32> %x, <4 x i32> %y, <4 x i32> %amt) nounwind {			define <4 x i32> @var_funnnel_v4i32(<4 x i32> %x, <4 x i32> %y, <4 x i32> %amt) nounwind {
	; SSE2-LABEL: var_funnnel_v4i32:			; SSE2-LABEL: var_funnnel_v4i32:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: psrld %xmm7, %xmm3			; SSE41-NEXT: psrld %xmm7, %xmm3
	; SSE41-NEXT: pblendw {{.*#+}} xmm3 = xmm6[0,1,2,3],xmm3[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm3 = xmm6[0,1,2,3],xmm3[4,5,6,7]
	; SSE41-NEXT: pshuflw {{.*#+}} xmm4 = xmm4[0,1,1,1,4,5,6,7]			; SSE41-NEXT: pshuflw {{.*#+}} xmm4 = xmm4[0,1,1,1,4,5,6,7]
	; SSE41-NEXT: movdqa %xmm1, %xmm6			; SSE41-NEXT: movdqa %xmm1, %xmm6
	; SSE41-NEXT: psrld %xmm4, %xmm6			; SSE41-NEXT: psrld %xmm4, %xmm6
	; SSE41-NEXT: pshuflw {{.*#+}} xmm4 = xmm5[0,1,1,1,4,5,6,7]			; SSE41-NEXT: pshuflw {{.*#+}} xmm4 = xmm5[0,1,1,1,4,5,6,7]
	; SSE41-NEXT: psrld %xmm4, %xmm1			; SSE41-NEXT: psrld %xmm4, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm6[0,1,2,3],xmm1[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm6[0,1,2,3],xmm1[4,5,6,7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm3[2,3],xmm1[4,5],xmm3[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm6 = xmm6[0,1],xmm3[2,3],xmm6[4,5],xmm3[6,7]
	; SSE41-NEXT: pandn %xmm8, %xmm2			; SSE41-NEXT: pandn %xmm8, %xmm2
	; SSE41-NEXT: pslld $23, %xmm2			; SSE41-NEXT: pslld $23, %xmm2
	; SSE41-NEXT: paddd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2			; SSE41-NEXT: paddd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
	; SSE41-NEXT: cvttps2dq %xmm2, %xmm2			; SSE41-NEXT: cvttps2dq %xmm2, %xmm1
	; SSE41-NEXT: pslld $1, %xmm0			; SSE41-NEXT: pslld $1, %xmm0
	; SSE41-NEXT: pmulld %xmm2, %xmm0			; SSE41-NEXT: pmulld %xmm1, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: var_funnnel_v4i32:			; AVX1-LABEL: var_funnnel_v4i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [31,31,31,31]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [31,31,31,31]
	; AVX1-NEXT: vpand %xmm3, %xmm2, %xmm4			; AVX1-NEXT: vpand %xmm3, %xmm2, %xmm4
	; AVX1-NEXT: vpsrldq {{.*#+}} xmm5 = xmm4[12,13,14,15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; AVX1-NEXT: vpsrldq {{.*#+}} xmm5 = xmm4[12,13,14,15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; AVX1-NEXT: vpsrld %xmm5, %xmm1, %xmm5			; AVX1-NEXT: vpsrld %xmm5, %xmm1, %xmm5
	▲ Show 20 Lines • Show All 177 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: psrlw $2, %xmm1			; SSE2-NEXT: psrlw $2, %xmm1
	; SSE2-NEXT: pand %xmm4, %xmm1			; SSE2-NEXT: pand %xmm4, %xmm1
	; SSE2-NEXT: por %xmm5, %xmm1			; SSE2-NEXT: por %xmm5, %xmm1
	; SSE2-NEXT: paddw %xmm3, %xmm3			; SSE2-NEXT: paddw %xmm3, %xmm3
	; SSE2-NEXT: psraw $15, %xmm3			; SSE2-NEXT: psraw $15, %xmm3
	; SSE2-NEXT: movdqa %xmm3, %xmm4			; SSE2-NEXT: movdqa %xmm3, %xmm4
	; SSE2-NEXT: pandn %xmm1, %xmm4			; SSE2-NEXT: pandn %xmm1, %xmm4
	; SSE2-NEXT: psrlw $1, %xmm1			; SSE2-NEXT: psrlw $1, %xmm1
	; SSE2-NEXT: pand %xmm3, %xmm1			; SSE2-NEXT: pand %xmm1, %xmm3
	; SSE2-NEXT: pandn {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2			; SSE2-NEXT: pandn {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
	; SSE2-NEXT: movdqa %xmm2, %xmm3			; SSE2-NEXT: movdqa %xmm2, %xmm1
	; SSE2-NEXT: punpckhwd {{.*#+}} xmm3 = xmm3[4,4,5,5,6,6,7,7]			; SSE2-NEXT: punpckhwd {{.*#+}} xmm1 = xmm1[4,4,5,5,6,6,7,7]
	; SSE2-NEXT: pslld $23, %xmm3			; SSE2-NEXT: pslld $23, %xmm1
	; SSE2-NEXT: movdqa {{.*#+}} xmm5 = [1065353216,1065353216,1065353216,1065353216]			; SSE2-NEXT: movdqa {{.*#+}} xmm5 = [1065353216,1065353216,1065353216,1065353216]
	; SSE2-NEXT: paddd %xmm5, %xmm3			; SSE2-NEXT: paddd %xmm5, %xmm1
	; SSE2-NEXT: cvttps2dq %xmm3, %xmm3			; SSE2-NEXT: cvttps2dq %xmm1, %xmm1
	; SSE2-NEXT: pshuflw {{.*#+}} xmm3 = xmm3[0,2,2,3,4,5,6,7]			; SSE2-NEXT: pshuflw {{.*#+}} xmm1 = xmm1[0,2,2,3,4,5,6,7]
	; SSE2-NEXT: pshufhw {{.*#+}} xmm3 = xmm3[0,1,2,3,4,6,6,7]			; SSE2-NEXT: pshufhw {{.*#+}} xmm1 = xmm1[0,1,2,3,4,6,6,7]
	; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm3[0,2,2,3]			; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,2,2,3]
	; SSE2-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0,0,1,1,2,2,3,3]			; SSE2-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0,0,1,1,2,2,3,3]
	; SSE2-NEXT: pslld $23, %xmm2			; SSE2-NEXT: pslld $23, %xmm2
	; SSE2-NEXT: paddd %xmm5, %xmm2			; SSE2-NEXT: paddd %xmm5, %xmm2
	; SSE2-NEXT: cvttps2dq %xmm2, %xmm2			; SSE2-NEXT: cvttps2dq %xmm2, %xmm2
	; SSE2-NEXT: pshuflw {{.*#+}} xmm2 = xmm2[0,2,2,3,4,5,6,7]			; SSE2-NEXT: pshuflw {{.*#+}} xmm2 = xmm2[0,2,2,3,4,5,6,7]
	; SSE2-NEXT: pshufhw {{.*#+}} xmm2 = xmm2[0,1,2,3,4,6,6,7]			; SSE2-NEXT: pshufhw {{.*#+}} xmm2 = xmm2[0,1,2,3,4,6,6,7]
	; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,2,2,3]			; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,2,2,3]
	; SSE2-NEXT: punpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm3[0]			; SSE2-NEXT: punpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm1[0]
	; SSE2-NEXT: psllw $1, %xmm0			; SSE2-NEXT: psllw $1, %xmm0
	; SSE2-NEXT: pmullw %xmm2, %xmm0			; SSE2-NEXT: pmullw %xmm2, %xmm0
	; SSE2-NEXT: por %xmm4, %xmm0			; SSE2-NEXT: por %xmm4, %xmm0
	; SSE2-NEXT: por %xmm1, %xmm0			; SSE2-NEXT: por %xmm3, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: var_funnnel_v8i16:			; SSE41-LABEL: var_funnnel_v8i16:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm3			; SSE41-NEXT: movdqa %xmm0, %xmm3
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [15,15,15,15,15,15,15,15]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [15,15,15,15,15,15,15,15]
	; SSE41-NEXT: movdqa %xmm2, %xmm0			; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: pand %xmm5, %xmm0			; SSE41-NEXT: pand %xmm5, %xmm0
	▲ Show 20 Lines • Show All 206 Lines • ▼ Show 20 Lines
	; X86-SSE2-NEXT: psrlw $2, %xmm1			; X86-SSE2-NEXT: psrlw $2, %xmm1
	; X86-SSE2-NEXT: pand %xmm4, %xmm1			; X86-SSE2-NEXT: pand %xmm4, %xmm1
	; X86-SSE2-NEXT: por %xmm5, %xmm1			; X86-SSE2-NEXT: por %xmm5, %xmm1
	; X86-SSE2-NEXT: paddw %xmm3, %xmm3			; X86-SSE2-NEXT: paddw %xmm3, %xmm3
	; X86-SSE2-NEXT: psraw $15, %xmm3			; X86-SSE2-NEXT: psraw $15, %xmm3
	; X86-SSE2-NEXT: movdqa %xmm3, %xmm4			; X86-SSE2-NEXT: movdqa %xmm3, %xmm4
	; X86-SSE2-NEXT: pandn %xmm1, %xmm4			; X86-SSE2-NEXT: pandn %xmm1, %xmm4
	; X86-SSE2-NEXT: psrlw $1, %xmm1			; X86-SSE2-NEXT: psrlw $1, %xmm1
	; X86-SSE2-NEXT: pand %xmm3, %xmm1			; X86-SSE2-NEXT: pand %xmm1, %xmm3
	; X86-SSE2-NEXT: pandn {{\.?LCPI[0-9]+_[0-9]+}}, %xmm2			; X86-SSE2-NEXT: pandn {{\.?LCPI[0-9]+_[0-9]+}}, %xmm2
	; X86-SSE2-NEXT: movdqa %xmm2, %xmm3			; X86-SSE2-NEXT: movdqa %xmm2, %xmm1
	; X86-SSE2-NEXT: punpckhwd {{.*#+}} xmm3 = xmm3[4,4,5,5,6,6,7,7]			; X86-SSE2-NEXT: punpckhwd {{.*#+}} xmm1 = xmm1[4,4,5,5,6,6,7,7]
	; X86-SSE2-NEXT: pslld $23, %xmm3			; X86-SSE2-NEXT: pslld $23, %xmm1
	; X86-SSE2-NEXT: movdqa {{.*#+}} xmm5 = [1065353216,1065353216,1065353216,1065353216]			; X86-SSE2-NEXT: movdqa {{.*#+}} xmm5 = [1065353216,1065353216,1065353216,1065353216]
	; X86-SSE2-NEXT: paddd %xmm5, %xmm3			; X86-SSE2-NEXT: paddd %xmm5, %xmm1
	; X86-SSE2-NEXT: cvttps2dq %xmm3, %xmm3			; X86-SSE2-NEXT: cvttps2dq %xmm1, %xmm1
	; X86-SSE2-NEXT: pshuflw {{.*#+}} xmm3 = xmm3[0,2,2,3,4,5,6,7]			; X86-SSE2-NEXT: pshuflw {{.*#+}} xmm1 = xmm1[0,2,2,3,4,5,6,7]
	; X86-SSE2-NEXT: pshufhw {{.*#+}} xmm3 = xmm3[0,1,2,3,4,6,6,7]			; X86-SSE2-NEXT: pshufhw {{.*#+}} xmm1 = xmm1[0,1,2,3,4,6,6,7]
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm3[0,2,2,3]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,2,2,3]
	; X86-SSE2-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0,0,1,1,2,2,3,3]			; X86-SSE2-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0,0,1,1,2,2,3,3]
	; X86-SSE2-NEXT: pslld $23, %xmm2			; X86-SSE2-NEXT: pslld $23, %xmm2
	; X86-SSE2-NEXT: paddd %xmm5, %xmm2			; X86-SSE2-NEXT: paddd %xmm5, %xmm2
	; X86-SSE2-NEXT: cvttps2dq %xmm2, %xmm2			; X86-SSE2-NEXT: cvttps2dq %xmm2, %xmm2
	; X86-SSE2-NEXT: pshuflw {{.*#+}} xmm2 = xmm2[0,2,2,3,4,5,6,7]			; X86-SSE2-NEXT: pshuflw {{.*#+}} xmm2 = xmm2[0,2,2,3,4,5,6,7]
	; X86-SSE2-NEXT: pshufhw {{.*#+}} xmm2 = xmm2[0,1,2,3,4,6,6,7]			; X86-SSE2-NEXT: pshufhw {{.*#+}} xmm2 = xmm2[0,1,2,3,4,6,6,7]
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,2,2,3]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,2,2,3]
	; X86-SSE2-NEXT: punpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm3[0]			; X86-SSE2-NEXT: punpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm1[0]
	; X86-SSE2-NEXT: psllw $1, %xmm0			; X86-SSE2-NEXT: psllw $1, %xmm0
	; X86-SSE2-NEXT: pmullw %xmm2, %xmm0			; X86-SSE2-NEXT: pmullw %xmm2, %xmm0
	; X86-SSE2-NEXT: por %xmm4, %xmm0			; X86-SSE2-NEXT: por %xmm4, %xmm0
	; X86-SSE2-NEXT: por %xmm1, %xmm0			; X86-SSE2-NEXT: por %xmm3, %xmm0
	; X86-SSE2-NEXT: retl			; X86-SSE2-NEXT: retl
	%res = call <8 x i16> @llvm.fshr.v8i16(<8 x i16> %x, <8 x i16> %y, <8 x i16> %amt)			%res = call <8 x i16> @llvm.fshr.v8i16(<8 x i16> %x, <8 x i16> %y, <8 x i16> %amt)
	ret <8 x i16> %res			ret <8 x i16> %res
	}			}

	define <16 x i8> @var_funnnel_v16i8(<16 x i8> %x, <16 x i8> %y, <16 x i8> %amt) nounwind {			define <16 x i8> @var_funnnel_v16i8(<16 x i8> %x, <16 x i8> %y, <16 x i8> %amt) nounwind {
	; SSE2-LABEL: var_funnnel_v16i8:			; SSE2-LABEL: var_funnnel_v16i8:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7]			; SSE2-NEXT: movdqa {{.*#+}} xmm5 = [7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7]
	; SSE2-NEXT: movdqa %xmm2, %xmm5			; SSE2-NEXT: movdqa %xmm2, %xmm6
	; SSE2-NEXT: pand %xmm4, %xmm5			; SSE2-NEXT: pand %xmm5, %xmm6
	; SSE2-NEXT: psllw $5, %xmm5			; SSE2-NEXT: psllw $5, %xmm6
	; SSE2-NEXT: pxor %xmm3, %xmm3			; SSE2-NEXT: pxor %xmm3, %xmm3
	; SSE2-NEXT: pxor %xmm6, %xmm6			; SSE2-NEXT: pxor %xmm4, %xmm4
	; SSE2-NEXT: pcmpgtb %xmm5, %xmm6			; SSE2-NEXT: pcmpgtb %xmm6, %xmm4
	; SSE2-NEXT: movdqa %xmm6, %xmm7			; SSE2-NEXT: movdqa %xmm4, %xmm7
	; SSE2-NEXT: pandn %xmm1, %xmm7			; SSE2-NEXT: pandn %xmm1, %xmm7
	; SSE2-NEXT: psrlw $4, %xmm1			; SSE2-NEXT: psrlw $4, %xmm1
	; SSE2-NEXT: pand %xmm6, %xmm1			; SSE2-NEXT: pand %xmm4, %xmm1
	; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE2-NEXT: por %xmm7, %xmm1			; SSE2-NEXT: por %xmm7, %xmm1
	; SSE2-NEXT: paddb %xmm5, %xmm5			; SSE2-NEXT: paddb %xmm6, %xmm6
	; SSE2-NEXT: pxor %xmm6, %xmm6			; SSE2-NEXT: pxor %xmm4, %xmm4
	; SSE2-NEXT: pcmpgtb %xmm5, %xmm6			; SSE2-NEXT: pcmpgtb %xmm6, %xmm4
	; SSE2-NEXT: movdqa %xmm6, %xmm7			; SSE2-NEXT: movdqa %xmm4, %xmm7
	; SSE2-NEXT: pandn %xmm1, %xmm7			; SSE2-NEXT: pandn %xmm1, %xmm7
	; SSE2-NEXT: psrlw $2, %xmm1			; SSE2-NEXT: psrlw $2, %xmm1
	; SSE2-NEXT: pand %xmm6, %xmm1			; SSE2-NEXT: pand %xmm4, %xmm1
	; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE2-NEXT: por %xmm7, %xmm1			; SSE2-NEXT: por %xmm7, %xmm1
	; SSE2-NEXT: paddb %xmm5, %xmm5			; SSE2-NEXT: paddb %xmm6, %xmm6
	; SSE2-NEXT: pxor %xmm6, %xmm6			; SSE2-NEXT: pxor %xmm4, %xmm4
	; SSE2-NEXT: pcmpgtb %xmm5, %xmm6			; SSE2-NEXT: pcmpgtb %xmm6, %xmm4
	; SSE2-NEXT: movdqa %xmm6, %xmm5			; SSE2-NEXT: movdqa %xmm4, %xmm6
	; SSE2-NEXT: pandn %xmm1, %xmm5			; SSE2-NEXT: pandn %xmm1, %xmm6
	; SSE2-NEXT: psrlw $1, %xmm1			; SSE2-NEXT: psrlw $1, %xmm1
	; SSE2-NEXT: pand %xmm6, %xmm1			; SSE2-NEXT: pand %xmm1, %xmm4
	; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm4
	; SSE2-NEXT: por %xmm5, %xmm1			; SSE2-NEXT: por %xmm6, %xmm4
	; SSE2-NEXT: pandn %xmm4, %xmm2			; SSE2-NEXT: pandn %xmm5, %xmm2
	; SSE2-NEXT: psllw $5, %xmm2			; SSE2-NEXT: psllw $5, %xmm2
	; SSE2-NEXT: pxor %xmm4, %xmm4			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpgtb %xmm2, %xmm4			; SSE2-NEXT: pcmpgtb %xmm2, %xmm1
	; SSE2-NEXT: paddb %xmm0, %xmm0			; SSE2-NEXT: paddb %xmm0, %xmm0
	; SSE2-NEXT: movdqa %xmm4, %xmm5			; SSE2-NEXT: movdqa %xmm1, %xmm5
	; SSE2-NEXT: pandn %xmm0, %xmm5			; SSE2-NEXT: pandn %xmm0, %xmm5
	; SSE2-NEXT: psllw $4, %xmm0			; SSE2-NEXT: psllw $4, %xmm0
	; SSE2-NEXT: pand %xmm4, %xmm0			; SSE2-NEXT: pand %xmm1, %xmm0
	; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE2-NEXT: por %xmm5, %xmm0			; SSE2-NEXT: por %xmm5, %xmm0
	; SSE2-NEXT: paddb %xmm2, %xmm2			; SSE2-NEXT: paddb %xmm2, %xmm2
	; SSE2-NEXT: pxor %xmm4, %xmm4			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpgtb %xmm2, %xmm4			; SSE2-NEXT: pcmpgtb %xmm2, %xmm1
	; SSE2-NEXT: movdqa %xmm4, %xmm5			; SSE2-NEXT: movdqa %xmm1, %xmm5
	; SSE2-NEXT: pandn %xmm0, %xmm5			; SSE2-NEXT: pandn %xmm0, %xmm5
	; SSE2-NEXT: psllw $2, %xmm0			; SSE2-NEXT: psllw $2, %xmm0
	; SSE2-NEXT: pand %xmm4, %xmm0			; SSE2-NEXT: pand %xmm1, %xmm0
	; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE2-NEXT: por %xmm5, %xmm0			; SSE2-NEXT: por %xmm5, %xmm0
	; SSE2-NEXT: paddb %xmm2, %xmm2			; SSE2-NEXT: paddb %xmm2, %xmm2
	; SSE2-NEXT: pcmpgtb %xmm2, %xmm3			; SSE2-NEXT: pcmpgtb %xmm2, %xmm3
	; SSE2-NEXT: movdqa %xmm3, %xmm2			; SSE2-NEXT: movdqa %xmm3, %xmm1
	; SSE2-NEXT: pandn %xmm0, %xmm2			; SSE2-NEXT: pandn %xmm0, %xmm1
	; SSE2-NEXT: por %xmm1, %xmm2			; SSE2-NEXT: por %xmm4, %xmm1
	; SSE2-NEXT: paddb %xmm0, %xmm0			; SSE2-NEXT: paddb %xmm0, %xmm0
	; SSE2-NEXT: pand %xmm3, %xmm0			; SSE2-NEXT: pand %xmm3, %xmm0
	; SSE2-NEXT: por %xmm2, %xmm0			; SSE2-NEXT: por %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: var_funnnel_v16i8:			; SSE41-LABEL: var_funnnel_v16i8:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm2, %xmm3			; SSE41-NEXT: movdqa %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7]
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	▲ Show 20 Lines • Show All 186 Lines • ▼ Show 20 Lines
	; XOP-NEXT: vpandn %xmm3, %xmm2, %xmm2			; XOP-NEXT: vpandn %xmm3, %xmm2, %xmm2
	; XOP-NEXT: vpaddb %xmm0, %xmm0, %xmm0			; XOP-NEXT: vpaddb %xmm0, %xmm0, %xmm0
	; XOP-NEXT: vpshlb %xmm2, %xmm0, %xmm0			; XOP-NEXT: vpshlb %xmm2, %xmm0, %xmm0
	; XOP-NEXT: vpor %xmm1, %xmm0, %xmm0			; XOP-NEXT: vpor %xmm1, %xmm0, %xmm0
	; XOP-NEXT: retq			; XOP-NEXT: retq
	;			;
	; X86-SSE2-LABEL: var_funnnel_v16i8:			; X86-SSE2-LABEL: var_funnnel_v16i8:
	; X86-SSE2: # %bb.0:			; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: movdqa {{.*#+}} xmm4 = [7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7]			; X86-SSE2-NEXT: movdqa {{.*#+}} xmm5 = [7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7]
	; X86-SSE2-NEXT: movdqa %xmm2, %xmm5			; X86-SSE2-NEXT: movdqa %xmm2, %xmm6
	; X86-SSE2-NEXT: pand %xmm4, %xmm5			; X86-SSE2-NEXT: pand %xmm5, %xmm6
	; X86-SSE2-NEXT: psllw $5, %xmm5			; X86-SSE2-NEXT: psllw $5, %xmm6
	; X86-SSE2-NEXT: pxor %xmm3, %xmm3			; X86-SSE2-NEXT: pxor %xmm3, %xmm3
	; X86-SSE2-NEXT: pxor %xmm6, %xmm6			; X86-SSE2-NEXT: pxor %xmm4, %xmm4
	; X86-SSE2-NEXT: pcmpgtb %xmm5, %xmm6			; X86-SSE2-NEXT: pcmpgtb %xmm6, %xmm4
	; X86-SSE2-NEXT: movdqa %xmm6, %xmm7			; X86-SSE2-NEXT: movdqa %xmm4, %xmm7
	; X86-SSE2-NEXT: pandn %xmm1, %xmm7			; X86-SSE2-NEXT: pandn %xmm1, %xmm7
	; X86-SSE2-NEXT: psrlw $4, %xmm1			; X86-SSE2-NEXT: psrlw $4, %xmm1
	; X86-SSE2-NEXT: pand %xmm6, %xmm1			; X86-SSE2-NEXT: pand %xmm4, %xmm1
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm1			; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm1
	; X86-SSE2-NEXT: por %xmm7, %xmm1			; X86-SSE2-NEXT: por %xmm7, %xmm1
	; X86-SSE2-NEXT: paddb %xmm5, %xmm5			; X86-SSE2-NEXT: paddb %xmm6, %xmm6
	; X86-SSE2-NEXT: pxor %xmm6, %xmm6			; X86-SSE2-NEXT: pxor %xmm4, %xmm4
	; X86-SSE2-NEXT: pcmpgtb %xmm5, %xmm6			; X86-SSE2-NEXT: pcmpgtb %xmm6, %xmm4
	; X86-SSE2-NEXT: movdqa %xmm6, %xmm7			; X86-SSE2-NEXT: movdqa %xmm4, %xmm7
	; X86-SSE2-NEXT: pandn %xmm1, %xmm7			; X86-SSE2-NEXT: pandn %xmm1, %xmm7
	; X86-SSE2-NEXT: psrlw $2, %xmm1			; X86-SSE2-NEXT: psrlw $2, %xmm1
	; X86-SSE2-NEXT: pand %xmm6, %xmm1			; X86-SSE2-NEXT: pand %xmm4, %xmm1
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm1			; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm1
	; X86-SSE2-NEXT: por %xmm7, %xmm1			; X86-SSE2-NEXT: por %xmm7, %xmm1
	; X86-SSE2-NEXT: paddb %xmm5, %xmm5			; X86-SSE2-NEXT: paddb %xmm6, %xmm6
	; X86-SSE2-NEXT: pxor %xmm6, %xmm6			; X86-SSE2-NEXT: pxor %xmm4, %xmm4
	; X86-SSE2-NEXT: pcmpgtb %xmm5, %xmm6			; X86-SSE2-NEXT: pcmpgtb %xmm6, %xmm4
	; X86-SSE2-NEXT: movdqa %xmm6, %xmm5			; X86-SSE2-NEXT: movdqa %xmm4, %xmm6
	; X86-SSE2-NEXT: pandn %xmm1, %xmm5			; X86-SSE2-NEXT: pandn %xmm1, %xmm6
	; X86-SSE2-NEXT: psrlw $1, %xmm1			; X86-SSE2-NEXT: psrlw $1, %xmm1
	; X86-SSE2-NEXT: pand %xmm6, %xmm1			; X86-SSE2-NEXT: pand %xmm1, %xmm4
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm1			; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm4
	; X86-SSE2-NEXT: por %xmm5, %xmm1			; X86-SSE2-NEXT: por %xmm6, %xmm4
	; X86-SSE2-NEXT: pandn %xmm4, %xmm2			; X86-SSE2-NEXT: pandn %xmm5, %xmm2
	; X86-SSE2-NEXT: psllw $5, %xmm2			; X86-SSE2-NEXT: psllw $5, %xmm2
	; X86-SSE2-NEXT: pxor %xmm4, %xmm4			; X86-SSE2-NEXT: pxor %xmm1, %xmm1
	; X86-SSE2-NEXT: pcmpgtb %xmm2, %xmm4			; X86-SSE2-NEXT: pcmpgtb %xmm2, %xmm1
	; X86-SSE2-NEXT: paddb %xmm0, %xmm0			; X86-SSE2-NEXT: paddb %xmm0, %xmm0
	; X86-SSE2-NEXT: movdqa %xmm4, %xmm5			; X86-SSE2-NEXT: movdqa %xmm1, %xmm5
	; X86-SSE2-NEXT: pandn %xmm0, %xmm5			; X86-SSE2-NEXT: pandn %xmm0, %xmm5
	; X86-SSE2-NEXT: psllw $4, %xmm0			; X86-SSE2-NEXT: psllw $4, %xmm0
	; X86-SSE2-NEXT: pand %xmm4, %xmm0			; X86-SSE2-NEXT: pand %xmm1, %xmm0
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0			; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0
	; X86-SSE2-NEXT: por %xmm5, %xmm0			; X86-SSE2-NEXT: por %xmm5, %xmm0
	; X86-SSE2-NEXT: paddb %xmm2, %xmm2			; X86-SSE2-NEXT: paddb %xmm2, %xmm2
	; X86-SSE2-NEXT: pxor %xmm4, %xmm4			; X86-SSE2-NEXT: pxor %xmm1, %xmm1
	; X86-SSE2-NEXT: pcmpgtb %xmm2, %xmm4			; X86-SSE2-NEXT: pcmpgtb %xmm2, %xmm1
	; X86-SSE2-NEXT: movdqa %xmm4, %xmm5			; X86-SSE2-NEXT: movdqa %xmm1, %xmm5
	; X86-SSE2-NEXT: pandn %xmm0, %xmm5			; X86-SSE2-NEXT: pandn %xmm0, %xmm5
	; X86-SSE2-NEXT: psllw $2, %xmm0			; X86-SSE2-NEXT: psllw $2, %xmm0
	; X86-SSE2-NEXT: pand %xmm4, %xmm0			; X86-SSE2-NEXT: pand %xmm1, %xmm0
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0			; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0
	; X86-SSE2-NEXT: por %xmm5, %xmm0			; X86-SSE2-NEXT: por %xmm5, %xmm0
	; X86-SSE2-NEXT: paddb %xmm2, %xmm2			; X86-SSE2-NEXT: paddb %xmm2, %xmm2
	; X86-SSE2-NEXT: pcmpgtb %xmm2, %xmm3			; X86-SSE2-NEXT: pcmpgtb %xmm2, %xmm3
	; X86-SSE2-NEXT: movdqa %xmm3, %xmm2			; X86-SSE2-NEXT: movdqa %xmm3, %xmm1
	; X86-SSE2-NEXT: pandn %xmm0, %xmm2			; X86-SSE2-NEXT: pandn %xmm0, %xmm1
	; X86-SSE2-NEXT: por %xmm1, %xmm2			; X86-SSE2-NEXT: por %xmm4, %xmm1
	; X86-SSE2-NEXT: paddb %xmm0, %xmm0			; X86-SSE2-NEXT: paddb %xmm0, %xmm0
	; X86-SSE2-NEXT: pand %xmm3, %xmm0			; X86-SSE2-NEXT: pand %xmm3, %xmm0
	; X86-SSE2-NEXT: por %xmm2, %xmm0			; X86-SSE2-NEXT: por %xmm1, %xmm0
	; X86-SSE2-NEXT: retl			; X86-SSE2-NEXT: retl
	%res = call <16 x i8> @llvm.fshr.v16i8(<16 x i8> %x, <16 x i8> %y, <16 x i8> %amt)			%res = call <16 x i8> @llvm.fshr.v16i8(<16 x i8> %x, <16 x i8> %y, <16 x i8> %amt)
	ret <16 x i8> %res			ret <16 x i8> %res
	}			}

	;			;
	; Uniform Variable Shifts			; Uniform Variable Shifts
	;			;
	▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines
	; XOP-NEXT: vpandn %xmm3, %xmm2, %xmm2			; XOP-NEXT: vpandn %xmm3, %xmm2, %xmm2
	; XOP-NEXT: vpsllq $1, %xmm0, %xmm0			; XOP-NEXT: vpsllq $1, %xmm0, %xmm0
	; XOP-NEXT: vpsllq %xmm2, %xmm0, %xmm0			; XOP-NEXT: vpsllq %xmm2, %xmm0, %xmm0
	; XOP-NEXT: vpor %xmm1, %xmm0, %xmm0			; XOP-NEXT: vpor %xmm1, %xmm0, %xmm0
	; XOP-NEXT: retq			; XOP-NEXT: retq
	;			;
	; X86-SSE2-LABEL: splatvar_funnnel_v2i64:			; X86-SSE2-LABEL: splatvar_funnnel_v2i64:
	; X86-SSE2: # %bb.0:			; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,1,0,1]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm2[0,1,0,1]
	; X86-SSE2-NEXT: movdqa {{.*#+}} xmm3 = [63,0,63,0]			; X86-SSE2-NEXT: movdqa {{.*#+}} xmm4 = [63,0,63,0]
	; X86-SSE2-NEXT: movdqa %xmm2, %xmm4			; X86-SSE2-NEXT: movdqa %xmm3, %xmm5
	; X86-SSE2-NEXT: pand %xmm3, %xmm4			; X86-SSE2-NEXT: pand %xmm4, %xmm5
	; X86-SSE2-NEXT: movdqa %xmm1, %xmm5			; X86-SSE2-NEXT: movdqa %xmm1, %xmm2
	; X86-SSE2-NEXT: psrlq %xmm4, %xmm5			; X86-SSE2-NEXT: psrlq %xmm5, %xmm2
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm4[2,3,2,3]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm5[2,3,2,3]
	; X86-SSE2-NEXT: psrlq %xmm4, %xmm1			; X86-SSE2-NEXT: psrlq %xmm5, %xmm1
	; X86-SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm5[0],xmm1[1]			; X86-SSE2-NEXT: shufpd {{.*#+}} xmm2 = xmm2[0],xmm1[1]
	; X86-SSE2-NEXT: pandn %xmm3, %xmm2			; X86-SSE2-NEXT: pandn %xmm4, %xmm3
	; X86-SSE2-NEXT: psllq $1, %xmm0			; X86-SSE2-NEXT: psllq $1, %xmm0
	; X86-SSE2-NEXT: movdqa %xmm0, %xmm3			; X86-SSE2-NEXT: movdqa %xmm0, %xmm1
	; X86-SSE2-NEXT: psllq %xmm2, %xmm3			; X86-SSE2-NEXT: psllq %xmm3, %xmm1
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[2,3,2,3]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm3[2,3,2,3]
	; X86-SSE2-NEXT: psllq %xmm2, %xmm0			; X86-SSE2-NEXT: psllq %xmm3, %xmm0
	; X86-SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm3[0],xmm0[1]			; X86-SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
	; X86-SSE2-NEXT: orpd %xmm1, %xmm0			; X86-SSE2-NEXT: orpd %xmm2, %xmm0
	; X86-SSE2-NEXT: retl			; X86-SSE2-NEXT: retl
	%splat = shufflevector <2 x i64> %amt, <2 x i64> undef, <2 x i32> zeroinitializer			%splat = shufflevector <2 x i64> %amt, <2 x i64> undef, <2 x i32> zeroinitializer
	%res = call <2 x i64> @llvm.fshr.v2i64(<2 x i64> %x, <2 x i64> %y, <2 x i64> %splat)			%res = call <2 x i64> @llvm.fshr.v2i64(<2 x i64> %x, <2 x i64> %y, <2 x i64> %splat)
	ret <2 x i64> %res			ret <2 x i64> %res
	}			}

	define <4 x i32> @splatvar_funnnel_v4i32(<4 x i32> %x, <4 x i32> %y, <4 x i32> %amt) nounwind {			define <4 x i32> @splatvar_funnnel_v4i32(<4 x i32> %x, <4 x i32> %y, <4 x i32> %amt) nounwind {
	; SSE2-LABEL: splatvar_funnnel_v4i32:			; SSE2-LABEL: splatvar_funnnel_v4i32:
	▲ Show 20 Lines • Show All 576 Lines • ▼ Show 20 Lines
	;			;

	define <2 x i64> @constant_funnnel_v2i64(<2 x i64> %x, <2 x i64> %y) nounwind {			define <2 x i64> @constant_funnnel_v2i64(<2 x i64> %x, <2 x i64> %y) nounwind {
	; SSE2-LABEL: constant_funnnel_v2i64:			; SSE2-LABEL: constant_funnnel_v2i64:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa %xmm1, %xmm2			; SSE2-NEXT: movdqa %xmm1, %xmm2
	; SSE2-NEXT: psrlq $4, %xmm2			; SSE2-NEXT: psrlq $4, %xmm2
	; SSE2-NEXT: psrlq $14, %xmm1			; SSE2-NEXT: psrlq $14, %xmm1
	; SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm2[0],xmm1[1]			; SSE2-NEXT: shufpd {{.*#+}} xmm2 = xmm2[0],xmm1[1]
	; SSE2-NEXT: movdqa %xmm0, %xmm2			; SSE2-NEXT: movdqa %xmm0, %xmm1
	; SSE2-NEXT: psllq $60, %xmm2			; SSE2-NEXT: psllq $60, %xmm1
	; SSE2-NEXT: psllq $50, %xmm0			; SSE2-NEXT: psllq $50, %xmm0
	; SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm2[0],xmm0[1]			; SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
	; SSE2-NEXT: orpd %xmm1, %xmm0			; SSE2-NEXT: orpd %xmm2, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: constant_funnnel_v2i64:			; SSE41-LABEL: constant_funnnel_v2i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm1, %xmm2			; SSE41-NEXT: movdqa %xmm1, %xmm2
	; SSE41-NEXT: psrlq $14, %xmm2			; SSE41-NEXT: psrlq $14, %xmm2
	; SSE41-NEXT: psrlq $4, %xmm1			; SSE41-NEXT: psrlq $4, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1,2,3],xmm2[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm1[0,1,2,3],xmm2[4,5,6,7]
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: psllq $50, %xmm2			; SSE41-NEXT: psllq $50, %xmm1
	; SSE41-NEXT: psllq $60, %xmm0			; SSE41-NEXT: psllq $60, %xmm0
	; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm2[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
	; SSE41-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: constant_funnnel_v2i64:			; AVX1-LABEL: constant_funnnel_v2i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsrlq $14, %xmm1, %xmm2			; AVX1-NEXT: vpsrlq $14, %xmm1, %xmm2
	; AVX1-NEXT: vpsrlq $4, %xmm1, %xmm1			; AVX1-NEXT: vpsrlq $4, %xmm1, %xmm1
	; AVX1-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0,1,2,3],xmm2[4,5,6,7]			; AVX1-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0,1,2,3],xmm2[4,5,6,7]
	; AVX1-NEXT: vpsllq $50, %xmm0, %xmm2			; AVX1-NEXT: vpsllq $50, %xmm0, %xmm2
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; XOPAVX2: # %bb.0:			; XOPAVX2: # %bb.0:
	; XOPAVX2-NEXT: vpsrlvq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; XOPAVX2-NEXT: vpsrlvq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; XOPAVX2-NEXT: vpsllvq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; XOPAVX2-NEXT: vpsllvq {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; XOPAVX2-NEXT: vpor %xmm1, %xmm0, %xmm0			; XOPAVX2-NEXT: vpor %xmm1, %xmm0, %xmm0
	; XOPAVX2-NEXT: retq			; XOPAVX2-NEXT: retq
	;			;
	; X86-SSE2-LABEL: constant_funnnel_v2i64:			; X86-SSE2-LABEL: constant_funnnel_v2i64:
	; X86-SSE2: # %bb.0:			; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: movdqa {{.*#+}} xmm2 = [63,0,63,0]			; X86-SSE2-NEXT: movdqa {{.*#+}} xmm3 = [63,0,63,0]
	; X86-SSE2-NEXT: movdqa {{.*#+}} xmm3 = <4,u,14,u>			; X86-SSE2-NEXT: movdqa {{.*#+}} xmm4 = <4,u,14,u>
	; X86-SSE2-NEXT: movdqa %xmm3, %xmm4			; X86-SSE2-NEXT: movdqa %xmm4, %xmm5
	; X86-SSE2-NEXT: pand %xmm2, %xmm4			; X86-SSE2-NEXT: pand %xmm3, %xmm5
	; X86-SSE2-NEXT: movdqa %xmm1, %xmm5			; X86-SSE2-NEXT: movdqa %xmm1, %xmm2
	; X86-SSE2-NEXT: psrlq %xmm4, %xmm5			; X86-SSE2-NEXT: psrlq %xmm5, %xmm2
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm4[2,3,2,3]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm5[2,3,2,3]
	; X86-SSE2-NEXT: psrlq %xmm4, %xmm1			; X86-SSE2-NEXT: psrlq %xmm5, %xmm1
	; X86-SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm5[0],xmm1[1]			; X86-SSE2-NEXT: shufpd {{.*#+}} xmm2 = xmm2[0],xmm1[1]
	; X86-SSE2-NEXT: pandn %xmm2, %xmm3			; X86-SSE2-NEXT: pandn %xmm3, %xmm4
	; X86-SSE2-NEXT: psllq $1, %xmm0			; X86-SSE2-NEXT: psllq $1, %xmm0
	; X86-SSE2-NEXT: movdqa %xmm0, %xmm2			; X86-SSE2-NEXT: movdqa %xmm0, %xmm1
	; X86-SSE2-NEXT: psllq %xmm3, %xmm2			; X86-SSE2-NEXT: psllq %xmm4, %xmm1
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm3[2,3,2,3]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm4[2,3,2,3]
	; X86-SSE2-NEXT: psllq %xmm3, %xmm0			; X86-SSE2-NEXT: psllq %xmm3, %xmm0
	; X86-SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm2[0],xmm0[1]			; X86-SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
	; X86-SSE2-NEXT: orpd %xmm1, %xmm0			; X86-SSE2-NEXT: orpd %xmm2, %xmm0
	; X86-SSE2-NEXT: retl			; X86-SSE2-NEXT: retl
	%res = call <2 x i64> @llvm.fshr.v2i64(<2 x i64> %x, <2 x i64> %y, <2 x i64> <i64 4, i64 14>)			%res = call <2 x i64> @llvm.fshr.v2i64(<2 x i64> %x, <2 x i64> %y, <2 x i64> <i64 4, i64 14>)
	ret <2 x i64> %res			ret <2 x i64> %res
	}			}

	define <4 x i32> @constant_funnnel_v4i32(<4 x i32> %x, <4 x i32> %y) nounwind {			define <4 x i32> @constant_funnnel_v4i32(<4 x i32> %x, <4 x i32> %y) nounwind {
	; SSE2-LABEL: constant_funnnel_v4i32:			; SSE2-LABEL: constant_funnnel_v4i32:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	Show All 23 Lines
	; SSE41-NEXT: movdqa %xmm1, %xmm2			; SSE41-NEXT: movdqa %xmm1, %xmm2
	; SSE41-NEXT: psrld $7, %xmm2			; SSE41-NEXT: psrld $7, %xmm2
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: psrld $5, %xmm3			; SSE41-NEXT: psrld $5, %xmm3
	; SSE41-NEXT: pblendw {{.*#+}} xmm3 = xmm3[0,1,2,3],xmm2[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm3 = xmm3[0,1,2,3],xmm2[4,5,6,7]
	; SSE41-NEXT: movdqa %xmm1, %xmm2			; SSE41-NEXT: movdqa %xmm1, %xmm2
	; SSE41-NEXT: psrld $6, %xmm2			; SSE41-NEXT: psrld $6, %xmm2
	; SSE41-NEXT: psrld $4, %xmm1			; SSE41-NEXT: psrld $4, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1,2,3],xmm2[4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm1[0,1,2,3],xmm2[4,5,6,7]
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm3[2,3],xmm1[4,5],xmm3[6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm3[2,3],xmm2[4,5],xmm3[6,7]
	; SSE41-NEXT: pmulld {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0			; SSE41-NEXT: pmulld {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: por %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: constant_funnnel_v4i32:			; AVX1-LABEL: constant_funnnel_v4i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsrld $7, %xmm1, %xmm2			; AVX1-NEXT: vpsrld $7, %xmm1, %xmm2
	; AVX1-NEXT: vpsrld $5, %xmm1, %xmm3			; AVX1-NEXT: vpsrld $5, %xmm1, %xmm3
	; AVX1-NEXT: vpblendw {{.*#+}} xmm2 = xmm3[0,1,2,3],xmm2[4,5,6,7]			; AVX1-NEXT: vpblendw {{.*#+}} xmm2 = xmm3[0,1,2,3],xmm2[4,5,6,7]
	; AVX1-NEXT: vpsrld $6, %xmm1, %xmm3			; AVX1-NEXT: vpsrld $6, %xmm1, %xmm3
	▲ Show 20 Lines • Show All 721 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-fshr-rot-128.ll

	Show First 20 Lines • Show All 1,196 Lines • ▼ Show 20 Lines
	}			}

	define <16 x i8> @splatvar_funnnel_v16i8(<16 x i8> %x, <16 x i8> %amt) nounwind {			define <16 x i8> @splatvar_funnnel_v16i8(<16 x i8> %x, <16 x i8> %amt) nounwind {
	; SSE2-LABEL: splatvar_funnnel_v16i8:			; SSE2-LABEL: splatvar_funnnel_v16i8:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: pxor %xmm2, %xmm2			; SSE2-NEXT: pxor %xmm2, %xmm2
	; SSE2-NEXT: psubb %xmm1, %xmm2			; SSE2-NEXT: psubb %xmm1, %xmm2
	; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2			; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
	; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]			; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]
	; SSE2-NEXT: psubb %xmm2, %xmm3			; SSE2-NEXT: psubb %xmm2, %xmm1
	; SSE2-NEXT: pslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0]			; SSE2-NEXT: pslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0]
	; SSE2-NEXT: psrldq {{.*#+}} xmm2 = xmm2[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; SSE2-NEXT: psrldq {{.*#+}} xmm2 = xmm2[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; SSE2-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: movdqa %xmm0, %xmm3
	; SSE2-NEXT: psllw %xmm2, %xmm1			; SSE2-NEXT: psllw %xmm2, %xmm3
	; SSE2-NEXT: pcmpeqd %xmm4, %xmm4			; SSE2-NEXT: pcmpeqd %xmm4, %xmm4
	; SSE2-NEXT: pcmpeqd %xmm5, %xmm5			; SSE2-NEXT: pcmpeqd %xmm5, %xmm5
	; SSE2-NEXT: psllw %xmm2, %xmm5			; SSE2-NEXT: psllw %xmm2, %xmm5
	; SSE2-NEXT: punpcklbw {{.*#+}} xmm5 = xmm5[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]			; SSE2-NEXT: punpcklbw {{.*#+}} xmm5 = xmm5[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
	; SSE2-NEXT: pshuflw {{.*#+}} xmm2 = xmm5[0,0,0,0,4,5,6,7]			; SSE2-NEXT: pshuflw {{.*#+}} xmm2 = xmm5[0,0,0,0,4,5,6,7]
	; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,0,0,0]			; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,0,0,0]
	; SSE2-NEXT: pand %xmm2, %xmm1			; SSE2-NEXT: pand %xmm3, %xmm2
	; SSE2-NEXT: pslldq {{.*#+}} xmm3 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm3[0]			; SSE2-NEXT: pslldq {{.*#+}} xmm1 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm1[0]
	; SSE2-NEXT: psrldq {{.*#+}} xmm3 = xmm3[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; SSE2-NEXT: psrldq {{.*#+}} xmm1 = xmm1[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; SSE2-NEXT: psrlw %xmm3, %xmm0			; SSE2-NEXT: psrlw %xmm1, %xmm0
	; SSE2-NEXT: psrlw %xmm3, %xmm4			; SSE2-NEXT: psrlw %xmm1, %xmm4
	; SSE2-NEXT: psrlw $8, %xmm4			; SSE2-NEXT: psrlw $8, %xmm4
	; SSE2-NEXT: punpcklbw {{.*#+}} xmm4 = xmm4[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]			; SSE2-NEXT: punpcklbw {{.*#+}} xmm4 = xmm4[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
	; SSE2-NEXT: pshuflw {{.*#+}} xmm2 = xmm4[0,0,0,0,4,5,6,7]			; SSE2-NEXT: pshuflw {{.*#+}} xmm1 = xmm4[0,0,0,0,4,5,6,7]
	; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,0,0,0]			; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,0,0,0]
	; SSE2-NEXT: pand %xmm0, %xmm2			; SSE2-NEXT: pand %xmm1, %xmm0
	; SSE2-NEXT: por %xmm2, %xmm1			; SSE2-NEXT: por %xmm2, %xmm0
	; SSE2-NEXT: movdqa %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: splatvar_funnnel_v16i8:			; SSE41-LABEL: splatvar_funnnel_v16i8:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: pxor %xmm2, %xmm2			; SSE41-NEXT: pxor %xmm2, %xmm2
	; SSE41-NEXT: pxor %xmm3, %xmm3			; SSE41-NEXT: pxor %xmm3, %xmm3
	; SSE41-NEXT: psubb %xmm1, %xmm3			; SSE41-NEXT: psubb %xmm1, %xmm3
	; SSE41-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3			; SSE41-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3
	; SSE41-NEXT: pmovzxbq {{.*#+}} xmm4 = xmm3[0],zero,zero,zero,zero,zero,zero,zero,xmm3[1],zero,zero,zero,zero,zero,zero,zero			; SSE41-NEXT: pmovzxbq {{.*#+}} xmm1 = xmm3[0],zero,zero,zero,zero,zero,zero,zero,xmm3[1],zero,zero,zero,zero,zero,zero,zero
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: psllw %xmm4, %xmm1			; SSE41-NEXT: psllw %xmm1, %xmm4
	; SSE41-NEXT: pcmpeqd %xmm5, %xmm5			; SSE41-NEXT: pcmpeqd %xmm5, %xmm5
	; SSE41-NEXT: pcmpeqd %xmm6, %xmm6			; SSE41-NEXT: pcmpeqd %xmm6, %xmm6
	; SSE41-NEXT: psllw %xmm4, %xmm6			; SSE41-NEXT: psllw %xmm1, %xmm6
	; SSE41-NEXT: pshufb %xmm2, %xmm6			; SSE41-NEXT: pshufb %xmm2, %xmm6
	; SSE41-NEXT: pand %xmm6, %xmm1			; SSE41-NEXT: pand %xmm4, %xmm6
	; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]			; SSE41-NEXT: movdqa {{.*#+}} xmm1 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]
	; SSE41-NEXT: psubb %xmm3, %xmm2			; SSE41-NEXT: psubb %xmm3, %xmm1
	; SSE41-NEXT: pmovzxbq {{.*#+}} xmm2 = xmm2[0],zero,zero,zero,zero,zero,zero,zero,xmm2[1],zero,zero,zero,zero,zero,zero,zero			; SSE41-NEXT: pmovzxbq {{.*#+}} xmm1 = xmm1[0],zero,zero,zero,zero,zero,zero,zero,xmm1[1],zero,zero,zero,zero,zero,zero,zero
	; SSE41-NEXT: psrlw %xmm2, %xmm0			; SSE41-NEXT: psrlw %xmm1, %xmm0
	; SSE41-NEXT: psrlw %xmm2, %xmm5			; SSE41-NEXT: psrlw %xmm1, %xmm5
	; SSE41-NEXT: pshufb {{.*#+}} xmm5 = xmm5[1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]			; SSE41-NEXT: pshufb {{.*#+}} xmm5 = xmm5[1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]
	; SSE41-NEXT: pand %xmm0, %xmm5			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm1			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: splatvar_funnnel_v16i8:			; AVX1-LABEL: splatvar_funnnel_v16i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpsubb %xmm1, %xmm2, %xmm1			; AVX1-NEXT: vpsubb %xmm1, %xmm2, %xmm1
	; AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX1-NEXT: vpmovzxbq {{.*#+}} xmm3 = xmm1[0],zero,zero,zero,zero,zero,zero,zero,xmm1[1],zero,zero,zero,zero,zero,zero,zero			; AVX1-NEXT: vpmovzxbq {{.*#+}} xmm3 = xmm1[0],zero,zero,zero,zero,zero,zero,zero,xmm1[1],zero,zero,zero,zero,zero,zero,zero
	▲ Show 20 Lines • Show All 154 Lines • ▼ Show 20 Lines
	; XOPAVX2-NEXT: vprotb %xmm1, %xmm0, %xmm0			; XOPAVX2-NEXT: vprotb %xmm1, %xmm0, %xmm0
	; XOPAVX2-NEXT: retq			; XOPAVX2-NEXT: retq
	;			;
	; X86-SSE2-LABEL: splatvar_funnnel_v16i8:			; X86-SSE2-LABEL: splatvar_funnnel_v16i8:
	; X86-SSE2: # %bb.0:			; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: pxor %xmm2, %xmm2			; X86-SSE2-NEXT: pxor %xmm2, %xmm2
	; X86-SSE2-NEXT: psubb %xmm1, %xmm2			; X86-SSE2-NEXT: psubb %xmm1, %xmm2
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm2			; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm2
	; X86-SSE2-NEXT: movdqa {{.*#+}} xmm3 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]			; X86-SSE2-NEXT: movdqa {{.*#+}} xmm1 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]
	; X86-SSE2-NEXT: psubb %xmm2, %xmm3			; X86-SSE2-NEXT: psubb %xmm2, %xmm1
	; X86-SSE2-NEXT: pslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0]			; X86-SSE2-NEXT: pslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0]
	; X86-SSE2-NEXT: psrldq {{.*#+}} xmm2 = xmm2[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; X86-SSE2-NEXT: psrldq {{.*#+}} xmm2 = xmm2[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; X86-SSE2-NEXT: movdqa %xmm0, %xmm1			; X86-SSE2-NEXT: movdqa %xmm0, %xmm3
	; X86-SSE2-NEXT: psllw %xmm2, %xmm1			; X86-SSE2-NEXT: psllw %xmm2, %xmm3
	; X86-SSE2-NEXT: pcmpeqd %xmm4, %xmm4			; X86-SSE2-NEXT: pcmpeqd %xmm4, %xmm4
	; X86-SSE2-NEXT: pcmpeqd %xmm5, %xmm5			; X86-SSE2-NEXT: pcmpeqd %xmm5, %xmm5
	; X86-SSE2-NEXT: psllw %xmm2, %xmm5			; X86-SSE2-NEXT: psllw %xmm2, %xmm5
	; X86-SSE2-NEXT: punpcklbw {{.*#+}} xmm5 = xmm5[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]			; X86-SSE2-NEXT: punpcklbw {{.*#+}} xmm5 = xmm5[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
	; X86-SSE2-NEXT: pshuflw {{.*#+}} xmm2 = xmm5[0,0,0,0,4,5,6,7]			; X86-SSE2-NEXT: pshuflw {{.*#+}} xmm2 = xmm5[0,0,0,0,4,5,6,7]
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,0,0,0]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,0,0,0]
	; X86-SSE2-NEXT: pand %xmm2, %xmm1			; X86-SSE2-NEXT: pand %xmm3, %xmm2
	; X86-SSE2-NEXT: pslldq {{.*#+}} xmm3 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm3[0]			; X86-SSE2-NEXT: pslldq {{.*#+}} xmm1 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm1[0]
	; X86-SSE2-NEXT: psrldq {{.*#+}} xmm3 = xmm3[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; X86-SSE2-NEXT: psrldq {{.*#+}} xmm1 = xmm1[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; X86-SSE2-NEXT: psrlw %xmm3, %xmm0			; X86-SSE2-NEXT: psrlw %xmm1, %xmm0
	; X86-SSE2-NEXT: psrlw %xmm3, %xmm4			; X86-SSE2-NEXT: psrlw %xmm1, %xmm4
	; X86-SSE2-NEXT: psrlw $8, %xmm4			; X86-SSE2-NEXT: psrlw $8, %xmm4
	; X86-SSE2-NEXT: punpcklbw {{.*#+}} xmm4 = xmm4[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]			; X86-SSE2-NEXT: punpcklbw {{.*#+}} xmm4 = xmm4[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
	; X86-SSE2-NEXT: pshuflw {{.*#+}} xmm2 = xmm4[0,0,0,0,4,5,6,7]			; X86-SSE2-NEXT: pshuflw {{.*#+}} xmm1 = xmm4[0,0,0,0,4,5,6,7]
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,0,0,0]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,0,0,0]
	; X86-SSE2-NEXT: pand %xmm0, %xmm2			; X86-SSE2-NEXT: pand %xmm1, %xmm0
	; X86-SSE2-NEXT: por %xmm2, %xmm1			; X86-SSE2-NEXT: por %xmm2, %xmm0
	; X86-SSE2-NEXT: movdqa %xmm1, %xmm0
	; X86-SSE2-NEXT: retl			; X86-SSE2-NEXT: retl
	%splat = shufflevector <16 x i8> %amt, <16 x i8> undef, <16 x i32> zeroinitializer			%splat = shufflevector <16 x i8> %amt, <16 x i8> undef, <16 x i32> zeroinitializer
	%res = call <16 x i8> @llvm.fshr.v16i8(<16 x i8> %x, <16 x i8> %x, <16 x i8> %splat)			%res = call <16 x i8> @llvm.fshr.v16i8(<16 x i8> %x, <16 x i8> %x, <16 x i8> %splat)
	ret <16 x i8> %res			ret <16 x i8> %res
	}			}

	;			;
	; Constant Shifts			; Constant Shifts
	▲ Show 20 Lines • Show All 809 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-fshr-rot-sub128.ll

	Show First 20 Lines • Show All 460 Lines • ▼ Show 20 Lines

	;			;
	; Uniform Constant Shifts			; Uniform Constant Shifts
	;			;

	define <2 x i32> @splatconstant_funnnel_v2i32(<2 x i32> %x) nounwind {			define <2 x i32> @splatconstant_funnnel_v2i32(<2 x i32> %x) nounwind {
	; SSE2-LABEL: splatconstant_funnnel_v2i32:			; SSE2-LABEL: splatconstant_funnnel_v2i32:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa %xmm0, %xmm2
	; SSE2-NEXT: psrld $4, %xmm2
	; SSE2-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: movdqa %xmm0, %xmm1
	; SSE2-NEXT: pslld $28, %xmm1			; SSE2-NEXT: psrld $4, %xmm1
	; SSE2-NEXT: por %xmm2, %xmm1			; SSE2-NEXT: movdqa %xmm0, %xmm2
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,1],xmm0[2,3]			; SSE2-NEXT: pslld $28, %xmm2
	; SSE2-NEXT: movaps %xmm1, %xmm0			; SSE2-NEXT: por %xmm1, %xmm2
				; SSE2-NEXT: movsd %xmm2, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: splatconstant_funnnel_v2i32:			; SSE41-LABEL: splatconstant_funnnel_v2i32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: psrld $4, %xmm2
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: pslld $28, %xmm1			; SSE41-NEXT: psrld $4, %xmm1
	; SSE41-NEXT: por %xmm2, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1,2,3],xmm0[4,5,6,7]			; SSE41-NEXT: pslld $28, %xmm2
	; SSE41-NEXT: movdqa %xmm1, %xmm0			; SSE41-NEXT: por %xmm1, %xmm2
				; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm2[0,1,2,3],xmm0[4,5,6,7]
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: splatconstant_funnnel_v2i32:			; AVX1-LABEL: splatconstant_funnnel_v2i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpsrld $4, %xmm0, %xmm1			; AVX1-NEXT: vpsrld $4, %xmm0, %xmm1
	; AVX1-NEXT: vpslld $28, %xmm0, %xmm2			; AVX1-NEXT: vpslld $28, %xmm0, %xmm2
	; AVX1-NEXT: vpor %xmm1, %xmm2, %xmm1			; AVX1-NEXT: vpor %xmm1, %xmm2, %xmm1
	; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm1[0,1,2,3],xmm0[4,5,6,7]			; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm1[0,1,2,3],xmm0[4,5,6,7]
	▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines
	;			;
	; XOP-LABEL: splatconstant_funnnel_v2i32:			; XOP-LABEL: splatconstant_funnnel_v2i32:
	; XOP: # %bb.0:			; XOP: # %bb.0:
	; XOP-NEXT: vprotd $28, %xmm0, %xmm0			; XOP-NEXT: vprotd $28, %xmm0, %xmm0
	; XOP-NEXT: retq			; XOP-NEXT: retq
	;			;
	; X86-SSE2-LABEL: splatconstant_funnnel_v2i32:			; X86-SSE2-LABEL: splatconstant_funnnel_v2i32:
	; X86-SSE2: # %bb.0:			; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: movdqa %xmm0, %xmm2
	; X86-SSE2-NEXT: psrld $4, %xmm2
	; X86-SSE2-NEXT: movdqa %xmm0, %xmm1			; X86-SSE2-NEXT: movdqa %xmm0, %xmm1
	; X86-SSE2-NEXT: pslld $28, %xmm1			; X86-SSE2-NEXT: psrld $4, %xmm1
	; X86-SSE2-NEXT: por %xmm2, %xmm1			; X86-SSE2-NEXT: movdqa %xmm0, %xmm2
	; X86-SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,1],xmm0[2,3]			; X86-SSE2-NEXT: pslld $28, %xmm2
	; X86-SSE2-NEXT: movaps %xmm1, %xmm0			; X86-SSE2-NEXT: por %xmm1, %xmm2
				; X86-SSE2-NEXT: movsd %xmm2, %xmm0
	; X86-SSE2-NEXT: retl			; X86-SSE2-NEXT: retl
	%res = call <2 x i32> @llvm.fshr.v2i32(<2 x i32> %x, <2 x i32> %x, <2 x i32> <i32 4, i32 4>)			%res = call <2 x i32> @llvm.fshr.v2i32(<2 x i32> %x, <2 x i32> %x, <2 x i32> <i32 4, i32 4>)
	ret <2 x i32> %res			ret <2 x i32> %res
	}			}

llvm/test/CodeGen/X86/vector-idiv-udiv-128.ll

	Show First 20 Lines • Show All 536 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: movdqa %xmm0, %xmm1
	; SSE2-NEXT: psubd %xmm2, %xmm1			; SSE2-NEXT: psubd %xmm2, %xmm1
	; SSE2-NEXT: psrld $1, %xmm1			; SSE2-NEXT: psrld $1, %xmm1
	; SSE2-NEXT: paddd %xmm2, %xmm1			; SSE2-NEXT: paddd %xmm2, %xmm1
	; SSE2-NEXT: psrld $2, %xmm1			; SSE2-NEXT: psrld $2, %xmm1
	; SSE2-NEXT: movdqa %xmm1, %xmm2			; SSE2-NEXT: movdqa %xmm1, %xmm2
	; SSE2-NEXT: pslld $3, %xmm2			; SSE2-NEXT: pslld $3, %xmm2
	; SSE2-NEXT: psubd %xmm2, %xmm1			; SSE2-NEXT: psubd %xmm2, %xmm1
	; SSE2-NEXT: paddd %xmm0, %xmm1			; SSE2-NEXT: paddd %xmm1, %xmm0
	; SSE2-NEXT: movdqa %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_rem7_4i32:			; SSE41-LABEL: test_rem7_4i32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,3,3]
	; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [613566757,613566757,613566757,613566757]			; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [613566757,613566757,613566757,613566757]
	; SSE41-NEXT: pmuludq %xmm2, %xmm1			; SSE41-NEXT: pmuludq %xmm2, %xmm1
	; SSE41-NEXT: pmuludq %xmm0, %xmm2			; SSE41-NEXT: pmuludq %xmm0, %xmm2
	▲ Show 20 Lines • Show All 92 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE2-NEXT: paddb %xmm4, %xmm1			; SSE2-NEXT: paddb %xmm4, %xmm1
	; SSE2-NEXT: psrlw $2, %xmm1			; SSE2-NEXT: psrlw $2, %xmm1
	; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE2-NEXT: movdqa %xmm1, %xmm2			; SSE2-NEXT: movdqa %xmm1, %xmm2
	; SSE2-NEXT: psllw $3, %xmm2			; SSE2-NEXT: psllw $3, %xmm2
	; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2			; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
	; SSE2-NEXT: psubb %xmm2, %xmm1			; SSE2-NEXT: psubb %xmm2, %xmm1
	; SSE2-NEXT: paddb %xmm0, %xmm1			; SSE2-NEXT: paddb %xmm1, %xmm0
	; SSE2-NEXT: movdqa %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_rem7_16i8:			; SSE41-LABEL: test_rem7_16i8:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: pxor %xmm1, %xmm1			; SSE41-NEXT: pxor %xmm1, %xmm1
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: punpckhbw {{.*#+}} xmm2 = xmm2[8],xmm1[8],xmm2[9],xmm1[9],xmm2[10],xmm1[10],xmm2[11],xmm1[11],xmm2[12],xmm1[12],xmm2[13],xmm1[13],xmm2[14],xmm1[14],xmm2[15],xmm1[15]			; SSE41-NEXT: punpckhbw {{.*#+}} xmm2 = xmm2[8],xmm1[8],xmm2[9],xmm1[9],xmm2[10],xmm1[10],xmm2[11],xmm1[11],xmm2[12],xmm1[12],xmm2[13],xmm1[13],xmm2[14],xmm1[14],xmm2[15],xmm1[15]
	; SSE41-NEXT: movdqa {{.*#+}} xmm1 = [37,37,37,37,37,37,37,37]			; SSE41-NEXT: movdqa {{.*#+}} xmm1 = [37,37,37,37,37,37,37,37]
	Show All 9 Lines
	; SSE41-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE41-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE41-NEXT: paddb %xmm3, %xmm1			; SSE41-NEXT: paddb %xmm3, %xmm1
	; SSE41-NEXT: psrlw $2, %xmm1			; SSE41-NEXT: psrlw $2, %xmm1
	; SSE41-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE41-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm2			; SSE41-NEXT: movdqa %xmm1, %xmm2
	; SSE41-NEXT: psllw $3, %xmm2			; SSE41-NEXT: psllw $3, %xmm2
	; SSE41-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2			; SSE41-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
	; SSE41-NEXT: psubb %xmm2, %xmm1			; SSE41-NEXT: psubb %xmm2, %xmm1
	; SSE41-NEXT: paddb %xmm0, %xmm1			; SSE41-NEXT: paddb %xmm1, %xmm0
	; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test_rem7_16i8:			; AVX1-LABEL: test_rem7_16i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX1-NEXT: vpunpckhbw {{.*#+}} xmm1 = xmm0[8],xmm1[8],xmm0[9],xmm1[9],xmm0[10],xmm1[10],xmm0[11],xmm1[11],xmm0[12],xmm1[12],xmm0[13],xmm1[13],xmm0[14],xmm1[14],xmm0[15],xmm1[15]			; AVX1-NEXT: vpunpckhbw {{.*#+}} xmm1 = xmm0[8],xmm1[8],xmm0[9],xmm1[9],xmm0[10],xmm1[10],xmm0[11],xmm1[11],xmm0[12],xmm1[12],xmm0[13],xmm1[13],xmm0[14],xmm1[14],xmm0[15],xmm1[15]
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [37,37,37,37,37,37,37,37]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [37,37,37,37,37,37,37,37]
	; AVX1-NEXT: vpmullw %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpmullw %xmm2, %xmm1, %xmm1
	▲ Show 20 Lines • Show All 247 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-lzcnt-128.ll

	Show First 20 Lines • Show All 117 Lines • ▼ Show 20 Lines
	; SSSE3-NEXT: psrld $16, %xmm2			; SSSE3-NEXT: psrld $16, %xmm2
	; SSSE3-NEXT: pand %xmm1, %xmm2			; SSSE3-NEXT: pand %xmm1, %xmm2
	; SSSE3-NEXT: psrld $16, %xmm1			; SSSE3-NEXT: psrld $16, %xmm1
	; SSSE3-NEXT: paddd %xmm2, %xmm1			; SSSE3-NEXT: paddd %xmm2, %xmm1
	; SSSE3-NEXT: pcmpeqd %xmm4, %xmm0			; SSSE3-NEXT: pcmpeqd %xmm4, %xmm0
	; SSSE3-NEXT: psrlq $32, %xmm0			; SSSE3-NEXT: psrlq $32, %xmm0
	; SSSE3-NEXT: pand %xmm1, %xmm0			; SSSE3-NEXT: pand %xmm1, %xmm0
	; SSSE3-NEXT: psrlq $32, %xmm1			; SSSE3-NEXT: psrlq $32, %xmm1
	; SSSE3-NEXT: paddq %xmm0, %xmm1			; SSSE3-NEXT: paddq %xmm1, %xmm0
	; SSSE3-NEXT: movdqa %xmm1, %xmm0
	; SSSE3-NEXT: retq			; SSSE3-NEXT: retq
	;			;
	; SSE41-LABEL: testv2i64:			; SSE41-LABEL: testv2i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]			; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]
	; SSE41-NEXT: movdqa %xmm2, %xmm3			; SSE41-NEXT: movdqa %xmm2, %xmm3
	; SSE41-NEXT: pshufb %xmm0, %xmm3			; SSE41-NEXT: pshufb %xmm0, %xmm3
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm1
	Show All 15 Lines
	; SSE41-NEXT: psrld $16, %xmm2			; SSE41-NEXT: psrld $16, %xmm2
	; SSE41-NEXT: pand %xmm1, %xmm2			; SSE41-NEXT: pand %xmm1, %xmm2
	; SSE41-NEXT: psrld $16, %xmm1			; SSE41-NEXT: psrld $16, %xmm1
	; SSE41-NEXT: paddd %xmm2, %xmm1			; SSE41-NEXT: paddd %xmm2, %xmm1
	; SSE41-NEXT: pcmpeqd %xmm4, %xmm0			; SSE41-NEXT: pcmpeqd %xmm4, %xmm0
	; SSE41-NEXT: psrlq $32, %xmm0			; SSE41-NEXT: psrlq $32, %xmm0
	; SSE41-NEXT: pand %xmm1, %xmm0			; SSE41-NEXT: pand %xmm1, %xmm0
	; SSE41-NEXT: psrlq $32, %xmm1			; SSE41-NEXT: psrlq $32, %xmm1
	; SSE41-NEXT: paddq %xmm0, %xmm1			; SSE41-NEXT: paddq %xmm1, %xmm0
	; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: testv2i64:			; AVX-LABEL: testv2i64:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]			; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]
	; AVX-NEXT: vpshufb %xmm0, %xmm1, %xmm2			; AVX-NEXT: vpshufb %xmm0, %xmm1, %xmm2
	; AVX-NEXT: vpsrlw $4, %xmm0, %xmm3			; AVX-NEXT: vpsrlw $4, %xmm0, %xmm3
	; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3, %xmm3			; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3, %xmm3
	▲ Show 20 Lines • Show All 84 Lines • ▼ Show 20 Lines
	; X32-SSE-NEXT: psrld $16, %xmm3			; X32-SSE-NEXT: psrld $16, %xmm3
	; X32-SSE-NEXT: pand %xmm1, %xmm3			; X32-SSE-NEXT: pand %xmm1, %xmm3
	; X32-SSE-NEXT: psrld $16, %xmm1			; X32-SSE-NEXT: psrld $16, %xmm1
	; X32-SSE-NEXT: paddd %xmm3, %xmm1			; X32-SSE-NEXT: paddd %xmm3, %xmm1
	; X32-SSE-NEXT: pcmpeqd %xmm2, %xmm0			; X32-SSE-NEXT: pcmpeqd %xmm2, %xmm0
	; X32-SSE-NEXT: psrlq $32, %xmm0			; X32-SSE-NEXT: psrlq $32, %xmm0
	; X32-SSE-NEXT: pand %xmm1, %xmm0			; X32-SSE-NEXT: pand %xmm1, %xmm0
	; X32-SSE-NEXT: psrlq $32, %xmm1			; X32-SSE-NEXT: psrlq $32, %xmm1
	; X32-SSE-NEXT: paddq %xmm0, %xmm1			; X32-SSE-NEXT: paddq %xmm1, %xmm0
	; X32-SSE-NEXT: movdqa %xmm1, %xmm0
	; X32-SSE-NEXT: retl			; X32-SSE-NEXT: retl

	%out = call <2 x i64> @llvm.ctlz.v2i64(<2 x i64> %in, i1 0)			%out = call <2 x i64> @llvm.ctlz.v2i64(<2 x i64> %in, i1 0)
	ret <2 x i64> %out			ret <2 x i64> %out
	}			}

	define <2 x i64> @testv2i64u(<2 x i64> %in) nounwind {			define <2 x i64> @testv2i64u(<2 x i64> %in) nounwind {
	; SSE2-LABEL: testv2i64u:			; SSE2-LABEL: testv2i64u:
	▲ Show 20 Lines • Show All 100 Lines • ▼ Show 20 Lines
	; SSSE3-NEXT: psrld $16, %xmm2			; SSSE3-NEXT: psrld $16, %xmm2
	; SSSE3-NEXT: pand %xmm1, %xmm2			; SSSE3-NEXT: pand %xmm1, %xmm2
	; SSSE3-NEXT: psrld $16, %xmm1			; SSSE3-NEXT: psrld $16, %xmm1
	; SSSE3-NEXT: paddd %xmm2, %xmm1			; SSSE3-NEXT: paddd %xmm2, %xmm1
	; SSSE3-NEXT: pcmpeqd %xmm4, %xmm0			; SSSE3-NEXT: pcmpeqd %xmm4, %xmm0
	; SSSE3-NEXT: psrlq $32, %xmm0			; SSSE3-NEXT: psrlq $32, %xmm0
	; SSSE3-NEXT: pand %xmm1, %xmm0			; SSSE3-NEXT: pand %xmm1, %xmm0
	; SSSE3-NEXT: psrlq $32, %xmm1			; SSSE3-NEXT: psrlq $32, %xmm1
	; SSSE3-NEXT: paddq %xmm0, %xmm1			; SSSE3-NEXT: paddq %xmm1, %xmm0
	; SSSE3-NEXT: movdqa %xmm1, %xmm0
	; SSSE3-NEXT: retq			; SSSE3-NEXT: retq
	;			;
	; SSE41-LABEL: testv2i64u:			; SSE41-LABEL: testv2i64u:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]			; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]
	; SSE41-NEXT: movdqa %xmm2, %xmm3			; SSE41-NEXT: movdqa %xmm2, %xmm3
	; SSE41-NEXT: pshufb %xmm0, %xmm3			; SSE41-NEXT: pshufb %xmm0, %xmm3
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm1
	Show All 15 Lines
	; SSE41-NEXT: psrld $16, %xmm2			; SSE41-NEXT: psrld $16, %xmm2
	; SSE41-NEXT: pand %xmm1, %xmm2			; SSE41-NEXT: pand %xmm1, %xmm2
	; SSE41-NEXT: psrld $16, %xmm1			; SSE41-NEXT: psrld $16, %xmm1
	; SSE41-NEXT: paddd %xmm2, %xmm1			; SSE41-NEXT: paddd %xmm2, %xmm1
	; SSE41-NEXT: pcmpeqd %xmm4, %xmm0			; SSE41-NEXT: pcmpeqd %xmm4, %xmm0
	; SSE41-NEXT: psrlq $32, %xmm0			; SSE41-NEXT: psrlq $32, %xmm0
	; SSE41-NEXT: pand %xmm1, %xmm0			; SSE41-NEXT: pand %xmm1, %xmm0
	; SSE41-NEXT: psrlq $32, %xmm1			; SSE41-NEXT: psrlq $32, %xmm1
	; SSE41-NEXT: paddq %xmm0, %xmm1			; SSE41-NEXT: paddq %xmm1, %xmm0
	; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: testv2i64u:			; AVX-LABEL: testv2i64u:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]			; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]
	; AVX-NEXT: vpshufb %xmm0, %xmm1, %xmm2			; AVX-NEXT: vpshufb %xmm0, %xmm1, %xmm2
	; AVX-NEXT: vpsrlw $4, %xmm0, %xmm3			; AVX-NEXT: vpsrlw $4, %xmm0, %xmm3
	; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3, %xmm3			; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3, %xmm3
	▲ Show 20 Lines • Show All 84 Lines • ▼ Show 20 Lines
	; X32-SSE-NEXT: psrld $16, %xmm3			; X32-SSE-NEXT: psrld $16, %xmm3
	; X32-SSE-NEXT: pand %xmm1, %xmm3			; X32-SSE-NEXT: pand %xmm1, %xmm3
	; X32-SSE-NEXT: psrld $16, %xmm1			; X32-SSE-NEXT: psrld $16, %xmm1
	; X32-SSE-NEXT: paddd %xmm3, %xmm1			; X32-SSE-NEXT: paddd %xmm3, %xmm1
	; X32-SSE-NEXT: pcmpeqd %xmm2, %xmm0			; X32-SSE-NEXT: pcmpeqd %xmm2, %xmm0
	; X32-SSE-NEXT: psrlq $32, %xmm0			; X32-SSE-NEXT: psrlq $32, %xmm0
	; X32-SSE-NEXT: pand %xmm1, %xmm0			; X32-SSE-NEXT: pand %xmm1, %xmm0
	; X32-SSE-NEXT: psrlq $32, %xmm1			; X32-SSE-NEXT: psrlq $32, %xmm1
	; X32-SSE-NEXT: paddq %xmm0, %xmm1			; X32-SSE-NEXT: paddq %xmm1, %xmm0
	; X32-SSE-NEXT: movdqa %xmm1, %xmm0
	; X32-SSE-NEXT: retl			; X32-SSE-NEXT: retl

	%out = call <2 x i64> @llvm.ctlz.v2i64(<2 x i64> %in, i1 -1)			%out = call <2 x i64> @llvm.ctlz.v2i64(<2 x i64> %in, i1 -1)
	ret <2 x i64> %out			ret <2 x i64> %out
	}			}

	define <4 x i32> @testv4i32(<4 x i32> %in) nounwind {			define <4 x i32> @testv4i32(<4 x i32> %in) nounwind {
	; SSE2-LABEL: testv4i32:			; SSE2-LABEL: testv4i32:
	▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
	; SSE3-NEXT: psadbw %xmm1, %xmm2			; SSE3-NEXT: psadbw %xmm1, %xmm2
	; SSE3-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]			; SSE3-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
	; SSE3-NEXT: psadbw %xmm1, %xmm0			; SSE3-NEXT: psadbw %xmm1, %xmm0
	; SSE3-NEXT: packuswb %xmm2, %xmm0			; SSE3-NEXT: packuswb %xmm2, %xmm0
	; SSE3-NEXT: retq			; SSE3-NEXT: retq
	;			;
	; SSSE3-LABEL: testv4i32:			; SSSE3-LABEL: testv4i32:
	; SSSE3: # %bb.0:			; SSSE3: # %bb.0:
	; SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]			; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]
	; SSSE3-NEXT: movdqa %xmm2, %xmm3			; SSSE3-NEXT: movdqa %xmm1, %xmm2
	; SSSE3-NEXT: pshufb %xmm0, %xmm3			; SSSE3-NEXT: pshufb %xmm0, %xmm2
	; SSSE3-NEXT: movdqa %xmm0, %xmm1			; SSSE3-NEXT: movdqa %xmm0, %xmm3
	; SSSE3-NEXT: psrlw $4, %xmm1			; SSSE3-NEXT: psrlw $4, %xmm3
	; SSSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3
	; SSSE3-NEXT: pxor %xmm4, %xmm4			; SSSE3-NEXT: pxor %xmm4, %xmm4
	; SSSE3-NEXT: pshufb %xmm1, %xmm2			; SSSE3-NEXT: pshufb %xmm3, %xmm1
				; SSSE3-NEXT: pcmpeqb %xmm4, %xmm3
				; SSSE3-NEXT: pand %xmm2, %xmm3
				; SSSE3-NEXT: paddb %xmm1, %xmm3
				; SSSE3-NEXT: movdqa %xmm0, %xmm1
	; SSSE3-NEXT: pcmpeqb %xmm4, %xmm1			; SSSE3-NEXT: pcmpeqb %xmm4, %xmm1
	; SSSE3-NEXT: pand %xmm3, %xmm1
	; SSSE3-NEXT: paddb %xmm2, %xmm1
	; SSSE3-NEXT: movdqa %xmm0, %xmm2
	; SSSE3-NEXT: pcmpeqb %xmm4, %xmm2
	; SSSE3-NEXT: psrlw $8, %xmm2
	; SSSE3-NEXT: pand %xmm1, %xmm2
	; SSSE3-NEXT: psrlw $8, %xmm1			; SSSE3-NEXT: psrlw $8, %xmm1
	; SSSE3-NEXT: paddw %xmm2, %xmm1			; SSSE3-NEXT: pand %xmm3, %xmm1
				; SSSE3-NEXT: psrlw $8, %xmm3
				; SSSE3-NEXT: paddw %xmm1, %xmm3
	; SSSE3-NEXT: pcmpeqw %xmm4, %xmm0			; SSSE3-NEXT: pcmpeqw %xmm4, %xmm0
	; SSSE3-NEXT: psrld $16, %xmm0			; SSSE3-NEXT: psrld $16, %xmm0
	; SSSE3-NEXT: pand %xmm1, %xmm0			; SSSE3-NEXT: pand %xmm3, %xmm0
	; SSSE3-NEXT: psrld $16, %xmm1			; SSSE3-NEXT: psrld $16, %xmm3
	; SSSE3-NEXT: paddd %xmm0, %xmm1			; SSSE3-NEXT: paddd %xmm3, %xmm0
	; SSSE3-NEXT: movdqa %xmm1, %xmm0
	; SSSE3-NEXT: retq			; SSSE3-NEXT: retq
	;			;
	; SSE41-LABEL: testv4i32:			; SSE41-LABEL: testv4i32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]			; SSE41-NEXT: movdqa {{.*#+}} xmm1 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]
	; SSE41-NEXT: movdqa %xmm2, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm2
	; SSE41-NEXT: pshufb %xmm0, %xmm3			; SSE41-NEXT: pshufb %xmm0, %xmm2
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm3
	; SSE41-NEXT: psrlw $4, %xmm1			; SSE41-NEXT: psrlw $4, %xmm3
	; SSE41-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE41-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3
	; SSE41-NEXT: pxor %xmm4, %xmm4			; SSE41-NEXT: pxor %xmm4, %xmm4
	; SSE41-NEXT: pshufb %xmm1, %xmm2			; SSE41-NEXT: pshufb %xmm3, %xmm1
				; SSE41-NEXT: pcmpeqb %xmm4, %xmm3
				; SSE41-NEXT: pand %xmm2, %xmm3
				; SSE41-NEXT: paddb %xmm1, %xmm3
				; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: pcmpeqb %xmm4, %xmm1			; SSE41-NEXT: pcmpeqb %xmm4, %xmm1
	; SSE41-NEXT: pand %xmm3, %xmm1
	; SSE41-NEXT: paddb %xmm2, %xmm1
	; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: pcmpeqb %xmm4, %xmm2
	; SSE41-NEXT: psrlw $8, %xmm2
	; SSE41-NEXT: pand %xmm1, %xmm2
	; SSE41-NEXT: psrlw $8, %xmm1			; SSE41-NEXT: psrlw $8, %xmm1
	; SSE41-NEXT: paddw %xmm2, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm1
				; SSE41-NEXT: psrlw $8, %xmm3
				; SSE41-NEXT: paddw %xmm1, %xmm3
	; SSE41-NEXT: pcmpeqw %xmm4, %xmm0			; SSE41-NEXT: pcmpeqw %xmm4, %xmm0
	; SSE41-NEXT: psrld $16, %xmm0			; SSE41-NEXT: psrld $16, %xmm0
	; SSE41-NEXT: pand %xmm1, %xmm0			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: psrld $16, %xmm1			; SSE41-NEXT: psrld $16, %xmm3
	; SSE41-NEXT: paddd %xmm0, %xmm1			; SSE41-NEXT: paddd %xmm3, %xmm0
	; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: testv4i32:			; AVX-LABEL: testv4i32:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]			; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]
	; AVX-NEXT: vpshufb %xmm0, %xmm1, %xmm2			; AVX-NEXT: vpshufb %xmm0, %xmm1, %xmm2
	; AVX-NEXT: vpsrlw $4, %xmm0, %xmm3			; AVX-NEXT: vpsrlw $4, %xmm0, %xmm3
	; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3, %xmm3			; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3, %xmm3
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; X32-SSE-NEXT: psrlw $8, %xmm3			; X32-SSE-NEXT: psrlw $8, %xmm3
	; X32-SSE-NEXT: pand %xmm1, %xmm3			; X32-SSE-NEXT: pand %xmm1, %xmm3
	; X32-SSE-NEXT: psrlw $8, %xmm1			; X32-SSE-NEXT: psrlw $8, %xmm1
	; X32-SSE-NEXT: paddw %xmm3, %xmm1			; X32-SSE-NEXT: paddw %xmm3, %xmm1
	; X32-SSE-NEXT: pcmpeqw %xmm2, %xmm0			; X32-SSE-NEXT: pcmpeqw %xmm2, %xmm0
	; X32-SSE-NEXT: psrld $16, %xmm0			; X32-SSE-NEXT: psrld $16, %xmm0
	; X32-SSE-NEXT: pand %xmm1, %xmm0			; X32-SSE-NEXT: pand %xmm1, %xmm0
	; X32-SSE-NEXT: psrld $16, %xmm1			; X32-SSE-NEXT: psrld $16, %xmm1
	; X32-SSE-NEXT: paddd %xmm0, %xmm1			; X32-SSE-NEXT: paddd %xmm1, %xmm0
	; X32-SSE-NEXT: movdqa %xmm1, %xmm0
	; X32-SSE-NEXT: retl			; X32-SSE-NEXT: retl

	%out = call <4 x i32> @llvm.ctlz.v4i32(<4 x i32> %in, i1 0)			%out = call <4 x i32> @llvm.ctlz.v4i32(<4 x i32> %in, i1 0)
	ret <4 x i32> %out			ret <4 x i32> %out
	}			}

	define <4 x i32> @testv4i32u(<4 x i32> %in) nounwind {			define <4 x i32> @testv4i32u(<4 x i32> %in) nounwind {
	; SSE2-LABEL: testv4i32u:			; SSE2-LABEL: testv4i32u:
	▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
	; SSE3-NEXT: psadbw %xmm1, %xmm2			; SSE3-NEXT: psadbw %xmm1, %xmm2
	; SSE3-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]			; SSE3-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
	; SSE3-NEXT: psadbw %xmm1, %xmm0			; SSE3-NEXT: psadbw %xmm1, %xmm0
	; SSE3-NEXT: packuswb %xmm2, %xmm0			; SSE3-NEXT: packuswb %xmm2, %xmm0
	; SSE3-NEXT: retq			; SSE3-NEXT: retq
	;			;
	; SSSE3-LABEL: testv4i32u:			; SSSE3-LABEL: testv4i32u:
	; SSSE3: # %bb.0:			; SSSE3: # %bb.0:
	; SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]			; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]
	; SSSE3-NEXT: movdqa %xmm2, %xmm3			; SSSE3-NEXT: movdqa %xmm1, %xmm2
	; SSSE3-NEXT: pshufb %xmm0, %xmm3			; SSSE3-NEXT: pshufb %xmm0, %xmm2
	; SSSE3-NEXT: movdqa %xmm0, %xmm1			; SSSE3-NEXT: movdqa %xmm0, %xmm3
	; SSSE3-NEXT: psrlw $4, %xmm1			; SSSE3-NEXT: psrlw $4, %xmm3
	; SSSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3
	; SSSE3-NEXT: pxor %xmm4, %xmm4			; SSSE3-NEXT: pxor %xmm4, %xmm4
	; SSSE3-NEXT: pshufb %xmm1, %xmm2			; SSSE3-NEXT: pshufb %xmm3, %xmm1
				; SSSE3-NEXT: pcmpeqb %xmm4, %xmm3
				; SSSE3-NEXT: pand %xmm2, %xmm3
				; SSSE3-NEXT: paddb %xmm1, %xmm3
				; SSSE3-NEXT: movdqa %xmm0, %xmm1
	; SSSE3-NEXT: pcmpeqb %xmm4, %xmm1			; SSSE3-NEXT: pcmpeqb %xmm4, %xmm1
	; SSSE3-NEXT: pand %xmm3, %xmm1
	; SSSE3-NEXT: paddb %xmm2, %xmm1
	; SSSE3-NEXT: movdqa %xmm0, %xmm2
	; SSSE3-NEXT: pcmpeqb %xmm4, %xmm2
	; SSSE3-NEXT: psrlw $8, %xmm2
	; SSSE3-NEXT: pand %xmm1, %xmm2
	; SSSE3-NEXT: psrlw $8, %xmm1			; SSSE3-NEXT: psrlw $8, %xmm1
	; SSSE3-NEXT: paddw %xmm2, %xmm1			; SSSE3-NEXT: pand %xmm3, %xmm1
				; SSSE3-NEXT: psrlw $8, %xmm3
				; SSSE3-NEXT: paddw %xmm1, %xmm3
	; SSSE3-NEXT: pcmpeqw %xmm4, %xmm0			; SSSE3-NEXT: pcmpeqw %xmm4, %xmm0
	; SSSE3-NEXT: psrld $16, %xmm0			; SSSE3-NEXT: psrld $16, %xmm0
	; SSSE3-NEXT: pand %xmm1, %xmm0			; SSSE3-NEXT: pand %xmm3, %xmm0
	; SSSE3-NEXT: psrld $16, %xmm1			; SSSE3-NEXT: psrld $16, %xmm3
	; SSSE3-NEXT: paddd %xmm0, %xmm1			; SSSE3-NEXT: paddd %xmm3, %xmm0
	; SSSE3-NEXT: movdqa %xmm1, %xmm0
	; SSSE3-NEXT: retq			; SSSE3-NEXT: retq
	;			;
	; SSE41-LABEL: testv4i32u:			; SSE41-LABEL: testv4i32u:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]			; SSE41-NEXT: movdqa {{.*#+}} xmm1 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]
	; SSE41-NEXT: movdqa %xmm2, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm2
	; SSE41-NEXT: pshufb %xmm0, %xmm3			; SSE41-NEXT: pshufb %xmm0, %xmm2
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm3
	; SSE41-NEXT: psrlw $4, %xmm1			; SSE41-NEXT: psrlw $4, %xmm3
	; SSE41-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE41-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3
	; SSE41-NEXT: pxor %xmm4, %xmm4			; SSE41-NEXT: pxor %xmm4, %xmm4
	; SSE41-NEXT: pshufb %xmm1, %xmm2			; SSE41-NEXT: pshufb %xmm3, %xmm1
				; SSE41-NEXT: pcmpeqb %xmm4, %xmm3
				; SSE41-NEXT: pand %xmm2, %xmm3
				; SSE41-NEXT: paddb %xmm1, %xmm3
				; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: pcmpeqb %xmm4, %xmm1			; SSE41-NEXT: pcmpeqb %xmm4, %xmm1
	; SSE41-NEXT: pand %xmm3, %xmm1
	; SSE41-NEXT: paddb %xmm2, %xmm1
	; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: pcmpeqb %xmm4, %xmm2
	; SSE41-NEXT: psrlw $8, %xmm2
	; SSE41-NEXT: pand %xmm1, %xmm2
	; SSE41-NEXT: psrlw $8, %xmm1			; SSE41-NEXT: psrlw $8, %xmm1
	; SSE41-NEXT: paddw %xmm2, %xmm1			; SSE41-NEXT: pand %xmm3, %xmm1
				; SSE41-NEXT: psrlw $8, %xmm3
				; SSE41-NEXT: paddw %xmm1, %xmm3
	; SSE41-NEXT: pcmpeqw %xmm4, %xmm0			; SSE41-NEXT: pcmpeqw %xmm4, %xmm0
	; SSE41-NEXT: psrld $16, %xmm0			; SSE41-NEXT: psrld $16, %xmm0
	; SSE41-NEXT: pand %xmm1, %xmm0			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: psrld $16, %xmm1			; SSE41-NEXT: psrld $16, %xmm3
	; SSE41-NEXT: paddd %xmm0, %xmm1			; SSE41-NEXT: paddd %xmm3, %xmm0
	; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: testv4i32u:			; AVX-LABEL: testv4i32u:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]			; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]
	; AVX-NEXT: vpshufb %xmm0, %xmm1, %xmm2			; AVX-NEXT: vpshufb %xmm0, %xmm1, %xmm2
	; AVX-NEXT: vpsrlw $4, %xmm0, %xmm3			; AVX-NEXT: vpsrlw $4, %xmm0, %xmm3
	; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3, %xmm3			; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3, %xmm3
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; X32-SSE-NEXT: psrlw $8, %xmm3			; X32-SSE-NEXT: psrlw $8, %xmm3
	; X32-SSE-NEXT: pand %xmm1, %xmm3			; X32-SSE-NEXT: pand %xmm1, %xmm3
	; X32-SSE-NEXT: psrlw $8, %xmm1			; X32-SSE-NEXT: psrlw $8, %xmm1
	; X32-SSE-NEXT: paddw %xmm3, %xmm1			; X32-SSE-NEXT: paddw %xmm3, %xmm1
	; X32-SSE-NEXT: pcmpeqw %xmm2, %xmm0			; X32-SSE-NEXT: pcmpeqw %xmm2, %xmm0
	; X32-SSE-NEXT: psrld $16, %xmm0			; X32-SSE-NEXT: psrld $16, %xmm0
	; X32-SSE-NEXT: pand %xmm1, %xmm0			; X32-SSE-NEXT: pand %xmm1, %xmm0
	; X32-SSE-NEXT: psrld $16, %xmm1			; X32-SSE-NEXT: psrld $16, %xmm1
	; X32-SSE-NEXT: paddd %xmm0, %xmm1			; X32-SSE-NEXT: paddd %xmm1, %xmm0
	; X32-SSE-NEXT: movdqa %xmm1, %xmm0
	; X32-SSE-NEXT: retl			; X32-SSE-NEXT: retl

	%out = call <4 x i32> @llvm.ctlz.v4i32(<4 x i32> %in, i1 -1)			%out = call <4 x i32> @llvm.ctlz.v4i32(<4 x i32> %in, i1 -1)
	ret <4 x i32> %out			ret <4 x i32> %out
	}			}

	define <8 x i16> @testv8i16(<8 x i16> %in) nounwind {			define <8 x i16> @testv8i16(<8 x i16> %in) nounwind {
	; SSE2-LABEL: testv8i16:			; SSE2-LABEL: testv8i16:
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; SSE3-NEXT: movdqa %xmm2, %xmm0			; SSE3-NEXT: movdqa %xmm2, %xmm0
	; SSE3-NEXT: psllw $8, %xmm0			; SSE3-NEXT: psllw $8, %xmm0
	; SSE3-NEXT: paddb %xmm2, %xmm0			; SSE3-NEXT: paddb %xmm2, %xmm0
	; SSE3-NEXT: psrlw $8, %xmm0			; SSE3-NEXT: psrlw $8, %xmm0
	; SSE3-NEXT: retq			; SSE3-NEXT: retq
	;			;
	; SSSE3-LABEL: testv8i16:			; SSSE3-LABEL: testv8i16:
	; SSSE3: # %bb.0:			; SSSE3: # %bb.0:
	; SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]			; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]
	; SSSE3-NEXT: movdqa %xmm2, %xmm3			; SSSE3-NEXT: movdqa %xmm1, %xmm2
	; SSSE3-NEXT: pshufb %xmm0, %xmm3			; SSSE3-NEXT: pshufb %xmm0, %xmm2
	; SSSE3-NEXT: movdqa %xmm0, %xmm1			; SSSE3-NEXT: movdqa %xmm0, %xmm3
	; SSSE3-NEXT: psrlw $4, %xmm1			; SSSE3-NEXT: psrlw $4, %xmm3
	; SSSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3
	; SSSE3-NEXT: pxor %xmm4, %xmm4			; SSSE3-NEXT: pxor %xmm4, %xmm4
	; SSSE3-NEXT: pshufb %xmm1, %xmm2			; SSSE3-NEXT: pshufb %xmm3, %xmm1
	; SSSE3-NEXT: pcmpeqb %xmm4, %xmm1			; SSSE3-NEXT: pcmpeqb %xmm4, %xmm3
	; SSSE3-NEXT: pand %xmm3, %xmm1			; SSSE3-NEXT: pand %xmm2, %xmm3
	; SSSE3-NEXT: paddb %xmm2, %xmm1			; SSSE3-NEXT: paddb %xmm1, %xmm3
	; SSSE3-NEXT: pcmpeqb %xmm4, %xmm0			; SSSE3-NEXT: pcmpeqb %xmm4, %xmm0
	; SSSE3-NEXT: psrlw $8, %xmm0			; SSSE3-NEXT: psrlw $8, %xmm0
	; SSSE3-NEXT: pand %xmm1, %xmm0			; SSSE3-NEXT: pand %xmm3, %xmm0
	; SSSE3-NEXT: psrlw $8, %xmm1			; SSSE3-NEXT: psrlw $8, %xmm3
	; SSSE3-NEXT: paddw %xmm0, %xmm1			; SSSE3-NEXT: paddw %xmm3, %xmm0
	; SSSE3-NEXT: movdqa %xmm1, %xmm0
	; SSSE3-NEXT: retq			; SSSE3-NEXT: retq
	;			;
	; SSE41-LABEL: testv8i16:			; SSE41-LABEL: testv8i16:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]			; SSE41-NEXT: movdqa {{.*#+}} xmm1 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]
	; SSE41-NEXT: movdqa %xmm2, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm2
	; SSE41-NEXT: pshufb %xmm0, %xmm3			; SSE41-NEXT: pshufb %xmm0, %xmm2
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm3
	; SSE41-NEXT: psrlw $4, %xmm1			; SSE41-NEXT: psrlw $4, %xmm3
	; SSE41-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE41-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3
	; SSE41-NEXT: pxor %xmm4, %xmm4			; SSE41-NEXT: pxor %xmm4, %xmm4
	; SSE41-NEXT: pshufb %xmm1, %xmm2			; SSE41-NEXT: pshufb %xmm3, %xmm1
	; SSE41-NEXT: pcmpeqb %xmm4, %xmm1			; SSE41-NEXT: pcmpeqb %xmm4, %xmm3
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm2, %xmm3
	; SSE41-NEXT: paddb %xmm2, %xmm1			; SSE41-NEXT: paddb %xmm1, %xmm3
	; SSE41-NEXT: pcmpeqb %xmm4, %xmm0			; SSE41-NEXT: pcmpeqb %xmm4, %xmm0
	; SSE41-NEXT: psrlw $8, %xmm0			; SSE41-NEXT: psrlw $8, %xmm0
	; SSE41-NEXT: pand %xmm1, %xmm0			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: psrlw $8, %xmm1			; SSE41-NEXT: psrlw $8, %xmm3
	; SSE41-NEXT: paddw %xmm0, %xmm1			; SSE41-NEXT: paddw %xmm3, %xmm0
	; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: testv8i16:			; AVX-LABEL: testv8i16:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]			; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]
	; AVX-NEXT: vpshufb %xmm0, %xmm1, %xmm2			; AVX-NEXT: vpshufb %xmm0, %xmm1, %xmm2
	; AVX-NEXT: vpsrlw $4, %xmm0, %xmm3			; AVX-NEXT: vpsrlw $4, %xmm0, %xmm3
	; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3, %xmm3			; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3, %xmm3
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; X32-SSE-NEXT: pshufb %xmm1, %xmm2			; X32-SSE-NEXT: pshufb %xmm1, %xmm2
	; X32-SSE-NEXT: pcmpeqb %xmm4, %xmm1			; X32-SSE-NEXT: pcmpeqb %xmm4, %xmm1
	; X32-SSE-NEXT: pand %xmm3, %xmm1			; X32-SSE-NEXT: pand %xmm3, %xmm1
	; X32-SSE-NEXT: paddb %xmm2, %xmm1			; X32-SSE-NEXT: paddb %xmm2, %xmm1
	; X32-SSE-NEXT: pcmpeqb %xmm4, %xmm0			; X32-SSE-NEXT: pcmpeqb %xmm4, %xmm0
	; X32-SSE-NEXT: psrlw $8, %xmm0			; X32-SSE-NEXT: psrlw $8, %xmm0
	; X32-SSE-NEXT: pand %xmm1, %xmm0			; X32-SSE-NEXT: pand %xmm1, %xmm0
	; X32-SSE-NEXT: psrlw $8, %xmm1			; X32-SSE-NEXT: psrlw $8, %xmm1
	; X32-SSE-NEXT: paddw %xmm0, %xmm1			; X32-SSE-NEXT: paddw %xmm1, %xmm0
	; X32-SSE-NEXT: movdqa %xmm1, %xmm0
	; X32-SSE-NEXT: retl			; X32-SSE-NEXT: retl
	%out = call <8 x i16> @llvm.ctlz.v8i16(<8 x i16> %in, i1 0)			%out = call <8 x i16> @llvm.ctlz.v8i16(<8 x i16> %in, i1 0)
	ret <8 x i16> %out			ret <8 x i16> %out
	}			}

	define <8 x i16> @testv8i16u(<8 x i16> %in) nounwind {			define <8 x i16> @testv8i16u(<8 x i16> %in) nounwind {
	; SSE2-LABEL: testv8i16u:			; SSE2-LABEL: testv8i16u:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; SSE3-NEXT: movdqa %xmm2, %xmm0			; SSE3-NEXT: movdqa %xmm2, %xmm0
	; SSE3-NEXT: psllw $8, %xmm0			; SSE3-NEXT: psllw $8, %xmm0
	; SSE3-NEXT: paddb %xmm2, %xmm0			; SSE3-NEXT: paddb %xmm2, %xmm0
	; SSE3-NEXT: psrlw $8, %xmm0			; SSE3-NEXT: psrlw $8, %xmm0
	; SSE3-NEXT: retq			; SSE3-NEXT: retq
	;			;
	; SSSE3-LABEL: testv8i16u:			; SSSE3-LABEL: testv8i16u:
	; SSSE3: # %bb.0:			; SSSE3: # %bb.0:
	; SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]			; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]
	; SSSE3-NEXT: movdqa %xmm2, %xmm3			; SSSE3-NEXT: movdqa %xmm1, %xmm2
	; SSSE3-NEXT: pshufb %xmm0, %xmm3			; SSSE3-NEXT: pshufb %xmm0, %xmm2
	; SSSE3-NEXT: movdqa %xmm0, %xmm1			; SSSE3-NEXT: movdqa %xmm0, %xmm3
	; SSSE3-NEXT: psrlw $4, %xmm1			; SSSE3-NEXT: psrlw $4, %xmm3
	; SSSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3
	; SSSE3-NEXT: pxor %xmm4, %xmm4			; SSSE3-NEXT: pxor %xmm4, %xmm4
	; SSSE3-NEXT: pshufb %xmm1, %xmm2			; SSSE3-NEXT: pshufb %xmm3, %xmm1
	; SSSE3-NEXT: pcmpeqb %xmm4, %xmm1			; SSSE3-NEXT: pcmpeqb %xmm4, %xmm3
	; SSSE3-NEXT: pand %xmm3, %xmm1			; SSSE3-NEXT: pand %xmm2, %xmm3
	; SSSE3-NEXT: paddb %xmm2, %xmm1			; SSSE3-NEXT: paddb %xmm1, %xmm3
	; SSSE3-NEXT: pcmpeqb %xmm4, %xmm0			; SSSE3-NEXT: pcmpeqb %xmm4, %xmm0
	; SSSE3-NEXT: psrlw $8, %xmm0			; SSSE3-NEXT: psrlw $8, %xmm0
	; SSSE3-NEXT: pand %xmm1, %xmm0			; SSSE3-NEXT: pand %xmm3, %xmm0
	; SSSE3-NEXT: psrlw $8, %xmm1			; SSSE3-NEXT: psrlw $8, %xmm3
	; SSSE3-NEXT: paddw %xmm0, %xmm1			; SSSE3-NEXT: paddw %xmm3, %xmm0
	; SSSE3-NEXT: movdqa %xmm1, %xmm0
	; SSSE3-NEXT: retq			; SSSE3-NEXT: retq
	;			;
	; SSE41-LABEL: testv8i16u:			; SSE41-LABEL: testv8i16u:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]			; SSE41-NEXT: movdqa {{.*#+}} xmm1 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]
	; SSE41-NEXT: movdqa %xmm2, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm2
	; SSE41-NEXT: pshufb %xmm0, %xmm3			; SSE41-NEXT: pshufb %xmm0, %xmm2
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm3
	; SSE41-NEXT: psrlw $4, %xmm1			; SSE41-NEXT: psrlw $4, %xmm3
	; SSE41-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE41-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3
	; SSE41-NEXT: pxor %xmm4, %xmm4			; SSE41-NEXT: pxor %xmm4, %xmm4
	; SSE41-NEXT: pshufb %xmm1, %xmm2			; SSE41-NEXT: pshufb %xmm3, %xmm1
	; SSE41-NEXT: pcmpeqb %xmm4, %xmm1			; SSE41-NEXT: pcmpeqb %xmm4, %xmm3
	; SSE41-NEXT: pand %xmm3, %xmm1			; SSE41-NEXT: pand %xmm2, %xmm3
	; SSE41-NEXT: paddb %xmm2, %xmm1			; SSE41-NEXT: paddb %xmm1, %xmm3
	; SSE41-NEXT: pcmpeqb %xmm4, %xmm0			; SSE41-NEXT: pcmpeqb %xmm4, %xmm0
	; SSE41-NEXT: psrlw $8, %xmm0			; SSE41-NEXT: psrlw $8, %xmm0
	; SSE41-NEXT: pand %xmm1, %xmm0			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: psrlw $8, %xmm1			; SSE41-NEXT: psrlw $8, %xmm3
	; SSE41-NEXT: paddw %xmm0, %xmm1			; SSE41-NEXT: paddw %xmm3, %xmm0
	; SSE41-NEXT: movdqa %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: testv8i16u:			; AVX-LABEL: testv8i16u:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]			; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [4,3,2,2,1,1,1,1,0,0,0,0,0,0,0,0]
	; AVX-NEXT: vpshufb %xmm0, %xmm1, %xmm2			; AVX-NEXT: vpshufb %xmm0, %xmm1, %xmm2
	; AVX-NEXT: vpsrlw $4, %xmm0, %xmm3			; AVX-NEXT: vpsrlw $4, %xmm0, %xmm3
	; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3, %xmm3			; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm3, %xmm3
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; X32-SSE-NEXT: pshufb %xmm1, %xmm2			; X32-SSE-NEXT: pshufb %xmm1, %xmm2
	; X32-SSE-NEXT: pcmpeqb %xmm4, %xmm1			; X32-SSE-NEXT: pcmpeqb %xmm4, %xmm1
	; X32-SSE-NEXT: pand %xmm3, %xmm1			; X32-SSE-NEXT: pand %xmm3, %xmm1
	; X32-SSE-NEXT: paddb %xmm2, %xmm1			; X32-SSE-NEXT: paddb %xmm2, %xmm1
	; X32-SSE-NEXT: pcmpeqb %xmm4, %xmm0			; X32-SSE-NEXT: pcmpeqb %xmm4, %xmm0
	; X32-SSE-NEXT: psrlw $8, %xmm0			; X32-SSE-NEXT: psrlw $8, %xmm0
	; X32-SSE-NEXT: pand %xmm1, %xmm0			; X32-SSE-NEXT: pand %xmm1, %xmm0
	; X32-SSE-NEXT: psrlw $8, %xmm1			; X32-SSE-NEXT: psrlw $8, %xmm1
	; X32-SSE-NEXT: paddw %xmm0, %xmm1			; X32-SSE-NEXT: paddw %xmm1, %xmm0
	; X32-SSE-NEXT: movdqa %xmm1, %xmm0
	; X32-SSE-NEXT: retl			; X32-SSE-NEXT: retl
	%out = call <8 x i16> @llvm.ctlz.v8i16(<8 x i16> %in, i1 -1)			%out = call <8 x i16> @llvm.ctlz.v8i16(<8 x i16> %in, i1 -1)
	ret <8 x i16> %out			ret <8 x i16> %out
	}			}

	define <16 x i8> @testv16i8(<16 x i8> %in) nounwind {			define <16 x i8> @testv16i8(<16 x i8> %in) nounwind {
	; SSE2-LABEL: testv16i8:			; SSE2-LABEL: testv16i8:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	▲ Show 20 Lines • Show All 493 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-mul.ll

Show First 20 Lines • Show All 254 Lines • ▼ Show 20 Lines
; PowOf2 + 1 (uniform)		; PowOf2 + 1 (uniform)
;		;

define <2 x i64> @mul_v2i64_17(<2 x i64> %a0) nounwind {		define <2 x i64> @mul_v2i64_17(<2 x i64> %a0) nounwind {
; SSE-LABEL: mul_v2i64_17:		; SSE-LABEL: mul_v2i64_17:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movdqa %xmm0, %xmm1		; SSE-NEXT: movdqa %xmm0, %xmm1
; SSE-NEXT: psllq $4, %xmm1		; SSE-NEXT: psllq $4, %xmm1
; SSE-NEXT: paddq %xmm0, %xmm1		; SSE-NEXT: paddq %xmm1, %xmm0
; SSE-NEXT: movdqa %xmm1, %xmm0
; SSE-NEXT: ret{{[l\|q]}}		; SSE-NEXT: ret{{[l\|q]}}
;		;
; X64-AVX-LABEL: mul_v2i64_17:		; X64-AVX-LABEL: mul_v2i64_17:
; X64-AVX: # %bb.0:		; X64-AVX: # %bb.0:
; X64-AVX-NEXT: vpsllq $4, %xmm0, %xmm1		; X64-AVX-NEXT: vpsllq $4, %xmm0, %xmm1
; X64-AVX-NEXT: vpaddq %xmm0, %xmm1, %xmm0		; X64-AVX-NEXT: vpaddq %xmm0, %xmm1, %xmm0
; X64-AVX-NEXT: retq		; X64-AVX-NEXT: retq
%1 = mul <2 x i64> %a0, <i64 17, i64 17>		%1 = mul <2 x i64> %a0, <i64 17, i64 17>
ret <2 x i64> %1		ret <2 x i64> %1
}		}

define <4 x i32> @mul_v4i32_17(<4 x i32> %a0) nounwind {		define <4 x i32> @mul_v4i32_17(<4 x i32> %a0) nounwind {
; SSE2-LABEL: mul_v4i32_17:		; SSE2-LABEL: mul_v4i32_17:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm1
; SSE2-NEXT: pslld $4, %xmm1		; SSE2-NEXT: pslld $4, %xmm1
; SSE2-NEXT: paddd %xmm0, %xmm1		; SSE2-NEXT: paddd %xmm1, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm0
; SSE2-NEXT: ret{{[l\|q]}}		; SSE2-NEXT: ret{{[l\|q]}}
;		;
; X86-SSE4-LABEL: mul_v4i32_17:		; X86-SSE4-LABEL: mul_v4i32_17:
; X86-SSE4: # %bb.0:		; X86-SSE4: # %bb.0:
; X86-SSE4-NEXT: pmulld {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0		; X86-SSE4-NEXT: pmulld {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0
; X86-SSE4-NEXT: retl		; X86-SSE4-NEXT: retl
;		;
; X64-SSE4-FAST-LABEL: mul_v4i32_17:		; X64-SSE4-FAST-LABEL: mul_v4i32_17:
; X64-SSE4-FAST: # %bb.0:		; X64-SSE4-FAST: # %bb.0:
; X64-SSE4-FAST-NEXT: pmulld {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0		; X64-SSE4-FAST-NEXT: pmulld {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; X64-SSE4-FAST-NEXT: retq		; X64-SSE4-FAST-NEXT: retq
;		;
; X64-SSE4-SLOW-LABEL: mul_v4i32_17:		; X64-SSE4-SLOW-LABEL: mul_v4i32_17:
; X64-SSE4-SLOW: # %bb.0:		; X64-SSE4-SLOW: # %bb.0:
; X64-SSE4-SLOW-NEXT: movdqa %xmm0, %xmm1		; X64-SSE4-SLOW-NEXT: movdqa %xmm0, %xmm1
; X64-SSE4-SLOW-NEXT: pslld $4, %xmm1		; X64-SSE4-SLOW-NEXT: pslld $4, %xmm1
; X64-SSE4-SLOW-NEXT: paddd %xmm0, %xmm1		; X64-SSE4-SLOW-NEXT: paddd %xmm1, %xmm0
; X64-SSE4-SLOW-NEXT: movdqa %xmm1, %xmm0
; X64-SSE4-SLOW-NEXT: retq		; X64-SSE4-SLOW-NEXT: retq
;		;
; X64-XOP-LABEL: mul_v4i32_17:		; X64-XOP-LABEL: mul_v4i32_17:
; X64-XOP: # %bb.0:		; X64-XOP: # %bb.0:
; X64-XOP-NEXT: vpmulld {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0		; X64-XOP-NEXT: vpmulld {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
; X64-XOP-NEXT: retq		; X64-XOP-NEXT: retq
;		;
; X64-AVX2-LABEL: mul_v4i32_17:		; X64-AVX2-LABEL: mul_v4i32_17:
Show All 30 Lines
}		}

define <16 x i8> @mul_v16i8_17(<16 x i8> %a0) nounwind {		define <16 x i8> @mul_v16i8_17(<16 x i8> %a0) nounwind {
; X86-SSE-LABEL: mul_v16i8_17:		; X86-SSE-LABEL: mul_v16i8_17:
; X86-SSE: # %bb.0:		; X86-SSE: # %bb.0:
; X86-SSE-NEXT: movdqa %xmm0, %xmm1		; X86-SSE-NEXT: movdqa %xmm0, %xmm1
; X86-SSE-NEXT: psllw $4, %xmm1		; X86-SSE-NEXT: psllw $4, %xmm1
; X86-SSE-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm1		; X86-SSE-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm1
; X86-SSE-NEXT: paddb %xmm0, %xmm1		; X86-SSE-NEXT: paddb %xmm1, %xmm0
; X86-SSE-NEXT: movdqa %xmm1, %xmm0
; X86-SSE-NEXT: retl		; X86-SSE-NEXT: retl
;		;
; X64-SSE-LABEL: mul_v16i8_17:		; X64-SSE-LABEL: mul_v16i8_17:
; X64-SSE: # %bb.0:		; X64-SSE: # %bb.0:
; X64-SSE-NEXT: movdqa %xmm0, %xmm1		; X64-SSE-NEXT: movdqa %xmm0, %xmm1
; X64-SSE-NEXT: psllw $4, %xmm1		; X64-SSE-NEXT: psllw $4, %xmm1
; X64-SSE-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; X64-SSE-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
; X64-SSE-NEXT: paddb %xmm0, %xmm1		; X64-SSE-NEXT: paddb %xmm1, %xmm0
; X64-SSE-NEXT: movdqa %xmm1, %xmm0
; X64-SSE-NEXT: retq		; X64-SSE-NEXT: retq
;		;
; X64-XOP-LABEL: mul_v16i8_17:		; X64-XOP-LABEL: mul_v16i8_17:
; X64-XOP: # %bb.0:		; X64-XOP: # %bb.0:
; X64-XOP-NEXT: vpshlb {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm1		; X64-XOP-NEXT: vpshlb {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm1
; X64-XOP-NEXT: vpaddb %xmm0, %xmm1, %xmm0		; X64-XOP-NEXT: vpaddb %xmm0, %xmm1, %xmm0
; X64-XOP-NEXT: retq		; X64-XOP-NEXT: retq
;		;
Show All 14 Lines	; X64-AVX512DQ-NEXT: retq
ret <16 x i8> %1		ret <16 x i8> %1
}		}

define <4 x i64> @mul_v4i64_17(<4 x i64> %a0) nounwind {		define <4 x i64> @mul_v4i64_17(<4 x i64> %a0) nounwind {
; SSE-LABEL: mul_v4i64_17:		; SSE-LABEL: mul_v4i64_17:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movdqa %xmm0, %xmm2		; SSE-NEXT: movdqa %xmm0, %xmm2
; SSE-NEXT: psllq $4, %xmm2		; SSE-NEXT: psllq $4, %xmm2
; SSE-NEXT: paddq %xmm0, %xmm2		; SSE-NEXT: paddq %xmm2, %xmm0
; SSE-NEXT: movdqa %xmm1, %xmm3		; SSE-NEXT: movdqa %xmm1, %xmm2
; SSE-NEXT: psllq $4, %xmm3		; SSE-NEXT: psllq $4, %xmm2
; SSE-NEXT: paddq %xmm1, %xmm3		; SSE-NEXT: paddq %xmm2, %xmm1
; SSE-NEXT: movdqa %xmm2, %xmm0
; SSE-NEXT: movdqa %xmm3, %xmm1
; SSE-NEXT: ret{{[l\|q]}}		; SSE-NEXT: ret{{[l\|q]}}
;		;
; X64-XOP-LABEL: mul_v4i64_17:		; X64-XOP-LABEL: mul_v4i64_17:
; X64-XOP: # %bb.0:		; X64-XOP: # %bb.0:
; X64-XOP-NEXT: vextractf128 $1, %ymm0, %xmm1		; X64-XOP-NEXT: vextractf128 $1, %ymm0, %xmm1
; X64-XOP-NEXT: vpsllq $4, %xmm1, %xmm2		; X64-XOP-NEXT: vpsllq $4, %xmm1, %xmm2
; X64-XOP-NEXT: vpaddq %xmm1, %xmm2, %xmm1		; X64-XOP-NEXT: vpaddq %xmm1, %xmm2, %xmm1
; X64-XOP-NEXT: vpsllq $4, %xmm0, %xmm2		; X64-XOP-NEXT: vpsllq $4, %xmm0, %xmm2
Show All 16 Lines	; X64-AVX512DQ-NEXT: retq
ret <4 x i64> %1		ret <4 x i64> %1
}		}

define <8 x i32> @mul_v8i32_17(<8 x i32> %a0) nounwind {		define <8 x i32> @mul_v8i32_17(<8 x i32> %a0) nounwind {
; SSE2-LABEL: mul_v8i32_17:		; SSE2-LABEL: mul_v8i32_17:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movdqa %xmm0, %xmm2		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pslld $4, %xmm2		; SSE2-NEXT: pslld $4, %xmm2
; SSE2-NEXT: paddd %xmm0, %xmm2		; SSE2-NEXT: paddd %xmm2, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm3		; SSE2-NEXT: movdqa %xmm1, %xmm2
; SSE2-NEXT: pslld $4, %xmm3		; SSE2-NEXT: pslld $4, %xmm2
; SSE2-NEXT: paddd %xmm1, %xmm3		; SSE2-NEXT: paddd %xmm2, %xmm1
; SSE2-NEXT: movdqa %xmm2, %xmm0
; SSE2-NEXT: movdqa %xmm3, %xmm1
; SSE2-NEXT: ret{{[l\|q]}}		; SSE2-NEXT: ret{{[l\|q]}}
;		;
; X86-SSE4-LABEL: mul_v8i32_17:		; X86-SSE4-LABEL: mul_v8i32_17:
; X86-SSE4: # %bb.0:		; X86-SSE4: # %bb.0:
; X86-SSE4-NEXT: movdqa {{.*#+}} xmm2 = [17,17,17,17]		; X86-SSE4-NEXT: movdqa {{.*#+}} xmm2 = [17,17,17,17]
; X86-SSE4-NEXT: pmulld %xmm2, %xmm0		; X86-SSE4-NEXT: pmulld %xmm2, %xmm0
; X86-SSE4-NEXT: pmulld %xmm2, %xmm1		; X86-SSE4-NEXT: pmulld %xmm2, %xmm1
; X86-SSE4-NEXT: retl		; X86-SSE4-NEXT: retl
;		;
; X64-SSE4-FAST-LABEL: mul_v8i32_17:		; X64-SSE4-FAST-LABEL: mul_v8i32_17:
; X64-SSE4-FAST: # %bb.0:		; X64-SSE4-FAST: # %bb.0:
; X64-SSE4-FAST-NEXT: movdqa {{.*#+}} xmm2 = [17,17,17,17]		; X64-SSE4-FAST-NEXT: movdqa {{.*#+}} xmm2 = [17,17,17,17]
; X64-SSE4-FAST-NEXT: pmulld %xmm2, %xmm0		; X64-SSE4-FAST-NEXT: pmulld %xmm2, %xmm0
; X64-SSE4-FAST-NEXT: pmulld %xmm2, %xmm1		; X64-SSE4-FAST-NEXT: pmulld %xmm2, %xmm1
; X64-SSE4-FAST-NEXT: retq		; X64-SSE4-FAST-NEXT: retq
;		;
; X64-SSE4-SLOW-LABEL: mul_v8i32_17:		; X64-SSE4-SLOW-LABEL: mul_v8i32_17:
; X64-SSE4-SLOW: # %bb.0:		; X64-SSE4-SLOW: # %bb.0:
; X64-SSE4-SLOW-NEXT: movdqa %xmm0, %xmm2		; X64-SSE4-SLOW-NEXT: movdqa %xmm0, %xmm2
; X64-SSE4-SLOW-NEXT: pslld $4, %xmm2		; X64-SSE4-SLOW-NEXT: pslld $4, %xmm2
; X64-SSE4-SLOW-NEXT: paddd %xmm0, %xmm2		; X64-SSE4-SLOW-NEXT: paddd %xmm2, %xmm0
; X64-SSE4-SLOW-NEXT: movdqa %xmm1, %xmm3		; X64-SSE4-SLOW-NEXT: movdqa %xmm1, %xmm2
; X64-SSE4-SLOW-NEXT: pslld $4, %xmm3		; X64-SSE4-SLOW-NEXT: pslld $4, %xmm2
; X64-SSE4-SLOW-NEXT: paddd %xmm1, %xmm3		; X64-SSE4-SLOW-NEXT: paddd %xmm2, %xmm1
; X64-SSE4-SLOW-NEXT: movdqa %xmm2, %xmm0
; X64-SSE4-SLOW-NEXT: movdqa %xmm3, %xmm1
; X64-SSE4-SLOW-NEXT: retq		; X64-SSE4-SLOW-NEXT: retq
;		;
; X64-XOP-LABEL: mul_v8i32_17:		; X64-XOP-LABEL: mul_v8i32_17:
; X64-XOP: # %bb.0:		; X64-XOP: # %bb.0:
; X64-XOP-NEXT: vextractf128 $1, %ymm0, %xmm1		; X64-XOP-NEXT: vextractf128 $1, %ymm0, %xmm1
; X64-XOP-NEXT: vpslld $4, %xmm1, %xmm2		; X64-XOP-NEXT: vpslld $4, %xmm1, %xmm2
; X64-XOP-NEXT: vpaddd %xmm1, %xmm2, %xmm1		; X64-XOP-NEXT: vpaddd %xmm1, %xmm2, %xmm1
; X64-XOP-NEXT: vpslld $4, %xmm0, %xmm2		; X64-XOP-NEXT: vpslld $4, %xmm0, %xmm2
▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines	; X64-AVX512DQ-NEXT: retq
ret <16 x i16> %1		ret <16 x i16> %1
}		}

define <32 x i8> @mul_v32i8_17(<32 x i8> %a0) nounwind {		define <32 x i8> @mul_v32i8_17(<32 x i8> %a0) nounwind {
; SSE-LABEL: mul_v32i8_17:		; SSE-LABEL: mul_v32i8_17:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movdqa %xmm0, %xmm2		; SSE-NEXT: movdqa %xmm0, %xmm2
; SSE-NEXT: psllw $4, %xmm2		; SSE-NEXT: psllw $4, %xmm2
; SSE-NEXT: movdqa {{.*#+}} xmm4 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]		; SSE-NEXT: movdqa {{.*#+}} xmm3 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
; SSE-NEXT: pand %xmm4, %xmm2		; SSE-NEXT: pand %xmm3, %xmm2
; SSE-NEXT: paddb %xmm0, %xmm2		; SSE-NEXT: paddb %xmm2, %xmm0
; SSE-NEXT: movdqa %xmm1, %xmm3		; SSE-NEXT: movdqa %xmm1, %xmm2
; SSE-NEXT: psllw $4, %xmm3		; SSE-NEXT: psllw $4, %xmm2
; SSE-NEXT: pand %xmm4, %xmm3		; SSE-NEXT: pand %xmm3, %xmm2
; SSE-NEXT: paddb %xmm1, %xmm3		; SSE-NEXT: paddb %xmm2, %xmm1
; SSE-NEXT: movdqa %xmm2, %xmm0
; SSE-NEXT: movdqa %xmm3, %xmm1
; SSE-NEXT: ret{{[l\|q]}}		; SSE-NEXT: ret{{[l\|q]}}
;		;
; X64-XOP-LABEL: mul_v32i8_17:		; X64-XOP-LABEL: mul_v32i8_17:
; X64-XOP: # %bb.0:		; X64-XOP: # %bb.0:
; X64-XOP-NEXT: vextractf128 $1, %ymm0, %xmm1		; X64-XOP-NEXT: vextractf128 $1, %ymm0, %xmm1
; X64-XOP-NEXT: vmovdqa {{.*#+}} xmm2 = [4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4]		; X64-XOP-NEXT: vmovdqa {{.*#+}} xmm2 = [4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4]
; X64-XOP-NEXT: vpshlb %xmm2, %xmm1, %xmm3		; X64-XOP-NEXT: vpshlb %xmm2, %xmm1, %xmm3
; X64-XOP-NEXT: vpaddb %xmm1, %xmm3, %xmm1		; X64-XOP-NEXT: vpaddb %xmm1, %xmm3, %xmm1
▲ Show 20 Lines • Show All 1,507 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-popcnt-128-ult-ugt.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc < %s -mtriple=x86_64-unknown-unknown \| FileCheck %s --check-prefixes=SSE,SSE2		; RUN: llc < %s -mtriple=x86_64-unknown-unknown \| FileCheck %s --check-prefixes=SSE,SSE2
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse3 \| FileCheck %s --check-prefixes=SSE,SSE3		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse3 \| FileCheck %s --check-prefixes=SSE,SSE3
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+ssse3 \| FileCheck %s --check-prefixes=SSE,SSSE3		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+ssse3 \| FileCheck %s --check-prefixes=SSE,SSSE3
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 \| FileCheck %s --check-prefixes=SSE,SSE41		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 \| FileCheck %s --check-prefixes=SSE,SSE41
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefixes=AVX,AVX1		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefixes=AVX,AVX1
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefixes=AVX,AVX2		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefixes=AVX,AVX2
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512vpopcntdq \| FileCheck %s --check-prefixes=AVX,AVX512VPOPCNTDQ		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512vpopcntdq \| FileCheck %s --check-prefixes=AVX,AVX512VPOPCNTDQ
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512vpopcntdq,+avx512vl \| FileCheck %s --check-prefixes=AVX,AVX512VPOPCNTDQVL		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512vpopcntdq,+avx512vl \| FileCheck %s --check-prefixes=AVX,AVX512VPOPCNTDQVL
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bitalg \| FileCheck %s --check-prefix=BITALG_NOVLX		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bitalg \| FileCheck %s --check-prefix=BITALG_NOVLX
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bitalg,+avx512vl \| FileCheck %s --check-prefix=BITALG		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bitalg,+avx512vl \| FileCheck %s --check-prefix=BITALG


define <16 x i8> @ugt_1_v16i8(<16 x i8> %0) {		define <16 x i8> @ugt_1_v16i8(<16 x i8> %0) {
; SSE-LABEL: ugt_1_v16i8:		; SSE-LABEL: ugt_1_v16i8:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: pcmpeqd %xmm2, %xmm2		; SSE-NEXT: pcmpeqd %xmm1, %xmm1
; SSE-NEXT: movdqa %xmm0, %xmm1		; SSE-NEXT: movdqa %xmm0, %xmm2
; SSE-NEXT: paddb %xmm2, %xmm1		; SSE-NEXT: paddb %xmm1, %xmm2
; SSE-NEXT: pand %xmm0, %xmm1		; SSE-NEXT: pand %xmm2, %xmm0
; SSE-NEXT: pxor %xmm0, %xmm0		; SSE-NEXT: pxor %xmm2, %xmm2
; SSE-NEXT: pcmpeqb %xmm0, %xmm1		; SSE-NEXT: pcmpeqb %xmm2, %xmm0
; SSE-NEXT: pxor %xmm2, %xmm1		; SSE-NEXT: pxor %xmm1, %xmm0
; SSE-NEXT: movdqa %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: ugt_1_v16i8:		; AVX1-LABEL: ugt_1_v16i8:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1		; AVX1-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
; AVX1-NEXT: vpaddb %xmm1, %xmm0, %xmm2		; AVX1-NEXT: vpaddb %xmm1, %xmm0, %xmm2
; AVX1-NEXT: vpand %xmm2, %xmm0, %xmm0		; AVX1-NEXT: vpand %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
▲ Show 20 Lines • Show All 103 Lines • ▼ Show 20 Lines
; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]		; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
; SSE2-NEXT: movdqa %xmm0, %xmm2		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pand %xmm1, %xmm2		; SSE2-NEXT: pand %xmm1, %xmm2
; SSE2-NEXT: psrlw $2, %xmm0		; SSE2-NEXT: psrlw $2, %xmm0
; SSE2-NEXT: pand %xmm1, %xmm0		; SSE2-NEXT: pand %xmm1, %xmm0
; SSE2-NEXT: paddb %xmm2, %xmm0		; SSE2-NEXT: paddb %xmm2, %xmm0
; SSE2-NEXT: movdqa %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm1
; SSE2-NEXT: psrlw $4, %xmm1		; SSE2-NEXT: psrlw $4, %xmm1
; SSE2-NEXT: paddb %xmm0, %xmm1		; SSE2-NEXT: paddb %xmm1, %xmm0
; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE2-NEXT: pcmpgtb {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE2-NEXT: pcmpgtb {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE3-LABEL: ugt_2_v16i8:		; SSE3-LABEL: ugt_2_v16i8:
; SSE3: # %bb.0:		; SSE3: # %bb.0:
; SSE3-NEXT: movdqa %xmm0, %xmm1		; SSE3-NEXT: movdqa %xmm0, %xmm1
; SSE3-NEXT: psrlw $1, %xmm1		; SSE3-NEXT: psrlw $1, %xmm1
; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
; SSE3-NEXT: psubb %xmm1, %xmm0		; SSE3-NEXT: psubb %xmm1, %xmm0
; SSE3-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]		; SSE3-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
; SSE3-NEXT: movdqa %xmm0, %xmm2		; SSE3-NEXT: movdqa %xmm0, %xmm2
; SSE3-NEXT: pand %xmm1, %xmm2		; SSE3-NEXT: pand %xmm1, %xmm2
; SSE3-NEXT: psrlw $2, %xmm0		; SSE3-NEXT: psrlw $2, %xmm0
; SSE3-NEXT: pand %xmm1, %xmm0		; SSE3-NEXT: pand %xmm1, %xmm0
; SSE3-NEXT: paddb %xmm2, %xmm0		; SSE3-NEXT: paddb %xmm2, %xmm0
; SSE3-NEXT: movdqa %xmm0, %xmm1		; SSE3-NEXT: movdqa %xmm0, %xmm1
; SSE3-NEXT: psrlw $4, %xmm1		; SSE3-NEXT: psrlw $4, %xmm1
; SSE3-NEXT: paddb %xmm0, %xmm1		; SSE3-NEXT: paddb %xmm1, %xmm0
; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE3-NEXT: pcmpgtb {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE3-NEXT: pcmpgtb {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE3-NEXT: movdqa %xmm1, %xmm0
; SSE3-NEXT: retq		; SSE3-NEXT: retq
;		;
; SSSE3-LABEL: ugt_2_v16i8:		; SSSE3-LABEL: ugt_2_v16i8:
; SSSE3: # %bb.0:		; SSSE3: # %bb.0:
; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]		; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
; SSSE3-NEXT: movdqa %xmm0, %xmm2		; SSSE3-NEXT: movdqa %xmm0, %xmm2
; SSSE3-NEXT: pand %xmm1, %xmm2		; SSSE3-NEXT: pand %xmm1, %xmm2
; SSSE3-NEXT: movdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]		; SSSE3-NEXT: movdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
▲ Show 20 Lines • Show All 245 Lines • ▼ Show 20 Lines
; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]		; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
; SSE2-NEXT: movdqa %xmm0, %xmm2		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pand %xmm1, %xmm2		; SSE2-NEXT: pand %xmm1, %xmm2
; SSE2-NEXT: psrlw $2, %xmm0		; SSE2-NEXT: psrlw $2, %xmm0
; SSE2-NEXT: pand %xmm1, %xmm0		; SSE2-NEXT: pand %xmm1, %xmm0
; SSE2-NEXT: paddb %xmm2, %xmm0		; SSE2-NEXT: paddb %xmm2, %xmm0
; SSE2-NEXT: movdqa %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm1
; SSE2-NEXT: psrlw $4, %xmm1		; SSE2-NEXT: psrlw $4, %xmm1
; SSE2-NEXT: paddb %xmm0, %xmm1		; SSE2-NEXT: paddb %xmm1, %xmm0
; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE2-NEXT: pcmpgtb {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE2-NEXT: pcmpgtb {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE3-LABEL: ugt_3_v16i8:		; SSE3-LABEL: ugt_3_v16i8:
; SSE3: # %bb.0:		; SSE3: # %bb.0:
; SSE3-NEXT: movdqa %xmm0, %xmm1		; SSE3-NEXT: movdqa %xmm0, %xmm1
; SSE3-NEXT: psrlw $1, %xmm1		; SSE3-NEXT: psrlw $1, %xmm1
; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
; SSE3-NEXT: psubb %xmm1, %xmm0		; SSE3-NEXT: psubb %xmm1, %xmm0
; SSE3-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]		; SSE3-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
; SSE3-NEXT: movdqa %xmm0, %xmm2		; SSE3-NEXT: movdqa %xmm0, %xmm2
; SSE3-NEXT: pand %xmm1, %xmm2		; SSE3-NEXT: pand %xmm1, %xmm2
; SSE3-NEXT: psrlw $2, %xmm0		; SSE3-NEXT: psrlw $2, %xmm0
; SSE3-NEXT: pand %xmm1, %xmm0		; SSE3-NEXT: pand %xmm1, %xmm0
; SSE3-NEXT: paddb %xmm2, %xmm0		; SSE3-NEXT: paddb %xmm2, %xmm0
; SSE3-NEXT: movdqa %xmm0, %xmm1		; SSE3-NEXT: movdqa %xmm0, %xmm1
; SSE3-NEXT: psrlw $4, %xmm1		; SSE3-NEXT: psrlw $4, %xmm1
; SSE3-NEXT: paddb %xmm0, %xmm1		; SSE3-NEXT: paddb %xmm1, %xmm0
; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE3-NEXT: pcmpgtb {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE3-NEXT: pcmpgtb {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE3-NEXT: movdqa %xmm1, %xmm0
; SSE3-NEXT: retq		; SSE3-NEXT: retq
;		;
; SSSE3-LABEL: ugt_3_v16i8:		; SSSE3-LABEL: ugt_3_v16i8:
; SSSE3: # %bb.0:		; SSSE3: # %bb.0:
; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]		; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
; SSSE3-NEXT: movdqa %xmm0, %xmm2		; SSSE3-NEXT: movdqa %xmm0, %xmm2
; SSSE3-NEXT: pand %xmm1, %xmm2		; SSSE3-NEXT: pand %xmm1, %xmm2
; SSSE3-NEXT: movdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]		; SSSE3-NEXT: movdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
▲ Show 20 Lines • Show All 245 Lines • ▼ Show 20 Lines
; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]		; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
; SSE2-NEXT: movdqa %xmm0, %xmm2		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pand %xmm1, %xmm2		; SSE2-NEXT: pand %xmm1, %xmm2
; SSE2-NEXT: psrlw $2, %xmm0		; SSE2-NEXT: psrlw $2, %xmm0
; SSE2-NEXT: pand %xmm1, %xmm0		; SSE2-NEXT: pand %xmm1, %xmm0
; SSE2-NEXT: paddb %xmm2, %xmm0		; SSE2-NEXT: paddb %xmm2, %xmm0
; SSE2-NEXT: movdqa %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm1
; SSE2-NEXT: psrlw $4, %xmm1		; SSE2-NEXT: psrlw $4, %xmm1
; SSE2-NEXT: paddb %xmm0, %xmm1		; SSE2-NEXT: paddb %xmm1, %xmm0
; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE2-NEXT: pcmpgtb {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE2-NEXT: pcmpgtb {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE3-LABEL: ugt_4_v16i8:		; SSE3-LABEL: ugt_4_v16i8:
; SSE3: # %bb.0:		; SSE3: # %bb.0:
; SSE3-NEXT: movdqa %xmm0, %xmm1		; SSE3-NEXT: movdqa %xmm0, %xmm1
; SSE3-NEXT: psrlw $1, %xmm1		; SSE3-NEXT: psrlw $1, %xmm1
; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
; SSE3-NEXT: psubb %xmm1, %xmm0		; SSE3-NEXT: psubb %xmm1, %xmm0
; SSE3-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]		; SSE3-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
; SSE3-NEXT: movdqa %xmm0, %xmm2		; SSE3-NEXT: movdqa %xmm0, %xmm2
; SSE3-NEXT: pand %xmm1, %xmm2		; SSE3-NEXT: pand %xmm1, %xmm2
; SSE3-NEXT: psrlw $2, %xmm0		; SSE3-NEXT: psrlw $2, %xmm0
; SSE3-NEXT: pand %xmm1, %xmm0		; SSE3-NEXT: pand %xmm1, %xmm0
; SSE3-NEXT: paddb %xmm2, %xmm0		; SSE3-NEXT: paddb %xmm2, %xmm0
; SSE3-NEXT: movdqa %xmm0, %xmm1		; SSE3-NEXT: movdqa %xmm0, %xmm1
; SSE3-NEXT: psrlw $4, %xmm1		; SSE3-NEXT: psrlw $4, %xmm1
; SSE3-NEXT: paddb %xmm0, %xmm1		; SSE3-NEXT: paddb %xmm1, %xmm0
; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE3-NEXT: pcmpgtb {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE3-NEXT: pcmpgtb {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE3-NEXT: movdqa %xmm1, %xmm0
; SSE3-NEXT: retq		; SSE3-NEXT: retq
;		;
; SSSE3-LABEL: ugt_4_v16i8:		; SSSE3-LABEL: ugt_4_v16i8:
; SSSE3: # %bb.0:		; SSSE3: # %bb.0:
; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]		; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
; SSSE3-NEXT: movdqa %xmm0, %xmm2		; SSSE3-NEXT: movdqa %xmm0, %xmm2
; SSSE3-NEXT: pand %xmm1, %xmm2		; SSSE3-NEXT: pand %xmm1, %xmm2
; SSSE3-NEXT: movdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]		; SSSE3-NEXT: movdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
▲ Show 20 Lines • Show All 245 Lines • ▼ Show 20 Lines
; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]		; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
; SSE2-NEXT: movdqa %xmm0, %xmm2		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pand %xmm1, %xmm2		; SSE2-NEXT: pand %xmm1, %xmm2
; SSE2-NEXT: psrlw $2, %xmm0		; SSE2-NEXT: psrlw $2, %xmm0
; SSE2-NEXT: pand %xmm1, %xmm0		; SSE2-NEXT: pand %xmm1, %xmm0
; SSE2-NEXT: paddb %xmm2, %xmm0		; SSE2-NEXT: paddb %xmm2, %xmm0
; SSE2-NEXT: movdqa %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm1
; SSE2-NEXT: psrlw $4, %xmm1		; SSE2-NEXT: psrlw $4, %xmm1
; SSE2-NEXT: paddb %xmm0, %xmm1		; SSE2-NEXT: paddb %xmm1, %xmm0
; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE2-NEXT: pcmpgtb {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE2-NEXT: pcmpgtb {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE3-LABEL: ugt_5_v16i8:		; SSE3-LABEL: ugt_5_v16i8:
; SSE3: # %bb.0:		; SSE3: # %bb.0:
; SSE3-NEXT: movdqa %xmm0, %xmm1		; SSE3-NEXT: movdqa %xmm0, %xmm1
; SSE3-NEXT: psrlw $1, %xmm1		; SSE3-NEXT: psrlw $1, %xmm1
; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
; SSE3-NEXT: psubb %xmm1, %xmm0		; SSE3-NEXT: psubb %xmm1, %xmm0
; SSE3-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]		; SSE3-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
; SSE3-NEXT: movdqa %xmm0, %xmm2		; SSE3-NEXT: movdqa %xmm0, %xmm2
; SSE3-NEXT: pand %xmm1, %xmm2		; SSE3-NEXT: pand %xmm1, %xmm2
; SSE3-NEXT: psrlw $2, %xmm0		; SSE3-NEXT: psrlw $2, %xmm0
; SSE3-NEXT: pand %xmm1, %xmm0		; SSE3-NEXT: pand %xmm1, %xmm0
; SSE3-NEXT: paddb %xmm2, %xmm0		; SSE3-NEXT: paddb %xmm2, %xmm0
; SSE3-NEXT: movdqa %xmm0, %xmm1		; SSE3-NEXT: movdqa %xmm0, %xmm1
; SSE3-NEXT: psrlw $4, %xmm1		; SSE3-NEXT: psrlw $4, %xmm1
; SSE3-NEXT: paddb %xmm0, %xmm1		; SSE3-NEXT: paddb %xmm1, %xmm0
; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE3-NEXT: pcmpgtb {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE3-NEXT: pcmpgtb {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE3-NEXT: movdqa %xmm1, %xmm0
; SSE3-NEXT: retq		; SSE3-NEXT: retq
;		;
; SSSE3-LABEL: ugt_5_v16i8:		; SSSE3-LABEL: ugt_5_v16i8:
; SSSE3: # %bb.0:		; SSSE3: # %bb.0:
; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]		; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
; SSSE3-NEXT: movdqa %xmm0, %xmm2		; SSSE3-NEXT: movdqa %xmm0, %xmm2
; SSSE3-NEXT: pand %xmm1, %xmm2		; SSSE3-NEXT: pand %xmm1, %xmm2
; SSSE3-NEXT: movdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]		; SSSE3-NEXT: movdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
▲ Show 20 Lines • Show All 245 Lines • ▼ Show 20 Lines
; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]		; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
; SSE2-NEXT: movdqa %xmm0, %xmm2		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pand %xmm1, %xmm2		; SSE2-NEXT: pand %xmm1, %xmm2
; SSE2-NEXT: psrlw $2, %xmm0		; SSE2-NEXT: psrlw $2, %xmm0
; SSE2-NEXT: pand %xmm1, %xmm0		; SSE2-NEXT: pand %xmm1, %xmm0
; SSE2-NEXT: paddb %xmm2, %xmm0		; SSE2-NEXT: paddb %xmm2, %xmm0
; SSE2-NEXT: movdqa %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm1
; SSE2-NEXT: psrlw $4, %xmm1		; SSE2-NEXT: psrlw $4, %xmm1
; SSE2-NEXT: paddb %xmm0, %xmm1		; SSE2-NEXT: paddb %xmm1, %xmm0
; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE2-NEXT: pcmpgtb {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE2-NEXT: pcmpgtb {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE3-LABEL: ugt_6_v16i8:		; SSE3-LABEL: ugt_6_v16i8:
; SSE3: # %bb.0:		; SSE3: # %bb.0:
; SSE3-NEXT: movdqa %xmm0, %xmm1		; SSE3-NEXT: movdqa %xmm0, %xmm1
; SSE3-NEXT: psrlw $1, %xmm1		; SSE3-NEXT: psrlw $1, %xmm1
; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
; SSE3-NEXT: psubb %xmm1, %xmm0		; SSE3-NEXT: psubb %xmm1, %xmm0
; SSE3-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]		; SSE3-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
; SSE3-NEXT: movdqa %xmm0, %xmm2		; SSE3-NEXT: movdqa %xmm0, %xmm2
; SSE3-NEXT: pand %xmm1, %xmm2		; SSE3-NEXT: pand %xmm1, %xmm2
; SSE3-NEXT: psrlw $2, %xmm0		; SSE3-NEXT: psrlw $2, %xmm0
; SSE3-NEXT: pand %xmm1, %xmm0		; SSE3-NEXT: pand %xmm1, %xmm0
; SSE3-NEXT: paddb %xmm2, %xmm0		; SSE3-NEXT: paddb %xmm2, %xmm0
; SSE3-NEXT: movdqa %xmm0, %xmm1		; SSE3-NEXT: movdqa %xmm0, %xmm1
; SSE3-NEXT: psrlw $4, %xmm1		; SSE3-NEXT: psrlw $4, %xmm1
; SSE3-NEXT: paddb %xmm0, %xmm1		; SSE3-NEXT: paddb %xmm1, %xmm0
; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE3-NEXT: pcmpgtb {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE3-NEXT: pcmpgtb {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE3-NEXT: movdqa %xmm1, %xmm0
; SSE3-NEXT: retq		; SSE3-NEXT: retq
;		;
; SSSE3-LABEL: ugt_6_v16i8:		; SSSE3-LABEL: ugt_6_v16i8:
; SSSE3: # %bb.0:		; SSSE3: # %bb.0:
; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]		; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
; SSSE3-NEXT: movdqa %xmm0, %xmm2		; SSSE3-NEXT: movdqa %xmm0, %xmm2
; SSSE3-NEXT: pand %xmm1, %xmm2		; SSSE3-NEXT: pand %xmm1, %xmm2
; SSSE3-NEXT: movdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]		; SSSE3-NEXT: movdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
▲ Show 20 Lines • Show All 233 Lines • ▼ Show 20 Lines	; BITALG-NEXT: retq
%3 = icmp ult <16 x i8> %2, <i8 7, i8 7, i8 7, i8 7, i8 7, i8 7, i8 7, i8 7, i8 7, i8 7, i8 7, i8 7, i8 7, i8 7, i8 7, i8 7>		%3 = icmp ult <16 x i8> %2, <i8 7, i8 7, i8 7, i8 7, i8 7, i8 7, i8 7, i8 7, i8 7, i8 7, i8 7, i8 7, i8 7, i8 7, i8 7, i8 7>
%4 = sext <16 x i1> %3 to <16 x i8>		%4 = sext <16 x i1> %3 to <16 x i8>
ret <16 x i8> %4		ret <16 x i8> %4
}		}

define <8 x i16> @ugt_1_v8i16(<8 x i16> %0) {		define <8 x i16> @ugt_1_v8i16(<8 x i16> %0) {
; SSE-LABEL: ugt_1_v8i16:		; SSE-LABEL: ugt_1_v8i16:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: pcmpeqd %xmm2, %xmm2		; SSE-NEXT: pcmpeqd %xmm1, %xmm1
; SSE-NEXT: movdqa %xmm0, %xmm1		; SSE-NEXT: movdqa %xmm0, %xmm2
; SSE-NEXT: paddw %xmm2, %xmm1		; SSE-NEXT: paddw %xmm1, %xmm2
; SSE-NEXT: pand %xmm0, %xmm1		; SSE-NEXT: pand %xmm2, %xmm0
; SSE-NEXT: pxor %xmm0, %xmm0		; SSE-NEXT: pxor %xmm2, %xmm2
; SSE-NEXT: pcmpeqw %xmm0, %xmm1		; SSE-NEXT: pcmpeqw %xmm2, %xmm0
; SSE-NEXT: pxor %xmm2, %xmm1		; SSE-NEXT: pxor %xmm1, %xmm0
; SSE-NEXT: movdqa %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: ugt_1_v8i16:		; AVX1-LABEL: ugt_1_v8i16:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1		; AVX1-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
; AVX1-NEXT: vpaddw %xmm1, %xmm0, %xmm2		; AVX1-NEXT: vpaddw %xmm1, %xmm0, %xmm2
; AVX1-NEXT: vpand %xmm2, %xmm0, %xmm0		; AVX1-NEXT: vpand %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
▲ Show 20 Lines • Show All 4,238 Lines • ▼ Show 20 Lines	; BITALG-NEXT: retq
%3 = icmp ult <8 x i16> %2, <i16 15, i16 15, i16 15, i16 15, i16 15, i16 15, i16 15, i16 15>		%3 = icmp ult <8 x i16> %2, <i16 15, i16 15, i16 15, i16 15, i16 15, i16 15, i16 15, i16 15>
%4 = sext <8 x i1> %3 to <8 x i16>		%4 = sext <8 x i1> %3 to <8 x i16>
ret <8 x i16> %4		ret <8 x i16> %4
}		}

define <4 x i32> @ugt_1_v4i32(<4 x i32> %0) {		define <4 x i32> @ugt_1_v4i32(<4 x i32> %0) {
; SSE-LABEL: ugt_1_v4i32:		; SSE-LABEL: ugt_1_v4i32:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: pcmpeqd %xmm2, %xmm2		; SSE-NEXT: pcmpeqd %xmm1, %xmm1
; SSE-NEXT: movdqa %xmm0, %xmm1		; SSE-NEXT: movdqa %xmm0, %xmm2
; SSE-NEXT: paddd %xmm2, %xmm1		; SSE-NEXT: paddd %xmm1, %xmm2
; SSE-NEXT: pand %xmm0, %xmm1		; SSE-NEXT: pand %xmm2, %xmm0
; SSE-NEXT: pxor %xmm0, %xmm0		; SSE-NEXT: pxor %xmm2, %xmm2
; SSE-NEXT: pcmpeqd %xmm0, %xmm1		; SSE-NEXT: pcmpeqd %xmm2, %xmm0
; SSE-NEXT: pxor %xmm2, %xmm1		; SSE-NEXT: pxor %xmm1, %xmm0
; SSE-NEXT: movdqa %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: ugt_1_v4i32:		; AVX1-LABEL: ugt_1_v4i32:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1		; AVX1-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
; AVX1-NEXT: vpaddd %xmm1, %xmm0, %xmm2		; AVX1-NEXT: vpaddd %xmm1, %xmm0, %xmm2
; AVX1-NEXT: vpand %xmm2, %xmm0, %xmm0		; AVX1-NEXT: vpand %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
▲ Show 20 Lines • Show All 11,180 Lines • ▼ Show 20 Lines
; SSSE3-NEXT: pcmpeqd %xmm2, %xmm3		; SSSE3-NEXT: pcmpeqd %xmm2, %xmm3
; SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,0,3,2]		; SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,0,3,2]
; SSSE3-NEXT: pand %xmm3, %xmm0		; SSSE3-NEXT: pand %xmm3, %xmm0
; SSSE3-NEXT: pxor %xmm1, %xmm0		; SSSE3-NEXT: pxor %xmm1, %xmm0
; SSSE3-NEXT: retq		; SSSE3-NEXT: retq
;		;
; SSE41-LABEL: ugt_1_v2i64:		; SSE41-LABEL: ugt_1_v2i64:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: pcmpeqd %xmm2, %xmm2		; SSE41-NEXT: pcmpeqd %xmm1, %xmm1
; SSE41-NEXT: movdqa %xmm0, %xmm1		; SSE41-NEXT: movdqa %xmm0, %xmm2
; SSE41-NEXT: paddq %xmm2, %xmm1		; SSE41-NEXT: paddq %xmm1, %xmm2
; SSE41-NEXT: pand %xmm0, %xmm1		; SSE41-NEXT: pand %xmm2, %xmm0
; SSE41-NEXT: pxor %xmm0, %xmm0		; SSE41-NEXT: pxor %xmm2, %xmm2
; SSE41-NEXT: pcmpeqq %xmm0, %xmm1		; SSE41-NEXT: pcmpeqq %xmm2, %xmm0
; SSE41-NEXT: pxor %xmm2, %xmm1		; SSE41-NEXT: pxor %xmm1, %xmm0
; SSE41-NEXT: movdqa %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX1-LABEL: ugt_1_v2i64:		; AVX1-LABEL: ugt_1_v2i64:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1		; AVX1-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
; AVX1-NEXT: vpaddq %xmm1, %xmm0, %xmm2		; AVX1-NEXT: vpaddq %xmm1, %xmm0, %xmm2
; AVX1-NEXT: vpand %xmm2, %xmm0, %xmm0		; AVX1-NEXT: vpand %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
▲ Show 20 Lines • Show All 22,854 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-popcnt-128.ll

Show All 19 Lines
; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]		; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
; SSE2-NEXT: movdqa %xmm0, %xmm2		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pand %xmm1, %xmm2		; SSE2-NEXT: pand %xmm1, %xmm2
; SSE2-NEXT: psrlw $2, %xmm0		; SSE2-NEXT: psrlw $2, %xmm0
; SSE2-NEXT: pand %xmm1, %xmm0		; SSE2-NEXT: pand %xmm1, %xmm0
; SSE2-NEXT: paddb %xmm2, %xmm0		; SSE2-NEXT: paddb %xmm2, %xmm0
; SSE2-NEXT: movdqa %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm1
; SSE2-NEXT: psrlw $4, %xmm1		; SSE2-NEXT: psrlw $4, %xmm1
; SSE2-NEXT: paddb %xmm0, %xmm1		; SSE2-NEXT: paddb %xmm1, %xmm0
; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE2-NEXT: pxor %xmm0, %xmm0		; SSE2-NEXT: pxor %xmm1, %xmm1
; SSE2-NEXT: psadbw %xmm0, %xmm1		; SSE2-NEXT: psadbw %xmm1, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE3-LABEL: testv2i64:		; SSE3-LABEL: testv2i64:
; SSE3: # %bb.0:		; SSE3: # %bb.0:
; SSE3-NEXT: movdqa %xmm0, %xmm1		; SSE3-NEXT: movdqa %xmm0, %xmm1
; SSE3-NEXT: psrlw $1, %xmm1		; SSE3-NEXT: psrlw $1, %xmm1
; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
; SSE3-NEXT: psubb %xmm1, %xmm0		; SSE3-NEXT: psubb %xmm1, %xmm0
; SSE3-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]		; SSE3-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
; SSE3-NEXT: movdqa %xmm0, %xmm2		; SSE3-NEXT: movdqa %xmm0, %xmm2
; SSE3-NEXT: pand %xmm1, %xmm2		; SSE3-NEXT: pand %xmm1, %xmm2
; SSE3-NEXT: psrlw $2, %xmm0		; SSE3-NEXT: psrlw $2, %xmm0
; SSE3-NEXT: pand %xmm1, %xmm0		; SSE3-NEXT: pand %xmm1, %xmm0
; SSE3-NEXT: paddb %xmm2, %xmm0		; SSE3-NEXT: paddb %xmm2, %xmm0
; SSE3-NEXT: movdqa %xmm0, %xmm1		; SSE3-NEXT: movdqa %xmm0, %xmm1
; SSE3-NEXT: psrlw $4, %xmm1		; SSE3-NEXT: psrlw $4, %xmm1
; SSE3-NEXT: paddb %xmm0, %xmm1		; SSE3-NEXT: paddb %xmm1, %xmm0
; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE3-NEXT: pxor %xmm0, %xmm0		; SSE3-NEXT: pxor %xmm1, %xmm1
; SSE3-NEXT: psadbw %xmm0, %xmm1		; SSE3-NEXT: psadbw %xmm1, %xmm0
; SSE3-NEXT: movdqa %xmm1, %xmm0
; SSE3-NEXT: retq		; SSE3-NEXT: retq
;		;
; SSSE3-LABEL: testv2i64:		; SSSE3-LABEL: testv2i64:
; SSSE3: # %bb.0:		; SSSE3: # %bb.0:
; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]		; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
; SSSE3-NEXT: movdqa %xmm0, %xmm2		; SSSE3-NEXT: movdqa %xmm0, %xmm2
; SSSE3-NEXT: pand %xmm1, %xmm2		; SSSE3-NEXT: pand %xmm1, %xmm2
; SSSE3-NEXT: movdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]		; SSSE3-NEXT: movdqa {{.*#+}} xmm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
▲ Show 20 Lines • Show All 408 Lines • ▼ Show 20 Lines
; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]		; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
; SSE2-NEXT: movdqa %xmm0, %xmm2		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pand %xmm1, %xmm2		; SSE2-NEXT: pand %xmm1, %xmm2
; SSE2-NEXT: psrlw $2, %xmm0		; SSE2-NEXT: psrlw $2, %xmm0
; SSE2-NEXT: pand %xmm1, %xmm0		; SSE2-NEXT: pand %xmm1, %xmm0
; SSE2-NEXT: paddb %xmm2, %xmm0		; SSE2-NEXT: paddb %xmm2, %xmm0
; SSE2-NEXT: movdqa %xmm0, %xmm1		; SSE2-NEXT: movdqa %xmm0, %xmm1
; SSE2-NEXT: psrlw $4, %xmm1		; SSE2-NEXT: psrlw $4, %xmm1
; SSE2-NEXT: paddb %xmm0, %xmm1		; SSE2-NEXT: paddb %xmm1, %xmm0
; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE3-LABEL: testv16i8:		; SSE3-LABEL: testv16i8:
; SSE3: # %bb.0:		; SSE3: # %bb.0:
; SSE3-NEXT: movdqa %xmm0, %xmm1		; SSE3-NEXT: movdqa %xmm0, %xmm1
; SSE3-NEXT: psrlw $1, %xmm1		; SSE3-NEXT: psrlw $1, %xmm1
; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
; SSE3-NEXT: psubb %xmm1, %xmm0		; SSE3-NEXT: psubb %xmm1, %xmm0
; SSE3-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]		; SSE3-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
; SSE3-NEXT: movdqa %xmm0, %xmm2		; SSE3-NEXT: movdqa %xmm0, %xmm2
; SSE3-NEXT: pand %xmm1, %xmm2		; SSE3-NEXT: pand %xmm1, %xmm2
; SSE3-NEXT: psrlw $2, %xmm0		; SSE3-NEXT: psrlw $2, %xmm0
; SSE3-NEXT: pand %xmm1, %xmm0		; SSE3-NEXT: pand %xmm1, %xmm0
; SSE3-NEXT: paddb %xmm2, %xmm0		; SSE3-NEXT: paddb %xmm2, %xmm0
; SSE3-NEXT: movdqa %xmm0, %xmm1		; SSE3-NEXT: movdqa %xmm0, %xmm1
; SSE3-NEXT: psrlw $4, %xmm1		; SSE3-NEXT: psrlw $4, %xmm1
; SSE3-NEXT: paddb %xmm0, %xmm1		; SSE3-NEXT: paddb %xmm1, %xmm0
; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1		; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
; SSE3-NEXT: movdqa %xmm1, %xmm0
; SSE3-NEXT: retq		; SSE3-NEXT: retq
;		;
; SSSE3-LABEL: testv16i8:		; SSSE3-LABEL: testv16i8:
; SSSE3: # %bb.0:		; SSSE3: # %bb.0:
; SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]		; SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
; SSSE3-NEXT: movdqa %xmm0, %xmm3		; SSSE3-NEXT: movdqa %xmm0, %xmm3
; SSSE3-NEXT: pand %xmm2, %xmm3		; SSSE3-NEXT: pand %xmm2, %xmm3
; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]		; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4]
▲ Show 20 Lines • Show All 175 Lines • ▼ Show 20 Lines

define <2 x i64> @eq_1_v2i64(<2 x i64> %0) {		define <2 x i64> @eq_1_v2i64(<2 x i64> %0) {
; SSE2-LABEL: eq_1_v2i64:		; SSE2-LABEL: eq_1_v2i64:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: pxor %xmm1, %xmm1		; SSE2-NEXT: pxor %xmm1, %xmm1
; SSE2-NEXT: pcmpeqd %xmm2, %xmm2		; SSE2-NEXT: pcmpeqd %xmm2, %xmm2
; SSE2-NEXT: paddq %xmm0, %xmm2		; SSE2-NEXT: paddq %xmm0, %xmm2
; SSE2-NEXT: pand %xmm0, %xmm2		; SSE2-NEXT: pand %xmm0, %xmm2
; SSE2-NEXT: pcmpeqd %xmm1, %xmm0		; SSE2-NEXT: movdqa %xmm0, %xmm3
; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,0,3,2]		; SSE2-NEXT: pcmpeqd %xmm1, %xmm3
		; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,0,3,2]
; SSE2-NEXT: pand %xmm3, %xmm0		; SSE2-NEXT: pand %xmm3, %xmm0
; SSE2-NEXT: pcmpeqd %xmm1, %xmm2		; SSE2-NEXT: pcmpeqd %xmm1, %xmm2
; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm2[1,0,3,2]		; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm2[1,0,3,2]
; SSE2-NEXT: pand %xmm2, %xmm1		; SSE2-NEXT: pand %xmm2, %xmm1
; SSE2-NEXT: pandn %xmm1, %xmm0		; SSE2-NEXT: pandn %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE3-LABEL: eq_1_v2i64:		; SSE3-LABEL: eq_1_v2i64:
; SSE3: # %bb.0:		; SSE3: # %bb.0:
; SSE3-NEXT: pxor %xmm1, %xmm1		; SSE3-NEXT: pxor %xmm1, %xmm1
; SSE3-NEXT: pcmpeqd %xmm2, %xmm2		; SSE3-NEXT: pcmpeqd %xmm2, %xmm2
; SSE3-NEXT: paddq %xmm0, %xmm2		; SSE3-NEXT: paddq %xmm0, %xmm2
; SSE3-NEXT: pand %xmm0, %xmm2		; SSE3-NEXT: pand %xmm0, %xmm2
; SSE3-NEXT: pcmpeqd %xmm1, %xmm0		; SSE3-NEXT: movdqa %xmm0, %xmm3
; SSE3-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,0,3,2]		; SSE3-NEXT: pcmpeqd %xmm1, %xmm3
		; SSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,0,3,2]
; SSE3-NEXT: pand %xmm3, %xmm0		; SSE3-NEXT: pand %xmm3, %xmm0
; SSE3-NEXT: pcmpeqd %xmm1, %xmm2		; SSE3-NEXT: pcmpeqd %xmm1, %xmm2
; SSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm2[1,0,3,2]		; SSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm2[1,0,3,2]
; SSE3-NEXT: pand %xmm2, %xmm1		; SSE3-NEXT: pand %xmm2, %xmm1
; SSE3-NEXT: pandn %xmm1, %xmm0		; SSE3-NEXT: pandn %xmm1, %xmm0
; SSE3-NEXT: retq		; SSE3-NEXT: retq
;		;
; SSSE3-LABEL: eq_1_v2i64:		; SSSE3-LABEL: eq_1_v2i64:
; SSSE3: # %bb.0:		; SSSE3: # %bb.0:
; SSSE3-NEXT: pxor %xmm1, %xmm1		; SSSE3-NEXT: pxor %xmm1, %xmm1
; SSSE3-NEXT: pcmpeqd %xmm2, %xmm2		; SSSE3-NEXT: pcmpeqd %xmm2, %xmm2
; SSSE3-NEXT: paddq %xmm0, %xmm2		; SSSE3-NEXT: paddq %xmm0, %xmm2
; SSSE3-NEXT: pand %xmm0, %xmm2		; SSSE3-NEXT: pand %xmm0, %xmm2
; SSSE3-NEXT: pcmpeqd %xmm1, %xmm0		; SSSE3-NEXT: movdqa %xmm0, %xmm3
; SSSE3-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,0,3,2]		; SSSE3-NEXT: pcmpeqd %xmm1, %xmm3
		; SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,0,3,2]
; SSSE3-NEXT: pand %xmm3, %xmm0		; SSSE3-NEXT: pand %xmm3, %xmm0
; SSSE3-NEXT: pcmpeqd %xmm1, %xmm2		; SSSE3-NEXT: pcmpeqd %xmm1, %xmm2
; SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm2[1,0,3,2]		; SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm2[1,0,3,2]
; SSSE3-NEXT: pand %xmm2, %xmm1		; SSSE3-NEXT: pand %xmm2, %xmm1
; SSSE3-NEXT: pandn %xmm1, %xmm0		; SSSE3-NEXT: pandn %xmm1, %xmm0
; SSSE3-NEXT: retq		; SSSE3-NEXT: retq
;		;
; SSE41-LABEL: eq_1_v2i64:		; SSE41-LABEL: eq_1_v2i64:
▲ Show 20 Lines • Show All 75 Lines • ▼ Show 20 Lines
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: pxor %xmm1, %xmm1		; SSE2-NEXT: pxor %xmm1, %xmm1
; SSE2-NEXT: pcmpeqd %xmm2, %xmm2		; SSE2-NEXT: pcmpeqd %xmm2, %xmm2
; SSE2-NEXT: movdqa %xmm0, %xmm3		; SSE2-NEXT: movdqa %xmm0, %xmm3
; SSE2-NEXT: paddq %xmm2, %xmm3		; SSE2-NEXT: paddq %xmm2, %xmm3
; SSE2-NEXT: pand %xmm0, %xmm3		; SSE2-NEXT: pand %xmm0, %xmm3
; SSE2-NEXT: pcmpeqd %xmm1, %xmm0		; SSE2-NEXT: pcmpeqd %xmm1, %xmm0
; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,0,3,2]		; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,0,3,2]
; SSE2-NEXT: pand %xmm4, %xmm0		; SSE2-NEXT: pand %xmm0, %xmm4
; SSE2-NEXT: pcmpeqd %xmm1, %xmm3		; SSE2-NEXT: pcmpeqd %xmm1, %xmm3
; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm3[1,0,3,2]		; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,0,3,2]
; SSE2-NEXT: pand %xmm3, %xmm1		; SSE2-NEXT: pand %xmm3, %xmm0
; SSE2-NEXT: pxor %xmm2, %xmm1		; SSE2-NEXT: pxor %xmm2, %xmm0
; SSE2-NEXT: por %xmm1, %xmm0		; SSE2-NEXT: por %xmm4, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE3-LABEL: ne_1_v2i64:		; SSE3-LABEL: ne_1_v2i64:
; SSE3: # %bb.0:		; SSE3: # %bb.0:
; SSE3-NEXT: pxor %xmm1, %xmm1		; SSE3-NEXT: pxor %xmm1, %xmm1
; SSE3-NEXT: pcmpeqd %xmm2, %xmm2		; SSE3-NEXT: pcmpeqd %xmm2, %xmm2
; SSE3-NEXT: movdqa %xmm0, %xmm3		; SSE3-NEXT: movdqa %xmm0, %xmm3
; SSE3-NEXT: paddq %xmm2, %xmm3		; SSE3-NEXT: paddq %xmm2, %xmm3
; SSE3-NEXT: pand %xmm0, %xmm3		; SSE3-NEXT: pand %xmm0, %xmm3
; SSE3-NEXT: pcmpeqd %xmm1, %xmm0		; SSE3-NEXT: pcmpeqd %xmm1, %xmm0
; SSE3-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,0,3,2]		; SSE3-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,0,3,2]
; SSE3-NEXT: pand %xmm4, %xmm0		; SSE3-NEXT: pand %xmm0, %xmm4
; SSE3-NEXT: pcmpeqd %xmm1, %xmm3		; SSE3-NEXT: pcmpeqd %xmm1, %xmm3
; SSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm3[1,0,3,2]		; SSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,0,3,2]
; SSE3-NEXT: pand %xmm3, %xmm1		; SSE3-NEXT: pand %xmm3, %xmm0
; SSE3-NEXT: pxor %xmm2, %xmm1		; SSE3-NEXT: pxor %xmm2, %xmm0
; SSE3-NEXT: por %xmm1, %xmm0		; SSE3-NEXT: por %xmm4, %xmm0
; SSE3-NEXT: retq		; SSE3-NEXT: retq
;		;
; SSSE3-LABEL: ne_1_v2i64:		; SSSE3-LABEL: ne_1_v2i64:
; SSSE3: # %bb.0:		; SSSE3: # %bb.0:
; SSSE3-NEXT: pxor %xmm1, %xmm1		; SSSE3-NEXT: pxor %xmm1, %xmm1
; SSSE3-NEXT: pcmpeqd %xmm2, %xmm2		; SSSE3-NEXT: pcmpeqd %xmm2, %xmm2
; SSSE3-NEXT: movdqa %xmm0, %xmm3		; SSSE3-NEXT: movdqa %xmm0, %xmm3
; SSSE3-NEXT: paddq %xmm2, %xmm3		; SSSE3-NEXT: paddq %xmm2, %xmm3
; SSSE3-NEXT: pand %xmm0, %xmm3		; SSSE3-NEXT: pand %xmm0, %xmm3
; SSSE3-NEXT: pcmpeqd %xmm1, %xmm0		; SSSE3-NEXT: pcmpeqd %xmm1, %xmm0
; SSSE3-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,0,3,2]		; SSSE3-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,0,3,2]
; SSSE3-NEXT: pand %xmm4, %xmm0		; SSSE3-NEXT: pand %xmm0, %xmm4
; SSSE3-NEXT: pcmpeqd %xmm1, %xmm3		; SSSE3-NEXT: pcmpeqd %xmm1, %xmm3
; SSSE3-NEXT: pshufd {{.*#+}} xmm1 = xmm3[1,0,3,2]		; SSSE3-NEXT: pshufd {{.*#+}} xmm0 = xmm3[1,0,3,2]
; SSSE3-NEXT: pand %xmm3, %xmm1		; SSSE3-NEXT: pand %xmm3, %xmm0
; SSSE3-NEXT: pxor %xmm2, %xmm1		; SSSE3-NEXT: pxor %xmm2, %xmm0
; SSSE3-NEXT: por %xmm1, %xmm0		; SSSE3-NEXT: por %xmm4, %xmm0
; SSSE3-NEXT: retq		; SSSE3-NEXT: retq
;		;
; SSE41-LABEL: ne_1_v2i64:		; SSE41-LABEL: ne_1_v2i64:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: pxor %xmm2, %xmm2		; SSE41-NEXT: pxor %xmm1, %xmm1
		; SSE41-NEXT: movdqa %xmm0, %xmm2
		; SSE41-NEXT: pcmpeqq %xmm1, %xmm2
; SSE41-NEXT: pcmpeqd %xmm3, %xmm3		; SSE41-NEXT: pcmpeqd %xmm3, %xmm3
; SSE41-NEXT: movdqa %xmm0, %xmm1		; SSE41-NEXT: movdqa %xmm0, %xmm4
; SSE41-NEXT: paddq %xmm3, %xmm1		; SSE41-NEXT: paddq %xmm3, %xmm4
; SSE41-NEXT: pand %xmm0, %xmm1		; SSE41-NEXT: pand %xmm4, %xmm0
; SSE41-NEXT: pcmpeqq %xmm2, %xmm0		; SSE41-NEXT: pcmpeqq %xmm1, %xmm0
; SSE41-NEXT: pcmpeqq %xmm2, %xmm1		; SSE41-NEXT: pxor %xmm3, %xmm0
; SSE41-NEXT: pxor %xmm3, %xmm1		; SSE41-NEXT: por %xmm2, %xmm0
; SSE41-NEXT: por %xmm0, %xmm1
; SSE41-NEXT: movdqa %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX1-LABEL: ne_1_v2i64:		; AVX1-LABEL: ne_1_v2i64:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1		; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
; AVX1-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm2		; AVX1-NEXT: vpcmpeqq %xmm1, %xmm0, %xmm2
; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3		; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
; AVX1-NEXT: vpaddq %xmm3, %xmm0, %xmm4		; AVX1-NEXT: vpaddq %xmm3, %xmm0, %xmm4
▲ Show 20 Lines • Show All 136 Lines • ▼ Show 20 Lines	; BITALG-NEXT: retq
%3 = icmp eq <4 x i32> %2, <i32 1, i32 1, i32 1, i32 1>		%3 = icmp eq <4 x i32> %2, <i32 1, i32 1, i32 1, i32 1>
%4 = sext <4 x i1> %3 to <4 x i32>		%4 = sext <4 x i1> %3 to <4 x i32>
ret <4 x i32> %4		ret <4 x i32> %4
}		}

define <4 x i32> @ne_1_v4i32(<4 x i32> %0) {		define <4 x i32> @ne_1_v4i32(<4 x i32> %0) {
; SSE-LABEL: ne_1_v4i32:		; SSE-LABEL: ne_1_v4i32:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: pxor %xmm2, %xmm2		; SSE-NEXT: pxor %xmm1, %xmm1
		; SSE-NEXT: movdqa %xmm0, %xmm2
		; SSE-NEXT: pcmpeqd %xmm1, %xmm2
; SSE-NEXT: pcmpeqd %xmm3, %xmm3		; SSE-NEXT: pcmpeqd %xmm3, %xmm3
; SSE-NEXT: movdqa %xmm0, %xmm1		; SSE-NEXT: movdqa %xmm0, %xmm4
; SSE-NEXT: paddd %xmm3, %xmm1		; SSE-NEXT: paddd %xmm3, %xmm4
; SSE-NEXT: pand %xmm0, %xmm1		; SSE-NEXT: pand %xmm4, %xmm0
; SSE-NEXT: pcmpeqd %xmm2, %xmm0		; SSE-NEXT: pcmpeqd %xmm1, %xmm0
; SSE-NEXT: pcmpeqd %xmm2, %xmm1		; SSE-NEXT: pxor %xmm3, %xmm0
; SSE-NEXT: pxor %xmm3, %xmm1		; SSE-NEXT: por %xmm2, %xmm0
; SSE-NEXT: por %xmm0, %xmm1
; SSE-NEXT: movdqa %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: ne_1_v4i32:		; AVX1-LABEL: ne_1_v4i32:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1		; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
; AVX1-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm2		; AVX1-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm2
; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3		; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
; AVX1-NEXT: vpaddd %xmm3, %xmm0, %xmm4		; AVX1-NEXT: vpaddd %xmm3, %xmm0, %xmm4
▲ Show 20 Lines • Show All 103 Lines • ▼ Show 20 Lines	; BITALG-NEXT: retq
%3 = icmp eq <8 x i16> %2, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>		%3 = icmp eq <8 x i16> %2, <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>
%4 = sext <8 x i1> %3 to <8 x i16>		%4 = sext <8 x i1> %3 to <8 x i16>
ret <8 x i16> %4		ret <8 x i16> %4
}		}

define <8 x i16> @ne_1_v8i16(<8 x i16> %0) {		define <8 x i16> @ne_1_v8i16(<8 x i16> %0) {
; SSE-LABEL: ne_1_v8i16:		; SSE-LABEL: ne_1_v8i16:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: pxor %xmm2, %xmm2		; SSE-NEXT: pxor %xmm1, %xmm1
		; SSE-NEXT: movdqa %xmm0, %xmm2
		; SSE-NEXT: pcmpeqw %xmm1, %xmm2
; SSE-NEXT: pcmpeqd %xmm3, %xmm3		; SSE-NEXT: pcmpeqd %xmm3, %xmm3
; SSE-NEXT: movdqa %xmm0, %xmm1		; SSE-NEXT: movdqa %xmm0, %xmm4
; SSE-NEXT: paddw %xmm3, %xmm1		; SSE-NEXT: paddw %xmm3, %xmm4
; SSE-NEXT: pand %xmm0, %xmm1		; SSE-NEXT: pand %xmm4, %xmm0
; SSE-NEXT: pcmpeqw %xmm2, %xmm0		; SSE-NEXT: pcmpeqw %xmm1, %xmm0
; SSE-NEXT: pcmpeqw %xmm2, %xmm1		; SSE-NEXT: pxor %xmm3, %xmm0
; SSE-NEXT: pxor %xmm3, %xmm1		; SSE-NEXT: por %xmm2, %xmm0
; SSE-NEXT: por %xmm0, %xmm1
; SSE-NEXT: movdqa %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: ne_1_v8i16:		; AVX1-LABEL: ne_1_v8i16:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1		; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
; AVX1-NEXT: vpcmpeqw %xmm1, %xmm0, %xmm2		; AVX1-NEXT: vpcmpeqw %xmm1, %xmm0, %xmm2
; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3		; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
; AVX1-NEXT: vpaddw %xmm3, %xmm0, %xmm4		; AVX1-NEXT: vpaddw %xmm3, %xmm0, %xmm4
▲ Show 20 Lines • Show All 101 Lines • ▼ Show 20 Lines	; BITALG-NEXT: retq
%3 = icmp eq <16 x i8> %2, <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>		%3 = icmp eq <16 x i8> %2, <i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1, i8 1>
%4 = sext <16 x i1> %3 to <16 x i8>		%4 = sext <16 x i1> %3 to <16 x i8>
ret <16 x i8> %4		ret <16 x i8> %4
}		}

define <16 x i8> @ne_1_v16i8(<16 x i8> %0) {		define <16 x i8> @ne_1_v16i8(<16 x i8> %0) {
; SSE-LABEL: ne_1_v16i8:		; SSE-LABEL: ne_1_v16i8:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: pxor %xmm2, %xmm2		; SSE-NEXT: pxor %xmm1, %xmm1
		; SSE-NEXT: movdqa %xmm0, %xmm2
		; SSE-NEXT: pcmpeqb %xmm1, %xmm2
; SSE-NEXT: pcmpeqd %xmm3, %xmm3		; SSE-NEXT: pcmpeqd %xmm3, %xmm3
; SSE-NEXT: movdqa %xmm0, %xmm1		; SSE-NEXT: movdqa %xmm0, %xmm4
; SSE-NEXT: paddb %xmm3, %xmm1		; SSE-NEXT: paddb %xmm3, %xmm4
; SSE-NEXT: pand %xmm0, %xmm1		; SSE-NEXT: pand %xmm4, %xmm0
; SSE-NEXT: pcmpeqb %xmm2, %xmm0		; SSE-NEXT: pcmpeqb %xmm1, %xmm0
; SSE-NEXT: pcmpeqb %xmm2, %xmm1		; SSE-NEXT: pxor %xmm3, %xmm0
; SSE-NEXT: pxor %xmm3, %xmm1		; SSE-NEXT: por %xmm2, %xmm0
; SSE-NEXT: por %xmm0, %xmm1
; SSE-NEXT: movdqa %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: ne_1_v16i8:		; AVX1-LABEL: ne_1_v16i8:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1		; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
; AVX1-NEXT: vpcmpeqb %xmm1, %xmm0, %xmm2		; AVX1-NEXT: vpcmpeqb %xmm1, %xmm0, %xmm2
; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3		; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
; AVX1-NEXT: vpaddb %xmm3, %xmm0, %xmm4		; AVX1-NEXT: vpaddb %xmm3, %xmm0, %xmm4
▲ Show 20 Lines • Show All 68 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-reduce-fadd-fast.ll

	Show First 20 Lines • Show All 275 Lines • ▼ Show 20 Lines
	; vXf32 (zero)			; vXf32 (zero)
	;			;

	define float @test_v2f32_zero(<2 x float> %a0) {			define float @test_v2f32_zero(<2 x float> %a0) {
	; SSE2-LABEL: test_v2f32_zero:			; SSE2-LABEL: test_v2f32_zero:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movaps %xmm0, %xmm1			; SSE2-NEXT: movaps %xmm0, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[1,1]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[1,1]
	; SSE2-NEXT: addss %xmm0, %xmm1			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v2f32_zero:			; SSE41-LABEL: test_v2f32_zero:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	Show All 35 Lines
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v4f32_zero:			; SSE41-LABEL: test_v4f32_zero:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movaps %xmm0, %xmm1			; SSE41-NEXT: movaps %xmm0, %xmm1
	; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE41-NEXT: addps %xmm0, %xmm1			; SSE41-NEXT: addps %xmm0, %xmm1
	; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: addss %xmm0, %xmm1			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-SLOW-LABEL: test_v4f32_zero:			; AVX1-SLOW-LABEL: test_v4f32_zero:
	; AVX1-SLOW: # %bb.0:			; AVX1-SLOW: # %bb.0:
	; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	; AVX1-SLOW-NEXT: vaddps %xmm1, %xmm0, %xmm0			; AVX1-SLOW-NEXT: vaddps %xmm1, %xmm0, %xmm0
	; AVX1-SLOW-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]			; AVX1-SLOW-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
	; AVX1-SLOW-NEXT: vaddss %xmm1, %xmm0, %xmm0			; AVX1-SLOW-NEXT: vaddss %xmm1, %xmm0, %xmm0
	Show All 38 Lines
	;			;
	; SSE41-LABEL: test_v8f32_zero:			; SSE41-LABEL: test_v8f32_zero:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: addps %xmm1, %xmm0			; SSE41-NEXT: addps %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm0, %xmm1			; SSE41-NEXT: movaps %xmm0, %xmm1
	; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE41-NEXT: addps %xmm0, %xmm1			; SSE41-NEXT: addps %xmm0, %xmm1
	; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: addss %xmm0, %xmm1			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-SLOW-LABEL: test_v8f32_zero:			; AVX1-SLOW-LABEL: test_v8f32_zero:
	; AVX1-SLOW: # %bb.0:			; AVX1-SLOW: # %bb.0:
	; AVX1-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-SLOW-NEXT: vaddps %xmm1, %xmm0, %xmm0			; AVX1-SLOW-NEXT: vaddps %xmm1, %xmm0, %xmm0
	; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	; AVX1-SLOW-NEXT: vaddps %xmm1, %xmm0, %xmm0			; AVX1-SLOW-NEXT: vaddps %xmm1, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: addps %xmm3, %xmm1			; SSE41-NEXT: addps %xmm3, %xmm1
	; SSE41-NEXT: addps %xmm2, %xmm0			; SSE41-NEXT: addps %xmm2, %xmm0
	; SSE41-NEXT: addps %xmm1, %xmm0			; SSE41-NEXT: addps %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm0, %xmm1			; SSE41-NEXT: movaps %xmm0, %xmm1
	; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE41-NEXT: addps %xmm0, %xmm1			; SSE41-NEXT: addps %xmm0, %xmm1
	; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: addss %xmm0, %xmm1			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-SLOW-LABEL: test_v16f32_zero:			; AVX1-SLOW-LABEL: test_v16f32_zero:
	; AVX1-SLOW: # %bb.0:			; AVX1-SLOW: # %bb.0:
	; AVX1-SLOW-NEXT: vaddps %ymm1, %ymm0, %ymm0			; AVX1-SLOW-NEXT: vaddps %ymm1, %ymm0, %ymm0
	; AVX1-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-SLOW-NEXT: vaddps %xmm1, %xmm0, %xmm0			; AVX1-SLOW-NEXT: vaddps %xmm1, %xmm0, %xmm0
	; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; vXf32 (undef)			; vXf32 (undef)
	;			;

	define float @test_v2f32_undef(<2 x float> %a0) {			define float @test_v2f32_undef(<2 x float> %a0) {
	; SSE2-LABEL: test_v2f32_undef:			; SSE2-LABEL: test_v2f32_undef:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movaps %xmm0, %xmm1			; SSE2-NEXT: movaps %xmm0, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[1,1]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[1,1]
	; SSE2-NEXT: addss %xmm0, %xmm1			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v2f32_undef:			; SSE41-LABEL: test_v2f32_undef:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	Show All 35 Lines
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v4f32_undef:			; SSE41-LABEL: test_v4f32_undef:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movaps %xmm0, %xmm1			; SSE41-NEXT: movaps %xmm0, %xmm1
	; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE41-NEXT: addps %xmm0, %xmm1			; SSE41-NEXT: addps %xmm0, %xmm1
	; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: addss %xmm0, %xmm1			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-SLOW-LABEL: test_v4f32_undef:			; AVX1-SLOW-LABEL: test_v4f32_undef:
	; AVX1-SLOW: # %bb.0:			; AVX1-SLOW: # %bb.0:
	; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	; AVX1-SLOW-NEXT: vaddps %xmm1, %xmm0, %xmm0			; AVX1-SLOW-NEXT: vaddps %xmm1, %xmm0, %xmm0
	; AVX1-SLOW-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]			; AVX1-SLOW-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
	; AVX1-SLOW-NEXT: vaddss %xmm1, %xmm0, %xmm0			; AVX1-SLOW-NEXT: vaddss %xmm1, %xmm0, %xmm0
	Show All 38 Lines
	;			;
	; SSE41-LABEL: test_v8f32_undef:			; SSE41-LABEL: test_v8f32_undef:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: addps %xmm1, %xmm0			; SSE41-NEXT: addps %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm0, %xmm1			; SSE41-NEXT: movaps %xmm0, %xmm1
	; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE41-NEXT: addps %xmm0, %xmm1			; SSE41-NEXT: addps %xmm0, %xmm1
	; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: addss %xmm0, %xmm1			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-SLOW-LABEL: test_v8f32_undef:			; AVX1-SLOW-LABEL: test_v8f32_undef:
	; AVX1-SLOW: # %bb.0:			; AVX1-SLOW: # %bb.0:
	; AVX1-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-SLOW-NEXT: vaddps %xmm1, %xmm0, %xmm0			; AVX1-SLOW-NEXT: vaddps %xmm1, %xmm0, %xmm0
	; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	; AVX1-SLOW-NEXT: vaddps %xmm1, %xmm0, %xmm0			; AVX1-SLOW-NEXT: vaddps %xmm1, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 54 Lines • ▼ Show 20 Lines
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: addps %xmm3, %xmm1			; SSE41-NEXT: addps %xmm3, %xmm1
	; SSE41-NEXT: addps %xmm2, %xmm0			; SSE41-NEXT: addps %xmm2, %xmm0
	; SSE41-NEXT: addps %xmm1, %xmm0			; SSE41-NEXT: addps %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm0, %xmm1			; SSE41-NEXT: movaps %xmm0, %xmm1
	; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE41-NEXT: addps %xmm0, %xmm1			; SSE41-NEXT: addps %xmm0, %xmm1
	; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: addss %xmm0, %xmm1			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-SLOW-LABEL: test_v16f32_undef:			; AVX1-SLOW-LABEL: test_v16f32_undef:
	; AVX1-SLOW: # %bb.0:			; AVX1-SLOW: # %bb.0:
	; AVX1-SLOW-NEXT: vaddps %ymm1, %ymm0, %ymm0			; AVX1-SLOW-NEXT: vaddps %ymm1, %ymm0, %ymm0
	; AVX1-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-SLOW-NEXT: vaddps %xmm1, %xmm0, %xmm0			; AVX1-SLOW-NEXT: vaddps %xmm1, %xmm0, %xmm0
	; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	▲ Show 20 Lines • Show All 270 Lines • ▼ Show 20 Lines
	; vXf64 (zero)			; vXf64 (zero)
	;			;

	define double @test_v2f64_zero(<2 x double> %a0) {			define double @test_v2f64_zero(<2 x double> %a0) {
	; SSE-LABEL: test_v2f64_zero:			; SSE-LABEL: test_v2f64_zero:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movapd %xmm0, %xmm1			; SSE-NEXT: movapd %xmm0, %xmm1
	; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE-NEXT: addsd %xmm0, %xmm1			; SSE-NEXT: addsd %xmm1, %xmm0
	; SSE-NEXT: movapd %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-SLOW-LABEL: test_v2f64_zero:			; AVX1-SLOW-LABEL: test_v2f64_zero:
	; AVX1-SLOW: # %bb.0:			; AVX1-SLOW: # %bb.0:
	; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	; AVX1-SLOW-NEXT: vaddsd %xmm1, %xmm0, %xmm0			; AVX1-SLOW-NEXT: vaddsd %xmm1, %xmm0, %xmm0
	; AVX1-SLOW-NEXT: retq			; AVX1-SLOW-NEXT: retq
	;			;
	Show All 18 Lines
	}			}

	define double @test_v4f64_zero(<4 x double> %a0) {			define double @test_v4f64_zero(<4 x double> %a0) {
	; SSE-LABEL: test_v4f64_zero:			; SSE-LABEL: test_v4f64_zero:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: addpd %xmm1, %xmm0			; SSE-NEXT: addpd %xmm1, %xmm0
	; SSE-NEXT: movapd %xmm0, %xmm1			; SSE-NEXT: movapd %xmm0, %xmm1
	; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE-NEXT: addsd %xmm0, %xmm1			; SSE-NEXT: addsd %xmm1, %xmm0
	; SSE-NEXT: movapd %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-SLOW-LABEL: test_v4f64_zero:			; AVX1-SLOW-LABEL: test_v4f64_zero:
	; AVX1-SLOW: # %bb.0:			; AVX1-SLOW: # %bb.0:
	; AVX1-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-SLOW-NEXT: vaddpd %xmm1, %xmm0, %xmm0			; AVX1-SLOW-NEXT: vaddpd %xmm1, %xmm0, %xmm0
	; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	; AVX1-SLOW-NEXT: vaddsd %xmm1, %xmm0, %xmm0			; AVX1-SLOW-NEXT: vaddsd %xmm1, %xmm0, %xmm0
	Show All 32 Lines
	define double @test_v8f64_zero(<8 x double> %a0) {			define double @test_v8f64_zero(<8 x double> %a0) {
	; SSE-LABEL: test_v8f64_zero:			; SSE-LABEL: test_v8f64_zero:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: addpd %xmm3, %xmm1			; SSE-NEXT: addpd %xmm3, %xmm1
	; SSE-NEXT: addpd %xmm2, %xmm0			; SSE-NEXT: addpd %xmm2, %xmm0
	; SSE-NEXT: addpd %xmm1, %xmm0			; SSE-NEXT: addpd %xmm1, %xmm0
	; SSE-NEXT: movapd %xmm0, %xmm1			; SSE-NEXT: movapd %xmm0, %xmm1
	; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE-NEXT: addsd %xmm0, %xmm1			; SSE-NEXT: addsd %xmm1, %xmm0
	; SSE-NEXT: movapd %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-SLOW-LABEL: test_v8f64_zero:			; AVX1-SLOW-LABEL: test_v8f64_zero:
	; AVX1-SLOW: # %bb.0:			; AVX1-SLOW: # %bb.0:
	; AVX1-SLOW-NEXT: vaddpd %ymm1, %ymm0, %ymm0			; AVX1-SLOW-NEXT: vaddpd %ymm1, %ymm0, %ymm0
	; AVX1-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-SLOW-NEXT: vaddpd %xmm1, %xmm0, %xmm0			; AVX1-SLOW-NEXT: vaddpd %xmm1, %xmm0, %xmm0
	; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	▲ Show 20 Lines • Show All 103 Lines • ▼ Show 20 Lines
	; vXf64 (undef)			; vXf64 (undef)
	;			;

	define double @test_v2f64_undef(<2 x double> %a0) {			define double @test_v2f64_undef(<2 x double> %a0) {
	; SSE-LABEL: test_v2f64_undef:			; SSE-LABEL: test_v2f64_undef:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movapd %xmm0, %xmm1			; SSE-NEXT: movapd %xmm0, %xmm1
	; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE-NEXT: addsd %xmm0, %xmm1			; SSE-NEXT: addsd %xmm1, %xmm0
	; SSE-NEXT: movapd %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-SLOW-LABEL: test_v2f64_undef:			; AVX1-SLOW-LABEL: test_v2f64_undef:
	; AVX1-SLOW: # %bb.0:			; AVX1-SLOW: # %bb.0:
	; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	; AVX1-SLOW-NEXT: vaddsd %xmm1, %xmm0, %xmm0			; AVX1-SLOW-NEXT: vaddsd %xmm1, %xmm0, %xmm0
	; AVX1-SLOW-NEXT: retq			; AVX1-SLOW-NEXT: retq
	;			;
	Show All 18 Lines
	}			}

	define double @test_v4f64_undef(<4 x double> %a0) {			define double @test_v4f64_undef(<4 x double> %a0) {
	; SSE-LABEL: test_v4f64_undef:			; SSE-LABEL: test_v4f64_undef:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: addpd %xmm1, %xmm0			; SSE-NEXT: addpd %xmm1, %xmm0
	; SSE-NEXT: movapd %xmm0, %xmm1			; SSE-NEXT: movapd %xmm0, %xmm1
	; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE-NEXT: addsd %xmm0, %xmm1			; SSE-NEXT: addsd %xmm1, %xmm0
	; SSE-NEXT: movapd %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-SLOW-LABEL: test_v4f64_undef:			; AVX1-SLOW-LABEL: test_v4f64_undef:
	; AVX1-SLOW: # %bb.0:			; AVX1-SLOW: # %bb.0:
	; AVX1-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-SLOW-NEXT: vaddpd %xmm1, %xmm0, %xmm0			; AVX1-SLOW-NEXT: vaddpd %xmm1, %xmm0, %xmm0
	; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	; AVX1-SLOW-NEXT: vaddsd %xmm1, %xmm0, %xmm0			; AVX1-SLOW-NEXT: vaddsd %xmm1, %xmm0, %xmm0
	Show All 32 Lines
	define double @test_v8f64_undef(<8 x double> %a0) {			define double @test_v8f64_undef(<8 x double> %a0) {
	; SSE-LABEL: test_v8f64_undef:			; SSE-LABEL: test_v8f64_undef:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: addpd %xmm3, %xmm1			; SSE-NEXT: addpd %xmm3, %xmm1
	; SSE-NEXT: addpd %xmm2, %xmm0			; SSE-NEXT: addpd %xmm2, %xmm0
	; SSE-NEXT: addpd %xmm1, %xmm0			; SSE-NEXT: addpd %xmm1, %xmm0
	; SSE-NEXT: movapd %xmm0, %xmm1			; SSE-NEXT: movapd %xmm0, %xmm1
	; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE-NEXT: addsd %xmm0, %xmm1			; SSE-NEXT: addsd %xmm1, %xmm0
	; SSE-NEXT: movapd %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-SLOW-LABEL: test_v8f64_undef:			; AVX1-SLOW-LABEL: test_v8f64_undef:
	; AVX1-SLOW: # %bb.0:			; AVX1-SLOW: # %bb.0:
	; AVX1-SLOW-NEXT: vaddpd %ymm1, %ymm0, %ymm0			; AVX1-SLOW-NEXT: vaddpd %ymm1, %ymm0, %ymm0
	; AVX1-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-SLOW-NEXT: vaddpd %xmm1, %xmm0, %xmm0			; AVX1-SLOW-NEXT: vaddpd %xmm1, %xmm0, %xmm0
	; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	▲ Show 20 Lines • Show All 111 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-reduce-fadd.ll

Show First 20 Lines • Show All 334 Lines • ▼ Show 20 Lines
; vXf32 (zero)		; vXf32 (zero)
;		;

define float @test_v2f32_zero(<2 x float> %a0) {		define float @test_v2f32_zero(<2 x float> %a0) {
; SSE2-LABEL: test_v2f32_zero:		; SSE2-LABEL: test_v2f32_zero:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[1,1]		; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[1,1]
; SSE2-NEXT: addss %xmm0, %xmm1		; SSE2-NEXT: addss %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v2f32_zero:		; SSE41-LABEL: test_v2f32_zero:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]		; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
; SSE41-NEXT: addss %xmm1, %xmm0		; SSE41-NEXT: addss %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
▲ Show 20 Lines • Show All 988 Lines • ▼ Show 20 Lines
; vXf64 (zero)		; vXf64 (zero)
;		;

define double @test_v2f64_zero(<2 x double> %a0) {		define double @test_v2f64_zero(<2 x double> %a0) {
; SSE-LABEL: test_v2f64_zero:		; SSE-LABEL: test_v2f64_zero:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movapd %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: addsd %xmm0, %xmm1		; SSE-NEXT: addsd %xmm1, %xmm0
; SSE-NEXT: movapd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-SLOW-LABEL: test_v2f64_zero:		; AVX1-SLOW-LABEL: test_v2f64_zero:
; AVX1-SLOW: # %bb.0:		; AVX1-SLOW: # %bb.0:
; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
; AVX1-SLOW-NEXT: vaddsd %xmm1, %xmm0, %xmm0		; AVX1-SLOW-NEXT: vaddsd %xmm1, %xmm0, %xmm0
; AVX1-SLOW-NEXT: retq		; AVX1-SLOW-NEXT: retq
;		;
Show All 17 Lines	; AVX512-NEXT: retq
ret double %1		ret double %1
}		}

define double @test_v4f64_zero(<4 x double> %a0) {		define double @test_v4f64_zero(<4 x double> %a0) {
; SSE-LABEL: test_v4f64_zero:		; SSE-LABEL: test_v4f64_zero:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movapd %xmm0, %xmm2		; SSE-NEXT: movapd %xmm0, %xmm2
; SSE-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm0[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm0[1]
; SSE-NEXT: addsd %xmm0, %xmm2		; SSE-NEXT: addsd %xmm2, %xmm0
; SSE-NEXT: addsd %xmm1, %xmm2		; SSE-NEXT: addsd %xmm1, %xmm0
; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1,1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1,1]
; SSE-NEXT: addsd %xmm1, %xmm2		; SSE-NEXT: addsd %xmm1, %xmm0
; SSE-NEXT: movapd %xmm2, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-SLOW-LABEL: test_v4f64_zero:		; AVX1-SLOW-LABEL: test_v4f64_zero:
; AVX1-SLOW: # %bb.0:		; AVX1-SLOW: # %bb.0:
; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
; AVX1-SLOW-NEXT: vaddsd %xmm1, %xmm0, %xmm1		; AVX1-SLOW-NEXT: vaddsd %xmm1, %xmm0, %xmm1
; AVX1-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm0		; AVX1-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm0
; AVX1-SLOW-NEXT: vaddsd %xmm0, %xmm1, %xmm1		; AVX1-SLOW-NEXT: vaddsd %xmm0, %xmm1, %xmm1
Show All 37 Lines	; AVX512-NEXT: retq
ret double %1		ret double %1
}		}

define double @test_v8f64_zero(<8 x double> %a0) {		define double @test_v8f64_zero(<8 x double> %a0) {
; SSE-LABEL: test_v8f64_zero:		; SSE-LABEL: test_v8f64_zero:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movapd %xmm0, %xmm4		; SSE-NEXT: movapd %xmm0, %xmm4
; SSE-NEXT: unpckhpd {{.*#+}} xmm4 = xmm4[1],xmm0[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm4 = xmm4[1],xmm0[1]
; SSE-NEXT: addsd %xmm0, %xmm4		; SSE-NEXT: addsd %xmm4, %xmm0
; SSE-NEXT: addsd %xmm1, %xmm4		; SSE-NEXT: addsd %xmm1, %xmm0
; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1,1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1,1]
; SSE-NEXT: addsd %xmm1, %xmm4		; SSE-NEXT: addsd %xmm1, %xmm0
; SSE-NEXT: addsd %xmm2, %xmm4		; SSE-NEXT: addsd %xmm2, %xmm0
; SSE-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1,1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1,1]
; SSE-NEXT: addsd %xmm2, %xmm4		; SSE-NEXT: addsd %xmm2, %xmm0
; SSE-NEXT: addsd %xmm3, %xmm4		; SSE-NEXT: addsd %xmm3, %xmm0
; SSE-NEXT: unpckhpd {{.*#+}} xmm3 = xmm3[1,1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm3 = xmm3[1,1]
; SSE-NEXT: addsd %xmm3, %xmm4		; SSE-NEXT: addsd %xmm3, %xmm0
; SSE-NEXT: movapd %xmm4, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-SLOW-LABEL: test_v8f64_zero:		; AVX1-SLOW-LABEL: test_v8f64_zero:
; AVX1-SLOW: # %bb.0:		; AVX1-SLOW: # %bb.0:
; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm2 = xmm0[1,0]		; AVX1-SLOW-NEXT: vpermilpd {{.*#+}} xmm2 = xmm0[1,0]
; AVX1-SLOW-NEXT: vaddsd %xmm2, %xmm0, %xmm2		; AVX1-SLOW-NEXT: vaddsd %xmm2, %xmm0, %xmm2
; AVX1-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm0		; AVX1-SLOW-NEXT: vextractf128 $1, %ymm0, %xmm0
; AVX1-SLOW-NEXT: vaddsd %xmm0, %xmm2, %xmm2		; AVX1-SLOW-NEXT: vaddsd %xmm0, %xmm2, %xmm2
▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines	; AVX512-NEXT: retq
%1 = call double @llvm.vector.reduce.fadd.f64.v8f64(double -0.0, <8 x double> %a0)		%1 = call double @llvm.vector.reduce.fadd.f64.v8f64(double -0.0, <8 x double> %a0)
ret double %1		ret double %1
}		}

define double @test_v16f64_zero(<16 x double> %a0) {		define double @test_v16f64_zero(<16 x double> %a0) {
; SSE-LABEL: test_v16f64_zero:		; SSE-LABEL: test_v16f64_zero:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movapd %xmm0, %xmm8		; SSE-NEXT: movapd %xmm0, %xmm8
; SSE-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1,1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm8 = xmm8[1],xmm0[1]
; SSE-NEXT: addsd %xmm8, %xmm0		; SSE-NEXT: addsd %xmm8, %xmm0
; SSE-NEXT: addsd %xmm1, %xmm0		; SSE-NEXT: addsd %xmm1, %xmm0
; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1,1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1,1]
; SSE-NEXT: addsd %xmm1, %xmm0		; SSE-NEXT: addsd %xmm1, %xmm0
; SSE-NEXT: addsd %xmm2, %xmm0		; SSE-NEXT: addsd %xmm2, %xmm0
; SSE-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1,1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1,1]
; SSE-NEXT: addsd %xmm2, %xmm0		; SSE-NEXT: addsd %xmm2, %xmm0
; SSE-NEXT: addsd %xmm3, %xmm0		; SSE-NEXT: addsd %xmm3, %xmm0
▲ Show 20 Lines • Show All 371 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-reduce-fmax.ll

	Show First 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call float @llvm.vector.reduce.fmax.v2f32(<2 x float> %a0)			%1 = call float @llvm.vector.reduce.fmax.v2f32(<2 x float> %a0)
	ret float %1			ret float %1
	}			}

	define float @test_v3f32(<3 x float> %a0) {			define float @test_v3f32(<3 x float> %a0) {
	; SSE2-LABEL: test_v3f32:			; SSE2-LABEL: test_v3f32:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movaps %xmm0, %xmm2
	; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1],xmm0[1,1]
	; SSE2-NEXT: movaps %xmm0, %xmm1			; SSE2-NEXT: movaps %xmm0, %xmm1
	; SSE2-NEXT: cmpunordss %xmm0, %xmm1			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[1,1]
	; SSE2-NEXT: movaps %xmm1, %xmm3
	; SSE2-NEXT: andps %xmm2, %xmm3
	; SSE2-NEXT: maxss %xmm0, %xmm2
	; SSE2-NEXT: andnps %xmm2, %xmm1
	; SSE2-NEXT: orps %xmm3, %xmm1
	; SSE2-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]
	; SSE2-NEXT: movaps %xmm0, %xmm2			; SSE2-NEXT: movaps %xmm0, %xmm2
	; SSE2-NEXT: maxss %xmm1, %xmm2			; SSE2-NEXT: cmpunordss %xmm0, %xmm2
	; SSE2-NEXT: cmpunordss %xmm1, %xmm1			; SSE2-NEXT: movaps %xmm2, %xmm3
	; SSE2-NEXT: movaps %xmm1, %xmm3			; SSE2-NEXT: andps %xmm1, %xmm3
	; SSE2-NEXT: andnps %xmm2, %xmm3			; SSE2-NEXT: maxss %xmm0, %xmm1
	; SSE2-NEXT: andps %xmm0, %xmm1			; SSE2-NEXT: andnps %xmm1, %xmm2
	; SSE2-NEXT: orps %xmm3, %xmm1			; SSE2-NEXT: orps %xmm3, %xmm2
	; SSE2-NEXT: movaps %xmm1, %xmm0			; SSE2-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]
				; SSE2-NEXT: movaps %xmm0, %xmm1
				; SSE2-NEXT: maxss %xmm2, %xmm1
				; SSE2-NEXT: cmpunordss %xmm2, %xmm2
				; SSE2-NEXT: andps %xmm2, %xmm0
				; SSE2-NEXT: andnps %xmm1, %xmm2
				; SSE2-NEXT: orps %xmm2, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v3f32:			; SSE41-LABEL: test_v3f32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movshdup {{.*#+}} xmm2 = xmm0[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
	; SSE41-NEXT: movaps %xmm0, %xmm1
	; SSE41-NEXT: cmpunordss %xmm0, %xmm1
	; SSE41-NEXT: movaps %xmm1, %xmm3
	; SSE41-NEXT: andps %xmm2, %xmm3
	; SSE41-NEXT: maxss %xmm0, %xmm2
	; SSE41-NEXT: andnps %xmm2, %xmm1
	; SSE41-NEXT: orps %xmm3, %xmm1
	; SSE41-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]
	; SSE41-NEXT: movaps %xmm0, %xmm2			; SSE41-NEXT: movaps %xmm0, %xmm2
	; SSE41-NEXT: maxss %xmm1, %xmm2			; SSE41-NEXT: cmpunordss %xmm0, %xmm2
	; SSE41-NEXT: cmpunordss %xmm1, %xmm1			; SSE41-NEXT: movaps %xmm2, %xmm3
	; SSE41-NEXT: movaps %xmm1, %xmm3			; SSE41-NEXT: andps %xmm1, %xmm3
	; SSE41-NEXT: andnps %xmm2, %xmm3			; SSE41-NEXT: maxss %xmm0, %xmm1
	; SSE41-NEXT: andps %xmm0, %xmm1			; SSE41-NEXT: andnps %xmm1, %xmm2
	; SSE41-NEXT: orps %xmm3, %xmm1			; SSE41-NEXT: orps %xmm3, %xmm2
	; SSE41-NEXT: movaps %xmm1, %xmm0			; SSE41-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]
				; SSE41-NEXT: movaps %xmm0, %xmm1
				; SSE41-NEXT: maxss %xmm2, %xmm1
				; SSE41-NEXT: cmpunordss %xmm2, %xmm2
				; SSE41-NEXT: andps %xmm2, %xmm0
				; SSE41-NEXT: andnps %xmm1, %xmm2
				; SSE41-NEXT: orps %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v3f32:			; AVX-LABEL: test_v3f32:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]			; AVX-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
	; AVX-NEXT: vmaxss %xmm0, %xmm1, %xmm2			; AVX-NEXT: vmaxss %xmm0, %xmm1, %xmm2
	; AVX-NEXT: vcmpunordss %xmm0, %xmm0, %xmm3			; AVX-NEXT: vcmpunordss %xmm0, %xmm0, %xmm3
	; AVX-NEXT: vblendvps %xmm3, %xmm1, %xmm2, %xmm1			; AVX-NEXT: vblendvps %xmm3, %xmm1, %xmm2, %xmm1
	▲ Show 20 Lines • Show All 990 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-reduce-fmul-fast.ll

	Show First 20 Lines • Show All 198 Lines • ▼ Show 20 Lines
	; vXf32 (one)			; vXf32 (one)
	;			;

	define float @test_v2f32_zero(<2 x float> %a0) {			define float @test_v2f32_zero(<2 x float> %a0) {
	; SSE2-LABEL: test_v2f32_zero:			; SSE2-LABEL: test_v2f32_zero:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movaps %xmm0, %xmm1			; SSE2-NEXT: movaps %xmm0, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[1,1]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[1,1]
	; SSE2-NEXT: mulss %xmm0, %xmm1			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v2f32_zero:			; SSE41-LABEL: test_v2f32_zero:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	Show All 24 Lines
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v4f32_zero:			; SSE41-LABEL: test_v4f32_zero:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movaps %xmm0, %xmm1			; SSE41-NEXT: movaps %xmm0, %xmm1
	; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE41-NEXT: mulps %xmm0, %xmm1			; SSE41-NEXT: mulps %xmm0, %xmm1
	; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: mulss %xmm0, %xmm1			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v4f32_zero:			; AVX-LABEL: test_v4f32_zero:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	; AVX-NEXT: vmulps %xmm1, %xmm0, %xmm0			; AVX-NEXT: vmulps %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]			; AVX-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
	; AVX-NEXT: vmulss %xmm1, %xmm0, %xmm0			; AVX-NEXT: vmulss %xmm1, %xmm0, %xmm0
	Show All 24 Lines
	;			;
	; SSE41-LABEL: test_v8f32_zero:			; SSE41-LABEL: test_v8f32_zero:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: mulps %xmm1, %xmm0			; SSE41-NEXT: mulps %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm0, %xmm1			; SSE41-NEXT: movaps %xmm0, %xmm1
	; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE41-NEXT: mulps %xmm0, %xmm1			; SSE41-NEXT: mulps %xmm0, %xmm1
	; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: mulss %xmm0, %xmm1			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v8f32_zero:			; AVX-LABEL: test_v8f32_zero:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX-NEXT: vmulps %xmm1, %xmm0, %xmm0			; AVX-NEXT: vmulps %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	; AVX-NEXT: vmulps %xmm1, %xmm0, %xmm0			; AVX-NEXT: vmulps %xmm1, %xmm0, %xmm0
	Show All 34 Lines
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: mulps %xmm3, %xmm1			; SSE41-NEXT: mulps %xmm3, %xmm1
	; SSE41-NEXT: mulps %xmm2, %xmm0			; SSE41-NEXT: mulps %xmm2, %xmm0
	; SSE41-NEXT: mulps %xmm1, %xmm0			; SSE41-NEXT: mulps %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm0, %xmm1			; SSE41-NEXT: movaps %xmm0, %xmm1
	; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE41-NEXT: mulps %xmm0, %xmm1			; SSE41-NEXT: mulps %xmm0, %xmm1
	; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: mulss %xmm0, %xmm1			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v16f32_zero:			; AVX-LABEL: test_v16f32_zero:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmulps %ymm1, %ymm0, %ymm0			; AVX-NEXT: vmulps %ymm1, %ymm0, %ymm0
	; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX-NEXT: vmulps %xmm1, %xmm0, %xmm0			; AVX-NEXT: vmulps %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	Show All 23 Lines
	; vXf32 (undef)			; vXf32 (undef)
	;			;

	define float @test_v2f32_undef(<2 x float> %a0) {			define float @test_v2f32_undef(<2 x float> %a0) {
	; SSE2-LABEL: test_v2f32_undef:			; SSE2-LABEL: test_v2f32_undef:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movaps %xmm0, %xmm1			; SSE2-NEXT: movaps %xmm0, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[1,1]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[1,1]
	; SSE2-NEXT: mulss %xmm0, %xmm1			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v2f32_undef:			; SSE41-LABEL: test_v2f32_undef:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	Show All 24 Lines
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v4f32_undef:			; SSE41-LABEL: test_v4f32_undef:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movaps %xmm0, %xmm1			; SSE41-NEXT: movaps %xmm0, %xmm1
	; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE41-NEXT: mulps %xmm0, %xmm1			; SSE41-NEXT: mulps %xmm0, %xmm1
	; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: mulss %xmm0, %xmm1			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v4f32_undef:			; AVX-LABEL: test_v4f32_undef:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	; AVX-NEXT: vmulps %xmm1, %xmm0, %xmm0			; AVX-NEXT: vmulps %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]			; AVX-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
	; AVX-NEXT: vmulss %xmm1, %xmm0, %xmm0			; AVX-NEXT: vmulss %xmm1, %xmm0, %xmm0
	Show All 24 Lines
	;			;
	; SSE41-LABEL: test_v8f32_undef:			; SSE41-LABEL: test_v8f32_undef:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: mulps %xmm1, %xmm0			; SSE41-NEXT: mulps %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm0, %xmm1			; SSE41-NEXT: movaps %xmm0, %xmm1
	; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE41-NEXT: mulps %xmm0, %xmm1			; SSE41-NEXT: mulps %xmm0, %xmm1
	; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: mulss %xmm0, %xmm1			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v8f32_undef:			; AVX-LABEL: test_v8f32_undef:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX-NEXT: vmulps %xmm1, %xmm0, %xmm0			; AVX-NEXT: vmulps %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	; AVX-NEXT: vmulps %xmm1, %xmm0, %xmm0			; AVX-NEXT: vmulps %xmm1, %xmm0, %xmm0
	Show All 34 Lines
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: mulps %xmm3, %xmm1			; SSE41-NEXT: mulps %xmm3, %xmm1
	; SSE41-NEXT: mulps %xmm2, %xmm0			; SSE41-NEXT: mulps %xmm2, %xmm0
	; SSE41-NEXT: mulps %xmm1, %xmm0			; SSE41-NEXT: mulps %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm0, %xmm1			; SSE41-NEXT: movaps %xmm0, %xmm1
	; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE41-NEXT: mulps %xmm0, %xmm1			; SSE41-NEXT: mulps %xmm0, %xmm1
	; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
	; SSE41-NEXT: mulss %xmm0, %xmm1			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v16f32_undef:			; AVX-LABEL: test_v16f32_undef:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmulps %ymm1, %ymm0, %ymm0			; AVX-NEXT: vmulps %ymm1, %ymm0, %ymm0
	; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX-NEXT: vmulps %xmm1, %xmm0, %xmm0			; AVX-NEXT: vmulps %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	▲ Show 20 Lines • Show All 169 Lines • ▼ Show 20 Lines
	; vXf64 (one)			; vXf64 (one)
	;			;

	define double @test_v2f64_zero(<2 x double> %a0) {			define double @test_v2f64_zero(<2 x double> %a0) {
	; SSE-LABEL: test_v2f64_zero:			; SSE-LABEL: test_v2f64_zero:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movapd %xmm0, %xmm1			; SSE-NEXT: movapd %xmm0, %xmm1
	; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE-NEXT: mulsd %xmm0, %xmm1			; SSE-NEXT: mulsd %xmm1, %xmm0
	; SSE-NEXT: movapd %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v2f64_zero:			; AVX-LABEL: test_v2f64_zero:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	; AVX-NEXT: vmulsd %xmm1, %xmm0, %xmm0			; AVX-NEXT: vmulsd %xmm1, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; AVX512-LABEL: test_v2f64_zero:			; AVX512-LABEL: test_v2f64_zero:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX512-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	; AVX512-NEXT: vmulsd %xmm1, %xmm0, %xmm0			; AVX512-NEXT: vmulsd %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call fast double @llvm.vector.reduce.fmul.f64.v2f64(double 1.0, <2 x double> %a0)			%1 = call fast double @llvm.vector.reduce.fmul.f64.v2f64(double 1.0, <2 x double> %a0)
	ret double %1			ret double %1
	}			}

	define double @test_v4f64_zero(<4 x double> %a0) {			define double @test_v4f64_zero(<4 x double> %a0) {
	; SSE-LABEL: test_v4f64_zero:			; SSE-LABEL: test_v4f64_zero:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: mulpd %xmm1, %xmm0			; SSE-NEXT: mulpd %xmm1, %xmm0
	; SSE-NEXT: movapd %xmm0, %xmm1			; SSE-NEXT: movapd %xmm0, %xmm1
	; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE-NEXT: mulsd %xmm0, %xmm1			; SSE-NEXT: mulsd %xmm1, %xmm0
	; SSE-NEXT: movapd %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v4f64_zero:			; AVX-LABEL: test_v4f64_zero:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX-NEXT: vmulpd %xmm1, %xmm0, %xmm0			; AVX-NEXT: vmulpd %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	; AVX-NEXT: vmulsd %xmm1, %xmm0, %xmm0			; AVX-NEXT: vmulsd %xmm1, %xmm0, %xmm0
	Show All 15 Lines
	define double @test_v8f64_zero(<8 x double> %a0) {			define double @test_v8f64_zero(<8 x double> %a0) {
	; SSE-LABEL: test_v8f64_zero:			; SSE-LABEL: test_v8f64_zero:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: mulpd %xmm3, %xmm1			; SSE-NEXT: mulpd %xmm3, %xmm1
	; SSE-NEXT: mulpd %xmm2, %xmm0			; SSE-NEXT: mulpd %xmm2, %xmm0
	; SSE-NEXT: mulpd %xmm1, %xmm0			; SSE-NEXT: mulpd %xmm1, %xmm0
	; SSE-NEXT: movapd %xmm0, %xmm1			; SSE-NEXT: movapd %xmm0, %xmm1
	; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE-NEXT: mulsd %xmm0, %xmm1			; SSE-NEXT: mulsd %xmm1, %xmm0
	; SSE-NEXT: movapd %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v8f64_zero:			; AVX-LABEL: test_v8f64_zero:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmulpd %ymm1, %ymm0, %ymm0			; AVX-NEXT: vmulpd %ymm1, %ymm0, %ymm0
	; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX-NEXT: vmulpd %xmm1, %xmm0, %xmm0			; AVX-NEXT: vmulpd %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; vXf64 (undef)			; vXf64 (undef)
	;			;

	define double @test_v2f64_undef(<2 x double> %a0) {			define double @test_v2f64_undef(<2 x double> %a0) {
	; SSE-LABEL: test_v2f64_undef:			; SSE-LABEL: test_v2f64_undef:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movapd %xmm0, %xmm1			; SSE-NEXT: movapd %xmm0, %xmm1
	; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE-NEXT: mulsd %xmm0, %xmm1			; SSE-NEXT: mulsd %xmm1, %xmm0
	; SSE-NEXT: movapd %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v2f64_undef:			; AVX-LABEL: test_v2f64_undef:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	; AVX-NEXT: vmulsd %xmm1, %xmm0, %xmm0			; AVX-NEXT: vmulsd %xmm1, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; AVX512-LABEL: test_v2f64_undef:			; AVX512-LABEL: test_v2f64_undef:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX512-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	; AVX512-NEXT: vmulsd %xmm1, %xmm0, %xmm0			; AVX512-NEXT: vmulsd %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call fast double @llvm.vector.reduce.fmul.f64.v2f64(double 1.0, <2 x double> %a0)			%1 = call fast double @llvm.vector.reduce.fmul.f64.v2f64(double 1.0, <2 x double> %a0)
	ret double %1			ret double %1
	}			}

	define double @test_v4f64_undef(<4 x double> %a0) {			define double @test_v4f64_undef(<4 x double> %a0) {
	; SSE-LABEL: test_v4f64_undef:			; SSE-LABEL: test_v4f64_undef:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: mulpd %xmm1, %xmm0			; SSE-NEXT: mulpd %xmm1, %xmm0
	; SSE-NEXT: movapd %xmm0, %xmm1			; SSE-NEXT: movapd %xmm0, %xmm1
	; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE-NEXT: mulsd %xmm0, %xmm1			; SSE-NEXT: mulsd %xmm1, %xmm0
	; SSE-NEXT: movapd %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v4f64_undef:			; AVX-LABEL: test_v4f64_undef:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX-NEXT: vmulpd %xmm1, %xmm0, %xmm0			; AVX-NEXT: vmulpd %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	; AVX-NEXT: vmulsd %xmm1, %xmm0, %xmm0			; AVX-NEXT: vmulsd %xmm1, %xmm0, %xmm0
	Show All 15 Lines
	define double @test_v8f64_undef(<8 x double> %a0) {			define double @test_v8f64_undef(<8 x double> %a0) {
	; SSE-LABEL: test_v8f64_undef:			; SSE-LABEL: test_v8f64_undef:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: mulpd %xmm3, %xmm1			; SSE-NEXT: mulpd %xmm3, %xmm1
	; SSE-NEXT: mulpd %xmm2, %xmm0			; SSE-NEXT: mulpd %xmm2, %xmm0
	; SSE-NEXT: mulpd %xmm1, %xmm0			; SSE-NEXT: mulpd %xmm1, %xmm0
	; SSE-NEXT: movapd %xmm0, %xmm1			; SSE-NEXT: movapd %xmm0, %xmm1
	; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE-NEXT: mulsd %xmm0, %xmm1			; SSE-NEXT: mulsd %xmm1, %xmm0
	; SSE-NEXT: movapd %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v8f64_undef:			; AVX-LABEL: test_v8f64_undef:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmulpd %ymm1, %ymm0, %ymm0			; AVX-NEXT: vmulpd %ymm1, %ymm0, %ymm0
	; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX-NEXT: vmulpd %xmm1, %xmm0, %xmm0			; AVX-NEXT: vmulpd %xmm1, %xmm0, %xmm0
	; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	▲ Show 20 Lines • Show All 69 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-reduce-fmul.ll

Show First 20 Lines • Show All 333 Lines • ▼ Show 20 Lines
; vXf32 (one)		; vXf32 (one)
;		;

define float @test_v2f32_one(<2 x float> %a0) {		define float @test_v2f32_one(<2 x float> %a0) {
; SSE2-LABEL: test_v2f32_one:		; SSE2-LABEL: test_v2f32_one:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[1,1]		; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[1,1]
; SSE2-NEXT: mulss %xmm0, %xmm1		; SSE2-NEXT: mulss %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v2f32_one:		; SSE41-LABEL: test_v2f32_one:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]		; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
; SSE41-NEXT: mulss %xmm1, %xmm0		; SSE41-NEXT: mulss %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
▲ Show 20 Lines • Show All 854 Lines • ▼ Show 20 Lines
; vXf64 (one)		; vXf64 (one)
;		;

define double @test_v2f64_one(<2 x double> %a0) {		define double @test_v2f64_one(<2 x double> %a0) {
; SSE-LABEL: test_v2f64_one:		; SSE-LABEL: test_v2f64_one:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movapd %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: mulsd %xmm0, %xmm1		; SSE-NEXT: mulsd %xmm1, %xmm0
; SSE-NEXT: movapd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v2f64_one:		; AVX-LABEL: test_v2f64_one:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
; AVX-NEXT: vmulsd %xmm1, %xmm0, %xmm0		; AVX-NEXT: vmulsd %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
;		;
; AVX512-LABEL: test_v2f64_one:		; AVX512-LABEL: test_v2f64_one:
; AVX512: # %bb.0:		; AVX512: # %bb.0:
; AVX512-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX512-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
; AVX512-NEXT: vmulsd %xmm1, %xmm0, %xmm0		; AVX512-NEXT: vmulsd %xmm1, %xmm0, %xmm0
; AVX512-NEXT: retq		; AVX512-NEXT: retq
%1 = call double @llvm.vector.reduce.fmul.f64.v2f64(double 1.0, <2 x double> %a0)		%1 = call double @llvm.vector.reduce.fmul.f64.v2f64(double 1.0, <2 x double> %a0)
ret double %1		ret double %1
}		}

define double @test_v4f64_one(<4 x double> %a0) {		define double @test_v4f64_one(<4 x double> %a0) {
; SSE-LABEL: test_v4f64_one:		; SSE-LABEL: test_v4f64_one:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movapd %xmm0, %xmm2		; SSE-NEXT: movapd %xmm0, %xmm2
; SSE-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm0[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm0[1]
; SSE-NEXT: mulsd %xmm0, %xmm2		; SSE-NEXT: mulsd %xmm2, %xmm0
; SSE-NEXT: mulsd %xmm1, %xmm2		; SSE-NEXT: mulsd %xmm1, %xmm0
; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1,1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1,1]
; SSE-NEXT: mulsd %xmm1, %xmm2		; SSE-NEXT: mulsd %xmm1, %xmm0
; SSE-NEXT: movapd %xmm2, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v4f64_one:		; AVX-LABEL: test_v4f64_one:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
; AVX-NEXT: vmulsd %xmm1, %xmm0, %xmm1		; AVX-NEXT: vmulsd %xmm1, %xmm0, %xmm1
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm0		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm0
; AVX-NEXT: vmulsd %xmm0, %xmm1, %xmm1		; AVX-NEXT: vmulsd %xmm0, %xmm1, %xmm1
Show All 16 Lines	; AVX512-NEXT: retq
ret double %1		ret double %1
}		}

define double @test_v8f64_one(<8 x double> %a0) {		define double @test_v8f64_one(<8 x double> %a0) {
; SSE-LABEL: test_v8f64_one:		; SSE-LABEL: test_v8f64_one:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movapd %xmm0, %xmm4		; SSE-NEXT: movapd %xmm0, %xmm4
; SSE-NEXT: unpckhpd {{.*#+}} xmm4 = xmm4[1],xmm0[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm4 = xmm4[1],xmm0[1]
; SSE-NEXT: mulsd %xmm0, %xmm4		; SSE-NEXT: mulsd %xmm4, %xmm0
; SSE-NEXT: mulsd %xmm1, %xmm4		; SSE-NEXT: mulsd %xmm1, %xmm0
; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1,1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1,1]
; SSE-NEXT: mulsd %xmm1, %xmm4		; SSE-NEXT: mulsd %xmm1, %xmm0
; SSE-NEXT: mulsd %xmm2, %xmm4		; SSE-NEXT: mulsd %xmm2, %xmm0
; SSE-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1,1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1,1]
; SSE-NEXT: mulsd %xmm2, %xmm4		; SSE-NEXT: mulsd %xmm2, %xmm0
; SSE-NEXT: mulsd %xmm3, %xmm4		; SSE-NEXT: mulsd %xmm3, %xmm0
; SSE-NEXT: unpckhpd {{.*#+}} xmm3 = xmm3[1,1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm3 = xmm3[1,1]
; SSE-NEXT: mulsd %xmm3, %xmm4		; SSE-NEXT: mulsd %xmm3, %xmm0
; SSE-NEXT: movapd %xmm4, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v8f64_one:		; AVX-LABEL: test_v8f64_one:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpermilpd {{.*#+}} xmm2 = xmm0[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm2 = xmm0[1,0]
; AVX-NEXT: vmulsd %xmm2, %xmm0, %xmm2		; AVX-NEXT: vmulsd %xmm2, %xmm0, %xmm2
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm0		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm0
; AVX-NEXT: vmulsd %xmm0, %xmm2, %xmm2		; AVX-NEXT: vmulsd %xmm0, %xmm2, %xmm2
Show All 30 Lines	; AVX512-NEXT: retq
%1 = call double @llvm.vector.reduce.fmul.f64.v8f64(double 1.0, <8 x double> %a0)		%1 = call double @llvm.vector.reduce.fmul.f64.v8f64(double 1.0, <8 x double> %a0)
ret double %1		ret double %1
}		}

define double @test_v16f64_one(<16 x double> %a0) {		define double @test_v16f64_one(<16 x double> %a0) {
; SSE-LABEL: test_v16f64_one:		; SSE-LABEL: test_v16f64_one:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movapd %xmm0, %xmm8		; SSE-NEXT: movapd %xmm0, %xmm8
; SSE-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1,1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm8 = xmm8[1],xmm0[1]
; SSE-NEXT: mulsd %xmm8, %xmm0		; SSE-NEXT: mulsd %xmm8, %xmm0
; SSE-NEXT: mulsd %xmm1, %xmm0		; SSE-NEXT: mulsd %xmm1, %xmm0
; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1,1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1,1]
; SSE-NEXT: mulsd %xmm1, %xmm0		; SSE-NEXT: mulsd %xmm1, %xmm0
; SSE-NEXT: mulsd %xmm2, %xmm0		; SSE-NEXT: mulsd %xmm2, %xmm0
; SSE-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1,1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1,1]
; SSE-NEXT: mulsd %xmm2, %xmm0		; SSE-NEXT: mulsd %xmm2, %xmm0
; SSE-NEXT: mulsd %xmm3, %xmm0		; SSE-NEXT: mulsd %xmm3, %xmm0
▲ Show 20 Lines • Show All 308 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-reduce-smax.ll

	Show All 31 Lines
	; SSE2-NEXT: por %xmm0, %xmm3			; SSE2-NEXT: por %xmm0, %xmm3
	; SSE2-NEXT: movq %xmm3, %rax			; SSE2-NEXT: movq %xmm3, %rax
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v2i64:			; SSE41-LABEL: test_v2i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,2,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,2,3]
	; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: pxor %xmm3, %xmm4			; SSE41-NEXT: pxor %xmm0, %xmm3
	; SSE41-NEXT: pxor %xmm2, %xmm3			; SSE41-NEXT: pxor %xmm2, %xmm0
	; SSE41-NEXT: movdqa %xmm4, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm4
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[0,0,2,2]
	; SSE41-NEXT: pand %xmm3, %xmm0			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: test_v2i64:			; SSE42-LABEL: test_v2i64:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm0, %xmm1			; SSE42-NEXT: movdqa %xmm0, %xmm1
	; SSE42-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,2,3]			; SSE42-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,2,3]
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: por %xmm4, %xmm2			; SSE2-NEXT: por %xmm4, %xmm2
	; SSE2-NEXT: movq %xmm2, %rax			; SSE2-NEXT: movq %xmm2, %rax
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v4i64:			; SSE41-LABEL: test_v4i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm1, %xmm4			; SSE41-NEXT: movdqa %xmm1, %xmm0
				; SSE41-NEXT: pxor %xmm3, %xmm0
				; SSE41-NEXT: movdqa %xmm2, %xmm4
	; SSE41-NEXT: pxor %xmm3, %xmm4			; SSE41-NEXT: pxor %xmm3, %xmm4
	; SSE41-NEXT: movdqa %xmm0, %xmm5			; SSE41-NEXT: movdqa %xmm4, %xmm5
	; SSE41-NEXT: pxor %xmm3, %xmm5			; SSE41-NEXT: pcmpeqd %xmm0, %xmm5
	; SSE41-NEXT: movdqa %xmm5, %xmm0			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pcmpeqd %xmm4, %xmm0			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpgtd %xmm4, %xmm5			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm5[0,0,2,2]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[2,3,2,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[2,3,2,3]
	; SSE41-NEXT: movdqa %xmm1, %xmm4			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: pxor %xmm3, %xmm4			; SSE41-NEXT: pxor %xmm3, %xmm4
	; SSE41-NEXT: pxor %xmm2, %xmm3			; SSE41-NEXT: pxor %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm4, %xmm5			; SSE41-NEXT: movdqa %xmm4, %xmm5
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm5			; SSE41-NEXT: pcmpeqd %xmm3, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	▲ Show 20 Lines • Show All 130 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: por %xmm1, %xmm3			; SSE2-NEXT: por %xmm1, %xmm3
	; SSE2-NEXT: movq %xmm3, %rax			; SSE2-NEXT: movq %xmm3, %rax
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v8i64:			; SSE41-LABEL: test_v8i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648]
	; SSE41-NEXT: movdqa %xmm2, %xmm6			; SSE41-NEXT: movdqa %xmm2, %xmm0
				; SSE41-NEXT: pxor %xmm5, %xmm0
				; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm6			; SSE41-NEXT: pxor %xmm5, %xmm6
	; SSE41-NEXT: movdqa %xmm0, %xmm7			; SSE41-NEXT: movdqa %xmm6, %xmm7
	; SSE41-NEXT: pxor %xmm5, %xmm7			; SSE41-NEXT: pcmpeqd %xmm0, %xmm7
	; SSE41-NEXT: movdqa %xmm7, %xmm0			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pcmpeqd %xmm6, %xmm0			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpgtd %xmm6, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm7[0,0,2,2]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm1, %xmm4			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: pxor %xmm5, %xmm4			; SSE41-NEXT: pxor %xmm5, %xmm4
	; SSE41-NEXT: movdqa %xmm4, %xmm6			; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm6			; SSE41-NEXT: pcmpeqd %xmm0, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	▲ Show 20 Lines • Show All 251 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pxor %xmm9, %xmm1			; SSE41-NEXT: pxor %xmm9, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm10			; SSE41-NEXT: movdqa %xmm1, %xmm10
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm10			; SSE41-NEXT: pcmpeqd %xmm0, %xmm10
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[0,0,2,2]
	; SSE41-NEXT: pand %xmm10, %xmm0			; SSE41-NEXT: pand %xmm10, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7
	; SSE41-NEXT: movdqa %xmm4, %xmm1			; SSE41-NEXT: movdqa %xmm4, %xmm0
				; SSE41-NEXT: pxor %xmm9, %xmm0
				; SSE41-NEXT: movdqa %xmm8, %xmm1
	; SSE41-NEXT: pxor %xmm9, %xmm1			; SSE41-NEXT: pxor %xmm9, %xmm1
	; SSE41-NEXT: movdqa %xmm8, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: pxor %xmm9, %xmm3			; SSE41-NEXT: pcmpeqd %xmm0, %xmm3
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pcmpeqd %xmm1, %xmm0			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpgtd %xmm1, %xmm3			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm3[0,0,2,2]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: pand %xmm1, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm4
	; SSE41-NEXT: movdqa %xmm6, %xmm0			; SSE41-NEXT: movdqa %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm2, %xmm1			; SSE41-NEXT: movdqa %xmm2, %xmm1
	; SSE41-NEXT: pxor %xmm9, %xmm1			; SSE41-NEXT: pxor %xmm9, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm3			; SSE41-NEXT: pcmpeqd %xmm0, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	▲ Show 20 Lines • Show All 1,492 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-reduce-umax.ll

	Show All 31 Lines
	; SSE2-NEXT: por %xmm0, %xmm3			; SSE2-NEXT: por %xmm0, %xmm3
	; SSE2-NEXT: movq %xmm3, %rax			; SSE2-NEXT: movq %xmm3, %rax
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v2i64:			; SSE41-LABEL: test_v2i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm1			; SSE41-NEXT: movdqa %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,2,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,2,3]
	; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: pxor %xmm3, %xmm4			; SSE41-NEXT: pxor %xmm0, %xmm3
	; SSE41-NEXT: pxor %xmm2, %xmm3			; SSE41-NEXT: pxor %xmm2, %xmm0
	; SSE41-NEXT: movdqa %xmm4, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm4
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm0			; SSE41-NEXT: pcmpeqd %xmm0, %xmm4
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm3
	; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm4[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm3[0,0,2,2]
	; SSE41-NEXT: pand %xmm3, %xmm0			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm0			; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm1, %xmm2
	; SSE41-NEXT: movq %xmm2, %rax			; SSE41-NEXT: movq %xmm2, %rax
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; SSE42-LABEL: test_v2i64:			; SSE42-LABEL: test_v2i64:
	; SSE42: # %bb.0:			; SSE42: # %bb.0:
	; SSE42-NEXT: movdqa %xmm0, %xmm1			; SSE42-NEXT: movdqa %xmm0, %xmm1
	; SSE42-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,2,3]			; SSE42-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,2,3]
	▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: por %xmm4, %xmm2			; SSE2-NEXT: por %xmm4, %xmm2
	; SSE2-NEXT: movq %xmm2, %rax			; SSE2-NEXT: movq %xmm2, %rax
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v4i64:			; SSE41-LABEL: test_v4i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm2
	; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm1, %xmm4			; SSE41-NEXT: movdqa %xmm1, %xmm0
				; SSE41-NEXT: pxor %xmm3, %xmm0
				; SSE41-NEXT: movdqa %xmm2, %xmm4
	; SSE41-NEXT: pxor %xmm3, %xmm4			; SSE41-NEXT: pxor %xmm3, %xmm4
	; SSE41-NEXT: movdqa %xmm0, %xmm5			; SSE41-NEXT: movdqa %xmm4, %xmm5
	; SSE41-NEXT: pxor %xmm3, %xmm5			; SSE41-NEXT: pcmpeqd %xmm0, %xmm5
	; SSE41-NEXT: movdqa %xmm5, %xmm0			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	; SSE41-NEXT: pcmpeqd %xmm4, %xmm0			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm4[0,0,2,2]
	; SSE41-NEXT: pcmpgtd %xmm4, %xmm5			; SSE41-NEXT: pand %xmm5, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm5[0,0,2,2]			; SSE41-NEXT: por %xmm4, %xmm0
	; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1			; SSE41-NEXT: blendvpd %xmm0, %xmm2, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[2,3,2,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[2,3,2,3]
	; SSE41-NEXT: movdqa %xmm1, %xmm4			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: pxor %xmm3, %xmm4			; SSE41-NEXT: pxor %xmm3, %xmm4
	; SSE41-NEXT: pxor %xmm2, %xmm3			; SSE41-NEXT: pxor %xmm2, %xmm3
	; SSE41-NEXT: movdqa %xmm4, %xmm5			; SSE41-NEXT: movdqa %xmm4, %xmm5
	; SSE41-NEXT: pcmpeqd %xmm3, %xmm5			; SSE41-NEXT: pcmpeqd %xmm3, %xmm5
	; SSE41-NEXT: pcmpgtd %xmm3, %xmm4			; SSE41-NEXT: pcmpgtd %xmm3, %xmm4
	▲ Show 20 Lines • Show All 146 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: por %xmm1, %xmm3			; SSE2-NEXT: por %xmm1, %xmm3
	; SSE2-NEXT: movq %xmm3, %rax			; SSE2-NEXT: movq %xmm3, %rax
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v8i64:			; SSE41-LABEL: test_v8i64:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa %xmm0, %xmm4			; SSE41-NEXT: movdqa %xmm0, %xmm4
	; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [9223372039002259456,9223372039002259456]			; SSE41-NEXT: movdqa {{.*#+}} xmm5 = [9223372039002259456,9223372039002259456]
	; SSE41-NEXT: movdqa %xmm2, %xmm6			; SSE41-NEXT: movdqa %xmm2, %xmm0
				; SSE41-NEXT: pxor %xmm5, %xmm0
				; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: pxor %xmm5, %xmm6			; SSE41-NEXT: pxor %xmm5, %xmm6
	; SSE41-NEXT: movdqa %xmm0, %xmm7			; SSE41-NEXT: movdqa %xmm6, %xmm7
	; SSE41-NEXT: pxor %xmm5, %xmm7			; SSE41-NEXT: pcmpeqd %xmm0, %xmm7
	; SSE41-NEXT: movdqa %xmm7, %xmm0			; SSE41-NEXT: pcmpgtd %xmm0, %xmm6
	; SSE41-NEXT: pcmpeqd %xmm6, %xmm0			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm6[0,0,2,2]
	; SSE41-NEXT: pcmpgtd %xmm6, %xmm7			; SSE41-NEXT: pand %xmm7, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm6 = xmm7[0,0,2,2]			; SSE41-NEXT: por %xmm6, %xmm0
	; SSE41-NEXT: pand %xmm6, %xmm0
	; SSE41-NEXT: por %xmm7, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2			; SSE41-NEXT: blendvpd %xmm0, %xmm4, %xmm2
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: movdqa %xmm3, %xmm0
	; SSE41-NEXT: pxor %xmm5, %xmm0			; SSE41-NEXT: pxor %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm1, %xmm4			; SSE41-NEXT: movdqa %xmm1, %xmm4
	; SSE41-NEXT: pxor %xmm5, %xmm4			; SSE41-NEXT: pxor %xmm5, %xmm4
	; SSE41-NEXT: movdqa %xmm4, %xmm6			; SSE41-NEXT: movdqa %xmm4, %xmm6
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm6			; SSE41-NEXT: pcmpeqd %xmm0, %xmm6
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm4			; SSE41-NEXT: pcmpgtd %xmm0, %xmm4
	▲ Show 20 Lines • Show All 278 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pxor %xmm9, %xmm1			; SSE41-NEXT: pxor %xmm9, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm10			; SSE41-NEXT: movdqa %xmm1, %xmm10
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm10			; SSE41-NEXT: pcmpeqd %xmm0, %xmm10
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[0,0,2,2]			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[0,0,2,2]
	; SSE41-NEXT: pand %xmm10, %xmm0			; SSE41-NEXT: pand %xmm10, %xmm0
	; SSE41-NEXT: por %xmm1, %xmm0			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7			; SSE41-NEXT: blendvpd %xmm0, %xmm3, %xmm7
	; SSE41-NEXT: movdqa %xmm4, %xmm1			; SSE41-NEXT: movdqa %xmm4, %xmm0
				; SSE41-NEXT: pxor %xmm9, %xmm0
				; SSE41-NEXT: movdqa %xmm8, %xmm1
	; SSE41-NEXT: pxor %xmm9, %xmm1			; SSE41-NEXT: pxor %xmm9, %xmm1
	; SSE41-NEXT: movdqa %xmm8, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: pxor %xmm9, %xmm3			; SSE41-NEXT: pcmpeqd %xmm0, %xmm3
	; SSE41-NEXT: movdqa %xmm3, %xmm0			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	; SSE41-NEXT: pcmpeqd %xmm1, %xmm0			; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[0,0,2,2]
	; SSE41-NEXT: pcmpgtd %xmm1, %xmm3			; SSE41-NEXT: pand %xmm3, %xmm0
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm3[0,0,2,2]			; SSE41-NEXT: por %xmm1, %xmm0
	; SSE41-NEXT: pand %xmm1, %xmm0
	; SSE41-NEXT: por %xmm3, %xmm0
	; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm4			; SSE41-NEXT: blendvpd %xmm0, %xmm8, %xmm4
	; SSE41-NEXT: movdqa %xmm6, %xmm0			; SSE41-NEXT: movdqa %xmm6, %xmm0
	; SSE41-NEXT: pxor %xmm9, %xmm0			; SSE41-NEXT: pxor %xmm9, %xmm0
	; SSE41-NEXT: movdqa %xmm2, %xmm1			; SSE41-NEXT: movdqa %xmm2, %xmm1
	; SSE41-NEXT: pxor %xmm9, %xmm1			; SSE41-NEXT: pxor %xmm9, %xmm1
	; SSE41-NEXT: movdqa %xmm1, %xmm3			; SSE41-NEXT: movdqa %xmm1, %xmm3
	; SSE41-NEXT: pcmpeqd %xmm0, %xmm3			; SSE41-NEXT: pcmpeqd %xmm0, %xmm3
	; SSE41-NEXT: pcmpgtd %xmm0, %xmm1			; SSE41-NEXT: pcmpgtd %xmm0, %xmm1
	▲ Show 20 Lines • Show All 1,617 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-rotate-128.ll

	Show First 20 Lines • Show All 1,090 Lines • ▼ Show 20 Lines
	}			}

	define <16 x i8> @splatvar_rotate_v16i8(<16 x i8> %a, <16 x i8> %b) nounwind {			define <16 x i8> @splatvar_rotate_v16i8(<16 x i8> %a, <16 x i8> %b) nounwind {
	; SSE2-LABEL: splatvar_rotate_v16i8:			; SSE2-LABEL: splatvar_rotate_v16i8:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]			; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]
	; SSE2-NEXT: psubb %xmm1, %xmm2			; SSE2-NEXT: psubb %xmm1, %xmm2
	; SSE2-NEXT: movdqa %xmm1, %xmm3			; SSE2-NEXT: pslldq {{.*#+}} xmm1 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm1[0]
	; SSE2-NEXT: pslldq {{.*#+}} xmm3 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm3[0]			; SSE2-NEXT: psrldq {{.*#+}} xmm1 = xmm1[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; SSE2-NEXT: psrldq {{.*#+}} xmm3 = xmm3[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; SSE2-NEXT: movdqa %xmm0, %xmm3
	; SSE2-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: psllw %xmm1, %xmm3
	; SSE2-NEXT: psllw %xmm3, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm4, %xmm4			; SSE2-NEXT: pcmpeqd %xmm4, %xmm4
	; SSE2-NEXT: pcmpeqd %xmm5, %xmm5			; SSE2-NEXT: pcmpeqd %xmm5, %xmm5
	; SSE2-NEXT: psllw %xmm3, %xmm5			; SSE2-NEXT: psllw %xmm1, %xmm5
	; SSE2-NEXT: punpcklbw {{.*#+}} xmm5 = xmm5[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]			; SSE2-NEXT: punpcklbw {{.*#+}} xmm5 = xmm5[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
	; SSE2-NEXT: pshuflw {{.*#+}} xmm3 = xmm5[0,0,0,0,4,5,6,7]			; SSE2-NEXT: pshuflw {{.*#+}} xmm1 = xmm5[0,0,0,0,4,5,6,7]
	; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm3[0,0,0,0]			; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,0,0,0]
	; SSE2-NEXT: pand %xmm3, %xmm1			; SSE2-NEXT: pand %xmm3, %xmm1
	; SSE2-NEXT: pslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0]			; SSE2-NEXT: pslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0]
	; SSE2-NEXT: psrldq {{.*#+}} xmm2 = xmm2[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; SSE2-NEXT: psrldq {{.*#+}} xmm2 = xmm2[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; SSE2-NEXT: psrlw %xmm2, %xmm0			; SSE2-NEXT: psrlw %xmm2, %xmm0
	; SSE2-NEXT: psrlw %xmm2, %xmm4			; SSE2-NEXT: psrlw %xmm2, %xmm4
	; SSE2-NEXT: psrlw $8, %xmm4			; SSE2-NEXT: psrlw $8, %xmm4
	; SSE2-NEXT: punpcklbw {{.*#+}} xmm4 = xmm4[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]			; SSE2-NEXT: punpcklbw {{.*#+}} xmm4 = xmm4[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
	; SSE2-NEXT: pshuflw {{.*#+}} xmm2 = xmm4[0,0,0,0,4,5,6,7]			; SSE2-NEXT: pshuflw {{.*#+}} xmm2 = xmm4[0,0,0,0,4,5,6,7]
	; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,0,0,0]			; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,0,0,0]
	; SSE2-NEXT: pand %xmm0, %xmm2			; SSE2-NEXT: pand %xmm2, %xmm0
	; SSE2-NEXT: por %xmm2, %xmm1			; SSE2-NEXT: por %xmm1, %xmm0
	; SSE2-NEXT: movdqa %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: splatvar_rotate_v16i8:			; SSE41-LABEL: splatvar_rotate_v16i8:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE41-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE41-NEXT: pmovzxbq {{.*#+}} xmm3 = xmm1[0],zero,zero,zero,zero,zero,zero,zero,xmm1[1],zero,zero,zero,zero,zero,zero,zero			; SSE41-NEXT: pmovzxbq {{.*#+}} xmm2 = xmm1[0],zero,zero,zero,zero,zero,zero,zero,xmm1[1],zero,zero,zero,zero,zero,zero,zero
	; SSE41-NEXT: movdqa %xmm0, %xmm2			; SSE41-NEXT: movdqa %xmm0, %xmm3
	; SSE41-NEXT: psllw %xmm3, %xmm2			; SSE41-NEXT: psllw %xmm2, %xmm3
	; SSE41-NEXT: pcmpeqd %xmm4, %xmm4			; SSE41-NEXT: pcmpeqd %xmm4, %xmm4
	; SSE41-NEXT: pcmpeqd %xmm5, %xmm5			; SSE41-NEXT: pcmpeqd %xmm5, %xmm5
	; SSE41-NEXT: psllw %xmm3, %xmm5			; SSE41-NEXT: psllw %xmm2, %xmm5
	; SSE41-NEXT: pxor %xmm3, %xmm3			; SSE41-NEXT: pxor %xmm2, %xmm2
	; SSE41-NEXT: pshufb %xmm3, %xmm5			; SSE41-NEXT: pshufb %xmm2, %xmm5
	; SSE41-NEXT: pand %xmm5, %xmm2			; SSE41-NEXT: pand %xmm3, %xmm5
	; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]			; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]
	; SSE41-NEXT: psubb %xmm1, %xmm3			; SSE41-NEXT: psubb %xmm1, %xmm2
	; SSE41-NEXT: pmovzxbq {{.*#+}} xmm1 = xmm3[0],zero,zero,zero,zero,zero,zero,zero,xmm3[1],zero,zero,zero,zero,zero,zero,zero			; SSE41-NEXT: pmovzxbq {{.*#+}} xmm1 = xmm2[0],zero,zero,zero,zero,zero,zero,zero,xmm2[1],zero,zero,zero,zero,zero,zero,zero
	; SSE41-NEXT: psrlw %xmm1, %xmm0			; SSE41-NEXT: psrlw %xmm1, %xmm0
	; SSE41-NEXT: psrlw %xmm1, %xmm4			; SSE41-NEXT: psrlw %xmm1, %xmm4
	; SSE41-NEXT: pshufb {{.*#+}} xmm4 = xmm4[1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]			; SSE41-NEXT: pshufb {{.*#+}} xmm4 = xmm4[1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]
	; SSE41-NEXT: pand %xmm0, %xmm4			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: por %xmm4, %xmm2			; SSE41-NEXT: por %xmm5, %xmm0
	; SSE41-NEXT: movdqa %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: splatvar_rotate_v16i8:			; AVX1-LABEL: splatvar_rotate_v16i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX1-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX1-NEXT: vpmovzxbq {{.*#+}} xmm2 = xmm1[0],zero,zero,zero,zero,zero,zero,zero,xmm1[1],zero,zero,zero,zero,zero,zero,zero			; AVX1-NEXT: vpmovzxbq {{.*#+}} xmm2 = xmm1[0],zero,zero,zero,zero,zero,zero,zero,xmm1[1],zero,zero,zero,zero,zero,zero,zero
	; AVX1-NEXT: vpsllw %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpsllw %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vpcmpeqd %xmm4, %xmm4, %xmm4			; AVX1-NEXT: vpcmpeqd %xmm4, %xmm4, %xmm4
	▲ Show 20 Lines • Show All 130 Lines • ▼ Show 20 Lines
	; XOPAVX2-NEXT: vprotb %xmm1, %xmm0, %xmm0			; XOPAVX2-NEXT: vprotb %xmm1, %xmm0, %xmm0
	; XOPAVX2-NEXT: retq			; XOPAVX2-NEXT: retq
	;			;
	; X86-SSE2-LABEL: splatvar_rotate_v16i8:			; X86-SSE2-LABEL: splatvar_rotate_v16i8:
	; X86-SSE2: # %bb.0:			; X86-SSE2: # %bb.0:
	; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm1			; X86-SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}, %xmm1
	; X86-SSE2-NEXT: movdqa {{.*#+}} xmm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]			; X86-SSE2-NEXT: movdqa {{.*#+}} xmm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]
	; X86-SSE2-NEXT: psubb %xmm1, %xmm2			; X86-SSE2-NEXT: psubb %xmm1, %xmm2
	; X86-SSE2-NEXT: movdqa %xmm1, %xmm3			; X86-SSE2-NEXT: pslldq {{.*#+}} xmm1 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm1[0]
	; X86-SSE2-NEXT: pslldq {{.*#+}} xmm3 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm3[0]			; X86-SSE2-NEXT: psrldq {{.*#+}} xmm1 = xmm1[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; X86-SSE2-NEXT: psrldq {{.*#+}} xmm3 = xmm3[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; X86-SSE2-NEXT: movdqa %xmm0, %xmm3
	; X86-SSE2-NEXT: movdqa %xmm0, %xmm1			; X86-SSE2-NEXT: psllw %xmm1, %xmm3
	; X86-SSE2-NEXT: psllw %xmm3, %xmm1
	; X86-SSE2-NEXT: pcmpeqd %xmm4, %xmm4			; X86-SSE2-NEXT: pcmpeqd %xmm4, %xmm4
	; X86-SSE2-NEXT: pcmpeqd %xmm5, %xmm5			; X86-SSE2-NEXT: pcmpeqd %xmm5, %xmm5
	; X86-SSE2-NEXT: psllw %xmm3, %xmm5			; X86-SSE2-NEXT: psllw %xmm1, %xmm5
	; X86-SSE2-NEXT: punpcklbw {{.*#+}} xmm5 = xmm5[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]			; X86-SSE2-NEXT: punpcklbw {{.*#+}} xmm5 = xmm5[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
	; X86-SSE2-NEXT: pshuflw {{.*#+}} xmm3 = xmm5[0,0,0,0,4,5,6,7]			; X86-SSE2-NEXT: pshuflw {{.*#+}} xmm1 = xmm5[0,0,0,0,4,5,6,7]
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm3[0,0,0,0]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,0,0,0]
	; X86-SSE2-NEXT: pand %xmm3, %xmm1			; X86-SSE2-NEXT: pand %xmm3, %xmm1
	; X86-SSE2-NEXT: pslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0]			; X86-SSE2-NEXT: pslldq {{.*#+}} xmm2 = zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,xmm2[0]
	; X86-SSE2-NEXT: psrldq {{.*#+}} xmm2 = xmm2[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero			; X86-SSE2-NEXT: psrldq {{.*#+}} xmm2 = xmm2[15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
	; X86-SSE2-NEXT: psrlw %xmm2, %xmm0			; X86-SSE2-NEXT: psrlw %xmm2, %xmm0
	; X86-SSE2-NEXT: psrlw %xmm2, %xmm4			; X86-SSE2-NEXT: psrlw %xmm2, %xmm4
	; X86-SSE2-NEXT: psrlw $8, %xmm4			; X86-SSE2-NEXT: psrlw $8, %xmm4
	; X86-SSE2-NEXT: punpcklbw {{.*#+}} xmm4 = xmm4[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]			; X86-SSE2-NEXT: punpcklbw {{.*#+}} xmm4 = xmm4[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
	; X86-SSE2-NEXT: pshuflw {{.*#+}} xmm2 = xmm4[0,0,0,0,4,5,6,7]			; X86-SSE2-NEXT: pshuflw {{.*#+}} xmm2 = xmm4[0,0,0,0,4,5,6,7]
	; X86-SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,0,0,0]			; X86-SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,0,0,0]
	; X86-SSE2-NEXT: pand %xmm0, %xmm2			; X86-SSE2-NEXT: pand %xmm2, %xmm0
	; X86-SSE2-NEXT: por %xmm2, %xmm1			; X86-SSE2-NEXT: por %xmm1, %xmm0
	; X86-SSE2-NEXT: movdqa %xmm1, %xmm0
	; X86-SSE2-NEXT: retl			; X86-SSE2-NEXT: retl
	%splat = shufflevector <16 x i8> %b, <16 x i8> undef, <16 x i32> zeroinitializer			%splat = shufflevector <16 x i8> %b, <16 x i8> undef, <16 x i32> zeroinitializer
	%splat8 = sub <16 x i8> <i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8>, %splat			%splat8 = sub <16 x i8> <i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8>, %splat
	%shl = shl <16 x i8> %a, %splat			%shl = shl <16 x i8> %a, %splat
	%lshr = lshr <16 x i8> %a, %splat8			%lshr = lshr <16 x i8> %a, %splat8
	%or = or <16 x i8> %shl, %lshr			%or = or <16 x i8> %shl, %lshr
	ret <16 x i8> %or			ret <16 x i8> %or
	}			}
	▲ Show 20 Lines • Show All 1,302 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-shift-ashr-128.ll

	Show First 20 Lines • Show All 1,085 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: movdqa %xmm0, %xmm1
	; SSE2-NEXT: psraw $4, %xmm1			; SSE2-NEXT: psraw $4, %xmm1
	; SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm0[0],xmm1[1]			; SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm0[0],xmm1[1]
	; SSE2-NEXT: movapd %xmm1, %xmm2			; SSE2-NEXT: movapd %xmm1, %xmm2
	; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm1[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm1[2,3]
	; SSE2-NEXT: psraw $2, %xmm1			; SSE2-NEXT: psraw $2, %xmm1
	; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,3,2,3]			; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,3,2,3]
	; SSE2-NEXT: unpcklps {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1]			; SSE2-NEXT: unpcklps {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1]
	; SSE2-NEXT: movaps {{.*#+}} xmm1 = [65535,0,65535,0,65535,0,65535,0]			; SSE2-NEXT: movaps {{.*#+}} xmm0 = [65535,0,65535,0,65535,0,65535,0]
	; SSE2-NEXT: movaps %xmm2, %xmm0			; SSE2-NEXT: movaps %xmm2, %xmm1
	; SSE2-NEXT: andps %xmm1, %xmm0			; SSE2-NEXT: andps %xmm0, %xmm1
	; SSE2-NEXT: psraw $1, %xmm2			; SSE2-NEXT: psraw $1, %xmm2
	; SSE2-NEXT: andnps %xmm2, %xmm1			; SSE2-NEXT: andnps %xmm2, %xmm0
	; SSE2-NEXT: orps %xmm1, %xmm0			; SSE2-NEXT: orps %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: constant_shift_v8i16:			; SSE41-LABEL: constant_shift_v8i16:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa {{.*#+}} xmm1 = <u,32768,16384,8192,4096,2048,1024,512>			; SSE41-NEXT: movdqa {{.*#+}} xmm1 = <u,32768,16384,8192,4096,2048,1024,512>
	; SSE41-NEXT: pmulhw %xmm0, %xmm1			; SSE41-NEXT: pmulhw %xmm0, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0],xmm1[1,2,3,4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0],xmm1[1,2,3,4,5,6,7]
	▲ Show 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
	; X86-SSE-NEXT: movdqa %xmm0, %xmm1			; X86-SSE-NEXT: movdqa %xmm0, %xmm1
	; X86-SSE-NEXT: psraw $4, %xmm1			; X86-SSE-NEXT: psraw $4, %xmm1
	; X86-SSE-NEXT: movsd {{.*#+}} xmm1 = xmm0[0],xmm1[1]			; X86-SSE-NEXT: movsd {{.*#+}} xmm1 = xmm0[0],xmm1[1]
	; X86-SSE-NEXT: movapd %xmm1, %xmm2			; X86-SSE-NEXT: movapd %xmm1, %xmm2
	; X86-SSE-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm1[2,3]			; X86-SSE-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm1[2,3]
	; X86-SSE-NEXT: psraw $2, %xmm1			; X86-SSE-NEXT: psraw $2, %xmm1
	; X86-SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,3,2,3]			; X86-SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,3,2,3]
	; X86-SSE-NEXT: unpcklps {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1]			; X86-SSE-NEXT: unpcklps {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1]
	; X86-SSE-NEXT: movaps {{.*#+}} xmm1 = [65535,0,65535,0,65535,0,65535,0]			; X86-SSE-NEXT: movaps {{.*#+}} xmm0 = [65535,0,65535,0,65535,0,65535,0]
	; X86-SSE-NEXT: movaps %xmm2, %xmm0			; X86-SSE-NEXT: movaps %xmm2, %xmm1
	; X86-SSE-NEXT: andps %xmm1, %xmm0			; X86-SSE-NEXT: andps %xmm0, %xmm1
	; X86-SSE-NEXT: psraw $1, %xmm2			; X86-SSE-NEXT: psraw $1, %xmm2
	; X86-SSE-NEXT: andnps %xmm2, %xmm1			; X86-SSE-NEXT: andnps %xmm2, %xmm0
	; X86-SSE-NEXT: orps %xmm1, %xmm0			; X86-SSE-NEXT: orps %xmm1, %xmm0
	; X86-SSE-NEXT: retl			; X86-SSE-NEXT: retl
	%shift = ashr <8 x i16> %a, <i16 0, i16 1, i16 2, i16 3, i16 4, i16 5, i16 6, i16 7>			%shift = ashr <8 x i16> %a, <i16 0, i16 1, i16 2, i16 3, i16 4, i16 5, i16 6, i16 7>
	ret <8 x i16> %shift			ret <8 x i16> %shift
	}			}

	define <16 x i8> @constant_shift_v16i8(<16 x i8> %a) nounwind {			define <16 x i8> @constant_shift_v16i8(<16 x i8> %a) nounwind {
	; SSE-LABEL: constant_shift_v16i8:			; SSE-LABEL: constant_shift_v16i8:
	▲ Show 20 Lines • Show All 280 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-shift-ashr-sub128.ll

	Show First 20 Lines • Show All 1,778 Lines • ▼ Show 20 Lines

	define <4 x i16> @constant_shift_v4i16(<4 x i16> %a) nounwind {			define <4 x i16> @constant_shift_v4i16(<4 x i16> %a) nounwind {
	; SSE2-LABEL: constant_shift_v4i16:			; SSE2-LABEL: constant_shift_v4i16:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: movdqa %xmm0, %xmm1
	; SSE2-NEXT: psraw $2, %xmm1			; SSE2-NEXT: psraw $2, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,0],xmm0[0,0]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,0],xmm0[0,0]
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[2,0],xmm0[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[2,0],xmm0[2,3]
	; SSE2-NEXT: movaps {{.*#+}} xmm2 = [65535,0,65535,0,65535,65535,65535,65535]			; SSE2-NEXT: movaps {{.*#+}} xmm0 = [65535,0,65535,0,65535,65535,65535,65535]
	; SSE2-NEXT: movaps %xmm1, %xmm0			; SSE2-NEXT: movaps %xmm1, %xmm2
	; SSE2-NEXT: andps %xmm2, %xmm0			; SSE2-NEXT: andps %xmm0, %xmm2
	; SSE2-NEXT: psraw $1, %xmm1			; SSE2-NEXT: psraw $1, %xmm1
	; SSE2-NEXT: andnps %xmm1, %xmm2			; SSE2-NEXT: andnps %xmm1, %xmm0
	; SSE2-NEXT: orps %xmm2, %xmm0			; SSE2-NEXT: orps %xmm2, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: constant_shift_v4i16:			; SSE41-LABEL: constant_shift_v4i16:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movdqa {{.*#+}} xmm1 = <u,32768,16384,8192,u,u,u,u>			; SSE41-NEXT: movdqa {{.*#+}} xmm1 = <u,32768,16384,8192,u,u,u,u>
	; SSE41-NEXT: pmulhw %xmm0, %xmm1			; SSE41-NEXT: pmulhw %xmm0, %xmm1
	; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0],xmm1[1,2,3,4,5,6,7]			; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0],xmm1[1,2,3,4,5,6,7]
	▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
	; AVX512BWVL-NEXT: retq			; AVX512BWVL-NEXT: retq
	;			;
	; X86-SSE-LABEL: constant_shift_v4i16:			; X86-SSE-LABEL: constant_shift_v4i16:
	; X86-SSE: # %bb.0:			; X86-SSE: # %bb.0:
	; X86-SSE-NEXT: movdqa %xmm0, %xmm1			; X86-SSE-NEXT: movdqa %xmm0, %xmm1
	; X86-SSE-NEXT: psraw $2, %xmm1			; X86-SSE-NEXT: psraw $2, %xmm1
	; X86-SSE-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,0],xmm0[0,0]			; X86-SSE-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,0],xmm0[0,0]
	; X86-SSE-NEXT: shufps {{.*#+}} xmm1 = xmm1[2,0],xmm0[2,3]			; X86-SSE-NEXT: shufps {{.*#+}} xmm1 = xmm1[2,0],xmm0[2,3]
	; X86-SSE-NEXT: movaps {{.*#+}} xmm2 = [65535,0,65535,0,65535,65535,65535,65535]			; X86-SSE-NEXT: movaps {{.*#+}} xmm0 = [65535,0,65535,0,65535,65535,65535,65535]
	; X86-SSE-NEXT: movaps %xmm1, %xmm0			; X86-SSE-NEXT: movaps %xmm1, %xmm2
	; X86-SSE-NEXT: andps %xmm2, %xmm0			; X86-SSE-NEXT: andps %xmm0, %xmm2
	; X86-SSE-NEXT: psraw $1, %xmm1			; X86-SSE-NEXT: psraw $1, %xmm1
	; X86-SSE-NEXT: andnps %xmm1, %xmm2			; X86-SSE-NEXT: andnps %xmm1, %xmm0
	; X86-SSE-NEXT: orps %xmm2, %xmm0			; X86-SSE-NEXT: orps %xmm2, %xmm0
	; X86-SSE-NEXT: retl			; X86-SSE-NEXT: retl
	%shift = ashr <4 x i16> %a, <i16 0, i16 1, i16 2, i16 3>			%shift = ashr <4 x i16> %a, <i16 0, i16 1, i16 2, i16 3>
	ret <4 x i16> %shift			ret <4 x i16> %shift
	}			}

	define <2 x i16> @constant_shift_v2i16(<2 x i16> %a) nounwind {			define <2 x i16> @constant_shift_v2i16(<2 x i16> %a) nounwind {
	; SSE2-LABEL: constant_shift_v2i16:			; SSE2-LABEL: constant_shift_v2i16:
	▲ Show 20 Lines • Show All 600 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-shuffle-combining.ll

	Show First 20 Lines • Show All 2,687 Lines • ▼ Show 20 Lines
	}			}

	define <4 x float> @PR22390(<4 x float> %a, <4 x float> %b) {			define <4 x float> @PR22390(<4 x float> %a, <4 x float> %b) {
	; SSE2-LABEL: PR22390:			; SSE2-LABEL: PR22390:
	; SSE2: # %bb.0: # %entry			; SSE2: # %bb.0: # %entry
	; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,0,1,2]			; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,0,1,2]
	; SSE2-NEXT: movaps %xmm0, %xmm2			; SSE2-NEXT: movaps %xmm0, %xmm2
	; SSE2-NEXT: movss {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3]			; SSE2-NEXT: movss {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3]
	; SSE2-NEXT: addps %xmm0, %xmm2			; SSE2-NEXT: addps %xmm2, %xmm0
	; SSE2-NEXT: movaps %xmm2, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSSE3-LABEL: PR22390:			; SSSE3-LABEL: PR22390:
	; SSSE3: # %bb.0: # %entry			; SSSE3: # %bb.0: # %entry
	; SSSE3-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,0,1,2]			; SSSE3-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,0,1,2]
	; SSSE3-NEXT: movaps %xmm0, %xmm2			; SSSE3-NEXT: movaps %xmm0, %xmm2
	; SSSE3-NEXT: movss {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3]			; SSSE3-NEXT: movss {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3]
	; SSSE3-NEXT: addps %xmm0, %xmm2			; SSSE3-NEXT: addps %xmm2, %xmm0
	; SSSE3-NEXT: movaps %xmm2, %xmm0
	; SSSE3-NEXT: retq			; SSSE3-NEXT: retq
	;			;
	; SSE41-LABEL: PR22390:			; SSE41-LABEL: PR22390:
	; SSE41: # %bb.0: # %entry			; SSE41: # %bb.0: # %entry
	; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,0,1,2]			; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,0,1,2]
	; SSE41-NEXT: blendps {{.*#+}} xmm1 = xmm1[0],xmm0[1,2,3]			; SSE41-NEXT: blendps {{.*#+}} xmm1 = xmm1[0],xmm0[1,2,3]
	; SSE41-NEXT: addps %xmm1, %xmm0			; SSE41-NEXT: addps %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	▲ Show 20 Lines • Show All 703 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-trunc-math.ll

	Show First 20 Lines • Show All 2,810 Lines • ▼ Show 20 Lines
	; SSE-NEXT: movdqa {{.*#+}} xmm8 = [255,0,0,0,255,0,0,0,255,0,0,0,255,0,0,0]			; SSE-NEXT: movdqa {{.*#+}} xmm8 = [255,0,0,0,255,0,0,0,255,0,0,0,255,0,0,0]
	; SSE-NEXT: pand %xmm8, %xmm7			; SSE-NEXT: pand %xmm8, %xmm7
	; SSE-NEXT: pand %xmm3, %xmm7			; SSE-NEXT: pand %xmm3, %xmm7
	; SSE-NEXT: pand %xmm8, %xmm6			; SSE-NEXT: pand %xmm8, %xmm6
	; SSE-NEXT: pand %xmm2, %xmm6			; SSE-NEXT: pand %xmm2, %xmm6
	; SSE-NEXT: packuswb %xmm7, %xmm6			; SSE-NEXT: packuswb %xmm7, %xmm6
	; SSE-NEXT: pand %xmm8, %xmm5			; SSE-NEXT: pand %xmm8, %xmm5
	; SSE-NEXT: pand %xmm1, %xmm5			; SSE-NEXT: pand %xmm1, %xmm5
	; SSE-NEXT: pand %xmm8, %xmm4			; SSE-NEXT: pand %xmm4, %xmm8
	; SSE-NEXT: pand %xmm4, %xmm0			; SSE-NEXT: pand %xmm8, %xmm0
	; SSE-NEXT: packuswb %xmm5, %xmm0			; SSE-NEXT: packuswb %xmm5, %xmm0
	; SSE-NEXT: packuswb %xmm6, %xmm0			; SSE-NEXT: packuswb %xmm6, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_and_v16i32_v16i8:			; AVX1-LABEL: trunc_and_v16i32_v16i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vmovaps {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255]			; AVX1-NEXT: vmovaps {{.*#+}} ymm4 = [255,255,255,255,255,255,255,255]
	; AVX1-NEXT: vandps %ymm4, %ymm3, %ymm3			; AVX1-NEXT: vandps %ymm4, %ymm3, %ymm3
	Show All 34 Lines
	}			}

	define <16 x i8> @trunc_and_v16i16_v16i8(<16 x i16> %a0, <16 x i16> %a1) nounwind {			define <16 x i8> @trunc_and_v16i16_v16i8(<16 x i16> %a0, <16 x i16> %a1) nounwind {
	; SSE-LABEL: trunc_and_v16i16_v16i8:			; SSE-LABEL: trunc_and_v16i16_v16i8:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movdqa {{.*#+}} xmm4 = [255,0,255,0,255,0,255,0,255,0,255,0,255,0,255,0]			; SSE-NEXT: movdqa {{.*#+}} xmm4 = [255,0,255,0,255,0,255,0,255,0,255,0,255,0,255,0]
	; SSE-NEXT: pand %xmm4, %xmm3			; SSE-NEXT: pand %xmm4, %xmm3
	; SSE-NEXT: pand %xmm1, %xmm3			; SSE-NEXT: pand %xmm1, %xmm3
	; SSE-NEXT: pand %xmm4, %xmm2			; SSE-NEXT: pand %xmm2, %xmm4
	; SSE-NEXT: pand %xmm2, %xmm0			; SSE-NEXT: pand %xmm4, %xmm0
	; SSE-NEXT: packuswb %xmm3, %xmm0			; SSE-NEXT: packuswb %xmm3, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-LABEL: trunc_and_v16i16_v16i8:			; AVX1-LABEL: trunc_and_v16i16_v16i8:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vandps %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vandps %ymm1, %ymm0, %ymm0
	; AVX1-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX1-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	▲ Show 20 Lines • Show All 1,860 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-tzcnt-128.ll

	Show All 27 Lines
	; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]			; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
	; SSE2-NEXT: movdqa %xmm0, %xmm2			; SSE2-NEXT: movdqa %xmm0, %xmm2
	; SSE2-NEXT: pand %xmm1, %xmm2			; SSE2-NEXT: pand %xmm1, %xmm2
	; SSE2-NEXT: psrlw $2, %xmm0			; SSE2-NEXT: psrlw $2, %xmm0
	; SSE2-NEXT: pand %xmm1, %xmm0			; SSE2-NEXT: pand %xmm1, %xmm0
	; SSE2-NEXT: paddb %xmm2, %xmm0			; SSE2-NEXT: paddb %xmm2, %xmm0
	; SSE2-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: movdqa %xmm0, %xmm1
	; SSE2-NEXT: psrlw $4, %xmm1			; SSE2-NEXT: psrlw $4, %xmm1
	; SSE2-NEXT: paddb %xmm0, %xmm1			; SSE2-NEXT: paddb %xmm1, %xmm0
	; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: psadbw %xmm0, %xmm1			; SSE2-NEXT: psadbw %xmm1, %xmm0
	; SSE2-NEXT: movdqa %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE3-LABEL: testv2i64:			; SSE3-LABEL: testv2i64:
	; SSE3: # %bb.0:			; SSE3: # %bb.0:
	; SSE3-NEXT: pcmpeqd %xmm1, %xmm1			; SSE3-NEXT: pcmpeqd %xmm1, %xmm1
	; SSE3-NEXT: paddq %xmm0, %xmm1			; SSE3-NEXT: paddq %xmm0, %xmm1
	; SSE3-NEXT: pandn %xmm1, %xmm0			; SSE3-NEXT: pandn %xmm1, %xmm0
	; SSE3-NEXT: movdqa %xmm0, %xmm1			; SSE3-NEXT: movdqa %xmm0, %xmm1
	; SSE3-NEXT: psrlw $1, %xmm1			; SSE3-NEXT: psrlw $1, %xmm1
	; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE3-NEXT: psubb %xmm1, %xmm0			; SSE3-NEXT: psubb %xmm1, %xmm0
	; SSE3-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]			; SSE3-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
	; SSE3-NEXT: movdqa %xmm0, %xmm2			; SSE3-NEXT: movdqa %xmm0, %xmm2
	; SSE3-NEXT: pand %xmm1, %xmm2			; SSE3-NEXT: pand %xmm1, %xmm2
	; SSE3-NEXT: psrlw $2, %xmm0			; SSE3-NEXT: psrlw $2, %xmm0
	; SSE3-NEXT: pand %xmm1, %xmm0			; SSE3-NEXT: pand %xmm1, %xmm0
	; SSE3-NEXT: paddb %xmm2, %xmm0			; SSE3-NEXT: paddb %xmm2, %xmm0
	; SSE3-NEXT: movdqa %xmm0, %xmm1			; SSE3-NEXT: movdqa %xmm0, %xmm1
	; SSE3-NEXT: psrlw $4, %xmm1			; SSE3-NEXT: psrlw $4, %xmm1
	; SSE3-NEXT: paddb %xmm0, %xmm1			; SSE3-NEXT: paddb %xmm1, %xmm0
	; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE3-NEXT: pxor %xmm0, %xmm0			; SSE3-NEXT: pxor %xmm1, %xmm1
	; SSE3-NEXT: psadbw %xmm0, %xmm1			; SSE3-NEXT: psadbw %xmm1, %xmm0
	; SSE3-NEXT: movdqa %xmm1, %xmm0
	; SSE3-NEXT: retq			; SSE3-NEXT: retq
	;			;
	; SSSE3-LABEL: testv2i64:			; SSSE3-LABEL: testv2i64:
	; SSSE3: # %bb.0:			; SSSE3: # %bb.0:
	; SSSE3-NEXT: pcmpeqd %xmm1, %xmm1			; SSSE3-NEXT: pcmpeqd %xmm1, %xmm1
	; SSSE3-NEXT: paddq %xmm0, %xmm1			; SSSE3-NEXT: paddq %xmm0, %xmm1
	; SSSE3-NEXT: pandn %xmm1, %xmm0			; SSSE3-NEXT: pandn %xmm1, %xmm0
	; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]			; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	▲ Show 20 Lines • Show All 158 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]			; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
	; SSE2-NEXT: movdqa %xmm0, %xmm2			; SSE2-NEXT: movdqa %xmm0, %xmm2
	; SSE2-NEXT: pand %xmm1, %xmm2			; SSE2-NEXT: pand %xmm1, %xmm2
	; SSE2-NEXT: psrlw $2, %xmm0			; SSE2-NEXT: psrlw $2, %xmm0
	; SSE2-NEXT: pand %xmm1, %xmm0			; SSE2-NEXT: pand %xmm1, %xmm0
	; SSE2-NEXT: paddb %xmm2, %xmm0			; SSE2-NEXT: paddb %xmm2, %xmm0
	; SSE2-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: movdqa %xmm0, %xmm1
	; SSE2-NEXT: psrlw $4, %xmm1			; SSE2-NEXT: psrlw $4, %xmm1
	; SSE2-NEXT: paddb %xmm0, %xmm1			; SSE2-NEXT: paddb %xmm1, %xmm0
	; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: psadbw %xmm0, %xmm1			; SSE2-NEXT: psadbw %xmm1, %xmm0
	; SSE2-NEXT: movdqa %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE3-LABEL: testv2i64u:			; SSE3-LABEL: testv2i64u:
	; SSE3: # %bb.0:			; SSE3: # %bb.0:
	; SSE3-NEXT: pcmpeqd %xmm1, %xmm1			; SSE3-NEXT: pcmpeqd %xmm1, %xmm1
	; SSE3-NEXT: paddq %xmm0, %xmm1			; SSE3-NEXT: paddq %xmm0, %xmm1
	; SSE3-NEXT: pandn %xmm1, %xmm0			; SSE3-NEXT: pandn %xmm1, %xmm0
	; SSE3-NEXT: movdqa %xmm0, %xmm1			; SSE3-NEXT: movdqa %xmm0, %xmm1
	; SSE3-NEXT: psrlw $1, %xmm1			; SSE3-NEXT: psrlw $1, %xmm1
	; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE3-NEXT: psubb %xmm1, %xmm0			; SSE3-NEXT: psubb %xmm1, %xmm0
	; SSE3-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]			; SSE3-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
	; SSE3-NEXT: movdqa %xmm0, %xmm2			; SSE3-NEXT: movdqa %xmm0, %xmm2
	; SSE3-NEXT: pand %xmm1, %xmm2			; SSE3-NEXT: pand %xmm1, %xmm2
	; SSE3-NEXT: psrlw $2, %xmm0			; SSE3-NEXT: psrlw $2, %xmm0
	; SSE3-NEXT: pand %xmm1, %xmm0			; SSE3-NEXT: pand %xmm1, %xmm0
	; SSE3-NEXT: paddb %xmm2, %xmm0			; SSE3-NEXT: paddb %xmm2, %xmm0
	; SSE3-NEXT: movdqa %xmm0, %xmm1			; SSE3-NEXT: movdqa %xmm0, %xmm1
	; SSE3-NEXT: psrlw $4, %xmm1			; SSE3-NEXT: psrlw $4, %xmm1
	; SSE3-NEXT: paddb %xmm0, %xmm1			; SSE3-NEXT: paddb %xmm1, %xmm0
	; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE3-NEXT: pxor %xmm0, %xmm0			; SSE3-NEXT: pxor %xmm1, %xmm1
	; SSE3-NEXT: psadbw %xmm0, %xmm1			; SSE3-NEXT: psadbw %xmm1, %xmm0
	; SSE3-NEXT: movdqa %xmm1, %xmm0
	; SSE3-NEXT: retq			; SSE3-NEXT: retq
	;			;
	; SSSE3-LABEL: testv2i64u:			; SSSE3-LABEL: testv2i64u:
	; SSSE3: # %bb.0:			; SSSE3: # %bb.0:
	; SSSE3-NEXT: pcmpeqd %xmm1, %xmm1			; SSSE3-NEXT: pcmpeqd %xmm1, %xmm1
	; SSSE3-NEXT: paddq %xmm0, %xmm1			; SSSE3-NEXT: paddq %xmm0, %xmm1
	; SSSE3-NEXT: pandn %xmm1, %xmm0			; SSSE3-NEXT: pandn %xmm1, %xmm0
	; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]			; SSSE3-NEXT: movdqa {{.*#+}} xmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	▲ Show 20 Lines • Show All 996 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]			; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
	; SSE2-NEXT: movdqa %xmm0, %xmm2			; SSE2-NEXT: movdqa %xmm0, %xmm2
	; SSE2-NEXT: pand %xmm1, %xmm2			; SSE2-NEXT: pand %xmm1, %xmm2
	; SSE2-NEXT: psrlw $2, %xmm0			; SSE2-NEXT: psrlw $2, %xmm0
	; SSE2-NEXT: pand %xmm1, %xmm0			; SSE2-NEXT: pand %xmm1, %xmm0
	; SSE2-NEXT: paddb %xmm2, %xmm0			; SSE2-NEXT: paddb %xmm2, %xmm0
	; SSE2-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: movdqa %xmm0, %xmm1
	; SSE2-NEXT: psrlw $4, %xmm1			; SSE2-NEXT: psrlw $4, %xmm1
	; SSE2-NEXT: paddb %xmm0, %xmm1			; SSE2-NEXT: paddb %xmm1, %xmm0
	; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE2-NEXT: movdqa %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE3-LABEL: testv16i8:			; SSE3-LABEL: testv16i8:
	; SSE3: # %bb.0:			; SSE3: # %bb.0:
	; SSE3-NEXT: pcmpeqd %xmm1, %xmm1			; SSE3-NEXT: pcmpeqd %xmm1, %xmm1
	; SSE3-NEXT: paddb %xmm0, %xmm1			; SSE3-NEXT: paddb %xmm0, %xmm1
	; SSE3-NEXT: pandn %xmm1, %xmm0			; SSE3-NEXT: pandn %xmm1, %xmm0
	; SSE3-NEXT: movdqa %xmm0, %xmm1			; SSE3-NEXT: movdqa %xmm0, %xmm1
	; SSE3-NEXT: psrlw $1, %xmm1			; SSE3-NEXT: psrlw $1, %xmm1
	; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE3-NEXT: psubb %xmm1, %xmm0			; SSE3-NEXT: psubb %xmm1, %xmm0
	; SSE3-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]			; SSE3-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
	; SSE3-NEXT: movdqa %xmm0, %xmm2			; SSE3-NEXT: movdqa %xmm0, %xmm2
	; SSE3-NEXT: pand %xmm1, %xmm2			; SSE3-NEXT: pand %xmm1, %xmm2
	; SSE3-NEXT: psrlw $2, %xmm0			; SSE3-NEXT: psrlw $2, %xmm0
	; SSE3-NEXT: pand %xmm1, %xmm0			; SSE3-NEXT: pand %xmm1, %xmm0
	; SSE3-NEXT: paddb %xmm2, %xmm0			; SSE3-NEXT: paddb %xmm2, %xmm0
	; SSE3-NEXT: movdqa %xmm0, %xmm1			; SSE3-NEXT: movdqa %xmm0, %xmm1
	; SSE3-NEXT: psrlw $4, %xmm1			; SSE3-NEXT: psrlw $4, %xmm1
	; SSE3-NEXT: paddb %xmm0, %xmm1			; SSE3-NEXT: paddb %xmm1, %xmm0
	; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE3-NEXT: movdqa %xmm1, %xmm0
	; SSE3-NEXT: retq			; SSE3-NEXT: retq
	;			;
	; SSSE3-LABEL: testv16i8:			; SSSE3-LABEL: testv16i8:
	; SSSE3: # %bb.0:			; SSSE3: # %bb.0:
	; SSSE3-NEXT: pcmpeqd %xmm1, %xmm1			; SSSE3-NEXT: pcmpeqd %xmm1, %xmm1
	; SSSE3-NEXT: paddb %xmm0, %xmm1			; SSSE3-NEXT: paddb %xmm0, %xmm1
	; SSSE3-NEXT: pandn %xmm1, %xmm0			; SSSE3-NEXT: pandn %xmm1, %xmm0
	; SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]			; SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	▲ Show 20 Lines • Show All 116 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]			; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
	; SSE2-NEXT: movdqa %xmm0, %xmm2			; SSE2-NEXT: movdqa %xmm0, %xmm2
	; SSE2-NEXT: pand %xmm1, %xmm2			; SSE2-NEXT: pand %xmm1, %xmm2
	; SSE2-NEXT: psrlw $2, %xmm0			; SSE2-NEXT: psrlw $2, %xmm0
	; SSE2-NEXT: pand %xmm1, %xmm0			; SSE2-NEXT: pand %xmm1, %xmm0
	; SSE2-NEXT: paddb %xmm2, %xmm0			; SSE2-NEXT: paddb %xmm2, %xmm0
	; SSE2-NEXT: movdqa %xmm0, %xmm1			; SSE2-NEXT: movdqa %xmm0, %xmm1
	; SSE2-NEXT: psrlw $4, %xmm1			; SSE2-NEXT: psrlw $4, %xmm1
	; SSE2-NEXT: paddb %xmm0, %xmm1			; SSE2-NEXT: paddb %xmm1, %xmm0
	; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE2-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE2-NEXT: movdqa %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE3-LABEL: testv16i8u:			; SSE3-LABEL: testv16i8u:
	; SSE3: # %bb.0:			; SSE3: # %bb.0:
	; SSE3-NEXT: pcmpeqd %xmm1, %xmm1			; SSE3-NEXT: pcmpeqd %xmm1, %xmm1
	; SSE3-NEXT: paddb %xmm0, %xmm1			; SSE3-NEXT: paddb %xmm0, %xmm1
	; SSE3-NEXT: pandn %xmm1, %xmm0			; SSE3-NEXT: pandn %xmm1, %xmm0
	; SSE3-NEXT: movdqa %xmm0, %xmm1			; SSE3-NEXT: movdqa %xmm0, %xmm1
	; SSE3-NEXT: psrlw $1, %xmm1			; SSE3-NEXT: psrlw $1, %xmm1
	; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
	; SSE3-NEXT: psubb %xmm1, %xmm0			; SSE3-NEXT: psubb %xmm1, %xmm0
	; SSE3-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]			; SSE3-NEXT: movdqa {{.*#+}} xmm1 = [51,51,51,51,51,51,51,51,51,51,51,51,51,51,51,51]
	; SSE3-NEXT: movdqa %xmm0, %xmm2			; SSE3-NEXT: movdqa %xmm0, %xmm2
	; SSE3-NEXT: pand %xmm1, %xmm2			; SSE3-NEXT: pand %xmm1, %xmm2
	; SSE3-NEXT: psrlw $2, %xmm0			; SSE3-NEXT: psrlw $2, %xmm0
	; SSE3-NEXT: pand %xmm1, %xmm0			; SSE3-NEXT: pand %xmm1, %xmm0
	; SSE3-NEXT: paddb %xmm2, %xmm0			; SSE3-NEXT: paddb %xmm2, %xmm0
	; SSE3-NEXT: movdqa %xmm0, %xmm1			; SSE3-NEXT: movdqa %xmm0, %xmm1
	; SSE3-NEXT: psrlw $4, %xmm1			; SSE3-NEXT: psrlw $4, %xmm1
	; SSE3-NEXT: paddb %xmm0, %xmm1			; SSE3-NEXT: paddb %xmm1, %xmm0
	; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1			; SSE3-NEXT: pand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
	; SSE3-NEXT: movdqa %xmm1, %xmm0
	; SSE3-NEXT: retq			; SSE3-NEXT: retq
	;			;
	; SSSE3-LABEL: testv16i8u:			; SSSE3-LABEL: testv16i8u:
	; SSSE3: # %bb.0:			; SSSE3: # %bb.0:
	; SSSE3-NEXT: pcmpeqd %xmm1, %xmm1			; SSSE3-NEXT: pcmpeqd %xmm1, %xmm1
	; SSSE3-NEXT: paddb %xmm0, %xmm1			; SSSE3-NEXT: paddb %xmm0, %xmm1
	; SSSE3-NEXT: pandn %xmm1, %xmm0			; SSSE3-NEXT: pandn %xmm1, %xmm0
	; SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]			; SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	▲ Show 20 Lines • Show All 422 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-unsigned-cmp.ll

	Show First 20 Lines • Show All 396 Lines • ▼ Show 20 Lines

	define <16 x i1> @uge_v16i8(<16 x i8> %x, <16 x i8> %y) {			define <16 x i1> @uge_v16i8(<16 x i8> %x, <16 x i8> %y) {
	; SSE-LABEL: uge_v16i8:			; SSE-LABEL: uge_v16i8:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: psrlw $1, %xmm0			; SSE-NEXT: psrlw $1, %xmm0
	; SSE-NEXT: movdqa {{.*#+}} xmm2 = [127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127]			; SSE-NEXT: movdqa {{.*#+}} xmm2 = [127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127]
	; SSE-NEXT: pand %xmm2, %xmm0			; SSE-NEXT: pand %xmm2, %xmm0
	; SSE-NEXT: psrlw $1, %xmm1			; SSE-NEXT: psrlw $1, %xmm1
	; SSE-NEXT: pand %xmm2, %xmm1			; SSE-NEXT: pand %xmm1, %xmm2
	; SSE-NEXT: pmaxub %xmm0, %xmm1			; SSE-NEXT: pmaxub %xmm0, %xmm2
	; SSE-NEXT: pcmpeqb %xmm1, %xmm0			; SSE-NEXT: pcmpeqb %xmm2, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: uge_v16i8:			; AVX-LABEL: uge_v16i8:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpsrlw $1, %xmm0, %xmm0			; AVX-NEXT: vpsrlw $1, %xmm0, %xmm0
	; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127]			; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127]
	; AVX-NEXT: vpand %xmm2, %xmm0, %xmm0			; AVX-NEXT: vpand %xmm2, %xmm0, %xmm0
	; AVX-NEXT: vpsrlw $1, %xmm1, %xmm1			; AVX-NEXT: vpsrlw $1, %xmm1, %xmm1
	Show All 9 Lines

	define <16 x i1> @ule_v16i8(<16 x i8> %x, <16 x i8> %y) {			define <16 x i1> @ule_v16i8(<16 x i8> %x, <16 x i8> %y) {
	; SSE-LABEL: ule_v16i8:			; SSE-LABEL: ule_v16i8:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: psrlw $1, %xmm0			; SSE-NEXT: psrlw $1, %xmm0
	; SSE-NEXT: movdqa {{.*#+}} xmm2 = [127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127]			; SSE-NEXT: movdqa {{.*#+}} xmm2 = [127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127]
	; SSE-NEXT: pand %xmm2, %xmm0			; SSE-NEXT: pand %xmm2, %xmm0
	; SSE-NEXT: psrlw $1, %xmm1			; SSE-NEXT: psrlw $1, %xmm1
	; SSE-NEXT: pand %xmm2, %xmm1			; SSE-NEXT: pand %xmm1, %xmm2
	; SSE-NEXT: pminub %xmm0, %xmm1			; SSE-NEXT: pminub %xmm0, %xmm2
	; SSE-NEXT: pcmpeqb %xmm1, %xmm0			; SSE-NEXT: pcmpeqb %xmm2, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: ule_v16i8:			; AVX-LABEL: ule_v16i8:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpsrlw $1, %xmm0, %xmm0			; AVX-NEXT: vpsrlw $1, %xmm0, %xmm0
	; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127]			; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127]
	; AVX-NEXT: vpand %xmm2, %xmm0, %xmm0			; AVX-NEXT: vpand %xmm2, %xmm0, %xmm0
	; AVX-NEXT: vpsrlw $1, %xmm1, %xmm1			; AVX-NEXT: vpsrlw $1, %xmm1, %xmm1
	▲ Show 20 Lines • Show All 93 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vselect-minmax.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 57 Lines • ▼ Show 20 Lines

define <16 x i8> @test3(<16 x i8> %a, <16 x i8> %b) {		define <16 x i8> @test3(<16 x i8> %a, <16 x i8> %b) {
; SSE2-LABEL: test3:		; SSE2-LABEL: test3:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm2		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pcmpgtb %xmm1, %xmm2		; SSE2-NEXT: pcmpgtb %xmm1, %xmm2
; SSE2-NEXT: pand %xmm2, %xmm0		; SSE2-NEXT: pand %xmm2, %xmm0
; SSE2-NEXT: pandn %xmm1, %xmm2		; SSE2-NEXT: pandn %xmm1, %xmm2
; SSE2-NEXT: por %xmm0, %xmm2		; SSE2-NEXT: por %xmm2, %xmm0
; SSE2-NEXT: movdqa %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test3:		; SSE4-LABEL: test3:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsb %xmm1, %xmm0		; SSE4-NEXT: pmaxsb %xmm1, %xmm0
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
; AVX-LABEL: test3:		; AVX-LABEL: test3:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vpmaxsb %xmm1, %xmm0, %xmm0		; AVX-NEXT: vpmaxsb %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
entry:		entry:
%cmp = icmp sgt <16 x i8> %a, %b		%cmp = icmp sgt <16 x i8> %a, %b
%sel = select <16 x i1> %cmp, <16 x i8> %a, <16 x i8> %b		%sel = select <16 x i1> %cmp, <16 x i8> %a, <16 x i8> %b
ret <16 x i8> %sel		ret <16 x i8> %sel
}		}

define <16 x i8> @test4(<16 x i8> %a, <16 x i8> %b) {		define <16 x i8> @test4(<16 x i8> %a, <16 x i8> %b) {
; SSE2-LABEL: test4:		; SSE2-LABEL: test4:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm2		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pcmpgtb %xmm1, %xmm2		; SSE2-NEXT: pcmpgtb %xmm1, %xmm2
; SSE2-NEXT: pand %xmm2, %xmm0		; SSE2-NEXT: pand %xmm2, %xmm0
; SSE2-NEXT: pandn %xmm1, %xmm2		; SSE2-NEXT: pandn %xmm1, %xmm2
; SSE2-NEXT: por %xmm0, %xmm2		; SSE2-NEXT: por %xmm2, %xmm0
; SSE2-NEXT: movdqa %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test4:		; SSE4-LABEL: test4:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsb %xmm1, %xmm0		; SSE4-NEXT: pmaxsb %xmm1, %xmm0
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
; AVX-LABEL: test4:		; AVX-LABEL: test4:
▲ Show 20 Lines • Show All 276 Lines • ▼ Show 20 Lines

define <4 x i32> @test19(<4 x i32> %a, <4 x i32> %b) {		define <4 x i32> @test19(<4 x i32> %a, <4 x i32> %b) {
; SSE2-LABEL: test19:		; SSE2-LABEL: test19:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm2		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pcmpgtd %xmm1, %xmm2		; SSE2-NEXT: pcmpgtd %xmm1, %xmm2
; SSE2-NEXT: pand %xmm2, %xmm0		; SSE2-NEXT: pand %xmm2, %xmm0
; SSE2-NEXT: pandn %xmm1, %xmm2		; SSE2-NEXT: pandn %xmm1, %xmm2
; SSE2-NEXT: por %xmm0, %xmm2		; SSE2-NEXT: por %xmm2, %xmm0
; SSE2-NEXT: movdqa %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test19:		; SSE4-LABEL: test19:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsd %xmm1, %xmm0		; SSE4-NEXT: pmaxsd %xmm1, %xmm0
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
; AVX-LABEL: test19:		; AVX-LABEL: test19:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vpmaxsd %xmm1, %xmm0, %xmm0		; AVX-NEXT: vpmaxsd %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
entry:		entry:
%cmp = icmp sgt <4 x i32> %a, %b		%cmp = icmp sgt <4 x i32> %a, %b
%sel = select <4 x i1> %cmp, <4 x i32> %a, <4 x i32> %b		%sel = select <4 x i1> %cmp, <4 x i32> %a, <4 x i32> %b
ret <4 x i32> %sel		ret <4 x i32> %sel
}		}

define <4 x i32> @test20(<4 x i32> %a, <4 x i32> %b) {		define <4 x i32> @test20(<4 x i32> %a, <4 x i32> %b) {
; SSE2-LABEL: test20:		; SSE2-LABEL: test20:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm2		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pcmpgtd %xmm1, %xmm2		; SSE2-NEXT: pcmpgtd %xmm1, %xmm2
; SSE2-NEXT: pand %xmm2, %xmm0		; SSE2-NEXT: pand %xmm2, %xmm0
; SSE2-NEXT: pandn %xmm1, %xmm2		; SSE2-NEXT: pandn %xmm1, %xmm2
; SSE2-NEXT: por %xmm0, %xmm2		; SSE2-NEXT: por %xmm2, %xmm0
; SSE2-NEXT: movdqa %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test20:		; SSE4-LABEL: test20:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsd %xmm1, %xmm0		; SSE4-NEXT: pmaxsd %xmm1, %xmm0
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
; AVX-LABEL: test20:		; AVX-LABEL: test20:
▲ Show 20 Lines • Show All 210 Lines • ▼ Show 20 Lines

define <32 x i8> @test27(<32 x i8> %a, <32 x i8> %b) {		define <32 x i8> @test27(<32 x i8> %a, <32 x i8> %b) {
; SSE2-LABEL: test27:		; SSE2-LABEL: test27:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm4		; SSE2-NEXT: movdqa %xmm0, %xmm4
; SSE2-NEXT: pcmpgtb %xmm2, %xmm4		; SSE2-NEXT: pcmpgtb %xmm2, %xmm4
; SSE2-NEXT: pand %xmm4, %xmm0		; SSE2-NEXT: pand %xmm4, %xmm0
; SSE2-NEXT: pandn %xmm2, %xmm4		; SSE2-NEXT: pandn %xmm2, %xmm4
; SSE2-NEXT: por %xmm0, %xmm4		; SSE2-NEXT: por %xmm4, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm2		; SSE2-NEXT: movdqa %xmm1, %xmm2
; SSE2-NEXT: pcmpgtb %xmm3, %xmm2		; SSE2-NEXT: pcmpgtb %xmm3, %xmm2
; SSE2-NEXT: pand %xmm2, %xmm1		; SSE2-NEXT: pand %xmm2, %xmm1
; SSE2-NEXT: pandn %xmm3, %xmm2		; SSE2-NEXT: pandn %xmm3, %xmm2
; SSE2-NEXT: por %xmm1, %xmm2		; SSE2-NEXT: por %xmm2, %xmm1
; SSE2-NEXT: movdqa %xmm4, %xmm0
; SSE2-NEXT: movdqa %xmm2, %xmm1
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test27:		; SSE4-LABEL: test27:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsb %xmm2, %xmm0		; SSE4-NEXT: pmaxsb %xmm2, %xmm0
; SSE4-NEXT: pmaxsb %xmm3, %xmm1		; SSE4-NEXT: pmaxsb %xmm3, %xmm1
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
Show All 23 Lines

define <32 x i8> @test28(<32 x i8> %a, <32 x i8> %b) {		define <32 x i8> @test28(<32 x i8> %a, <32 x i8> %b) {
; SSE2-LABEL: test28:		; SSE2-LABEL: test28:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm4		; SSE2-NEXT: movdqa %xmm0, %xmm4
; SSE2-NEXT: pcmpgtb %xmm2, %xmm4		; SSE2-NEXT: pcmpgtb %xmm2, %xmm4
; SSE2-NEXT: pand %xmm4, %xmm0		; SSE2-NEXT: pand %xmm4, %xmm0
; SSE2-NEXT: pandn %xmm2, %xmm4		; SSE2-NEXT: pandn %xmm2, %xmm4
; SSE2-NEXT: por %xmm0, %xmm4		; SSE2-NEXT: por %xmm4, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm2		; SSE2-NEXT: movdqa %xmm1, %xmm2
; SSE2-NEXT: pcmpgtb %xmm3, %xmm2		; SSE2-NEXT: pcmpgtb %xmm3, %xmm2
; SSE2-NEXT: pand %xmm2, %xmm1		; SSE2-NEXT: pand %xmm2, %xmm1
; SSE2-NEXT: pandn %xmm3, %xmm2		; SSE2-NEXT: pandn %xmm3, %xmm2
; SSE2-NEXT: por %xmm1, %xmm2		; SSE2-NEXT: por %xmm2, %xmm1
; SSE2-NEXT: movdqa %xmm4, %xmm0
; SSE2-NEXT: movdqa %xmm2, %xmm1
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test28:		; SSE4-LABEL: test28:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsb %xmm2, %xmm0		; SSE4-NEXT: pmaxsb %xmm2, %xmm0
; SSE4-NEXT: pmaxsb %xmm3, %xmm1		; SSE4-NEXT: pmaxsb %xmm3, %xmm1
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
▲ Show 20 Lines • Show All 521 Lines • ▼ Show 20 Lines

define <8 x i32> @test43(<8 x i32> %a, <8 x i32> %b) {		define <8 x i32> @test43(<8 x i32> %a, <8 x i32> %b) {
; SSE2-LABEL: test43:		; SSE2-LABEL: test43:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm4		; SSE2-NEXT: movdqa %xmm0, %xmm4
; SSE2-NEXT: pcmpgtd %xmm2, %xmm4		; SSE2-NEXT: pcmpgtd %xmm2, %xmm4
; SSE2-NEXT: pand %xmm4, %xmm0		; SSE2-NEXT: pand %xmm4, %xmm0
; SSE2-NEXT: pandn %xmm2, %xmm4		; SSE2-NEXT: pandn %xmm2, %xmm4
; SSE2-NEXT: por %xmm0, %xmm4		; SSE2-NEXT: por %xmm4, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm2		; SSE2-NEXT: movdqa %xmm1, %xmm2
; SSE2-NEXT: pcmpgtd %xmm3, %xmm2		; SSE2-NEXT: pcmpgtd %xmm3, %xmm2
; SSE2-NEXT: pand %xmm2, %xmm1		; SSE2-NEXT: pand %xmm2, %xmm1
; SSE2-NEXT: pandn %xmm3, %xmm2		; SSE2-NEXT: pandn %xmm3, %xmm2
; SSE2-NEXT: por %xmm1, %xmm2		; SSE2-NEXT: por %xmm2, %xmm1
; SSE2-NEXT: movdqa %xmm4, %xmm0
; SSE2-NEXT: movdqa %xmm2, %xmm1
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test43:		; SSE4-LABEL: test43:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsd %xmm2, %xmm0		; SSE4-NEXT: pmaxsd %xmm2, %xmm0
; SSE4-NEXT: pmaxsd %xmm3, %xmm1		; SSE4-NEXT: pmaxsd %xmm3, %xmm1
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
Show All 23 Lines

define <8 x i32> @test44(<8 x i32> %a, <8 x i32> %b) {		define <8 x i32> @test44(<8 x i32> %a, <8 x i32> %b) {
; SSE2-LABEL: test44:		; SSE2-LABEL: test44:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm4		; SSE2-NEXT: movdqa %xmm0, %xmm4
; SSE2-NEXT: pcmpgtd %xmm2, %xmm4		; SSE2-NEXT: pcmpgtd %xmm2, %xmm4
; SSE2-NEXT: pand %xmm4, %xmm0		; SSE2-NEXT: pand %xmm4, %xmm0
; SSE2-NEXT: pandn %xmm2, %xmm4		; SSE2-NEXT: pandn %xmm2, %xmm4
; SSE2-NEXT: por %xmm0, %xmm4		; SSE2-NEXT: por %xmm4, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm2		; SSE2-NEXT: movdqa %xmm1, %xmm2
; SSE2-NEXT: pcmpgtd %xmm3, %xmm2		; SSE2-NEXT: pcmpgtd %xmm3, %xmm2
; SSE2-NEXT: pand %xmm2, %xmm1		; SSE2-NEXT: pand %xmm2, %xmm1
; SSE2-NEXT: pandn %xmm3, %xmm2		; SSE2-NEXT: pandn %xmm3, %xmm2
; SSE2-NEXT: por %xmm1, %xmm2		; SSE2-NEXT: por %xmm2, %xmm1
; SSE2-NEXT: movdqa %xmm4, %xmm0
; SSE2-NEXT: movdqa %xmm2, %xmm1
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test44:		; SSE4-LABEL: test44:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsd %xmm2, %xmm0		; SSE4-NEXT: pmaxsd %xmm2, %xmm0
; SSE4-NEXT: pmaxsd %xmm3, %xmm1		; SSE4-NEXT: pmaxsd %xmm3, %xmm1
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
▲ Show 20 Lines • Show All 121 Lines • ▼ Show 20 Lines	entry:
%cmp = icmp ule <8 x i32> %a, %b		%cmp = icmp ule <8 x i32> %a, %b
%sel = select <8 x i1> %cmp, <8 x i32> %a, <8 x i32> %b		%sel = select <8 x i1> %cmp, <8 x i32> %a, <8 x i32> %b
ret <8 x i32> %sel		ret <8 x i32> %sel
}		}

define <8 x i32> @test47(<8 x i32> %a, <8 x i32> %b) {		define <8 x i32> @test47(<8 x i32> %a, <8 x i32> %b) {
; SSE2-LABEL: test47:		; SSE2-LABEL: test47:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648,2147483648,2147483648]		; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [2147483648,2147483648,2147483648,2147483648]
; SSE2-NEXT: movdqa %xmm2, %xmm6		; SSE2-NEXT: movdqa %xmm2, %xmm5
; SSE2-NEXT: pxor %xmm5, %xmm6		; SSE2-NEXT: pxor %xmm4, %xmm5
; SSE2-NEXT: movdqa %xmm0, %xmm4		; SSE2-NEXT: movdqa %xmm0, %xmm6
; SSE2-NEXT: pxor %xmm5, %xmm4		; SSE2-NEXT: pxor %xmm4, %xmm6
; SSE2-NEXT: pcmpgtd %xmm6, %xmm4		; SSE2-NEXT: pcmpgtd %xmm5, %xmm6
; SSE2-NEXT: pand %xmm4, %xmm0		; SSE2-NEXT: pand %xmm6, %xmm0
; SSE2-NEXT: pandn %xmm2, %xmm4		; SSE2-NEXT: pandn %xmm2, %xmm6
; SSE2-NEXT: por %xmm0, %xmm4		; SSE2-NEXT: por %xmm6, %xmm0
; SSE2-NEXT: movdqa %xmm3, %xmm0		; SSE2-NEXT: movdqa %xmm3, %xmm2
; SSE2-NEXT: pxor %xmm5, %xmm0		; SSE2-NEXT: pxor %xmm4, %xmm2
; SSE2-NEXT: pxor %xmm1, %xmm5		; SSE2-NEXT: pxor %xmm1, %xmm4
; SSE2-NEXT: pcmpgtd %xmm0, %xmm5		; SSE2-NEXT: pcmpgtd %xmm2, %xmm4
; SSE2-NEXT: pand %xmm5, %xmm1		; SSE2-NEXT: pand %xmm4, %xmm1
; SSE2-NEXT: pandn %xmm3, %xmm5		; SSE2-NEXT: pandn %xmm3, %xmm4
; SSE2-NEXT: por %xmm5, %xmm1		; SSE2-NEXT: por %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm4, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test47:		; SSE4-LABEL: test47:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxud %xmm2, %xmm0		; SSE4-NEXT: pmaxud %xmm2, %xmm0
; SSE4-NEXT: pmaxud %xmm3, %xmm1		; SSE4-NEXT: pmaxud %xmm3, %xmm1
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
Show All 19 Lines	entry:
%cmp = icmp ugt <8 x i32> %a, %b		%cmp = icmp ugt <8 x i32> %a, %b
%sel = select <8 x i1> %cmp, <8 x i32> %a, <8 x i32> %b		%sel = select <8 x i1> %cmp, <8 x i32> %a, <8 x i32> %b
ret <8 x i32> %sel		ret <8 x i32> %sel
}		}

define <8 x i32> @test48(<8 x i32> %a, <8 x i32> %b) {		define <8 x i32> @test48(<8 x i32> %a, <8 x i32> %b) {
; SSE2-LABEL: test48:		; SSE2-LABEL: test48:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648,2147483648,2147483648]		; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [2147483648,2147483648,2147483648,2147483648]
; SSE2-NEXT: movdqa %xmm2, %xmm6		; SSE2-NEXT: movdqa %xmm2, %xmm5
; SSE2-NEXT: pxor %xmm5, %xmm6		; SSE2-NEXT: pxor %xmm4, %xmm5
; SSE2-NEXT: movdqa %xmm0, %xmm4		; SSE2-NEXT: movdqa %xmm0, %xmm6
; SSE2-NEXT: pxor %xmm5, %xmm4		; SSE2-NEXT: pxor %xmm4, %xmm6
; SSE2-NEXT: pcmpgtd %xmm6, %xmm4		; SSE2-NEXT: pcmpgtd %xmm5, %xmm6
; SSE2-NEXT: pand %xmm4, %xmm0		; SSE2-NEXT: pand %xmm6, %xmm0
; SSE2-NEXT: pandn %xmm2, %xmm4		; SSE2-NEXT: pandn %xmm2, %xmm6
; SSE2-NEXT: por %xmm0, %xmm4		; SSE2-NEXT: por %xmm6, %xmm0
; SSE2-NEXT: movdqa %xmm3, %xmm0		; SSE2-NEXT: movdqa %xmm3, %xmm2
; SSE2-NEXT: pxor %xmm5, %xmm0		; SSE2-NEXT: pxor %xmm4, %xmm2
; SSE2-NEXT: pxor %xmm1, %xmm5		; SSE2-NEXT: pxor %xmm1, %xmm4
; SSE2-NEXT: pcmpgtd %xmm0, %xmm5		; SSE2-NEXT: pcmpgtd %xmm2, %xmm4
; SSE2-NEXT: pand %xmm5, %xmm1		; SSE2-NEXT: pand %xmm4, %xmm1
; SSE2-NEXT: pandn %xmm3, %xmm5		; SSE2-NEXT: pandn %xmm3, %xmm4
; SSE2-NEXT: por %xmm5, %xmm1		; SSE2-NEXT: por %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm4, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test48:		; SSE4-LABEL: test48:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxud %xmm2, %xmm0		; SSE4-NEXT: pmaxud %xmm2, %xmm0
; SSE4-NEXT: pmaxud %xmm3, %xmm1		; SSE4-NEXT: pmaxud %xmm3, %xmm1
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
Show All 23 Lines

define <16 x i8> @test49(<16 x i8> %a, <16 x i8> %b) {		define <16 x i8> @test49(<16 x i8> %a, <16 x i8> %b) {
; SSE2-LABEL: test49:		; SSE2-LABEL: test49:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm2		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pcmpgtb %xmm1, %xmm2		; SSE2-NEXT: pcmpgtb %xmm1, %xmm2
; SSE2-NEXT: pand %xmm2, %xmm0		; SSE2-NEXT: pand %xmm2, %xmm0
; SSE2-NEXT: pandn %xmm1, %xmm2		; SSE2-NEXT: pandn %xmm1, %xmm2
; SSE2-NEXT: por %xmm0, %xmm2		; SSE2-NEXT: por %xmm2, %xmm0
; SSE2-NEXT: movdqa %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test49:		; SSE4-LABEL: test49:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsb %xmm1, %xmm0		; SSE4-NEXT: pmaxsb %xmm1, %xmm0
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
; AVX-LABEL: test49:		; AVX-LABEL: test49:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vpmaxsb %xmm1, %xmm0, %xmm0		; AVX-NEXT: vpmaxsb %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
entry:		entry:
%cmp = icmp slt <16 x i8> %a, %b		%cmp = icmp slt <16 x i8> %a, %b
%sel = select <16 x i1> %cmp, <16 x i8> %b, <16 x i8> %a		%sel = select <16 x i1> %cmp, <16 x i8> %b, <16 x i8> %a
ret <16 x i8> %sel		ret <16 x i8> %sel
}		}

define <16 x i8> @test50(<16 x i8> %a, <16 x i8> %b) {		define <16 x i8> @test50(<16 x i8> %a, <16 x i8> %b) {
; SSE2-LABEL: test50:		; SSE2-LABEL: test50:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm2		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pcmpgtb %xmm1, %xmm2		; SSE2-NEXT: pcmpgtb %xmm1, %xmm2
; SSE2-NEXT: pand %xmm2, %xmm0		; SSE2-NEXT: pand %xmm2, %xmm0
; SSE2-NEXT: pandn %xmm1, %xmm2		; SSE2-NEXT: pandn %xmm1, %xmm2
; SSE2-NEXT: por %xmm0, %xmm2		; SSE2-NEXT: por %xmm2, %xmm0
; SSE2-NEXT: movdqa %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test50:		; SSE4-LABEL: test50:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsb %xmm1, %xmm0		; SSE4-NEXT: pmaxsb %xmm1, %xmm0
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
; AVX-LABEL: test50:		; AVX-LABEL: test50:
▲ Show 20 Lines • Show All 276 Lines • ▼ Show 20 Lines

define <4 x i32> @test65(<4 x i32> %a, <4 x i32> %b) {		define <4 x i32> @test65(<4 x i32> %a, <4 x i32> %b) {
; SSE2-LABEL: test65:		; SSE2-LABEL: test65:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm2		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pcmpgtd %xmm1, %xmm2		; SSE2-NEXT: pcmpgtd %xmm1, %xmm2
; SSE2-NEXT: pand %xmm2, %xmm0		; SSE2-NEXT: pand %xmm2, %xmm0
; SSE2-NEXT: pandn %xmm1, %xmm2		; SSE2-NEXT: pandn %xmm1, %xmm2
; SSE2-NEXT: por %xmm0, %xmm2		; SSE2-NEXT: por %xmm2, %xmm0
; SSE2-NEXT: movdqa %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test65:		; SSE4-LABEL: test65:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsd %xmm1, %xmm0		; SSE4-NEXT: pmaxsd %xmm1, %xmm0
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
; AVX-LABEL: test65:		; AVX-LABEL: test65:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vpmaxsd %xmm1, %xmm0, %xmm0		; AVX-NEXT: vpmaxsd %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
entry:		entry:
%cmp = icmp slt <4 x i32> %a, %b		%cmp = icmp slt <4 x i32> %a, %b
%sel = select <4 x i1> %cmp, <4 x i32> %b, <4 x i32> %a		%sel = select <4 x i1> %cmp, <4 x i32> %b, <4 x i32> %a
ret <4 x i32> %sel		ret <4 x i32> %sel
}		}

define <4 x i32> @test66(<4 x i32> %a, <4 x i32> %b) {		define <4 x i32> @test66(<4 x i32> %a, <4 x i32> %b) {
; SSE2-LABEL: test66:		; SSE2-LABEL: test66:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm2		; SSE2-NEXT: movdqa %xmm0, %xmm2
; SSE2-NEXT: pcmpgtd %xmm1, %xmm2		; SSE2-NEXT: pcmpgtd %xmm1, %xmm2
; SSE2-NEXT: pand %xmm2, %xmm0		; SSE2-NEXT: pand %xmm2, %xmm0
; SSE2-NEXT: pandn %xmm1, %xmm2		; SSE2-NEXT: pandn %xmm1, %xmm2
; SSE2-NEXT: por %xmm0, %xmm2		; SSE2-NEXT: por %xmm2, %xmm0
; SSE2-NEXT: movdqa %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test66:		; SSE4-LABEL: test66:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsd %xmm1, %xmm0		; SSE4-NEXT: pmaxsd %xmm1, %xmm0
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
; AVX-LABEL: test66:		; AVX-LABEL: test66:
▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines

define <32 x i8> @test73(<32 x i8> %a, <32 x i8> %b) {		define <32 x i8> @test73(<32 x i8> %a, <32 x i8> %b) {
; SSE2-LABEL: test73:		; SSE2-LABEL: test73:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm4		; SSE2-NEXT: movdqa %xmm0, %xmm4
; SSE2-NEXT: pcmpgtb %xmm2, %xmm4		; SSE2-NEXT: pcmpgtb %xmm2, %xmm4
; SSE2-NEXT: pand %xmm4, %xmm0		; SSE2-NEXT: pand %xmm4, %xmm0
; SSE2-NEXT: pandn %xmm2, %xmm4		; SSE2-NEXT: pandn %xmm2, %xmm4
; SSE2-NEXT: por %xmm0, %xmm4		; SSE2-NEXT: por %xmm4, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm2		; SSE2-NEXT: movdqa %xmm1, %xmm2
; SSE2-NEXT: pcmpgtb %xmm3, %xmm2		; SSE2-NEXT: pcmpgtb %xmm3, %xmm2
; SSE2-NEXT: pand %xmm2, %xmm1		; SSE2-NEXT: pand %xmm2, %xmm1
; SSE2-NEXT: pandn %xmm3, %xmm2		; SSE2-NEXT: pandn %xmm3, %xmm2
; SSE2-NEXT: por %xmm1, %xmm2		; SSE2-NEXT: por %xmm2, %xmm1
; SSE2-NEXT: movdqa %xmm4, %xmm0
; SSE2-NEXT: movdqa %xmm2, %xmm1
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test73:		; SSE4-LABEL: test73:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsb %xmm2, %xmm0		; SSE4-NEXT: pmaxsb %xmm2, %xmm0
; SSE4-NEXT: pmaxsb %xmm3, %xmm1		; SSE4-NEXT: pmaxsb %xmm3, %xmm1
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
Show All 23 Lines

define <32 x i8> @test74(<32 x i8> %a, <32 x i8> %b) {		define <32 x i8> @test74(<32 x i8> %a, <32 x i8> %b) {
; SSE2-LABEL: test74:		; SSE2-LABEL: test74:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm4		; SSE2-NEXT: movdqa %xmm0, %xmm4
; SSE2-NEXT: pcmpgtb %xmm2, %xmm4		; SSE2-NEXT: pcmpgtb %xmm2, %xmm4
; SSE2-NEXT: pand %xmm4, %xmm0		; SSE2-NEXT: pand %xmm4, %xmm0
; SSE2-NEXT: pandn %xmm2, %xmm4		; SSE2-NEXT: pandn %xmm2, %xmm4
; SSE2-NEXT: por %xmm0, %xmm4		; SSE2-NEXT: por %xmm4, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm2		; SSE2-NEXT: movdqa %xmm1, %xmm2
; SSE2-NEXT: pcmpgtb %xmm3, %xmm2		; SSE2-NEXT: pcmpgtb %xmm3, %xmm2
; SSE2-NEXT: pand %xmm2, %xmm1		; SSE2-NEXT: pand %xmm2, %xmm1
; SSE2-NEXT: pandn %xmm3, %xmm2		; SSE2-NEXT: pandn %xmm3, %xmm2
; SSE2-NEXT: por %xmm1, %xmm2		; SSE2-NEXT: por %xmm2, %xmm1
; SSE2-NEXT: movdqa %xmm4, %xmm0
; SSE2-NEXT: movdqa %xmm2, %xmm1
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test74:		; SSE4-LABEL: test74:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsb %xmm2, %xmm0		; SSE4-NEXT: pmaxsb %xmm2, %xmm0
; SSE4-NEXT: pmaxsb %xmm3, %xmm1		; SSE4-NEXT: pmaxsb %xmm3, %xmm1
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
▲ Show 20 Lines • Show All 521 Lines • ▼ Show 20 Lines

define <8 x i32> @test89(<8 x i32> %a, <8 x i32> %b) {		define <8 x i32> @test89(<8 x i32> %a, <8 x i32> %b) {
; SSE2-LABEL: test89:		; SSE2-LABEL: test89:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm4		; SSE2-NEXT: movdqa %xmm0, %xmm4
; SSE2-NEXT: pcmpgtd %xmm2, %xmm4		; SSE2-NEXT: pcmpgtd %xmm2, %xmm4
; SSE2-NEXT: pand %xmm4, %xmm0		; SSE2-NEXT: pand %xmm4, %xmm0
; SSE2-NEXT: pandn %xmm2, %xmm4		; SSE2-NEXT: pandn %xmm2, %xmm4
; SSE2-NEXT: por %xmm0, %xmm4		; SSE2-NEXT: por %xmm4, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm2		; SSE2-NEXT: movdqa %xmm1, %xmm2
; SSE2-NEXT: pcmpgtd %xmm3, %xmm2		; SSE2-NEXT: pcmpgtd %xmm3, %xmm2
; SSE2-NEXT: pand %xmm2, %xmm1		; SSE2-NEXT: pand %xmm2, %xmm1
; SSE2-NEXT: pandn %xmm3, %xmm2		; SSE2-NEXT: pandn %xmm3, %xmm2
; SSE2-NEXT: por %xmm1, %xmm2		; SSE2-NEXT: por %xmm2, %xmm1
; SSE2-NEXT: movdqa %xmm4, %xmm0
; SSE2-NEXT: movdqa %xmm2, %xmm1
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test89:		; SSE4-LABEL: test89:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsd %xmm2, %xmm0		; SSE4-NEXT: pmaxsd %xmm2, %xmm0
; SSE4-NEXT: pmaxsd %xmm3, %xmm1		; SSE4-NEXT: pmaxsd %xmm3, %xmm1
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
Show All 23 Lines

define <8 x i32> @test90(<8 x i32> %a, <8 x i32> %b) {		define <8 x i32> @test90(<8 x i32> %a, <8 x i32> %b) {
; SSE2-LABEL: test90:		; SSE2-LABEL: test90:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm4		; SSE2-NEXT: movdqa %xmm0, %xmm4
; SSE2-NEXT: pcmpgtd %xmm2, %xmm4		; SSE2-NEXT: pcmpgtd %xmm2, %xmm4
; SSE2-NEXT: pand %xmm4, %xmm0		; SSE2-NEXT: pand %xmm4, %xmm0
; SSE2-NEXT: pandn %xmm2, %xmm4		; SSE2-NEXT: pandn %xmm2, %xmm4
; SSE2-NEXT: por %xmm0, %xmm4		; SSE2-NEXT: por %xmm4, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm2		; SSE2-NEXT: movdqa %xmm1, %xmm2
; SSE2-NEXT: pcmpgtd %xmm3, %xmm2		; SSE2-NEXT: pcmpgtd %xmm3, %xmm2
; SSE2-NEXT: pand %xmm2, %xmm1		; SSE2-NEXT: pand %xmm2, %xmm1
; SSE2-NEXT: pandn %xmm3, %xmm2		; SSE2-NEXT: pandn %xmm3, %xmm2
; SSE2-NEXT: por %xmm1, %xmm2		; SSE2-NEXT: por %xmm2, %xmm1
; SSE2-NEXT: movdqa %xmm4, %xmm0
; SSE2-NEXT: movdqa %xmm2, %xmm1
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test90:		; SSE4-LABEL: test90:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsd %xmm2, %xmm0		; SSE4-NEXT: pmaxsd %xmm2, %xmm0
; SSE4-NEXT: pmaxsd %xmm3, %xmm1		; SSE4-NEXT: pmaxsd %xmm3, %xmm1
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
▲ Show 20 Lines • Show All 109 Lines • ▼ Show 20 Lines	entry:
%cmp = icmp sge <8 x i32> %a, %b		%cmp = icmp sge <8 x i32> %a, %b
%sel = select <8 x i1> %cmp, <8 x i32> %b, <8 x i32> %a		%sel = select <8 x i1> %cmp, <8 x i32> %b, <8 x i32> %a
ret <8 x i32> %sel		ret <8 x i32> %sel
}		}

define <8 x i32> @test93(<8 x i32> %a, <8 x i32> %b) {		define <8 x i32> @test93(<8 x i32> %a, <8 x i32> %b) {
; SSE2-LABEL: test93:		; SSE2-LABEL: test93:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648,2147483648,2147483648]		; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [2147483648,2147483648,2147483648,2147483648]
; SSE2-NEXT: movdqa %xmm2, %xmm6		; SSE2-NEXT: movdqa %xmm2, %xmm5
; SSE2-NEXT: pxor %xmm5, %xmm6		; SSE2-NEXT: pxor %xmm4, %xmm5
; SSE2-NEXT: movdqa %xmm0, %xmm4		; SSE2-NEXT: movdqa %xmm0, %xmm6
; SSE2-NEXT: pxor %xmm5, %xmm4		; SSE2-NEXT: pxor %xmm4, %xmm6
; SSE2-NEXT: pcmpgtd %xmm6, %xmm4		; SSE2-NEXT: pcmpgtd %xmm5, %xmm6
; SSE2-NEXT: pand %xmm4, %xmm0		; SSE2-NEXT: pand %xmm6, %xmm0
; SSE2-NEXT: pandn %xmm2, %xmm4		; SSE2-NEXT: pandn %xmm2, %xmm6
; SSE2-NEXT: por %xmm0, %xmm4		; SSE2-NEXT: por %xmm6, %xmm0
; SSE2-NEXT: movdqa %xmm3, %xmm0		; SSE2-NEXT: movdqa %xmm3, %xmm2
; SSE2-NEXT: pxor %xmm5, %xmm0		; SSE2-NEXT: pxor %xmm4, %xmm2
; SSE2-NEXT: pxor %xmm1, %xmm5		; SSE2-NEXT: pxor %xmm1, %xmm4
; SSE2-NEXT: pcmpgtd %xmm0, %xmm5		; SSE2-NEXT: pcmpgtd %xmm2, %xmm4
; SSE2-NEXT: pand %xmm5, %xmm1		; SSE2-NEXT: pand %xmm4, %xmm1
; SSE2-NEXT: pandn %xmm3, %xmm5		; SSE2-NEXT: pandn %xmm3, %xmm4
; SSE2-NEXT: por %xmm5, %xmm1		; SSE2-NEXT: por %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm4, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test93:		; SSE4-LABEL: test93:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxud %xmm2, %xmm0		; SSE4-NEXT: pmaxud %xmm2, %xmm0
; SSE4-NEXT: pmaxud %xmm3, %xmm1		; SSE4-NEXT: pmaxud %xmm3, %xmm1
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
Show All 19 Lines	entry:
%cmp = icmp ult <8 x i32> %a, %b		%cmp = icmp ult <8 x i32> %a, %b
%sel = select <8 x i1> %cmp, <8 x i32> %b, <8 x i32> %a		%sel = select <8 x i1> %cmp, <8 x i32> %b, <8 x i32> %a
ret <8 x i32> %sel		ret <8 x i32> %sel
}		}

define <8 x i32> @test94(<8 x i32> %a, <8 x i32> %b) {		define <8 x i32> @test94(<8 x i32> %a, <8 x i32> %b) {
; SSE2-LABEL: test94:		; SSE2-LABEL: test94:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648,2147483648,2147483648]		; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [2147483648,2147483648,2147483648,2147483648]
; SSE2-NEXT: movdqa %xmm2, %xmm6		; SSE2-NEXT: movdqa %xmm2, %xmm5
; SSE2-NEXT: pxor %xmm5, %xmm6		; SSE2-NEXT: pxor %xmm4, %xmm5
; SSE2-NEXT: movdqa %xmm0, %xmm4		; SSE2-NEXT: movdqa %xmm0, %xmm6
; SSE2-NEXT: pxor %xmm5, %xmm4		; SSE2-NEXT: pxor %xmm4, %xmm6
; SSE2-NEXT: pcmpgtd %xmm6, %xmm4		; SSE2-NEXT: pcmpgtd %xmm5, %xmm6
; SSE2-NEXT: pand %xmm4, %xmm0		; SSE2-NEXT: pand %xmm6, %xmm0
; SSE2-NEXT: pandn %xmm2, %xmm4		; SSE2-NEXT: pandn %xmm2, %xmm6
; SSE2-NEXT: por %xmm0, %xmm4		; SSE2-NEXT: por %xmm6, %xmm0
; SSE2-NEXT: movdqa %xmm3, %xmm0		; SSE2-NEXT: movdqa %xmm3, %xmm2
; SSE2-NEXT: pxor %xmm5, %xmm0		; SSE2-NEXT: pxor %xmm4, %xmm2
; SSE2-NEXT: pxor %xmm1, %xmm5		; SSE2-NEXT: pxor %xmm1, %xmm4
; SSE2-NEXT: pcmpgtd %xmm0, %xmm5		; SSE2-NEXT: pcmpgtd %xmm2, %xmm4
; SSE2-NEXT: pand %xmm5, %xmm1		; SSE2-NEXT: pand %xmm4, %xmm1
; SSE2-NEXT: pandn %xmm3, %xmm5		; SSE2-NEXT: pandn %xmm3, %xmm4
; SSE2-NEXT: por %xmm5, %xmm1		; SSE2-NEXT: por %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm4, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test94:		; SSE4-LABEL: test94:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxud %xmm2, %xmm0		; SSE4-NEXT: pmaxud %xmm2, %xmm0
; SSE4-NEXT: pmaxud %xmm3, %xmm1		; SSE4-NEXT: pmaxud %xmm3, %xmm1
; SSE4-NEXT: retq		; SSE4-NEXT: retq
;		;
▲ Show 20 Lines • Show All 271 Lines • ▼ Show 20 Lines

define <64 x i8> @test99(<64 x i8> %a, <64 x i8> %b) {		define <64 x i8> @test99(<64 x i8> %a, <64 x i8> %b) {
; SSE2-LABEL: test99:		; SSE2-LABEL: test99:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm8		; SSE2-NEXT: movdqa %xmm0, %xmm8
; SSE2-NEXT: pcmpgtb %xmm4, %xmm8		; SSE2-NEXT: pcmpgtb %xmm4, %xmm8
; SSE2-NEXT: pand %xmm8, %xmm0		; SSE2-NEXT: pand %xmm8, %xmm0
; SSE2-NEXT: pandn %xmm4, %xmm8		; SSE2-NEXT: pandn %xmm4, %xmm8
; SSE2-NEXT: por %xmm0, %xmm8		; SSE2-NEXT: por %xmm8, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm4		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: pcmpgtb %xmm5, %xmm4		; SSE2-NEXT: pcmpgtb %xmm5, %xmm4
; SSE2-NEXT: pand %xmm4, %xmm1		; SSE2-NEXT: pand %xmm4, %xmm1
; SSE2-NEXT: pandn %xmm5, %xmm4		; SSE2-NEXT: pandn %xmm5, %xmm4
; SSE2-NEXT: por %xmm1, %xmm4		; SSE2-NEXT: por %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm2, %xmm5		; SSE2-NEXT: movdqa %xmm2, %xmm4
; SSE2-NEXT: pcmpgtb %xmm6, %xmm5		; SSE2-NEXT: pcmpgtb %xmm6, %xmm4
; SSE2-NEXT: pand %xmm5, %xmm2		; SSE2-NEXT: pand %xmm4, %xmm2
; SSE2-NEXT: pandn %xmm6, %xmm5		; SSE2-NEXT: pandn %xmm6, %xmm4
; SSE2-NEXT: por %xmm2, %xmm5		; SSE2-NEXT: por %xmm4, %xmm2
; SSE2-NEXT: movdqa %xmm3, %xmm6		; SSE2-NEXT: movdqa %xmm3, %xmm4
; SSE2-NEXT: pcmpgtb %xmm7, %xmm6		; SSE2-NEXT: pcmpgtb %xmm7, %xmm4
; SSE2-NEXT: pand %xmm6, %xmm3		; SSE2-NEXT: pand %xmm4, %xmm3
; SSE2-NEXT: pandn %xmm7, %xmm6		; SSE2-NEXT: pandn %xmm7, %xmm4
; SSE2-NEXT: por %xmm3, %xmm6		; SSE2-NEXT: por %xmm4, %xmm3
; SSE2-NEXT: movdqa %xmm8, %xmm0
; SSE2-NEXT: movdqa %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm5, %xmm2
; SSE2-NEXT: movdqa %xmm6, %xmm3
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test99:		; SSE4-LABEL: test99:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsb %xmm4, %xmm0		; SSE4-NEXT: pmaxsb %xmm4, %xmm0
; SSE4-NEXT: pmaxsb %xmm5, %xmm1		; SSE4-NEXT: pmaxsb %xmm5, %xmm1
; SSE4-NEXT: pmaxsb %xmm6, %xmm2		; SSE4-NEXT: pmaxsb %xmm6, %xmm2
; SSE4-NEXT: pmaxsb %xmm7, %xmm3		; SSE4-NEXT: pmaxsb %xmm7, %xmm3
Show All 40 Lines

define <64 x i8> @test100(<64 x i8> %a, <64 x i8> %b) {		define <64 x i8> @test100(<64 x i8> %a, <64 x i8> %b) {
; SSE2-LABEL: test100:		; SSE2-LABEL: test100:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm8		; SSE2-NEXT: movdqa %xmm0, %xmm8
; SSE2-NEXT: pcmpgtb %xmm4, %xmm8		; SSE2-NEXT: pcmpgtb %xmm4, %xmm8
; SSE2-NEXT: pand %xmm8, %xmm0		; SSE2-NEXT: pand %xmm8, %xmm0
; SSE2-NEXT: pandn %xmm4, %xmm8		; SSE2-NEXT: pandn %xmm4, %xmm8
; SSE2-NEXT: por %xmm0, %xmm8		; SSE2-NEXT: por %xmm8, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm4		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: pcmpgtb %xmm5, %xmm4		; SSE2-NEXT: pcmpgtb %xmm5, %xmm4
; SSE2-NEXT: pand %xmm4, %xmm1		; SSE2-NEXT: pand %xmm4, %xmm1
; SSE2-NEXT: pandn %xmm5, %xmm4		; SSE2-NEXT: pandn %xmm5, %xmm4
; SSE2-NEXT: por %xmm1, %xmm4		; SSE2-NEXT: por %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm2, %xmm5		; SSE2-NEXT: movdqa %xmm2, %xmm4
; SSE2-NEXT: pcmpgtb %xmm6, %xmm5		; SSE2-NEXT: pcmpgtb %xmm6, %xmm4
; SSE2-NEXT: pand %xmm5, %xmm2		; SSE2-NEXT: pand %xmm4, %xmm2
; SSE2-NEXT: pandn %xmm6, %xmm5		; SSE2-NEXT: pandn %xmm6, %xmm4
; SSE2-NEXT: por %xmm2, %xmm5		; SSE2-NEXT: por %xmm4, %xmm2
; SSE2-NEXT: movdqa %xmm3, %xmm6		; SSE2-NEXT: movdqa %xmm3, %xmm4
; SSE2-NEXT: pcmpgtb %xmm7, %xmm6		; SSE2-NEXT: pcmpgtb %xmm7, %xmm4
; SSE2-NEXT: pand %xmm6, %xmm3		; SSE2-NEXT: pand %xmm4, %xmm3
; SSE2-NEXT: pandn %xmm7, %xmm6		; SSE2-NEXT: pandn %xmm7, %xmm4
; SSE2-NEXT: por %xmm3, %xmm6		; SSE2-NEXT: por %xmm4, %xmm3
; SSE2-NEXT: movdqa %xmm8, %xmm0
; SSE2-NEXT: movdqa %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm5, %xmm2
; SSE2-NEXT: movdqa %xmm6, %xmm3
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test100:		; SSE4-LABEL: test100:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsb %xmm4, %xmm0		; SSE4-NEXT: pmaxsb %xmm4, %xmm0
; SSE4-NEXT: pmaxsb %xmm5, %xmm1		; SSE4-NEXT: pmaxsb %xmm5, %xmm1
; SSE4-NEXT: pmaxsb %xmm6, %xmm2		; SSE4-NEXT: pmaxsb %xmm6, %xmm2
; SSE4-NEXT: pmaxsb %xmm7, %xmm3		; SSE4-NEXT: pmaxsb %xmm7, %xmm3
▲ Show 20 Lines • Show All 798 Lines • ▼ Show 20 Lines

define <16 x i32> @test115(<16 x i32> %a, <16 x i32> %b) {		define <16 x i32> @test115(<16 x i32> %a, <16 x i32> %b) {
; SSE2-LABEL: test115:		; SSE2-LABEL: test115:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm8		; SSE2-NEXT: movdqa %xmm0, %xmm8
; SSE2-NEXT: pcmpgtd %xmm4, %xmm8		; SSE2-NEXT: pcmpgtd %xmm4, %xmm8
; SSE2-NEXT: pand %xmm8, %xmm0		; SSE2-NEXT: pand %xmm8, %xmm0
; SSE2-NEXT: pandn %xmm4, %xmm8		; SSE2-NEXT: pandn %xmm4, %xmm8
; SSE2-NEXT: por %xmm0, %xmm8		; SSE2-NEXT: por %xmm8, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm4		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: pcmpgtd %xmm5, %xmm4		; SSE2-NEXT: pcmpgtd %xmm5, %xmm4
; SSE2-NEXT: pand %xmm4, %xmm1		; SSE2-NEXT: pand %xmm4, %xmm1
; SSE2-NEXT: pandn %xmm5, %xmm4		; SSE2-NEXT: pandn %xmm5, %xmm4
; SSE2-NEXT: por %xmm1, %xmm4		; SSE2-NEXT: por %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm2, %xmm5		; SSE2-NEXT: movdqa %xmm2, %xmm4
; SSE2-NEXT: pcmpgtd %xmm6, %xmm5		; SSE2-NEXT: pcmpgtd %xmm6, %xmm4
; SSE2-NEXT: pand %xmm5, %xmm2		; SSE2-NEXT: pand %xmm4, %xmm2
; SSE2-NEXT: pandn %xmm6, %xmm5		; SSE2-NEXT: pandn %xmm6, %xmm4
; SSE2-NEXT: por %xmm2, %xmm5		; SSE2-NEXT: por %xmm4, %xmm2
; SSE2-NEXT: movdqa %xmm3, %xmm6		; SSE2-NEXT: movdqa %xmm3, %xmm4
; SSE2-NEXT: pcmpgtd %xmm7, %xmm6		; SSE2-NEXT: pcmpgtd %xmm7, %xmm4
; SSE2-NEXT: pand %xmm6, %xmm3		; SSE2-NEXT: pand %xmm4, %xmm3
; SSE2-NEXT: pandn %xmm7, %xmm6		; SSE2-NEXT: pandn %xmm7, %xmm4
; SSE2-NEXT: por %xmm3, %xmm6		; SSE2-NEXT: por %xmm4, %xmm3
; SSE2-NEXT: movdqa %xmm8, %xmm0
; SSE2-NEXT: movdqa %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm5, %xmm2
; SSE2-NEXT: movdqa %xmm6, %xmm3
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test115:		; SSE4-LABEL: test115:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsd %xmm4, %xmm0		; SSE4-NEXT: pmaxsd %xmm4, %xmm0
; SSE4-NEXT: pmaxsd %xmm5, %xmm1		; SSE4-NEXT: pmaxsd %xmm5, %xmm1
; SSE4-NEXT: pmaxsd %xmm6, %xmm2		; SSE4-NEXT: pmaxsd %xmm6, %xmm2
; SSE4-NEXT: pmaxsd %xmm7, %xmm3		; SSE4-NEXT: pmaxsd %xmm7, %xmm3
Show All 31 Lines

define <16 x i32> @test116(<16 x i32> %a, <16 x i32> %b) {		define <16 x i32> @test116(<16 x i32> %a, <16 x i32> %b) {
; SSE2-LABEL: test116:		; SSE2-LABEL: test116:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm8		; SSE2-NEXT: movdqa %xmm0, %xmm8
; SSE2-NEXT: pcmpgtd %xmm4, %xmm8		; SSE2-NEXT: pcmpgtd %xmm4, %xmm8
; SSE2-NEXT: pand %xmm8, %xmm0		; SSE2-NEXT: pand %xmm8, %xmm0
; SSE2-NEXT: pandn %xmm4, %xmm8		; SSE2-NEXT: pandn %xmm4, %xmm8
; SSE2-NEXT: por %xmm0, %xmm8		; SSE2-NEXT: por %xmm8, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm4		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: pcmpgtd %xmm5, %xmm4		; SSE2-NEXT: pcmpgtd %xmm5, %xmm4
; SSE2-NEXT: pand %xmm4, %xmm1		; SSE2-NEXT: pand %xmm4, %xmm1
; SSE2-NEXT: pandn %xmm5, %xmm4		; SSE2-NEXT: pandn %xmm5, %xmm4
; SSE2-NEXT: por %xmm1, %xmm4		; SSE2-NEXT: por %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm2, %xmm5		; SSE2-NEXT: movdqa %xmm2, %xmm4
; SSE2-NEXT: pcmpgtd %xmm6, %xmm5		; SSE2-NEXT: pcmpgtd %xmm6, %xmm4
; SSE2-NEXT: pand %xmm5, %xmm2		; SSE2-NEXT: pand %xmm4, %xmm2
; SSE2-NEXT: pandn %xmm6, %xmm5		; SSE2-NEXT: pandn %xmm6, %xmm4
; SSE2-NEXT: por %xmm2, %xmm5		; SSE2-NEXT: por %xmm4, %xmm2
; SSE2-NEXT: movdqa %xmm3, %xmm6		; SSE2-NEXT: movdqa %xmm3, %xmm4
; SSE2-NEXT: pcmpgtd %xmm7, %xmm6		; SSE2-NEXT: pcmpgtd %xmm7, %xmm4
; SSE2-NEXT: pand %xmm6, %xmm3		; SSE2-NEXT: pand %xmm4, %xmm3
; SSE2-NEXT: pandn %xmm7, %xmm6		; SSE2-NEXT: pandn %xmm7, %xmm4
; SSE2-NEXT: por %xmm3, %xmm6		; SSE2-NEXT: por %xmm4, %xmm3
; SSE2-NEXT: movdqa %xmm8, %xmm0
; SSE2-NEXT: movdqa %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm5, %xmm2
; SSE2-NEXT: movdqa %xmm6, %xmm3
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test116:		; SSE4-LABEL: test116:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsd %xmm4, %xmm0		; SSE4-NEXT: pmaxsd %xmm4, %xmm0
; SSE4-NEXT: pmaxsd %xmm5, %xmm1		; SSE4-NEXT: pmaxsd %xmm5, %xmm1
; SSE4-NEXT: pmaxsd %xmm6, %xmm2		; SSE4-NEXT: pmaxsd %xmm6, %xmm2
; SSE4-NEXT: pmaxsd %xmm7, %xmm3		; SSE4-NEXT: pmaxsd %xmm7, %xmm3
▲ Show 20 Lines • Show All 177 Lines • ▼ Show 20 Lines	entry:
%cmp = icmp ule <16 x i32> %a, %b		%cmp = icmp ule <16 x i32> %a, %b
%sel = select <16 x i1> %cmp, <16 x i32> %a, <16 x i32> %b		%sel = select <16 x i1> %cmp, <16 x i32> %a, <16 x i32> %b
ret <16 x i32> %sel		ret <16 x i32> %sel
}		}

define <16 x i32> @test119(<16 x i32> %a, <16 x i32> %b) {		define <16 x i32> @test119(<16 x i32> %a, <16 x i32> %b) {
; SSE2-LABEL: test119:		; SSE2-LABEL: test119:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm1, %xmm8		; SSE2-NEXT: movdqa {{.*#+}} xmm8 = [2147483648,2147483648,2147483648,2147483648]
		; SSE2-NEXT: movdqa %xmm4, %xmm9
		; SSE2-NEXT: pxor %xmm8, %xmm9
; SSE2-NEXT: movdqa %xmm0, %xmm10		; SSE2-NEXT: movdqa %xmm0, %xmm10
; SSE2-NEXT: movdqa {{.*#+}} xmm9 = [2147483648,2147483648,2147483648,2147483648]		; SSE2-NEXT: pxor %xmm8, %xmm10
; SSE2-NEXT: movdqa %xmm4, %xmm1		; SSE2-NEXT: pcmpgtd %xmm9, %xmm10
; SSE2-NEXT: pxor %xmm9, %xmm1		; SSE2-NEXT: pand %xmm10, %xmm0
; SSE2-NEXT: pxor %xmm9, %xmm0		; SSE2-NEXT: pandn %xmm4, %xmm10
; SSE2-NEXT: pcmpgtd %xmm1, %xmm0
; SSE2-NEXT: pand %xmm0, %xmm10
; SSE2-NEXT: pandn %xmm4, %xmm0
; SSE2-NEXT: por %xmm10, %xmm0		; SSE2-NEXT: por %xmm10, %xmm0
; SSE2-NEXT: movdqa %xmm5, %xmm4		; SSE2-NEXT: movdqa %xmm5, %xmm9
; SSE2-NEXT: pxor %xmm9, %xmm4		; SSE2-NEXT: pxor %xmm8, %xmm9
; SSE2-NEXT: movdqa %xmm8, %xmm1		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: pxor %xmm9, %xmm1		; SSE2-NEXT: pxor %xmm8, %xmm4
; SSE2-NEXT: pcmpgtd %xmm4, %xmm1		; SSE2-NEXT: pcmpgtd %xmm9, %xmm4
; SSE2-NEXT: pand %xmm1, %xmm8		; SSE2-NEXT: pand %xmm4, %xmm1
; SSE2-NEXT: pandn %xmm5, %xmm1		; SSE2-NEXT: pandn %xmm5, %xmm4
; SSE2-NEXT: por %xmm8, %xmm1		; SSE2-NEXT: por %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm6, %xmm5		; SSE2-NEXT: movdqa %xmm6, %xmm4
; SSE2-NEXT: pxor %xmm9, %xmm5		; SSE2-NEXT: pxor %xmm8, %xmm4
; SSE2-NEXT: movdqa %xmm2, %xmm4		; SSE2-NEXT: movdqa %xmm2, %xmm5
; SSE2-NEXT: pxor %xmm9, %xmm4		; SSE2-NEXT: pxor %xmm8, %xmm5
; SSE2-NEXT: pcmpgtd %xmm5, %xmm4		; SSE2-NEXT: pcmpgtd %xmm4, %xmm5
; SSE2-NEXT: pand %xmm4, %xmm2		; SSE2-NEXT: pand %xmm5, %xmm2
; SSE2-NEXT: pandn %xmm6, %xmm4		; SSE2-NEXT: pandn %xmm6, %xmm5
; SSE2-NEXT: por %xmm2, %xmm4		; SSE2-NEXT: por %xmm5, %xmm2
; SSE2-NEXT: movdqa %xmm7, %xmm2		; SSE2-NEXT: movdqa %xmm7, %xmm4
; SSE2-NEXT: pxor %xmm9, %xmm2		; SSE2-NEXT: pxor %xmm8, %xmm4
; SSE2-NEXT: pxor %xmm3, %xmm9		; SSE2-NEXT: pxor %xmm3, %xmm8
; SSE2-NEXT: pcmpgtd %xmm2, %xmm9		; SSE2-NEXT: pcmpgtd %xmm4, %xmm8
; SSE2-NEXT: pand %xmm9, %xmm3		; SSE2-NEXT: pand %xmm8, %xmm3
; SSE2-NEXT: pandn %xmm7, %xmm9		; SSE2-NEXT: pandn %xmm7, %xmm8
; SSE2-NEXT: por %xmm9, %xmm3		; SSE2-NEXT: por %xmm8, %xmm3
; SSE2-NEXT: movdqa %xmm4, %xmm2
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test119:		; SSE4-LABEL: test119:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxud %xmm4, %xmm0		; SSE4-NEXT: pmaxud %xmm4, %xmm0
; SSE4-NEXT: pmaxud %xmm5, %xmm1		; SSE4-NEXT: pmaxud %xmm5, %xmm1
; SSE4-NEXT: pmaxud %xmm6, %xmm2		; SSE4-NEXT: pmaxud %xmm6, %xmm2
; SSE4-NEXT: pmaxud %xmm7, %xmm3		; SSE4-NEXT: pmaxud %xmm7, %xmm3
Show All 27 Lines	entry:
%cmp = icmp ugt <16 x i32> %a, %b		%cmp = icmp ugt <16 x i32> %a, %b
%sel = select <16 x i1> %cmp, <16 x i32> %a, <16 x i32> %b		%sel = select <16 x i1> %cmp, <16 x i32> %a, <16 x i32> %b
ret <16 x i32> %sel		ret <16 x i32> %sel
}		}

define <16 x i32> @test120(<16 x i32> %a, <16 x i32> %b) {		define <16 x i32> @test120(<16 x i32> %a, <16 x i32> %b) {
; SSE2-LABEL: test120:		; SSE2-LABEL: test120:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm1, %xmm8		; SSE2-NEXT: movdqa {{.*#+}} xmm8 = [2147483648,2147483648,2147483648,2147483648]
		; SSE2-NEXT: movdqa %xmm4, %xmm9
		; SSE2-NEXT: pxor %xmm8, %xmm9
; SSE2-NEXT: movdqa %xmm0, %xmm10		; SSE2-NEXT: movdqa %xmm0, %xmm10
; SSE2-NEXT: movdqa {{.*#+}} xmm9 = [2147483648,2147483648,2147483648,2147483648]		; SSE2-NEXT: pxor %xmm8, %xmm10
; SSE2-NEXT: movdqa %xmm4, %xmm1		; SSE2-NEXT: pcmpgtd %xmm9, %xmm10
; SSE2-NEXT: pxor %xmm9, %xmm1		; SSE2-NEXT: pand %xmm10, %xmm0
; SSE2-NEXT: pxor %xmm9, %xmm0		; SSE2-NEXT: pandn %xmm4, %xmm10
; SSE2-NEXT: pcmpgtd %xmm1, %xmm0
; SSE2-NEXT: pand %xmm0, %xmm10
; SSE2-NEXT: pandn %xmm4, %xmm0
; SSE2-NEXT: por %xmm10, %xmm0		; SSE2-NEXT: por %xmm10, %xmm0
; SSE2-NEXT: movdqa %xmm5, %xmm4		; SSE2-NEXT: movdqa %xmm5, %xmm9
; SSE2-NEXT: pxor %xmm9, %xmm4		; SSE2-NEXT: pxor %xmm8, %xmm9
; SSE2-NEXT: movdqa %xmm8, %xmm1		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: pxor %xmm9, %xmm1		; SSE2-NEXT: pxor %xmm8, %xmm4
; SSE2-NEXT: pcmpgtd %xmm4, %xmm1		; SSE2-NEXT: pcmpgtd %xmm9, %xmm4
; SSE2-NEXT: pand %xmm1, %xmm8		; SSE2-NEXT: pand %xmm4, %xmm1
; SSE2-NEXT: pandn %xmm5, %xmm1		; SSE2-NEXT: pandn %xmm5, %xmm4
; SSE2-NEXT: por %xmm8, %xmm1		; SSE2-NEXT: por %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm6, %xmm5		; SSE2-NEXT: movdqa %xmm6, %xmm4
; SSE2-NEXT: pxor %xmm9, %xmm5		; SSE2-NEXT: pxor %xmm8, %xmm4
; SSE2-NEXT: movdqa %xmm2, %xmm4		; SSE2-NEXT: movdqa %xmm2, %xmm5
; SSE2-NEXT: pxor %xmm9, %xmm4		; SSE2-NEXT: pxor %xmm8, %xmm5
; SSE2-NEXT: pcmpgtd %xmm5, %xmm4		; SSE2-NEXT: pcmpgtd %xmm4, %xmm5
; SSE2-NEXT: pand %xmm4, %xmm2		; SSE2-NEXT: pand %xmm5, %xmm2
; SSE2-NEXT: pandn %xmm6, %xmm4		; SSE2-NEXT: pandn %xmm6, %xmm5
; SSE2-NEXT: por %xmm2, %xmm4		; SSE2-NEXT: por %xmm5, %xmm2
; SSE2-NEXT: movdqa %xmm7, %xmm2		; SSE2-NEXT: movdqa %xmm7, %xmm4
; SSE2-NEXT: pxor %xmm9, %xmm2		; SSE2-NEXT: pxor %xmm8, %xmm4
; SSE2-NEXT: pxor %xmm3, %xmm9		; SSE2-NEXT: pxor %xmm3, %xmm8
; SSE2-NEXT: pcmpgtd %xmm2, %xmm9		; SSE2-NEXT: pcmpgtd %xmm4, %xmm8
; SSE2-NEXT: pand %xmm9, %xmm3		; SSE2-NEXT: pand %xmm8, %xmm3
; SSE2-NEXT: pandn %xmm7, %xmm9		; SSE2-NEXT: pandn %xmm7, %xmm8
; SSE2-NEXT: por %xmm9, %xmm3		; SSE2-NEXT: por %xmm8, %xmm3
; SSE2-NEXT: movdqa %xmm4, %xmm2
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test120:		; SSE4-LABEL: test120:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxud %xmm4, %xmm0		; SSE4-NEXT: pmaxud %xmm4, %xmm0
; SSE4-NEXT: pmaxud %xmm5, %xmm1		; SSE4-NEXT: pmaxud %xmm5, %xmm1
; SSE4-NEXT: pmaxud %xmm6, %xmm2		; SSE4-NEXT: pmaxud %xmm6, %xmm2
; SSE4-NEXT: pmaxud %xmm7, %xmm3		; SSE4-NEXT: pmaxud %xmm7, %xmm3
▲ Show 20 Lines • Show All 1,111 Lines • ▼ Show 20 Lines

define <64 x i8> @test129(<64 x i8> %a, <64 x i8> %b) {		define <64 x i8> @test129(<64 x i8> %a, <64 x i8> %b) {
; SSE2-LABEL: test129:		; SSE2-LABEL: test129:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm8		; SSE2-NEXT: movdqa %xmm0, %xmm8
; SSE2-NEXT: pcmpgtb %xmm4, %xmm8		; SSE2-NEXT: pcmpgtb %xmm4, %xmm8
; SSE2-NEXT: pand %xmm8, %xmm0		; SSE2-NEXT: pand %xmm8, %xmm0
; SSE2-NEXT: pandn %xmm4, %xmm8		; SSE2-NEXT: pandn %xmm4, %xmm8
; SSE2-NEXT: por %xmm0, %xmm8		; SSE2-NEXT: por %xmm8, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm4		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: pcmpgtb %xmm5, %xmm4		; SSE2-NEXT: pcmpgtb %xmm5, %xmm4
; SSE2-NEXT: pand %xmm4, %xmm1		; SSE2-NEXT: pand %xmm4, %xmm1
; SSE2-NEXT: pandn %xmm5, %xmm4		; SSE2-NEXT: pandn %xmm5, %xmm4
; SSE2-NEXT: por %xmm1, %xmm4		; SSE2-NEXT: por %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm2, %xmm5		; SSE2-NEXT: movdqa %xmm2, %xmm4
; SSE2-NEXT: pcmpgtb %xmm6, %xmm5		; SSE2-NEXT: pcmpgtb %xmm6, %xmm4
; SSE2-NEXT: pand %xmm5, %xmm2		; SSE2-NEXT: pand %xmm4, %xmm2
; SSE2-NEXT: pandn %xmm6, %xmm5		; SSE2-NEXT: pandn %xmm6, %xmm4
; SSE2-NEXT: por %xmm2, %xmm5		; SSE2-NEXT: por %xmm4, %xmm2
; SSE2-NEXT: movdqa %xmm3, %xmm6		; SSE2-NEXT: movdqa %xmm3, %xmm4
; SSE2-NEXT: pcmpgtb %xmm7, %xmm6		; SSE2-NEXT: pcmpgtb %xmm7, %xmm4
; SSE2-NEXT: pand %xmm6, %xmm3		; SSE2-NEXT: pand %xmm4, %xmm3
; SSE2-NEXT: pandn %xmm7, %xmm6		; SSE2-NEXT: pandn %xmm7, %xmm4
; SSE2-NEXT: por %xmm3, %xmm6		; SSE2-NEXT: por %xmm4, %xmm3
; SSE2-NEXT: movdqa %xmm8, %xmm0
; SSE2-NEXT: movdqa %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm5, %xmm2
; SSE2-NEXT: movdqa %xmm6, %xmm3
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test129:		; SSE4-LABEL: test129:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsb %xmm4, %xmm0		; SSE4-NEXT: pmaxsb %xmm4, %xmm0
; SSE4-NEXT: pmaxsb %xmm5, %xmm1		; SSE4-NEXT: pmaxsb %xmm5, %xmm1
; SSE4-NEXT: pmaxsb %xmm6, %xmm2		; SSE4-NEXT: pmaxsb %xmm6, %xmm2
; SSE4-NEXT: pmaxsb %xmm7, %xmm3		; SSE4-NEXT: pmaxsb %xmm7, %xmm3
Show All 40 Lines

define <64 x i8> @test130(<64 x i8> %a, <64 x i8> %b) {		define <64 x i8> @test130(<64 x i8> %a, <64 x i8> %b) {
; SSE2-LABEL: test130:		; SSE2-LABEL: test130:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm8		; SSE2-NEXT: movdqa %xmm0, %xmm8
; SSE2-NEXT: pcmpgtb %xmm4, %xmm8		; SSE2-NEXT: pcmpgtb %xmm4, %xmm8
; SSE2-NEXT: pand %xmm8, %xmm0		; SSE2-NEXT: pand %xmm8, %xmm0
; SSE2-NEXT: pandn %xmm4, %xmm8		; SSE2-NEXT: pandn %xmm4, %xmm8
; SSE2-NEXT: por %xmm0, %xmm8		; SSE2-NEXT: por %xmm8, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm4		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: pcmpgtb %xmm5, %xmm4		; SSE2-NEXT: pcmpgtb %xmm5, %xmm4
; SSE2-NEXT: pand %xmm4, %xmm1		; SSE2-NEXT: pand %xmm4, %xmm1
; SSE2-NEXT: pandn %xmm5, %xmm4		; SSE2-NEXT: pandn %xmm5, %xmm4
; SSE2-NEXT: por %xmm1, %xmm4		; SSE2-NEXT: por %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm2, %xmm5		; SSE2-NEXT: movdqa %xmm2, %xmm4
; SSE2-NEXT: pcmpgtb %xmm6, %xmm5		; SSE2-NEXT: pcmpgtb %xmm6, %xmm4
; SSE2-NEXT: pand %xmm5, %xmm2		; SSE2-NEXT: pand %xmm4, %xmm2
; SSE2-NEXT: pandn %xmm6, %xmm5		; SSE2-NEXT: pandn %xmm6, %xmm4
; SSE2-NEXT: por %xmm2, %xmm5		; SSE2-NEXT: por %xmm4, %xmm2
; SSE2-NEXT: movdqa %xmm3, %xmm6		; SSE2-NEXT: movdqa %xmm3, %xmm4
; SSE2-NEXT: pcmpgtb %xmm7, %xmm6		; SSE2-NEXT: pcmpgtb %xmm7, %xmm4
; SSE2-NEXT: pand %xmm6, %xmm3		; SSE2-NEXT: pand %xmm4, %xmm3
; SSE2-NEXT: pandn %xmm7, %xmm6		; SSE2-NEXT: pandn %xmm7, %xmm4
; SSE2-NEXT: por %xmm3, %xmm6		; SSE2-NEXT: por %xmm4, %xmm3
; SSE2-NEXT: movdqa %xmm8, %xmm0
; SSE2-NEXT: movdqa %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm5, %xmm2
; SSE2-NEXT: movdqa %xmm6, %xmm3
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test130:		; SSE4-LABEL: test130:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsb %xmm4, %xmm0		; SSE4-NEXT: pmaxsb %xmm4, %xmm0
; SSE4-NEXT: pmaxsb %xmm5, %xmm1		; SSE4-NEXT: pmaxsb %xmm5, %xmm1
; SSE4-NEXT: pmaxsb %xmm6, %xmm2		; SSE4-NEXT: pmaxsb %xmm6, %xmm2
; SSE4-NEXT: pmaxsb %xmm7, %xmm3		; SSE4-NEXT: pmaxsb %xmm7, %xmm3
▲ Show 20 Lines • Show All 816 Lines • ▼ Show 20 Lines

define <16 x i32> @test145(<16 x i32> %a, <16 x i32> %b) {		define <16 x i32> @test145(<16 x i32> %a, <16 x i32> %b) {
; SSE2-LABEL: test145:		; SSE2-LABEL: test145:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm8		; SSE2-NEXT: movdqa %xmm0, %xmm8
; SSE2-NEXT: pcmpgtd %xmm4, %xmm8		; SSE2-NEXT: pcmpgtd %xmm4, %xmm8
; SSE2-NEXT: pand %xmm8, %xmm0		; SSE2-NEXT: pand %xmm8, %xmm0
; SSE2-NEXT: pandn %xmm4, %xmm8		; SSE2-NEXT: pandn %xmm4, %xmm8
; SSE2-NEXT: por %xmm0, %xmm8		; SSE2-NEXT: por %xmm8, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm4		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: pcmpgtd %xmm5, %xmm4		; SSE2-NEXT: pcmpgtd %xmm5, %xmm4
; SSE2-NEXT: pand %xmm4, %xmm1		; SSE2-NEXT: pand %xmm4, %xmm1
; SSE2-NEXT: pandn %xmm5, %xmm4		; SSE2-NEXT: pandn %xmm5, %xmm4
; SSE2-NEXT: por %xmm1, %xmm4		; SSE2-NEXT: por %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm2, %xmm5		; SSE2-NEXT: movdqa %xmm2, %xmm4
; SSE2-NEXT: pcmpgtd %xmm6, %xmm5		; SSE2-NEXT: pcmpgtd %xmm6, %xmm4
; SSE2-NEXT: pand %xmm5, %xmm2		; SSE2-NEXT: pand %xmm4, %xmm2
; SSE2-NEXT: pandn %xmm6, %xmm5		; SSE2-NEXT: pandn %xmm6, %xmm4
; SSE2-NEXT: por %xmm2, %xmm5		; SSE2-NEXT: por %xmm4, %xmm2
; SSE2-NEXT: movdqa %xmm3, %xmm6		; SSE2-NEXT: movdqa %xmm3, %xmm4
; SSE2-NEXT: pcmpgtd %xmm7, %xmm6		; SSE2-NEXT: pcmpgtd %xmm7, %xmm4
; SSE2-NEXT: pand %xmm6, %xmm3		; SSE2-NEXT: pand %xmm4, %xmm3
; SSE2-NEXT: pandn %xmm7, %xmm6		; SSE2-NEXT: pandn %xmm7, %xmm4
; SSE2-NEXT: por %xmm3, %xmm6		; SSE2-NEXT: por %xmm4, %xmm3
; SSE2-NEXT: movdqa %xmm8, %xmm0
; SSE2-NEXT: movdqa %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm5, %xmm2
; SSE2-NEXT: movdqa %xmm6, %xmm3
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test145:		; SSE4-LABEL: test145:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsd %xmm4, %xmm0		; SSE4-NEXT: pmaxsd %xmm4, %xmm0
; SSE4-NEXT: pmaxsd %xmm5, %xmm1		; SSE4-NEXT: pmaxsd %xmm5, %xmm1
; SSE4-NEXT: pmaxsd %xmm6, %xmm2		; SSE4-NEXT: pmaxsd %xmm6, %xmm2
; SSE4-NEXT: pmaxsd %xmm7, %xmm3		; SSE4-NEXT: pmaxsd %xmm7, %xmm3
Show All 31 Lines

define <16 x i32> @test146(<16 x i32> %a, <16 x i32> %b) {		define <16 x i32> @test146(<16 x i32> %a, <16 x i32> %b) {
; SSE2-LABEL: test146:		; SSE2-LABEL: test146:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm0, %xmm8		; SSE2-NEXT: movdqa %xmm0, %xmm8
; SSE2-NEXT: pcmpgtd %xmm4, %xmm8		; SSE2-NEXT: pcmpgtd %xmm4, %xmm8
; SSE2-NEXT: pand %xmm8, %xmm0		; SSE2-NEXT: pand %xmm8, %xmm0
; SSE2-NEXT: pandn %xmm4, %xmm8		; SSE2-NEXT: pandn %xmm4, %xmm8
; SSE2-NEXT: por %xmm0, %xmm8		; SSE2-NEXT: por %xmm8, %xmm0
; SSE2-NEXT: movdqa %xmm1, %xmm4		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: pcmpgtd %xmm5, %xmm4		; SSE2-NEXT: pcmpgtd %xmm5, %xmm4
; SSE2-NEXT: pand %xmm4, %xmm1		; SSE2-NEXT: pand %xmm4, %xmm1
; SSE2-NEXT: pandn %xmm5, %xmm4		; SSE2-NEXT: pandn %xmm5, %xmm4
; SSE2-NEXT: por %xmm1, %xmm4		; SSE2-NEXT: por %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm2, %xmm5		; SSE2-NEXT: movdqa %xmm2, %xmm4
; SSE2-NEXT: pcmpgtd %xmm6, %xmm5		; SSE2-NEXT: pcmpgtd %xmm6, %xmm4
; SSE2-NEXT: pand %xmm5, %xmm2		; SSE2-NEXT: pand %xmm4, %xmm2
; SSE2-NEXT: pandn %xmm6, %xmm5		; SSE2-NEXT: pandn %xmm6, %xmm4
; SSE2-NEXT: por %xmm2, %xmm5		; SSE2-NEXT: por %xmm4, %xmm2
; SSE2-NEXT: movdqa %xmm3, %xmm6		; SSE2-NEXT: movdqa %xmm3, %xmm4
; SSE2-NEXT: pcmpgtd %xmm7, %xmm6		; SSE2-NEXT: pcmpgtd %xmm7, %xmm4
; SSE2-NEXT: pand %xmm6, %xmm3		; SSE2-NEXT: pand %xmm4, %xmm3
; SSE2-NEXT: pandn %xmm7, %xmm6		; SSE2-NEXT: pandn %xmm7, %xmm4
; SSE2-NEXT: por %xmm3, %xmm6		; SSE2-NEXT: por %xmm4, %xmm3
; SSE2-NEXT: movdqa %xmm8, %xmm0
; SSE2-NEXT: movdqa %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm5, %xmm2
; SSE2-NEXT: movdqa %xmm6, %xmm3
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test146:		; SSE4-LABEL: test146:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxsd %xmm4, %xmm0		; SSE4-NEXT: pmaxsd %xmm4, %xmm0
; SSE4-NEXT: pmaxsd %xmm5, %xmm1		; SSE4-NEXT: pmaxsd %xmm5, %xmm1
; SSE4-NEXT: pmaxsd %xmm6, %xmm2		; SSE4-NEXT: pmaxsd %xmm6, %xmm2
; SSE4-NEXT: pmaxsd %xmm7, %xmm3		; SSE4-NEXT: pmaxsd %xmm7, %xmm3
▲ Show 20 Lines • Show All 153 Lines • ▼ Show 20 Lines	entry:
%cmp = icmp sge <16 x i32> %a, %b		%cmp = icmp sge <16 x i32> %a, %b
%sel = select <16 x i1> %cmp, <16 x i32> %b, <16 x i32> %a		%sel = select <16 x i1> %cmp, <16 x i32> %b, <16 x i32> %a
ret <16 x i32> %sel		ret <16 x i32> %sel
}		}

define <16 x i32> @test149(<16 x i32> %a, <16 x i32> %b) {		define <16 x i32> @test149(<16 x i32> %a, <16 x i32> %b) {
; SSE2-LABEL: test149:		; SSE2-LABEL: test149:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm1, %xmm8		; SSE2-NEXT: movdqa {{.*#+}} xmm8 = [2147483648,2147483648,2147483648,2147483648]
		; SSE2-NEXT: movdqa %xmm4, %xmm9
		; SSE2-NEXT: pxor %xmm8, %xmm9
; SSE2-NEXT: movdqa %xmm0, %xmm10		; SSE2-NEXT: movdqa %xmm0, %xmm10
; SSE2-NEXT: movdqa {{.*#+}} xmm9 = [2147483648,2147483648,2147483648,2147483648]		; SSE2-NEXT: pxor %xmm8, %xmm10
; SSE2-NEXT: movdqa %xmm4, %xmm1		; SSE2-NEXT: pcmpgtd %xmm9, %xmm10
; SSE2-NEXT: pxor %xmm9, %xmm1		; SSE2-NEXT: pand %xmm10, %xmm0
; SSE2-NEXT: pxor %xmm9, %xmm0		; SSE2-NEXT: pandn %xmm4, %xmm10
; SSE2-NEXT: pcmpgtd %xmm1, %xmm0
; SSE2-NEXT: pand %xmm0, %xmm10
; SSE2-NEXT: pandn %xmm4, %xmm0
; SSE2-NEXT: por %xmm10, %xmm0		; SSE2-NEXT: por %xmm10, %xmm0
; SSE2-NEXT: movdqa %xmm5, %xmm4		; SSE2-NEXT: movdqa %xmm5, %xmm9
; SSE2-NEXT: pxor %xmm9, %xmm4		; SSE2-NEXT: pxor %xmm8, %xmm9
; SSE2-NEXT: movdqa %xmm8, %xmm1		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: pxor %xmm9, %xmm1		; SSE2-NEXT: pxor %xmm8, %xmm4
; SSE2-NEXT: pcmpgtd %xmm4, %xmm1		; SSE2-NEXT: pcmpgtd %xmm9, %xmm4
; SSE2-NEXT: pand %xmm1, %xmm8		; SSE2-NEXT: pand %xmm4, %xmm1
; SSE2-NEXT: pandn %xmm5, %xmm1		; SSE2-NEXT: pandn %xmm5, %xmm4
; SSE2-NEXT: por %xmm8, %xmm1		; SSE2-NEXT: por %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm6, %xmm5		; SSE2-NEXT: movdqa %xmm6, %xmm4
; SSE2-NEXT: pxor %xmm9, %xmm5		; SSE2-NEXT: pxor %xmm8, %xmm4
; SSE2-NEXT: movdqa %xmm2, %xmm4		; SSE2-NEXT: movdqa %xmm2, %xmm5
; SSE2-NEXT: pxor %xmm9, %xmm4		; SSE2-NEXT: pxor %xmm8, %xmm5
; SSE2-NEXT: pcmpgtd %xmm5, %xmm4		; SSE2-NEXT: pcmpgtd %xmm4, %xmm5
; SSE2-NEXT: pand %xmm4, %xmm2		; SSE2-NEXT: pand %xmm5, %xmm2
; SSE2-NEXT: pandn %xmm6, %xmm4		; SSE2-NEXT: pandn %xmm6, %xmm5
; SSE2-NEXT: por %xmm2, %xmm4		; SSE2-NEXT: por %xmm5, %xmm2
; SSE2-NEXT: movdqa %xmm7, %xmm2		; SSE2-NEXT: movdqa %xmm7, %xmm4
; SSE2-NEXT: pxor %xmm9, %xmm2		; SSE2-NEXT: pxor %xmm8, %xmm4
; SSE2-NEXT: pxor %xmm3, %xmm9		; SSE2-NEXT: pxor %xmm3, %xmm8
; SSE2-NEXT: pcmpgtd %xmm2, %xmm9		; SSE2-NEXT: pcmpgtd %xmm4, %xmm8
; SSE2-NEXT: pand %xmm9, %xmm3		; SSE2-NEXT: pand %xmm8, %xmm3
; SSE2-NEXT: pandn %xmm7, %xmm9		; SSE2-NEXT: pandn %xmm7, %xmm8
; SSE2-NEXT: por %xmm9, %xmm3		; SSE2-NEXT: por %xmm8, %xmm3
; SSE2-NEXT: movdqa %xmm4, %xmm2
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test149:		; SSE4-LABEL: test149:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxud %xmm4, %xmm0		; SSE4-NEXT: pmaxud %xmm4, %xmm0
; SSE4-NEXT: pmaxud %xmm5, %xmm1		; SSE4-NEXT: pmaxud %xmm5, %xmm1
; SSE4-NEXT: pmaxud %xmm6, %xmm2		; SSE4-NEXT: pmaxud %xmm6, %xmm2
; SSE4-NEXT: pmaxud %xmm7, %xmm3		; SSE4-NEXT: pmaxud %xmm7, %xmm3
Show All 27 Lines	entry:
%cmp = icmp ult <16 x i32> %a, %b		%cmp = icmp ult <16 x i32> %a, %b
%sel = select <16 x i1> %cmp, <16 x i32> %b, <16 x i32> %a		%sel = select <16 x i1> %cmp, <16 x i32> %b, <16 x i32> %a
ret <16 x i32> %sel		ret <16 x i32> %sel
}		}

define <16 x i32> @test150(<16 x i32> %a, <16 x i32> %b) {		define <16 x i32> @test150(<16 x i32> %a, <16 x i32> %b) {
; SSE2-LABEL: test150:		; SSE2-LABEL: test150:
; SSE2: # %bb.0: # %entry		; SSE2: # %bb.0: # %entry
; SSE2-NEXT: movdqa %xmm1, %xmm8		; SSE2-NEXT: movdqa {{.*#+}} xmm8 = [2147483648,2147483648,2147483648,2147483648]
		; SSE2-NEXT: movdqa %xmm4, %xmm9
		; SSE2-NEXT: pxor %xmm8, %xmm9
; SSE2-NEXT: movdqa %xmm0, %xmm10		; SSE2-NEXT: movdqa %xmm0, %xmm10
; SSE2-NEXT: movdqa {{.*#+}} xmm9 = [2147483648,2147483648,2147483648,2147483648]		; SSE2-NEXT: pxor %xmm8, %xmm10
; SSE2-NEXT: movdqa %xmm4, %xmm1		; SSE2-NEXT: pcmpgtd %xmm9, %xmm10
; SSE2-NEXT: pxor %xmm9, %xmm1		; SSE2-NEXT: pand %xmm10, %xmm0
; SSE2-NEXT: pxor %xmm9, %xmm0		; SSE2-NEXT: pandn %xmm4, %xmm10
; SSE2-NEXT: pcmpgtd %xmm1, %xmm0
; SSE2-NEXT: pand %xmm0, %xmm10
; SSE2-NEXT: pandn %xmm4, %xmm0
; SSE2-NEXT: por %xmm10, %xmm0		; SSE2-NEXT: por %xmm10, %xmm0
; SSE2-NEXT: movdqa %xmm5, %xmm4		; SSE2-NEXT: movdqa %xmm5, %xmm9
; SSE2-NEXT: pxor %xmm9, %xmm4		; SSE2-NEXT: pxor %xmm8, %xmm9
; SSE2-NEXT: movdqa %xmm8, %xmm1		; SSE2-NEXT: movdqa %xmm1, %xmm4
; SSE2-NEXT: pxor %xmm9, %xmm1		; SSE2-NEXT: pxor %xmm8, %xmm4
; SSE2-NEXT: pcmpgtd %xmm4, %xmm1		; SSE2-NEXT: pcmpgtd %xmm9, %xmm4
; SSE2-NEXT: pand %xmm1, %xmm8		; SSE2-NEXT: pand %xmm4, %xmm1
; SSE2-NEXT: pandn %xmm5, %xmm1		; SSE2-NEXT: pandn %xmm5, %xmm4
; SSE2-NEXT: por %xmm8, %xmm1		; SSE2-NEXT: por %xmm4, %xmm1
; SSE2-NEXT: movdqa %xmm6, %xmm5		; SSE2-NEXT: movdqa %xmm6, %xmm4
; SSE2-NEXT: pxor %xmm9, %xmm5		; SSE2-NEXT: pxor %xmm8, %xmm4
; SSE2-NEXT: movdqa %xmm2, %xmm4		; SSE2-NEXT: movdqa %xmm2, %xmm5
; SSE2-NEXT: pxor %xmm9, %xmm4		; SSE2-NEXT: pxor %xmm8, %xmm5
; SSE2-NEXT: pcmpgtd %xmm5, %xmm4		; SSE2-NEXT: pcmpgtd %xmm4, %xmm5
; SSE2-NEXT: pand %xmm4, %xmm2		; SSE2-NEXT: pand %xmm5, %xmm2
; SSE2-NEXT: pandn %xmm6, %xmm4		; SSE2-NEXT: pandn %xmm6, %xmm5
; SSE2-NEXT: por %xmm2, %xmm4		; SSE2-NEXT: por %xmm5, %xmm2
; SSE2-NEXT: movdqa %xmm7, %xmm2		; SSE2-NEXT: movdqa %xmm7, %xmm4
; SSE2-NEXT: pxor %xmm9, %xmm2		; SSE2-NEXT: pxor %xmm8, %xmm4
; SSE2-NEXT: pxor %xmm3, %xmm9		; SSE2-NEXT: pxor %xmm3, %xmm8
; SSE2-NEXT: pcmpgtd %xmm2, %xmm9		; SSE2-NEXT: pcmpgtd %xmm4, %xmm8
; SSE2-NEXT: pand %xmm9, %xmm3		; SSE2-NEXT: pand %xmm8, %xmm3
; SSE2-NEXT: pandn %xmm7, %xmm9		; SSE2-NEXT: pandn %xmm7, %xmm8
; SSE2-NEXT: por %xmm9, %xmm3		; SSE2-NEXT: por %xmm8, %xmm3
; SSE2-NEXT: movdqa %xmm4, %xmm2
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: test150:		; SSE4-LABEL: test150:
; SSE4: # %bb.0: # %entry		; SSE4: # %bb.0: # %entry
; SSE4-NEXT: pmaxud %xmm4, %xmm0		; SSE4-NEXT: pmaxud %xmm4, %xmm0
; SSE4-NEXT: pmaxud %xmm5, %xmm1		; SSE4-NEXT: pmaxud %xmm5, %xmm1
; SSE4-NEXT: pmaxud %xmm6, %xmm2		; SSE4-NEXT: pmaxud %xmm6, %xmm2
; SSE4-NEXT: pmaxud %xmm7, %xmm3		; SSE4-NEXT: pmaxud %xmm7, %xmm3
▲ Show 20 Lines • Show All 3,429 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vselect-zero.ll

Show First 20 Lines • Show All 136 Lines • ▼ Show 20 Lines	; AVX-NEXT: retq
%r = select i1 %cond, double 12.0, double 42.0		%r = select i1 %cond, double 12.0, double 42.0
ret double %r		ret double %r
}		}

define <2 x double> @vsel_nonzero_constants(<2 x double> %x, <2 x double> %y) {		define <2 x double> @vsel_nonzero_constants(<2 x double> %x, <2 x double> %y) {
; SSE2-LABEL: vsel_nonzero_constants:		; SSE2-LABEL: vsel_nonzero_constants:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: cmplepd %xmm0, %xmm1		; SSE2-NEXT: cmplepd %xmm0, %xmm1
; SSE2-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; SSE2-NEXT: movsd {{.*#+}} xmm2 = mem[0],zero
; SSE2-NEXT: movapd %xmm1, %xmm2
; SSE2-NEXT: andnpd %xmm0, %xmm2
; SSE2-NEXT: andpd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
; SSE2-NEXT: orpd %xmm2, %xmm1
; SSE2-NEXT: movapd %xmm1, %xmm0		; SSE2-NEXT: movapd %xmm1, %xmm0
		; SSE2-NEXT: andnpd %xmm2, %xmm0
		; SSE2-NEXT: andpd {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1
		; SSE2-NEXT: orpd %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE42-LABEL: vsel_nonzero_constants:		; SSE42-LABEL: vsel_nonzero_constants:
; SSE42: # %bb.0:		; SSE42: # %bb.0:
; SSE42-NEXT: cmplepd %xmm0, %xmm1		; SSE42-NEXT: cmplepd %xmm0, %xmm1
; SSE42-NEXT: movsd {{.*#+}} xmm2 = mem[0],zero		; SSE42-NEXT: movsd {{.*#+}} xmm2 = mem[0],zero
; SSE42-NEXT: movapd %xmm1, %xmm0		; SSE42-NEXT: movapd %xmm1, %xmm0
; SSE42-NEXT: blendvpd %xmm0, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2		; SSE42-NEXT: blendvpd %xmm0, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
Show All 14 Lines

llvm/test/CodeGen/X86/x86-no_caller_saved_registers-preserve.ll

	Show All 36 Lines
	; CHECK-NEXT: movaps %xmm0, %xmm1			; CHECK-NEXT: movaps %xmm0, %xmm1
	; CHECK-NEXT: movl %esi, %ecx			; CHECK-NEXT: movl %esi, %ecx
	; CHECK-NEXT: movl %edi, %edx			; CHECK-NEXT: movl %edi, %edx
	; CHECK-NEXT: callq bar@PLT			; CHECK-NEXT: callq bar@PLT
	; CHECK-NEXT: addl %edx, %eax			; CHECK-NEXT: addl %edx, %eax
	; CHECK-NEXT: addl %ecx, %eax			; CHECK-NEXT: addl %ecx, %eax
	; CHECK-NEXT: xorps %xmm0, %xmm0			; CHECK-NEXT: xorps %xmm0, %xmm0
	; CHECK-NEXT: cvtsi2ss %eax, %xmm0			; CHECK-NEXT: cvtsi2ss %eax, %xmm0
	; CHECK-NEXT: addss %xmm0, %xmm1			; CHECK-NEXT: addss %xmm1, %xmm0
	; CHECK-NEXT: movaps %xmm1, %xmm0
	; CHECK-NEXT: popq %rax			; CHECK-NEXT: popq %rax
	; CHECK-NEXT: .cfi_def_cfa_offset 8			; CHECK-NEXT: .cfi_def_cfa_offset 8
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%call = call i32 @bar(i32 %a0, i32 %a1, float %b0)			%call = call i32 @bar(i32 %a0, i32 %a1, float %b0)
	%c0 = add i32 %a0, %call			%c0 = add i32 %a0, %call
	%c1 = add i32 %c0, %a1			%c1 = add i32 %c0, %a1
	%c2 = sitofp i32 %c1 to float			%c2 = sitofp i32 %c1 to float
	%c3 = fadd float %c2, %b0			%c3 = fadd float %c2, %b0
	ret float %c3			ret float %c3
	}			}

	attributes #0 = { "no_caller_saved_registers" }			attributes #0 = { "no_caller_saved_registers" }

llvm/test/CodeGen/X86/x86-shifts.ll

Show First 20 Lines • Show All 146 Lines • ▼ Show 20 Lines	entry:
%C = shl <8 x i16> %A, < i16 9, i16 7, i16 5, i16 1, i16 4, i16 1, i16 1, i16 1>		%C = shl <8 x i16> %A, < i16 9, i16 7, i16 5, i16 1, i16 4, i16 1, i16 1, i16 1>
%K = xor <8 x i16> %B, %C		%K = xor <8 x i16> %B, %C
ret <8 x i16> %K		ret <8 x i16> %K
}		}

define <2 x i64> @shr2_nosplat(<2 x i64> %A) nounwind {		define <2 x i64> @shr2_nosplat(<2 x i64> %A) nounwind {
; CHECK-LABEL: shr2_nosplat:		; CHECK-LABEL: shr2_nosplat:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: movdqa %xmm0, %xmm2
; CHECK-NEXT: psrlq $8, %xmm2
; CHECK-NEXT: movdqa %xmm0, %xmm1		; CHECK-NEXT: movdqa %xmm0, %xmm1
; CHECK-NEXT: psrlq $1, %xmm1		; CHECK-NEXT: psrlq $8, %xmm1
; CHECK-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,1],xmm1[2,3]		; CHECK-NEXT: movdqa %xmm0, %xmm2
; CHECK-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,1],xmm0[2,3]		; CHECK-NEXT: psrlq $1, %xmm2
; CHECK-NEXT: xorps %xmm2, %xmm1		; CHECK-NEXT: shufpd {{.*#+}} xmm1 = xmm1[0],xmm2[1]
; CHECK-NEXT: movaps %xmm1, %xmm0		; CHECK-NEXT: movsd {{.*#+}} xmm0 = xmm2[0],xmm0[1]
		; CHECK-NEXT: xorpd %xmm1, %xmm0
; CHECK-NEXT: ret{{[l\|q]}}		; CHECK-NEXT: ret{{[l\|q]}}
entry:		entry:
%B = lshr <2 x i64> %A, < i64 8, i64 1>		%B = lshr <2 x i64> %A, < i64 8, i64 1>
%C = lshr <2 x i64> %A, < i64 1, i64 0>		%C = lshr <2 x i64> %A, < i64 1, i64 0>
%K = xor <2 x i64> %B, %C		%K = xor <2 x i64> %B, %C
ret <2 x i64> %K		ret <2 x i64> %K
}		}

▲ Show 20 Lines • Show All 96 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[TwoAddressInstructionPass] Improve the SrcRegMap and DstRegMap computationClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 378815

llvm/lib/CodeGen/TwoAddressInstructionPass.cpp

llvm/test/CodeGen/ARM/ssat.ll

llvm/test/CodeGen/ARM/usat.ll

llvm/test/CodeGen/AVR/ctpop.ll

llvm/test/CodeGen/AVR/hardware-mul.ll

llvm/test/CodeGen/SystemZ/int-cmp-57.ll

llvm/test/CodeGen/Thumb/pr35836_2.ll

llvm/test/CodeGen/X86/DynamicCalleeSavedRegisters.ll

llvm/test/CodeGen/X86/abs.ll

llvm/test/CodeGen/X86/add-cmov.ll

llvm/test/CodeGen/X86/addsub-constant-folding.ll

llvm/test/CodeGen/X86/align-down.ll

llvm/test/CodeGen/X86/arithmetic_fence2.ll

llvm/test/CodeGen/X86/avg.ll

llvm/test/CodeGen/X86/avx512-inc-dec.ll

llvm/test/CodeGen/X86/avx512-mask-op.ll

llvm/test/CodeGen/X86/avx512-regcall-NoMask.ll

llvm/test/CodeGen/X86/avx512bw-mask-op.ll

llvm/test/CodeGen/X86/avx512dq-mask-op.ll

llvm/test/CodeGen/X86/bitreverse.ll

llvm/test/CodeGen/X86/bswap_tree2.ll

llvm/test/CodeGen/X86/cmp-concat.ll

llvm/test/CodeGen/X86/combine-mul.ll

llvm/test/CodeGen/X86/combine-mulo.ll

llvm/test/CodeGen/X86/combine-or.ll

llvm/test/CodeGen/X86/combine-sdiv.ll

llvm/test/CodeGen/X86/combine-smax.ll

llvm/test/CodeGen/X86/combine-smin.ll

llvm/test/CodeGen/X86/combine-sra.ll

llvm/test/CodeGen/X86/combine-srem.ll

llvm/test/CodeGen/X86/combine-srl.ll

llvm/test/CodeGen/X86/combine-udiv.ll

llvm/test/CodeGen/X86/ctpop-combine.ll

llvm/test/CodeGen/X86/fshl.ll

llvm/test/CodeGen/X86/fshr.ll

llvm/test/CodeGen/X86/funnel-shift.ll

llvm/test/CodeGen/X86/haddsub-shuf.ll

llvm/test/CodeGen/X86/haddsub-undef.ll

llvm/test/CodeGen/X86/haddsub.ll

llvm/test/CodeGen/X86/horizontal-reduce-fadd.ll

llvm/test/CodeGen/X86/horizontal-sum.ll

llvm/test/CodeGen/X86/i128-mul.ll

llvm/test/CodeGen/X86/iabs.ll

llvm/test/CodeGen/X86/imul.ll

llvm/test/CodeGen/X86/midpoint-int-vec-128.ll

llvm/test/CodeGen/X86/mul-constant-i16.ll

llvm/test/CodeGen/X86/mul-constant-i32.ll

llvm/test/CodeGen/X86/mul-constant-i64.ll

llvm/test/CodeGen/X86/mul-constant-i8.ll

llvm/test/CodeGen/X86/mul128.ll

llvm/test/CodeGen/X86/overflow.ll

llvm/test/CodeGen/X86/palignr.ll

llvm/test/CodeGen/X86/phaddsub.ll

llvm/test/CodeGen/X86/pmul.ll

llvm/test/CodeGen/X86/pmulh.ll

llvm/test/CodeGen/X86/popcnt.ll

llvm/test/CodeGen/X86/powi.ll

llvm/test/CodeGen/X86/pr42998.ll

llvm/test/CodeGen/X86/recip-fastmath.ll

llvm/test/CodeGen/X86/rev16.ll

llvm/test/CodeGen/X86/rot16.ll

llvm/test/CodeGen/X86/rotate-extract.ll

llvm/test/CodeGen/X86/rotate-multi.ll

llvm/test/CodeGen/X86/sat-add.ll

llvm/test/CodeGen/X86/sdiv_fix.ll

llvm/test/CodeGen/X86/select-constant-xor.ll

llvm/test/CodeGen/X86/select.ll

llvm/test/CodeGen/X86/shift-logic.ll

llvm/test/CodeGen/X86/smax.ll

llvm/test/CodeGen/X86/smin.ll

llvm/test/CodeGen/X86/smul_fix_sat.ll

llvm/test/CodeGen/X86/sqrt-fastmath-tune.ll

llvm/test/CodeGen/X86/sqrt-fastmath.ll

[TwoAddressInstructionPass] Improve the SrcRegMap and DstRegMap computation
ClosedPublic