This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/trunk/
-
trunk/
-
lib/CodeGen/
-
CodeGen/
6/7
MachineCSE.cpp
-
test/CodeGen/
-
CodeGen/
-
Mips/
-
internalfunc.ll
-
X86/
-
avx2-masked-gather.ll
-
masked_compressstore.ll
-
masked_gather.ll
-
masked_store.ll
-
masked_store_trunc.ll
-
masked_store_trunc_ssat.ll
-
masked_store_trunc_usat.ll

Differential D56772

[MIR] Add simple PRE pass to MachineCSE
ClosedPublic

Authored by anton-afanasyev on Jan 16 2019, 12:15 AM.

Download Raw Diff

Details

Reviewers

RKSimon
MatzeB
spatel
craig.topper
aemerson
qcolombet
atrick
rtereshin

Commits

rZORG3b8eade8a420: [MIR] Add simple PRE pass to MachineCSE
rZORGea3d1df9d6a7: [MIR] Add simple PRE pass to MachineCSE
rG3b8eade8a420: [MIR] Add simple PRE pass to MachineCSE
rGea3d1df9d6a7: [MIR] Add simple PRE pass to MachineCSE
rG9c20156de39b: [MIR] Add simple PRE pass to MachineCSE
rL359870: [MIR] Add simple PRE pass to MachineCSE

Summary

This is the second part of the commit fixing PR38917 (hoisting
partitially redundant machine instruction). Most of PRE (partitial
redundancy elimination) and CSE work is done on LLVM IR, but some of
redundancy arises during DAG legalization. Machine CSE is not enough
to deal with it. This simple PRE implementation works a little bit
intricately: it passes before CSE, looking for partitial redundancy
and transforming it to fully redundancy, anticipating that the next
CSE step will eliminate this created redundancy. If CSE doesn't
eliminate this, than created instruction will remain dead and eliminated
later by Remove Dead Machine Instructions pass.

The third part of the commit is supposed to refactor MachineCSE,
to make it more clear and to merge MachinePRE with MachineCSE,
so one need no rely on further Remove Dead pass to clear instrs
not eliminated by CSE.

First step: https://reviews.llvm.org/D54839

Fixes llvm.org/PR38917

Diff Detail

Repository: rL LLVM

Event Timeline

anton-afanasyev created this revision.Jan 16 2019, 12:15 AM

Herald added subscribers: llvm-commits, atanasyan, jrtc27, sdardis. · View Herald TranscriptJan 16 2019, 12:15 AM

Ping.
Should I clarify anything?

anton-afanasyev added reviewers: aemerson, qcolombet, atrick.Jan 18 2019, 8:05 AM

anton-afanasyev added a reviewer: rtereshin.Jan 18 2019, 1:40 PM

Ping!

In D56772#1365972, @anton-afanasyev wrote:

Ping!

FYI: Generally accepted ping frequency is once per week.

lib/CodeGen/MachineCSE.cpp
54 ↗	(On Diff #181982)	Our general style is not to use line continuations like this, but instead rely on adjacent string concatenation, so this would be: STATISTIC(NumPREs, "Number of partial redundant expression" " transformed to fully redundant"); (where the starting quotes are vertically aligned)
754 ↗	(On Diff #181982)	Comments should be full sentences and end with a period (or other punctuation). Also, please explain why the conditions are stronger in this case.
790 ↗	(On Diff #181982)	It looks like this could be: if (!PREMap.count(MI)) { PREMap[MI] = MBB; continue; } and then you don't need the else and extra associated indentation.
812 ↗	(On Diff #181982)	It would be better to not create, and then delete, instructions speculatively. isProfitableToCSE does look at the parent blocks of the instructions, but we could abstract that by: Making isProfitableToCSE also take the blocks of the instructions as arguments; explain that isProfitableToCSE treats the instructions as though they are in the specified parent blocks (even if they're not currently). Make an overload isProfitableToCSE which retains the current behavior (where the parent blocks come from the instructions themselves) which calls the underlying implementation from (1).

In D56772#1367096, @hfinkel wrote:

In D56772#1365972, @anton-afanasyev wrote:

Ping!

FYI: Generally accepted ping frequency is once per week.

Ok, thanks!

lib/CodeGen/MachineCSE.cpp
54 ↗	(On Diff #181982)	Ok, fixed.
754 ↗	(On Diff #181982)	Ok, changed.
790 ↗	(On Diff #181982)	Thanks, that is better! Fixed.
812 ↗	(On Diff #181982)	Thanks, changed. Actually isProfitableToCSE() doesn't need CSMI (new instr) as argument, only its basic block, so just changed function arglist.

anton-afanasyev updated this revision to Diff 183272.Jan 24 2019, 2:23 AM

anton-afanasyev marked 4 inline comments as done.

Have you measured the compile-time impact?

lib/CodeGen/MachineCSE.cpp
755 ↗	(On Diff #183272)	I think it would be useful to elaborate on under what conditions we create these PRE instructions that are not later CSEd. Do you know how often that happens (I assume that you can figure this out by looking at the statistics and comparing runs where this happens vs. where it doesn't)?

In D56772#1369571, @hfinkel wrote:

Have you measured the compile-time impact?

What do you mean by compile-time impact? I've run test suite of course, compared with baseline.
The results for exec_time and size..text metrics are like here:

> ~/llvm/test-suite/utils/compare.py  --filter-short -m exec_time ~/llvm/test-suite-results/results_rel_base.json ~/llvm/test-suite-results/results_rel_exp3.json 
...
Program                                         results_rel_base  results_rel_exp3 diff  
                                                                                        
MicroBench...RayFDRMultiThreaded/threads:32   1055.94           931.21            -11.8%
Bitcode/Be...rid/halide_bilateral_grid.test    30.26             26.70            -11.8%
MultiSourc...mbolics-flt/Symbolics-flt.test     1.10              0.98            -10.9%
MicroBench...XRayFDRMultiThreaded/threads:2   497.85            547.92            10.1% 
MicroBench...lcalsCRaw.test:BM_EOS_RAW/5001    10.33              9.49            -8.2% 
MicroBench...bda.test:BM_PIC_1D_LAMBDA/5001    75.75             81.43             7.5% 
MicroBench...XRayFDRMultiThreaded/threads:8   1029.95           1100.16            6.8% 
MicroBench...XRayFDRMultiThreaded/threads:4   626.46            667.17             6.5% 
MicroBench...ambda.test:BM_EOS_LAMBDA/44217    87.21             92.66             6.2% 
MultiSourc...flt/LoopRestructuring-flt.test     3.76              3.53            -6.2% 
MicroBench...calsCRaw.test:BM_EOS_RAW/44217    85.94             90.96             5.8% 
MicroBench...Lambda.test:BM_ADI_LAMBDA/5001   128.27            135.35             5.5% 
MicroBench...est:BM_ReturnNeverInstrumented     1.60              1.68             5.3% 
MicroBench....test:BM_MULADDSUB_LAMBDA/5001    14.14             14.84             4.9% 
SingleSour...ncils/fdtd-apml/fdtd-apml.test     0.63              0.66             4.4%
...
> ~/llvm/test-suite/utils/compare.py  --filter-short -m size..text ~/llvm/test-suite-results/results_rel_base.json ~/llvm/test-suite-results/results_rel_exp3.json 
...
Program                                         results_rel_base  results_rel_exp3 diff 
                                                                                       
SingleSour...marks/Shootout/Shootout-random   658.00            642.00            -2.4%
SingleSour...ce/UnitTests/SignlessTypes/rem   4834.00           4930.00            2.0%
SingleSour...ootout-C++/Shootout-C++-random   818.00            802.00            -2.0%
MultiSource/Benchmarks/Olden/mst/mst          2658.00           2706.00            1.8%
SingleSource/Benchmarks/Misc/ffbench          2322.00           2290.00           -1.4%
MultiSource/Benchmarks/NPB-serial/is/is       4946.00           4898.00           -1.0%
MultiSource/Benchmarks/McCat/18-imp/imp       13266.00          13138.00          -1.0%
MultiSourc...rks/McCat/03-testtrie/testtrie   1810.00           1794.00           -0.9%
MultiSourc...chmarks/McCat/01-qbsort/qbsort   2066.00           2050.00           -0.8%
MultiSourc...iabench/g721/g721encode/encode   7394.00           7346.00           -0.6%
SingleSource/Benchmarks/Misc/fbench           2546.00           2562.00            0.6%
SingleSour...ce/Benchmarks/Misc/ReedSolomon   11170.00          11234.00           0.6%
SingleSource/Benchmarks/Stanford/Towers       2802.00           2786.00           -0.6%
MultiSourc...e/Applications/SIBsim4/SIBsim4   47666.00          47938.00           0.6%
MultiSourc...OE-ProxyApps-C/miniGMG/miniGMG   76258.00          76674.00           0.5%

Although I'm not sure exec_time is good metrics. I've also tried compile_time, never used it before:

~/llvm/test-suite/utils/compare.py  --filter-short -m compile_time ~/llvm/test-suite-results/results_rel_base.json ~/llvm/test-suite-results/results_rel_exp3.json 
...
Program                                         results_rel_base  results_rel_exp3 diff 
                                                                                       
SingleSour.../Benchmarks/Misc-C++/Large/ray     0.68              0.74             7.6%
MultiSourc...Prolangs-C/simulator/simulator     1.56              1.64             5.7%
MultiSource/Benchmarks/McCat/18-imp/imp         0.82              0.78            -5.3%
MultiSourc...OE-ProxyApps-C/RSBench/rsbench     0.88              0.84            -4.6%
MultiSource/Benchmarks/Ptrdist/bc/bc            2.42              2.52             4.1%
SingleSour...enchmarks/CoyoteBench/fftbench     1.08              1.03            -4.1%
SingleSour...UnitTests/Vectorizer/gcc-loops     1.42              1.48             3.9%
MultiSourc...chmarks/Prolangs-C++/city/city     3.20              3.08            -3.9%
MultiSource/Benchmarks/sim/sim                  0.72              0.75             3.9%
MultiSourc...nchmarks/FreeBench/pifft/pifft     2.56              2.65             3.6%
MultiSource/Applications/spiff/spiff            1.58              1.64             3.5%
MultiSourc...lds-flt/CrossingThresholds-flt     3.80              3.94             3.5%
MultiSourc...s/Prolangs-C/compiler/compiler     0.84              0.81            -3.3%
MultiSourc...rks/Prolangs-C++/employ/employ     0.74              0.71            -3.3%
SingleSour...ks/Misc-C++/stepanov_container     3.01              3.11             3.2%
...

Also one can see many tests increased their machine-cse.NumCSEs statistics (meaning that PRE step created common subexpressions eliminated by CSE):

> ~/llvm/test-suite/utils/compare.py  --filter-short -m machine-cse.NumCSEs ~/llvm/test-suite-results_deb_base.json ~/llvm/test-suite-results/results_deb_exp.json
...
Program                                         results_deb_base  results_deb_exp diff   
                                                                                        
SingleSour...ce/UnitTests/SignlessTypes/rem     1.00             19.00           1800.0%
MultiSource/Benchmarks/llubenchmark/llu         1.00             10.00           900.0% 
MultiSource/Benchmarks/NPB-serial/is/is         1.00              9.00           800.0% 
SingleSource/Benchmarks/Misc/fbench             1.00              7.00           600.0% 
MultiSourc...OE-ProxyApps-C/XSBench/XSBench     2.00              8.00           300.0% 
SingleSource/Benchmarks/Misc/ffbench            2.00              8.00           300.0% 
SingleSour...chmarks/Misc-C++/stepanov_v1p2     1.00              3.00           200.0% 
MultiSourc...arks/FreeBench/distray/distray     7.00             20.00           185.7% 
MicroBench.../ImageProcessing/Dither/Dither     3.00              8.00           166.7% 
MultiSourc...ench/telecomm-FFT/telecomm-fft     5.00             13.00           160.0% 
MultiSourc...enchmarks/mafft/pairlocalalign   482.00            1214.00          151.9% 
MultiSourc...aran/netbench-url/netbench-url     3.00              7.00           133.3% 
MultiSourc...Benchmarks/SciMark2-C/scimark2     6.00             13.00           116.7% 
MultiSourc...nch/mpeg2/mpeg2dec/mpeg2decode    57.00            115.00           101.8% 
MultiSourc...chmarks/McCat/01-qbsort/qbsort     2.00              4.00           100.0%
...

lib/CodeGen/MachineCSE.cpp
755 ↗	(On Diff #183272)	Thanks for pointing this out, I've cleaned this place. I've removed needless checks like `MI->isReturn()` after comparing statistics (no change). Mostly, these checks are implicitly done while CSE work (not inside `isCSECandidate()`). I've left aux checks of virtual registers though -- they are also implicitly done. I've also updated comment. This looks artificially, but I'm going to refactor this place in the third (and last) step of this work -- merging PRE and CSE, so we need no different checks.

anton-afanasyev updated this revision to Diff 184185.Jan 29 2019, 2:55 PM

Fixed revision, forgot to add changes.

Rebase

Ping. Does it have a chance to get lgtm?

@hfinkel @MatzeB Any comments?

Ping. Please, review this.

hfinkel added inline comments.Feb 26 2019, 12:03 PM

lib/CodeGen/MachineCSE.cpp
800 ↗	(On Diff #185240)	Are these calls expensive? SingleSour.../Benchmarks/Misc-C++/Large/ray 0.68 0.74 7.6% That 7% increase in compile time, and a few other others, look significant. (Maybe there's something you can cache?)

anton-afanasyev marked an inline comment as done.Feb 26 2019, 2:15 PM

anton-afanasyev added inline comments.

lib/CodeGen/MachineCSE.cpp
800 ↗	(On Diff #185240)	I believe caching this gives nothing, cause two common subexpressions unlikely belong to the same basic blocks pair. 7% are only for one test among hundreds, there are also -5% and so on. I'm to run benchmarks again to compare results.

Hi @hfinkel,
Unfortunately, the results of compile_time are unstable and not reproducible. Below are two different runs.

The first run:

> ~/llvm/test-suite/utils/compare.py  --filter-short -m compile_time ~/llvm/test-suite-results/results_rel_base.json ~/llvm/test-suite-results/results_rel_exp.json 
Tests: 1163
Short Running: 1010 (filtered out)
Remaining: 153
Metric: compile_time

Program                                         results_rel_base  results_rel_exp diff 
                                                                                      
MultiSourc...OE-ProxyApps-C/XSBench/XSBench     0.74              0.79            6.5%
MicroBench...y/ReturnReference/retref-bench     1.24              1.17           -6.1%
SingleSour...rks/Misc-C++/Large/sphereflake     0.71              0.68           -4.5%
MultiSourc...ps-C++/HACCKernels/HACCKernels     0.72              0.76            4.4%
MultiSourc...chmarks/Prolangs-C/gnugo/gnugo     1.40              1.34           -4.3%
MultiSourc...rks/Prolangs-C++/employ/employ     0.76              0.73           -4.2%
MicroBench...arks/ImageProcessing/Blur/blur     1.61              1.55           -4.0%
MultiSourc...rks/Trimaran/enc-3des/enc-3des     0.62              0.65            3.8%
MultiSourc...rks/mediabench/gsm/toast/toast     2.29              2.38            3.7%
MultiSourc...Benchmarks/SciMark2-C/scimark2     0.79              0.82            3.6%
MicroBench.../ImageProcessing/Dilate/Dilate     1.32              1.36            2.7%
MicroBench...oopInterchange/LoopInterchange     0.74              0.72           -2.7%
MultiSourc...s/Prolangs-C/unix-tbl/unix-tbl     2.22              2.16           -2.7%
MultiSourc...rolangs-C/archie-client/archie     1.20              1.17           -2.7%
MultiSourc...marks/Prolangs-C/loader/loader     0.62              0.60           -2.6%
       results_rel_base  results_rel_exp        diff
count  153.000000        152.000000       152.000000
mean   7.235216          7.270763        -0.000904  
std    12.322023         12.328571        0.016021  
min    0.600000          0.604000        -0.061093  
25%    1.516000          1.535000        -0.007504  
50%    3.784000          3.800000         0.000000  
75%    5.568000          5.581000         0.006387  
max    88.724000         88.972000        0.064516

and the second run:

> ~/llvm/test-suite/utils/compare.py  --filter-short -m compile_time ~/llvm/test-suite-results/results_rel_base2.json ~/llvm/test-suite-results/results_rel_exp2.json 
Tests: 1163
Short Running: 1009 (filtered out)
Remaining: 154
Metric: compile_time

Program                                         results_rel_base2  results_rel_exp2 diff 
                                                                                        
ultiSource/Benchmarks/McCat/09-vor/vor          0.66               0.62            -6.6%
ultiSource...Benchmarks/SciMark2-C/scimark2     0.80               0.75            -5.5%
ultiSource...rolangs-C/archie-client/archie     1.16               1.22             5.2%
ultiSource...OE-ProxyApps-C/XSBench/XSBench     0.79               0.76            -4.1%
ultiSource/Benchmarks/McCat/18-imp/imp          0.80               0.83             4.0%
ultiSource...OE-ProxyApps-C/RSBench/rsbench     0.87               0.90             3.7%
ultiSource...rks/Trimaran/enc-3des/enc-3des     0.66               0.63            -3.7%
ultiSource...hmarks/MallocBench/cfrac/cfrac     1.64               1.70             3.6%
icroBenchm.../ImageProcessing/Dilate/Dilate     1.37               1.32            -3.5%
ultiSource...ALAC/decode/alacconvert-decode     2.41               2.34            -3.0%
ultiSource...chmarks/Prolangs-C++/city/city     3.22               3.13            -3.0%
ultiSource...xyApps-C/Pathfinder/PathFinder     1.77               1.72            -2.9%
ultiSource...s/Prolangs-C/compiler/compiler     0.86               0.84            -2.8%
ultiSource...rks/Prolangs-C++/employ/employ     0.73               0.71            -2.7%
ultiSource/Applications/sgefa/sgefa             0.99               1.02             2.4%
       results_rel_base2  results_rel_exp2        diff
count  152.000000         153.000000        151.000000
mean   7.284842           7.236418         -0.002551  
std    12.346005          12.320806         0.015407  
min    0.600000           0.604000         -0.066265  
25%    1.567000           1.504000         -0.009324  
50%    3.794000           3.776000         -0.001112  
75%    5.609000           5.584000          0.005669  
max    89.004000          89.036000         0.051724

Also, I don't think the heavy functions here (like findNearestCommonDominator() and isPotentiallyReachable()) can significant impact compile time -- they are called rarely only for two BBs with common subexpressions, which is unusual. Taking the machine-cse.NumCSE statistics above as example, one can make an estimation of no more than 10-100 calls of these functions for the benchs from test suite. Also, these heavy calls are already cached in a sense, they are using prebuilt Machine Dominator Tree.

Hi all, please review this.

@hfinkel, should I clarify anything?

Ping!

Rebase. Please, review this.

Herald added a project: Restricted Project. · View Herald TranscriptApr 24 2019, 3:06 AM

Herald added a subscriber: hiraditya. · View Herald Transcript

Harbormaster completed remote builds in B30931: Diff 196406.Apr 24 2019, 3:08 AM

@hfinkel Any more comments?

LGTM - based on the improved codegen and the negligible effect on compile time. Thanks.

llvm/lib/CodeGen/MachineCSE.cpp
784 ↗	(On Diff #196406)	Very minor - but why can't the ++I be moved inside the for-loop increment statement?

This revision is now accepted and ready to land.Apr 30 2019, 6:01 AM

anton-afanasyev marked an inline comment as done.Apr 30 2019, 6:26 AM

anton-afanasyev added inline comments.

llvm/lib/CodeGen/MachineCSE.cpp
784 ↗	(On Diff #196406)	It can, I'm to fix it, thanks.

Small fix and tests update

Harbormaster completed remote builds in B31156: Diff 197328.Apr 30 2019, 7:53 AM

RKSimon added inline comments.Apr 30 2019, 8:11 AM

llvm/lib/CodeGen/MachineCSE.cpp
784 ↗	(On Diff #196406)	This one too?

anton-afanasyev marked an inline comment as done.Apr 30 2019, 8:16 AM

anton-afanasyev added inline comments.

llvm/lib/CodeGen/MachineCSE.cpp
784 ↗	(On Diff #196406)	Hmm, looks like I've eventually fixed L506 -- the original loop inside `ProcessBlockCSE()` instead of `ProcessBlockPRE()`.

Update, clang-format

Harbormaster completed remote builds in B31335: Diff 197938.May 3 2019, 2:56 AM

Closed by commit rL359870: [MIR] Add simple PRE pass to MachineCSE (authored by anton-afanasyev). · Explain WhyMay 3 2019, 3:29 AM

This revision was automatically updated to reflect the committed changes.

We should reopen this review since the patch was reverted at rL359875?

anton-afanasyev reopened this revision.May 3 2019, 7:51 AM

This revision is now accepted and ready to land.May 3 2019, 7:51 AM

Closed by commit https://reviews.llvm.org/rL362901

This is causing incorrect code generation for this piece of IR:

target datalayout = "e-m:e-i8:8:32-i16:16:32-i64:64-i128:128-n32:64-S128"
target triple = "aarch64-arm-none-eabi"

@var = hidden local_unnamed_addr global i32 0, align 4
@_ZTIi = external dso_local constant i8*
declare dso_local void @_Z2fnv() local_unnamed_addr #1
declare dso_local i32 @__gxx_personality_v0(...)
declare i32 @llvm.eh.typeid.for(i8*) #2
declare dso_local i8* @__cxa_begin_catch(i8*) local_unnamed_addr
declare dso_local void @__cxa_end_catch() local_unnamed_addr

define hidden i32 @_Z7examplev() personality i8* bitcast (i32 (...)* @__gxx_personality_v0 to i8*) {
entry:
  invoke void @_Z2fnv()
          to label %try.cont unwind label %lpad

lpad:                                             ; preds = %entry
  %0 = landingpad { i8*, i32 }
          catch i8* bitcast (i8** @_ZTIi to i8*)
          catch i8* null
  %1 = extractvalue { i8*, i32 } %0, 0
  %2 = extractvalue { i8*, i32 } %0, 1
  %3 = tail call i32 @llvm.eh.typeid.for(i8* bitcast (i8** @_ZTIi to i8*))
  %matches = icmp eq i32 %2, %3
  %4 = tail call i8* @__cxa_begin_catch(i8* %1)
  %5 = load i32, i32* @var, align 4
  br i1 %matches, label %catch1, label %catch

catch1:                                           ; preds = %lpad
  %or3 = or i32 %5, 4
  store i32 %or3, i32* @var, align 4
  tail call void @__cxa_end_catch()
  br label %try.cont

try.cont:                                         ; preds = %entry, %catch1, %catch
  %6 = load i32, i32* @var, align 4
  ret i32 %6

catch:                                            ; preds = %lpad
  %or = or i32 %5, 8
  store i32 %or, i32* @var, align 4
  tail call void @__cxa_end_catch()
  br label %try.cont
}

As part of the accesses to var an ADRP instruction is being generated and MachineCSE is hoisting it to the entry block, but it gets hoisted to after the call to fn so when we catch an exception the ADRP hasn't been executed so the loads and stores use an undefined base register.

This revision is now accepted and ready to land.Jun 11 2019, 4:33 AM

In D56772#1537772, @john.brawn wrote:

This is causing incorrect code generation for this piece of IR:

...
As part of the accesses to var an ADRP instruction is being generated and MachineCSE is hoisting it to the entry block, but it gets hoisted to after the call to fn so when we catch an exception the ADRP hasn't been executed so the loads and stores use an undefined base register.

Hi @john.brawn , thanks, I'm looking into it. At first glance, this instruction should have special flag to being non-hoistable.

The issue actually is not with this instruction, but it's related to exception handling. Hoisted instruction is inserted before getFirstTerminator(), but there could be EH_LABEL's which are not terminators, but could change control flow.
I'm to fix it.

Hi @john.brawn , here is the fix, could you please look to it: https://reviews.llvm.org/D63148

Last issue fixed by this revision: https://reviews.llvm.org/D63148

LuoYuanke added a subscriber: LuoYuanke.Jun 19 2019, 7:50 PM

LuoYuanke added inline comments.

llvm/trunk/lib/CodeGen/MachineCSE.cpp
814	Do we need to enhance the algorithm to consider more about register pressure on the profit calculation? I'm afraid there is performance drop when the register pressure is heavy.

anton-afanasyev marked 2 inline comments as done.Jun 21 2019, 8:19 AM

anton-afanasyev added inline comments.

llvm/trunk/lib/CodeGen/MachineCSE.cpp
814	Hi @LuoYuanke, yes, this could be the case. Actually this commit doesn't change profit calculation, `ProcessBlockPRE()` uses the same `isProfitableToCommit()` function as `ProcessBlockCSE()` uses. Do you have concrete test cases where register pressure increases?

LuoYuanke added inline comments.Jun 22 2019, 6:15 PM

llvm/trunk/lib/CodeGen/MachineCSE.cpp
814	CSE only eliminate MI, but current PRE insert MI to the common dominated block, so the instruction is hoisted to dominated block. It increase register pressure more than CSE. I have some cases that got performance regression with this patch due to the register pressure, but I am not able to extract a small case from it. I notice in LICM, MachineLICMBase::IsProfitableToHoist() is more considerate for the register pressure. I wonder if PRE can apply the same algorithm. Do you have any idea for a better register pressure solution?

anton-afanasyev marked 3 inline comments as done.Jun 23 2019, 2:58 PM

anton-afanasyev added inline comments.

llvm/trunk/lib/CodeGen/MachineCSE.cpp
814	Hi @LuoYuanke, actually PRE doesn't hoist instruction, but _duplicates_ it, real hoisting is made by CSE when it _eliminates_ instruction. I do believe that CSE should consider register pressure while eliminating instruction. Have you tried `MachineLICMBase::isProfitableToHoist()` with your test case? We can adopt and insert it to CSE.

LuoYuanke added inline comments.Jul 1 2019, 6:14 PM

llvm/trunk/lib/CodeGen/MachineCSE.cpp
814	Hi @anton-afanasyev, sorry for reply late. I'm trying to figure out this issue, but it seems complex for me. Can you run SPEC cpu2017/500.perlbench_r? There is some significant performance drop on X86 with the patch. If you have resource to run the benchmark, could you help to look into the issue?

@anton-afanasyev
Hi,
Did you look into the SPEC cpu2017/500.perlbench_r issue? There is some significant performance drop on X86 with the patch. I ask you to revert the patch first, and when the SPEC2017 regression is fixed, we can submit the patch again. How do you think?

In D56772#1592951, @LuoYuanke wrote:

@anton-afanasyev
Hi,
Did you look into the SPEC cpu2017/500.perlbench_r issue? There is some significant performance drop on X86 with the patch. I ask you to revert the patch first, and when the SPEC2017 regression is fixed, we can submit the patch again. How do you think?

Hi @LuoYuanke, I'm sorry, it looks like my previous answer to you remained unsubmitted.
Here it is:

Hi @LuoYuanke , I have only access to SPEC cpu2006, I see 400.perlbench there. Could it be the case you know regressed sample from cpu2006?
Also, I have prepared new patch for review: https://reviews.llvm.org/D63934 -- I believe it can potentially decrease reg pressure.

At the moment, I believe that another patch (from Kai Luo) https://reviews.llvm.org/D64394 fixes this regression.

Btw, this fix (https://reviews.llvm.org/D64394) was commited recently.

lkail added a subscriber: lkail.Jul 20 2019, 8:07 AM

lkail added inline comments.

llvm/trunk/lib/CodeGen/MachineCSE.cpp
807	Hi @anton-afanasyev , I have a concern here that CFG of LLVM IR might not be equivalent to CFG of Machine IR.

@anton-afanasyev
Hi,
Do you have any performance data for the patch? I'd like to know what benchmark has performance gain with your patch. https://reviews.llvm.org/D64394 fixed perlbench regression, but I wonder what the performance gain do we achieve with the 2 patch?

In D56772#1596814, @LuoYuanke wrote:

@anton-afanasyev
Hi,
Do you have any performance data for the patch? I'd like to know what benchmark has performance gain with your patch. https://reviews.llvm.org/D64394 fixed perlbench regression, but I wonder what the performance gain do we achieve with the 2 patch?

Hi @LuoYuanke, I've benchmarked the first patch and posted results in two posts started from here: https://reviews.llvm.org/D56772#1376284.
But you are right: with the second patch the performance gain may be eliminated! I'm to measure second patch effect.

llvm/trunk/lib/CodeGen/MachineCSE.cpp
807	Hi @lkail, yes this is possible case. But that is not an issue actually, for this case in place it would be just non-optimization. PRE will create instruction, but if CSE doesn't eliminate original instructions, than "hoisted" instruction will be deleted by Remove Dead Machine Instructions pass later.

Hi @LuoYuanke, I've benchmarked the effect of the revertion my and @lkail patches.
The benchmark showed some increase of the exec_time:

~/llvm/test-suite/utils/compare.py  --filter-short -m exec_time ~/llvm/test-suite-results/results_rel_base.json ~/llvm/test-suite-results/results_rel_base2.json vs ~/llvm/test-suite-results/results_rel_exp.json  ~/llvm/test-suite-results/results_rel_exp2.json 

Program                                        lhs    rhs     diff 
 test-suite...Raw.test:BM_MULADDSUB_RAW/5001    13.96  17.35  24.3%
 test-suite...XRayFDRMultiThreaded/threads:4   568.16 634.38  11.7%
 test-suite...RayFDRMultiThreaded/threads:32   858.02 944.45  10.1%
 test-suite...XRayFDRMultiThreaded/threads:2   464.93 501.92   8.0%
 test-suite...algebra/kernels/symm/symm.test    14.00  15.12   7.9%
 test-suite...st:BM_BAND_LIN_EQ_LAMBDA/44217    39.41  37.34  -5.2%
 test-suite...test:BM_MULADDSUB_LAMBDA/44217   141.97 148.38   4.5%
 test-suite...Lambda.test:BM_EOS_LAMBDA/5001     9.88   9.48  -4.0%
 test-suite...ambda.test:BM_EOS_LAMBDA/44217    89.08  85.78  -3.7%
 test-suite...s/Halide/blur/halide_blur.test     1.77   1.83   3.6%
 test-suite...BenchmarkGame/Large/fasta.test     0.72   0.70  -3.3%
 test-suite...lcalsCRaw.test:BM_EOS_RAW/5001     9.86   9.54  -3.3%
 test-suite...calsCRaw.test:BM_EOS_RAW/44217    88.90  86.00  -3.3%
 test-suite...XRayFDRMultiThreaded/threads:8   983.92 1014.32  3.1%
 test-suite...RayFDRMultiThreaded/threads:16   979.55 1008.68  3.0%

So I'd like to leave these changes unreverted and to proceed with particular patches (like this one https://reviews.llvm.org/D63934). Please tell if you have any objections.

@anton-afanasyev, I have no objection. Thank you for the effort to improve the performance.

Revision Contents

Path

Size

llvm/

trunk/

lib/

CodeGen/

MachineCSE.cpp

126 lines

test/

CodeGen/

Mips/

internalfunc.ll

3 lines

X86/

avx2-masked-gather.ll

48 lines

masked_compressstore.ll

1013 lines

masked_gather.ll

94 lines

masked_store.ll

722 lines

masked_store_trunc.ll

531 lines

masked_store_trunc_ssat.ll

527 lines

masked_store_trunc_usat.ll

535 lines

Diff 197945

llvm/trunk/lib/CodeGen/MachineCSE.cpp

Show All 13 Lines

#include "llvm/ADT/DenseMap.h"		#include "llvm/ADT/DenseMap.h"
#include "llvm/ADT/ScopedHashTable.h"		#include "llvm/ADT/ScopedHashTable.h"
#include "llvm/ADT/SmallPtrSet.h"		#include "llvm/ADT/SmallPtrSet.h"
#include "llvm/ADT/SmallSet.h"		#include "llvm/ADT/SmallSet.h"
#include "llvm/ADT/SmallVector.h"		#include "llvm/ADT/SmallVector.h"
#include "llvm/ADT/Statistic.h"		#include "llvm/ADT/Statistic.h"
#include "llvm/Analysis/AliasAnalysis.h"		#include "llvm/Analysis/AliasAnalysis.h"
		#include "llvm/Analysis/CFG.h"
#include "llvm/CodeGen/MachineBasicBlock.h"		#include "llvm/CodeGen/MachineBasicBlock.h"
#include "llvm/CodeGen/MachineDominators.h"		#include "llvm/CodeGen/MachineDominators.h"
#include "llvm/CodeGen/MachineFunction.h"		#include "llvm/CodeGen/MachineFunction.h"
#include "llvm/CodeGen/MachineFunctionPass.h"		#include "llvm/CodeGen/MachineFunctionPass.h"
#include "llvm/CodeGen/MachineInstr.h"		#include "llvm/CodeGen/MachineInstr.h"
#include "llvm/CodeGen/MachineOperand.h"		#include "llvm/CodeGen/MachineOperand.h"
#include "llvm/CodeGen/MachineRegisterInfo.h"		#include "llvm/CodeGen/MachineRegisterInfo.h"
#include "llvm/CodeGen/Passes.h"		#include "llvm/CodeGen/Passes.h"
Show All 14 Lines
#include <vector>		#include <vector>

using namespace llvm;		using namespace llvm;

#define DEBUG_TYPE "machine-cse"		#define DEBUG_TYPE "machine-cse"

STATISTIC(NumCoalesces, "Number of copies coalesced");		STATISTIC(NumCoalesces, "Number of copies coalesced");
STATISTIC(NumCSEs, "Number of common subexpression eliminated");		STATISTIC(NumCSEs, "Number of common subexpression eliminated");
		STATISTIC(NumPREs, "Number of partial redundant expression"
		" transformed to fully redundant");
STATISTIC(NumPhysCSEs,		STATISTIC(NumPhysCSEs,
"Number of physreg referencing common subexpr eliminated");		"Number of physreg referencing common subexpr eliminated");
STATISTIC(NumCrossBBCSEs,		STATISTIC(NumCrossBBCSEs,
"Number of cross-MBB physreg referencing CS eliminated");		"Number of cross-MBB physreg referencing CS eliminated");
STATISTIC(NumCommutes, "Number of copies coalesced after commuting");		STATISTIC(NumCommutes, "Number of copies coalesced after commuting");

namespace {		namespace {

Show All 19 Lines	void getAnalysisUsage(AnalysisUsage &AU) const override {
AU.addRequired<AAResultsWrapperPass>();		AU.addRequired<AAResultsWrapperPass>();
AU.addPreservedID(MachineLoopInfoID);		AU.addPreservedID(MachineLoopInfoID);
AU.addRequired<MachineDominatorTree>();		AU.addRequired<MachineDominatorTree>();
AU.addPreserved<MachineDominatorTree>();		AU.addPreserved<MachineDominatorTree>();
}		}

void releaseMemory() override {		void releaseMemory() override {
ScopeMap.clear();		ScopeMap.clear();
		PREMap.clear();
Exps.clear();		Exps.clear();
}		}

private:		private:
using AllocatorTy = RecyclingAllocator<BumpPtrAllocator,		using AllocatorTy = RecyclingAllocator<BumpPtrAllocator,
ScopedHashTableVal<MachineInstr *, unsigned>>;		ScopedHashTableVal<MachineInstr *, unsigned>>;
using ScopedHTType =		using ScopedHTType =
ScopedHashTable<MachineInstr *, unsigned, MachineInstrExpressionTrait,		ScopedHashTable<MachineInstr *, unsigned, MachineInstrExpressionTrait,
AllocatorTy>;		AllocatorTy>;
using ScopeType = ScopedHTType::ScopeTy;		using ScopeType = ScopedHTType::ScopeTy;
using PhysDefVector = SmallVector<std::pair<unsigned, unsigned>, 2>;		using PhysDefVector = SmallVector<std::pair<unsigned, unsigned>, 2>;

unsigned LookAheadLimit = 0;		unsigned LookAheadLimit = 0;
DenseMap<MachineBasicBlock , ScopeType > ScopeMap;		DenseMap<MachineBasicBlock , ScopeType > ScopeMap;
		DenseMap<MachineInstr , MachineBasicBlock , MachineInstrExpressionTrait>
		PREMap;
ScopedHTType VNT;		ScopedHTType VNT;
SmallVector<MachineInstr *, 64> Exps;		SmallVector<MachineInstr *, 64> Exps;
unsigned CurrVN = 0;		unsigned CurrVN = 0;

bool PerformTrivialCopyPropagation(MachineInstr *MI,		bool PerformTrivialCopyPropagation(MachineInstr *MI,
MachineBasicBlock *MBB);		MachineBasicBlock *MBB);
bool isPhysDefTriviallyDead(unsigned Reg,		bool isPhysDefTriviallyDead(unsigned Reg,
MachineBasicBlock::const_iterator I,		MachineBasicBlock::const_iterator I,
MachineBasicBlock::const_iterator E) const;		MachineBasicBlock::const_iterator E) const;
bool hasLivePhysRegDefUses(const MachineInstr *MI,		bool hasLivePhysRegDefUses(const MachineInstr *MI,
const MachineBasicBlock *MBB,		const MachineBasicBlock *MBB,
SmallSet<unsigned, 8> &PhysRefs,		SmallSet<unsigned, 8> &PhysRefs,
PhysDefVector &PhysDefs, bool &PhysUseDef) const;		PhysDefVector &PhysDefs, bool &PhysUseDef) const;
bool PhysRegDefsReach(MachineInstr CSMI, MachineInstr MI,		bool PhysRegDefsReach(MachineInstr CSMI, MachineInstr MI,
SmallSet<unsigned, 8> &PhysRefs,		SmallSet<unsigned, 8> &PhysRefs,
PhysDefVector &PhysDefs, bool &NonLocal) const;		PhysDefVector &PhysDefs, bool &NonLocal) const;
bool isCSECandidate(MachineInstr *MI);		bool isCSECandidate(MachineInstr *MI);
bool isProfitableToCSE(unsigned CSReg, unsigned Reg,		bool isProfitableToCSE(unsigned CSReg, unsigned Reg,
MachineInstr CSMI, MachineInstr MI);		MachineBasicBlock CSBB, MachineInstr MI);
void EnterScope(MachineBasicBlock *MBB);		void EnterScope(MachineBasicBlock *MBB);
void ExitScope(MachineBasicBlock *MBB);		void ExitScope(MachineBasicBlock *MBB);
bool ProcessBlock(MachineBasicBlock *MBB);		bool ProcessBlockCSE(MachineBasicBlock *MBB);
void ExitScopeIfDone(MachineDomTreeNode *Node,		void ExitScopeIfDone(MachineDomTreeNode *Node,
DenseMap<MachineDomTreeNode*, unsigned> &OpenChildren);		DenseMap<MachineDomTreeNode*, unsigned> &OpenChildren);
bool PerformCSE(MachineDomTreeNode *Node);		bool PerformCSE(MachineDomTreeNode *Node);

		bool isPRECandidate(MachineInstr *MI);
		bool ProcessBlockPRE(MachineDominatorTree MDT, MachineBasicBlock MBB);
		bool PerformSimplePRE(MachineDominatorTree *DT);
};		};

} // end anonymous namespace		} // end anonymous namespace

char MachineCSE::ID = 0;		char MachineCSE::ID = 0;

char &llvm::MachineCSEID = MachineCSE::ID;		char &llvm::MachineCSEID = MachineCSE::ID;

▲ Show 20 Lines • Show All 266 Lines • ▼ Show 20 Lines	bool MachineCSE::isCSECandidate(MachineInstr *MI) {
// be spilled and get loaded back with corrupted data.		// be spilled and get loaded back with corrupted data.
if (MI->getOpcode() == TargetOpcode::LOAD_STACK_GUARD)		if (MI->getOpcode() == TargetOpcode::LOAD_STACK_GUARD)
return false;		return false;

return true;		return true;
}		}

/// isProfitableToCSE - Return true if it's profitable to eliminate MI with a		/// isProfitableToCSE - Return true if it's profitable to eliminate MI with a
/// common expression that defines Reg.		/// common expression that defines Reg. CSBB is basic block where CSReg is
		/// defined.
bool MachineCSE::isProfitableToCSE(unsigned CSReg, unsigned Reg,		bool MachineCSE::isProfitableToCSE(unsigned CSReg, unsigned Reg,
MachineInstr CSMI, MachineInstr MI) {		MachineBasicBlock CSBB, MachineInstr MI) {
// FIXME: Heuristics that works around the lack the live range splitting.		// FIXME: Heuristics that works around the lack the live range splitting.

// If CSReg is used at all uses of Reg, CSE should not increase register		// If CSReg is used at all uses of Reg, CSE should not increase register
// pressure of CSReg.		// pressure of CSReg.
bool MayIncreasePressure = true;		bool MayIncreasePressure = true;
if (TargetRegisterInfo::isVirtualRegister(CSReg) &&		if (TargetRegisterInfo::isVirtualRegister(CSReg) &&
TargetRegisterInfo::isVirtualRegister(Reg)) {		TargetRegisterInfo::isVirtualRegister(Reg)) {
MayIncreasePressure = false;		MayIncreasePressure = false;
Show All 9 Lines	if (TargetRegisterInfo::isVirtualRegister(CSReg) &&
}		}
}		}
if (!MayIncreasePressure) return true;		if (!MayIncreasePressure) return true;

// Heuristics #1: Don't CSE "cheap" computation if the def is not local or in		// Heuristics #1: Don't CSE "cheap" computation if the def is not local or in
// an immediate predecessor. We don't want to increase register pressure and		// an immediate predecessor. We don't want to increase register pressure and
// end up causing other computation to be spilled.		// end up causing other computation to be spilled.
if (TII->isAsCheapAsAMove(*MI)) {		if (TII->isAsCheapAsAMove(*MI)) {
MachineBasicBlock *CSBB = CSMI->getParent();
MachineBasicBlock *BB = MI->getParent();		MachineBasicBlock *BB = MI->getParent();
if (CSBB != BB && !CSBB->isSuccessor(BB))		if (CSBB != BB && !CSBB->isSuccessor(BB))
return false;		return false;
}		}

// Heuristics #2: If the expression doesn't not use a vr and the only use		// Heuristics #2: If the expression doesn't not use a vr and the only use
// of the redundant computation are copies, do not cse.		// of the redundant computation are copies, do not cse.
bool HasVRegUse = false;		bool HasVRegUse = false;
Show All 38 Lines
void MachineCSE::ExitScope(MachineBasicBlock *MBB) {		void MachineCSE::ExitScope(MachineBasicBlock *MBB) {
LLVM_DEBUG(dbgs() << "Exiting: " << MBB->getName() << '\n');		LLVM_DEBUG(dbgs() << "Exiting: " << MBB->getName() << '\n');
DenseMap<MachineBasicBlock, ScopeType>::iterator SI = ScopeMap.find(MBB);		DenseMap<MachineBasicBlock, ScopeType>::iterator SI = ScopeMap.find(MBB);
assert(SI != ScopeMap.end());		assert(SI != ScopeMap.end());
delete SI->second;		delete SI->second;
ScopeMap.erase(SI);		ScopeMap.erase(SI);
}		}

bool MachineCSE::ProcessBlock(MachineBasicBlock *MBB) {		bool MachineCSE::ProcessBlockCSE(MachineBasicBlock *MBB) {
bool Changed = false;		bool Changed = false;

SmallVector<std::pair<unsigned, unsigned>, 8> CSEPairs;		SmallVector<std::pair<unsigned, unsigned>, 8> CSEPairs;
SmallVector<unsigned, 2> ImplicitDefsToUpdate;		SmallVector<unsigned, 2> ImplicitDefsToUpdate;
SmallVector<unsigned, 2> ImplicitDefs;		SmallVector<unsigned, 2> ImplicitDefs;
for (MachineBasicBlock::iterator I = MBB->begin(), E = MBB->end(); I != E; ) {		for (MachineBasicBlock::iterator I = MBB->begin(), E = MBB->end(); I != E; ) {
MachineInstr MI = &I;		MachineInstr MI = &I;
++I;		++I;
▲ Show 20 Lines • Show All 93 Lines • ▼ Show 20 Lines	for (unsigned i = 0, e = MI->getNumOperands(); NumDefs && i != e; ++i) {
--NumDefs;		--NumDefs;
continue;		continue;
}		}

assert(TargetRegisterInfo::isVirtualRegister(OldReg) &&		assert(TargetRegisterInfo::isVirtualRegister(OldReg) &&
TargetRegisterInfo::isVirtualRegister(NewReg) &&		TargetRegisterInfo::isVirtualRegister(NewReg) &&
"Do not CSE physical register defs!");		"Do not CSE physical register defs!");

if (!isProfitableToCSE(NewReg, OldReg, CSMI, MI)) {		if (!isProfitableToCSE(NewReg, OldReg, CSMI->getParent(), MI)) {
LLVM_DEBUG(dbgs() << "*** Not profitable, avoid CSE!\n");		LLVM_DEBUG(dbgs() << "*** Not profitable, avoid CSE!\n");
DoCSE = false;		DoCSE = false;
break;		break;
}		}

// Don't perform CSE if the result of the new instruction cannot exist		// Don't perform CSE if the result of the new instruction cannot exist
// within the constraints (register class, bank, or low-level type) of		// within the constraints (register class, bank, or low-level type) of
// the old instruction.		// the old instruction.
▲ Show 20 Lines • Show All 123 Lines • ▼ Show 20 Lines	for (MachineDomTreeNode *Child : Children)
WorkList.push_back(Child);		WorkList.push_back(Child);
} while (!WorkList.empty());		} while (!WorkList.empty());

// Now perform CSE.		// Now perform CSE.
bool Changed = false;		bool Changed = false;
for (MachineDomTreeNode *Node : Scopes) {		for (MachineDomTreeNode *Node : Scopes) {
MachineBasicBlock *MBB = Node->getBlock();		MachineBasicBlock *MBB = Node->getBlock();
EnterScope(MBB);		EnterScope(MBB);
Changed \|= ProcessBlock(MBB);		Changed \|= ProcessBlockCSE(MBB);
// If it's a leaf node, it's done. Traverse upwards to pop ancestors.		// If it's a leaf node, it's done. Traverse upwards to pop ancestors.
ExitScopeIfDone(Node, OpenChildren);		ExitScopeIfDone(Node, OpenChildren);
}		}

return Changed;		return Changed;
}		}

		// We use stronger checks for PRE candidate rather than for CSE ones to embrace
		// checks inside ProcessBlockCSE(), not only inside isCSECandidate(). This helps
		// to exclude instrs created by PRE that won't be CSEed later.
		bool MachineCSE::isPRECandidate(MachineInstr *MI) {
		if (!isCSECandidate(MI) \|\|
		MI->isNotDuplicable() \|\|
		MI->isAsCheapAsAMove() \|\|
		MI->getNumDefs() != 1 \|\|
		MI->getNumExplicitDefs() != 1)
		return false;

		for (auto def : MI->defs())
		if (!TRI->isVirtualRegister(def.getReg()))
		return false;

		for (auto use : MI->uses())
		if (use.isReg() && !TRI->isVirtualRegister(use.getReg()))
		return false;

		return true;
		}

		bool MachineCSE::ProcessBlockPRE(MachineDominatorTree *DT,
		MachineBasicBlock *MBB) {
		bool Changed = false;
		for (MachineBasicBlock::iterator I = MBB->begin(), E = MBB->end(); I != E;) {
		MachineInstr MI = &I;
		++I;

		if (!isPRECandidate(MI))
		continue;

		if (!PREMap.count(MI)) {
		PREMap[MI] = MBB;
		continue;
		}

		auto MBB1 = PREMap[MI];
		assert(
		!DT->properlyDominates(MBB, MBB1) &&
		"MBB cannot properly dominate MBB1 while DFS through dominators tree!");
		auto CMBB = DT->findNearestCommonDominator(MBB, MBB1);

		// Two instrs are partial redundant if their basic blocks are reachable
		// from one to another but one doesn't dominate another.
		if (CMBB != MBB1) {
		auto BB = MBB->getBasicBlock(), BB1 = MBB1->getBasicBlock();
		if (BB != nullptr && BB1 != nullptr &&
		(isPotentiallyReachable(BB1, BB) \|\|
		lkailUnsubmitted Not Done Reply Inline Actions Hi @anton-afanasyev , I have a concern here that CFG of LLVM IR might not be equivalent to CFG of Machine IR. lkail: Hi @anton-afanasyev , I have a concern here that CFG of LLVM IR might not be equivalent to CFG…
		anton-afanasyevAuthorUnsubmitted Done Reply Inline Actions Hi @lkail, yes this is possible case. But that is not an issue actually, for this case in place it would be just non-optimization. PRE will create instruction, but if CSE doesn't eliminate original instructions, than "hoisted" instruction will be deleted by Remove Dead Machine Instructions pass later. anton-afanasyev: Hi @lkail, yes this is possible case. But that is not an issue actually, for this case in place…
		isPotentiallyReachable(BB, BB1))) {

		assert(MI->getOperand(0).isDef() &&
		"First operand of instr with one explicit def must be this def");
		unsigned VReg = MI->getOperand(0).getReg();
		unsigned NewReg = MRI->cloneVirtualRegister(VReg);
		if (!isProfitableToCSE(NewReg, VReg, CMBB, MI))
		LuoYuankeUnsubmitted Done Reply Inline Actions Do we need to enhance the algorithm to consider more about register pressure on the profit calculation? I'm afraid there is performance drop when the register pressure is heavy. LuoYuanke: Do we need to enhance the algorithm to consider more about register pressure on the profit…
		anton-afanasyevAuthorUnsubmitted Done Reply Inline Actions Hi @LuoYuanke, yes, this could be the case. Actually this commit doesn't change profit calculation, `ProcessBlockPRE()` uses the same `isProfitableToCommit()` function as `ProcessBlockCSE()` uses. Do you have concrete test cases where register pressure increases? anton-afanasyev: Hi @LuoYuanke, yes, this could be the case. Actually this commit doesn't change profit…
		LuoYuankeUnsubmitted Done Reply Inline Actions CSE only eliminate MI, but current PRE insert MI to the common dominated block, so the instruction is hoisted to dominated block. It increase register pressure more than CSE. I have some cases that got performance regression with this patch due to the register pressure, but I am not able to extract a small case from it. I notice in LICM, MachineLICMBase::IsProfitableToHoist() is more considerate for the register pressure. I wonder if PRE can apply the same algorithm. Do you have any idea for a better register pressure solution? LuoYuanke: CSE only eliminate MI, but current PRE insert MI to the common dominated block, so the…
		anton-afanasyevAuthorUnsubmitted Done Reply Inline Actions Hi @LuoYuanke, actually PRE doesn't hoist instruction, but _duplicates_ it, real hoisting is made by CSE when it _eliminates_ instruction. I do believe that CSE should consider register pressure while eliminating instruction. Have you tried `MachineLICMBase::isProfitableToHoist()` with your test case? We can adopt and insert it to CSE. anton-afanasyev: Hi @LuoYuanke, actually PRE doesn't hoist instruction, but _duplicates_ it, real hoisting is…
		LuoYuankeUnsubmitted Done Reply Inline Actions Hi @anton-afanasyev, sorry for reply late. I'm trying to figure out this issue, but it seems complex for me. Can you run SPEC cpu2017/500.perlbench_r? There is some significant performance drop on X86 with the patch. If you have resource to run the benchmark, could you help to look into the issue? LuoYuanke: Hi @anton-afanasyev, sorry for reply late. I'm trying to figure out this issue, but it seems…
		continue;
		MachineInstr &NewMI =
		TII->duplicate(CMBB, CMBB->getFirstTerminator(), MI);
		NewMI.getOperand(0).setReg(NewReg);

		PREMap[MI] = CMBB;
		++NumPREs;
		Changed = true;
		}
		}
		}
		return Changed;
		}

		// This simple PRE (partial redundancy elimination) pass doesn't actually
		// eliminate partial redundancy but transforms it to full redundancy,
		// anticipating that the next CSE step will eliminate this created redundancy.
		// If CSE doesn't eliminate this, than created instruction will remain dead
		// and eliminated later by Remove Dead Machine Instructions pass.
		bool MachineCSE::PerformSimplePRE(MachineDominatorTree *DT) {
		SmallVector<MachineDomTreeNode *, 32> BBs;

		PREMap.clear();
		bool Changed = false;
		BBs.push_back(DT->getRootNode());
		do {
		auto Node = BBs.pop_back_val();
		const std::vector<MachineDomTreeNode *> &Children = Node->getChildren();
		for (MachineDomTreeNode *Child : Children)
		BBs.push_back(Child);

		MachineBasicBlock *MBB = Node->getBlock();
		Changed \|= ProcessBlockPRE(DT, MBB);

		} while (!BBs.empty());

		return Changed;
		}

bool MachineCSE::runOnMachineFunction(MachineFunction &MF) {		bool MachineCSE::runOnMachineFunction(MachineFunction &MF) {
if (skipFunction(MF.getFunction()))		if (skipFunction(MF.getFunction()))
return false;		return false;

TII = MF.getSubtarget().getInstrInfo();		TII = MF.getSubtarget().getInstrInfo();
TRI = MF.getSubtarget().getRegisterInfo();		TRI = MF.getSubtarget().getRegisterInfo();
MRI = &MF.getRegInfo();		MRI = &MF.getRegInfo();
AA = &getAnalysis<AAResultsWrapperPass>().getAAResults();		AA = &getAnalysis<AAResultsWrapperPass>().getAAResults();
DT = &getAnalysis<MachineDominatorTree>();		DT = &getAnalysis<MachineDominatorTree>();
LookAheadLimit = TII->getMachineCSELookAheadLimit();		LookAheadLimit = TII->getMachineCSELookAheadLimit();
return PerformCSE(DT->getRootNode());		bool ChangedPRE, ChangedCSE;
		ChangedPRE = PerformSimplePRE(DT);
		ChangedCSE = PerformCSE(DT->getRootNode());
		return ChangedPRE \|\| ChangedCSE;
}		}

llvm/trunk/test/CodeGen/Mips/internalfunc.ll

	Show All 21 Lines
	if.then: ; preds = %entry			if.then: ; preds = %entry
	%tmp1 = load void (...), void (...)* @caller.sf1, align 4			%tmp1 = load void (...), void (...)* @caller.sf1, align 4
	tail call void (...) %tmp1() nounwind			tail call void (...) %tmp1() nounwind
	br label %if.end			br label %if.end

	if.end: ; preds = %entry, %if.then			if.end: ; preds = %entry, %if.then
	; CHECK: lw $[[R2:[0-9]+]], %got(sf2)			; CHECK: lw $[[R2:[0-9]+]], %got(sf2)
	; CHECK: addiu ${{[0-9]+}}, $[[R2]], %lo(sf2)			; CHECK: addiu ${{[0-9]+}}, $[[R2]], %lo(sf2)
	; CHECK: lw $[[R3:[0-9]+]], %got(caller.sf1)			; CHECK: sw ${{[0-9]+}}, %lo(caller.sf1)($[[R1]])
	; CHECK: sw ${{[0-9]+}}, %lo(caller.sf1)($[[R3]])
	%tobool3 = icmp ne i32 %a0, 0			%tobool3 = icmp ne i32 %a0, 0
	%tmp4 = load void (...), void (...)* @gf1, align 4			%tmp4 = load void (...), void (...)* @gf1, align 4
	%cond = select i1 %tobool3, void (...)* %tmp4, void (...)* bitcast (void ()* @sf2 to void (...)*)			%cond = select i1 %tobool3, void (...)* %tmp4, void (...)* bitcast (void ()* @sf2 to void (...)*)
	store void (...)* %cond, void (...)** @caller.sf1, align 4			store void (...)* %cond, void (...)** @caller.sf1, align 4
	ret void			ret void
	}			}

	define internal void @sf2() nounwind {			define internal void @sf2() nounwind {
	Show All 13 Lines

llvm/trunk/test/CodeGen/X86/avx2-masked-gather.ll

	Show First 20 Lines • Show All 230 Lines • ▼ Show 20 Lines
	; NOGATHER-NEXT: vpextrb $4, %xmm1, %eax			; NOGATHER-NEXT: vpextrb $4, %xmm1, %eax
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB4_4			; NOGATHER-NEXT: je .LBB4_4
	; NOGATHER-NEXT: # %bb.3: # %cond.load1			; NOGATHER-NEXT: # %bb.3: # %cond.load1
	; NOGATHER-NEXT: vpextrq $1, %xmm0, %rax			; NOGATHER-NEXT: vpextrq $1, %xmm0, %rax
	; NOGATHER-NEXT: vpinsrd $1, (%rax), %xmm2, %xmm2			; NOGATHER-NEXT: vpinsrd $1, (%rax), %xmm2, %xmm2
	; NOGATHER-NEXT: .LBB4_4: # %else2			; NOGATHER-NEXT: .LBB4_4: # %else2
	; NOGATHER-NEXT: vpextrb $8, %xmm1, %eax			; NOGATHER-NEXT: vpextrb $8, %xmm1, %eax
				; NOGATHER-NEXT: vextractf128 $1, %ymm0, %xmm0
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB4_6			; NOGATHER-NEXT: je .LBB4_6
	; NOGATHER-NEXT: # %bb.5: # %cond.load4			; NOGATHER-NEXT: # %bb.5: # %cond.load4
	; NOGATHER-NEXT: vextractf128 $1, %ymm0, %xmm3			; NOGATHER-NEXT: vmovq %xmm0, %rax
	; NOGATHER-NEXT: vmovq %xmm3, %rax
	; NOGATHER-NEXT: vpinsrd $2, (%rax), %xmm2, %xmm2			; NOGATHER-NEXT: vpinsrd $2, (%rax), %xmm2, %xmm2
	; NOGATHER-NEXT: .LBB4_6: # %else5			; NOGATHER-NEXT: .LBB4_6: # %else5
	; NOGATHER-NEXT: vpextrb $12, %xmm1, %eax			; NOGATHER-NEXT: vpextrb $12, %xmm1, %eax
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB4_8			; NOGATHER-NEXT: je .LBB4_8
	; NOGATHER-NEXT: # %bb.7: # %cond.load7			; NOGATHER-NEXT: # %bb.7: # %cond.load7
	; NOGATHER-NEXT: vextractf128 $1, %ymm0, %xmm0
	; NOGATHER-NEXT: vpextrq $1, %xmm0, %rax			; NOGATHER-NEXT: vpextrq $1, %xmm0, %rax
	; NOGATHER-NEXT: vpinsrd $3, (%rax), %xmm2, %xmm2			; NOGATHER-NEXT: vpinsrd $3, (%rax), %xmm2, %xmm2
	; NOGATHER-NEXT: .LBB4_8: # %else8			; NOGATHER-NEXT: .LBB4_8: # %else8
	; NOGATHER-NEXT: vmovdqa %xmm2, %xmm0			; NOGATHER-NEXT: vmovdqa %xmm2, %xmm0
	; NOGATHER-NEXT: vzeroupper			; NOGATHER-NEXT: vzeroupper
	; NOGATHER-NEXT: retq			; NOGATHER-NEXT: retq
	entry:			entry:
	%res = call <4 x i32> @llvm.masked.gather.v4i32(<4 x i32*> %ptrs, i32 0, <4 x i1> %masks, <4 x i32> %passthro)			%res = call <4 x i32> @llvm.masked.gather.v4i32(<4 x i32*> %ptrs, i32 0, <4 x i1> %masks, <4 x i32> %passthro)
	Show All 31 Lines
	; NOGATHER-NEXT: vpextrb $4, %xmm1, %eax			; NOGATHER-NEXT: vpextrb $4, %xmm1, %eax
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB5_4			; NOGATHER-NEXT: je .LBB5_4
	; NOGATHER-NEXT: # %bb.3: # %cond.load1			; NOGATHER-NEXT: # %bb.3: # %cond.load1
	; NOGATHER-NEXT: vpextrq $1, %xmm0, %rax			; NOGATHER-NEXT: vpextrq $1, %xmm0, %rax
	; NOGATHER-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0],mem[0],xmm2[2,3]			; NOGATHER-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0],mem[0],xmm2[2,3]
	; NOGATHER-NEXT: .LBB5_4: # %else2			; NOGATHER-NEXT: .LBB5_4: # %else2
	; NOGATHER-NEXT: vpextrb $8, %xmm1, %eax			; NOGATHER-NEXT: vpextrb $8, %xmm1, %eax
				; NOGATHER-NEXT: vextractf128 $1, %ymm0, %xmm0
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB5_6			; NOGATHER-NEXT: je .LBB5_6
	; NOGATHER-NEXT: # %bb.5: # %cond.load4			; NOGATHER-NEXT: # %bb.5: # %cond.load4
	; NOGATHER-NEXT: vextractf128 $1, %ymm0, %xmm3			; NOGATHER-NEXT: vmovq %xmm0, %rax
	; NOGATHER-NEXT: vmovq %xmm3, %rax
	; NOGATHER-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1],mem[0],xmm2[3]			; NOGATHER-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1],mem[0],xmm2[3]
	; NOGATHER-NEXT: .LBB5_6: # %else5			; NOGATHER-NEXT: .LBB5_6: # %else5
	; NOGATHER-NEXT: vpextrb $12, %xmm1, %eax			; NOGATHER-NEXT: vpextrb $12, %xmm1, %eax
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB5_8			; NOGATHER-NEXT: je .LBB5_8
	; NOGATHER-NEXT: # %bb.7: # %cond.load7			; NOGATHER-NEXT: # %bb.7: # %cond.load7
	; NOGATHER-NEXT: vextractf128 $1, %ymm0, %xmm0
	; NOGATHER-NEXT: vpextrq $1, %xmm0, %rax			; NOGATHER-NEXT: vpextrq $1, %xmm0, %rax
	; NOGATHER-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1,2],mem[0]			; NOGATHER-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1,2],mem[0]
	; NOGATHER-NEXT: .LBB5_8: # %else8			; NOGATHER-NEXT: .LBB5_8: # %else8
	; NOGATHER-NEXT: vmovaps %xmm2, %xmm0			; NOGATHER-NEXT: vmovaps %xmm2, %xmm0
	; NOGATHER-NEXT: vzeroupper			; NOGATHER-NEXT: vzeroupper
	; NOGATHER-NEXT: retq			; NOGATHER-NEXT: retq
	entry:			entry:
	%res = call <4 x float> @llvm.masked.gather.v4float(<4 x float*> %ptrs, i32 0, <4 x i1> %masks, <4 x float> %passthro)			%res = call <4 x float> @llvm.masked.gather.v4float(<4 x float*> %ptrs, i32 0, <4 x i1> %masks, <4 x float> %passthro)
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB6_4			; NOGATHER-NEXT: je .LBB6_4
	; NOGATHER-NEXT: # %bb.3: # %cond.load1			; NOGATHER-NEXT: # %bb.3: # %cond.load1
	; NOGATHER-NEXT: vpextrq $1, %xmm3, %rax			; NOGATHER-NEXT: vpextrq $1, %xmm3, %rax
	; NOGATHER-NEXT: vpinsrd $1, (%rax), %xmm1, %xmm4			; NOGATHER-NEXT: vpinsrd $1, (%rax), %xmm1, %xmm4
	; NOGATHER-NEXT: vblendps {{.*#+}} ymm1 = ymm4[0,1,2,3],ymm1[4,5,6,7]			; NOGATHER-NEXT: vblendps {{.*#+}} ymm1 = ymm4[0,1,2,3],ymm1[4,5,6,7]
	; NOGATHER-NEXT: .LBB6_4: # %else2			; NOGATHER-NEXT: .LBB6_4: # %else2
	; NOGATHER-NEXT: vpextrb $4, %xmm0, %eax			; NOGATHER-NEXT: vpextrb $4, %xmm0, %eax
				; NOGATHER-NEXT: vextractf128 $1, %ymm3, %xmm3
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB6_6			; NOGATHER-NEXT: je .LBB6_6
	; NOGATHER-NEXT: # %bb.5: # %cond.load4			; NOGATHER-NEXT: # %bb.5: # %cond.load4
	; NOGATHER-NEXT: vextractf128 $1, %ymm3, %xmm4			; NOGATHER-NEXT: vmovq %xmm3, %rax
	; NOGATHER-NEXT: vmovq %xmm4, %rax
	; NOGATHER-NEXT: vpinsrd $2, (%rax), %xmm1, %xmm4			; NOGATHER-NEXT: vpinsrd $2, (%rax), %xmm1, %xmm4
	; NOGATHER-NEXT: vblendps {{.*#+}} ymm1 = ymm4[0,1,2,3],ymm1[4,5,6,7]			; NOGATHER-NEXT: vblendps {{.*#+}} ymm1 = ymm4[0,1,2,3],ymm1[4,5,6,7]
	; NOGATHER-NEXT: .LBB6_6: # %else5			; NOGATHER-NEXT: .LBB6_6: # %else5
	; NOGATHER-NEXT: vpextrb $6, %xmm0, %eax			; NOGATHER-NEXT: vpextrb $6, %xmm0, %eax
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB6_8			; NOGATHER-NEXT: je .LBB6_8
	; NOGATHER-NEXT: # %bb.7: # %cond.load7			; NOGATHER-NEXT: # %bb.7: # %cond.load7
	; NOGATHER-NEXT: vextractf128 $1, %ymm3, %xmm3
	; NOGATHER-NEXT: vpextrq $1, %xmm3, %rax			; NOGATHER-NEXT: vpextrq $1, %xmm3, %rax
	; NOGATHER-NEXT: vpinsrd $3, (%rax), %xmm1, %xmm3			; NOGATHER-NEXT: vpinsrd $3, (%rax), %xmm1, %xmm3
	; NOGATHER-NEXT: vblendps {{.*#+}} ymm1 = ymm3[0,1,2,3],ymm1[4,5,6,7]			; NOGATHER-NEXT: vblendps {{.*#+}} ymm1 = ymm3[0,1,2,3],ymm1[4,5,6,7]
	; NOGATHER-NEXT: .LBB6_8: # %else8			; NOGATHER-NEXT: .LBB6_8: # %else8
	; NOGATHER-NEXT: vpextrb $8, %xmm0, %eax			; NOGATHER-NEXT: vpextrb $8, %xmm0, %eax
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB6_10			; NOGATHER-NEXT: je .LBB6_10
	; NOGATHER-NEXT: # %bb.9: # %cond.load10			; NOGATHER-NEXT: # %bb.9: # %cond.load10
	; NOGATHER-NEXT: vmovq %xmm2, %rax			; NOGATHER-NEXT: vmovq %xmm2, %rax
	; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm3			; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm3
	; NOGATHER-NEXT: vpinsrd $0, (%rax), %xmm3, %xmm3			; NOGATHER-NEXT: vpinsrd $0, (%rax), %xmm3, %xmm3
	; NOGATHER-NEXT: vinsertf128 $1, %xmm3, %ymm1, %ymm1			; NOGATHER-NEXT: vinsertf128 $1, %xmm3, %ymm1, %ymm1
	; NOGATHER-NEXT: .LBB6_10: # %else11			; NOGATHER-NEXT: .LBB6_10: # %else11
	; NOGATHER-NEXT: vpextrb $10, %xmm0, %eax			; NOGATHER-NEXT: vpextrb $10, %xmm0, %eax
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB6_12			; NOGATHER-NEXT: je .LBB6_12
	; NOGATHER-NEXT: # %bb.11: # %cond.load13			; NOGATHER-NEXT: # %bb.11: # %cond.load13
	; NOGATHER-NEXT: vpextrq $1, %xmm2, %rax			; NOGATHER-NEXT: vpextrq $1, %xmm2, %rax
	; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm3			; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm3
	; NOGATHER-NEXT: vpinsrd $1, (%rax), %xmm3, %xmm3			; NOGATHER-NEXT: vpinsrd $1, (%rax), %xmm3, %xmm3
	; NOGATHER-NEXT: vinsertf128 $1, %xmm3, %ymm1, %ymm1			; NOGATHER-NEXT: vinsertf128 $1, %xmm3, %ymm1, %ymm1
	; NOGATHER-NEXT: .LBB6_12: # %else14			; NOGATHER-NEXT: .LBB6_12: # %else14
	; NOGATHER-NEXT: vpextrb $12, %xmm0, %eax			; NOGATHER-NEXT: vpextrb $12, %xmm0, %eax
				; NOGATHER-NEXT: vextractf128 $1, %ymm2, %xmm2
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB6_14			; NOGATHER-NEXT: je .LBB6_14
	; NOGATHER-NEXT: # %bb.13: # %cond.load16			; NOGATHER-NEXT: # %bb.13: # %cond.load16
	; NOGATHER-NEXT: vextractf128 $1, %ymm2, %xmm3			; NOGATHER-NEXT: vmovq %xmm2, %rax
	; NOGATHER-NEXT: vmovq %xmm3, %rax
	; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm3			; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm3
	; NOGATHER-NEXT: vpinsrd $2, (%rax), %xmm3, %xmm3			; NOGATHER-NEXT: vpinsrd $2, (%rax), %xmm3, %xmm3
	; NOGATHER-NEXT: vinsertf128 $1, %xmm3, %ymm1, %ymm1			; NOGATHER-NEXT: vinsertf128 $1, %xmm3, %ymm1, %ymm1
	; NOGATHER-NEXT: .LBB6_14: # %else17			; NOGATHER-NEXT: .LBB6_14: # %else17
	; NOGATHER-NEXT: vpextrb $14, %xmm0, %eax			; NOGATHER-NEXT: vpextrb $14, %xmm0, %eax
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB6_16			; NOGATHER-NEXT: je .LBB6_16
	; NOGATHER-NEXT: # %bb.15: # %cond.load19			; NOGATHER-NEXT: # %bb.15: # %cond.load19
	; NOGATHER-NEXT: vextractf128 $1, %ymm2, %xmm0			; NOGATHER-NEXT: vpextrq $1, %xmm2, %rax
	; NOGATHER-NEXT: vpextrq $1, %xmm0, %rax
	; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm0			; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm0
	; NOGATHER-NEXT: vpinsrd $3, (%rax), %xmm0, %xmm0			; NOGATHER-NEXT: vpinsrd $3, (%rax), %xmm0, %xmm0
	; NOGATHER-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm1			; NOGATHER-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm1
	; NOGATHER-NEXT: .LBB6_16: # %else20			; NOGATHER-NEXT: .LBB6_16: # %else20
	; NOGATHER-NEXT: vmovaps %ymm1, %ymm0			; NOGATHER-NEXT: vmovaps %ymm1, %ymm0
	; NOGATHER-NEXT: retq			; NOGATHER-NEXT: retq
	entry:			entry:
	%ld = load <8 x i32>, <8 x i32>* %ptr			%ld = load <8 x i32>, <8 x i32>* %ptr
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB7_4			; NOGATHER-NEXT: je .LBB7_4
	; NOGATHER-NEXT: # %bb.3: # %cond.load1			; NOGATHER-NEXT: # %bb.3: # %cond.load1
	; NOGATHER-NEXT: vpextrq $1, %xmm3, %rax			; NOGATHER-NEXT: vpextrq $1, %xmm3, %rax
	; NOGATHER-NEXT: vinsertps {{.*#+}} xmm4 = xmm1[0],mem[0],xmm1[2,3]			; NOGATHER-NEXT: vinsertps {{.*#+}} xmm4 = xmm1[0],mem[0],xmm1[2,3]
	; NOGATHER-NEXT: vblendps {{.*#+}} ymm1 = ymm4[0,1,2,3],ymm1[4,5,6,7]			; NOGATHER-NEXT: vblendps {{.*#+}} ymm1 = ymm4[0,1,2,3],ymm1[4,5,6,7]
	; NOGATHER-NEXT: .LBB7_4: # %else2			; NOGATHER-NEXT: .LBB7_4: # %else2
	; NOGATHER-NEXT: vpextrb $4, %xmm0, %eax			; NOGATHER-NEXT: vpextrb $4, %xmm0, %eax
				; NOGATHER-NEXT: vextractf128 $1, %ymm3, %xmm3
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB7_6			; NOGATHER-NEXT: je .LBB7_6
	; NOGATHER-NEXT: # %bb.5: # %cond.load4			; NOGATHER-NEXT: # %bb.5: # %cond.load4
	; NOGATHER-NEXT: vextractf128 $1, %ymm3, %xmm4			; NOGATHER-NEXT: vmovq %xmm3, %rax
	; NOGATHER-NEXT: vmovq %xmm4, %rax
	; NOGATHER-NEXT: vinsertps {{.*#+}} xmm4 = xmm1[0,1],mem[0],xmm1[3]			; NOGATHER-NEXT: vinsertps {{.*#+}} xmm4 = xmm1[0,1],mem[0],xmm1[3]
	; NOGATHER-NEXT: vblendps {{.*#+}} ymm1 = ymm4[0,1,2,3],ymm1[4,5,6,7]			; NOGATHER-NEXT: vblendps {{.*#+}} ymm1 = ymm4[0,1,2,3],ymm1[4,5,6,7]
	; NOGATHER-NEXT: .LBB7_6: # %else5			; NOGATHER-NEXT: .LBB7_6: # %else5
	; NOGATHER-NEXT: vpextrb $6, %xmm0, %eax			; NOGATHER-NEXT: vpextrb $6, %xmm0, %eax
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB7_8			; NOGATHER-NEXT: je .LBB7_8
	; NOGATHER-NEXT: # %bb.7: # %cond.load7			; NOGATHER-NEXT: # %bb.7: # %cond.load7
	; NOGATHER-NEXT: vextractf128 $1, %ymm3, %xmm3
	; NOGATHER-NEXT: vpextrq $1, %xmm3, %rax			; NOGATHER-NEXT: vpextrq $1, %xmm3, %rax
	; NOGATHER-NEXT: vinsertps {{.*#+}} xmm3 = xmm1[0,1,2],mem[0]			; NOGATHER-NEXT: vinsertps {{.*#+}} xmm3 = xmm1[0,1,2],mem[0]
	; NOGATHER-NEXT: vblendps {{.*#+}} ymm1 = ymm3[0,1,2,3],ymm1[4,5,6,7]			; NOGATHER-NEXT: vblendps {{.*#+}} ymm1 = ymm3[0,1,2,3],ymm1[4,5,6,7]
	; NOGATHER-NEXT: .LBB7_8: # %else8			; NOGATHER-NEXT: .LBB7_8: # %else8
	; NOGATHER-NEXT: vpextrb $8, %xmm0, %eax			; NOGATHER-NEXT: vpextrb $8, %xmm0, %eax
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB7_10			; NOGATHER-NEXT: je .LBB7_10
	; NOGATHER-NEXT: # %bb.9: # %cond.load10			; NOGATHER-NEXT: # %bb.9: # %cond.load10
	; NOGATHER-NEXT: vmovq %xmm2, %rax			; NOGATHER-NEXT: vmovq %xmm2, %rax
	; NOGATHER-NEXT: vmovss {{.*#+}} xmm3 = mem[0],zero,zero,zero			; NOGATHER-NEXT: vmovss {{.*#+}} xmm3 = mem[0],zero,zero,zero
	; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm4			; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm4
	; NOGATHER-NEXT: vblendps {{.*#+}} xmm3 = xmm3[0],xmm4[1,2,3]			; NOGATHER-NEXT: vblendps {{.*#+}} xmm3 = xmm3[0],xmm4[1,2,3]
	; NOGATHER-NEXT: vinsertf128 $1, %xmm3, %ymm1, %ymm1			; NOGATHER-NEXT: vinsertf128 $1, %xmm3, %ymm1, %ymm1
	; NOGATHER-NEXT: .LBB7_10: # %else11			; NOGATHER-NEXT: .LBB7_10: # %else11
	; NOGATHER-NEXT: vpextrb $10, %xmm0, %eax			; NOGATHER-NEXT: vpextrb $10, %xmm0, %eax
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB7_12			; NOGATHER-NEXT: je .LBB7_12
	; NOGATHER-NEXT: # %bb.11: # %cond.load13			; NOGATHER-NEXT: # %bb.11: # %cond.load13
	; NOGATHER-NEXT: vpextrq $1, %xmm2, %rax			; NOGATHER-NEXT: vpextrq $1, %xmm2, %rax
	; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm3			; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm3
	; NOGATHER-NEXT: vinsertps {{.*#+}} xmm3 = xmm3[0],mem[0],xmm3[2,3]			; NOGATHER-NEXT: vinsertps {{.*#+}} xmm3 = xmm3[0],mem[0],xmm3[2,3]
	; NOGATHER-NEXT: vinsertf128 $1, %xmm3, %ymm1, %ymm1			; NOGATHER-NEXT: vinsertf128 $1, %xmm3, %ymm1, %ymm1
	; NOGATHER-NEXT: .LBB7_12: # %else14			; NOGATHER-NEXT: .LBB7_12: # %else14
	; NOGATHER-NEXT: vpextrb $12, %xmm0, %eax			; NOGATHER-NEXT: vpextrb $12, %xmm0, %eax
				; NOGATHER-NEXT: vextractf128 $1, %ymm2, %xmm2
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB7_14			; NOGATHER-NEXT: je .LBB7_14
	; NOGATHER-NEXT: # %bb.13: # %cond.load16			; NOGATHER-NEXT: # %bb.13: # %cond.load16
	; NOGATHER-NEXT: vextractf128 $1, %ymm2, %xmm3			; NOGATHER-NEXT: vmovq %xmm2, %rax
	; NOGATHER-NEXT: vmovq %xmm3, %rax
	; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm3			; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm3
	; NOGATHER-NEXT: vinsertps {{.*#+}} xmm3 = xmm3[0,1],mem[0],xmm3[3]			; NOGATHER-NEXT: vinsertps {{.*#+}} xmm3 = xmm3[0,1],mem[0],xmm3[3]
	; NOGATHER-NEXT: vinsertf128 $1, %xmm3, %ymm1, %ymm1			; NOGATHER-NEXT: vinsertf128 $1, %xmm3, %ymm1, %ymm1
	; NOGATHER-NEXT: .LBB7_14: # %else17			; NOGATHER-NEXT: .LBB7_14: # %else17
	; NOGATHER-NEXT: vpextrb $14, %xmm0, %eax			; NOGATHER-NEXT: vpextrb $14, %xmm0, %eax
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB7_16			; NOGATHER-NEXT: je .LBB7_16
	; NOGATHER-NEXT: # %bb.15: # %cond.load19			; NOGATHER-NEXT: # %bb.15: # %cond.load19
	; NOGATHER-NEXT: vextractf128 $1, %ymm2, %xmm0			; NOGATHER-NEXT: vpextrq $1, %xmm2, %rax
	; NOGATHER-NEXT: vpextrq $1, %xmm0, %rax
	; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm0			; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm0
	; NOGATHER-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,1,2],mem[0]			; NOGATHER-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,1,2],mem[0]
	; NOGATHER-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm1			; NOGATHER-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm1
	; NOGATHER-NEXT: .LBB7_16: # %else20			; NOGATHER-NEXT: .LBB7_16: # %else20
	; NOGATHER-NEXT: vmovaps %ymm1, %ymm0			; NOGATHER-NEXT: vmovaps %ymm1, %ymm0
	; NOGATHER-NEXT: retq			; NOGATHER-NEXT: retq
	entry:			entry:
	%ld = load <8 x float>, <8 x float>* %ptr			%ld = load <8 x float>, <8 x float>* %ptr
	Show All 38 Lines
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB8_4			; NOGATHER-NEXT: je .LBB8_4
	; NOGATHER-NEXT: # %bb.3: # %cond.load1			; NOGATHER-NEXT: # %bb.3: # %cond.load1
	; NOGATHER-NEXT: vpextrq $1, %xmm2, %rax			; NOGATHER-NEXT: vpextrq $1, %xmm2, %rax
	; NOGATHER-NEXT: vpinsrq $1, (%rax), %xmm1, %xmm3			; NOGATHER-NEXT: vpinsrq $1, (%rax), %xmm1, %xmm3
	; NOGATHER-NEXT: vblendps {{.*#+}} ymm1 = ymm3[0,1,2,3],ymm1[4,5,6,7]			; NOGATHER-NEXT: vblendps {{.*#+}} ymm1 = ymm3[0,1,2,3],ymm1[4,5,6,7]
	; NOGATHER-NEXT: .LBB8_4: # %else2			; NOGATHER-NEXT: .LBB8_4: # %else2
	; NOGATHER-NEXT: vpextrb $8, %xmm0, %eax			; NOGATHER-NEXT: vpextrb $8, %xmm0, %eax
				; NOGATHER-NEXT: vextractf128 $1, %ymm2, %xmm2
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB8_6			; NOGATHER-NEXT: je .LBB8_6
	; NOGATHER-NEXT: # %bb.5: # %cond.load4			; NOGATHER-NEXT: # %bb.5: # %cond.load4
	; NOGATHER-NEXT: vextractf128 $1, %ymm2, %xmm3			; NOGATHER-NEXT: vmovq %xmm2, %rax
	; NOGATHER-NEXT: vmovq %xmm3, %rax
	; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm3			; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm3
	; NOGATHER-NEXT: vpinsrq $0, (%rax), %xmm3, %xmm3			; NOGATHER-NEXT: vpinsrq $0, (%rax), %xmm3, %xmm3
	; NOGATHER-NEXT: vinsertf128 $1, %xmm3, %ymm1, %ymm1			; NOGATHER-NEXT: vinsertf128 $1, %xmm3, %ymm1, %ymm1
	; NOGATHER-NEXT: .LBB8_6: # %else5			; NOGATHER-NEXT: .LBB8_6: # %else5
	; NOGATHER-NEXT: vpextrb $12, %xmm0, %eax			; NOGATHER-NEXT: vpextrb $12, %xmm0, %eax
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB8_8			; NOGATHER-NEXT: je .LBB8_8
	; NOGATHER-NEXT: # %bb.7: # %cond.load7			; NOGATHER-NEXT: # %bb.7: # %cond.load7
	; NOGATHER-NEXT: vextractf128 $1, %ymm2, %xmm0			; NOGATHER-NEXT: vpextrq $1, %xmm2, %rax
	; NOGATHER-NEXT: vpextrq $1, %xmm0, %rax
	; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm0			; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm0
	; NOGATHER-NEXT: vpinsrq $1, (%rax), %xmm0, %xmm0			; NOGATHER-NEXT: vpinsrq $1, (%rax), %xmm0, %xmm0
	; NOGATHER-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm1			; NOGATHER-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm1
	; NOGATHER-NEXT: .LBB8_8: # %else8			; NOGATHER-NEXT: .LBB8_8: # %else8
	; NOGATHER-NEXT: vmovaps %ymm1, %ymm0			; NOGATHER-NEXT: vmovaps %ymm1, %ymm0
	; NOGATHER-NEXT: retq			; NOGATHER-NEXT: retq
	entry:			entry:
	%ld = load <4 x i64>, <4 x i64>* %ptr			%ld = load <4 x i64>, <4 x i64>* %ptr
	Show All 38 Lines
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB9_4			; NOGATHER-NEXT: je .LBB9_4
	; NOGATHER-NEXT: # %bb.3: # %cond.load1			; NOGATHER-NEXT: # %bb.3: # %cond.load1
	; NOGATHER-NEXT: vpextrq $1, %xmm2, %rax			; NOGATHER-NEXT: vpextrq $1, %xmm2, %rax
	; NOGATHER-NEXT: vmovhpd {{.*#+}} xmm3 = xmm1[0],mem[0]			; NOGATHER-NEXT: vmovhpd {{.*#+}} xmm3 = xmm1[0],mem[0]
	; NOGATHER-NEXT: vblendpd {{.*#+}} ymm1 = ymm3[0,1],ymm1[2,3]			; NOGATHER-NEXT: vblendpd {{.*#+}} ymm1 = ymm3[0,1],ymm1[2,3]
	; NOGATHER-NEXT: .LBB9_4: # %else2			; NOGATHER-NEXT: .LBB9_4: # %else2
	; NOGATHER-NEXT: vpextrb $8, %xmm0, %eax			; NOGATHER-NEXT: vpextrb $8, %xmm0, %eax
				; NOGATHER-NEXT: vextractf128 $1, %ymm2, %xmm2
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB9_6			; NOGATHER-NEXT: je .LBB9_6
	; NOGATHER-NEXT: # %bb.5: # %cond.load4			; NOGATHER-NEXT: # %bb.5: # %cond.load4
	; NOGATHER-NEXT: vextractf128 $1, %ymm2, %xmm3			; NOGATHER-NEXT: vmovq %xmm2, %rax
	; NOGATHER-NEXT: vmovq %xmm3, %rax
	; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm3			; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm3
	; NOGATHER-NEXT: vmovlpd {{.*#+}} xmm3 = mem[0],xmm3[1]			; NOGATHER-NEXT: vmovlpd {{.*#+}} xmm3 = mem[0],xmm3[1]
	; NOGATHER-NEXT: vinsertf128 $1, %xmm3, %ymm1, %ymm1			; NOGATHER-NEXT: vinsertf128 $1, %xmm3, %ymm1, %ymm1
	; NOGATHER-NEXT: .LBB9_6: # %else5			; NOGATHER-NEXT: .LBB9_6: # %else5
	; NOGATHER-NEXT: vpextrb $12, %xmm0, %eax			; NOGATHER-NEXT: vpextrb $12, %xmm0, %eax
	; NOGATHER-NEXT: testb $1, %al			; NOGATHER-NEXT: testb $1, %al
	; NOGATHER-NEXT: je .LBB9_8			; NOGATHER-NEXT: je .LBB9_8
	; NOGATHER-NEXT: # %bb.7: # %cond.load7			; NOGATHER-NEXT: # %bb.7: # %cond.load7
	; NOGATHER-NEXT: vextractf128 $1, %ymm2, %xmm0			; NOGATHER-NEXT: vpextrq $1, %xmm2, %rax
	; NOGATHER-NEXT: vpextrq $1, %xmm0, %rax
	; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm0			; NOGATHER-NEXT: vextractf128 $1, %ymm1, %xmm0
	; NOGATHER-NEXT: vmovhpd {{.*#+}} xmm0 = xmm0[0],mem[0]			; NOGATHER-NEXT: vmovhpd {{.*#+}} xmm0 = xmm0[0],mem[0]
	; NOGATHER-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm1			; NOGATHER-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm1
	; NOGATHER-NEXT: .LBB9_8: # %else8			; NOGATHER-NEXT: .LBB9_8: # %else8
	; NOGATHER-NEXT: vmovapd %ymm1, %ymm0			; NOGATHER-NEXT: vmovapd %ymm1, %ymm0
	; NOGATHER-NEXT: retq			; NOGATHER-NEXT: retq
	entry:			entry:
	%ld = load <4 x double>, <4 x double>* %ptr			%ld = load <4 x double>, <4 x double>* %ptr
	▲ Show 20 Lines • Show All 94 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/masked_compressstore.ll

	Show First 20 Lines • Show All 124 Lines • ▼ Show 20 Lines
	; SSE42-NEXT: pextrb $14, %xmm4, %eax			; SSE42-NEXT: pextrb $14, %xmm4, %eax
	; SSE42-NEXT: testb $1, %al			; SSE42-NEXT: testb $1, %al
	; SSE42-NEXT: je LBB0_16			; SSE42-NEXT: je LBB0_16
	; SSE42-NEXT: ## %bb.15: ## %cond.store19			; SSE42-NEXT: ## %bb.15: ## %cond.store19
	; SSE42-NEXT: movhpd %xmm3, (%rdi)			; SSE42-NEXT: movhpd %xmm3, (%rdi)
	; SSE42-NEXT: LBB0_16: ## %else20			; SSE42-NEXT: LBB0_16: ## %else20
	; SSE42-NEXT: retq			; SSE42-NEXT: retq
	;			;
	; AVX1-LABEL: compressstore_v8f64_v8i1:			; AVX1OR2-LABEL: compressstore_v8f64_v8i1:
	; AVX1: ## %bb.0:			; AVX1OR2: ## %bb.0:
	; AVX1-NEXT: vpextrb $0, %xmm2, %eax			; AVX1OR2-NEXT: vpextrb $0, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB0_2			; AVX1OR2-NEXT: je LBB0_2
	; AVX1-NEXT: ## %bb.1: ## %cond.store			; AVX1OR2-NEXT: ## %bb.1: ## %cond.store
	; AVX1-NEXT: vmovlpd %xmm0, (%rdi)			; AVX1OR2-NEXT: vmovlpd %xmm0, (%rdi)
	; AVX1-NEXT: addq $8, %rdi			; AVX1OR2-NEXT: addq $8, %rdi
	; AVX1-NEXT: LBB0_2: ## %else			; AVX1OR2-NEXT: LBB0_2: ## %else
	; AVX1-NEXT: vpextrb $2, %xmm2, %eax			; AVX1OR2-NEXT: vpextrb $2, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB0_4			; AVX1OR2-NEXT: je LBB0_4
	; AVX1-NEXT: ## %bb.3: ## %cond.store1			; AVX1OR2-NEXT: ## %bb.3: ## %cond.store1
	; AVX1-NEXT: vmovhpd %xmm0, (%rdi)			; AVX1OR2-NEXT: vmovhpd %xmm0, (%rdi)
	; AVX1-NEXT: addq $8, %rdi			; AVX1OR2-NEXT: addq $8, %rdi
	; AVX1-NEXT: LBB0_4: ## %else2			; AVX1OR2-NEXT: LBB0_4: ## %else2
	; AVX1-NEXT: vpextrb $4, %xmm2, %eax			; AVX1OR2-NEXT: vpextrb $4, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB0_6			; AVX1OR2-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: ## %bb.5: ## %cond.store4			; AVX1OR2-NEXT: je LBB0_6
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1OR2-NEXT: ## %bb.5: ## %cond.store4
	; AVX1-NEXT: vmovlps %xmm3, (%rdi)			; AVX1OR2-NEXT: vmovlpd %xmm0, (%rdi)
	; AVX1-NEXT: addq $8, %rdi			; AVX1OR2-NEXT: addq $8, %rdi
	; AVX1-NEXT: LBB0_6: ## %else5			; AVX1OR2-NEXT: LBB0_6: ## %else5
	; AVX1-NEXT: vpextrb $6, %xmm2, %eax			; AVX1OR2-NEXT: vpextrb $6, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB0_8			; AVX1OR2-NEXT: je LBB0_8
	; AVX1-NEXT: ## %bb.7: ## %cond.store7			; AVX1OR2-NEXT: ## %bb.7: ## %cond.store7
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0			; AVX1OR2-NEXT: vmovhpd %xmm0, (%rdi)
	; AVX1-NEXT: vmovhpd %xmm0, (%rdi)			; AVX1OR2-NEXT: addq $8, %rdi
	; AVX1-NEXT: addq $8, %rdi			; AVX1OR2-NEXT: LBB0_8: ## %else8
	; AVX1-NEXT: LBB0_8: ## %else8			; AVX1OR2-NEXT: vpextrb $8, %xmm2, %eax
	; AVX1-NEXT: vpextrb $8, %xmm2, %eax			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: je LBB0_10
	; AVX1-NEXT: je LBB0_10			; AVX1OR2-NEXT: ## %bb.9: ## %cond.store10
	; AVX1-NEXT: ## %bb.9: ## %cond.store10			; AVX1OR2-NEXT: vmovlpd %xmm1, (%rdi)
	; AVX1-NEXT: vmovlpd %xmm1, (%rdi)			; AVX1OR2-NEXT: addq $8, %rdi
	; AVX1-NEXT: addq $8, %rdi			; AVX1OR2-NEXT: LBB0_10: ## %else11
	; AVX1-NEXT: LBB0_10: ## %else11			; AVX1OR2-NEXT: vpextrb $10, %xmm2, %eax
	; AVX1-NEXT: vpextrb $10, %xmm2, %eax			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: je LBB0_12
	; AVX1-NEXT: je LBB0_12			; AVX1OR2-NEXT: ## %bb.11: ## %cond.store13
	; AVX1-NEXT: ## %bb.11: ## %cond.store13			; AVX1OR2-NEXT: vmovhpd %xmm1, (%rdi)
	; AVX1-NEXT: vmovhpd %xmm1, (%rdi)			; AVX1OR2-NEXT: addq $8, %rdi
	; AVX1-NEXT: addq $8, %rdi			; AVX1OR2-NEXT: LBB0_12: ## %else14
	; AVX1-NEXT: LBB0_12: ## %else14			; AVX1OR2-NEXT: vpextrb $12, %xmm2, %eax
	; AVX1-NEXT: vpextrb $12, %xmm2, %eax			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: vextractf128 $1, %ymm1, %xmm0
	; AVX1-NEXT: je LBB0_14			; AVX1OR2-NEXT: je LBB0_14
	; AVX1-NEXT: ## %bb.13: ## %cond.store16			; AVX1OR2-NEXT: ## %bb.13: ## %cond.store16
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0			; AVX1OR2-NEXT: vmovlpd %xmm0, (%rdi)
	; AVX1-NEXT: vmovlpd %xmm0, (%rdi)			; AVX1OR2-NEXT: addq $8, %rdi
	; AVX1-NEXT: addq $8, %rdi			; AVX1OR2-NEXT: LBB0_14: ## %else17
	; AVX1-NEXT: LBB0_14: ## %else17			; AVX1OR2-NEXT: vpextrb $14, %xmm2, %eax
	; AVX1-NEXT: vpextrb $14, %xmm2, %eax			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: je LBB0_16
	; AVX1-NEXT: je LBB0_16			; AVX1OR2-NEXT: ## %bb.15: ## %cond.store19
	; AVX1-NEXT: ## %bb.15: ## %cond.store19			; AVX1OR2-NEXT: vmovhpd %xmm0, (%rdi)
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0			; AVX1OR2-NEXT: LBB0_16: ## %else20
	; AVX1-NEXT: vmovhpd %xmm0, (%rdi)			; AVX1OR2-NEXT: vzeroupper
	; AVX1-NEXT: LBB0_16: ## %else20			; AVX1OR2-NEXT: retq
	; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq
	;
	; AVX2-LABEL: compressstore_v8f64_v8i1:
	; AVX2: ## %bb.0:
	; AVX2-NEXT: vpextrb $0, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB0_2
	; AVX2-NEXT: ## %bb.1: ## %cond.store
	; AVX2-NEXT: vmovlpd %xmm0, (%rdi)
	; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB0_2: ## %else
	; AVX2-NEXT: vpextrb $2, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB0_4
	; AVX2-NEXT: ## %bb.3: ## %cond.store1
	; AVX2-NEXT: vmovhpd %xmm0, (%rdi)
	; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB0_4: ## %else2
	; AVX2-NEXT: vpextrb $4, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB0_6
	; AVX2-NEXT: ## %bb.5: ## %cond.store4
	; AVX2-NEXT: vextractf128 $1, %ymm0, %xmm3
	; AVX2-NEXT: vmovlpd %xmm3, (%rdi)
	; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB0_6: ## %else5
	; AVX2-NEXT: vpextrb $6, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB0_8
	; AVX2-NEXT: ## %bb.7: ## %cond.store7
	; AVX2-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX2-NEXT: vmovhpd %xmm0, (%rdi)
	; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB0_8: ## %else8
	; AVX2-NEXT: vpextrb $8, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB0_10
	; AVX2-NEXT: ## %bb.9: ## %cond.store10
	; AVX2-NEXT: vmovlpd %xmm1, (%rdi)
	; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB0_10: ## %else11
	; AVX2-NEXT: vpextrb $10, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB0_12
	; AVX2-NEXT: ## %bb.11: ## %cond.store13
	; AVX2-NEXT: vmovhpd %xmm1, (%rdi)
	; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB0_12: ## %else14
	; AVX2-NEXT: vpextrb $12, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB0_14
	; AVX2-NEXT: ## %bb.13: ## %cond.store16
	; AVX2-NEXT: vextractf128 $1, %ymm1, %xmm0
	; AVX2-NEXT: vmovlpd %xmm0, (%rdi)
	; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB0_14: ## %else17
	; AVX2-NEXT: vpextrb $14, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB0_16
	; AVX2-NEXT: ## %bb.15: ## %cond.store19
	; AVX2-NEXT: vextractf128 $1, %ymm1, %xmm0
	; AVX2-NEXT: vmovhpd %xmm0, (%rdi)
	; AVX2-NEXT: LBB0_16: ## %else20
	; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: compressstore_v8f64_v8i1:			; AVX512F-LABEL: compressstore_v8f64_v8i1:
	; AVX512F: ## %bb.0:			; AVX512F: ## %bb.0:
	; AVX512F-NEXT: vpmovzxwq {{.*#+}} zmm1 = xmm1[0],zero,zero,zero,xmm1[1],zero,zero,zero,xmm1[2],zero,zero,zero,xmm1[3],zero,zero,zero,xmm1[4],zero,zero,zero,xmm1[5],zero,zero,zero,xmm1[6],zero,zero,zero,xmm1[7],zero,zero,zero			; AVX512F-NEXT: vpmovzxwq {{.*#+}} zmm1 = xmm1[0],zero,zero,zero,xmm1[1],zero,zero,zero,xmm1[2],zero,zero,zero,xmm1[3],zero,zero,zero,xmm1[4],zero,zero,zero,xmm1[5],zero,zero,zero,xmm1[6],zero,zero,zero,xmm1[7],zero,zero,zero
	; AVX512F-NEXT: vpsllq $63, %zmm1, %zmm1			; AVX512F-NEXT: vpsllq $63, %zmm1, %zmm1
	; AVX512F-NEXT: vptestmq %zmm1, %zmm1, %k1			; AVX512F-NEXT: vptestmq %zmm1, %zmm1, %k1
	; AVX512F-NEXT: vcompresspd %zmm0, (%rdi) {%k1}			; AVX512F-NEXT: vcompresspd %zmm0, (%rdi) {%k1}
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	▲ Show 20 Lines • Show All 250 Lines • ▼ Show 20 Lines
	; SSE42-NEXT: pextrb $15, %xmm8, %eax			; SSE42-NEXT: pextrb $15, %xmm8, %eax
	; SSE42-NEXT: testb $1, %al			; SSE42-NEXT: testb $1, %al
	; SSE42-NEXT: je LBB1_32			; SSE42-NEXT: je LBB1_32
	; SSE42-NEXT: ## %bb.31: ## %cond.store43			; SSE42-NEXT: ## %bb.31: ## %cond.store43
	; SSE42-NEXT: movhpd %xmm7, (%rdi)			; SSE42-NEXT: movhpd %xmm7, (%rdi)
	; SSE42-NEXT: LBB1_32: ## %else44			; SSE42-NEXT: LBB1_32: ## %else44
	; SSE42-NEXT: retq			; SSE42-NEXT: retq
	;			;
	; AVX1-LABEL: compressstore_v16f64_v16i1:			; AVX1OR2-LABEL: compressstore_v16f64_v16i1:
	; AVX1: ## %bb.0:			; AVX1OR2: ## %bb.0:
	; AVX1-NEXT: vpextrb $0, %xmm4, %eax			; AVX1OR2-NEXT: vpextrb $0, %xmm4, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB1_2			; AVX1OR2-NEXT: je LBB1_2
	; AVX1-NEXT: ## %bb.1: ## %cond.store			; AVX1OR2-NEXT: ## %bb.1: ## %cond.store
	; AVX1-NEXT: vmovlpd %xmm0, (%rdi)			; AVX1OR2-NEXT: vmovlpd %xmm0, (%rdi)
	; AVX1-NEXT: addq $8, %rdi			; AVX1OR2-NEXT: addq $8, %rdi
	; AVX1-NEXT: LBB1_2: ## %else			; AVX1OR2-NEXT: LBB1_2: ## %else
	; AVX1-NEXT: vpextrb $1, %xmm4, %eax			; AVX1OR2-NEXT: vpextrb $1, %xmm4, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB1_4			; AVX1OR2-NEXT: je LBB1_4
	; AVX1-NEXT: ## %bb.3: ## %cond.store1			; AVX1OR2-NEXT: ## %bb.3: ## %cond.store1
	; AVX1-NEXT: vmovhpd %xmm0, (%rdi)			; AVX1OR2-NEXT: vmovhpd %xmm0, (%rdi)
	; AVX1-NEXT: addq $8, %rdi			; AVX1OR2-NEXT: addq $8, %rdi
	; AVX1-NEXT: LBB1_4: ## %else2			; AVX1OR2-NEXT: LBB1_4: ## %else2
	; AVX1-NEXT: vpextrb $2, %xmm4, %eax			; AVX1OR2-NEXT: vpextrb $2, %xmm4, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB1_6			; AVX1OR2-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: ## %bb.5: ## %cond.store4			; AVX1OR2-NEXT: je LBB1_6
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5			; AVX1OR2-NEXT: ## %bb.5: ## %cond.store4
	; AVX1-NEXT: vmovlps %xmm5, (%rdi)			; AVX1OR2-NEXT: vmovlpd %xmm0, (%rdi)
	; AVX1-NEXT: addq $8, %rdi			; AVX1OR2-NEXT: addq $8, %rdi
	; AVX1-NEXT: LBB1_6: ## %else5			; AVX1OR2-NEXT: LBB1_6: ## %else5
	; AVX1-NEXT: vpextrb $3, %xmm4, %eax			; AVX1OR2-NEXT: vpextrb $3, %xmm4, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB1_8			; AVX1OR2-NEXT: je LBB1_8
	; AVX1-NEXT: ## %bb.7: ## %cond.store7			; AVX1OR2-NEXT: ## %bb.7: ## %cond.store7
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0			; AVX1OR2-NEXT: vmovhpd %xmm0, (%rdi)
	; AVX1-NEXT: vmovhpd %xmm0, (%rdi)			; AVX1OR2-NEXT: addq $8, %rdi
	; AVX1-NEXT: addq $8, %rdi			; AVX1OR2-NEXT: LBB1_8: ## %else8
	; AVX1-NEXT: LBB1_8: ## %else8			; AVX1OR2-NEXT: vpextrb $4, %xmm4, %eax
	; AVX1-NEXT: vpextrb $4, %xmm4, %eax			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: je LBB1_10
	; AVX1-NEXT: je LBB1_10			; AVX1OR2-NEXT: ## %bb.9: ## %cond.store10
	; AVX1-NEXT: ## %bb.9: ## %cond.store10			; AVX1OR2-NEXT: vmovlpd %xmm1, (%rdi)
	; AVX1-NEXT: vmovlpd %xmm1, (%rdi)			; AVX1OR2-NEXT: addq $8, %rdi
	; AVX1-NEXT: addq $8, %rdi			; AVX1OR2-NEXT: LBB1_10: ## %else11
	; AVX1-NEXT: LBB1_10: ## %else11			; AVX1OR2-NEXT: vpextrb $5, %xmm4, %eax
	; AVX1-NEXT: vpextrb $5, %xmm4, %eax			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: je LBB1_12
	; AVX1-NEXT: je LBB1_12			; AVX1OR2-NEXT: ## %bb.11: ## %cond.store13
	; AVX1-NEXT: ## %bb.11: ## %cond.store13			; AVX1OR2-NEXT: vmovhpd %xmm1, (%rdi)
	; AVX1-NEXT: vmovhpd %xmm1, (%rdi)			; AVX1OR2-NEXT: addq $8, %rdi
	; AVX1-NEXT: addq $8, %rdi			; AVX1OR2-NEXT: LBB1_12: ## %else14
	; AVX1-NEXT: LBB1_12: ## %else14			; AVX1OR2-NEXT: vpextrb $6, %xmm4, %eax
	; AVX1-NEXT: vpextrb $6, %xmm4, %eax			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: vextractf128 $1, %ymm1, %xmm0
	; AVX1-NEXT: je LBB1_14			; AVX1OR2-NEXT: je LBB1_14
	; AVX1-NEXT: ## %bb.13: ## %cond.store16			; AVX1OR2-NEXT: ## %bb.13: ## %cond.store16
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0			; AVX1OR2-NEXT: vmovlpd %xmm0, (%rdi)
	; AVX1-NEXT: vmovlpd %xmm0, (%rdi)			; AVX1OR2-NEXT: addq $8, %rdi
	; AVX1-NEXT: addq $8, %rdi			; AVX1OR2-NEXT: LBB1_14: ## %else17
	; AVX1-NEXT: LBB1_14: ## %else17			; AVX1OR2-NEXT: vpextrb $7, %xmm4, %eax
	; AVX1-NEXT: vpextrb $7, %xmm4, %eax			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: je LBB1_16
	; AVX1-NEXT: je LBB1_16			; AVX1OR2-NEXT: ## %bb.15: ## %cond.store19
	; AVX1-NEXT: ## %bb.15: ## %cond.store19			; AVX1OR2-NEXT: vmovhpd %xmm0, (%rdi)
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0			; AVX1OR2-NEXT: addq $8, %rdi
	; AVX1-NEXT: vmovhpd %xmm0, (%rdi)			; AVX1OR2-NEXT: LBB1_16: ## %else20
	; AVX1-NEXT: addq $8, %rdi			; AVX1OR2-NEXT: vpextrb $8, %xmm4, %eax
	; AVX1-NEXT: LBB1_16: ## %else20			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: vpextrb $8, %xmm4, %eax			; AVX1OR2-NEXT: je LBB1_18
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: ## %bb.17: ## %cond.store22
	; AVX1-NEXT: je LBB1_18			; AVX1OR2-NEXT: vmovlpd %xmm2, (%rdi)
	; AVX1-NEXT: ## %bb.17: ## %cond.store22			; AVX1OR2-NEXT: addq $8, %rdi
	; AVX1-NEXT: vmovlpd %xmm2, (%rdi)			; AVX1OR2-NEXT: LBB1_18: ## %else23
	; AVX1-NEXT: addq $8, %rdi			; AVX1OR2-NEXT: vpextrb $9, %xmm4, %eax
	; AVX1-NEXT: LBB1_18: ## %else23			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: vpextrb $9, %xmm4, %eax			; AVX1OR2-NEXT: je LBB1_20
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: ## %bb.19: ## %cond.store25
	; AVX1-NEXT: je LBB1_20			; AVX1OR2-NEXT: vmovhpd %xmm2, (%rdi)
	; AVX1-NEXT: ## %bb.19: ## %cond.store25			; AVX1OR2-NEXT: addq $8, %rdi
	; AVX1-NEXT: vmovhpd %xmm2, (%rdi)			; AVX1OR2-NEXT: LBB1_20: ## %else26
	; AVX1-NEXT: addq $8, %rdi			; AVX1OR2-NEXT: vpextrb $10, %xmm4, %eax
	; AVX1-NEXT: LBB1_20: ## %else26			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: vpextrb $10, %xmm4, %eax			; AVX1OR2-NEXT: vextractf128 $1, %ymm2, %xmm0
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: je LBB1_22
	; AVX1-NEXT: je LBB1_22			; AVX1OR2-NEXT: ## %bb.21: ## %cond.store28
	; AVX1-NEXT: ## %bb.21: ## %cond.store28			; AVX1OR2-NEXT: vmovlpd %xmm0, (%rdi)
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm0			; AVX1OR2-NEXT: addq $8, %rdi
	; AVX1-NEXT: vmovlpd %xmm0, (%rdi)			; AVX1OR2-NEXT: LBB1_22: ## %else29
	; AVX1-NEXT: addq $8, %rdi			; AVX1OR2-NEXT: vpextrb $11, %xmm4, %eax
	; AVX1-NEXT: LBB1_22: ## %else29			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: vpextrb $11, %xmm4, %eax			; AVX1OR2-NEXT: je LBB1_24
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: ## %bb.23: ## %cond.store31
	; AVX1-NEXT: je LBB1_24			; AVX1OR2-NEXT: vmovhpd %xmm0, (%rdi)
	; AVX1-NEXT: ## %bb.23: ## %cond.store31			; AVX1OR2-NEXT: addq $8, %rdi
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm0			; AVX1OR2-NEXT: LBB1_24: ## %else32
	; AVX1-NEXT: vmovhpd %xmm0, (%rdi)			; AVX1OR2-NEXT: vpextrb $12, %xmm4, %eax
	; AVX1-NEXT: addq $8, %rdi			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: LBB1_24: ## %else32			; AVX1OR2-NEXT: je LBB1_26
	; AVX1-NEXT: vpextrb $12, %xmm4, %eax			; AVX1OR2-NEXT: ## %bb.25: ## %cond.store34
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: vmovlpd %xmm3, (%rdi)
	; AVX1-NEXT: je LBB1_26			; AVX1OR2-NEXT: addq $8, %rdi
	; AVX1-NEXT: ## %bb.25: ## %cond.store34			; AVX1OR2-NEXT: LBB1_26: ## %else35
	; AVX1-NEXT: vmovlpd %xmm3, (%rdi)			; AVX1OR2-NEXT: vpextrb $13, %xmm4, %eax
	; AVX1-NEXT: addq $8, %rdi			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: LBB1_26: ## %else35			; AVX1OR2-NEXT: je LBB1_28
	; AVX1-NEXT: vpextrb $13, %xmm4, %eax			; AVX1OR2-NEXT: ## %bb.27: ## %cond.store37
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: vmovhpd %xmm3, (%rdi)
	; AVX1-NEXT: je LBB1_28			; AVX1OR2-NEXT: addq $8, %rdi
	; AVX1-NEXT: ## %bb.27: ## %cond.store37			; AVX1OR2-NEXT: LBB1_28: ## %else38
	; AVX1-NEXT: vmovhpd %xmm3, (%rdi)			; AVX1OR2-NEXT: vpextrb $14, %xmm4, %eax
	; AVX1-NEXT: addq $8, %rdi			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: LBB1_28: ## %else38			; AVX1OR2-NEXT: vextractf128 $1, %ymm3, %xmm0
	; AVX1-NEXT: vpextrb $14, %xmm4, %eax			; AVX1OR2-NEXT: je LBB1_30
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: ## %bb.29: ## %cond.store40
	; AVX1-NEXT: je LBB1_30			; AVX1OR2-NEXT: vmovlpd %xmm0, (%rdi)
	; AVX1-NEXT: ## %bb.29: ## %cond.store40			; AVX1OR2-NEXT: addq $8, %rdi
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm0			; AVX1OR2-NEXT: LBB1_30: ## %else41
	; AVX1-NEXT: vmovlpd %xmm0, (%rdi)			; AVX1OR2-NEXT: vpextrb $15, %xmm4, %eax
	; AVX1-NEXT: addq $8, %rdi			; AVX1OR2-NEXT: testb $1, %al
	; AVX1-NEXT: LBB1_30: ## %else41			; AVX1OR2-NEXT: je LBB1_32
	; AVX1-NEXT: vpextrb $15, %xmm4, %eax			; AVX1OR2-NEXT: ## %bb.31: ## %cond.store43
	; AVX1-NEXT: testb $1, %al			; AVX1OR2-NEXT: vmovhpd %xmm0, (%rdi)
	; AVX1-NEXT: je LBB1_32			; AVX1OR2-NEXT: LBB1_32: ## %else44
	; AVX1-NEXT: ## %bb.31: ## %cond.store43			; AVX1OR2-NEXT: vzeroupper
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm0			; AVX1OR2-NEXT: retq
	; AVX1-NEXT: vmovhpd %xmm0, (%rdi)
	; AVX1-NEXT: LBB1_32: ## %else44
	; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq
	;
	; AVX2-LABEL: compressstore_v16f64_v16i1:
	; AVX2: ## %bb.0:
	; AVX2-NEXT: vpextrb $0, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB1_2
	; AVX2-NEXT: ## %bb.1: ## %cond.store
	; AVX2-NEXT: vmovlpd %xmm0, (%rdi)
	; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB1_2: ## %else
	; AVX2-NEXT: vpextrb $1, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB1_4
	; AVX2-NEXT: ## %bb.3: ## %cond.store1
	; AVX2-NEXT: vmovhpd %xmm0, (%rdi)
	; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB1_4: ## %else2
	; AVX2-NEXT: vpextrb $2, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB1_6
	; AVX2-NEXT: ## %bb.5: ## %cond.store4
	; AVX2-NEXT: vextractf128 $1, %ymm0, %xmm5
	; AVX2-NEXT: vmovlpd %xmm5, (%rdi)
	; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB1_6: ## %else5
	; AVX2-NEXT: vpextrb $3, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB1_8
	; AVX2-NEXT: ## %bb.7: ## %cond.store7
	; AVX2-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX2-NEXT: vmovhpd %xmm0, (%rdi)
	; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB1_8: ## %else8
	; AVX2-NEXT: vpextrb $4, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB1_10
	; AVX2-NEXT: ## %bb.9: ## %cond.store10
	; AVX2-NEXT: vmovlpd %xmm1, (%rdi)
	; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB1_10: ## %else11
	; AVX2-NEXT: vpextrb $5, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB1_12
	; AVX2-NEXT: ## %bb.11: ## %cond.store13
	; AVX2-NEXT: vmovhpd %xmm1, (%rdi)
	; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB1_12: ## %else14
	; AVX2-NEXT: vpextrb $6, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB1_14
	; AVX2-NEXT: ## %bb.13: ## %cond.store16
	; AVX2-NEXT: vextractf128 $1, %ymm1, %xmm0
	; AVX2-NEXT: vmovlpd %xmm0, (%rdi)
	; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB1_14: ## %else17
	; AVX2-NEXT: vpextrb $7, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB1_16
	; AVX2-NEXT: ## %bb.15: ## %cond.store19
	; AVX2-NEXT: vextractf128 $1, %ymm1, %xmm0
	; AVX2-NEXT: vmovhpd %xmm0, (%rdi)
	; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB1_16: ## %else20
	; AVX2-NEXT: vpextrb $8, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB1_18
	; AVX2-NEXT: ## %bb.17: ## %cond.store22
	; AVX2-NEXT: vmovlpd %xmm2, (%rdi)
	; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB1_18: ## %else23
	; AVX2-NEXT: vpextrb $9, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB1_20
	; AVX2-NEXT: ## %bb.19: ## %cond.store25
	; AVX2-NEXT: vmovhpd %xmm2, (%rdi)
	; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB1_20: ## %else26
	; AVX2-NEXT: vpextrb $10, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB1_22
	; AVX2-NEXT: ## %bb.21: ## %cond.store28
	; AVX2-NEXT: vextractf128 $1, %ymm2, %xmm0
	; AVX2-NEXT: vmovlpd %xmm0, (%rdi)
	; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB1_22: ## %else29
	; AVX2-NEXT: vpextrb $11, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB1_24
	; AVX2-NEXT: ## %bb.23: ## %cond.store31
	; AVX2-NEXT: vextractf128 $1, %ymm2, %xmm0
	; AVX2-NEXT: vmovhpd %xmm0, (%rdi)
	; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB1_24: ## %else32
	; AVX2-NEXT: vpextrb $12, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB1_26
	; AVX2-NEXT: ## %bb.25: ## %cond.store34
	; AVX2-NEXT: vmovlpd %xmm3, (%rdi)
	; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB1_26: ## %else35
	; AVX2-NEXT: vpextrb $13, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB1_28
	; AVX2-NEXT: ## %bb.27: ## %cond.store37
	; AVX2-NEXT: vmovhpd %xmm3, (%rdi)
	; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB1_28: ## %else38
	; AVX2-NEXT: vpextrb $14, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB1_30
	; AVX2-NEXT: ## %bb.29: ## %cond.store40
	; AVX2-NEXT: vextractf128 $1, %ymm3, %xmm0
	; AVX2-NEXT: vmovlpd %xmm0, (%rdi)
	; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB1_30: ## %else41
	; AVX2-NEXT: vpextrb $15, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB1_32
	; AVX2-NEXT: ## %bb.31: ## %cond.store43
	; AVX2-NEXT: vextractf128 $1, %ymm3, %xmm0
	; AVX2-NEXT: vmovhpd %xmm0, (%rdi)
	; AVX2-NEXT: LBB1_32: ## %else44
	; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: compressstore_v16f64_v16i1:			; AVX512F-LABEL: compressstore_v16f64_v16i1:
	; AVX512F: ## %bb.0:			; AVX512F: ## %bb.0:
	; AVX512F-NEXT: vpmovzxbd {{.*#+}} zmm2 = xmm2[0],zero,zero,zero,xmm2[1],zero,zero,zero,xmm2[2],zero,zero,zero,xmm2[3],zero,zero,zero,xmm2[4],zero,zero,zero,xmm2[5],zero,zero,zero,xmm2[6],zero,zero,zero,xmm2[7],zero,zero,zero,xmm2[8],zero,zero,zero,xmm2[9],zero,zero,zero,xmm2[10],zero,zero,zero,xmm2[11],zero,zero,zero,xmm2[12],zero,zero,zero,xmm2[13],zero,zero,zero,xmm2[14],zero,zero,zero,xmm2[15],zero,zero,zero			; AVX512F-NEXT: vpmovzxbd {{.*#+}} zmm2 = xmm2[0],zero,zero,zero,xmm2[1],zero,zero,zero,xmm2[2],zero,zero,zero,xmm2[3],zero,zero,zero,xmm2[4],zero,zero,zero,xmm2[5],zero,zero,zero,xmm2[6],zero,zero,zero,xmm2[7],zero,zero,zero,xmm2[8],zero,zero,zero,xmm2[9],zero,zero,zero,xmm2[10],zero,zero,zero,xmm2[11],zero,zero,zero,xmm2[12],zero,zero,zero,xmm2[13],zero,zero,zero,xmm2[14],zero,zero,zero,xmm2[15],zero,zero,zero
	; AVX512F-NEXT: vpslld $31, %zmm2, %zmm2			; AVX512F-NEXT: vpslld $31, %zmm2, %zmm2
	; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k1			; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k1
	; AVX512F-NEXT: kshiftrw $8, %k1, %k2			; AVX512F-NEXT: kshiftrw $8, %k1, %k2
	; AVX512F-NEXT: vcompresspd %zmm0, (%rdi) {%k1}			; AVX512F-NEXT: vcompresspd %zmm0, (%rdi) {%k1}
	▲ Show 20 Lines • Show All 470 Lines • ▼ Show 20 Lines
	; AVX1OR2-NEXT: testb $1, %al			; AVX1OR2-NEXT: testb $1, %al
	; AVX1OR2-NEXT: je LBB4_8			; AVX1OR2-NEXT: je LBB4_8
	; AVX1OR2-NEXT: ## %bb.7: ## %cond.store7			; AVX1OR2-NEXT: ## %bb.7: ## %cond.store7
	; AVX1OR2-NEXT: vextractps $3, %xmm0, (%rdi)			; AVX1OR2-NEXT: vextractps $3, %xmm0, (%rdi)
	; AVX1OR2-NEXT: addq $4, %rdi			; AVX1OR2-NEXT: addq $4, %rdi
	; AVX1OR2-NEXT: LBB4_8: ## %else8			; AVX1OR2-NEXT: LBB4_8: ## %else8
	; AVX1OR2-NEXT: vpextrb $8, %xmm1, %eax			; AVX1OR2-NEXT: vpextrb $8, %xmm1, %eax
	; AVX1OR2-NEXT: testb $1, %al			; AVX1OR2-NEXT: testb $1, %al
				; AVX1OR2-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1OR2-NEXT: je LBB4_10			; AVX1OR2-NEXT: je LBB4_10
	; AVX1OR2-NEXT: ## %bb.9: ## %cond.store10			; AVX1OR2-NEXT: ## %bb.9: ## %cond.store10
	; AVX1OR2-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1OR2-NEXT: vmovss %xmm0, (%rdi)
	; AVX1OR2-NEXT: vmovss %xmm2, (%rdi)
	; AVX1OR2-NEXT: addq $4, %rdi			; AVX1OR2-NEXT: addq $4, %rdi
	; AVX1OR2-NEXT: LBB4_10: ## %else11			; AVX1OR2-NEXT: LBB4_10: ## %else11
	; AVX1OR2-NEXT: vpextrb $10, %xmm1, %eax			; AVX1OR2-NEXT: vpextrb $10, %xmm1, %eax
	; AVX1OR2-NEXT: testb $1, %al			; AVX1OR2-NEXT: testb $1, %al
	; AVX1OR2-NEXT: je LBB4_12			; AVX1OR2-NEXT: je LBB4_12
	; AVX1OR2-NEXT: ## %bb.11: ## %cond.store13			; AVX1OR2-NEXT: ## %bb.11: ## %cond.store13
	; AVX1OR2-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1OR2-NEXT: vextractps $1, %xmm0, (%rdi)
	; AVX1OR2-NEXT: vextractps $1, %xmm2, (%rdi)
	; AVX1OR2-NEXT: addq $4, %rdi			; AVX1OR2-NEXT: addq $4, %rdi
	; AVX1OR2-NEXT: LBB4_12: ## %else14			; AVX1OR2-NEXT: LBB4_12: ## %else14
	; AVX1OR2-NEXT: vpextrb $12, %xmm1, %eax			; AVX1OR2-NEXT: vpextrb $12, %xmm1, %eax
	; AVX1OR2-NEXT: testb $1, %al			; AVX1OR2-NEXT: testb $1, %al
	; AVX1OR2-NEXT: je LBB4_14			; AVX1OR2-NEXT: je LBB4_14
	; AVX1OR2-NEXT: ## %bb.13: ## %cond.store16			; AVX1OR2-NEXT: ## %bb.13: ## %cond.store16
	; AVX1OR2-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1OR2-NEXT: vextractps $2, %xmm0, (%rdi)
	; AVX1OR2-NEXT: vextractps $2, %xmm2, (%rdi)
	; AVX1OR2-NEXT: addq $4, %rdi			; AVX1OR2-NEXT: addq $4, %rdi
	; AVX1OR2-NEXT: LBB4_14: ## %else17			; AVX1OR2-NEXT: LBB4_14: ## %else17
	; AVX1OR2-NEXT: vpextrb $14, %xmm1, %eax			; AVX1OR2-NEXT: vpextrb $14, %xmm1, %eax
	; AVX1OR2-NEXT: testb $1, %al			; AVX1OR2-NEXT: testb $1, %al
	; AVX1OR2-NEXT: je LBB4_16			; AVX1OR2-NEXT: je LBB4_16
	; AVX1OR2-NEXT: ## %bb.15: ## %cond.store19			; AVX1OR2-NEXT: ## %bb.15: ## %cond.store19
	; AVX1OR2-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1OR2-NEXT: vextractps $3, %xmm0, (%rdi)			; AVX1OR2-NEXT: vextractps $3, %xmm0, (%rdi)
	; AVX1OR2-NEXT: LBB4_16: ## %else20			; AVX1OR2-NEXT: LBB4_16: ## %else20
	; AVX1OR2-NEXT: vzeroupper			; AVX1OR2-NEXT: vzeroupper
	; AVX1OR2-NEXT: retq			; AVX1OR2-NEXT: retq
	;			;
	; AVX512F-LABEL: compressstore_v8f32_v8i1:			; AVX512F-LABEL: compressstore_v8f32_v8i1:
	; AVX512F: ## %bb.0:			; AVX512F: ## %bb.0:
	; AVX512F-NEXT: ## kill: def $ymm0 killed $ymm0 def $zmm0			; AVX512F-NEXT: ## kill: def $ymm0 killed $ymm0 def $zmm0
	▲ Show 20 Lines • Show All 746 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: LBB6_8: ## %else8			; AVX1-NEXT: LBB6_8: ## %else8
	; AVX1-NEXT: vextractf128 $1, %ymm4, %xmm8			; AVX1-NEXT: vextractf128 $1, %ymm4, %xmm8
	; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4			; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4
	; AVX1-NEXT: vpcmpeqd %xmm4, %xmm8, %xmm9			; AVX1-NEXT: vpcmpeqd %xmm4, %xmm8, %xmm9
	; AVX1-NEXT: vpackssdw %xmm9, %xmm0, %xmm4			; AVX1-NEXT: vpackssdw %xmm9, %xmm0, %xmm4
	; AVX1-NEXT: vpacksswb %xmm0, %xmm4, %xmm4			; AVX1-NEXT: vpacksswb %xmm0, %xmm4, %xmm4
	; AVX1-NEXT: vpextrb $4, %xmm4, %eax			; AVX1-NEXT: vpextrb $4, %xmm4, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
				; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm10
	; AVX1-NEXT: je LBB6_10			; AVX1-NEXT: je LBB6_10
	; AVX1-NEXT: ## %bb.9: ## %cond.store10			; AVX1-NEXT: ## %bb.9: ## %cond.store10
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vmovss %xmm10, (%rdi)
	; AVX1-NEXT: vmovd %xmm4, (%rdi)
	; AVX1-NEXT: addq $4, %rdi			; AVX1-NEXT: addq $4, %rdi
	; AVX1-NEXT: LBB6_10: ## %else11			; AVX1-NEXT: LBB6_10: ## %else11
	; AVX1-NEXT: vpackssdw %xmm9, %xmm0, %xmm4			; AVX1-NEXT: vpackssdw %xmm9, %xmm0, %xmm4
	; AVX1-NEXT: vpacksswb %xmm0, %xmm4, %xmm4			; AVX1-NEXT: vpacksswb %xmm0, %xmm4, %xmm4
	; AVX1-NEXT: vpextrb $5, %xmm4, %eax			; AVX1-NEXT: vpextrb $5, %xmm4, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB6_12			; AVX1-NEXT: je LBB6_12
	; AVX1-NEXT: ## %bb.11: ## %cond.store13			; AVX1-NEXT: ## %bb.11: ## %cond.store13
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vextractps $1, %xmm10, (%rdi)
	; AVX1-NEXT: vpextrd $1, %xmm4, (%rdi)
	; AVX1-NEXT: addq $4, %rdi			; AVX1-NEXT: addq $4, %rdi
	; AVX1-NEXT: LBB6_12: ## %else14			; AVX1-NEXT: LBB6_12: ## %else14
	; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4			; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4
	; AVX1-NEXT: vpcmpeqd %xmm4, %xmm8, %xmm8			; AVX1-NEXT: vpcmpeqd %xmm4, %xmm8, %xmm4
	; AVX1-NEXT: vpackssdw %xmm8, %xmm0, %xmm4			; AVX1-NEXT: vpackssdw %xmm4, %xmm0, %xmm0
	; AVX1-NEXT: vpacksswb %xmm0, %xmm4, %xmm4			; AVX1-NEXT: vpacksswb %xmm0, %xmm0, %xmm0
	; AVX1-NEXT: vpextrb $6, %xmm4, %eax			; AVX1-NEXT: vpextrb $6, %xmm0, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB6_14			; AVX1-NEXT: je LBB6_14
	; AVX1-NEXT: ## %bb.13: ## %cond.store16			; AVX1-NEXT: ## %bb.13: ## %cond.store16
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vextractps $2, %xmm10, (%rdi)
	; AVX1-NEXT: vpextrd $2, %xmm4, (%rdi)
	; AVX1-NEXT: addq $4, %rdi			; AVX1-NEXT: addq $4, %rdi
	; AVX1-NEXT: LBB6_14: ## %else17			; AVX1-NEXT: LBB6_14: ## %else17
	; AVX1-NEXT: vpackssdw %xmm8, %xmm0, %xmm4			; AVX1-NEXT: vpackssdw %xmm4, %xmm0, %xmm0
	; AVX1-NEXT: vpacksswb %xmm0, %xmm4, %xmm4			; AVX1-NEXT: vpacksswb %xmm0, %xmm0, %xmm0
	; AVX1-NEXT: vpextrb $7, %xmm4, %eax			; AVX1-NEXT: vpextrb $7, %xmm0, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB6_16			; AVX1-NEXT: je LBB6_16
	; AVX1-NEXT: ## %bb.15: ## %cond.store19			; AVX1-NEXT: ## %bb.15: ## %cond.store19
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0			; AVX1-NEXT: vextractps $3, %xmm10, (%rdi)
	; AVX1-NEXT: vpextrd $3, %xmm0, (%rdi)
	; AVX1-NEXT: addq $4, %rdi			; AVX1-NEXT: addq $4, %rdi
	; AVX1-NEXT: LBB6_16: ## %else20			; AVX1-NEXT: LBB6_16: ## %else20
	; AVX1-NEXT: vpxor %xmm0, %xmm0, %xmm0			; AVX1-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; AVX1-NEXT: vpcmpeqd %xmm0, %xmm5, %xmm4			; AVX1-NEXT: vpcmpeqd %xmm0, %xmm5, %xmm4
	; AVX1-NEXT: vpackssdw %xmm0, %xmm4, %xmm4			; AVX1-NEXT: vpackssdw %xmm0, %xmm4, %xmm4
	; AVX1-NEXT: vpacksswb %xmm4, %xmm0, %xmm4			; AVX1-NEXT: vpacksswb %xmm4, %xmm0, %xmm4
	; AVX1-NEXT: vpextrb $8, %xmm4, %eax			; AVX1-NEXT: vpextrb $8, %xmm4, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	Show All 28 Lines
	; AVX1-NEXT: vpacksswb %xmm0, %xmm0, %xmm0			; AVX1-NEXT: vpacksswb %xmm0, %xmm0, %xmm0
	; AVX1-NEXT: vpextrb $11, %xmm0, %eax			; AVX1-NEXT: vpextrb $11, %xmm0, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB6_24			; AVX1-NEXT: je LBB6_24
	; AVX1-NEXT: ## %bb.23: ## %cond.store31			; AVX1-NEXT: ## %bb.23: ## %cond.store31
	; AVX1-NEXT: vextractps $3, %xmm1, (%rdi)			; AVX1-NEXT: vextractps $3, %xmm1, (%rdi)
	; AVX1-NEXT: addq $4, %rdi			; AVX1-NEXT: addq $4, %rdi
	; AVX1-NEXT: LBB6_24: ## %else32			; AVX1-NEXT: LBB6_24: ## %else32
	; AVX1-NEXT: vextractf128 $1, %ymm5, %xmm0			; AVX1-NEXT: vextractf128 $1, %ymm5, %xmm4
	; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4			; AVX1-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; AVX1-NEXT: vpcmpeqd %xmm4, %xmm0, %xmm4			; AVX1-NEXT: vpcmpeqd %xmm0, %xmm4, %xmm5
	; AVX1-NEXT: vpackssdw %xmm4, %xmm0, %xmm5			; AVX1-NEXT: vpackssdw %xmm5, %xmm0, %xmm0
	; AVX1-NEXT: vpacksswb %xmm5, %xmm0, %xmm5			; AVX1-NEXT: vpacksswb %xmm0, %xmm0, %xmm0
	; AVX1-NEXT: vpextrb $12, %xmm5, %eax			; AVX1-NEXT: vpextrb $12, %xmm0, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
				; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0
	; AVX1-NEXT: je LBB6_26			; AVX1-NEXT: je LBB6_26
	; AVX1-NEXT: ## %bb.25: ## %cond.store34			; AVX1-NEXT: ## %bb.25: ## %cond.store34
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5			; AVX1-NEXT: vmovd %xmm0, (%rdi)
	; AVX1-NEXT: vmovd %xmm5, (%rdi)
	; AVX1-NEXT: addq $4, %rdi			; AVX1-NEXT: addq $4, %rdi
	; AVX1-NEXT: LBB6_26: ## %else35			; AVX1-NEXT: LBB6_26: ## %else35
	; AVX1-NEXT: vpackssdw %xmm4, %xmm0, %xmm4			; AVX1-NEXT: vpackssdw %xmm5, %xmm0, %xmm1
	; AVX1-NEXT: vpacksswb %xmm4, %xmm0, %xmm4			; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpextrb $13, %xmm4, %eax			; AVX1-NEXT: vpextrb $13, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB6_28			; AVX1-NEXT: je LBB6_28
	; AVX1-NEXT: ## %bb.27: ## %cond.store37			; AVX1-NEXT: ## %bb.27: ## %cond.store37
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4			; AVX1-NEXT: vpextrd $1, %xmm0, (%rdi)
	; AVX1-NEXT: vpextrd $1, %xmm4, (%rdi)
	; AVX1-NEXT: addq $4, %rdi			; AVX1-NEXT: addq $4, %rdi
	; AVX1-NEXT: LBB6_28: ## %else38			; AVX1-NEXT: LBB6_28: ## %else38
	; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4			; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpeqd %xmm4, %xmm0, %xmm0			; AVX1-NEXT: vpcmpeqd %xmm1, %xmm4, %xmm1
	; AVX1-NEXT: vpackssdw %xmm0, %xmm0, %xmm4			; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm4
	; AVX1-NEXT: vpacksswb %xmm4, %xmm0, %xmm4			; AVX1-NEXT: vpacksswb %xmm4, %xmm0, %xmm4
	; AVX1-NEXT: vpextrb $14, %xmm4, %eax			; AVX1-NEXT: vpextrb $14, %xmm4, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB6_30			; AVX1-NEXT: je LBB6_30
	; AVX1-NEXT: ## %bb.29: ## %cond.store40			; AVX1-NEXT: ## %bb.29: ## %cond.store40
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4			; AVX1-NEXT: vpextrd $2, %xmm0, (%rdi)
	; AVX1-NEXT: vpextrd $2, %xmm4, (%rdi)
	; AVX1-NEXT: addq $4, %rdi			; AVX1-NEXT: addq $4, %rdi
	; AVX1-NEXT: LBB6_30: ## %else41			; AVX1-NEXT: LBB6_30: ## %else41
	; AVX1-NEXT: vpackssdw %xmm0, %xmm0, %xmm0			; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpacksswb %xmm0, %xmm0, %xmm0			; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpextrb $15, %xmm0, %eax			; AVX1-NEXT: vpextrb $15, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB6_32			; AVX1-NEXT: je LBB6_32
	; AVX1-NEXT: ## %bb.31: ## %cond.store43			; AVX1-NEXT: ## %bb.31: ## %cond.store43
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0
	; AVX1-NEXT: vpextrd $3, %xmm0, (%rdi)			; AVX1-NEXT: vpextrd $3, %xmm0, (%rdi)
	; AVX1-NEXT: addq $4, %rdi			; AVX1-NEXT: addq $4, %rdi
	; AVX1-NEXT: LBB6_32: ## %else44			; AVX1-NEXT: LBB6_32: ## %else44
	; AVX1-NEXT: vpxor %xmm0, %xmm0, %xmm0			; AVX1-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; AVX1-NEXT: vpcmpeqd %xmm0, %xmm6, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm0, %xmm6, %xmm1
	; AVX1-NEXT: vpackssdw %xmm0, %xmm1, %xmm1			; AVX1-NEXT: vpackssdw %xmm0, %xmm1, %xmm1
	; AVX1-NEXT: vpacksswb %xmm0, %xmm1, %xmm1			; AVX1-NEXT: vpacksswb %xmm0, %xmm1, %xmm1
	; AVX1-NEXT: vpextrb $0, %xmm1, %eax			; AVX1-NEXT: vpextrb $0, %xmm1, %eax
	Show All 29 Lines
	; AVX1-NEXT: vpacksswb %xmm0, %xmm0, %xmm0			; AVX1-NEXT: vpacksswb %xmm0, %xmm0, %xmm0
	; AVX1-NEXT: vpextrb $3, %xmm0, %eax			; AVX1-NEXT: vpextrb $3, %xmm0, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB6_40			; AVX1-NEXT: je LBB6_40
	; AVX1-NEXT: ## %bb.39: ## %cond.store55			; AVX1-NEXT: ## %bb.39: ## %cond.store55
	; AVX1-NEXT: vextractps $3, %xmm2, (%rdi)			; AVX1-NEXT: vextractps $3, %xmm2, (%rdi)
	; AVX1-NEXT: addq $4, %rdi			; AVX1-NEXT: addq $4, %rdi
	; AVX1-NEXT: LBB6_40: ## %else56			; AVX1-NEXT: LBB6_40: ## %else56
	; AVX1-NEXT: vextractf128 $1, %ymm6, %xmm0			; AVX1-NEXT: vextractf128 $1, %ymm6, %xmm1
	; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm0, %xmm1, %xmm4
	; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm4			; AVX1-NEXT: vpackssdw %xmm4, %xmm0, %xmm0
	; AVX1-NEXT: vpacksswb %xmm0, %xmm4, %xmm4			; AVX1-NEXT: vpacksswb %xmm0, %xmm0, %xmm0
	; AVX1-NEXT: vpextrb $4, %xmm4, %eax			; AVX1-NEXT: vpextrb $4, %xmm0, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
				; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm0
	; AVX1-NEXT: je LBB6_42			; AVX1-NEXT: je LBB6_42
	; AVX1-NEXT: ## %bb.41: ## %cond.store58			; AVX1-NEXT: ## %bb.41: ## %cond.store58
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm4			; AVX1-NEXT: vmovd %xmm0, (%rdi)
	; AVX1-NEXT: vmovd %xmm4, (%rdi)
	; AVX1-NEXT: addq $4, %rdi			; AVX1-NEXT: addq $4, %rdi
	; AVX1-NEXT: LBB6_42: ## %else59			; AVX1-NEXT: LBB6_42: ## %else59
	; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpackssdw %xmm4, %xmm0, %xmm2
	; AVX1-NEXT: vpacksswb %xmm0, %xmm1, %xmm1			; AVX1-NEXT: vpacksswb %xmm0, %xmm2, %xmm2
	; AVX1-NEXT: vpextrb $5, %xmm1, %eax			; AVX1-NEXT: vpextrb $5, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB6_44			; AVX1-NEXT: je LBB6_44
	; AVX1-NEXT: ## %bb.43: ## %cond.store61			; AVX1-NEXT: ## %bb.43: ## %cond.store61
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm1			; AVX1-NEXT: vpextrd $1, %xmm0, (%rdi)
	; AVX1-NEXT: vpextrd $1, %xmm1, (%rdi)
	; AVX1-NEXT: addq $4, %rdi			; AVX1-NEXT: addq $4, %rdi
	; AVX1-NEXT: LBB6_44: ## %else62			; AVX1-NEXT: LBB6_44: ## %else62
	; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpackssdw %xmm0, %xmm0, %xmm1			; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vpacksswb %xmm0, %xmm1, %xmm1			; AVX1-NEXT: vpacksswb %xmm0, %xmm2, %xmm2
	; AVX1-NEXT: vpextrb $6, %xmm1, %eax			; AVX1-NEXT: vpextrb $6, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB6_46			; AVX1-NEXT: je LBB6_46
	; AVX1-NEXT: ## %bb.45: ## %cond.store64			; AVX1-NEXT: ## %bb.45: ## %cond.store64
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm1			; AVX1-NEXT: vpextrd $2, %xmm0, (%rdi)
	; AVX1-NEXT: vpextrd $2, %xmm1, (%rdi)
	; AVX1-NEXT: addq $4, %rdi			; AVX1-NEXT: addq $4, %rdi
	; AVX1-NEXT: LBB6_46: ## %else65			; AVX1-NEXT: LBB6_46: ## %else65
	; AVX1-NEXT: vpackssdw %xmm0, %xmm0, %xmm0			; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpacksswb %xmm0, %xmm0, %xmm0			; AVX1-NEXT: vpacksswb %xmm0, %xmm1, %xmm1
	; AVX1-NEXT: vpextrb $7, %xmm0, %eax			; AVX1-NEXT: vpextrb $7, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB6_48			; AVX1-NEXT: je LBB6_48
	; AVX1-NEXT: ## %bb.47: ## %cond.store67			; AVX1-NEXT: ## %bb.47: ## %cond.store67
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm0
	; AVX1-NEXT: vpextrd $3, %xmm0, (%rdi)			; AVX1-NEXT: vpextrd $3, %xmm0, (%rdi)
	; AVX1-NEXT: addq $4, %rdi			; AVX1-NEXT: addq $4, %rdi
	; AVX1-NEXT: LBB6_48: ## %else68			; AVX1-NEXT: LBB6_48: ## %else68
	; AVX1-NEXT: vpxor %xmm0, %xmm0, %xmm0			; AVX1-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; AVX1-NEXT: vpcmpeqd %xmm0, %xmm7, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm0, %xmm7, %xmm1
	; AVX1-NEXT: vpackssdw %xmm0, %xmm1, %xmm1			; AVX1-NEXT: vpackssdw %xmm0, %xmm1, %xmm1
	; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpextrb $8, %xmm1, %eax			; AVX1-NEXT: vpextrb $8, %xmm1, %eax
	Show All 29 Lines
	; AVX1-NEXT: vpacksswb %xmm0, %xmm0, %xmm0			; AVX1-NEXT: vpacksswb %xmm0, %xmm0, %xmm0
	; AVX1-NEXT: vpextrb $11, %xmm0, %eax			; AVX1-NEXT: vpextrb $11, %xmm0, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB6_56			; AVX1-NEXT: je LBB6_56
	; AVX1-NEXT: ## %bb.55: ## %cond.store79			; AVX1-NEXT: ## %bb.55: ## %cond.store79
	; AVX1-NEXT: vextractps $3, %xmm3, (%rdi)			; AVX1-NEXT: vextractps $3, %xmm3, (%rdi)
	; AVX1-NEXT: addq $4, %rdi			; AVX1-NEXT: addq $4, %rdi
	; AVX1-NEXT: LBB6_56: ## %else80			; AVX1-NEXT: LBB6_56: ## %else80
	; AVX1-NEXT: vextractf128 $1, %ymm7, %xmm0			; AVX1-NEXT: vextractf128 $1, %ymm7, %xmm1
	; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm0, %xmm1, %xmm2
	; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpackssdw %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm2			; AVX1-NEXT: vpacksswb %xmm0, %xmm0, %xmm0
	; AVX1-NEXT: vpextrb $12, %xmm2, %eax			; AVX1-NEXT: vpextrb $12, %xmm0, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
				; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm0
	; AVX1-NEXT: je LBB6_58			; AVX1-NEXT: je LBB6_58
	; AVX1-NEXT: ## %bb.57: ## %cond.store82			; AVX1-NEXT: ## %bb.57: ## %cond.store82
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm2			; AVX1-NEXT: vmovd %xmm0, (%rdi)
	; AVX1-NEXT: vmovd %xmm2, (%rdi)
	; AVX1-NEXT: addq $4, %rdi			; AVX1-NEXT: addq $4, %rdi
	; AVX1-NEXT: LBB6_58: ## %else83			; AVX1-NEXT: LBB6_58: ## %else83
	; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpackssdw %xmm2, %xmm0, %xmm2
	; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm2
	; AVX1-NEXT: vpextrb $13, %xmm1, %eax			; AVX1-NEXT: vpextrb $13, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB6_60			; AVX1-NEXT: je LBB6_60
	; AVX1-NEXT: ## %bb.59: ## %cond.store85			; AVX1-NEXT: ## %bb.59: ## %cond.store85
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm1			; AVX1-NEXT: vpextrd $1, %xmm0, (%rdi)
	; AVX1-NEXT: vpextrd $1, %xmm1, (%rdi)
	; AVX1-NEXT: addq $4, %rdi			; AVX1-NEXT: addq $4, %rdi
	; AVX1-NEXT: LBB6_60: ## %else86			; AVX1-NEXT: LBB6_60: ## %else86
	; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpackssdw %xmm0, %xmm0, %xmm1			; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm2
	; AVX1-NEXT: vpextrb $14, %xmm1, %eax			; AVX1-NEXT: vpextrb $14, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB6_62			; AVX1-NEXT: je LBB6_62
	; AVX1-NEXT: ## %bb.61: ## %cond.store88			; AVX1-NEXT: ## %bb.61: ## %cond.store88
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm1			; AVX1-NEXT: vpextrd $2, %xmm0, (%rdi)
	; AVX1-NEXT: vpextrd $2, %xmm1, (%rdi)
	; AVX1-NEXT: addq $4, %rdi			; AVX1-NEXT: addq $4, %rdi
	; AVX1-NEXT: LBB6_62: ## %else89			; AVX1-NEXT: LBB6_62: ## %else89
	; AVX1-NEXT: vpackssdw %xmm0, %xmm0, %xmm0			; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpacksswb %xmm0, %xmm0, %xmm0			; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpextrb $15, %xmm0, %eax			; AVX1-NEXT: vpextrb $15, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB6_64			; AVX1-NEXT: je LBB6_64
	; AVX1-NEXT: ## %bb.63: ## %cond.store91			; AVX1-NEXT: ## %bb.63: ## %cond.store91
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm0
	; AVX1-NEXT: vpextrd $3, %xmm0, (%rdi)			; AVX1-NEXT: vpextrd $3, %xmm0, (%rdi)
	; AVX1-NEXT: LBB6_64: ## %else92			; AVX1-NEXT: LBB6_64: ## %else92
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: compressstore_v32f32_v32i32:			; AVX2-LABEL: compressstore_v32f32_v32i32:
	; AVX2: ## %bb.0:			; AVX2: ## %bb.0:
	; AVX2-NEXT: vpxor %xmm8, %xmm8, %xmm8			; AVX2-NEXT: vpxor %xmm8, %xmm8, %xmm8
	Show All 38 Lines
	; AVX2-NEXT: LBB6_8: ## %else8			; AVX2-NEXT: LBB6_8: ## %else8
	; AVX2-NEXT: vpxor %xmm8, %xmm8, %xmm8			; AVX2-NEXT: vpxor %xmm8, %xmm8, %xmm8
	; AVX2-NEXT: vpcmpeqd %ymm8, %ymm4, %ymm8			; AVX2-NEXT: vpcmpeqd %ymm8, %ymm4, %ymm8
	; AVX2-NEXT: vextracti128 $1, %ymm8, %xmm8			; AVX2-NEXT: vextracti128 $1, %ymm8, %xmm8
	; AVX2-NEXT: vpackssdw %xmm8, %xmm0, %xmm9			; AVX2-NEXT: vpackssdw %xmm8, %xmm0, %xmm9
	; AVX2-NEXT: vpacksswb %xmm0, %xmm9, %xmm9			; AVX2-NEXT: vpacksswb %xmm0, %xmm9, %xmm9
	; AVX2-NEXT: vpextrb $4, %xmm9, %eax			; AVX2-NEXT: vpextrb $4, %xmm9, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm9
	; AVX2-NEXT: je LBB6_10			; AVX2-NEXT: je LBB6_10
	; AVX2-NEXT: ## %bb.9: ## %cond.store10			; AVX2-NEXT: ## %bb.9: ## %cond.store10
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm9
	; AVX2-NEXT: vmovd %xmm9, (%rdi)			; AVX2-NEXT: vmovd %xmm9, (%rdi)
	; AVX2-NEXT: addq $4, %rdi			; AVX2-NEXT: addq $4, %rdi
	; AVX2-NEXT: LBB6_10: ## %else11			; AVX2-NEXT: LBB6_10: ## %else11
	; AVX2-NEXT: vpackssdw %xmm8, %xmm0, %xmm8			; AVX2-NEXT: vpackssdw %xmm8, %xmm0, %xmm0
	; AVX2-NEXT: vpacksswb %xmm0, %xmm8, %xmm8			; AVX2-NEXT: vpacksswb %xmm0, %xmm0, %xmm0
	; AVX2-NEXT: vpextrb $5, %xmm8, %eax			; AVX2-NEXT: vpextrb $5, %xmm0, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB6_12			; AVX2-NEXT: je LBB6_12
	; AVX2-NEXT: ## %bb.11: ## %cond.store13			; AVX2-NEXT: ## %bb.11: ## %cond.store13
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm8			; AVX2-NEXT: vpextrd $1, %xmm9, (%rdi)
	; AVX2-NEXT: vpextrd $1, %xmm8, (%rdi)
	; AVX2-NEXT: addq $4, %rdi			; AVX2-NEXT: addq $4, %rdi
	; AVX2-NEXT: LBB6_12: ## %else14			; AVX2-NEXT: LBB6_12: ## %else14
	; AVX2-NEXT: vpxor %xmm8, %xmm8, %xmm8			; AVX2-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpeqd %ymm8, %ymm4, %ymm4			; AVX2-NEXT: vpcmpeqd %ymm0, %ymm4, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm4, %xmm8			; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm4
	; AVX2-NEXT: vpackssdw %xmm8, %xmm0, %xmm4			; AVX2-NEXT: vpackssdw %xmm4, %xmm0, %xmm0
	; AVX2-NEXT: vpacksswb %xmm0, %xmm4, %xmm4			; AVX2-NEXT: vpacksswb %xmm0, %xmm0, %xmm0
	; AVX2-NEXT: vpextrb $6, %xmm4, %eax			; AVX2-NEXT: vpextrb $6, %xmm0, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB6_14			; AVX2-NEXT: je LBB6_14
	; AVX2-NEXT: ## %bb.13: ## %cond.store16			; AVX2-NEXT: ## %bb.13: ## %cond.store16
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm4			; AVX2-NEXT: vpextrd $2, %xmm9, (%rdi)
	; AVX2-NEXT: vpextrd $2, %xmm4, (%rdi)
	; AVX2-NEXT: addq $4, %rdi			; AVX2-NEXT: addq $4, %rdi
	; AVX2-NEXT: LBB6_14: ## %else17			; AVX2-NEXT: LBB6_14: ## %else17
	; AVX2-NEXT: vpackssdw %xmm8, %xmm0, %xmm4			; AVX2-NEXT: vpackssdw %xmm4, %xmm0, %xmm0
	; AVX2-NEXT: vpacksswb %xmm0, %xmm4, %xmm4			; AVX2-NEXT: vpacksswb %xmm0, %xmm0, %xmm0
	; AVX2-NEXT: vpextrb $7, %xmm4, %eax			; AVX2-NEXT: vpextrb $7, %xmm0, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB6_16			; AVX2-NEXT: je LBB6_16
	; AVX2-NEXT: ## %bb.15: ## %cond.store19			; AVX2-NEXT: ## %bb.15: ## %cond.store19
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0			; AVX2-NEXT: vpextrd $3, %xmm9, (%rdi)
	; AVX2-NEXT: vpextrd $3, %xmm0, (%rdi)
	; AVX2-NEXT: addq $4, %rdi			; AVX2-NEXT: addq $4, %rdi
	; AVX2-NEXT: LBB6_16: ## %else20			; AVX2-NEXT: LBB6_16: ## %else20
	; AVX2-NEXT: vpxor %xmm0, %xmm0, %xmm0			; AVX2-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpeqd %ymm0, %ymm5, %ymm0			; AVX2-NEXT: vpcmpeqd %ymm0, %ymm5, %ymm0
	; AVX2-NEXT: vpackssdw %xmm0, %xmm0, %xmm4			; AVX2-NEXT: vpackssdw %xmm0, %xmm0, %xmm4
	; AVX2-NEXT: vpacksswb %xmm4, %xmm0, %xmm4			; AVX2-NEXT: vpacksswb %xmm4, %xmm0, %xmm4
	; AVX2-NEXT: vpextrb $8, %xmm4, %eax			; AVX2-NEXT: vpextrb $8, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	Show All 28 Lines
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB6_24			; AVX2-NEXT: je LBB6_24
	; AVX2-NEXT: ## %bb.23: ## %cond.store31			; AVX2-NEXT: ## %bb.23: ## %cond.store31
	; AVX2-NEXT: vpextrd $3, %xmm1, (%rdi)			; AVX2-NEXT: vpextrd $3, %xmm1, (%rdi)
	; AVX2-NEXT: addq $4, %rdi			; AVX2-NEXT: addq $4, %rdi
	; AVX2-NEXT: LBB6_24: ## %else32			; AVX2-NEXT: LBB6_24: ## %else32
	; AVX2-NEXT: vpxor %xmm0, %xmm0, %xmm0			; AVX2-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpeqd %ymm0, %ymm5, %ymm0			; AVX2-NEXT: vpcmpeqd %ymm0, %ymm5, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0			; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm4
	; AVX2-NEXT: vpackssdw %xmm0, %xmm0, %xmm4			; AVX2-NEXT: vpackssdw %xmm4, %xmm0, %xmm0
	; AVX2-NEXT: vpacksswb %xmm4, %xmm0, %xmm4			; AVX2-NEXT: vpacksswb %xmm0, %xmm0, %xmm0
	; AVX2-NEXT: vpextrb $12, %xmm4, %eax			; AVX2-NEXT: vpextrb $12, %xmm0, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm0
	; AVX2-NEXT: je LBB6_26			; AVX2-NEXT: je LBB6_26
	; AVX2-NEXT: ## %bb.25: ## %cond.store34			; AVX2-NEXT: ## %bb.25: ## %cond.store34
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm4			; AVX2-NEXT: vmovd %xmm0, (%rdi)
	; AVX2-NEXT: vmovd %xmm4, (%rdi)
	; AVX2-NEXT: addq $4, %rdi			; AVX2-NEXT: addq $4, %rdi
	; AVX2-NEXT: LBB6_26: ## %else35			; AVX2-NEXT: LBB6_26: ## %else35
	; AVX2-NEXT: vpackssdw %xmm0, %xmm0, %xmm0			; AVX2-NEXT: vpackssdw %xmm4, %xmm0, %xmm1
	; AVX2-NEXT: vpacksswb %xmm0, %xmm0, %xmm0			; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpextrb $13, %xmm0, %eax			; AVX2-NEXT: vpextrb $13, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB6_28			; AVX2-NEXT: je LBB6_28
	; AVX2-NEXT: ## %bb.27: ## %cond.store37			; AVX2-NEXT: ## %bb.27: ## %cond.store37
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm0
	; AVX2-NEXT: vpextrd $1, %xmm0, (%rdi)			; AVX2-NEXT: vpextrd $1, %xmm0, (%rdi)
	; AVX2-NEXT: addq $4, %rdi			; AVX2-NEXT: addq $4, %rdi
	; AVX2-NEXT: LBB6_28: ## %else38			; AVX2-NEXT: LBB6_28: ## %else38
	; AVX2-NEXT: vpxor %xmm0, %xmm0, %xmm0			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %ymm0, %ymm5, %ymm0			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm5, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpackssdw %xmm0, %xmm0, %xmm4			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm4
	; AVX2-NEXT: vpacksswb %xmm4, %xmm0, %xmm4			; AVX2-NEXT: vpacksswb %xmm4, %xmm0, %xmm4
	; AVX2-NEXT: vpextrb $14, %xmm4, %eax			; AVX2-NEXT: vpextrb $14, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB6_30			; AVX2-NEXT: je LBB6_30
	; AVX2-NEXT: ## %bb.29: ## %cond.store40			; AVX2-NEXT: ## %bb.29: ## %cond.store40
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm4			; AVX2-NEXT: vpextrd $2, %xmm0, (%rdi)
	; AVX2-NEXT: vpextrd $2, %xmm4, (%rdi)
	; AVX2-NEXT: addq $4, %rdi			; AVX2-NEXT: addq $4, %rdi
	; AVX2-NEXT: LBB6_30: ## %else41			; AVX2-NEXT: LBB6_30: ## %else41
	; AVX2-NEXT: vpackssdw %xmm0, %xmm0, %xmm0			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpacksswb %xmm0, %xmm0, %xmm0			; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpextrb $15, %xmm0, %eax			; AVX2-NEXT: vpextrb $15, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB6_32			; AVX2-NEXT: je LBB6_32
	; AVX2-NEXT: ## %bb.31: ## %cond.store43			; AVX2-NEXT: ## %bb.31: ## %cond.store43
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm0
	; AVX2-NEXT: vpextrd $3, %xmm0, (%rdi)			; AVX2-NEXT: vpextrd $3, %xmm0, (%rdi)
	; AVX2-NEXT: addq $4, %rdi			; AVX2-NEXT: addq $4, %rdi
	; AVX2-NEXT: LBB6_32: ## %else44			; AVX2-NEXT: LBB6_32: ## %else44
	; AVX2-NEXT: vpxor %xmm0, %xmm0, %xmm0			; AVX2-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpeqd %ymm0, %ymm6, %ymm0			; AVX2-NEXT: vpcmpeqd %ymm0, %ymm6, %ymm0
	; AVX2-NEXT: vpackssdw %xmm0, %xmm0, %xmm1			; AVX2-NEXT: vpackssdw %xmm0, %xmm0, %xmm1
	; AVX2-NEXT: vpacksswb %xmm0, %xmm1, %xmm1			; AVX2-NEXT: vpacksswb %xmm0, %xmm1, %xmm1
	; AVX2-NEXT: vpextrb $0, %xmm1, %eax			; AVX2-NEXT: vpextrb $0, %xmm1, %eax
	Show All 29 Lines
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB6_40			; AVX2-NEXT: je LBB6_40
	; AVX2-NEXT: ## %bb.39: ## %cond.store55			; AVX2-NEXT: ## %bb.39: ## %cond.store55
	; AVX2-NEXT: vpextrd $3, %xmm2, (%rdi)			; AVX2-NEXT: vpextrd $3, %xmm2, (%rdi)
	; AVX2-NEXT: addq $4, %rdi			; AVX2-NEXT: addq $4, %rdi
	; AVX2-NEXT: LBB6_40: ## %else56			; AVX2-NEXT: LBB6_40: ## %else56
	; AVX2-NEXT: vpxor %xmm0, %xmm0, %xmm0			; AVX2-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpeqd %ymm0, %ymm6, %ymm0			; AVX2-NEXT: vpcmpeqd %ymm0, %ymm6, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0			; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpackssdw %xmm0, %xmm0, %xmm1			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpacksswb %xmm0, %xmm1, %xmm1			; AVX2-NEXT: vpacksswb %xmm0, %xmm0, %xmm0
	; AVX2-NEXT: vpextrb $4, %xmm1, %eax			; AVX2-NEXT: vpextrb $4, %xmm0, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm0
	; AVX2-NEXT: je LBB6_42			; AVX2-NEXT: je LBB6_42
	; AVX2-NEXT: ## %bb.41: ## %cond.store58			; AVX2-NEXT: ## %bb.41: ## %cond.store58
	; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm1			; AVX2-NEXT: vmovd %xmm0, (%rdi)
	; AVX2-NEXT: vmovd %xmm1, (%rdi)
	; AVX2-NEXT: addq $4, %rdi			; AVX2-NEXT: addq $4, %rdi
	; AVX2-NEXT: LBB6_42: ## %else59			; AVX2-NEXT: LBB6_42: ## %else59
	; AVX2-NEXT: vpackssdw %xmm0, %xmm0, %xmm0			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpacksswb %xmm0, %xmm0, %xmm0			; AVX2-NEXT: vpacksswb %xmm0, %xmm1, %xmm1
	; AVX2-NEXT: vpextrb $5, %xmm0, %eax			; AVX2-NEXT: vpextrb $5, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB6_44			; AVX2-NEXT: je LBB6_44
	; AVX2-NEXT: ## %bb.43: ## %cond.store61			; AVX2-NEXT: ## %bb.43: ## %cond.store61
	; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm0
	; AVX2-NEXT: vpextrd $1, %xmm0, (%rdi)			; AVX2-NEXT: vpextrd $1, %xmm0, (%rdi)
	; AVX2-NEXT: addq $4, %rdi			; AVX2-NEXT: addq $4, %rdi
	; AVX2-NEXT: LBB6_44: ## %else62			; AVX2-NEXT: LBB6_44: ## %else62
	; AVX2-NEXT: vpxor %xmm0, %xmm0, %xmm0			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %ymm0, %ymm6, %ymm0			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm6, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpackssdw %xmm0, %xmm0, %xmm1			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm2
	; AVX2-NEXT: vpacksswb %xmm0, %xmm1, %xmm1			; AVX2-NEXT: vpacksswb %xmm0, %xmm2, %xmm2
	; AVX2-NEXT: vpextrb $6, %xmm1, %eax			; AVX2-NEXT: vpextrb $6, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB6_46			; AVX2-NEXT: je LBB6_46
	; AVX2-NEXT: ## %bb.45: ## %cond.store64			; AVX2-NEXT: ## %bb.45: ## %cond.store64
	; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm1			; AVX2-NEXT: vpextrd $2, %xmm0, (%rdi)
	; AVX2-NEXT: vpextrd $2, %xmm1, (%rdi)
	; AVX2-NEXT: addq $4, %rdi			; AVX2-NEXT: addq $4, %rdi
	; AVX2-NEXT: LBB6_46: ## %else65			; AVX2-NEXT: LBB6_46: ## %else65
	; AVX2-NEXT: vpackssdw %xmm0, %xmm0, %xmm0			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpacksswb %xmm0, %xmm0, %xmm0			; AVX2-NEXT: vpacksswb %xmm0, %xmm1, %xmm1
	; AVX2-NEXT: vpextrb $7, %xmm0, %eax			; AVX2-NEXT: vpextrb $7, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB6_48			; AVX2-NEXT: je LBB6_48
	; AVX2-NEXT: ## %bb.47: ## %cond.store67			; AVX2-NEXT: ## %bb.47: ## %cond.store67
	; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm0
	; AVX2-NEXT: vpextrd $3, %xmm0, (%rdi)			; AVX2-NEXT: vpextrd $3, %xmm0, (%rdi)
	; AVX2-NEXT: addq $4, %rdi			; AVX2-NEXT: addq $4, %rdi
	; AVX2-NEXT: LBB6_48: ## %else68			; AVX2-NEXT: LBB6_48: ## %else68
	; AVX2-NEXT: vpxor %xmm0, %xmm0, %xmm0			; AVX2-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpeqd %ymm0, %ymm7, %ymm0			; AVX2-NEXT: vpcmpeqd %ymm0, %ymm7, %ymm0
	; AVX2-NEXT: vpackssdw %xmm0, %xmm0, %xmm1			; AVX2-NEXT: vpackssdw %xmm0, %xmm0, %xmm1
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpextrb $8, %xmm1, %eax			; AVX2-NEXT: vpextrb $8, %xmm1, %eax
	Show All 29 Lines
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB6_56			; AVX2-NEXT: je LBB6_56
	; AVX2-NEXT: ## %bb.55: ## %cond.store79			; AVX2-NEXT: ## %bb.55: ## %cond.store79
	; AVX2-NEXT: vpextrd $3, %xmm3, (%rdi)			; AVX2-NEXT: vpextrd $3, %xmm3, (%rdi)
	; AVX2-NEXT: addq $4, %rdi			; AVX2-NEXT: addq $4, %rdi
	; AVX2-NEXT: LBB6_56: ## %else80			; AVX2-NEXT: LBB6_56: ## %else80
	; AVX2-NEXT: vpxor %xmm0, %xmm0, %xmm0			; AVX2-NEXT: vpxor %xmm0, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpeqd %ymm0, %ymm7, %ymm0			; AVX2-NEXT: vpcmpeqd %ymm0, %ymm7, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0			; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpackssdw %xmm0, %xmm0, %xmm1			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpacksswb %xmm0, %xmm0, %xmm0
	; AVX2-NEXT: vpextrb $12, %xmm1, %eax			; AVX2-NEXT: vpextrb $12, %xmm0, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: vextracti128 $1, %ymm3, %xmm0
	; AVX2-NEXT: je LBB6_58			; AVX2-NEXT: je LBB6_58
	; AVX2-NEXT: ## %bb.57: ## %cond.store82			; AVX2-NEXT: ## %bb.57: ## %cond.store82
	; AVX2-NEXT: vextracti128 $1, %ymm3, %xmm1			; AVX2-NEXT: vmovd %xmm0, (%rdi)
	; AVX2-NEXT: vmovd %xmm1, (%rdi)
	; AVX2-NEXT: addq $4, %rdi			; AVX2-NEXT: addq $4, %rdi
	; AVX2-NEXT: LBB6_58: ## %else83			; AVX2-NEXT: LBB6_58: ## %else83
	; AVX2-NEXT: vpackssdw %xmm0, %xmm0, %xmm0			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpacksswb %xmm0, %xmm0, %xmm0			; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpextrb $13, %xmm0, %eax			; AVX2-NEXT: vpextrb $13, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB6_60			; AVX2-NEXT: je LBB6_60
	; AVX2-NEXT: ## %bb.59: ## %cond.store85			; AVX2-NEXT: ## %bb.59: ## %cond.store85
	; AVX2-NEXT: vextracti128 $1, %ymm3, %xmm0
	; AVX2-NEXT: vpextrd $1, %xmm0, (%rdi)			; AVX2-NEXT: vpextrd $1, %xmm0, (%rdi)
	; AVX2-NEXT: addq $4, %rdi			; AVX2-NEXT: addq $4, %rdi
	; AVX2-NEXT: LBB6_60: ## %else86			; AVX2-NEXT: LBB6_60: ## %else86
	; AVX2-NEXT: vpxor %xmm0, %xmm0, %xmm0			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %ymm0, %ymm7, %ymm0			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm7, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpackssdw %xmm0, %xmm0, %xmm1			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm2
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpacksswb %xmm2, %xmm0, %xmm2
	; AVX2-NEXT: vpextrb $14, %xmm1, %eax			; AVX2-NEXT: vpextrb $14, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB6_62			; AVX2-NEXT: je LBB6_62
	; AVX2-NEXT: ## %bb.61: ## %cond.store88			; AVX2-NEXT: ## %bb.61: ## %cond.store88
	; AVX2-NEXT: vextracti128 $1, %ymm3, %xmm1			; AVX2-NEXT: vpextrd $2, %xmm0, (%rdi)
	; AVX2-NEXT: vpextrd $2, %xmm1, (%rdi)
	; AVX2-NEXT: addq $4, %rdi			; AVX2-NEXT: addq $4, %rdi
	; AVX2-NEXT: LBB6_62: ## %else89			; AVX2-NEXT: LBB6_62: ## %else89
	; AVX2-NEXT: vpackssdw %xmm0, %xmm0, %xmm0			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpacksswb %xmm0, %xmm0, %xmm0			; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpextrb $15, %xmm0, %eax			; AVX2-NEXT: vpextrb $15, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB6_64			; AVX2-NEXT: je LBB6_64
	; AVX2-NEXT: ## %bb.63: ## %cond.store91			; AVX2-NEXT: ## %bb.63: ## %cond.store91
	; AVX2-NEXT: vextracti128 $1, %ymm3, %xmm0
	; AVX2-NEXT: vpextrd $3, %xmm0, (%rdi)			; AVX2-NEXT: vpextrd $3, %xmm0, (%rdi)
	; AVX2-NEXT: LBB6_64: ## %else92			; AVX2-NEXT: LBB6_64: ## %else92
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: compressstore_v32f32_v32i32:			; AVX512-LABEL: compressstore_v32f32_v32i32:
	; AVX512: ## %bb.0:			; AVX512: ## %bb.0:
	; AVX512-NEXT: vptestnmd %zmm3, %zmm3, %k1			; AVX512-NEXT: vptestnmd %zmm3, %zmm3, %k1
	▲ Show 20 Lines • Show All 186 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB8_4			; AVX1-NEXT: je LBB8_4
	; AVX1-NEXT: ## %bb.3: ## %cond.store1			; AVX1-NEXT: ## %bb.3: ## %cond.store1
	; AVX1-NEXT: vpextrq $1, %xmm0, (%rdi)			; AVX1-NEXT: vpextrq $1, %xmm0, (%rdi)
	; AVX1-NEXT: addq $8, %rdi			; AVX1-NEXT: addq $8, %rdi
	; AVX1-NEXT: LBB8_4: ## %else2			; AVX1-NEXT: LBB8_4: ## %else2
	; AVX1-NEXT: vpextrb $8, %xmm1, %eax			; AVX1-NEXT: vpextrb $8, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
				; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: je LBB8_6			; AVX1-NEXT: je LBB8_6
	; AVX1-NEXT: ## %bb.5: ## %cond.store4			; AVX1-NEXT: ## %bb.5: ## %cond.store4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vmovq %xmm0, (%rdi)
	; AVX1-NEXT: vmovlps %xmm2, (%rdi)
	; AVX1-NEXT: addq $8, %rdi			; AVX1-NEXT: addq $8, %rdi
	; AVX1-NEXT: LBB8_6: ## %else5			; AVX1-NEXT: LBB8_6: ## %else5
	; AVX1-NEXT: vpextrb $12, %xmm1, %eax			; AVX1-NEXT: vpextrb $12, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB8_8			; AVX1-NEXT: je LBB8_8
	; AVX1-NEXT: ## %bb.7: ## %cond.store7			; AVX1-NEXT: ## %bb.7: ## %cond.store7
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: vpextrq $1, %xmm0, (%rdi)			; AVX1-NEXT: vpextrq $1, %xmm0, (%rdi)
	; AVX1-NEXT: LBB8_8: ## %else8			; AVX1-NEXT: LBB8_8: ## %else8
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: compressstore_v4i64_v4i1:			; AVX2-LABEL: compressstore_v4i64_v4i1:
	; AVX2: ## %bb.0:			; AVX2: ## %bb.0:
	; AVX2-NEXT: vpextrb $0, %xmm1, %eax			; AVX2-NEXT: vpextrb $0, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB8_2			; AVX2-NEXT: je LBB8_2
	; AVX2-NEXT: ## %bb.1: ## %cond.store			; AVX2-NEXT: ## %bb.1: ## %cond.store
	; AVX2-NEXT: vmovq %xmm0, (%rdi)			; AVX2-NEXT: vmovq %xmm0, (%rdi)
	; AVX2-NEXT: addq $8, %rdi			; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB8_2: ## %else			; AVX2-NEXT: LBB8_2: ## %else
	; AVX2-NEXT: vpextrb $4, %xmm1, %eax			; AVX2-NEXT: vpextrb $4, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB8_4			; AVX2-NEXT: je LBB8_4
	; AVX2-NEXT: ## %bb.3: ## %cond.store1			; AVX2-NEXT: ## %bb.3: ## %cond.store1
	; AVX2-NEXT: vpextrq $1, %xmm0, (%rdi)			; AVX2-NEXT: vpextrq $1, %xmm0, (%rdi)
	; AVX2-NEXT: addq $8, %rdi			; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB8_4: ## %else2			; AVX2-NEXT: LBB8_4: ## %else2
	; AVX2-NEXT: vpextrb $8, %xmm1, %eax			; AVX2-NEXT: vpextrb $8, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: je LBB8_6			; AVX2-NEXT: je LBB8_6
	; AVX2-NEXT: ## %bb.5: ## %cond.store4			; AVX2-NEXT: ## %bb.5: ## %cond.store4
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm2			; AVX2-NEXT: vmovq %xmm0, (%rdi)
	; AVX2-NEXT: vmovq %xmm2, (%rdi)
	; AVX2-NEXT: addq $8, %rdi			; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB8_6: ## %else5			; AVX2-NEXT: LBB8_6: ## %else5
	; AVX2-NEXT: vpextrb $12, %xmm1, %eax			; AVX2-NEXT: vpextrb $12, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB8_8			; AVX2-NEXT: je LBB8_8
	; AVX2-NEXT: ## %bb.7: ## %cond.store7			; AVX2-NEXT: ## %bb.7: ## %cond.store7
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: vpextrq $1, %xmm0, (%rdi)			; AVX2-NEXT: vpextrq $1, %xmm0, (%rdi)
	; AVX2-NEXT: LBB8_8: ## %else8			; AVX2-NEXT: LBB8_8: ## %else8
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: compressstore_v4i64_v4i1:			; AVX512F-LABEL: compressstore_v4i64_v4i1:
	; AVX512F: ## %bb.0:			; AVX512F: ## %bb.0:
	; AVX512F-NEXT: ## kill: def $ymm0 killed $ymm0 def $zmm0			; AVX512F-NEXT: ## kill: def $ymm0 killed $ymm0 def $zmm0
	▲ Show 20 Lines • Show All 160 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB9_4			; AVX1-NEXT: je LBB9_4
	; AVX1-NEXT: ## %bb.3: ## %cond.store1			; AVX1-NEXT: ## %bb.3: ## %cond.store1
	; AVX1-NEXT: vpextrq $1, %xmm0, (%rdi)			; AVX1-NEXT: vpextrq $1, %xmm0, (%rdi)
	; AVX1-NEXT: addq $8, %rdi			; AVX1-NEXT: addq $8, %rdi
	; AVX1-NEXT: LBB9_4: ## %else2			; AVX1-NEXT: LBB9_4: ## %else2
	; AVX1-NEXT: vpextrb $4, %xmm2, %eax			; AVX1-NEXT: vpextrb $4, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
				; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: je LBB9_6			; AVX1-NEXT: je LBB9_6
	; AVX1-NEXT: ## %bb.5: ## %cond.store4			; AVX1-NEXT: ## %bb.5: ## %cond.store4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vmovq %xmm0, (%rdi)
	; AVX1-NEXT: vmovlps %xmm3, (%rdi)
	; AVX1-NEXT: addq $8, %rdi			; AVX1-NEXT: addq $8, %rdi
	; AVX1-NEXT: LBB9_6: ## %else5			; AVX1-NEXT: LBB9_6: ## %else5
	; AVX1-NEXT: vpextrb $6, %xmm2, %eax			; AVX1-NEXT: vpextrb $6, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB9_8			; AVX1-NEXT: je LBB9_8
	; AVX1-NEXT: ## %bb.7: ## %cond.store7			; AVX1-NEXT: ## %bb.7: ## %cond.store7
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: vpextrq $1, %xmm0, (%rdi)			; AVX1-NEXT: vpextrq $1, %xmm0, (%rdi)
	; AVX1-NEXT: addq $8, %rdi			; AVX1-NEXT: addq $8, %rdi
	; AVX1-NEXT: LBB9_8: ## %else8			; AVX1-NEXT: LBB9_8: ## %else8
	; AVX1-NEXT: vpextrb $8, %xmm2, %eax			; AVX1-NEXT: vpextrb $8, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB9_10			; AVX1-NEXT: je LBB9_10
	; AVX1-NEXT: ## %bb.9: ## %cond.store10			; AVX1-NEXT: ## %bb.9: ## %cond.store10
	; AVX1-NEXT: vmovq %xmm1, (%rdi)			; AVX1-NEXT: vmovq %xmm1, (%rdi)
	; AVX1-NEXT: addq $8, %rdi			; AVX1-NEXT: addq $8, %rdi
	; AVX1-NEXT: LBB9_10: ## %else11			; AVX1-NEXT: LBB9_10: ## %else11
	; AVX1-NEXT: vpextrb $10, %xmm2, %eax			; AVX1-NEXT: vpextrb $10, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB9_12			; AVX1-NEXT: je LBB9_12
	; AVX1-NEXT: ## %bb.11: ## %cond.store13			; AVX1-NEXT: ## %bb.11: ## %cond.store13
	; AVX1-NEXT: vpextrq $1, %xmm1, (%rdi)			; AVX1-NEXT: vpextrq $1, %xmm1, (%rdi)
	; AVX1-NEXT: addq $8, %rdi			; AVX1-NEXT: addq $8, %rdi
	; AVX1-NEXT: LBB9_12: ## %else14			; AVX1-NEXT: LBB9_12: ## %else14
	; AVX1-NEXT: vpextrb $12, %xmm2, %eax			; AVX1-NEXT: vpextrb $12, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
				; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0
	; AVX1-NEXT: je LBB9_14			; AVX1-NEXT: je LBB9_14
	; AVX1-NEXT: ## %bb.13: ## %cond.store16			; AVX1-NEXT: ## %bb.13: ## %cond.store16
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0
	; AVX1-NEXT: vmovq %xmm0, (%rdi)			; AVX1-NEXT: vmovq %xmm0, (%rdi)
	; AVX1-NEXT: addq $8, %rdi			; AVX1-NEXT: addq $8, %rdi
	; AVX1-NEXT: LBB9_14: ## %else17			; AVX1-NEXT: LBB9_14: ## %else17
	; AVX1-NEXT: vpextrb $14, %xmm2, %eax			; AVX1-NEXT: vpextrb $14, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB9_16			; AVX1-NEXT: je LBB9_16
	; AVX1-NEXT: ## %bb.15: ## %cond.store19			; AVX1-NEXT: ## %bb.15: ## %cond.store19
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0
	; AVX1-NEXT: vpextrq $1, %xmm0, (%rdi)			; AVX1-NEXT: vpextrq $1, %xmm0, (%rdi)
	; AVX1-NEXT: LBB9_16: ## %else20			; AVX1-NEXT: LBB9_16: ## %else20
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: compressstore_v8i64_v8i1:			; AVX2-LABEL: compressstore_v8i64_v8i1:
	; AVX2: ## %bb.0:			; AVX2: ## %bb.0:
	; AVX2-NEXT: vpextrb $0, %xmm2, %eax			; AVX2-NEXT: vpextrb $0, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB9_2			; AVX2-NEXT: je LBB9_2
	; AVX2-NEXT: ## %bb.1: ## %cond.store			; AVX2-NEXT: ## %bb.1: ## %cond.store
	; AVX2-NEXT: vmovq %xmm0, (%rdi)			; AVX2-NEXT: vmovq %xmm0, (%rdi)
	; AVX2-NEXT: addq $8, %rdi			; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB9_2: ## %else			; AVX2-NEXT: LBB9_2: ## %else
	; AVX2-NEXT: vpextrb $2, %xmm2, %eax			; AVX2-NEXT: vpextrb $2, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB9_4			; AVX2-NEXT: je LBB9_4
	; AVX2-NEXT: ## %bb.3: ## %cond.store1			; AVX2-NEXT: ## %bb.3: ## %cond.store1
	; AVX2-NEXT: vpextrq $1, %xmm0, (%rdi)			; AVX2-NEXT: vpextrq $1, %xmm0, (%rdi)
	; AVX2-NEXT: addq $8, %rdi			; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB9_4: ## %else2			; AVX2-NEXT: LBB9_4: ## %else2
	; AVX2-NEXT: vpextrb $4, %xmm2, %eax			; AVX2-NEXT: vpextrb $4, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: je LBB9_6			; AVX2-NEXT: je LBB9_6
	; AVX2-NEXT: ## %bb.5: ## %cond.store4			; AVX2-NEXT: ## %bb.5: ## %cond.store4
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vmovq %xmm0, (%rdi)
	; AVX2-NEXT: vmovq %xmm3, (%rdi)
	; AVX2-NEXT: addq $8, %rdi			; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB9_6: ## %else5			; AVX2-NEXT: LBB9_6: ## %else5
	; AVX2-NEXT: vpextrb $6, %xmm2, %eax			; AVX2-NEXT: vpextrb $6, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB9_8			; AVX2-NEXT: je LBB9_8
	; AVX2-NEXT: ## %bb.7: ## %cond.store7			; AVX2-NEXT: ## %bb.7: ## %cond.store7
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: vpextrq $1, %xmm0, (%rdi)			; AVX2-NEXT: vpextrq $1, %xmm0, (%rdi)
	; AVX2-NEXT: addq $8, %rdi			; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB9_8: ## %else8			; AVX2-NEXT: LBB9_8: ## %else8
	; AVX2-NEXT: vpextrb $8, %xmm2, %eax			; AVX2-NEXT: vpextrb $8, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB9_10			; AVX2-NEXT: je LBB9_10
	; AVX2-NEXT: ## %bb.9: ## %cond.store10			; AVX2-NEXT: ## %bb.9: ## %cond.store10
	; AVX2-NEXT: vmovq %xmm1, (%rdi)			; AVX2-NEXT: vmovq %xmm1, (%rdi)
	; AVX2-NEXT: addq $8, %rdi			; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB9_10: ## %else11			; AVX2-NEXT: LBB9_10: ## %else11
	; AVX2-NEXT: vpextrb $10, %xmm2, %eax			; AVX2-NEXT: vpextrb $10, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB9_12			; AVX2-NEXT: je LBB9_12
	; AVX2-NEXT: ## %bb.11: ## %cond.store13			; AVX2-NEXT: ## %bb.11: ## %cond.store13
	; AVX2-NEXT: vpextrq $1, %xmm1, (%rdi)			; AVX2-NEXT: vpextrq $1, %xmm1, (%rdi)
	; AVX2-NEXT: addq $8, %rdi			; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB9_12: ## %else14			; AVX2-NEXT: LBB9_12: ## %else14
	; AVX2-NEXT: vpextrb $12, %xmm2, %eax			; AVX2-NEXT: vpextrb $12, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm0
	; AVX2-NEXT: je LBB9_14			; AVX2-NEXT: je LBB9_14
	; AVX2-NEXT: ## %bb.13: ## %cond.store16			; AVX2-NEXT: ## %bb.13: ## %cond.store16
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm0
	; AVX2-NEXT: vmovq %xmm0, (%rdi)			; AVX2-NEXT: vmovq %xmm0, (%rdi)
	; AVX2-NEXT: addq $8, %rdi			; AVX2-NEXT: addq $8, %rdi
	; AVX2-NEXT: LBB9_14: ## %else17			; AVX2-NEXT: LBB9_14: ## %else17
	; AVX2-NEXT: vpextrb $14, %xmm2, %eax			; AVX2-NEXT: vpextrb $14, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB9_16			; AVX2-NEXT: je LBB9_16
	; AVX2-NEXT: ## %bb.15: ## %cond.store19			; AVX2-NEXT: ## %bb.15: ## %cond.store19
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm0
	; AVX2-NEXT: vpextrq $1, %xmm0, (%rdi)			; AVX2-NEXT: vpextrq $1, %xmm0, (%rdi)
	; AVX2-NEXT: LBB9_16: ## %else20			; AVX2-NEXT: LBB9_16: ## %else20
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: compressstore_v8i64_v8i1:			; AVX512F-LABEL: compressstore_v8i64_v8i1:
	; AVX512F: ## %bb.0:			; AVX512F: ## %bb.0:
	; AVX512F-NEXT: vpmovzxwq {{.*#+}} zmm1 = xmm1[0],zero,zero,zero,xmm1[1],zero,zero,zero,xmm1[2],zero,zero,zero,xmm1[3],zero,zero,zero,xmm1[4],zero,zero,zero,xmm1[5],zero,zero,zero,xmm1[6],zero,zero,zero,xmm1[7],zero,zero,zero			; AVX512F-NEXT: vpmovzxwq {{.*#+}} zmm1 = xmm1[0],zero,zero,zero,xmm1[1],zero,zero,zero,xmm1[2],zero,zero,zero,xmm1[3],zero,zero,zero,xmm1[4],zero,zero,zero,xmm1[5],zero,zero,zero,xmm1[6],zero,zero,zero,xmm1[7],zero,zero,zero
	▲ Show 20 Lines • Show All 612 Lines • ▼ Show 20 Lines
	; vXi8			; vXi8
	;			;

	define void @compressstore_v16i8_v16i8(i8* %base, <16 x i8> %V, <16 x i8> %trigger) {			define void @compressstore_v16i8_v16i8(i8* %base, <16 x i8> %V, <16 x i8> %trigger) {
	; SSE2-LABEL: compressstore_v16i8_v16i8:			; SSE2-LABEL: compressstore_v16i8_v16i8:
	; SSE2: ## %bb.0:			; SSE2: ## %bb.0:
	; SSE2-NEXT: pxor %xmm2, %xmm2			; SSE2-NEXT: pxor %xmm2, %xmm2
	; SSE2-NEXT: pcmpeqb %xmm1, %xmm2			; SSE2-NEXT: pcmpeqb %xmm1, %xmm2
	; SSE2-NEXT: movd %xmm2, %eax			; SSE2-NEXT: movd %xmm2, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: je LBB12_2			; SSE2-NEXT: je LBB12_2
	; SSE2-NEXT: ## %bb.1: ## %cond.store			; SSE2-NEXT: ## %bb.1: ## %cond.store
	; SSE2-NEXT: movd %xmm0, %ecx			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: movb %cl, (%rdi)
	; SSE2-NEXT: incq %rdi			; SSE2-NEXT: incq %rdi
	; SSE2-NEXT: LBB12_2: ## %else			; SSE2-NEXT: LBB12_2: ## %else
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je LBB12_4			; SSE2-NEXT: je LBB12_4
	; SSE2-NEXT: ## %bb.3: ## %cond.store1			; SSE2-NEXT: ## %bb.3: ## %cond.store1
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: movb %ah, (%rdi)			; SSE2-NEXT: movb %ah, (%rdi)
	; SSE2-NEXT: incq %rdi			; SSE2-NEXT: incq %rdi
	; SSE2-NEXT: LBB12_4: ## %else2			; SSE2-NEXT: LBB12_4: ## %else2
	; SSE2-NEXT: pxor %xmm2, %xmm2			; SSE2-NEXT: pxor %xmm2, %xmm2
	; SSE2-NEXT: pcmpeqb %xmm1, %xmm2			; SSE2-NEXT: pcmpeqb %xmm1, %xmm2
	; SSE2-NEXT: movd %xmm2, %eax			; SSE2-NEXT: movd %xmm2, %ecx
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %ecx, %edx
	; SSE2-NEXT: shrl $16, %ecx			; SSE2-NEXT: shrl $16, %edx
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %dl
	; SSE2-NEXT: je LBB12_6			; SSE2-NEXT: je LBB12_6
	; SSE2-NEXT: ## %bb.5: ## %cond.store4			; SSE2-NEXT: ## %bb.5: ## %cond.store4
	; SSE2-NEXT: movd %xmm0, %ecx			; SSE2-NEXT: movl %eax, %edx
	; SSE2-NEXT: shrl $16, %ecx			; SSE2-NEXT: shrl $16, %edx
	; SSE2-NEXT: movb %cl, (%rdi)			; SSE2-NEXT: movb %dl, (%rdi)
	; SSE2-NEXT: incq %rdi			; SSE2-NEXT: incq %rdi
	; SSE2-NEXT: LBB12_6: ## %else5			; SSE2-NEXT: LBB12_6: ## %else5
	; SSE2-NEXT: shrl $24, %eax			; SSE2-NEXT: shrl $24, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je LBB12_8			; SSE2-NEXT: je LBB12_8
	; SSE2-NEXT: ## %bb.7: ## %cond.store7			; SSE2-NEXT: ## %bb.7: ## %cond.store7
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: shrl $24, %eax			; SSE2-NEXT: shrl $24, %eax
	; SSE2-NEXT: movb %al, (%rdi)			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: incq %rdi			; SSE2-NEXT: incq %rdi
	; SSE2-NEXT: LBB12_8: ## %else8			; SSE2-NEXT: LBB12_8: ## %else8
	; SSE2-NEXT: pxor %xmm2, %xmm2			; SSE2-NEXT: pxor %xmm2, %xmm2
	; SSE2-NEXT: pcmpeqb %xmm1, %xmm2			; SSE2-NEXT: pcmpeqb %xmm1, %xmm2
	; SSE2-NEXT: pextrw $2, %xmm2, %eax			; SSE2-NEXT: pextrw $2, %xmm2, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $2, %xmm0, %eax
	; SSE2-NEXT: je LBB12_10			; SSE2-NEXT: je LBB12_10
	; SSE2-NEXT: ## %bb.9: ## %cond.store10			; SSE2-NEXT: ## %bb.9: ## %cond.store10
	; SSE2-NEXT: pextrw $2, %xmm0, %ecx			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: movb %cl, (%rdi)
	; SSE2-NEXT: incq %rdi			; SSE2-NEXT: incq %rdi
	; SSE2-NEXT: LBB12_10: ## %else11			; SSE2-NEXT: LBB12_10: ## %else11
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je LBB12_12			; SSE2-NEXT: je LBB12_12
	; SSE2-NEXT: ## %bb.11: ## %cond.store13			; SSE2-NEXT: ## %bb.11: ## %cond.store13
	; SSE2-NEXT: pextrw $2, %xmm0, %eax
	; SSE2-NEXT: movb %ah, (%rdi)			; SSE2-NEXT: movb %ah, (%rdi)
	; SSE2-NEXT: incq %rdi			; SSE2-NEXT: incq %rdi
	; SSE2-NEXT: LBB12_12: ## %else14			; SSE2-NEXT: LBB12_12: ## %else14
	; SSE2-NEXT: pxor %xmm2, %xmm2			; SSE2-NEXT: pxor %xmm2, %xmm2
	; SSE2-NEXT: pcmpeqb %xmm1, %xmm2			; SSE2-NEXT: pcmpeqb %xmm1, %xmm2
	; SSE2-NEXT: pextrw $3, %xmm2, %eax			; SSE2-NEXT: pextrw $3, %xmm2, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $3, %xmm0, %eax
	; SSE2-NEXT: je LBB12_14			; SSE2-NEXT: je LBB12_14
	; SSE2-NEXT: ## %bb.13: ## %cond.store16			; SSE2-NEXT: ## %bb.13: ## %cond.store16
	; SSE2-NEXT: pextrw $3, %xmm0, %ecx			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: movb %cl, (%rdi)
	; SSE2-NEXT: incq %rdi			; SSE2-NEXT: incq %rdi
	; SSE2-NEXT: LBB12_14: ## %else17			; SSE2-NEXT: LBB12_14: ## %else17
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je LBB12_16			; SSE2-NEXT: je LBB12_16
	; SSE2-NEXT: ## %bb.15: ## %cond.store19			; SSE2-NEXT: ## %bb.15: ## %cond.store19
	; SSE2-NEXT: pextrw $3, %xmm0, %eax
	; SSE2-NEXT: movb %ah, (%rdi)			; SSE2-NEXT: movb %ah, (%rdi)
	; SSE2-NEXT: incq %rdi			; SSE2-NEXT: incq %rdi
	; SSE2-NEXT: LBB12_16: ## %else20			; SSE2-NEXT: LBB12_16: ## %else20
	; SSE2-NEXT: pxor %xmm2, %xmm2			; SSE2-NEXT: pxor %xmm2, %xmm2
	; SSE2-NEXT: pcmpeqb %xmm1, %xmm2			; SSE2-NEXT: pcmpeqb %xmm1, %xmm2
	; SSE2-NEXT: pextrw $4, %xmm2, %eax			; SSE2-NEXT: pextrw $4, %xmm2, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $4, %xmm0, %eax
	; SSE2-NEXT: je LBB12_18			; SSE2-NEXT: je LBB12_18
	; SSE2-NEXT: ## %bb.17: ## %cond.store22			; SSE2-NEXT: ## %bb.17: ## %cond.store22
	; SSE2-NEXT: pextrw $4, %xmm0, %ecx			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: movb %cl, (%rdi)
	; SSE2-NEXT: incq %rdi			; SSE2-NEXT: incq %rdi
	; SSE2-NEXT: LBB12_18: ## %else23			; SSE2-NEXT: LBB12_18: ## %else23
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je LBB12_20			; SSE2-NEXT: je LBB12_20
	; SSE2-NEXT: ## %bb.19: ## %cond.store25			; SSE2-NEXT: ## %bb.19: ## %cond.store25
	; SSE2-NEXT: pextrw $4, %xmm0, %eax
	; SSE2-NEXT: movb %ah, (%rdi)			; SSE2-NEXT: movb %ah, (%rdi)
	; SSE2-NEXT: incq %rdi			; SSE2-NEXT: incq %rdi
	; SSE2-NEXT: LBB12_20: ## %else26			; SSE2-NEXT: LBB12_20: ## %else26
	; SSE2-NEXT: pxor %xmm2, %xmm2			; SSE2-NEXT: pxor %xmm2, %xmm2
	; SSE2-NEXT: pcmpeqb %xmm1, %xmm2			; SSE2-NEXT: pcmpeqb %xmm1, %xmm2
	; SSE2-NEXT: pextrw $5, %xmm2, %eax			; SSE2-NEXT: pextrw $5, %xmm2, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $5, %xmm0, %eax
	; SSE2-NEXT: je LBB12_22			; SSE2-NEXT: je LBB12_22
	; SSE2-NEXT: ## %bb.21: ## %cond.store28			; SSE2-NEXT: ## %bb.21: ## %cond.store28
	; SSE2-NEXT: pextrw $5, %xmm0, %ecx			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: movb %cl, (%rdi)
	; SSE2-NEXT: incq %rdi			; SSE2-NEXT: incq %rdi
	; SSE2-NEXT: LBB12_22: ## %else29			; SSE2-NEXT: LBB12_22: ## %else29
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je LBB12_24			; SSE2-NEXT: je LBB12_24
	; SSE2-NEXT: ## %bb.23: ## %cond.store31			; SSE2-NEXT: ## %bb.23: ## %cond.store31
	; SSE2-NEXT: pextrw $5, %xmm0, %eax
	; SSE2-NEXT: movb %ah, (%rdi)			; SSE2-NEXT: movb %ah, (%rdi)
	; SSE2-NEXT: incq %rdi			; SSE2-NEXT: incq %rdi
	; SSE2-NEXT: LBB12_24: ## %else32			; SSE2-NEXT: LBB12_24: ## %else32
	; SSE2-NEXT: pxor %xmm2, %xmm2			; SSE2-NEXT: pxor %xmm2, %xmm2
	; SSE2-NEXT: pcmpeqb %xmm1, %xmm2			; SSE2-NEXT: pcmpeqb %xmm1, %xmm2
	; SSE2-NEXT: pextrw $6, %xmm2, %eax			; SSE2-NEXT: pextrw $6, %xmm2, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $6, %xmm0, %eax
	; SSE2-NEXT: je LBB12_26			; SSE2-NEXT: je LBB12_26
	; SSE2-NEXT: ## %bb.25: ## %cond.store34			; SSE2-NEXT: ## %bb.25: ## %cond.store34
	; SSE2-NEXT: pextrw $6, %xmm0, %ecx			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: movb %cl, (%rdi)
	; SSE2-NEXT: incq %rdi			; SSE2-NEXT: incq %rdi
	; SSE2-NEXT: LBB12_26: ## %else35			; SSE2-NEXT: LBB12_26: ## %else35
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je LBB12_28			; SSE2-NEXT: je LBB12_28
	; SSE2-NEXT: ## %bb.27: ## %cond.store37			; SSE2-NEXT: ## %bb.27: ## %cond.store37
	; SSE2-NEXT: pextrw $6, %xmm0, %eax
	; SSE2-NEXT: movb %ah, (%rdi)			; SSE2-NEXT: movb %ah, (%rdi)
	; SSE2-NEXT: incq %rdi			; SSE2-NEXT: incq %rdi
	; SSE2-NEXT: LBB12_28: ## %else38			; SSE2-NEXT: LBB12_28: ## %else38
	; SSE2-NEXT: pxor %xmm2, %xmm2			; SSE2-NEXT: pxor %xmm2, %xmm2
	; SSE2-NEXT: pcmpeqb %xmm2, %xmm1			; SSE2-NEXT: pcmpeqb %xmm2, %xmm1
	; SSE2-NEXT: pextrw $7, %xmm1, %eax			; SSE2-NEXT: pextrw $7, %xmm1, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $7, %xmm0, %eax
	; SSE2-NEXT: je LBB12_30			; SSE2-NEXT: je LBB12_30
	; SSE2-NEXT: ## %bb.29: ## %cond.store40			; SSE2-NEXT: ## %bb.29: ## %cond.store40
	; SSE2-NEXT: pextrw $7, %xmm0, %ecx			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: movb %cl, (%rdi)
	; SSE2-NEXT: incq %rdi			; SSE2-NEXT: incq %rdi
	; SSE2-NEXT: LBB12_30: ## %else41			; SSE2-NEXT: LBB12_30: ## %else41
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je LBB12_32			; SSE2-NEXT: je LBB12_32
	; SSE2-NEXT: ## %bb.31: ## %cond.store43			; SSE2-NEXT: ## %bb.31: ## %cond.store43
	; SSE2-NEXT: pextrw $7, %xmm0, %eax
	; SSE2-NEXT: movb %ah, (%rdi)			; SSE2-NEXT: movb %ah, (%rdi)
	; SSE2-NEXT: LBB12_32: ## %else44			; SSE2-NEXT: LBB12_32: ## %else44
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE42-LABEL: compressstore_v16i8_v16i8:			; SSE42-LABEL: compressstore_v16i8_v16i8:
	; SSE42: ## %bb.0:			; SSE42: ## %bb.0:
	; SSE42-NEXT: pxor %xmm2, %xmm2			; SSE42-NEXT: pxor %xmm2, %xmm2
	; SSE42-NEXT: pcmpeqb %xmm1, %xmm2			; SSE42-NEXT: pcmpeqb %xmm1, %xmm2
	▲ Show 20 Lines • Show All 750 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/masked_gather.ll

	Show First 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: # %bb.3: # %cond.load1			; AVX1-NEXT: # %bb.3: # %cond.load1
	; AVX1-NEXT: vpextrq $1, %xmm0, %rax			; AVX1-NEXT: vpextrq $1, %xmm0, %rax
	; AVX1-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0],mem[0],xmm2[2,3]			; AVX1-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0],mem[0],xmm2[2,3]
	; AVX1-NEXT: .LBB0_4: # %else2			; AVX1-NEXT: .LBB0_4: # %else2
	; AVX1-NEXT: vpxor %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpxor %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm1, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm1, %xmm1
	; AVX1-NEXT: vpextrb $8, %xmm1, %eax			; AVX1-NEXT: vpextrb $8, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
				; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: je .LBB0_6			; AVX1-NEXT: je .LBB0_6
	; AVX1-NEXT: # %bb.5: # %cond.load4			; AVX1-NEXT: # %bb.5: # %cond.load4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vmovq %xmm3, %rax
	; AVX1-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1],mem[0],xmm2[3]			; AVX1-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1],mem[0],xmm2[3]
	; AVX1-NEXT: .LBB0_6: # %else5			; AVX1-NEXT: .LBB0_6: # %else5
	; AVX1-NEXT: vpextrb $12, %xmm1, %eax			; AVX1-NEXT: vpextrb $12, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB0_8			; AVX1-NEXT: je .LBB0_8
	; AVX1-NEXT: # %bb.7: # %cond.load7			; AVX1-NEXT: # %bb.7: # %cond.load7
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: vpextrq $1, %xmm0, %rax			; AVX1-NEXT: vpextrq $1, %xmm0, %rax
	; AVX1-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1,2],mem[0]			; AVX1-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1,2],mem[0]
	; AVX1-NEXT: .LBB0_8: # %else8			; AVX1-NEXT: .LBB0_8: # %else8
	; AVX1-NEXT: vmovaps %xmm2, %xmm0			; AVX1-NEXT: vmovaps %xmm2, %xmm0
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: gather_v4f32_ptr_v4i32:			; AVX2-LABEL: gather_v4f32_ptr_v4i32:
	Show All 14 Lines
	; AVX2-NEXT: # %bb.3: # %cond.load1			; AVX2-NEXT: # %bb.3: # %cond.load1
	; AVX2-NEXT: vpextrq $1, %xmm0, %rax			; AVX2-NEXT: vpextrq $1, %xmm0, %rax
	; AVX2-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0],mem[0],xmm2[2,3]			; AVX2-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0],mem[0],xmm2[2,3]
	; AVX2-NEXT: .LBB0_4: # %else2			; AVX2-NEXT: .LBB0_4: # %else2
	; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3			; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3
	; AVX2-NEXT: vpcmpeqd %xmm3, %xmm1, %xmm1			; AVX2-NEXT: vpcmpeqd %xmm3, %xmm1, %xmm1
	; AVX2-NEXT: vpextrb $8, %xmm1, %eax			; AVX2-NEXT: vpextrb $8, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: je .LBB0_6			; AVX2-NEXT: je .LBB0_6
	; AVX2-NEXT: # %bb.5: # %cond.load4			; AVX2-NEXT: # %bb.5: # %cond.load4
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vmovq %xmm0, %rax
	; AVX2-NEXT: vmovq %xmm3, %rax
	; AVX2-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1],mem[0],xmm2[3]			; AVX2-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1],mem[0],xmm2[3]
	; AVX2-NEXT: .LBB0_6: # %else5			; AVX2-NEXT: .LBB0_6: # %else5
	; AVX2-NEXT: vpextrb $12, %xmm1, %eax			; AVX2-NEXT: vpextrb $12, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB0_8			; AVX2-NEXT: je .LBB0_8
	; AVX2-NEXT: # %bb.7: # %cond.load7			; AVX2-NEXT: # %bb.7: # %cond.load7
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: vpextrq $1, %xmm0, %rax			; AVX2-NEXT: vpextrq $1, %xmm0, %rax
	; AVX2-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1,2],mem[0]			; AVX2-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1,2],mem[0]
	; AVX2-NEXT: .LBB0_8: # %else8			; AVX2-NEXT: .LBB0_8: # %else8
	; AVX2-NEXT: vmovaps %xmm2, %xmm0			; AVX2-NEXT: vmovaps %xmm2, %xmm0
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: gather_v4f32_ptr_v4i32:			; AVX512-LABEL: gather_v4f32_ptr_v4i32:
	▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: # %bb.3: # %cond.load1			; AVX1-NEXT: # %bb.3: # %cond.load1
	; AVX1-NEXT: vpextrq $1, %xmm0, %rax			; AVX1-NEXT: vpextrq $1, %xmm0, %rax
	; AVX1-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0],mem[0],xmm2[2,3]			; AVX1-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0],mem[0],xmm2[2,3]
	; AVX1-NEXT: .LBB1_4: # %else2			; AVX1-NEXT: .LBB1_4: # %else2
	; AVX1-NEXT: vpxor %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpxor %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm1, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm1, %xmm1
	; AVX1-NEXT: vpextrb $8, %xmm1, %eax			; AVX1-NEXT: vpextrb $8, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
				; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: je .LBB1_6			; AVX1-NEXT: je .LBB1_6
	; AVX1-NEXT: # %bb.5: # %cond.load4			; AVX1-NEXT: # %bb.5: # %cond.load4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vmovq %xmm3, %rax
	; AVX1-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1],mem[0],xmm2[3]			; AVX1-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1],mem[0],xmm2[3]
	; AVX1-NEXT: .LBB1_6: # %else5			; AVX1-NEXT: .LBB1_6: # %else5
	; AVX1-NEXT: vpextrb $12, %xmm1, %eax			; AVX1-NEXT: vpextrb $12, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB1_8			; AVX1-NEXT: je .LBB1_8
	; AVX1-NEXT: # %bb.7: # %cond.load7			; AVX1-NEXT: # %bb.7: # %cond.load7
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: vpextrq $1, %xmm0, %rax			; AVX1-NEXT: vpextrq $1, %xmm0, %rax
	; AVX1-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1,2],mem[0]			; AVX1-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1,2],mem[0]
	; AVX1-NEXT: .LBB1_8: # %else8			; AVX1-NEXT: .LBB1_8: # %else8
	; AVX1-NEXT: vmovaps %xmm2, %xmm0			; AVX1-NEXT: vmovaps %xmm2, %xmm0
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: gather_v4f32_v4i32_v4i32:			; AVX2-LABEL: gather_v4f32_v4i32_v4i32:
	Show All 19 Lines
	; AVX2-NEXT: # %bb.3: # %cond.load1			; AVX2-NEXT: # %bb.3: # %cond.load1
	; AVX2-NEXT: vpextrq $1, %xmm0, %rax			; AVX2-NEXT: vpextrq $1, %xmm0, %rax
	; AVX2-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0],mem[0],xmm2[2,3]			; AVX2-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0],mem[0],xmm2[2,3]
	; AVX2-NEXT: .LBB1_4: # %else2			; AVX2-NEXT: .LBB1_4: # %else2
	; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3			; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3
	; AVX2-NEXT: vpcmpeqd %xmm3, %xmm1, %xmm1			; AVX2-NEXT: vpcmpeqd %xmm3, %xmm1, %xmm1
	; AVX2-NEXT: vpextrb $8, %xmm1, %eax			; AVX2-NEXT: vpextrb $8, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: je .LBB1_6			; AVX2-NEXT: je .LBB1_6
	; AVX2-NEXT: # %bb.5: # %cond.load4			; AVX2-NEXT: # %bb.5: # %cond.load4
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vmovq %xmm0, %rax
	; AVX2-NEXT: vmovq %xmm3, %rax
	; AVX2-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1],mem[0],xmm2[3]			; AVX2-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1],mem[0],xmm2[3]
	; AVX2-NEXT: .LBB1_6: # %else5			; AVX2-NEXT: .LBB1_6: # %else5
	; AVX2-NEXT: vpextrb $12, %xmm1, %eax			; AVX2-NEXT: vpextrb $12, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB1_8			; AVX2-NEXT: je .LBB1_8
	; AVX2-NEXT: # %bb.7: # %cond.load7			; AVX2-NEXT: # %bb.7: # %cond.load7
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: vpextrq $1, %xmm0, %rax			; AVX2-NEXT: vpextrq $1, %xmm0, %rax
	; AVX2-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1,2],mem[0]			; AVX2-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1,2],mem[0]
	; AVX2-NEXT: .LBB1_8: # %else8			; AVX2-NEXT: .LBB1_8: # %else8
	; AVX2-NEXT: vmovaps %xmm2, %xmm0			; AVX2-NEXT: vmovaps %xmm2, %xmm0
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: gather_v4f32_v4i32_v4i32:			; AVX512-LABEL: gather_v4f32_v4i32_v4i32:
	▲ Show 20 Lines • Show All 88 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: # %bb.3: # %cond.load1			; AVX1-NEXT: # %bb.3: # %cond.load1
	; AVX1-NEXT: vpextrq $1, %xmm0, %rax			; AVX1-NEXT: vpextrq $1, %xmm0, %rax
	; AVX1-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0],mem[0],xmm2[2,3]			; AVX1-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0],mem[0],xmm2[2,3]
	; AVX1-NEXT: .LBB2_4: # %else2			; AVX1-NEXT: .LBB2_4: # %else2
	; AVX1-NEXT: vpxor %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpxor %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm1, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm1, %xmm1
	; AVX1-NEXT: vpextrb $8, %xmm1, %eax			; AVX1-NEXT: vpextrb $8, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
				; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: je .LBB2_6			; AVX1-NEXT: je .LBB2_6
	; AVX1-NEXT: # %bb.5: # %cond.load4			; AVX1-NEXT: # %bb.5: # %cond.load4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vmovq %xmm3, %rax
	; AVX1-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1],mem[0],xmm2[3]			; AVX1-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1],mem[0],xmm2[3]
	; AVX1-NEXT: .LBB2_6: # %else5			; AVX1-NEXT: .LBB2_6: # %else5
	; AVX1-NEXT: vpextrb $12, %xmm1, %eax			; AVX1-NEXT: vpextrb $12, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB2_8			; AVX1-NEXT: je .LBB2_8
	; AVX1-NEXT: # %bb.7: # %cond.load7			; AVX1-NEXT: # %bb.7: # %cond.load7
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: vpextrq $1, %xmm0, %rax			; AVX1-NEXT: vpextrq $1, %xmm0, %rax
	; AVX1-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1,2],mem[0]			; AVX1-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1,2],mem[0]
	; AVX1-NEXT: .LBB2_8: # %else8			; AVX1-NEXT: .LBB2_8: # %else8
	; AVX1-NEXT: vmovaps %xmm2, %xmm0			; AVX1-NEXT: vmovaps %xmm2, %xmm0
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: gather_v4f32_v4i64_v4i32:			; AVX2-LABEL: gather_v4f32_v4i64_v4i32:
	Show All 18 Lines
	; AVX2-NEXT: # %bb.3: # %cond.load1			; AVX2-NEXT: # %bb.3: # %cond.load1
	; AVX2-NEXT: vpextrq $1, %xmm0, %rax			; AVX2-NEXT: vpextrq $1, %xmm0, %rax
	; AVX2-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0],mem[0],xmm2[2,3]			; AVX2-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0],mem[0],xmm2[2,3]
	; AVX2-NEXT: .LBB2_4: # %else2			; AVX2-NEXT: .LBB2_4: # %else2
	; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3			; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3
	; AVX2-NEXT: vpcmpeqd %xmm3, %xmm1, %xmm1			; AVX2-NEXT: vpcmpeqd %xmm3, %xmm1, %xmm1
	; AVX2-NEXT: vpextrb $8, %xmm1, %eax			; AVX2-NEXT: vpextrb $8, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: je .LBB2_6			; AVX2-NEXT: je .LBB2_6
	; AVX2-NEXT: # %bb.5: # %cond.load4			; AVX2-NEXT: # %bb.5: # %cond.load4
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vmovq %xmm0, %rax
	; AVX2-NEXT: vmovq %xmm3, %rax
	; AVX2-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1],mem[0],xmm2[3]			; AVX2-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1],mem[0],xmm2[3]
	; AVX2-NEXT: .LBB2_6: # %else5			; AVX2-NEXT: .LBB2_6: # %else5
	; AVX2-NEXT: vpextrb $12, %xmm1, %eax			; AVX2-NEXT: vpextrb $12, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB2_8			; AVX2-NEXT: je .LBB2_8
	; AVX2-NEXT: # %bb.7: # %cond.load7			; AVX2-NEXT: # %bb.7: # %cond.load7
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: vpextrq $1, %xmm0, %rax			; AVX2-NEXT: vpextrq $1, %xmm0, %rax
	; AVX2-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1,2],mem[0]			; AVX2-NEXT: vinsertps {{.*#+}} xmm2 = xmm2[0,1,2],mem[0]
	; AVX2-NEXT: .LBB2_8: # %else8			; AVX2-NEXT: .LBB2_8: # %else8
	; AVX2-NEXT: vmovaps %xmm2, %xmm0			; AVX2-NEXT: vmovaps %xmm2, %xmm0
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: gather_v4f32_v4i64_v4i32:			; AVX512-LABEL: gather_v4f32_v4i64_v4i32:
	▲ Show 20 Lines • Show All 202 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpextrb $1, %xmm6, %eax			; AVX1-NEXT: vpextrb $1, %xmm6, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB3_4			; AVX1-NEXT: je .LBB3_4
	; AVX1-NEXT: # %bb.3: # %cond.load1			; AVX1-NEXT: # %bb.3: # %cond.load1
	; AVX1-NEXT: vpextrq $1, %xmm0, %rax			; AVX1-NEXT: vpextrq $1, %xmm0, %rax
	; AVX1-NEXT: vpinsrb $1, (%rax), %xmm3, %xmm3			; AVX1-NEXT: vpinsrb $1, (%rax), %xmm3, %xmm3
	; AVX1-NEXT: .LBB3_4: # %else2			; AVX1-NEXT: .LBB3_4: # %else2
	; AVX1-NEXT: vpmovsxdq %xmm7, %xmm6			; AVX1-NEXT: vpmovsxdq %xmm7, %xmm6
	; AVX1-NEXT: vpaddq %xmm5, %xmm4, %xmm8			; AVX1-NEXT: vpaddq %xmm5, %xmm4, %xmm5
	; AVX1-NEXT: vpxor %xmm7, %xmm7, %xmm7			; AVX1-NEXT: vpxor %xmm7, %xmm7, %xmm7
	; AVX1-NEXT: vpcmpeqb %xmm7, %xmm2, %xmm7			; AVX1-NEXT: vpcmpeqb %xmm7, %xmm2, %xmm7
	; AVX1-NEXT: vpextrb $2, %xmm7, %eax			; AVX1-NEXT: vpextrb $2, %xmm7, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
				; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: je .LBB3_6			; AVX1-NEXT: je .LBB3_6
	; AVX1-NEXT: # %bb.5: # %cond.load4			; AVX1-NEXT: # %bb.5: # %cond.load4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vmovq %xmm5, %rax
	; AVX1-NEXT: vpinsrb $2, (%rax), %xmm3, %xmm3			; AVX1-NEXT: vpinsrb $2, (%rax), %xmm3, %xmm3
	; AVX1-NEXT: .LBB3_6: # %else5			; AVX1-NEXT: .LBB3_6: # %else5
	; AVX1-NEXT: vpaddq %xmm6, %xmm4, %xmm6			; AVX1-NEXT: vpaddq %xmm6, %xmm4, %xmm6
	; AVX1-NEXT: vpextrb $3, %xmm7, %eax			; AVX1-NEXT: vpextrb $3, %xmm7, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB3_8			; AVX1-NEXT: je .LBB3_8
	; AVX1-NEXT: # %bb.7: # %cond.load7			; AVX1-NEXT: # %bb.7: # %cond.load7
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: vpextrq $1, %xmm0, %rax			; AVX1-NEXT: vpextrq $1, %xmm0, %rax
	; AVX1-NEXT: vpinsrb $3, (%rax), %xmm3, %xmm3			; AVX1-NEXT: vpinsrb $3, (%rax), %xmm3, %xmm3
	; AVX1-NEXT: .LBB3_8: # %else8			; AVX1-NEXT: .LBB3_8: # %else8
	; AVX1-NEXT: vinsertf128 $1, %xmm6, %ymm8, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm6, %ymm5, %ymm0
	; AVX1-NEXT: vpxor %xmm5, %xmm5, %xmm5			; AVX1-NEXT: vpxor %xmm5, %xmm5, %xmm5
	; AVX1-NEXT: vpcmpeqb %xmm5, %xmm2, %xmm5			; AVX1-NEXT: vpcmpeqb %xmm5, %xmm2, %xmm5
	; AVX1-NEXT: vpextrb $4, %xmm5, %eax			; AVX1-NEXT: vpextrb $4, %xmm5, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB3_10			; AVX1-NEXT: je .LBB3_10
	; AVX1-NEXT: # %bb.9: # %cond.load10			; AVX1-NEXT: # %bb.9: # %cond.load10
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vpinsrb $4, (%rax), %xmm3, %xmm3			; AVX1-NEXT: vpinsrb $4, (%rax), %xmm3, %xmm3
	; AVX1-NEXT: .LBB3_10: # %else11			; AVX1-NEXT: .LBB3_10: # %else11
	; AVX1-NEXT: vpshufd {{.*#+}} xmm6 = xmm1[2,3,0,1]			; AVX1-NEXT: vpshufd {{.*#+}} xmm6 = xmm1[2,3,0,1]
	; AVX1-NEXT: vpmovsxdq %xmm1, %xmm7			; AVX1-NEXT: vpmovsxdq %xmm1, %xmm7
	; AVX1-NEXT: vpextrb $5, %xmm5, %eax			; AVX1-NEXT: vpextrb $5, %xmm5, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB3_12			; AVX1-NEXT: je .LBB3_12
	; AVX1-NEXT: # %bb.11: # %cond.load13			; AVX1-NEXT: # %bb.11: # %cond.load13
	; AVX1-NEXT: vpextrq $1, %xmm0, %rax			; AVX1-NEXT: vpextrq $1, %xmm0, %rax
	; AVX1-NEXT: vpinsrb $5, (%rax), %xmm3, %xmm3			; AVX1-NEXT: vpinsrb $5, (%rax), %xmm3, %xmm3
	; AVX1-NEXT: .LBB3_12: # %else14			; AVX1-NEXT: .LBB3_12: # %else14
	; AVX1-NEXT: vpmovsxdq %xmm6, %xmm6			; AVX1-NEXT: vpmovsxdq %xmm6, %xmm6
	; AVX1-NEXT: vpaddq %xmm7, %xmm4, %xmm8			; AVX1-NEXT: vpaddq %xmm7, %xmm4, %xmm5
	; AVX1-NEXT: vpxor %xmm7, %xmm7, %xmm7			; AVX1-NEXT: vpxor %xmm7, %xmm7, %xmm7
	; AVX1-NEXT: vpcmpeqb %xmm7, %xmm2, %xmm7			; AVX1-NEXT: vpcmpeqb %xmm7, %xmm2, %xmm7
	; AVX1-NEXT: vpextrb $6, %xmm7, %eax			; AVX1-NEXT: vpextrb $6, %xmm7, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
				; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: je .LBB3_14			; AVX1-NEXT: je .LBB3_14
	; AVX1-NEXT: # %bb.13: # %cond.load16			; AVX1-NEXT: # %bb.13: # %cond.load16
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vmovq %xmm5, %rax
	; AVX1-NEXT: vpinsrb $6, (%rax), %xmm3, %xmm3			; AVX1-NEXT: vpinsrb $6, (%rax), %xmm3, %xmm3
	; AVX1-NEXT: .LBB3_14: # %else17			; AVX1-NEXT: .LBB3_14: # %else17
	; AVX1-NEXT: vpaddq %xmm6, %xmm4, %xmm6			; AVX1-NEXT: vpaddq %xmm6, %xmm4, %xmm6
	; AVX1-NEXT: vpextrb $7, %xmm7, %eax			; AVX1-NEXT: vpextrb $7, %xmm7, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB3_16			; AVX1-NEXT: je .LBB3_16
	; AVX1-NEXT: # %bb.15: # %cond.load19			; AVX1-NEXT: # %bb.15: # %cond.load19
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: vpextrq $1, %xmm0, %rax			; AVX1-NEXT: vpextrq $1, %xmm0, %rax
	; AVX1-NEXT: vpinsrb $7, (%rax), %xmm3, %xmm3			; AVX1-NEXT: vpinsrb $7, (%rax), %xmm3, %xmm3
	; AVX1-NEXT: .LBB3_16: # %else20			; AVX1-NEXT: .LBB3_16: # %else20
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm1
	; AVX1-NEXT: vinsertf128 $1, %xmm6, %ymm8, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm6, %ymm5, %ymm0
	; AVX1-NEXT: vpxor %xmm5, %xmm5, %xmm5			; AVX1-NEXT: vpxor %xmm5, %xmm5, %xmm5
	; AVX1-NEXT: vpcmpeqb %xmm5, %xmm2, %xmm5			; AVX1-NEXT: vpcmpeqb %xmm5, %xmm2, %xmm5
	; AVX1-NEXT: vpextrb $8, %xmm5, %eax			; AVX1-NEXT: vpextrb $8, %xmm5, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB3_18			; AVX1-NEXT: je .LBB3_18
	; AVX1-NEXT: # %bb.17: # %cond.load22			; AVX1-NEXT: # %bb.17: # %cond.load22
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vpinsrb $8, (%rax), %xmm3, %xmm3			; AVX1-NEXT: vpinsrb $8, (%rax), %xmm3, %xmm3
	; AVX1-NEXT: .LBB3_18: # %else23			; AVX1-NEXT: .LBB3_18: # %else23
	; AVX1-NEXT: vpshufd {{.*#+}} xmm6 = xmm1[2,3,0,1]			; AVX1-NEXT: vpshufd {{.*#+}} xmm6 = xmm1[2,3,0,1]
	; AVX1-NEXT: vpmovsxdq %xmm1, %xmm1			; AVX1-NEXT: vpmovsxdq %xmm1, %xmm1
	; AVX1-NEXT: vpextrb $9, %xmm5, %eax			; AVX1-NEXT: vpextrb $9, %xmm5, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB3_20			; AVX1-NEXT: je .LBB3_20
	; AVX1-NEXT: # %bb.19: # %cond.load25			; AVX1-NEXT: # %bb.19: # %cond.load25
	; AVX1-NEXT: vpextrq $1, %xmm0, %rax			; AVX1-NEXT: vpextrq $1, %xmm0, %rax
	; AVX1-NEXT: vpinsrb $9, (%rax), %xmm3, %xmm3			; AVX1-NEXT: vpinsrb $9, (%rax), %xmm3, %xmm3
	; AVX1-NEXT: .LBB3_20: # %else26			; AVX1-NEXT: .LBB3_20: # %else26
	; AVX1-NEXT: vpmovsxdq %xmm6, %xmm5			; AVX1-NEXT: vpmovsxdq %xmm6, %xmm5
	; AVX1-NEXT: vpaddq %xmm1, %xmm4, %xmm1			; AVX1-NEXT: vpaddq %xmm1, %xmm4, %xmm1
	; AVX1-NEXT: vpxor %xmm6, %xmm6, %xmm6			; AVX1-NEXT: vpxor %xmm6, %xmm6, %xmm6
	; AVX1-NEXT: vpcmpeqb %xmm6, %xmm2, %xmm6			; AVX1-NEXT: vpcmpeqb %xmm6, %xmm2, %xmm6
	; AVX1-NEXT: vpextrb $10, %xmm6, %eax			; AVX1-NEXT: vpextrb $10, %xmm6, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
				; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: je .LBB3_22			; AVX1-NEXT: je .LBB3_22
	; AVX1-NEXT: # %bb.21: # %cond.load28			; AVX1-NEXT: # %bb.21: # %cond.load28
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm7			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vmovq %xmm7, %rax
	; AVX1-NEXT: vpinsrb $10, (%rax), %xmm3, %xmm3			; AVX1-NEXT: vpinsrb $10, (%rax), %xmm3, %xmm3
	; AVX1-NEXT: .LBB3_22: # %else29			; AVX1-NEXT: .LBB3_22: # %else29
	; AVX1-NEXT: vpaddq %xmm5, %xmm4, %xmm4			; AVX1-NEXT: vpaddq %xmm5, %xmm4, %xmm4
	; AVX1-NEXT: vpextrb $11, %xmm6, %eax			; AVX1-NEXT: vpextrb $11, %xmm6, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB3_24			; AVX1-NEXT: je .LBB3_24
	; AVX1-NEXT: # %bb.23: # %cond.load31			; AVX1-NEXT: # %bb.23: # %cond.load31
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: vpextrq $1, %xmm0, %rax			; AVX1-NEXT: vpextrq $1, %xmm0, %rax
	; AVX1-NEXT: vpinsrb $11, (%rax), %xmm3, %xmm3			; AVX1-NEXT: vpinsrb $11, (%rax), %xmm3, %xmm3
	; AVX1-NEXT: .LBB3_24: # %else32			; AVX1-NEXT: .LBB3_24: # %else32
	; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm1, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm4, %ymm1, %ymm0
	; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpeqb %xmm1, %xmm2, %xmm1			; AVX1-NEXT: vpcmpeqb %xmm1, %xmm2, %xmm1
	; AVX1-NEXT: vpextrb $12, %xmm1, %eax			; AVX1-NEXT: vpextrb $12, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB3_26			; AVX1-NEXT: je .LBB3_26
	; AVX1-NEXT: # %bb.25: # %cond.load34			; AVX1-NEXT: # %bb.25: # %cond.load34
	; AVX1-NEXT: vmovq %xmm0, %rax			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vpinsrb $12, (%rax), %xmm3, %xmm3			; AVX1-NEXT: vpinsrb $12, (%rax), %xmm3, %xmm3
	; AVX1-NEXT: .LBB3_26: # %else35			; AVX1-NEXT: .LBB3_26: # %else35
	; AVX1-NEXT: vpextrb $13, %xmm1, %eax			; AVX1-NEXT: vpextrb $13, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB3_28			; AVX1-NEXT: je .LBB3_28
	; AVX1-NEXT: # %bb.27: # %cond.load37			; AVX1-NEXT: # %bb.27: # %cond.load37
	; AVX1-NEXT: vpextrq $1, %xmm0, %rax			; AVX1-NEXT: vpextrq $1, %xmm0, %rax
	; AVX1-NEXT: vpinsrb $13, (%rax), %xmm3, %xmm3			; AVX1-NEXT: vpinsrb $13, (%rax), %xmm3, %xmm3
	; AVX1-NEXT: .LBB3_28: # %else38			; AVX1-NEXT: .LBB3_28: # %else38
	; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpeqb %xmm1, %xmm2, %xmm1			; AVX1-NEXT: vpcmpeqb %xmm1, %xmm2, %xmm1
	; AVX1-NEXT: vpextrb $14, %xmm1, %eax			; AVX1-NEXT: vpextrb $14, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
				; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: je .LBB3_30			; AVX1-NEXT: je .LBB3_30
	; AVX1-NEXT: # %bb.29: # %cond.load40			; AVX1-NEXT: # %bb.29: # %cond.load40
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vmovq %xmm0, %rax
	; AVX1-NEXT: vmovq %xmm2, %rax
	; AVX1-NEXT: vpinsrb $14, (%rax), %xmm3, %xmm3			; AVX1-NEXT: vpinsrb $14, (%rax), %xmm3, %xmm3
	; AVX1-NEXT: .LBB3_30: # %else41			; AVX1-NEXT: .LBB3_30: # %else41
	; AVX1-NEXT: vpextrb $15, %xmm1, %eax			; AVX1-NEXT: vpextrb $15, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB3_32			; AVX1-NEXT: je .LBB3_32
	; AVX1-NEXT: # %bb.31: # %cond.load43			; AVX1-NEXT: # %bb.31: # %cond.load43
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: vpextrq $1, %xmm0, %rax			; AVX1-NEXT: vpextrq $1, %xmm0, %rax
	; AVX1-NEXT: vpinsrb $15, (%rax), %xmm3, %xmm3			; AVX1-NEXT: vpinsrb $15, (%rax), %xmm3, %xmm3
	; AVX1-NEXT: .LBB3_32: # %else44			; AVX1-NEXT: .LBB3_32: # %else44
	; AVX1-NEXT: vmovdqa %xmm3, %xmm0			; AVX1-NEXT: vmovdqa %xmm3, %xmm0
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: gather_v16i8_v16i32_v16i8:			; AVX2-LABEL: gather_v16i8_v16i32_v16i8:
	Show All 18 Lines
	; AVX2-NEXT: vpextrq $1, %xmm5, %rax			; AVX2-NEXT: vpextrq $1, %xmm5, %rax
	; AVX2-NEXT: vpinsrb $1, (%rax), %xmm3, %xmm3			; AVX2-NEXT: vpinsrb $1, (%rax), %xmm3, %xmm3
	; AVX2-NEXT: .LBB3_4: # %else2			; AVX2-NEXT: .LBB3_4: # %else2
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0			; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: vpxor %xmm6, %xmm6, %xmm6			; AVX2-NEXT: vpxor %xmm6, %xmm6, %xmm6
	; AVX2-NEXT: vpcmpeqb %xmm6, %xmm2, %xmm6			; AVX2-NEXT: vpcmpeqb %xmm6, %xmm2, %xmm6
	; AVX2-NEXT: vpextrb $2, %xmm6, %eax			; AVX2-NEXT: vpextrb $2, %xmm6, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: vextracti128 $1, %ymm5, %xmm5
	; AVX2-NEXT: je .LBB3_6			; AVX2-NEXT: je .LBB3_6
	; AVX2-NEXT: # %bb.5: # %cond.load4			; AVX2-NEXT: # %bb.5: # %cond.load4
	; AVX2-NEXT: vextracti128 $1, %ymm5, %xmm7			; AVX2-NEXT: vmovq %xmm5, %rax
	; AVX2-NEXT: vmovq %xmm7, %rax
	; AVX2-NEXT: vpinsrb $2, (%rax), %xmm3, %xmm3			; AVX2-NEXT: vpinsrb $2, (%rax), %xmm3, %xmm3
	; AVX2-NEXT: .LBB3_6: # %else5			; AVX2-NEXT: .LBB3_6: # %else5
	; AVX2-NEXT: vpmovsxdq %xmm0, %ymm0			; AVX2-NEXT: vpmovsxdq %xmm0, %ymm0
	; AVX2-NEXT: vpextrb $3, %xmm6, %eax			; AVX2-NEXT: vpextrb $3, %xmm6, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB3_8			; AVX2-NEXT: je .LBB3_8
	; AVX2-NEXT: # %bb.7: # %cond.load7			; AVX2-NEXT: # %bb.7: # %cond.load7
	; AVX2-NEXT: vextracti128 $1, %ymm5, %xmm5
	; AVX2-NEXT: vpextrq $1, %xmm5, %rax			; AVX2-NEXT: vpextrq $1, %xmm5, %rax
	; AVX2-NEXT: vpinsrb $3, (%rax), %xmm3, %xmm3			; AVX2-NEXT: vpinsrb $3, (%rax), %xmm3, %xmm3
	; AVX2-NEXT: .LBB3_8: # %else8			; AVX2-NEXT: .LBB3_8: # %else8
	; AVX2-NEXT: vpaddq %ymm0, %ymm4, %ymm0			; AVX2-NEXT: vpaddq %ymm0, %ymm4, %ymm0
	; AVX2-NEXT: vpxor %xmm5, %xmm5, %xmm5			; AVX2-NEXT: vpxor %xmm5, %xmm5, %xmm5
	; AVX2-NEXT: vpcmpeqb %xmm5, %xmm2, %xmm5			; AVX2-NEXT: vpcmpeqb %xmm5, %xmm2, %xmm5
	; AVX2-NEXT: vpextrb $4, %xmm5, %eax			; AVX2-NEXT: vpextrb $4, %xmm5, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB3_10			; AVX2-NEXT: je .LBB3_10
	; AVX2-NEXT: # %bb.9: # %cond.load10			; AVX2-NEXT: # %bb.9: # %cond.load10
	; AVX2-NEXT: vmovq %xmm0, %rax			; AVX2-NEXT: vmovq %xmm0, %rax
	; AVX2-NEXT: vpinsrb $4, (%rax), %xmm3, %xmm3			; AVX2-NEXT: vpinsrb $4, (%rax), %xmm3, %xmm3
	; AVX2-NEXT: .LBB3_10: # %else11			; AVX2-NEXT: .LBB3_10: # %else11
	; AVX2-NEXT: vpextrb $5, %xmm5, %eax			; AVX2-NEXT: vpextrb $5, %xmm5, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB3_12			; AVX2-NEXT: je .LBB3_12
	; AVX2-NEXT: # %bb.11: # %cond.load13			; AVX2-NEXT: # %bb.11: # %cond.load13
	; AVX2-NEXT: vpextrq $1, %xmm0, %rax			; AVX2-NEXT: vpextrq $1, %xmm0, %rax
	; AVX2-NEXT: vpinsrb $5, (%rax), %xmm3, %xmm3			; AVX2-NEXT: vpinsrb $5, (%rax), %xmm3, %xmm3
	; AVX2-NEXT: .LBB3_12: # %else14			; AVX2-NEXT: .LBB3_12: # %else14
	; AVX2-NEXT: vpxor %xmm5, %xmm5, %xmm5			; AVX2-NEXT: vpxor %xmm5, %xmm5, %xmm5
	; AVX2-NEXT: vpcmpeqb %xmm5, %xmm2, %xmm5			; AVX2-NEXT: vpcmpeqb %xmm5, %xmm2, %xmm5
	; AVX2-NEXT: vpextrb $6, %xmm5, %eax			; AVX2-NEXT: vpextrb $6, %xmm5, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: je .LBB3_14			; AVX2-NEXT: je .LBB3_14
	; AVX2-NEXT: # %bb.13: # %cond.load16			; AVX2-NEXT: # %bb.13: # %cond.load16
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm6			; AVX2-NEXT: vmovq %xmm0, %rax
	; AVX2-NEXT: vmovq %xmm6, %rax
	; AVX2-NEXT: vpinsrb $6, (%rax), %xmm3, %xmm3			; AVX2-NEXT: vpinsrb $6, (%rax), %xmm3, %xmm3
	; AVX2-NEXT: .LBB3_14: # %else17			; AVX2-NEXT: .LBB3_14: # %else17
	; AVX2-NEXT: vpmovsxdq %xmm1, %ymm6			; AVX2-NEXT: vpmovsxdq %xmm1, %ymm6
	; AVX2-NEXT: vpextrb $7, %xmm5, %eax			; AVX2-NEXT: vpextrb $7, %xmm5, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB3_16			; AVX2-NEXT: je .LBB3_16
	; AVX2-NEXT: # %bb.15: # %cond.load19			; AVX2-NEXT: # %bb.15: # %cond.load19
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: vpextrq $1, %xmm0, %rax			; AVX2-NEXT: vpextrq $1, %xmm0, %rax
	; AVX2-NEXT: vpinsrb $7, (%rax), %xmm3, %xmm3			; AVX2-NEXT: vpinsrb $7, (%rax), %xmm3, %xmm3
	; AVX2-NEXT: .LBB3_16: # %else20			; AVX2-NEXT: .LBB3_16: # %else20
	; AVX2-NEXT: vpaddq %ymm6, %ymm4, %ymm0			; AVX2-NEXT: vpaddq %ymm6, %ymm4, %ymm0
	; AVX2-NEXT: vpxor %xmm5, %xmm5, %xmm5			; AVX2-NEXT: vpxor %xmm5, %xmm5, %xmm5
	; AVX2-NEXT: vpcmpeqb %xmm5, %xmm2, %xmm5			; AVX2-NEXT: vpcmpeqb %xmm5, %xmm2, %xmm5
	; AVX2-NEXT: vpextrb $8, %xmm5, %eax			; AVX2-NEXT: vpextrb $8, %xmm5, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	Show All 9 Lines
	; AVX2-NEXT: vpextrq $1, %xmm0, %rax			; AVX2-NEXT: vpextrq $1, %xmm0, %rax
	; AVX2-NEXT: vpinsrb $9, (%rax), %xmm3, %xmm3			; AVX2-NEXT: vpinsrb $9, (%rax), %xmm3, %xmm3
	; AVX2-NEXT: .LBB3_20: # %else26			; AVX2-NEXT: .LBB3_20: # %else26
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpxor %xmm5, %xmm5, %xmm5			; AVX2-NEXT: vpxor %xmm5, %xmm5, %xmm5
	; AVX2-NEXT: vpcmpeqb %xmm5, %xmm2, %xmm5			; AVX2-NEXT: vpcmpeqb %xmm5, %xmm2, %xmm5
	; AVX2-NEXT: vpextrb $10, %xmm5, %eax			; AVX2-NEXT: vpextrb $10, %xmm5, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: je .LBB3_22			; AVX2-NEXT: je .LBB3_22
	; AVX2-NEXT: # %bb.21: # %cond.load28			; AVX2-NEXT: # %bb.21: # %cond.load28
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm6			; AVX2-NEXT: vmovq %xmm0, %rax
	; AVX2-NEXT: vmovq %xmm6, %rax
	; AVX2-NEXT: vpinsrb $10, (%rax), %xmm3, %xmm3			; AVX2-NEXT: vpinsrb $10, (%rax), %xmm3, %xmm3
	; AVX2-NEXT: .LBB3_22: # %else29			; AVX2-NEXT: .LBB3_22: # %else29
	; AVX2-NEXT: vpmovsxdq %xmm1, %ymm1			; AVX2-NEXT: vpmovsxdq %xmm1, %ymm1
	; AVX2-NEXT: vpextrb $11, %xmm5, %eax			; AVX2-NEXT: vpextrb $11, %xmm5, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB3_24			; AVX2-NEXT: je .LBB3_24
	; AVX2-NEXT: # %bb.23: # %cond.load31			; AVX2-NEXT: # %bb.23: # %cond.load31
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: vpextrq $1, %xmm0, %rax			; AVX2-NEXT: vpextrq $1, %xmm0, %rax
	; AVX2-NEXT: vpinsrb $11, (%rax), %xmm3, %xmm3			; AVX2-NEXT: vpinsrb $11, (%rax), %xmm3, %xmm3
	; AVX2-NEXT: .LBB3_24: # %else32			; AVX2-NEXT: .LBB3_24: # %else32
	; AVX2-NEXT: vpaddq %ymm1, %ymm4, %ymm0			; AVX2-NEXT: vpaddq %ymm1, %ymm4, %ymm0
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %xmm1, %xmm2, %xmm1			; AVX2-NEXT: vpcmpeqb %xmm1, %xmm2, %xmm1
	; AVX2-NEXT: vpextrb $12, %xmm1, %eax			; AVX2-NEXT: vpextrb $12, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB3_26			; AVX2-NEXT: je .LBB3_26
	; AVX2-NEXT: # %bb.25: # %cond.load34			; AVX2-NEXT: # %bb.25: # %cond.load34
	; AVX2-NEXT: vmovq %xmm0, %rax			; AVX2-NEXT: vmovq %xmm0, %rax
	; AVX2-NEXT: vpinsrb $12, (%rax), %xmm3, %xmm3			; AVX2-NEXT: vpinsrb $12, (%rax), %xmm3, %xmm3
	; AVX2-NEXT: .LBB3_26: # %else35			; AVX2-NEXT: .LBB3_26: # %else35
	; AVX2-NEXT: vpextrb $13, %xmm1, %eax			; AVX2-NEXT: vpextrb $13, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB3_28			; AVX2-NEXT: je .LBB3_28
	; AVX2-NEXT: # %bb.27: # %cond.load37			; AVX2-NEXT: # %bb.27: # %cond.load37
	; AVX2-NEXT: vpextrq $1, %xmm0, %rax			; AVX2-NEXT: vpextrq $1, %xmm0, %rax
	; AVX2-NEXT: vpinsrb $13, (%rax), %xmm3, %xmm3			; AVX2-NEXT: vpinsrb $13, (%rax), %xmm3, %xmm3
	; AVX2-NEXT: .LBB3_28: # %else38			; AVX2-NEXT: .LBB3_28: # %else38
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %xmm1, %xmm2, %xmm1			; AVX2-NEXT: vpcmpeqb %xmm1, %xmm2, %xmm1
	; AVX2-NEXT: vpextrb $14, %xmm1, %eax			; AVX2-NEXT: vpextrb $14, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: je .LBB3_30			; AVX2-NEXT: je .LBB3_30
	; AVX2-NEXT: # %bb.29: # %cond.load40			; AVX2-NEXT: # %bb.29: # %cond.load40
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm2			; AVX2-NEXT: vmovq %xmm0, %rax
	; AVX2-NEXT: vmovq %xmm2, %rax
	; AVX2-NEXT: vpinsrb $14, (%rax), %xmm3, %xmm3			; AVX2-NEXT: vpinsrb $14, (%rax), %xmm3, %xmm3
	; AVX2-NEXT: .LBB3_30: # %else41			; AVX2-NEXT: .LBB3_30: # %else41
	; AVX2-NEXT: vpextrb $15, %xmm1, %eax			; AVX2-NEXT: vpextrb $15, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB3_32			; AVX2-NEXT: je .LBB3_32
	; AVX2-NEXT: # %bb.31: # %cond.load43			; AVX2-NEXT: # %bb.31: # %cond.load43
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: vpextrq $1, %xmm0, %rax			; AVX2-NEXT: vpextrq $1, %xmm0, %rax
	; AVX2-NEXT: vpinsrb $15, (%rax), %xmm3, %xmm3			; AVX2-NEXT: vpinsrb $15, (%rax), %xmm3, %xmm3
	; AVX2-NEXT: .LBB3_32: # %else44			; AVX2-NEXT: .LBB3_32: # %else44
	; AVX2-NEXT: vmovdqa %xmm3, %xmm0			; AVX2-NEXT: vmovdqa %xmm3, %xmm0
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: gather_v16i8_v16i32_v16i8:			; AVX512-LABEL: gather_v16i8_v16i32_v16i8:
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; AVX512-NEXT: .LBB3_8: # %else8			; AVX512-NEXT: .LBB3_8: # %else8
	; AVX512-NEXT: vpxor %xmm5, %xmm5, %xmm5			; AVX512-NEXT: vpxor %xmm5, %xmm5, %xmm5
	; AVX512-NEXT: vpcmpeqb %xmm5, %xmm1, %xmm5			; AVX512-NEXT: vpcmpeqb %xmm5, %xmm1, %xmm5
	; AVX512-NEXT: vpmovsxbd %xmm5, %zmm5			; AVX512-NEXT: vpmovsxbd %xmm5, %zmm5
	; AVX512-NEXT: vptestmd %zmm5, %zmm5, %k0			; AVX512-NEXT: vptestmd %zmm5, %zmm5, %k0
	; AVX512-NEXT: kshiftrw $4, %k0, %k1			; AVX512-NEXT: kshiftrw $4, %k0, %k1
	; AVX512-NEXT: kmovw %k1, %eax			; AVX512-NEXT: kmovw %k1, %eax
	; AVX512-NEXT: testb $1, %al			; AVX512-NEXT: testb $1, %al
				; AVX512-NEXT: vextracti32x4 $2, %zmm4, %xmm5
	; AVX512-NEXT: je .LBB3_10			; AVX512-NEXT: je .LBB3_10
	; AVX512-NEXT: # %bb.9: # %cond.load10			; AVX512-NEXT: # %bb.9: # %cond.load10
	; AVX512-NEXT: vextracti32x4 $2, %zmm4, %xmm5
	; AVX512-NEXT: vmovq %xmm5, %rax			; AVX512-NEXT: vmovq %xmm5, %rax
	; AVX512-NEXT: vpinsrb $4, (%rax), %xmm2, %xmm2			; AVX512-NEXT: vpinsrb $4, (%rax), %xmm2, %xmm2
	; AVX512-NEXT: .LBB3_10: # %else11			; AVX512-NEXT: .LBB3_10: # %else11
	; AVX512-NEXT: kshiftrw $5, %k0, %k0			; AVX512-NEXT: kshiftrw $5, %k0, %k0
	; AVX512-NEXT: kmovw %k0, %eax			; AVX512-NEXT: kmovw %k0, %eax
	; AVX512-NEXT: testb $1, %al			; AVX512-NEXT: testb $1, %al
	; AVX512-NEXT: je .LBB3_12			; AVX512-NEXT: je .LBB3_12
	; AVX512-NEXT: # %bb.11: # %cond.load13			; AVX512-NEXT: # %bb.11: # %cond.load13
	; AVX512-NEXT: vextracti32x4 $2, %zmm4, %xmm5
	; AVX512-NEXT: vpextrq $1, %xmm5, %rax			; AVX512-NEXT: vpextrq $1, %xmm5, %rax
	; AVX512-NEXT: vpinsrb $5, (%rax), %xmm2, %xmm2			; AVX512-NEXT: vpinsrb $5, (%rax), %xmm2, %xmm2
	; AVX512-NEXT: .LBB3_12: # %else14			; AVX512-NEXT: .LBB3_12: # %else14
	; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm0			; AVX512-NEXT: vextracti64x4 $1, %zmm0, %ymm0
	; AVX512-NEXT: vpxor %xmm5, %xmm5, %xmm5			; AVX512-NEXT: vpxor %xmm5, %xmm5, %xmm5
	; AVX512-NEXT: vpcmpeqb %xmm5, %xmm1, %xmm5			; AVX512-NEXT: vpcmpeqb %xmm5, %xmm1, %xmm5
	; AVX512-NEXT: vpmovsxbd %xmm5, %zmm5			; AVX512-NEXT: vpmovsxbd %xmm5, %zmm5
	; AVX512-NEXT: vptestmd %zmm5, %zmm5, %k0			; AVX512-NEXT: vptestmd %zmm5, %zmm5, %k0
	; AVX512-NEXT: kshiftrw $6, %k0, %k1			; AVX512-NEXT: kshiftrw $6, %k0, %k1
	; AVX512-NEXT: kmovw %k1, %eax			; AVX512-NEXT: kmovw %k1, %eax
	; AVX512-NEXT: testb $1, %al			; AVX512-NEXT: testb $1, %al
				; AVX512-NEXT: vextracti32x4 $3, %zmm4, %xmm4
	; AVX512-NEXT: je .LBB3_14			; AVX512-NEXT: je .LBB3_14
	; AVX512-NEXT: # %bb.13: # %cond.load16			; AVX512-NEXT: # %bb.13: # %cond.load16
	; AVX512-NEXT: vextracti32x4 $3, %zmm4, %xmm5			; AVX512-NEXT: vmovq %xmm4, %rax
	; AVX512-NEXT: vmovq %xmm5, %rax
	; AVX512-NEXT: vpinsrb $6, (%rax), %xmm2, %xmm2			; AVX512-NEXT: vpinsrb $6, (%rax), %xmm2, %xmm2
	; AVX512-NEXT: .LBB3_14: # %else17			; AVX512-NEXT: .LBB3_14: # %else17
	; AVX512-NEXT: vpmovsxdq %ymm0, %zmm0			; AVX512-NEXT: vpmovsxdq %ymm0, %zmm0
	; AVX512-NEXT: kshiftrw $7, %k0, %k0			; AVX512-NEXT: kshiftrw $7, %k0, %k0
	; AVX512-NEXT: kmovw %k0, %eax			; AVX512-NEXT: kmovw %k0, %eax
	; AVX512-NEXT: testb $1, %al			; AVX512-NEXT: testb $1, %al
	; AVX512-NEXT: je .LBB3_16			; AVX512-NEXT: je .LBB3_16
	; AVX512-NEXT: # %bb.15: # %cond.load19			; AVX512-NEXT: # %bb.15: # %cond.load19
	; AVX512-NEXT: vextracti32x4 $3, %zmm4, %xmm4
	; AVX512-NEXT: vpextrq $1, %xmm4, %rax			; AVX512-NEXT: vpextrq $1, %xmm4, %rax
	; AVX512-NEXT: vpinsrb $7, (%rax), %xmm2, %xmm2			; AVX512-NEXT: vpinsrb $7, (%rax), %xmm2, %xmm2
	; AVX512-NEXT: .LBB3_16: # %else20			; AVX512-NEXT: .LBB3_16: # %else20
	; AVX512-NEXT: vpaddq %zmm0, %zmm3, %zmm0			; AVX512-NEXT: vpaddq %zmm0, %zmm3, %zmm0
	; AVX512-NEXT: vpxor %xmm3, %xmm3, %xmm3			; AVX512-NEXT: vpxor %xmm3, %xmm3, %xmm3
	; AVX512-NEXT: vpcmpeqb %xmm3, %xmm1, %xmm3			; AVX512-NEXT: vpcmpeqb %xmm3, %xmm1, %xmm3
	; AVX512-NEXT: vpmovsxbd %xmm3, %zmm3			; AVX512-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512-NEXT: vptestmd %zmm3, %zmm3, %k0			; AVX512-NEXT: vptestmd %zmm3, %zmm3, %k0
	Show All 37 Lines
	; AVX512-NEXT: .LBB3_24: # %else32			; AVX512-NEXT: .LBB3_24: # %else32
	; AVX512-NEXT: vpxor %xmm3, %xmm3, %xmm3			; AVX512-NEXT: vpxor %xmm3, %xmm3, %xmm3
	; AVX512-NEXT: vpcmpeqb %xmm3, %xmm1, %xmm3			; AVX512-NEXT: vpcmpeqb %xmm3, %xmm1, %xmm3
	; AVX512-NEXT: vpmovsxbd %xmm3, %zmm3			; AVX512-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512-NEXT: vptestmd %zmm3, %zmm3, %k0			; AVX512-NEXT: vptestmd %zmm3, %zmm3, %k0
	; AVX512-NEXT: kshiftrw $12, %k0, %k1			; AVX512-NEXT: kshiftrw $12, %k0, %k1
	; AVX512-NEXT: kmovw %k1, %eax			; AVX512-NEXT: kmovw %k1, %eax
	; AVX512-NEXT: testb $1, %al			; AVX512-NEXT: testb $1, %al
				; AVX512-NEXT: vextracti32x4 $2, %zmm0, %xmm3
	; AVX512-NEXT: je .LBB3_26			; AVX512-NEXT: je .LBB3_26
	; AVX512-NEXT: # %bb.25: # %cond.load34			; AVX512-NEXT: # %bb.25: # %cond.load34
	; AVX512-NEXT: vextracti32x4 $2, %zmm0, %xmm3
	; AVX512-NEXT: vmovq %xmm3, %rax			; AVX512-NEXT: vmovq %xmm3, %rax
	; AVX512-NEXT: vpinsrb $12, (%rax), %xmm2, %xmm2			; AVX512-NEXT: vpinsrb $12, (%rax), %xmm2, %xmm2
	; AVX512-NEXT: .LBB3_26: # %else35			; AVX512-NEXT: .LBB3_26: # %else35
	; AVX512-NEXT: kshiftrw $13, %k0, %k0			; AVX512-NEXT: kshiftrw $13, %k0, %k0
	; AVX512-NEXT: kmovw %k0, %eax			; AVX512-NEXT: kmovw %k0, %eax
	; AVX512-NEXT: testb $1, %al			; AVX512-NEXT: testb $1, %al
	; AVX512-NEXT: je .LBB3_28			; AVX512-NEXT: je .LBB3_28
	; AVX512-NEXT: # %bb.27: # %cond.load37			; AVX512-NEXT: # %bb.27: # %cond.load37
	; AVX512-NEXT: vextracti32x4 $2, %zmm0, %xmm3
	; AVX512-NEXT: vpextrq $1, %xmm3, %rax			; AVX512-NEXT: vpextrq $1, %xmm3, %rax
	; AVX512-NEXT: vpinsrb $13, (%rax), %xmm2, %xmm2			; AVX512-NEXT: vpinsrb $13, (%rax), %xmm2, %xmm2
	; AVX512-NEXT: .LBB3_28: # %else38			; AVX512-NEXT: .LBB3_28: # %else38
	; AVX512-NEXT: vpxor %xmm3, %xmm3, %xmm3			; AVX512-NEXT: vpxor %xmm3, %xmm3, %xmm3
	; AVX512-NEXT: vpcmpeqb %xmm3, %xmm1, %xmm1			; AVX512-NEXT: vpcmpeqb %xmm3, %xmm1, %xmm1
	; AVX512-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512-NEXT: kshiftrw $14, %k0, %k1			; AVX512-NEXT: kshiftrw $14, %k0, %k1
	; AVX512-NEXT: kmovw %k1, %eax			; AVX512-NEXT: kmovw %k1, %eax
	; AVX512-NEXT: testb $1, %al			; AVX512-NEXT: testb $1, %al
				; AVX512-NEXT: vextracti32x4 $3, %zmm0, %xmm0
	; AVX512-NEXT: je .LBB3_30			; AVX512-NEXT: je .LBB3_30
	; AVX512-NEXT: # %bb.29: # %cond.load40			; AVX512-NEXT: # %bb.29: # %cond.load40
	; AVX512-NEXT: vextracti32x4 $3, %zmm0, %xmm1			; AVX512-NEXT: vmovq %xmm0, %rax
	; AVX512-NEXT: vmovq %xmm1, %rax
	; AVX512-NEXT: vpinsrb $14, (%rax), %xmm2, %xmm2			; AVX512-NEXT: vpinsrb $14, (%rax), %xmm2, %xmm2
	; AVX512-NEXT: .LBB3_30: # %else41			; AVX512-NEXT: .LBB3_30: # %else41
	; AVX512-NEXT: kshiftrw $15, %k0, %k0			; AVX512-NEXT: kshiftrw $15, %k0, %k0
	; AVX512-NEXT: kmovw %k0, %eax			; AVX512-NEXT: kmovw %k0, %eax
	; AVX512-NEXT: testb $1, %al			; AVX512-NEXT: testb $1, %al
	; AVX512-NEXT: je .LBB3_32			; AVX512-NEXT: je .LBB3_32
	; AVX512-NEXT: # %bb.31: # %cond.load43			; AVX512-NEXT: # %bb.31: # %cond.load43
	; AVX512-NEXT: vextracti32x4 $3, %zmm0, %xmm0
	; AVX512-NEXT: vpextrq $1, %xmm0, %rax			; AVX512-NEXT: vpextrq $1, %xmm0, %rax
	; AVX512-NEXT: vpinsrb $15, (%rax), %xmm2, %xmm2			; AVX512-NEXT: vpinsrb $15, (%rax), %xmm2, %xmm2
	; AVX512-NEXT: .LBB3_32: # %else44			; AVX512-NEXT: .LBB3_32: # %else44
	; AVX512-NEXT: vmovdqa %xmm2, %xmm0			; AVX512-NEXT: vmovdqa %xmm2, %xmm0
	; AVX512-NEXT: vzeroupper			; AVX512-NEXT: vzeroupper
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%vptr0 = insertelement <16 x i8> undef, i8 %base, i32 0			%vptr0 = insertelement <16 x i8> undef, i8 %base, i32 0
	%vptr1 = shufflevector <16 x i8> %vptr0, <16 x i8> undef, <16 x i32> zeroinitializer			%vptr1 = shufflevector <16 x i8> %vptr0, <16 x i8> undef, <16 x i32> zeroinitializer
	Show All 14 Lines

llvm/trunk/test/CodeGen/X86/masked_store.ll

Show First 20 Lines • Show All 2,145 Lines • ▼ Show 20 Lines
; AVX1-NEXT: LBB14_14: ## %else12		; AVX1-NEXT: LBB14_14: ## %else12
; AVX1-NEXT: vpcmpeqw %xmm2, %xmm0, %xmm2		; AVX1-NEXT: vpcmpeqw %xmm2, %xmm0, %xmm2
; AVX1-NEXT: vpextrb $14, %xmm2, %eax		; AVX1-NEXT: vpextrb $14, %xmm2, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB14_16		; AVX1-NEXT: je LBB14_16
; AVX1-NEXT: ## %bb.15: ## %cond.store13		; AVX1-NEXT: ## %bb.15: ## %cond.store13
; AVX1-NEXT: vpextrw $7, %xmm1, 14(%rdi)		; AVX1-NEXT: vpextrw $7, %xmm1, 14(%rdi)
; AVX1-NEXT: LBB14_16: ## %else14		; AVX1-NEXT: LBB14_16: ## %else14
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpxor %xmm0, %xmm0, %xmm0
; AVX1-NEXT: vpcmpeqw %xmm2, %xmm0, %xmm2		; AVX1-NEXT: vpcmpeqw %xmm0, %xmm2, %xmm3
; AVX1-NEXT: vpextrb $0, %xmm2, %eax		; AVX1-NEXT: vpextrb $0, %xmm3, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0
; AVX1-NEXT: je LBB14_18		; AVX1-NEXT: je LBB14_18
; AVX1-NEXT: ## %bb.17: ## %cond.store15		; AVX1-NEXT: ## %bb.17: ## %cond.store15
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3		; AVX1-NEXT: vpextrw $0, %xmm0, 16(%rdi)
; AVX1-NEXT: vpextrw $0, %xmm3, 16(%rdi)
; AVX1-NEXT: LBB14_18: ## %else16		; AVX1-NEXT: LBB14_18: ## %else16
; AVX1-NEXT: vpextrb $2, %xmm2, %eax		; AVX1-NEXT: vpextrb $2, %xmm3, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB14_20		; AVX1-NEXT: je LBB14_20
; AVX1-NEXT: ## %bb.19: ## %cond.store17		; AVX1-NEXT: ## %bb.19: ## %cond.store17
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX1-NEXT: vpextrw $1, %xmm0, 18(%rdi)
; AVX1-NEXT: vpextrw $1, %xmm2, 18(%rdi)
; AVX1-NEXT: LBB14_20: ## %else18		; AVX1-NEXT: LBB14_20: ## %else18
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
; AVX1-NEXT: vpcmpeqw %xmm2, %xmm0, %xmm2		; AVX1-NEXT: vpcmpeqw %xmm1, %xmm2, %xmm1
; AVX1-NEXT: vpextrb $4, %xmm2, %eax		; AVX1-NEXT: vpextrb $4, %xmm1, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB14_22		; AVX1-NEXT: je LBB14_22
; AVX1-NEXT: ## %bb.21: ## %cond.store19		; AVX1-NEXT: ## %bb.21: ## %cond.store19
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3		; AVX1-NEXT: vpextrw $2, %xmm0, 20(%rdi)
; AVX1-NEXT: vpextrw $2, %xmm3, 20(%rdi)
; AVX1-NEXT: LBB14_22: ## %else20		; AVX1-NEXT: LBB14_22: ## %else20
; AVX1-NEXT: vpextrb $6, %xmm2, %eax		; AVX1-NEXT: vpextrb $6, %xmm1, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB14_24		; AVX1-NEXT: je LBB14_24
; AVX1-NEXT: ## %bb.23: ## %cond.store21		; AVX1-NEXT: ## %bb.23: ## %cond.store21
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX1-NEXT: vpextrw $3, %xmm0, 22(%rdi)
; AVX1-NEXT: vpextrw $3, %xmm2, 22(%rdi)
; AVX1-NEXT: LBB14_24: ## %else22		; AVX1-NEXT: LBB14_24: ## %else22
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
; AVX1-NEXT: vpcmpeqw %xmm2, %xmm0, %xmm2		; AVX1-NEXT: vpcmpeqw %xmm1, %xmm2, %xmm1
; AVX1-NEXT: vpextrb $8, %xmm2, %eax		; AVX1-NEXT: vpextrb $8, %xmm1, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB14_26		; AVX1-NEXT: je LBB14_26
; AVX1-NEXT: ## %bb.25: ## %cond.store23		; AVX1-NEXT: ## %bb.25: ## %cond.store23
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3		; AVX1-NEXT: vpextrw $4, %xmm0, 24(%rdi)
; AVX1-NEXT: vpextrw $4, %xmm3, 24(%rdi)
; AVX1-NEXT: LBB14_26: ## %else24		; AVX1-NEXT: LBB14_26: ## %else24
; AVX1-NEXT: vpextrb $10, %xmm2, %eax		; AVX1-NEXT: vpextrb $10, %xmm1, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB14_28		; AVX1-NEXT: je LBB14_28
; AVX1-NEXT: ## %bb.27: ## %cond.store25		; AVX1-NEXT: ## %bb.27: ## %cond.store25
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX1-NEXT: vpextrw $5, %xmm0, 26(%rdi)
; AVX1-NEXT: vpextrw $5, %xmm2, 26(%rdi)
; AVX1-NEXT: LBB14_28: ## %else26		; AVX1-NEXT: LBB14_28: ## %else26
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
; AVX1-NEXT: vpcmpeqw %xmm2, %xmm0, %xmm0		; AVX1-NEXT: vpcmpeqw %xmm1, %xmm2, %xmm1
; AVX1-NEXT: vpextrb $12, %xmm0, %eax		; AVX1-NEXT: vpextrb $12, %xmm1, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB14_30		; AVX1-NEXT: je LBB14_30
; AVX1-NEXT: ## %bb.29: ## %cond.store27		; AVX1-NEXT: ## %bb.29: ## %cond.store27
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX1-NEXT: vpextrw $6, %xmm0, 28(%rdi)
; AVX1-NEXT: vpextrw $6, %xmm2, 28(%rdi)
; AVX1-NEXT: LBB14_30: ## %else28		; AVX1-NEXT: LBB14_30: ## %else28
; AVX1-NEXT: vpextrb $14, %xmm0, %eax		; AVX1-NEXT: vpextrb $14, %xmm1, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB14_32		; AVX1-NEXT: je LBB14_32
; AVX1-NEXT: ## %bb.31: ## %cond.store29		; AVX1-NEXT: ## %bb.31: ## %cond.store29
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0
; AVX1-NEXT: vpextrw $7, %xmm0, 30(%rdi)		; AVX1-NEXT: vpextrw $7, %xmm0, 30(%rdi)
; AVX1-NEXT: LBB14_32: ## %else30		; AVX1-NEXT: LBB14_32: ## %else30
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: store_v16i16_v16i16:		; AVX2-LABEL: store_v16i16_v16i16:
; AVX2: ## %bb.0:		; AVX2: ## %bb.0:
; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
; AVX2-NEXT: ## %bb.15: ## %cond.store13		; AVX2-NEXT: ## %bb.15: ## %cond.store13
; AVX2-NEXT: vpextrw $7, %xmm1, 14(%rdi)		; AVX2-NEXT: vpextrw $7, %xmm1, 14(%rdi)
; AVX2-NEXT: LBB14_16: ## %else14		; AVX2-NEXT: LBB14_16: ## %else14
; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX2-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm2		; AVX2-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm2
; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX2-NEXT: vpextrb $0, %xmm2, %eax		; AVX2-NEXT: vpextrb $0, %xmm2, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
		; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
; AVX2-NEXT: je LBB14_18		; AVX2-NEXT: je LBB14_18
; AVX2-NEXT: ## %bb.17: ## %cond.store15		; AVX2-NEXT: ## %bb.17: ## %cond.store15
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm3		; AVX2-NEXT: vpextrw $0, %xmm1, 16(%rdi)
; AVX2-NEXT: vpextrw $0, %xmm3, 16(%rdi)
; AVX2-NEXT: LBB14_18: ## %else16		; AVX2-NEXT: LBB14_18: ## %else16
; AVX2-NEXT: vpextrb $2, %xmm2, %eax		; AVX2-NEXT: vpextrb $2, %xmm2, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
; AVX2-NEXT: je LBB14_20		; AVX2-NEXT: je LBB14_20
; AVX2-NEXT: ## %bb.19: ## %cond.store17		; AVX2-NEXT: ## %bb.19: ## %cond.store17
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX2-NEXT: vpextrw $1, %xmm1, 18(%rdi)
; AVX2-NEXT: vpextrw $1, %xmm2, 18(%rdi)
; AVX2-NEXT: LBB14_20: ## %else18		; AVX2-NEXT: LBB14_20: ## %else18
; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX2-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm2		; AVX2-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm2
; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX2-NEXT: vpextrb $4, %xmm2, %eax		; AVX2-NEXT: vpextrb $4, %xmm2, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
; AVX2-NEXT: je LBB14_22		; AVX2-NEXT: je LBB14_22
; AVX2-NEXT: ## %bb.21: ## %cond.store19		; AVX2-NEXT: ## %bb.21: ## %cond.store19
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm3		; AVX2-NEXT: vpextrw $2, %xmm1, 20(%rdi)
; AVX2-NEXT: vpextrw $2, %xmm3, 20(%rdi)
; AVX2-NEXT: LBB14_22: ## %else20		; AVX2-NEXT: LBB14_22: ## %else20
; AVX2-NEXT: vpextrb $6, %xmm2, %eax		; AVX2-NEXT: vpextrb $6, %xmm2, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
; AVX2-NEXT: je LBB14_24		; AVX2-NEXT: je LBB14_24
; AVX2-NEXT: ## %bb.23: ## %cond.store21		; AVX2-NEXT: ## %bb.23: ## %cond.store21
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX2-NEXT: vpextrw $3, %xmm1, 22(%rdi)
; AVX2-NEXT: vpextrw $3, %xmm2, 22(%rdi)
; AVX2-NEXT: LBB14_24: ## %else22		; AVX2-NEXT: LBB14_24: ## %else22
; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX2-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm2		; AVX2-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm2
; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX2-NEXT: vpextrb $8, %xmm2, %eax		; AVX2-NEXT: vpextrb $8, %xmm2, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
; AVX2-NEXT: je LBB14_26		; AVX2-NEXT: je LBB14_26
; AVX2-NEXT: ## %bb.25: ## %cond.store23		; AVX2-NEXT: ## %bb.25: ## %cond.store23
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm3		; AVX2-NEXT: vpextrw $4, %xmm1, 24(%rdi)
; AVX2-NEXT: vpextrw $4, %xmm3, 24(%rdi)
; AVX2-NEXT: LBB14_26: ## %else24		; AVX2-NEXT: LBB14_26: ## %else24
; AVX2-NEXT: vpextrb $10, %xmm2, %eax		; AVX2-NEXT: vpextrb $10, %xmm2, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
; AVX2-NEXT: je LBB14_28		; AVX2-NEXT: je LBB14_28
; AVX2-NEXT: ## %bb.27: ## %cond.store25		; AVX2-NEXT: ## %bb.27: ## %cond.store25
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX2-NEXT: vpextrw $5, %xmm1, 26(%rdi)
; AVX2-NEXT: vpextrw $5, %xmm2, 26(%rdi)
; AVX2-NEXT: LBB14_28: ## %else26		; AVX2-NEXT: LBB14_28: ## %else26
; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX2-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm0		; AVX2-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm0
; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0		; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
; AVX2-NEXT: vpextrb $12, %xmm0, %eax		; AVX2-NEXT: vpextrb $12, %xmm0, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
; AVX2-NEXT: je LBB14_30		; AVX2-NEXT: je LBB14_30
; AVX2-NEXT: ## %bb.29: ## %cond.store27		; AVX2-NEXT: ## %bb.29: ## %cond.store27
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX2-NEXT: vpextrw $6, %xmm1, 28(%rdi)
; AVX2-NEXT: vpextrw $6, %xmm2, 28(%rdi)
; AVX2-NEXT: LBB14_30: ## %else28		; AVX2-NEXT: LBB14_30: ## %else28
; AVX2-NEXT: vpextrb $14, %xmm0, %eax		; AVX2-NEXT: vpextrb $14, %xmm0, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
; AVX2-NEXT: je LBB14_32		; AVX2-NEXT: je LBB14_32
; AVX2-NEXT: ## %bb.31: ## %cond.store29		; AVX2-NEXT: ## %bb.31: ## %cond.store29
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm0		; AVX2-NEXT: vpextrw $7, %xmm1, 30(%rdi)
; AVX2-NEXT: vpextrw $7, %xmm0, 30(%rdi)
; AVX2-NEXT: LBB14_32: ## %else30		; AVX2-NEXT: LBB14_32: ## %else30
; AVX2-NEXT: vzeroupper		; AVX2-NEXT: vzeroupper
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; AVX512F-LABEL: store_v16i16_v16i16:		; AVX512F-LABEL: store_v16i16_v16i16:
; AVX512F: ## %bb.0:		; AVX512F: ## %bb.0:
; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512F-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm2		; AVX512F-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm2
▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
; AVX512F-NEXT: LBB14_16: ## %else14		; AVX512F-NEXT: LBB14_16: ## %else14
; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512F-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm2		; AVX512F-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm2
; AVX512F-NEXT: vpmovsxwd %ymm2, %zmm2		; AVX512F-NEXT: vpmovsxwd %ymm2, %zmm2
; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0		; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0
; AVX512F-NEXT: kshiftrw $8, %k0, %k1		; AVX512F-NEXT: kshiftrw $8, %k0, %k1
; AVX512F-NEXT: kmovw %k1, %eax		; AVX512F-NEXT: kmovw %k1, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
		; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
; AVX512F-NEXT: je LBB14_18		; AVX512F-NEXT: je LBB14_18
; AVX512F-NEXT: ## %bb.17: ## %cond.store15		; AVX512F-NEXT: ## %bb.17: ## %cond.store15
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512F-NEXT: vpextrw $0, %xmm1, 16(%rdi)
; AVX512F-NEXT: vpextrw $0, %xmm2, 16(%rdi)
; AVX512F-NEXT: LBB14_18: ## %else16		; AVX512F-NEXT: LBB14_18: ## %else16
; AVX512F-NEXT: kshiftrw $9, %k0, %k0		; AVX512F-NEXT: kshiftrw $9, %k0, %k0
; AVX512F-NEXT: kmovw %k0, %eax		; AVX512F-NEXT: kmovw %k0, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
; AVX512F-NEXT: je LBB14_20		; AVX512F-NEXT: je LBB14_20
; AVX512F-NEXT: ## %bb.19: ## %cond.store17		; AVX512F-NEXT: ## %bb.19: ## %cond.store17
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512F-NEXT: vpextrw $1, %xmm1, 18(%rdi)
; AVX512F-NEXT: vpextrw $1, %xmm2, 18(%rdi)
; AVX512F-NEXT: LBB14_20: ## %else18		; AVX512F-NEXT: LBB14_20: ## %else18
; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512F-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm2		; AVX512F-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm2
; AVX512F-NEXT: vpmovsxwd %ymm2, %zmm2		; AVX512F-NEXT: vpmovsxwd %ymm2, %zmm2
; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0		; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0
; AVX512F-NEXT: kshiftrw $10, %k0, %k1		; AVX512F-NEXT: kshiftrw $10, %k0, %k1
; AVX512F-NEXT: kmovw %k1, %eax		; AVX512F-NEXT: kmovw %k1, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
; AVX512F-NEXT: je LBB14_22		; AVX512F-NEXT: je LBB14_22
; AVX512F-NEXT: ## %bb.21: ## %cond.store19		; AVX512F-NEXT: ## %bb.21: ## %cond.store19
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512F-NEXT: vpextrw $2, %xmm1, 20(%rdi)
; AVX512F-NEXT: vpextrw $2, %xmm2, 20(%rdi)
; AVX512F-NEXT: LBB14_22: ## %else20		; AVX512F-NEXT: LBB14_22: ## %else20
; AVX512F-NEXT: kshiftrw $11, %k0, %k0		; AVX512F-NEXT: kshiftrw $11, %k0, %k0
; AVX512F-NEXT: kmovw %k0, %eax		; AVX512F-NEXT: kmovw %k0, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
; AVX512F-NEXT: je LBB14_24		; AVX512F-NEXT: je LBB14_24
; AVX512F-NEXT: ## %bb.23: ## %cond.store21		; AVX512F-NEXT: ## %bb.23: ## %cond.store21
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512F-NEXT: vpextrw $3, %xmm1, 22(%rdi)
; AVX512F-NEXT: vpextrw $3, %xmm2, 22(%rdi)
; AVX512F-NEXT: LBB14_24: ## %else22		; AVX512F-NEXT: LBB14_24: ## %else22
; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512F-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm2		; AVX512F-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm2
; AVX512F-NEXT: vpmovsxwd %ymm2, %zmm2		; AVX512F-NEXT: vpmovsxwd %ymm2, %zmm2
; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0		; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0
; AVX512F-NEXT: kshiftrw $12, %k0, %k1		; AVX512F-NEXT: kshiftrw $12, %k0, %k1
; AVX512F-NEXT: kmovw %k1, %eax		; AVX512F-NEXT: kmovw %k1, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
; AVX512F-NEXT: je LBB14_26		; AVX512F-NEXT: je LBB14_26
; AVX512F-NEXT: ## %bb.25: ## %cond.store23		; AVX512F-NEXT: ## %bb.25: ## %cond.store23
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512F-NEXT: vpextrw $4, %xmm1, 24(%rdi)
; AVX512F-NEXT: vpextrw $4, %xmm2, 24(%rdi)
; AVX512F-NEXT: LBB14_26: ## %else24		; AVX512F-NEXT: LBB14_26: ## %else24
; AVX512F-NEXT: kshiftrw $13, %k0, %k0		; AVX512F-NEXT: kshiftrw $13, %k0, %k0
; AVX512F-NEXT: kmovw %k0, %eax		; AVX512F-NEXT: kmovw %k0, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
; AVX512F-NEXT: je LBB14_28		; AVX512F-NEXT: je LBB14_28
; AVX512F-NEXT: ## %bb.27: ## %cond.store25		; AVX512F-NEXT: ## %bb.27: ## %cond.store25
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512F-NEXT: vpextrw $5, %xmm1, 26(%rdi)
; AVX512F-NEXT: vpextrw $5, %xmm2, 26(%rdi)
; AVX512F-NEXT: LBB14_28: ## %else26		; AVX512F-NEXT: LBB14_28: ## %else26
; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512F-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm0		; AVX512F-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm0
; AVX512F-NEXT: vpmovsxwd %ymm0, %zmm0		; AVX512F-NEXT: vpmovsxwd %ymm0, %zmm0
; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k0		; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k0
; AVX512F-NEXT: kshiftrw $14, %k0, %k1		; AVX512F-NEXT: kshiftrw $14, %k0, %k1
; AVX512F-NEXT: kmovw %k1, %eax		; AVX512F-NEXT: kmovw %k1, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
; AVX512F-NEXT: je LBB14_30		; AVX512F-NEXT: je LBB14_30
; AVX512F-NEXT: ## %bb.29: ## %cond.store27		; AVX512F-NEXT: ## %bb.29: ## %cond.store27
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm0		; AVX512F-NEXT: vpextrw $6, %xmm1, 28(%rdi)
; AVX512F-NEXT: vpextrw $6, %xmm0, 28(%rdi)
; AVX512F-NEXT: LBB14_30: ## %else28		; AVX512F-NEXT: LBB14_30: ## %else28
; AVX512F-NEXT: kshiftrw $15, %k0, %k0		; AVX512F-NEXT: kshiftrw $15, %k0, %k0
; AVX512F-NEXT: kmovw %k0, %eax		; AVX512F-NEXT: kmovw %k0, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
; AVX512F-NEXT: je LBB14_32		; AVX512F-NEXT: je LBB14_32
; AVX512F-NEXT: ## %bb.31: ## %cond.store29		; AVX512F-NEXT: ## %bb.31: ## %cond.store29
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm0		; AVX512F-NEXT: vpextrw $7, %xmm1, 30(%rdi)
; AVX512F-NEXT: vpextrw $7, %xmm0, 30(%rdi)
; AVX512F-NEXT: LBB14_32: ## %else30		; AVX512F-NEXT: LBB14_32: ## %else30
; AVX512F-NEXT: vzeroupper		; AVX512F-NEXT: vzeroupper
; AVX512F-NEXT: retq		; AVX512F-NEXT: retq
;		;
; AVX512VLDQ-LABEL: store_v16i16_v16i16:		; AVX512VLDQ-LABEL: store_v16i16_v16i16:
; AVX512VLDQ: ## %bb.0:		; AVX512VLDQ: ## %bb.0:
; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512VLDQ-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm2		; AVX512VLDQ-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm2
▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
; AVX512VLDQ-NEXT: LBB14_16: ## %else14		; AVX512VLDQ-NEXT: LBB14_16: ## %else14
; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512VLDQ-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm2		; AVX512VLDQ-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm2
; AVX512VLDQ-NEXT: vpmovsxwd %ymm2, %zmm2		; AVX512VLDQ-NEXT: vpmovsxwd %ymm2, %zmm2
; AVX512VLDQ-NEXT: vpmovd2m %zmm2, %k0		; AVX512VLDQ-NEXT: vpmovd2m %zmm2, %k0
; AVX512VLDQ-NEXT: kshiftrw $8, %k0, %k1		; AVX512VLDQ-NEXT: kshiftrw $8, %k0, %k1
; AVX512VLDQ-NEXT: kmovw %k1, %eax		; AVX512VLDQ-NEXT: kmovw %k1, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
		; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm1
; AVX512VLDQ-NEXT: je LBB14_18		; AVX512VLDQ-NEXT: je LBB14_18
; AVX512VLDQ-NEXT: ## %bb.17: ## %cond.store15		; AVX512VLDQ-NEXT: ## %bb.17: ## %cond.store15
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512VLDQ-NEXT: vpextrw $0, %xmm1, 16(%rdi)
; AVX512VLDQ-NEXT: vpextrw $0, %xmm2, 16(%rdi)
; AVX512VLDQ-NEXT: LBB14_18: ## %else16		; AVX512VLDQ-NEXT: LBB14_18: ## %else16
; AVX512VLDQ-NEXT: kshiftrw $9, %k0, %k0		; AVX512VLDQ-NEXT: kshiftrw $9, %k0, %k0
; AVX512VLDQ-NEXT: kmovw %k0, %eax		; AVX512VLDQ-NEXT: kmovw %k0, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
; AVX512VLDQ-NEXT: je LBB14_20		; AVX512VLDQ-NEXT: je LBB14_20
; AVX512VLDQ-NEXT: ## %bb.19: ## %cond.store17		; AVX512VLDQ-NEXT: ## %bb.19: ## %cond.store17
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512VLDQ-NEXT: vpextrw $1, %xmm1, 18(%rdi)
; AVX512VLDQ-NEXT: vpextrw $1, %xmm2, 18(%rdi)
; AVX512VLDQ-NEXT: LBB14_20: ## %else18		; AVX512VLDQ-NEXT: LBB14_20: ## %else18
; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512VLDQ-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm2		; AVX512VLDQ-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm2
; AVX512VLDQ-NEXT: vpmovsxwd %ymm2, %zmm2		; AVX512VLDQ-NEXT: vpmovsxwd %ymm2, %zmm2
; AVX512VLDQ-NEXT: vpmovd2m %zmm2, %k0		; AVX512VLDQ-NEXT: vpmovd2m %zmm2, %k0
; AVX512VLDQ-NEXT: kshiftrw $10, %k0, %k1		; AVX512VLDQ-NEXT: kshiftrw $10, %k0, %k1
; AVX512VLDQ-NEXT: kmovw %k1, %eax		; AVX512VLDQ-NEXT: kmovw %k1, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
; AVX512VLDQ-NEXT: je LBB14_22		; AVX512VLDQ-NEXT: je LBB14_22
; AVX512VLDQ-NEXT: ## %bb.21: ## %cond.store19		; AVX512VLDQ-NEXT: ## %bb.21: ## %cond.store19
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512VLDQ-NEXT: vpextrw $2, %xmm1, 20(%rdi)
; AVX512VLDQ-NEXT: vpextrw $2, %xmm2, 20(%rdi)
; AVX512VLDQ-NEXT: LBB14_22: ## %else20		; AVX512VLDQ-NEXT: LBB14_22: ## %else20
; AVX512VLDQ-NEXT: kshiftrw $11, %k0, %k0		; AVX512VLDQ-NEXT: kshiftrw $11, %k0, %k0
; AVX512VLDQ-NEXT: kmovw %k0, %eax		; AVX512VLDQ-NEXT: kmovw %k0, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
; AVX512VLDQ-NEXT: je LBB14_24		; AVX512VLDQ-NEXT: je LBB14_24
; AVX512VLDQ-NEXT: ## %bb.23: ## %cond.store21		; AVX512VLDQ-NEXT: ## %bb.23: ## %cond.store21
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512VLDQ-NEXT: vpextrw $3, %xmm1, 22(%rdi)
; AVX512VLDQ-NEXT: vpextrw $3, %xmm2, 22(%rdi)
; AVX512VLDQ-NEXT: LBB14_24: ## %else22		; AVX512VLDQ-NEXT: LBB14_24: ## %else22
; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512VLDQ-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm2		; AVX512VLDQ-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm2
; AVX512VLDQ-NEXT: vpmovsxwd %ymm2, %zmm2		; AVX512VLDQ-NEXT: vpmovsxwd %ymm2, %zmm2
; AVX512VLDQ-NEXT: vpmovd2m %zmm2, %k0		; AVX512VLDQ-NEXT: vpmovd2m %zmm2, %k0
; AVX512VLDQ-NEXT: kshiftrw $12, %k0, %k1		; AVX512VLDQ-NEXT: kshiftrw $12, %k0, %k1
; AVX512VLDQ-NEXT: kmovw %k1, %eax		; AVX512VLDQ-NEXT: kmovw %k1, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
; AVX512VLDQ-NEXT: je LBB14_26		; AVX512VLDQ-NEXT: je LBB14_26
; AVX512VLDQ-NEXT: ## %bb.25: ## %cond.store23		; AVX512VLDQ-NEXT: ## %bb.25: ## %cond.store23
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512VLDQ-NEXT: vpextrw $4, %xmm1, 24(%rdi)
; AVX512VLDQ-NEXT: vpextrw $4, %xmm2, 24(%rdi)
; AVX512VLDQ-NEXT: LBB14_26: ## %else24		; AVX512VLDQ-NEXT: LBB14_26: ## %else24
; AVX512VLDQ-NEXT: kshiftrw $13, %k0, %k0		; AVX512VLDQ-NEXT: kshiftrw $13, %k0, %k0
; AVX512VLDQ-NEXT: kmovw %k0, %eax		; AVX512VLDQ-NEXT: kmovw %k0, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
; AVX512VLDQ-NEXT: je LBB14_28		; AVX512VLDQ-NEXT: je LBB14_28
; AVX512VLDQ-NEXT: ## %bb.27: ## %cond.store25		; AVX512VLDQ-NEXT: ## %bb.27: ## %cond.store25
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512VLDQ-NEXT: vpextrw $5, %xmm1, 26(%rdi)
; AVX512VLDQ-NEXT: vpextrw $5, %xmm2, 26(%rdi)
; AVX512VLDQ-NEXT: LBB14_28: ## %else26		; AVX512VLDQ-NEXT: LBB14_28: ## %else26
; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512VLDQ-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm0		; AVX512VLDQ-NEXT: vpcmpeqw %ymm2, %ymm0, %ymm0
; AVX512VLDQ-NEXT: vpmovsxwd %ymm0, %zmm0		; AVX512VLDQ-NEXT: vpmovsxwd %ymm0, %zmm0
; AVX512VLDQ-NEXT: vpmovd2m %zmm0, %k0		; AVX512VLDQ-NEXT: vpmovd2m %zmm0, %k0
; AVX512VLDQ-NEXT: kshiftrw $14, %k0, %k1		; AVX512VLDQ-NEXT: kshiftrw $14, %k0, %k1
; AVX512VLDQ-NEXT: kmovw %k1, %eax		; AVX512VLDQ-NEXT: kmovw %k1, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
; AVX512VLDQ-NEXT: je LBB14_30		; AVX512VLDQ-NEXT: je LBB14_30
; AVX512VLDQ-NEXT: ## %bb.29: ## %cond.store27		; AVX512VLDQ-NEXT: ## %bb.29: ## %cond.store27
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm0		; AVX512VLDQ-NEXT: vpextrw $6, %xmm1, 28(%rdi)
; AVX512VLDQ-NEXT: vpextrw $6, %xmm0, 28(%rdi)
; AVX512VLDQ-NEXT: LBB14_30: ## %else28		; AVX512VLDQ-NEXT: LBB14_30: ## %else28
; AVX512VLDQ-NEXT: kshiftrw $15, %k0, %k0		; AVX512VLDQ-NEXT: kshiftrw $15, %k0, %k0
; AVX512VLDQ-NEXT: kmovw %k0, %eax		; AVX512VLDQ-NEXT: kmovw %k0, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
; AVX512VLDQ-NEXT: je LBB14_32		; AVX512VLDQ-NEXT: je LBB14_32
; AVX512VLDQ-NEXT: ## %bb.31: ## %cond.store29		; AVX512VLDQ-NEXT: ## %bb.31: ## %cond.store29
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm0		; AVX512VLDQ-NEXT: vpextrw $7, %xmm1, 30(%rdi)
; AVX512VLDQ-NEXT: vpextrw $7, %xmm0, 30(%rdi)
; AVX512VLDQ-NEXT: LBB14_32: ## %else30		; AVX512VLDQ-NEXT: LBB14_32: ## %else30
; AVX512VLDQ-NEXT: vzeroupper		; AVX512VLDQ-NEXT: vzeroupper
; AVX512VLDQ-NEXT: retq		; AVX512VLDQ-NEXT: retq
;		;
; AVX512VLBW-LABEL: store_v16i16_v16i16:		; AVX512VLBW-LABEL: store_v16i16_v16i16:
; AVX512VLBW: ## %bb.0:		; AVX512VLBW: ## %bb.0:
; AVX512VLBW-NEXT: vptestnmw %ymm0, %ymm0, %k1		; AVX512VLBW-NEXT: vptestnmw %ymm0, %ymm0, %k1
; AVX512VLBW-NEXT: vmovdqu16 %ymm1, (%rdi) {%k1}		; AVX512VLBW-NEXT: vmovdqu16 %ymm1, (%rdi) {%k1}
; AVX512VLBW-NEXT: vzeroupper		; AVX512VLBW-NEXT: vzeroupper
; AVX512VLBW-NEXT: retq		; AVX512VLBW-NEXT: retq
%mask = icmp eq <16 x i16> %trigger, zeroinitializer		%mask = icmp eq <16 x i16> %trigger, zeroinitializer
call void @llvm.masked.store.v16i16.p0v16i16(<16 x i16> %val, <16 x i16>* %addr, i32 4, <16 x i1> %mask)		call void @llvm.masked.store.v16i16.p0v16i16(<16 x i16> %val, <16 x i16>* %addr, i32 4, <16 x i1> %mask)
ret void		ret void
}		}

;		;
; vXi8		; vXi8
;		;

define void @store_v16i8_v16i8(<16 x i8> %trigger, <16 x i8>* %addr, <16 x i8> %val) {		define void @store_v16i8_v16i8(<16 x i8> %trigger, <16 x i8>* %addr, <16 x i8> %val) {
; SSE2-LABEL: store_v16i8_v16i8:		; SSE2-LABEL: store_v16i8_v16i8:
; SSE2: ## %bb.0:		; SSE2: ## %bb.0:
; SSE2-NEXT: pxor %xmm2, %xmm2		; SSE2-NEXT: pxor %xmm2, %xmm2
; SSE2-NEXT: pcmpeqb %xmm0, %xmm2		; SSE2-NEXT: pcmpeqb %xmm0, %xmm2
; SSE2-NEXT: movd %xmm2, %eax		; SSE2-NEXT: movd %xmm2, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
		; SSE2-NEXT: movd %xmm1, %eax
; SSE2-NEXT: je LBB15_2		; SSE2-NEXT: je LBB15_2
; SSE2-NEXT: ## %bb.1: ## %cond.store		; SSE2-NEXT: ## %bb.1: ## %cond.store
; SSE2-NEXT: movd %xmm1, %ecx		; SSE2-NEXT: movb %al, (%rdi)
; SSE2-NEXT: movb %cl, (%rdi)
; SSE2-NEXT: LBB15_2: ## %else		; SSE2-NEXT: LBB15_2: ## %else
; SSE2-NEXT: shrl $8, %eax		; SSE2-NEXT: shrl $8, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB15_4		; SSE2-NEXT: je LBB15_4
; SSE2-NEXT: ## %bb.3: ## %cond.store1		; SSE2-NEXT: ## %bb.3: ## %cond.store1
; SSE2-NEXT: movd %xmm1, %eax
; SSE2-NEXT: movb %ah, 1(%rdi)		; SSE2-NEXT: movb %ah, 1(%rdi)
; SSE2-NEXT: LBB15_4: ## %else2		; SSE2-NEXT: LBB15_4: ## %else2
; SSE2-NEXT: pxor %xmm2, %xmm2		; SSE2-NEXT: pxor %xmm2, %xmm2
; SSE2-NEXT: pcmpeqb %xmm0, %xmm2		; SSE2-NEXT: pcmpeqb %xmm0, %xmm2
; SSE2-NEXT: movd %xmm2, %eax		; SSE2-NEXT: movd %xmm2, %ecx
; SSE2-NEXT: movl %eax, %ecx		; SSE2-NEXT: movl %ecx, %edx
; SSE2-NEXT: shrl $16, %ecx		; SSE2-NEXT: shrl $16, %edx
; SSE2-NEXT: testb $1, %cl		; SSE2-NEXT: testb $1, %dl
; SSE2-NEXT: je LBB15_6		; SSE2-NEXT: je LBB15_6
; SSE2-NEXT: ## %bb.5: ## %cond.store3		; SSE2-NEXT: ## %bb.5: ## %cond.store3
; SSE2-NEXT: movd %xmm1, %ecx		; SSE2-NEXT: movl %eax, %edx
; SSE2-NEXT: shrl $16, %ecx		; SSE2-NEXT: shrl $16, %edx
; SSE2-NEXT: movb %cl, 2(%rdi)		; SSE2-NEXT: movb %dl, 2(%rdi)
; SSE2-NEXT: LBB15_6: ## %else4		; SSE2-NEXT: LBB15_6: ## %else4
; SSE2-NEXT: shrl $24, %eax		; SSE2-NEXT: shrl $24, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB15_8		; SSE2-NEXT: je LBB15_8
; SSE2-NEXT: ## %bb.7: ## %cond.store5		; SSE2-NEXT: ## %bb.7: ## %cond.store5
; SSE2-NEXT: movd %xmm1, %eax
; SSE2-NEXT: shrl $24, %eax		; SSE2-NEXT: shrl $24, %eax
; SSE2-NEXT: movb %al, 3(%rdi)		; SSE2-NEXT: movb %al, 3(%rdi)
; SSE2-NEXT: LBB15_8: ## %else6		; SSE2-NEXT: LBB15_8: ## %else6
; SSE2-NEXT: pxor %xmm2, %xmm2		; SSE2-NEXT: pxor %xmm2, %xmm2
; SSE2-NEXT: pcmpeqb %xmm0, %xmm2		; SSE2-NEXT: pcmpeqb %xmm0, %xmm2
; SSE2-NEXT: pextrw $2, %xmm2, %eax		; SSE2-NEXT: pextrw $2, %xmm2, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
		; SSE2-NEXT: pextrw $2, %xmm1, %eax
; SSE2-NEXT: je LBB15_10		; SSE2-NEXT: je LBB15_10
; SSE2-NEXT: ## %bb.9: ## %cond.store7		; SSE2-NEXT: ## %bb.9: ## %cond.store7
; SSE2-NEXT: pextrw $2, %xmm1, %ecx		; SSE2-NEXT: movb %al, 4(%rdi)
; SSE2-NEXT: movb %cl, 4(%rdi)
; SSE2-NEXT: LBB15_10: ## %else8		; SSE2-NEXT: LBB15_10: ## %else8
; SSE2-NEXT: shrl $8, %eax		; SSE2-NEXT: shrl $8, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB15_12		; SSE2-NEXT: je LBB15_12
; SSE2-NEXT: ## %bb.11: ## %cond.store9		; SSE2-NEXT: ## %bb.11: ## %cond.store9
; SSE2-NEXT: pextrw $2, %xmm1, %eax
; SSE2-NEXT: movb %ah, 5(%rdi)		; SSE2-NEXT: movb %ah, 5(%rdi)
; SSE2-NEXT: LBB15_12: ## %else10		; SSE2-NEXT: LBB15_12: ## %else10
; SSE2-NEXT: pxor %xmm2, %xmm2		; SSE2-NEXT: pxor %xmm2, %xmm2
; SSE2-NEXT: pcmpeqb %xmm0, %xmm2		; SSE2-NEXT: pcmpeqb %xmm0, %xmm2
; SSE2-NEXT: pextrw $3, %xmm2, %eax		; SSE2-NEXT: pextrw $3, %xmm2, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
		; SSE2-NEXT: pextrw $3, %xmm1, %eax
; SSE2-NEXT: je LBB15_14		; SSE2-NEXT: je LBB15_14
; SSE2-NEXT: ## %bb.13: ## %cond.store11		; SSE2-NEXT: ## %bb.13: ## %cond.store11
; SSE2-NEXT: pextrw $3, %xmm1, %ecx		; SSE2-NEXT: movb %al, 6(%rdi)
; SSE2-NEXT: movb %cl, 6(%rdi)
; SSE2-NEXT: LBB15_14: ## %else12		; SSE2-NEXT: LBB15_14: ## %else12
; SSE2-NEXT: shrl $8, %eax		; SSE2-NEXT: shrl $8, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB15_16		; SSE2-NEXT: je LBB15_16
; SSE2-NEXT: ## %bb.15: ## %cond.store13		; SSE2-NEXT: ## %bb.15: ## %cond.store13
; SSE2-NEXT: pextrw $3, %xmm1, %eax
; SSE2-NEXT: movb %ah, 7(%rdi)		; SSE2-NEXT: movb %ah, 7(%rdi)
; SSE2-NEXT: LBB15_16: ## %else14		; SSE2-NEXT: LBB15_16: ## %else14
; SSE2-NEXT: pxor %xmm2, %xmm2		; SSE2-NEXT: pxor %xmm2, %xmm2
; SSE2-NEXT: pcmpeqb %xmm0, %xmm2		; SSE2-NEXT: pcmpeqb %xmm0, %xmm2
; SSE2-NEXT: pextrw $4, %xmm2, %eax		; SSE2-NEXT: pextrw $4, %xmm2, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
		; SSE2-NEXT: pextrw $4, %xmm1, %eax
; SSE2-NEXT: je LBB15_18		; SSE2-NEXT: je LBB15_18
; SSE2-NEXT: ## %bb.17: ## %cond.store15		; SSE2-NEXT: ## %bb.17: ## %cond.store15
; SSE2-NEXT: pextrw $4, %xmm1, %ecx		; SSE2-NEXT: movb %al, 8(%rdi)
; SSE2-NEXT: movb %cl, 8(%rdi)
; SSE2-NEXT: LBB15_18: ## %else16		; SSE2-NEXT: LBB15_18: ## %else16
; SSE2-NEXT: shrl $8, %eax		; SSE2-NEXT: shrl $8, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB15_20		; SSE2-NEXT: je LBB15_20
; SSE2-NEXT: ## %bb.19: ## %cond.store17		; SSE2-NEXT: ## %bb.19: ## %cond.store17
; SSE2-NEXT: pextrw $4, %xmm1, %eax
; SSE2-NEXT: movb %ah, 9(%rdi)		; SSE2-NEXT: movb %ah, 9(%rdi)
; SSE2-NEXT: LBB15_20: ## %else18		; SSE2-NEXT: LBB15_20: ## %else18
; SSE2-NEXT: pxor %xmm2, %xmm2		; SSE2-NEXT: pxor %xmm2, %xmm2
; SSE2-NEXT: pcmpeqb %xmm0, %xmm2		; SSE2-NEXT: pcmpeqb %xmm0, %xmm2
; SSE2-NEXT: pextrw $5, %xmm2, %eax		; SSE2-NEXT: pextrw $5, %xmm2, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
		; SSE2-NEXT: pextrw $5, %xmm1, %eax
; SSE2-NEXT: je LBB15_22		; SSE2-NEXT: je LBB15_22
; SSE2-NEXT: ## %bb.21: ## %cond.store19		; SSE2-NEXT: ## %bb.21: ## %cond.store19
; SSE2-NEXT: pextrw $5, %xmm1, %ecx		; SSE2-NEXT: movb %al, 10(%rdi)
; SSE2-NEXT: movb %cl, 10(%rdi)
; SSE2-NEXT: LBB15_22: ## %else20		; SSE2-NEXT: LBB15_22: ## %else20
; SSE2-NEXT: shrl $8, %eax		; SSE2-NEXT: shrl $8, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB15_24		; SSE2-NEXT: je LBB15_24
; SSE2-NEXT: ## %bb.23: ## %cond.store21		; SSE2-NEXT: ## %bb.23: ## %cond.store21
; SSE2-NEXT: pextrw $5, %xmm1, %eax
; SSE2-NEXT: movb %ah, 11(%rdi)		; SSE2-NEXT: movb %ah, 11(%rdi)
; SSE2-NEXT: LBB15_24: ## %else22		; SSE2-NEXT: LBB15_24: ## %else22
; SSE2-NEXT: pxor %xmm2, %xmm2		; SSE2-NEXT: pxor %xmm2, %xmm2
; SSE2-NEXT: pcmpeqb %xmm0, %xmm2		; SSE2-NEXT: pcmpeqb %xmm0, %xmm2
; SSE2-NEXT: pextrw $6, %xmm2, %eax		; SSE2-NEXT: pextrw $6, %xmm2, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
		; SSE2-NEXT: pextrw $6, %xmm1, %eax
; SSE2-NEXT: je LBB15_26		; SSE2-NEXT: je LBB15_26
; SSE2-NEXT: ## %bb.25: ## %cond.store23		; SSE2-NEXT: ## %bb.25: ## %cond.store23
; SSE2-NEXT: pextrw $6, %xmm1, %ecx		; SSE2-NEXT: movb %al, 12(%rdi)
; SSE2-NEXT: movb %cl, 12(%rdi)
; SSE2-NEXT: LBB15_26: ## %else24		; SSE2-NEXT: LBB15_26: ## %else24
; SSE2-NEXT: shrl $8, %eax		; SSE2-NEXT: shrl $8, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB15_28		; SSE2-NEXT: je LBB15_28
; SSE2-NEXT: ## %bb.27: ## %cond.store25		; SSE2-NEXT: ## %bb.27: ## %cond.store25
; SSE2-NEXT: pextrw $6, %xmm1, %eax
; SSE2-NEXT: movb %ah, 13(%rdi)		; SSE2-NEXT: movb %ah, 13(%rdi)
; SSE2-NEXT: LBB15_28: ## %else26		; SSE2-NEXT: LBB15_28: ## %else26
; SSE2-NEXT: pxor %xmm2, %xmm2		; SSE2-NEXT: pxor %xmm2, %xmm2
; SSE2-NEXT: pcmpeqb %xmm2, %xmm0		; SSE2-NEXT: pcmpeqb %xmm2, %xmm0
; SSE2-NEXT: pextrw $7, %xmm0, %eax		; SSE2-NEXT: pextrw $7, %xmm0, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
		; SSE2-NEXT: pextrw $7, %xmm1, %eax
; SSE2-NEXT: je LBB15_30		; SSE2-NEXT: je LBB15_30
; SSE2-NEXT: ## %bb.29: ## %cond.store27		; SSE2-NEXT: ## %bb.29: ## %cond.store27
; SSE2-NEXT: pextrw $7, %xmm1, %ecx		; SSE2-NEXT: movb %al, 14(%rdi)
; SSE2-NEXT: movb %cl, 14(%rdi)
; SSE2-NEXT: LBB15_30: ## %else28		; SSE2-NEXT: LBB15_30: ## %else28
; SSE2-NEXT: shrl $8, %eax		; SSE2-NEXT: shrl $8, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB15_32		; SSE2-NEXT: je LBB15_32
; SSE2-NEXT: ## %bb.31: ## %cond.store29		; SSE2-NEXT: ## %bb.31: ## %cond.store29
; SSE2-NEXT: pextrw $7, %xmm1, %eax
; SSE2-NEXT: movb %ah, 15(%rdi)		; SSE2-NEXT: movb %ah, 15(%rdi)
; SSE2-NEXT: LBB15_32: ## %else30		; SSE2-NEXT: LBB15_32: ## %else30
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: store_v16i8_v16i8:		; SSE4-LABEL: store_v16i8_v16i8:
; SSE4: ## %bb.0:		; SSE4: ## %bb.0:
; SSE4-NEXT: pxor %xmm2, %xmm2		; SSE4-NEXT: pxor %xmm2, %xmm2
; SSE4-NEXT: pcmpeqb %xmm0, %xmm2		; SSE4-NEXT: pcmpeqb %xmm0, %xmm2
▲ Show 20 Lines • Show All 531 Lines • ▼ Show 20 Lines	; AVX512VLBW-NEXT: retq
ret void		ret void
}		}

define void @store_v32i8_v32i8(<32 x i8> %trigger, <32 x i8>* %addr, <32 x i8> %val) {		define void @store_v32i8_v32i8(<32 x i8> %trigger, <32 x i8>* %addr, <32 x i8> %val) {
; SSE2-LABEL: store_v32i8_v32i8:		; SSE2-LABEL: store_v32i8_v32i8:
; SSE2: ## %bb.0:		; SSE2: ## %bb.0:
; SSE2-NEXT: pxor %xmm4, %xmm4		; SSE2-NEXT: pxor %xmm4, %xmm4
; SSE2-NEXT: pcmpeqb %xmm0, %xmm4		; SSE2-NEXT: pcmpeqb %xmm0, %xmm4
; SSE2-NEXT: movd %xmm4, %eax		; SSE2-NEXT: movd %xmm4, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
		; SSE2-NEXT: movd %xmm2, %eax
; SSE2-NEXT: je LBB16_2		; SSE2-NEXT: je LBB16_2
; SSE2-NEXT: ## %bb.1: ## %cond.store		; SSE2-NEXT: ## %bb.1: ## %cond.store
; SSE2-NEXT: movd %xmm2, %ecx		; SSE2-NEXT: movb %al, (%rdi)
; SSE2-NEXT: movb %cl, (%rdi)
; SSE2-NEXT: LBB16_2: ## %else		; SSE2-NEXT: LBB16_2: ## %else
; SSE2-NEXT: shrl $8, %eax		; SSE2-NEXT: shrl $8, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB16_4		; SSE2-NEXT: je LBB16_4
; SSE2-NEXT: ## %bb.3: ## %cond.store1		; SSE2-NEXT: ## %bb.3: ## %cond.store1
; SSE2-NEXT: movd %xmm2, %eax
; SSE2-NEXT: movb %ah, 1(%rdi)		; SSE2-NEXT: movb %ah, 1(%rdi)
; SSE2-NEXT: LBB16_4: ## %else2		; SSE2-NEXT: LBB16_4: ## %else2
; SSE2-NEXT: pxor %xmm4, %xmm4		; SSE2-NEXT: pxor %xmm4, %xmm4
; SSE2-NEXT: pcmpeqb %xmm0, %xmm4		; SSE2-NEXT: pcmpeqb %xmm0, %xmm4
; SSE2-NEXT: movd %xmm4, %eax		; SSE2-NEXT: movd %xmm4, %ecx
; SSE2-NEXT: movl %eax, %ecx		; SSE2-NEXT: movl %ecx, %edx
; SSE2-NEXT: shrl $16, %ecx		; SSE2-NEXT: shrl $16, %edx
; SSE2-NEXT: testb $1, %cl		; SSE2-NEXT: testb $1, %dl
; SSE2-NEXT: je LBB16_6		; SSE2-NEXT: je LBB16_6
; SSE2-NEXT: ## %bb.5: ## %cond.store3		; SSE2-NEXT: ## %bb.5: ## %cond.store3
; SSE2-NEXT: movd %xmm2, %ecx		; SSE2-NEXT: movl %eax, %edx
; SSE2-NEXT: shrl $16, %ecx		; SSE2-NEXT: shrl $16, %edx
; SSE2-NEXT: movb %cl, 2(%rdi)		; SSE2-NEXT: movb %dl, 2(%rdi)
; SSE2-NEXT: LBB16_6: ## %else4		; SSE2-NEXT: LBB16_6: ## %else4
; SSE2-NEXT: shrl $24, %eax		; SSE2-NEXT: shrl $24, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB16_8		; SSE2-NEXT: je LBB16_8
; SSE2-NEXT: ## %bb.7: ## %cond.store5		; SSE2-NEXT: ## %bb.7: ## %cond.store5
; SSE2-NEXT: movd %xmm2, %eax
; SSE2-NEXT: shrl $24, %eax		; SSE2-NEXT: shrl $24, %eax
; SSE2-NEXT: movb %al, 3(%rdi)		; SSE2-NEXT: movb %al, 3(%rdi)
; SSE2-NEXT: LBB16_8: ## %else6		; SSE2-NEXT: LBB16_8: ## %else6
; SSE2-NEXT: pxor %xmm4, %xmm4		; SSE2-NEXT: pxor %xmm4, %xmm4
; SSE2-NEXT: pcmpeqb %xmm0, %xmm4		; SSE2-NEXT: pcmpeqb %xmm0, %xmm4
; SSE2-NEXT: pextrw $2, %xmm4, %eax		; SSE2-NEXT: pextrw $2, %xmm4, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
		; SSE2-NEXT: pextrw $2, %xmm2, %eax
; SSE2-NEXT: je LBB16_10		; SSE2-NEXT: je LBB16_10
; SSE2-NEXT: ## %bb.9: ## %cond.store7		; SSE2-NEXT: ## %bb.9: ## %cond.store7
; SSE2-NEXT: pextrw $2, %xmm2, %ecx		; SSE2-NEXT: movb %al, 4(%rdi)
; SSE2-NEXT: movb %cl, 4(%rdi)
; SSE2-NEXT: LBB16_10: ## %else8		; SSE2-NEXT: LBB16_10: ## %else8
; SSE2-NEXT: shrl $8, %eax		; SSE2-NEXT: shrl $8, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB16_12		; SSE2-NEXT: je LBB16_12
; SSE2-NEXT: ## %bb.11: ## %cond.store9		; SSE2-NEXT: ## %bb.11: ## %cond.store9
; SSE2-NEXT: pextrw $2, %xmm2, %eax
; SSE2-NEXT: movb %ah, 5(%rdi)		; SSE2-NEXT: movb %ah, 5(%rdi)
; SSE2-NEXT: LBB16_12: ## %else10		; SSE2-NEXT: LBB16_12: ## %else10
; SSE2-NEXT: pxor %xmm4, %xmm4		; SSE2-NEXT: pxor %xmm4, %xmm4
; SSE2-NEXT: pcmpeqb %xmm0, %xmm4		; SSE2-NEXT: pcmpeqb %xmm0, %xmm4
; SSE2-NEXT: pextrw $3, %xmm4, %eax		; SSE2-NEXT: pextrw $3, %xmm4, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
		; SSE2-NEXT: pextrw $3, %xmm2, %eax
; SSE2-NEXT: je LBB16_14		; SSE2-NEXT: je LBB16_14
; SSE2-NEXT: ## %bb.13: ## %cond.store11		; SSE2-NEXT: ## %bb.13: ## %cond.store11
; SSE2-NEXT: pextrw $3, %xmm2, %ecx		; SSE2-NEXT: movb %al, 6(%rdi)
; SSE2-NEXT: movb %cl, 6(%rdi)
; SSE2-NEXT: LBB16_14: ## %else12		; SSE2-NEXT: LBB16_14: ## %else12
; SSE2-NEXT: shrl $8, %eax		; SSE2-NEXT: shrl $8, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB16_16		; SSE2-NEXT: je LBB16_16
; SSE2-NEXT: ## %bb.15: ## %cond.store13		; SSE2-NEXT: ## %bb.15: ## %cond.store13
; SSE2-NEXT: pextrw $3, %xmm2, %eax
; SSE2-NEXT: movb %ah, 7(%rdi)		; SSE2-NEXT: movb %ah, 7(%rdi)
; SSE2-NEXT: LBB16_16: ## %else14		; SSE2-NEXT: LBB16_16: ## %else14
; SSE2-NEXT: pxor %xmm4, %xmm4		; SSE2-NEXT: pxor %xmm4, %xmm4
; SSE2-NEXT: pcmpeqb %xmm0, %xmm4		; SSE2-NEXT: pcmpeqb %xmm0, %xmm4
; SSE2-NEXT: pextrw $4, %xmm4, %eax		; SSE2-NEXT: pextrw $4, %xmm4, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
		; SSE2-NEXT: pextrw $4, %xmm2, %eax
; SSE2-NEXT: je LBB16_18		; SSE2-NEXT: je LBB16_18
; SSE2-NEXT: ## %bb.17: ## %cond.store15		; SSE2-NEXT: ## %bb.17: ## %cond.store15
; SSE2-NEXT: pextrw $4, %xmm2, %ecx		; SSE2-NEXT: movb %al, 8(%rdi)
; SSE2-NEXT: movb %cl, 8(%rdi)
; SSE2-NEXT: LBB16_18: ## %else16		; SSE2-NEXT: LBB16_18: ## %else16
; SSE2-NEXT: shrl $8, %eax		; SSE2-NEXT: shrl $8, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB16_20		; SSE2-NEXT: je LBB16_20
; SSE2-NEXT: ## %bb.19: ## %cond.store17		; SSE2-NEXT: ## %bb.19: ## %cond.store17
; SSE2-NEXT: pextrw $4, %xmm2, %eax
; SSE2-NEXT: movb %ah, 9(%rdi)		; SSE2-NEXT: movb %ah, 9(%rdi)
; SSE2-NEXT: LBB16_20: ## %else18		; SSE2-NEXT: LBB16_20: ## %else18
; SSE2-NEXT: pxor %xmm4, %xmm4		; SSE2-NEXT: pxor %xmm4, %xmm4
; SSE2-NEXT: pcmpeqb %xmm0, %xmm4		; SSE2-NEXT: pcmpeqb %xmm0, %xmm4
; SSE2-NEXT: pextrw $5, %xmm4, %eax		; SSE2-NEXT: pextrw $5, %xmm4, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
		; SSE2-NEXT: pextrw $5, %xmm2, %eax
; SSE2-NEXT: je LBB16_22		; SSE2-NEXT: je LBB16_22
; SSE2-NEXT: ## %bb.21: ## %cond.store19		; SSE2-NEXT: ## %bb.21: ## %cond.store19
; SSE2-NEXT: pextrw $5, %xmm2, %ecx		; SSE2-NEXT: movb %al, 10(%rdi)
; SSE2-NEXT: movb %cl, 10(%rdi)
; SSE2-NEXT: LBB16_22: ## %else20		; SSE2-NEXT: LBB16_22: ## %else20
; SSE2-NEXT: shrl $8, %eax		; SSE2-NEXT: shrl $8, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB16_24		; SSE2-NEXT: je LBB16_24
; SSE2-NEXT: ## %bb.23: ## %cond.store21		; SSE2-NEXT: ## %bb.23: ## %cond.store21
; SSE2-NEXT: pextrw $5, %xmm2, %eax
; SSE2-NEXT: movb %ah, 11(%rdi)		; SSE2-NEXT: movb %ah, 11(%rdi)
; SSE2-NEXT: LBB16_24: ## %else22		; SSE2-NEXT: LBB16_24: ## %else22
; SSE2-NEXT: pxor %xmm4, %xmm4		; SSE2-NEXT: pxor %xmm4, %xmm4
; SSE2-NEXT: pcmpeqb %xmm0, %xmm4		; SSE2-NEXT: pcmpeqb %xmm0, %xmm4
; SSE2-NEXT: pextrw $6, %xmm4, %eax		; SSE2-NEXT: pextrw $6, %xmm4, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
		; SSE2-NEXT: pextrw $6, %xmm2, %eax
; SSE2-NEXT: je LBB16_26		; SSE2-NEXT: je LBB16_26
; SSE2-NEXT: ## %bb.25: ## %cond.store23		; SSE2-NEXT: ## %bb.25: ## %cond.store23
; SSE2-NEXT: pextrw $6, %xmm2, %ecx		; SSE2-NEXT: movb %al, 12(%rdi)
; SSE2-NEXT: movb %cl, 12(%rdi)
; SSE2-NEXT: LBB16_26: ## %else24		; SSE2-NEXT: LBB16_26: ## %else24
; SSE2-NEXT: shrl $8, %eax		; SSE2-NEXT: shrl $8, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB16_28		; SSE2-NEXT: je LBB16_28
; SSE2-NEXT: ## %bb.27: ## %cond.store25		; SSE2-NEXT: ## %bb.27: ## %cond.store25
; SSE2-NEXT: pextrw $6, %xmm2, %eax
; SSE2-NEXT: movb %ah, 13(%rdi)		; SSE2-NEXT: movb %ah, 13(%rdi)
; SSE2-NEXT: LBB16_28: ## %else26		; SSE2-NEXT: LBB16_28: ## %else26
; SSE2-NEXT: pxor %xmm4, %xmm4		; SSE2-NEXT: pxor %xmm4, %xmm4
; SSE2-NEXT: pcmpeqb %xmm4, %xmm0		; SSE2-NEXT: pcmpeqb %xmm4, %xmm0
; SSE2-NEXT: pextrw $7, %xmm0, %eax		; SSE2-NEXT: pextrw $7, %xmm0, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
		; SSE2-NEXT: pextrw $7, %xmm2, %eax
; SSE2-NEXT: je LBB16_30		; SSE2-NEXT: je LBB16_30
; SSE2-NEXT: ## %bb.29: ## %cond.store27		; SSE2-NEXT: ## %bb.29: ## %cond.store27
; SSE2-NEXT: pextrw $7, %xmm2, %ecx		; SSE2-NEXT: movb %al, 14(%rdi)
; SSE2-NEXT: movb %cl, 14(%rdi)
; SSE2-NEXT: LBB16_30: ## %else28		; SSE2-NEXT: LBB16_30: ## %else28
; SSE2-NEXT: shrl $8, %eax		; SSE2-NEXT: shrl $8, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB16_32		; SSE2-NEXT: je LBB16_32
; SSE2-NEXT: ## %bb.31: ## %cond.store29		; SSE2-NEXT: ## %bb.31: ## %cond.store29
; SSE2-NEXT: pextrw $7, %xmm2, %eax
; SSE2-NEXT: movb %ah, 15(%rdi)		; SSE2-NEXT: movb %ah, 15(%rdi)
; SSE2-NEXT: LBB16_32: ## %else30		; SSE2-NEXT: LBB16_32: ## %else30
; SSE2-NEXT: pxor %xmm0, %xmm0		; SSE2-NEXT: pxor %xmm0, %xmm0
; SSE2-NEXT: pcmpeqb %xmm1, %xmm0		; SSE2-NEXT: pcmpeqb %xmm1, %xmm0
; SSE2-NEXT: movd %xmm0, %eax		; SSE2-NEXT: movd %xmm0, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
		; SSE2-NEXT: movd %xmm3, %eax
; SSE2-NEXT: je LBB16_34		; SSE2-NEXT: je LBB16_34
; SSE2-NEXT: ## %bb.33: ## %cond.store31		; SSE2-NEXT: ## %bb.33: ## %cond.store31
; SSE2-NEXT: movd %xmm3, %ecx		; SSE2-NEXT: movb %al, 16(%rdi)
; SSE2-NEXT: movb %cl, 16(%rdi)
; SSE2-NEXT: LBB16_34: ## %else32		; SSE2-NEXT: LBB16_34: ## %else32
; SSE2-NEXT: shrl $8, %eax		; SSE2-NEXT: shrl $8, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB16_36		; SSE2-NEXT: je LBB16_36
; SSE2-NEXT: ## %bb.35: ## %cond.store33		; SSE2-NEXT: ## %bb.35: ## %cond.store33
; SSE2-NEXT: movd %xmm3, %eax
; SSE2-NEXT: movb %ah, 17(%rdi)		; SSE2-NEXT: movb %ah, 17(%rdi)
; SSE2-NEXT: LBB16_36: ## %else34		; SSE2-NEXT: LBB16_36: ## %else34
; SSE2-NEXT: pxor %xmm0, %xmm0		; SSE2-NEXT: pxor %xmm0, %xmm0
; SSE2-NEXT: pcmpeqb %xmm1, %xmm0		; SSE2-NEXT: pcmpeqb %xmm1, %xmm0
; SSE2-NEXT: movd %xmm0, %eax		; SSE2-NEXT: movd %xmm0, %ecx
; SSE2-NEXT: movl %eax, %ecx		; SSE2-NEXT: movl %ecx, %edx
; SSE2-NEXT: shrl $16, %ecx		; SSE2-NEXT: shrl $16, %edx
; SSE2-NEXT: testb $1, %cl		; SSE2-NEXT: testb $1, %dl
; SSE2-NEXT: je LBB16_38		; SSE2-NEXT: je LBB16_38
; SSE2-NEXT: ## %bb.37: ## %cond.store35		; SSE2-NEXT: ## %bb.37: ## %cond.store35
; SSE2-NEXT: movd %xmm3, %ecx		; SSE2-NEXT: movl %eax, %edx
; SSE2-NEXT: shrl $16, %ecx		; SSE2-NEXT: shrl $16, %edx
; SSE2-NEXT: movb %cl, 18(%rdi)		; SSE2-NEXT: movb %dl, 18(%rdi)
; SSE2-NEXT: LBB16_38: ## %else36		; SSE2-NEXT: LBB16_38: ## %else36
; SSE2-NEXT: shrl $24, %eax		; SSE2-NEXT: shrl $24, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB16_40		; SSE2-NEXT: je LBB16_40
; SSE2-NEXT: ## %bb.39: ## %cond.store37		; SSE2-NEXT: ## %bb.39: ## %cond.store37
; SSE2-NEXT: movd %xmm3, %eax
; SSE2-NEXT: shrl $24, %eax		; SSE2-NEXT: shrl $24, %eax
; SSE2-NEXT: movb %al, 19(%rdi)		; SSE2-NEXT: movb %al, 19(%rdi)
; SSE2-NEXT: LBB16_40: ## %else38		; SSE2-NEXT: LBB16_40: ## %else38
; SSE2-NEXT: pxor %xmm0, %xmm0		; SSE2-NEXT: pxor %xmm0, %xmm0
; SSE2-NEXT: pcmpeqb %xmm1, %xmm0		; SSE2-NEXT: pcmpeqb %xmm1, %xmm0
; SSE2-NEXT: pextrw $2, %xmm0, %eax		; SSE2-NEXT: pextrw $2, %xmm0, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
		; SSE2-NEXT: pextrw $2, %xmm3, %eax
; SSE2-NEXT: je LBB16_42		; SSE2-NEXT: je LBB16_42
; SSE2-NEXT: ## %bb.41: ## %cond.store39		; SSE2-NEXT: ## %bb.41: ## %cond.store39
; SSE2-NEXT: pextrw $2, %xmm3, %ecx		; SSE2-NEXT: movb %al, 20(%rdi)
; SSE2-NEXT: movb %cl, 20(%rdi)
; SSE2-NEXT: LBB16_42: ## %else40		; SSE2-NEXT: LBB16_42: ## %else40
; SSE2-NEXT: shrl $8, %eax		; SSE2-NEXT: shrl $8, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB16_44		; SSE2-NEXT: je LBB16_44
; SSE2-NEXT: ## %bb.43: ## %cond.store41		; SSE2-NEXT: ## %bb.43: ## %cond.store41
; SSE2-NEXT: pextrw $2, %xmm3, %eax
; SSE2-NEXT: movb %ah, 21(%rdi)		; SSE2-NEXT: movb %ah, 21(%rdi)
; SSE2-NEXT: LBB16_44: ## %else42		; SSE2-NEXT: LBB16_44: ## %else42
; SSE2-NEXT: pxor %xmm0, %xmm0		; SSE2-NEXT: pxor %xmm0, %xmm0
; SSE2-NEXT: pcmpeqb %xmm1, %xmm0		; SSE2-NEXT: pcmpeqb %xmm1, %xmm0
; SSE2-NEXT: pextrw $3, %xmm0, %eax		; SSE2-NEXT: pextrw $3, %xmm0, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
		; SSE2-NEXT: pextrw $3, %xmm3, %eax
; SSE2-NEXT: je LBB16_46		; SSE2-NEXT: je LBB16_46
; SSE2-NEXT: ## %bb.45: ## %cond.store43		; SSE2-NEXT: ## %bb.45: ## %cond.store43
; SSE2-NEXT: pextrw $3, %xmm3, %ecx		; SSE2-NEXT: movb %al, 22(%rdi)
; SSE2-NEXT: movb %cl, 22(%rdi)
; SSE2-NEXT: LBB16_46: ## %else44		; SSE2-NEXT: LBB16_46: ## %else44
; SSE2-NEXT: shrl $8, %eax		; SSE2-NEXT: shrl $8, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB16_48		; SSE2-NEXT: je LBB16_48
; SSE2-NEXT: ## %bb.47: ## %cond.store45		; SSE2-NEXT: ## %bb.47: ## %cond.store45
; SSE2-NEXT: pextrw $3, %xmm3, %eax
; SSE2-NEXT: movb %ah, 23(%rdi)		; SSE2-NEXT: movb %ah, 23(%rdi)
; SSE2-NEXT: LBB16_48: ## %else46		; SSE2-NEXT: LBB16_48: ## %else46
; SSE2-NEXT: pxor %xmm0, %xmm0		; SSE2-NEXT: pxor %xmm0, %xmm0
; SSE2-NEXT: pcmpeqb %xmm1, %xmm0		; SSE2-NEXT: pcmpeqb %xmm1, %xmm0
; SSE2-NEXT: pextrw $4, %xmm0, %eax		; SSE2-NEXT: pextrw $4, %xmm0, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
		; SSE2-NEXT: pextrw $4, %xmm3, %eax
; SSE2-NEXT: je LBB16_50		; SSE2-NEXT: je LBB16_50
; SSE2-NEXT: ## %bb.49: ## %cond.store47		; SSE2-NEXT: ## %bb.49: ## %cond.store47
; SSE2-NEXT: pextrw $4, %xmm3, %ecx		; SSE2-NEXT: movb %al, 24(%rdi)
; SSE2-NEXT: movb %cl, 24(%rdi)
; SSE2-NEXT: LBB16_50: ## %else48		; SSE2-NEXT: LBB16_50: ## %else48
; SSE2-NEXT: shrl $8, %eax		; SSE2-NEXT: shrl $8, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB16_52		; SSE2-NEXT: je LBB16_52
; SSE2-NEXT: ## %bb.51: ## %cond.store49		; SSE2-NEXT: ## %bb.51: ## %cond.store49
; SSE2-NEXT: pextrw $4, %xmm3, %eax
; SSE2-NEXT: movb %ah, 25(%rdi)		; SSE2-NEXT: movb %ah, 25(%rdi)
; SSE2-NEXT: LBB16_52: ## %else50		; SSE2-NEXT: LBB16_52: ## %else50
; SSE2-NEXT: pxor %xmm0, %xmm0		; SSE2-NEXT: pxor %xmm0, %xmm0
; SSE2-NEXT: pcmpeqb %xmm1, %xmm0		; SSE2-NEXT: pcmpeqb %xmm1, %xmm0
; SSE2-NEXT: pextrw $5, %xmm0, %eax		; SSE2-NEXT: pextrw $5, %xmm0, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
		; SSE2-NEXT: pextrw $5, %xmm3, %eax
; SSE2-NEXT: je LBB16_54		; SSE2-NEXT: je LBB16_54
; SSE2-NEXT: ## %bb.53: ## %cond.store51		; SSE2-NEXT: ## %bb.53: ## %cond.store51
; SSE2-NEXT: pextrw $5, %xmm3, %ecx		; SSE2-NEXT: movb %al, 26(%rdi)
; SSE2-NEXT: movb %cl, 26(%rdi)
; SSE2-NEXT: LBB16_54: ## %else52		; SSE2-NEXT: LBB16_54: ## %else52
; SSE2-NEXT: shrl $8, %eax		; SSE2-NEXT: shrl $8, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB16_56		; SSE2-NEXT: je LBB16_56
; SSE2-NEXT: ## %bb.55: ## %cond.store53		; SSE2-NEXT: ## %bb.55: ## %cond.store53
; SSE2-NEXT: pextrw $5, %xmm3, %eax
; SSE2-NEXT: movb %ah, 27(%rdi)		; SSE2-NEXT: movb %ah, 27(%rdi)
; SSE2-NEXT: LBB16_56: ## %else54		; SSE2-NEXT: LBB16_56: ## %else54
; SSE2-NEXT: pxor %xmm0, %xmm0		; SSE2-NEXT: pxor %xmm0, %xmm0
; SSE2-NEXT: pcmpeqb %xmm1, %xmm0		; SSE2-NEXT: pcmpeqb %xmm1, %xmm0
; SSE2-NEXT: pextrw $6, %xmm0, %eax		; SSE2-NEXT: pextrw $6, %xmm0, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
		; SSE2-NEXT: pextrw $6, %xmm3, %eax
; SSE2-NEXT: je LBB16_58		; SSE2-NEXT: je LBB16_58
; SSE2-NEXT: ## %bb.57: ## %cond.store55		; SSE2-NEXT: ## %bb.57: ## %cond.store55
; SSE2-NEXT: pextrw $6, %xmm3, %ecx		; SSE2-NEXT: movb %al, 28(%rdi)
; SSE2-NEXT: movb %cl, 28(%rdi)
; SSE2-NEXT: LBB16_58: ## %else56		; SSE2-NEXT: LBB16_58: ## %else56
; SSE2-NEXT: shrl $8, %eax		; SSE2-NEXT: shrl $8, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB16_60		; SSE2-NEXT: je LBB16_60
; SSE2-NEXT: ## %bb.59: ## %cond.store57		; SSE2-NEXT: ## %bb.59: ## %cond.store57
; SSE2-NEXT: pextrw $6, %xmm3, %eax
; SSE2-NEXT: movb %ah, 29(%rdi)		; SSE2-NEXT: movb %ah, 29(%rdi)
; SSE2-NEXT: LBB16_60: ## %else58		; SSE2-NEXT: LBB16_60: ## %else58
; SSE2-NEXT: pxor %xmm0, %xmm0		; SSE2-NEXT: pxor %xmm0, %xmm0
; SSE2-NEXT: pcmpeqb %xmm0, %xmm1		; SSE2-NEXT: pcmpeqb %xmm0, %xmm1
; SSE2-NEXT: pextrw $7, %xmm1, %eax		; SSE2-NEXT: pextrw $7, %xmm1, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
		; SSE2-NEXT: pextrw $7, %xmm3, %eax
; SSE2-NEXT: je LBB16_62		; SSE2-NEXT: je LBB16_62
; SSE2-NEXT: ## %bb.61: ## %cond.store59		; SSE2-NEXT: ## %bb.61: ## %cond.store59
; SSE2-NEXT: pextrw $7, %xmm3, %ecx		; SSE2-NEXT: movb %al, 30(%rdi)
; SSE2-NEXT: movb %cl, 30(%rdi)
; SSE2-NEXT: LBB16_62: ## %else60		; SSE2-NEXT: LBB16_62: ## %else60
; SSE2-NEXT: shrl $8, %eax		; SSE2-NEXT: shrl $8, %ecx
; SSE2-NEXT: testb $1, %al		; SSE2-NEXT: testb $1, %cl
; SSE2-NEXT: je LBB16_64		; SSE2-NEXT: je LBB16_64
; SSE2-NEXT: ## %bb.63: ## %cond.store61		; SSE2-NEXT: ## %bb.63: ## %cond.store61
; SSE2-NEXT: pextrw $7, %xmm3, %eax
; SSE2-NEXT: movb %ah, 31(%rdi)		; SSE2-NEXT: movb %ah, 31(%rdi)
; SSE2-NEXT: LBB16_64: ## %else62		; SSE2-NEXT: LBB16_64: ## %else62
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE4-LABEL: store_v32i8_v32i8:		; SSE4-LABEL: store_v32i8_v32i8:
; SSE4: ## %bb.0:		; SSE4: ## %bb.0:
; SSE4-NEXT: pxor %xmm4, %xmm4		; SSE4-NEXT: pxor %xmm4, %xmm4
; SSE4-NEXT: pcmpeqb %xmm0, %xmm4		; SSE4-NEXT: pcmpeqb %xmm0, %xmm4
▲ Show 20 Lines • Show All 338 Lines • ▼ Show 20 Lines
; AVX1-NEXT: LBB16_30: ## %else28		; AVX1-NEXT: LBB16_30: ## %else28
; AVX1-NEXT: vpcmpeqb %xmm2, %xmm0, %xmm2		; AVX1-NEXT: vpcmpeqb %xmm2, %xmm0, %xmm2
; AVX1-NEXT: vpextrb $15, %xmm2, %eax		; AVX1-NEXT: vpextrb $15, %xmm2, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB16_32		; AVX1-NEXT: je LBB16_32
; AVX1-NEXT: ## %bb.31: ## %cond.store29		; AVX1-NEXT: ## %bb.31: ## %cond.store29
; AVX1-NEXT: vpextrb $15, %xmm1, 15(%rdi)		; AVX1-NEXT: vpextrb $15, %xmm1, 15(%rdi)
; AVX1-NEXT: LBB16_32: ## %else30		; AVX1-NEXT: LBB16_32: ## %else30
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpxor %xmm0, %xmm0, %xmm0
; AVX1-NEXT: vpcmpeqb %xmm2, %xmm0, %xmm2		; AVX1-NEXT: vpcmpeqb %xmm0, %xmm2, %xmm3
; AVX1-NEXT: vpextrb $0, %xmm2, %eax		; AVX1-NEXT: vpextrb $0, %xmm3, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
		; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0
; AVX1-NEXT: je LBB16_34		; AVX1-NEXT: je LBB16_34
; AVX1-NEXT: ## %bb.33: ## %cond.store31		; AVX1-NEXT: ## %bb.33: ## %cond.store31
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3		; AVX1-NEXT: vpextrb $0, %xmm0, 16(%rdi)
; AVX1-NEXT: vpextrb $0, %xmm3, 16(%rdi)
; AVX1-NEXT: LBB16_34: ## %else32		; AVX1-NEXT: LBB16_34: ## %else32
; AVX1-NEXT: vpextrb $1, %xmm2, %eax		; AVX1-NEXT: vpextrb $1, %xmm3, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB16_36		; AVX1-NEXT: je LBB16_36
; AVX1-NEXT: ## %bb.35: ## %cond.store33		; AVX1-NEXT: ## %bb.35: ## %cond.store33
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX1-NEXT: vpextrb $1, %xmm0, 17(%rdi)
; AVX1-NEXT: vpextrb $1, %xmm2, 17(%rdi)
; AVX1-NEXT: LBB16_36: ## %else34		; AVX1-NEXT: LBB16_36: ## %else34
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
; AVX1-NEXT: vpcmpeqb %xmm2, %xmm0, %xmm2		; AVX1-NEXT: vpcmpeqb %xmm1, %xmm2, %xmm1
; AVX1-NEXT: vpextrb $2, %xmm2, %eax		; AVX1-NEXT: vpextrb $2, %xmm1, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB16_38		; AVX1-NEXT: je LBB16_38
; AVX1-NEXT: ## %bb.37: ## %cond.store35		; AVX1-NEXT: ## %bb.37: ## %cond.store35
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3		; AVX1-NEXT: vpextrb $2, %xmm0, 18(%rdi)
; AVX1-NEXT: vpextrb $2, %xmm3, 18(%rdi)
; AVX1-NEXT: LBB16_38: ## %else36		; AVX1-NEXT: LBB16_38: ## %else36
; AVX1-NEXT: vpextrb $3, %xmm2, %eax		; AVX1-NEXT: vpextrb $3, %xmm1, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB16_40		; AVX1-NEXT: je LBB16_40
; AVX1-NEXT: ## %bb.39: ## %cond.store37		; AVX1-NEXT: ## %bb.39: ## %cond.store37
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX1-NEXT: vpextrb $3, %xmm0, 19(%rdi)
; AVX1-NEXT: vpextrb $3, %xmm2, 19(%rdi)
; AVX1-NEXT: LBB16_40: ## %else38		; AVX1-NEXT: LBB16_40: ## %else38
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
; AVX1-NEXT: vpcmpeqb %xmm2, %xmm0, %xmm2		; AVX1-NEXT: vpcmpeqb %xmm1, %xmm2, %xmm1
; AVX1-NEXT: vpextrb $4, %xmm2, %eax		; AVX1-NEXT: vpextrb $4, %xmm1, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB16_42		; AVX1-NEXT: je LBB16_42
; AVX1-NEXT: ## %bb.41: ## %cond.store39		; AVX1-NEXT: ## %bb.41: ## %cond.store39
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3		; AVX1-NEXT: vpextrb $4, %xmm0, 20(%rdi)
; AVX1-NEXT: vpextrb $4, %xmm3, 20(%rdi)
; AVX1-NEXT: LBB16_42: ## %else40		; AVX1-NEXT: LBB16_42: ## %else40
; AVX1-NEXT: vpextrb $5, %xmm2, %eax		; AVX1-NEXT: vpextrb $5, %xmm1, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB16_44		; AVX1-NEXT: je LBB16_44
; AVX1-NEXT: ## %bb.43: ## %cond.store41		; AVX1-NEXT: ## %bb.43: ## %cond.store41
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX1-NEXT: vpextrb $5, %xmm0, 21(%rdi)
; AVX1-NEXT: vpextrb $5, %xmm2, 21(%rdi)
; AVX1-NEXT: LBB16_44: ## %else42		; AVX1-NEXT: LBB16_44: ## %else42
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
; AVX1-NEXT: vpcmpeqb %xmm2, %xmm0, %xmm2		; AVX1-NEXT: vpcmpeqb %xmm1, %xmm2, %xmm1
; AVX1-NEXT: vpextrb $6, %xmm2, %eax		; AVX1-NEXT: vpextrb $6, %xmm1, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB16_46		; AVX1-NEXT: je LBB16_46
; AVX1-NEXT: ## %bb.45: ## %cond.store43		; AVX1-NEXT: ## %bb.45: ## %cond.store43
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3		; AVX1-NEXT: vpextrb $6, %xmm0, 22(%rdi)
; AVX1-NEXT: vpextrb $6, %xmm3, 22(%rdi)
; AVX1-NEXT: LBB16_46: ## %else44		; AVX1-NEXT: LBB16_46: ## %else44
; AVX1-NEXT: vpextrb $7, %xmm2, %eax		; AVX1-NEXT: vpextrb $7, %xmm1, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB16_48		; AVX1-NEXT: je LBB16_48
; AVX1-NEXT: ## %bb.47: ## %cond.store45		; AVX1-NEXT: ## %bb.47: ## %cond.store45
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX1-NEXT: vpextrb $7, %xmm0, 23(%rdi)
; AVX1-NEXT: vpextrb $7, %xmm2, 23(%rdi)
; AVX1-NEXT: LBB16_48: ## %else46		; AVX1-NEXT: LBB16_48: ## %else46
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
; AVX1-NEXT: vpcmpeqb %xmm2, %xmm0, %xmm2		; AVX1-NEXT: vpcmpeqb %xmm1, %xmm2, %xmm1
; AVX1-NEXT: vpextrb $8, %xmm2, %eax		; AVX1-NEXT: vpextrb $8, %xmm1, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB16_50		; AVX1-NEXT: je LBB16_50
; AVX1-NEXT: ## %bb.49: ## %cond.store47		; AVX1-NEXT: ## %bb.49: ## %cond.store47
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3		; AVX1-NEXT: vpextrb $8, %xmm0, 24(%rdi)
; AVX1-NEXT: vpextrb $8, %xmm3, 24(%rdi)
; AVX1-NEXT: LBB16_50: ## %else48		; AVX1-NEXT: LBB16_50: ## %else48
; AVX1-NEXT: vpextrb $9, %xmm2, %eax		; AVX1-NEXT: vpextrb $9, %xmm1, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB16_52		; AVX1-NEXT: je LBB16_52
; AVX1-NEXT: ## %bb.51: ## %cond.store49		; AVX1-NEXT: ## %bb.51: ## %cond.store49
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX1-NEXT: vpextrb $9, %xmm0, 25(%rdi)
; AVX1-NEXT: vpextrb $9, %xmm2, 25(%rdi)
; AVX1-NEXT: LBB16_52: ## %else50		; AVX1-NEXT: LBB16_52: ## %else50
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
; AVX1-NEXT: vpcmpeqb %xmm2, %xmm0, %xmm2		; AVX1-NEXT: vpcmpeqb %xmm1, %xmm2, %xmm1
; AVX1-NEXT: vpextrb $10, %xmm2, %eax		; AVX1-NEXT: vpextrb $10, %xmm1, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB16_54		; AVX1-NEXT: je LBB16_54
; AVX1-NEXT: ## %bb.53: ## %cond.store51		; AVX1-NEXT: ## %bb.53: ## %cond.store51
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3		; AVX1-NEXT: vpextrb $10, %xmm0, 26(%rdi)
; AVX1-NEXT: vpextrb $10, %xmm3, 26(%rdi)
; AVX1-NEXT: LBB16_54: ## %else52		; AVX1-NEXT: LBB16_54: ## %else52
; AVX1-NEXT: vpextrb $11, %xmm2, %eax		; AVX1-NEXT: vpextrb $11, %xmm1, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB16_56		; AVX1-NEXT: je LBB16_56
; AVX1-NEXT: ## %bb.55: ## %cond.store53		; AVX1-NEXT: ## %bb.55: ## %cond.store53
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX1-NEXT: vpextrb $11, %xmm0, 27(%rdi)
; AVX1-NEXT: vpextrb $11, %xmm2, 27(%rdi)
; AVX1-NEXT: LBB16_56: ## %else54		; AVX1-NEXT: LBB16_56: ## %else54
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
; AVX1-NEXT: vpcmpeqb %xmm2, %xmm0, %xmm2		; AVX1-NEXT: vpcmpeqb %xmm1, %xmm2, %xmm1
; AVX1-NEXT: vpextrb $12, %xmm2, %eax		; AVX1-NEXT: vpextrb $12, %xmm1, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB16_58		; AVX1-NEXT: je LBB16_58
; AVX1-NEXT: ## %bb.57: ## %cond.store55		; AVX1-NEXT: ## %bb.57: ## %cond.store55
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3		; AVX1-NEXT: vpextrb $12, %xmm0, 28(%rdi)
; AVX1-NEXT: vpextrb $12, %xmm3, 28(%rdi)
; AVX1-NEXT: LBB16_58: ## %else56		; AVX1-NEXT: LBB16_58: ## %else56
; AVX1-NEXT: vpextrb $13, %xmm2, %eax		; AVX1-NEXT: vpextrb $13, %xmm1, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB16_60		; AVX1-NEXT: je LBB16_60
; AVX1-NEXT: ## %bb.59: ## %cond.store57		; AVX1-NEXT: ## %bb.59: ## %cond.store57
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX1-NEXT: vpextrb $13, %xmm0, 29(%rdi)
; AVX1-NEXT: vpextrb $13, %xmm2, 29(%rdi)
; AVX1-NEXT: LBB16_60: ## %else58		; AVX1-NEXT: LBB16_60: ## %else58
; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
; AVX1-NEXT: vpcmpeqb %xmm2, %xmm0, %xmm0		; AVX1-NEXT: vpcmpeqb %xmm1, %xmm2, %xmm1
; AVX1-NEXT: vpextrb $14, %xmm0, %eax		; AVX1-NEXT: vpextrb $14, %xmm1, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB16_62		; AVX1-NEXT: je LBB16_62
; AVX1-NEXT: ## %bb.61: ## %cond.store59		; AVX1-NEXT: ## %bb.61: ## %cond.store59
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2		; AVX1-NEXT: vpextrb $14, %xmm0, 30(%rdi)
; AVX1-NEXT: vpextrb $14, %xmm2, 30(%rdi)
; AVX1-NEXT: LBB16_62: ## %else60		; AVX1-NEXT: LBB16_62: ## %else60
; AVX1-NEXT: vpextrb $15, %xmm0, %eax		; AVX1-NEXT: vpextrb $15, %xmm1, %eax
; AVX1-NEXT: testb $1, %al		; AVX1-NEXT: testb $1, %al
; AVX1-NEXT: je LBB16_64		; AVX1-NEXT: je LBB16_64
; AVX1-NEXT: ## %bb.63: ## %cond.store61		; AVX1-NEXT: ## %bb.63: ## %cond.store61
; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm0
; AVX1-NEXT: vpextrb $15, %xmm0, 31(%rdi)		; AVX1-NEXT: vpextrb $15, %xmm0, 31(%rdi)
; AVX1-NEXT: LBB16_64: ## %else62		; AVX1-NEXT: LBB16_64: ## %else62
; AVX1-NEXT: vzeroupper		; AVX1-NEXT: vzeroupper
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: store_v32i8_v32i8:		; AVX2-LABEL: store_v32i8_v32i8:
; AVX2: ## %bb.0:		; AVX2: ## %bb.0:
; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
▲ Show 20 Lines • Show All 108 Lines • ▼ Show 20 Lines
; AVX2-NEXT: ## %bb.31: ## %cond.store29		; AVX2-NEXT: ## %bb.31: ## %cond.store29
; AVX2-NEXT: vpextrb $15, %xmm1, 15(%rdi)		; AVX2-NEXT: vpextrb $15, %xmm1, 15(%rdi)
; AVX2-NEXT: LBB16_32: ## %else30		; AVX2-NEXT: LBB16_32: ## %else30
; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX2-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2		; AVX2-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2
; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX2-NEXT: vpextrb $0, %xmm2, %eax		; AVX2-NEXT: vpextrb $0, %xmm2, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
		; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
; AVX2-NEXT: je LBB16_34		; AVX2-NEXT: je LBB16_34
; AVX2-NEXT: ## %bb.33: ## %cond.store31		; AVX2-NEXT: ## %bb.33: ## %cond.store31
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm3		; AVX2-NEXT: vpextrb $0, %xmm1, 16(%rdi)
; AVX2-NEXT: vpextrb $0, %xmm3, 16(%rdi)
; AVX2-NEXT: LBB16_34: ## %else32		; AVX2-NEXT: LBB16_34: ## %else32
; AVX2-NEXT: vpextrb $1, %xmm2, %eax		; AVX2-NEXT: vpextrb $1, %xmm2, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
; AVX2-NEXT: je LBB16_36		; AVX2-NEXT: je LBB16_36
; AVX2-NEXT: ## %bb.35: ## %cond.store33		; AVX2-NEXT: ## %bb.35: ## %cond.store33
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX2-NEXT: vpextrb $1, %xmm1, 17(%rdi)
; AVX2-NEXT: vpextrb $1, %xmm2, 17(%rdi)
; AVX2-NEXT: LBB16_36: ## %else34		; AVX2-NEXT: LBB16_36: ## %else34
; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX2-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2		; AVX2-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2
; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX2-NEXT: vpextrb $2, %xmm2, %eax		; AVX2-NEXT: vpextrb $2, %xmm2, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
; AVX2-NEXT: je LBB16_38		; AVX2-NEXT: je LBB16_38
; AVX2-NEXT: ## %bb.37: ## %cond.store35		; AVX2-NEXT: ## %bb.37: ## %cond.store35
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm3		; AVX2-NEXT: vpextrb $2, %xmm1, 18(%rdi)
; AVX2-NEXT: vpextrb $2, %xmm3, 18(%rdi)
; AVX2-NEXT: LBB16_38: ## %else36		; AVX2-NEXT: LBB16_38: ## %else36
; AVX2-NEXT: vpextrb $3, %xmm2, %eax		; AVX2-NEXT: vpextrb $3, %xmm2, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
; AVX2-NEXT: je LBB16_40		; AVX2-NEXT: je LBB16_40
; AVX2-NEXT: ## %bb.39: ## %cond.store37		; AVX2-NEXT: ## %bb.39: ## %cond.store37
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX2-NEXT: vpextrb $3, %xmm1, 19(%rdi)
; AVX2-NEXT: vpextrb $3, %xmm2, 19(%rdi)
; AVX2-NEXT: LBB16_40: ## %else38		; AVX2-NEXT: LBB16_40: ## %else38
; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX2-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2		; AVX2-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2
; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX2-NEXT: vpextrb $4, %xmm2, %eax		; AVX2-NEXT: vpextrb $4, %xmm2, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
; AVX2-NEXT: je LBB16_42		; AVX2-NEXT: je LBB16_42
; AVX2-NEXT: ## %bb.41: ## %cond.store39		; AVX2-NEXT: ## %bb.41: ## %cond.store39
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm3		; AVX2-NEXT: vpextrb $4, %xmm1, 20(%rdi)
; AVX2-NEXT: vpextrb $4, %xmm3, 20(%rdi)
; AVX2-NEXT: LBB16_42: ## %else40		; AVX2-NEXT: LBB16_42: ## %else40
; AVX2-NEXT: vpextrb $5, %xmm2, %eax		; AVX2-NEXT: vpextrb $5, %xmm2, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
; AVX2-NEXT: je LBB16_44		; AVX2-NEXT: je LBB16_44
; AVX2-NEXT: ## %bb.43: ## %cond.store41		; AVX2-NEXT: ## %bb.43: ## %cond.store41
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX2-NEXT: vpextrb $5, %xmm1, 21(%rdi)
; AVX2-NEXT: vpextrb $5, %xmm2, 21(%rdi)
; AVX2-NEXT: LBB16_44: ## %else42		; AVX2-NEXT: LBB16_44: ## %else42
; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX2-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2		; AVX2-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2
; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX2-NEXT: vpextrb $6, %xmm2, %eax		; AVX2-NEXT: vpextrb $6, %xmm2, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
; AVX2-NEXT: je LBB16_46		; AVX2-NEXT: je LBB16_46
; AVX2-NEXT: ## %bb.45: ## %cond.store43		; AVX2-NEXT: ## %bb.45: ## %cond.store43
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm3		; AVX2-NEXT: vpextrb $6, %xmm1, 22(%rdi)
; AVX2-NEXT: vpextrb $6, %xmm3, 22(%rdi)
; AVX2-NEXT: LBB16_46: ## %else44		; AVX2-NEXT: LBB16_46: ## %else44
; AVX2-NEXT: vpextrb $7, %xmm2, %eax		; AVX2-NEXT: vpextrb $7, %xmm2, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
; AVX2-NEXT: je LBB16_48		; AVX2-NEXT: je LBB16_48
; AVX2-NEXT: ## %bb.47: ## %cond.store45		; AVX2-NEXT: ## %bb.47: ## %cond.store45
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX2-NEXT: vpextrb $7, %xmm1, 23(%rdi)
; AVX2-NEXT: vpextrb $7, %xmm2, 23(%rdi)
; AVX2-NEXT: LBB16_48: ## %else46		; AVX2-NEXT: LBB16_48: ## %else46
; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX2-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2		; AVX2-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2
; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX2-NEXT: vpextrb $8, %xmm2, %eax		; AVX2-NEXT: vpextrb $8, %xmm2, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
; AVX2-NEXT: je LBB16_50		; AVX2-NEXT: je LBB16_50
; AVX2-NEXT: ## %bb.49: ## %cond.store47		; AVX2-NEXT: ## %bb.49: ## %cond.store47
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm3		; AVX2-NEXT: vpextrb $8, %xmm1, 24(%rdi)
; AVX2-NEXT: vpextrb $8, %xmm3, 24(%rdi)
; AVX2-NEXT: LBB16_50: ## %else48		; AVX2-NEXT: LBB16_50: ## %else48
; AVX2-NEXT: vpextrb $9, %xmm2, %eax		; AVX2-NEXT: vpextrb $9, %xmm2, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
; AVX2-NEXT: je LBB16_52		; AVX2-NEXT: je LBB16_52
; AVX2-NEXT: ## %bb.51: ## %cond.store49		; AVX2-NEXT: ## %bb.51: ## %cond.store49
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX2-NEXT: vpextrb $9, %xmm1, 25(%rdi)
; AVX2-NEXT: vpextrb $9, %xmm2, 25(%rdi)
; AVX2-NEXT: LBB16_52: ## %else50		; AVX2-NEXT: LBB16_52: ## %else50
; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX2-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2		; AVX2-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2
; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX2-NEXT: vpextrb $10, %xmm2, %eax		; AVX2-NEXT: vpextrb $10, %xmm2, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
; AVX2-NEXT: je LBB16_54		; AVX2-NEXT: je LBB16_54
; AVX2-NEXT: ## %bb.53: ## %cond.store51		; AVX2-NEXT: ## %bb.53: ## %cond.store51
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm3		; AVX2-NEXT: vpextrb $10, %xmm1, 26(%rdi)
; AVX2-NEXT: vpextrb $10, %xmm3, 26(%rdi)
; AVX2-NEXT: LBB16_54: ## %else52		; AVX2-NEXT: LBB16_54: ## %else52
; AVX2-NEXT: vpextrb $11, %xmm2, %eax		; AVX2-NEXT: vpextrb $11, %xmm2, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
; AVX2-NEXT: je LBB16_56		; AVX2-NEXT: je LBB16_56
; AVX2-NEXT: ## %bb.55: ## %cond.store53		; AVX2-NEXT: ## %bb.55: ## %cond.store53
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX2-NEXT: vpextrb $11, %xmm1, 27(%rdi)
; AVX2-NEXT: vpextrb $11, %xmm2, 27(%rdi)
; AVX2-NEXT: LBB16_56: ## %else54		; AVX2-NEXT: LBB16_56: ## %else54
; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX2-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2		; AVX2-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2
; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX2-NEXT: vpextrb $12, %xmm2, %eax		; AVX2-NEXT: vpextrb $12, %xmm2, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
; AVX2-NEXT: je LBB16_58		; AVX2-NEXT: je LBB16_58
; AVX2-NEXT: ## %bb.57: ## %cond.store55		; AVX2-NEXT: ## %bb.57: ## %cond.store55
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm3		; AVX2-NEXT: vpextrb $12, %xmm1, 28(%rdi)
; AVX2-NEXT: vpextrb $12, %xmm3, 28(%rdi)
; AVX2-NEXT: LBB16_58: ## %else56		; AVX2-NEXT: LBB16_58: ## %else56
; AVX2-NEXT: vpextrb $13, %xmm2, %eax		; AVX2-NEXT: vpextrb $13, %xmm2, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
; AVX2-NEXT: je LBB16_60		; AVX2-NEXT: je LBB16_60
; AVX2-NEXT: ## %bb.59: ## %cond.store57		; AVX2-NEXT: ## %bb.59: ## %cond.store57
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX2-NEXT: vpextrb $13, %xmm1, 29(%rdi)
; AVX2-NEXT: vpextrb $13, %xmm2, 29(%rdi)
; AVX2-NEXT: LBB16_60: ## %else58		; AVX2-NEXT: LBB16_60: ## %else58
; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX2-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm0		; AVX2-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm0
; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0		; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
; AVX2-NEXT: vpextrb $14, %xmm0, %eax		; AVX2-NEXT: vpextrb $14, %xmm0, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
; AVX2-NEXT: je LBB16_62		; AVX2-NEXT: je LBB16_62
; AVX2-NEXT: ## %bb.61: ## %cond.store59		; AVX2-NEXT: ## %bb.61: ## %cond.store59
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX2-NEXT: vpextrb $14, %xmm1, 30(%rdi)
; AVX2-NEXT: vpextrb $14, %xmm2, 30(%rdi)
; AVX2-NEXT: LBB16_62: ## %else60		; AVX2-NEXT: LBB16_62: ## %else60
; AVX2-NEXT: vpextrb $15, %xmm0, %eax		; AVX2-NEXT: vpextrb $15, %xmm0, %eax
; AVX2-NEXT: testb $1, %al		; AVX2-NEXT: testb $1, %al
; AVX2-NEXT: je LBB16_64		; AVX2-NEXT: je LBB16_64
; AVX2-NEXT: ## %bb.63: ## %cond.store61		; AVX2-NEXT: ## %bb.63: ## %cond.store61
; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm0		; AVX2-NEXT: vpextrb $15, %xmm1, 31(%rdi)
; AVX2-NEXT: vpextrb $15, %xmm0, 31(%rdi)
; AVX2-NEXT: LBB16_64: ## %else62		; AVX2-NEXT: LBB16_64: ## %else62
; AVX2-NEXT: vzeroupper		; AVX2-NEXT: vzeroupper
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; AVX512F-LABEL: store_v32i8_v32i8:		; AVX512F-LABEL: store_v32i8_v32i8:
; AVX512F: ## %bb.0:		; AVX512F: ## %bb.0:
; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512F-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2		; AVX512F-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2
▲ Show 20 Lines • Show All 156 Lines • ▼ Show 20 Lines
; AVX512F-NEXT: LBB16_32: ## %else30		; AVX512F-NEXT: LBB16_32: ## %else30
; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512F-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2		; AVX512F-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2
; AVX512F-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX512F-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX512F-NEXT: vpmovsxbd %xmm2, %zmm2		; AVX512F-NEXT: vpmovsxbd %xmm2, %zmm2
; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0		; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0
; AVX512F-NEXT: kmovw %k0, %eax		; AVX512F-NEXT: kmovw %k0, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
		; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
; AVX512F-NEXT: je LBB16_34		; AVX512F-NEXT: je LBB16_34
; AVX512F-NEXT: ## %bb.33: ## %cond.store31		; AVX512F-NEXT: ## %bb.33: ## %cond.store31
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512F-NEXT: vpextrb $0, %xmm1, 16(%rdi)
; AVX512F-NEXT: vpextrb $0, %xmm2, 16(%rdi)
; AVX512F-NEXT: LBB16_34: ## %else32		; AVX512F-NEXT: LBB16_34: ## %else32
; AVX512F-NEXT: kshiftrw $1, %k0, %k0		; AVX512F-NEXT: kshiftrw $1, %k0, %k0
; AVX512F-NEXT: kmovw %k0, %eax		; AVX512F-NEXT: kmovw %k0, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
; AVX512F-NEXT: je LBB16_36		; AVX512F-NEXT: je LBB16_36
; AVX512F-NEXT: ## %bb.35: ## %cond.store33		; AVX512F-NEXT: ## %bb.35: ## %cond.store33
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512F-NEXT: vpextrb $1, %xmm1, 17(%rdi)
; AVX512F-NEXT: vpextrb $1, %xmm2, 17(%rdi)
; AVX512F-NEXT: LBB16_36: ## %else34		; AVX512F-NEXT: LBB16_36: ## %else34
; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512F-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2		; AVX512F-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2
; AVX512F-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX512F-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX512F-NEXT: vpmovsxbd %xmm2, %zmm2		; AVX512F-NEXT: vpmovsxbd %xmm2, %zmm2
; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0		; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0
; AVX512F-NEXT: kshiftrw $2, %k0, %k1		; AVX512F-NEXT: kshiftrw $2, %k0, %k1
; AVX512F-NEXT: kmovw %k1, %eax		; AVX512F-NEXT: kmovw %k1, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
; AVX512F-NEXT: je LBB16_38		; AVX512F-NEXT: je LBB16_38
; AVX512F-NEXT: ## %bb.37: ## %cond.store35		; AVX512F-NEXT: ## %bb.37: ## %cond.store35
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512F-NEXT: vpextrb $2, %xmm1, 18(%rdi)
; AVX512F-NEXT: vpextrb $2, %xmm2, 18(%rdi)
; AVX512F-NEXT: LBB16_38: ## %else36		; AVX512F-NEXT: LBB16_38: ## %else36
; AVX512F-NEXT: kshiftrw $3, %k0, %k0		; AVX512F-NEXT: kshiftrw $3, %k0, %k0
; AVX512F-NEXT: kmovw %k0, %eax		; AVX512F-NEXT: kmovw %k0, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
; AVX512F-NEXT: je LBB16_40		; AVX512F-NEXT: je LBB16_40
; AVX512F-NEXT: ## %bb.39: ## %cond.store37		; AVX512F-NEXT: ## %bb.39: ## %cond.store37
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512F-NEXT: vpextrb $3, %xmm1, 19(%rdi)
; AVX512F-NEXT: vpextrb $3, %xmm2, 19(%rdi)
; AVX512F-NEXT: LBB16_40: ## %else38		; AVX512F-NEXT: LBB16_40: ## %else38
; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512F-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2		; AVX512F-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2
; AVX512F-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX512F-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX512F-NEXT: vpmovsxbd %xmm2, %zmm2		; AVX512F-NEXT: vpmovsxbd %xmm2, %zmm2
; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0		; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0
; AVX512F-NEXT: kshiftrw $4, %k0, %k1		; AVX512F-NEXT: kshiftrw $4, %k0, %k1
; AVX512F-NEXT: kmovw %k1, %eax		; AVX512F-NEXT: kmovw %k1, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
; AVX512F-NEXT: je LBB16_42		; AVX512F-NEXT: je LBB16_42
; AVX512F-NEXT: ## %bb.41: ## %cond.store39		; AVX512F-NEXT: ## %bb.41: ## %cond.store39
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512F-NEXT: vpextrb $4, %xmm1, 20(%rdi)
; AVX512F-NEXT: vpextrb $4, %xmm2, 20(%rdi)
; AVX512F-NEXT: LBB16_42: ## %else40		; AVX512F-NEXT: LBB16_42: ## %else40
; AVX512F-NEXT: kshiftrw $5, %k0, %k0		; AVX512F-NEXT: kshiftrw $5, %k0, %k0
; AVX512F-NEXT: kmovw %k0, %eax		; AVX512F-NEXT: kmovw %k0, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
; AVX512F-NEXT: je LBB16_44		; AVX512F-NEXT: je LBB16_44
; AVX512F-NEXT: ## %bb.43: ## %cond.store41		; AVX512F-NEXT: ## %bb.43: ## %cond.store41
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512F-NEXT: vpextrb $5, %xmm1, 21(%rdi)
; AVX512F-NEXT: vpextrb $5, %xmm2, 21(%rdi)
; AVX512F-NEXT: LBB16_44: ## %else42		; AVX512F-NEXT: LBB16_44: ## %else42
; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512F-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2		; AVX512F-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2
; AVX512F-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX512F-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX512F-NEXT: vpmovsxbd %xmm2, %zmm2		; AVX512F-NEXT: vpmovsxbd %xmm2, %zmm2
; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0		; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0
; AVX512F-NEXT: kshiftrw $6, %k0, %k1		; AVX512F-NEXT: kshiftrw $6, %k0, %k1
; AVX512F-NEXT: kmovw %k1, %eax		; AVX512F-NEXT: kmovw %k1, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
; AVX512F-NEXT: je LBB16_46		; AVX512F-NEXT: je LBB16_46
; AVX512F-NEXT: ## %bb.45: ## %cond.store43		; AVX512F-NEXT: ## %bb.45: ## %cond.store43
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512F-NEXT: vpextrb $6, %xmm1, 22(%rdi)
; AVX512F-NEXT: vpextrb $6, %xmm2, 22(%rdi)
; AVX512F-NEXT: LBB16_46: ## %else44		; AVX512F-NEXT: LBB16_46: ## %else44
; AVX512F-NEXT: kshiftrw $7, %k0, %k0		; AVX512F-NEXT: kshiftrw $7, %k0, %k0
; AVX512F-NEXT: kmovw %k0, %eax		; AVX512F-NEXT: kmovw %k0, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
; AVX512F-NEXT: je LBB16_48		; AVX512F-NEXT: je LBB16_48
; AVX512F-NEXT: ## %bb.47: ## %cond.store45		; AVX512F-NEXT: ## %bb.47: ## %cond.store45
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512F-NEXT: vpextrb $7, %xmm1, 23(%rdi)
; AVX512F-NEXT: vpextrb $7, %xmm2, 23(%rdi)
; AVX512F-NEXT: LBB16_48: ## %else46		; AVX512F-NEXT: LBB16_48: ## %else46
; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512F-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2		; AVX512F-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2
; AVX512F-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX512F-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX512F-NEXT: vpmovsxbd %xmm2, %zmm2		; AVX512F-NEXT: vpmovsxbd %xmm2, %zmm2
; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0		; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0
; AVX512F-NEXT: kshiftrw $8, %k0, %k1		; AVX512F-NEXT: kshiftrw $8, %k0, %k1
; AVX512F-NEXT: kmovw %k1, %eax		; AVX512F-NEXT: kmovw %k1, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
; AVX512F-NEXT: je LBB16_50		; AVX512F-NEXT: je LBB16_50
; AVX512F-NEXT: ## %bb.49: ## %cond.store47		; AVX512F-NEXT: ## %bb.49: ## %cond.store47
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512F-NEXT: vpextrb $8, %xmm1, 24(%rdi)
; AVX512F-NEXT: vpextrb $8, %xmm2, 24(%rdi)
; AVX512F-NEXT: LBB16_50: ## %else48		; AVX512F-NEXT: LBB16_50: ## %else48
; AVX512F-NEXT: kshiftrw $9, %k0, %k0		; AVX512F-NEXT: kshiftrw $9, %k0, %k0
; AVX512F-NEXT: kmovw %k0, %eax		; AVX512F-NEXT: kmovw %k0, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
; AVX512F-NEXT: je LBB16_52		; AVX512F-NEXT: je LBB16_52
; AVX512F-NEXT: ## %bb.51: ## %cond.store49		; AVX512F-NEXT: ## %bb.51: ## %cond.store49
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512F-NEXT: vpextrb $9, %xmm1, 25(%rdi)
; AVX512F-NEXT: vpextrb $9, %xmm2, 25(%rdi)
; AVX512F-NEXT: LBB16_52: ## %else50		; AVX512F-NEXT: LBB16_52: ## %else50
; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512F-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2		; AVX512F-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2
; AVX512F-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX512F-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX512F-NEXT: vpmovsxbd %xmm2, %zmm2		; AVX512F-NEXT: vpmovsxbd %xmm2, %zmm2
; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0		; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0
; AVX512F-NEXT: kshiftrw $10, %k0, %k1		; AVX512F-NEXT: kshiftrw $10, %k0, %k1
; AVX512F-NEXT: kmovw %k1, %eax		; AVX512F-NEXT: kmovw %k1, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
; AVX512F-NEXT: je LBB16_54		; AVX512F-NEXT: je LBB16_54
; AVX512F-NEXT: ## %bb.53: ## %cond.store51		; AVX512F-NEXT: ## %bb.53: ## %cond.store51
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512F-NEXT: vpextrb $10, %xmm1, 26(%rdi)
; AVX512F-NEXT: vpextrb $10, %xmm2, 26(%rdi)
; AVX512F-NEXT: LBB16_54: ## %else52		; AVX512F-NEXT: LBB16_54: ## %else52
; AVX512F-NEXT: kshiftrw $11, %k0, %k0		; AVX512F-NEXT: kshiftrw $11, %k0, %k0
; AVX512F-NEXT: kmovw %k0, %eax		; AVX512F-NEXT: kmovw %k0, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
; AVX512F-NEXT: je LBB16_56		; AVX512F-NEXT: je LBB16_56
; AVX512F-NEXT: ## %bb.55: ## %cond.store53		; AVX512F-NEXT: ## %bb.55: ## %cond.store53
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512F-NEXT: vpextrb $11, %xmm1, 27(%rdi)
; AVX512F-NEXT: vpextrb $11, %xmm2, 27(%rdi)
; AVX512F-NEXT: LBB16_56: ## %else54		; AVX512F-NEXT: LBB16_56: ## %else54
; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512F-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2		; AVX512F-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2
; AVX512F-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX512F-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX512F-NEXT: vpmovsxbd %xmm2, %zmm2		; AVX512F-NEXT: vpmovsxbd %xmm2, %zmm2
; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0		; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0
; AVX512F-NEXT: kshiftrw $12, %k0, %k1		; AVX512F-NEXT: kshiftrw $12, %k0, %k1
; AVX512F-NEXT: kmovw %k1, %eax		; AVX512F-NEXT: kmovw %k1, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
; AVX512F-NEXT: je LBB16_58		; AVX512F-NEXT: je LBB16_58
; AVX512F-NEXT: ## %bb.57: ## %cond.store55		; AVX512F-NEXT: ## %bb.57: ## %cond.store55
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512F-NEXT: vpextrb $12, %xmm1, 28(%rdi)
; AVX512F-NEXT: vpextrb $12, %xmm2, 28(%rdi)
; AVX512F-NEXT: LBB16_58: ## %else56		; AVX512F-NEXT: LBB16_58: ## %else56
; AVX512F-NEXT: kshiftrw $13, %k0, %k0		; AVX512F-NEXT: kshiftrw $13, %k0, %k0
; AVX512F-NEXT: kmovw %k0, %eax		; AVX512F-NEXT: kmovw %k0, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
; AVX512F-NEXT: je LBB16_60		; AVX512F-NEXT: je LBB16_60
; AVX512F-NEXT: ## %bb.59: ## %cond.store57		; AVX512F-NEXT: ## %bb.59: ## %cond.store57
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512F-NEXT: vpextrb $13, %xmm1, 29(%rdi)
; AVX512F-NEXT: vpextrb $13, %xmm2, 29(%rdi)
; AVX512F-NEXT: LBB16_60: ## %else58		; AVX512F-NEXT: LBB16_60: ## %else58
; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512F-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm0		; AVX512F-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm0
; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm0		; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm0
; AVX512F-NEXT: vpmovsxbd %xmm0, %zmm0		; AVX512F-NEXT: vpmovsxbd %xmm0, %zmm0
; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k0		; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k0
; AVX512F-NEXT: kshiftrw $14, %k0, %k1		; AVX512F-NEXT: kshiftrw $14, %k0, %k1
; AVX512F-NEXT: kmovw %k1, %eax		; AVX512F-NEXT: kmovw %k1, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
; AVX512F-NEXT: je LBB16_62		; AVX512F-NEXT: je LBB16_62
; AVX512F-NEXT: ## %bb.61: ## %cond.store59		; AVX512F-NEXT: ## %bb.61: ## %cond.store59
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm0		; AVX512F-NEXT: vpextrb $14, %xmm1, 30(%rdi)
; AVX512F-NEXT: vpextrb $14, %xmm0, 30(%rdi)
; AVX512F-NEXT: LBB16_62: ## %else60		; AVX512F-NEXT: LBB16_62: ## %else60
; AVX512F-NEXT: kshiftrw $15, %k0, %k0		; AVX512F-NEXT: kshiftrw $15, %k0, %k0
; AVX512F-NEXT: kmovw %k0, %eax		; AVX512F-NEXT: kmovw %k0, %eax
; AVX512F-NEXT: testb $1, %al		; AVX512F-NEXT: testb $1, %al
; AVX512F-NEXT: je LBB16_64		; AVX512F-NEXT: je LBB16_64
; AVX512F-NEXT: ## %bb.63: ## %cond.store61		; AVX512F-NEXT: ## %bb.63: ## %cond.store61
; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm0		; AVX512F-NEXT: vpextrb $15, %xmm1, 31(%rdi)
; AVX512F-NEXT: vpextrb $15, %xmm0, 31(%rdi)
; AVX512F-NEXT: LBB16_64: ## %else62		; AVX512F-NEXT: LBB16_64: ## %else62
; AVX512F-NEXT: vzeroupper		; AVX512F-NEXT: vzeroupper
; AVX512F-NEXT: retq		; AVX512F-NEXT: retq
;		;
; AVX512VLDQ-LABEL: store_v32i8_v32i8:		; AVX512VLDQ-LABEL: store_v32i8_v32i8:
; AVX512VLDQ: ## %bb.0:		; AVX512VLDQ: ## %bb.0:
; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512VLDQ-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2		; AVX512VLDQ-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2
▲ Show 20 Lines • Show All 156 Lines • ▼ Show 20 Lines
; AVX512VLDQ-NEXT: LBB16_32: ## %else30		; AVX512VLDQ-NEXT: LBB16_32: ## %else30
; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512VLDQ-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2		; AVX512VLDQ-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX512VLDQ-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX512VLDQ-NEXT: vpmovsxbd %xmm2, %zmm2		; AVX512VLDQ-NEXT: vpmovsxbd %xmm2, %zmm2
; AVX512VLDQ-NEXT: vpmovd2m %zmm2, %k0		; AVX512VLDQ-NEXT: vpmovd2m %zmm2, %k0
; AVX512VLDQ-NEXT: kmovw %k0, %eax		; AVX512VLDQ-NEXT: kmovw %k0, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
		; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm1
; AVX512VLDQ-NEXT: je LBB16_34		; AVX512VLDQ-NEXT: je LBB16_34
; AVX512VLDQ-NEXT: ## %bb.33: ## %cond.store31		; AVX512VLDQ-NEXT: ## %bb.33: ## %cond.store31
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512VLDQ-NEXT: vpextrb $0, %xmm1, 16(%rdi)
; AVX512VLDQ-NEXT: vpextrb $0, %xmm2, 16(%rdi)
; AVX512VLDQ-NEXT: LBB16_34: ## %else32		; AVX512VLDQ-NEXT: LBB16_34: ## %else32
; AVX512VLDQ-NEXT: kshiftrw $1, %k0, %k0		; AVX512VLDQ-NEXT: kshiftrw $1, %k0, %k0
; AVX512VLDQ-NEXT: kmovw %k0, %eax		; AVX512VLDQ-NEXT: kmovw %k0, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
; AVX512VLDQ-NEXT: je LBB16_36		; AVX512VLDQ-NEXT: je LBB16_36
; AVX512VLDQ-NEXT: ## %bb.35: ## %cond.store33		; AVX512VLDQ-NEXT: ## %bb.35: ## %cond.store33
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512VLDQ-NEXT: vpextrb $1, %xmm1, 17(%rdi)
; AVX512VLDQ-NEXT: vpextrb $1, %xmm2, 17(%rdi)
; AVX512VLDQ-NEXT: LBB16_36: ## %else34		; AVX512VLDQ-NEXT: LBB16_36: ## %else34
; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512VLDQ-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2		; AVX512VLDQ-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX512VLDQ-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX512VLDQ-NEXT: vpmovsxbd %xmm2, %zmm2		; AVX512VLDQ-NEXT: vpmovsxbd %xmm2, %zmm2
; AVX512VLDQ-NEXT: vpmovd2m %zmm2, %k0		; AVX512VLDQ-NEXT: vpmovd2m %zmm2, %k0
; AVX512VLDQ-NEXT: kshiftrw $2, %k0, %k1		; AVX512VLDQ-NEXT: kshiftrw $2, %k0, %k1
; AVX512VLDQ-NEXT: kmovw %k1, %eax		; AVX512VLDQ-NEXT: kmovw %k1, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
; AVX512VLDQ-NEXT: je LBB16_38		; AVX512VLDQ-NEXT: je LBB16_38
; AVX512VLDQ-NEXT: ## %bb.37: ## %cond.store35		; AVX512VLDQ-NEXT: ## %bb.37: ## %cond.store35
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512VLDQ-NEXT: vpextrb $2, %xmm1, 18(%rdi)
; AVX512VLDQ-NEXT: vpextrb $2, %xmm2, 18(%rdi)
; AVX512VLDQ-NEXT: LBB16_38: ## %else36		; AVX512VLDQ-NEXT: LBB16_38: ## %else36
; AVX512VLDQ-NEXT: kshiftrw $3, %k0, %k0		; AVX512VLDQ-NEXT: kshiftrw $3, %k0, %k0
; AVX512VLDQ-NEXT: kmovw %k0, %eax		; AVX512VLDQ-NEXT: kmovw %k0, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
; AVX512VLDQ-NEXT: je LBB16_40		; AVX512VLDQ-NEXT: je LBB16_40
; AVX512VLDQ-NEXT: ## %bb.39: ## %cond.store37		; AVX512VLDQ-NEXT: ## %bb.39: ## %cond.store37
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512VLDQ-NEXT: vpextrb $3, %xmm1, 19(%rdi)
; AVX512VLDQ-NEXT: vpextrb $3, %xmm2, 19(%rdi)
; AVX512VLDQ-NEXT: LBB16_40: ## %else38		; AVX512VLDQ-NEXT: LBB16_40: ## %else38
; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512VLDQ-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2		; AVX512VLDQ-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX512VLDQ-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX512VLDQ-NEXT: vpmovsxbd %xmm2, %zmm2		; AVX512VLDQ-NEXT: vpmovsxbd %xmm2, %zmm2
; AVX512VLDQ-NEXT: vpmovd2m %zmm2, %k0		; AVX512VLDQ-NEXT: vpmovd2m %zmm2, %k0
; AVX512VLDQ-NEXT: kshiftrw $4, %k0, %k1		; AVX512VLDQ-NEXT: kshiftrw $4, %k0, %k1
; AVX512VLDQ-NEXT: kmovw %k1, %eax		; AVX512VLDQ-NEXT: kmovw %k1, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
; AVX512VLDQ-NEXT: je LBB16_42		; AVX512VLDQ-NEXT: je LBB16_42
; AVX512VLDQ-NEXT: ## %bb.41: ## %cond.store39		; AVX512VLDQ-NEXT: ## %bb.41: ## %cond.store39
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512VLDQ-NEXT: vpextrb $4, %xmm1, 20(%rdi)
; AVX512VLDQ-NEXT: vpextrb $4, %xmm2, 20(%rdi)
; AVX512VLDQ-NEXT: LBB16_42: ## %else40		; AVX512VLDQ-NEXT: LBB16_42: ## %else40
; AVX512VLDQ-NEXT: kshiftrw $5, %k0, %k0		; AVX512VLDQ-NEXT: kshiftrw $5, %k0, %k0
; AVX512VLDQ-NEXT: kmovw %k0, %eax		; AVX512VLDQ-NEXT: kmovw %k0, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
; AVX512VLDQ-NEXT: je LBB16_44		; AVX512VLDQ-NEXT: je LBB16_44
; AVX512VLDQ-NEXT: ## %bb.43: ## %cond.store41		; AVX512VLDQ-NEXT: ## %bb.43: ## %cond.store41
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512VLDQ-NEXT: vpextrb $5, %xmm1, 21(%rdi)
; AVX512VLDQ-NEXT: vpextrb $5, %xmm2, 21(%rdi)
; AVX512VLDQ-NEXT: LBB16_44: ## %else42		; AVX512VLDQ-NEXT: LBB16_44: ## %else42
; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512VLDQ-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2		; AVX512VLDQ-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX512VLDQ-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX512VLDQ-NEXT: vpmovsxbd %xmm2, %zmm2		; AVX512VLDQ-NEXT: vpmovsxbd %xmm2, %zmm2
; AVX512VLDQ-NEXT: vpmovd2m %zmm2, %k0		; AVX512VLDQ-NEXT: vpmovd2m %zmm2, %k0
; AVX512VLDQ-NEXT: kshiftrw $6, %k0, %k1		; AVX512VLDQ-NEXT: kshiftrw $6, %k0, %k1
; AVX512VLDQ-NEXT: kmovw %k1, %eax		; AVX512VLDQ-NEXT: kmovw %k1, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
; AVX512VLDQ-NEXT: je LBB16_46		; AVX512VLDQ-NEXT: je LBB16_46
; AVX512VLDQ-NEXT: ## %bb.45: ## %cond.store43		; AVX512VLDQ-NEXT: ## %bb.45: ## %cond.store43
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512VLDQ-NEXT: vpextrb $6, %xmm1, 22(%rdi)
; AVX512VLDQ-NEXT: vpextrb $6, %xmm2, 22(%rdi)
; AVX512VLDQ-NEXT: LBB16_46: ## %else44		; AVX512VLDQ-NEXT: LBB16_46: ## %else44
; AVX512VLDQ-NEXT: kshiftrw $7, %k0, %k0		; AVX512VLDQ-NEXT: kshiftrw $7, %k0, %k0
; AVX512VLDQ-NEXT: kmovw %k0, %eax		; AVX512VLDQ-NEXT: kmovw %k0, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
; AVX512VLDQ-NEXT: je LBB16_48		; AVX512VLDQ-NEXT: je LBB16_48
; AVX512VLDQ-NEXT: ## %bb.47: ## %cond.store45		; AVX512VLDQ-NEXT: ## %bb.47: ## %cond.store45
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512VLDQ-NEXT: vpextrb $7, %xmm1, 23(%rdi)
; AVX512VLDQ-NEXT: vpextrb $7, %xmm2, 23(%rdi)
; AVX512VLDQ-NEXT: LBB16_48: ## %else46		; AVX512VLDQ-NEXT: LBB16_48: ## %else46
; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512VLDQ-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2		; AVX512VLDQ-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX512VLDQ-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX512VLDQ-NEXT: vpmovsxbd %xmm2, %zmm2		; AVX512VLDQ-NEXT: vpmovsxbd %xmm2, %zmm2
; AVX512VLDQ-NEXT: vpmovd2m %zmm2, %k0		; AVX512VLDQ-NEXT: vpmovd2m %zmm2, %k0
; AVX512VLDQ-NEXT: kshiftrw $8, %k0, %k1		; AVX512VLDQ-NEXT: kshiftrw $8, %k0, %k1
; AVX512VLDQ-NEXT: kmovw %k1, %eax		; AVX512VLDQ-NEXT: kmovw %k1, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
; AVX512VLDQ-NEXT: je LBB16_50		; AVX512VLDQ-NEXT: je LBB16_50
; AVX512VLDQ-NEXT: ## %bb.49: ## %cond.store47		; AVX512VLDQ-NEXT: ## %bb.49: ## %cond.store47
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512VLDQ-NEXT: vpextrb $8, %xmm1, 24(%rdi)
; AVX512VLDQ-NEXT: vpextrb $8, %xmm2, 24(%rdi)
; AVX512VLDQ-NEXT: LBB16_50: ## %else48		; AVX512VLDQ-NEXT: LBB16_50: ## %else48
; AVX512VLDQ-NEXT: kshiftrw $9, %k0, %k0		; AVX512VLDQ-NEXT: kshiftrw $9, %k0, %k0
; AVX512VLDQ-NEXT: kmovw %k0, %eax		; AVX512VLDQ-NEXT: kmovw %k0, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
; AVX512VLDQ-NEXT: je LBB16_52		; AVX512VLDQ-NEXT: je LBB16_52
; AVX512VLDQ-NEXT: ## %bb.51: ## %cond.store49		; AVX512VLDQ-NEXT: ## %bb.51: ## %cond.store49
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512VLDQ-NEXT: vpextrb $9, %xmm1, 25(%rdi)
; AVX512VLDQ-NEXT: vpextrb $9, %xmm2, 25(%rdi)
; AVX512VLDQ-NEXT: LBB16_52: ## %else50		; AVX512VLDQ-NEXT: LBB16_52: ## %else50
; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512VLDQ-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2		; AVX512VLDQ-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX512VLDQ-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX512VLDQ-NEXT: vpmovsxbd %xmm2, %zmm2		; AVX512VLDQ-NEXT: vpmovsxbd %xmm2, %zmm2
; AVX512VLDQ-NEXT: vpmovd2m %zmm2, %k0		; AVX512VLDQ-NEXT: vpmovd2m %zmm2, %k0
; AVX512VLDQ-NEXT: kshiftrw $10, %k0, %k1		; AVX512VLDQ-NEXT: kshiftrw $10, %k0, %k1
; AVX512VLDQ-NEXT: kmovw %k1, %eax		; AVX512VLDQ-NEXT: kmovw %k1, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
; AVX512VLDQ-NEXT: je LBB16_54		; AVX512VLDQ-NEXT: je LBB16_54
; AVX512VLDQ-NEXT: ## %bb.53: ## %cond.store51		; AVX512VLDQ-NEXT: ## %bb.53: ## %cond.store51
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512VLDQ-NEXT: vpextrb $10, %xmm1, 26(%rdi)
; AVX512VLDQ-NEXT: vpextrb $10, %xmm2, 26(%rdi)
; AVX512VLDQ-NEXT: LBB16_54: ## %else52		; AVX512VLDQ-NEXT: LBB16_54: ## %else52
; AVX512VLDQ-NEXT: kshiftrw $11, %k0, %k0		; AVX512VLDQ-NEXT: kshiftrw $11, %k0, %k0
; AVX512VLDQ-NEXT: kmovw %k0, %eax		; AVX512VLDQ-NEXT: kmovw %k0, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
; AVX512VLDQ-NEXT: je LBB16_56		; AVX512VLDQ-NEXT: je LBB16_56
; AVX512VLDQ-NEXT: ## %bb.55: ## %cond.store53		; AVX512VLDQ-NEXT: ## %bb.55: ## %cond.store53
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512VLDQ-NEXT: vpextrb $11, %xmm1, 27(%rdi)
; AVX512VLDQ-NEXT: vpextrb $11, %xmm2, 27(%rdi)
; AVX512VLDQ-NEXT: LBB16_56: ## %else54		; AVX512VLDQ-NEXT: LBB16_56: ## %else54
; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512VLDQ-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2		; AVX512VLDQ-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm2
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm2, %xmm2		; AVX512VLDQ-NEXT: vextracti128 $1, %ymm2, %xmm2
; AVX512VLDQ-NEXT: vpmovsxbd %xmm2, %zmm2		; AVX512VLDQ-NEXT: vpmovsxbd %xmm2, %zmm2
; AVX512VLDQ-NEXT: vpmovd2m %zmm2, %k0		; AVX512VLDQ-NEXT: vpmovd2m %zmm2, %k0
; AVX512VLDQ-NEXT: kshiftrw $12, %k0, %k1		; AVX512VLDQ-NEXT: kshiftrw $12, %k0, %k1
; AVX512VLDQ-NEXT: kmovw %k1, %eax		; AVX512VLDQ-NEXT: kmovw %k1, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
; AVX512VLDQ-NEXT: je LBB16_58		; AVX512VLDQ-NEXT: je LBB16_58
; AVX512VLDQ-NEXT: ## %bb.57: ## %cond.store55		; AVX512VLDQ-NEXT: ## %bb.57: ## %cond.store55
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512VLDQ-NEXT: vpextrb $12, %xmm1, 28(%rdi)
; AVX512VLDQ-NEXT: vpextrb $12, %xmm2, 28(%rdi)
; AVX512VLDQ-NEXT: LBB16_58: ## %else56		; AVX512VLDQ-NEXT: LBB16_58: ## %else56
; AVX512VLDQ-NEXT: kshiftrw $13, %k0, %k0		; AVX512VLDQ-NEXT: kshiftrw $13, %k0, %k0
; AVX512VLDQ-NEXT: kmovw %k0, %eax		; AVX512VLDQ-NEXT: kmovw %k0, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
; AVX512VLDQ-NEXT: je LBB16_60		; AVX512VLDQ-NEXT: je LBB16_60
; AVX512VLDQ-NEXT: ## %bb.59: ## %cond.store57		; AVX512VLDQ-NEXT: ## %bb.59: ## %cond.store57
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm2		; AVX512VLDQ-NEXT: vpextrb $13, %xmm1, 29(%rdi)
; AVX512VLDQ-NEXT: vpextrb $13, %xmm2, 29(%rdi)
; AVX512VLDQ-NEXT: LBB16_60: ## %else58		; AVX512VLDQ-NEXT: LBB16_60: ## %else58
; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512VLDQ-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512VLDQ-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm0		; AVX512VLDQ-NEXT: vpcmpeqb %ymm2, %ymm0, %ymm0
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm0, %xmm0		; AVX512VLDQ-NEXT: vextracti128 $1, %ymm0, %xmm0
; AVX512VLDQ-NEXT: vpmovsxbd %xmm0, %zmm0		; AVX512VLDQ-NEXT: vpmovsxbd %xmm0, %zmm0
; AVX512VLDQ-NEXT: vpmovd2m %zmm0, %k0		; AVX512VLDQ-NEXT: vpmovd2m %zmm0, %k0
; AVX512VLDQ-NEXT: kshiftrw $14, %k0, %k1		; AVX512VLDQ-NEXT: kshiftrw $14, %k0, %k1
; AVX512VLDQ-NEXT: kmovw %k1, %eax		; AVX512VLDQ-NEXT: kmovw %k1, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
; AVX512VLDQ-NEXT: je LBB16_62		; AVX512VLDQ-NEXT: je LBB16_62
; AVX512VLDQ-NEXT: ## %bb.61: ## %cond.store59		; AVX512VLDQ-NEXT: ## %bb.61: ## %cond.store59
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm0		; AVX512VLDQ-NEXT: vpextrb $14, %xmm1, 30(%rdi)
; AVX512VLDQ-NEXT: vpextrb $14, %xmm0, 30(%rdi)
; AVX512VLDQ-NEXT: LBB16_62: ## %else60		; AVX512VLDQ-NEXT: LBB16_62: ## %else60
; AVX512VLDQ-NEXT: kshiftrw $15, %k0, %k0		; AVX512VLDQ-NEXT: kshiftrw $15, %k0, %k0
; AVX512VLDQ-NEXT: kmovw %k0, %eax		; AVX512VLDQ-NEXT: kmovw %k0, %eax
; AVX512VLDQ-NEXT: testb $1, %al		; AVX512VLDQ-NEXT: testb $1, %al
; AVX512VLDQ-NEXT: je LBB16_64		; AVX512VLDQ-NEXT: je LBB16_64
; AVX512VLDQ-NEXT: ## %bb.63: ## %cond.store61		; AVX512VLDQ-NEXT: ## %bb.63: ## %cond.store61
; AVX512VLDQ-NEXT: vextracti128 $1, %ymm1, %xmm0		; AVX512VLDQ-NEXT: vpextrb $15, %xmm1, 31(%rdi)
; AVX512VLDQ-NEXT: vpextrb $15, %xmm0, 31(%rdi)
; AVX512VLDQ-NEXT: LBB16_64: ## %else62		; AVX512VLDQ-NEXT: LBB16_64: ## %else62
; AVX512VLDQ-NEXT: vzeroupper		; AVX512VLDQ-NEXT: vzeroupper
; AVX512VLDQ-NEXT: retq		; AVX512VLDQ-NEXT: retq
;		;
; AVX512VLBW-LABEL: store_v32i8_v32i8:		; AVX512VLBW-LABEL: store_v32i8_v32i8:
; AVX512VLBW: ## %bb.0:		; AVX512VLBW: ## %bb.0:
; AVX512VLBW-NEXT: vptestnmb %ymm0, %ymm0, %k1		; AVX512VLBW-NEXT: vptestnmb %ymm0, %ymm0, %k1
; AVX512VLBW-NEXT: vmovdqu8 %ymm1, (%rdi) {%k1}		; AVX512VLBW-NEXT: vmovdqu8 %ymm1, (%rdi) {%k1}
▲ Show 20 Lines • Show All 516 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/masked_store_trunc.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 657 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm3[0,2,2,3]			; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm3[0,2,2,3]
	; SSE2-NEXT: pshuflw {{.*#+}} xmm3 = xmm0[0,1,0,2,4,5,6,7]			; SSE2-NEXT: pshuflw {{.*#+}} xmm3 = xmm0[0,1,0,2,4,5,6,7]
	; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm2[0,2,2,3]			; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm2[0,2,2,3]
	; SSE2-NEXT: pshuflw {{.*#+}} xmm0 = xmm0[0,1,0,2,4,5,6,7]			; SSE2-NEXT: pshuflw {{.*#+}} xmm0 = xmm0[0,1,0,2,4,5,6,7]
	; SSE2-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm3[0],xmm0[1],xmm3[1]			; SSE2-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm3[0],xmm0[1],xmm3[1]
	; SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]			; SSE2-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
	; SSE2-NEXT: movd %xmm7, %eax			; SSE2-NEXT: movd %xmm7, %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: je .LBB2_2			; SSE2-NEXT: je .LBB2_2
	; SSE2-NEXT: # %bb.1: # %cond.store			; SSE2-NEXT: # %bb.1: # %cond.store
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: movb %al, (%rdi)			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: .LBB2_2: # %else			; SSE2-NEXT: .LBB2_2: # %else
	; SSE2-NEXT: psrlq $16, %xmm6			; SSE2-NEXT: psrlq $16, %xmm6
	; SSE2-NEXT: movd %xmm6, %eax			; SSE2-NEXT: movd %xmm6, %ecx
	; SSE2-NEXT: shrl $16, %eax			; SSE2-NEXT: shrl $16, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB2_4			; SSE2-NEXT: je .LBB2_4
	; SSE2-NEXT: # %bb.3: # %cond.store1			; SSE2-NEXT: # %bb.3: # %cond.store1
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: shrl $16, %eax			; SSE2-NEXT: shrl $16, %eax
	; SSE2-NEXT: movb %al, 1(%rdi)			; SSE2-NEXT: movb %al, 1(%rdi)
	; SSE2-NEXT: .LBB2_4: # %else2			; SSE2-NEXT: .LBB2_4: # %else2
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm4			; SSE2-NEXT: pcmpeqd %xmm1, %xmm4
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm1			; SSE2-NEXT: pcmpeqd %xmm1, %xmm1
	; SSE2-NEXT: pxor %xmm4, %xmm1			; SSE2-NEXT: pxor %xmm4, %xmm1
	; SSE2-NEXT: pextrw $4, %xmm1, %eax			; SSE2-NEXT: pextrw $4, %xmm1, %eax
	▲ Show 20 Lines • Show All 1,607 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm4			; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm4
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpxor %xmm2, %xmm4, %xmm4			; AVX1-NEXT: vpxor %xmm2, %xmm4, %xmm4
	; AVX1-NEXT: vpackssdw %xmm0, %xmm4, %xmm4			; AVX1-NEXT: vpackssdw %xmm0, %xmm4, %xmm4
	; AVX1-NEXT: vpacksswb %xmm4, %xmm0, %xmm4			; AVX1-NEXT: vpacksswb %xmm4, %xmm0, %xmm4
	; AVX1-NEXT: vpextrb $8, %xmm4, %eax			; AVX1-NEXT: vpextrb $8, %xmm4, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
				; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: je .LBB9_18			; AVX1-NEXT: je .LBB9_18
	; AVX1-NEXT: # %bb.17: # %cond.store15			; AVX1-NEXT: # %bb.17: # %cond.store15
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vpextrw $0, %xmm0, 16(%rdi)
	; AVX1-NEXT: vpextrw $0, %xmm4, 16(%rdi)
	; AVX1-NEXT: .LBB9_18: # %else16			; AVX1-NEXT: .LBB9_18: # %else16
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpackssdw %xmm0, %xmm1, %xmm1			; AVX1-NEXT: vpackssdw %xmm0, %xmm1, %xmm1
	; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpextrb $9, %xmm1, %eax			; AVX1-NEXT: vpextrb $9, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB9_20			; AVX1-NEXT: je .LBB9_20
	; AVX1-NEXT: # %bb.19: # %cond.store17			; AVX1-NEXT: # %bb.19: # %cond.store17
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vpextrw $1, %xmm0, 18(%rdi)
	; AVX1-NEXT: vpextrw $1, %xmm1, 18(%rdi)
	; AVX1-NEXT: .LBB9_20: # %else18			; AVX1-NEXT: .LBB9_20: # %else18
	; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm4			; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm4
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpxor %xmm2, %xmm4, %xmm4			; AVX1-NEXT: vpxor %xmm2, %xmm4, %xmm4
	; AVX1-NEXT: vpackssdw %xmm0, %xmm4, %xmm4			; AVX1-NEXT: vpackssdw %xmm0, %xmm4, %xmm4
	; AVX1-NEXT: vpacksswb %xmm4, %xmm0, %xmm4			; AVX1-NEXT: vpacksswb %xmm4, %xmm0, %xmm4
	; AVX1-NEXT: vpextrb $10, %xmm4, %eax			; AVX1-NEXT: vpextrb $10, %xmm4, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB9_22			; AVX1-NEXT: je .LBB9_22
	; AVX1-NEXT: # %bb.21: # %cond.store19			; AVX1-NEXT: # %bb.21: # %cond.store19
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vpextrw $2, %xmm0, 20(%rdi)
	; AVX1-NEXT: vpextrw $2, %xmm4, 20(%rdi)
	; AVX1-NEXT: .LBB9_22: # %else20			; AVX1-NEXT: .LBB9_22: # %else20
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpackssdw %xmm0, %xmm1, %xmm1			; AVX1-NEXT: vpackssdw %xmm0, %xmm1, %xmm1
	; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpextrb $11, %xmm1, %eax			; AVX1-NEXT: vpextrb $11, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB9_24			; AVX1-NEXT: je .LBB9_24
	; AVX1-NEXT: # %bb.23: # %cond.store21			; AVX1-NEXT: # %bb.23: # %cond.store21
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vpextrw $3, %xmm0, 22(%rdi)
	; AVX1-NEXT: vpextrw $3, %xmm1, 22(%rdi)
	; AVX1-NEXT: .LBB9_24: # %else22			; AVX1-NEXT: .LBB9_24: # %else22
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm1
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpackssdw %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpackssdw %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vpacksswb %xmm3, %xmm0, %xmm3			; AVX1-NEXT: vpacksswb %xmm3, %xmm0, %xmm3
	; AVX1-NEXT: vpextrb $12, %xmm3, %eax			; AVX1-NEXT: vpextrb $12, %xmm3, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB9_26			; AVX1-NEXT: je .LBB9_26
	; AVX1-NEXT: # %bb.25: # %cond.store23			; AVX1-NEXT: # %bb.25: # %cond.store23
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrw $4, %xmm0, 24(%rdi)
	; AVX1-NEXT: vpextrw $4, %xmm3, 24(%rdi)
	; AVX1-NEXT: .LBB9_26: # %else24			; AVX1-NEXT: .LBB9_26: # %else24
	; AVX1-NEXT: vpackssdw %xmm2, %xmm0, %xmm2			; AVX1-NEXT: vpackssdw %xmm2, %xmm0, %xmm2
	; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm2			; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm2
	; AVX1-NEXT: vpextrb $13, %xmm2, %eax			; AVX1-NEXT: vpextrb $13, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB9_28			; AVX1-NEXT: je .LBB9_28
	; AVX1-NEXT: # %bb.27: # %cond.store25			; AVX1-NEXT: # %bb.27: # %cond.store25
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrw $5, %xmm0, 26(%rdi)
	; AVX1-NEXT: vpextrw $5, %xmm2, 26(%rdi)
	; AVX1-NEXT: .LBB9_28: # %else26			; AVX1-NEXT: .LBB9_28: # %else26
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm2			; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm2
	; AVX1-NEXT: vpextrb $14, %xmm2, %eax			; AVX1-NEXT: vpextrb $14, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB9_30			; AVX1-NEXT: je .LBB9_30
	; AVX1-NEXT: # %bb.29: # %cond.store27			; AVX1-NEXT: # %bb.29: # %cond.store27
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrw $6, %xmm0, 28(%rdi)
	; AVX1-NEXT: vpextrw $6, %xmm2, 28(%rdi)
	; AVX1-NEXT: .LBB9_30: # %else28			; AVX1-NEXT: .LBB9_30: # %else28
	; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpextrb $15, %xmm1, %eax			; AVX1-NEXT: vpextrb $15, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB9_32			; AVX1-NEXT: je .LBB9_32
	; AVX1-NEXT: # %bb.31: # %cond.store29			; AVX1-NEXT: # %bb.31: # %cond.store29
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: vpextrw $7, %xmm0, 30(%rdi)			; AVX1-NEXT: vpextrw $7, %xmm0, 30(%rdi)
	; AVX1-NEXT: .LBB9_32: # %else30			; AVX1-NEXT: .LBB9_32: # %else30
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: truncstore_v16i32_v16i16:			; AVX2-LABEL: truncstore_v16i32_v16i16:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpxor %xmm4, %xmm4, %xmm4			; AVX2-NEXT: vpxor %xmm4, %xmm4, %xmm4
	▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1
	; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm4			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm4
	; AVX2-NEXT: vpackssdw %xmm0, %xmm4, %xmm4			; AVX2-NEXT: vpackssdw %xmm0, %xmm4, %xmm4
	; AVX2-NEXT: vpacksswb %xmm4, %xmm0, %xmm4			; AVX2-NEXT: vpacksswb %xmm4, %xmm0, %xmm4
	; AVX2-NEXT: vpextrb $8, %xmm4, %eax			; AVX2-NEXT: vpextrb $8, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: je .LBB9_18			; AVX2-NEXT: je .LBB9_18
	; AVX2-NEXT: # %bb.17: # %cond.store15			; AVX2-NEXT: # %bb.17: # %cond.store15
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm4			; AVX2-NEXT: vpextrw $0, %xmm0, 16(%rdi)
	; AVX2-NEXT: vpextrw $0, %xmm4, 16(%rdi)
	; AVX2-NEXT: .LBB9_18: # %else16			; AVX2-NEXT: .LBB9_18: # %else16
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpackssdw %xmm0, %xmm1, %xmm1			; AVX2-NEXT: vpackssdw %xmm0, %xmm1, %xmm1
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpextrb $9, %xmm1, %eax			; AVX2-NEXT: vpextrb $9, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB9_20			; AVX2-NEXT: je .LBB9_20
	; AVX2-NEXT: # %bb.19: # %cond.store17			; AVX2-NEXT: # %bb.19: # %cond.store17
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrw $1, %xmm0, 18(%rdi)
	; AVX2-NEXT: vpextrw $1, %xmm1, 18(%rdi)
	; AVX2-NEXT: .LBB9_20: # %else18			; AVX2-NEXT: .LBB9_20: # %else18
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1
	; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm4			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm4
	; AVX2-NEXT: vpackssdw %xmm0, %xmm4, %xmm4			; AVX2-NEXT: vpackssdw %xmm0, %xmm4, %xmm4
	; AVX2-NEXT: vpacksswb %xmm4, %xmm0, %xmm4			; AVX2-NEXT: vpacksswb %xmm4, %xmm0, %xmm4
	; AVX2-NEXT: vpextrb $10, %xmm4, %eax			; AVX2-NEXT: vpextrb $10, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB9_22			; AVX2-NEXT: je .LBB9_22
	; AVX2-NEXT: # %bb.21: # %cond.store19			; AVX2-NEXT: # %bb.21: # %cond.store19
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm4			; AVX2-NEXT: vpextrw $2, %xmm0, 20(%rdi)
	; AVX2-NEXT: vpextrw $2, %xmm4, 20(%rdi)
	; AVX2-NEXT: .LBB9_22: # %else20			; AVX2-NEXT: .LBB9_22: # %else20
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpackssdw %xmm0, %xmm1, %xmm1			; AVX2-NEXT: vpackssdw %xmm0, %xmm1, %xmm1
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpextrb $11, %xmm1, %eax			; AVX2-NEXT: vpextrb $11, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB9_24			; AVX2-NEXT: je .LBB9_24
	; AVX2-NEXT: # %bb.23: # %cond.store21			; AVX2-NEXT: # %bb.23: # %cond.store21
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrw $3, %xmm0, 22(%rdi)
	; AVX2-NEXT: vpextrw $3, %xmm1, 22(%rdi)
	; AVX2-NEXT: .LBB9_24: # %else22			; AVX2-NEXT: .LBB9_24: # %else22
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm2			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm2
	; AVX2-NEXT: vpacksswb %xmm2, %xmm0, %xmm2			; AVX2-NEXT: vpacksswb %xmm2, %xmm0, %xmm2
	; AVX2-NEXT: vpextrb $12, %xmm2, %eax			; AVX2-NEXT: vpextrb $12, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB9_26			; AVX2-NEXT: je .LBB9_26
	; AVX2-NEXT: # %bb.25: # %cond.store23			; AVX2-NEXT: # %bb.25: # %cond.store23
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm2			; AVX2-NEXT: vpextrw $4, %xmm0, 24(%rdi)
	; AVX2-NEXT: vpextrw $4, %xmm2, 24(%rdi)
	; AVX2-NEXT: .LBB9_26: # %else24			; AVX2-NEXT: .LBB9_26: # %else24
	; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpextrb $13, %xmm1, %eax			; AVX2-NEXT: vpextrb $13, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB9_28			; AVX2-NEXT: je .LBB9_28
	; AVX2-NEXT: # %bb.27: # %cond.store25			; AVX2-NEXT: # %bb.27: # %cond.store25
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrw $5, %xmm0, 26(%rdi)
	; AVX2-NEXT: vpextrw $5, %xmm1, 26(%rdi)
	; AVX2-NEXT: .LBB9_28: # %else26			; AVX2-NEXT: .LBB9_28: # %else26
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm2			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm2
	; AVX2-NEXT: vpacksswb %xmm2, %xmm0, %xmm2			; AVX2-NEXT: vpacksswb %xmm2, %xmm0, %xmm2
	; AVX2-NEXT: vpextrb $14, %xmm2, %eax			; AVX2-NEXT: vpextrb $14, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB9_30			; AVX2-NEXT: je .LBB9_30
	; AVX2-NEXT: # %bb.29: # %cond.store27			; AVX2-NEXT: # %bb.29: # %cond.store27
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm2			; AVX2-NEXT: vpextrw $6, %xmm0, 28(%rdi)
	; AVX2-NEXT: vpextrw $6, %xmm2, 28(%rdi)
	; AVX2-NEXT: .LBB9_30: # %else28			; AVX2-NEXT: .LBB9_30: # %else28
	; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpextrb $15, %xmm1, %eax			; AVX2-NEXT: vpextrb $15, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB9_32			; AVX2-NEXT: je .LBB9_32
	; AVX2-NEXT: # %bb.31: # %cond.store29			; AVX2-NEXT: # %bb.31: # %cond.store29
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: vpextrw $7, %xmm0, 30(%rdi)			; AVX2-NEXT: vpextrw $7, %xmm0, 30(%rdi)
	; AVX2-NEXT: .LBB9_32: # %else30			; AVX2-NEXT: .LBB9_32: # %else30
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: truncstore_v16i32_v16i16:			; AVX512F-LABEL: truncstore_v16i32_v16i16:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_16			; AVX512F-NEXT: je .LBB9_16
	; AVX512F-NEXT: # %bb.15: # %cond.store13			; AVX512F-NEXT: # %bb.15: # %cond.store13
	; AVX512F-NEXT: vpextrw $7, %xmm0, 14(%rdi)			; AVX512F-NEXT: vpextrw $7, %xmm0, 14(%rdi)
	; AVX512F-NEXT: .LBB9_16: # %else14			; AVX512F-NEXT: .LBB9_16: # %else14
	; AVX512F-NEXT: kshiftrw $8, %k0, %k1			; AVX512F-NEXT: kshiftrw $8, %k0, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
				; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX512F-NEXT: je .LBB9_18			; AVX512F-NEXT: je .LBB9_18
	; AVX512F-NEXT: # %bb.17: # %cond.store15			; AVX512F-NEXT: # %bb.17: # %cond.store15
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrw $0, %xmm0, 16(%rdi)
	; AVX512F-NEXT: vpextrw $0, %xmm1, 16(%rdi)
	; AVX512F-NEXT: .LBB9_18: # %else16			; AVX512F-NEXT: .LBB9_18: # %else16
	; AVX512F-NEXT: kshiftrw $9, %k0, %k1			; AVX512F-NEXT: kshiftrw $9, %k0, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_20			; AVX512F-NEXT: je .LBB9_20
	; AVX512F-NEXT: # %bb.19: # %cond.store17			; AVX512F-NEXT: # %bb.19: # %cond.store17
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrw $1, %xmm0, 18(%rdi)
	; AVX512F-NEXT: vpextrw $1, %xmm1, 18(%rdi)
	; AVX512F-NEXT: .LBB9_20: # %else18			; AVX512F-NEXT: .LBB9_20: # %else18
	; AVX512F-NEXT: kshiftrw $10, %k0, %k1			; AVX512F-NEXT: kshiftrw $10, %k0, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_22			; AVX512F-NEXT: je .LBB9_22
	; AVX512F-NEXT: # %bb.21: # %cond.store19			; AVX512F-NEXT: # %bb.21: # %cond.store19
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrw $2, %xmm0, 20(%rdi)
	; AVX512F-NEXT: vpextrw $2, %xmm1, 20(%rdi)
	; AVX512F-NEXT: .LBB9_22: # %else20			; AVX512F-NEXT: .LBB9_22: # %else20
	; AVX512F-NEXT: kshiftrw $11, %k0, %k1			; AVX512F-NEXT: kshiftrw $11, %k0, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_24			; AVX512F-NEXT: je .LBB9_24
	; AVX512F-NEXT: # %bb.23: # %cond.store21			; AVX512F-NEXT: # %bb.23: # %cond.store21
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrw $3, %xmm0, 22(%rdi)
	; AVX512F-NEXT: vpextrw $3, %xmm1, 22(%rdi)
	; AVX512F-NEXT: .LBB9_24: # %else22			; AVX512F-NEXT: .LBB9_24: # %else22
	; AVX512F-NEXT: kshiftrw $12, %k0, %k1			; AVX512F-NEXT: kshiftrw $12, %k0, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_26			; AVX512F-NEXT: je .LBB9_26
	; AVX512F-NEXT: # %bb.25: # %cond.store23			; AVX512F-NEXT: # %bb.25: # %cond.store23
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrw $4, %xmm0, 24(%rdi)
	; AVX512F-NEXT: vpextrw $4, %xmm1, 24(%rdi)
	; AVX512F-NEXT: .LBB9_26: # %else24			; AVX512F-NEXT: .LBB9_26: # %else24
	; AVX512F-NEXT: kshiftrw $13, %k0, %k1			; AVX512F-NEXT: kshiftrw $13, %k0, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_28			; AVX512F-NEXT: je .LBB9_28
	; AVX512F-NEXT: # %bb.27: # %cond.store25			; AVX512F-NEXT: # %bb.27: # %cond.store25
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrw $5, %xmm0, 26(%rdi)
	; AVX512F-NEXT: vpextrw $5, %xmm1, 26(%rdi)
	; AVX512F-NEXT: .LBB9_28: # %else26			; AVX512F-NEXT: .LBB9_28: # %else26
	; AVX512F-NEXT: kshiftrw $14, %k0, %k1			; AVX512F-NEXT: kshiftrw $14, %k0, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_30			; AVX512F-NEXT: je .LBB9_30
	; AVX512F-NEXT: # %bb.29: # %cond.store27			; AVX512F-NEXT: # %bb.29: # %cond.store27
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrw $6, %xmm0, 28(%rdi)
	; AVX512F-NEXT: vpextrw $6, %xmm1, 28(%rdi)
	; AVX512F-NEXT: .LBB9_30: # %else28			; AVX512F-NEXT: .LBB9_30: # %else28
	; AVX512F-NEXT: kshiftrw $15, %k0, %k0			; AVX512F-NEXT: kshiftrw $15, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_32			; AVX512F-NEXT: je .LBB9_32
	; AVX512F-NEXT: # %bb.31: # %cond.store29			; AVX512F-NEXT: # %bb.31: # %cond.store29
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX512F-NEXT: vpextrw $7, %xmm0, 30(%rdi)			; AVX512F-NEXT: vpextrw $7, %xmm0, 30(%rdi)
	; AVX512F-NEXT: .LBB9_32: # %else30			; AVX512F-NEXT: .LBB9_32: # %else30
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512BW-LABEL: truncstore_v16i32_v16i16:			; AVX512BW-LABEL: truncstore_v16i32_v16i16:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vptestmd %zmm1, %zmm1, %k1			; AVX512BW-NEXT: vptestmd %zmm1, %zmm1, %k1
	Show All 24 Lines
	; SSE2-NEXT: packuswb %xmm3, %xmm2			; SSE2-NEXT: packuswb %xmm3, %xmm2
	; SSE2-NEXT: pand %xmm9, %xmm1			; SSE2-NEXT: pand %xmm9, %xmm1
	; SSE2-NEXT: pand %xmm9, %xmm0			; SSE2-NEXT: pand %xmm9, %xmm0
	; SSE2-NEXT: packuswb %xmm1, %xmm0			; SSE2-NEXT: packuswb %xmm1, %xmm0
	; SSE2-NEXT: packuswb %xmm2, %xmm0			; SSE2-NEXT: packuswb %xmm2, %xmm0
	; SSE2-NEXT: movd %xmm8, %eax			; SSE2-NEXT: movd %xmm8, %eax
	; SSE2-NEXT: notl %eax			; SSE2-NEXT: notl %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: je .LBB10_2			; SSE2-NEXT: je .LBB10_2
	; SSE2-NEXT: # %bb.1: # %cond.store			; SSE2-NEXT: # %bb.1: # %cond.store
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: movb %al, (%rdi)			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: .LBB10_2: # %else			; SSE2-NEXT: .LBB10_2: # %else
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm1			; SSE2-NEXT: pcmpeqd %xmm1, %xmm1
	; SSE2-NEXT: pxor %xmm1, %xmm8			; SSE2-NEXT: pxor %xmm1, %xmm8
	; SSE2-NEXT: pextrw $2, %xmm8, %eax			; SSE2-NEXT: pextrw $2, %xmm8, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_4			; SSE2-NEXT: je .LBB10_4
	; SSE2-NEXT: # %bb.3: # %cond.store1			; SSE2-NEXT: # %bb.3: # %cond.store1
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: movb %ah, 1(%rdi)			; SSE2-NEXT: movb %ah, 1(%rdi)
	; SSE2-NEXT: .LBB10_4: # %else2			; SSE2-NEXT: .LBB10_4: # %else2
	; SSE2-NEXT: pxor %xmm2, %xmm2			; SSE2-NEXT: pxor %xmm2, %xmm2
	; SSE2-NEXT: pcmpeqd %xmm2, %xmm4			; SSE2-NEXT: pcmpeqd %xmm2, %xmm4
	; SSE2-NEXT: pxor %xmm4, %xmm1			; SSE2-NEXT: pxor %xmm4, %xmm1
	; SSE2-NEXT: pextrw $4, %xmm1, %eax			; SSE2-NEXT: pextrw $4, %xmm1, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_6			; SSE2-NEXT: je .LBB10_6
	; SSE2-NEXT: # %bb.5: # %cond.store3			; SSE2-NEXT: # %bb.5: # %cond.store3
	; SSE2-NEXT: movd %xmm0, %eax			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: shrl $16, %eax			; SSE2-NEXT: shrl $16, %ecx
	; SSE2-NEXT: movb %al, 2(%rdi)			; SSE2-NEXT: movb %cl, 2(%rdi)
	; SSE2-NEXT: .LBB10_6: # %else4			; SSE2-NEXT: .LBB10_6: # %else4
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm1			; SSE2-NEXT: pcmpeqd %xmm1, %xmm1
	; SSE2-NEXT: pxor %xmm1, %xmm4			; SSE2-NEXT: pxor %xmm1, %xmm4
	; SSE2-NEXT: pextrw $6, %xmm4, %eax			; SSE2-NEXT: pextrw $6, %xmm4, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_8			; SSE2-NEXT: je .LBB10_8
	; SSE2-NEXT: # %bb.7: # %cond.store5			; SSE2-NEXT: # %bb.7: # %cond.store5
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: shrl $24, %eax			; SSE2-NEXT: shrl $24, %eax
	; SSE2-NEXT: movb %al, 3(%rdi)			; SSE2-NEXT: movb %al, 3(%rdi)
	; SSE2-NEXT: .LBB10_8: # %else6			; SSE2-NEXT: .LBB10_8: # %else6
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm5, %xmm1			; SSE2-NEXT: pcmpeqd %xmm5, %xmm1
	; SSE2-NEXT: movd %xmm1, %eax			; SSE2-NEXT: movd %xmm1, %eax
	; SSE2-NEXT: notl %eax			; SSE2-NEXT: notl %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: pextrw $2, %xmm0, %eax
	; SSE2-NEXT: je .LBB10_10			; SSE2-NEXT: je .LBB10_10
	; SSE2-NEXT: # %bb.9: # %cond.store7			; SSE2-NEXT: # %bb.9: # %cond.store7
	; SSE2-NEXT: pextrw $2, %xmm0, %eax
	; SSE2-NEXT: movb %al, 4(%rdi)			; SSE2-NEXT: movb %al, 4(%rdi)
	; SSE2-NEXT: .LBB10_10: # %else8			; SSE2-NEXT: .LBB10_10: # %else8
	; SSE2-NEXT: pcmpeqd %xmm2, %xmm2			; SSE2-NEXT: pcmpeqd %xmm2, %xmm2
	; SSE2-NEXT: pxor %xmm2, %xmm1			; SSE2-NEXT: pxor %xmm2, %xmm1
	; SSE2-NEXT: pextrw $2, %xmm1, %eax			; SSE2-NEXT: pextrw $2, %xmm1, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_12			; SSE2-NEXT: je .LBB10_12
	; SSE2-NEXT: # %bb.11: # %cond.store9			; SSE2-NEXT: # %bb.11: # %cond.store9
	; SSE2-NEXT: pextrw $2, %xmm0, %eax
	; SSE2-NEXT: movb %ah, 5(%rdi)			; SSE2-NEXT: movb %ah, 5(%rdi)
	; SSE2-NEXT: .LBB10_12: # %else10			; SSE2-NEXT: .LBB10_12: # %else10
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm5			; SSE2-NEXT: pcmpeqd %xmm1, %xmm5
	; SSE2-NEXT: pxor %xmm5, %xmm2			; SSE2-NEXT: pxor %xmm5, %xmm2
	; SSE2-NEXT: pextrw $4, %xmm2, %eax			; SSE2-NEXT: pextrw $4, %xmm2, %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: pextrw $3, %xmm0, %eax
	; SSE2-NEXT: je .LBB10_14			; SSE2-NEXT: je .LBB10_14
	; SSE2-NEXT: # %bb.13: # %cond.store11			; SSE2-NEXT: # %bb.13: # %cond.store11
	; SSE2-NEXT: pextrw $3, %xmm0, %eax
	; SSE2-NEXT: movb %al, 6(%rdi)			; SSE2-NEXT: movb %al, 6(%rdi)
	; SSE2-NEXT: .LBB10_14: # %else12			; SSE2-NEXT: .LBB10_14: # %else12
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm1			; SSE2-NEXT: pcmpeqd %xmm1, %xmm1
	; SSE2-NEXT: pxor %xmm1, %xmm5			; SSE2-NEXT: pxor %xmm1, %xmm5
	; SSE2-NEXT: pextrw $6, %xmm5, %eax			; SSE2-NEXT: pextrw $6, %xmm5, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_16			; SSE2-NEXT: je .LBB10_16
	; SSE2-NEXT: # %bb.15: # %cond.store13			; SSE2-NEXT: # %bb.15: # %cond.store13
	; SSE2-NEXT: pextrw $3, %xmm0, %eax
	; SSE2-NEXT: movb %ah, 7(%rdi)			; SSE2-NEXT: movb %ah, 7(%rdi)
	; SSE2-NEXT: .LBB10_16: # %else14			; SSE2-NEXT: .LBB10_16: # %else14
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm6, %xmm1			; SSE2-NEXT: pcmpeqd %xmm6, %xmm1
	; SSE2-NEXT: movd %xmm1, %eax			; SSE2-NEXT: movd %xmm1, %eax
	; SSE2-NEXT: notl %eax			; SSE2-NEXT: notl %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: pextrw $4, %xmm0, %eax
	; SSE2-NEXT: je .LBB10_18			; SSE2-NEXT: je .LBB10_18
	; SSE2-NEXT: # %bb.17: # %cond.store15			; SSE2-NEXT: # %bb.17: # %cond.store15
	; SSE2-NEXT: pextrw $4, %xmm0, %eax
	; SSE2-NEXT: movb %al, 8(%rdi)			; SSE2-NEXT: movb %al, 8(%rdi)
	; SSE2-NEXT: .LBB10_18: # %else16			; SSE2-NEXT: .LBB10_18: # %else16
	; SSE2-NEXT: pcmpeqd %xmm2, %xmm2			; SSE2-NEXT: pcmpeqd %xmm2, %xmm2
	; SSE2-NEXT: pxor %xmm2, %xmm1			; SSE2-NEXT: pxor %xmm2, %xmm1
	; SSE2-NEXT: pextrw $2, %xmm1, %eax			; SSE2-NEXT: pextrw $2, %xmm1, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_20			; SSE2-NEXT: je .LBB10_20
	; SSE2-NEXT: # %bb.19: # %cond.store17			; SSE2-NEXT: # %bb.19: # %cond.store17
	; SSE2-NEXT: pextrw $4, %xmm0, %eax
	; SSE2-NEXT: movb %ah, 9(%rdi)			; SSE2-NEXT: movb %ah, 9(%rdi)
	; SSE2-NEXT: .LBB10_20: # %else18			; SSE2-NEXT: .LBB10_20: # %else18
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm6			; SSE2-NEXT: pcmpeqd %xmm1, %xmm6
	; SSE2-NEXT: pxor %xmm6, %xmm2			; SSE2-NEXT: pxor %xmm6, %xmm2
	; SSE2-NEXT: pextrw $4, %xmm2, %eax			; SSE2-NEXT: pextrw $4, %xmm2, %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: pextrw $5, %xmm0, %eax
	; SSE2-NEXT: je .LBB10_22			; SSE2-NEXT: je .LBB10_22
	; SSE2-NEXT: # %bb.21: # %cond.store19			; SSE2-NEXT: # %bb.21: # %cond.store19
	; SSE2-NEXT: pextrw $5, %xmm0, %eax
	; SSE2-NEXT: movb %al, 10(%rdi)			; SSE2-NEXT: movb %al, 10(%rdi)
	; SSE2-NEXT: .LBB10_22: # %else20			; SSE2-NEXT: .LBB10_22: # %else20
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm1			; SSE2-NEXT: pcmpeqd %xmm1, %xmm1
	; SSE2-NEXT: pxor %xmm1, %xmm6			; SSE2-NEXT: pxor %xmm1, %xmm6
	; SSE2-NEXT: pextrw $6, %xmm6, %eax			; SSE2-NEXT: pextrw $6, %xmm6, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_24			; SSE2-NEXT: je .LBB10_24
	; SSE2-NEXT: # %bb.23: # %cond.store21			; SSE2-NEXT: # %bb.23: # %cond.store21
	; SSE2-NEXT: pextrw $5, %xmm0, %eax
	; SSE2-NEXT: movb %ah, 11(%rdi)			; SSE2-NEXT: movb %ah, 11(%rdi)
	; SSE2-NEXT: .LBB10_24: # %else22			; SSE2-NEXT: .LBB10_24: # %else22
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm7, %xmm1			; SSE2-NEXT: pcmpeqd %xmm7, %xmm1
	; SSE2-NEXT: movd %xmm1, %eax			; SSE2-NEXT: movd %xmm1, %eax
	; SSE2-NEXT: notl %eax			; SSE2-NEXT: notl %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: pextrw $6, %xmm0, %eax
	; SSE2-NEXT: je .LBB10_26			; SSE2-NEXT: je .LBB10_26
	; SSE2-NEXT: # %bb.25: # %cond.store23			; SSE2-NEXT: # %bb.25: # %cond.store23
	; SSE2-NEXT: pextrw $6, %xmm0, %eax
	; SSE2-NEXT: movb %al, 12(%rdi)			; SSE2-NEXT: movb %al, 12(%rdi)
	; SSE2-NEXT: .LBB10_26: # %else24			; SSE2-NEXT: .LBB10_26: # %else24
	; SSE2-NEXT: pcmpeqd %xmm2, %xmm2			; SSE2-NEXT: pcmpeqd %xmm2, %xmm2
	; SSE2-NEXT: pxor %xmm2, %xmm1			; SSE2-NEXT: pxor %xmm2, %xmm1
	; SSE2-NEXT: pextrw $2, %xmm1, %eax			; SSE2-NEXT: pextrw $2, %xmm1, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_28			; SSE2-NEXT: je .LBB10_28
	; SSE2-NEXT: # %bb.27: # %cond.store25			; SSE2-NEXT: # %bb.27: # %cond.store25
	; SSE2-NEXT: pextrw $6, %xmm0, %eax
	; SSE2-NEXT: movb %ah, 13(%rdi)			; SSE2-NEXT: movb %ah, 13(%rdi)
	; SSE2-NEXT: .LBB10_28: # %else26			; SSE2-NEXT: .LBB10_28: # %else26
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm7			; SSE2-NEXT: pcmpeqd %xmm1, %xmm7
	; SSE2-NEXT: pxor %xmm7, %xmm2			; SSE2-NEXT: pxor %xmm7, %xmm2
	; SSE2-NEXT: pextrw $4, %xmm2, %eax			; SSE2-NEXT: pextrw $4, %xmm2, %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: pextrw $7, %xmm0, %eax
	; SSE2-NEXT: je .LBB10_30			; SSE2-NEXT: je .LBB10_30
	; SSE2-NEXT: # %bb.29: # %cond.store27			; SSE2-NEXT: # %bb.29: # %cond.store27
	; SSE2-NEXT: pextrw $7, %xmm0, %eax
	; SSE2-NEXT: movb %al, 14(%rdi)			; SSE2-NEXT: movb %al, 14(%rdi)
	; SSE2-NEXT: .LBB10_30: # %else28			; SSE2-NEXT: .LBB10_30: # %else28
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm1			; SSE2-NEXT: pcmpeqd %xmm0, %xmm0
	; SSE2-NEXT: pxor %xmm1, %xmm7			; SSE2-NEXT: pxor %xmm0, %xmm7
	; SSE2-NEXT: pextrw $6, %xmm7, %eax			; SSE2-NEXT: pextrw $6, %xmm7, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_32			; SSE2-NEXT: je .LBB10_32
	; SSE2-NEXT: # %bb.31: # %cond.store29			; SSE2-NEXT: # %bb.31: # %cond.store29
	; SSE2-NEXT: pextrw $7, %xmm0, %eax
	; SSE2-NEXT: movb %ah, 15(%rdi)			; SSE2-NEXT: movb %ah, 15(%rdi)
	; SSE2-NEXT: .LBB10_32: # %else30			; SSE2-NEXT: .LBB10_32: # %else30
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE4-LABEL: truncstore_v16i32_v16i8:			; SSE4-LABEL: truncstore_v16i32_v16i8:
	; SSE4: # %bb.0:			; SSE4: # %bb.0:
	; SSE4-NEXT: pxor %xmm9, %xmm9			; SSE4-NEXT: pxor %xmm9, %xmm9
	; SSE4-NEXT: pcmpeqd %xmm4, %xmm9			; SSE4-NEXT: pcmpeqd %xmm4, %xmm9
	▲ Show 20 Lines • Show All 1,053 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: packssdw %xmm0, %xmm5			; SSE2-NEXT: packssdw %xmm0, %xmm5
	; SSE2-NEXT: pslld $16, %xmm1			; SSE2-NEXT: pslld $16, %xmm1
	; SSE2-NEXT: psrad $16, %xmm1			; SSE2-NEXT: psrad $16, %xmm1
	; SSE2-NEXT: pslld $16, %xmm0			; SSE2-NEXT: pslld $16, %xmm0
	; SSE2-NEXT: psrad $16, %xmm0			; SSE2-NEXT: psrad $16, %xmm0
	; SSE2-NEXT: packssdw %xmm1, %xmm0			; SSE2-NEXT: packssdw %xmm1, %xmm0
	; SSE2-NEXT: movd %xmm5, %eax			; SSE2-NEXT: movd %xmm5, %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: je .LBB12_2			; SSE2-NEXT: je .LBB12_2
	; SSE2-NEXT: # %bb.1: # %cond.store			; SSE2-NEXT: # %bb.1: # %cond.store
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: movb %al, (%rdi)			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: .LBB12_2: # %else			; SSE2-NEXT: .LBB12_2: # %else
	; SSE2-NEXT: psrlq $16, %xmm4			; SSE2-NEXT: psrlq $16, %xmm4
	; SSE2-NEXT: movd %xmm4, %eax			; SSE2-NEXT: movd %xmm4, %ecx
	; SSE2-NEXT: shrl $16, %eax			; SSE2-NEXT: shrl $16, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB12_4			; SSE2-NEXT: je .LBB12_4
	; SSE2-NEXT: # %bb.3: # %cond.store1			; SSE2-NEXT: # %bb.3: # %cond.store1
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: shrl $16, %eax			; SSE2-NEXT: shrl $16, %eax
	; SSE2-NEXT: movb %al, 1(%rdi)			; SSE2-NEXT: movb %al, 1(%rdi)
	; SSE2-NEXT: .LBB12_4: # %else2			; SSE2-NEXT: .LBB12_4: # %else2
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm2			; SSE2-NEXT: pcmpeqd %xmm1, %xmm2
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm1			; SSE2-NEXT: pcmpeqd %xmm1, %xmm1
	; SSE2-NEXT: pxor %xmm2, %xmm1			; SSE2-NEXT: pxor %xmm2, %xmm1
	; SSE2-NEXT: pextrw $4, %xmm1, %eax			; SSE2-NEXT: pextrw $4, %xmm1, %eax
	▲ Show 20 Lines • Show All 722 Lines • ▼ Show 20 Lines
	; SSE2-LABEL: truncstore_v32i16_v32i8:			; SSE2-LABEL: truncstore_v32i16_v32i8:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: pxor %xmm7, %xmm7			; SSE2-NEXT: pxor %xmm7, %xmm7
	; SSE2-NEXT: pcmpeqb %xmm4, %xmm7			; SSE2-NEXT: pcmpeqb %xmm4, %xmm7
	; SSE2-NEXT: movdqa {{.*#+}} xmm6 = [255,255,255,255,255,255,255,255]			; SSE2-NEXT: movdqa {{.*#+}} xmm6 = [255,255,255,255,255,255,255,255]
	; SSE2-NEXT: pand %xmm6, %xmm1			; SSE2-NEXT: pand %xmm6, %xmm1
	; SSE2-NEXT: pand %xmm6, %xmm0			; SSE2-NEXT: pand %xmm6, %xmm0
	; SSE2-NEXT: packuswb %xmm1, %xmm0			; SSE2-NEXT: packuswb %xmm1, %xmm0
	; SSE2-NEXT: movd %xmm7, %eax			; SSE2-NEXT: movd %xmm7, %ecx
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %ecx, %eax
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: je .LBB15_2			; SSE2-NEXT: je .LBB15_2
	; SSE2-NEXT: # %bb.1: # %cond.store			; SSE2-NEXT: # %bb.1: # %cond.store
	; SSE2-NEXT: movd %xmm0, %ecx			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: movb %cl, (%rdi)
	; SSE2-NEXT: .LBB15_2: # %else			; SSE2-NEXT: .LBB15_2: # %else
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %ecx
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB15_4			; SSE2-NEXT: je .LBB15_4
	; SSE2-NEXT: # %bb.3: # %cond.store1			; SSE2-NEXT: # %bb.3: # %cond.store1
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: movb %ah, 1(%rdi)			; SSE2-NEXT: movb %ah, 1(%rdi)
	; SSE2-NEXT: .LBB15_4: # %else2			; SSE2-NEXT: .LBB15_4: # %else2
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm4, %xmm1			; SSE2-NEXT: pcmpeqb %xmm4, %xmm1
	; SSE2-NEXT: movd %xmm1, %eax			; SSE2-NEXT: movd %xmm1, %ecx
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %ecx, %edx
	; SSE2-NEXT: shrl $16, %ecx			; SSE2-NEXT: shrl $16, %edx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %dl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %dl
	; SSE2-NEXT: je .LBB15_6			; SSE2-NEXT: je .LBB15_6
	; SSE2-NEXT: # %bb.5: # %cond.store3			; SSE2-NEXT: # %bb.5: # %cond.store3
	; SSE2-NEXT: movd %xmm0, %ecx			; SSE2-NEXT: movl %eax, %edx
	; SSE2-NEXT: shrl $16, %ecx			; SSE2-NEXT: shrl $16, %edx
	; SSE2-NEXT: movb %cl, 2(%rdi)			; SSE2-NEXT: movb %dl, 2(%rdi)
	; SSE2-NEXT: .LBB15_6: # %else4			; SSE2-NEXT: .LBB15_6: # %else4
	; SSE2-NEXT: shrl $24, %eax			; SSE2-NEXT: shrl $24, %ecx
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB15_8			; SSE2-NEXT: je .LBB15_8
	; SSE2-NEXT: # %bb.7: # %cond.store5			; SSE2-NEXT: # %bb.7: # %cond.store5
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: shrl $24, %eax			; SSE2-NEXT: shrl $24, %eax
	; SSE2-NEXT: movb %al, 3(%rdi)			; SSE2-NEXT: movb %al, 3(%rdi)
	; SSE2-NEXT: .LBB15_8: # %else6			; SSE2-NEXT: .LBB15_8: # %else6
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm4, %xmm1			; SSE2-NEXT: pcmpeqb %xmm4, %xmm1
	; SSE2-NEXT: pextrw $2, %xmm1, %eax			; SSE2-NEXT: pextrw $2, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $2, %xmm0, %ecx
	; SSE2-NEXT: je .LBB15_10			; SSE2-NEXT: je .LBB15_10
	; SSE2-NEXT: # %bb.9: # %cond.store7			; SSE2-NEXT: # %bb.9: # %cond.store7
	; SSE2-NEXT: pextrw $2, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 4(%rdi)			; SSE2-NEXT: movb %cl, 4(%rdi)
	; SSE2-NEXT: .LBB15_10: # %else8			; SSE2-NEXT: .LBB15_10: # %else8
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_12			; SSE2-NEXT: je .LBB15_12
	; SSE2-NEXT: # %bb.11: # %cond.store9			; SSE2-NEXT: # %bb.11: # %cond.store9
	; SSE2-NEXT: pextrw $2, %xmm0, %eax			; SSE2-NEXT: movb %ch, 5(%rdi)
	; SSE2-NEXT: movb %ah, 5(%rdi)
	; SSE2-NEXT: .LBB15_12: # %else10			; SSE2-NEXT: .LBB15_12: # %else10
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm4, %xmm1			; SSE2-NEXT: pcmpeqb %xmm4, %xmm1
	; SSE2-NEXT: pextrw $3, %xmm1, %eax			; SSE2-NEXT: pextrw $3, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $3, %xmm0, %ecx
	; SSE2-NEXT: je .LBB15_14			; SSE2-NEXT: je .LBB15_14
	; SSE2-NEXT: # %bb.13: # %cond.store11			; SSE2-NEXT: # %bb.13: # %cond.store11
	; SSE2-NEXT: pextrw $3, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 6(%rdi)			; SSE2-NEXT: movb %cl, 6(%rdi)
	; SSE2-NEXT: .LBB15_14: # %else12			; SSE2-NEXT: .LBB15_14: # %else12
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_16			; SSE2-NEXT: je .LBB15_16
	; SSE2-NEXT: # %bb.15: # %cond.store13			; SSE2-NEXT: # %bb.15: # %cond.store13
	; SSE2-NEXT: pextrw $3, %xmm0, %eax			; SSE2-NEXT: movb %ch, 7(%rdi)
	; SSE2-NEXT: movb %ah, 7(%rdi)
	; SSE2-NEXT: .LBB15_16: # %else14			; SSE2-NEXT: .LBB15_16: # %else14
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm4, %xmm1			; SSE2-NEXT: pcmpeqb %xmm4, %xmm1
	; SSE2-NEXT: pextrw $4, %xmm1, %eax			; SSE2-NEXT: pextrw $4, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $4, %xmm0, %ecx
	; SSE2-NEXT: je .LBB15_18			; SSE2-NEXT: je .LBB15_18
	; SSE2-NEXT: # %bb.17: # %cond.store15			; SSE2-NEXT: # %bb.17: # %cond.store15
	; SSE2-NEXT: pextrw $4, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 8(%rdi)			; SSE2-NEXT: movb %cl, 8(%rdi)
	; SSE2-NEXT: .LBB15_18: # %else16			; SSE2-NEXT: .LBB15_18: # %else16
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_20			; SSE2-NEXT: je .LBB15_20
	; SSE2-NEXT: # %bb.19: # %cond.store17			; SSE2-NEXT: # %bb.19: # %cond.store17
	; SSE2-NEXT: pextrw $4, %xmm0, %eax			; SSE2-NEXT: movb %ch, 9(%rdi)
	; SSE2-NEXT: movb %ah, 9(%rdi)
	; SSE2-NEXT: .LBB15_20: # %else18			; SSE2-NEXT: .LBB15_20: # %else18
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm4, %xmm1			; SSE2-NEXT: pcmpeqb %xmm4, %xmm1
	; SSE2-NEXT: pextrw $5, %xmm1, %eax			; SSE2-NEXT: pextrw $5, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $5, %xmm0, %ecx
	; SSE2-NEXT: je .LBB15_22			; SSE2-NEXT: je .LBB15_22
	; SSE2-NEXT: # %bb.21: # %cond.store19			; SSE2-NEXT: # %bb.21: # %cond.store19
	; SSE2-NEXT: pextrw $5, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 10(%rdi)			; SSE2-NEXT: movb %cl, 10(%rdi)
	; SSE2-NEXT: .LBB15_22: # %else20			; SSE2-NEXT: .LBB15_22: # %else20
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_24			; SSE2-NEXT: je .LBB15_24
	; SSE2-NEXT: # %bb.23: # %cond.store21			; SSE2-NEXT: # %bb.23: # %cond.store21
	; SSE2-NEXT: pextrw $5, %xmm0, %eax			; SSE2-NEXT: movb %ch, 11(%rdi)
	; SSE2-NEXT: movb %ah, 11(%rdi)
	; SSE2-NEXT: .LBB15_24: # %else22			; SSE2-NEXT: .LBB15_24: # %else22
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm4, %xmm1			; SSE2-NEXT: pcmpeqb %xmm4, %xmm1
	; SSE2-NEXT: pextrw $6, %xmm1, %eax			; SSE2-NEXT: pextrw $6, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $6, %xmm0, %ecx
	; SSE2-NEXT: je .LBB15_26			; SSE2-NEXT: je .LBB15_26
	; SSE2-NEXT: # %bb.25: # %cond.store23			; SSE2-NEXT: # %bb.25: # %cond.store23
	; SSE2-NEXT: pextrw $6, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 12(%rdi)			; SSE2-NEXT: movb %cl, 12(%rdi)
	; SSE2-NEXT: .LBB15_26: # %else24			; SSE2-NEXT: .LBB15_26: # %else24
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_28			; SSE2-NEXT: je .LBB15_28
	; SSE2-NEXT: # %bb.27: # %cond.store25			; SSE2-NEXT: # %bb.27: # %cond.store25
	; SSE2-NEXT: pextrw $6, %xmm0, %eax			; SSE2-NEXT: movb %ch, 13(%rdi)
	; SSE2-NEXT: movb %ah, 13(%rdi)
	; SSE2-NEXT: .LBB15_28: # %else26			; SSE2-NEXT: .LBB15_28: # %else26
				; SSE2-NEXT: pand %xmm6, %xmm3
				; SSE2-NEXT: pand %xmm6, %xmm2
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm1, %xmm4			; SSE2-NEXT: pcmpeqb %xmm1, %xmm4
	; SSE2-NEXT: pextrw $7, %xmm4, %eax			; SSE2-NEXT: pextrw $7, %xmm4, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $7, %xmm0, %ecx
	; SSE2-NEXT: je .LBB15_30			; SSE2-NEXT: je .LBB15_30
	; SSE2-NEXT: # %bb.29: # %cond.store27			; SSE2-NEXT: # %bb.29: # %cond.store27
	; SSE2-NEXT: pextrw $7, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 14(%rdi)			; SSE2-NEXT: movb %cl, 14(%rdi)
	; SSE2-NEXT: .LBB15_30: # %else28			; SSE2-NEXT: .LBB15_30: # %else28
	; SSE2-NEXT: pand %xmm6, %xmm3			; SSE2-NEXT: packuswb %xmm3, %xmm2
	; SSE2-NEXT: pand %xmm6, %xmm2
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_32			; SSE2-NEXT: je .LBB15_32
	; SSE2-NEXT: # %bb.31: # %cond.store29			; SSE2-NEXT: # %bb.31: # %cond.store29
	; SSE2-NEXT: pextrw $7, %xmm0, %eax			; SSE2-NEXT: movb %ch, 15(%rdi)
	; SSE2-NEXT: movb %ah, 15(%rdi)
	; SSE2-NEXT: .LBB15_32: # %else30			; SSE2-NEXT: .LBB15_32: # %else30
	; SSE2-NEXT: packuswb %xmm3, %xmm2
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm5, %xmm0			; SSE2-NEXT: pcmpeqb %xmm5, %xmm0
	; SSE2-NEXT: movd %xmm0, %eax			; SSE2-NEXT: movd %xmm0, %ecx
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %ecx, %eax
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: movd %xmm2, %eax
	; SSE2-NEXT: je .LBB15_34			; SSE2-NEXT: je .LBB15_34
	; SSE2-NEXT: # %bb.33: # %cond.store31			; SSE2-NEXT: # %bb.33: # %cond.store31
	; SSE2-NEXT: movd %xmm2, %ecx			; SSE2-NEXT: movb %al, 16(%rdi)
	; SSE2-NEXT: movb %cl, 16(%rdi)
	; SSE2-NEXT: .LBB15_34: # %else32			; SSE2-NEXT: .LBB15_34: # %else32
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %ecx
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB15_36			; SSE2-NEXT: je .LBB15_36
	; SSE2-NEXT: # %bb.35: # %cond.store33			; SSE2-NEXT: # %bb.35: # %cond.store33
	; SSE2-NEXT: movd %xmm2, %eax
	; SSE2-NEXT: movb %ah, 17(%rdi)			; SSE2-NEXT: movb %ah, 17(%rdi)
	; SSE2-NEXT: .LBB15_36: # %else34			; SSE2-NEXT: .LBB15_36: # %else34
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm5, %xmm0			; SSE2-NEXT: pcmpeqb %xmm5, %xmm0
	; SSE2-NEXT: movd %xmm0, %eax			; SSE2-NEXT: movd %xmm0, %ecx
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %ecx, %edx
	; SSE2-NEXT: shrl $16, %ecx			; SSE2-NEXT: shrl $16, %edx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %dl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %dl
	; SSE2-NEXT: je .LBB15_38			; SSE2-NEXT: je .LBB15_38
	; SSE2-NEXT: # %bb.37: # %cond.store35			; SSE2-NEXT: # %bb.37: # %cond.store35
	; SSE2-NEXT: movd %xmm2, %ecx			; SSE2-NEXT: movl %eax, %edx
	; SSE2-NEXT: shrl $16, %ecx			; SSE2-NEXT: shrl $16, %edx
	; SSE2-NEXT: movb %cl, 18(%rdi)			; SSE2-NEXT: movb %dl, 18(%rdi)
	; SSE2-NEXT: .LBB15_38: # %else36			; SSE2-NEXT: .LBB15_38: # %else36
	; SSE2-NEXT: shrl $24, %eax			; SSE2-NEXT: shrl $24, %ecx
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB15_40			; SSE2-NEXT: je .LBB15_40
	; SSE2-NEXT: # %bb.39: # %cond.store37			; SSE2-NEXT: # %bb.39: # %cond.store37
	; SSE2-NEXT: movd %xmm2, %eax
	; SSE2-NEXT: shrl $24, %eax			; SSE2-NEXT: shrl $24, %eax
	; SSE2-NEXT: movb %al, 19(%rdi)			; SSE2-NEXT: movb %al, 19(%rdi)
	; SSE2-NEXT: .LBB15_40: # %else38			; SSE2-NEXT: .LBB15_40: # %else38
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm5, %xmm0			; SSE2-NEXT: pcmpeqb %xmm5, %xmm0
	; SSE2-NEXT: pextrw $2, %xmm0, %eax			; SSE2-NEXT: pextrw $2, %xmm0, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $2, %xmm2, %ecx
	; SSE2-NEXT: je .LBB15_42			; SSE2-NEXT: je .LBB15_42
	; SSE2-NEXT: # %bb.41: # %cond.store39			; SSE2-NEXT: # %bb.41: # %cond.store39
	; SSE2-NEXT: pextrw $2, %xmm2, %ecx
	; SSE2-NEXT: movb %cl, 20(%rdi)			; SSE2-NEXT: movb %cl, 20(%rdi)
	; SSE2-NEXT: .LBB15_42: # %else40			; SSE2-NEXT: .LBB15_42: # %else40
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_44			; SSE2-NEXT: je .LBB15_44
	; SSE2-NEXT: # %bb.43: # %cond.store41			; SSE2-NEXT: # %bb.43: # %cond.store41
	; SSE2-NEXT: pextrw $2, %xmm2, %eax			; SSE2-NEXT: movb %ch, 21(%rdi)
	; SSE2-NEXT: movb %ah, 21(%rdi)
	; SSE2-NEXT: .LBB15_44: # %else42			; SSE2-NEXT: .LBB15_44: # %else42
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm5, %xmm0			; SSE2-NEXT: pcmpeqb %xmm5, %xmm0
	; SSE2-NEXT: pextrw $3, %xmm0, %eax			; SSE2-NEXT: pextrw $3, %xmm0, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $3, %xmm2, %ecx
	; SSE2-NEXT: je .LBB15_46			; SSE2-NEXT: je .LBB15_46
	; SSE2-NEXT: # %bb.45: # %cond.store43			; SSE2-NEXT: # %bb.45: # %cond.store43
	; SSE2-NEXT: pextrw $3, %xmm2, %ecx
	; SSE2-NEXT: movb %cl, 22(%rdi)			; SSE2-NEXT: movb %cl, 22(%rdi)
	; SSE2-NEXT: .LBB15_46: # %else44			; SSE2-NEXT: .LBB15_46: # %else44
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_48			; SSE2-NEXT: je .LBB15_48
	; SSE2-NEXT: # %bb.47: # %cond.store45			; SSE2-NEXT: # %bb.47: # %cond.store45
	; SSE2-NEXT: pextrw $3, %xmm2, %eax			; SSE2-NEXT: movb %ch, 23(%rdi)
	; SSE2-NEXT: movb %ah, 23(%rdi)
	; SSE2-NEXT: .LBB15_48: # %else46			; SSE2-NEXT: .LBB15_48: # %else46
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm5, %xmm0			; SSE2-NEXT: pcmpeqb %xmm5, %xmm0
	; SSE2-NEXT: pextrw $4, %xmm0, %eax			; SSE2-NEXT: pextrw $4, %xmm0, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $4, %xmm2, %ecx
	; SSE2-NEXT: je .LBB15_50			; SSE2-NEXT: je .LBB15_50
	; SSE2-NEXT: # %bb.49: # %cond.store47			; SSE2-NEXT: # %bb.49: # %cond.store47
	; SSE2-NEXT: pextrw $4, %xmm2, %ecx
	; SSE2-NEXT: movb %cl, 24(%rdi)			; SSE2-NEXT: movb %cl, 24(%rdi)
	; SSE2-NEXT: .LBB15_50: # %else48			; SSE2-NEXT: .LBB15_50: # %else48
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_52			; SSE2-NEXT: je .LBB15_52
	; SSE2-NEXT: # %bb.51: # %cond.store49			; SSE2-NEXT: # %bb.51: # %cond.store49
	; SSE2-NEXT: pextrw $4, %xmm2, %eax			; SSE2-NEXT: movb %ch, 25(%rdi)
	; SSE2-NEXT: movb %ah, 25(%rdi)
	; SSE2-NEXT: .LBB15_52: # %else50			; SSE2-NEXT: .LBB15_52: # %else50
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm5, %xmm0			; SSE2-NEXT: pcmpeqb %xmm5, %xmm0
	; SSE2-NEXT: pextrw $5, %xmm0, %eax			; SSE2-NEXT: pextrw $5, %xmm0, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $5, %xmm2, %ecx
	; SSE2-NEXT: je .LBB15_54			; SSE2-NEXT: je .LBB15_54
	; SSE2-NEXT: # %bb.53: # %cond.store51			; SSE2-NEXT: # %bb.53: # %cond.store51
	; SSE2-NEXT: pextrw $5, %xmm2, %ecx
	; SSE2-NEXT: movb %cl, 26(%rdi)			; SSE2-NEXT: movb %cl, 26(%rdi)
	; SSE2-NEXT: .LBB15_54: # %else52			; SSE2-NEXT: .LBB15_54: # %else52
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_56			; SSE2-NEXT: je .LBB15_56
	; SSE2-NEXT: # %bb.55: # %cond.store53			; SSE2-NEXT: # %bb.55: # %cond.store53
	; SSE2-NEXT: pextrw $5, %xmm2, %eax			; SSE2-NEXT: movb %ch, 27(%rdi)
	; SSE2-NEXT: movb %ah, 27(%rdi)
	; SSE2-NEXT: .LBB15_56: # %else54			; SSE2-NEXT: .LBB15_56: # %else54
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm5, %xmm0			; SSE2-NEXT: pcmpeqb %xmm5, %xmm0
	; SSE2-NEXT: pextrw $6, %xmm0, %eax			; SSE2-NEXT: pextrw $6, %xmm0, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $6, %xmm2, %ecx
	; SSE2-NEXT: je .LBB15_58			; SSE2-NEXT: je .LBB15_58
	; SSE2-NEXT: # %bb.57: # %cond.store55			; SSE2-NEXT: # %bb.57: # %cond.store55
	; SSE2-NEXT: pextrw $6, %xmm2, %ecx
	; SSE2-NEXT: movb %cl, 28(%rdi)			; SSE2-NEXT: movb %cl, 28(%rdi)
	; SSE2-NEXT: .LBB15_58: # %else56			; SSE2-NEXT: .LBB15_58: # %else56
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_60			; SSE2-NEXT: je .LBB15_60
	; SSE2-NEXT: # %bb.59: # %cond.store57			; SSE2-NEXT: # %bb.59: # %cond.store57
	; SSE2-NEXT: pextrw $6, %xmm2, %eax			; SSE2-NEXT: movb %ch, 29(%rdi)
	; SSE2-NEXT: movb %ah, 29(%rdi)
	; SSE2-NEXT: .LBB15_60: # %else58			; SSE2-NEXT: .LBB15_60: # %else58
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm0, %xmm5			; SSE2-NEXT: pcmpeqb %xmm0, %xmm5
	; SSE2-NEXT: pextrw $7, %xmm5, %eax			; SSE2-NEXT: pextrw $7, %xmm5, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $7, %xmm2, %ecx
	; SSE2-NEXT: je .LBB15_62			; SSE2-NEXT: je .LBB15_62
	; SSE2-NEXT: # %bb.61: # %cond.store59			; SSE2-NEXT: # %bb.61: # %cond.store59
	; SSE2-NEXT: pextrw $7, %xmm2, %ecx
	; SSE2-NEXT: movb %cl, 30(%rdi)			; SSE2-NEXT: movb %cl, 30(%rdi)
	; SSE2-NEXT: .LBB15_62: # %else60			; SSE2-NEXT: .LBB15_62: # %else60
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_64			; SSE2-NEXT: je .LBB15_64
	; SSE2-NEXT: # %bb.63: # %cond.store61			; SSE2-NEXT: # %bb.63: # %cond.store61
	; SSE2-NEXT: pextrw $7, %xmm2, %eax			; SSE2-NEXT: movb %ch, 31(%rdi)
	; SSE2-NEXT: movb %ah, 31(%rdi)
	; SSE2-NEXT: .LBB15_64: # %else62			; SSE2-NEXT: .LBB15_64: # %else62
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE4-LABEL: truncstore_v32i16_v32i8:			; SSE4-LABEL: truncstore_v32i16_v32i8:
	; SSE4: # %bb.0:			; SSE4: # %bb.0:
	; SSE4-NEXT: pxor %xmm7, %xmm7			; SSE4-NEXT: pxor %xmm7, %xmm7
	; SSE4-NEXT: pcmpeqb %xmm4, %xmm7			; SSE4-NEXT: pcmpeqb %xmm4, %xmm7
	; SSE4-NEXT: movdqa {{.*#+}} xmm6 = <0,2,4,6,8,10,12,14,u,u,u,u,u,u,u,u>			; SSE4-NEXT: movdqa {{.*#+}} xmm6 = <0,2,4,6,8,10,12,14,u,u,u,u,u,u,u,u>
	▲ Show 20 Lines • Show All 415 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: .LBB15_32: # %else30			; AVX1-NEXT: .LBB15_32: # %else30
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm1
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpextrb $0, %xmm2, %eax			; AVX1-NEXT: vpextrb $0, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
				; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: je .LBB15_34			; AVX1-NEXT: je .LBB15_34
	; AVX1-NEXT: # %bb.33: # %cond.store31			; AVX1-NEXT: # %bb.33: # %cond.store31
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrb $0, %xmm0, 16(%rdi)
	; AVX1-NEXT: vpextrb $0, %xmm3, 16(%rdi)
	; AVX1-NEXT: .LBB15_34: # %else32			; AVX1-NEXT: .LBB15_34: # %else32
	; AVX1-NEXT: vpextrb $1, %xmm2, %eax			; AVX1-NEXT: vpextrb $1, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_36			; AVX1-NEXT: je .LBB15_36
	; AVX1-NEXT: # %bb.35: # %cond.store33			; AVX1-NEXT: # %bb.35: # %cond.store33
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $1, %xmm0, 17(%rdi)
	; AVX1-NEXT: vpextrb $1, %xmm2, 17(%rdi)
	; AVX1-NEXT: .LBB15_36: # %else34			; AVX1-NEXT: .LBB15_36: # %else34
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpextrb $2, %xmm2, %eax			; AVX1-NEXT: vpextrb $2, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_38			; AVX1-NEXT: je .LBB15_38
	; AVX1-NEXT: # %bb.37: # %cond.store35			; AVX1-NEXT: # %bb.37: # %cond.store35
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrb $2, %xmm0, 18(%rdi)
	; AVX1-NEXT: vpextrb $2, %xmm3, 18(%rdi)
	; AVX1-NEXT: .LBB15_38: # %else36			; AVX1-NEXT: .LBB15_38: # %else36
	; AVX1-NEXT: vpextrb $3, %xmm2, %eax			; AVX1-NEXT: vpextrb $3, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_40			; AVX1-NEXT: je .LBB15_40
	; AVX1-NEXT: # %bb.39: # %cond.store37			; AVX1-NEXT: # %bb.39: # %cond.store37
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $3, %xmm0, 19(%rdi)
	; AVX1-NEXT: vpextrb $3, %xmm2, 19(%rdi)
	; AVX1-NEXT: .LBB15_40: # %else38			; AVX1-NEXT: .LBB15_40: # %else38
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpextrb $4, %xmm2, %eax			; AVX1-NEXT: vpextrb $4, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_42			; AVX1-NEXT: je .LBB15_42
	; AVX1-NEXT: # %bb.41: # %cond.store39			; AVX1-NEXT: # %bb.41: # %cond.store39
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrb $4, %xmm0, 20(%rdi)
	; AVX1-NEXT: vpextrb $4, %xmm3, 20(%rdi)
	; AVX1-NEXT: .LBB15_42: # %else40			; AVX1-NEXT: .LBB15_42: # %else40
	; AVX1-NEXT: vpextrb $5, %xmm2, %eax			; AVX1-NEXT: vpextrb $5, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_44			; AVX1-NEXT: je .LBB15_44
	; AVX1-NEXT: # %bb.43: # %cond.store41			; AVX1-NEXT: # %bb.43: # %cond.store41
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $5, %xmm0, 21(%rdi)
	; AVX1-NEXT: vpextrb $5, %xmm2, 21(%rdi)
	; AVX1-NEXT: .LBB15_44: # %else42			; AVX1-NEXT: .LBB15_44: # %else42
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpextrb $6, %xmm2, %eax			; AVX1-NEXT: vpextrb $6, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_46			; AVX1-NEXT: je .LBB15_46
	; AVX1-NEXT: # %bb.45: # %cond.store43			; AVX1-NEXT: # %bb.45: # %cond.store43
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrb $6, %xmm0, 22(%rdi)
	; AVX1-NEXT: vpextrb $6, %xmm3, 22(%rdi)
	; AVX1-NEXT: .LBB15_46: # %else44			; AVX1-NEXT: .LBB15_46: # %else44
	; AVX1-NEXT: vpextrb $7, %xmm2, %eax			; AVX1-NEXT: vpextrb $7, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_48			; AVX1-NEXT: je .LBB15_48
	; AVX1-NEXT: # %bb.47: # %cond.store45			; AVX1-NEXT: # %bb.47: # %cond.store45
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $7, %xmm0, 23(%rdi)
	; AVX1-NEXT: vpextrb $7, %xmm2, 23(%rdi)
	; AVX1-NEXT: .LBB15_48: # %else46			; AVX1-NEXT: .LBB15_48: # %else46
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpextrb $8, %xmm2, %eax			; AVX1-NEXT: vpextrb $8, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_50			; AVX1-NEXT: je .LBB15_50
	; AVX1-NEXT: # %bb.49: # %cond.store47			; AVX1-NEXT: # %bb.49: # %cond.store47
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrb $8, %xmm0, 24(%rdi)
	; AVX1-NEXT: vpextrb $8, %xmm3, 24(%rdi)
	; AVX1-NEXT: .LBB15_50: # %else48			; AVX1-NEXT: .LBB15_50: # %else48
	; AVX1-NEXT: vpextrb $9, %xmm2, %eax			; AVX1-NEXT: vpextrb $9, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_52			; AVX1-NEXT: je .LBB15_52
	; AVX1-NEXT: # %bb.51: # %cond.store49			; AVX1-NEXT: # %bb.51: # %cond.store49
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $9, %xmm0, 25(%rdi)
	; AVX1-NEXT: vpextrb $9, %xmm2, 25(%rdi)
	; AVX1-NEXT: .LBB15_52: # %else50			; AVX1-NEXT: .LBB15_52: # %else50
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpextrb $10, %xmm2, %eax			; AVX1-NEXT: vpextrb $10, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_54			; AVX1-NEXT: je .LBB15_54
	; AVX1-NEXT: # %bb.53: # %cond.store51			; AVX1-NEXT: # %bb.53: # %cond.store51
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrb $10, %xmm0, 26(%rdi)
	; AVX1-NEXT: vpextrb $10, %xmm3, 26(%rdi)
	; AVX1-NEXT: .LBB15_54: # %else52			; AVX1-NEXT: .LBB15_54: # %else52
	; AVX1-NEXT: vpextrb $11, %xmm2, %eax			; AVX1-NEXT: vpextrb $11, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_56			; AVX1-NEXT: je .LBB15_56
	; AVX1-NEXT: # %bb.55: # %cond.store53			; AVX1-NEXT: # %bb.55: # %cond.store53
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $11, %xmm0, 27(%rdi)
	; AVX1-NEXT: vpextrb $11, %xmm2, 27(%rdi)
	; AVX1-NEXT: .LBB15_56: # %else54			; AVX1-NEXT: .LBB15_56: # %else54
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpextrb $12, %xmm2, %eax			; AVX1-NEXT: vpextrb $12, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_58			; AVX1-NEXT: je .LBB15_58
	; AVX1-NEXT: # %bb.57: # %cond.store55			; AVX1-NEXT: # %bb.57: # %cond.store55
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrb $12, %xmm0, 28(%rdi)
	; AVX1-NEXT: vpextrb $12, %xmm3, 28(%rdi)
	; AVX1-NEXT: .LBB15_58: # %else56			; AVX1-NEXT: .LBB15_58: # %else56
	; AVX1-NEXT: vpextrb $13, %xmm2, %eax			; AVX1-NEXT: vpextrb $13, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_60			; AVX1-NEXT: je .LBB15_60
	; AVX1-NEXT: # %bb.59: # %cond.store57			; AVX1-NEXT: # %bb.59: # %cond.store57
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $13, %xmm0, 29(%rdi)
	; AVX1-NEXT: vpextrb $13, %xmm2, 29(%rdi)
	; AVX1-NEXT: .LBB15_60: # %else58			; AVX1-NEXT: .LBB15_60: # %else58
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpextrb $14, %xmm1, %eax			; AVX1-NEXT: vpextrb $14, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_62			; AVX1-NEXT: je .LBB15_62
	; AVX1-NEXT: # %bb.61: # %cond.store59			; AVX1-NEXT: # %bb.61: # %cond.store59
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $14, %xmm0, 30(%rdi)
	; AVX1-NEXT: vpextrb $14, %xmm2, 30(%rdi)
	; AVX1-NEXT: .LBB15_62: # %else60			; AVX1-NEXT: .LBB15_62: # %else60
	; AVX1-NEXT: vpextrb $15, %xmm1, %eax			; AVX1-NEXT: vpextrb $15, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_64			; AVX1-NEXT: je .LBB15_64
	; AVX1-NEXT: # %bb.63: # %cond.store61			; AVX1-NEXT: # %bb.63: # %cond.store61
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: vpextrb $15, %xmm0, 31(%rdi)			; AVX1-NEXT: vpextrb $15, %xmm0, 31(%rdi)
	; AVX1-NEXT: .LBB15_64: # %else62			; AVX1-NEXT: .LBB15_64: # %else62
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: truncstore_v32i16_v32i8:			; AVX2-LABEL: truncstore_v32i16_v32i8:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3			; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3
	▲ Show 20 Lines • Show All 133 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpextrb $15, %xmm0, 15(%rdi)			; AVX2-NEXT: vpextrb $15, %xmm0, 15(%rdi)
	; AVX2-NEXT: .LBB15_32: # %else30			; AVX2-NEXT: .LBB15_32: # %else30
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $0, %xmm1, %eax			; AVX2-NEXT: vpextrb $0, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: je .LBB15_34			; AVX2-NEXT: je .LBB15_34
	; AVX2-NEXT: # %bb.33: # %cond.store31			; AVX2-NEXT: # %bb.33: # %cond.store31
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vpextrb $0, %xmm0, 16(%rdi)
	; AVX2-NEXT: vpextrb $0, %xmm3, 16(%rdi)
	; AVX2-NEXT: .LBB15_34: # %else32			; AVX2-NEXT: .LBB15_34: # %else32
	; AVX2-NEXT: vpextrb $1, %xmm1, %eax			; AVX2-NEXT: vpextrb $1, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_36			; AVX2-NEXT: je .LBB15_36
	; AVX2-NEXT: # %bb.35: # %cond.store33			; AVX2-NEXT: # %bb.35: # %cond.store33
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrb $1, %xmm0, 17(%rdi)
	; AVX2-NEXT: vpextrb $1, %xmm1, 17(%rdi)
	; AVX2-NEXT: .LBB15_36: # %else34			; AVX2-NEXT: .LBB15_36: # %else34
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $2, %xmm1, %eax			; AVX2-NEXT: vpextrb $2, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_38			; AVX2-NEXT: je .LBB15_38
	; AVX2-NEXT: # %bb.37: # %cond.store35			; AVX2-NEXT: # %bb.37: # %cond.store35
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vpextrb $2, %xmm0, 18(%rdi)
	; AVX2-NEXT: vpextrb $2, %xmm3, 18(%rdi)
	; AVX2-NEXT: .LBB15_38: # %else36			; AVX2-NEXT: .LBB15_38: # %else36
	; AVX2-NEXT: vpextrb $3, %xmm1, %eax			; AVX2-NEXT: vpextrb $3, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_40			; AVX2-NEXT: je .LBB15_40
	; AVX2-NEXT: # %bb.39: # %cond.store37			; AVX2-NEXT: # %bb.39: # %cond.store37
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrb $3, %xmm0, 19(%rdi)
	; AVX2-NEXT: vpextrb $3, %xmm1, 19(%rdi)
	; AVX2-NEXT: .LBB15_40: # %else38			; AVX2-NEXT: .LBB15_40: # %else38
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $4, %xmm1, %eax			; AVX2-NEXT: vpextrb $4, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_42			; AVX2-NEXT: je .LBB15_42
	; AVX2-NEXT: # %bb.41: # %cond.store39			; AVX2-NEXT: # %bb.41: # %cond.store39
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vpextrb $4, %xmm0, 20(%rdi)
	; AVX2-NEXT: vpextrb $4, %xmm3, 20(%rdi)
	; AVX2-NEXT: .LBB15_42: # %else40			; AVX2-NEXT: .LBB15_42: # %else40
	; AVX2-NEXT: vpextrb $5, %xmm1, %eax			; AVX2-NEXT: vpextrb $5, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_44			; AVX2-NEXT: je .LBB15_44
	; AVX2-NEXT: # %bb.43: # %cond.store41			; AVX2-NEXT: # %bb.43: # %cond.store41
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrb $5, %xmm0, 21(%rdi)
	; AVX2-NEXT: vpextrb $5, %xmm1, 21(%rdi)
	; AVX2-NEXT: .LBB15_44: # %else42			; AVX2-NEXT: .LBB15_44: # %else42
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $6, %xmm1, %eax			; AVX2-NEXT: vpextrb $6, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_46			; AVX2-NEXT: je .LBB15_46
	; AVX2-NEXT: # %bb.45: # %cond.store43			; AVX2-NEXT: # %bb.45: # %cond.store43
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vpextrb $6, %xmm0, 22(%rdi)
	; AVX2-NEXT: vpextrb $6, %xmm3, 22(%rdi)
	; AVX2-NEXT: .LBB15_46: # %else44			; AVX2-NEXT: .LBB15_46: # %else44
	; AVX2-NEXT: vpextrb $7, %xmm1, %eax			; AVX2-NEXT: vpextrb $7, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_48			; AVX2-NEXT: je .LBB15_48
	; AVX2-NEXT: # %bb.47: # %cond.store45			; AVX2-NEXT: # %bb.47: # %cond.store45
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrb $7, %xmm0, 23(%rdi)
	; AVX2-NEXT: vpextrb $7, %xmm1, 23(%rdi)
	; AVX2-NEXT: .LBB15_48: # %else46			; AVX2-NEXT: .LBB15_48: # %else46
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $8, %xmm1, %eax			; AVX2-NEXT: vpextrb $8, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_50			; AVX2-NEXT: je .LBB15_50
	; AVX2-NEXT: # %bb.49: # %cond.store47			; AVX2-NEXT: # %bb.49: # %cond.store47
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vpextrb $8, %xmm0, 24(%rdi)
	; AVX2-NEXT: vpextrb $8, %xmm3, 24(%rdi)
	; AVX2-NEXT: .LBB15_50: # %else48			; AVX2-NEXT: .LBB15_50: # %else48
	; AVX2-NEXT: vpextrb $9, %xmm1, %eax			; AVX2-NEXT: vpextrb $9, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_52			; AVX2-NEXT: je .LBB15_52
	; AVX2-NEXT: # %bb.51: # %cond.store49			; AVX2-NEXT: # %bb.51: # %cond.store49
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrb $9, %xmm0, 25(%rdi)
	; AVX2-NEXT: vpextrb $9, %xmm1, 25(%rdi)
	; AVX2-NEXT: .LBB15_52: # %else50			; AVX2-NEXT: .LBB15_52: # %else50
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $10, %xmm1, %eax			; AVX2-NEXT: vpextrb $10, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_54			; AVX2-NEXT: je .LBB15_54
	; AVX2-NEXT: # %bb.53: # %cond.store51			; AVX2-NEXT: # %bb.53: # %cond.store51
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vpextrb $10, %xmm0, 26(%rdi)
	; AVX2-NEXT: vpextrb $10, %xmm3, 26(%rdi)
	; AVX2-NEXT: .LBB15_54: # %else52			; AVX2-NEXT: .LBB15_54: # %else52
	; AVX2-NEXT: vpextrb $11, %xmm1, %eax			; AVX2-NEXT: vpextrb $11, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_56			; AVX2-NEXT: je .LBB15_56
	; AVX2-NEXT: # %bb.55: # %cond.store53			; AVX2-NEXT: # %bb.55: # %cond.store53
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrb $11, %xmm0, 27(%rdi)
	; AVX2-NEXT: vpextrb $11, %xmm1, 27(%rdi)
	; AVX2-NEXT: .LBB15_56: # %else54			; AVX2-NEXT: .LBB15_56: # %else54
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $12, %xmm1, %eax			; AVX2-NEXT: vpextrb $12, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_58			; AVX2-NEXT: je .LBB15_58
	; AVX2-NEXT: # %bb.57: # %cond.store55			; AVX2-NEXT: # %bb.57: # %cond.store55
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vpextrb $12, %xmm0, 28(%rdi)
	; AVX2-NEXT: vpextrb $12, %xmm3, 28(%rdi)
	; AVX2-NEXT: .LBB15_58: # %else56			; AVX2-NEXT: .LBB15_58: # %else56
	; AVX2-NEXT: vpextrb $13, %xmm1, %eax			; AVX2-NEXT: vpextrb $13, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_60			; AVX2-NEXT: je .LBB15_60
	; AVX2-NEXT: # %bb.59: # %cond.store57			; AVX2-NEXT: # %bb.59: # %cond.store57
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrb $13, %xmm0, 29(%rdi)
	; AVX2-NEXT: vpextrb $13, %xmm1, 29(%rdi)
	; AVX2-NEXT: .LBB15_60: # %else58			; AVX2-NEXT: .LBB15_60: # %else58
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $14, %xmm1, %eax			; AVX2-NEXT: vpextrb $14, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_62			; AVX2-NEXT: je .LBB15_62
	; AVX2-NEXT: # %bb.61: # %cond.store59			; AVX2-NEXT: # %bb.61: # %cond.store59
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm2			; AVX2-NEXT: vpextrb $14, %xmm0, 30(%rdi)
	; AVX2-NEXT: vpextrb $14, %xmm2, 30(%rdi)
	; AVX2-NEXT: .LBB15_62: # %else60			; AVX2-NEXT: .LBB15_62: # %else60
	; AVX2-NEXT: vpextrb $15, %xmm1, %eax			; AVX2-NEXT: vpextrb $15, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_64			; AVX2-NEXT: je .LBB15_64
	; AVX2-NEXT: # %bb.63: # %cond.store61			; AVX2-NEXT: # %bb.63: # %cond.store61
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: vpextrb $15, %xmm0, 31(%rdi)			; AVX2-NEXT: vpextrb $15, %xmm0, 31(%rdi)
	; AVX2-NEXT: .LBB15_64: # %else62			; AVX2-NEXT: .LBB15_64: # %else62
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: truncstore_v32i16_v32i8:			; AVX512F-LABEL: truncstore_v32i16_v32i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpxor %xmm3, %xmm3, %xmm3			; AVX512F-NEXT: vpxor %xmm3, %xmm3, %xmm3
	▲ Show 20 Lines • Show All 188 Lines • ▼ Show 20 Lines
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3
	; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3			; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0			; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
				; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX512F-NEXT: je .LBB15_34			; AVX512F-NEXT: je .LBB15_34
	; AVX512F-NEXT: # %bb.33: # %cond.store31			; AVX512F-NEXT: # %bb.33: # %cond.store31
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX512F-NEXT: vpextrb $0, %xmm0, 16(%rdi)
	; AVX512F-NEXT: vpextrb $0, %xmm3, 16(%rdi)
	; AVX512F-NEXT: .LBB15_34: # %else32			; AVX512F-NEXT: .LBB15_34: # %else32
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $1, %k0, %k0			; AVX512F-NEXT: kshiftrw $1, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_36			; AVX512F-NEXT: je .LBB15_36
	; AVX512F-NEXT: # %bb.35: # %cond.store33			; AVX512F-NEXT: # %bb.35: # %cond.store33
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrb $1, %xmm0, 17(%rdi)
	; AVX512F-NEXT: vpextrb $1, %xmm1, 17(%rdi)
	; AVX512F-NEXT: .LBB15_36: # %else34			; AVX512F-NEXT: .LBB15_36: # %else34
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3
	; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3			; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0			; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0
	; AVX512F-NEXT: kshiftrw $2, %k0, %k0			; AVX512F-NEXT: kshiftrw $2, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_38			; AVX512F-NEXT: je .LBB15_38
	; AVX512F-NEXT: # %bb.37: # %cond.store35			; AVX512F-NEXT: # %bb.37: # %cond.store35
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX512F-NEXT: vpextrb $2, %xmm0, 18(%rdi)
	; AVX512F-NEXT: vpextrb $2, %xmm3, 18(%rdi)
	; AVX512F-NEXT: .LBB15_38: # %else36			; AVX512F-NEXT: .LBB15_38: # %else36
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $3, %k0, %k0			; AVX512F-NEXT: kshiftrw $3, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_40			; AVX512F-NEXT: je .LBB15_40
	; AVX512F-NEXT: # %bb.39: # %cond.store37			; AVX512F-NEXT: # %bb.39: # %cond.store37
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrb $3, %xmm0, 19(%rdi)
	; AVX512F-NEXT: vpextrb $3, %xmm1, 19(%rdi)
	; AVX512F-NEXT: .LBB15_40: # %else38			; AVX512F-NEXT: .LBB15_40: # %else38
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3
	; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3			; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0			; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0
	; AVX512F-NEXT: kshiftrw $4, %k0, %k0			; AVX512F-NEXT: kshiftrw $4, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_42			; AVX512F-NEXT: je .LBB15_42
	; AVX512F-NEXT: # %bb.41: # %cond.store39			; AVX512F-NEXT: # %bb.41: # %cond.store39
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX512F-NEXT: vpextrb $4, %xmm0, 20(%rdi)
	; AVX512F-NEXT: vpextrb $4, %xmm3, 20(%rdi)
	; AVX512F-NEXT: .LBB15_42: # %else40			; AVX512F-NEXT: .LBB15_42: # %else40
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $5, %k0, %k0			; AVX512F-NEXT: kshiftrw $5, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_44			; AVX512F-NEXT: je .LBB15_44
	; AVX512F-NEXT: # %bb.43: # %cond.store41			; AVX512F-NEXT: # %bb.43: # %cond.store41
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrb $5, %xmm0, 21(%rdi)
	; AVX512F-NEXT: vpextrb $5, %xmm1, 21(%rdi)
	; AVX512F-NEXT: .LBB15_44: # %else42			; AVX512F-NEXT: .LBB15_44: # %else42
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3
	; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3			; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0			; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0
	; AVX512F-NEXT: kshiftrw $6, %k0, %k0			; AVX512F-NEXT: kshiftrw $6, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_46			; AVX512F-NEXT: je .LBB15_46
	; AVX512F-NEXT: # %bb.45: # %cond.store43			; AVX512F-NEXT: # %bb.45: # %cond.store43
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX512F-NEXT: vpextrb $6, %xmm0, 22(%rdi)
	; AVX512F-NEXT: vpextrb $6, %xmm3, 22(%rdi)
	; AVX512F-NEXT: .LBB15_46: # %else44			; AVX512F-NEXT: .LBB15_46: # %else44
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $7, %k0, %k0			; AVX512F-NEXT: kshiftrw $7, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_48			; AVX512F-NEXT: je .LBB15_48
	; AVX512F-NEXT: # %bb.47: # %cond.store45			; AVX512F-NEXT: # %bb.47: # %cond.store45
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrb $7, %xmm0, 23(%rdi)
	; AVX512F-NEXT: vpextrb $7, %xmm1, 23(%rdi)
	; AVX512F-NEXT: .LBB15_48: # %else46			; AVX512F-NEXT: .LBB15_48: # %else46
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3
	; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3			; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0			; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0
	; AVX512F-NEXT: kshiftrw $8, %k0, %k0			; AVX512F-NEXT: kshiftrw $8, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_50			; AVX512F-NEXT: je .LBB15_50
	; AVX512F-NEXT: # %bb.49: # %cond.store47			; AVX512F-NEXT: # %bb.49: # %cond.store47
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX512F-NEXT: vpextrb $8, %xmm0, 24(%rdi)
	; AVX512F-NEXT: vpextrb $8, %xmm3, 24(%rdi)
	; AVX512F-NEXT: .LBB15_50: # %else48			; AVX512F-NEXT: .LBB15_50: # %else48
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $9, %k0, %k0			; AVX512F-NEXT: kshiftrw $9, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_52			; AVX512F-NEXT: je .LBB15_52
	; AVX512F-NEXT: # %bb.51: # %cond.store49			; AVX512F-NEXT: # %bb.51: # %cond.store49
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrb $9, %xmm0, 25(%rdi)
	; AVX512F-NEXT: vpextrb $9, %xmm1, 25(%rdi)
	; AVX512F-NEXT: .LBB15_52: # %else50			; AVX512F-NEXT: .LBB15_52: # %else50
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3
	; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3			; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0			; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0
	; AVX512F-NEXT: kshiftrw $10, %k0, %k0			; AVX512F-NEXT: kshiftrw $10, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_54			; AVX512F-NEXT: je .LBB15_54
	; AVX512F-NEXT: # %bb.53: # %cond.store51			; AVX512F-NEXT: # %bb.53: # %cond.store51
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX512F-NEXT: vpextrb $10, %xmm0, 26(%rdi)
	; AVX512F-NEXT: vpextrb $10, %xmm3, 26(%rdi)
	; AVX512F-NEXT: .LBB15_54: # %else52			; AVX512F-NEXT: .LBB15_54: # %else52
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $11, %k0, %k0			; AVX512F-NEXT: kshiftrw $11, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_56			; AVX512F-NEXT: je .LBB15_56
	; AVX512F-NEXT: # %bb.55: # %cond.store53			; AVX512F-NEXT: # %bb.55: # %cond.store53
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrb $11, %xmm0, 27(%rdi)
	; AVX512F-NEXT: vpextrb $11, %xmm1, 27(%rdi)
	; AVX512F-NEXT: .LBB15_56: # %else54			; AVX512F-NEXT: .LBB15_56: # %else54
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3
	; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3			; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0			; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0
	; AVX512F-NEXT: kshiftrw $12, %k0, %k0			; AVX512F-NEXT: kshiftrw $12, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_58			; AVX512F-NEXT: je .LBB15_58
	; AVX512F-NEXT: # %bb.57: # %cond.store55			; AVX512F-NEXT: # %bb.57: # %cond.store55
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX512F-NEXT: vpextrb $12, %xmm0, 28(%rdi)
	; AVX512F-NEXT: vpextrb $12, %xmm3, 28(%rdi)
	; AVX512F-NEXT: .LBB15_58: # %else56			; AVX512F-NEXT: .LBB15_58: # %else56
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $13, %k0, %k0			; AVX512F-NEXT: kshiftrw $13, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_60			; AVX512F-NEXT: je .LBB15_60
	; AVX512F-NEXT: # %bb.59: # %cond.store57			; AVX512F-NEXT: # %bb.59: # %cond.store57
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrb $13, %xmm0, 29(%rdi)
	; AVX512F-NEXT: vpextrb $13, %xmm1, 29(%rdi)
	; AVX512F-NEXT: .LBB15_60: # %else58			; AVX512F-NEXT: .LBB15_60: # %else58
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm2			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm2
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm2			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm2
	; AVX512F-NEXT: vpmovsxbd %xmm2, %zmm2			; AVX512F-NEXT: vpmovsxbd %xmm2, %zmm2
	; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0			; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0
	; AVX512F-NEXT: kshiftrw $14, %k0, %k0			; AVX512F-NEXT: kshiftrw $14, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_62			; AVX512F-NEXT: je .LBB15_62
	; AVX512F-NEXT: # %bb.61: # %cond.store59			; AVX512F-NEXT: # %bb.61: # %cond.store59
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm2			; AVX512F-NEXT: vpextrb $14, %xmm0, 30(%rdi)
	; AVX512F-NEXT: vpextrb $14, %xmm2, 30(%rdi)
	; AVX512F-NEXT: .LBB15_62: # %else60			; AVX512F-NEXT: .LBB15_62: # %else60
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $15, %k0, %k0			; AVX512F-NEXT: kshiftrw $15, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_64			; AVX512F-NEXT: je .LBB15_64
	; AVX512F-NEXT: # %bb.63: # %cond.store61			; AVX512F-NEXT: # %bb.63: # %cond.store61
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX512F-NEXT: vpextrb $15, %xmm0, 31(%rdi)			; AVX512F-NEXT: vpextrb $15, %xmm0, 31(%rdi)
	; AVX512F-NEXT: .LBB15_64: # %else62			; AVX512F-NEXT: .LBB15_64: # %else62
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512BW-LABEL: truncstore_v32i16_v32i8:			; AVX512BW-LABEL: truncstore_v32i16_v32i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: # kill: def $ymm1 killed $ymm1 def $zmm1			; AVX512BW-NEXT: # kill: def $ymm1 killed $ymm1 def $zmm1
	Show All 18 Lines
	; SSE2-LABEL: truncstore_v16i16_v16i8:			; SSE2-LABEL: truncstore_v16i16_v16i8:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: pxor %xmm3, %xmm3			; SSE2-NEXT: pxor %xmm3, %xmm3
	; SSE2-NEXT: pcmpeqb %xmm2, %xmm3			; SSE2-NEXT: pcmpeqb %xmm2, %xmm3
	; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [255,255,255,255,255,255,255,255]			; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [255,255,255,255,255,255,255,255]
	; SSE2-NEXT: pand %xmm4, %xmm1			; SSE2-NEXT: pand %xmm4, %xmm1
	; SSE2-NEXT: pand %xmm4, %xmm0			; SSE2-NEXT: pand %xmm4, %xmm0
	; SSE2-NEXT: packuswb %xmm1, %xmm0			; SSE2-NEXT: packuswb %xmm1, %xmm0
	; SSE2-NEXT: movd %xmm3, %eax			; SSE2-NEXT: movd %xmm3, %ecx
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %ecx, %eax
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: je .LBB16_2			; SSE2-NEXT: je .LBB16_2
	; SSE2-NEXT: # %bb.1: # %cond.store			; SSE2-NEXT: # %bb.1: # %cond.store
	; SSE2-NEXT: movd %xmm0, %ecx			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: movb %cl, (%rdi)
	; SSE2-NEXT: .LBB16_2: # %else			; SSE2-NEXT: .LBB16_2: # %else
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %ecx
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB16_4			; SSE2-NEXT: je .LBB16_4
	; SSE2-NEXT: # %bb.3: # %cond.store1			; SSE2-NEXT: # %bb.3: # %cond.store1
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: movb %ah, 1(%rdi)			; SSE2-NEXT: movb %ah, 1(%rdi)
	; SSE2-NEXT: .LBB16_4: # %else2			; SSE2-NEXT: .LBB16_4: # %else2
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm2, %xmm1			; SSE2-NEXT: pcmpeqb %xmm2, %xmm1
	; SSE2-NEXT: movd %xmm1, %eax			; SSE2-NEXT: movd %xmm1, %ecx
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %ecx, %edx
	; SSE2-NEXT: shrl $16, %ecx			; SSE2-NEXT: shrl $16, %edx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %dl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %dl
	; SSE2-NEXT: je .LBB16_6			; SSE2-NEXT: je .LBB16_6
	; SSE2-NEXT: # %bb.5: # %cond.store3			; SSE2-NEXT: # %bb.5: # %cond.store3
	; SSE2-NEXT: movd %xmm0, %ecx			; SSE2-NEXT: movl %eax, %edx
	; SSE2-NEXT: shrl $16, %ecx			; SSE2-NEXT: shrl $16, %edx
	; SSE2-NEXT: movb %cl, 2(%rdi)			; SSE2-NEXT: movb %dl, 2(%rdi)
	; SSE2-NEXT: .LBB16_6: # %else4			; SSE2-NEXT: .LBB16_6: # %else4
	; SSE2-NEXT: shrl $24, %eax			; SSE2-NEXT: shrl $24, %ecx
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB16_8			; SSE2-NEXT: je .LBB16_8
	; SSE2-NEXT: # %bb.7: # %cond.store5			; SSE2-NEXT: # %bb.7: # %cond.store5
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: shrl $24, %eax			; SSE2-NEXT: shrl $24, %eax
	; SSE2-NEXT: movb %al, 3(%rdi)			; SSE2-NEXT: movb %al, 3(%rdi)
	; SSE2-NEXT: .LBB16_8: # %else6			; SSE2-NEXT: .LBB16_8: # %else6
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm2, %xmm1			; SSE2-NEXT: pcmpeqb %xmm2, %xmm1
	; SSE2-NEXT: pextrw $2, %xmm1, %eax			; SSE2-NEXT: pextrw $2, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $2, %xmm0, %ecx
	; SSE2-NEXT: je .LBB16_10			; SSE2-NEXT: je .LBB16_10
	; SSE2-NEXT: # %bb.9: # %cond.store7			; SSE2-NEXT: # %bb.9: # %cond.store7
	; SSE2-NEXT: pextrw $2, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 4(%rdi)			; SSE2-NEXT: movb %cl, 4(%rdi)
	; SSE2-NEXT: .LBB16_10: # %else8			; SSE2-NEXT: .LBB16_10: # %else8
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB16_12			; SSE2-NEXT: je .LBB16_12
	; SSE2-NEXT: # %bb.11: # %cond.store9			; SSE2-NEXT: # %bb.11: # %cond.store9
	; SSE2-NEXT: pextrw $2, %xmm0, %eax			; SSE2-NEXT: movb %ch, 5(%rdi)
	; SSE2-NEXT: movb %ah, 5(%rdi)
	; SSE2-NEXT: .LBB16_12: # %else10			; SSE2-NEXT: .LBB16_12: # %else10
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm2, %xmm1			; SSE2-NEXT: pcmpeqb %xmm2, %xmm1
	; SSE2-NEXT: pextrw $3, %xmm1, %eax			; SSE2-NEXT: pextrw $3, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $3, %xmm0, %ecx
	; SSE2-NEXT: je .LBB16_14			; SSE2-NEXT: je .LBB16_14
	; SSE2-NEXT: # %bb.13: # %cond.store11			; SSE2-NEXT: # %bb.13: # %cond.store11
	; SSE2-NEXT: pextrw $3, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 6(%rdi)			; SSE2-NEXT: movb %cl, 6(%rdi)
	; SSE2-NEXT: .LBB16_14: # %else12			; SSE2-NEXT: .LBB16_14: # %else12
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB16_16			; SSE2-NEXT: je .LBB16_16
	; SSE2-NEXT: # %bb.15: # %cond.store13			; SSE2-NEXT: # %bb.15: # %cond.store13
	; SSE2-NEXT: pextrw $3, %xmm0, %eax			; SSE2-NEXT: movb %ch, 7(%rdi)
	; SSE2-NEXT: movb %ah, 7(%rdi)
	; SSE2-NEXT: .LBB16_16: # %else14			; SSE2-NEXT: .LBB16_16: # %else14
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm2, %xmm1			; SSE2-NEXT: pcmpeqb %xmm2, %xmm1
	; SSE2-NEXT: pextrw $4, %xmm1, %eax			; SSE2-NEXT: pextrw $4, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $4, %xmm0, %ecx
	; SSE2-NEXT: je .LBB16_18			; SSE2-NEXT: je .LBB16_18
	; SSE2-NEXT: # %bb.17: # %cond.store15			; SSE2-NEXT: # %bb.17: # %cond.store15
	; SSE2-NEXT: pextrw $4, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 8(%rdi)			; SSE2-NEXT: movb %cl, 8(%rdi)
	; SSE2-NEXT: .LBB16_18: # %else16			; SSE2-NEXT: .LBB16_18: # %else16
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB16_20			; SSE2-NEXT: je .LBB16_20
	; SSE2-NEXT: # %bb.19: # %cond.store17			; SSE2-NEXT: # %bb.19: # %cond.store17
	; SSE2-NEXT: pextrw $4, %xmm0, %eax			; SSE2-NEXT: movb %ch, 9(%rdi)
	; SSE2-NEXT: movb %ah, 9(%rdi)
	; SSE2-NEXT: .LBB16_20: # %else18			; SSE2-NEXT: .LBB16_20: # %else18
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm2, %xmm1			; SSE2-NEXT: pcmpeqb %xmm2, %xmm1
	; SSE2-NEXT: pextrw $5, %xmm1, %eax			; SSE2-NEXT: pextrw $5, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $5, %xmm0, %ecx
	; SSE2-NEXT: je .LBB16_22			; SSE2-NEXT: je .LBB16_22
	; SSE2-NEXT: # %bb.21: # %cond.store19			; SSE2-NEXT: # %bb.21: # %cond.store19
	; SSE2-NEXT: pextrw $5, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 10(%rdi)			; SSE2-NEXT: movb %cl, 10(%rdi)
	; SSE2-NEXT: .LBB16_22: # %else20			; SSE2-NEXT: .LBB16_22: # %else20
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB16_24			; SSE2-NEXT: je .LBB16_24
	; SSE2-NEXT: # %bb.23: # %cond.store21			; SSE2-NEXT: # %bb.23: # %cond.store21
	; SSE2-NEXT: pextrw $5, %xmm0, %eax			; SSE2-NEXT: movb %ch, 11(%rdi)
	; SSE2-NEXT: movb %ah, 11(%rdi)
	; SSE2-NEXT: .LBB16_24: # %else22			; SSE2-NEXT: .LBB16_24: # %else22
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm2, %xmm1			; SSE2-NEXT: pcmpeqb %xmm2, %xmm1
	; SSE2-NEXT: pextrw $6, %xmm1, %eax			; SSE2-NEXT: pextrw $6, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $6, %xmm0, %ecx
	; SSE2-NEXT: je .LBB16_26			; SSE2-NEXT: je .LBB16_26
	; SSE2-NEXT: # %bb.25: # %cond.store23			; SSE2-NEXT: # %bb.25: # %cond.store23
	; SSE2-NEXT: pextrw $6, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 12(%rdi)			; SSE2-NEXT: movb %cl, 12(%rdi)
	; SSE2-NEXT: .LBB16_26: # %else24			; SSE2-NEXT: .LBB16_26: # %else24
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB16_28			; SSE2-NEXT: je .LBB16_28
	; SSE2-NEXT: # %bb.27: # %cond.store25			; SSE2-NEXT: # %bb.27: # %cond.store25
	; SSE2-NEXT: pextrw $6, %xmm0, %eax			; SSE2-NEXT: movb %ch, 13(%rdi)
	; SSE2-NEXT: movb %ah, 13(%rdi)
	; SSE2-NEXT: .LBB16_28: # %else26			; SSE2-NEXT: .LBB16_28: # %else26
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm1, %xmm2			; SSE2-NEXT: pcmpeqb %xmm1, %xmm2
	; SSE2-NEXT: pextrw $7, %xmm2, %eax			; SSE2-NEXT: pextrw $7, %xmm2, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $7, %xmm0, %ecx
	; SSE2-NEXT: je .LBB16_30			; SSE2-NEXT: je .LBB16_30
	; SSE2-NEXT: # %bb.29: # %cond.store27			; SSE2-NEXT: # %bb.29: # %cond.store27
	; SSE2-NEXT: pextrw $7, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 14(%rdi)			; SSE2-NEXT: movb %cl, 14(%rdi)
	; SSE2-NEXT: .LBB16_30: # %else28			; SSE2-NEXT: .LBB16_30: # %else28
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB16_32			; SSE2-NEXT: je .LBB16_32
	; SSE2-NEXT: # %bb.31: # %cond.store29			; SSE2-NEXT: # %bb.31: # %cond.store29
	; SSE2-NEXT: pextrw $7, %xmm0, %eax			; SSE2-NEXT: movb %ch, 15(%rdi)
	; SSE2-NEXT: movb %ah, 15(%rdi)
	; SSE2-NEXT: .LBB16_32: # %else30			; SSE2-NEXT: .LBB16_32: # %else30
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE4-LABEL: truncstore_v16i16_v16i8:			; SSE4-LABEL: truncstore_v16i16_v16i8:
	; SSE4: # %bb.0:			; SSE4: # %bb.0:
	; SSE4-NEXT: pxor %xmm3, %xmm3			; SSE4-NEXT: pxor %xmm3, %xmm3
	; SSE4-NEXT: pcmpeqb %xmm2, %xmm3			; SSE4-NEXT: pcmpeqb %xmm2, %xmm3
	; SSE4-NEXT: movdqa {{.*#+}} xmm4 = <0,2,4,6,8,10,12,14,u,u,u,u,u,u,u,u>			; SSE4-NEXT: movdqa {{.*#+}} xmm4 = <0,2,4,6,8,10,12,14,u,u,u,u,u,u,u,u>
	▲ Show 20 Lines • Show All 615 Lines • ▼ Show 20 Lines

	define void @truncstore_v8i16_v8i8(<8 x i16> %x, <8 x i8>* %p, <8 x i16> %mask) {			define void @truncstore_v8i16_v8i8(<8 x i16> %x, <8 x i8>* %p, <8 x i16> %mask) {
	; SSE2-LABEL: truncstore_v8i16_v8i8:			; SSE2-LABEL: truncstore_v8i16_v8i8:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: pxor %xmm2, %xmm2			; SSE2-NEXT: pxor %xmm2, %xmm2
	; SSE2-NEXT: pcmpeqw %xmm1, %xmm2			; SSE2-NEXT: pcmpeqw %xmm1, %xmm2
	; SSE2-NEXT: pcmpeqd %xmm3, %xmm3			; SSE2-NEXT: pcmpeqd %xmm3, %xmm3
	; SSE2-NEXT: pxor %xmm2, %xmm3			; SSE2-NEXT: pxor %xmm2, %xmm3
	; SSE2-NEXT: movd %xmm3, %eax			; SSE2-NEXT: movd %xmm3, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: je .LBB17_2			; SSE2-NEXT: je .LBB17_2
	; SSE2-NEXT: # %bb.1: # %cond.store			; SSE2-NEXT: # %bb.1: # %cond.store
	; SSE2-NEXT: movd %xmm0, %ecx			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: movb %cl, (%rdi)
	; SSE2-NEXT: .LBB17_2: # %else			; SSE2-NEXT: .LBB17_2: # %else
	; SSE2-NEXT: shrl $16, %eax			; SSE2-NEXT: shrl $16, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB17_4			; SSE2-NEXT: je .LBB17_4
	; SSE2-NEXT: # %bb.3: # %cond.store1			; SSE2-NEXT: # %bb.3: # %cond.store1
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: shrl $16, %eax			; SSE2-NEXT: shrl $16, %eax
	; SSE2-NEXT: movb %al, 1(%rdi)			; SSE2-NEXT: movb %al, 1(%rdi)
	; SSE2-NEXT: .LBB17_4: # %else2			; SSE2-NEXT: .LBB17_4: # %else2
	; SSE2-NEXT: pxor %xmm3, %xmm3			; SSE2-NEXT: pxor %xmm3, %xmm3
	; SSE2-NEXT: pcmpeqw %xmm1, %xmm3			; SSE2-NEXT: pcmpeqw %xmm1, %xmm3
	; SSE2-NEXT: pcmpeqd %xmm2, %xmm2			; SSE2-NEXT: pcmpeqd %xmm2, %xmm2
	; SSE2-NEXT: pxor %xmm3, %xmm2			; SSE2-NEXT: pxor %xmm3, %xmm2
	; SSE2-NEXT: pextrw $2, %xmm2, %eax			; SSE2-NEXT: pextrw $2, %xmm2, %eax
	▲ Show 20 Lines • Show All 317 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/masked_store_trunc_ssat.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 1,106 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: por %xmm6, %xmm1			; SSE2-NEXT: por %xmm6, %xmm1
	; SSE2-NEXT: pand %xmm1, %xmm14			; SSE2-NEXT: pand %xmm1, %xmm14
	; SSE2-NEXT: pandn %xmm10, %xmm1			; SSE2-NEXT: pandn %xmm10, %xmm1
	; SSE2-NEXT: por %xmm14, %xmm1			; SSE2-NEXT: por %xmm14, %xmm1
	; SSE2-NEXT: packssdw %xmm3, %xmm1			; SSE2-NEXT: packssdw %xmm3, %xmm1
	; SSE2-NEXT: packssdw %xmm1, %xmm0			; SSE2-NEXT: packssdw %xmm1, %xmm0
	; SSE2-NEXT: movd %xmm8, %eax			; SSE2-NEXT: movd %xmm8, %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: je .LBB2_2			; SSE2-NEXT: je .LBB2_2
	; SSE2-NEXT: # %bb.1: # %cond.store			; SSE2-NEXT: # %bb.1: # %cond.store
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: movb %al, (%rdi)			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: .LBB2_2: # %else			; SSE2-NEXT: .LBB2_2: # %else
	; SSE2-NEXT: psrlq $16, %xmm9			; SSE2-NEXT: psrlq $16, %xmm9
	; SSE2-NEXT: movd %xmm9, %eax			; SSE2-NEXT: movd %xmm9, %ecx
	; SSE2-NEXT: shrl $16, %eax			; SSE2-NEXT: shrl $16, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB2_4			; SSE2-NEXT: je .LBB2_4
	; SSE2-NEXT: # %bb.3: # %cond.store1			; SSE2-NEXT: # %bb.3: # %cond.store1
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: shrl $16, %eax			; SSE2-NEXT: shrl $16, %eax
	; SSE2-NEXT: movb %al, 1(%rdi)			; SSE2-NEXT: movb %al, 1(%rdi)
	; SSE2-NEXT: .LBB2_4: # %else2			; SSE2-NEXT: .LBB2_4: # %else2
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm4			; SSE2-NEXT: pcmpeqd %xmm1, %xmm4
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm1			; SSE2-NEXT: pcmpeqd %xmm1, %xmm1
	; SSE2-NEXT: pxor %xmm4, %xmm1			; SSE2-NEXT: pxor %xmm4, %xmm1
	; SSE2-NEXT: pextrw $4, %xmm1, %eax			; SSE2-NEXT: pextrw $4, %xmm1, %eax
	▲ Show 20 Lines • Show All 2,239 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm4			; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm4
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpxor %xmm2, %xmm4, %xmm4			; AVX1-NEXT: vpxor %xmm2, %xmm4, %xmm4
	; AVX1-NEXT: vpackssdw %xmm0, %xmm4, %xmm4			; AVX1-NEXT: vpackssdw %xmm0, %xmm4, %xmm4
	; AVX1-NEXT: vpacksswb %xmm4, %xmm0, %xmm4			; AVX1-NEXT: vpacksswb %xmm4, %xmm0, %xmm4
	; AVX1-NEXT: vpextrb $8, %xmm4, %eax			; AVX1-NEXT: vpextrb $8, %xmm4, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
				; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: je .LBB9_18			; AVX1-NEXT: je .LBB9_18
	; AVX1-NEXT: # %bb.17: # %cond.store15			; AVX1-NEXT: # %bb.17: # %cond.store15
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vpextrw $0, %xmm0, 16(%rdi)
	; AVX1-NEXT: vpextrw $0, %xmm4, 16(%rdi)
	; AVX1-NEXT: .LBB9_18: # %else16			; AVX1-NEXT: .LBB9_18: # %else16
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpackssdw %xmm0, %xmm1, %xmm1			; AVX1-NEXT: vpackssdw %xmm0, %xmm1, %xmm1
	; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpextrb $9, %xmm1, %eax			; AVX1-NEXT: vpextrb $9, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB9_20			; AVX1-NEXT: je .LBB9_20
	; AVX1-NEXT: # %bb.19: # %cond.store17			; AVX1-NEXT: # %bb.19: # %cond.store17
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vpextrw $1, %xmm0, 18(%rdi)
	; AVX1-NEXT: vpextrw $1, %xmm1, 18(%rdi)
	; AVX1-NEXT: .LBB9_20: # %else18			; AVX1-NEXT: .LBB9_20: # %else18
	; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm4			; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm4
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpxor %xmm2, %xmm4, %xmm4			; AVX1-NEXT: vpxor %xmm2, %xmm4, %xmm4
	; AVX1-NEXT: vpackssdw %xmm0, %xmm4, %xmm4			; AVX1-NEXT: vpackssdw %xmm0, %xmm4, %xmm4
	; AVX1-NEXT: vpacksswb %xmm4, %xmm0, %xmm4			; AVX1-NEXT: vpacksswb %xmm4, %xmm0, %xmm4
	; AVX1-NEXT: vpextrb $10, %xmm4, %eax			; AVX1-NEXT: vpextrb $10, %xmm4, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB9_22			; AVX1-NEXT: je .LBB9_22
	; AVX1-NEXT: # %bb.21: # %cond.store19			; AVX1-NEXT: # %bb.21: # %cond.store19
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vpextrw $2, %xmm0, 20(%rdi)
	; AVX1-NEXT: vpextrw $2, %xmm4, 20(%rdi)
	; AVX1-NEXT: .LBB9_22: # %else20			; AVX1-NEXT: .LBB9_22: # %else20
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpackssdw %xmm0, %xmm1, %xmm1			; AVX1-NEXT: vpackssdw %xmm0, %xmm1, %xmm1
	; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpextrb $11, %xmm1, %eax			; AVX1-NEXT: vpextrb $11, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB9_24			; AVX1-NEXT: je .LBB9_24
	; AVX1-NEXT: # %bb.23: # %cond.store21			; AVX1-NEXT: # %bb.23: # %cond.store21
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vpextrw $3, %xmm0, 22(%rdi)
	; AVX1-NEXT: vpextrw $3, %xmm1, 22(%rdi)
	; AVX1-NEXT: .LBB9_24: # %else22			; AVX1-NEXT: .LBB9_24: # %else22
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm1
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpackssdw %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpackssdw %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vpacksswb %xmm3, %xmm0, %xmm3			; AVX1-NEXT: vpacksswb %xmm3, %xmm0, %xmm3
	; AVX1-NEXT: vpextrb $12, %xmm3, %eax			; AVX1-NEXT: vpextrb $12, %xmm3, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB9_26			; AVX1-NEXT: je .LBB9_26
	; AVX1-NEXT: # %bb.25: # %cond.store23			; AVX1-NEXT: # %bb.25: # %cond.store23
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrw $4, %xmm0, 24(%rdi)
	; AVX1-NEXT: vpextrw $4, %xmm3, 24(%rdi)
	; AVX1-NEXT: .LBB9_26: # %else24			; AVX1-NEXT: .LBB9_26: # %else24
	; AVX1-NEXT: vpackssdw %xmm2, %xmm0, %xmm2			; AVX1-NEXT: vpackssdw %xmm2, %xmm0, %xmm2
	; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm2			; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm2
	; AVX1-NEXT: vpextrb $13, %xmm2, %eax			; AVX1-NEXT: vpextrb $13, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB9_28			; AVX1-NEXT: je .LBB9_28
	; AVX1-NEXT: # %bb.27: # %cond.store25			; AVX1-NEXT: # %bb.27: # %cond.store25
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrw $5, %xmm0, 26(%rdi)
	; AVX1-NEXT: vpextrw $5, %xmm2, 26(%rdi)
	; AVX1-NEXT: .LBB9_28: # %else26			; AVX1-NEXT: .LBB9_28: # %else26
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm2			; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm2
	; AVX1-NEXT: vpextrb $14, %xmm2, %eax			; AVX1-NEXT: vpextrb $14, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB9_30			; AVX1-NEXT: je .LBB9_30
	; AVX1-NEXT: # %bb.29: # %cond.store27			; AVX1-NEXT: # %bb.29: # %cond.store27
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrw $6, %xmm0, 28(%rdi)
	; AVX1-NEXT: vpextrw $6, %xmm2, 28(%rdi)
	; AVX1-NEXT: .LBB9_30: # %else28			; AVX1-NEXT: .LBB9_30: # %else28
	; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpextrb $15, %xmm1, %eax			; AVX1-NEXT: vpextrb $15, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB9_32			; AVX1-NEXT: je .LBB9_32
	; AVX1-NEXT: # %bb.31: # %cond.store29			; AVX1-NEXT: # %bb.31: # %cond.store29
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: vpextrw $7, %xmm0, 30(%rdi)			; AVX1-NEXT: vpextrw $7, %xmm0, 30(%rdi)
	; AVX1-NEXT: .LBB9_32: # %else30			; AVX1-NEXT: .LBB9_32: # %else30
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: truncstore_v16i32_v16i16:			; AVX2-LABEL: truncstore_v16i32_v16i16:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpxor %xmm4, %xmm4, %xmm4			; AVX2-NEXT: vpxor %xmm4, %xmm4, %xmm4
	▲ Show 20 Lines • Show All 85 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1
	; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm4			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm4
	; AVX2-NEXT: vpackssdw %xmm0, %xmm4, %xmm4			; AVX2-NEXT: vpackssdw %xmm0, %xmm4, %xmm4
	; AVX2-NEXT: vpacksswb %xmm4, %xmm0, %xmm4			; AVX2-NEXT: vpacksswb %xmm4, %xmm0, %xmm4
	; AVX2-NEXT: vpextrb $8, %xmm4, %eax			; AVX2-NEXT: vpextrb $8, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: je .LBB9_18			; AVX2-NEXT: je .LBB9_18
	; AVX2-NEXT: # %bb.17: # %cond.store15			; AVX2-NEXT: # %bb.17: # %cond.store15
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm4			; AVX2-NEXT: vpextrw $0, %xmm0, 16(%rdi)
	; AVX2-NEXT: vpextrw $0, %xmm4, 16(%rdi)
	; AVX2-NEXT: .LBB9_18: # %else16			; AVX2-NEXT: .LBB9_18: # %else16
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpackssdw %xmm0, %xmm1, %xmm1			; AVX2-NEXT: vpackssdw %xmm0, %xmm1, %xmm1
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpextrb $9, %xmm1, %eax			; AVX2-NEXT: vpextrb $9, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB9_20			; AVX2-NEXT: je .LBB9_20
	; AVX2-NEXT: # %bb.19: # %cond.store17			; AVX2-NEXT: # %bb.19: # %cond.store17
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrw $1, %xmm0, 18(%rdi)
	; AVX2-NEXT: vpextrw $1, %xmm1, 18(%rdi)
	; AVX2-NEXT: .LBB9_20: # %else18			; AVX2-NEXT: .LBB9_20: # %else18
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1
	; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm4			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm4
	; AVX2-NEXT: vpackssdw %xmm0, %xmm4, %xmm4			; AVX2-NEXT: vpackssdw %xmm0, %xmm4, %xmm4
	; AVX2-NEXT: vpacksswb %xmm4, %xmm0, %xmm4			; AVX2-NEXT: vpacksswb %xmm4, %xmm0, %xmm4
	; AVX2-NEXT: vpextrb $10, %xmm4, %eax			; AVX2-NEXT: vpextrb $10, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB9_22			; AVX2-NEXT: je .LBB9_22
	; AVX2-NEXT: # %bb.21: # %cond.store19			; AVX2-NEXT: # %bb.21: # %cond.store19
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm4			; AVX2-NEXT: vpextrw $2, %xmm0, 20(%rdi)
	; AVX2-NEXT: vpextrw $2, %xmm4, 20(%rdi)
	; AVX2-NEXT: .LBB9_22: # %else20			; AVX2-NEXT: .LBB9_22: # %else20
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpackssdw %xmm0, %xmm1, %xmm1			; AVX2-NEXT: vpackssdw %xmm0, %xmm1, %xmm1
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpextrb $11, %xmm1, %eax			; AVX2-NEXT: vpextrb $11, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB9_24			; AVX2-NEXT: je .LBB9_24
	; AVX2-NEXT: # %bb.23: # %cond.store21			; AVX2-NEXT: # %bb.23: # %cond.store21
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrw $3, %xmm0, 22(%rdi)
	; AVX2-NEXT: vpextrw $3, %xmm1, 22(%rdi)
	; AVX2-NEXT: .LBB9_24: # %else22			; AVX2-NEXT: .LBB9_24: # %else22
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm2			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm2
	; AVX2-NEXT: vpacksswb %xmm2, %xmm0, %xmm2			; AVX2-NEXT: vpacksswb %xmm2, %xmm0, %xmm2
	; AVX2-NEXT: vpextrb $12, %xmm2, %eax			; AVX2-NEXT: vpextrb $12, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB9_26			; AVX2-NEXT: je .LBB9_26
	; AVX2-NEXT: # %bb.25: # %cond.store23			; AVX2-NEXT: # %bb.25: # %cond.store23
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm2			; AVX2-NEXT: vpextrw $4, %xmm0, 24(%rdi)
	; AVX2-NEXT: vpextrw $4, %xmm2, 24(%rdi)
	; AVX2-NEXT: .LBB9_26: # %else24			; AVX2-NEXT: .LBB9_26: # %else24
	; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpextrb $13, %xmm1, %eax			; AVX2-NEXT: vpextrb $13, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB9_28			; AVX2-NEXT: je .LBB9_28
	; AVX2-NEXT: # %bb.27: # %cond.store25			; AVX2-NEXT: # %bb.27: # %cond.store25
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrw $5, %xmm0, 26(%rdi)
	; AVX2-NEXT: vpextrw $5, %xmm1, 26(%rdi)
	; AVX2-NEXT: .LBB9_28: # %else26			; AVX2-NEXT: .LBB9_28: # %else26
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm2			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm2
	; AVX2-NEXT: vpacksswb %xmm2, %xmm0, %xmm2			; AVX2-NEXT: vpacksswb %xmm2, %xmm0, %xmm2
	; AVX2-NEXT: vpextrb $14, %xmm2, %eax			; AVX2-NEXT: vpextrb $14, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB9_30			; AVX2-NEXT: je .LBB9_30
	; AVX2-NEXT: # %bb.29: # %cond.store27			; AVX2-NEXT: # %bb.29: # %cond.store27
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm2			; AVX2-NEXT: vpextrw $6, %xmm0, 28(%rdi)
	; AVX2-NEXT: vpextrw $6, %xmm2, 28(%rdi)
	; AVX2-NEXT: .LBB9_30: # %else28			; AVX2-NEXT: .LBB9_30: # %else28
	; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpextrb $15, %xmm1, %eax			; AVX2-NEXT: vpextrb $15, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB9_32			; AVX2-NEXT: je .LBB9_32
	; AVX2-NEXT: # %bb.31: # %cond.store29			; AVX2-NEXT: # %bb.31: # %cond.store29
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: vpextrw $7, %xmm0, 30(%rdi)			; AVX2-NEXT: vpextrw $7, %xmm0, 30(%rdi)
	; AVX2-NEXT: .LBB9_32: # %else30			; AVX2-NEXT: .LBB9_32: # %else30
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: truncstore_v16i32_v16i16:			; AVX512F-LABEL: truncstore_v16i32_v16i16:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_16			; AVX512F-NEXT: je .LBB9_16
	; AVX512F-NEXT: # %bb.15: # %cond.store13			; AVX512F-NEXT: # %bb.15: # %cond.store13
	; AVX512F-NEXT: vpextrw $7, %xmm0, 14(%rdi)			; AVX512F-NEXT: vpextrw $7, %xmm0, 14(%rdi)
	; AVX512F-NEXT: .LBB9_16: # %else14			; AVX512F-NEXT: .LBB9_16: # %else14
	; AVX512F-NEXT: kshiftrw $8, %k0, %k1			; AVX512F-NEXT: kshiftrw $8, %k0, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
				; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX512F-NEXT: je .LBB9_18			; AVX512F-NEXT: je .LBB9_18
	; AVX512F-NEXT: # %bb.17: # %cond.store15			; AVX512F-NEXT: # %bb.17: # %cond.store15
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrw $0, %xmm0, 16(%rdi)
	; AVX512F-NEXT: vpextrw $0, %xmm1, 16(%rdi)
	; AVX512F-NEXT: .LBB9_18: # %else16			; AVX512F-NEXT: .LBB9_18: # %else16
	; AVX512F-NEXT: kshiftrw $9, %k0, %k1			; AVX512F-NEXT: kshiftrw $9, %k0, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_20			; AVX512F-NEXT: je .LBB9_20
	; AVX512F-NEXT: # %bb.19: # %cond.store17			; AVX512F-NEXT: # %bb.19: # %cond.store17
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrw $1, %xmm0, 18(%rdi)
	; AVX512F-NEXT: vpextrw $1, %xmm1, 18(%rdi)
	; AVX512F-NEXT: .LBB9_20: # %else18			; AVX512F-NEXT: .LBB9_20: # %else18
	; AVX512F-NEXT: kshiftrw $10, %k0, %k1			; AVX512F-NEXT: kshiftrw $10, %k0, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_22			; AVX512F-NEXT: je .LBB9_22
	; AVX512F-NEXT: # %bb.21: # %cond.store19			; AVX512F-NEXT: # %bb.21: # %cond.store19
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrw $2, %xmm0, 20(%rdi)
	; AVX512F-NEXT: vpextrw $2, %xmm1, 20(%rdi)
	; AVX512F-NEXT: .LBB9_22: # %else20			; AVX512F-NEXT: .LBB9_22: # %else20
	; AVX512F-NEXT: kshiftrw $11, %k0, %k1			; AVX512F-NEXT: kshiftrw $11, %k0, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_24			; AVX512F-NEXT: je .LBB9_24
	; AVX512F-NEXT: # %bb.23: # %cond.store21			; AVX512F-NEXT: # %bb.23: # %cond.store21
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrw $3, %xmm0, 22(%rdi)
	; AVX512F-NEXT: vpextrw $3, %xmm1, 22(%rdi)
	; AVX512F-NEXT: .LBB9_24: # %else22			; AVX512F-NEXT: .LBB9_24: # %else22
	; AVX512F-NEXT: kshiftrw $12, %k0, %k1			; AVX512F-NEXT: kshiftrw $12, %k0, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_26			; AVX512F-NEXT: je .LBB9_26
	; AVX512F-NEXT: # %bb.25: # %cond.store23			; AVX512F-NEXT: # %bb.25: # %cond.store23
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrw $4, %xmm0, 24(%rdi)
	; AVX512F-NEXT: vpextrw $4, %xmm1, 24(%rdi)
	; AVX512F-NEXT: .LBB9_26: # %else24			; AVX512F-NEXT: .LBB9_26: # %else24
	; AVX512F-NEXT: kshiftrw $13, %k0, %k1			; AVX512F-NEXT: kshiftrw $13, %k0, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_28			; AVX512F-NEXT: je .LBB9_28
	; AVX512F-NEXT: # %bb.27: # %cond.store25			; AVX512F-NEXT: # %bb.27: # %cond.store25
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrw $5, %xmm0, 26(%rdi)
	; AVX512F-NEXT: vpextrw $5, %xmm1, 26(%rdi)
	; AVX512F-NEXT: .LBB9_28: # %else26			; AVX512F-NEXT: .LBB9_28: # %else26
	; AVX512F-NEXT: kshiftrw $14, %k0, %k1			; AVX512F-NEXT: kshiftrw $14, %k0, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_30			; AVX512F-NEXT: je .LBB9_30
	; AVX512F-NEXT: # %bb.29: # %cond.store27			; AVX512F-NEXT: # %bb.29: # %cond.store27
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrw $6, %xmm0, 28(%rdi)
	; AVX512F-NEXT: vpextrw $6, %xmm1, 28(%rdi)
	; AVX512F-NEXT: .LBB9_30: # %else28			; AVX512F-NEXT: .LBB9_30: # %else28
	; AVX512F-NEXT: kshiftrw $15, %k0, %k0			; AVX512F-NEXT: kshiftrw $15, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_32			; AVX512F-NEXT: je .LBB9_32
	; AVX512F-NEXT: # %bb.31: # %cond.store29			; AVX512F-NEXT: # %bb.31: # %cond.store29
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX512F-NEXT: vpextrw $7, %xmm0, 30(%rdi)			; AVX512F-NEXT: vpextrw $7, %xmm0, 30(%rdi)
	; AVX512F-NEXT: .LBB9_32: # %else30			; AVX512F-NEXT: .LBB9_32: # %else30
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512BW-LABEL: truncstore_v16i32_v16i16:			; AVX512BW-LABEL: truncstore_v16i32_v16i16:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vptestmd %zmm1, %zmm1, %k1			; AVX512BW-NEXT: vptestmd %zmm1, %zmm1, %k1
	Show All 27 Lines
	; SSE2-NEXT: pxor %xmm8, %xmm8			; SSE2-NEXT: pxor %xmm8, %xmm8
	; SSE2-NEXT: pcmpeqd %xmm4, %xmm8			; SSE2-NEXT: pcmpeqd %xmm4, %xmm8
	; SSE2-NEXT: packssdw %xmm3, %xmm2			; SSE2-NEXT: packssdw %xmm3, %xmm2
	; SSE2-NEXT: packssdw %xmm1, %xmm0			; SSE2-NEXT: packssdw %xmm1, %xmm0
	; SSE2-NEXT: packsswb %xmm2, %xmm0			; SSE2-NEXT: packsswb %xmm2, %xmm0
	; SSE2-NEXT: movd %xmm8, %eax			; SSE2-NEXT: movd %xmm8, %eax
	; SSE2-NEXT: notl %eax			; SSE2-NEXT: notl %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: je .LBB10_2			; SSE2-NEXT: je .LBB10_2
	; SSE2-NEXT: # %bb.1: # %cond.store			; SSE2-NEXT: # %bb.1: # %cond.store
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: movb %al, (%rdi)			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: .LBB10_2: # %else			; SSE2-NEXT: .LBB10_2: # %else
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm1			; SSE2-NEXT: pcmpeqd %xmm1, %xmm1
	; SSE2-NEXT: pxor %xmm1, %xmm8			; SSE2-NEXT: pxor %xmm1, %xmm8
	; SSE2-NEXT: pextrw $2, %xmm8, %eax			; SSE2-NEXT: pextrw $2, %xmm8, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_4			; SSE2-NEXT: je .LBB10_4
	; SSE2-NEXT: # %bb.3: # %cond.store1			; SSE2-NEXT: # %bb.3: # %cond.store1
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: movb %ah, 1(%rdi)			; SSE2-NEXT: movb %ah, 1(%rdi)
	; SSE2-NEXT: .LBB10_4: # %else2			; SSE2-NEXT: .LBB10_4: # %else2
	; SSE2-NEXT: pxor %xmm2, %xmm2			; SSE2-NEXT: pxor %xmm2, %xmm2
	; SSE2-NEXT: pcmpeqd %xmm2, %xmm4			; SSE2-NEXT: pcmpeqd %xmm2, %xmm4
	; SSE2-NEXT: pxor %xmm4, %xmm1			; SSE2-NEXT: pxor %xmm4, %xmm1
	; SSE2-NEXT: pextrw $4, %xmm1, %eax			; SSE2-NEXT: pextrw $4, %xmm1, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_6			; SSE2-NEXT: je .LBB10_6
	; SSE2-NEXT: # %bb.5: # %cond.store3			; SSE2-NEXT: # %bb.5: # %cond.store3
	; SSE2-NEXT: movd %xmm0, %eax			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: shrl $16, %eax			; SSE2-NEXT: shrl $16, %ecx
	; SSE2-NEXT: movb %al, 2(%rdi)			; SSE2-NEXT: movb %cl, 2(%rdi)
	; SSE2-NEXT: .LBB10_6: # %else4			; SSE2-NEXT: .LBB10_6: # %else4
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm1			; SSE2-NEXT: pcmpeqd %xmm1, %xmm1
	; SSE2-NEXT: pxor %xmm1, %xmm4			; SSE2-NEXT: pxor %xmm1, %xmm4
	; SSE2-NEXT: pextrw $6, %xmm4, %eax			; SSE2-NEXT: pextrw $6, %xmm4, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_8			; SSE2-NEXT: je .LBB10_8
	; SSE2-NEXT: # %bb.7: # %cond.store5			; SSE2-NEXT: # %bb.7: # %cond.store5
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: shrl $24, %eax			; SSE2-NEXT: shrl $24, %eax
	; SSE2-NEXT: movb %al, 3(%rdi)			; SSE2-NEXT: movb %al, 3(%rdi)
	; SSE2-NEXT: .LBB10_8: # %else6			; SSE2-NEXT: .LBB10_8: # %else6
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm5, %xmm1			; SSE2-NEXT: pcmpeqd %xmm5, %xmm1
	; SSE2-NEXT: movd %xmm1, %eax			; SSE2-NEXT: movd %xmm1, %eax
	; SSE2-NEXT: notl %eax			; SSE2-NEXT: notl %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: pextrw $2, %xmm0, %eax
	; SSE2-NEXT: je .LBB10_10			; SSE2-NEXT: je .LBB10_10
	; SSE2-NEXT: # %bb.9: # %cond.store7			; SSE2-NEXT: # %bb.9: # %cond.store7
	; SSE2-NEXT: pextrw $2, %xmm0, %eax
	; SSE2-NEXT: movb %al, 4(%rdi)			; SSE2-NEXT: movb %al, 4(%rdi)
	; SSE2-NEXT: .LBB10_10: # %else8			; SSE2-NEXT: .LBB10_10: # %else8
	; SSE2-NEXT: pcmpeqd %xmm2, %xmm2			; SSE2-NEXT: pcmpeqd %xmm2, %xmm2
	; SSE2-NEXT: pxor %xmm2, %xmm1			; SSE2-NEXT: pxor %xmm2, %xmm1
	; SSE2-NEXT: pextrw $2, %xmm1, %eax			; SSE2-NEXT: pextrw $2, %xmm1, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_12			; SSE2-NEXT: je .LBB10_12
	; SSE2-NEXT: # %bb.11: # %cond.store9			; SSE2-NEXT: # %bb.11: # %cond.store9
	; SSE2-NEXT: pextrw $2, %xmm0, %eax
	; SSE2-NEXT: movb %ah, 5(%rdi)			; SSE2-NEXT: movb %ah, 5(%rdi)
	; SSE2-NEXT: .LBB10_12: # %else10			; SSE2-NEXT: .LBB10_12: # %else10
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm5			; SSE2-NEXT: pcmpeqd %xmm1, %xmm5
	; SSE2-NEXT: pxor %xmm5, %xmm2			; SSE2-NEXT: pxor %xmm5, %xmm2
	; SSE2-NEXT: pextrw $4, %xmm2, %eax			; SSE2-NEXT: pextrw $4, %xmm2, %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: pextrw $3, %xmm0, %eax
	; SSE2-NEXT: je .LBB10_14			; SSE2-NEXT: je .LBB10_14
	; SSE2-NEXT: # %bb.13: # %cond.store11			; SSE2-NEXT: # %bb.13: # %cond.store11
	; SSE2-NEXT: pextrw $3, %xmm0, %eax
	; SSE2-NEXT: movb %al, 6(%rdi)			; SSE2-NEXT: movb %al, 6(%rdi)
	; SSE2-NEXT: .LBB10_14: # %else12			; SSE2-NEXT: .LBB10_14: # %else12
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm1			; SSE2-NEXT: pcmpeqd %xmm1, %xmm1
	; SSE2-NEXT: pxor %xmm1, %xmm5			; SSE2-NEXT: pxor %xmm1, %xmm5
	; SSE2-NEXT: pextrw $6, %xmm5, %eax			; SSE2-NEXT: pextrw $6, %xmm5, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_16			; SSE2-NEXT: je .LBB10_16
	; SSE2-NEXT: # %bb.15: # %cond.store13			; SSE2-NEXT: # %bb.15: # %cond.store13
	; SSE2-NEXT: pextrw $3, %xmm0, %eax
	; SSE2-NEXT: movb %ah, 7(%rdi)			; SSE2-NEXT: movb %ah, 7(%rdi)
	; SSE2-NEXT: .LBB10_16: # %else14			; SSE2-NEXT: .LBB10_16: # %else14
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm6, %xmm1			; SSE2-NEXT: pcmpeqd %xmm6, %xmm1
	; SSE2-NEXT: movd %xmm1, %eax			; SSE2-NEXT: movd %xmm1, %eax
	; SSE2-NEXT: notl %eax			; SSE2-NEXT: notl %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: pextrw $4, %xmm0, %eax
	; SSE2-NEXT: je .LBB10_18			; SSE2-NEXT: je .LBB10_18
	; SSE2-NEXT: # %bb.17: # %cond.store15			; SSE2-NEXT: # %bb.17: # %cond.store15
	; SSE2-NEXT: pextrw $4, %xmm0, %eax
	; SSE2-NEXT: movb %al, 8(%rdi)			; SSE2-NEXT: movb %al, 8(%rdi)
	; SSE2-NEXT: .LBB10_18: # %else16			; SSE2-NEXT: .LBB10_18: # %else16
	; SSE2-NEXT: pcmpeqd %xmm2, %xmm2			; SSE2-NEXT: pcmpeqd %xmm2, %xmm2
	; SSE2-NEXT: pxor %xmm2, %xmm1			; SSE2-NEXT: pxor %xmm2, %xmm1
	; SSE2-NEXT: pextrw $2, %xmm1, %eax			; SSE2-NEXT: pextrw $2, %xmm1, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_20			; SSE2-NEXT: je .LBB10_20
	; SSE2-NEXT: # %bb.19: # %cond.store17			; SSE2-NEXT: # %bb.19: # %cond.store17
	; SSE2-NEXT: pextrw $4, %xmm0, %eax
	; SSE2-NEXT: movb %ah, 9(%rdi)			; SSE2-NEXT: movb %ah, 9(%rdi)
	; SSE2-NEXT: .LBB10_20: # %else18			; SSE2-NEXT: .LBB10_20: # %else18
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm6			; SSE2-NEXT: pcmpeqd %xmm1, %xmm6
	; SSE2-NEXT: pxor %xmm6, %xmm2			; SSE2-NEXT: pxor %xmm6, %xmm2
	; SSE2-NEXT: pextrw $4, %xmm2, %eax			; SSE2-NEXT: pextrw $4, %xmm2, %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: pextrw $5, %xmm0, %eax
	; SSE2-NEXT: je .LBB10_22			; SSE2-NEXT: je .LBB10_22
	; SSE2-NEXT: # %bb.21: # %cond.store19			; SSE2-NEXT: # %bb.21: # %cond.store19
	; SSE2-NEXT: pextrw $5, %xmm0, %eax
	; SSE2-NEXT: movb %al, 10(%rdi)			; SSE2-NEXT: movb %al, 10(%rdi)
	; SSE2-NEXT: .LBB10_22: # %else20			; SSE2-NEXT: .LBB10_22: # %else20
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm1			; SSE2-NEXT: pcmpeqd %xmm1, %xmm1
	; SSE2-NEXT: pxor %xmm1, %xmm6			; SSE2-NEXT: pxor %xmm1, %xmm6
	; SSE2-NEXT: pextrw $6, %xmm6, %eax			; SSE2-NEXT: pextrw $6, %xmm6, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_24			; SSE2-NEXT: je .LBB10_24
	; SSE2-NEXT: # %bb.23: # %cond.store21			; SSE2-NEXT: # %bb.23: # %cond.store21
	; SSE2-NEXT: pextrw $5, %xmm0, %eax
	; SSE2-NEXT: movb %ah, 11(%rdi)			; SSE2-NEXT: movb %ah, 11(%rdi)
	; SSE2-NEXT: .LBB10_24: # %else22			; SSE2-NEXT: .LBB10_24: # %else22
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm7, %xmm1			; SSE2-NEXT: pcmpeqd %xmm7, %xmm1
	; SSE2-NEXT: movd %xmm1, %eax			; SSE2-NEXT: movd %xmm1, %eax
	; SSE2-NEXT: notl %eax			; SSE2-NEXT: notl %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: pextrw $6, %xmm0, %eax
	; SSE2-NEXT: je .LBB10_26			; SSE2-NEXT: je .LBB10_26
	; SSE2-NEXT: # %bb.25: # %cond.store23			; SSE2-NEXT: # %bb.25: # %cond.store23
	; SSE2-NEXT: pextrw $6, %xmm0, %eax
	; SSE2-NEXT: movb %al, 12(%rdi)			; SSE2-NEXT: movb %al, 12(%rdi)
	; SSE2-NEXT: .LBB10_26: # %else24			; SSE2-NEXT: .LBB10_26: # %else24
	; SSE2-NEXT: pcmpeqd %xmm2, %xmm2			; SSE2-NEXT: pcmpeqd %xmm2, %xmm2
	; SSE2-NEXT: pxor %xmm2, %xmm1			; SSE2-NEXT: pxor %xmm2, %xmm1
	; SSE2-NEXT: pextrw $2, %xmm1, %eax			; SSE2-NEXT: pextrw $2, %xmm1, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_28			; SSE2-NEXT: je .LBB10_28
	; SSE2-NEXT: # %bb.27: # %cond.store25			; SSE2-NEXT: # %bb.27: # %cond.store25
	; SSE2-NEXT: pextrw $6, %xmm0, %eax
	; SSE2-NEXT: movb %ah, 13(%rdi)			; SSE2-NEXT: movb %ah, 13(%rdi)
	; SSE2-NEXT: .LBB10_28: # %else26			; SSE2-NEXT: .LBB10_28: # %else26
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm7			; SSE2-NEXT: pcmpeqd %xmm1, %xmm7
	; SSE2-NEXT: pxor %xmm7, %xmm2			; SSE2-NEXT: pxor %xmm7, %xmm2
	; SSE2-NEXT: pextrw $4, %xmm2, %eax			; SSE2-NEXT: pextrw $4, %xmm2, %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: pextrw $7, %xmm0, %eax
	; SSE2-NEXT: je .LBB10_30			; SSE2-NEXT: je .LBB10_30
	; SSE2-NEXT: # %bb.29: # %cond.store27			; SSE2-NEXT: # %bb.29: # %cond.store27
	; SSE2-NEXT: pextrw $7, %xmm0, %eax
	; SSE2-NEXT: movb %al, 14(%rdi)			; SSE2-NEXT: movb %al, 14(%rdi)
	; SSE2-NEXT: .LBB10_30: # %else28			; SSE2-NEXT: .LBB10_30: # %else28
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm1			; SSE2-NEXT: pcmpeqd %xmm0, %xmm0
	; SSE2-NEXT: pxor %xmm1, %xmm7			; SSE2-NEXT: pxor %xmm0, %xmm7
	; SSE2-NEXT: pextrw $6, %xmm7, %eax			; SSE2-NEXT: pextrw $6, %xmm7, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_32			; SSE2-NEXT: je .LBB10_32
	; SSE2-NEXT: # %bb.31: # %cond.store29			; SSE2-NEXT: # %bb.31: # %cond.store29
	; SSE2-NEXT: pextrw $7, %xmm0, %eax
	; SSE2-NEXT: movb %ah, 15(%rdi)			; SSE2-NEXT: movb %ah, 15(%rdi)
	; SSE2-NEXT: .LBB10_32: # %else30			; SSE2-NEXT: .LBB10_32: # %else30
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE4-LABEL: truncstore_v16i32_v16i8:			; SSE4-LABEL: truncstore_v16i32_v16i8:
	; SSE4: # %bb.0:			; SSE4: # %bb.0:
	; SSE4-NEXT: pxor %xmm9, %xmm9			; SSE4-NEXT: pxor %xmm9, %xmm9
	; SSE4-NEXT: pcmpeqd %xmm4, %xmm9			; SSE4-NEXT: pcmpeqd %xmm4, %xmm9
	▲ Show 20 Lines • Show All 1,068 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: movdqa %xmm7, %xmm0			; SSE2-NEXT: movdqa %xmm7, %xmm0
	; SSE2-NEXT: pcmpgtd %xmm1, %xmm0			; SSE2-NEXT: pcmpgtd %xmm1, %xmm0
	; SSE2-NEXT: pand %xmm0, %xmm7			; SSE2-NEXT: pand %xmm0, %xmm7
	; SSE2-NEXT: pandn %xmm1, %xmm0			; SSE2-NEXT: pandn %xmm1, %xmm0
	; SSE2-NEXT: por %xmm7, %xmm0			; SSE2-NEXT: por %xmm7, %xmm0
	; SSE2-NEXT: packssdw %xmm6, %xmm0			; SSE2-NEXT: packssdw %xmm6, %xmm0
	; SSE2-NEXT: movd %xmm5, %eax			; SSE2-NEXT: movd %xmm5, %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: je .LBB12_2			; SSE2-NEXT: je .LBB12_2
	; SSE2-NEXT: # %bb.1: # %cond.store			; SSE2-NEXT: # %bb.1: # %cond.store
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: movb %al, (%rdi)			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: .LBB12_2: # %else			; SSE2-NEXT: .LBB12_2: # %else
	; SSE2-NEXT: psrlq $16, %xmm4			; SSE2-NEXT: psrlq $16, %xmm4
	; SSE2-NEXT: movd %xmm4, %eax			; SSE2-NEXT: movd %xmm4, %ecx
	; SSE2-NEXT: shrl $16, %eax			; SSE2-NEXT: shrl $16, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB12_4			; SSE2-NEXT: je .LBB12_4
	; SSE2-NEXT: # %bb.3: # %cond.store1			; SSE2-NEXT: # %bb.3: # %cond.store1
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: shrl $16, %eax			; SSE2-NEXT: shrl $16, %eax
	; SSE2-NEXT: movb %al, 1(%rdi)			; SSE2-NEXT: movb %al, 1(%rdi)
	; SSE2-NEXT: .LBB12_4: # %else2			; SSE2-NEXT: .LBB12_4: # %else2
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm2			; SSE2-NEXT: pcmpeqd %xmm1, %xmm2
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm1			; SSE2-NEXT: pcmpeqd %xmm1, %xmm1
	; SSE2-NEXT: pxor %xmm2, %xmm1			; SSE2-NEXT: pxor %xmm2, %xmm1
	; SSE2-NEXT: pextrw $4, %xmm1, %eax			; SSE2-NEXT: pextrw $4, %xmm1, %eax
	▲ Show 20 Lines • Show All 881 Lines • ▼ Show 20 Lines
	}			}

	define void @truncstore_v32i16_v32i8(<32 x i16> %x, <32 x i8>* %p, <32 x i8> %mask) {			define void @truncstore_v32i16_v32i8(<32 x i16> %x, <32 x i8>* %p, <32 x i8> %mask) {
	; SSE2-LABEL: truncstore_v32i16_v32i8:			; SSE2-LABEL: truncstore_v32i16_v32i8:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: pxor %xmm6, %xmm6			; SSE2-NEXT: pxor %xmm6, %xmm6
	; SSE2-NEXT: pcmpeqb %xmm4, %xmm6			; SSE2-NEXT: pcmpeqb %xmm4, %xmm6
	; SSE2-NEXT: packsswb %xmm1, %xmm0			; SSE2-NEXT: packsswb %xmm1, %xmm0
	; SSE2-NEXT: movd %xmm6, %eax			; SSE2-NEXT: movd %xmm6, %ecx
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %ecx, %eax
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: je .LBB15_2			; SSE2-NEXT: je .LBB15_2
	; SSE2-NEXT: # %bb.1: # %cond.store			; SSE2-NEXT: # %bb.1: # %cond.store
	; SSE2-NEXT: movd %xmm0, %ecx			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: movb %cl, (%rdi)
	; SSE2-NEXT: .LBB15_2: # %else			; SSE2-NEXT: .LBB15_2: # %else
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %ecx
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB15_4			; SSE2-NEXT: je .LBB15_4
	; SSE2-NEXT: # %bb.3: # %cond.store1			; SSE2-NEXT: # %bb.3: # %cond.store1
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: movb %ah, 1(%rdi)			; SSE2-NEXT: movb %ah, 1(%rdi)
	; SSE2-NEXT: .LBB15_4: # %else2			; SSE2-NEXT: .LBB15_4: # %else2
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm4, %xmm1			; SSE2-NEXT: pcmpeqb %xmm4, %xmm1
	; SSE2-NEXT: movd %xmm1, %eax			; SSE2-NEXT: movd %xmm1, %ecx
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %ecx, %edx
	; SSE2-NEXT: shrl $16, %ecx			; SSE2-NEXT: shrl $16, %edx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %dl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %dl
	; SSE2-NEXT: je .LBB15_6			; SSE2-NEXT: je .LBB15_6
	; SSE2-NEXT: # %bb.5: # %cond.store3			; SSE2-NEXT: # %bb.5: # %cond.store3
	; SSE2-NEXT: movd %xmm0, %ecx			; SSE2-NEXT: movl %eax, %edx
	; SSE2-NEXT: shrl $16, %ecx			; SSE2-NEXT: shrl $16, %edx
	; SSE2-NEXT: movb %cl, 2(%rdi)			; SSE2-NEXT: movb %dl, 2(%rdi)
	; SSE2-NEXT: .LBB15_6: # %else4			; SSE2-NEXT: .LBB15_6: # %else4
	; SSE2-NEXT: shrl $24, %eax			; SSE2-NEXT: shrl $24, %ecx
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB15_8			; SSE2-NEXT: je .LBB15_8
	; SSE2-NEXT: # %bb.7: # %cond.store5			; SSE2-NEXT: # %bb.7: # %cond.store5
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: shrl $24, %eax			; SSE2-NEXT: shrl $24, %eax
	; SSE2-NEXT: movb %al, 3(%rdi)			; SSE2-NEXT: movb %al, 3(%rdi)
	; SSE2-NEXT: .LBB15_8: # %else6			; SSE2-NEXT: .LBB15_8: # %else6
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm4, %xmm1			; SSE2-NEXT: pcmpeqb %xmm4, %xmm1
	; SSE2-NEXT: pextrw $2, %xmm1, %eax			; SSE2-NEXT: pextrw $2, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $2, %xmm0, %ecx
	; SSE2-NEXT: je .LBB15_10			; SSE2-NEXT: je .LBB15_10
	; SSE2-NEXT: # %bb.9: # %cond.store7			; SSE2-NEXT: # %bb.9: # %cond.store7
	; SSE2-NEXT: pextrw $2, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 4(%rdi)			; SSE2-NEXT: movb %cl, 4(%rdi)
	; SSE2-NEXT: .LBB15_10: # %else8			; SSE2-NEXT: .LBB15_10: # %else8
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_12			; SSE2-NEXT: je .LBB15_12
	; SSE2-NEXT: # %bb.11: # %cond.store9			; SSE2-NEXT: # %bb.11: # %cond.store9
	; SSE2-NEXT: pextrw $2, %xmm0, %eax			; SSE2-NEXT: movb %ch, 5(%rdi)
	; SSE2-NEXT: movb %ah, 5(%rdi)
	; SSE2-NEXT: .LBB15_12: # %else10			; SSE2-NEXT: .LBB15_12: # %else10
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm4, %xmm1			; SSE2-NEXT: pcmpeqb %xmm4, %xmm1
	; SSE2-NEXT: pextrw $3, %xmm1, %eax			; SSE2-NEXT: pextrw $3, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $3, %xmm0, %ecx
	; SSE2-NEXT: je .LBB15_14			; SSE2-NEXT: je .LBB15_14
	; SSE2-NEXT: # %bb.13: # %cond.store11			; SSE2-NEXT: # %bb.13: # %cond.store11
	; SSE2-NEXT: pextrw $3, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 6(%rdi)			; SSE2-NEXT: movb %cl, 6(%rdi)
	; SSE2-NEXT: .LBB15_14: # %else12			; SSE2-NEXT: .LBB15_14: # %else12
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_16			; SSE2-NEXT: je .LBB15_16
	; SSE2-NEXT: # %bb.15: # %cond.store13			; SSE2-NEXT: # %bb.15: # %cond.store13
	; SSE2-NEXT: pextrw $3, %xmm0, %eax			; SSE2-NEXT: movb %ch, 7(%rdi)
	; SSE2-NEXT: movb %ah, 7(%rdi)
	; SSE2-NEXT: .LBB15_16: # %else14			; SSE2-NEXT: .LBB15_16: # %else14
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm4, %xmm1			; SSE2-NEXT: pcmpeqb %xmm4, %xmm1
	; SSE2-NEXT: pextrw $4, %xmm1, %eax			; SSE2-NEXT: pextrw $4, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $4, %xmm0, %ecx
	; SSE2-NEXT: je .LBB15_18			; SSE2-NEXT: je .LBB15_18
	; SSE2-NEXT: # %bb.17: # %cond.store15			; SSE2-NEXT: # %bb.17: # %cond.store15
	; SSE2-NEXT: pextrw $4, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 8(%rdi)			; SSE2-NEXT: movb %cl, 8(%rdi)
	; SSE2-NEXT: .LBB15_18: # %else16			; SSE2-NEXT: .LBB15_18: # %else16
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_20			; SSE2-NEXT: je .LBB15_20
	; SSE2-NEXT: # %bb.19: # %cond.store17			; SSE2-NEXT: # %bb.19: # %cond.store17
	; SSE2-NEXT: pextrw $4, %xmm0, %eax			; SSE2-NEXT: movb %ch, 9(%rdi)
	; SSE2-NEXT: movb %ah, 9(%rdi)
	; SSE2-NEXT: .LBB15_20: # %else18			; SSE2-NEXT: .LBB15_20: # %else18
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm4, %xmm1			; SSE2-NEXT: pcmpeqb %xmm4, %xmm1
	; SSE2-NEXT: pextrw $5, %xmm1, %eax			; SSE2-NEXT: pextrw $5, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $5, %xmm0, %ecx
	; SSE2-NEXT: je .LBB15_22			; SSE2-NEXT: je .LBB15_22
	; SSE2-NEXT: # %bb.21: # %cond.store19			; SSE2-NEXT: # %bb.21: # %cond.store19
	; SSE2-NEXT: pextrw $5, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 10(%rdi)			; SSE2-NEXT: movb %cl, 10(%rdi)
	; SSE2-NEXT: .LBB15_22: # %else20			; SSE2-NEXT: .LBB15_22: # %else20
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_24			; SSE2-NEXT: je .LBB15_24
	; SSE2-NEXT: # %bb.23: # %cond.store21			; SSE2-NEXT: # %bb.23: # %cond.store21
	; SSE2-NEXT: pextrw $5, %xmm0, %eax			; SSE2-NEXT: movb %ch, 11(%rdi)
	; SSE2-NEXT: movb %ah, 11(%rdi)
	; SSE2-NEXT: .LBB15_24: # %else22			; SSE2-NEXT: .LBB15_24: # %else22
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm4, %xmm1			; SSE2-NEXT: pcmpeqb %xmm4, %xmm1
	; SSE2-NEXT: pextrw $6, %xmm1, %eax			; SSE2-NEXT: pextrw $6, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $6, %xmm0, %ecx
	; SSE2-NEXT: je .LBB15_26			; SSE2-NEXT: je .LBB15_26
	; SSE2-NEXT: # %bb.25: # %cond.store23			; SSE2-NEXT: # %bb.25: # %cond.store23
	; SSE2-NEXT: pextrw $6, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 12(%rdi)			; SSE2-NEXT: movb %cl, 12(%rdi)
	; SSE2-NEXT: .LBB15_26: # %else24			; SSE2-NEXT: .LBB15_26: # %else24
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_28			; SSE2-NEXT: je .LBB15_28
	; SSE2-NEXT: # %bb.27: # %cond.store25			; SSE2-NEXT: # %bb.27: # %cond.store25
	; SSE2-NEXT: pextrw $6, %xmm0, %eax			; SSE2-NEXT: movb %ch, 13(%rdi)
	; SSE2-NEXT: movb %ah, 13(%rdi)
	; SSE2-NEXT: .LBB15_28: # %else26			; SSE2-NEXT: .LBB15_28: # %else26
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm1, %xmm4			; SSE2-NEXT: pcmpeqb %xmm1, %xmm4
	; SSE2-NEXT: pextrw $7, %xmm4, %eax			; SSE2-NEXT: pextrw $7, %xmm4, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $7, %xmm0, %ecx
	; SSE2-NEXT: je .LBB15_30			; SSE2-NEXT: je .LBB15_30
	; SSE2-NEXT: # %bb.29: # %cond.store27			; SSE2-NEXT: # %bb.29: # %cond.store27
	; SSE2-NEXT: pextrw $7, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 14(%rdi)			; SSE2-NEXT: movb %cl, 14(%rdi)
	; SSE2-NEXT: .LBB15_30: # %else28			; SSE2-NEXT: .LBB15_30: # %else28
				; SSE2-NEXT: packsswb %xmm3, %xmm2
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_32			; SSE2-NEXT: je .LBB15_32
	; SSE2-NEXT: # %bb.31: # %cond.store29			; SSE2-NEXT: # %bb.31: # %cond.store29
	; SSE2-NEXT: pextrw $7, %xmm0, %eax			; SSE2-NEXT: movb %ch, 15(%rdi)
	; SSE2-NEXT: movb %ah, 15(%rdi)
	; SSE2-NEXT: .LBB15_32: # %else30			; SSE2-NEXT: .LBB15_32: # %else30
	; SSE2-NEXT: packsswb %xmm3, %xmm2
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm5, %xmm0			; SSE2-NEXT: pcmpeqb %xmm5, %xmm0
	; SSE2-NEXT: movd %xmm0, %eax			; SSE2-NEXT: movd %xmm0, %ecx
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %ecx, %eax
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: movd %xmm2, %eax
	; SSE2-NEXT: je .LBB15_34			; SSE2-NEXT: je .LBB15_34
	; SSE2-NEXT: # %bb.33: # %cond.store31			; SSE2-NEXT: # %bb.33: # %cond.store31
	; SSE2-NEXT: movd %xmm2, %ecx			; SSE2-NEXT: movb %al, 16(%rdi)
	; SSE2-NEXT: movb %cl, 16(%rdi)
	; SSE2-NEXT: .LBB15_34: # %else32			; SSE2-NEXT: .LBB15_34: # %else32
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %ecx
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB15_36			; SSE2-NEXT: je .LBB15_36
	; SSE2-NEXT: # %bb.35: # %cond.store33			; SSE2-NEXT: # %bb.35: # %cond.store33
	; SSE2-NEXT: movd %xmm2, %eax
	; SSE2-NEXT: movb %ah, 17(%rdi)			; SSE2-NEXT: movb %ah, 17(%rdi)
	; SSE2-NEXT: .LBB15_36: # %else34			; SSE2-NEXT: .LBB15_36: # %else34
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm5, %xmm0			; SSE2-NEXT: pcmpeqb %xmm5, %xmm0
	; SSE2-NEXT: movd %xmm0, %eax			; SSE2-NEXT: movd %xmm0, %ecx
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %ecx, %edx
	; SSE2-NEXT: shrl $16, %ecx			; SSE2-NEXT: shrl $16, %edx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %dl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %dl
	; SSE2-NEXT: je .LBB15_38			; SSE2-NEXT: je .LBB15_38
	; SSE2-NEXT: # %bb.37: # %cond.store35			; SSE2-NEXT: # %bb.37: # %cond.store35
	; SSE2-NEXT: movd %xmm2, %ecx			; SSE2-NEXT: movl %eax, %edx
	; SSE2-NEXT: shrl $16, %ecx			; SSE2-NEXT: shrl $16, %edx
	; SSE2-NEXT: movb %cl, 18(%rdi)			; SSE2-NEXT: movb %dl, 18(%rdi)
	; SSE2-NEXT: .LBB15_38: # %else36			; SSE2-NEXT: .LBB15_38: # %else36
	; SSE2-NEXT: shrl $24, %eax			; SSE2-NEXT: shrl $24, %ecx
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB15_40			; SSE2-NEXT: je .LBB15_40
	; SSE2-NEXT: # %bb.39: # %cond.store37			; SSE2-NEXT: # %bb.39: # %cond.store37
	; SSE2-NEXT: movd %xmm2, %eax
	; SSE2-NEXT: shrl $24, %eax			; SSE2-NEXT: shrl $24, %eax
	; SSE2-NEXT: movb %al, 19(%rdi)			; SSE2-NEXT: movb %al, 19(%rdi)
	; SSE2-NEXT: .LBB15_40: # %else38			; SSE2-NEXT: .LBB15_40: # %else38
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm5, %xmm0			; SSE2-NEXT: pcmpeqb %xmm5, %xmm0
	; SSE2-NEXT: pextrw $2, %xmm0, %eax			; SSE2-NEXT: pextrw $2, %xmm0, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $2, %xmm2, %ecx
	; SSE2-NEXT: je .LBB15_42			; SSE2-NEXT: je .LBB15_42
	; SSE2-NEXT: # %bb.41: # %cond.store39			; SSE2-NEXT: # %bb.41: # %cond.store39
	; SSE2-NEXT: pextrw $2, %xmm2, %ecx
	; SSE2-NEXT: movb %cl, 20(%rdi)			; SSE2-NEXT: movb %cl, 20(%rdi)
	; SSE2-NEXT: .LBB15_42: # %else40			; SSE2-NEXT: .LBB15_42: # %else40
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_44			; SSE2-NEXT: je .LBB15_44
	; SSE2-NEXT: # %bb.43: # %cond.store41			; SSE2-NEXT: # %bb.43: # %cond.store41
	; SSE2-NEXT: pextrw $2, %xmm2, %eax			; SSE2-NEXT: movb %ch, 21(%rdi)
	; SSE2-NEXT: movb %ah, 21(%rdi)
	; SSE2-NEXT: .LBB15_44: # %else42			; SSE2-NEXT: .LBB15_44: # %else42
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm5, %xmm0			; SSE2-NEXT: pcmpeqb %xmm5, %xmm0
	; SSE2-NEXT: pextrw $3, %xmm0, %eax			; SSE2-NEXT: pextrw $3, %xmm0, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $3, %xmm2, %ecx
	; SSE2-NEXT: je .LBB15_46			; SSE2-NEXT: je .LBB15_46
	; SSE2-NEXT: # %bb.45: # %cond.store43			; SSE2-NEXT: # %bb.45: # %cond.store43
	; SSE2-NEXT: pextrw $3, %xmm2, %ecx
	; SSE2-NEXT: movb %cl, 22(%rdi)			; SSE2-NEXT: movb %cl, 22(%rdi)
	; SSE2-NEXT: .LBB15_46: # %else44			; SSE2-NEXT: .LBB15_46: # %else44
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_48			; SSE2-NEXT: je .LBB15_48
	; SSE2-NEXT: # %bb.47: # %cond.store45			; SSE2-NEXT: # %bb.47: # %cond.store45
	; SSE2-NEXT: pextrw $3, %xmm2, %eax			; SSE2-NEXT: movb %ch, 23(%rdi)
	; SSE2-NEXT: movb %ah, 23(%rdi)
	; SSE2-NEXT: .LBB15_48: # %else46			; SSE2-NEXT: .LBB15_48: # %else46
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm5, %xmm0			; SSE2-NEXT: pcmpeqb %xmm5, %xmm0
	; SSE2-NEXT: pextrw $4, %xmm0, %eax			; SSE2-NEXT: pextrw $4, %xmm0, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $4, %xmm2, %ecx
	; SSE2-NEXT: je .LBB15_50			; SSE2-NEXT: je .LBB15_50
	; SSE2-NEXT: # %bb.49: # %cond.store47			; SSE2-NEXT: # %bb.49: # %cond.store47
	; SSE2-NEXT: pextrw $4, %xmm2, %ecx
	; SSE2-NEXT: movb %cl, 24(%rdi)			; SSE2-NEXT: movb %cl, 24(%rdi)
	; SSE2-NEXT: .LBB15_50: # %else48			; SSE2-NEXT: .LBB15_50: # %else48
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_52			; SSE2-NEXT: je .LBB15_52
	; SSE2-NEXT: # %bb.51: # %cond.store49			; SSE2-NEXT: # %bb.51: # %cond.store49
	; SSE2-NEXT: pextrw $4, %xmm2, %eax			; SSE2-NEXT: movb %ch, 25(%rdi)
	; SSE2-NEXT: movb %ah, 25(%rdi)
	; SSE2-NEXT: .LBB15_52: # %else50			; SSE2-NEXT: .LBB15_52: # %else50
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm5, %xmm0			; SSE2-NEXT: pcmpeqb %xmm5, %xmm0
	; SSE2-NEXT: pextrw $5, %xmm0, %eax			; SSE2-NEXT: pextrw $5, %xmm0, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $5, %xmm2, %ecx
	; SSE2-NEXT: je .LBB15_54			; SSE2-NEXT: je .LBB15_54
	; SSE2-NEXT: # %bb.53: # %cond.store51			; SSE2-NEXT: # %bb.53: # %cond.store51
	; SSE2-NEXT: pextrw $5, %xmm2, %ecx
	; SSE2-NEXT: movb %cl, 26(%rdi)			; SSE2-NEXT: movb %cl, 26(%rdi)
	; SSE2-NEXT: .LBB15_54: # %else52			; SSE2-NEXT: .LBB15_54: # %else52
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_56			; SSE2-NEXT: je .LBB15_56
	; SSE2-NEXT: # %bb.55: # %cond.store53			; SSE2-NEXT: # %bb.55: # %cond.store53
	; SSE2-NEXT: pextrw $5, %xmm2, %eax			; SSE2-NEXT: movb %ch, 27(%rdi)
	; SSE2-NEXT: movb %ah, 27(%rdi)
	; SSE2-NEXT: .LBB15_56: # %else54			; SSE2-NEXT: .LBB15_56: # %else54
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm5, %xmm0			; SSE2-NEXT: pcmpeqb %xmm5, %xmm0
	; SSE2-NEXT: pextrw $6, %xmm0, %eax			; SSE2-NEXT: pextrw $6, %xmm0, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $6, %xmm2, %ecx
	; SSE2-NEXT: je .LBB15_58			; SSE2-NEXT: je .LBB15_58
	; SSE2-NEXT: # %bb.57: # %cond.store55			; SSE2-NEXT: # %bb.57: # %cond.store55
	; SSE2-NEXT: pextrw $6, %xmm2, %ecx
	; SSE2-NEXT: movb %cl, 28(%rdi)			; SSE2-NEXT: movb %cl, 28(%rdi)
	; SSE2-NEXT: .LBB15_58: # %else56			; SSE2-NEXT: .LBB15_58: # %else56
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_60			; SSE2-NEXT: je .LBB15_60
	; SSE2-NEXT: # %bb.59: # %cond.store57			; SSE2-NEXT: # %bb.59: # %cond.store57
	; SSE2-NEXT: pextrw $6, %xmm2, %eax			; SSE2-NEXT: movb %ch, 29(%rdi)
	; SSE2-NEXT: movb %ah, 29(%rdi)
	; SSE2-NEXT: .LBB15_60: # %else58			; SSE2-NEXT: .LBB15_60: # %else58
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm0, %xmm5			; SSE2-NEXT: pcmpeqb %xmm0, %xmm5
	; SSE2-NEXT: pextrw $7, %xmm5, %eax			; SSE2-NEXT: pextrw $7, %xmm5, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $7, %xmm2, %ecx
	; SSE2-NEXT: je .LBB15_62			; SSE2-NEXT: je .LBB15_62
	; SSE2-NEXT: # %bb.61: # %cond.store59			; SSE2-NEXT: # %bb.61: # %cond.store59
	; SSE2-NEXT: pextrw $7, %xmm2, %ecx
	; SSE2-NEXT: movb %cl, 30(%rdi)			; SSE2-NEXT: movb %cl, 30(%rdi)
	; SSE2-NEXT: .LBB15_62: # %else60			; SSE2-NEXT: .LBB15_62: # %else60
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_64			; SSE2-NEXT: je .LBB15_64
	; SSE2-NEXT: # %bb.63: # %cond.store61			; SSE2-NEXT: # %bb.63: # %cond.store61
	; SSE2-NEXT: pextrw $7, %xmm2, %eax			; SSE2-NEXT: movb %ch, 31(%rdi)
	; SSE2-NEXT: movb %ah, 31(%rdi)
	; SSE2-NEXT: .LBB15_64: # %else62			; SSE2-NEXT: .LBB15_64: # %else62
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE4-LABEL: truncstore_v32i16_v32i8:			; SSE4-LABEL: truncstore_v32i16_v32i8:
	; SSE4: # %bb.0:			; SSE4: # %bb.0:
	; SSE4-NEXT: pxor %xmm6, %xmm6			; SSE4-NEXT: pxor %xmm6, %xmm6
	; SSE4-NEXT: pcmpeqb %xmm4, %xmm6			; SSE4-NEXT: pcmpeqb %xmm4, %xmm6
	; SSE4-NEXT: packsswb %xmm1, %xmm0			; SSE4-NEXT: packsswb %xmm1, %xmm0
	▲ Show 20 Lines • Show All 407 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: .LBB15_32: # %else30			; AVX1-NEXT: .LBB15_32: # %else30
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm1
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpextrb $0, %xmm2, %eax			; AVX1-NEXT: vpextrb $0, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
				; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: je .LBB15_34			; AVX1-NEXT: je .LBB15_34
	; AVX1-NEXT: # %bb.33: # %cond.store31			; AVX1-NEXT: # %bb.33: # %cond.store31
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrb $0, %xmm0, 16(%rdi)
	; AVX1-NEXT: vpextrb $0, %xmm3, 16(%rdi)
	; AVX1-NEXT: .LBB15_34: # %else32			; AVX1-NEXT: .LBB15_34: # %else32
	; AVX1-NEXT: vpextrb $1, %xmm2, %eax			; AVX1-NEXT: vpextrb $1, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_36			; AVX1-NEXT: je .LBB15_36
	; AVX1-NEXT: # %bb.35: # %cond.store33			; AVX1-NEXT: # %bb.35: # %cond.store33
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $1, %xmm0, 17(%rdi)
	; AVX1-NEXT: vpextrb $1, %xmm2, 17(%rdi)
	; AVX1-NEXT: .LBB15_36: # %else34			; AVX1-NEXT: .LBB15_36: # %else34
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpextrb $2, %xmm2, %eax			; AVX1-NEXT: vpextrb $2, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_38			; AVX1-NEXT: je .LBB15_38
	; AVX1-NEXT: # %bb.37: # %cond.store35			; AVX1-NEXT: # %bb.37: # %cond.store35
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrb $2, %xmm0, 18(%rdi)
	; AVX1-NEXT: vpextrb $2, %xmm3, 18(%rdi)
	; AVX1-NEXT: .LBB15_38: # %else36			; AVX1-NEXT: .LBB15_38: # %else36
	; AVX1-NEXT: vpextrb $3, %xmm2, %eax			; AVX1-NEXT: vpextrb $3, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_40			; AVX1-NEXT: je .LBB15_40
	; AVX1-NEXT: # %bb.39: # %cond.store37			; AVX1-NEXT: # %bb.39: # %cond.store37
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $3, %xmm0, 19(%rdi)
	; AVX1-NEXT: vpextrb $3, %xmm2, 19(%rdi)
	; AVX1-NEXT: .LBB15_40: # %else38			; AVX1-NEXT: .LBB15_40: # %else38
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpextrb $4, %xmm2, %eax			; AVX1-NEXT: vpextrb $4, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_42			; AVX1-NEXT: je .LBB15_42
	; AVX1-NEXT: # %bb.41: # %cond.store39			; AVX1-NEXT: # %bb.41: # %cond.store39
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrb $4, %xmm0, 20(%rdi)
	; AVX1-NEXT: vpextrb $4, %xmm3, 20(%rdi)
	; AVX1-NEXT: .LBB15_42: # %else40			; AVX1-NEXT: .LBB15_42: # %else40
	; AVX1-NEXT: vpextrb $5, %xmm2, %eax			; AVX1-NEXT: vpextrb $5, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_44			; AVX1-NEXT: je .LBB15_44
	; AVX1-NEXT: # %bb.43: # %cond.store41			; AVX1-NEXT: # %bb.43: # %cond.store41
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $5, %xmm0, 21(%rdi)
	; AVX1-NEXT: vpextrb $5, %xmm2, 21(%rdi)
	; AVX1-NEXT: .LBB15_44: # %else42			; AVX1-NEXT: .LBB15_44: # %else42
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpextrb $6, %xmm2, %eax			; AVX1-NEXT: vpextrb $6, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_46			; AVX1-NEXT: je .LBB15_46
	; AVX1-NEXT: # %bb.45: # %cond.store43			; AVX1-NEXT: # %bb.45: # %cond.store43
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrb $6, %xmm0, 22(%rdi)
	; AVX1-NEXT: vpextrb $6, %xmm3, 22(%rdi)
	; AVX1-NEXT: .LBB15_46: # %else44			; AVX1-NEXT: .LBB15_46: # %else44
	; AVX1-NEXT: vpextrb $7, %xmm2, %eax			; AVX1-NEXT: vpextrb $7, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_48			; AVX1-NEXT: je .LBB15_48
	; AVX1-NEXT: # %bb.47: # %cond.store45			; AVX1-NEXT: # %bb.47: # %cond.store45
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $7, %xmm0, 23(%rdi)
	; AVX1-NEXT: vpextrb $7, %xmm2, 23(%rdi)
	; AVX1-NEXT: .LBB15_48: # %else46			; AVX1-NEXT: .LBB15_48: # %else46
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpextrb $8, %xmm2, %eax			; AVX1-NEXT: vpextrb $8, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_50			; AVX1-NEXT: je .LBB15_50
	; AVX1-NEXT: # %bb.49: # %cond.store47			; AVX1-NEXT: # %bb.49: # %cond.store47
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrb $8, %xmm0, 24(%rdi)
	; AVX1-NEXT: vpextrb $8, %xmm3, 24(%rdi)
	; AVX1-NEXT: .LBB15_50: # %else48			; AVX1-NEXT: .LBB15_50: # %else48
	; AVX1-NEXT: vpextrb $9, %xmm2, %eax			; AVX1-NEXT: vpextrb $9, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_52			; AVX1-NEXT: je .LBB15_52
	; AVX1-NEXT: # %bb.51: # %cond.store49			; AVX1-NEXT: # %bb.51: # %cond.store49
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $9, %xmm0, 25(%rdi)
	; AVX1-NEXT: vpextrb $9, %xmm2, 25(%rdi)
	; AVX1-NEXT: .LBB15_52: # %else50			; AVX1-NEXT: .LBB15_52: # %else50
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpextrb $10, %xmm2, %eax			; AVX1-NEXT: vpextrb $10, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_54			; AVX1-NEXT: je .LBB15_54
	; AVX1-NEXT: # %bb.53: # %cond.store51			; AVX1-NEXT: # %bb.53: # %cond.store51
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrb $10, %xmm0, 26(%rdi)
	; AVX1-NEXT: vpextrb $10, %xmm3, 26(%rdi)
	; AVX1-NEXT: .LBB15_54: # %else52			; AVX1-NEXT: .LBB15_54: # %else52
	; AVX1-NEXT: vpextrb $11, %xmm2, %eax			; AVX1-NEXT: vpextrb $11, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_56			; AVX1-NEXT: je .LBB15_56
	; AVX1-NEXT: # %bb.55: # %cond.store53			; AVX1-NEXT: # %bb.55: # %cond.store53
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $11, %xmm0, 27(%rdi)
	; AVX1-NEXT: vpextrb $11, %xmm2, 27(%rdi)
	; AVX1-NEXT: .LBB15_56: # %else54			; AVX1-NEXT: .LBB15_56: # %else54
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpextrb $12, %xmm2, %eax			; AVX1-NEXT: vpextrb $12, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_58			; AVX1-NEXT: je .LBB15_58
	; AVX1-NEXT: # %bb.57: # %cond.store55			; AVX1-NEXT: # %bb.57: # %cond.store55
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrb $12, %xmm0, 28(%rdi)
	; AVX1-NEXT: vpextrb $12, %xmm3, 28(%rdi)
	; AVX1-NEXT: .LBB15_58: # %else56			; AVX1-NEXT: .LBB15_58: # %else56
	; AVX1-NEXT: vpextrb $13, %xmm2, %eax			; AVX1-NEXT: vpextrb $13, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_60			; AVX1-NEXT: je .LBB15_60
	; AVX1-NEXT: # %bb.59: # %cond.store57			; AVX1-NEXT: # %bb.59: # %cond.store57
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $13, %xmm0, 29(%rdi)
	; AVX1-NEXT: vpextrb $13, %xmm2, 29(%rdi)
	; AVX1-NEXT: .LBB15_60: # %else58			; AVX1-NEXT: .LBB15_60: # %else58
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpextrb $14, %xmm1, %eax			; AVX1-NEXT: vpextrb $14, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_62			; AVX1-NEXT: je .LBB15_62
	; AVX1-NEXT: # %bb.61: # %cond.store59			; AVX1-NEXT: # %bb.61: # %cond.store59
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $14, %xmm0, 30(%rdi)
	; AVX1-NEXT: vpextrb $14, %xmm2, 30(%rdi)
	; AVX1-NEXT: .LBB15_62: # %else60			; AVX1-NEXT: .LBB15_62: # %else60
	; AVX1-NEXT: vpextrb $15, %xmm1, %eax			; AVX1-NEXT: vpextrb $15, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_64			; AVX1-NEXT: je .LBB15_64
	; AVX1-NEXT: # %bb.63: # %cond.store61			; AVX1-NEXT: # %bb.63: # %cond.store61
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: vpextrb $15, %xmm0, 31(%rdi)			; AVX1-NEXT: vpextrb $15, %xmm0, 31(%rdi)
	; AVX1-NEXT: .LBB15_64: # %else62			; AVX1-NEXT: .LBB15_64: # %else62
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: truncstore_v32i16_v32i8:			; AVX2-LABEL: truncstore_v32i16_v32i8:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3			; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3
	▲ Show 20 Lines • Show All 127 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpextrb $15, %xmm0, 15(%rdi)			; AVX2-NEXT: vpextrb $15, %xmm0, 15(%rdi)
	; AVX2-NEXT: .LBB15_32: # %else30			; AVX2-NEXT: .LBB15_32: # %else30
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $0, %xmm1, %eax			; AVX2-NEXT: vpextrb $0, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: je .LBB15_34			; AVX2-NEXT: je .LBB15_34
	; AVX2-NEXT: # %bb.33: # %cond.store31			; AVX2-NEXT: # %bb.33: # %cond.store31
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vpextrb $0, %xmm0, 16(%rdi)
	; AVX2-NEXT: vpextrb $0, %xmm3, 16(%rdi)
	; AVX2-NEXT: .LBB15_34: # %else32			; AVX2-NEXT: .LBB15_34: # %else32
	; AVX2-NEXT: vpextrb $1, %xmm1, %eax			; AVX2-NEXT: vpextrb $1, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_36			; AVX2-NEXT: je .LBB15_36
	; AVX2-NEXT: # %bb.35: # %cond.store33			; AVX2-NEXT: # %bb.35: # %cond.store33
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrb $1, %xmm0, 17(%rdi)
	; AVX2-NEXT: vpextrb $1, %xmm1, 17(%rdi)
	; AVX2-NEXT: .LBB15_36: # %else34			; AVX2-NEXT: .LBB15_36: # %else34
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $2, %xmm1, %eax			; AVX2-NEXT: vpextrb $2, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_38			; AVX2-NEXT: je .LBB15_38
	; AVX2-NEXT: # %bb.37: # %cond.store35			; AVX2-NEXT: # %bb.37: # %cond.store35
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vpextrb $2, %xmm0, 18(%rdi)
	; AVX2-NEXT: vpextrb $2, %xmm3, 18(%rdi)
	; AVX2-NEXT: .LBB15_38: # %else36			; AVX2-NEXT: .LBB15_38: # %else36
	; AVX2-NEXT: vpextrb $3, %xmm1, %eax			; AVX2-NEXT: vpextrb $3, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_40			; AVX2-NEXT: je .LBB15_40
	; AVX2-NEXT: # %bb.39: # %cond.store37			; AVX2-NEXT: # %bb.39: # %cond.store37
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrb $3, %xmm0, 19(%rdi)
	; AVX2-NEXT: vpextrb $3, %xmm1, 19(%rdi)
	; AVX2-NEXT: .LBB15_40: # %else38			; AVX2-NEXT: .LBB15_40: # %else38
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $4, %xmm1, %eax			; AVX2-NEXT: vpextrb $4, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_42			; AVX2-NEXT: je .LBB15_42
	; AVX2-NEXT: # %bb.41: # %cond.store39			; AVX2-NEXT: # %bb.41: # %cond.store39
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vpextrb $4, %xmm0, 20(%rdi)
	; AVX2-NEXT: vpextrb $4, %xmm3, 20(%rdi)
	; AVX2-NEXT: .LBB15_42: # %else40			; AVX2-NEXT: .LBB15_42: # %else40
	; AVX2-NEXT: vpextrb $5, %xmm1, %eax			; AVX2-NEXT: vpextrb $5, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_44			; AVX2-NEXT: je .LBB15_44
	; AVX2-NEXT: # %bb.43: # %cond.store41			; AVX2-NEXT: # %bb.43: # %cond.store41
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrb $5, %xmm0, 21(%rdi)
	; AVX2-NEXT: vpextrb $5, %xmm1, 21(%rdi)
	; AVX2-NEXT: .LBB15_44: # %else42			; AVX2-NEXT: .LBB15_44: # %else42
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $6, %xmm1, %eax			; AVX2-NEXT: vpextrb $6, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_46			; AVX2-NEXT: je .LBB15_46
	; AVX2-NEXT: # %bb.45: # %cond.store43			; AVX2-NEXT: # %bb.45: # %cond.store43
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vpextrb $6, %xmm0, 22(%rdi)
	; AVX2-NEXT: vpextrb $6, %xmm3, 22(%rdi)
	; AVX2-NEXT: .LBB15_46: # %else44			; AVX2-NEXT: .LBB15_46: # %else44
	; AVX2-NEXT: vpextrb $7, %xmm1, %eax			; AVX2-NEXT: vpextrb $7, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_48			; AVX2-NEXT: je .LBB15_48
	; AVX2-NEXT: # %bb.47: # %cond.store45			; AVX2-NEXT: # %bb.47: # %cond.store45
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrb $7, %xmm0, 23(%rdi)
	; AVX2-NEXT: vpextrb $7, %xmm1, 23(%rdi)
	; AVX2-NEXT: .LBB15_48: # %else46			; AVX2-NEXT: .LBB15_48: # %else46
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $8, %xmm1, %eax			; AVX2-NEXT: vpextrb $8, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_50			; AVX2-NEXT: je .LBB15_50
	; AVX2-NEXT: # %bb.49: # %cond.store47			; AVX2-NEXT: # %bb.49: # %cond.store47
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vpextrb $8, %xmm0, 24(%rdi)
	; AVX2-NEXT: vpextrb $8, %xmm3, 24(%rdi)
	; AVX2-NEXT: .LBB15_50: # %else48			; AVX2-NEXT: .LBB15_50: # %else48
	; AVX2-NEXT: vpextrb $9, %xmm1, %eax			; AVX2-NEXT: vpextrb $9, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_52			; AVX2-NEXT: je .LBB15_52
	; AVX2-NEXT: # %bb.51: # %cond.store49			; AVX2-NEXT: # %bb.51: # %cond.store49
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrb $9, %xmm0, 25(%rdi)
	; AVX2-NEXT: vpextrb $9, %xmm1, 25(%rdi)
	; AVX2-NEXT: .LBB15_52: # %else50			; AVX2-NEXT: .LBB15_52: # %else50
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $10, %xmm1, %eax			; AVX2-NEXT: vpextrb $10, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_54			; AVX2-NEXT: je .LBB15_54
	; AVX2-NEXT: # %bb.53: # %cond.store51			; AVX2-NEXT: # %bb.53: # %cond.store51
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vpextrb $10, %xmm0, 26(%rdi)
	; AVX2-NEXT: vpextrb $10, %xmm3, 26(%rdi)
	; AVX2-NEXT: .LBB15_54: # %else52			; AVX2-NEXT: .LBB15_54: # %else52
	; AVX2-NEXT: vpextrb $11, %xmm1, %eax			; AVX2-NEXT: vpextrb $11, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_56			; AVX2-NEXT: je .LBB15_56
	; AVX2-NEXT: # %bb.55: # %cond.store53			; AVX2-NEXT: # %bb.55: # %cond.store53
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrb $11, %xmm0, 27(%rdi)
	; AVX2-NEXT: vpextrb $11, %xmm1, 27(%rdi)
	; AVX2-NEXT: .LBB15_56: # %else54			; AVX2-NEXT: .LBB15_56: # %else54
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $12, %xmm1, %eax			; AVX2-NEXT: vpextrb $12, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_58			; AVX2-NEXT: je .LBB15_58
	; AVX2-NEXT: # %bb.57: # %cond.store55			; AVX2-NEXT: # %bb.57: # %cond.store55
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vpextrb $12, %xmm0, 28(%rdi)
	; AVX2-NEXT: vpextrb $12, %xmm3, 28(%rdi)
	; AVX2-NEXT: .LBB15_58: # %else56			; AVX2-NEXT: .LBB15_58: # %else56
	; AVX2-NEXT: vpextrb $13, %xmm1, %eax			; AVX2-NEXT: vpextrb $13, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_60			; AVX2-NEXT: je .LBB15_60
	; AVX2-NEXT: # %bb.59: # %cond.store57			; AVX2-NEXT: # %bb.59: # %cond.store57
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrb $13, %xmm0, 29(%rdi)
	; AVX2-NEXT: vpextrb $13, %xmm1, 29(%rdi)
	; AVX2-NEXT: .LBB15_60: # %else58			; AVX2-NEXT: .LBB15_60: # %else58
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $14, %xmm1, %eax			; AVX2-NEXT: vpextrb $14, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_62			; AVX2-NEXT: je .LBB15_62
	; AVX2-NEXT: # %bb.61: # %cond.store59			; AVX2-NEXT: # %bb.61: # %cond.store59
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm2			; AVX2-NEXT: vpextrb $14, %xmm0, 30(%rdi)
	; AVX2-NEXT: vpextrb $14, %xmm2, 30(%rdi)
	; AVX2-NEXT: .LBB15_62: # %else60			; AVX2-NEXT: .LBB15_62: # %else60
	; AVX2-NEXT: vpextrb $15, %xmm1, %eax			; AVX2-NEXT: vpextrb $15, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_64			; AVX2-NEXT: je .LBB15_64
	; AVX2-NEXT: # %bb.63: # %cond.store61			; AVX2-NEXT: # %bb.63: # %cond.store61
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: vpextrb $15, %xmm0, 31(%rdi)			; AVX2-NEXT: vpextrb $15, %xmm0, 31(%rdi)
	; AVX2-NEXT: .LBB15_64: # %else62			; AVX2-NEXT: .LBB15_64: # %else62
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: truncstore_v32i16_v32i8:			; AVX512F-LABEL: truncstore_v32i16_v32i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpxor %xmm3, %xmm3, %xmm3			; AVX512F-NEXT: vpxor %xmm3, %xmm3, %xmm3
	▲ Show 20 Lines • Show All 194 Lines • ▼ Show 20 Lines
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3
	; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3			; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0			; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
				; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX512F-NEXT: je .LBB15_34			; AVX512F-NEXT: je .LBB15_34
	; AVX512F-NEXT: # %bb.33: # %cond.store31			; AVX512F-NEXT: # %bb.33: # %cond.store31
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX512F-NEXT: vpextrb $0, %xmm0, 16(%rdi)
	; AVX512F-NEXT: vpextrb $0, %xmm3, 16(%rdi)
	; AVX512F-NEXT: .LBB15_34: # %else32			; AVX512F-NEXT: .LBB15_34: # %else32
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $1, %k0, %k0			; AVX512F-NEXT: kshiftrw $1, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_36			; AVX512F-NEXT: je .LBB15_36
	; AVX512F-NEXT: # %bb.35: # %cond.store33			; AVX512F-NEXT: # %bb.35: # %cond.store33
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrb $1, %xmm0, 17(%rdi)
	; AVX512F-NEXT: vpextrb $1, %xmm1, 17(%rdi)
	; AVX512F-NEXT: .LBB15_36: # %else34			; AVX512F-NEXT: .LBB15_36: # %else34
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3
	; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3			; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0			; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0
	; AVX512F-NEXT: kshiftrw $2, %k0, %k0			; AVX512F-NEXT: kshiftrw $2, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_38			; AVX512F-NEXT: je .LBB15_38
	; AVX512F-NEXT: # %bb.37: # %cond.store35			; AVX512F-NEXT: # %bb.37: # %cond.store35
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX512F-NEXT: vpextrb $2, %xmm0, 18(%rdi)
	; AVX512F-NEXT: vpextrb $2, %xmm3, 18(%rdi)
	; AVX512F-NEXT: .LBB15_38: # %else36			; AVX512F-NEXT: .LBB15_38: # %else36
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $3, %k0, %k0			; AVX512F-NEXT: kshiftrw $3, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_40			; AVX512F-NEXT: je .LBB15_40
	; AVX512F-NEXT: # %bb.39: # %cond.store37			; AVX512F-NEXT: # %bb.39: # %cond.store37
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrb $3, %xmm0, 19(%rdi)
	; AVX512F-NEXT: vpextrb $3, %xmm1, 19(%rdi)
	; AVX512F-NEXT: .LBB15_40: # %else38			; AVX512F-NEXT: .LBB15_40: # %else38
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3
	; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3			; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0			; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0
	; AVX512F-NEXT: kshiftrw $4, %k0, %k0			; AVX512F-NEXT: kshiftrw $4, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_42			; AVX512F-NEXT: je .LBB15_42
	; AVX512F-NEXT: # %bb.41: # %cond.store39			; AVX512F-NEXT: # %bb.41: # %cond.store39
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX512F-NEXT: vpextrb $4, %xmm0, 20(%rdi)
	; AVX512F-NEXT: vpextrb $4, %xmm3, 20(%rdi)
	; AVX512F-NEXT: .LBB15_42: # %else40			; AVX512F-NEXT: .LBB15_42: # %else40
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $5, %k0, %k0			; AVX512F-NEXT: kshiftrw $5, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_44			; AVX512F-NEXT: je .LBB15_44
	; AVX512F-NEXT: # %bb.43: # %cond.store41			; AVX512F-NEXT: # %bb.43: # %cond.store41
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrb $5, %xmm0, 21(%rdi)
	; AVX512F-NEXT: vpextrb $5, %xmm1, 21(%rdi)
	; AVX512F-NEXT: .LBB15_44: # %else42			; AVX512F-NEXT: .LBB15_44: # %else42
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3
	; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3			; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0			; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0
	; AVX512F-NEXT: kshiftrw $6, %k0, %k0			; AVX512F-NEXT: kshiftrw $6, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_46			; AVX512F-NEXT: je .LBB15_46
	; AVX512F-NEXT: # %bb.45: # %cond.store43			; AVX512F-NEXT: # %bb.45: # %cond.store43
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX512F-NEXT: vpextrb $6, %xmm0, 22(%rdi)
	; AVX512F-NEXT: vpextrb $6, %xmm3, 22(%rdi)
	; AVX512F-NEXT: .LBB15_46: # %else44			; AVX512F-NEXT: .LBB15_46: # %else44
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $7, %k0, %k0			; AVX512F-NEXT: kshiftrw $7, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_48			; AVX512F-NEXT: je .LBB15_48
	; AVX512F-NEXT: # %bb.47: # %cond.store45			; AVX512F-NEXT: # %bb.47: # %cond.store45
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrb $7, %xmm0, 23(%rdi)
	; AVX512F-NEXT: vpextrb $7, %xmm1, 23(%rdi)
	; AVX512F-NEXT: .LBB15_48: # %else46			; AVX512F-NEXT: .LBB15_48: # %else46
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3
	; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3			; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0			; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0
	; AVX512F-NEXT: kshiftrw $8, %k0, %k0			; AVX512F-NEXT: kshiftrw $8, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_50			; AVX512F-NEXT: je .LBB15_50
	; AVX512F-NEXT: # %bb.49: # %cond.store47			; AVX512F-NEXT: # %bb.49: # %cond.store47
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX512F-NEXT: vpextrb $8, %xmm0, 24(%rdi)
	; AVX512F-NEXT: vpextrb $8, %xmm3, 24(%rdi)
	; AVX512F-NEXT: .LBB15_50: # %else48			; AVX512F-NEXT: .LBB15_50: # %else48
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $9, %k0, %k0			; AVX512F-NEXT: kshiftrw $9, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_52			; AVX512F-NEXT: je .LBB15_52
	; AVX512F-NEXT: # %bb.51: # %cond.store49			; AVX512F-NEXT: # %bb.51: # %cond.store49
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrb $9, %xmm0, 25(%rdi)
	; AVX512F-NEXT: vpextrb $9, %xmm1, 25(%rdi)
	; AVX512F-NEXT: .LBB15_52: # %else50			; AVX512F-NEXT: .LBB15_52: # %else50
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3
	; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3			; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0			; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0
	; AVX512F-NEXT: kshiftrw $10, %k0, %k0			; AVX512F-NEXT: kshiftrw $10, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_54			; AVX512F-NEXT: je .LBB15_54
	; AVX512F-NEXT: # %bb.53: # %cond.store51			; AVX512F-NEXT: # %bb.53: # %cond.store51
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX512F-NEXT: vpextrb $10, %xmm0, 26(%rdi)
	; AVX512F-NEXT: vpextrb $10, %xmm3, 26(%rdi)
	; AVX512F-NEXT: .LBB15_54: # %else52			; AVX512F-NEXT: .LBB15_54: # %else52
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $11, %k0, %k0			; AVX512F-NEXT: kshiftrw $11, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_56			; AVX512F-NEXT: je .LBB15_56
	; AVX512F-NEXT: # %bb.55: # %cond.store53			; AVX512F-NEXT: # %bb.55: # %cond.store53
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrb $11, %xmm0, 27(%rdi)
	; AVX512F-NEXT: vpextrb $11, %xmm1, 27(%rdi)
	; AVX512F-NEXT: .LBB15_56: # %else54			; AVX512F-NEXT: .LBB15_56: # %else54
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3
	; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3			; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0			; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0
	; AVX512F-NEXT: kshiftrw $12, %k0, %k0			; AVX512F-NEXT: kshiftrw $12, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_58			; AVX512F-NEXT: je .LBB15_58
	; AVX512F-NEXT: # %bb.57: # %cond.store55			; AVX512F-NEXT: # %bb.57: # %cond.store55
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX512F-NEXT: vpextrb $12, %xmm0, 28(%rdi)
	; AVX512F-NEXT: vpextrb $12, %xmm3, 28(%rdi)
	; AVX512F-NEXT: .LBB15_58: # %else56			; AVX512F-NEXT: .LBB15_58: # %else56
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $13, %k0, %k0			; AVX512F-NEXT: kshiftrw $13, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_60			; AVX512F-NEXT: je .LBB15_60
	; AVX512F-NEXT: # %bb.59: # %cond.store57			; AVX512F-NEXT: # %bb.59: # %cond.store57
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrb $13, %xmm0, 29(%rdi)
	; AVX512F-NEXT: vpextrb $13, %xmm1, 29(%rdi)
	; AVX512F-NEXT: .LBB15_60: # %else58			; AVX512F-NEXT: .LBB15_60: # %else58
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm2			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm2
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm2			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm2
	; AVX512F-NEXT: vpmovsxbd %xmm2, %zmm2			; AVX512F-NEXT: vpmovsxbd %xmm2, %zmm2
	; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0			; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0
	; AVX512F-NEXT: kshiftrw $14, %k0, %k0			; AVX512F-NEXT: kshiftrw $14, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_62			; AVX512F-NEXT: je .LBB15_62
	; AVX512F-NEXT: # %bb.61: # %cond.store59			; AVX512F-NEXT: # %bb.61: # %cond.store59
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm2			; AVX512F-NEXT: vpextrb $14, %xmm0, 30(%rdi)
	; AVX512F-NEXT: vpextrb $14, %xmm2, 30(%rdi)
	; AVX512F-NEXT: .LBB15_62: # %else60			; AVX512F-NEXT: .LBB15_62: # %else60
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $15, %k0, %k0			; AVX512F-NEXT: kshiftrw $15, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_64			; AVX512F-NEXT: je .LBB15_64
	; AVX512F-NEXT: # %bb.63: # %cond.store61			; AVX512F-NEXT: # %bb.63: # %cond.store61
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX512F-NEXT: vpextrb $15, %xmm0, 31(%rdi)			; AVX512F-NEXT: vpextrb $15, %xmm0, 31(%rdi)
	; AVX512F-NEXT: .LBB15_64: # %else62			; AVX512F-NEXT: .LBB15_64: # %else62
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512BW-LABEL: truncstore_v32i16_v32i8:			; AVX512BW-LABEL: truncstore_v32i16_v32i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: # kill: def $ymm1 killed $ymm1 def $zmm1			; AVX512BW-NEXT: # kill: def $ymm1 killed $ymm1 def $zmm1
	Show All 23 Lines
	}			}

	define void @truncstore_v16i16_v16i8(<16 x i16> %x, <16 x i8>* %p, <16 x i8> %mask) {			define void @truncstore_v16i16_v16i8(<16 x i16> %x, <16 x i8>* %p, <16 x i8> %mask) {
	; SSE2-LABEL: truncstore_v16i16_v16i8:			; SSE2-LABEL: truncstore_v16i16_v16i8:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: pxor %xmm3, %xmm3			; SSE2-NEXT: pxor %xmm3, %xmm3
	; SSE2-NEXT: pcmpeqb %xmm2, %xmm3			; SSE2-NEXT: pcmpeqb %xmm2, %xmm3
	; SSE2-NEXT: packsswb %xmm1, %xmm0			; SSE2-NEXT: packsswb %xmm1, %xmm0
	; SSE2-NEXT: movd %xmm3, %eax			; SSE2-NEXT: movd %xmm3, %ecx
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %ecx, %eax
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: je .LBB16_2			; SSE2-NEXT: je .LBB16_2
	; SSE2-NEXT: # %bb.1: # %cond.store			; SSE2-NEXT: # %bb.1: # %cond.store
	; SSE2-NEXT: movd %xmm0, %ecx			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: movb %cl, (%rdi)
	; SSE2-NEXT: .LBB16_2: # %else			; SSE2-NEXT: .LBB16_2: # %else
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %ecx
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB16_4			; SSE2-NEXT: je .LBB16_4
	; SSE2-NEXT: # %bb.3: # %cond.store1			; SSE2-NEXT: # %bb.3: # %cond.store1
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: movb %ah, 1(%rdi)			; SSE2-NEXT: movb %ah, 1(%rdi)
	; SSE2-NEXT: .LBB16_4: # %else2			; SSE2-NEXT: .LBB16_4: # %else2
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm2, %xmm1			; SSE2-NEXT: pcmpeqb %xmm2, %xmm1
	; SSE2-NEXT: movd %xmm1, %eax			; SSE2-NEXT: movd %xmm1, %ecx
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %ecx, %edx
	; SSE2-NEXT: shrl $16, %ecx			; SSE2-NEXT: shrl $16, %edx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %dl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %dl
	; SSE2-NEXT: je .LBB16_6			; SSE2-NEXT: je .LBB16_6
	; SSE2-NEXT: # %bb.5: # %cond.store3			; SSE2-NEXT: # %bb.5: # %cond.store3
	; SSE2-NEXT: movd %xmm0, %ecx			; SSE2-NEXT: movl %eax, %edx
	; SSE2-NEXT: shrl $16, %ecx			; SSE2-NEXT: shrl $16, %edx
	; SSE2-NEXT: movb %cl, 2(%rdi)			; SSE2-NEXT: movb %dl, 2(%rdi)
	; SSE2-NEXT: .LBB16_6: # %else4			; SSE2-NEXT: .LBB16_6: # %else4
	; SSE2-NEXT: shrl $24, %eax			; SSE2-NEXT: shrl $24, %ecx
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB16_8			; SSE2-NEXT: je .LBB16_8
	; SSE2-NEXT: # %bb.7: # %cond.store5			; SSE2-NEXT: # %bb.7: # %cond.store5
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: shrl $24, %eax			; SSE2-NEXT: shrl $24, %eax
	; SSE2-NEXT: movb %al, 3(%rdi)			; SSE2-NEXT: movb %al, 3(%rdi)
	; SSE2-NEXT: .LBB16_8: # %else6			; SSE2-NEXT: .LBB16_8: # %else6
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm2, %xmm1			; SSE2-NEXT: pcmpeqb %xmm2, %xmm1
	; SSE2-NEXT: pextrw $2, %xmm1, %eax			; SSE2-NEXT: pextrw $2, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $2, %xmm0, %ecx
	; SSE2-NEXT: je .LBB16_10			; SSE2-NEXT: je .LBB16_10
	; SSE2-NEXT: # %bb.9: # %cond.store7			; SSE2-NEXT: # %bb.9: # %cond.store7
	; SSE2-NEXT: pextrw $2, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 4(%rdi)			; SSE2-NEXT: movb %cl, 4(%rdi)
	; SSE2-NEXT: .LBB16_10: # %else8			; SSE2-NEXT: .LBB16_10: # %else8
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB16_12			; SSE2-NEXT: je .LBB16_12
	; SSE2-NEXT: # %bb.11: # %cond.store9			; SSE2-NEXT: # %bb.11: # %cond.store9
	; SSE2-NEXT: pextrw $2, %xmm0, %eax			; SSE2-NEXT: movb %ch, 5(%rdi)
	; SSE2-NEXT: movb %ah, 5(%rdi)
	; SSE2-NEXT: .LBB16_12: # %else10			; SSE2-NEXT: .LBB16_12: # %else10
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm2, %xmm1			; SSE2-NEXT: pcmpeqb %xmm2, %xmm1
	; SSE2-NEXT: pextrw $3, %xmm1, %eax			; SSE2-NEXT: pextrw $3, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $3, %xmm0, %ecx
	; SSE2-NEXT: je .LBB16_14			; SSE2-NEXT: je .LBB16_14
	; SSE2-NEXT: # %bb.13: # %cond.store11			; SSE2-NEXT: # %bb.13: # %cond.store11
	; SSE2-NEXT: pextrw $3, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 6(%rdi)			; SSE2-NEXT: movb %cl, 6(%rdi)
	; SSE2-NEXT: .LBB16_14: # %else12			; SSE2-NEXT: .LBB16_14: # %else12
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB16_16			; SSE2-NEXT: je .LBB16_16
	; SSE2-NEXT: # %bb.15: # %cond.store13			; SSE2-NEXT: # %bb.15: # %cond.store13
	; SSE2-NEXT: pextrw $3, %xmm0, %eax			; SSE2-NEXT: movb %ch, 7(%rdi)
	; SSE2-NEXT: movb %ah, 7(%rdi)
	; SSE2-NEXT: .LBB16_16: # %else14			; SSE2-NEXT: .LBB16_16: # %else14
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm2, %xmm1			; SSE2-NEXT: pcmpeqb %xmm2, %xmm1
	; SSE2-NEXT: pextrw $4, %xmm1, %eax			; SSE2-NEXT: pextrw $4, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $4, %xmm0, %ecx
	; SSE2-NEXT: je .LBB16_18			; SSE2-NEXT: je .LBB16_18
	; SSE2-NEXT: # %bb.17: # %cond.store15			; SSE2-NEXT: # %bb.17: # %cond.store15
	; SSE2-NEXT: pextrw $4, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 8(%rdi)			; SSE2-NEXT: movb %cl, 8(%rdi)
	; SSE2-NEXT: .LBB16_18: # %else16			; SSE2-NEXT: .LBB16_18: # %else16
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB16_20			; SSE2-NEXT: je .LBB16_20
	; SSE2-NEXT: # %bb.19: # %cond.store17			; SSE2-NEXT: # %bb.19: # %cond.store17
	; SSE2-NEXT: pextrw $4, %xmm0, %eax			; SSE2-NEXT: movb %ch, 9(%rdi)
	; SSE2-NEXT: movb %ah, 9(%rdi)
	; SSE2-NEXT: .LBB16_20: # %else18			; SSE2-NEXT: .LBB16_20: # %else18
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm2, %xmm1			; SSE2-NEXT: pcmpeqb %xmm2, %xmm1
	; SSE2-NEXT: pextrw $5, %xmm1, %eax			; SSE2-NEXT: pextrw $5, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $5, %xmm0, %ecx
	; SSE2-NEXT: je .LBB16_22			; SSE2-NEXT: je .LBB16_22
	; SSE2-NEXT: # %bb.21: # %cond.store19			; SSE2-NEXT: # %bb.21: # %cond.store19
	; SSE2-NEXT: pextrw $5, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 10(%rdi)			; SSE2-NEXT: movb %cl, 10(%rdi)
	; SSE2-NEXT: .LBB16_22: # %else20			; SSE2-NEXT: .LBB16_22: # %else20
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB16_24			; SSE2-NEXT: je .LBB16_24
	; SSE2-NEXT: # %bb.23: # %cond.store21			; SSE2-NEXT: # %bb.23: # %cond.store21
	; SSE2-NEXT: pextrw $5, %xmm0, %eax			; SSE2-NEXT: movb %ch, 11(%rdi)
	; SSE2-NEXT: movb %ah, 11(%rdi)
	; SSE2-NEXT: .LBB16_24: # %else22			; SSE2-NEXT: .LBB16_24: # %else22
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm2, %xmm1			; SSE2-NEXT: pcmpeqb %xmm2, %xmm1
	; SSE2-NEXT: pextrw $6, %xmm1, %eax			; SSE2-NEXT: pextrw $6, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $6, %xmm0, %ecx
	; SSE2-NEXT: je .LBB16_26			; SSE2-NEXT: je .LBB16_26
	; SSE2-NEXT: # %bb.25: # %cond.store23			; SSE2-NEXT: # %bb.25: # %cond.store23
	; SSE2-NEXT: pextrw $6, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 12(%rdi)			; SSE2-NEXT: movb %cl, 12(%rdi)
	; SSE2-NEXT: .LBB16_26: # %else24			; SSE2-NEXT: .LBB16_26: # %else24
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB16_28			; SSE2-NEXT: je .LBB16_28
	; SSE2-NEXT: # %bb.27: # %cond.store25			; SSE2-NEXT: # %bb.27: # %cond.store25
	; SSE2-NEXT: pextrw $6, %xmm0, %eax			; SSE2-NEXT: movb %ch, 13(%rdi)
	; SSE2-NEXT: movb %ah, 13(%rdi)
	; SSE2-NEXT: .LBB16_28: # %else26			; SSE2-NEXT: .LBB16_28: # %else26
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm1, %xmm2			; SSE2-NEXT: pcmpeqb %xmm1, %xmm2
	; SSE2-NEXT: pextrw $7, %xmm2, %eax			; SSE2-NEXT: pextrw $7, %xmm2, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $7, %xmm0, %ecx
	; SSE2-NEXT: je .LBB16_30			; SSE2-NEXT: je .LBB16_30
	; SSE2-NEXT: # %bb.29: # %cond.store27			; SSE2-NEXT: # %bb.29: # %cond.store27
	; SSE2-NEXT: pextrw $7, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 14(%rdi)			; SSE2-NEXT: movb %cl, 14(%rdi)
	; SSE2-NEXT: .LBB16_30: # %else28			; SSE2-NEXT: .LBB16_30: # %else28
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB16_32			; SSE2-NEXT: je .LBB16_32
	; SSE2-NEXT: # %bb.31: # %cond.store29			; SSE2-NEXT: # %bb.31: # %cond.store29
	; SSE2-NEXT: pextrw $7, %xmm0, %eax			; SSE2-NEXT: movb %ch, 15(%rdi)
	; SSE2-NEXT: movb %ah, 15(%rdi)
	; SSE2-NEXT: .LBB16_32: # %else30			; SSE2-NEXT: .LBB16_32: # %else30
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE4-LABEL: truncstore_v16i16_v16i8:			; SSE4-LABEL: truncstore_v16i16_v16i8:
	; SSE4: # %bb.0:			; SSE4: # %bb.0:
	; SSE4-NEXT: pxor %xmm3, %xmm3			; SSE4-NEXT: pxor %xmm3, %xmm3
	; SSE4-NEXT: pcmpeqb %xmm2, %xmm3			; SSE4-NEXT: pcmpeqb %xmm2, %xmm3
	; SSE4-NEXT: packsswb %xmm1, %xmm0			; SSE4-NEXT: packsswb %xmm1, %xmm0
	▲ Show 20 Lines • Show All 621 Lines • ▼ Show 20 Lines
	; SSE2-LABEL: truncstore_v8i16_v8i8:			; SSE2-LABEL: truncstore_v8i16_v8i8:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: pxor %xmm2, %xmm2			; SSE2-NEXT: pxor %xmm2, %xmm2
	; SSE2-NEXT: pcmpeqw %xmm1, %xmm2			; SSE2-NEXT: pcmpeqw %xmm1, %xmm2
	; SSE2-NEXT: pcmpeqd %xmm3, %xmm3			; SSE2-NEXT: pcmpeqd %xmm3, %xmm3
	; SSE2-NEXT: pxor %xmm2, %xmm3			; SSE2-NEXT: pxor %xmm2, %xmm3
	; SSE2-NEXT: pminsw {{.*}}(%rip), %xmm0			; SSE2-NEXT: pminsw {{.*}}(%rip), %xmm0
	; SSE2-NEXT: pmaxsw {{.*}}(%rip), %xmm0			; SSE2-NEXT: pmaxsw {{.*}}(%rip), %xmm0
	; SSE2-NEXT: movd %xmm3, %eax			; SSE2-NEXT: movd %xmm3, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: je .LBB17_2			; SSE2-NEXT: je .LBB17_2
	; SSE2-NEXT: # %bb.1: # %cond.store			; SSE2-NEXT: # %bb.1: # %cond.store
	; SSE2-NEXT: movd %xmm0, %ecx			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: movb %cl, (%rdi)
	; SSE2-NEXT: .LBB17_2: # %else			; SSE2-NEXT: .LBB17_2: # %else
	; SSE2-NEXT: shrl $16, %eax			; SSE2-NEXT: shrl $16, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB17_4			; SSE2-NEXT: je .LBB17_4
	; SSE2-NEXT: # %bb.3: # %cond.store1			; SSE2-NEXT: # %bb.3: # %cond.store1
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: shrl $16, %eax			; SSE2-NEXT: shrl $16, %eax
	; SSE2-NEXT: movb %al, 1(%rdi)			; SSE2-NEXT: movb %al, 1(%rdi)
	; SSE2-NEXT: .LBB17_4: # %else2			; SSE2-NEXT: .LBB17_4: # %else2
	; SSE2-NEXT: pxor %xmm3, %xmm3			; SSE2-NEXT: pxor %xmm3, %xmm3
	; SSE2-NEXT: pcmpeqw %xmm1, %xmm3			; SSE2-NEXT: pcmpeqw %xmm1, %xmm3
	; SSE2-NEXT: pcmpeqd %xmm2, %xmm2			; SSE2-NEXT: pcmpeqd %xmm2, %xmm2
	; SSE2-NEXT: pxor %xmm3, %xmm2			; SSE2-NEXT: pxor %xmm3, %xmm2
	; SSE2-NEXT: pextrw $2, %xmm2, %eax			; SSE2-NEXT: pextrw $2, %xmm2, %eax
	▲ Show 20 Lines • Show All 331 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/masked_store_trunc_usat.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 913 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: por %xmm7, %xmm0			; SSE2-NEXT: por %xmm7, %xmm0
	; SSE2-NEXT: pand %xmm0, %xmm2			; SSE2-NEXT: pand %xmm0, %xmm2
	; SSE2-NEXT: pandn %xmm8, %xmm0			; SSE2-NEXT: pandn %xmm8, %xmm0
	; SSE2-NEXT: por %xmm2, %xmm0			; SSE2-NEXT: por %xmm2, %xmm0
	; SSE2-NEXT: packuswb %xmm1, %xmm0			; SSE2-NEXT: packuswb %xmm1, %xmm0
	; SSE2-NEXT: packuswb %xmm0, %xmm6			; SSE2-NEXT: packuswb %xmm0, %xmm6
	; SSE2-NEXT: movd %xmm9, %eax			; SSE2-NEXT: movd %xmm9, %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: movd %xmm6, %eax
	; SSE2-NEXT: je .LBB2_2			; SSE2-NEXT: je .LBB2_2
	; SSE2-NEXT: # %bb.1: # %cond.store			; SSE2-NEXT: # %bb.1: # %cond.store
	; SSE2-NEXT: movd %xmm6, %eax
	; SSE2-NEXT: movb %al, (%rdi)			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: .LBB2_2: # %else			; SSE2-NEXT: .LBB2_2: # %else
	; SSE2-NEXT: psrlq $16, %xmm11			; SSE2-NEXT: psrlq $16, %xmm11
	; SSE2-NEXT: movd %xmm11, %eax			; SSE2-NEXT: movd %xmm11, %ecx
	; SSE2-NEXT: shrl $16, %eax			; SSE2-NEXT: shrl $16, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB2_4			; SSE2-NEXT: je .LBB2_4
	; SSE2-NEXT: # %bb.3: # %cond.store1			; SSE2-NEXT: # %bb.3: # %cond.store1
	; SSE2-NEXT: movd %xmm6, %eax
	; SSE2-NEXT: shrl $16, %eax			; SSE2-NEXT: shrl $16, %eax
	; SSE2-NEXT: movb %al, 1(%rdi)			; SSE2-NEXT: movb %al, 1(%rdi)
	; SSE2-NEXT: .LBB2_4: # %else2			; SSE2-NEXT: .LBB2_4: # %else2
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqd %xmm0, %xmm4			; SSE2-NEXT: pcmpeqd %xmm0, %xmm4
	; SSE2-NEXT: pcmpeqd %xmm0, %xmm0			; SSE2-NEXT: pcmpeqd %xmm0, %xmm0
	; SSE2-NEXT: pxor %xmm4, %xmm0			; SSE2-NEXT: pxor %xmm4, %xmm0
	; SSE2-NEXT: pextrw $4, %xmm0, %eax			; SSE2-NEXT: pextrw $4, %xmm0, %eax
	▲ Show 20 Lines • Show All 2,065 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm4			; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm4
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpxor %xmm2, %xmm4, %xmm4			; AVX1-NEXT: vpxor %xmm2, %xmm4, %xmm4
	; AVX1-NEXT: vpackssdw %xmm0, %xmm4, %xmm4			; AVX1-NEXT: vpackssdw %xmm0, %xmm4, %xmm4
	; AVX1-NEXT: vpacksswb %xmm4, %xmm0, %xmm4			; AVX1-NEXT: vpacksswb %xmm4, %xmm0, %xmm4
	; AVX1-NEXT: vpextrb $8, %xmm4, %eax			; AVX1-NEXT: vpextrb $8, %xmm4, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
				; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: je .LBB9_18			; AVX1-NEXT: je .LBB9_18
	; AVX1-NEXT: # %bb.17: # %cond.store15			; AVX1-NEXT: # %bb.17: # %cond.store15
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vpextrw $0, %xmm0, 16(%rdi)
	; AVX1-NEXT: vpextrw $0, %xmm4, 16(%rdi)
	; AVX1-NEXT: .LBB9_18: # %else16			; AVX1-NEXT: .LBB9_18: # %else16
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpackssdw %xmm0, %xmm1, %xmm1			; AVX1-NEXT: vpackssdw %xmm0, %xmm1, %xmm1
	; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpextrb $9, %xmm1, %eax			; AVX1-NEXT: vpextrb $9, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB9_20			; AVX1-NEXT: je .LBB9_20
	; AVX1-NEXT: # %bb.19: # %cond.store17			; AVX1-NEXT: # %bb.19: # %cond.store17
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vpextrw $1, %xmm0, 18(%rdi)
	; AVX1-NEXT: vpextrw $1, %xmm1, 18(%rdi)
	; AVX1-NEXT: .LBB9_20: # %else18			; AVX1-NEXT: .LBB9_20: # %else18
	; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm4			; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm4
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpxor %xmm2, %xmm4, %xmm4			; AVX1-NEXT: vpxor %xmm2, %xmm4, %xmm4
	; AVX1-NEXT: vpackssdw %xmm0, %xmm4, %xmm4			; AVX1-NEXT: vpackssdw %xmm0, %xmm4, %xmm4
	; AVX1-NEXT: vpacksswb %xmm4, %xmm0, %xmm4			; AVX1-NEXT: vpacksswb %xmm4, %xmm0, %xmm4
	; AVX1-NEXT: vpextrb $10, %xmm4, %eax			; AVX1-NEXT: vpextrb $10, %xmm4, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB9_22			; AVX1-NEXT: je .LBB9_22
	; AVX1-NEXT: # %bb.21: # %cond.store19			; AVX1-NEXT: # %bb.21: # %cond.store19
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4			; AVX1-NEXT: vpextrw $2, %xmm0, 20(%rdi)
	; AVX1-NEXT: vpextrw $2, %xmm4, 20(%rdi)
	; AVX1-NEXT: .LBB9_22: # %else20			; AVX1-NEXT: .LBB9_22: # %else20
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm1, %xmm3, %xmm1
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpackssdw %xmm0, %xmm1, %xmm1			; AVX1-NEXT: vpackssdw %xmm0, %xmm1, %xmm1
	; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpextrb $11, %xmm1, %eax			; AVX1-NEXT: vpextrb $11, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB9_24			; AVX1-NEXT: je .LBB9_24
	; AVX1-NEXT: # %bb.23: # %cond.store21			; AVX1-NEXT: # %bb.23: # %cond.store21
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vpextrw $3, %xmm0, 22(%rdi)
	; AVX1-NEXT: vpextrw $3, %xmm1, 22(%rdi)
	; AVX1-NEXT: .LBB9_24: # %else22			; AVX1-NEXT: .LBB9_24: # %else22
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm1
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpackssdw %xmm2, %xmm0, %xmm3			; AVX1-NEXT: vpackssdw %xmm2, %xmm0, %xmm3
	; AVX1-NEXT: vpacksswb %xmm3, %xmm0, %xmm3			; AVX1-NEXT: vpacksswb %xmm3, %xmm0, %xmm3
	; AVX1-NEXT: vpextrb $12, %xmm3, %eax			; AVX1-NEXT: vpextrb $12, %xmm3, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB9_26			; AVX1-NEXT: je .LBB9_26
	; AVX1-NEXT: # %bb.25: # %cond.store23			; AVX1-NEXT: # %bb.25: # %cond.store23
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrw $4, %xmm0, 24(%rdi)
	; AVX1-NEXT: vpextrw $4, %xmm3, 24(%rdi)
	; AVX1-NEXT: .LBB9_26: # %else24			; AVX1-NEXT: .LBB9_26: # %else24
	; AVX1-NEXT: vpackssdw %xmm2, %xmm0, %xmm2			; AVX1-NEXT: vpackssdw %xmm2, %xmm0, %xmm2
	; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm2			; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm2
	; AVX1-NEXT: vpextrb $13, %xmm2, %eax			; AVX1-NEXT: vpextrb $13, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB9_28			; AVX1-NEXT: je .LBB9_28
	; AVX1-NEXT: # %bb.27: # %cond.store25			; AVX1-NEXT: # %bb.27: # %cond.store25
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrw $5, %xmm0, 26(%rdi)
	; AVX1-NEXT: vpextrw $5, %xmm2, 26(%rdi)
	; AVX1-NEXT: .LBB9_28: # %else26			; AVX1-NEXT: .LBB9_28: # %else26
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm2			; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm2
	; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm2			; AVX1-NEXT: vpacksswb %xmm2, %xmm0, %xmm2
	; AVX1-NEXT: vpextrb $14, %xmm2, %eax			; AVX1-NEXT: vpextrb $14, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB9_30			; AVX1-NEXT: je .LBB9_30
	; AVX1-NEXT: # %bb.29: # %cond.store27			; AVX1-NEXT: # %bb.29: # %cond.store27
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrw $6, %xmm0, 28(%rdi)
	; AVX1-NEXT: vpextrw $6, %xmm2, 28(%rdi)
	; AVX1-NEXT: .LBB9_30: # %else28			; AVX1-NEXT: .LBB9_30: # %else28
	; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpackssdw %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX1-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX1-NEXT: vpextrb $15, %xmm1, %eax			; AVX1-NEXT: vpextrb $15, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB9_32			; AVX1-NEXT: je .LBB9_32
	; AVX1-NEXT: # %bb.31: # %cond.store29			; AVX1-NEXT: # %bb.31: # %cond.store29
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: vpextrw $7, %xmm0, 30(%rdi)			; AVX1-NEXT: vpextrw $7, %xmm0, 30(%rdi)
	; AVX1-NEXT: .LBB9_32: # %else30			; AVX1-NEXT: .LBB9_32: # %else30
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: truncstore_v16i32_v16i16:			; AVX2-LABEL: truncstore_v16i32_v16i16:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpxor %xmm4, %xmm4, %xmm4			; AVX2-NEXT: vpxor %xmm4, %xmm4, %xmm4
	▲ Show 20 Lines • Show All 88 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1
	; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm4			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm4
	; AVX2-NEXT: vpackssdw %xmm0, %xmm4, %xmm4			; AVX2-NEXT: vpackssdw %xmm0, %xmm4, %xmm4
	; AVX2-NEXT: vpacksswb %xmm4, %xmm0, %xmm4			; AVX2-NEXT: vpacksswb %xmm4, %xmm0, %xmm4
	; AVX2-NEXT: vpextrb $8, %xmm4, %eax			; AVX2-NEXT: vpextrb $8, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: je .LBB9_18			; AVX2-NEXT: je .LBB9_18
	; AVX2-NEXT: # %bb.17: # %cond.store15			; AVX2-NEXT: # %bb.17: # %cond.store15
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm4			; AVX2-NEXT: vpextrw $0, %xmm0, 16(%rdi)
	; AVX2-NEXT: vpextrw $0, %xmm4, 16(%rdi)
	; AVX2-NEXT: .LBB9_18: # %else16			; AVX2-NEXT: .LBB9_18: # %else16
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpackssdw %xmm0, %xmm1, %xmm1			; AVX2-NEXT: vpackssdw %xmm0, %xmm1, %xmm1
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpextrb $9, %xmm1, %eax			; AVX2-NEXT: vpextrb $9, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB9_20			; AVX2-NEXT: je .LBB9_20
	; AVX2-NEXT: # %bb.19: # %cond.store17			; AVX2-NEXT: # %bb.19: # %cond.store17
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrw $1, %xmm0, 18(%rdi)
	; AVX2-NEXT: vpextrw $1, %xmm1, 18(%rdi)
	; AVX2-NEXT: .LBB9_20: # %else18			; AVX2-NEXT: .LBB9_20: # %else18
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1
	; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm4			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm4
	; AVX2-NEXT: vpackssdw %xmm0, %xmm4, %xmm4			; AVX2-NEXT: vpackssdw %xmm0, %xmm4, %xmm4
	; AVX2-NEXT: vpacksswb %xmm4, %xmm0, %xmm4			; AVX2-NEXT: vpacksswb %xmm4, %xmm0, %xmm4
	; AVX2-NEXT: vpextrb $10, %xmm4, %eax			; AVX2-NEXT: vpextrb $10, %xmm4, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB9_22			; AVX2-NEXT: je .LBB9_22
	; AVX2-NEXT: # %bb.21: # %cond.store19			; AVX2-NEXT: # %bb.21: # %cond.store19
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm4			; AVX2-NEXT: vpextrw $2, %xmm0, 20(%rdi)
	; AVX2-NEXT: vpextrw $2, %xmm4, 20(%rdi)
	; AVX2-NEXT: .LBB9_22: # %else20			; AVX2-NEXT: .LBB9_22: # %else20
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpackssdw %xmm0, %xmm1, %xmm1			; AVX2-NEXT: vpackssdw %xmm0, %xmm1, %xmm1
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpextrb $11, %xmm1, %eax			; AVX2-NEXT: vpextrb $11, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB9_24			; AVX2-NEXT: je .LBB9_24
	; AVX2-NEXT: # %bb.23: # %cond.store21			; AVX2-NEXT: # %bb.23: # %cond.store21
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrw $3, %xmm0, 22(%rdi)
	; AVX2-NEXT: vpextrw $3, %xmm1, 22(%rdi)
	; AVX2-NEXT: .LBB9_24: # %else22			; AVX2-NEXT: .LBB9_24: # %else22
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm2			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm2
	; AVX2-NEXT: vpacksswb %xmm2, %xmm0, %xmm2			; AVX2-NEXT: vpacksswb %xmm2, %xmm0, %xmm2
	; AVX2-NEXT: vpextrb $12, %xmm2, %eax			; AVX2-NEXT: vpextrb $12, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB9_26			; AVX2-NEXT: je .LBB9_26
	; AVX2-NEXT: # %bb.25: # %cond.store23			; AVX2-NEXT: # %bb.25: # %cond.store23
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm2			; AVX2-NEXT: vpextrw $4, %xmm0, 24(%rdi)
	; AVX2-NEXT: vpextrw $4, %xmm2, 24(%rdi)
	; AVX2-NEXT: .LBB9_26: # %else24			; AVX2-NEXT: .LBB9_26: # %else24
	; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpextrb $13, %xmm1, %eax			; AVX2-NEXT: vpextrb $13, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB9_28			; AVX2-NEXT: je .LBB9_28
	; AVX2-NEXT: # %bb.27: # %cond.store25			; AVX2-NEXT: # %bb.27: # %cond.store25
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrw $5, %xmm0, 26(%rdi)
	; AVX2-NEXT: vpextrw $5, %xmm1, 26(%rdi)
	; AVX2-NEXT: .LBB9_28: # %else26			; AVX2-NEXT: .LBB9_28: # %else26
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm3, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX2-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm2			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm2
	; AVX2-NEXT: vpacksswb %xmm2, %xmm0, %xmm2			; AVX2-NEXT: vpacksswb %xmm2, %xmm0, %xmm2
	; AVX2-NEXT: vpextrb $14, %xmm2, %eax			; AVX2-NEXT: vpextrb $14, %xmm2, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB9_30			; AVX2-NEXT: je .LBB9_30
	; AVX2-NEXT: # %bb.29: # %cond.store27			; AVX2-NEXT: # %bb.29: # %cond.store27
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm2			; AVX2-NEXT: vpextrw $6, %xmm0, 28(%rdi)
	; AVX2-NEXT: vpextrw $6, %xmm2, 28(%rdi)
	; AVX2-NEXT: .LBB9_30: # %else28			; AVX2-NEXT: .LBB9_30: # %else28
	; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1			; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm1
	; AVX2-NEXT: vpextrb $15, %xmm1, %eax			; AVX2-NEXT: vpextrb $15, %xmm1, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB9_32			; AVX2-NEXT: je .LBB9_32
	; AVX2-NEXT: # %bb.31: # %cond.store29			; AVX2-NEXT: # %bb.31: # %cond.store29
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: vpextrw $7, %xmm0, 30(%rdi)			; AVX2-NEXT: vpextrw $7, %xmm0, 30(%rdi)
	; AVX2-NEXT: .LBB9_32: # %else30			; AVX2-NEXT: .LBB9_32: # %else30
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: truncstore_v16i32_v16i16:			; AVX512F-LABEL: truncstore_v16i32_v16i16:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	▲ Show 20 Lines • Show All 51 Lines • ▼ Show 20 Lines
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_16			; AVX512F-NEXT: je .LBB9_16
	; AVX512F-NEXT: # %bb.15: # %cond.store13			; AVX512F-NEXT: # %bb.15: # %cond.store13
	; AVX512F-NEXT: vpextrw $7, %xmm0, 14(%rdi)			; AVX512F-NEXT: vpextrw $7, %xmm0, 14(%rdi)
	; AVX512F-NEXT: .LBB9_16: # %else14			; AVX512F-NEXT: .LBB9_16: # %else14
	; AVX512F-NEXT: kshiftrw $8, %k0, %k1			; AVX512F-NEXT: kshiftrw $8, %k0, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
				; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX512F-NEXT: je .LBB9_18			; AVX512F-NEXT: je .LBB9_18
	; AVX512F-NEXT: # %bb.17: # %cond.store15			; AVX512F-NEXT: # %bb.17: # %cond.store15
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrw $0, %xmm0, 16(%rdi)
	; AVX512F-NEXT: vpextrw $0, %xmm1, 16(%rdi)
	; AVX512F-NEXT: .LBB9_18: # %else16			; AVX512F-NEXT: .LBB9_18: # %else16
	; AVX512F-NEXT: kshiftrw $9, %k0, %k1			; AVX512F-NEXT: kshiftrw $9, %k0, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_20			; AVX512F-NEXT: je .LBB9_20
	; AVX512F-NEXT: # %bb.19: # %cond.store17			; AVX512F-NEXT: # %bb.19: # %cond.store17
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrw $1, %xmm0, 18(%rdi)
	; AVX512F-NEXT: vpextrw $1, %xmm1, 18(%rdi)
	; AVX512F-NEXT: .LBB9_20: # %else18			; AVX512F-NEXT: .LBB9_20: # %else18
	; AVX512F-NEXT: kshiftrw $10, %k0, %k1			; AVX512F-NEXT: kshiftrw $10, %k0, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_22			; AVX512F-NEXT: je .LBB9_22
	; AVX512F-NEXT: # %bb.21: # %cond.store19			; AVX512F-NEXT: # %bb.21: # %cond.store19
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrw $2, %xmm0, 20(%rdi)
	; AVX512F-NEXT: vpextrw $2, %xmm1, 20(%rdi)
	; AVX512F-NEXT: .LBB9_22: # %else20			; AVX512F-NEXT: .LBB9_22: # %else20
	; AVX512F-NEXT: kshiftrw $11, %k0, %k1			; AVX512F-NEXT: kshiftrw $11, %k0, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_24			; AVX512F-NEXT: je .LBB9_24
	; AVX512F-NEXT: # %bb.23: # %cond.store21			; AVX512F-NEXT: # %bb.23: # %cond.store21
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrw $3, %xmm0, 22(%rdi)
	; AVX512F-NEXT: vpextrw $3, %xmm1, 22(%rdi)
	; AVX512F-NEXT: .LBB9_24: # %else22			; AVX512F-NEXT: .LBB9_24: # %else22
	; AVX512F-NEXT: kshiftrw $12, %k0, %k1			; AVX512F-NEXT: kshiftrw $12, %k0, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_26			; AVX512F-NEXT: je .LBB9_26
	; AVX512F-NEXT: # %bb.25: # %cond.store23			; AVX512F-NEXT: # %bb.25: # %cond.store23
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrw $4, %xmm0, 24(%rdi)
	; AVX512F-NEXT: vpextrw $4, %xmm1, 24(%rdi)
	; AVX512F-NEXT: .LBB9_26: # %else24			; AVX512F-NEXT: .LBB9_26: # %else24
	; AVX512F-NEXT: kshiftrw $13, %k0, %k1			; AVX512F-NEXT: kshiftrw $13, %k0, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_28			; AVX512F-NEXT: je .LBB9_28
	; AVX512F-NEXT: # %bb.27: # %cond.store25			; AVX512F-NEXT: # %bb.27: # %cond.store25
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrw $5, %xmm0, 26(%rdi)
	; AVX512F-NEXT: vpextrw $5, %xmm1, 26(%rdi)
	; AVX512F-NEXT: .LBB9_28: # %else26			; AVX512F-NEXT: .LBB9_28: # %else26
	; AVX512F-NEXT: kshiftrw $14, %k0, %k1			; AVX512F-NEXT: kshiftrw $14, %k0, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_30			; AVX512F-NEXT: je .LBB9_30
	; AVX512F-NEXT: # %bb.29: # %cond.store27			; AVX512F-NEXT: # %bb.29: # %cond.store27
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrw $6, %xmm0, 28(%rdi)
	; AVX512F-NEXT: vpextrw $6, %xmm1, 28(%rdi)
	; AVX512F-NEXT: .LBB9_30: # %else28			; AVX512F-NEXT: .LBB9_30: # %else28
	; AVX512F-NEXT: kshiftrw $15, %k0, %k0			; AVX512F-NEXT: kshiftrw $15, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB9_32			; AVX512F-NEXT: je .LBB9_32
	; AVX512F-NEXT: # %bb.31: # %cond.store29			; AVX512F-NEXT: # %bb.31: # %cond.store29
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX512F-NEXT: vpextrw $7, %xmm0, 30(%rdi)			; AVX512F-NEXT: vpextrw $7, %xmm0, 30(%rdi)
	; AVX512F-NEXT: .LBB9_32: # %else30			; AVX512F-NEXT: .LBB9_32: # %else30
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512BW-LABEL: truncstore_v16i32_v16i16:			; AVX512BW-LABEL: truncstore_v16i32_v16i16:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vptestmd %zmm1, %zmm1, %k1			; AVX512BW-NEXT: vptestmd %zmm1, %zmm1, %k1
	▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: pand %xmm9, %xmm2			; SSE2-NEXT: pand %xmm9, %xmm2
	; SSE2-NEXT: pandn %xmm10, %xmm9			; SSE2-NEXT: pandn %xmm10, %xmm9
	; SSE2-NEXT: por %xmm2, %xmm9			; SSE2-NEXT: por %xmm2, %xmm9
	; SSE2-NEXT: packuswb %xmm1, %xmm9			; SSE2-NEXT: packuswb %xmm1, %xmm9
	; SSE2-NEXT: packuswb %xmm9, %xmm12			; SSE2-NEXT: packuswb %xmm9, %xmm12
	; SSE2-NEXT: movd %xmm8, %eax			; SSE2-NEXT: movd %xmm8, %eax
	; SSE2-NEXT: notl %eax			; SSE2-NEXT: notl %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: movd %xmm12, %eax
	; SSE2-NEXT: je .LBB10_2			; SSE2-NEXT: je .LBB10_2
	; SSE2-NEXT: # %bb.1: # %cond.store			; SSE2-NEXT: # %bb.1: # %cond.store
	; SSE2-NEXT: movd %xmm12, %eax
	; SSE2-NEXT: movb %al, (%rdi)			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: .LBB10_2: # %else			; SSE2-NEXT: .LBB10_2: # %else
	; SSE2-NEXT: pcmpeqd %xmm0, %xmm0			; SSE2-NEXT: pcmpeqd %xmm0, %xmm0
	; SSE2-NEXT: pxor %xmm0, %xmm8			; SSE2-NEXT: pxor %xmm0, %xmm8
	; SSE2-NEXT: pextrw $2, %xmm8, %eax			; SSE2-NEXT: pextrw $2, %xmm8, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_4			; SSE2-NEXT: je .LBB10_4
	; SSE2-NEXT: # %bb.3: # %cond.store1			; SSE2-NEXT: # %bb.3: # %cond.store1
	; SSE2-NEXT: movd %xmm12, %eax
	; SSE2-NEXT: movb %ah, 1(%rdi)			; SSE2-NEXT: movb %ah, 1(%rdi)
	; SSE2-NEXT: .LBB10_4: # %else2			; SSE2-NEXT: .LBB10_4: # %else2
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqd %xmm1, %xmm4			; SSE2-NEXT: pcmpeqd %xmm1, %xmm4
	; SSE2-NEXT: pxor %xmm4, %xmm0			; SSE2-NEXT: pxor %xmm4, %xmm0
	; SSE2-NEXT: pextrw $4, %xmm0, %eax			; SSE2-NEXT: pextrw $4, %xmm0, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_6			; SSE2-NEXT: je .LBB10_6
	; SSE2-NEXT: # %bb.5: # %cond.store3			; SSE2-NEXT: # %bb.5: # %cond.store3
	; SSE2-NEXT: movd %xmm12, %eax			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: shrl $16, %eax			; SSE2-NEXT: shrl $16, %ecx
	; SSE2-NEXT: movb %al, 2(%rdi)			; SSE2-NEXT: movb %cl, 2(%rdi)
	; SSE2-NEXT: .LBB10_6: # %else4			; SSE2-NEXT: .LBB10_6: # %else4
	; SSE2-NEXT: pcmpeqd %xmm0, %xmm0			; SSE2-NEXT: pcmpeqd %xmm0, %xmm0
	; SSE2-NEXT: pxor %xmm0, %xmm4			; SSE2-NEXT: pxor %xmm0, %xmm4
	; SSE2-NEXT: pextrw $6, %xmm4, %eax			; SSE2-NEXT: pextrw $6, %xmm4, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_8			; SSE2-NEXT: je .LBB10_8
	; SSE2-NEXT: # %bb.7: # %cond.store5			; SSE2-NEXT: # %bb.7: # %cond.store5
	; SSE2-NEXT: movd %xmm12, %eax
	; SSE2-NEXT: shrl $24, %eax			; SSE2-NEXT: shrl $24, %eax
	; SSE2-NEXT: movb %al, 3(%rdi)			; SSE2-NEXT: movb %al, 3(%rdi)
	; SSE2-NEXT: .LBB10_8: # %else6			; SSE2-NEXT: .LBB10_8: # %else6
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqd %xmm5, %xmm0			; SSE2-NEXT: pcmpeqd %xmm5, %xmm0
	; SSE2-NEXT: movd %xmm0, %eax			; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: notl %eax			; SSE2-NEXT: notl %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: pextrw $2, %xmm12, %eax
	; SSE2-NEXT: je .LBB10_10			; SSE2-NEXT: je .LBB10_10
	; SSE2-NEXT: # %bb.9: # %cond.store7			; SSE2-NEXT: # %bb.9: # %cond.store7
	; SSE2-NEXT: pextrw $2, %xmm12, %eax
	; SSE2-NEXT: movb %al, 4(%rdi)			; SSE2-NEXT: movb %al, 4(%rdi)
	; SSE2-NEXT: .LBB10_10: # %else8			; SSE2-NEXT: .LBB10_10: # %else8
	; SSE2-NEXT: pcmpeqd %xmm2, %xmm2			; SSE2-NEXT: pcmpeqd %xmm2, %xmm2
	; SSE2-NEXT: pxor %xmm2, %xmm0			; SSE2-NEXT: pxor %xmm2, %xmm0
	; SSE2-NEXT: pextrw $2, %xmm0, %eax			; SSE2-NEXT: pextrw $2, %xmm0, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_12			; SSE2-NEXT: je .LBB10_12
	; SSE2-NEXT: # %bb.11: # %cond.store9			; SSE2-NEXT: # %bb.11: # %cond.store9
	; SSE2-NEXT: pextrw $2, %xmm12, %eax
	; SSE2-NEXT: movb %ah, 5(%rdi)			; SSE2-NEXT: movb %ah, 5(%rdi)
	; SSE2-NEXT: .LBB10_12: # %else10			; SSE2-NEXT: .LBB10_12: # %else10
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqd %xmm0, %xmm5			; SSE2-NEXT: pcmpeqd %xmm0, %xmm5
	; SSE2-NEXT: pxor %xmm5, %xmm2			; SSE2-NEXT: pxor %xmm5, %xmm2
	; SSE2-NEXT: pextrw $4, %xmm2, %eax			; SSE2-NEXT: pextrw $4, %xmm2, %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: pextrw $3, %xmm12, %eax
	; SSE2-NEXT: je .LBB10_14			; SSE2-NEXT: je .LBB10_14
	; SSE2-NEXT: # %bb.13: # %cond.store11			; SSE2-NEXT: # %bb.13: # %cond.store11
	; SSE2-NEXT: pextrw $3, %xmm12, %eax
	; SSE2-NEXT: movb %al, 6(%rdi)			; SSE2-NEXT: movb %al, 6(%rdi)
	; SSE2-NEXT: .LBB10_14: # %else12			; SSE2-NEXT: .LBB10_14: # %else12
	; SSE2-NEXT: pcmpeqd %xmm0, %xmm0			; SSE2-NEXT: pcmpeqd %xmm0, %xmm0
	; SSE2-NEXT: pxor %xmm0, %xmm5			; SSE2-NEXT: pxor %xmm0, %xmm5
	; SSE2-NEXT: pextrw $6, %xmm5, %eax			; SSE2-NEXT: pextrw $6, %xmm5, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_16			; SSE2-NEXT: je .LBB10_16
	; SSE2-NEXT: # %bb.15: # %cond.store13			; SSE2-NEXT: # %bb.15: # %cond.store13
	; SSE2-NEXT: pextrw $3, %xmm12, %eax
	; SSE2-NEXT: movb %ah, 7(%rdi)			; SSE2-NEXT: movb %ah, 7(%rdi)
	; SSE2-NEXT: .LBB10_16: # %else14			; SSE2-NEXT: .LBB10_16: # %else14
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqd %xmm6, %xmm0			; SSE2-NEXT: pcmpeqd %xmm6, %xmm0
	; SSE2-NEXT: movd %xmm0, %eax			; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: notl %eax			; SSE2-NEXT: notl %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: pextrw $4, %xmm12, %eax
	; SSE2-NEXT: je .LBB10_18			; SSE2-NEXT: je .LBB10_18
	; SSE2-NEXT: # %bb.17: # %cond.store15			; SSE2-NEXT: # %bb.17: # %cond.store15
	; SSE2-NEXT: pextrw $4, %xmm12, %eax
	; SSE2-NEXT: movb %al, 8(%rdi)			; SSE2-NEXT: movb %al, 8(%rdi)
	; SSE2-NEXT: .LBB10_18: # %else16			; SSE2-NEXT: .LBB10_18: # %else16
	; SSE2-NEXT: pcmpeqd %xmm2, %xmm2			; SSE2-NEXT: pcmpeqd %xmm2, %xmm2
	; SSE2-NEXT: pxor %xmm2, %xmm0			; SSE2-NEXT: pxor %xmm2, %xmm0
	; SSE2-NEXT: pextrw $2, %xmm0, %eax			; SSE2-NEXT: pextrw $2, %xmm0, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_20			; SSE2-NEXT: je .LBB10_20
	; SSE2-NEXT: # %bb.19: # %cond.store17			; SSE2-NEXT: # %bb.19: # %cond.store17
	; SSE2-NEXT: pextrw $4, %xmm12, %eax
	; SSE2-NEXT: movb %ah, 9(%rdi)			; SSE2-NEXT: movb %ah, 9(%rdi)
	; SSE2-NEXT: .LBB10_20: # %else18			; SSE2-NEXT: .LBB10_20: # %else18
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqd %xmm0, %xmm6			; SSE2-NEXT: pcmpeqd %xmm0, %xmm6
	; SSE2-NEXT: pxor %xmm6, %xmm2			; SSE2-NEXT: pxor %xmm6, %xmm2
	; SSE2-NEXT: pextrw $4, %xmm2, %eax			; SSE2-NEXT: pextrw $4, %xmm2, %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: pextrw $5, %xmm12, %eax
	; SSE2-NEXT: je .LBB10_22			; SSE2-NEXT: je .LBB10_22
	; SSE2-NEXT: # %bb.21: # %cond.store19			; SSE2-NEXT: # %bb.21: # %cond.store19
	; SSE2-NEXT: pextrw $5, %xmm12, %eax
	; SSE2-NEXT: movb %al, 10(%rdi)			; SSE2-NEXT: movb %al, 10(%rdi)
	; SSE2-NEXT: .LBB10_22: # %else20			; SSE2-NEXT: .LBB10_22: # %else20
	; SSE2-NEXT: pcmpeqd %xmm0, %xmm0			; SSE2-NEXT: pcmpeqd %xmm0, %xmm0
	; SSE2-NEXT: pxor %xmm0, %xmm6			; SSE2-NEXT: pxor %xmm0, %xmm6
	; SSE2-NEXT: pextrw $6, %xmm6, %eax			; SSE2-NEXT: pextrw $6, %xmm6, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_24			; SSE2-NEXT: je .LBB10_24
	; SSE2-NEXT: # %bb.23: # %cond.store21			; SSE2-NEXT: # %bb.23: # %cond.store21
	; SSE2-NEXT: pextrw $5, %xmm12, %eax
	; SSE2-NEXT: movb %ah, 11(%rdi)			; SSE2-NEXT: movb %ah, 11(%rdi)
	; SSE2-NEXT: .LBB10_24: # %else22			; SSE2-NEXT: .LBB10_24: # %else22
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqd %xmm7, %xmm0			; SSE2-NEXT: pcmpeqd %xmm7, %xmm0
	; SSE2-NEXT: movd %xmm0, %eax			; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: notl %eax			; SSE2-NEXT: notl %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: pextrw $6, %xmm12, %eax
	; SSE2-NEXT: je .LBB10_26			; SSE2-NEXT: je .LBB10_26
	; SSE2-NEXT: # %bb.25: # %cond.store23			; SSE2-NEXT: # %bb.25: # %cond.store23
	; SSE2-NEXT: pextrw $6, %xmm12, %eax
	; SSE2-NEXT: movb %al, 12(%rdi)			; SSE2-NEXT: movb %al, 12(%rdi)
	; SSE2-NEXT: .LBB10_26: # %else24			; SSE2-NEXT: .LBB10_26: # %else24
	; SSE2-NEXT: pcmpeqd %xmm2, %xmm2			; SSE2-NEXT: pcmpeqd %xmm2, %xmm2
	; SSE2-NEXT: pxor %xmm2, %xmm0			; SSE2-NEXT: pxor %xmm2, %xmm0
	; SSE2-NEXT: pextrw $2, %xmm0, %eax			; SSE2-NEXT: pextrw $2, %xmm0, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_28			; SSE2-NEXT: je .LBB10_28
	; SSE2-NEXT: # %bb.27: # %cond.store25			; SSE2-NEXT: # %bb.27: # %cond.store25
	; SSE2-NEXT: pextrw $6, %xmm12, %eax
	; SSE2-NEXT: movb %ah, 13(%rdi)			; SSE2-NEXT: movb %ah, 13(%rdi)
	; SSE2-NEXT: .LBB10_28: # %else26			; SSE2-NEXT: .LBB10_28: # %else26
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqd %xmm0, %xmm7			; SSE2-NEXT: pcmpeqd %xmm0, %xmm7
	; SSE2-NEXT: pxor %xmm7, %xmm2			; SSE2-NEXT: pxor %xmm7, %xmm2
	; SSE2-NEXT: pextrw $4, %xmm2, %eax			; SSE2-NEXT: pextrw $4, %xmm2, %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: pextrw $7, %xmm12, %eax
	; SSE2-NEXT: je .LBB10_30			; SSE2-NEXT: je .LBB10_30
	; SSE2-NEXT: # %bb.29: # %cond.store27			; SSE2-NEXT: # %bb.29: # %cond.store27
	; SSE2-NEXT: pextrw $7, %xmm12, %eax
	; SSE2-NEXT: movb %al, 14(%rdi)			; SSE2-NEXT: movb %al, 14(%rdi)
	; SSE2-NEXT: .LBB10_30: # %else28			; SSE2-NEXT: .LBB10_30: # %else28
	; SSE2-NEXT: pcmpeqd %xmm0, %xmm0			; SSE2-NEXT: pcmpeqd %xmm0, %xmm0
	; SSE2-NEXT: pxor %xmm0, %xmm7			; SSE2-NEXT: pxor %xmm0, %xmm7
	; SSE2-NEXT: pextrw $6, %xmm7, %eax			; SSE2-NEXT: pextrw $6, %xmm7, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB10_32			; SSE2-NEXT: je .LBB10_32
	; SSE2-NEXT: # %bb.31: # %cond.store29			; SSE2-NEXT: # %bb.31: # %cond.store29
	; SSE2-NEXT: pextrw $7, %xmm12, %eax
	; SSE2-NEXT: movb %ah, 15(%rdi)			; SSE2-NEXT: movb %ah, 15(%rdi)
	; SSE2-NEXT: .LBB10_32: # %else30			; SSE2-NEXT: .LBB10_32: # %else30
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE4-LABEL: truncstore_v16i32_v16i8:			; SSE4-LABEL: truncstore_v16i32_v16i8:
	; SSE4: # %bb.0:			; SSE4: # %bb.0:
	; SSE4-NEXT: pxor %xmm9, %xmm9			; SSE4-NEXT: pxor %xmm9, %xmm9
	; SSE4-NEXT: pcmpeqd %xmm4, %xmm9			; SSE4-NEXT: pcmpeqd %xmm4, %xmm9
	▲ Show 20 Lines • Show All 1,089 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: pxor %xmm0, %xmm7			; SSE2-NEXT: pxor %xmm0, %xmm7
	; SSE2-NEXT: pcmpgtd %xmm7, %xmm10			; SSE2-NEXT: pcmpgtd %xmm7, %xmm10
	; SSE2-NEXT: pand %xmm10, %xmm0			; SSE2-NEXT: pand %xmm10, %xmm0
	; SSE2-NEXT: pandn %xmm8, %xmm10			; SSE2-NEXT: pandn %xmm8, %xmm10
	; SSE2-NEXT: por %xmm0, %xmm10			; SSE2-NEXT: por %xmm0, %xmm10
	; SSE2-NEXT: packuswb %xmm4, %xmm10			; SSE2-NEXT: packuswb %xmm4, %xmm10
	; SSE2-NEXT: movd %xmm9, %eax			; SSE2-NEXT: movd %xmm9, %eax
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: movd %xmm10, %eax
	; SSE2-NEXT: je .LBB12_2			; SSE2-NEXT: je .LBB12_2
	; SSE2-NEXT: # %bb.1: # %cond.store			; SSE2-NEXT: # %bb.1: # %cond.store
	; SSE2-NEXT: movd %xmm10, %eax
	; SSE2-NEXT: movb %al, (%rdi)			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: .LBB12_2: # %else			; SSE2-NEXT: .LBB12_2: # %else
	; SSE2-NEXT: psrlq $16, %xmm5			; SSE2-NEXT: psrlq $16, %xmm5
	; SSE2-NEXT: movd %xmm5, %eax			; SSE2-NEXT: movd %xmm5, %ecx
	; SSE2-NEXT: shrl $16, %eax			; SSE2-NEXT: shrl $16, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB12_4			; SSE2-NEXT: je .LBB12_4
	; SSE2-NEXT: # %bb.3: # %cond.store1			; SSE2-NEXT: # %bb.3: # %cond.store1
	; SSE2-NEXT: movd %xmm10, %eax
	; SSE2-NEXT: shrl $16, %eax			; SSE2-NEXT: shrl $16, %eax
	; SSE2-NEXT: movb %al, 1(%rdi)			; SSE2-NEXT: movb %al, 1(%rdi)
	; SSE2-NEXT: .LBB12_4: # %else2			; SSE2-NEXT: .LBB12_4: # %else2
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqd %xmm0, %xmm2			; SSE2-NEXT: pcmpeqd %xmm0, %xmm2
	; SSE2-NEXT: pcmpeqd %xmm0, %xmm0			; SSE2-NEXT: pcmpeqd %xmm0, %xmm0
	; SSE2-NEXT: pxor %xmm2, %xmm0			; SSE2-NEXT: pxor %xmm2, %xmm0
	; SSE2-NEXT: pextrw $4, %xmm0, %eax			; SSE2-NEXT: pextrw $4, %xmm0, %eax
	▲ Show 20 Lines • Show All 842 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: pxor %xmm6, %xmm1			; SSE2-NEXT: pxor %xmm6, %xmm1
	; SSE2-NEXT: movdqa {{.*#+}} xmm8 = [33023,33023,33023,33023,33023,33023,33023,33023]			; SSE2-NEXT: movdqa {{.*#+}} xmm8 = [33023,33023,33023,33023,33023,33023,33023,33023]
	; SSE2-NEXT: pminsw %xmm8, %xmm1			; SSE2-NEXT: pminsw %xmm8, %xmm1
	; SSE2-NEXT: pxor %xmm6, %xmm1			; SSE2-NEXT: pxor %xmm6, %xmm1
	; SSE2-NEXT: pxor %xmm6, %xmm0			; SSE2-NEXT: pxor %xmm6, %xmm0
	; SSE2-NEXT: pminsw %xmm8, %xmm0			; SSE2-NEXT: pminsw %xmm8, %xmm0
	; SSE2-NEXT: pxor %xmm6, %xmm0			; SSE2-NEXT: pxor %xmm6, %xmm0
	; SSE2-NEXT: packuswb %xmm1, %xmm0			; SSE2-NEXT: packuswb %xmm1, %xmm0
	; SSE2-NEXT: movd %xmm7, %eax			; SSE2-NEXT: movd %xmm7, %ecx
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %ecx, %eax
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: je .LBB15_2			; SSE2-NEXT: je .LBB15_2
	; SSE2-NEXT: # %bb.1: # %cond.store			; SSE2-NEXT: # %bb.1: # %cond.store
	; SSE2-NEXT: movd %xmm0, %ecx			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: movb %cl, (%rdi)
	; SSE2-NEXT: .LBB15_2: # %else			; SSE2-NEXT: .LBB15_2: # %else
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %ecx
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB15_4			; SSE2-NEXT: je .LBB15_4
	; SSE2-NEXT: # %bb.3: # %cond.store1			; SSE2-NEXT: # %bb.3: # %cond.store1
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: movb %ah, 1(%rdi)			; SSE2-NEXT: movb %ah, 1(%rdi)
	; SSE2-NEXT: .LBB15_4: # %else2			; SSE2-NEXT: .LBB15_4: # %else2
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm4, %xmm1			; SSE2-NEXT: pcmpeqb %xmm4, %xmm1
	; SSE2-NEXT: movd %xmm1, %eax			; SSE2-NEXT: movd %xmm1, %ecx
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %ecx, %edx
	; SSE2-NEXT: shrl $16, %ecx			; SSE2-NEXT: shrl $16, %edx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %dl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %dl
	; SSE2-NEXT: je .LBB15_6			; SSE2-NEXT: je .LBB15_6
	; SSE2-NEXT: # %bb.5: # %cond.store3			; SSE2-NEXT: # %bb.5: # %cond.store3
	; SSE2-NEXT: movd %xmm0, %ecx			; SSE2-NEXT: movl %eax, %edx
	; SSE2-NEXT: shrl $16, %ecx			; SSE2-NEXT: shrl $16, %edx
	; SSE2-NEXT: movb %cl, 2(%rdi)			; SSE2-NEXT: movb %dl, 2(%rdi)
	; SSE2-NEXT: .LBB15_6: # %else4			; SSE2-NEXT: .LBB15_6: # %else4
	; SSE2-NEXT: shrl $24, %eax			; SSE2-NEXT: shrl $24, %ecx
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB15_8			; SSE2-NEXT: je .LBB15_8
	; SSE2-NEXT: # %bb.7: # %cond.store5			; SSE2-NEXT: # %bb.7: # %cond.store5
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: shrl $24, %eax			; SSE2-NEXT: shrl $24, %eax
	; SSE2-NEXT: movb %al, 3(%rdi)			; SSE2-NEXT: movb %al, 3(%rdi)
	; SSE2-NEXT: .LBB15_8: # %else6			; SSE2-NEXT: .LBB15_8: # %else6
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm4, %xmm1			; SSE2-NEXT: pcmpeqb %xmm4, %xmm1
	; SSE2-NEXT: pextrw $2, %xmm1, %eax			; SSE2-NEXT: pextrw $2, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $2, %xmm0, %ecx
	; SSE2-NEXT: je .LBB15_10			; SSE2-NEXT: je .LBB15_10
	; SSE2-NEXT: # %bb.9: # %cond.store7			; SSE2-NEXT: # %bb.9: # %cond.store7
	; SSE2-NEXT: pextrw $2, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 4(%rdi)			; SSE2-NEXT: movb %cl, 4(%rdi)
	; SSE2-NEXT: .LBB15_10: # %else8			; SSE2-NEXT: .LBB15_10: # %else8
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_12			; SSE2-NEXT: je .LBB15_12
	; SSE2-NEXT: # %bb.11: # %cond.store9			; SSE2-NEXT: # %bb.11: # %cond.store9
	; SSE2-NEXT: pextrw $2, %xmm0, %eax			; SSE2-NEXT: movb %ch, 5(%rdi)
	; SSE2-NEXT: movb %ah, 5(%rdi)
	; SSE2-NEXT: .LBB15_12: # %else10			; SSE2-NEXT: .LBB15_12: # %else10
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm4, %xmm1			; SSE2-NEXT: pcmpeqb %xmm4, %xmm1
	; SSE2-NEXT: pextrw $3, %xmm1, %eax			; SSE2-NEXT: pextrw $3, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $3, %xmm0, %ecx
	; SSE2-NEXT: je .LBB15_14			; SSE2-NEXT: je .LBB15_14
	; SSE2-NEXT: # %bb.13: # %cond.store11			; SSE2-NEXT: # %bb.13: # %cond.store11
	; SSE2-NEXT: pextrw $3, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 6(%rdi)			; SSE2-NEXT: movb %cl, 6(%rdi)
	; SSE2-NEXT: .LBB15_14: # %else12			; SSE2-NEXT: .LBB15_14: # %else12
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_16			; SSE2-NEXT: je .LBB15_16
	; SSE2-NEXT: # %bb.15: # %cond.store13			; SSE2-NEXT: # %bb.15: # %cond.store13
	; SSE2-NEXT: pextrw $3, %xmm0, %eax			; SSE2-NEXT: movb %ch, 7(%rdi)
	; SSE2-NEXT: movb %ah, 7(%rdi)
	; SSE2-NEXT: .LBB15_16: # %else14			; SSE2-NEXT: .LBB15_16: # %else14
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm4, %xmm1			; SSE2-NEXT: pcmpeqb %xmm4, %xmm1
	; SSE2-NEXT: pextrw $4, %xmm1, %eax			; SSE2-NEXT: pextrw $4, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $4, %xmm0, %ecx
	; SSE2-NEXT: je .LBB15_18			; SSE2-NEXT: je .LBB15_18
	; SSE2-NEXT: # %bb.17: # %cond.store15			; SSE2-NEXT: # %bb.17: # %cond.store15
	; SSE2-NEXT: pextrw $4, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 8(%rdi)			; SSE2-NEXT: movb %cl, 8(%rdi)
	; SSE2-NEXT: .LBB15_18: # %else16			; SSE2-NEXT: .LBB15_18: # %else16
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_20			; SSE2-NEXT: je .LBB15_20
	; SSE2-NEXT: # %bb.19: # %cond.store17			; SSE2-NEXT: # %bb.19: # %cond.store17
	; SSE2-NEXT: pextrw $4, %xmm0, %eax			; SSE2-NEXT: movb %ch, 9(%rdi)
	; SSE2-NEXT: movb %ah, 9(%rdi)
	; SSE2-NEXT: .LBB15_20: # %else18			; SSE2-NEXT: .LBB15_20: # %else18
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm4, %xmm1			; SSE2-NEXT: pcmpeqb %xmm4, %xmm1
	; SSE2-NEXT: pextrw $5, %xmm1, %eax			; SSE2-NEXT: pextrw $5, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $5, %xmm0, %ecx
	; SSE2-NEXT: je .LBB15_22			; SSE2-NEXT: je .LBB15_22
	; SSE2-NEXT: # %bb.21: # %cond.store19			; SSE2-NEXT: # %bb.21: # %cond.store19
	; SSE2-NEXT: pextrw $5, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 10(%rdi)			; SSE2-NEXT: movb %cl, 10(%rdi)
	; SSE2-NEXT: .LBB15_22: # %else20			; SSE2-NEXT: .LBB15_22: # %else20
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_24			; SSE2-NEXT: je .LBB15_24
	; SSE2-NEXT: # %bb.23: # %cond.store21			; SSE2-NEXT: # %bb.23: # %cond.store21
	; SSE2-NEXT: pextrw $5, %xmm0, %eax			; SSE2-NEXT: movb %ch, 11(%rdi)
	; SSE2-NEXT: movb %ah, 11(%rdi)
	; SSE2-NEXT: .LBB15_24: # %else22			; SSE2-NEXT: .LBB15_24: # %else22
				; SSE2-NEXT: pxor %xmm6, %xmm3
				; SSE2-NEXT: pxor %xmm6, %xmm2
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm4, %xmm1			; SSE2-NEXT: pcmpeqb %xmm4, %xmm1
	; SSE2-NEXT: pextrw $6, %xmm1, %eax			; SSE2-NEXT: pextrw $6, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $6, %xmm0, %ecx
	; SSE2-NEXT: je .LBB15_26			; SSE2-NEXT: je .LBB15_26
	; SSE2-NEXT: # %bb.25: # %cond.store23			; SSE2-NEXT: # %bb.25: # %cond.store23
	; SSE2-NEXT: pextrw $6, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 12(%rdi)			; SSE2-NEXT: movb %cl, 12(%rdi)
	; SSE2-NEXT: .LBB15_26: # %else24			; SSE2-NEXT: .LBB15_26: # %else24
	; SSE2-NEXT: pxor %xmm6, %xmm3			; SSE2-NEXT: pminsw %xmm8, %xmm3
	; SSE2-NEXT: pxor %xmm6, %xmm2			; SSE2-NEXT: pminsw %xmm8, %xmm2
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_28			; SSE2-NEXT: je .LBB15_28
	; SSE2-NEXT: # %bb.27: # %cond.store25			; SSE2-NEXT: # %bb.27: # %cond.store25
	; SSE2-NEXT: pextrw $6, %xmm0, %eax			; SSE2-NEXT: movb %ch, 13(%rdi)
	; SSE2-NEXT: movb %ah, 13(%rdi)
	; SSE2-NEXT: .LBB15_28: # %else26			; SSE2-NEXT: .LBB15_28: # %else26
	; SSE2-NEXT: pminsw %xmm8, %xmm3			; SSE2-NEXT: pxor %xmm6, %xmm3
	; SSE2-NEXT: pminsw %xmm8, %xmm2			; SSE2-NEXT: pxor %xmm6, %xmm2
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm1, %xmm4			; SSE2-NEXT: pcmpeqb %xmm1, %xmm4
	; SSE2-NEXT: pextrw $7, %xmm4, %eax			; SSE2-NEXT: pextrw $7, %xmm4, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $7, %xmm0, %ecx
	; SSE2-NEXT: je .LBB15_30			; SSE2-NEXT: je .LBB15_30
	; SSE2-NEXT: # %bb.29: # %cond.store27			; SSE2-NEXT: # %bb.29: # %cond.store27
	; SSE2-NEXT: pextrw $7, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 14(%rdi)			; SSE2-NEXT: movb %cl, 14(%rdi)
	; SSE2-NEXT: .LBB15_30: # %else28			; SSE2-NEXT: .LBB15_30: # %else28
	; SSE2-NEXT: pxor %xmm6, %xmm3			; SSE2-NEXT: packuswb %xmm3, %xmm2
	; SSE2-NEXT: pxor %xmm6, %xmm2
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_32			; SSE2-NEXT: je .LBB15_32
	; SSE2-NEXT: # %bb.31: # %cond.store29			; SSE2-NEXT: # %bb.31: # %cond.store29
	; SSE2-NEXT: pextrw $7, %xmm0, %eax			; SSE2-NEXT: movb %ch, 15(%rdi)
	; SSE2-NEXT: movb %ah, 15(%rdi)
	; SSE2-NEXT: .LBB15_32: # %else30			; SSE2-NEXT: .LBB15_32: # %else30
	; SSE2-NEXT: packuswb %xmm3, %xmm2
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm5, %xmm0			; SSE2-NEXT: pcmpeqb %xmm5, %xmm0
	; SSE2-NEXT: movd %xmm0, %eax			; SSE2-NEXT: movd %xmm0, %ecx
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %ecx, %eax
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: movd %xmm2, %eax
	; SSE2-NEXT: je .LBB15_34			; SSE2-NEXT: je .LBB15_34
	; SSE2-NEXT: # %bb.33: # %cond.store31			; SSE2-NEXT: # %bb.33: # %cond.store31
	; SSE2-NEXT: movd %xmm2, %ecx			; SSE2-NEXT: movb %al, 16(%rdi)
	; SSE2-NEXT: movb %cl, 16(%rdi)
	; SSE2-NEXT: .LBB15_34: # %else32			; SSE2-NEXT: .LBB15_34: # %else32
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %ecx
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB15_36			; SSE2-NEXT: je .LBB15_36
	; SSE2-NEXT: # %bb.35: # %cond.store33			; SSE2-NEXT: # %bb.35: # %cond.store33
	; SSE2-NEXT: movd %xmm2, %eax
	; SSE2-NEXT: movb %ah, 17(%rdi)			; SSE2-NEXT: movb %ah, 17(%rdi)
	; SSE2-NEXT: .LBB15_36: # %else34			; SSE2-NEXT: .LBB15_36: # %else34
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm5, %xmm0			; SSE2-NEXT: pcmpeqb %xmm5, %xmm0
	; SSE2-NEXT: movd %xmm0, %eax			; SSE2-NEXT: movd %xmm0, %ecx
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %ecx, %edx
	; SSE2-NEXT: shrl $16, %ecx			; SSE2-NEXT: shrl $16, %edx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %dl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %dl
	; SSE2-NEXT: je .LBB15_38			; SSE2-NEXT: je .LBB15_38
	; SSE2-NEXT: # %bb.37: # %cond.store35			; SSE2-NEXT: # %bb.37: # %cond.store35
	; SSE2-NEXT: movd %xmm2, %ecx			; SSE2-NEXT: movl %eax, %edx
	; SSE2-NEXT: shrl $16, %ecx			; SSE2-NEXT: shrl $16, %edx
	; SSE2-NEXT: movb %cl, 18(%rdi)			; SSE2-NEXT: movb %dl, 18(%rdi)
	; SSE2-NEXT: .LBB15_38: # %else36			; SSE2-NEXT: .LBB15_38: # %else36
	; SSE2-NEXT: shrl $24, %eax			; SSE2-NEXT: shrl $24, %ecx
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB15_40			; SSE2-NEXT: je .LBB15_40
	; SSE2-NEXT: # %bb.39: # %cond.store37			; SSE2-NEXT: # %bb.39: # %cond.store37
	; SSE2-NEXT: movd %xmm2, %eax
	; SSE2-NEXT: shrl $24, %eax			; SSE2-NEXT: shrl $24, %eax
	; SSE2-NEXT: movb %al, 19(%rdi)			; SSE2-NEXT: movb %al, 19(%rdi)
	; SSE2-NEXT: .LBB15_40: # %else38			; SSE2-NEXT: .LBB15_40: # %else38
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm5, %xmm0			; SSE2-NEXT: pcmpeqb %xmm5, %xmm0
	; SSE2-NEXT: pextrw $2, %xmm0, %eax			; SSE2-NEXT: pextrw $2, %xmm0, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $2, %xmm2, %ecx
	; SSE2-NEXT: je .LBB15_42			; SSE2-NEXT: je .LBB15_42
	; SSE2-NEXT: # %bb.41: # %cond.store39			; SSE2-NEXT: # %bb.41: # %cond.store39
	; SSE2-NEXT: pextrw $2, %xmm2, %ecx
	; SSE2-NEXT: movb %cl, 20(%rdi)			; SSE2-NEXT: movb %cl, 20(%rdi)
	; SSE2-NEXT: .LBB15_42: # %else40			; SSE2-NEXT: .LBB15_42: # %else40
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_44			; SSE2-NEXT: je .LBB15_44
	; SSE2-NEXT: # %bb.43: # %cond.store41			; SSE2-NEXT: # %bb.43: # %cond.store41
	; SSE2-NEXT: pextrw $2, %xmm2, %eax			; SSE2-NEXT: movb %ch, 21(%rdi)
	; SSE2-NEXT: movb %ah, 21(%rdi)
	; SSE2-NEXT: .LBB15_44: # %else42			; SSE2-NEXT: .LBB15_44: # %else42
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm5, %xmm0			; SSE2-NEXT: pcmpeqb %xmm5, %xmm0
	; SSE2-NEXT: pextrw $3, %xmm0, %eax			; SSE2-NEXT: pextrw $3, %xmm0, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $3, %xmm2, %ecx
	; SSE2-NEXT: je .LBB15_46			; SSE2-NEXT: je .LBB15_46
	; SSE2-NEXT: # %bb.45: # %cond.store43			; SSE2-NEXT: # %bb.45: # %cond.store43
	; SSE2-NEXT: pextrw $3, %xmm2, %ecx
	; SSE2-NEXT: movb %cl, 22(%rdi)			; SSE2-NEXT: movb %cl, 22(%rdi)
	; SSE2-NEXT: .LBB15_46: # %else44			; SSE2-NEXT: .LBB15_46: # %else44
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_48			; SSE2-NEXT: je .LBB15_48
	; SSE2-NEXT: # %bb.47: # %cond.store45			; SSE2-NEXT: # %bb.47: # %cond.store45
	; SSE2-NEXT: pextrw $3, %xmm2, %eax			; SSE2-NEXT: movb %ch, 23(%rdi)
	; SSE2-NEXT: movb %ah, 23(%rdi)
	; SSE2-NEXT: .LBB15_48: # %else46			; SSE2-NEXT: .LBB15_48: # %else46
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm5, %xmm0			; SSE2-NEXT: pcmpeqb %xmm5, %xmm0
	; SSE2-NEXT: pextrw $4, %xmm0, %eax			; SSE2-NEXT: pextrw $4, %xmm0, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $4, %xmm2, %ecx
	; SSE2-NEXT: je .LBB15_50			; SSE2-NEXT: je .LBB15_50
	; SSE2-NEXT: # %bb.49: # %cond.store47			; SSE2-NEXT: # %bb.49: # %cond.store47
	; SSE2-NEXT: pextrw $4, %xmm2, %ecx
	; SSE2-NEXT: movb %cl, 24(%rdi)			; SSE2-NEXT: movb %cl, 24(%rdi)
	; SSE2-NEXT: .LBB15_50: # %else48			; SSE2-NEXT: .LBB15_50: # %else48
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_52			; SSE2-NEXT: je .LBB15_52
	; SSE2-NEXT: # %bb.51: # %cond.store49			; SSE2-NEXT: # %bb.51: # %cond.store49
	; SSE2-NEXT: pextrw $4, %xmm2, %eax			; SSE2-NEXT: movb %ch, 25(%rdi)
	; SSE2-NEXT: movb %ah, 25(%rdi)
	; SSE2-NEXT: .LBB15_52: # %else50			; SSE2-NEXT: .LBB15_52: # %else50
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm5, %xmm0			; SSE2-NEXT: pcmpeqb %xmm5, %xmm0
	; SSE2-NEXT: pextrw $5, %xmm0, %eax			; SSE2-NEXT: pextrw $5, %xmm0, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $5, %xmm2, %ecx
	; SSE2-NEXT: je .LBB15_54			; SSE2-NEXT: je .LBB15_54
	; SSE2-NEXT: # %bb.53: # %cond.store51			; SSE2-NEXT: # %bb.53: # %cond.store51
	; SSE2-NEXT: pextrw $5, %xmm2, %ecx
	; SSE2-NEXT: movb %cl, 26(%rdi)			; SSE2-NEXT: movb %cl, 26(%rdi)
	; SSE2-NEXT: .LBB15_54: # %else52			; SSE2-NEXT: .LBB15_54: # %else52
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_56			; SSE2-NEXT: je .LBB15_56
	; SSE2-NEXT: # %bb.55: # %cond.store53			; SSE2-NEXT: # %bb.55: # %cond.store53
	; SSE2-NEXT: pextrw $5, %xmm2, %eax			; SSE2-NEXT: movb %ch, 27(%rdi)
	; SSE2-NEXT: movb %ah, 27(%rdi)
	; SSE2-NEXT: .LBB15_56: # %else54			; SSE2-NEXT: .LBB15_56: # %else54
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm5, %xmm0			; SSE2-NEXT: pcmpeqb %xmm5, %xmm0
	; SSE2-NEXT: pextrw $6, %xmm0, %eax			; SSE2-NEXT: pextrw $6, %xmm0, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $6, %xmm2, %ecx
	; SSE2-NEXT: je .LBB15_58			; SSE2-NEXT: je .LBB15_58
	; SSE2-NEXT: # %bb.57: # %cond.store55			; SSE2-NEXT: # %bb.57: # %cond.store55
	; SSE2-NEXT: pextrw $6, %xmm2, %ecx
	; SSE2-NEXT: movb %cl, 28(%rdi)			; SSE2-NEXT: movb %cl, 28(%rdi)
	; SSE2-NEXT: .LBB15_58: # %else56			; SSE2-NEXT: .LBB15_58: # %else56
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_60			; SSE2-NEXT: je .LBB15_60
	; SSE2-NEXT: # %bb.59: # %cond.store57			; SSE2-NEXT: # %bb.59: # %cond.store57
	; SSE2-NEXT: pextrw $6, %xmm2, %eax			; SSE2-NEXT: movb %ch, 29(%rdi)
	; SSE2-NEXT: movb %ah, 29(%rdi)
	; SSE2-NEXT: .LBB15_60: # %else58			; SSE2-NEXT: .LBB15_60: # %else58
	; SSE2-NEXT: pxor %xmm0, %xmm0			; SSE2-NEXT: pxor %xmm0, %xmm0
	; SSE2-NEXT: pcmpeqb %xmm0, %xmm5			; SSE2-NEXT: pcmpeqb %xmm0, %xmm5
	; SSE2-NEXT: pextrw $7, %xmm5, %eax			; SSE2-NEXT: pextrw $7, %xmm5, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $7, %xmm2, %ecx
	; SSE2-NEXT: je .LBB15_62			; SSE2-NEXT: je .LBB15_62
	; SSE2-NEXT: # %bb.61: # %cond.store59			; SSE2-NEXT: # %bb.61: # %cond.store59
	; SSE2-NEXT: pextrw $7, %xmm2, %ecx
	; SSE2-NEXT: movb %cl, 30(%rdi)			; SSE2-NEXT: movb %cl, 30(%rdi)
	; SSE2-NEXT: .LBB15_62: # %else60			; SSE2-NEXT: .LBB15_62: # %else60
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB15_64			; SSE2-NEXT: je .LBB15_64
	; SSE2-NEXT: # %bb.63: # %cond.store61			; SSE2-NEXT: # %bb.63: # %cond.store61
	; SSE2-NEXT: pextrw $7, %xmm2, %eax			; SSE2-NEXT: movb %ch, 31(%rdi)
	; SSE2-NEXT: movb %ah, 31(%rdi)
	; SSE2-NEXT: .LBB15_64: # %else62			; SSE2-NEXT: .LBB15_64: # %else62
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE4-LABEL: truncstore_v32i16_v32i8:			; SSE4-LABEL: truncstore_v32i16_v32i8:
	; SSE4: # %bb.0:			; SSE4: # %bb.0:
	; SSE4-NEXT: pxor %xmm7, %xmm7			; SSE4-NEXT: pxor %xmm7, %xmm7
	; SSE4-NEXT: pcmpeqb %xmm4, %xmm7			; SSE4-NEXT: pcmpeqb %xmm4, %xmm7
	; SSE4-NEXT: movdqa {{.*#+}} xmm6 = [255,255,255,255,255,255,255,255]			; SSE4-NEXT: movdqa {{.*#+}} xmm6 = [255,255,255,255,255,255,255,255]
	▲ Show 20 Lines • Show All 417 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: .LBB15_32: # %else30			; AVX1-NEXT: .LBB15_32: # %else30
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm1
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpextrb $0, %xmm2, %eax			; AVX1-NEXT: vpextrb $0, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
				; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: je .LBB15_34			; AVX1-NEXT: je .LBB15_34
	; AVX1-NEXT: # %bb.33: # %cond.store31			; AVX1-NEXT: # %bb.33: # %cond.store31
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrb $0, %xmm0, 16(%rdi)
	; AVX1-NEXT: vpextrb $0, %xmm3, 16(%rdi)
	; AVX1-NEXT: .LBB15_34: # %else32			; AVX1-NEXT: .LBB15_34: # %else32
	; AVX1-NEXT: vpextrb $1, %xmm2, %eax			; AVX1-NEXT: vpextrb $1, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_36			; AVX1-NEXT: je .LBB15_36
	; AVX1-NEXT: # %bb.35: # %cond.store33			; AVX1-NEXT: # %bb.35: # %cond.store33
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $1, %xmm0, 17(%rdi)
	; AVX1-NEXT: vpextrb $1, %xmm2, 17(%rdi)
	; AVX1-NEXT: .LBB15_36: # %else34			; AVX1-NEXT: .LBB15_36: # %else34
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpextrb $2, %xmm2, %eax			; AVX1-NEXT: vpextrb $2, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_38			; AVX1-NEXT: je .LBB15_38
	; AVX1-NEXT: # %bb.37: # %cond.store35			; AVX1-NEXT: # %bb.37: # %cond.store35
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrb $2, %xmm0, 18(%rdi)
	; AVX1-NEXT: vpextrb $2, %xmm3, 18(%rdi)
	; AVX1-NEXT: .LBB15_38: # %else36			; AVX1-NEXT: .LBB15_38: # %else36
	; AVX1-NEXT: vpextrb $3, %xmm2, %eax			; AVX1-NEXT: vpextrb $3, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_40			; AVX1-NEXT: je .LBB15_40
	; AVX1-NEXT: # %bb.39: # %cond.store37			; AVX1-NEXT: # %bb.39: # %cond.store37
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $3, %xmm0, 19(%rdi)
	; AVX1-NEXT: vpextrb $3, %xmm2, 19(%rdi)
	; AVX1-NEXT: .LBB15_40: # %else38			; AVX1-NEXT: .LBB15_40: # %else38
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpextrb $4, %xmm2, %eax			; AVX1-NEXT: vpextrb $4, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_42			; AVX1-NEXT: je .LBB15_42
	; AVX1-NEXT: # %bb.41: # %cond.store39			; AVX1-NEXT: # %bb.41: # %cond.store39
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrb $4, %xmm0, 20(%rdi)
	; AVX1-NEXT: vpextrb $4, %xmm3, 20(%rdi)
	; AVX1-NEXT: .LBB15_42: # %else40			; AVX1-NEXT: .LBB15_42: # %else40
	; AVX1-NEXT: vpextrb $5, %xmm2, %eax			; AVX1-NEXT: vpextrb $5, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_44			; AVX1-NEXT: je .LBB15_44
	; AVX1-NEXT: # %bb.43: # %cond.store41			; AVX1-NEXT: # %bb.43: # %cond.store41
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $5, %xmm0, 21(%rdi)
	; AVX1-NEXT: vpextrb $5, %xmm2, 21(%rdi)
	; AVX1-NEXT: .LBB15_44: # %else42			; AVX1-NEXT: .LBB15_44: # %else42
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpextrb $6, %xmm2, %eax			; AVX1-NEXT: vpextrb $6, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_46			; AVX1-NEXT: je .LBB15_46
	; AVX1-NEXT: # %bb.45: # %cond.store43			; AVX1-NEXT: # %bb.45: # %cond.store43
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrb $6, %xmm0, 22(%rdi)
	; AVX1-NEXT: vpextrb $6, %xmm3, 22(%rdi)
	; AVX1-NEXT: .LBB15_46: # %else44			; AVX1-NEXT: .LBB15_46: # %else44
	; AVX1-NEXT: vpextrb $7, %xmm2, %eax			; AVX1-NEXT: vpextrb $7, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_48			; AVX1-NEXT: je .LBB15_48
	; AVX1-NEXT: # %bb.47: # %cond.store45			; AVX1-NEXT: # %bb.47: # %cond.store45
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $7, %xmm0, 23(%rdi)
	; AVX1-NEXT: vpextrb $7, %xmm2, 23(%rdi)
	; AVX1-NEXT: .LBB15_48: # %else46			; AVX1-NEXT: .LBB15_48: # %else46
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpextrb $8, %xmm2, %eax			; AVX1-NEXT: vpextrb $8, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_50			; AVX1-NEXT: je .LBB15_50
	; AVX1-NEXT: # %bb.49: # %cond.store47			; AVX1-NEXT: # %bb.49: # %cond.store47
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrb $8, %xmm0, 24(%rdi)
	; AVX1-NEXT: vpextrb $8, %xmm3, 24(%rdi)
	; AVX1-NEXT: .LBB15_50: # %else48			; AVX1-NEXT: .LBB15_50: # %else48
	; AVX1-NEXT: vpextrb $9, %xmm2, %eax			; AVX1-NEXT: vpextrb $9, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_52			; AVX1-NEXT: je .LBB15_52
	; AVX1-NEXT: # %bb.51: # %cond.store49			; AVX1-NEXT: # %bb.51: # %cond.store49
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $9, %xmm0, 25(%rdi)
	; AVX1-NEXT: vpextrb $9, %xmm2, 25(%rdi)
	; AVX1-NEXT: .LBB15_52: # %else50			; AVX1-NEXT: .LBB15_52: # %else50
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpextrb $10, %xmm2, %eax			; AVX1-NEXT: vpextrb $10, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_54			; AVX1-NEXT: je .LBB15_54
	; AVX1-NEXT: # %bb.53: # %cond.store51			; AVX1-NEXT: # %bb.53: # %cond.store51
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrb $10, %xmm0, 26(%rdi)
	; AVX1-NEXT: vpextrb $10, %xmm3, 26(%rdi)
	; AVX1-NEXT: .LBB15_54: # %else52			; AVX1-NEXT: .LBB15_54: # %else52
	; AVX1-NEXT: vpextrb $11, %xmm2, %eax			; AVX1-NEXT: vpextrb $11, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_56			; AVX1-NEXT: je .LBB15_56
	; AVX1-NEXT: # %bb.55: # %cond.store53			; AVX1-NEXT: # %bb.55: # %cond.store53
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $11, %xmm0, 27(%rdi)
	; AVX1-NEXT: vpextrb $11, %xmm2, 27(%rdi)
	; AVX1-NEXT: .LBB15_56: # %else54			; AVX1-NEXT: .LBB15_56: # %else54
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm2
	; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
	; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpextrb $12, %xmm2, %eax			; AVX1-NEXT: vpextrb $12, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_58			; AVX1-NEXT: je .LBB15_58
	; AVX1-NEXT: # %bb.57: # %cond.store55			; AVX1-NEXT: # %bb.57: # %cond.store55
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; AVX1-NEXT: vpextrb $12, %xmm0, 28(%rdi)
	; AVX1-NEXT: vpextrb $12, %xmm3, 28(%rdi)
	; AVX1-NEXT: .LBB15_58: # %else56			; AVX1-NEXT: .LBB15_58: # %else56
	; AVX1-NEXT: vpextrb $13, %xmm2, %eax			; AVX1-NEXT: vpextrb $13, %xmm2, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_60			; AVX1-NEXT: je .LBB15_60
	; AVX1-NEXT: # %bb.59: # %cond.store57			; AVX1-NEXT: # %bb.59: # %cond.store57
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $13, %xmm0, 29(%rdi)
	; AVX1-NEXT: vpextrb $13, %xmm2, 29(%rdi)
	; AVX1-NEXT: .LBB15_60: # %else58			; AVX1-NEXT: .LBB15_60: # %else58
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpcmpeqb %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpextrb $14, %xmm1, %eax			; AVX1-NEXT: vpextrb $14, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_62			; AVX1-NEXT: je .LBB15_62
	; AVX1-NEXT: # %bb.61: # %cond.store59			; AVX1-NEXT: # %bb.61: # %cond.store59
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vpextrb $14, %xmm0, 30(%rdi)
	; AVX1-NEXT: vpextrb $14, %xmm2, 30(%rdi)
	; AVX1-NEXT: .LBB15_62: # %else60			; AVX1-NEXT: .LBB15_62: # %else60
	; AVX1-NEXT: vpextrb $15, %xmm1, %eax			; AVX1-NEXT: vpextrb $15, %xmm1, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je .LBB15_64			; AVX1-NEXT: je .LBB15_64
	; AVX1-NEXT: # %bb.63: # %cond.store61			; AVX1-NEXT: # %bb.63: # %cond.store61
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: vpextrb $15, %xmm0, 31(%rdi)			; AVX1-NEXT: vpextrb $15, %xmm0, 31(%rdi)
	; AVX1-NEXT: .LBB15_64: # %else62			; AVX1-NEXT: .LBB15_64: # %else62
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: truncstore_v32i16_v32i8:			; AVX2-LABEL: truncstore_v32i16_v32i8:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3			; AVX2-NEXT: vpxor %xmm3, %xmm3, %xmm3
	▲ Show 20 Lines • Show All 130 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpextrb $15, %xmm0, 15(%rdi)			; AVX2-NEXT: vpextrb $15, %xmm0, 15(%rdi)
	; AVX2-NEXT: .LBB15_32: # %else30			; AVX2-NEXT: .LBB15_32: # %else30
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $0, %xmm1, %eax			; AVX2-NEXT: vpextrb $0, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
				; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: je .LBB15_34			; AVX2-NEXT: je .LBB15_34
	; AVX2-NEXT: # %bb.33: # %cond.store31			; AVX2-NEXT: # %bb.33: # %cond.store31
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vpextrb $0, %xmm0, 16(%rdi)
	; AVX2-NEXT: vpextrb $0, %xmm3, 16(%rdi)
	; AVX2-NEXT: .LBB15_34: # %else32			; AVX2-NEXT: .LBB15_34: # %else32
	; AVX2-NEXT: vpextrb $1, %xmm1, %eax			; AVX2-NEXT: vpextrb $1, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_36			; AVX2-NEXT: je .LBB15_36
	; AVX2-NEXT: # %bb.35: # %cond.store33			; AVX2-NEXT: # %bb.35: # %cond.store33
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrb $1, %xmm0, 17(%rdi)
	; AVX2-NEXT: vpextrb $1, %xmm1, 17(%rdi)
	; AVX2-NEXT: .LBB15_36: # %else34			; AVX2-NEXT: .LBB15_36: # %else34
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $2, %xmm1, %eax			; AVX2-NEXT: vpextrb $2, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_38			; AVX2-NEXT: je .LBB15_38
	; AVX2-NEXT: # %bb.37: # %cond.store35			; AVX2-NEXT: # %bb.37: # %cond.store35
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vpextrb $2, %xmm0, 18(%rdi)
	; AVX2-NEXT: vpextrb $2, %xmm3, 18(%rdi)
	; AVX2-NEXT: .LBB15_38: # %else36			; AVX2-NEXT: .LBB15_38: # %else36
	; AVX2-NEXT: vpextrb $3, %xmm1, %eax			; AVX2-NEXT: vpextrb $3, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_40			; AVX2-NEXT: je .LBB15_40
	; AVX2-NEXT: # %bb.39: # %cond.store37			; AVX2-NEXT: # %bb.39: # %cond.store37
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrb $3, %xmm0, 19(%rdi)
	; AVX2-NEXT: vpextrb $3, %xmm1, 19(%rdi)
	; AVX2-NEXT: .LBB15_40: # %else38			; AVX2-NEXT: .LBB15_40: # %else38
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $4, %xmm1, %eax			; AVX2-NEXT: vpextrb $4, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_42			; AVX2-NEXT: je .LBB15_42
	; AVX2-NEXT: # %bb.41: # %cond.store39			; AVX2-NEXT: # %bb.41: # %cond.store39
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vpextrb $4, %xmm0, 20(%rdi)
	; AVX2-NEXT: vpextrb $4, %xmm3, 20(%rdi)
	; AVX2-NEXT: .LBB15_42: # %else40			; AVX2-NEXT: .LBB15_42: # %else40
	; AVX2-NEXT: vpextrb $5, %xmm1, %eax			; AVX2-NEXT: vpextrb $5, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_44			; AVX2-NEXT: je .LBB15_44
	; AVX2-NEXT: # %bb.43: # %cond.store41			; AVX2-NEXT: # %bb.43: # %cond.store41
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrb $5, %xmm0, 21(%rdi)
	; AVX2-NEXT: vpextrb $5, %xmm1, 21(%rdi)
	; AVX2-NEXT: .LBB15_44: # %else42			; AVX2-NEXT: .LBB15_44: # %else42
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $6, %xmm1, %eax			; AVX2-NEXT: vpextrb $6, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_46			; AVX2-NEXT: je .LBB15_46
	; AVX2-NEXT: # %bb.45: # %cond.store43			; AVX2-NEXT: # %bb.45: # %cond.store43
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vpextrb $6, %xmm0, 22(%rdi)
	; AVX2-NEXT: vpextrb $6, %xmm3, 22(%rdi)
	; AVX2-NEXT: .LBB15_46: # %else44			; AVX2-NEXT: .LBB15_46: # %else44
	; AVX2-NEXT: vpextrb $7, %xmm1, %eax			; AVX2-NEXT: vpextrb $7, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_48			; AVX2-NEXT: je .LBB15_48
	; AVX2-NEXT: # %bb.47: # %cond.store45			; AVX2-NEXT: # %bb.47: # %cond.store45
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrb $7, %xmm0, 23(%rdi)
	; AVX2-NEXT: vpextrb $7, %xmm1, 23(%rdi)
	; AVX2-NEXT: .LBB15_48: # %else46			; AVX2-NEXT: .LBB15_48: # %else46
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $8, %xmm1, %eax			; AVX2-NEXT: vpextrb $8, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_50			; AVX2-NEXT: je .LBB15_50
	; AVX2-NEXT: # %bb.49: # %cond.store47			; AVX2-NEXT: # %bb.49: # %cond.store47
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vpextrb $8, %xmm0, 24(%rdi)
	; AVX2-NEXT: vpextrb $8, %xmm3, 24(%rdi)
	; AVX2-NEXT: .LBB15_50: # %else48			; AVX2-NEXT: .LBB15_50: # %else48
	; AVX2-NEXT: vpextrb $9, %xmm1, %eax			; AVX2-NEXT: vpextrb $9, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_52			; AVX2-NEXT: je .LBB15_52
	; AVX2-NEXT: # %bb.51: # %cond.store49			; AVX2-NEXT: # %bb.51: # %cond.store49
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrb $9, %xmm0, 25(%rdi)
	; AVX2-NEXT: vpextrb $9, %xmm1, 25(%rdi)
	; AVX2-NEXT: .LBB15_52: # %else50			; AVX2-NEXT: .LBB15_52: # %else50
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $10, %xmm1, %eax			; AVX2-NEXT: vpextrb $10, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_54			; AVX2-NEXT: je .LBB15_54
	; AVX2-NEXT: # %bb.53: # %cond.store51			; AVX2-NEXT: # %bb.53: # %cond.store51
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vpextrb $10, %xmm0, 26(%rdi)
	; AVX2-NEXT: vpextrb $10, %xmm3, 26(%rdi)
	; AVX2-NEXT: .LBB15_54: # %else52			; AVX2-NEXT: .LBB15_54: # %else52
	; AVX2-NEXT: vpextrb $11, %xmm1, %eax			; AVX2-NEXT: vpextrb $11, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_56			; AVX2-NEXT: je .LBB15_56
	; AVX2-NEXT: # %bb.55: # %cond.store53			; AVX2-NEXT: # %bb.55: # %cond.store53
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrb $11, %xmm0, 27(%rdi)
	; AVX2-NEXT: vpextrb $11, %xmm1, 27(%rdi)
	; AVX2-NEXT: .LBB15_56: # %else54			; AVX2-NEXT: .LBB15_56: # %else54
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $12, %xmm1, %eax			; AVX2-NEXT: vpextrb $12, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_58			; AVX2-NEXT: je .LBB15_58
	; AVX2-NEXT: # %bb.57: # %cond.store55			; AVX2-NEXT: # %bb.57: # %cond.store55
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX2-NEXT: vpextrb $12, %xmm0, 28(%rdi)
	; AVX2-NEXT: vpextrb $12, %xmm3, 28(%rdi)
	; AVX2-NEXT: .LBB15_58: # %else56			; AVX2-NEXT: .LBB15_58: # %else56
	; AVX2-NEXT: vpextrb $13, %xmm1, %eax			; AVX2-NEXT: vpextrb $13, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_60			; AVX2-NEXT: je .LBB15_60
	; AVX2-NEXT: # %bb.59: # %cond.store57			; AVX2-NEXT: # %bb.59: # %cond.store57
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vpextrb $13, %xmm0, 29(%rdi)
	; AVX2-NEXT: vpextrb $13, %xmm1, 29(%rdi)
	; AVX2-NEXT: .LBB15_60: # %else58			; AVX2-NEXT: .LBB15_60: # %else58
	; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX2-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrb $14, %xmm1, %eax			; AVX2-NEXT: vpextrb $14, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_62			; AVX2-NEXT: je .LBB15_62
	; AVX2-NEXT: # %bb.61: # %cond.store59			; AVX2-NEXT: # %bb.61: # %cond.store59
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm2			; AVX2-NEXT: vpextrb $14, %xmm0, 30(%rdi)
	; AVX2-NEXT: vpextrb $14, %xmm2, 30(%rdi)
	; AVX2-NEXT: .LBB15_62: # %else60			; AVX2-NEXT: .LBB15_62: # %else60
	; AVX2-NEXT: vpextrb $15, %xmm1, %eax			; AVX2-NEXT: vpextrb $15, %xmm1, %eax
	; AVX2-NEXT: notb %al			; AVX2-NEXT: notb %al
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je .LBB15_64			; AVX2-NEXT: je .LBB15_64
	; AVX2-NEXT: # %bb.63: # %cond.store61			; AVX2-NEXT: # %bb.63: # %cond.store61
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: vpextrb $15, %xmm0, 31(%rdi)			; AVX2-NEXT: vpextrb $15, %xmm0, 31(%rdi)
	; AVX2-NEXT: .LBB15_64: # %else62			; AVX2-NEXT: .LBB15_64: # %else62
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: truncstore_v32i16_v32i8:			; AVX512F-LABEL: truncstore_v32i16_v32i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpxor %xmm3, %xmm3, %xmm3			; AVX512F-NEXT: vpxor %xmm3, %xmm3, %xmm3
	▲ Show 20 Lines • Show All 191 Lines • ▼ Show 20 Lines
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3
	; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3			; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0			; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
				; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX512F-NEXT: je .LBB15_34			; AVX512F-NEXT: je .LBB15_34
	; AVX512F-NEXT: # %bb.33: # %cond.store31			; AVX512F-NEXT: # %bb.33: # %cond.store31
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX512F-NEXT: vpextrb $0, %xmm0, 16(%rdi)
	; AVX512F-NEXT: vpextrb $0, %xmm3, 16(%rdi)
	; AVX512F-NEXT: .LBB15_34: # %else32			; AVX512F-NEXT: .LBB15_34: # %else32
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $1, %k0, %k0			; AVX512F-NEXT: kshiftrw $1, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_36			; AVX512F-NEXT: je .LBB15_36
	; AVX512F-NEXT: # %bb.35: # %cond.store33			; AVX512F-NEXT: # %bb.35: # %cond.store33
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrb $1, %xmm0, 17(%rdi)
	; AVX512F-NEXT: vpextrb $1, %xmm1, 17(%rdi)
	; AVX512F-NEXT: .LBB15_36: # %else34			; AVX512F-NEXT: .LBB15_36: # %else34
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3
	; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3			; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0			; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0
	; AVX512F-NEXT: kshiftrw $2, %k0, %k0			; AVX512F-NEXT: kshiftrw $2, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_38			; AVX512F-NEXT: je .LBB15_38
	; AVX512F-NEXT: # %bb.37: # %cond.store35			; AVX512F-NEXT: # %bb.37: # %cond.store35
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX512F-NEXT: vpextrb $2, %xmm0, 18(%rdi)
	; AVX512F-NEXT: vpextrb $2, %xmm3, 18(%rdi)
	; AVX512F-NEXT: .LBB15_38: # %else36			; AVX512F-NEXT: .LBB15_38: # %else36
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $3, %k0, %k0			; AVX512F-NEXT: kshiftrw $3, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_40			; AVX512F-NEXT: je .LBB15_40
	; AVX512F-NEXT: # %bb.39: # %cond.store37			; AVX512F-NEXT: # %bb.39: # %cond.store37
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrb $3, %xmm0, 19(%rdi)
	; AVX512F-NEXT: vpextrb $3, %xmm1, 19(%rdi)
	; AVX512F-NEXT: .LBB15_40: # %else38			; AVX512F-NEXT: .LBB15_40: # %else38
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3
	; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3			; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0			; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0
	; AVX512F-NEXT: kshiftrw $4, %k0, %k0			; AVX512F-NEXT: kshiftrw $4, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_42			; AVX512F-NEXT: je .LBB15_42
	; AVX512F-NEXT: # %bb.41: # %cond.store39			; AVX512F-NEXT: # %bb.41: # %cond.store39
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX512F-NEXT: vpextrb $4, %xmm0, 20(%rdi)
	; AVX512F-NEXT: vpextrb $4, %xmm3, 20(%rdi)
	; AVX512F-NEXT: .LBB15_42: # %else40			; AVX512F-NEXT: .LBB15_42: # %else40
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $5, %k0, %k0			; AVX512F-NEXT: kshiftrw $5, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_44			; AVX512F-NEXT: je .LBB15_44
	; AVX512F-NEXT: # %bb.43: # %cond.store41			; AVX512F-NEXT: # %bb.43: # %cond.store41
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrb $5, %xmm0, 21(%rdi)
	; AVX512F-NEXT: vpextrb $5, %xmm1, 21(%rdi)
	; AVX512F-NEXT: .LBB15_44: # %else42			; AVX512F-NEXT: .LBB15_44: # %else42
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3
	; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3			; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0			; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0
	; AVX512F-NEXT: kshiftrw $6, %k0, %k0			; AVX512F-NEXT: kshiftrw $6, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_46			; AVX512F-NEXT: je .LBB15_46
	; AVX512F-NEXT: # %bb.45: # %cond.store43			; AVX512F-NEXT: # %bb.45: # %cond.store43
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX512F-NEXT: vpextrb $6, %xmm0, 22(%rdi)
	; AVX512F-NEXT: vpextrb $6, %xmm3, 22(%rdi)
	; AVX512F-NEXT: .LBB15_46: # %else44			; AVX512F-NEXT: .LBB15_46: # %else44
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $7, %k0, %k0			; AVX512F-NEXT: kshiftrw $7, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_48			; AVX512F-NEXT: je .LBB15_48
	; AVX512F-NEXT: # %bb.47: # %cond.store45			; AVX512F-NEXT: # %bb.47: # %cond.store45
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrb $7, %xmm0, 23(%rdi)
	; AVX512F-NEXT: vpextrb $7, %xmm1, 23(%rdi)
	; AVX512F-NEXT: .LBB15_48: # %else46			; AVX512F-NEXT: .LBB15_48: # %else46
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3
	; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3			; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0			; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0
	; AVX512F-NEXT: kshiftrw $8, %k0, %k0			; AVX512F-NEXT: kshiftrw $8, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_50			; AVX512F-NEXT: je .LBB15_50
	; AVX512F-NEXT: # %bb.49: # %cond.store47			; AVX512F-NEXT: # %bb.49: # %cond.store47
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX512F-NEXT: vpextrb $8, %xmm0, 24(%rdi)
	; AVX512F-NEXT: vpextrb $8, %xmm3, 24(%rdi)
	; AVX512F-NEXT: .LBB15_50: # %else48			; AVX512F-NEXT: .LBB15_50: # %else48
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $9, %k0, %k0			; AVX512F-NEXT: kshiftrw $9, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_52			; AVX512F-NEXT: je .LBB15_52
	; AVX512F-NEXT: # %bb.51: # %cond.store49			; AVX512F-NEXT: # %bb.51: # %cond.store49
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrb $9, %xmm0, 25(%rdi)
	; AVX512F-NEXT: vpextrb $9, %xmm1, 25(%rdi)
	; AVX512F-NEXT: .LBB15_52: # %else50			; AVX512F-NEXT: .LBB15_52: # %else50
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3
	; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3			; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0			; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0
	; AVX512F-NEXT: kshiftrw $10, %k0, %k0			; AVX512F-NEXT: kshiftrw $10, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_54			; AVX512F-NEXT: je .LBB15_54
	; AVX512F-NEXT: # %bb.53: # %cond.store51			; AVX512F-NEXT: # %bb.53: # %cond.store51
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX512F-NEXT: vpextrb $10, %xmm0, 26(%rdi)
	; AVX512F-NEXT: vpextrb $10, %xmm3, 26(%rdi)
	; AVX512F-NEXT: .LBB15_54: # %else52			; AVX512F-NEXT: .LBB15_54: # %else52
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $11, %k0, %k0			; AVX512F-NEXT: kshiftrw $11, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_56			; AVX512F-NEXT: je .LBB15_56
	; AVX512F-NEXT: # %bb.55: # %cond.store53			; AVX512F-NEXT: # %bb.55: # %cond.store53
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrb $11, %xmm0, 27(%rdi)
	; AVX512F-NEXT: vpextrb $11, %xmm1, 27(%rdi)
	; AVX512F-NEXT: .LBB15_56: # %else54			; AVX512F-NEXT: .LBB15_56: # %else54
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm3
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm3
	; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3			; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0			; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0
	; AVX512F-NEXT: kshiftrw $12, %k0, %k0			; AVX512F-NEXT: kshiftrw $12, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_58			; AVX512F-NEXT: je .LBB15_58
	; AVX512F-NEXT: # %bb.57: # %cond.store55			; AVX512F-NEXT: # %bb.57: # %cond.store55
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm3			; AVX512F-NEXT: vpextrb $12, %xmm0, 28(%rdi)
	; AVX512F-NEXT: vpextrb $12, %xmm3, 28(%rdi)
	; AVX512F-NEXT: .LBB15_58: # %else56			; AVX512F-NEXT: .LBB15_58: # %else56
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $13, %k0, %k0			; AVX512F-NEXT: kshiftrw $13, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_60			; AVX512F-NEXT: je .LBB15_60
	; AVX512F-NEXT: # %bb.59: # %cond.store57			; AVX512F-NEXT: # %bb.59: # %cond.store57
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpextrb $13, %xmm0, 29(%rdi)
	; AVX512F-NEXT: vpextrb $13, %xmm1, 29(%rdi)
	; AVX512F-NEXT: .LBB15_60: # %else58			; AVX512F-NEXT: .LBB15_60: # %else58
	; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1			; AVX512F-NEXT: vpcmpeqb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm2			; AVX512F-NEXT: vmovdqa64 %zmm1, %zmm2
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm2			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm2
	; AVX512F-NEXT: vpmovsxbd %xmm2, %zmm2			; AVX512F-NEXT: vpmovsxbd %xmm2, %zmm2
	; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0			; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0
	; AVX512F-NEXT: kshiftrw $14, %k0, %k0			; AVX512F-NEXT: kshiftrw $14, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_62			; AVX512F-NEXT: je .LBB15_62
	; AVX512F-NEXT: # %bb.61: # %cond.store59			; AVX512F-NEXT: # %bb.61: # %cond.store59
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm2			; AVX512F-NEXT: vpextrb $14, %xmm0, 30(%rdi)
	; AVX512F-NEXT: vpextrb $14, %xmm2, 30(%rdi)
	; AVX512F-NEXT: .LBB15_62: # %else60			; AVX512F-NEXT: .LBB15_62: # %else60
	; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1			; AVX512F-NEXT: vpternlogq $15, %zmm1, %zmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: kshiftrw $15, %k0, %k0			; AVX512F-NEXT: kshiftrw $15, %k0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je .LBB15_64			; AVX512F-NEXT: je .LBB15_64
	; AVX512F-NEXT: # %bb.63: # %cond.store61			; AVX512F-NEXT: # %bb.63: # %cond.store61
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX512F-NEXT: vpextrb $15, %xmm0, 31(%rdi)			; AVX512F-NEXT: vpextrb $15, %xmm0, 31(%rdi)
	; AVX512F-NEXT: .LBB15_64: # %else62			; AVX512F-NEXT: .LBB15_64: # %else62
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512BW-LABEL: truncstore_v32i16_v32i8:			; AVX512BW-LABEL: truncstore_v32i16_v32i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: # kill: def $ymm1 killed $ymm1 def $zmm1			; AVX512BW-NEXT: # kill: def $ymm1 killed $ymm1 def $zmm1
	Show All 27 Lines
	; SSE2-NEXT: pxor %xmm4, %xmm1			; SSE2-NEXT: pxor %xmm4, %xmm1
	; SSE2-NEXT: movdqa {{.*#+}} xmm5 = [33023,33023,33023,33023,33023,33023,33023,33023]			; SSE2-NEXT: movdqa {{.*#+}} xmm5 = [33023,33023,33023,33023,33023,33023,33023,33023]
	; SSE2-NEXT: pminsw %xmm5, %xmm1			; SSE2-NEXT: pminsw %xmm5, %xmm1
	; SSE2-NEXT: pxor %xmm4, %xmm1			; SSE2-NEXT: pxor %xmm4, %xmm1
	; SSE2-NEXT: pxor %xmm4, %xmm0			; SSE2-NEXT: pxor %xmm4, %xmm0
	; SSE2-NEXT: pminsw %xmm5, %xmm0			; SSE2-NEXT: pminsw %xmm5, %xmm0
	; SSE2-NEXT: pxor %xmm4, %xmm0			; SSE2-NEXT: pxor %xmm4, %xmm0
	; SSE2-NEXT: packuswb %xmm1, %xmm0			; SSE2-NEXT: packuswb %xmm1, %xmm0
	; SSE2-NEXT: movd %xmm3, %eax			; SSE2-NEXT: movd %xmm3, %ecx
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %ecx, %eax
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %al
				; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: je .LBB16_2			; SSE2-NEXT: je .LBB16_2
	; SSE2-NEXT: # %bb.1: # %cond.store			; SSE2-NEXT: # %bb.1: # %cond.store
	; SSE2-NEXT: movd %xmm0, %ecx			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: movb %cl, (%rdi)
	; SSE2-NEXT: .LBB16_2: # %else			; SSE2-NEXT: .LBB16_2: # %else
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %ecx
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB16_4			; SSE2-NEXT: je .LBB16_4
	; SSE2-NEXT: # %bb.3: # %cond.store1			; SSE2-NEXT: # %bb.3: # %cond.store1
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: movb %ah, 1(%rdi)			; SSE2-NEXT: movb %ah, 1(%rdi)
	; SSE2-NEXT: .LBB16_4: # %else2			; SSE2-NEXT: .LBB16_4: # %else2
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm2, %xmm1			; SSE2-NEXT: pcmpeqb %xmm2, %xmm1
	; SSE2-NEXT: movd %xmm1, %eax			; SSE2-NEXT: movd %xmm1, %ecx
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %ecx, %edx
	; SSE2-NEXT: shrl $16, %ecx			; SSE2-NEXT: shrl $16, %edx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %dl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %dl
	; SSE2-NEXT: je .LBB16_6			; SSE2-NEXT: je .LBB16_6
	; SSE2-NEXT: # %bb.5: # %cond.store3			; SSE2-NEXT: # %bb.5: # %cond.store3
	; SSE2-NEXT: movd %xmm0, %ecx			; SSE2-NEXT: movl %eax, %edx
	; SSE2-NEXT: shrl $16, %ecx			; SSE2-NEXT: shrl $16, %edx
	; SSE2-NEXT: movb %cl, 2(%rdi)			; SSE2-NEXT: movb %dl, 2(%rdi)
	; SSE2-NEXT: .LBB16_6: # %else4			; SSE2-NEXT: .LBB16_6: # %else4
	; SSE2-NEXT: shrl $24, %eax			; SSE2-NEXT: shrl $24, %ecx
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB16_8			; SSE2-NEXT: je .LBB16_8
	; SSE2-NEXT: # %bb.7: # %cond.store5			; SSE2-NEXT: # %bb.7: # %cond.store5
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: shrl $24, %eax			; SSE2-NEXT: shrl $24, %eax
	; SSE2-NEXT: movb %al, 3(%rdi)			; SSE2-NEXT: movb %al, 3(%rdi)
	; SSE2-NEXT: .LBB16_8: # %else6			; SSE2-NEXT: .LBB16_8: # %else6
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm2, %xmm1			; SSE2-NEXT: pcmpeqb %xmm2, %xmm1
	; SSE2-NEXT: pextrw $2, %xmm1, %eax			; SSE2-NEXT: pextrw $2, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $2, %xmm0, %ecx
	; SSE2-NEXT: je .LBB16_10			; SSE2-NEXT: je .LBB16_10
	; SSE2-NEXT: # %bb.9: # %cond.store7			; SSE2-NEXT: # %bb.9: # %cond.store7
	; SSE2-NEXT: pextrw $2, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 4(%rdi)			; SSE2-NEXT: movb %cl, 4(%rdi)
	; SSE2-NEXT: .LBB16_10: # %else8			; SSE2-NEXT: .LBB16_10: # %else8
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB16_12			; SSE2-NEXT: je .LBB16_12
	; SSE2-NEXT: # %bb.11: # %cond.store9			; SSE2-NEXT: # %bb.11: # %cond.store9
	; SSE2-NEXT: pextrw $2, %xmm0, %eax			; SSE2-NEXT: movb %ch, 5(%rdi)
	; SSE2-NEXT: movb %ah, 5(%rdi)
	; SSE2-NEXT: .LBB16_12: # %else10			; SSE2-NEXT: .LBB16_12: # %else10
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm2, %xmm1			; SSE2-NEXT: pcmpeqb %xmm2, %xmm1
	; SSE2-NEXT: pextrw $3, %xmm1, %eax			; SSE2-NEXT: pextrw $3, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $3, %xmm0, %ecx
	; SSE2-NEXT: je .LBB16_14			; SSE2-NEXT: je .LBB16_14
	; SSE2-NEXT: # %bb.13: # %cond.store11			; SSE2-NEXT: # %bb.13: # %cond.store11
	; SSE2-NEXT: pextrw $3, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 6(%rdi)			; SSE2-NEXT: movb %cl, 6(%rdi)
	; SSE2-NEXT: .LBB16_14: # %else12			; SSE2-NEXT: .LBB16_14: # %else12
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB16_16			; SSE2-NEXT: je .LBB16_16
	; SSE2-NEXT: # %bb.15: # %cond.store13			; SSE2-NEXT: # %bb.15: # %cond.store13
	; SSE2-NEXT: pextrw $3, %xmm0, %eax			; SSE2-NEXT: movb %ch, 7(%rdi)
	; SSE2-NEXT: movb %ah, 7(%rdi)
	; SSE2-NEXT: .LBB16_16: # %else14			; SSE2-NEXT: .LBB16_16: # %else14
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm2, %xmm1			; SSE2-NEXT: pcmpeqb %xmm2, %xmm1
	; SSE2-NEXT: pextrw $4, %xmm1, %eax			; SSE2-NEXT: pextrw $4, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $4, %xmm0, %ecx
	; SSE2-NEXT: je .LBB16_18			; SSE2-NEXT: je .LBB16_18
	; SSE2-NEXT: # %bb.17: # %cond.store15			; SSE2-NEXT: # %bb.17: # %cond.store15
	; SSE2-NEXT: pextrw $4, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 8(%rdi)			; SSE2-NEXT: movb %cl, 8(%rdi)
	; SSE2-NEXT: .LBB16_18: # %else16			; SSE2-NEXT: .LBB16_18: # %else16
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB16_20			; SSE2-NEXT: je .LBB16_20
	; SSE2-NEXT: # %bb.19: # %cond.store17			; SSE2-NEXT: # %bb.19: # %cond.store17
	; SSE2-NEXT: pextrw $4, %xmm0, %eax			; SSE2-NEXT: movb %ch, 9(%rdi)
	; SSE2-NEXT: movb %ah, 9(%rdi)
	; SSE2-NEXT: .LBB16_20: # %else18			; SSE2-NEXT: .LBB16_20: # %else18
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm2, %xmm1			; SSE2-NEXT: pcmpeqb %xmm2, %xmm1
	; SSE2-NEXT: pextrw $5, %xmm1, %eax			; SSE2-NEXT: pextrw $5, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $5, %xmm0, %ecx
	; SSE2-NEXT: je .LBB16_22			; SSE2-NEXT: je .LBB16_22
	; SSE2-NEXT: # %bb.21: # %cond.store19			; SSE2-NEXT: # %bb.21: # %cond.store19
	; SSE2-NEXT: pextrw $5, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 10(%rdi)			; SSE2-NEXT: movb %cl, 10(%rdi)
	; SSE2-NEXT: .LBB16_22: # %else20			; SSE2-NEXT: .LBB16_22: # %else20
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB16_24			; SSE2-NEXT: je .LBB16_24
	; SSE2-NEXT: # %bb.23: # %cond.store21			; SSE2-NEXT: # %bb.23: # %cond.store21
	; SSE2-NEXT: pextrw $5, %xmm0, %eax			; SSE2-NEXT: movb %ch, 11(%rdi)
	; SSE2-NEXT: movb %ah, 11(%rdi)
	; SSE2-NEXT: .LBB16_24: # %else22			; SSE2-NEXT: .LBB16_24: # %else22
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm2, %xmm1			; SSE2-NEXT: pcmpeqb %xmm2, %xmm1
	; SSE2-NEXT: pextrw $6, %xmm1, %eax			; SSE2-NEXT: pextrw $6, %xmm1, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $6, %xmm0, %ecx
	; SSE2-NEXT: je .LBB16_26			; SSE2-NEXT: je .LBB16_26
	; SSE2-NEXT: # %bb.25: # %cond.store23			; SSE2-NEXT: # %bb.25: # %cond.store23
	; SSE2-NEXT: pextrw $6, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 12(%rdi)			; SSE2-NEXT: movb %cl, 12(%rdi)
	; SSE2-NEXT: .LBB16_26: # %else24			; SSE2-NEXT: .LBB16_26: # %else24
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB16_28			; SSE2-NEXT: je .LBB16_28
	; SSE2-NEXT: # %bb.27: # %cond.store25			; SSE2-NEXT: # %bb.27: # %cond.store25
	; SSE2-NEXT: pextrw $6, %xmm0, %eax			; SSE2-NEXT: movb %ch, 13(%rdi)
	; SSE2-NEXT: movb %ah, 13(%rdi)
	; SSE2-NEXT: .LBB16_28: # %else26			; SSE2-NEXT: .LBB16_28: # %else26
	; SSE2-NEXT: pxor %xmm1, %xmm1			; SSE2-NEXT: pxor %xmm1, %xmm1
	; SSE2-NEXT: pcmpeqb %xmm1, %xmm2			; SSE2-NEXT: pcmpeqb %xmm1, %xmm2
	; SSE2-NEXT: pextrw $7, %xmm2, %eax			; SSE2-NEXT: pextrw $7, %xmm2, %eax
	; SSE2-NEXT: movl %eax, %ecx			; SSE2-NEXT: movl %eax, %ecx
	; SSE2-NEXT: notb %cl			; SSE2-NEXT: notb %cl
	; SSE2-NEXT: testb $1, %cl			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: pextrw $7, %xmm0, %ecx
	; SSE2-NEXT: je .LBB16_30			; SSE2-NEXT: je .LBB16_30
	; SSE2-NEXT: # %bb.29: # %cond.store27			; SSE2-NEXT: # %bb.29: # %cond.store27
	; SSE2-NEXT: pextrw $7, %xmm0, %ecx
	; SSE2-NEXT: movb %cl, 14(%rdi)			; SSE2-NEXT: movb %cl, 14(%rdi)
	; SSE2-NEXT: .LBB16_30: # %else28			; SSE2-NEXT: .LBB16_30: # %else28
	; SSE2-NEXT: shrl $8, %eax			; SSE2-NEXT: shrl $8, %eax
	; SSE2-NEXT: notb %al			; SSE2-NEXT: notb %al
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %al
	; SSE2-NEXT: je .LBB16_32			; SSE2-NEXT: je .LBB16_32
	; SSE2-NEXT: # %bb.31: # %cond.store29			; SSE2-NEXT: # %bb.31: # %cond.store29
	; SSE2-NEXT: pextrw $7, %xmm0, %eax			; SSE2-NEXT: movb %ch, 15(%rdi)
	; SSE2-NEXT: movb %ah, 15(%rdi)
	; SSE2-NEXT: .LBB16_32: # %else30			; SSE2-NEXT: .LBB16_32: # %else30
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE4-LABEL: truncstore_v16i16_v16i8:			; SSE4-LABEL: truncstore_v16i16_v16i8:
	; SSE4: # %bb.0:			; SSE4: # %bb.0:
	; SSE4-NEXT: pxor %xmm3, %xmm3			; SSE4-NEXT: pxor %xmm3, %xmm3
	; SSE4-NEXT: pcmpeqb %xmm2, %xmm3			; SSE4-NEXT: pcmpeqb %xmm2, %xmm3
	; SSE4-NEXT: movdqa {{.*#+}} xmm4 = [255,255,255,255,255,255,255,255]			; SSE4-NEXT: movdqa {{.*#+}} xmm4 = [255,255,255,255,255,255,255,255]
	▲ Show 20 Lines • Show All 625 Lines • ▼ Show 20 Lines
	; SSE2-NEXT: pxor %xmm2, %xmm2			; SSE2-NEXT: pxor %xmm2, %xmm2
	; SSE2-NEXT: pcmpeqw %xmm1, %xmm2			; SSE2-NEXT: pcmpeqw %xmm1, %xmm2
	; SSE2-NEXT: pcmpeqd %xmm3, %xmm3			; SSE2-NEXT: pcmpeqd %xmm3, %xmm3
	; SSE2-NEXT: pxor %xmm2, %xmm3			; SSE2-NEXT: pxor %xmm2, %xmm3
	; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]			; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [32768,32768,32768,32768,32768,32768,32768,32768]
	; SSE2-NEXT: pxor %xmm2, %xmm0			; SSE2-NEXT: pxor %xmm2, %xmm0
	; SSE2-NEXT: pminsw {{.*}}(%rip), %xmm0			; SSE2-NEXT: pminsw {{.*}}(%rip), %xmm0
	; SSE2-NEXT: pxor %xmm2, %xmm0			; SSE2-NEXT: pxor %xmm2, %xmm0
	; SSE2-NEXT: movd %xmm3, %eax			; SSE2-NEXT: movd %xmm3, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
				; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: je .LBB17_2			; SSE2-NEXT: je .LBB17_2
	; SSE2-NEXT: # %bb.1: # %cond.store			; SSE2-NEXT: # %bb.1: # %cond.store
	; SSE2-NEXT: movd %xmm0, %ecx			; SSE2-NEXT: movb %al, (%rdi)
	; SSE2-NEXT: movb %cl, (%rdi)
	; SSE2-NEXT: .LBB17_2: # %else			; SSE2-NEXT: .LBB17_2: # %else
	; SSE2-NEXT: shrl $16, %eax			; SSE2-NEXT: shrl $16, %ecx
	; SSE2-NEXT: testb $1, %al			; SSE2-NEXT: testb $1, %cl
	; SSE2-NEXT: je .LBB17_4			; SSE2-NEXT: je .LBB17_4
	; SSE2-NEXT: # %bb.3: # %cond.store1			; SSE2-NEXT: # %bb.3: # %cond.store1
	; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: shrl $16, %eax			; SSE2-NEXT: shrl $16, %eax
	; SSE2-NEXT: movb %al, 1(%rdi)			; SSE2-NEXT: movb %al, 1(%rdi)
	; SSE2-NEXT: .LBB17_4: # %else2			; SSE2-NEXT: .LBB17_4: # %else2
	; SSE2-NEXT: pxor %xmm3, %xmm3			; SSE2-NEXT: pxor %xmm3, %xmm3
	; SSE2-NEXT: pcmpeqw %xmm1, %xmm3			; SSE2-NEXT: pcmpeqw %xmm1, %xmm3
	; SSE2-NEXT: pcmpeqd %xmm2, %xmm2			; SSE2-NEXT: pcmpeqd %xmm2, %xmm2
	; SSE2-NEXT: pxor %xmm3, %xmm2			; SSE2-NEXT: pxor %xmm3, %xmm2
	; SSE2-NEXT: pextrw $2, %xmm2, %eax			; SSE2-NEXT: pextrw $2, %xmm2, %eax
	▲ Show 20 Lines • Show All 324 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[MIR] Add simple PRE pass to MachineCSEClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 197945

llvm/trunk/lib/CodeGen/MachineCSE.cpp

llvm/trunk/test/CodeGen/Mips/internalfunc.ll

llvm/trunk/test/CodeGen/X86/avx2-masked-gather.ll

llvm/trunk/test/CodeGen/X86/masked_compressstore.ll

llvm/trunk/test/CodeGen/X86/masked_gather.ll

llvm/trunk/test/CodeGen/X86/masked_store.ll

llvm/trunk/test/CodeGen/X86/masked_store_trunc.ll

llvm/trunk/test/CodeGen/X86/masked_store_trunc_ssat.ll

llvm/trunk/test/CodeGen/X86/masked_store_trunc_usat.ll

[MIR] Add simple PRE pass to MachineCSE
ClosedPublic