This is an archive of the discontinued LLVM Phabricator instance.

[X86][SandyBridge] SBWriteResPair +5cy and +1uop Memory Folds
ClosedPublic

Authored by RKSimon on Mar 19 2018, 5:22 PM.

Download Raw Diff

Details

Reviewers

craig.topper
gadi.haber
courbet

Commits

rG8a83f16ccd08: [X86][SandyBridge] SBWriteResPair +5cy Memory Folds
rL329388: [X86][SandyBridge] SBWriteResPair +5cy Memory Folds

Summary

As mentioned on D44647, this patch increases the default memory latency to +5cy as well as costing +1uop, which more closely matches what most custom cases are doing for reg-mem instructions.

I've left ReadAfterLd at 4cy at the moment, which seems to be correct for 'pure' loads - should I can increase this to 5 as well? What about WriteLoad etc?

As Sandy Bridge is currently our default generic model, this affects a lot of scheduling tests...

Diff Detail

Repository: rL LLVM

Event Timeline

RKSimon created this revision.Mar 19 2018, 5:22 PM

I think this mostly looks ok. Most of this just stuff SNB doens't support anyway. We should file bugs for the obvious bugs its showing.

test/CodeGen/X86/mmx-schedule.ll
1266 ↗	(On Diff #139028)	So a ton of MMX instructions are missing from SNB?
test/CodeGen/X86/schedule-x86_32.ll
213 ↗	(On Diff #139028)	So RETQ is in the scheduler model but RETL isn't?
test/CodeGen/X86/sse41-schedule.ll
353 ↗	(On Diff #139028)	So DPPSrmi and VDPPSrmi are missing from the SNB scheduler model?
713 ↗	(On Diff #139028)	This is an obvious mistake in the SNB model. I'll commit a fix.

I'll fix the ror/rol/shr/sar problems too.

And I'll fix TEST

courbet added inline comments.Mar 20 2018, 2:02 AM

lib/Target/X86/X86SchedSandyBridge.td
83 ↗	(On Diff #139028)	Please fix the comment.

Fixed comment and rebased patch.

Another issue is WriteLoad is set to 4cy but WriteFLoad/WriteVecLoad is set to 6cy memory latency - there are a lot of inconsistencies in here.

I'm open to any/all recommendations - plus I think we need to bear in mind that this model is used for generic (non-specific) x86_64 targets.

In D44654#1043354, @RKSimon wrote:

Fixed comment and rebased patch.

Another issue is WriteLoad is set to 4cy but WriteFLoad/WriteVecLoad is set to 6cy memory latency - there are a lot of inconsistencies in here.

When the data is in cache, I see latencies of 2 for MOV64rm, 3 for VMOVUPSrm, 4 for VMOVUPSYrm with llvm-exegesis (btw @craig.topper: why are all memory latencies shifted by 3? Is it to account for data that's not in the cache ?). So the values here seem reasonable if the 6cy is for the ymm version. Essentially this shows that the basic model is too simplistic for sandybridge; we really need the specialization per mnemonic. The specialization seem to be correct: VMOVUPSYrm has latency 7 (4+3), VMOVUPSrm 6 (3+3) and MOV64rm 5 (2+3).

2 cycle latency for MOV64rm seems low to me. There's an address calculation and a TLB lookup before it can even start accessing the cache.

Table 2-20 of https://software.intel.com/sites/default/files/managed/9e/bc/64-ia-32-architectures-optimization-manual.pdf shows the load latencies according to Intel.

In D44654#1045323, @craig.topper wrote:

2 cycle latency for MOV64rm seems low to me. There's an address calculation and a TLB lookup before it can even start accessing the cache.

Table 2-20 of https://software.intel.com/sites/default/files/managed/9e/bc/64-ia-32-architectures-optimization-manual.pdf shows the load latencies according to Intel.

The generated code had store-to-load forwarding, so the numbers here are indeed missing the memory access part. When we change the generator to prevent the forwarding, we see latencies of 11/9/7 for ymm0/xmm0/rax on sandybridge, which are consistent with the access-less numbers I mentioned above (4/3/2), plus access times according to the doc you pointed to (7/6/5): 11=7+4 / 9=6+3 / 7=2+5.
It's not obvious to me which number LLVM should be using (should we give it both numbers and teach it to recognize store-load forwarding opportunities and schedule accordingly ?)

We'll try to think of a way to integrate this in a principled way into llvm-exegesis (created PR36905).

I've left ReadAfterLd at 4cy at the moment, which seems to be correct for 'pure' loads

Isn't ReadAfterLd only used by instructions with folded loads? So shouldn't it be 5cyc?

LGTM. I'd like to see this go in so I can start removing InstrRWs from Sandy Bridge to start fixing the missing ReadAfterLd.

This revision is now accepted and ready to land.Apr 5 2018, 7:08 PM

Closed by commit rL329388: [X86][SandyBridge] SBWriteResPair +5cy Memory Folds (authored by RKSimon). · Explain WhyApr 6 2018, 4:04 AM

This revision was automatically updated to reflect the committed changes.

RKSimon mentioned this in rL329389: [X86][SandyBridge] Add (V)DPPS memory fold latencies.Apr 6 2018, 4:29 AM

Revision Contents

Path

Size

llvm/

trunk/

lib/

Target/

X86/

X86SchedSandyBridge.td

12 lines

test/

CodeGen/

X86/

48 lines

8 lines

4 lines

290 lines

224 lines

avx512-shuffle-schedule.ll

852 lines

avx512vpopcntdq-schedule.ll

24 lines

20 lines

32 lines

2 lines

20 lines

192 lines

128 lines

204 lines

6 lines

58 lines

224 lines

14 lines

10 lines

40 lines

118 lines

166 lines

Diff 141307

llvm/trunk/lib/Target/X86/X86SchedSandyBridge.td

Show All 12 Lines
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

def SandyBridgeModel : SchedMachineModel {		def SandyBridgeModel : SchedMachineModel {
// All x86 instructions are modeled as a single micro-op, and SB can decode 4		// All x86 instructions are modeled as a single micro-op, and SB can decode 4
// instructions per cycle.		// instructions per cycle.
// FIXME: Identify instructions that aren't a single fused micro-op.		// FIXME: Identify instructions that aren't a single fused micro-op.
let IssueWidth = 4;		let IssueWidth = 4;
let MicroOpBufferSize = 168; // Based on the reorder buffer.		let MicroOpBufferSize = 168; // Based on the reorder buffer.
let LoadLatency = 4;		let LoadLatency = 5;
let MispredictPenalty = 16;		let MispredictPenalty = 16;

// Based on the LSD (loop-stream detector) queue size.		// Based on the LSD (loop-stream detector) queue size.
let LoopMicroOpBufferSize = 28;		let LoopMicroOpBufferSize = 28;

// This flag is set to allow the scheduler to assign		// This flag is set to allow the scheduler to assign
// a default model to unrecognized opcodes.		// a default model to unrecognized opcodes.
let CompleteModel = 0;		let CompleteModel = 0;
Show All 28 Lines	def SBPortAny : ProcResGroup<[SBPort0, SBPort1, SBPort23, SBPort4, SBPort5]> {
let BufferSize=54;		let BufferSize=54;
}		}

// Integer division issued on port 0.		// Integer division issued on port 0.
def SBDivider : ProcResource<1>;		def SBDivider : ProcResource<1>;
// FP division and sqrt on port 0.		// FP division and sqrt on port 0.
def SBFPDivider : ProcResource<1>;		def SBFPDivider : ProcResource<1>;

// Loads are 4 cycles, so ReadAfterLd registers needn't be available until 4		// Loads are 5 cycles, so ReadAfterLd registers needn't be available until 5
// cycles after the memory operand.		// cycles after the memory operand.
def : ReadAdvance<ReadAfterLd, 4>;		def : ReadAdvance<ReadAfterLd, 5>;

// Many SchedWrites are defined in pairs with and without a folded load.		// Many SchedWrites are defined in pairs with and without a folded load.
// Instructions with folded loads are usually micro-fused, so they only appear		// Instructions with folded loads are usually micro-fused, so they only appear
// as two micro-ops when queued in the reservation station.		// as two micro-ops when queued in the reservation station.
// This multiclass defines the resource usage for variants with and without		// This multiclass defines the resource usage for variants with and without
// folded loads.		// folded loads.
multiclass SBWriteResPair<X86FoldableSchedWrite SchedRW,		multiclass SBWriteResPair<X86FoldableSchedWrite SchedRW,
list<ProcResourceKind> ExePorts,		list<ProcResourceKind> ExePorts,
int Lat, list<int> Res = [1], int UOps = 1,		int Lat, list<int> Res = [1], int UOps = 1,
int LoadLat = 4> {		int LoadLat = 5> {
// Register variant is using a single cycle on ExePort.		// Register variant is using a single cycle on ExePort.
def : WriteRes<SchedRW, ExePorts> {		def : WriteRes<SchedRW, ExePorts> {
let Latency = Lat;		let Latency = Lat;
let ResourceCycles = Res;		let ResourceCycles = Res;
let NumMicroOps = UOps;		let NumMicroOps = UOps;
}		}

// Memory variant also uses a cycle on port 2/3 and adds LoadLat cycles to		// Memory variant also uses a cycle on port 2/3 and adds LoadLat cycles to
// the latency (default = 4).		// the latency (default = 5).
def : WriteRes<SchedRW.Folded, !listconcat([SBPort23], ExePorts)> {		def : WriteRes<SchedRW.Folded, !listconcat([SBPort23], ExePorts)> {
let Latency = !add(Lat, LoadLat);		let Latency = !add(Lat, LoadLat);
let ResourceCycles = !listconcat([1], Res);		let ResourceCycles = !listconcat([1], Res);
let NumMicroOps = !add(UOps, 1);		let NumMicroOps = !add(UOps, 1);
}		}
}		}

// A folded store needs a cycle on port 4 for the store data, but it does not		// A folded store needs a cycle on port 4 for the store data, but it does not
// need an extra port 2/3 cycle to recompute the address.		// need an extra port 2/3 cycle to recompute the address.
def : WriteRes<WriteRMW, [SBPort4]>;		def : WriteRes<WriteRMW, [SBPort4]>;

def : WriteRes<WriteStore, [SBPort23, SBPort4]>;		def : WriteRes<WriteStore, [SBPort23, SBPort4]>;
def : WriteRes<WriteLoad, [SBPort23]> { let Latency = 4; }		def : WriteRes<WriteLoad, [SBPort23]> { let Latency = 5; }
def : WriteRes<WriteMove, [SBPort015]>;		def : WriteRes<WriteMove, [SBPort015]>;
def : WriteRes<WriteZero, []>;		def : WriteRes<WriteZero, []>;

defm : SBWriteResPair<WriteALU, [SBPort015], 1>;		defm : SBWriteResPair<WriteALU, [SBPort015], 1>;
defm : SBWriteResPair<WriteIMul, [SBPort1], 3>;		defm : SBWriteResPair<WriteIMul, [SBPort1], 3>;
defm : SBWriteResPair<WriteIDiv, [SBPort0, SBDivider], 25, [1, 10]>;		defm : SBWriteResPair<WriteIDiv, [SBPort0, SBDivider], 25, [1, 10]>;
def : WriteRes<WriteIMulH, []> { let Latency = 3; }		def : WriteRes<WriteIMulH, []> { let Latency = 3; }

▲ Show 20 Lines • Show All 1,955 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/3dnow-schedule.ll

Show All 9 Lines	; CHECK-NEXT: retq # sched: [1:1.00]
ret void		ret void
}		}
declare void @llvm.x86.mmx.femms() nounwind readnone		declare void @llvm.x86.mmx.femms() nounwind readnone

define i64 @test_pavgusb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pavgusb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; CHECK-LABEL: test_pavgusb:		; CHECK-LABEL: test_pavgusb:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pavgusb %mm1, %mm0 # sched: [5:1.00]		; CHECK-NEXT: pavgusb %mm1, %mm0 # sched: [5:1.00]
; CHECK-NEXT: pavgusb (%rdi), %mm0 # sched: [9:1.00]		; CHECK-NEXT: pavgusb (%rdi), %mm0 # sched: [10:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = call x86_mmx @llvm.x86.3dnow.pavgusb(x86_mmx %a0, x86_mmx %a1)		%1 = call x86_mmx @llvm.x86.3dnow.pavgusb(x86_mmx %a0, x86_mmx %a1)
%2 = load x86_mmx, x86_mmx *%a2, align 8		%2 = load x86_mmx, x86_mmx *%a2, align 8
%3 = call x86_mmx @llvm.x86.3dnow.pavgusb(x86_mmx %1, x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnow.pavgusb(x86_mmx %1, x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.3dnow.pavgusb(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.3dnow.pavgusb(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pf2id(x86_mmx* %a0) optsize {		define i64 @test_pf2id(x86_mmx* %a0) optsize {
; CHECK-LABEL: test_pf2id:		; CHECK-LABEL: test_pf2id:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pf2id (%rdi), %mm0 # sched: [7:1.00]		; CHECK-NEXT: pf2id (%rdi), %mm0 # sched: [8:1.00]
; CHECK-NEXT: pf2id %mm0, %mm0 # sched: [3:1.00]		; CHECK-NEXT: pf2id %mm0, %mm0 # sched: [3:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = load x86_mmx, x86_mmx *%a0, align 8		%1 = load x86_mmx, x86_mmx *%a0, align 8
%2 = call x86_mmx @llvm.x86.3dnow.pf2id(x86_mmx %1)		%2 = call x86_mmx @llvm.x86.3dnow.pf2id(x86_mmx %1)
%3 = call x86_mmx @llvm.x86.3dnow.pf2id(x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnow.pf2id(x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.3dnow.pf2id(x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.3dnow.pf2id(x86_mmx) nounwind readnone

define i64 @test_pf2iw(x86_mmx* %a0) optsize {		define i64 @test_pf2iw(x86_mmx* %a0) optsize {
; CHECK-LABEL: test_pf2iw:		; CHECK-LABEL: test_pf2iw:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pf2iw (%rdi), %mm0 # sched: [7:1.00]		; CHECK-NEXT: pf2iw (%rdi), %mm0 # sched: [8:1.00]
; CHECK-NEXT: pf2iw %mm0, %mm0 # sched: [3:1.00]		; CHECK-NEXT: pf2iw %mm0, %mm0 # sched: [3:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = load x86_mmx, x86_mmx *%a0, align 8		%1 = load x86_mmx, x86_mmx *%a0, align 8
%2 = call x86_mmx @llvm.x86.3dnowa.pf2iw(x86_mmx %1)		%2 = call x86_mmx @llvm.x86.3dnowa.pf2iw(x86_mmx %1)
%3 = call x86_mmx @llvm.x86.3dnowa.pf2iw(x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnowa.pf2iw(x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.3dnowa.pf2iw(x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.3dnowa.pf2iw(x86_mmx) nounwind readnone

define i64 @test_pfacc(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pfacc(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; CHECK-LABEL: test_pfacc:		; CHECK-LABEL: test_pfacc:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pfacc %mm1, %mm0 # sched: [3:1.00]		; CHECK-NEXT: pfacc %mm1, %mm0 # sched: [3:1.00]
; CHECK-NEXT: pfacc (%rdi), %mm0 # sched: [7:1.00]		; CHECK-NEXT: pfacc (%rdi), %mm0 # sched: [8:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = call x86_mmx @llvm.x86.3dnow.pfacc(x86_mmx %a0, x86_mmx %a1)		%1 = call x86_mmx @llvm.x86.3dnow.pfacc(x86_mmx %a0, x86_mmx %a1)
%2 = load x86_mmx, x86_mmx *%a2, align 8		%2 = load x86_mmx, x86_mmx *%a2, align 8
%3 = call x86_mmx @llvm.x86.3dnow.pfacc(x86_mmx %1, x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnow.pfacc(x86_mmx %1, x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.3dnow.pfacc(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.3dnow.pfacc(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pfadd(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pfadd(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; CHECK-LABEL: test_pfadd:		; CHECK-LABEL: test_pfadd:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pfadd %mm1, %mm0 # sched: [3:1.00]		; CHECK-NEXT: pfadd %mm1, %mm0 # sched: [3:1.00]
; CHECK-NEXT: pfadd (%rdi), %mm0 # sched: [7:1.00]		; CHECK-NEXT: pfadd (%rdi), %mm0 # sched: [8:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = call x86_mmx @llvm.x86.3dnow.pfadd(x86_mmx %a0, x86_mmx %a1)		%1 = call x86_mmx @llvm.x86.3dnow.pfadd(x86_mmx %a0, x86_mmx %a1)
%2 = load x86_mmx, x86_mmx *%a2, align 8		%2 = load x86_mmx, x86_mmx *%a2, align 8
%3 = call x86_mmx @llvm.x86.3dnow.pfadd(x86_mmx %1, x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnow.pfadd(x86_mmx %1, x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.3dnow.pfadd(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.3dnow.pfadd(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pfcmpeq(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pfcmpeq(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; CHECK-LABEL: test_pfcmpeq:		; CHECK-LABEL: test_pfcmpeq:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pfcmpeq %mm1, %mm0 # sched: [3:1.00]		; CHECK-NEXT: pfcmpeq %mm1, %mm0 # sched: [3:1.00]
; CHECK-NEXT: pfcmpeq (%rdi), %mm0 # sched: [7:1.00]		; CHECK-NEXT: pfcmpeq (%rdi), %mm0 # sched: [8:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = call x86_mmx @llvm.x86.3dnow.pfcmpeq(x86_mmx %a0, x86_mmx %a1)		%1 = call x86_mmx @llvm.x86.3dnow.pfcmpeq(x86_mmx %a0, x86_mmx %a1)
%2 = load x86_mmx, x86_mmx *%a2, align 8		%2 = load x86_mmx, x86_mmx *%a2, align 8
%3 = call x86_mmx @llvm.x86.3dnow.pfcmpeq(x86_mmx %1, x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnow.pfcmpeq(x86_mmx %1, x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.3dnow.pfcmpeq(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.3dnow.pfcmpeq(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pfcmpge(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pfcmpge(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; CHECK-LABEL: test_pfcmpge:		; CHECK-LABEL: test_pfcmpge:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pfcmpge %mm1, %mm0 # sched: [3:1.00]		; CHECK-NEXT: pfcmpge %mm1, %mm0 # sched: [3:1.00]
; CHECK-NEXT: pfcmpge (%rdi), %mm0 # sched: [7:1.00]		; CHECK-NEXT: pfcmpge (%rdi), %mm0 # sched: [8:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = call x86_mmx @llvm.x86.3dnow.pfcmpge(x86_mmx %a0, x86_mmx %a1)		%1 = call x86_mmx @llvm.x86.3dnow.pfcmpge(x86_mmx %a0, x86_mmx %a1)
%2 = load x86_mmx, x86_mmx *%a2, align 8		%2 = load x86_mmx, x86_mmx *%a2, align 8
%3 = call x86_mmx @llvm.x86.3dnow.pfcmpge(x86_mmx %1, x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnow.pfcmpge(x86_mmx %1, x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.3dnow.pfcmpge(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.3dnow.pfcmpge(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pfcmpgt(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pfcmpgt(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; CHECK-LABEL: test_pfcmpgt:		; CHECK-LABEL: test_pfcmpgt:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pfcmpgt %mm1, %mm0 # sched: [3:1.00]		; CHECK-NEXT: pfcmpgt %mm1, %mm0 # sched: [3:1.00]
; CHECK-NEXT: pfcmpgt (%rdi), %mm0 # sched: [7:1.00]		; CHECK-NEXT: pfcmpgt (%rdi), %mm0 # sched: [8:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = call x86_mmx @llvm.x86.3dnow.pfcmpgt(x86_mmx %a0, x86_mmx %a1)		%1 = call x86_mmx @llvm.x86.3dnow.pfcmpgt(x86_mmx %a0, x86_mmx %a1)
%2 = load x86_mmx, x86_mmx *%a2, align 8		%2 = load x86_mmx, x86_mmx *%a2, align 8
%3 = call x86_mmx @llvm.x86.3dnow.pfcmpgt(x86_mmx %1, x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnow.pfcmpgt(x86_mmx %1, x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.3dnow.pfcmpgt(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.3dnow.pfcmpgt(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pfmax(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pfmax(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; CHECK-LABEL: test_pfmax:		; CHECK-LABEL: test_pfmax:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pfmax %mm1, %mm0 # sched: [3:1.00]		; CHECK-NEXT: pfmax %mm1, %mm0 # sched: [3:1.00]
; CHECK-NEXT: pfmax (%rdi), %mm0 # sched: [7:1.00]		; CHECK-NEXT: pfmax (%rdi), %mm0 # sched: [8:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = call x86_mmx @llvm.x86.3dnow.pfmax(x86_mmx %a0, x86_mmx %a1)		%1 = call x86_mmx @llvm.x86.3dnow.pfmax(x86_mmx %a0, x86_mmx %a1)
%2 = load x86_mmx, x86_mmx *%a2, align 8		%2 = load x86_mmx, x86_mmx *%a2, align 8
%3 = call x86_mmx @llvm.x86.3dnow.pfmax(x86_mmx %1, x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnow.pfmax(x86_mmx %1, x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.3dnow.pfmax(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.3dnow.pfmax(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pfmin(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pfmin(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; CHECK-LABEL: test_pfmin:		; CHECK-LABEL: test_pfmin:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pfmin %mm1, %mm0 # sched: [3:1.00]		; CHECK-NEXT: pfmin %mm1, %mm0 # sched: [3:1.00]
; CHECK-NEXT: pfmin (%rdi), %mm0 # sched: [7:1.00]		; CHECK-NEXT: pfmin (%rdi), %mm0 # sched: [8:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = call x86_mmx @llvm.x86.3dnow.pfmin(x86_mmx %a0, x86_mmx %a1)		%1 = call x86_mmx @llvm.x86.3dnow.pfmin(x86_mmx %a0, x86_mmx %a1)
%2 = load x86_mmx, x86_mmx *%a2, align 8		%2 = load x86_mmx, x86_mmx *%a2, align 8
%3 = call x86_mmx @llvm.x86.3dnow.pfmin(x86_mmx %1, x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnow.pfmin(x86_mmx %1, x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.3dnow.pfmin(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.3dnow.pfmin(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pfmul(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pfmul(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; CHECK-LABEL: test_pfmul:		; CHECK-LABEL: test_pfmul:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pfmul %mm1, %mm0 # sched: [3:1.00]		; CHECK-NEXT: pfmul %mm1, %mm0 # sched: [3:1.00]
; CHECK-NEXT: pfmul (%rdi), %mm0 # sched: [7:1.00]		; CHECK-NEXT: pfmul (%rdi), %mm0 # sched: [8:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = call x86_mmx @llvm.x86.3dnow.pfmul(x86_mmx %a0, x86_mmx %a1)		%1 = call x86_mmx @llvm.x86.3dnow.pfmul(x86_mmx %a0, x86_mmx %a1)
%2 = load x86_mmx, x86_mmx *%a2, align 8		%2 = load x86_mmx, x86_mmx *%a2, align 8
%3 = call x86_mmx @llvm.x86.3dnow.pfmul(x86_mmx %1, x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnow.pfmul(x86_mmx %1, x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.3dnow.pfmul(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.3dnow.pfmul(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pfnacc(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pfnacc(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; CHECK-LABEL: test_pfnacc:		; CHECK-LABEL: test_pfnacc:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pfnacc %mm1, %mm0 # sched: [3:1.00]		; CHECK-NEXT: pfnacc %mm1, %mm0 # sched: [3:1.00]
; CHECK-NEXT: pfnacc (%rdi), %mm0 # sched: [7:1.00]		; CHECK-NEXT: pfnacc (%rdi), %mm0 # sched: [8:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = call x86_mmx @llvm.x86.3dnowa.pfnacc(x86_mmx %a0, x86_mmx %a1)		%1 = call x86_mmx @llvm.x86.3dnowa.pfnacc(x86_mmx %a0, x86_mmx %a1)
%2 = load x86_mmx, x86_mmx *%a2, align 8		%2 = load x86_mmx, x86_mmx *%a2, align 8
%3 = call x86_mmx @llvm.x86.3dnowa.pfnacc(x86_mmx %1, x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnowa.pfnacc(x86_mmx %1, x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.3dnowa.pfnacc(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.3dnowa.pfnacc(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pfpnacc(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pfpnacc(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; CHECK-LABEL: test_pfpnacc:		; CHECK-LABEL: test_pfpnacc:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pfpnacc %mm1, %mm0 # sched: [3:1.00]		; CHECK-NEXT: pfpnacc %mm1, %mm0 # sched: [3:1.00]
; CHECK-NEXT: pfpnacc (%rdi), %mm0 # sched: [7:1.00]		; CHECK-NEXT: pfpnacc (%rdi), %mm0 # sched: [8:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = call x86_mmx @llvm.x86.3dnowa.pfpnacc(x86_mmx %a0, x86_mmx %a1)		%1 = call x86_mmx @llvm.x86.3dnowa.pfpnacc(x86_mmx %a0, x86_mmx %a1)
%2 = load x86_mmx, x86_mmx *%a2, align 8		%2 = load x86_mmx, x86_mmx *%a2, align 8
%3 = call x86_mmx @llvm.x86.3dnowa.pfpnacc(x86_mmx %1, x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnowa.pfpnacc(x86_mmx %1, x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.3dnowa.pfpnacc(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.3dnowa.pfpnacc(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pfrcp(x86_mmx* %a0) optsize {		define i64 @test_pfrcp(x86_mmx* %a0) optsize {
; CHECK-LABEL: test_pfrcp:		; CHECK-LABEL: test_pfrcp:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pfrcp (%rdi), %mm0 # sched: [7:1.00]		; CHECK-NEXT: pfrcp (%rdi), %mm0 # sched: [8:1.00]
; CHECK-NEXT: pfrcp %mm0, %mm0 # sched: [3:1.00]		; CHECK-NEXT: pfrcp %mm0, %mm0 # sched: [3:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = load x86_mmx, x86_mmx *%a0, align 8		%1 = load x86_mmx, x86_mmx *%a0, align 8
%2 = call x86_mmx @llvm.x86.3dnow.pfrcp(x86_mmx %1)		%2 = call x86_mmx @llvm.x86.3dnow.pfrcp(x86_mmx %1)
%3 = call x86_mmx @llvm.x86.3dnow.pfrcp(x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnow.pfrcp(x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.3dnow.pfrcp(x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.3dnow.pfrcp(x86_mmx) nounwind readnone

define i64 @test_pfrcpit1(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pfrcpit1(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; CHECK-LABEL: test_pfrcpit1:		; CHECK-LABEL: test_pfrcpit1:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pfrcpit1 %mm1, %mm0 # sched: [3:1.00]		; CHECK-NEXT: pfrcpit1 %mm1, %mm0 # sched: [3:1.00]
; CHECK-NEXT: pfrcpit1 (%rdi), %mm0 # sched: [7:1.00]		; CHECK-NEXT: pfrcpit1 (%rdi), %mm0 # sched: [8:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = call x86_mmx @llvm.x86.3dnow.pfrcpit1(x86_mmx %a0, x86_mmx %a1)		%1 = call x86_mmx @llvm.x86.3dnow.pfrcpit1(x86_mmx %a0, x86_mmx %a1)
%2 = load x86_mmx, x86_mmx *%a2, align 8		%2 = load x86_mmx, x86_mmx *%a2, align 8
%3 = call x86_mmx @llvm.x86.3dnow.pfrcpit1(x86_mmx %1, x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnow.pfrcpit1(x86_mmx %1, x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.3dnow.pfrcpit1(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.3dnow.pfrcpit1(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pfrcpit2(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pfrcpit2(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; CHECK-LABEL: test_pfrcpit2:		; CHECK-LABEL: test_pfrcpit2:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pfrcpit2 %mm1, %mm0 # sched: [3:1.00]		; CHECK-NEXT: pfrcpit2 %mm1, %mm0 # sched: [3:1.00]
; CHECK-NEXT: pfrcpit2 (%rdi), %mm0 # sched: [7:1.00]		; CHECK-NEXT: pfrcpit2 (%rdi), %mm0 # sched: [8:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = call x86_mmx @llvm.x86.3dnow.pfrcpit2(x86_mmx %a0, x86_mmx %a1)		%1 = call x86_mmx @llvm.x86.3dnow.pfrcpit2(x86_mmx %a0, x86_mmx %a1)
%2 = load x86_mmx, x86_mmx *%a2, align 8		%2 = load x86_mmx, x86_mmx *%a2, align 8
%3 = call x86_mmx @llvm.x86.3dnow.pfrcpit2(x86_mmx %1, x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnow.pfrcpit2(x86_mmx %1, x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.3dnow.pfrcpit2(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.3dnow.pfrcpit2(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pfrsqit1(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pfrsqit1(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; CHECK-LABEL: test_pfrsqit1:		; CHECK-LABEL: test_pfrsqit1:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pfrsqit1 %mm1, %mm0 # sched: [3:1.00]		; CHECK-NEXT: pfrsqit1 %mm1, %mm0 # sched: [3:1.00]
; CHECK-NEXT: pfrsqit1 (%rdi), %mm0 # sched: [7:1.00]		; CHECK-NEXT: pfrsqit1 (%rdi), %mm0 # sched: [8:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = call x86_mmx @llvm.x86.3dnow.pfrsqit1(x86_mmx %a0, x86_mmx %a1)		%1 = call x86_mmx @llvm.x86.3dnow.pfrsqit1(x86_mmx %a0, x86_mmx %a1)
%2 = load x86_mmx, x86_mmx *%a2, align 8		%2 = load x86_mmx, x86_mmx *%a2, align 8
%3 = call x86_mmx @llvm.x86.3dnow.pfrsqit1(x86_mmx %1, x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnow.pfrsqit1(x86_mmx %1, x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.3dnow.pfrsqit1(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.3dnow.pfrsqit1(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pfrsqrt(x86_mmx* %a0) optsize {		define i64 @test_pfrsqrt(x86_mmx* %a0) optsize {
; CHECK-LABEL: test_pfrsqrt:		; CHECK-LABEL: test_pfrsqrt:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pfrsqrt (%rdi), %mm0 # sched: [7:1.00]		; CHECK-NEXT: pfrsqrt (%rdi), %mm0 # sched: [8:1.00]
; CHECK-NEXT: pfrsqrt %mm0, %mm0 # sched: [3:1.00]		; CHECK-NEXT: pfrsqrt %mm0, %mm0 # sched: [3:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = load x86_mmx, x86_mmx *%a0, align 8		%1 = load x86_mmx, x86_mmx *%a0, align 8
%2 = call x86_mmx @llvm.x86.3dnow.pfrsqrt(x86_mmx %1)		%2 = call x86_mmx @llvm.x86.3dnow.pfrsqrt(x86_mmx %1)
%3 = call x86_mmx @llvm.x86.3dnow.pfrsqrt(x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnow.pfrsqrt(x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.3dnow.pfrsqrt(x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.3dnow.pfrsqrt(x86_mmx) nounwind readnone

define i64 @test_pfsub(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pfsub(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; CHECK-LABEL: test_pfsub:		; CHECK-LABEL: test_pfsub:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pfsub %mm1, %mm0 # sched: [3:1.00]		; CHECK-NEXT: pfsub %mm1, %mm0 # sched: [3:1.00]
; CHECK-NEXT: pfsub (%rdi), %mm0 # sched: [7:1.00]		; CHECK-NEXT: pfsub (%rdi), %mm0 # sched: [8:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = call x86_mmx @llvm.x86.3dnow.pfsub(x86_mmx %a0, x86_mmx %a1)		%1 = call x86_mmx @llvm.x86.3dnow.pfsub(x86_mmx %a0, x86_mmx %a1)
%2 = load x86_mmx, x86_mmx *%a2, align 8		%2 = load x86_mmx, x86_mmx *%a2, align 8
%3 = call x86_mmx @llvm.x86.3dnow.pfsub(x86_mmx %1, x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnow.pfsub(x86_mmx %1, x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.3dnow.pfsub(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.3dnow.pfsub(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pfsubr(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pfsubr(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; CHECK-LABEL: test_pfsubr:		; CHECK-LABEL: test_pfsubr:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pfsubr %mm1, %mm0 # sched: [3:1.00]		; CHECK-NEXT: pfsubr %mm1, %mm0 # sched: [3:1.00]
; CHECK-NEXT: pfsubr (%rdi), %mm0 # sched: [7:1.00]		; CHECK-NEXT: pfsubr (%rdi), %mm0 # sched: [8:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = call x86_mmx @llvm.x86.3dnow.pfsubr(x86_mmx %a0, x86_mmx %a1)		%1 = call x86_mmx @llvm.x86.3dnow.pfsubr(x86_mmx %a0, x86_mmx %a1)
%2 = load x86_mmx, x86_mmx *%a2, align 8		%2 = load x86_mmx, x86_mmx *%a2, align 8
%3 = call x86_mmx @llvm.x86.3dnow.pfsubr(x86_mmx %1, x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnow.pfsubr(x86_mmx %1, x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.3dnow.pfsubr(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.3dnow.pfsubr(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pi2fd(x86_mmx* %a0) optsize {		define i64 @test_pi2fd(x86_mmx* %a0) optsize {
; CHECK-LABEL: test_pi2fd:		; CHECK-LABEL: test_pi2fd:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pi2fd (%rdi), %mm0 # sched: [8:1.00]		; CHECK-NEXT: pi2fd (%rdi), %mm0 # sched: [9:1.00]
; CHECK-NEXT: pi2fd %mm0, %mm0 # sched: [4:1.00]		; CHECK-NEXT: pi2fd %mm0, %mm0 # sched: [4:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = load x86_mmx, x86_mmx *%a0, align 8		%1 = load x86_mmx, x86_mmx *%a0, align 8
%2 = call x86_mmx @llvm.x86.3dnow.pi2fd(x86_mmx %1)		%2 = call x86_mmx @llvm.x86.3dnow.pi2fd(x86_mmx %1)
%3 = call x86_mmx @llvm.x86.3dnow.pi2fd(x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnow.pi2fd(x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.3dnow.pi2fd(x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.3dnow.pi2fd(x86_mmx) nounwind readnone

define i64 @test_pi2fw(x86_mmx* %a0) optsize {		define i64 @test_pi2fw(x86_mmx* %a0) optsize {
; CHECK-LABEL: test_pi2fw:		; CHECK-LABEL: test_pi2fw:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pi2fw (%rdi), %mm0 # sched: [8:1.00]		; CHECK-NEXT: pi2fw (%rdi), %mm0 # sched: [9:1.00]
; CHECK-NEXT: pi2fw %mm0, %mm0 # sched: [4:1.00]		; CHECK-NEXT: pi2fw %mm0, %mm0 # sched: [4:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = load x86_mmx, x86_mmx *%a0, align 8		%1 = load x86_mmx, x86_mmx *%a0, align 8
%2 = call x86_mmx @llvm.x86.3dnowa.pi2fw(x86_mmx %1)		%2 = call x86_mmx @llvm.x86.3dnowa.pi2fw(x86_mmx %1)
%3 = call x86_mmx @llvm.x86.3dnowa.pi2fw(x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnowa.pi2fw(x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.3dnowa.pi2fw(x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.3dnowa.pi2fw(x86_mmx) nounwind readnone

define i64 @test_pmulhrw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pmulhrw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; CHECK-LABEL: test_pmulhrw:		; CHECK-LABEL: test_pmulhrw:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pmulhrw %mm1, %mm0 # sched: [5:1.00]		; CHECK-NEXT: pmulhrw %mm1, %mm0 # sched: [5:1.00]
; CHECK-NEXT: pmulhrw (%rdi), %mm0 # sched: [9:1.00]		; CHECK-NEXT: pmulhrw (%rdi), %mm0 # sched: [10:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = call x86_mmx @llvm.x86.3dnow.pmulhrw(x86_mmx %a0, x86_mmx %a1)		%1 = call x86_mmx @llvm.x86.3dnow.pmulhrw(x86_mmx %a0, x86_mmx %a1)
%2 = load x86_mmx, x86_mmx *%a2, align 8		%2 = load x86_mmx, x86_mmx *%a2, align 8
%3 = call x86_mmx @llvm.x86.3dnow.pmulhrw(x86_mmx %1, x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnow.pmulhrw(x86_mmx %1, x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
Show All 19 Lines
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
tail call void asm sideeffect "prefetchw $0", "m"(i8 %a0) nounwind		tail call void asm sideeffect "prefetchw $0", "m"(i8 %a0) nounwind
ret void		ret void
}		}

define i64 @test_pswapd(x86_mmx* %a0) optsize {		define i64 @test_pswapd(x86_mmx* %a0) optsize {
; CHECK-LABEL: test_pswapd:		; CHECK-LABEL: test_pswapd:
; CHECK: # %bb.0:		; CHECK: # %bb.0:
; CHECK-NEXT: pswapd (%rdi), %mm0 # mm0 = mem[1,0] sched: [5:1.00]		; CHECK-NEXT: pswapd (%rdi), %mm0 # mm0 = mem[1,0] sched: [6:1.00]
; CHECK-NEXT: pswapd %mm0, %mm0 # mm0 = mm0[1,0] sched: [1:1.00]		; CHECK-NEXT: pswapd %mm0, %mm0 # mm0 = mm0[1,0] sched: [1:1.00]
; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]		; CHECK-NEXT: movq %mm0, %rax # sched: [1:0.33]
; CHECK-NEXT: retq # sched: [1:1.00]		; CHECK-NEXT: retq # sched: [1:1.00]
%1 = load x86_mmx, x86_mmx *%a0, align 8		%1 = load x86_mmx, x86_mmx *%a0, align 8
%2 = call x86_mmx @llvm.x86.3dnowa.pswapd(x86_mmx %1)		%2 = call x86_mmx @llvm.x86.3dnowa.pswapd(x86_mmx %1)
%3 = call x86_mmx @llvm.x86.3dnowa.pswapd(x86_mmx %2)		%3 = call x86_mmx @llvm.x86.3dnowa.pswapd(x86_mmx %2)
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.3dnowa.pswapd(x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.3dnowa.pswapd(x86_mmx) nounwind readnone

llvm/trunk/test/CodeGen/X86/adx-schedule.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=x86-64 -mattr=+adx \| FileCheck %s --check-prefix=CHECK --check-prefix=GENERIC		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=x86-64 -mattr=+adx \| FileCheck %s --check-prefix=CHECK --check-prefix=GENERIC
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=broadwell \| FileCheck %s --check-prefix=CHECK --check-prefix=BROADWELL		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=broadwell \| FileCheck %s --check-prefix=CHECK --check-prefix=BROADWELL
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=skylake \| FileCheck %s --check-prefix=CHECK --check-prefix=SKYLAKE --check-prefix=SKL		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=skylake \| FileCheck %s --check-prefix=CHECK --check-prefix=SKYLAKE --check-prefix=SKL
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=skx \| FileCheck %s --check-prefix=CHECK --check-prefix=SKYLAKE --check-prefix=SKX		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=skx \| FileCheck %s --check-prefix=CHECK --check-prefix=SKYLAKE --check-prefix=SKX
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=knl \| FileCheck %s --check-prefix=CHECK --check-prefix=KNL		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=knl \| FileCheck %s --check-prefix=CHECK --check-prefix=KNL
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=znver1 \| FileCheck %s --check-prefix=CHECK --check-prefix=ZNVER1		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=znver1 \| FileCheck %s --check-prefix=CHECK --check-prefix=ZNVER1

define void @test_adcx(i32 %a0, i32* %a1, i64 %a2, i64* %a3) optsize {		define void @test_adcx(i32 %a0, i32* %a1, i64 %a2, i64* %a3) optsize {
; GENERIC-LABEL: test_adcx:		; GENERIC-LABEL: test_adcx:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: adcxl %edi, %edi # sched: [1:0.33]		; GENERIC-NEXT: adcxl %edi, %edi # sched: [1:0.33]
; GENERIC-NEXT: adcxq %rdx, %rdx # sched: [1:0.33]		; GENERIC-NEXT: adcxq %rdx, %rdx # sched: [1:0.33]
; GENERIC-NEXT: adcxl (%rsi), %edi # sched: [5:0.50]		; GENERIC-NEXT: adcxl (%rsi), %edi # sched: [6:0.50]
; GENERIC-NEXT: adcxq (%rcx), %rdx # sched: [5:0.50]		; GENERIC-NEXT: adcxq (%rcx), %rdx # sched: [6:0.50]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BROADWELL-LABEL: test_adcx:		; BROADWELL-LABEL: test_adcx:
; BROADWELL: # %bb.0:		; BROADWELL: # %bb.0:
; BROADWELL-NEXT: #APP		; BROADWELL-NEXT: #APP
; BROADWELL-NEXT: adcxl %edi, %edi # sched: [1:0.50]		; BROADWELL-NEXT: adcxl %edi, %edi # sched: [1:0.50]
; BROADWELL-NEXT: adcxq %rdx, %rdx # sched: [1:0.50]		; BROADWELL-NEXT: adcxq %rdx, %rdx # sched: [1:0.50]
Show All 35 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret void		ret void
}		}
define void @test_adox(i32 %a0, i32* %a1, i64 %a2, i64* %a3) optsize {		define void @test_adox(i32 %a0, i32* %a1, i64 %a2, i64* %a3) optsize {
; GENERIC-LABEL: test_adox:		; GENERIC-LABEL: test_adox:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: adoxl %edi, %edi # sched: [1:0.33]		; GENERIC-NEXT: adoxl %edi, %edi # sched: [1:0.33]
; GENERIC-NEXT: adoxq %rdx, %rdx # sched: [1:0.33]		; GENERIC-NEXT: adoxq %rdx, %rdx # sched: [1:0.33]
; GENERIC-NEXT: adoxl (%rsi), %edi # sched: [5:0.50]		; GENERIC-NEXT: adoxl (%rsi), %edi # sched: [6:0.50]
; GENERIC-NEXT: adoxq (%rcx), %rdx # sched: [5:0.50]		; GENERIC-NEXT: adoxq (%rcx), %rdx # sched: [6:0.50]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BROADWELL-LABEL: test_adox:		; BROADWELL-LABEL: test_adox:
; BROADWELL: # %bb.0:		; BROADWELL: # %bb.0:
; BROADWELL-NEXT: #APP		; BROADWELL-NEXT: #APP
; BROADWELL-NEXT: adoxl %edi, %edi # sched: [1:0.50]		; BROADWELL-NEXT: adoxl %edi, %edi # sched: [1:0.50]
; BROADWELL-NEXT: adoxq %rdx, %rdx # sched: [1:0.50]		; BROADWELL-NEXT: adoxq %rdx, %rdx # sched: [1:0.50]
Show All 37 Lines

llvm/trunk/test/CodeGen/X86/avx-schedule.ll

Show First 20 Lines • Show All 1,601 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%3 = fdiv <8 x float> %1, %2		%3 = fdiv <8 x float> %1, %2
ret <8 x float> %3		ret <8 x float> %3
}		}

define <8 x float> @test_dpps(<8 x float> %a0, <8 x float> %a1, <8 x float> *%a2) {		define <8 x float> @test_dpps(<8 x float> %a0, <8 x float> %a1, <8 x float> *%a2) {
; GENERIC-LABEL: test_dpps:		; GENERIC-LABEL: test_dpps:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vdpps $7, %ymm1, %ymm0, %ymm0 # sched: [12:2.00]		; GENERIC-NEXT: vdpps $7, %ymm1, %ymm0, %ymm0 # sched: [12:2.00]
; GENERIC-NEXT: vdpps $7, (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vdpps $7, (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SANDY-LABEL: test_dpps:		; SANDY-LABEL: test_dpps:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: vdpps $7, %ymm1, %ymm0, %ymm0 # sched: [12:2.00]		; SANDY-NEXT: vdpps $7, %ymm1, %ymm0, %ymm0 # sched: [12:2.00]
; SANDY-NEXT: vdpps $7, (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; SANDY-NEXT: vdpps $7, (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_dpps:		; HASWELL-LABEL: test_dpps:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vdpps $7, %ymm1, %ymm0, %ymm0 # sched: [14:2.00]		; HASWELL-NEXT: vdpps $7, %ymm1, %ymm0, %ymm0 # sched: [14:2.00]
; HASWELL-NEXT: vdpps $7, (%rdi), %ymm0, %ymm0 # sched: [21:2.00]		; HASWELL-NEXT: vdpps $7, (%rdi), %ymm0, %ymm0 # sched: [21:2.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
▲ Show 20 Lines • Show All 3,805 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/avx2-schedule.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=x86-64 -mattr=+avx2 \| FileCheck %s --check-prefix=CHECK --check-prefix=GENERIC		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=x86-64 -mattr=+avx2 \| FileCheck %s --check-prefix=CHECK --check-prefix=GENERIC
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=haswell -mattr=-avx512f \| FileCheck %s --check-prefix=CHECK --check-prefix=HASWELL		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=haswell -mattr=-avx512f \| FileCheck %s --check-prefix=CHECK --check-prefix=HASWELL
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=broadwell -mattr=-avx512f \| FileCheck %s --check-prefix=CHECK --check-prefix=BROADWELL		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=broadwell -mattr=-avx512f \| FileCheck %s --check-prefix=CHECK --check-prefix=BROADWELL
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=skylake -mattr=-avx512f \| FileCheck %s --check-prefix=CHECK --check-prefix=SKYLAKE		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=skylake -mattr=-avx512f \| FileCheck %s --check-prefix=CHECK --check-prefix=SKYLAKE
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=skx -mattr=-avx512f \| FileCheck %s --check-prefix=CHECK --check-prefix=SKX		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=skx -mattr=-avx512f \| FileCheck %s --check-prefix=CHECK --check-prefix=SKX
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=znver1 -mattr=-avx512f \| FileCheck %s --check-prefix=CHECK --check-prefix=ZNVER1		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=znver1 -mattr=-avx512f \| FileCheck %s --check-prefix=CHECK --check-prefix=ZNVER1

define <8 x i32> @test_broadcasti128(<8 x i32> %a0, <4 x i32> *%a1) {		define <8 x i32> @test_broadcasti128(<8 x i32> %a0, <4 x i32> *%a1) {
; GENERIC-LABEL: test_broadcasti128:		; GENERIC-LABEL: test_broadcasti128:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vbroadcasti128 {{.*#+}} ymm1 = mem[0,1,0,1] sched: [5:1.00]		; GENERIC-NEXT: vbroadcasti128 {{.*#+}} ymm1 = mem[0,1,0,1] sched: [6:1.00]
; GENERIC-NEXT: vpaddd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_broadcasti128:		; HASWELL-LABEL: test_broadcasti128:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vbroadcasti128 {{.*#+}} ymm1 = mem[0,1,0,1] sched: [7:0.50]		; HASWELL-NEXT: vbroadcasti128 {{.*#+}} ymm1 = mem[0,1,0,1] sched: [7:0.50]
; HASWELL-NEXT: vpaddd %ymm0, %ymm1, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddd %ymm0, %ymm1, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
▲ Show 20 Lines • Show All 210 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = shufflevector <8 x i32> %2, <8 x i32> undef, <4 x i32> <i32 4, i32 5, i32 6, i32 7>		%4 = shufflevector <8 x i32> %2, <8 x i32> undef, <4 x i32> <i32 4, i32 5, i32 6, i32 7>
store <4 x i32> %3, <4 x i32> *%a2		store <4 x i32> %3, <4 x i32> *%a2
ret <4 x i32> %4		ret <4 x i32> %4
}		}

define <2 x double> @test_gatherdpd(<2 x double> %a0, i8* %a1, <4 x i32> %a2, <2 x double> %a3) {		define <2 x double> @test_gatherdpd(<2 x double> %a0, i8* %a1, <4 x i32> %a2, <2 x double> %a3) {
; GENERIC-LABEL: test_gatherdpd:		; GENERIC-LABEL: test_gatherdpd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vgatherdpd %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [4:0.50]		; GENERIC-NEXT: vgatherdpd %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [5:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_gatherdpd:		; HASWELL-LABEL: test_gatherdpd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vgatherdpd %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [26:2.67]		; HASWELL-NEXT: vgatherdpd %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [26:2.67]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
; BROADWELL-LABEL: test_gatherdpd:		; BROADWELL-LABEL: test_gatherdpd:
Show All 18 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%1 = call <2 x double> @llvm.x86.avx2.gather.d.pd(<2 x double> %a0, i8* %a1, <4 x i32> %a2, <2 x double> %a3, i8 2)		%1 = call <2 x double> @llvm.x86.avx2.gather.d.pd(<2 x double> %a0, i8* %a1, <4 x i32> %a2, <2 x double> %a3, i8 2)
ret <2 x double> %1		ret <2 x double> %1
}		}
declare <2 x double> @llvm.x86.avx2.gather.d.pd(<2 x double>, i8*, <4 x i32>, <2 x double>, i8) nounwind readonly		declare <2 x double> @llvm.x86.avx2.gather.d.pd(<2 x double>, i8*, <4 x i32>, <2 x double>, i8) nounwind readonly

define <4 x double> @test_gatherdpd_ymm(<4 x double> %a0, i8* %a1, <4 x i32> %a2, <4 x double> %a3) {		define <4 x double> @test_gatherdpd_ymm(<4 x double> %a0, i8* %a1, <4 x i32> %a2, <4 x double> %a3) {
; GENERIC-LABEL: test_gatherdpd_ymm:		; GENERIC-LABEL: test_gatherdpd_ymm:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vgatherdpd %ymm2, (%rdi,%xmm1,8), %ymm0 # sched: [4:0.50]		; GENERIC-NEXT: vgatherdpd %ymm2, (%rdi,%xmm1,8), %ymm0 # sched: [5:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_gatherdpd_ymm:		; HASWELL-LABEL: test_gatherdpd_ymm:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vgatherdpd %ymm2, (%rdi,%xmm1,8), %ymm0 # sched: [27:4.00]		; HASWELL-NEXT: vgatherdpd %ymm2, (%rdi,%xmm1,8), %ymm0 # sched: [27:4.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
; BROADWELL-LABEL: test_gatherdpd_ymm:		; BROADWELL-LABEL: test_gatherdpd_ymm:
Show All 18 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%1 = call <4 x double> @llvm.x86.avx2.gather.d.pd.256(<4 x double> %a0, i8* %a1, <4 x i32> %a2, <4 x double> %a3, i8 8)		%1 = call <4 x double> @llvm.x86.avx2.gather.d.pd.256(<4 x double> %a0, i8* %a1, <4 x i32> %a2, <4 x double> %a3, i8 8)
ret <4 x double> %1		ret <4 x double> %1
}		}
declare <4 x double> @llvm.x86.avx2.gather.d.pd.256(<4 x double>, i8*, <4 x i32>, <4 x double>, i8) nounwind readonly		declare <4 x double> @llvm.x86.avx2.gather.d.pd.256(<4 x double>, i8*, <4 x i32>, <4 x double>, i8) nounwind readonly

define <4 x float> @test_gatherdps(<4 x float> %a0, i8* %a1, <4 x i32> %a2, <4 x float> %a3) {		define <4 x float> @test_gatherdps(<4 x float> %a0, i8* %a1, <4 x i32> %a2, <4 x float> %a3) {
; GENERIC-LABEL: test_gatherdps:		; GENERIC-LABEL: test_gatherdps:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vgatherdps %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [4:0.50]		; GENERIC-NEXT: vgatherdps %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [5:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_gatherdps:		; HASWELL-LABEL: test_gatherdps:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vgatherdps %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [25:3.67]		; HASWELL-NEXT: vgatherdps %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [25:3.67]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
; BROADWELL-LABEL: test_gatherdps:		; BROADWELL-LABEL: test_gatherdps:
Show All 18 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%1 = call <4 x float> @llvm.x86.avx2.gather.d.ps(<4 x float> %a0, i8* %a1, <4 x i32> %a2, <4 x float> %a3, i8 2)		%1 = call <4 x float> @llvm.x86.avx2.gather.d.ps(<4 x float> %a0, i8* %a1, <4 x i32> %a2, <4 x float> %a3, i8 2)
ret <4 x float> %1		ret <4 x float> %1
}		}
declare <4 x float> @llvm.x86.avx2.gather.d.ps(<4 x float>, i8*, <4 x i32>, <4 x float>, i8) nounwind readonly		declare <4 x float> @llvm.x86.avx2.gather.d.ps(<4 x float>, i8*, <4 x i32>, <4 x float>, i8) nounwind readonly

define <8 x float> @test_gatherdps_ymm(<8 x float> %a0, i8* %a1, <8 x i32> %a2, <8 x float> %a3) {		define <8 x float> @test_gatherdps_ymm(<8 x float> %a0, i8* %a1, <8 x i32> %a2, <8 x float> %a3) {
; GENERIC-LABEL: test_gatherdps_ymm:		; GENERIC-LABEL: test_gatherdps_ymm:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vgatherdps %ymm2, (%rdi,%ymm1,4), %ymm0 # sched: [4:0.50]		; GENERIC-NEXT: vgatherdps %ymm2, (%rdi,%ymm1,4), %ymm0 # sched: [5:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_gatherdps_ymm:		; HASWELL-LABEL: test_gatherdps_ymm:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vgatherdps %ymm2, (%rdi,%ymm1,4), %ymm0 # sched: [27:6.50]		; HASWELL-NEXT: vgatherdps %ymm2, (%rdi,%ymm1,4), %ymm0 # sched: [27:6.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
; BROADWELL-LABEL: test_gatherdps_ymm:		; BROADWELL-LABEL: test_gatherdps_ymm:
Show All 18 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%1 = call <8 x float> @llvm.x86.avx2.gather.d.ps.256(<8 x float> %a0, i8* %a1, <8 x i32> %a2, <8 x float> %a3, i8 4)		%1 = call <8 x float> @llvm.x86.avx2.gather.d.ps.256(<8 x float> %a0, i8* %a1, <8 x i32> %a2, <8 x float> %a3, i8 4)
ret <8 x float> %1		ret <8 x float> %1
}		}
declare <8 x float> @llvm.x86.avx2.gather.d.ps.256(<8 x float>, i8*, <8 x i32>, <8 x float>, i8) nounwind readonly		declare <8 x float> @llvm.x86.avx2.gather.d.ps.256(<8 x float>, i8*, <8 x i32>, <8 x float>, i8) nounwind readonly

define <2 x double> @test_gatherqpd(<2 x double> %a0, i8* %a1, <2 x i64> %a2, <2 x double> %a3) {		define <2 x double> @test_gatherqpd(<2 x double> %a0, i8* %a1, <2 x i64> %a2, <2 x double> %a3) {
; GENERIC-LABEL: test_gatherqpd:		; GENERIC-LABEL: test_gatherqpd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vgatherqpd %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [4:0.50]		; GENERIC-NEXT: vgatherqpd %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [5:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_gatherqpd:		; HASWELL-LABEL: test_gatherqpd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vgatherqpd %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [23:3.33]		; HASWELL-NEXT: vgatherqpd %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [23:3.33]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
; BROADWELL-LABEL: test_gatherqpd:		; BROADWELL-LABEL: test_gatherqpd:
Show All 18 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%1 = call <2 x double> @llvm.x86.avx2.gather.q.pd(<2 x double> %a0, i8* %a1, <2 x i64> %a2, <2 x double> %a3, i8 2)		%1 = call <2 x double> @llvm.x86.avx2.gather.q.pd(<2 x double> %a0, i8* %a1, <2 x i64> %a2, <2 x double> %a3, i8 2)
ret <2 x double> %1		ret <2 x double> %1
}		}
declare <2 x double> @llvm.x86.avx2.gather.q.pd(<2 x double>, i8*, <2 x i64>, <2 x double>, i8) nounwind readonly		declare <2 x double> @llvm.x86.avx2.gather.q.pd(<2 x double>, i8*, <2 x i64>, <2 x double>, i8) nounwind readonly

define <4 x double> @test_gatherqpd_ymm(<4 x double> %a0, i8* %a1, <4 x i64> %a2, <4 x double> %a3) {		define <4 x double> @test_gatherqpd_ymm(<4 x double> %a0, i8* %a1, <4 x i64> %a2, <4 x double> %a3) {
; GENERIC-LABEL: test_gatherqpd_ymm:		; GENERIC-LABEL: test_gatherqpd_ymm:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vgatherqpd %ymm2, (%rdi,%ymm1,8), %ymm0 # sched: [4:0.50]		; GENERIC-NEXT: vgatherqpd %ymm2, (%rdi,%ymm1,8), %ymm0 # sched: [5:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_gatherqpd_ymm:		; HASWELL-LABEL: test_gatherqpd_ymm:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vgatherqpd %ymm2, (%rdi,%ymm1,8), %ymm0 # sched: [24:5.00]		; HASWELL-NEXT: vgatherqpd %ymm2, (%rdi,%ymm1,8), %ymm0 # sched: [24:5.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
; BROADWELL-LABEL: test_gatherqpd_ymm:		; BROADWELL-LABEL: test_gatherqpd_ymm:
Show All 18 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%1 = call <4 x double> @llvm.x86.avx2.gather.q.pd.256(<4 x double> %a0, i8* %a1, <4 x i64> %a2, <4 x double> %a3, i8 8)		%1 = call <4 x double> @llvm.x86.avx2.gather.q.pd.256(<4 x double> %a0, i8* %a1, <4 x i64> %a2, <4 x double> %a3, i8 8)
ret <4 x double> %1		ret <4 x double> %1
}		}
declare <4 x double> @llvm.x86.avx2.gather.q.pd.256(<4 x double>, i8*, <4 x i64>, <4 x double>, i8) nounwind readonly		declare <4 x double> @llvm.x86.avx2.gather.q.pd.256(<4 x double>, i8*, <4 x i64>, <4 x double>, i8) nounwind readonly

define <4 x float> @test_gatherqps(<4 x float> %a0, i8* %a1, <2 x i64> %a2, <4 x float> %a3) {		define <4 x float> @test_gatherqps(<4 x float> %a0, i8* %a1, <2 x i64> %a2, <4 x float> %a3) {
; GENERIC-LABEL: test_gatherqps:		; GENERIC-LABEL: test_gatherqps:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vgatherqps %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [4:0.50]		; GENERIC-NEXT: vgatherqps %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [5:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_gatherqps:		; HASWELL-LABEL: test_gatherqps:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vgatherqps %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [25:3.67]		; HASWELL-NEXT: vgatherqps %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [25:3.67]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
; BROADWELL-LABEL: test_gatherqps:		; BROADWELL-LABEL: test_gatherqps:
Show All 18 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%1 = call <4 x float> @llvm.x86.avx2.gather.q.ps(<4 x float> %a0, i8* %a1, <2 x i64> %a2, <4 x float> %a3, i8 2)		%1 = call <4 x float> @llvm.x86.avx2.gather.q.ps(<4 x float> %a0, i8* %a1, <2 x i64> %a2, <4 x float> %a3, i8 2)
ret <4 x float> %1		ret <4 x float> %1
}		}
declare <4 x float> @llvm.x86.avx2.gather.q.ps(<4 x float>, i8*, <2 x i64>, <4 x float>, i8) nounwind readonly		declare <4 x float> @llvm.x86.avx2.gather.q.ps(<4 x float>, i8*, <2 x i64>, <4 x float>, i8) nounwind readonly

define <4 x float> @test_gatherqps_ymm(<4 x float> %a0, i8* %a1, <4 x i64> %a2, <4 x float> %a3) {		define <4 x float> @test_gatherqps_ymm(<4 x float> %a0, i8* %a1, <4 x i64> %a2, <4 x float> %a3) {
; GENERIC-LABEL: test_gatherqps_ymm:		; GENERIC-LABEL: test_gatherqps_ymm:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vgatherqps %xmm2, (%rdi,%ymm1,4), %xmm0 # sched: [4:0.50]		; GENERIC-NEXT: vgatherqps %xmm2, (%rdi,%ymm1,4), %xmm0 # sched: [5:0.50]
; GENERIC-NEXT: vzeroupper # sched: [100:0.33]		; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_gatherqps_ymm:		; HASWELL-LABEL: test_gatherqps_ymm:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vgatherqps %xmm2, (%rdi,%ymm1,4), %xmm0 # sched: [28:3.67]		; HASWELL-NEXT: vgatherqps %xmm2, (%rdi,%ymm1,4), %xmm0 # sched: [28:3.67]
; HASWELL-NEXT: vzeroupper # sched: [4:1.00]		; HASWELL-NEXT: vzeroupper # sched: [4:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
Show All 25 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <4 x float> %1		ret <4 x float> %1
}		}
declare <4 x float> @llvm.x86.avx2.gather.q.ps.256(<4 x float>, i8*, <4 x i64>, <4 x float>, i8) nounwind readonly		declare <4 x float> @llvm.x86.avx2.gather.q.ps.256(<4 x float>, i8*, <4 x i64>, <4 x float>, i8) nounwind readonly

define <8 x i32> @test_inserti128(<8 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {		define <8 x i32> @test_inserti128(<8 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {
; GENERIC-LABEL: test_inserti128:		; GENERIC-LABEL: test_inserti128:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vinserti128 $1, %xmm1, %ymm0, %ymm1 # sched: [1:1.00]		; GENERIC-NEXT: vinserti128 $1, %xmm1, %ymm0, %ymm1 # sched: [1:1.00]
; GENERIC-NEXT: vinserti128 $1, (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vinserti128 $1, (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: vpaddd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_inserti128:		; HASWELL-LABEL: test_inserti128:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vinserti128 $1, %xmm1, %ymm0, %ymm1 # sched: [3:1.00]		; HASWELL-NEXT: vinserti128 $1, %xmm1, %ymm0, %ymm1 # sched: [3:1.00]
; HASWELL-NEXT: vinserti128 $1, (%rdi), %ymm0, %ymm0 # sched: [7:0.50]		; HASWELL-NEXT: vinserti128 $1, (%rdi), %ymm0, %ymm0 # sched: [7:0.50]
; HASWELL-NEXT: vpaddd %ymm0, %ymm1, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddd %ymm0, %ymm1, %ymm0 # sched: [1:0.50]
▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <4 x i64> %1		ret <4 x i64> %1
}		}
declare <4 x i64> @llvm.x86.avx2.movntdqa(i8*) nounwind readonly		declare <4 x i64> @llvm.x86.avx2.movntdqa(i8*) nounwind readonly

define <16 x i16> @test_mpsadbw(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {		define <16 x i16> @test_mpsadbw(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {
; GENERIC-LABEL: test_mpsadbw:		; GENERIC-LABEL: test_mpsadbw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmpsadbw $7, %ymm1, %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vmpsadbw $7, %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
; GENERIC-NEXT: vmpsadbw $7, (%rdi), %ymm0, %ymm0 # sched: [9:1.00]		; GENERIC-NEXT: vmpsadbw $7, (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_mpsadbw:		; HASWELL-LABEL: test_mpsadbw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vmpsadbw $7, %ymm1, %ymm0, %ymm0 # sched: [7:2.00]		; HASWELL-NEXT: vmpsadbw $7, %ymm1, %ymm0, %ymm0 # sched: [7:2.00]
; HASWELL-NEXT: vmpsadbw $7, (%rdi), %ymm0, %ymm0 # sched: [14:2.00]		; HASWELL-NEXT: vmpsadbw $7, (%rdi), %ymm0, %ymm0 # sched: [14:2.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 27 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <16 x i16> %4		ret <16 x i16> %4
}		}
declare <16 x i16> @llvm.x86.avx2.mpsadbw(<32 x i8>, <32 x i8>, i8) nounwind readnone		declare <16 x i16> @llvm.x86.avx2.mpsadbw(<32 x i8>, <32 x i8>, i8) nounwind readnone

define <32 x i8> @test_pabsb(<32 x i8> %a0, <32 x i8> *%a1) {		define <32 x i8> @test_pabsb(<32 x i8> %a0, <32 x i8> *%a1) {
; GENERIC-LABEL: test_pabsb:		; GENERIC-LABEL: test_pabsb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpabsb %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpabsb %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpabsb (%rdi), %ymm1 # sched: [7:1.00]		; GENERIC-NEXT: vpabsb (%rdi), %ymm1 # sched: [8:1.00]
; GENERIC-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pabsb:		; HASWELL-LABEL: test_pabsb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpabsb %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpabsb %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpabsb (%rdi), %ymm1 # sched: [8:0.50]		; HASWELL-NEXT: vpabsb (%rdi), %ymm1 # sched: [8:0.50]
; HASWELL-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]		; HASWELL-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]
Show All 33 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <32 x i8> %4		ret <32 x i8> %4
}		}
declare <32 x i8> @llvm.x86.avx2.pabs.b(<32 x i8>) nounwind readnone		declare <32 x i8> @llvm.x86.avx2.pabs.b(<32 x i8>) nounwind readnone

define <8 x i32> @test_pabsd(<8 x i32> %a0, <8 x i32> *%a1) {		define <8 x i32> @test_pabsd(<8 x i32> %a0, <8 x i32> *%a1) {
; GENERIC-LABEL: test_pabsd:		; GENERIC-LABEL: test_pabsd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpabsd %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpabsd %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpabsd (%rdi), %ymm1 # sched: [7:1.00]		; GENERIC-NEXT: vpabsd (%rdi), %ymm1 # sched: [8:1.00]
; GENERIC-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pabsd:		; HASWELL-LABEL: test_pabsd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpabsd %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpabsd %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpabsd (%rdi), %ymm1 # sched: [8:0.50]		; HASWELL-NEXT: vpabsd (%rdi), %ymm1 # sched: [8:0.50]
; HASWELL-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]		; HASWELL-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]
Show All 33 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <8 x i32> %4		ret <8 x i32> %4
}		}
declare <8 x i32> @llvm.x86.avx2.pabs.d(<8 x i32>) nounwind readnone		declare <8 x i32> @llvm.x86.avx2.pabs.d(<8 x i32>) nounwind readnone

define <16 x i16> @test_pabsw(<16 x i16> %a0, <16 x i16> *%a1) {		define <16 x i16> @test_pabsw(<16 x i16> %a0, <16 x i16> *%a1) {
; GENERIC-LABEL: test_pabsw:		; GENERIC-LABEL: test_pabsw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpabsw %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpabsw %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpabsw (%rdi), %ymm1 # sched: [7:1.00]		; GENERIC-NEXT: vpabsw (%rdi), %ymm1 # sched: [8:1.00]
; GENERIC-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pabsw:		; HASWELL-LABEL: test_pabsw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpabsw %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpabsw %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpabsw (%rdi), %ymm1 # sched: [8:0.50]		; HASWELL-NEXT: vpabsw (%rdi), %ymm1 # sched: [8:0.50]
; HASWELL-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]		; HASWELL-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]
Show All 33 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <16 x i16> %4		ret <16 x i16> %4
}		}
declare <16 x i16> @llvm.x86.avx2.pabs.w(<16 x i16>) nounwind readnone		declare <16 x i16> @llvm.x86.avx2.pabs.w(<16 x i16>) nounwind readnone

define <16 x i16> @test_packssdw(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {		define <16 x i16> @test_packssdw(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
; GENERIC-LABEL: test_packssdw:		; GENERIC-LABEL: test_packssdw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpackssdw %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpackssdw %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpackssdw (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpackssdw (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_packssdw:		; HASWELL-LABEL: test_packssdw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpackssdw %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; HASWELL-NEXT: vpackssdw %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; HASWELL-NEXT: vpackssdw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]		; HASWELL-NEXT: vpackssdw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 27 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <16 x i16> %4		ret <16 x i16> %4
}		}
declare <16 x i16> @llvm.x86.avx2.packssdw(<8 x i32>, <8 x i32>) nounwind readnone		declare <16 x i16> @llvm.x86.avx2.packssdw(<8 x i32>, <8 x i32>) nounwind readnone

define <32 x i8> @test_packsswb(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <32 x i8> @test_packsswb(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_packsswb:		; GENERIC-LABEL: test_packsswb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpacksswb %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpacksswb %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpacksswb (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpacksswb (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_packsswb:		; HASWELL-LABEL: test_packsswb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpacksswb %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; HASWELL-NEXT: vpacksswb %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; HASWELL-NEXT: vpacksswb (%rdi), %ymm0, %ymm0 # sched: [8:1.00]		; HASWELL-NEXT: vpacksswb (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 27 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <32 x i8> %4		ret <32 x i8> %4
}		}
declare <32 x i8> @llvm.x86.avx2.packsswb(<16 x i16>, <16 x i16>) nounwind readnone		declare <32 x i8> @llvm.x86.avx2.packsswb(<16 x i16>, <16 x i16>) nounwind readnone

define <16 x i16> @test_packusdw(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {		define <16 x i16> @test_packusdw(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
; GENERIC-LABEL: test_packusdw:		; GENERIC-LABEL: test_packusdw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpackusdw %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpackusdw %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpackusdw (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpackusdw (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_packusdw:		; HASWELL-LABEL: test_packusdw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpackusdw %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; HASWELL-NEXT: vpackusdw %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; HASWELL-NEXT: vpackusdw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]		; HASWELL-NEXT: vpackusdw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 27 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <16 x i16> %4		ret <16 x i16> %4
}		}
declare <16 x i16> @llvm.x86.avx2.packusdw(<8 x i32>, <8 x i32>) nounwind readnone		declare <16 x i16> @llvm.x86.avx2.packusdw(<8 x i32>, <8 x i32>) nounwind readnone

define <32 x i8> @test_packuswb(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <32 x i8> @test_packuswb(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_packuswb:		; GENERIC-LABEL: test_packuswb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpackuswb %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpackuswb %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpackuswb (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpackuswb (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_packuswb:		; HASWELL-LABEL: test_packuswb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpackuswb %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; HASWELL-NEXT: vpackuswb %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; HASWELL-NEXT: vpackuswb (%rdi), %ymm0, %ymm0 # sched: [8:1.00]		; HASWELL-NEXT: vpackuswb (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 27 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <32 x i8> %4		ret <32 x i8> %4
}		}
declare <32 x i8> @llvm.x86.avx2.packuswb(<16 x i16>, <16 x i16>) nounwind readnone		declare <32 x i8> @llvm.x86.avx2.packuswb(<16 x i16>, <16 x i16>) nounwind readnone

define <32 x i8> @test_paddb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {		define <32 x i8> @test_paddb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {
; GENERIC-LABEL: test_paddb:		; GENERIC-LABEL: test_paddb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpaddb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpaddb (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpaddb (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_paddb:		; HASWELL-LABEL: test_paddb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpaddb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpaddb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpaddb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 25 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%3 = add <32 x i8> %1, %2		%3 = add <32 x i8> %1, %2
ret <32 x i8> %3		ret <32 x i8> %3
}		}

define <8 x i32> @test_paddd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {		define <8 x i32> @test_paddd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
; GENERIC-LABEL: test_paddd:		; GENERIC-LABEL: test_paddd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpaddd (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpaddd (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_paddd:		; HASWELL-LABEL: test_paddd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpaddd (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpaddd (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 25 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%3 = add <8 x i32> %1, %2		%3 = add <8 x i32> %1, %2
ret <8 x i32> %3		ret <8 x i32> %3
}		}

define <4 x i64> @test_paddq(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {		define <4 x i64> @test_paddq(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {
; GENERIC-LABEL: test_paddq:		; GENERIC-LABEL: test_paddq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpaddq (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpaddq (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_paddq:		; HASWELL-LABEL: test_paddq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpaddq (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpaddq (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 25 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%3 = add <4 x i64> %1, %2		%3 = add <4 x i64> %1, %2
ret <4 x i64> %3		ret <4 x i64> %3
}		}

define <32 x i8> @test_paddsb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {		define <32 x i8> @test_paddsb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {
; GENERIC-LABEL: test_paddsb:		; GENERIC-LABEL: test_paddsb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpaddsb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddsb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpaddsb (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpaddsb (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_paddsb:		; HASWELL-LABEL: test_paddsb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpaddsb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddsb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpaddsb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpaddsb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <32 x i8> %3		ret <32 x i8> %3
}		}
declare <32 x i8> @llvm.x86.avx2.padds.b(<32 x i8>, <32 x i8>) nounwind readnone		declare <32 x i8> @llvm.x86.avx2.padds.b(<32 x i8>, <32 x i8>) nounwind readnone

define <16 x i16> @test_paddsw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_paddsw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_paddsw:		; GENERIC-LABEL: test_paddsw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpaddsw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddsw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpaddsw (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpaddsw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_paddsw:		; HASWELL-LABEL: test_paddsw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpaddsw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddsw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpaddsw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpaddsw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <16 x i16> %3		ret <16 x i16> %3
}		}
declare <16 x i16> @llvm.x86.avx2.padds.w(<16 x i16>, <16 x i16>) nounwind readnone		declare <16 x i16> @llvm.x86.avx2.padds.w(<16 x i16>, <16 x i16>) nounwind readnone

define <32 x i8> @test_paddusb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {		define <32 x i8> @test_paddusb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {
; GENERIC-LABEL: test_paddusb:		; GENERIC-LABEL: test_paddusb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpaddusb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddusb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpaddusb (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpaddusb (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_paddusb:		; HASWELL-LABEL: test_paddusb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpaddusb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddusb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpaddusb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpaddusb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <32 x i8> %3		ret <32 x i8> %3
}		}
declare <32 x i8> @llvm.x86.avx2.paddus.b(<32 x i8>, <32 x i8>) nounwind readnone		declare <32 x i8> @llvm.x86.avx2.paddus.b(<32 x i8>, <32 x i8>) nounwind readnone

define <16 x i16> @test_paddusw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_paddusw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_paddusw:		; GENERIC-LABEL: test_paddusw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpaddusw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddusw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpaddusw (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpaddusw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_paddusw:		; HASWELL-LABEL: test_paddusw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpaddusw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddusw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpaddusw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpaddusw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <16 x i16> %3		ret <16 x i16> %3
}		}
declare <16 x i16> @llvm.x86.avx2.paddus.w(<16 x i16>, <16 x i16>) nounwind readnone		declare <16 x i16> @llvm.x86.avx2.paddus.w(<16 x i16>, <16 x i16>) nounwind readnone

define <16 x i16> @test_paddw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_paddw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_paddw:		; GENERIC-LABEL: test_paddw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpaddw (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpaddw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_paddw:		; HASWELL-LABEL: test_paddw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpaddw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpaddw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
▲ Show 20 Lines • Show All 74 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <32 x i8> %1, %3		%4 = add <32 x i8> %1, %3
ret <32 x i8> %4		ret <32 x i8> %4
}		}

define <4 x i64> @test_pand(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {		define <4 x i64> @test_pand(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {
; GENERIC-LABEL: test_pand:		; GENERIC-LABEL: test_pand:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpand %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpand %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpand (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpand (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pand:		; HASWELL-LABEL: test_pand:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpand %ymm1, %ymm0, %ymm0 # sched: [1:0.33]		; HASWELL-NEXT: vpand %ymm1, %ymm0, %ymm0 # sched: [1:0.33]
; HASWELL-NEXT: vpand (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpand (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <4 x i64> %3, %a1		%4 = add <4 x i64> %3, %a1
ret <4 x i64> %4		ret <4 x i64> %4
}		}

define <4 x i64> @test_pandn(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {		define <4 x i64> @test_pandn(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {
; GENERIC-LABEL: test_pandn:		; GENERIC-LABEL: test_pandn:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpandn %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpandn %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpandn (%rdi), %ymm0, %ymm1 # sched: [5:1.00]		; GENERIC-NEXT: vpandn (%rdi), %ymm0, %ymm1 # sched: [6:1.00]
; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pandn:		; HASWELL-LABEL: test_pandn:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpandn %ymm1, %ymm0, %ymm0 # sched: [1:0.33]		; HASWELL-NEXT: vpandn %ymm1, %ymm0, %ymm0 # sched: [1:0.33]
; HASWELL-NEXT: vpandn (%rdi), %ymm0, %ymm1 # sched: [8:0.50]		; HASWELL-NEXT: vpandn (%rdi), %ymm0, %ymm1 # sched: [8:0.50]
; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 34 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%6 = add <4 x i64> %2, %5		%6 = add <4 x i64> %2, %5
ret <4 x i64> %6		ret <4 x i64> %6
}		}

define <32 x i8> @test_pavgb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {		define <32 x i8> @test_pavgb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {
; GENERIC-LABEL: test_pavgb:		; GENERIC-LABEL: test_pavgb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpavgb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpavgb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpavgb (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpavgb (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pavgb:		; HASWELL-LABEL: test_pavgb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpavgb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpavgb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpavgb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpavgb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 35 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%13 = trunc <32 x i16> %12 to <32 x i8>		%13 = trunc <32 x i16> %12 to <32 x i8>
ret <32 x i8> %13		ret <32 x i8> %13
}		}

define <16 x i16> @test_pavgw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_pavgw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_pavgw:		; GENERIC-LABEL: test_pavgw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpavgw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpavgw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpavgw (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpavgw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pavgw:		; HASWELL-LABEL: test_pavgw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpavgw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpavgw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpavgw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpavgw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 35 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%13 = trunc <16 x i32> %12 to <16 x i16>		%13 = trunc <16 x i32> %12 to <16 x i16>
ret <16 x i16> %13		ret <16 x i16> %13
}		}

define <4 x i32> @test_pblendd(<4 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {		define <4 x i32> @test_pblendd(<4 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {
; GENERIC-LABEL: test_pblendd:		; GENERIC-LABEL: test_pblendd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpblendd {{.*#+}} xmm0 = xmm1[0,1,2],xmm0[3] sched: [1:0.50]		; GENERIC-NEXT: vpblendd {{.*#+}} xmm0 = xmm1[0,1,2],xmm0[3] sched: [1:0.50]
; GENERIC-NEXT: vpblendd {{.*#+}} xmm1 = mem[0],xmm1[1],mem[2],xmm1[3] sched: [5:0.50]		; GENERIC-NEXT: vpblendd {{.*#+}} xmm1 = mem[0],xmm1[1],mem[2],xmm1[3] sched: [6:0.50]
; GENERIC-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pblendd:		; HASWELL-LABEL: test_pblendd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpblendd {{.*#+}} xmm0 = xmm1[0,1,2],xmm0[3] sched: [1:0.33]		; HASWELL-NEXT: vpblendd {{.*#+}} xmm0 = xmm1[0,1,2],xmm0[3] sched: [1:0.33]
; HASWELL-NEXT: vpblendd {{.*#+}} xmm1 = mem[0],xmm1[1],mem[2],xmm1[3] sched: [7:0.50]		; HASWELL-NEXT: vpblendd {{.*#+}} xmm1 = mem[0],xmm1[1],mem[2],xmm1[3] sched: [7:0.50]
; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <4 x i32> %1, %3		%4 = add <4 x i32> %1, %3
ret <4 x i32> %4		ret <4 x i32> %4
}		}

define <8 x i32> @test_pblendd_ymm(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {		define <8 x i32> @test_pblendd_ymm(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
; GENERIC-LABEL: test_pblendd_ymm:		; GENERIC-LABEL: test_pblendd_ymm:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpblendd {{.*#+}} ymm0 = ymm1[0,1,2],ymm0[3,4,5,6],ymm1[7] sched: [1:0.50]		; GENERIC-NEXT: vpblendd {{.*#+}} ymm0 = ymm1[0,1,2],ymm0[3,4,5,6],ymm1[7] sched: [1:0.50]
; GENERIC-NEXT: vpblendd {{.*#+}} ymm1 = ymm1[0],mem[1,2],ymm1[3,4,5,6,7] sched: [5:0.50]		; GENERIC-NEXT: vpblendd {{.*#+}} ymm1 = ymm1[0],mem[1,2],ymm1[3,4,5,6,7] sched: [6:0.50]
; GENERIC-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pblendd_ymm:		; HASWELL-LABEL: test_pblendd_ymm:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpblendd {{.*#+}} ymm0 = ymm1[0,1,2],ymm0[3,4,5,6],ymm1[7] sched: [1:0.33]		; HASWELL-NEXT: vpblendd {{.*#+}} ymm0 = ymm1[0,1,2],ymm0[3,4,5,6],ymm1[7] sched: [1:0.33]
; HASWELL-NEXT: vpblendd {{.*#+}} ymm1 = ymm1[0],mem[1,2],ymm1[3,4,5,6,7] sched: [8:0.50]		; HASWELL-NEXT: vpblendd {{.*#+}} ymm1 = ymm1[0],mem[1,2],ymm1[3,4,5,6,7] sched: [8:0.50]
; HASWELL-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <8 x i32> %1, %3		%4 = add <8 x i32> %1, %3
ret <8 x i32> %4		ret <8 x i32> %4
}		}

define <32 x i8> @test_pblendvb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> %a2, <32 x i8> *%a3, <32 x i8> %a4) {		define <32 x i8> @test_pblendvb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> %a2, <32 x i8> *%a3, <32 x i8> %a4) {
; GENERIC-LABEL: test_pblendvb:		; GENERIC-LABEL: test_pblendvb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpblendvb %ymm2, %ymm1, %ymm0, %ymm0 # sched: [2:1.00]		; GENERIC-NEXT: vpblendvb %ymm2, %ymm1, %ymm0, %ymm0 # sched: [2:1.00]
; GENERIC-NEXT: vpblendvb %ymm3, (%rdi), %ymm0, %ymm0 # sched: [6:1.00]		; GENERIC-NEXT: vpblendvb %ymm3, (%rdi), %ymm0, %ymm0 # sched: [7:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pblendvb:		; HASWELL-LABEL: test_pblendvb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpblendvb %ymm2, %ymm1, %ymm0, %ymm0 # sched: [2:2.00]		; HASWELL-NEXT: vpblendvb %ymm2, %ymm1, %ymm0, %ymm0 # sched: [2:2.00]
; HASWELL-NEXT: vpblendvb %ymm3, (%rdi), %ymm0, %ymm0 # sched: [9:2.00]		; HASWELL-NEXT: vpblendvb %ymm3, (%rdi), %ymm0, %ymm0 # sched: [9:2.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <32 x i8> %3		ret <32 x i8> %3
}		}
declare <32 x i8> @llvm.x86.avx2.pblendvb(<32 x i8>, <32 x i8>, <32 x i8>) nounwind readnone		declare <32 x i8> @llvm.x86.avx2.pblendvb(<32 x i8>, <32 x i8>, <32 x i8>) nounwind readnone

define <16 x i16> @test_pblendw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_pblendw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_pblendw:		; GENERIC-LABEL: test_pblendw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpblendw {{.*#+}} ymm0 = ymm0[0,1],ymm1[2,3,4],ymm0[5,6,7,8,9],ymm1[10,11,12],ymm0[13,14,15] sched: [1:0.50]		; GENERIC-NEXT: vpblendw {{.*#+}} ymm0 = ymm0[0,1],ymm1[2,3,4],ymm0[5,6,7,8,9],ymm1[10,11,12],ymm0[13,14,15] sched: [1:0.50]
; GENERIC-NEXT: vpblendw {{.*#+}} ymm1 = mem[0],ymm1[1],mem[2],ymm1[3],mem[4],ymm1[5],mem[6],ymm1[7],mem[8],ymm1[9],mem[10],ymm1[11],mem[12],ymm1[13],mem[14],ymm1[15] sched: [5:0.50]		; GENERIC-NEXT: vpblendw {{.*#+}} ymm1 = mem[0],ymm1[1],mem[2],ymm1[3],mem[4],ymm1[5],mem[6],ymm1[7],mem[8],ymm1[9],mem[10],ymm1[11],mem[12],ymm1[13],mem[14],ymm1[15] sched: [6:0.50]
; GENERIC-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pblendw:		; HASWELL-LABEL: test_pblendw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpblendw {{.*#+}} ymm0 = ymm0[0,1],ymm1[2,3,4],ymm0[5,6,7,8,9],ymm1[10,11,12],ymm0[13,14,15] sched: [1:1.00]		; HASWELL-NEXT: vpblendw {{.*#+}} ymm0 = ymm0[0,1],ymm1[2,3,4],ymm0[5,6,7,8,9],ymm1[10,11,12],ymm0[13,14,15] sched: [1:1.00]
; HASWELL-NEXT: vpblendw {{.*#+}} ymm1 = mem[0],ymm1[1],mem[2],ymm1[3],mem[4],ymm1[5],mem[6],ymm1[7],mem[8],ymm1[9],mem[10],ymm1[11],mem[12],ymm1[13],mem[14],ymm1[15] sched: [8:1.00]		; HASWELL-NEXT: vpblendw {{.*#+}} ymm1 = mem[0],ymm1[1],mem[2],ymm1[3],mem[4],ymm1[5],mem[6],ymm1[7],mem[8],ymm1[9],mem[10],ymm1[11],mem[12],ymm1[13],mem[14],ymm1[15] sched: [8:1.00]
; HASWELL-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <16 x i16> %1, %3		%4 = add <16 x i16> %1, %3
ret <16 x i16> %4		ret <16 x i16> %4
}		}

define <16 x i8> @test_pbroadcastb(<16 x i8> %a0, <16 x i8> *%a1) {		define <16 x i8> @test_pbroadcastb(<16 x i8> %a0, <16 x i8> *%a1) {
; GENERIC-LABEL: test_pbroadcastb:		; GENERIC-LABEL: test_pbroadcastb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpbroadcastb %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpbroadcastb %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpbroadcastb (%rdi), %xmm1 # sched: [5:1.00]		; GENERIC-NEXT: vpbroadcastb (%rdi), %xmm1 # sched: [6:1.00]
; GENERIC-NEXT: vpaddb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vpaddb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pbroadcastb:		; HASWELL-LABEL: test_pbroadcastb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpbroadcastb %xmm0, %xmm0 # sched: [3:1.00]		; HASWELL-NEXT: vpbroadcastb %xmm0, %xmm0 # sched: [3:1.00]
; HASWELL-NEXT: vpbroadcastb (%rdi), %xmm1 # sched: [9:1.00]		; HASWELL-NEXT: vpbroadcastb (%rdi), %xmm1 # sched: [9:1.00]
; HASWELL-NEXT: vpaddb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddb %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <16 x i8> %1, %3		%4 = add <16 x i8> %1, %3
ret <16 x i8> %4		ret <16 x i8> %4
}		}

define <32 x i8> @test_pbroadcastb_ymm(<32 x i8> %a0, <32 x i8> *%a1) {		define <32 x i8> @test_pbroadcastb_ymm(<32 x i8> %a0, <32 x i8> *%a1) {
; GENERIC-LABEL: test_pbroadcastb_ymm:		; GENERIC-LABEL: test_pbroadcastb_ymm:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpbroadcastb %xmm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpbroadcastb %xmm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpbroadcastb (%rdi), %ymm1 # sched: [5:1.00]		; GENERIC-NEXT: vpbroadcastb (%rdi), %ymm1 # sched: [6:1.00]
; GENERIC-NEXT: vpaddb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pbroadcastb_ymm:		; HASWELL-LABEL: test_pbroadcastb_ymm:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpbroadcastb %xmm0, %ymm0 # sched: [3:1.00]		; HASWELL-NEXT: vpbroadcastb %xmm0, %ymm0 # sched: [3:1.00]
; HASWELL-NEXT: vpbroadcastb (%rdi), %ymm1 # sched: [9:1.00]		; HASWELL-NEXT: vpbroadcastb (%rdi), %ymm1 # sched: [9:1.00]
; HASWELL-NEXT: vpaddb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <32 x i8> %1, %3		%4 = add <32 x i8> %1, %3
ret <32 x i8> %4		ret <32 x i8> %4
}		}

define <4 x i32> @test_pbroadcastd(<4 x i32> %a0, <4 x i32> *%a1) {		define <4 x i32> @test_pbroadcastd(<4 x i32> %a0, <4 x i32> *%a1) {
; GENERIC-LABEL: test_pbroadcastd:		; GENERIC-LABEL: test_pbroadcastd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpbroadcastd %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpbroadcastd %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpbroadcastd (%rdi), %xmm1 # sched: [5:1.00]		; GENERIC-NEXT: vpbroadcastd (%rdi), %xmm1 # sched: [6:1.00]
; GENERIC-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pbroadcastd:		; HASWELL-LABEL: test_pbroadcastd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpbroadcastd %xmm0, %xmm0 # sched: [1:1.00]		; HASWELL-NEXT: vpbroadcastd %xmm0, %xmm0 # sched: [1:1.00]
; HASWELL-NEXT: vpbroadcastd (%rdi), %xmm1 # sched: [6:0.50]		; HASWELL-NEXT: vpbroadcastd (%rdi), %xmm1 # sched: [6:0.50]
; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddd %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <4 x i32> %1, %3		%4 = add <4 x i32> %1, %3
ret <4 x i32> %4		ret <4 x i32> %4
}		}

define <8 x i32> @test_pbroadcastd_ymm(<8 x i32> %a0, <8 x i32> *%a1) {		define <8 x i32> @test_pbroadcastd_ymm(<8 x i32> %a0, <8 x i32> *%a1) {
; GENERIC-LABEL: test_pbroadcastd_ymm:		; GENERIC-LABEL: test_pbroadcastd_ymm:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpbroadcastd %xmm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpbroadcastd %xmm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpbroadcastd (%rdi), %ymm1 # sched: [5:1.00]		; GENERIC-NEXT: vpbroadcastd (%rdi), %ymm1 # sched: [6:1.00]
; GENERIC-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pbroadcastd_ymm:		; HASWELL-LABEL: test_pbroadcastd_ymm:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpbroadcastd %xmm0, %ymm0 # sched: [3:1.00]		; HASWELL-NEXT: vpbroadcastd %xmm0, %ymm0 # sched: [3:1.00]
; HASWELL-NEXT: vpbroadcastd (%rdi), %ymm1 # sched: [7:0.50]		; HASWELL-NEXT: vpbroadcastd (%rdi), %ymm1 # sched: [7:0.50]
; HASWELL-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <8 x i32> %1, %3		%4 = add <8 x i32> %1, %3
ret <8 x i32> %4		ret <8 x i32> %4
}		}

define <2 x i64> @test_pbroadcastq(<2 x i64> %a0, <2 x i64> *%a1) {		define <2 x i64> @test_pbroadcastq(<2 x i64> %a0, <2 x i64> *%a1) {
; GENERIC-LABEL: test_pbroadcastq:		; GENERIC-LABEL: test_pbroadcastq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpbroadcastq %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpbroadcastq %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpbroadcastq (%rdi), %xmm1 # sched: [5:1.00]		; GENERIC-NEXT: vpbroadcastq (%rdi), %xmm1 # sched: [6:1.00]
; GENERIC-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pbroadcastq:		; HASWELL-LABEL: test_pbroadcastq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpbroadcastq %xmm0, %xmm0 # sched: [1:1.00]		; HASWELL-NEXT: vpbroadcastq %xmm0, %xmm0 # sched: [1:1.00]
; HASWELL-NEXT: vpbroadcastq (%rdi), %xmm1 # sched: [6:0.50]		; HASWELL-NEXT: vpbroadcastq (%rdi), %xmm1 # sched: [6:0.50]
; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddq %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <2 x i64> %1, %3		%4 = add <2 x i64> %1, %3
ret <2 x i64> %4		ret <2 x i64> %4
}		}

define <4 x i64> @test_pbroadcastq_ymm(<4 x i64> %a0, <4 x i64> *%a1) {		define <4 x i64> @test_pbroadcastq_ymm(<4 x i64> %a0, <4 x i64> *%a1) {
; GENERIC-LABEL: test_pbroadcastq_ymm:		; GENERIC-LABEL: test_pbroadcastq_ymm:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpbroadcastq %xmm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpbroadcastq %xmm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpbroadcastq (%rdi), %ymm1 # sched: [5:1.00]		; GENERIC-NEXT: vpbroadcastq (%rdi), %ymm1 # sched: [6:1.00]
; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pbroadcastq_ymm:		; HASWELL-LABEL: test_pbroadcastq_ymm:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpbroadcastq %xmm0, %ymm0 # sched: [3:1.00]		; HASWELL-NEXT: vpbroadcastq %xmm0, %ymm0 # sched: [3:1.00]
; HASWELL-NEXT: vpbroadcastq (%rdi), %ymm1 # sched: [7:0.50]		; HASWELL-NEXT: vpbroadcastq (%rdi), %ymm1 # sched: [7:0.50]
; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <4 x i64> %1, %3		%4 = add <4 x i64> %1, %3
ret <4 x i64> %4		ret <4 x i64> %4
}		}

define <8 x i16> @test_pbroadcastw(<8 x i16> %a0, <8 x i16> *%a1) {		define <8 x i16> @test_pbroadcastw(<8 x i16> %a0, <8 x i16> *%a1) {
; GENERIC-LABEL: test_pbroadcastw:		; GENERIC-LABEL: test_pbroadcastw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpbroadcastw %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpbroadcastw %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpbroadcastw (%rdi), %xmm1 # sched: [5:1.00]		; GENERIC-NEXT: vpbroadcastw (%rdi), %xmm1 # sched: [6:1.00]
; GENERIC-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pbroadcastw:		; HASWELL-LABEL: test_pbroadcastw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpbroadcastw %xmm0, %xmm0 # sched: [3:1.00]		; HASWELL-NEXT: vpbroadcastw %xmm0, %xmm0 # sched: [3:1.00]
; HASWELL-NEXT: vpbroadcastw (%rdi), %xmm1 # sched: [9:1.00]		; HASWELL-NEXT: vpbroadcastw (%rdi), %xmm1 # sched: [9:1.00]
; HASWELL-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddw %xmm1, %xmm0, %xmm0 # sched: [1:0.50]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <8 x i16> %1, %3		%4 = add <8 x i16> %1, %3
ret <8 x i16> %4		ret <8 x i16> %4
}		}

define <16 x i16> @test_pbroadcastw_ymm(<16 x i16> %a0, <16 x i16> *%a1) {		define <16 x i16> @test_pbroadcastw_ymm(<16 x i16> %a0, <16 x i16> *%a1) {
; GENERIC-LABEL: test_pbroadcastw_ymm:		; GENERIC-LABEL: test_pbroadcastw_ymm:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpbroadcastw %xmm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpbroadcastw %xmm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpbroadcastw (%rdi), %ymm1 # sched: [5:1.00]		; GENERIC-NEXT: vpbroadcastw (%rdi), %ymm1 # sched: [6:1.00]
; GENERIC-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pbroadcastw_ymm:		; HASWELL-LABEL: test_pbroadcastw_ymm:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpbroadcastw %xmm0, %ymm0 # sched: [3:1.00]		; HASWELL-NEXT: vpbroadcastw %xmm0, %ymm0 # sched: [3:1.00]
; HASWELL-NEXT: vpbroadcastw (%rdi), %ymm1 # sched: [9:1.00]		; HASWELL-NEXT: vpbroadcastw (%rdi), %ymm1 # sched: [9:1.00]
; HASWELL-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <16 x i16> %1, %3		%4 = add <16 x i16> %1, %3
ret <16 x i16> %4		ret <16 x i16> %4
}		}

define <32 x i8> @test_pcmpeqb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {		define <32 x i8> @test_pcmpeqb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {
; GENERIC-LABEL: test_pcmpeqb:		; GENERIC-LABEL: test_pcmpeqb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpcmpeqb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpcmpeqb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpcmpeqb (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpcmpeqb (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pcmpeqb:		; HASWELL-LABEL: test_pcmpeqb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpcmpeqb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpcmpeqb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpcmpeqb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpcmpeqb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 27 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%5 = sext <32 x i1> %4 to <32 x i8>		%5 = sext <32 x i1> %4 to <32 x i8>
ret <32 x i8> %5		ret <32 x i8> %5
}		}

define <8 x i32> @test_pcmpeqd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {		define <8 x i32> @test_pcmpeqd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
; GENERIC-LABEL: test_pcmpeqd:		; GENERIC-LABEL: test_pcmpeqd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpcmpeqd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpcmpeqd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpcmpeqd (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpcmpeqd (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pcmpeqd:		; HASWELL-LABEL: test_pcmpeqd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpcmpeqd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpcmpeqd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpcmpeqd (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpcmpeqd (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 27 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%5 = sext <8 x i1> %4 to <8 x i32>		%5 = sext <8 x i1> %4 to <8 x i32>
ret <8 x i32> %5		ret <8 x i32> %5
}		}

define <4 x i64> @test_pcmpeqq(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {		define <4 x i64> @test_pcmpeqq(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {
; GENERIC-LABEL: test_pcmpeqq:		; GENERIC-LABEL: test_pcmpeqq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpcmpeqq (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpcmpeqq (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pcmpeqq:		; HASWELL-LABEL: test_pcmpeqq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpcmpeqq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpcmpeqq (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpcmpeqq (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 27 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%5 = sext <4 x i1> %4 to <4 x i64>		%5 = sext <4 x i1> %4 to <4 x i64>
ret <4 x i64> %5		ret <4 x i64> %5
}		}

define <16 x i16> @test_pcmpeqw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_pcmpeqw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_pcmpeqw:		; GENERIC-LABEL: test_pcmpeqw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpcmpeqw (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpcmpeqw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pcmpeqw:		; HASWELL-LABEL: test_pcmpeqw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpcmpeqw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpcmpeqw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpcmpeqw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 27 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%5 = sext <16 x i1> %4 to <16 x i16>		%5 = sext <16 x i1> %4 to <16 x i16>
ret <16 x i16> %5		ret <16 x i16> %5
}		}

define <32 x i8> @test_pcmpgtb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {		define <32 x i8> @test_pcmpgtb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {
; GENERIC-LABEL: test_pcmpgtb:		; GENERIC-LABEL: test_pcmpgtb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpcmpgtb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpcmpgtb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpcmpgtb (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpcmpgtb (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pcmpgtb:		; HASWELL-LABEL: test_pcmpgtb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpcmpgtb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpcmpgtb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpcmpgtb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpcmpgtb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 27 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%5 = sext <32 x i1> %4 to <32 x i8>		%5 = sext <32 x i1> %4 to <32 x i8>
ret <32 x i8> %5		ret <32 x i8> %5
}		}

define <8 x i32> @test_pcmpgtd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {		define <8 x i32> @test_pcmpgtd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
; GENERIC-LABEL: test_pcmpgtd:		; GENERIC-LABEL: test_pcmpgtd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpcmpgtd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpcmpgtd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpcmpgtd (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpcmpgtd (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pcmpgtd:		; HASWELL-LABEL: test_pcmpgtd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpcmpgtd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpcmpgtd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpcmpgtd (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpcmpgtd (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 27 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%5 = sext <8 x i1> %4 to <8 x i32>		%5 = sext <8 x i1> %4 to <8 x i32>
ret <8 x i32> %5		ret <8 x i32> %5
}		}

define <4 x i64> @test_pcmpgtq(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {		define <4 x i64> @test_pcmpgtq(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {
; GENERIC-LABEL: test_pcmpgtq:		; GENERIC-LABEL: test_pcmpgtq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpcmpgtq (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpcmpgtq (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pcmpgtq:		; HASWELL-LABEL: test_pcmpgtq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0 # sched: [5:1.00]		; HASWELL-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
; HASWELL-NEXT: vpcmpgtq (%rdi), %ymm0, %ymm0 # sched: [12:1.00]		; HASWELL-NEXT: vpcmpgtq (%rdi), %ymm0, %ymm0 # sched: [12:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 27 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%5 = sext <4 x i1> %4 to <4 x i64>		%5 = sext <4 x i1> %4 to <4 x i64>
ret <4 x i64> %5		ret <4 x i64> %5
}		}

define <16 x i16> @test_pcmpgtw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_pcmpgtw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_pcmpgtw:		; GENERIC-LABEL: test_pcmpgtw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpcmpgtw (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpcmpgtw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pcmpgtw:		; HASWELL-LABEL: test_pcmpgtw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpcmpgtw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpcmpgtw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 27 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%5 = sext <16 x i1> %4 to <16 x i16>		%5 = sext <16 x i1> %4 to <16 x i16>
ret <16 x i16> %5		ret <16 x i16> %5
}		}

define <4 x i64> @test_perm2i128(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {		define <4 x i64> @test_perm2i128(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {
; GENERIC-LABEL: test_perm2i128:		; GENERIC-LABEL: test_perm2i128:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vperm2i128 {{.*#+}} ymm1 = ymm0[2,3],ymm1[0,1] sched: [1:1.00]		; GENERIC-NEXT: vperm2i128 {{.*#+}} ymm1 = ymm0[2,3],ymm1[0,1] sched: [1:1.00]
; GENERIC-NEXT: vperm2i128 {{.*#+}} ymm0 = ymm0[2,3],mem[0,1] sched: [5:1.00]		; GENERIC-NEXT: vperm2i128 {{.*#+}} ymm0 = ymm0[2,3],mem[0,1] sched: [6:1.00]
; GENERIC-NEXT: vpaddq %ymm0, %ymm1, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddq %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_perm2i128:		; HASWELL-LABEL: test_perm2i128:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vperm2i128 {{.*#+}} ymm1 = ymm0[2,3],ymm1[0,1] sched: [3:1.00]		; HASWELL-NEXT: vperm2i128 {{.*#+}} ymm1 = ymm0[2,3],ymm1[0,1] sched: [3:1.00]
; HASWELL-NEXT: vperm2i128 {{.*#+}} ymm0 = ymm0[2,3],mem[0,1] sched: [10:1.00]		; HASWELL-NEXT: vperm2i128 {{.*#+}} ymm0 = ymm0[2,3],mem[0,1] sched: [10:1.00]
; HASWELL-NEXT: vpaddq %ymm0, %ymm1, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddq %ymm0, %ymm1, %ymm0 # sched: [1:0.50]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <4 x i64> %1, %3		%4 = add <4 x i64> %1, %3
ret <4 x i64> %4		ret <4 x i64> %4
}		}

define <8 x i32> @test_permd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {		define <8 x i32> @test_permd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
; GENERIC-LABEL: test_permd:		; GENERIC-LABEL: test_permd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpermd %ymm1, %ymm0, %ymm1 # sched: [1:1.00]		; GENERIC-NEXT: vpermd %ymm1, %ymm0, %ymm1 # sched: [1:1.00]
; GENERIC-NEXT: vpermd (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermd (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: vpaddd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_permd:		; HASWELL-LABEL: test_permd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpermd %ymm1, %ymm0, %ymm1 # sched: [3:1.00]		; HASWELL-NEXT: vpermd %ymm1, %ymm0, %ymm1 # sched: [3:1.00]
; HASWELL-NEXT: vpermd (%rdi), %ymm0, %ymm0 # sched: [10:1.00]		; HASWELL-NEXT: vpermd (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
; HASWELL-NEXT: vpaddd %ymm0, %ymm1, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddd %ymm0, %ymm1, %ymm0 # sched: [1:0.50]
Show All 33 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <8 x i32> %4		ret <8 x i32> %4
}		}
declare <8 x i32> @llvm.x86.avx2.permd(<8 x i32>, <8 x i32>) nounwind readonly		declare <8 x i32> @llvm.x86.avx2.permd(<8 x i32>, <8 x i32>) nounwind readonly

define <4 x double> @test_permpd(<4 x double> %a0, <4 x double> *%a1) {		define <4 x double> @test_permpd(<4 x double> %a0, <4 x double> *%a1) {
; GENERIC-LABEL: test_permpd:		; GENERIC-LABEL: test_permpd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[3,2,2,3] sched: [1:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[3,2,2,3] sched: [1:1.00]
; GENERIC-NEXT: vpermpd {{.*#+}} ymm1 = mem[0,2,2,3] sched: [5:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} ymm1 = mem[0,2,2,3] sched: [6:1.00]
; GENERIC-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_permpd:		; HASWELL-LABEL: test_permpd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[3,2,2,3] sched: [3:1.00]		; HASWELL-NEXT: vpermpd {{.*#+}} ymm0 = ymm0[3,2,2,3] sched: [3:1.00]
; HASWELL-NEXT: vpermpd {{.*#+}} ymm1 = mem[0,2,2,3] sched: [10:1.00]		; HASWELL-NEXT: vpermpd {{.*#+}} ymm1 = mem[0,2,2,3] sched: [10:1.00]
; HASWELL-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; HASWELL-NEXT: vaddpd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = fadd <4 x double> %1, %3		%4 = fadd <4 x double> %1, %3
ret <4 x double> %4		ret <4 x double> %4
}		}

define <8 x float> @test_permps(<8 x i32> %a0, <8 x float> %a1, <8 x float> *%a2) {		define <8 x float> @test_permps(<8 x i32> %a0, <8 x float> %a1, <8 x float> *%a2) {
; GENERIC-LABEL: test_permps:		; GENERIC-LABEL: test_permps:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpermps %ymm1, %ymm0, %ymm1 # sched: [1:1.00]		; GENERIC-NEXT: vpermps %ymm1, %ymm0, %ymm1 # sched: [1:1.00]
; GENERIC-NEXT: vpermps (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_permps:		; HASWELL-LABEL: test_permps:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpermps %ymm1, %ymm0, %ymm1 # sched: [3:1.00]		; HASWELL-NEXT: vpermps %ymm1, %ymm0, %ymm1 # sched: [3:1.00]
; HASWELL-NEXT: vpermps (%rdi), %ymm0, %ymm0 # sched: [10:1.00]		; HASWELL-NEXT: vpermps (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
; HASWELL-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]		; HASWELL-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
Show All 33 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <8 x float> %4		ret <8 x float> %4
}		}
declare <8 x float> @llvm.x86.avx2.permps(<8 x float>, <8 x i32>) nounwind readonly		declare <8 x float> @llvm.x86.avx2.permps(<8 x float>, <8 x i32>) nounwind readonly

define <4 x i64> @test_permq(<4 x i64> %a0, <4 x i64> *%a1) {		define <4 x i64> @test_permq(<4 x i64> %a0, <4 x i64> *%a1) {
; GENERIC-LABEL: test_permq:		; GENERIC-LABEL: test_permq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpermq {{.*#+}} ymm0 = ymm0[3,2,2,3] sched: [1:1.00]		; GENERIC-NEXT: vpermq {{.*#+}} ymm0 = ymm0[3,2,2,3] sched: [1:1.00]
; GENERIC-NEXT: vpermq {{.*#+}} ymm1 = mem[0,2,2,3] sched: [5:1.00]		; GENERIC-NEXT: vpermq {{.*#+}} ymm1 = mem[0,2,2,3] sched: [6:1.00]
; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_permq:		; HASWELL-LABEL: test_permq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[3,2,2,3] sched: [3:1.00]		; HASWELL-NEXT: vpermq {{.*#+}} ymm0 = ymm0[3,2,2,3] sched: [3:1.00]
; HASWELL-NEXT: vpermq {{.*#+}} ymm1 = mem[0,2,2,3] sched: [10:1.00]		; HASWELL-NEXT: vpermq {{.*#+}} ymm1 = mem[0,2,2,3] sched: [10:1.00]
; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 31 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%3 = shufflevector <4 x i64> %2, <4 x i64> undef, <4 x i32> <i32 0, i32 2, i32 2, i32 3>		%3 = shufflevector <4 x i64> %2, <4 x i64> undef, <4 x i32> <i32 0, i32 2, i32 2, i32 3>
%4 = add <4 x i64> %1, %3		%4 = add <4 x i64> %1, %3
ret <4 x i64> %4		ret <4 x i64> %4
}		}

define <4 x i32> @test_pgatherdd(<4 x i32> %a0, i8* %a1, <4 x i32> %a2, <4 x i32> %a3) {		define <4 x i32> @test_pgatherdd(<4 x i32> %a0, i8* %a1, <4 x i32> %a2, <4 x i32> %a3) {
; GENERIC-LABEL: test_pgatherdd:		; GENERIC-LABEL: test_pgatherdd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpgatherdd %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [4:0.50]		; GENERIC-NEXT: vpgatherdd %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [5:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pgatherdd:		; HASWELL-LABEL: test_pgatherdd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpgatherdd %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [26:2.67]		; HASWELL-NEXT: vpgatherdd %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [26:2.67]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
; BROADWELL-LABEL: test_pgatherdd:		; BROADWELL-LABEL: test_pgatherdd:
Show All 18 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%1 = call <4 x i32> @llvm.x86.avx2.gather.d.d(<4 x i32> %a0, i8* %a1, <4 x i32> %a2, <4 x i32> %a3, i8 2)		%1 = call <4 x i32> @llvm.x86.avx2.gather.d.d(<4 x i32> %a0, i8* %a1, <4 x i32> %a2, <4 x i32> %a3, i8 2)
ret <4 x i32> %1		ret <4 x i32> %1
}		}
declare <4 x i32> @llvm.x86.avx2.gather.d.d(<4 x i32>, i8*, <4 x i32>, <4 x i32>, i8) nounwind readonly		declare <4 x i32> @llvm.x86.avx2.gather.d.d(<4 x i32>, i8*, <4 x i32>, <4 x i32>, i8) nounwind readonly

define <8 x i32> @test_pgatherdd_ymm(<8 x i32> %a0, i8* %a1, <8 x i32> %a2, <8 x i32> %a3) {		define <8 x i32> @test_pgatherdd_ymm(<8 x i32> %a0, i8* %a1, <8 x i32> %a2, <8 x i32> %a3) {
; GENERIC-LABEL: test_pgatherdd_ymm:		; GENERIC-LABEL: test_pgatherdd_ymm:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpgatherdd %ymm2, (%rdi,%ymm1,2), %ymm0 # sched: [4:0.50]		; GENERIC-NEXT: vpgatherdd %ymm2, (%rdi,%ymm1,2), %ymm0 # sched: [5:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pgatherdd_ymm:		; HASWELL-LABEL: test_pgatherdd_ymm:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpgatherdd %ymm2, (%rdi,%ymm1,2), %ymm0 # sched: [27:6.50]		; HASWELL-NEXT: vpgatherdd %ymm2, (%rdi,%ymm1,2), %ymm0 # sched: [27:6.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
; BROADWELL-LABEL: test_pgatherdd_ymm:		; BROADWELL-LABEL: test_pgatherdd_ymm:
Show All 18 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%1 = call <8 x i32> @llvm.x86.avx2.gather.d.d.256(<8 x i32> %a0, i8* %a1, <8 x i32> %a2, <8 x i32> %a3, i8 2)		%1 = call <8 x i32> @llvm.x86.avx2.gather.d.d.256(<8 x i32> %a0, i8* %a1, <8 x i32> %a2, <8 x i32> %a3, i8 2)
ret <8 x i32> %1		ret <8 x i32> %1
}		}
declare <8 x i32> @llvm.x86.avx2.gather.d.d.256(<8 x i32>, i8*, <8 x i32>, <8 x i32>, i8) nounwind readonly		declare <8 x i32> @llvm.x86.avx2.gather.d.d.256(<8 x i32>, i8*, <8 x i32>, <8 x i32>, i8) nounwind readonly

define <2 x i64> @test_pgatherdq(<2 x i64> %a0, i8* %a1, <4 x i32> %a2, <2 x i64> %a3) {		define <2 x i64> @test_pgatherdq(<2 x i64> %a0, i8* %a1, <4 x i32> %a2, <2 x i64> %a3) {
; GENERIC-LABEL: test_pgatherdq:		; GENERIC-LABEL: test_pgatherdq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpgatherdq %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [4:0.50]		; GENERIC-NEXT: vpgatherdq %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [5:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pgatherdq:		; HASWELL-LABEL: test_pgatherdq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpgatherdq %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [26:2.67]		; HASWELL-NEXT: vpgatherdq %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [26:2.67]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
; BROADWELL-LABEL: test_pgatherdq:		; BROADWELL-LABEL: test_pgatherdq:
Show All 18 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%1 = call <2 x i64> @llvm.x86.avx2.gather.d.q(<2 x i64> %a0, i8* %a1, <4 x i32> %a2, <2 x i64> %a3, i8 2)		%1 = call <2 x i64> @llvm.x86.avx2.gather.d.q(<2 x i64> %a0, i8* %a1, <4 x i32> %a2, <2 x i64> %a3, i8 2)
ret <2 x i64> %1		ret <2 x i64> %1
}		}
declare <2 x i64> @llvm.x86.avx2.gather.d.q(<2 x i64>, i8*, <4 x i32>, <2 x i64>, i8) nounwind readonly		declare <2 x i64> @llvm.x86.avx2.gather.d.q(<2 x i64>, i8*, <4 x i32>, <2 x i64>, i8) nounwind readonly

define <4 x i64> @test_pgatherdq_ymm(<4 x i64> %a0, i8* %a1, <4 x i32> %a2, <4 x i64> %a3) {		define <4 x i64> @test_pgatherdq_ymm(<4 x i64> %a0, i8* %a1, <4 x i32> %a2, <4 x i64> %a3) {
; GENERIC-LABEL: test_pgatherdq_ymm:		; GENERIC-LABEL: test_pgatherdq_ymm:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpgatherdq %ymm2, (%rdi,%xmm1,2), %ymm0 # sched: [4:0.50]		; GENERIC-NEXT: vpgatherdq %ymm2, (%rdi,%xmm1,2), %ymm0 # sched: [5:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pgatherdq_ymm:		; HASWELL-LABEL: test_pgatherdq_ymm:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpgatherdq %ymm2, (%rdi,%xmm1,2), %ymm0 # sched: [27:4.00]		; HASWELL-NEXT: vpgatherdq %ymm2, (%rdi,%xmm1,2), %ymm0 # sched: [27:4.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
; BROADWELL-LABEL: test_pgatherdq_ymm:		; BROADWELL-LABEL: test_pgatherdq_ymm:
Show All 18 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%1 = call <4 x i64> @llvm.x86.avx2.gather.d.q.256(<4 x i64> %a0, i8* %a1, <4 x i32> %a2, <4 x i64> %a3, i8 2)		%1 = call <4 x i64> @llvm.x86.avx2.gather.d.q.256(<4 x i64> %a0, i8* %a1, <4 x i32> %a2, <4 x i64> %a3, i8 2)
ret <4 x i64> %1		ret <4 x i64> %1
}		}
declare <4 x i64> @llvm.x86.avx2.gather.d.q.256(<4 x i64>, i8*, <4 x i32>, <4 x i64>, i8) nounwind readonly		declare <4 x i64> @llvm.x86.avx2.gather.d.q.256(<4 x i64>, i8*, <4 x i32>, <4 x i64>, i8) nounwind readonly

define <4 x i32> @test_pgatherqd(<4 x i32> %a0, i8* %a1, <2 x i64> %a2, <4 x i32> %a3) {		define <4 x i32> @test_pgatherqd(<4 x i32> %a0, i8* %a1, <2 x i64> %a2, <4 x i32> %a3) {
; GENERIC-LABEL: test_pgatherqd:		; GENERIC-LABEL: test_pgatherqd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpgatherqd %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [4:0.50]		; GENERIC-NEXT: vpgatherqd %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [5:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pgatherqd:		; HASWELL-LABEL: test_pgatherqd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpgatherqd %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [25:5.00]		; HASWELL-NEXT: vpgatherqd %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [25:5.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
; BROADWELL-LABEL: test_pgatherqd:		; BROADWELL-LABEL: test_pgatherqd:
Show All 18 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%1 = call <4 x i32> @llvm.x86.avx2.gather.q.d(<4 x i32> %a0, i8* %a1, <2 x i64> %a2, <4 x i32> %a3, i8 2)		%1 = call <4 x i32> @llvm.x86.avx2.gather.q.d(<4 x i32> %a0, i8* %a1, <2 x i64> %a2, <4 x i32> %a3, i8 2)
ret <4 x i32> %1		ret <4 x i32> %1
}		}
declare <4 x i32> @llvm.x86.avx2.gather.q.d(<4 x i32>, i8*, <2 x i64>, <4 x i32>, i8) nounwind readonly		declare <4 x i32> @llvm.x86.avx2.gather.q.d(<4 x i32>, i8*, <2 x i64>, <4 x i32>, i8) nounwind readonly

define <4 x i32> @test_pgatherqd_ymm(<4 x i32> %a0, i8* %a1, <4 x i64> %a2, <4 x i32> %a3) {		define <4 x i32> @test_pgatherqd_ymm(<4 x i32> %a0, i8* %a1, <4 x i64> %a2, <4 x i32> %a3) {
; GENERIC-LABEL: test_pgatherqd_ymm:		; GENERIC-LABEL: test_pgatherqd_ymm:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpgatherqd %xmm2, (%rdi,%ymm1,2), %xmm0 # sched: [4:0.50]		; GENERIC-NEXT: vpgatherqd %xmm2, (%rdi,%ymm1,2), %xmm0 # sched: [5:0.50]
; GENERIC-NEXT: vzeroupper # sched: [100:0.33]		; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pgatherqd_ymm:		; HASWELL-LABEL: test_pgatherqd_ymm:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpgatherqd %xmm2, (%rdi,%ymm1,2), %xmm0 # sched: [28:5.00]		; HASWELL-NEXT: vpgatherqd %xmm2, (%rdi,%ymm1,2), %xmm0 # sched: [28:5.00]
; HASWELL-NEXT: vzeroupper # sched: [4:1.00]		; HASWELL-NEXT: vzeroupper # sched: [4:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
Show All 24 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%1 = call <4 x i32> @llvm.x86.avx2.gather.q.d.256(<4 x i32> %a0, i8* %a1, <4 x i64> %a2, <4 x i32> %a3, i8 2)		%1 = call <4 x i32> @llvm.x86.avx2.gather.q.d.256(<4 x i32> %a0, i8* %a1, <4 x i64> %a2, <4 x i32> %a3, i8 2)
ret <4 x i32> %1		ret <4 x i32> %1
}		}
declare <4 x i32> @llvm.x86.avx2.gather.q.d.256(<4 x i32>, i8*, <4 x i64>, <4 x i32>, i8) nounwind readonly		declare <4 x i32> @llvm.x86.avx2.gather.q.d.256(<4 x i32>, i8*, <4 x i64>, <4 x i32>, i8) nounwind readonly

define <2 x i64> @test_pgatherqq(<2 x i64> %a0, i8 *%a1, <2 x i64> %a2, <2 x i64> %a3) {		define <2 x i64> @test_pgatherqq(<2 x i64> %a0, i8 *%a1, <2 x i64> %a2, <2 x i64> %a3) {
; GENERIC-LABEL: test_pgatherqq:		; GENERIC-LABEL: test_pgatherqq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpgatherqq %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [4:0.50]		; GENERIC-NEXT: vpgatherqq %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [5:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pgatherqq:		; HASWELL-LABEL: test_pgatherqq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpgatherqq %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [23:3.33]		; HASWELL-NEXT: vpgatherqq %xmm2, (%rdi,%xmm1,2), %xmm0 # sched: [23:3.33]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
; BROADWELL-LABEL: test_pgatherqq:		; BROADWELL-LABEL: test_pgatherqq:
Show All 18 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%1 = call <2 x i64> @llvm.x86.avx2.gather.q.q(<2 x i64> %a0, i8* %a1, <2 x i64> %a2, <2 x i64> %a3, i8 2)		%1 = call <2 x i64> @llvm.x86.avx2.gather.q.q(<2 x i64> %a0, i8* %a1, <2 x i64> %a2, <2 x i64> %a3, i8 2)
ret <2 x i64> %1		ret <2 x i64> %1
}		}
declare <2 x i64> @llvm.x86.avx2.gather.q.q(<2 x i64>, i8*, <2 x i64>, <2 x i64>, i8) nounwind readonly		declare <2 x i64> @llvm.x86.avx2.gather.q.q(<2 x i64>, i8*, <2 x i64>, <2 x i64>, i8) nounwind readonly

define <4 x i64> @test_pgatherqq_ymm(<4 x i64> %a0, i8 *%a1, <4 x i64> %a2, <4 x i64> %a3) {		define <4 x i64> @test_pgatherqq_ymm(<4 x i64> %a0, i8 *%a1, <4 x i64> %a2, <4 x i64> %a3) {
; GENERIC-LABEL: test_pgatherqq_ymm:		; GENERIC-LABEL: test_pgatherqq_ymm:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpgatherqq %ymm2, (%rdi,%ymm1,2), %ymm0 # sched: [4:0.50]		; GENERIC-NEXT: vpgatherqq %ymm2, (%rdi,%ymm1,2), %ymm0 # sched: [5:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pgatherqq_ymm:		; HASWELL-LABEL: test_pgatherqq_ymm:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpgatherqq %ymm2, (%rdi,%ymm1,2), %ymm0 # sched: [24:5.00]		; HASWELL-NEXT: vpgatherqq %ymm2, (%rdi,%ymm1,2), %ymm0 # sched: [24:5.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
; BROADWELL-LABEL: test_pgatherqq_ymm:		; BROADWELL-LABEL: test_pgatherqq_ymm:
Show All 19 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <4 x i64> %1		ret <4 x i64> %1
}		}
declare <4 x i64> @llvm.x86.avx2.gather.q.q.256(<4 x i64>, i8*, <4 x i64>, <4 x i64>, i8) nounwind readonly		declare <4 x i64> @llvm.x86.avx2.gather.q.q.256(<4 x i64>, i8*, <4 x i64>, <4 x i64>, i8) nounwind readonly

define <8 x i32> @test_phaddd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {		define <8 x i32> @test_phaddd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
; GENERIC-LABEL: test_phaddd:		; GENERIC-LABEL: test_phaddd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vphaddd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; GENERIC-NEXT: vphaddd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; GENERIC-NEXT: vphaddd (%rdi), %ymm0, %ymm0 # sched: [5:0.50]		; GENERIC-NEXT: vphaddd (%rdi), %ymm0, %ymm0 # sched: [6:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_phaddd:		; HASWELL-LABEL: test_phaddd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vphaddd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]		; HASWELL-NEXT: vphaddd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
; HASWELL-NEXT: vphaddd (%rdi), %ymm0, %ymm0 # sched: [10:2.00]		; HASWELL-NEXT: vphaddd (%rdi), %ymm0, %ymm0 # sched: [10:2.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <8 x i32> %3		ret <8 x i32> %3
}		}
declare <8 x i32> @llvm.x86.avx2.phadd.d(<8 x i32>, <8 x i32>) nounwind readnone		declare <8 x i32> @llvm.x86.avx2.phadd.d(<8 x i32>, <8 x i32>) nounwind readnone

define <16 x i16> @test_phaddsw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_phaddsw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_phaddsw:		; GENERIC-LABEL: test_phaddsw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vphaddsw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vphaddsw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vphaddsw (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vphaddsw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_phaddsw:		; HASWELL-LABEL: test_phaddsw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vphaddsw %ymm1, %ymm0, %ymm0 # sched: [3:2.00]		; HASWELL-NEXT: vphaddsw %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
; HASWELL-NEXT: vphaddsw (%rdi), %ymm0, %ymm0 # sched: [10:2.00]		; HASWELL-NEXT: vphaddsw (%rdi), %ymm0, %ymm0 # sched: [10:2.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <16 x i16> %3		ret <16 x i16> %3
}		}
declare <16 x i16> @llvm.x86.avx2.phadd.sw(<16 x i16>, <16 x i16>) nounwind readnone		declare <16 x i16> @llvm.x86.avx2.phadd.sw(<16 x i16>, <16 x i16>) nounwind readnone

define <16 x i16> @test_phaddw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_phaddw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_phaddw:		; GENERIC-LABEL: test_phaddw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vphaddw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; GENERIC-NEXT: vphaddw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; GENERIC-NEXT: vphaddw (%rdi), %ymm0, %ymm0 # sched: [5:0.50]		; GENERIC-NEXT: vphaddw (%rdi), %ymm0, %ymm0 # sched: [6:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_phaddw:		; HASWELL-LABEL: test_phaddw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vphaddw %ymm1, %ymm0, %ymm0 # sched: [3:2.00]		; HASWELL-NEXT: vphaddw %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
; HASWELL-NEXT: vphaddw (%rdi), %ymm0, %ymm0 # sched: [10:2.00]		; HASWELL-NEXT: vphaddw (%rdi), %ymm0, %ymm0 # sched: [10:2.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <16 x i16> %3		ret <16 x i16> %3
}		}
declare <16 x i16> @llvm.x86.avx2.phadd.w(<16 x i16>, <16 x i16>) nounwind readnone		declare <16 x i16> @llvm.x86.avx2.phadd.w(<16 x i16>, <16 x i16>) nounwind readnone

define <8 x i32> @test_phsubd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {		define <8 x i32> @test_phsubd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
; GENERIC-LABEL: test_phsubd:		; GENERIC-LABEL: test_phsubd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vphsubd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; GENERIC-NEXT: vphsubd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; GENERIC-NEXT: vphsubd (%rdi), %ymm0, %ymm0 # sched: [5:0.50]		; GENERIC-NEXT: vphsubd (%rdi), %ymm0, %ymm0 # sched: [6:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_phsubd:		; HASWELL-LABEL: test_phsubd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vphsubd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]		; HASWELL-NEXT: vphsubd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
; HASWELL-NEXT: vphsubd (%rdi), %ymm0, %ymm0 # sched: [10:2.00]		; HASWELL-NEXT: vphsubd (%rdi), %ymm0, %ymm0 # sched: [10:2.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <8 x i32> %3		ret <8 x i32> %3
}		}
declare <8 x i32> @llvm.x86.avx2.phsub.d(<8 x i32>, <8 x i32>) nounwind readnone		declare <8 x i32> @llvm.x86.avx2.phsub.d(<8 x i32>, <8 x i32>) nounwind readnone

define <16 x i16> @test_phsubsw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_phsubsw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_phsubsw:		; GENERIC-LABEL: test_phsubsw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vphsubsw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vphsubsw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vphsubsw (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vphsubsw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_phsubsw:		; HASWELL-LABEL: test_phsubsw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vphsubsw %ymm1, %ymm0, %ymm0 # sched: [3:2.00]		; HASWELL-NEXT: vphsubsw %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
; HASWELL-NEXT: vphsubsw (%rdi), %ymm0, %ymm0 # sched: [10:2.00]		; HASWELL-NEXT: vphsubsw (%rdi), %ymm0, %ymm0 # sched: [10:2.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <16 x i16> %3		ret <16 x i16> %3
}		}
declare <16 x i16> @llvm.x86.avx2.phsub.sw(<16 x i16>, <16 x i16>) nounwind readnone		declare <16 x i16> @llvm.x86.avx2.phsub.sw(<16 x i16>, <16 x i16>) nounwind readnone

define <16 x i16> @test_phsubw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_phsubw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_phsubw:		; GENERIC-LABEL: test_phsubw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vphsubw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; GENERIC-NEXT: vphsubw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; GENERIC-NEXT: vphsubw (%rdi), %ymm0, %ymm0 # sched: [5:0.50]		; GENERIC-NEXT: vphsubw (%rdi), %ymm0, %ymm0 # sched: [6:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_phsubw:		; HASWELL-LABEL: test_phsubw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vphsubw %ymm1, %ymm0, %ymm0 # sched: [3:2.00]		; HASWELL-NEXT: vphsubw %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
; HASWELL-NEXT: vphsubw (%rdi), %ymm0, %ymm0 # sched: [10:2.00]		; HASWELL-NEXT: vphsubw (%rdi), %ymm0, %ymm0 # sched: [10:2.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <16 x i16> %3		ret <16 x i16> %3
}		}
declare <16 x i16> @llvm.x86.avx2.phsub.w(<16 x i16>, <16 x i16>) nounwind readnone		declare <16 x i16> @llvm.x86.avx2.phsub.w(<16 x i16>, <16 x i16>) nounwind readnone

define <16 x i16> @test_pmaddubsw(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {		define <16 x i16> @test_pmaddubsw(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {
; GENERIC-LABEL: test_pmaddubsw:		; GENERIC-LABEL: test_pmaddubsw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmaddubsw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmaddubsw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
; GENERIC-NEXT: vpmaddubsw (%rdi), %ymm0, %ymm0 # sched: [9:1.00]		; GENERIC-NEXT: vpmaddubsw (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmaddubsw:		; HASWELL-LABEL: test_pmaddubsw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmaddubsw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]		; HASWELL-NEXT: vpmaddubsw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
; HASWELL-NEXT: vpmaddubsw (%rdi), %ymm0, %ymm0 # sched: [12:1.00]		; HASWELL-NEXT: vpmaddubsw (%rdi), %ymm0, %ymm0 # sched: [12:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 27 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <16 x i16> %4		ret <16 x i16> %4
}		}
declare <16 x i16> @llvm.x86.avx2.pmadd.ub.sw(<32 x i8>, <32 x i8>) nounwind readnone		declare <16 x i16> @llvm.x86.avx2.pmadd.ub.sw(<32 x i8>, <32 x i8>) nounwind readnone

define <8 x i32> @test_pmaddwd(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <8 x i32> @test_pmaddwd(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_pmaddwd:		; GENERIC-LABEL: test_pmaddwd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmaddwd %ymm1, %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmaddwd %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
; GENERIC-NEXT: vpmaddwd (%rdi), %ymm0, %ymm0 # sched: [9:1.00]		; GENERIC-NEXT: vpmaddwd (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmaddwd:		; HASWELL-LABEL: test_pmaddwd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmaddwd %ymm1, %ymm0, %ymm0 # sched: [5:1.00]		; HASWELL-NEXT: vpmaddwd %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
; HASWELL-NEXT: vpmaddwd (%rdi), %ymm0, %ymm0 # sched: [12:1.00]		; HASWELL-NEXT: vpmaddwd (%rdi), %ymm0, %ymm0 # sched: [12:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
▲ Show 20 Lines • Show All 223 Lines • ▼ Show 20 Lines
}		}
declare <4 x i64> @llvm.x86.avx2.maskload.q.256(i8*, <4 x i64>) nounwind readonly		declare <4 x i64> @llvm.x86.avx2.maskload.q.256(i8*, <4 x i64>) nounwind readonly
declare void @llvm.x86.avx2.maskstore.q.256(i8*, <4 x i64>, <4 x i64>) nounwind		declare void @llvm.x86.avx2.maskstore.q.256(i8*, <4 x i64>, <4 x i64>) nounwind

define <32 x i8> @test_pmaxsb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {		define <32 x i8> @test_pmaxsb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {
; GENERIC-LABEL: test_pmaxsb:		; GENERIC-LABEL: test_pmaxsb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmaxsb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpmaxsb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpmaxsb (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpmaxsb (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmaxsb:		; HASWELL-LABEL: test_pmaxsb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmaxsb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpmaxsb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpmaxsb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpmaxsb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <32 x i8> %3		ret <32 x i8> %3
}		}
declare <32 x i8> @llvm.x86.avx2.pmaxs.b(<32 x i8>, <32 x i8>) nounwind readnone		declare <32 x i8> @llvm.x86.avx2.pmaxs.b(<32 x i8>, <32 x i8>) nounwind readnone

define <8 x i32> @test_pmaxsd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {		define <8 x i32> @test_pmaxsd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
; GENERIC-LABEL: test_pmaxsd:		; GENERIC-LABEL: test_pmaxsd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmaxsd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpmaxsd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpmaxsd (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpmaxsd (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmaxsd:		; HASWELL-LABEL: test_pmaxsd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmaxsd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpmaxsd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpmaxsd (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpmaxsd (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <8 x i32> %3		ret <8 x i32> %3
}		}
declare <8 x i32> @llvm.x86.avx2.pmaxs.d(<8 x i32>, <8 x i32>) nounwind readnone		declare <8 x i32> @llvm.x86.avx2.pmaxs.d(<8 x i32>, <8 x i32>) nounwind readnone

define <16 x i16> @test_pmaxsw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_pmaxsw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_pmaxsw:		; GENERIC-LABEL: test_pmaxsw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmaxsw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpmaxsw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpmaxsw (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpmaxsw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmaxsw:		; HASWELL-LABEL: test_pmaxsw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmaxsw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpmaxsw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpmaxsw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpmaxsw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <16 x i16> %3		ret <16 x i16> %3
}		}
declare <16 x i16> @llvm.x86.avx2.pmaxs.w(<16 x i16>, <16 x i16>) nounwind readnone		declare <16 x i16> @llvm.x86.avx2.pmaxs.w(<16 x i16>, <16 x i16>) nounwind readnone

define <32 x i8> @test_pmaxub(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {		define <32 x i8> @test_pmaxub(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {
; GENERIC-LABEL: test_pmaxub:		; GENERIC-LABEL: test_pmaxub:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmaxub %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpmaxub %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpmaxub (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpmaxub (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmaxub:		; HASWELL-LABEL: test_pmaxub:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmaxub %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpmaxub %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpmaxub (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpmaxub (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <32 x i8> %3		ret <32 x i8> %3
}		}
declare <32 x i8> @llvm.x86.avx2.pmaxu.b(<32 x i8>, <32 x i8>) nounwind readnone		declare <32 x i8> @llvm.x86.avx2.pmaxu.b(<32 x i8>, <32 x i8>) nounwind readnone

define <8 x i32> @test_pmaxud(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {		define <8 x i32> @test_pmaxud(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
; GENERIC-LABEL: test_pmaxud:		; GENERIC-LABEL: test_pmaxud:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmaxud %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpmaxud %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpmaxud (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpmaxud (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmaxud:		; HASWELL-LABEL: test_pmaxud:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmaxud %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpmaxud %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpmaxud (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpmaxud (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <8 x i32> %3		ret <8 x i32> %3
}		}
declare <8 x i32> @llvm.x86.avx2.pmaxu.d(<8 x i32>, <8 x i32>) nounwind readnone		declare <8 x i32> @llvm.x86.avx2.pmaxu.d(<8 x i32>, <8 x i32>) nounwind readnone

define <16 x i16> @test_pmaxuw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_pmaxuw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_pmaxuw:		; GENERIC-LABEL: test_pmaxuw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmaxuw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpmaxuw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpmaxuw (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpmaxuw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmaxuw:		; HASWELL-LABEL: test_pmaxuw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmaxuw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpmaxuw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpmaxuw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpmaxuw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <16 x i16> %3		ret <16 x i16> %3
}		}
declare <16 x i16> @llvm.x86.avx2.pmaxu.w(<16 x i16>, <16 x i16>) nounwind readnone		declare <16 x i16> @llvm.x86.avx2.pmaxu.w(<16 x i16>, <16 x i16>) nounwind readnone

define <32 x i8> @test_pminsb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {		define <32 x i8> @test_pminsb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {
; GENERIC-LABEL: test_pminsb:		; GENERIC-LABEL: test_pminsb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpminsb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpminsb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpminsb (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpminsb (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pminsb:		; HASWELL-LABEL: test_pminsb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpminsb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpminsb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpminsb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpminsb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <32 x i8> %3		ret <32 x i8> %3
}		}
declare <32 x i8> @llvm.x86.avx2.pmins.b(<32 x i8>, <32 x i8>) nounwind readnone		declare <32 x i8> @llvm.x86.avx2.pmins.b(<32 x i8>, <32 x i8>) nounwind readnone

define <8 x i32> @test_pminsd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {		define <8 x i32> @test_pminsd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
; GENERIC-LABEL: test_pminsd:		; GENERIC-LABEL: test_pminsd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpminsd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpminsd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpminsd (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpminsd (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pminsd:		; HASWELL-LABEL: test_pminsd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpminsd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpminsd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpminsd (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpminsd (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <8 x i32> %3		ret <8 x i32> %3
}		}
declare <8 x i32> @llvm.x86.avx2.pmins.d(<8 x i32>, <8 x i32>) nounwind readnone		declare <8 x i32> @llvm.x86.avx2.pmins.d(<8 x i32>, <8 x i32>) nounwind readnone

define <16 x i16> @test_pminsw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_pminsw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_pminsw:		; GENERIC-LABEL: test_pminsw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpminsw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpminsw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpminsw (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpminsw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pminsw:		; HASWELL-LABEL: test_pminsw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpminsw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpminsw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpminsw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpminsw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <16 x i16> %3		ret <16 x i16> %3
}		}
declare <16 x i16> @llvm.x86.avx2.pmins.w(<16 x i16>, <16 x i16>) nounwind readnone		declare <16 x i16> @llvm.x86.avx2.pmins.w(<16 x i16>, <16 x i16>) nounwind readnone

define <32 x i8> @test_pminub(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {		define <32 x i8> @test_pminub(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {
; GENERIC-LABEL: test_pminub:		; GENERIC-LABEL: test_pminub:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpminub %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpminub %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpminub (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpminub (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pminub:		; HASWELL-LABEL: test_pminub:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpminub %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpminub %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpminub (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpminub (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <32 x i8> %3		ret <32 x i8> %3
}		}
declare <32 x i8> @llvm.x86.avx2.pminu.b(<32 x i8>, <32 x i8>) nounwind readnone		declare <32 x i8> @llvm.x86.avx2.pminu.b(<32 x i8>, <32 x i8>) nounwind readnone

define <8 x i32> @test_pminud(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {		define <8 x i32> @test_pminud(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
; GENERIC-LABEL: test_pminud:		; GENERIC-LABEL: test_pminud:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpminud %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpminud %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpminud (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpminud (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pminud:		; HASWELL-LABEL: test_pminud:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpminud %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpminud %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpminud (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpminud (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <8 x i32> %3		ret <8 x i32> %3
}		}
declare <8 x i32> @llvm.x86.avx2.pminu.d(<8 x i32>, <8 x i32>) nounwind readnone		declare <8 x i32> @llvm.x86.avx2.pminu.d(<8 x i32>, <8 x i32>) nounwind readnone

define <16 x i16> @test_pminuw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_pminuw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_pminuw:		; GENERIC-LABEL: test_pminuw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpminuw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpminuw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpminuw (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpminuw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pminuw:		; HASWELL-LABEL: test_pminuw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpminuw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpminuw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpminuw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpminuw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i32 %1		ret i32 %1
}		}
declare i32 @llvm.x86.avx2.pmovmskb(<32 x i8>) nounwind readnone		declare i32 @llvm.x86.avx2.pmovmskb(<32 x i8>) nounwind readnone

define <8 x i32> @test_pmovsxbd(<16 x i8> %a0, <16 x i8> *%a1) {		define <8 x i32> @test_pmovsxbd(<16 x i8> %a0, <16 x i8> *%a1) {
; GENERIC-LABEL: test_pmovsxbd:		; GENERIC-LABEL: test_pmovsxbd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmovsxbd %xmm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpmovsxbd %xmm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovsxbd (%rdi), %ymm1 # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxbd (%rdi), %ymm1 # sched: [6:1.00]
; GENERIC-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmovsxbd:		; HASWELL-LABEL: test_pmovsxbd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmovsxbd %xmm0, %ymm0 # sched: [3:1.00]		; HASWELL-NEXT: vpmovsxbd %xmm0, %ymm0 # sched: [3:1.00]
; HASWELL-NEXT: vpmovsxbd (%rdi), %ymm1 # sched: [8:1.00]		; HASWELL-NEXT: vpmovsxbd (%rdi), %ymm1 # sched: [8:1.00]
; HASWELL-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 34 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%6 = add <8 x i32> %2, %5		%6 = add <8 x i32> %2, %5
ret <8 x i32> %6		ret <8 x i32> %6
}		}

define <4 x i64> @test_pmovsxbq(<16 x i8> %a0, <16 x i8> *%a1) {		define <4 x i64> @test_pmovsxbq(<16 x i8> %a0, <16 x i8> *%a1) {
; GENERIC-LABEL: test_pmovsxbq:		; GENERIC-LABEL: test_pmovsxbq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmovsxbq %xmm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpmovsxbq %xmm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovsxbq (%rdi), %ymm1 # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxbq (%rdi), %ymm1 # sched: [6:1.00]
; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmovsxbq:		; HASWELL-LABEL: test_pmovsxbq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmovsxbq %xmm0, %ymm0 # sched: [3:1.00]		; HASWELL-NEXT: vpmovsxbq %xmm0, %ymm0 # sched: [3:1.00]
; HASWELL-NEXT: vpmovsxbq (%rdi), %ymm1 # sched: [8:1.00]		; HASWELL-NEXT: vpmovsxbq (%rdi), %ymm1 # sched: [8:1.00]
; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 34 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%6 = add <4 x i64> %2, %5		%6 = add <4 x i64> %2, %5
ret <4 x i64> %6		ret <4 x i64> %6
}		}

define <16 x i16> @test_pmovsxbw(<16 x i8> %a0, <16 x i8> *%a1) {		define <16 x i16> @test_pmovsxbw(<16 x i8> %a0, <16 x i8> *%a1) {
; GENERIC-LABEL: test_pmovsxbw:		; GENERIC-LABEL: test_pmovsxbw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmovsxbw %xmm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpmovsxbw %xmm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovsxbw (%rdi), %ymm1 # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxbw (%rdi), %ymm1 # sched: [6:1.00]
; GENERIC-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmovsxbw:		; HASWELL-LABEL: test_pmovsxbw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmovsxbw %xmm0, %ymm0 # sched: [3:1.00]		; HASWELL-NEXT: vpmovsxbw %xmm0, %ymm0 # sched: [3:1.00]
; HASWELL-NEXT: vpmovsxbw (%rdi), %ymm1 # sched: [9:1.00]		; HASWELL-NEXT: vpmovsxbw (%rdi), %ymm1 # sched: [9:1.00]
; HASWELL-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <16 x i16> %1, %3		%4 = add <16 x i16> %1, %3
ret <16 x i16> %4		ret <16 x i16> %4
}		}

define <4 x i64> @test_pmovsxdq(<4 x i32> %a0, <4 x i32> *%a1) {		define <4 x i64> @test_pmovsxdq(<4 x i32> %a0, <4 x i32> *%a1) {
; GENERIC-LABEL: test_pmovsxdq:		; GENERIC-LABEL: test_pmovsxdq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmovsxdq %xmm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpmovsxdq %xmm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovsxdq (%rdi), %ymm1 # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxdq (%rdi), %ymm1 # sched: [6:1.00]
; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmovsxdq:		; HASWELL-LABEL: test_pmovsxdq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmovsxdq %xmm0, %ymm0 # sched: [3:1.00]		; HASWELL-NEXT: vpmovsxdq %xmm0, %ymm0 # sched: [3:1.00]
; HASWELL-NEXT: vpmovsxdq (%rdi), %ymm1 # sched: [9:1.00]		; HASWELL-NEXT: vpmovsxdq (%rdi), %ymm1 # sched: [9:1.00]
; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <4 x i64> %1, %3		%4 = add <4 x i64> %1, %3
ret <4 x i64> %4		ret <4 x i64> %4
}		}

define <8 x i32> @test_pmovsxwd(<8 x i16> %a0, <8 x i16> *%a1) {		define <8 x i32> @test_pmovsxwd(<8 x i16> %a0, <8 x i16> *%a1) {
; GENERIC-LABEL: test_pmovsxwd:		; GENERIC-LABEL: test_pmovsxwd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmovsxwd %xmm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpmovsxwd %xmm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovsxwd (%rdi), %ymm1 # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxwd (%rdi), %ymm1 # sched: [6:1.00]
; GENERIC-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmovsxwd:		; HASWELL-LABEL: test_pmovsxwd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmovsxwd %xmm0, %ymm0 # sched: [3:1.00]		; HASWELL-NEXT: vpmovsxwd %xmm0, %ymm0 # sched: [3:1.00]
; HASWELL-NEXT: vpmovsxwd (%rdi), %ymm1 # sched: [9:1.00]		; HASWELL-NEXT: vpmovsxwd (%rdi), %ymm1 # sched: [9:1.00]
; HASWELL-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <8 x i32> %1, %3		%4 = add <8 x i32> %1, %3
ret <8 x i32> %4		ret <8 x i32> %4
}		}

define <4 x i64> @test_pmovsxwq(<8 x i16> %a0, <8 x i16> *%a1) {		define <4 x i64> @test_pmovsxwq(<8 x i16> %a0, <8 x i16> *%a1) {
; GENERIC-LABEL: test_pmovsxwq:		; GENERIC-LABEL: test_pmovsxwq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmovsxwq %xmm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpmovsxwq %xmm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovsxwq (%rdi), %ymm1 # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxwq (%rdi), %ymm1 # sched: [6:1.00]
; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmovsxwq:		; HASWELL-LABEL: test_pmovsxwq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmovsxwq %xmm0, %ymm0 # sched: [3:1.00]		; HASWELL-NEXT: vpmovsxwq %xmm0, %ymm0 # sched: [3:1.00]
; HASWELL-NEXT: vpmovsxwq (%rdi), %ymm1 # sched: [8:1.00]		; HASWELL-NEXT: vpmovsxwq (%rdi), %ymm1 # sched: [8:1.00]
; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 34 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%6 = add <4 x i64> %2, %5		%6 = add <4 x i64> %2, %5
ret <4 x i64> %6		ret <4 x i64> %6
}		}

define <8 x i32> @test_pmovzxbd(<16 x i8> %a0, <16 x i8> *%a1) {		define <8 x i32> @test_pmovzxbd(<16 x i8> %a0, <16 x i8> *%a1) {
; GENERIC-LABEL: test_pmovzxbd:		; GENERIC-LABEL: test_pmovzxbd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmovzxbd {{.*#+}} ymm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero,xmm0[2],zero,zero,zero,xmm0[3],zero,zero,zero,xmm0[4],zero,zero,zero,xmm0[5],zero,zero,zero,xmm0[6],zero,zero,zero,xmm0[7],zero,zero,zero sched: [1:1.00]		; GENERIC-NEXT: vpmovzxbd {{.*#+}} ymm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero,xmm0[2],zero,zero,zero,xmm0[3],zero,zero,zero,xmm0[4],zero,zero,zero,xmm0[5],zero,zero,zero,xmm0[6],zero,zero,zero,xmm0[7],zero,zero,zero sched: [1:1.00]
; GENERIC-NEXT: vpmovzxbd {{.*#+}} ymm1 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero,mem[4],zero,zero,zero,mem[5],zero,zero,zero,mem[6],zero,zero,zero,mem[7],zero,zero,zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxbd {{.*#+}} ymm1 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero,mem[4],zero,zero,zero,mem[5],zero,zero,zero,mem[6],zero,zero,zero,mem[7],zero,zero,zero sched: [6:1.00]
; GENERIC-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmovzxbd:		; HASWELL-LABEL: test_pmovzxbd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmovzxbd {{.*#+}} ymm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero,xmm0[2],zero,zero,zero,xmm0[3],zero,zero,zero,xmm0[4],zero,zero,zero,xmm0[5],zero,zero,zero,xmm0[6],zero,zero,zero,xmm0[7],zero,zero,zero sched: [3:1.00]		; HASWELL-NEXT: vpmovzxbd {{.*#+}} ymm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero,xmm0[2],zero,zero,zero,xmm0[3],zero,zero,zero,xmm0[4],zero,zero,zero,xmm0[5],zero,zero,zero,xmm0[6],zero,zero,zero,xmm0[7],zero,zero,zero sched: [3:1.00]
; HASWELL-NEXT: vpmovzxbd {{.*#+}} ymm1 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero,mem[4],zero,zero,zero,mem[5],zero,zero,zero,mem[6],zero,zero,zero,mem[7],zero,zero,zero sched: [10:1.00]		; HASWELL-NEXT: vpmovzxbd {{.*#+}} ymm1 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero,mem[4],zero,zero,zero,mem[5],zero,zero,zero,mem[6],zero,zero,zero,mem[7],zero,zero,zero sched: [10:1.00]
; HASWELL-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 34 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%6 = add <8 x i32> %2, %5		%6 = add <8 x i32> %2, %5
ret <8 x i32> %6		ret <8 x i32> %6
}		}

define <4 x i64> @test_pmovzxbq(<16 x i8> %a0, <16 x i8> *%a1) {		define <4 x i64> @test_pmovzxbq(<16 x i8> %a0, <16 x i8> *%a1) {
; GENERIC-LABEL: test_pmovzxbq:		; GENERIC-LABEL: test_pmovzxbq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmovzxbq {{.*#+}} ymm0 = xmm0[0],zero,zero,zero,zero,zero,zero,zero,xmm0[1],zero,zero,zero,zero,zero,zero,zero,xmm0[2],zero,zero,zero,zero,zero,zero,zero,xmm0[3],zero,zero,zero,zero,zero,zero,zero sched: [1:1.00]		; GENERIC-NEXT: vpmovzxbq {{.*#+}} ymm0 = xmm0[0],zero,zero,zero,zero,zero,zero,zero,xmm0[1],zero,zero,zero,zero,zero,zero,zero,xmm0[2],zero,zero,zero,zero,zero,zero,zero,xmm0[3],zero,zero,zero,zero,zero,zero,zero sched: [1:1.00]
; GENERIC-NEXT: vpmovzxbq {{.*#+}} ymm1 = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero,mem[2],zero,zero,zero,zero,zero,zero,zero,mem[3],zero,zero,zero,zero,zero,zero,zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxbq {{.*#+}} ymm1 = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero,mem[2],zero,zero,zero,zero,zero,zero,zero,mem[3],zero,zero,zero,zero,zero,zero,zero sched: [6:1.00]
; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmovzxbq:		; HASWELL-LABEL: test_pmovzxbq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmovzxbq {{.*#+}} ymm0 = xmm0[0],zero,zero,zero,zero,zero,zero,zero,xmm0[1],zero,zero,zero,zero,zero,zero,zero,xmm0[2],zero,zero,zero,zero,zero,zero,zero,xmm0[3],zero,zero,zero,zero,zero,zero,zero sched: [3:1.00]		; HASWELL-NEXT: vpmovzxbq {{.*#+}} ymm0 = xmm0[0],zero,zero,zero,zero,zero,zero,zero,xmm0[1],zero,zero,zero,zero,zero,zero,zero,xmm0[2],zero,zero,zero,zero,zero,zero,zero,xmm0[3],zero,zero,zero,zero,zero,zero,zero sched: [3:1.00]
; HASWELL-NEXT: vpmovzxbq {{.*#+}} ymm1 = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero,mem[2],zero,zero,zero,zero,zero,zero,zero,mem[3],zero,zero,zero,zero,zero,zero,zero sched: [10:1.00]		; HASWELL-NEXT: vpmovzxbq {{.*#+}} ymm1 = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero,mem[2],zero,zero,zero,zero,zero,zero,zero,mem[3],zero,zero,zero,zero,zero,zero,zero sched: [10:1.00]
; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 34 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%6 = add <4 x i64> %2, %5		%6 = add <4 x i64> %2, %5
ret <4 x i64> %6		ret <4 x i64> %6
}		}

define <16 x i16> @test_pmovzxbw(<16 x i8> %a0, <16 x i8> *%a1) {		define <16 x i16> @test_pmovzxbw(<16 x i8> %a0, <16 x i8> *%a1) {
; GENERIC-LABEL: test_pmovzxbw:		; GENERIC-LABEL: test_pmovzxbw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmovzxbw {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero,xmm0[8],zero,xmm0[9],zero,xmm0[10],zero,xmm0[11],zero,xmm0[12],zero,xmm0[13],zero,xmm0[14],zero,xmm0[15],zero sched: [1:1.00]		; GENERIC-NEXT: vpmovzxbw {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero,xmm0[8],zero,xmm0[9],zero,xmm0[10],zero,xmm0[11],zero,xmm0[12],zero,xmm0[13],zero,xmm0[14],zero,xmm0[15],zero sched: [1:1.00]
; GENERIC-NEXT: vpmovzxbw {{.*#+}} ymm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero,mem[8],zero,mem[9],zero,mem[10],zero,mem[11],zero,mem[12],zero,mem[13],zero,mem[14],zero,mem[15],zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxbw {{.*#+}} ymm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero,mem[8],zero,mem[9],zero,mem[10],zero,mem[11],zero,mem[12],zero,mem[13],zero,mem[14],zero,mem[15],zero sched: [6:1.00]
; GENERIC-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmovzxbw:		; HASWELL-LABEL: test_pmovzxbw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmovzxbw {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero,xmm0[8],zero,xmm0[9],zero,xmm0[10],zero,xmm0[11],zero,xmm0[12],zero,xmm0[13],zero,xmm0[14],zero,xmm0[15],zero sched: [3:1.00]		; HASWELL-NEXT: vpmovzxbw {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero,xmm0[8],zero,xmm0[9],zero,xmm0[10],zero,xmm0[11],zero,xmm0[12],zero,xmm0[13],zero,xmm0[14],zero,xmm0[15],zero sched: [3:1.00]
; HASWELL-NEXT: vpmovzxbw {{.*#+}} ymm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero,mem[8],zero,mem[9],zero,mem[10],zero,mem[11],zero,mem[12],zero,mem[13],zero,mem[14],zero,mem[15],zero sched: [10:1.00]		; HASWELL-NEXT: vpmovzxbw {{.*#+}} ymm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero,mem[8],zero,mem[9],zero,mem[10],zero,mem[11],zero,mem[12],zero,mem[13],zero,mem[14],zero,mem[15],zero sched: [10:1.00]
; HASWELL-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <16 x i16> %1, %3		%4 = add <16 x i16> %1, %3
ret <16 x i16> %4		ret <16 x i16> %4
}		}

define <4 x i64> @test_pmovzxdq(<4 x i32> %a0, <4 x i32> *%a1) {		define <4 x i64> @test_pmovzxdq(<4 x i32> %a0, <4 x i32> *%a1) {
; GENERIC-LABEL: test_pmovzxdq:		; GENERIC-LABEL: test_pmovzxdq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmovzxdq {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero sched: [1:1.00]		; GENERIC-NEXT: vpmovzxdq {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero sched: [1:1.00]
; GENERIC-NEXT: vpmovzxdq {{.*#+}} ymm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxdq {{.*#+}} ymm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero sched: [6:1.00]
; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmovzxdq:		; HASWELL-LABEL: test_pmovzxdq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmovzxdq {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero sched: [3:1.00]		; HASWELL-NEXT: vpmovzxdq {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero sched: [3:1.00]
; HASWELL-NEXT: vpmovzxdq {{.*#+}} ymm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero sched: [10:1.00]		; HASWELL-NEXT: vpmovzxdq {{.*#+}} ymm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero sched: [10:1.00]
; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <4 x i64> %1, %3		%4 = add <4 x i64> %1, %3
ret <4 x i64> %4		ret <4 x i64> %4
}		}

define <8 x i32> @test_pmovzxwd(<8 x i16> %a0, <8 x i16> *%a1) {		define <8 x i32> @test_pmovzxwd(<8 x i16> %a0, <8 x i16> *%a1) {
; GENERIC-LABEL: test_pmovzxwd:		; GENERIC-LABEL: test_pmovzxwd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero sched: [1:1.00]		; GENERIC-NEXT: vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero sched: [1:1.00]
; GENERIC-NEXT: vpmovzxwd {{.*#+}} ymm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxwd {{.*#+}} ymm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero sched: [6:1.00]
; GENERIC-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmovzxwd:		; HASWELL-LABEL: test_pmovzxwd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero sched: [3:1.00]		; HASWELL-NEXT: vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero sched: [3:1.00]
; HASWELL-NEXT: vpmovzxwd {{.*#+}} ymm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero sched: [9:1.00]		; HASWELL-NEXT: vpmovzxwd {{.*#+}} ymm1 = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero sched: [9:1.00]
; HASWELL-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <8 x i32> %1, %3		%4 = add <8 x i32> %1, %3
ret <8 x i32> %4		ret <8 x i32> %4
}		}

define <4 x i64> @test_pmovzxwq(<8 x i16> %a0, <8 x i16> *%a1) {		define <4 x i64> @test_pmovzxwq(<8 x i16> %a0, <8 x i16> *%a1) {
; GENERIC-LABEL: test_pmovzxwq:		; GENERIC-LABEL: test_pmovzxwq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmovzxwq {{.*#+}} ymm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero,xmm0[2],zero,zero,zero,xmm0[3],zero,zero,zero sched: [1:1.00]		; GENERIC-NEXT: vpmovzxwq {{.*#+}} ymm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero,xmm0[2],zero,zero,zero,xmm0[3],zero,zero,zero sched: [1:1.00]
; GENERIC-NEXT: vpmovzxwq {{.*#+}} ymm1 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxwq {{.*#+}} ymm1 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero sched: [6:1.00]
; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmovzxwq:		; HASWELL-LABEL: test_pmovzxwq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmovzxwq {{.*#+}} ymm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero,xmm0[2],zero,zero,zero,xmm0[3],zero,zero,zero sched: [3:1.00]		; HASWELL-NEXT: vpmovzxwq {{.*#+}} ymm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero,xmm0[2],zero,zero,zero,xmm0[3],zero,zero,zero sched: [3:1.00]
; HASWELL-NEXT: vpmovzxwq {{.*#+}} ymm1 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero sched: [10:1.00]		; HASWELL-NEXT: vpmovzxwq {{.*#+}} ymm1 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero sched: [10:1.00]
; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 34 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%6 = add <4 x i64> %2, %5		%6 = add <4 x i64> %2, %5
ret <4 x i64> %6		ret <4 x i64> %6
}		}

define <4 x i64> @test_pmuldq(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {		define <4 x i64> @test_pmuldq(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
; GENERIC-LABEL: test_pmuldq:		; GENERIC-LABEL: test_pmuldq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmuldq %ymm1, %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmuldq %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
; GENERIC-NEXT: vpmuldq (%rdi), %ymm0, %ymm0 # sched: [9:1.00]		; GENERIC-NEXT: vpmuldq (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmuldq:		; HASWELL-LABEL: test_pmuldq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmuldq %ymm1, %ymm0, %ymm0 # sched: [5:1.00]		; HASWELL-NEXT: vpmuldq %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
; HASWELL-NEXT: vpmuldq (%rdi), %ymm0, %ymm0 # sched: [12:1.00]		; HASWELL-NEXT: vpmuldq (%rdi), %ymm0, %ymm0 # sched: [12:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 27 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <4 x i64> %4		ret <4 x i64> %4
}		}
declare <4 x i64> @llvm.x86.avx2.pmul.dq(<8 x i32>, <8 x i32>) nounwind readnone		declare <4 x i64> @llvm.x86.avx2.pmul.dq(<8 x i32>, <8 x i32>) nounwind readnone

define <16 x i16> @test_pmulhrsw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_pmulhrsw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_pmulhrsw:		; GENERIC-LABEL: test_pmulhrsw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmulhrsw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmulhrsw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
; GENERIC-NEXT: vpmulhrsw (%rdi), %ymm0, %ymm0 # sched: [9:1.00]		; GENERIC-NEXT: vpmulhrsw (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmulhrsw:		; HASWELL-LABEL: test_pmulhrsw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmulhrsw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]		; HASWELL-NEXT: vpmulhrsw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
; HASWELL-NEXT: vpmulhrsw (%rdi), %ymm0, %ymm0 # sched: [12:1.00]		; HASWELL-NEXT: vpmulhrsw (%rdi), %ymm0, %ymm0 # sched: [12:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <16 x i16> %3		ret <16 x i16> %3
}		}
declare <16 x i16> @llvm.x86.avx2.pmul.hr.sw(<16 x i16>, <16 x i16>) nounwind readnone		declare <16 x i16> @llvm.x86.avx2.pmul.hr.sw(<16 x i16>, <16 x i16>) nounwind readnone

define <16 x i16> @test_pmulhuw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_pmulhuw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_pmulhuw:		; GENERIC-LABEL: test_pmulhuw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmulhuw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmulhuw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
; GENERIC-NEXT: vpmulhuw (%rdi), %ymm0, %ymm0 # sched: [9:1.00]		; GENERIC-NEXT: vpmulhuw (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmulhuw:		; HASWELL-LABEL: test_pmulhuw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmulhuw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]		; HASWELL-NEXT: vpmulhuw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
; HASWELL-NEXT: vpmulhuw (%rdi), %ymm0, %ymm0 # sched: [12:1.00]		; HASWELL-NEXT: vpmulhuw (%rdi), %ymm0, %ymm0 # sched: [12:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <16 x i16> %3		ret <16 x i16> %3
}		}
declare <16 x i16> @llvm.x86.avx2.pmulhu.w(<16 x i16>, <16 x i16>) nounwind readnone		declare <16 x i16> @llvm.x86.avx2.pmulhu.w(<16 x i16>, <16 x i16>) nounwind readnone

define <16 x i16> @test_pmulhw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_pmulhw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_pmulhw:		; GENERIC-LABEL: test_pmulhw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmulhw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmulhw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
; GENERIC-NEXT: vpmulhw (%rdi), %ymm0, %ymm0 # sched: [9:1.00]		; GENERIC-NEXT: vpmulhw (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmulhw:		; HASWELL-LABEL: test_pmulhw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmulhw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]		; HASWELL-NEXT: vpmulhw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
; HASWELL-NEXT: vpmulhw (%rdi), %ymm0, %ymm0 # sched: [12:1.00]		; HASWELL-NEXT: vpmulhw (%rdi), %ymm0, %ymm0 # sched: [12:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%3 = mul <8 x i32> %1, %2		%3 = mul <8 x i32> %1, %2
ret <8 x i32> %3		ret <8 x i32> %3
}		}

define <16 x i16> @test_pmullw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_pmullw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_pmullw:		; GENERIC-LABEL: test_pmullw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmullw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmullw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
; GENERIC-NEXT: vpmullw (%rdi), %ymm0, %ymm0 # sched: [9:1.00]		; GENERIC-NEXT: vpmullw (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmullw:		; HASWELL-LABEL: test_pmullw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmullw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]		; HASWELL-NEXT: vpmullw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
; HASWELL-NEXT: vpmullw (%rdi), %ymm0, %ymm0 # sched: [12:1.00]		; HASWELL-NEXT: vpmullw (%rdi), %ymm0, %ymm0 # sched: [12:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 25 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%3 = mul <16 x i16> %1, %2		%3 = mul <16 x i16> %1, %2
ret <16 x i16> %3		ret <16 x i16> %3
}		}

define <4 x i64> @test_pmuludq(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {		define <4 x i64> @test_pmuludq(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
; GENERIC-LABEL: test_pmuludq:		; GENERIC-LABEL: test_pmuludq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmuludq %ymm1, %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmuludq %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
; GENERIC-NEXT: vpmuludq (%rdi), %ymm0, %ymm0 # sched: [9:1.00]		; GENERIC-NEXT: vpmuludq (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmuludq:		; HASWELL-LABEL: test_pmuludq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpmuludq %ymm1, %ymm0, %ymm0 # sched: [5:1.00]		; HASWELL-NEXT: vpmuludq %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
; HASWELL-NEXT: vpmuludq (%rdi), %ymm0, %ymm0 # sched: [12:1.00]		; HASWELL-NEXT: vpmuludq (%rdi), %ymm0, %ymm0 # sched: [12:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 27 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <4 x i64> %4		ret <4 x i64> %4
}		}
declare <4 x i64> @llvm.x86.avx2.pmulu.dq(<8 x i32>, <8 x i32>) nounwind readnone		declare <4 x i64> @llvm.x86.avx2.pmulu.dq(<8 x i32>, <8 x i32>) nounwind readnone

define <4 x i64> @test_por(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {		define <4 x i64> @test_por(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {
; GENERIC-LABEL: test_por:		; GENERIC-LABEL: test_por:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpor (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpor (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_por:		; HASWELL-LABEL: test_por:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]		; HASWELL-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]
; HASWELL-NEXT: vpor (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpor (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <4 x i64> %3, %a1		%4 = add <4 x i64> %3, %a1
ret <4 x i64> %4		ret <4 x i64> %4
}		}

define <4 x i64> @test_psadbw(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {		define <4 x i64> @test_psadbw(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {
; GENERIC-LABEL: test_psadbw:		; GENERIC-LABEL: test_psadbw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsadbw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpsadbw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpsadbw (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpsadbw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psadbw:		; HASWELL-LABEL: test_psadbw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsadbw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]		; HASWELL-NEXT: vpsadbw %ymm1, %ymm0, %ymm0 # sched: [5:1.00]
; HASWELL-NEXT: vpsadbw (%rdi), %ymm0, %ymm0 # sched: [12:1.00]		; HASWELL-NEXT: vpsadbw (%rdi), %ymm0, %ymm0 # sched: [12:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 27 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <4 x i64> %4		ret <4 x i64> %4
}		}
declare <4 x i64> @llvm.x86.avx2.psad.bw(<32 x i8>, <32 x i8>) nounwind readnone		declare <4 x i64> @llvm.x86.avx2.psad.bw(<32 x i8>, <32 x i8>) nounwind readnone

define <32 x i8> @test_pshufb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {		define <32 x i8> @test_pshufb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {
; GENERIC-LABEL: test_pshufb:		; GENERIC-LABEL: test_pshufb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpshufb %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpshufb %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpshufb (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pshufb:		; HASWELL-LABEL: test_pshufb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpshufb %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; HASWELL-NEXT: vpshufb %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; HASWELL-NEXT: vpshufb (%rdi), %ymm0, %ymm0 # sched: [8:1.00]		; HASWELL-NEXT: vpshufb (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <32 x i8> %3		ret <32 x i8> %3
}		}
declare <32 x i8> @llvm.x86.avx2.pshuf.b(<32 x i8>, <32 x i8>) nounwind readnone		declare <32 x i8> @llvm.x86.avx2.pshuf.b(<32 x i8>, <32 x i8>) nounwind readnone

define <8 x i32> @test_pshufd(<8 x i32> %a0, <8 x i32> *%a1) {		define <8 x i32> @test_pshufd(<8 x i32> %a0, <8 x i32> *%a1) {
; GENERIC-LABEL: test_pshufd:		; GENERIC-LABEL: test_pshufd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpshufd {{.*#+}} ymm0 = ymm0[3,2,1,0,7,6,5,4] sched: [1:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} ymm0 = ymm0[3,2,1,0,7,6,5,4] sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} ymm1 = mem[1,0,3,2,5,4,7,6] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} ymm1 = mem[1,0,3,2,5,4,7,6] sched: [6:1.00]
; GENERIC-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pshufd:		; HASWELL-LABEL: test_pshufd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpshufd {{.*#+}} ymm0 = ymm0[3,2,1,0,7,6,5,4] sched: [1:1.00]		; HASWELL-NEXT: vpshufd {{.*#+}} ymm0 = ymm0[3,2,1,0,7,6,5,4] sched: [1:1.00]
; HASWELL-NEXT: vpshufd {{.*#+}} ymm1 = mem[1,0,3,2,5,4,7,6] sched: [8:1.00]		; HASWELL-NEXT: vpshufd {{.*#+}} ymm1 = mem[1,0,3,2,5,4,7,6] sched: [8:1.00]
; HASWELL-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <8 x i32> %1, %3		%4 = add <8 x i32> %1, %3
ret <8 x i32> %4		ret <8 x i32> %4
}		}

define <16 x i16> @test_pshufhw(<16 x i16> %a0, <16 x i16> *%a1) {		define <16 x i16> @test_pshufhw(<16 x i16> %a0, <16 x i16> *%a1) {
; GENERIC-LABEL: test_pshufhw:		; GENERIC-LABEL: test_pshufhw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpshufhw {{.*#+}} ymm0 = ymm0[0,1,2,3,7,6,5,4,8,9,10,11,15,14,13,12] sched: [1:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} ymm0 = ymm0[0,1,2,3,7,6,5,4,8,9,10,11,15,14,13,12] sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} ymm1 = mem[0,1,2,3,5,4,7,6,8,9,10,11,13,12,15,14] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} ymm1 = mem[0,1,2,3,5,4,7,6,8,9,10,11,13,12,15,14] sched: [6:1.00]
; GENERIC-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pshufhw:		; HASWELL-LABEL: test_pshufhw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpshufhw {{.*#+}} ymm0 = ymm0[0,1,2,3,7,6,5,4,8,9,10,11,15,14,13,12] sched: [1:1.00]		; HASWELL-NEXT: vpshufhw {{.*#+}} ymm0 = ymm0[0,1,2,3,7,6,5,4,8,9,10,11,15,14,13,12] sched: [1:1.00]
; HASWELL-NEXT: vpshufhw {{.*#+}} ymm1 = mem[0,1,2,3,5,4,7,6,8,9,10,11,13,12,15,14] sched: [8:1.00]		; HASWELL-NEXT: vpshufhw {{.*#+}} ymm1 = mem[0,1,2,3,5,4,7,6,8,9,10,11,13,12,15,14] sched: [8:1.00]
; HASWELL-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]		; HASWELL-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = or <16 x i16> %1, %3		%4 = or <16 x i16> %1, %3
ret <16 x i16> %4		ret <16 x i16> %4
}		}

define <16 x i16> @test_pshuflw(<16 x i16> %a0, <16 x i16> *%a1) {		define <16 x i16> @test_pshuflw(<16 x i16> %a0, <16 x i16> *%a1) {
; GENERIC-LABEL: test_pshuflw:		; GENERIC-LABEL: test_pshuflw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpshuflw {{.*#+}} ymm0 = ymm0[3,2,1,0,4,5,6,7,11,10,9,8,12,13,14,15] sched: [1:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} ymm0 = ymm0[3,2,1,0,4,5,6,7,11,10,9,8,12,13,14,15] sched: [1:1.00]
; GENERIC-NEXT: vpshuflw {{.*#+}} ymm1 = mem[1,0,3,2,4,5,6,7,9,8,11,10,12,13,14,15] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} ymm1 = mem[1,0,3,2,4,5,6,7,9,8,11,10,12,13,14,15] sched: [6:1.00]
; GENERIC-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pshuflw:		; HASWELL-LABEL: test_pshuflw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpshuflw {{.*#+}} ymm0 = ymm0[3,2,1,0,4,5,6,7,11,10,9,8,12,13,14,15] sched: [1:1.00]		; HASWELL-NEXT: vpshuflw {{.*#+}} ymm0 = ymm0[3,2,1,0,4,5,6,7,11,10,9,8,12,13,14,15] sched: [1:1.00]
; HASWELL-NEXT: vpshuflw {{.*#+}} ymm1 = mem[1,0,3,2,4,5,6,7,9,8,11,10,12,13,14,15] sched: [8:1.00]		; HASWELL-NEXT: vpshuflw {{.*#+}} ymm1 = mem[1,0,3,2,4,5,6,7,9,8,11,10,12,13,14,15] sched: [8:1.00]
; HASWELL-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]		; HASWELL-NEXT: vpor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = or <16 x i16> %1, %3		%4 = or <16 x i16> %1, %3
ret <16 x i16> %4		ret <16 x i16> %4
}		}

define <32 x i8> @test_psignb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {		define <32 x i8> @test_psignb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {
; GENERIC-LABEL: test_psignb:		; GENERIC-LABEL: test_psignb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsignb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpsignb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpsignb (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpsignb (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psignb:		; HASWELL-LABEL: test_psignb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsignb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpsignb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpsignb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpsignb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <32 x i8> %3		ret <32 x i8> %3
}		}
declare <32 x i8> @llvm.x86.avx2.psign.b(<32 x i8>, <32 x i8>) nounwind readnone		declare <32 x i8> @llvm.x86.avx2.psign.b(<32 x i8>, <32 x i8>) nounwind readnone

define <8 x i32> @test_psignd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {		define <8 x i32> @test_psignd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
; GENERIC-LABEL: test_psignd:		; GENERIC-LABEL: test_psignd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsignd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpsignd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpsignd (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpsignd (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psignd:		; HASWELL-LABEL: test_psignd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsignd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpsignd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpsignd (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpsignd (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <8 x i32> %3		ret <8 x i32> %3
}		}
declare <8 x i32> @llvm.x86.avx2.psign.d(<8 x i32>, <8 x i32>) nounwind readnone		declare <8 x i32> @llvm.x86.avx2.psign.d(<8 x i32>, <8 x i32>) nounwind readnone

define <16 x i16> @test_psignw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_psignw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_psignw:		; GENERIC-LABEL: test_psignw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsignw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpsignw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpsignw (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpsignw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psignw:		; HASWELL-LABEL: test_psignw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsignw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpsignw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpsignw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpsignw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <16 x i16> %3		ret <16 x i16> %3
}		}
declare <16 x i16> @llvm.x86.avx2.psign.w(<16 x i16>, <16 x i16>) nounwind readnone		declare <16 x i16> @llvm.x86.avx2.psign.w(<16 x i16>, <16 x i16>) nounwind readnone

define <8 x i32> @test_pslld(<8 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {		define <8 x i32> @test_pslld(<8 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {
; GENERIC-LABEL: test_pslld:		; GENERIC-LABEL: test_pslld:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpslld %xmm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpslld %xmm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpslld (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpslld (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: vpslld $2, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpslld $2, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pslld:		; HASWELL-LABEL: test_pslld:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpslld %xmm1, %ymm0, %ymm0 # sched: [4:1.00]		; HASWELL-NEXT: vpslld %xmm1, %ymm0, %ymm0 # sched: [4:1.00]
; HASWELL-NEXT: vpslld (%rdi), %ymm0, %ymm0 # sched: [8:1.00]		; HASWELL-NEXT: vpslld (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; HASWELL-NEXT: vpslld $2, %ymm0, %ymm0 # sched: [1:1.00]		; HASWELL-NEXT: vpslld $2, %ymm0, %ymm0 # sched: [1:1.00]
▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%1 = shufflevector <32 x i8> zeroinitializer, <32 x i8> %a0, <32 x i32> <i32 13, i32 14, i32 15, i32 32, i32 33, i32 34, i32 35, i32 36, i32 37, i32 38, i32 39, i32 40, i32 41, i32 42, i32 43, i32 44, i32 29, i32 30, i32 31, i32 48, i32 49, i32 50, i32 51, i32 52, i32 53, i32 54, i32 55, i32 56, i32 57, i32 58, i32 59, i32 60>		%1 = shufflevector <32 x i8> zeroinitializer, <32 x i8> %a0, <32 x i32> <i32 13, i32 14, i32 15, i32 32, i32 33, i32 34, i32 35, i32 36, i32 37, i32 38, i32 39, i32 40, i32 41, i32 42, i32 43, i32 44, i32 29, i32 30, i32 31, i32 48, i32 49, i32 50, i32 51, i32 52, i32 53, i32 54, i32 55, i32 56, i32 57, i32 58, i32 59, i32 60>
ret <32 x i8> %1		ret <32 x i8> %1
}		}

define <4 x i64> @test_psllq(<4 x i64> %a0, <2 x i64> %a1, <2 x i64> *%a2) {		define <4 x i64> @test_psllq(<4 x i64> %a0, <2 x i64> %a1, <2 x i64> *%a2) {
; GENERIC-LABEL: test_psllq:		; GENERIC-LABEL: test_psllq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllq %xmm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllq %xmm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpsllq (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpsllq (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: vpsllq $2, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllq $2, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psllq:		; HASWELL-LABEL: test_psllq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsllq %xmm1, %ymm0, %ymm0 # sched: [4:1.00]		; HASWELL-NEXT: vpsllq %xmm1, %ymm0, %ymm0 # sched: [4:1.00]
; HASWELL-NEXT: vpsllq (%rdi), %ymm0, %ymm0 # sched: [8:1.00]		; HASWELL-NEXT: vpsllq (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; HASWELL-NEXT: vpsllq $2, %ymm0, %ymm0 # sched: [1:1.00]		; HASWELL-NEXT: vpsllq $2, %ymm0, %ymm0 # sched: [1:1.00]
Show All 33 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <4 x i64> %4		ret <4 x i64> %4
}		}
declare <4 x i64> @llvm.x86.avx2.psll.q(<4 x i64>, <2 x i64>) nounwind readnone		declare <4 x i64> @llvm.x86.avx2.psll.q(<4 x i64>, <2 x i64>) nounwind readnone

define <4 x i32> @test_psllvd(<4 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {		define <4 x i32> @test_psllvd(<4 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {
; GENERIC-LABEL: test_psllvd:		; GENERIC-LABEL: test_psllvd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllvd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllvd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpsllvd (%rdi), %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpsllvd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psllvd:		; HASWELL-LABEL: test_psllvd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsllvd %xmm1, %xmm0, %xmm0 # sched: [3:2.00]		; HASWELL-NEXT: vpsllvd %xmm1, %xmm0, %xmm0 # sched: [3:2.00]
; HASWELL-NEXT: vpsllvd (%rdi), %xmm0, %xmm0 # sched: [9:2.00]		; HASWELL-NEXT: vpsllvd (%rdi), %xmm0, %xmm0 # sched: [9:2.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <4 x i32> %3		ret <4 x i32> %3
}		}
declare <4 x i32> @llvm.x86.avx2.psllv.d(<4 x i32>, <4 x i32>) nounwind readnone		declare <4 x i32> @llvm.x86.avx2.psllv.d(<4 x i32>, <4 x i32>) nounwind readnone

define <8 x i32> @test_psllvd_ymm(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {		define <8 x i32> @test_psllvd_ymm(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
; GENERIC-LABEL: test_psllvd_ymm:		; GENERIC-LABEL: test_psllvd_ymm:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllvd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllvd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpsllvd (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpsllvd (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psllvd_ymm:		; HASWELL-LABEL: test_psllvd_ymm:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsllvd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]		; HASWELL-NEXT: vpsllvd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
; HASWELL-NEXT: vpsllvd (%rdi), %ymm0, %ymm0 # sched: [10:2.00]		; HASWELL-NEXT: vpsllvd (%rdi), %ymm0, %ymm0 # sched: [10:2.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <8 x i32> %3		ret <8 x i32> %3
}		}
declare <8 x i32> @llvm.x86.avx2.psllv.d.256(<8 x i32>, <8 x i32>) nounwind readnone		declare <8 x i32> @llvm.x86.avx2.psllv.d.256(<8 x i32>, <8 x i32>) nounwind readnone

define <2 x i64> @test_psllvq(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> *%a2) {		define <2 x i64> @test_psllvq(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> *%a2) {
; GENERIC-LABEL: test_psllvq:		; GENERIC-LABEL: test_psllvq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllvq %xmm1, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllvq %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpsllvq (%rdi), %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpsllvq (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psllvq:		; HASWELL-LABEL: test_psllvq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsllvq %xmm1, %xmm0, %xmm0 # sched: [1:1.00]		; HASWELL-NEXT: vpsllvq %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
; HASWELL-NEXT: vpsllvq (%rdi), %xmm0, %xmm0 # sched: [7:1.00]		; HASWELL-NEXT: vpsllvq (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <2 x i64> %3		ret <2 x i64> %3
}		}
declare <2 x i64> @llvm.x86.avx2.psllv.q(<2 x i64>, <2 x i64>) nounwind readnone		declare <2 x i64> @llvm.x86.avx2.psllv.q(<2 x i64>, <2 x i64>) nounwind readnone

define <4 x i64> @test_psllvq_ymm(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {		define <4 x i64> @test_psllvq_ymm(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {
; GENERIC-LABEL: test_psllvq_ymm:		; GENERIC-LABEL: test_psllvq_ymm:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllvq %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllvq %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpsllvq (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpsllvq (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psllvq_ymm:		; HASWELL-LABEL: test_psllvq_ymm:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsllvq %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; HASWELL-NEXT: vpsllvq %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; HASWELL-NEXT: vpsllvq (%rdi), %ymm0, %ymm0 # sched: [8:1.00]		; HASWELL-NEXT: vpsllvq (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <4 x i64> %3		ret <4 x i64> %3
}		}
declare <4 x i64> @llvm.x86.avx2.psllv.q.256(<4 x i64>, <4 x i64>) nounwind readnone		declare <4 x i64> @llvm.x86.avx2.psllv.q.256(<4 x i64>, <4 x i64>) nounwind readnone

define <16 x i16> @test_psllw(<16 x i16> %a0, <8 x i16> %a1, <8 x i16> *%a2) {		define <16 x i16> @test_psllw(<16 x i16> %a0, <8 x i16> %a1, <8 x i16> *%a2) {
; GENERIC-LABEL: test_psllw:		; GENERIC-LABEL: test_psllw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw %xmm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw %xmm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpsllw (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpsllw (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: vpsllw $2, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $2, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psllw:		; HASWELL-LABEL: test_psllw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsllw %xmm1, %ymm0, %ymm0 # sched: [4:1.00]		; HASWELL-NEXT: vpsllw %xmm1, %ymm0, %ymm0 # sched: [4:1.00]
; HASWELL-NEXT: vpsllw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]		; HASWELL-NEXT: vpsllw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; HASWELL-NEXT: vpsllw $2, %ymm0, %ymm0 # sched: [1:1.00]		; HASWELL-NEXT: vpsllw $2, %ymm0, %ymm0 # sched: [1:1.00]
Show All 33 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <16 x i16> %4		ret <16 x i16> %4
}		}
declare <16 x i16> @llvm.x86.avx2.psll.w(<16 x i16>, <8 x i16>) nounwind readnone		declare <16 x i16> @llvm.x86.avx2.psll.w(<16 x i16>, <8 x i16>) nounwind readnone

define <8 x i32> @test_psrad(<8 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {		define <8 x i32> @test_psrad(<8 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {
; GENERIC-LABEL: test_psrad:		; GENERIC-LABEL: test_psrad:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsrad %xmm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsrad %xmm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpsrad (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpsrad (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: vpsrad $2, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsrad $2, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psrad:		; HASWELL-LABEL: test_psrad:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsrad %xmm1, %ymm0, %ymm0 # sched: [4:1.00]		; HASWELL-NEXT: vpsrad %xmm1, %ymm0, %ymm0 # sched: [4:1.00]
; HASWELL-NEXT: vpsrad (%rdi), %ymm0, %ymm0 # sched: [8:1.00]		; HASWELL-NEXT: vpsrad (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; HASWELL-NEXT: vpsrad $2, %ymm0, %ymm0 # sched: [1:1.00]		; HASWELL-NEXT: vpsrad $2, %ymm0, %ymm0 # sched: [1:1.00]
Show All 33 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <8 x i32> %4		ret <8 x i32> %4
}		}
declare <8 x i32> @llvm.x86.avx2.psra.d(<8 x i32>, <4 x i32>) nounwind readnone		declare <8 x i32> @llvm.x86.avx2.psra.d(<8 x i32>, <4 x i32>) nounwind readnone

define <4 x i32> @test_psravd(<4 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {		define <4 x i32> @test_psravd(<4 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {
; GENERIC-LABEL: test_psravd:		; GENERIC-LABEL: test_psravd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsravd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsravd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpsravd (%rdi), %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpsravd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psravd:		; HASWELL-LABEL: test_psravd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsravd %xmm1, %xmm0, %xmm0 # sched: [3:2.00]		; HASWELL-NEXT: vpsravd %xmm1, %xmm0, %xmm0 # sched: [3:2.00]
; HASWELL-NEXT: vpsravd (%rdi), %xmm0, %xmm0 # sched: [9:2.00]		; HASWELL-NEXT: vpsravd (%rdi), %xmm0, %xmm0 # sched: [9:2.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <4 x i32> %3		ret <4 x i32> %3
}		}
declare <4 x i32> @llvm.x86.avx2.psrav.d(<4 x i32>, <4 x i32>) nounwind readnone		declare <4 x i32> @llvm.x86.avx2.psrav.d(<4 x i32>, <4 x i32>) nounwind readnone

define <8 x i32> @test_psravd_ymm(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {		define <8 x i32> @test_psravd_ymm(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
; GENERIC-LABEL: test_psravd_ymm:		; GENERIC-LABEL: test_psravd_ymm:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsravd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsravd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpsravd (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpsravd (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psravd_ymm:		; HASWELL-LABEL: test_psravd_ymm:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsravd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]		; HASWELL-NEXT: vpsravd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
; HASWELL-NEXT: vpsravd (%rdi), %ymm0, %ymm0 # sched: [10:2.00]		; HASWELL-NEXT: vpsravd (%rdi), %ymm0, %ymm0 # sched: [10:2.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <8 x i32> %3		ret <8 x i32> %3
}		}
declare <8 x i32> @llvm.x86.avx2.psrav.d.256(<8 x i32>, <8 x i32>) nounwind readnone		declare <8 x i32> @llvm.x86.avx2.psrav.d.256(<8 x i32>, <8 x i32>) nounwind readnone

define <16 x i16> @test_psraw(<16 x i16> %a0, <8 x i16> %a1, <8 x i16> *%a2) {		define <16 x i16> @test_psraw(<16 x i16> %a0, <8 x i16> %a1, <8 x i16> *%a2) {
; GENERIC-LABEL: test_psraw:		; GENERIC-LABEL: test_psraw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsraw %xmm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsraw %xmm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpsraw (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpsraw (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: vpsraw $2, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsraw $2, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psraw:		; HASWELL-LABEL: test_psraw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsraw %xmm1, %ymm0, %ymm0 # sched: [4:1.00]		; HASWELL-NEXT: vpsraw %xmm1, %ymm0, %ymm0 # sched: [4:1.00]
; HASWELL-NEXT: vpsraw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]		; HASWELL-NEXT: vpsraw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; HASWELL-NEXT: vpsraw $2, %ymm0, %ymm0 # sched: [1:1.00]		; HASWELL-NEXT: vpsraw $2, %ymm0, %ymm0 # sched: [1:1.00]
Show All 33 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <16 x i16> %4		ret <16 x i16> %4
}		}
declare <16 x i16> @llvm.x86.avx2.psra.w(<16 x i16>, <8 x i16>) nounwind readnone		declare <16 x i16> @llvm.x86.avx2.psra.w(<16 x i16>, <8 x i16>) nounwind readnone

define <8 x i32> @test_psrld(<8 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {		define <8 x i32> @test_psrld(<8 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {
; GENERIC-LABEL: test_psrld:		; GENERIC-LABEL: test_psrld:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsrld %xmm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsrld %xmm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpsrld (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpsrld (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: vpsrld $2, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsrld $2, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psrld:		; HASWELL-LABEL: test_psrld:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsrld %xmm1, %ymm0, %ymm0 # sched: [4:1.00]		; HASWELL-NEXT: vpsrld %xmm1, %ymm0, %ymm0 # sched: [4:1.00]
; HASWELL-NEXT: vpsrld (%rdi), %ymm0, %ymm0 # sched: [8:1.00]		; HASWELL-NEXT: vpsrld (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; HASWELL-NEXT: vpsrld $2, %ymm0, %ymm0 # sched: [1:1.00]		; HASWELL-NEXT: vpsrld $2, %ymm0, %ymm0 # sched: [1:1.00]
▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%1 = shufflevector <32 x i8> %a0, <32 x i8> zeroinitializer, <32 x i32> <i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 32, i32 33, i32 34, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 48, i32 49, i32 50>		%1 = shufflevector <32 x i8> %a0, <32 x i8> zeroinitializer, <32 x i32> <i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 32, i32 33, i32 34, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31, i32 48, i32 49, i32 50>
ret <32 x i8> %1		ret <32 x i8> %1
}		}

define <4 x i64> @test_psrlq(<4 x i64> %a0, <2 x i64> %a1, <2 x i64> *%a2) {		define <4 x i64> @test_psrlq(<4 x i64> %a0, <2 x i64> %a1, <2 x i64> *%a2) {
; GENERIC-LABEL: test_psrlq:		; GENERIC-LABEL: test_psrlq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsrlq %xmm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsrlq %xmm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpsrlq (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpsrlq (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: vpsrlq $2, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsrlq $2, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psrlq:		; HASWELL-LABEL: test_psrlq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsrlq %xmm1, %ymm0, %ymm0 # sched: [4:1.00]		; HASWELL-NEXT: vpsrlq %xmm1, %ymm0, %ymm0 # sched: [4:1.00]
; HASWELL-NEXT: vpsrlq (%rdi), %ymm0, %ymm0 # sched: [8:1.00]		; HASWELL-NEXT: vpsrlq (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; HASWELL-NEXT: vpsrlq $2, %ymm0, %ymm0 # sched: [1:1.00]		; HASWELL-NEXT: vpsrlq $2, %ymm0, %ymm0 # sched: [1:1.00]
Show All 33 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <4 x i64> %4		ret <4 x i64> %4
}		}
declare <4 x i64> @llvm.x86.avx2.psrl.q(<4 x i64>, <2 x i64>) nounwind readnone		declare <4 x i64> @llvm.x86.avx2.psrl.q(<4 x i64>, <2 x i64>) nounwind readnone

define <4 x i32> @test_psrlvd(<4 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {		define <4 x i32> @test_psrlvd(<4 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {
; GENERIC-LABEL: test_psrlvd:		; GENERIC-LABEL: test_psrlvd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsrlvd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsrlvd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpsrlvd (%rdi), %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpsrlvd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psrlvd:		; HASWELL-LABEL: test_psrlvd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsrlvd %xmm1, %xmm0, %xmm0 # sched: [3:2.00]		; HASWELL-NEXT: vpsrlvd %xmm1, %xmm0, %xmm0 # sched: [3:2.00]
; HASWELL-NEXT: vpsrlvd (%rdi), %xmm0, %xmm0 # sched: [9:2.00]		; HASWELL-NEXT: vpsrlvd (%rdi), %xmm0, %xmm0 # sched: [9:2.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <4 x i32> %3		ret <4 x i32> %3
}		}
declare <4 x i32> @llvm.x86.avx2.psrlv.d(<4 x i32>, <4 x i32>) nounwind readnone		declare <4 x i32> @llvm.x86.avx2.psrlv.d(<4 x i32>, <4 x i32>) nounwind readnone

define <8 x i32> @test_psrlvd_ymm(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {		define <8 x i32> @test_psrlvd_ymm(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
; GENERIC-LABEL: test_psrlvd_ymm:		; GENERIC-LABEL: test_psrlvd_ymm:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsrlvd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsrlvd %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpsrlvd (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpsrlvd (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psrlvd_ymm:		; HASWELL-LABEL: test_psrlvd_ymm:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsrlvd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]		; HASWELL-NEXT: vpsrlvd %ymm1, %ymm0, %ymm0 # sched: [3:2.00]
; HASWELL-NEXT: vpsrlvd (%rdi), %ymm0, %ymm0 # sched: [10:2.00]		; HASWELL-NEXT: vpsrlvd (%rdi), %ymm0, %ymm0 # sched: [10:2.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <8 x i32> %3		ret <8 x i32> %3
}		}
declare <8 x i32> @llvm.x86.avx2.psrlv.d.256(<8 x i32>, <8 x i32>) nounwind readnone		declare <8 x i32> @llvm.x86.avx2.psrlv.d.256(<8 x i32>, <8 x i32>) nounwind readnone

define <2 x i64> @test_psrlvq(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> *%a2) {		define <2 x i64> @test_psrlvq(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> *%a2) {
; GENERIC-LABEL: test_psrlvq:		; GENERIC-LABEL: test_psrlvq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsrlvq %xmm1, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsrlvq %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpsrlvq (%rdi), %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpsrlvq (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psrlvq:		; HASWELL-LABEL: test_psrlvq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsrlvq %xmm1, %xmm0, %xmm0 # sched: [1:1.00]		; HASWELL-NEXT: vpsrlvq %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
; HASWELL-NEXT: vpsrlvq (%rdi), %xmm0, %xmm0 # sched: [7:1.00]		; HASWELL-NEXT: vpsrlvq (%rdi), %xmm0, %xmm0 # sched: [7:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <2 x i64> %3		ret <2 x i64> %3
}		}
declare <2 x i64> @llvm.x86.avx2.psrlv.q(<2 x i64>, <2 x i64>) nounwind readnone		declare <2 x i64> @llvm.x86.avx2.psrlv.q(<2 x i64>, <2 x i64>) nounwind readnone

define <4 x i64> @test_psrlvq_ymm(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {		define <4 x i64> @test_psrlvq_ymm(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {
; GENERIC-LABEL: test_psrlvq_ymm:		; GENERIC-LABEL: test_psrlvq_ymm:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsrlvq %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsrlvq %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpsrlvq (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpsrlvq (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psrlvq_ymm:		; HASWELL-LABEL: test_psrlvq_ymm:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsrlvq %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; HASWELL-NEXT: vpsrlvq %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; HASWELL-NEXT: vpsrlvq (%rdi), %ymm0, %ymm0 # sched: [8:1.00]		; HASWELL-NEXT: vpsrlvq (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <4 x i64> %3		ret <4 x i64> %3
}		}
declare <4 x i64> @llvm.x86.avx2.psrlv.q.256(<4 x i64>, <4 x i64>) nounwind readnone		declare <4 x i64> @llvm.x86.avx2.psrlv.q.256(<4 x i64>, <4 x i64>) nounwind readnone

define <16 x i16> @test_psrlw(<16 x i16> %a0, <8 x i16> %a1, <8 x i16> *%a2) {		define <16 x i16> @test_psrlw(<16 x i16> %a0, <8 x i16> %a1, <8 x i16> *%a2) {
; GENERIC-LABEL: test_psrlw:		; GENERIC-LABEL: test_psrlw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsrlw %xmm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsrlw %xmm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpsrlw (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpsrlw (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: vpsrlw $2, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsrlw $2, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psrlw:		; HASWELL-LABEL: test_psrlw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsrlw %xmm1, %ymm0, %ymm0 # sched: [4:1.00]		; HASWELL-NEXT: vpsrlw %xmm1, %ymm0, %ymm0 # sched: [4:1.00]
; HASWELL-NEXT: vpsrlw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]		; HASWELL-NEXT: vpsrlw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; HASWELL-NEXT: vpsrlw $2, %ymm0, %ymm0 # sched: [1:1.00]		; HASWELL-NEXT: vpsrlw $2, %ymm0, %ymm0 # sched: [1:1.00]
Show All 33 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <16 x i16> %4		ret <16 x i16> %4
}		}
declare <16 x i16> @llvm.x86.avx2.psrl.w(<16 x i16>, <8 x i16>) nounwind readnone		declare <16 x i16> @llvm.x86.avx2.psrl.w(<16 x i16>, <8 x i16>) nounwind readnone

define <32 x i8> @test_psubb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {		define <32 x i8> @test_psubb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {
; GENERIC-LABEL: test_psubb:		; GENERIC-LABEL: test_psubb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsubb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpsubb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpsubb (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpsubb (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psubb:		; HASWELL-LABEL: test_psubb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsubb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpsubb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpsubb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpsubb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 25 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%3 = sub <32 x i8> %1, %2		%3 = sub <32 x i8> %1, %2
ret <32 x i8> %3		ret <32 x i8> %3
}		}

define <8 x i32> @test_psubd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {		define <8 x i32> @test_psubd(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
; GENERIC-LABEL: test_psubd:		; GENERIC-LABEL: test_psubd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsubd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpsubd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpsubd (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpsubd (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psubd:		; HASWELL-LABEL: test_psubd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsubd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpsubd %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpsubd (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpsubd (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 25 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%3 = sub <8 x i32> %1, %2		%3 = sub <8 x i32> %1, %2
ret <8 x i32> %3		ret <8 x i32> %3
}		}

define <4 x i64> @test_psubq(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {		define <4 x i64> @test_psubq(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {
; GENERIC-LABEL: test_psubq:		; GENERIC-LABEL: test_psubq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsubq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpsubq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpsubq (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpsubq (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psubq:		; HASWELL-LABEL: test_psubq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsubq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpsubq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpsubq (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpsubq (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 25 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%3 = sub <4 x i64> %1, %2		%3 = sub <4 x i64> %1, %2
ret <4 x i64> %3		ret <4 x i64> %3
}		}

define <32 x i8> @test_psubsb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {		define <32 x i8> @test_psubsb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {
; GENERIC-LABEL: test_psubsb:		; GENERIC-LABEL: test_psubsb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsubsb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpsubsb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpsubsb (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpsubsb (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psubsb:		; HASWELL-LABEL: test_psubsb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsubsb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpsubsb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpsubsb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpsubsb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <32 x i8> %3		ret <32 x i8> %3
}		}
declare <32 x i8> @llvm.x86.avx2.psubs.b(<32 x i8>, <32 x i8>) nounwind readnone		declare <32 x i8> @llvm.x86.avx2.psubs.b(<32 x i8>, <32 x i8>) nounwind readnone

define <16 x i16> @test_psubsw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_psubsw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_psubsw:		; GENERIC-LABEL: test_psubsw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsubsw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpsubsw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpsubsw (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpsubsw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psubsw:		; HASWELL-LABEL: test_psubsw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsubsw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpsubsw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpsubsw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpsubsw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <16 x i16> %3		ret <16 x i16> %3
}		}
declare <16 x i16> @llvm.x86.avx2.psubs.w(<16 x i16>, <16 x i16>) nounwind readnone		declare <16 x i16> @llvm.x86.avx2.psubs.w(<16 x i16>, <16 x i16>) nounwind readnone

define <32 x i8> @test_psubusb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {		define <32 x i8> @test_psubusb(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {
; GENERIC-LABEL: test_psubusb:		; GENERIC-LABEL: test_psubusb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsubusb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpsubusb %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpsubusb (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpsubusb (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psubusb:		; HASWELL-LABEL: test_psubusb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsubusb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpsubusb %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpsubusb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpsubusb (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <32 x i8> %3		ret <32 x i8> %3
}		}
declare <32 x i8> @llvm.x86.avx2.psubus.b(<32 x i8>, <32 x i8>) nounwind readnone		declare <32 x i8> @llvm.x86.avx2.psubus.b(<32 x i8>, <32 x i8>) nounwind readnone

define <16 x i16> @test_psubusw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_psubusw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_psubusw:		; GENERIC-LABEL: test_psubusw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsubusw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpsubusw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpsubusw (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpsubusw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psubusw:		; HASWELL-LABEL: test_psubusw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsubusw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpsubusw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpsubusw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpsubusw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 26 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <16 x i16> %3		ret <16 x i16> %3
}		}
declare <16 x i16> @llvm.x86.avx2.psubus.w(<16 x i16>, <16 x i16>) nounwind readnone		declare <16 x i16> @llvm.x86.avx2.psubus.w(<16 x i16>, <16 x i16>) nounwind readnone

define <16 x i16> @test_psubw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_psubw(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_psubw:		; GENERIC-LABEL: test_psubw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsubw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpsubw %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpsubw (%rdi), %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vpsubw (%rdi), %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psubw:		; HASWELL-LABEL: test_psubw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpsubw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpsubw %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
; HASWELL-NEXT: vpsubw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpsubw (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 25 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%3 = sub <16 x i16> %1, %2		%3 = sub <16 x i16> %1, %2
ret <16 x i16> %3		ret <16 x i16> %3
}		}

define <32 x i8> @test_punpckhbw(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {		define <32 x i8> @test_punpckhbw(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {
; GENERIC-LABEL: test_punpckhbw:		; GENERIC-LABEL: test_punpckhbw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpunpckhbw {{.*#+}} ymm0 = ymm0[8],ymm1[8],ymm0[9],ymm1[9],ymm0[10],ymm1[10],ymm0[11],ymm1[11],ymm0[12],ymm1[12],ymm0[13],ymm1[13],ymm0[14],ymm1[14],ymm0[15],ymm1[15],ymm0[24],ymm1[24],ymm0[25],ymm1[25],ymm0[26],ymm1[26],ymm0[27],ymm1[27],ymm0[28],ymm1[28],ymm0[29],ymm1[29],ymm0[30],ymm1[30],ymm0[31],ymm1[31] sched: [1:1.00]		; GENERIC-NEXT: vpunpckhbw {{.*#+}} ymm0 = ymm0[8],ymm1[8],ymm0[9],ymm1[9],ymm0[10],ymm1[10],ymm0[11],ymm1[11],ymm0[12],ymm1[12],ymm0[13],ymm1[13],ymm0[14],ymm1[14],ymm0[15],ymm1[15],ymm0[24],ymm1[24],ymm0[25],ymm1[25],ymm0[26],ymm1[26],ymm0[27],ymm1[27],ymm0[28],ymm1[28],ymm0[29],ymm1[29],ymm0[30],ymm1[30],ymm0[31],ymm1[31] sched: [1:1.00]
; GENERIC-NEXT: vpunpckhbw {{.*#+}} ymm0 = ymm0[8],mem[8],ymm0[9],mem[9],ymm0[10],mem[10],ymm0[11],mem[11],ymm0[12],mem[12],ymm0[13],mem[13],ymm0[14],mem[14],ymm0[15],mem[15],ymm0[24],mem[24],ymm0[25],mem[25],ymm0[26],mem[26],ymm0[27],mem[27],ymm0[28],mem[28],ymm0[29],mem[29],ymm0[30],mem[30],ymm0[31],mem[31] sched: [5:1.00]		; GENERIC-NEXT: vpunpckhbw {{.*#+}} ymm0 = ymm0[8],mem[8],ymm0[9],mem[9],ymm0[10],mem[10],ymm0[11],mem[11],ymm0[12],mem[12],ymm0[13],mem[13],ymm0[14],mem[14],ymm0[15],mem[15],ymm0[24],mem[24],ymm0[25],mem[25],ymm0[26],mem[26],ymm0[27],mem[27],ymm0[28],mem[28],ymm0[29],mem[29],ymm0[30],mem[30],ymm0[31],mem[31] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_punpckhbw:		; HASWELL-LABEL: test_punpckhbw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpunpckhbw {{.*#+}} ymm0 = ymm0[8],ymm1[8],ymm0[9],ymm1[9],ymm0[10],ymm1[10],ymm0[11],ymm1[11],ymm0[12],ymm1[12],ymm0[13],ymm1[13],ymm0[14],ymm1[14],ymm0[15],ymm1[15],ymm0[24],ymm1[24],ymm0[25],ymm1[25],ymm0[26],ymm1[26],ymm0[27],ymm1[27],ymm0[28],ymm1[28],ymm0[29],ymm1[29],ymm0[30],ymm1[30],ymm0[31],ymm1[31] sched: [1:1.00]		; HASWELL-NEXT: vpunpckhbw {{.*#+}} ymm0 = ymm0[8],ymm1[8],ymm0[9],ymm1[9],ymm0[10],ymm1[10],ymm0[11],ymm1[11],ymm0[12],ymm1[12],ymm0[13],ymm1[13],ymm0[14],ymm1[14],ymm0[15],ymm1[15],ymm0[24],ymm1[24],ymm0[25],ymm1[25],ymm0[26],ymm1[26],ymm0[27],ymm1[27],ymm0[28],ymm1[28],ymm0[29],ymm1[29],ymm0[30],ymm1[30],ymm0[31],ymm1[31] sched: [1:1.00]
; HASWELL-NEXT: vpunpckhbw {{.*#+}} ymm0 = ymm0[8],mem[8],ymm0[9],mem[9],ymm0[10],mem[10],ymm0[11],mem[11],ymm0[12],mem[12],ymm0[13],mem[13],ymm0[14],mem[14],ymm0[15],mem[15],ymm0[24],mem[24],ymm0[25],mem[25],ymm0[26],mem[26],ymm0[27],mem[27],ymm0[28],mem[28],ymm0[29],mem[29],ymm0[30],mem[30],ymm0[31],mem[31] sched: [8:1.00]		; HASWELL-NEXT: vpunpckhbw {{.*#+}} ymm0 = ymm0[8],mem[8],ymm0[9],mem[9],ymm0[10],mem[10],ymm0[11],mem[11],ymm0[12],mem[12],ymm0[13],mem[13],ymm0[14],mem[14],ymm0[15],mem[15],ymm0[24],mem[24],ymm0[25],mem[25],ymm0[26],mem[26],ymm0[27],mem[27],ymm0[28],mem[28],ymm0[29],mem[29],ymm0[30],mem[30],ymm0[31],mem[31] sched: [8:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 25 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%3 = shufflevector <32 x i8> %1, <32 x i8> %2, <32 x i32> <i32 8, i32 40, i32 9, i32 41, i32 10, i32 42, i32 11, i32 43, i32 12, i32 44, i32 13, i32 45, i32 14, i32 46, i32 15, i32 47, i32 24, i32 56, i32 25, i32 57, i32 26, i32 58, i32 27, i32 59, i32 28, i32 60, i32 29, i32 61, i32 30, i32 62, i32 31, i32 63>		%3 = shufflevector <32 x i8> %1, <32 x i8> %2, <32 x i32> <i32 8, i32 40, i32 9, i32 41, i32 10, i32 42, i32 11, i32 43, i32 12, i32 44, i32 13, i32 45, i32 14, i32 46, i32 15, i32 47, i32 24, i32 56, i32 25, i32 57, i32 26, i32 58, i32 27, i32 59, i32 28, i32 60, i32 29, i32 61, i32 30, i32 62, i32 31, i32 63>
ret <32 x i8> %3		ret <32 x i8> %3
}		}

define <8 x i32> @test_punpckhdq(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {		define <8 x i32> @test_punpckhdq(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
; GENERIC-LABEL: test_punpckhdq:		; GENERIC-LABEL: test_punpckhdq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpunpckhdq {{.*#+}} ymm0 = ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[6],ymm1[6],ymm0[7],ymm1[7] sched: [1:1.00]		; GENERIC-NEXT: vpunpckhdq {{.*#+}} ymm0 = ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[6],ymm1[6],ymm0[7],ymm1[7] sched: [1:1.00]
; GENERIC-NEXT: vpunpckhdq {{.*#+}} ymm0 = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [5:1.00]		; GENERIC-NEXT: vpunpckhdq {{.*#+}} ymm0 = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [6:1.00]
; GENERIC-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1 # sched: [3:1.00]		; GENERIC-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1 # sched: [3:1.00]
; GENERIC-NEXT: vpsubd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpsubd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_punpckhdq:		; HASWELL-LABEL: test_punpckhdq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpunpckhdq {{.*#+}} ymm0 = ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[6],ymm1[6],ymm0[7],ymm1[7] sched: [1:1.00]		; HASWELL-NEXT: vpunpckhdq {{.*#+}} ymm0 = ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[6],ymm1[6],ymm0[7],ymm1[7] sched: [1:1.00]
; HASWELL-NEXT: vpunpckhdq {{.*#+}} ymm0 = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]		; HASWELL-NEXT: vpunpckhdq {{.*#+}} ymm0 = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]
Show All 38 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <8 x i32> %3, <i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1>		%4 = add <8 x i32> %3, <i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1>
ret <8 x i32> %4		ret <8 x i32> %4
}		}

define <4 x i64> @test_punpckhqdq(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {		define <4 x i64> @test_punpckhqdq(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {
; GENERIC-LABEL: test_punpckhqdq:		; GENERIC-LABEL: test_punpckhqdq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpunpckhqdq {{.*#+}} ymm1 = ymm0[1],ymm1[1],ymm0[3],ymm1[3] sched: [1:1.00]		; GENERIC-NEXT: vpunpckhqdq {{.*#+}} ymm1 = ymm0[1],ymm1[1],ymm0[3],ymm1[3] sched: [1:1.00]
; GENERIC-NEXT: vpunpckhqdq {{.*#+}} ymm0 = ymm0[1],mem[1],ymm0[3],mem[3] sched: [5:1.00]		; GENERIC-NEXT: vpunpckhqdq {{.*#+}} ymm0 = ymm0[1],mem[1],ymm0[3],mem[3] sched: [6:1.00]
; GENERIC-NEXT: vpaddq %ymm0, %ymm1, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddq %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_punpckhqdq:		; HASWELL-LABEL: test_punpckhqdq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpunpckhqdq {{.*#+}} ymm1 = ymm0[1],ymm1[1],ymm0[3],ymm1[3] sched: [1:1.00]		; HASWELL-NEXT: vpunpckhqdq {{.*#+}} ymm1 = ymm0[1],ymm1[1],ymm0[3],ymm1[3] sched: [1:1.00]
; HASWELL-NEXT: vpunpckhqdq {{.*#+}} ymm0 = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]		; HASWELL-NEXT: vpunpckhqdq {{.*#+}} ymm0 = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]
; HASWELL-NEXT: vpaddq %ymm0, %ymm1, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddq %ymm0, %ymm1, %ymm0 # sched: [1:0.50]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <4 x i64> %1, %3		%4 = add <4 x i64> %1, %3
ret <4 x i64> %4		ret <4 x i64> %4
}		}

define <16 x i16> @test_punpckhwd(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_punpckhwd(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_punpckhwd:		; GENERIC-LABEL: test_punpckhwd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpunpckhwd {{.*#+}} ymm0 = ymm0[4],ymm1[4],ymm0[5],ymm1[5],ymm0[6],ymm1[6],ymm0[7],ymm1[7],ymm0[12],ymm1[12],ymm0[13],ymm1[13],ymm0[14],ymm1[14],ymm0[15],ymm1[15] sched: [1:1.00]		; GENERIC-NEXT: vpunpckhwd {{.*#+}} ymm0 = ymm0[4],ymm1[4],ymm0[5],ymm1[5],ymm0[6],ymm1[6],ymm0[7],ymm1[7],ymm0[12],ymm1[12],ymm0[13],ymm1[13],ymm0[14],ymm1[14],ymm0[15],ymm1[15] sched: [1:1.00]
; GENERIC-NEXT: vpunpckhwd {{.*#+}} ymm0 = ymm0[4],mem[4],ymm0[5],mem[5],ymm0[6],mem[6],ymm0[7],mem[7],ymm0[12],mem[12],ymm0[13],mem[13],ymm0[14],mem[14],ymm0[15],mem[15] sched: [5:1.00]		; GENERIC-NEXT: vpunpckhwd {{.*#+}} ymm0 = ymm0[4],mem[4],ymm0[5],mem[5],ymm0[6],mem[6],ymm0[7],mem[7],ymm0[12],mem[12],ymm0[13],mem[13],ymm0[14],mem[14],ymm0[15],mem[15] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_punpckhwd:		; HASWELL-LABEL: test_punpckhwd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpunpckhwd {{.*#+}} ymm0 = ymm0[4],ymm1[4],ymm0[5],ymm1[5],ymm0[6],ymm1[6],ymm0[7],ymm1[7],ymm0[12],ymm1[12],ymm0[13],ymm1[13],ymm0[14],ymm1[14],ymm0[15],ymm1[15] sched: [1:1.00]		; HASWELL-NEXT: vpunpckhwd {{.*#+}} ymm0 = ymm0[4],ymm1[4],ymm0[5],ymm1[5],ymm0[6],ymm1[6],ymm0[7],ymm1[7],ymm0[12],ymm1[12],ymm0[13],ymm1[13],ymm0[14],ymm1[14],ymm0[15],ymm1[15] sched: [1:1.00]
; HASWELL-NEXT: vpunpckhwd {{.*#+}} ymm0 = ymm0[4],mem[4],ymm0[5],mem[5],ymm0[6],mem[6],ymm0[7],mem[7],ymm0[12],mem[12],ymm0[13],mem[13],ymm0[14],mem[14],ymm0[15],mem[15] sched: [8:1.00]		; HASWELL-NEXT: vpunpckhwd {{.*#+}} ymm0 = ymm0[4],mem[4],ymm0[5],mem[5],ymm0[6],mem[6],ymm0[7],mem[7],ymm0[12],mem[12],ymm0[13],mem[13],ymm0[14],mem[14],ymm0[15],mem[15] sched: [8:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 25 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%3 = shufflevector <16 x i16> %1, <16 x i16> %2, <16 x i32> <i32 4, i32 20, i32 5, i32 21, i32 6, i32 22, i32 7, i32 23, i32 12, i32 28, i32 13, i32 29, i32 14, i32 30, i32 15, i32 31>		%3 = shufflevector <16 x i16> %1, <16 x i16> %2, <16 x i32> <i32 4, i32 20, i32 5, i32 21, i32 6, i32 22, i32 7, i32 23, i32 12, i32 28, i32 13, i32 29, i32 14, i32 30, i32 15, i32 31>
ret <16 x i16> %3		ret <16 x i16> %3
}		}

define <32 x i8> @test_punpcklbw(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {		define <32 x i8> @test_punpcklbw(<32 x i8> %a0, <32 x i8> %a1, <32 x i8> *%a2) {
; GENERIC-LABEL: test_punpcklbw:		; GENERIC-LABEL: test_punpcklbw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpunpcklbw {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[4],ymm1[4],ymm0[5],ymm1[5],ymm0[6],ymm1[6],ymm0[7],ymm1[7],ymm0[16],ymm1[16],ymm0[17],ymm1[17],ymm0[18],ymm1[18],ymm0[19],ymm1[19],ymm0[20],ymm1[20],ymm0[21],ymm1[21],ymm0[22],ymm1[22],ymm0[23],ymm1[23] sched: [1:1.00]		; GENERIC-NEXT: vpunpcklbw {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[4],ymm1[4],ymm0[5],ymm1[5],ymm0[6],ymm1[6],ymm0[7],ymm1[7],ymm0[16],ymm1[16],ymm0[17],ymm1[17],ymm0[18],ymm1[18],ymm0[19],ymm1[19],ymm0[20],ymm1[20],ymm0[21],ymm1[21],ymm0[22],ymm1[22],ymm0[23],ymm1[23] sched: [1:1.00]
; GENERIC-NEXT: vpunpcklbw {{.*#+}} ymm0 = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[2],mem[2],ymm0[3],mem[3],ymm0[4],mem[4],ymm0[5],mem[5],ymm0[6],mem[6],ymm0[7],mem[7],ymm0[16],mem[16],ymm0[17],mem[17],ymm0[18],mem[18],ymm0[19],mem[19],ymm0[20],mem[20],ymm0[21],mem[21],ymm0[22],mem[22],ymm0[23],mem[23] sched: [5:1.00]		; GENERIC-NEXT: vpunpcklbw {{.*#+}} ymm0 = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[2],mem[2],ymm0[3],mem[3],ymm0[4],mem[4],ymm0[5],mem[5],ymm0[6],mem[6],ymm0[7],mem[7],ymm0[16],mem[16],ymm0[17],mem[17],ymm0[18],mem[18],ymm0[19],mem[19],ymm0[20],mem[20],ymm0[21],mem[21],ymm0[22],mem[22],ymm0[23],mem[23] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_punpcklbw:		; HASWELL-LABEL: test_punpcklbw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpunpcklbw {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[4],ymm1[4],ymm0[5],ymm1[5],ymm0[6],ymm1[6],ymm0[7],ymm1[7],ymm0[16],ymm1[16],ymm0[17],ymm1[17],ymm0[18],ymm1[18],ymm0[19],ymm1[19],ymm0[20],ymm1[20],ymm0[21],ymm1[21],ymm0[22],ymm1[22],ymm0[23],ymm1[23] sched: [1:1.00]		; HASWELL-NEXT: vpunpcklbw {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[4],ymm1[4],ymm0[5],ymm1[5],ymm0[6],ymm1[6],ymm0[7],ymm1[7],ymm0[16],ymm1[16],ymm0[17],ymm1[17],ymm0[18],ymm1[18],ymm0[19],ymm1[19],ymm0[20],ymm1[20],ymm0[21],ymm1[21],ymm0[22],ymm1[22],ymm0[23],ymm1[23] sched: [1:1.00]
; HASWELL-NEXT: vpunpcklbw {{.*#+}} ymm0 = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[2],mem[2],ymm0[3],mem[3],ymm0[4],mem[4],ymm0[5],mem[5],ymm0[6],mem[6],ymm0[7],mem[7],ymm0[16],mem[16],ymm0[17],mem[17],ymm0[18],mem[18],ymm0[19],mem[19],ymm0[20],mem[20],ymm0[21],mem[21],ymm0[22],mem[22],ymm0[23],mem[23] sched: [8:1.00]		; HASWELL-NEXT: vpunpcklbw {{.*#+}} ymm0 = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[2],mem[2],ymm0[3],mem[3],ymm0[4],mem[4],ymm0[5],mem[5],ymm0[6],mem[6],ymm0[7],mem[7],ymm0[16],mem[16],ymm0[17],mem[17],ymm0[18],mem[18],ymm0[19],mem[19],ymm0[20],mem[20],ymm0[21],mem[21],ymm0[22],mem[22],ymm0[23],mem[23] sched: [8:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 25 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%3 = shufflevector <32 x i8> %1, <32 x i8> %2, <32 x i32> <i32 0, i32 32, i32 1, i32 33, i32 2, i32 34, i32 3, i32 35, i32 4, i32 36, i32 5, i32 37, i32 6, i32 38, i32 7, i32 39, i32 16, i32 48, i32 17, i32 49, i32 18, i32 50, i32 19, i32 51, i32 20, i32 52, i32 21, i32 53, i32 22, i32 54, i32 23, i32 55>		%3 = shufflevector <32 x i8> %1, <32 x i8> %2, <32 x i32> <i32 0, i32 32, i32 1, i32 33, i32 2, i32 34, i32 3, i32 35, i32 4, i32 36, i32 5, i32 37, i32 6, i32 38, i32 7, i32 39, i32 16, i32 48, i32 17, i32 49, i32 18, i32 50, i32 19, i32 51, i32 20, i32 52, i32 21, i32 53, i32 22, i32 54, i32 23, i32 55>
ret <32 x i8> %3		ret <32 x i8> %3
}		}

define <8 x i32> @test_punpckldq(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {		define <8 x i32> @test_punpckldq(<8 x i32> %a0, <8 x i32> %a1, <8 x i32> *%a2) {
; GENERIC-LABEL: test_punpckldq:		; GENERIC-LABEL: test_punpckldq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpunpckldq {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[4],ymm1[4],ymm0[5],ymm1[5] sched: [1:1.00]		; GENERIC-NEXT: vpunpckldq {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[4],ymm1[4],ymm0[5],ymm1[5] sched: [1:1.00]
; GENERIC-NEXT: vpunpckldq {{.*#+}} ymm0 = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [5:1.00]		; GENERIC-NEXT: vpunpckldq {{.*#+}} ymm0 = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [6:1.00]
; GENERIC-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1 # sched: [3:1.00]		; GENERIC-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1 # sched: [3:1.00]
; GENERIC-NEXT: vpsubd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpsubd %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_punpckldq:		; HASWELL-LABEL: test_punpckldq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpunpckldq {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[4],ymm1[4],ymm0[5],ymm1[5] sched: [1:1.00]		; HASWELL-NEXT: vpunpckldq {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[4],ymm1[4],ymm0[5],ymm1[5] sched: [1:1.00]
; HASWELL-NEXT: vpunpckldq {{.*#+}} ymm0 = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]		; HASWELL-NEXT: vpunpckldq {{.*#+}} ymm0 = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]
Show All 38 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <8 x i32> %3, <i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1>		%4 = add <8 x i32> %3, <i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1, i32 1>
ret <8 x i32> %4		ret <8 x i32> %4
}		}

define <4 x i64> @test_punpcklqdq(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {		define <4 x i64> @test_punpcklqdq(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {
; GENERIC-LABEL: test_punpcklqdq:		; GENERIC-LABEL: test_punpcklqdq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpunpcklqdq {{.*#+}} ymm1 = ymm0[0],ymm1[0],ymm0[2],ymm1[2] sched: [1:1.00]		; GENERIC-NEXT: vpunpcklqdq {{.*#+}} ymm1 = ymm0[0],ymm1[0],ymm0[2],ymm1[2] sched: [1:1.00]
; GENERIC-NEXT: vpunpcklqdq {{.*#+}} ymm0 = ymm0[0],mem[0],ymm0[2],mem[2] sched: [5:1.00]		; GENERIC-NEXT: vpunpcklqdq {{.*#+}} ymm0 = ymm0[0],mem[0],ymm0[2],mem[2] sched: [6:1.00]
; GENERIC-NEXT: vpaddq %ymm0, %ymm1, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddq %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_punpcklqdq:		; HASWELL-LABEL: test_punpcklqdq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpunpcklqdq {{.*#+}} ymm1 = ymm0[0],ymm1[0],ymm0[2],ymm1[2] sched: [1:1.00]		; HASWELL-NEXT: vpunpcklqdq {{.*#+}} ymm1 = ymm0[0],ymm1[0],ymm0[2],ymm1[2] sched: [1:1.00]
; HASWELL-NEXT: vpunpcklqdq {{.*#+}} ymm0 = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]		; HASWELL-NEXT: vpunpcklqdq {{.*#+}} ymm0 = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]
; HASWELL-NEXT: vpaddq %ymm0, %ymm1, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddq %ymm0, %ymm1, %ymm0 # sched: [1:0.50]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add <4 x i64> %1, %3		%4 = add <4 x i64> %1, %3
ret <4 x i64> %4		ret <4 x i64> %4
}		}

define <16 x i16> @test_punpcklwd(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {		define <16 x i16> @test_punpcklwd(<16 x i16> %a0, <16 x i16> %a1, <16 x i16> *%a2) {
; GENERIC-LABEL: test_punpcklwd:		; GENERIC-LABEL: test_punpcklwd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpunpcklwd {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[8],ymm1[8],ymm0[9],ymm1[9],ymm0[10],ymm1[10],ymm0[11],ymm1[11] sched: [1:1.00]		; GENERIC-NEXT: vpunpcklwd {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[8],ymm1[8],ymm0[9],ymm1[9],ymm0[10],ymm1[10],ymm0[11],ymm1[11] sched: [1:1.00]
; GENERIC-NEXT: vpunpcklwd {{.*#+}} ymm0 = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[2],mem[2],ymm0[3],mem[3],ymm0[8],mem[8],ymm0[9],mem[9],ymm0[10],mem[10],ymm0[11],mem[11] sched: [5:1.00]		; GENERIC-NEXT: vpunpcklwd {{.*#+}} ymm0 = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[2],mem[2],ymm0[3],mem[3],ymm0[8],mem[8],ymm0[9],mem[9],ymm0[10],mem[10],ymm0[11],mem[11] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_punpcklwd:		; HASWELL-LABEL: test_punpcklwd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpunpcklwd {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[8],ymm1[8],ymm0[9],ymm1[9],ymm0[10],ymm1[10],ymm0[11],ymm1[11] sched: [1:1.00]		; HASWELL-NEXT: vpunpcklwd {{.*#+}} ymm0 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[8],ymm1[8],ymm0[9],ymm1[9],ymm0[10],ymm1[10],ymm0[11],ymm1[11] sched: [1:1.00]
; HASWELL-NEXT: vpunpcklwd {{.*#+}} ymm0 = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[2],mem[2],ymm0[3],mem[3],ymm0[8],mem[8],ymm0[9],mem[9],ymm0[10],mem[10],ymm0[11],mem[11] sched: [8:1.00]		; HASWELL-NEXT: vpunpcklwd {{.*#+}} ymm0 = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[2],mem[2],ymm0[3],mem[3],ymm0[8],mem[8],ymm0[9],mem[9],ymm0[10],mem[10],ymm0[11],mem[11] sched: [8:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 25 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%3 = shufflevector <16 x i16> %1, <16 x i16> %2, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 2, i32 18, i32 3, i32 19, i32 8, i32 24, i32 9, i32 25, i32 10, i32 26, i32 11, i32 27>		%3 = shufflevector <16 x i16> %1, <16 x i16> %2, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 2, i32 18, i32 3, i32 19, i32 8, i32 24, i32 9, i32 25, i32 10, i32 26, i32 11, i32 27>
ret <16 x i16> %3		ret <16 x i16> %3
}		}

define <4 x i64> @test_pxor(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {		define <4 x i64> @test_pxor(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> *%a2) {
; GENERIC-LABEL: test_pxor:		; GENERIC-LABEL: test_pxor:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpxor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpxor %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpxor (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpxor (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pxor:		; HASWELL-LABEL: test_pxor:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vpxor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]		; HASWELL-NEXT: vpxor %ymm1, %ymm0, %ymm0 # sched: [1:0.33]
; HASWELL-NEXT: vpxor (%rdi), %ymm0, %ymm0 # sched: [8:0.50]		; HASWELL-NEXT: vpxor (%rdi), %ymm0, %ymm0 # sched: [8:0.50]
; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]		; HASWELL-NEXT: vpaddq %ymm1, %ymm0, %ymm0 # sched: [1:0.50]
Show All 37 Lines

llvm/trunk/test/CodeGen/X86/avx512-schedule.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show All 16 Lines
entry:		entry:
%add.i = fadd <8 x double> %x, %y		%add.i = fadd <8 x double> %x, %y
ret <8 x double> %add.i		ret <8 x double> %add.i
}		}

define <8 x double> @addpd512fold(<8 x double> %y) {		define <8 x double> @addpd512fold(<8 x double> %y) {
; GENERIC-LABEL: addpd512fold:		; GENERIC-LABEL: addpd512fold:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
; GENERIC-NEXT: vaddpd {{.*}}(%rip), %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vaddpd {{.*}}(%rip), %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: addpd512fold:		; SKX-LABEL: addpd512fold:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: vaddpd {{.*}}(%rip), %zmm0, %zmm0 # sched: [11:0.50]		; SKX-NEXT: vaddpd {{.*}}(%rip), %zmm0, %zmm0 # sched: [11:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%add.i = fadd <8 x double> %y, <double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00, double 4.500000e+00, double 3.800000e+00, double 2.300000e+00, double 1.200000e+00>		%add.i = fadd <8 x double> %y, <double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00, double 4.500000e+00, double 3.800000e+00, double 2.300000e+00, double 1.200000e+00>
Show All 13 Lines
entry:		entry:
%add.i = fadd <16 x float> %x, %y		%add.i = fadd <16 x float> %x, %y
ret <16 x float> %add.i		ret <16 x float> %add.i
}		}

define <16 x float> @addps512fold(<16 x float> %y) {		define <16 x float> @addps512fold(<16 x float> %y) {
; GENERIC-LABEL: addps512fold:		; GENERIC-LABEL: addps512fold:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
; GENERIC-NEXT: vaddps {{.*}}(%rip), %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vaddps {{.*}}(%rip), %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: addps512fold:		; SKX-LABEL: addps512fold:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: vaddps {{.*}}(%rip), %zmm0, %zmm0 # sched: [11:0.50]		; SKX-NEXT: vaddps {{.*}}(%rip), %zmm0, %zmm0 # sched: [11:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%add.i = fadd <16 x float> %y, <float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 4.500000e+00, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000>		%add.i = fadd <16 x float> %y, <float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 4.500000e+00, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000>
Show All 13 Lines
entry:		entry:
%sub.i = fsub <8 x double> %x, %y		%sub.i = fsub <8 x double> %x, %y
ret <8 x double> %sub.i		ret <8 x double> %sub.i
}		}

define <8 x double> @subpd512fold(<8 x double> %y, <8 x double>* %x) {		define <8 x double> @subpd512fold(<8 x double> %y, <8 x double>* %x) {
; GENERIC-LABEL: subpd512fold:		; GENERIC-LABEL: subpd512fold:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
; GENERIC-NEXT: vsubpd (%rdi), %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vsubpd (%rdi), %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: subpd512fold:		; SKX-LABEL: subpd512fold:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: vsubpd (%rdi), %zmm0, %zmm0 # sched: [11:0.50]		; SKX-NEXT: vsubpd (%rdi), %zmm0, %zmm0 # sched: [11:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%tmp2 = load <8 x double>, <8 x double>* %x, align 8		%tmp2 = load <8 x double>, <8 x double>* %x, align 8
Show All 14 Lines
entry:		entry:
%sub.i = fsub <16 x float> %x, %y		%sub.i = fsub <16 x float> %x, %y
ret <16 x float> %sub.i		ret <16 x float> %sub.i
}		}

define <16 x float> @subps512fold(<16 x float> %y, <16 x float>* %x) {		define <16 x float> @subps512fold(<16 x float> %y, <16 x float>* %x) {
; GENERIC-LABEL: subps512fold:		; GENERIC-LABEL: subps512fold:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
; GENERIC-NEXT: vsubps (%rdi), %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vsubps (%rdi), %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: subps512fold:		; SKX-LABEL: subps512fold:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: vsubps (%rdi), %zmm0, %zmm0 # sched: [11:0.50]		; SKX-NEXT: vsubps (%rdi), %zmm0, %zmm0 # sched: [11:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%tmp2 = load <16 x float>, <16 x float>* %x, align 4		%tmp2 = load <16 x float>, <16 x float>* %x, align 4
▲ Show 20 Lines • Show All 56 Lines • ▼ Show 20 Lines
entry:		entry:
%mul.i = fmul <8 x double> %x, %y		%mul.i = fmul <8 x double> %x, %y
ret <8 x double> %mul.i		ret <8 x double> %mul.i
}		}

define <8 x double> @mulpd512fold(<8 x double> %y) {		define <8 x double> @mulpd512fold(<8 x double> %y) {
; GENERIC-LABEL: mulpd512fold:		; GENERIC-LABEL: mulpd512fold:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
; GENERIC-NEXT: vmulpd {{.*}}(%rip), %zmm0, %zmm0 # sched: [9:1.00]		; GENERIC-NEXT: vmulpd {{.*}}(%rip), %zmm0, %zmm0 # sched: [10:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: mulpd512fold:		; SKX-LABEL: mulpd512fold:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: vmulpd {{.*}}(%rip), %zmm0, %zmm0 # sched: [11:0.50]		; SKX-NEXT: vmulpd {{.*}}(%rip), %zmm0, %zmm0 # sched: [11:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%mul.i = fmul <8 x double> %y, <double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00, double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00>		%mul.i = fmul <8 x double> %y, <double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00, double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00>
Show All 13 Lines
entry:		entry:
%mul.i = fmul <16 x float> %x, %y		%mul.i = fmul <16 x float> %x, %y
ret <16 x float> %mul.i		ret <16 x float> %mul.i
}		}

define <16 x float> @mulps512fold(<16 x float> %y) {		define <16 x float> @mulps512fold(<16 x float> %y) {
; GENERIC-LABEL: mulps512fold:		; GENERIC-LABEL: mulps512fold:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
; GENERIC-NEXT: vmulps {{.*}}(%rip), %zmm0, %zmm0 # sched: [9:1.00]		; GENERIC-NEXT: vmulps {{.*}}(%rip), %zmm0, %zmm0 # sched: [10:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: mulps512fold:		; SKX-LABEL: mulps512fold:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: vmulps {{.*}}(%rip), %zmm0, %zmm0 # sched: [11:0.50]		; SKX-NEXT: vmulps {{.*}}(%rip), %zmm0, %zmm0 # sched: [11:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%mul.i = fmul <16 x float> %y, <float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000>		%mul.i = fmul <16 x float> %y, <float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000>
Show All 13 Lines
entry:		entry:
%div.i = fdiv <8 x double> %x, %y		%div.i = fdiv <8 x double> %x, %y
ret <8 x double> %div.i		ret <8 x double> %div.i
}		}

define <8 x double> @divpd512fold(<8 x double> %y) {		define <8 x double> @divpd512fold(<8 x double> %y) {
; GENERIC-LABEL: divpd512fold:		; GENERIC-LABEL: divpd512fold:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
; GENERIC-NEXT: vdivpd {{.*}}(%rip), %zmm0, %zmm0 # sched: [28:1.00]		; GENERIC-NEXT: vdivpd {{.*}}(%rip), %zmm0, %zmm0 # sched: [29:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: divpd512fold:		; SKX-LABEL: divpd512fold:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: vdivpd {{.*}}(%rip), %zmm0, %zmm0 # sched: [30:16.00]		; SKX-NEXT: vdivpd {{.*}}(%rip), %zmm0, %zmm0 # sched: [30:16.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%div.i = fdiv <8 x double> %y, <double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00, double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00>		%div.i = fdiv <8 x double> %y, <double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00, double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00>
Show All 13 Lines
entry:		entry:
%div.i = fdiv <16 x float> %x, %y		%div.i = fdiv <16 x float> %x, %y
ret <16 x float> %div.i		ret <16 x float> %div.i
}		}

define <16 x float> @divps512fold(<16 x float> %y) {		define <16 x float> @divps512fold(<16 x float> %y) {
; GENERIC-LABEL: divps512fold:		; GENERIC-LABEL: divps512fold:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
; GENERIC-NEXT: vdivps {{.*}}(%rip), %zmm0, %zmm0 # sched: [28:1.00]		; GENERIC-NEXT: vdivps {{.*}}(%rip), %zmm0, %zmm0 # sched: [29:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: divps512fold:		; SKX-LABEL: divps512fold:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: vdivps {{.*}}(%rip), %zmm0, %zmm0 # sched: [25:10.00]		; SKX-NEXT: vdivps {{.*}}(%rip), %zmm0, %zmm0 # sched: [25:10.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%div.i = fdiv <16 x float> %y, <float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 4.500000e+00, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 4.500000e+00, float 0x4002666660000000, float 0x3FF3333340000000>		%div.i = fdiv <16 x float> %y, <float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 4.500000e+00, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 4.500000e+00, float 0x4002666660000000, float 0x3FF3333340000000>
Show All 12 Lines
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%x = add <8 x i64> %i, %j		%x = add <8 x i64> %i, %j
ret <8 x i64> %x		ret <8 x i64> %x
}		}

define <8 x i64> @vpaddq_fold_test(<8 x i64> %i, <8 x i64>* %j) nounwind {		define <8 x i64> @vpaddq_fold_test(<8 x i64> %i, <8 x i64>* %j) nounwind {
; GENERIC-LABEL: vpaddq_fold_test:		; GENERIC-LABEL: vpaddq_fold_test:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpaddq (%rdi), %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vpaddq (%rdi), %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: vpaddq_fold_test:		; SKX-LABEL: vpaddq_fold_test:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpaddq (%rdi), %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vpaddq (%rdi), %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%tmp = load <8 x i64>, <8 x i64>* %j, align 4		%tmp = load <8 x i64>, <8 x i64>* %j, align 4
%x = add <8 x i64> %i, %tmp		%x = add <8 x i64> %i, %tmp
ret <8 x i64> %x		ret <8 x i64> %x
}		}

define <8 x i64> @vpaddq_broadcast_test(<8 x i64> %i) nounwind {		define <8 x i64> @vpaddq_broadcast_test(<8 x i64> %i) nounwind {
; GENERIC-LABEL: vpaddq_broadcast_test:		; GENERIC-LABEL: vpaddq_broadcast_test:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: vpaddq_broadcast_test:		; SKX-LABEL: vpaddq_broadcast_test:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%x = add <8 x i64> %i, <i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2>		%x = add <8 x i64> %i, <i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2>
ret <8 x i64> %x		ret <8 x i64> %x
}		}

define <8 x i64> @vpaddq_broadcast2_test(<8 x i64> %i, i64* %j) nounwind {		define <8 x i64> @vpaddq_broadcast2_test(<8 x i64> %i, i64* %j) nounwind {
; GENERIC-LABEL: vpaddq_broadcast2_test:		; GENERIC-LABEL: vpaddq_broadcast2_test:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpaddq (%rdi){1to8}, %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vpaddq (%rdi){1to8}, %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: vpaddq_broadcast2_test:		; SKX-LABEL: vpaddq_broadcast2_test:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpaddq (%rdi){1to8}, %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vpaddq (%rdi){1to8}, %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%tmp = load i64, i64* %j		%tmp = load i64, i64* %j
%j.0 = insertelement <8 x i64> undef, i64 %tmp, i32 0		%j.0 = insertelement <8 x i64> undef, i64 %tmp, i32 0
Show All 20 Lines
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%x = add <16 x i32> %i, %j		%x = add <16 x i32> %i, %j
ret <16 x i32> %x		ret <16 x i32> %x
}		}

define <16 x i32> @vpaddd_fold_test(<16 x i32> %i, <16 x i32>* %j) nounwind {		define <16 x i32> @vpaddd_fold_test(<16 x i32> %i, <16 x i32>* %j) nounwind {
; GENERIC-LABEL: vpaddd_fold_test:		; GENERIC-LABEL: vpaddd_fold_test:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpaddd (%rdi), %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vpaddd (%rdi), %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: vpaddd_fold_test:		; SKX-LABEL: vpaddd_fold_test:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpaddd (%rdi), %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vpaddd (%rdi), %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%tmp = load <16 x i32>, <16 x i32>* %j, align 4		%tmp = load <16 x i32>, <16 x i32>* %j, align 4
%x = add <16 x i32> %i, %tmp		%x = add <16 x i32> %i, %tmp
ret <16 x i32> %x		ret <16 x i32> %x
}		}

define <16 x i32> @vpaddd_broadcast_test(<16 x i32> %i) nounwind {		define <16 x i32> @vpaddd_broadcast_test(<16 x i32> %i) nounwind {
; GENERIC-LABEL: vpaddd_broadcast_test:		; GENERIC-LABEL: vpaddd_broadcast_test:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: vpaddd_broadcast_test:		; SKX-LABEL: vpaddd_broadcast_test:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%x = add <16 x i32> %i, <i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3>		%x = add <16 x i32> %i, <i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3>
ret <16 x i32> %x		ret <16 x i32> %x
Show All 34 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%r = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> zeroinitializer		%r = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> zeroinitializer
ret <16 x i32> %r		ret <16 x i32> %r
}		}

define <16 x i32> @vpaddd_mask_fold_test(<16 x i32> %i, <16 x i32>* %j.ptr, <16 x i32> %mask1) nounwind readnone {		define <16 x i32> @vpaddd_mask_fold_test(<16 x i32> %i, <16 x i32>* %j.ptr, <16 x i32> %mask1) nounwind readnone {
; GENERIC-LABEL: vpaddd_mask_fold_test:		; GENERIC-LABEL: vpaddd_mask_fold_test:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpaddd (%rdi), %zmm0, %zmm0 {%k1} # sched: [7:1.00]		; GENERIC-NEXT: vpaddd (%rdi), %zmm0, %zmm0 {%k1} # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: vpaddd_mask_fold_test:		; SKX-LABEL: vpaddd_mask_fold_test:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpaddd (%rdi), %zmm0, %zmm0 {%k1} # sched: [8:0.50]		; SKX-NEXT: vpaddd (%rdi), %zmm0, %zmm0 {%k1} # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%mask = icmp ne <16 x i32> %mask1, zeroinitializer		%mask = icmp ne <16 x i32> %mask1, zeroinitializer
%j = load <16 x i32>, <16 x i32>* %j.ptr		%j = load <16 x i32>, <16 x i32>* %j.ptr
%x = add <16 x i32> %i, %j		%x = add <16 x i32> %i, %j
%r = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> %i		%r = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> %i
ret <16 x i32> %r		ret <16 x i32> %r
}		}

define <16 x i32> @vpaddd_mask_broadcast_test(<16 x i32> %i, <16 x i32> %mask1) nounwind readnone {		define <16 x i32> @vpaddd_mask_broadcast_test(<16 x i32> %i, <16 x i32> %mask1) nounwind readnone {
; GENERIC-LABEL: vpaddd_mask_broadcast_test:		; GENERIC-LABEL: vpaddd_mask_broadcast_test:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 {%k1} # sched: [7:1.00]		; GENERIC-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 {%k1} # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: vpaddd_mask_broadcast_test:		; SKX-LABEL: vpaddd_mask_broadcast_test:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 {%k1} # sched: [8:0.50]		; SKX-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 {%k1} # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%mask = icmp ne <16 x i32> %mask1, zeroinitializer		%mask = icmp ne <16 x i32> %mask1, zeroinitializer
%x = add <16 x i32> %i, <i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>		%x = add <16 x i32> %i, <i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>
%r = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> %i		%r = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> %i
ret <16 x i32> %r		ret <16 x i32> %r
}		}

define <16 x i32> @vpaddd_maskz_fold_test(<16 x i32> %i, <16 x i32>* %j.ptr, <16 x i32> %mask1) nounwind readnone {		define <16 x i32> @vpaddd_maskz_fold_test(<16 x i32> %i, <16 x i32>* %j.ptr, <16 x i32> %mask1) nounwind readnone {
; GENERIC-LABEL: vpaddd_maskz_fold_test:		; GENERIC-LABEL: vpaddd_maskz_fold_test:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpaddd (%rdi), %zmm0, %zmm0 {%k1} {z} # sched: [7:1.00]		; GENERIC-NEXT: vpaddd (%rdi), %zmm0, %zmm0 {%k1} {z} # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: vpaddd_maskz_fold_test:		; SKX-LABEL: vpaddd_maskz_fold_test:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpaddd (%rdi), %zmm0, %zmm0 {%k1} {z} # sched: [8:0.50]		; SKX-NEXT: vpaddd (%rdi), %zmm0, %zmm0 {%k1} {z} # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%mask = icmp ne <16 x i32> %mask1, zeroinitializer		%mask = icmp ne <16 x i32> %mask1, zeroinitializer
%j = load <16 x i32>, <16 x i32>* %j.ptr		%j = load <16 x i32>, <16 x i32>* %j.ptr
%x = add <16 x i32> %i, %j		%x = add <16 x i32> %i, %j
%r = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> zeroinitializer		%r = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> zeroinitializer
ret <16 x i32> %r		ret <16 x i32> %r
}		}

define <16 x i32> @vpaddd_maskz_broadcast_test(<16 x i32> %i, <16 x i32> %mask1) nounwind readnone {		define <16 x i32> @vpaddd_maskz_broadcast_test(<16 x i32> %i, <16 x i32> %mask1) nounwind readnone {
; GENERIC-LABEL: vpaddd_maskz_broadcast_test:		; GENERIC-LABEL: vpaddd_maskz_broadcast_test:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 {%k1} {z} # sched: [7:1.00]		; GENERIC-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 {%k1} {z} # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: vpaddd_maskz_broadcast_test:		; SKX-LABEL: vpaddd_maskz_broadcast_test:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 {%k1} {z} # sched: [8:0.50]		; SKX-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 {%k1} {z} # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%mask = icmp ne <16 x i32> %mask1, zeroinitializer		%mask = icmp ne <16 x i32> %mask1, zeroinitializer
▲ Show 20 Lines • Show All 119 Lines • ▼ Show 20 Lines
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%b = call <8 x double> @llvm.sqrt.v8f64(<8 x double> %a)		%b = call <8 x double> @llvm.sqrt.v8f64(<8 x double> %a)
ret <8 x double> %b		ret <8 x double> %b
}		}

define <16 x float> @fadd_broadcast(<16 x float> %a) nounwind {		define <16 x float> @fadd_broadcast(<16 x float> %a) nounwind {
; GENERIC-LABEL: fadd_broadcast:		; GENERIC-LABEL: fadd_broadcast:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vaddps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vaddps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: fadd_broadcast:		; SKX-LABEL: fadd_broadcast:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vaddps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [11:0.50]		; SKX-NEXT: vaddps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [11:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%b = fadd <16 x float> %a, <float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000>		%b = fadd <16 x float> %a, <float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000>
ret <16 x float> %b		ret <16 x float> %b
}		}

define <8 x i64> @addq_broadcast(<8 x i64> %a) nounwind {		define <8 x i64> @addq_broadcast(<8 x i64> %a) nounwind {
; GENERIC-LABEL: addq_broadcast:		; GENERIC-LABEL: addq_broadcast:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: addq_broadcast:		; SKX-LABEL: addq_broadcast:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%b = add <8 x i64> %a, <i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2>		%b = add <8 x i64> %a, <i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2>
ret <8 x i64> %b		ret <8 x i64> %b
}		}

define <8 x i64> @orq_broadcast(<8 x i64> %a) nounwind {		define <8 x i64> @orq_broadcast(<8 x i64> %a) nounwind {
; GENERIC-LABEL: orq_broadcast:		; GENERIC-LABEL: orq_broadcast:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vorpd {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vorpd {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: orq_broadcast:		; SKX-LABEL: orq_broadcast:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vorpd {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vorpd {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%b = or <8 x i64> %a, <i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2>		%b = or <8 x i64> %a, <i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2, i64 2>
ret <8 x i64> %b		ret <8 x i64> %b
}		}

define <16 x i32> @andd512fold(<16 x i32> %y, <16 x i32>* %x) {		define <16 x i32> @andd512fold(<16 x i32> %y, <16 x i32>* %x) {
; GENERIC-LABEL: andd512fold:		; GENERIC-LABEL: andd512fold:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
; GENERIC-NEXT: vandps (%rdi), %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vandps (%rdi), %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: andd512fold:		; SKX-LABEL: andd512fold:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: vandps (%rdi), %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vandps (%rdi), %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%a = load <16 x i32>, <16 x i32>* %x, align 4		%a = load <16 x i32>, <16 x i32>* %x, align 4
%b = and <16 x i32> %y, %a		%b = and <16 x i32> %y, %a
ret <16 x i32> %b		ret <16 x i32> %b
}		}

define <8 x i64> @andqbrst(<8 x i64> %p1, i64* %ap) {		define <8 x i64> @andqbrst(<8 x i64> %p1, i64* %ap) {
; GENERIC-LABEL: andqbrst:		; GENERIC-LABEL: andqbrst:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
; GENERIC-NEXT: vandpd (%rdi){1to8}, %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vandpd (%rdi){1to8}, %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: andqbrst:		; SKX-LABEL: andqbrst:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: vandpd (%rdi){1to8}, %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vandpd (%rdi){1to8}, %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
%a = load i64, i64* %ap, align 8		%a = load i64, i64* %ap, align 8
▲ Show 20 Lines • Show All 188 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%r = select <8 x i1> %mask, <8 x double> %x, <8 x double> zeroinitializer		%r = select <8 x i1> %mask, <8 x double> %x, <8 x double> zeroinitializer
ret <8 x double> %r		ret <8 x double> %r
}		}

define <8 x double> @test_mask_fold_vaddpd(<8 x double> %dst, <8 x double> %i, <8 x double>* %j, <8 x i64> %mask1) nounwind {		define <8 x double> @test_mask_fold_vaddpd(<8 x double> %dst, <8 x double> %i, <8 x double>* %j, <8 x i64> %mask1) nounwind {
; GENERIC-LABEL: test_mask_fold_vaddpd:		; GENERIC-LABEL: test_mask_fold_vaddpd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestmq %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestmq %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vaddpd (%rdi), %zmm1, %zmm0 {%k1} # sched: [7:1.00]		; GENERIC-NEXT: vaddpd (%rdi), %zmm1, %zmm0 {%k1} # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_mask_fold_vaddpd:		; SKX-LABEL: test_mask_fold_vaddpd:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmq %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestmq %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vaddpd (%rdi), %zmm1, %zmm0 {%k1} # sched: [11:0.50]		; SKX-NEXT: vaddpd (%rdi), %zmm1, %zmm0 {%k1} # sched: [11:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%mask = icmp ne <8 x i64> %mask1, zeroinitializer		%mask = icmp ne <8 x i64> %mask1, zeroinitializer
%tmp = load <8 x double>, <8 x double>* %j, align 8		%tmp = load <8 x double>, <8 x double>* %j, align 8
%x = fadd <8 x double> %i, %tmp		%x = fadd <8 x double> %i, %tmp
%r = select <8 x i1> %mask, <8 x double> %x, <8 x double> %dst		%r = select <8 x i1> %mask, <8 x double> %x, <8 x double> %dst
ret <8 x double> %r		ret <8 x double> %r
}		}

define <8 x double> @test_maskz_fold_vaddpd(<8 x double> %i, <8 x double>* %j, <8 x i64> %mask1) nounwind {		define <8 x double> @test_maskz_fold_vaddpd(<8 x double> %i, <8 x double>* %j, <8 x i64> %mask1) nounwind {
; GENERIC-LABEL: test_maskz_fold_vaddpd:		; GENERIC-LABEL: test_maskz_fold_vaddpd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vaddpd (%rdi), %zmm0, %zmm0 {%k1} {z} # sched: [7:1.00]		; GENERIC-NEXT: vaddpd (%rdi), %zmm0, %zmm0 {%k1} {z} # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_maskz_fold_vaddpd:		; SKX-LABEL: test_maskz_fold_vaddpd:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vaddpd (%rdi), %zmm0, %zmm0 {%k1} {z} # sched: [11:0.50]		; SKX-NEXT: vaddpd (%rdi), %zmm0, %zmm0 {%k1} {z} # sched: [11:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%mask = icmp ne <8 x i64> %mask1, zeroinitializer		%mask = icmp ne <8 x i64> %mask1, zeroinitializer
%tmp = load <8 x double>, <8 x double>* %j, align 8		%tmp = load <8 x double>, <8 x double>* %j, align 8
%x = fadd <8 x double> %i, %tmp		%x = fadd <8 x double> %i, %tmp
%r = select <8 x i1> %mask, <8 x double> %x, <8 x double> zeroinitializer		%r = select <8 x i1> %mask, <8 x double> %x, <8 x double> zeroinitializer
ret <8 x double> %r		ret <8 x double> %r
}		}

define <8 x double> @test_broadcast_vaddpd(<8 x double> %i, double* %j) nounwind {		define <8 x double> @test_broadcast_vaddpd(<8 x double> %i, double* %j) nounwind {
; GENERIC-LABEL: test_broadcast_vaddpd:		; GENERIC-LABEL: test_broadcast_vaddpd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vaddpd (%rdi){1to8}, %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vaddpd (%rdi){1to8}, %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_broadcast_vaddpd:		; SKX-LABEL: test_broadcast_vaddpd:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vaddpd (%rdi){1to8}, %zmm0, %zmm0 # sched: [11:0.50]		; SKX-NEXT: vaddpd (%rdi){1to8}, %zmm0, %zmm0 # sched: [11:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%tmp = load double, double* %j		%tmp = load double, double* %j
%b = insertelement <8 x double> undef, double %tmp, i32 0		%b = insertelement <8 x double> undef, double %tmp, i32 0
%c = shufflevector <8 x double> %b, <8 x double> undef,		%c = shufflevector <8 x double> %b, <8 x double> undef,
<8 x i32> zeroinitializer		<8 x i32> zeroinitializer
%x = fadd <8 x double> %c, %i		%x = fadd <8 x double> %c, %i
ret <8 x double> %x		ret <8 x double> %x
}		}

define <8 x double> @test_mask_broadcast_vaddpd(<8 x double> %dst, <8 x double> %i, double* %j, <8 x i64> %mask1) nounwind {		define <8 x double> @test_mask_broadcast_vaddpd(<8 x double> %dst, <8 x double> %i, double* %j, <8 x i64> %mask1) nounwind {
; GENERIC-LABEL: test_mask_broadcast_vaddpd:		; GENERIC-LABEL: test_mask_broadcast_vaddpd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestmq %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestmq %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vaddpd (%rdi){1to8}, %zmm1, %zmm1 {%k1} # sched: [7:1.00]		; GENERIC-NEXT: vaddpd (%rdi){1to8}, %zmm1, %zmm1 {%k1} # sched: [8:1.00]
; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_mask_broadcast_vaddpd:		; SKX-LABEL: test_mask_broadcast_vaddpd:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmq %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestmq %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vaddpd (%rdi){1to8}, %zmm1, %zmm1 {%k1} # sched: [11:0.50]		; SKX-NEXT: vaddpd (%rdi){1to8}, %zmm1, %zmm1 {%k1} # sched: [11:0.50]
; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%mask = icmp ne <8 x i64> %mask1, zeroinitializer		%mask = icmp ne <8 x i64> %mask1, zeroinitializer
%tmp = load double, double* %j		%tmp = load double, double* %j
%b = insertelement <8 x double> undef, double %tmp, i32 0		%b = insertelement <8 x double> undef, double %tmp, i32 0
%c = shufflevector <8 x double> %b, <8 x double> undef,		%c = shufflevector <8 x double> %b, <8 x double> undef,
<8 x i32> zeroinitializer		<8 x i32> zeroinitializer
%x = fadd <8 x double> %c, %i		%x = fadd <8 x double> %c, %i
%r = select <8 x i1> %mask, <8 x double> %x, <8 x double> %i		%r = select <8 x i1> %mask, <8 x double> %x, <8 x double> %i
ret <8 x double> %r		ret <8 x double> %r
}		}

define <8 x double> @test_maskz_broadcast_vaddpd(<8 x double> %i, double* %j,		define <8 x double> @test_maskz_broadcast_vaddpd(<8 x double> %i, double* %j,
; GENERIC-LABEL: test_maskz_broadcast_vaddpd:		; GENERIC-LABEL: test_maskz_broadcast_vaddpd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vaddpd (%rdi){1to8}, %zmm0, %zmm0 {%k1} {z} # sched: [7:1.00]		; GENERIC-NEXT: vaddpd (%rdi){1to8}, %zmm0, %zmm0 {%k1} {z} # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_maskz_broadcast_vaddpd:		; SKX-LABEL: test_maskz_broadcast_vaddpd:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vaddpd (%rdi){1to8}, %zmm0, %zmm0 {%k1} {z} # sched: [11:0.50]		; SKX-NEXT: vaddpd (%rdi){1to8}, %zmm0, %zmm0 {%k1} {z} # sched: [11:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
<8 x i64> %mask1) nounwind {		<8 x i64> %mask1) nounwind {
%mask = icmp ne <8 x i64> %mask1, zeroinitializer		%mask = icmp ne <8 x i64> %mask1, zeroinitializer
%tmp = load double, double* %j		%tmp = load double, double* %j
%b = insertelement <8 x double> undef, double %tmp, i32 0		%b = insertelement <8 x double> undef, double %tmp, i32 0
%c = shufflevector <8 x double> %b, <8 x double> undef,		%c = shufflevector <8 x double> %b, <8 x double> undef,
<8 x i32> zeroinitializer		<8 x i32> zeroinitializer
%x = fadd <8 x double> %c, %i		%x = fadd <8 x double> %c, %i
%r = select <8 x i1> %mask, <8 x double> %x, <8 x double> zeroinitializer		%r = select <8 x i1> %mask, <8 x double> %x, <8 x double> zeroinitializer
ret <8 x double> %r		ret <8 x double> %r
}		}

define <16 x float> @test_fxor(<16 x float> %a) {		define <16 x float> @test_fxor(<16 x float> %a) {
; GENERIC-LABEL: test_fxor:		; GENERIC-LABEL: test_fxor:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vxorps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vxorps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_fxor:		; SKX-LABEL: test_fxor:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vxorps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vxorps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]

%res = fsub <16 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %a		%res = fsub <16 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %a
ret <16 x float>%res		ret <16 x float>%res
}		}

define <8 x float> @test_fxor_8f32(<8 x float> %a) {		define <8 x float> @test_fxor_8f32(<8 x float> %a) {
; GENERIC-LABEL: test_fxor_8f32:		; GENERIC-LABEL: test_fxor_8f32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vxorps {{.*}}(%rip){1to8}, %ymm0, %ymm0 # sched: [7:1.00]		; GENERIC-NEXT: vxorps {{.*}}(%rip){1to8}, %ymm0, %ymm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_fxor_8f32:		; SKX-LABEL: test_fxor_8f32:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vxorps {{.*}}(%rip){1to8}, %ymm0, %ymm0 # sched: [8:0.50]		; SKX-NEXT: vxorps {{.*}}(%rip){1to8}, %ymm0, %ymm0 # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%res = fsub <8 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %a		%res = fsub <8 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %a
ret <8 x float>%res		ret <8 x float>%res
}		}

define <8 x double> @fabs_v8f64(<8 x double> %p)		define <8 x double> @fabs_v8f64(<8 x double> %p)
; GENERIC-LABEL: fabs_v8f64:		; GENERIC-LABEL: fabs_v8f64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vandpd {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vandpd {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: fabs_v8f64:		; SKX-LABEL: fabs_v8f64:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vandpd {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vandpd {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
{		{
%t = call <8 x double> @llvm.fabs.v8f64(<8 x double> %p)		%t = call <8 x double> @llvm.fabs.v8f64(<8 x double> %p)
ret <8 x double> %t		ret <8 x double> %t
}		}
declare <8 x double> @llvm.fabs.v8f64(<8 x double> %p)		declare <8 x double> @llvm.fabs.v8f64(<8 x double> %p)

define <16 x float> @fabs_v16f32(<16 x float> %p)		define <16 x float> @fabs_v16f32(<16 x float> %p)
; GENERIC-LABEL: fabs_v16f32:		; GENERIC-LABEL: fabs_v16f32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vandps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vandps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: fabs_v16f32:		; SKX-LABEL: fabs_v16f32:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vandps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vandps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
{		{
%t = call <16 x float> @llvm.fabs.v16f32(<16 x float> %p)		%t = call <16 x float> @llvm.fabs.v16f32(<16 x float> %p)
▲ Show 20 Lines • Show All 347 Lines • ▼ Show 20 Lines
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%b = sitofp <2 x i64> %a to <2 x float>		%b = sitofp <2 x i64> %a to <2 x float>
ret <2 x float>%b		ret <2 x float>%b
}		}

define <4 x float> @slto4f32_mem(<4 x i64>* %a) {		define <4 x float> @slto4f32_mem(<4 x i64>* %a) {
; GENERIC-LABEL: slto4f32_mem:		; GENERIC-LABEL: slto4f32_mem:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vcvtqq2psy (%rdi), %xmm0 # sched: [8:1.00]		; GENERIC-NEXT: vcvtqq2psy (%rdi), %xmm0 # sched: [9:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: slto4f32_mem:		; SKX-LABEL: slto4f32_mem:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vcvtqq2psy (%rdi), %xmm0 # sched: [11:0.50]		; SKX-NEXT: vcvtqq2psy (%rdi), %xmm0 # sched: [11:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a1 = load <4 x i64>, <4 x i64>* %a, align 8		%a1 = load <4 x i64>, <4 x i64>* %a, align 8
%b = sitofp <4 x i64> %a1 to <4 x float>		%b = sitofp <4 x i64> %a1 to <4 x float>
▲ Show 20 Lines • Show All 1,409 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
ret <16 x double> %1		ret <16 x double> %1
}		}

define <8 x float> @ubto8f32(<8 x i32> %a) {		define <8 x float> @ubto8f32(<8 x i32> %a) {
; GENERIC-LABEL: ubto8f32:		; GENERIC-LABEL: ubto8f32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpxor %xmm1, %xmm1, %xmm1 # sched: [1:0.33]		; GENERIC-NEXT: vpxor %xmm1, %xmm1, %xmm1 # sched: [1:0.33]
; GENERIC-NEXT: vpcmpgtd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vpcmpgtd %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vpandd {{.*}}(%rip){1to8}, %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpandd {{.*}}(%rip){1to8}, %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: ubto8f32:		; SKX-LABEL: ubto8f32:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpxor %xmm1, %xmm1, %xmm1 # sched: [1:0.33]		; SKX-NEXT: vpxor %xmm1, %xmm1, %xmm1 # sched: [1:0.33]
; SKX-NEXT: vpcmpgtd %ymm0, %ymm1, %ymm0 # sched: [1:0.50]		; SKX-NEXT: vpcmpgtd %ymm0, %ymm1, %ymm0 # sched: [1:0.50]
; SKX-NEXT: vpandd {{.*}}(%rip){1to8}, %ymm0, %ymm0 # sched: [8:0.50]		; SKX-NEXT: vpandd {{.*}}(%rip){1to8}, %ymm0, %ymm0 # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
Show All 23 Lines	; SKX-NEXT: retq # sched: [7:1.00]
ret <8 x double> %1		ret <8 x double> %1
}		}

define <4 x float> @ubto4f32(<4 x i32> %a) {		define <4 x float> @ubto4f32(<4 x i32> %a) {
; GENERIC-LABEL: ubto4f32:		; GENERIC-LABEL: ubto4f32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpxor %xmm1, %xmm1, %xmm1 # sched: [1:0.33]		; GENERIC-NEXT: vpxor %xmm1, %xmm1, %xmm1 # sched: [1:0.33]
; GENERIC-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: vpandd {{.*}}(%rip){1to4}, %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpandd {{.*}}(%rip){1to4}, %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: ubto4f32:		; SKX-LABEL: ubto4f32:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpxor %xmm1, %xmm1, %xmm1 # sched: [1:0.33]		; SKX-NEXT: vpxor %xmm1, %xmm1, %xmm1 # sched: [1:0.33]
; SKX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpcmpgtd %xmm0, %xmm1, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpandd {{.*}}(%rip){1to4}, %xmm0, %xmm0 # sched: [7:0.50]		; SKX-NEXT: vpandd {{.*}}(%rip){1to4}, %xmm0, %xmm0 # sched: [7:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
ret <2 x double> %1		ret <2 x double> %1
}		}

define <8 x i16> @zext_8x8mem_to_8x16(<8 x i8> *%i , <8 x i1> %mask) nounwind readnone {		define <8 x i16> @zext_8x8mem_to_8x16(<8 x i8> *%i , <8 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: zext_8x8mem_to_8x16:		; GENERIC-LABEL: zext_8x8mem_to_8x16:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovzxbw {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxbw {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: zext_8x8mem_to_8x16:		; SKX-LABEL: zext_8x8mem_to_8x16:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovzxbw {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero sched: [9:1.00]		; SKX-NEXT: vpmovzxbw {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero sched: [9:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <8 x i8>,<8 x i8> *%i,align 1		%a = load <8 x i8>,<8 x i8> *%i,align 1
%x = zext <8 x i8> %a to <8 x i16>		%x = zext <8 x i8> %a to <8 x i16>
%ret = select <8 x i1> %mask, <8 x i16> %x, <8 x i16> zeroinitializer		%ret = select <8 x i1> %mask, <8 x i16> %x, <8 x i16> zeroinitializer
ret <8 x i16> %ret		ret <8 x i16> %ret
}		}

define <8 x i16> @sext_8x8mem_to_8x16(<8 x i8> *%i , <8 x i1> %mask) nounwind readnone {		define <8 x i16> @sext_8x8mem_to_8x16(<8 x i8> *%i , <8 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: sext_8x8mem_to_8x16:		; GENERIC-LABEL: sext_8x8mem_to_8x16:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovsxbw (%rdi), %xmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxbw (%rdi), %xmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_8x8mem_to_8x16:		; SKX-LABEL: sext_8x8mem_to_8x16:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovsxbw (%rdi), %xmm0 {%k1} {z} # sched: [9:1.00]		; SKX-NEXT: vpmovsxbw (%rdi), %xmm0 {%k1} {z} # sched: [9:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <8 x i8>,<8 x i8> *%i,align 1		%a = load <8 x i8>,<8 x i8> *%i,align 1
%x = sext <8 x i8> %a to <8 x i16>		%x = sext <8 x i8> %a to <8 x i16>
%ret = select <8 x i1> %mask, <8 x i16> %x, <8 x i16> zeroinitializer		%ret = select <8 x i1> %mask, <8 x i16> %x, <8 x i16> zeroinitializer
ret <8 x i16> %ret		ret <8 x i16> %ret
}		}


define <16 x i16> @zext_16x8mem_to_16x16(<16 x i8> *%i , <16 x i1> %mask) nounwind readnone {		define <16 x i16> @zext_16x8mem_to_16x16(<16 x i8> *%i , <16 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: zext_16x8mem_to_16x16:		; GENERIC-LABEL: zext_16x8mem_to_16x16:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovzxbw {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero,mem[8],zero,mem[9],zero,mem[10],zero,mem[11],zero,mem[12],zero,mem[13],zero,mem[14],zero,mem[15],zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxbw {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero,mem[8],zero,mem[9],zero,mem[10],zero,mem[11],zero,mem[12],zero,mem[13],zero,mem[14],zero,mem[15],zero sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: zext_16x8mem_to_16x16:		; SKX-LABEL: zext_16x8mem_to_16x16:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovzxbw {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero,mem[8],zero,mem[9],zero,mem[10],zero,mem[11],zero,mem[12],zero,mem[13],zero,mem[14],zero,mem[15],zero sched: [10:1.00]		; SKX-NEXT: vpmovzxbw {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero,mem[8],zero,mem[9],zero,mem[10],zero,mem[11],zero,mem[12],zero,mem[13],zero,mem[14],zero,mem[15],zero sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <16 x i8>,<16 x i8> *%i,align 1		%a = load <16 x i8>,<16 x i8> *%i,align 1
%x = zext <16 x i8> %a to <16 x i16>		%x = zext <16 x i8> %a to <16 x i16>
%ret = select <16 x i1> %mask, <16 x i16> %x, <16 x i16> zeroinitializer		%ret = select <16 x i1> %mask, <16 x i16> %x, <16 x i16> zeroinitializer
ret <16 x i16> %ret		ret <16 x i16> %ret
}		}

define <16 x i16> @sext_16x8mem_to_16x16(<16 x i8> *%i , <16 x i1> %mask) nounwind readnone {		define <16 x i16> @sext_16x8mem_to_16x16(<16 x i8> *%i , <16 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: sext_16x8mem_to_16x16:		; GENERIC-LABEL: sext_16x8mem_to_16x16:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovsxbw (%rdi), %ymm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxbw (%rdi), %ymm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_16x8mem_to_16x16:		; SKX-LABEL: sext_16x8mem_to_16x16:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovsxbw (%rdi), %ymm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpmovsxbw (%rdi), %ymm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
ret <16 x i16> %ret		ret <16 x i16> %ret
}		}

define <32 x i16> @zext_32x8mem_to_32x16(<32 x i8> *%i , <32 x i1> %mask) nounwind readnone {		define <32 x i16> @zext_32x8mem_to_32x16(<32 x i8> *%i , <32 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: zext_32x8mem_to_32x16:		; GENERIC-LABEL: zext_32x8mem_to_32x16:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw $7, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $7, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovb2m %ymm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovb2m %ymm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovzxbw {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero,mem[8],zero,mem[9],zero,mem[10],zero,mem[11],zero,mem[12],zero,mem[13],zero,mem[14],zero,mem[15],zero,mem[16],zero,mem[17],zero,mem[18],zero,mem[19],zero,mem[20],zero,mem[21],zero,mem[22],zero,mem[23],zero,mem[24],zero,mem[25],zero,mem[26],zero,mem[27],zero,mem[28],zero,mem[29],zero,mem[30],zero,mem[31],zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxbw {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero,mem[8],zero,mem[9],zero,mem[10],zero,mem[11],zero,mem[12],zero,mem[13],zero,mem[14],zero,mem[15],zero,mem[16],zero,mem[17],zero,mem[18],zero,mem[19],zero,mem[20],zero,mem[21],zero,mem[22],zero,mem[23],zero,mem[24],zero,mem[25],zero,mem[26],zero,mem[27],zero,mem[28],zero,mem[29],zero,mem[30],zero,mem[31],zero sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: zext_32x8mem_to_32x16:		; SKX-LABEL: zext_32x8mem_to_32x16:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllw $7, %ymm0, %ymm0 # sched: [1:0.50]		; SKX-NEXT: vpsllw $7, %ymm0, %ymm0 # sched: [1:0.50]
; SKX-NEXT: vpmovb2m %ymm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovb2m %ymm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovzxbw {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero,mem[8],zero,mem[9],zero,mem[10],zero,mem[11],zero,mem[12],zero,mem[13],zero,mem[14],zero,mem[15],zero,mem[16],zero,mem[17],zero,mem[18],zero,mem[19],zero,mem[20],zero,mem[21],zero,mem[22],zero,mem[23],zero,mem[24],zero,mem[25],zero,mem[26],zero,mem[27],zero,mem[28],zero,mem[29],zero,mem[30],zero,mem[31],zero sched: [10:1.00]		; SKX-NEXT: vpmovzxbw {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero,mem[8],zero,mem[9],zero,mem[10],zero,mem[11],zero,mem[12],zero,mem[13],zero,mem[14],zero,mem[15],zero,mem[16],zero,mem[17],zero,mem[18],zero,mem[19],zero,mem[20],zero,mem[21],zero,mem[22],zero,mem[23],zero,mem[24],zero,mem[25],zero,mem[26],zero,mem[27],zero,mem[28],zero,mem[29],zero,mem[30],zero,mem[31],zero sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <32 x i8>,<32 x i8> *%i,align 1		%a = load <32 x i8>,<32 x i8> *%i,align 1
%x = zext <32 x i8> %a to <32 x i16>		%x = zext <32 x i8> %a to <32 x i16>
%ret = select <32 x i1> %mask, <32 x i16> %x, <32 x i16> zeroinitializer		%ret = select <32 x i1> %mask, <32 x i16> %x, <32 x i16> zeroinitializer
ret <32 x i16> %ret		ret <32 x i16> %ret
}		}

define <32 x i16> @sext_32x8mem_to_32x16(<32 x i8> *%i , <32 x i1> %mask) nounwind readnone {		define <32 x i16> @sext_32x8mem_to_32x16(<32 x i8> *%i , <32 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: sext_32x8mem_to_32x16:		; GENERIC-LABEL: sext_32x8mem_to_32x16:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw $7, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $7, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovb2m %ymm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovb2m %ymm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovsxbw (%rdi), %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxbw (%rdi), %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_32x8mem_to_32x16:		; SKX-LABEL: sext_32x8mem_to_32x16:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllw $7, %ymm0, %ymm0 # sched: [1:0.50]		; SKX-NEXT: vpsllw $7, %ymm0, %ymm0 # sched: [1:0.50]
; SKX-NEXT: vpmovb2m %ymm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovb2m %ymm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovsxbw (%rdi), %zmm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpmovsxbw (%rdi), %zmm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
ret <32 x i16> %ret		ret <32 x i16> %ret
}		}

define <4 x i32> @zext_4x8mem_to_4x32(<4 x i8> *%i , <4 x i1> %mask) nounwind readnone {		define <4 x i32> @zext_4x8mem_to_4x32(<4 x i8> *%i , <4 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: zext_4x8mem_to_4x32:		; GENERIC-LABEL: zext_4x8mem_to_4x32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovzxbd {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxbd {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: zext_4x8mem_to_4x32:		; SKX-LABEL: zext_4x8mem_to_4x32:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovzxbd {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero sched: [9:1.00]		; SKX-NEXT: vpmovzxbd {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero sched: [9:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <4 x i8>,<4 x i8> *%i,align 1		%a = load <4 x i8>,<4 x i8> *%i,align 1
%x = zext <4 x i8> %a to <4 x i32>		%x = zext <4 x i8> %a to <4 x i32>
%ret = select <4 x i1> %mask, <4 x i32> %x, <4 x i32> zeroinitializer		%ret = select <4 x i1> %mask, <4 x i32> %x, <4 x i32> zeroinitializer
ret <4 x i32> %ret		ret <4 x i32> %ret
}		}

define <4 x i32> @sext_4x8mem_to_4x32(<4 x i8> *%i , <4 x i1> %mask) nounwind readnone {		define <4 x i32> @sext_4x8mem_to_4x32(<4 x i8> *%i , <4 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: sext_4x8mem_to_4x32:		; GENERIC-LABEL: sext_4x8mem_to_4x32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovsxbd (%rdi), %xmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxbd (%rdi), %xmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_4x8mem_to_4x32:		; SKX-LABEL: sext_4x8mem_to_4x32:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovsxbd (%rdi), %xmm0 {%k1} {z} # sched: [9:1.00]		; SKX-NEXT: vpmovsxbd (%rdi), %xmm0 {%k1} {z} # sched: [9:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <4 x i8>,<4 x i8> *%i,align 1		%a = load <4 x i8>,<4 x i8> *%i,align 1
%x = sext <4 x i8> %a to <4 x i32>		%x = sext <4 x i8> %a to <4 x i32>
%ret = select <4 x i1> %mask, <4 x i32> %x, <4 x i32> zeroinitializer		%ret = select <4 x i1> %mask, <4 x i32> %x, <4 x i32> zeroinitializer
ret <4 x i32> %ret		ret <4 x i32> %ret
}		}

define <8 x i32> @zext_8x8mem_to_8x32(<8 x i8> *%i , <8 x i1> %mask) nounwind readnone {		define <8 x i32> @zext_8x8mem_to_8x32(<8 x i8> *%i , <8 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: zext_8x8mem_to_8x32:		; GENERIC-LABEL: zext_8x8mem_to_8x32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovzxbd {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero,mem[4],zero,zero,zero,mem[5],zero,zero,zero,mem[6],zero,zero,zero,mem[7],zero,zero,zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxbd {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero,mem[4],zero,zero,zero,mem[5],zero,zero,zero,mem[6],zero,zero,zero,mem[7],zero,zero,zero sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: zext_8x8mem_to_8x32:		; SKX-LABEL: zext_8x8mem_to_8x32:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovzxbd {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero,mem[4],zero,zero,zero,mem[5],zero,zero,zero,mem[6],zero,zero,zero,mem[7],zero,zero,zero sched: [10:1.00]		; SKX-NEXT: vpmovzxbd {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero,mem[4],zero,zero,zero,mem[5],zero,zero,zero,mem[6],zero,zero,zero,mem[7],zero,zero,zero sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <8 x i8>,<8 x i8> *%i,align 1		%a = load <8 x i8>,<8 x i8> *%i,align 1
%x = zext <8 x i8> %a to <8 x i32>		%x = zext <8 x i8> %a to <8 x i32>
%ret = select <8 x i1> %mask, <8 x i32> %x, <8 x i32> zeroinitializer		%ret = select <8 x i1> %mask, <8 x i32> %x, <8 x i32> zeroinitializer
ret <8 x i32> %ret		ret <8 x i32> %ret
}		}

define <8 x i32> @sext_8x8mem_to_8x32(<8 x i8> *%i , <8 x i1> %mask) nounwind readnone {		define <8 x i32> @sext_8x8mem_to_8x32(<8 x i8> *%i , <8 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: sext_8x8mem_to_8x32:		; GENERIC-LABEL: sext_8x8mem_to_8x32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovsxbd (%rdi), %ymm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxbd (%rdi), %ymm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_8x8mem_to_8x32:		; SKX-LABEL: sext_8x8mem_to_8x32:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovsxbd (%rdi), %ymm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpmovsxbd (%rdi), %ymm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <8 x i8>,<8 x i8> *%i,align 1		%a = load <8 x i8>,<8 x i8> *%i,align 1
%x = sext <8 x i8> %a to <8 x i32>		%x = sext <8 x i8> %a to <8 x i32>
%ret = select <8 x i1> %mask, <8 x i32> %x, <8 x i32> zeroinitializer		%ret = select <8 x i1> %mask, <8 x i32> %x, <8 x i32> zeroinitializer
ret <8 x i32> %ret		ret <8 x i32> %ret
}		}

define <16 x i32> @zext_16x8mem_to_16x32(<16 x i8> *%i , <16 x i1> %mask) nounwind readnone {		define <16 x i32> @zext_16x8mem_to_16x32(<16 x i8> *%i , <16 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: zext_16x8mem_to_16x32:		; GENERIC-LABEL: zext_16x8mem_to_16x32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovzxbd {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero,mem[4],zero,zero,zero,mem[5],zero,zero,zero,mem[6],zero,zero,zero,mem[7],zero,zero,zero,mem[8],zero,zero,zero,mem[9],zero,zero,zero,mem[10],zero,zero,zero,mem[11],zero,zero,zero,mem[12],zero,zero,zero,mem[13],zero,zero,zero,mem[14],zero,zero,zero,mem[15],zero,zero,zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxbd {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero,mem[4],zero,zero,zero,mem[5],zero,zero,zero,mem[6],zero,zero,zero,mem[7],zero,zero,zero,mem[8],zero,zero,zero,mem[9],zero,zero,zero,mem[10],zero,zero,zero,mem[11],zero,zero,zero,mem[12],zero,zero,zero,mem[13],zero,zero,zero,mem[14],zero,zero,zero,mem[15],zero,zero,zero sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: zext_16x8mem_to_16x32:		; SKX-LABEL: zext_16x8mem_to_16x32:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovzxbd {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero,mem[4],zero,zero,zero,mem[5],zero,zero,zero,mem[6],zero,zero,zero,mem[7],zero,zero,zero,mem[8],zero,zero,zero,mem[9],zero,zero,zero,mem[10],zero,zero,zero,mem[11],zero,zero,zero,mem[12],zero,zero,zero,mem[13],zero,zero,zero,mem[14],zero,zero,zero,mem[15],zero,zero,zero sched: [10:1.00]		; SKX-NEXT: vpmovzxbd {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero,mem[4],zero,zero,zero,mem[5],zero,zero,zero,mem[6],zero,zero,zero,mem[7],zero,zero,zero,mem[8],zero,zero,zero,mem[9],zero,zero,zero,mem[10],zero,zero,zero,mem[11],zero,zero,zero,mem[12],zero,zero,zero,mem[13],zero,zero,zero,mem[14],zero,zero,zero,mem[15],zero,zero,zero sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <16 x i8>,<16 x i8> *%i,align 1		%a = load <16 x i8>,<16 x i8> *%i,align 1
%x = zext <16 x i8> %a to <16 x i32>		%x = zext <16 x i8> %a to <16 x i32>
%ret = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> zeroinitializer		%ret = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> zeroinitializer
ret <16 x i32> %ret		ret <16 x i32> %ret
}		}

define <16 x i32> @sext_16x8mem_to_16x32(<16 x i8> *%i , <16 x i1> %mask) nounwind readnone {		define <16 x i32> @sext_16x8mem_to_16x32(<16 x i8> *%i , <16 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: sext_16x8mem_to_16x32:		; GENERIC-LABEL: sext_16x8mem_to_16x32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovsxbd (%rdi), %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxbd (%rdi), %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_16x8mem_to_16x32:		; SKX-LABEL: sext_16x8mem_to_16x32:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovsxbd (%rdi), %zmm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpmovsxbd (%rdi), %zmm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
ret <16 x i32> %x		ret <16 x i32> %x
}		}

define <2 x i64> @zext_2x8mem_to_2x64(<2 x i8> *%i , <2 x i1> %mask) nounwind readnone {		define <2 x i64> @zext_2x8mem_to_2x64(<2 x i8> *%i , <2 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: zext_2x8mem_to_2x64:		; GENERIC-LABEL: zext_2x8mem_to_2x64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovzxbq {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxbq {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: zext_2x8mem_to_2x64:		; SKX-LABEL: zext_2x8mem_to_2x64:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovzxbq {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero sched: [9:1.00]		; SKX-NEXT: vpmovzxbq {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero sched: [9:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <2 x i8>,<2 x i8> *%i,align 1		%a = load <2 x i8>,<2 x i8> *%i,align 1
%x = zext <2 x i8> %a to <2 x i64>		%x = zext <2 x i8> %a to <2 x i64>
%ret = select <2 x i1> %mask, <2 x i64> %x, <2 x i64> zeroinitializer		%ret = select <2 x i1> %mask, <2 x i64> %x, <2 x i64> zeroinitializer
ret <2 x i64> %ret		ret <2 x i64> %ret
}		}
define <2 x i64> @sext_2x8mem_to_2x64mask(<2 x i8> *%i , <2 x i1> %mask) nounwind readnone {		define <2 x i64> @sext_2x8mem_to_2x64mask(<2 x i8> *%i , <2 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: sext_2x8mem_to_2x64mask:		; GENERIC-LABEL: sext_2x8mem_to_2x64mask:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovsxbq (%rdi), %xmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxbq (%rdi), %xmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_2x8mem_to_2x64mask:		; SKX-LABEL: sext_2x8mem_to_2x64mask:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovsxbq (%rdi), %xmm0 {%k1} {z} # sched: [9:1.00]		; SKX-NEXT: vpmovsxbq (%rdi), %xmm0 {%k1} {z} # sched: [9:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
Show All 17 Lines	; SKX-NEXT: retq # sched: [7:1.00]
ret <2 x i64> %x		ret <2 x i64> %x
}		}

define <4 x i64> @zext_4x8mem_to_4x64(<4 x i8> *%i , <4 x i1> %mask) nounwind readnone {		define <4 x i64> @zext_4x8mem_to_4x64(<4 x i8> *%i , <4 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: zext_4x8mem_to_4x64:		; GENERIC-LABEL: zext_4x8mem_to_4x64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovzxbq {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero,mem[2],zero,zero,zero,zero,zero,zero,zero,mem[3],zero,zero,zero,zero,zero,zero,zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxbq {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero,mem[2],zero,zero,zero,zero,zero,zero,zero,mem[3],zero,zero,zero,zero,zero,zero,zero sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: zext_4x8mem_to_4x64:		; SKX-LABEL: zext_4x8mem_to_4x64:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovzxbq {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero,mem[2],zero,zero,zero,zero,zero,zero,zero,mem[3],zero,zero,zero,zero,zero,zero,zero sched: [10:1.00]		; SKX-NEXT: vpmovzxbq {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero,mem[2],zero,zero,zero,zero,zero,zero,zero,mem[3],zero,zero,zero,zero,zero,zero,zero sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <4 x i8>,<4 x i8> *%i,align 1		%a = load <4 x i8>,<4 x i8> *%i,align 1
%x = zext <4 x i8> %a to <4 x i64>		%x = zext <4 x i8> %a to <4 x i64>
%ret = select <4 x i1> %mask, <4 x i64> %x, <4 x i64> zeroinitializer		%ret = select <4 x i1> %mask, <4 x i64> %x, <4 x i64> zeroinitializer
ret <4 x i64> %ret		ret <4 x i64> %ret
}		}

define <4 x i64> @sext_4x8mem_to_4x64mask(<4 x i8> *%i , <4 x i1> %mask) nounwind readnone {		define <4 x i64> @sext_4x8mem_to_4x64mask(<4 x i8> *%i , <4 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: sext_4x8mem_to_4x64mask:		; GENERIC-LABEL: sext_4x8mem_to_4x64mask:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovsxbq (%rdi), %ymm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxbq (%rdi), %ymm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_4x8mem_to_4x64mask:		; SKX-LABEL: sext_4x8mem_to_4x64mask:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovsxbq (%rdi), %ymm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpmovsxbq (%rdi), %ymm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <4 x i8>,<4 x i8> *%i,align 1		%a = load <4 x i8>,<4 x i8> *%i,align 1
%x = sext <4 x i8> %a to <4 x i64>		%x = sext <4 x i8> %a to <4 x i64>
%ret = select <4 x i1> %mask, <4 x i64> %x, <4 x i64> zeroinitializer		%ret = select <4 x i1> %mask, <4 x i64> %x, <4 x i64> zeroinitializer
ret <4 x i64> %ret		ret <4 x i64> %ret
}		}

define <4 x i64> @sext_4x8mem_to_4x64(<4 x i8> *%i) nounwind readnone {		define <4 x i64> @sext_4x8mem_to_4x64(<4 x i8> *%i) nounwind readnone {
; GENERIC-LABEL: sext_4x8mem_to_4x64:		; GENERIC-LABEL: sext_4x8mem_to_4x64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmovsxbq (%rdi), %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxbq (%rdi), %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_4x8mem_to_4x64:		; SKX-LABEL: sext_4x8mem_to_4x64:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpmovsxbq (%rdi), %ymm0 # sched: [8:1.00]		; SKX-NEXT: vpmovsxbq (%rdi), %ymm0 # sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <4 x i8>,<4 x i8> *%i,align 1		%a = load <4 x i8>,<4 x i8> *%i,align 1
%x = sext <4 x i8> %a to <4 x i64>		%x = sext <4 x i8> %a to <4 x i64>
ret <4 x i64> %x		ret <4 x i64> %x
}		}

define <8 x i64> @zext_8x8mem_to_8x64(<8 x i8> *%i , <8 x i1> %mask) nounwind readnone {		define <8 x i64> @zext_8x8mem_to_8x64(<8 x i8> *%i , <8 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: zext_8x8mem_to_8x64:		; GENERIC-LABEL: zext_8x8mem_to_8x64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovzxbq {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero,mem[2],zero,zero,zero,zero,zero,zero,zero,mem[3],zero,zero,zero,zero,zero,zero,zero,mem[4],zero,zero,zero,zero,zero,zero,zero,mem[5],zero,zero,zero,zero,zero,zero,zero,mem[6],zero,zero,zero,zero,zero,zero,zero,mem[7],zero,zero,zero,zero,zero,zero,zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxbq {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero,mem[2],zero,zero,zero,zero,zero,zero,zero,mem[3],zero,zero,zero,zero,zero,zero,zero,mem[4],zero,zero,zero,zero,zero,zero,zero,mem[5],zero,zero,zero,zero,zero,zero,zero,mem[6],zero,zero,zero,zero,zero,zero,zero,mem[7],zero,zero,zero,zero,zero,zero,zero sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: zext_8x8mem_to_8x64:		; SKX-LABEL: zext_8x8mem_to_8x64:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovzxbq {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero,mem[2],zero,zero,zero,zero,zero,zero,zero,mem[3],zero,zero,zero,zero,zero,zero,zero,mem[4],zero,zero,zero,zero,zero,zero,zero,mem[5],zero,zero,zero,zero,zero,zero,zero,mem[6],zero,zero,zero,zero,zero,zero,zero,mem[7],zero,zero,zero,zero,zero,zero,zero sched: [10:1.00]		; SKX-NEXT: vpmovzxbq {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero,mem[2],zero,zero,zero,zero,zero,zero,zero,mem[3],zero,zero,zero,zero,zero,zero,zero,mem[4],zero,zero,zero,zero,zero,zero,zero,mem[5],zero,zero,zero,zero,zero,zero,zero,mem[6],zero,zero,zero,zero,zero,zero,zero,mem[7],zero,zero,zero,zero,zero,zero,zero sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <8 x i8>,<8 x i8> *%i,align 1		%a = load <8 x i8>,<8 x i8> *%i,align 1
%x = zext <8 x i8> %a to <8 x i64>		%x = zext <8 x i8> %a to <8 x i64>
%ret = select <8 x i1> %mask, <8 x i64> %x, <8 x i64> zeroinitializer		%ret = select <8 x i1> %mask, <8 x i64> %x, <8 x i64> zeroinitializer
ret <8 x i64> %ret		ret <8 x i64> %ret
}		}

define <8 x i64> @sext_8x8mem_to_8x64mask(<8 x i8> *%i , <8 x i1> %mask) nounwind readnone {		define <8 x i64> @sext_8x8mem_to_8x64mask(<8 x i8> *%i , <8 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: sext_8x8mem_to_8x64mask:		; GENERIC-LABEL: sext_8x8mem_to_8x64mask:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovsxbq (%rdi), %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxbq (%rdi), %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_8x8mem_to_8x64mask:		; SKX-LABEL: sext_8x8mem_to_8x64mask:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovsxbq (%rdi), %zmm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpmovsxbq (%rdi), %zmm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <8 x i8>,<8 x i8> *%i,align 1		%a = load <8 x i8>,<8 x i8> *%i,align 1
%x = sext <8 x i8> %a to <8 x i64>		%x = sext <8 x i8> %a to <8 x i64>
%ret = select <8 x i1> %mask, <8 x i64> %x, <8 x i64> zeroinitializer		%ret = select <8 x i1> %mask, <8 x i64> %x, <8 x i64> zeroinitializer
ret <8 x i64> %ret		ret <8 x i64> %ret
}		}

define <8 x i64> @sext_8x8mem_to_8x64(<8 x i8> *%i) nounwind readnone {		define <8 x i64> @sext_8x8mem_to_8x64(<8 x i8> *%i) nounwind readnone {
; GENERIC-LABEL: sext_8x8mem_to_8x64:		; GENERIC-LABEL: sext_8x8mem_to_8x64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmovsxbq (%rdi), %zmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxbq (%rdi), %zmm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_8x8mem_to_8x64:		; SKX-LABEL: sext_8x8mem_to_8x64:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpmovsxbq (%rdi), %zmm0 # sched: [10:1.00]		; SKX-NEXT: vpmovsxbq (%rdi), %zmm0 # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <8 x i8>,<8 x i8> *%i,align 1		%a = load <8 x i8>,<8 x i8> *%i,align 1
%x = sext <8 x i8> %a to <8 x i64>		%x = sext <8 x i8> %a to <8 x i64>
ret <8 x i64> %x		ret <8 x i64> %x
}		}

define <4 x i32> @zext_4x16mem_to_4x32(<4 x i16> *%i , <4 x i1> %mask) nounwind readnone {		define <4 x i32> @zext_4x16mem_to_4x32(<4 x i16> *%i , <4 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: zext_4x16mem_to_4x32:		; GENERIC-LABEL: zext_4x16mem_to_4x32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovzxwd {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxwd {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: zext_4x16mem_to_4x32:		; SKX-LABEL: zext_4x16mem_to_4x32:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovzxwd {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero sched: [9:1.00]		; SKX-NEXT: vpmovzxwd {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero sched: [9:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <4 x i16>,<4 x i16> *%i,align 1		%a = load <4 x i16>,<4 x i16> *%i,align 1
%x = zext <4 x i16> %a to <4 x i32>		%x = zext <4 x i16> %a to <4 x i32>
%ret = select <4 x i1> %mask, <4 x i32> %x, <4 x i32> zeroinitializer		%ret = select <4 x i1> %mask, <4 x i32> %x, <4 x i32> zeroinitializer
ret <4 x i32> %ret		ret <4 x i32> %ret
}		}

define <4 x i32> @sext_4x16mem_to_4x32mask(<4 x i16> *%i , <4 x i1> %mask) nounwind readnone {		define <4 x i32> @sext_4x16mem_to_4x32mask(<4 x i16> *%i , <4 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: sext_4x16mem_to_4x32mask:		; GENERIC-LABEL: sext_4x16mem_to_4x32mask:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovsxwd (%rdi), %xmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxwd (%rdi), %xmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_4x16mem_to_4x32mask:		; SKX-LABEL: sext_4x16mem_to_4x32mask:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovsxwd (%rdi), %xmm0 {%k1} {z} # sched: [9:1.00]		; SKX-NEXT: vpmovsxwd (%rdi), %xmm0 {%k1} {z} # sched: [9:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
Show All 19 Lines
}		}


define <8 x i32> @zext_8x16mem_to_8x32(<8 x i16> *%i , <8 x i1> %mask) nounwind readnone {		define <8 x i32> @zext_8x16mem_to_8x32(<8 x i16> *%i , <8 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: zext_8x16mem_to_8x32:		; GENERIC-LABEL: zext_8x16mem_to_8x32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovzxwd {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxwd {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: zext_8x16mem_to_8x32:		; SKX-LABEL: zext_8x16mem_to_8x32:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovzxwd {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero sched: [10:1.00]		; SKX-NEXT: vpmovzxwd {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <8 x i16>,<8 x i16> *%i,align 1		%a = load <8 x i16>,<8 x i16> *%i,align 1
%x = zext <8 x i16> %a to <8 x i32>		%x = zext <8 x i16> %a to <8 x i32>
%ret = select <8 x i1> %mask, <8 x i32> %x, <8 x i32> zeroinitializer		%ret = select <8 x i1> %mask, <8 x i32> %x, <8 x i32> zeroinitializer
ret <8 x i32> %ret		ret <8 x i32> %ret
}		}

define <8 x i32> @sext_8x16mem_to_8x32mask(<8 x i16> *%i , <8 x i1> %mask) nounwind readnone {		define <8 x i32> @sext_8x16mem_to_8x32mask(<8 x i16> *%i , <8 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: sext_8x16mem_to_8x32mask:		; GENERIC-LABEL: sext_8x16mem_to_8x32mask:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovsxwd (%rdi), %ymm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxwd (%rdi), %ymm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_8x16mem_to_8x32mask:		; SKX-LABEL: sext_8x16mem_to_8x32mask:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovsxwd (%rdi), %ymm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpmovsxwd (%rdi), %ymm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <8 x i16>,<8 x i16> *%i,align 1		%a = load <8 x i16>,<8 x i16> *%i,align 1
%x = sext <8 x i16> %a to <8 x i32>		%x = sext <8 x i16> %a to <8 x i32>
%ret = select <8 x i1> %mask, <8 x i32> %x, <8 x i32> zeroinitializer		%ret = select <8 x i1> %mask, <8 x i32> %x, <8 x i32> zeroinitializer
ret <8 x i32> %ret		ret <8 x i32> %ret
}		}

define <8 x i32> @sext_8x16mem_to_8x32(<8 x i16> *%i) nounwind readnone {		define <8 x i32> @sext_8x16mem_to_8x32(<8 x i16> *%i) nounwind readnone {
; GENERIC-LABEL: sext_8x16mem_to_8x32:		; GENERIC-LABEL: sext_8x16mem_to_8x32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmovsxwd (%rdi), %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxwd (%rdi), %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_8x16mem_to_8x32:		; SKX-LABEL: sext_8x16mem_to_8x32:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpmovsxwd (%rdi), %ymm0 # sched: [9:1.00]		; SKX-NEXT: vpmovsxwd (%rdi), %ymm0 # sched: [9:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <8 x i16>,<8 x i16> *%i,align 1		%a = load <8 x i16>,<8 x i16> *%i,align 1
%x = sext <8 x i16> %a to <8 x i32>		%x = sext <8 x i16> %a to <8 x i32>
Show All 33 Lines	; SKX-NEXT: retq # sched: [7:1.00]
ret <8 x i32> %x		ret <8 x i32> %x
}		}

define <16 x i32> @zext_16x16mem_to_16x32(<16 x i16> *%i , <16 x i1> %mask) nounwind readnone {		define <16 x i32> @zext_16x16mem_to_16x32(<16 x i16> *%i , <16 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: zext_16x16mem_to_16x32:		; GENERIC-LABEL: zext_16x16mem_to_16x32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovzxwd {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero,mem[8],zero,mem[9],zero,mem[10],zero,mem[11],zero,mem[12],zero,mem[13],zero,mem[14],zero,mem[15],zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxwd {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero,mem[8],zero,mem[9],zero,mem[10],zero,mem[11],zero,mem[12],zero,mem[13],zero,mem[14],zero,mem[15],zero sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: zext_16x16mem_to_16x32:		; SKX-LABEL: zext_16x16mem_to_16x32:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovzxwd {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero,mem[8],zero,mem[9],zero,mem[10],zero,mem[11],zero,mem[12],zero,mem[13],zero,mem[14],zero,mem[15],zero sched: [10:1.00]		; SKX-NEXT: vpmovzxwd {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero,mem[8],zero,mem[9],zero,mem[10],zero,mem[11],zero,mem[12],zero,mem[13],zero,mem[14],zero,mem[15],zero sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <16 x i16>,<16 x i16> *%i,align 1		%a = load <16 x i16>,<16 x i16> *%i,align 1
%x = zext <16 x i16> %a to <16 x i32>		%x = zext <16 x i16> %a to <16 x i32>
%ret = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> zeroinitializer		%ret = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> zeroinitializer
ret <16 x i32> %ret		ret <16 x i32> %ret
}		}

define <16 x i32> @sext_16x16mem_to_16x32mask(<16 x i16> *%i , <16 x i1> %mask) nounwind readnone {		define <16 x i32> @sext_16x16mem_to_16x32mask(<16 x i16> *%i , <16 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: sext_16x16mem_to_16x32mask:		; GENERIC-LABEL: sext_16x16mem_to_16x32mask:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovsxwd (%rdi), %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxwd (%rdi), %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_16x16mem_to_16x32mask:		; SKX-LABEL: sext_16x16mem_to_16x32mask:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllw $7, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovb2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovsxwd (%rdi), %zmm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpmovsxwd (%rdi), %zmm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <16 x i16>,<16 x i16> *%i,align 1		%a = load <16 x i16>,<16 x i16> *%i,align 1
%x = sext <16 x i16> %a to <16 x i32>		%x = sext <16 x i16> %a to <16 x i32>
%ret = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> zeroinitializer		%ret = select <16 x i1> %mask, <16 x i32> %x, <16 x i32> zeroinitializer
ret <16 x i32> %ret		ret <16 x i32> %ret
}		}

define <16 x i32> @sext_16x16mem_to_16x32(<16 x i16> *%i) nounwind readnone {		define <16 x i32> @sext_16x16mem_to_16x32(<16 x i16> *%i) nounwind readnone {
; GENERIC-LABEL: sext_16x16mem_to_16x32:		; GENERIC-LABEL: sext_16x16mem_to_16x32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmovsxwd (%rdi), %zmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxwd (%rdi), %zmm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_16x16mem_to_16x32:		; SKX-LABEL: sext_16x16mem_to_16x32:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpmovsxwd (%rdi), %zmm0 # sched: [10:1.00]		; SKX-NEXT: vpmovsxwd (%rdi), %zmm0 # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <16 x i16>,<16 x i16> *%i,align 1		%a = load <16 x i16>,<16 x i16> *%i,align 1
%x = sext <16 x i16> %a to <16 x i32>		%x = sext <16 x i16> %a to <16 x i32>
Show All 32 Lines	; SKX-NEXT: retq # sched: [7:1.00]
ret <16 x i32> %x		ret <16 x i32> %x
}		}

define <2 x i64> @zext_2x16mem_to_2x64(<2 x i16> *%i , <2 x i1> %mask) nounwind readnone {		define <2 x i64> @zext_2x16mem_to_2x64(<2 x i16> *%i , <2 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: zext_2x16mem_to_2x64:		; GENERIC-LABEL: zext_2x16mem_to_2x64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovzxwq {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxwq {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: zext_2x16mem_to_2x64:		; SKX-LABEL: zext_2x16mem_to_2x64:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovzxwq {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero sched: [9:1.00]		; SKX-NEXT: vpmovzxwq {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero sched: [9:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <2 x i16>,<2 x i16> *%i,align 1		%a = load <2 x i16>,<2 x i16> *%i,align 1
%x = zext <2 x i16> %a to <2 x i64>		%x = zext <2 x i16> %a to <2 x i64>
%ret = select <2 x i1> %mask, <2 x i64> %x, <2 x i64> zeroinitializer		%ret = select <2 x i1> %mask, <2 x i64> %x, <2 x i64> zeroinitializer
ret <2 x i64> %ret		ret <2 x i64> %ret
}		}

define <2 x i64> @sext_2x16mem_to_2x64mask(<2 x i16> *%i , <2 x i1> %mask) nounwind readnone {		define <2 x i64> @sext_2x16mem_to_2x64mask(<2 x i16> *%i , <2 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: sext_2x16mem_to_2x64mask:		; GENERIC-LABEL: sext_2x16mem_to_2x64mask:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovsxwq (%rdi), %xmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxwq (%rdi), %xmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_2x16mem_to_2x64mask:		; SKX-LABEL: sext_2x16mem_to_2x64mask:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovsxwq (%rdi), %xmm0 {%k1} {z} # sched: [9:1.00]		; SKX-NEXT: vpmovsxwq (%rdi), %xmm0 {%k1} {z} # sched: [9:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
Show All 18 Lines	; SKX-NEXT: retq # sched: [7:1.00]
ret <2 x i64> %x		ret <2 x i64> %x
}		}

define <4 x i64> @zext_4x16mem_to_4x64(<4 x i16> *%i , <4 x i1> %mask) nounwind readnone {		define <4 x i64> @zext_4x16mem_to_4x64(<4 x i16> *%i , <4 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: zext_4x16mem_to_4x64:		; GENERIC-LABEL: zext_4x16mem_to_4x64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovzxwq {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxwq {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: zext_4x16mem_to_4x64:		; SKX-LABEL: zext_4x16mem_to_4x64:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovzxwq {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero sched: [10:1.00]		; SKX-NEXT: vpmovzxwq {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <4 x i16>,<4 x i16> *%i,align 1		%a = load <4 x i16>,<4 x i16> *%i,align 1
%x = zext <4 x i16> %a to <4 x i64>		%x = zext <4 x i16> %a to <4 x i64>
%ret = select <4 x i1> %mask, <4 x i64> %x, <4 x i64> zeroinitializer		%ret = select <4 x i1> %mask, <4 x i64> %x, <4 x i64> zeroinitializer
ret <4 x i64> %ret		ret <4 x i64> %ret
}		}

define <4 x i64> @sext_4x16mem_to_4x64mask(<4 x i16> *%i , <4 x i1> %mask) nounwind readnone {		define <4 x i64> @sext_4x16mem_to_4x64mask(<4 x i16> *%i , <4 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: sext_4x16mem_to_4x64mask:		; GENERIC-LABEL: sext_4x16mem_to_4x64mask:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovsxwq (%rdi), %ymm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxwq (%rdi), %ymm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_4x16mem_to_4x64mask:		; SKX-LABEL: sext_4x16mem_to_4x64mask:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovsxwq (%rdi), %ymm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpmovsxwq (%rdi), %ymm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <4 x i16>,<4 x i16> *%i,align 1		%a = load <4 x i16>,<4 x i16> *%i,align 1
%x = sext <4 x i16> %a to <4 x i64>		%x = sext <4 x i16> %a to <4 x i64>
%ret = select <4 x i1> %mask, <4 x i64> %x, <4 x i64> zeroinitializer		%ret = select <4 x i1> %mask, <4 x i64> %x, <4 x i64> zeroinitializer
ret <4 x i64> %ret		ret <4 x i64> %ret
}		}

define <4 x i64> @sext_4x16mem_to_4x64(<4 x i16> *%i) nounwind readnone {		define <4 x i64> @sext_4x16mem_to_4x64(<4 x i16> *%i) nounwind readnone {
; GENERIC-LABEL: sext_4x16mem_to_4x64:		; GENERIC-LABEL: sext_4x16mem_to_4x64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmovsxwq (%rdi), %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxwq (%rdi), %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_4x16mem_to_4x64:		; SKX-LABEL: sext_4x16mem_to_4x64:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpmovsxwq (%rdi), %ymm0 # sched: [8:1.00]		; SKX-NEXT: vpmovsxwq (%rdi), %ymm0 # sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <4 x i16>,<4 x i16> *%i,align 1		%a = load <4 x i16>,<4 x i16> *%i,align 1
%x = sext <4 x i16> %a to <4 x i64>		%x = sext <4 x i16> %a to <4 x i64>
ret <4 x i64> %x		ret <4 x i64> %x
}		}

define <8 x i64> @zext_8x16mem_to_8x64(<8 x i16> *%i , <8 x i1> %mask) nounwind readnone {		define <8 x i64> @zext_8x16mem_to_8x64(<8 x i16> *%i , <8 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: zext_8x16mem_to_8x64:		; GENERIC-LABEL: zext_8x16mem_to_8x64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovzxwq {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero,mem[4],zero,zero,zero,mem[5],zero,zero,zero,mem[6],zero,zero,zero,mem[7],zero,zero,zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxwq {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero,mem[4],zero,zero,zero,mem[5],zero,zero,zero,mem[6],zero,zero,zero,mem[7],zero,zero,zero sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: zext_8x16mem_to_8x64:		; SKX-LABEL: zext_8x16mem_to_8x64:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovzxwq {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero,mem[4],zero,zero,zero,mem[5],zero,zero,zero,mem[6],zero,zero,zero,mem[7],zero,zero,zero sched: [10:1.00]		; SKX-NEXT: vpmovzxwq {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero,mem[4],zero,zero,zero,mem[5],zero,zero,zero,mem[6],zero,zero,zero,mem[7],zero,zero,zero sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <8 x i16>,<8 x i16> *%i,align 1		%a = load <8 x i16>,<8 x i16> *%i,align 1
%x = zext <8 x i16> %a to <8 x i64>		%x = zext <8 x i16> %a to <8 x i64>
%ret = select <8 x i1> %mask, <8 x i64> %x, <8 x i64> zeroinitializer		%ret = select <8 x i1> %mask, <8 x i64> %x, <8 x i64> zeroinitializer
ret <8 x i64> %ret		ret <8 x i64> %ret
}		}

define <8 x i64> @sext_8x16mem_to_8x64mask(<8 x i16> *%i , <8 x i1> %mask) nounwind readnone {		define <8 x i64> @sext_8x16mem_to_8x64mask(<8 x i16> *%i , <8 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: sext_8x16mem_to_8x64mask:		; GENERIC-LABEL: sext_8x16mem_to_8x64mask:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovsxwq (%rdi), %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxwq (%rdi), %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_8x16mem_to_8x64mask:		; SKX-LABEL: sext_8x16mem_to_8x64mask:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovsxwq (%rdi), %zmm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpmovsxwq (%rdi), %zmm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <8 x i16>,<8 x i16> *%i,align 1		%a = load <8 x i16>,<8 x i16> *%i,align 1
%x = sext <8 x i16> %a to <8 x i64>		%x = sext <8 x i16> %a to <8 x i64>
%ret = select <8 x i1> %mask, <8 x i64> %x, <8 x i64> zeroinitializer		%ret = select <8 x i1> %mask, <8 x i64> %x, <8 x i64> zeroinitializer
ret <8 x i64> %ret		ret <8 x i64> %ret
}		}

define <8 x i64> @sext_8x16mem_to_8x64(<8 x i16> *%i) nounwind readnone {		define <8 x i64> @sext_8x16mem_to_8x64(<8 x i16> *%i) nounwind readnone {
; GENERIC-LABEL: sext_8x16mem_to_8x64:		; GENERIC-LABEL: sext_8x16mem_to_8x64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmovsxwq (%rdi), %zmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxwq (%rdi), %zmm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_8x16mem_to_8x64:		; SKX-LABEL: sext_8x16mem_to_8x64:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpmovsxwq (%rdi), %zmm0 # sched: [10:1.00]		; SKX-NEXT: vpmovsxwq (%rdi), %zmm0 # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <8 x i16>,<8 x i16> *%i,align 1		%a = load <8 x i16>,<8 x i16> *%i,align 1
%x = sext <8 x i16> %a to <8 x i64>		%x = sext <8 x i16> %a to <8 x i64>
Show All 33 Lines	; SKX-NEXT: retq # sched: [7:1.00]
ret <8 x i64> %ret		ret <8 x i64> %ret
}		}

define <2 x i64> @zext_2x32mem_to_2x64(<2 x i32> *%i , <2 x i1> %mask) nounwind readnone {		define <2 x i64> @zext_2x32mem_to_2x64(<2 x i32> *%i , <2 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: zext_2x32mem_to_2x64:		; GENERIC-LABEL: zext_2x32mem_to_2x64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovzxdq {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,mem[1],zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxdq {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,mem[1],zero sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: zext_2x32mem_to_2x64:		; SKX-LABEL: zext_2x32mem_to_2x64:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovzxdq {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,mem[1],zero sched: [9:1.00]		; SKX-NEXT: vpmovzxdq {{.*#+}} xmm0 {%k1} {z} = mem[0],zero,mem[1],zero sched: [9:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <2 x i32>,<2 x i32> *%i,align 1		%a = load <2 x i32>,<2 x i32> *%i,align 1
%x = zext <2 x i32> %a to <2 x i64>		%x = zext <2 x i32> %a to <2 x i64>
%ret = select <2 x i1> %mask, <2 x i64> %x, <2 x i64> zeroinitializer		%ret = select <2 x i1> %mask, <2 x i64> %x, <2 x i64> zeroinitializer
ret <2 x i64> %ret		ret <2 x i64> %ret
}		}

define <2 x i64> @sext_2x32mem_to_2x64mask(<2 x i32> *%i , <2 x i1> %mask) nounwind readnone {		define <2 x i64> @sext_2x32mem_to_2x64mask(<2 x i32> *%i , <2 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: sext_2x32mem_to_2x64mask:		; GENERIC-LABEL: sext_2x32mem_to_2x64mask:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovsxdq (%rdi), %xmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxdq (%rdi), %xmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_2x32mem_to_2x64mask:		; SKX-LABEL: sext_2x32mem_to_2x64mask:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllq $63, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovq2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovsxdq (%rdi), %xmm0 {%k1} {z} # sched: [9:1.00]		; SKX-NEXT: vpmovsxdq (%rdi), %xmm0 {%k1} {z} # sched: [9:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
Show All 18 Lines	; SKX-NEXT: retq # sched: [7:1.00]
ret <2 x i64> %x		ret <2 x i64> %x
}		}

define <4 x i64> @zext_4x32mem_to_4x64(<4 x i32> *%i , <4 x i1> %mask) nounwind readnone {		define <4 x i64> @zext_4x32mem_to_4x64(<4 x i32> *%i , <4 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: zext_4x32mem_to_4x64:		; GENERIC-LABEL: zext_4x32mem_to_4x64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovzxdq {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxdq {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: zext_4x32mem_to_4x64:		; SKX-LABEL: zext_4x32mem_to_4x64:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovzxdq {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero sched: [10:1.00]		; SKX-NEXT: vpmovzxdq {{.*#+}} ymm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <4 x i32>,<4 x i32> *%i,align 1		%a = load <4 x i32>,<4 x i32> *%i,align 1
%x = zext <4 x i32> %a to <4 x i64>		%x = zext <4 x i32> %a to <4 x i64>
%ret = select <4 x i1> %mask, <4 x i64> %x, <4 x i64> zeroinitializer		%ret = select <4 x i1> %mask, <4 x i64> %x, <4 x i64> zeroinitializer
ret <4 x i64> %ret		ret <4 x i64> %ret
}		}

define <4 x i64> @sext_4x32mem_to_4x64mask(<4 x i32> *%i , <4 x i1> %mask) nounwind readnone {		define <4 x i64> @sext_4x32mem_to_4x64mask(<4 x i32> *%i , <4 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: sext_4x32mem_to_4x64mask:		; GENERIC-LABEL: sext_4x32mem_to_4x64mask:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovsxdq (%rdi), %ymm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxdq (%rdi), %ymm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_4x32mem_to_4x64mask:		; SKX-LABEL: sext_4x32mem_to_4x64mask:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpslld $31, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovd2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovsxdq (%rdi), %ymm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpmovsxdq (%rdi), %ymm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <4 x i32>,<4 x i32> *%i,align 1		%a = load <4 x i32>,<4 x i32> *%i,align 1
%x = sext <4 x i32> %a to <4 x i64>		%x = sext <4 x i32> %a to <4 x i64>
%ret = select <4 x i1> %mask, <4 x i64> %x, <4 x i64> zeroinitializer		%ret = select <4 x i1> %mask, <4 x i64> %x, <4 x i64> zeroinitializer
ret <4 x i64> %ret		ret <4 x i64> %ret
}		}

define <4 x i64> @sext_4x32mem_to_4x64(<4 x i32> *%i) nounwind readnone {		define <4 x i64> @sext_4x32mem_to_4x64(<4 x i32> *%i) nounwind readnone {
; GENERIC-LABEL: sext_4x32mem_to_4x64:		; GENERIC-LABEL: sext_4x32mem_to_4x64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmovsxdq (%rdi), %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxdq (%rdi), %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_4x32mem_to_4x64:		; SKX-LABEL: sext_4x32mem_to_4x64:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpmovsxdq (%rdi), %ymm0 # sched: [9:1.00]		; SKX-NEXT: vpmovsxdq (%rdi), %ymm0 # sched: [9:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <4 x i32>,<4 x i32> *%i,align 1		%a = load <4 x i32>,<4 x i32> *%i,align 1
%x = sext <4 x i32> %a to <4 x i64>		%x = sext <4 x i32> %a to <4 x i64>
Show All 33 Lines	; SKX-NEXT: retq # sched: [7:1.00]
ret <4 x i64> %ret		ret <4 x i64> %ret
}		}

define <8 x i64> @zext_8x32mem_to_8x64(<8 x i32> *%i , <8 x i1> %mask) nounwind readnone {		define <8 x i64> @zext_8x32mem_to_8x64(<8 x i32> *%i , <8 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: zext_8x32mem_to_8x64:		; GENERIC-LABEL: zext_8x32mem_to_8x64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovzxdq {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero sched: [5:1.00]		; GENERIC-NEXT: vpmovzxdq {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: zext_8x32mem_to_8x64:		; SKX-LABEL: zext_8x32mem_to_8x64:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovzxdq {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero sched: [10:1.00]		; SKX-NEXT: vpmovzxdq {{.*#+}} zmm0 {%k1} {z} = mem[0],zero,mem[1],zero,mem[2],zero,mem[3],zero,mem[4],zero,mem[5],zero,mem[6],zero,mem[7],zero sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <8 x i32>,<8 x i32> *%i,align 1		%a = load <8 x i32>,<8 x i32> *%i,align 1
%x = zext <8 x i32> %a to <8 x i64>		%x = zext <8 x i32> %a to <8 x i64>
%ret = select <8 x i1> %mask, <8 x i64> %x, <8 x i64> zeroinitializer		%ret = select <8 x i1> %mask, <8 x i64> %x, <8 x i64> zeroinitializer
ret <8 x i64> %ret		ret <8 x i64> %ret
}		}

define <8 x i64> @sext_8x32mem_to_8x64mask(<8 x i32> *%i , <8 x i1> %mask) nounwind readnone {		define <8 x i64> @sext_8x32mem_to_8x64mask(<8 x i32> *%i , <8 x i1> %mask) nounwind readnone {
; GENERIC-LABEL: sext_8x32mem_to_8x64mask:		; GENERIC-LABEL: sext_8x32mem_to_8x64mask:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vpmovsxdq (%rdi), %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxdq (%rdi), %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_8x32mem_to_8x64mask:		; SKX-LABEL: sext_8x32mem_to_8x64mask:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]		; SKX-NEXT: vpsllw $15, %xmm0, %xmm0 # sched: [1:0.50]
; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovw2m %xmm0, %k1 # sched: [1:1.00]
; SKX-NEXT: vpmovsxdq (%rdi), %zmm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpmovsxdq (%rdi), %zmm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <8 x i32>,<8 x i32> *%i,align 1		%a = load <8 x i32>,<8 x i32> *%i,align 1
%x = sext <8 x i32> %a to <8 x i64>		%x = sext <8 x i32> %a to <8 x i64>
%ret = select <8 x i1> %mask, <8 x i64> %x, <8 x i64> zeroinitializer		%ret = select <8 x i1> %mask, <8 x i64> %x, <8 x i64> zeroinitializer
ret <8 x i64> %ret		ret <8 x i64> %ret
}		}

define <8 x i64> @sext_8x32mem_to_8x64(<8 x i32> *%i) nounwind readnone {		define <8 x i64> @sext_8x32mem_to_8x64(<8 x i32> *%i) nounwind readnone {
; GENERIC-LABEL: sext_8x32mem_to_8x64:		; GENERIC-LABEL: sext_8x32mem_to_8x64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmovsxdq (%rdi), %zmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxdq (%rdi), %zmm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: sext_8x32mem_to_8x64:		; SKX-LABEL: sext_8x32mem_to_8x64:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpmovsxdq (%rdi), %zmm0 # sched: [10:1.00]		; SKX-NEXT: vpmovsxdq (%rdi), %zmm0 # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load <8 x i32>,<8 x i32> *%i,align 1		%a = load <8 x i32>,<8 x i32> *%i,align 1
%x = sext <8 x i32> %a to <8 x i64>		%x = sext <8 x i32> %a to <8 x i64>
▲ Show 20 Lines • Show All 287 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%x = icmp slt <8 x i32> %a1, %a2		%x = icmp slt <8 x i32> %a1, %a2
%y = sext <8 x i1> %x to <8 x i64>		%y = sext <8 x i1> %x to <8 x i64>
ret <8 x i64> %y		ret <8 x i64> %y
}		}

define void @extload_v8i64(<8 x i8>* %a, <8 x i64>* %res) {		define void @extload_v8i64(<8 x i8>* %a, <8 x i64>* %res) {
; GENERIC-LABEL: extload_v8i64:		; GENERIC-LABEL: extload_v8i64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpmovsxbq (%rdi), %zmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmovsxbq (%rdi), %zmm0 # sched: [6:1.00]
; GENERIC-NEXT: vmovdqa64 %zmm0, (%rsi) # sched: [1:1.00]		; GENERIC-NEXT: vmovdqa64 %zmm0, (%rsi) # sched: [1:1.00]
; GENERIC-NEXT: vzeroupper # sched: [100:0.33]		; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: extload_v8i64:		; SKX-LABEL: extload_v8i64:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpmovsxbq (%rdi), %zmm0 # sched: [10:1.00]		; SKX-NEXT: vpmovsxbq (%rdi), %zmm0 # sched: [10:1.00]
; SKX-NEXT: vmovdqa64 %zmm0, (%rsi) # sched: [1:1.00]		; SKX-NEXT: vmovdqa64 %zmm0, (%rsi) # sched: [1:1.00]
▲ Show 20 Lines • Show All 319 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%res = fsub <16 x float> %a2, %x		%res = fsub <16 x float> %a2, %x
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_x86_fnmsub_ps_z(<16 x float> %a0, <16 x float> %a1, <16 x float> %a2) {		define <16 x float> @test_x86_fnmsub_ps_z(<16 x float> %a0, <16 x float> %a1, <16 x float> %a2) {
; GENERIC-LABEL: test_x86_fnmsub_ps_z:		; GENERIC-LABEL: test_x86_fnmsub_ps_z:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmulps %zmm1, %zmm0, %zmm0 # sched: [5:1.00]		; GENERIC-NEXT: vmulps %zmm1, %zmm0, %zmm0 # sched: [5:1.00]
; GENERIC-NEXT: vxorps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vxorps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: vsubps %zmm2, %zmm0, %zmm0 # sched: [3:1.00]		; GENERIC-NEXT: vsubps %zmm2, %zmm0, %zmm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_x86_fnmsub_ps_z:		; SKX-LABEL: test_x86_fnmsub_ps_z:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmulps %zmm1, %zmm0, %zmm0 # sched: [4:0.33]		; SKX-NEXT: vmulps %zmm1, %zmm0, %zmm0 # sched: [4:0.33]
; SKX-NEXT: vxorps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vxorps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: vsubps %zmm2, %zmm0, %zmm0 # sched: [4:0.33]		; SKX-NEXT: vsubps %zmm2, %zmm0, %zmm0 # sched: [4:0.33]
▲ Show 20 Lines • Show All 92 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%x = fmul double %a0, %a2		%x = fmul double %a0, %a2
%res = fsub double %x, %a1		%res = fsub double %x, %a1
ret double %res		ret double %res
}		}

define <16 x float> @test231_br(<16 x float> %a1, <16 x float> %a2) nounwind {		define <16 x float> @test231_br(<16 x float> %a1, <16 x float> %a2) nounwind {
; GENERIC-LABEL: test231_br:		; GENERIC-LABEL: test231_br:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmulps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [9:1.00]		; GENERIC-NEXT: vmulps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [10:1.00]
; GENERIC-NEXT: vaddps %zmm1, %zmm0, %zmm0 # sched: [3:1.00]		; GENERIC-NEXT: vaddps %zmm1, %zmm0, %zmm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test231_br:		; SKX-LABEL: test231_br:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmulps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [11:0.50]		; SKX-NEXT: vmulps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [11:0.50]
; SKX-NEXT: vaddps %zmm1, %zmm0, %zmm0 # sched: [4:0.33]		; SKX-NEXT: vaddps %zmm1, %zmm0, %zmm0 # sched: [4:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%b1 = fmul <16 x float> %a1, <float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000>		%b1 = fmul <16 x float> %a1, <float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000>
%b2 = fadd <16 x float> %b1, %a2		%b2 = fadd <16 x float> %b1, %a2
ret <16 x float> %b2		ret <16 x float> %b2
}		}

define <16 x float> @test213_br(<16 x float> %a1, <16 x float> %a2) nounwind {		define <16 x float> @test213_br(<16 x float> %a1, <16 x float> %a2) nounwind {
; GENERIC-LABEL: test213_br:		; GENERIC-LABEL: test213_br:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmulps %zmm1, %zmm0, %zmm0 # sched: [5:1.00]		; GENERIC-NEXT: vmulps %zmm1, %zmm0, %zmm0 # sched: [5:1.00]
; GENERIC-NEXT: vaddps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vaddps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test213_br:		; SKX-LABEL: test213_br:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmulps %zmm1, %zmm0, %zmm0 # sched: [4:0.33]		; SKX-NEXT: vmulps %zmm1, %zmm0, %zmm0 # sched: [4:0.33]
; SKX-NEXT: vaddps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [11:0.50]		; SKX-NEXT: vaddps {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [11:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%b1 = fmul <16 x float> %a1, %a2		%b1 = fmul <16 x float> %a1, %a2
%b2 = fadd <16 x float> %b1, <float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000>		%b2 = fadd <16 x float> %b1, <float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000, float 0x3FB99999A0000000>
ret <16 x float> %b2		ret <16 x float> %b2
}		}

;mask (a*c+b , a)		;mask (a*c+b , a)
define <16 x float> @test_x86_fmadd132_ps(<16 x float> %a0, <16 x float> %a1, <16 x float> *%a2_ptrt, <16 x i1> %mask) {		define <16 x float> @test_x86_fmadd132_ps(<16 x float> %a0, <16 x float> %a1, <16 x float> *%a2_ptrt, <16 x i1> %mask) {
; GENERIC-LABEL: test_x86_fmadd132_ps:		; GENERIC-LABEL: test_x86_fmadd132_ps:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw $7, %xmm2, %xmm2 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $7, %xmm2, %xmm2 # sched: [1:1.00]
; GENERIC-NEXT: vpmovb2m %xmm2, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovb2m %xmm2, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vmulps (%rdi), %zmm0, %zmm2 # sched: [9:1.00]		; GENERIC-NEXT: vmulps (%rdi), %zmm0, %zmm2 # sched: [10:1.00]
; GENERIC-NEXT: vaddps %zmm1, %zmm2, %zmm0 {%k1} # sched: [3:1.00]		; GENERIC-NEXT: vaddps %zmm1, %zmm2, %zmm0 {%k1} # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_x86_fmadd132_ps:		; SKX-LABEL: test_x86_fmadd132_ps:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllw $7, %xmm2, %xmm2 # sched: [1:0.50]		; SKX-NEXT: vpsllw $7, %xmm2, %xmm2 # sched: [1:0.50]
; SKX-NEXT: vpmovb2m %xmm2, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovb2m %xmm2, %k1 # sched: [1:1.00]
; SKX-NEXT: vmulps (%rdi), %zmm0, %zmm2 # sched: [11:0.50]		; SKX-NEXT: vmulps (%rdi), %zmm0, %zmm2 # sched: [11:0.50]
; SKX-NEXT: vaddps %zmm1, %zmm2, %zmm0 {%k1} # sched: [4:0.33]		; SKX-NEXT: vaddps %zmm1, %zmm2, %zmm0 {%k1} # sched: [4:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a2 = load <16 x float>,<16 x float> *%a2_ptrt,align 1		%a2 = load <16 x float>,<16 x float> *%a2_ptrt,align 1
%x = fmul <16 x float> %a0, %a2		%x = fmul <16 x float> %a0, %a2
%y = fadd <16 x float> %x, %a1		%y = fadd <16 x float> %x, %a1
%res = select <16 x i1> %mask, <16 x float> %y, <16 x float> %a0		%res = select <16 x i1> %mask, <16 x float> %y, <16 x float> %a0
ret <16 x float> %res		ret <16 x float> %res
}		}

;mask (a*c+b , b)		;mask (a*c+b , b)
define <16 x float> @test_x86_fmadd231_ps(<16 x float> %a0, <16 x float> %a1, <16 x float> *%a2_ptrt, <16 x i1> %mask) {		define <16 x float> @test_x86_fmadd231_ps(<16 x float> %a0, <16 x float> %a1, <16 x float> *%a2_ptrt, <16 x i1> %mask) {
; GENERIC-LABEL: test_x86_fmadd231_ps:		; GENERIC-LABEL: test_x86_fmadd231_ps:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw $7, %xmm2, %xmm2 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $7, %xmm2, %xmm2 # sched: [1:1.00]
; GENERIC-NEXT: vpmovb2m %xmm2, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovb2m %xmm2, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vmulps (%rdi), %zmm0, %zmm0 # sched: [9:1.00]		; GENERIC-NEXT: vmulps (%rdi), %zmm0, %zmm0 # sched: [10:1.00]
; GENERIC-NEXT: vaddps %zmm1, %zmm0, %zmm1 {%k1} # sched: [3:1.00]		; GENERIC-NEXT: vaddps %zmm1, %zmm0, %zmm1 {%k1} # sched: [3:1.00]
; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_x86_fmadd231_ps:		; SKX-LABEL: test_x86_fmadd231_ps:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllw $7, %xmm2, %xmm2 # sched: [1:0.50]		; SKX-NEXT: vpsllw $7, %xmm2, %xmm2 # sched: [1:0.50]
; SKX-NEXT: vpmovb2m %xmm2, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovb2m %xmm2, %k1 # sched: [1:1.00]
Show All 10 Lines

;mask (b*a+c , b)		;mask (b*a+c , b)
define <16 x float> @test_x86_fmadd213_ps(<16 x float> %a0, <16 x float> %a1, <16 x float> *%a2_ptrt, <16 x i1> %mask) {		define <16 x float> @test_x86_fmadd213_ps(<16 x float> %a0, <16 x float> %a1, <16 x float> *%a2_ptrt, <16 x i1> %mask) {
; GENERIC-LABEL: test_x86_fmadd213_ps:		; GENERIC-LABEL: test_x86_fmadd213_ps:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpsllw $7, %xmm2, %xmm2 # sched: [1:1.00]		; GENERIC-NEXT: vpsllw $7, %xmm2, %xmm2 # sched: [1:1.00]
; GENERIC-NEXT: vpmovb2m %xmm2, %k1 # sched: [1:0.33]		; GENERIC-NEXT: vpmovb2m %xmm2, %k1 # sched: [1:0.33]
; GENERIC-NEXT: vmulps %zmm0, %zmm1, %zmm0 # sched: [5:1.00]		; GENERIC-NEXT: vmulps %zmm0, %zmm1, %zmm0 # sched: [5:1.00]
; GENERIC-NEXT: vaddps (%rdi), %zmm0, %zmm1 {%k1} # sched: [7:1.00]		; GENERIC-NEXT: vaddps (%rdi), %zmm0, %zmm1 {%k1} # sched: [8:1.00]
; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_x86_fmadd213_ps:		; SKX-LABEL: test_x86_fmadd213_ps:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpsllw $7, %xmm2, %xmm2 # sched: [1:0.50]		; SKX-NEXT: vpsllw $7, %xmm2, %xmm2 # sched: [1:0.50]
; SKX-NEXT: vpmovb2m %xmm2, %k1 # sched: [1:1.00]		; SKX-NEXT: vpmovb2m %xmm2, %k1 # sched: [1:1.00]
; SKX-NEXT: vmulps %zmm0, %zmm1, %zmm0 # sched: [4:0.33]		; SKX-NEXT: vmulps %zmm0, %zmm1, %zmm0 # sched: [4:0.33]
; SKX-NEXT: vaddps (%rdi), %zmm0, %zmm1 {%k1} # sched: [11:0.50]		; SKX-NEXT: vaddps (%rdi), %zmm0, %zmm1 {%k1} # sched: [11:0.50]
; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a2 = load <16 x float>,<16 x float> *%a2_ptrt,align 1		%a2 = load <16 x float>,<16 x float> *%a2_ptrt,align 1
%x = fmul <16 x float> %a1, %a0		%x = fmul <16 x float> %a1, %a0
%y = fadd <16 x float> %x, %a2		%y = fadd <16 x float> %x, %a2
%res = select <16 x i1> %mask, <16 x float> %y, <16 x float> %a1		%res = select <16 x i1> %mask, <16 x float> %y, <16 x float> %a1
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x i32> @vpandd(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {		define <16 x i32> @vpandd(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {
; GENERIC-LABEL: vpandd:		; GENERIC-LABEL: vpandd:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
; GENERIC-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: vpandq %zmm1, %zmm0, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpandq %zmm1, %zmm0, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: vpandd:		; SKX-LABEL: vpandd:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: vpandq %zmm1, %zmm0, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vpandq %zmm1, %zmm0, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
; Force the execution domain with an add.		; Force the execution domain with an add.
%a2 = add <16 x i32> %a, <i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2,		%a2 = add <16 x i32> %a, <i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2,
i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2>		i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2, i32 2>
%x = and <16 x i32> %a2, %b		%x = and <16 x i32> %a2, %b
ret <16 x i32> %x		ret <16 x i32> %x
}		}

define <16 x i32> @vpandnd(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {		define <16 x i32> @vpandnd(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {
; GENERIC-LABEL: vpandnd:		; GENERIC-LABEL: vpandnd:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
; GENERIC-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: vpandnq %zmm0, %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpandnq %zmm0, %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: vpandnd:		; SKX-LABEL: vpandnd:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: vpandnq %zmm0, %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vpandnq %zmm0, %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
; Force the execution domain with an add.		; Force the execution domain with an add.
%a2 = add <16 x i32> %a, <i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3,		%a2 = add <16 x i32> %a, <i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3,
i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3>		i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3, i32 3>
%b2 = xor <16 x i32> %b, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1,		%b2 = xor <16 x i32> %b, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1,
i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>		i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>
%x = and <16 x i32> %a2, %b2		%x = and <16 x i32> %a2, %b2
ret <16 x i32> %x		ret <16 x i32> %x
}		}

define <16 x i32> @vpord(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {		define <16 x i32> @vpord(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {
; GENERIC-LABEL: vpord:		; GENERIC-LABEL: vpord:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
; GENERIC-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: vporq %zmm1, %zmm0, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vporq %zmm1, %zmm0, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: vpord:		; SKX-LABEL: vpord:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: vporq %zmm1, %zmm0, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vporq %zmm1, %zmm0, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
; Force the execution domain with an add.		; Force the execution domain with an add.
%a2 = add <16 x i32> %a, <i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4,		%a2 = add <16 x i32> %a, <i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4,
i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>		i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>
%x = or <16 x i32> %a2, %b		%x = or <16 x i32> %a2, %b
ret <16 x i32> %x		ret <16 x i32> %x
}		}

define <16 x i32> @vpxord(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {		define <16 x i32> @vpxord(<16 x i32> %a, <16 x i32> %b) nounwind uwtable readnone ssp {
; GENERIC-LABEL: vpxord:		; GENERIC-LABEL: vpxord:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
; GENERIC-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: vpxorq %zmm1, %zmm0, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpxorq %zmm1, %zmm0, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: vpxord:		; SKX-LABEL: vpxord:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vpaddd {{.*}}(%rip){1to16}, %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: vpxorq %zmm1, %zmm0, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vpxorq %zmm1, %zmm0, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
; Force the execution domain with an add.		; Force the execution domain with an add.
%a2 = add <16 x i32> %a, <i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5,		%a2 = add <16 x i32> %a, <i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5,
i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5>		i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5>
%x = xor <16 x i32> %a2, %b		%x = xor <16 x i32> %a2, %b
ret <16 x i32> %x		ret <16 x i32> %x
}		}

define <8 x i64> @vpandq(<8 x i64> %a, <8 x i64> %b) nounwind uwtable readnone ssp {		define <8 x i64> @vpandq(<8 x i64> %a, <8 x i64> %b) nounwind uwtable readnone ssp {
; GENERIC-LABEL: vpandq:		; GENERIC-LABEL: vpandq:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
; GENERIC-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: vpandq %zmm1, %zmm0, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpandq %zmm1, %zmm0, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: vpandq:		; SKX-LABEL: vpandq:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: vpandq %zmm1, %zmm0, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vpandq %zmm1, %zmm0, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
; Force the execution domain with an add.		; Force the execution domain with an add.
%a2 = add <8 x i64> %a, <i64 6, i64 6, i64 6, i64 6, i64 6, i64 6, i64 6, i64 6>		%a2 = add <8 x i64> %a, <i64 6, i64 6, i64 6, i64 6, i64 6, i64 6, i64 6, i64 6>
%x = and <8 x i64> %a2, %b		%x = and <8 x i64> %a2, %b
ret <8 x i64> %x		ret <8 x i64> %x
}		}

define <8 x i64> @vpandnq(<8 x i64> %a, <8 x i64> %b) nounwind uwtable readnone ssp {		define <8 x i64> @vpandnq(<8 x i64> %a, <8 x i64> %b) nounwind uwtable readnone ssp {
; GENERIC-LABEL: vpandnq:		; GENERIC-LABEL: vpandnq:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
; GENERIC-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: vpandnq %zmm0, %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpandnq %zmm0, %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: vpandnq:		; SKX-LABEL: vpandnq:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: vpandnq %zmm0, %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vpandnq %zmm0, %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
; Force the execution domain with an add.		; Force the execution domain with an add.
%a2 = add <8 x i64> %a, <i64 7, i64 7, i64 7, i64 7, i64 7, i64 7, i64 7, i64 7>		%a2 = add <8 x i64> %a, <i64 7, i64 7, i64 7, i64 7, i64 7, i64 7, i64 7, i64 7>
%b2 = xor <8 x i64> %b, <i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1>		%b2 = xor <8 x i64> %b, <i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1, i64 -1>
%x = and <8 x i64> %a2, %b2		%x = and <8 x i64> %a2, %b2
ret <8 x i64> %x		ret <8 x i64> %x
}		}

define <8 x i64> @vporq(<8 x i64> %a, <8 x i64> %b) nounwind uwtable readnone ssp {		define <8 x i64> @vporq(<8 x i64> %a, <8 x i64> %b) nounwind uwtable readnone ssp {
; GENERIC-LABEL: vporq:		; GENERIC-LABEL: vporq:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
; GENERIC-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: vporq %zmm1, %zmm0, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vporq %zmm1, %zmm0, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: vporq:		; SKX-LABEL: vporq:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: vporq %zmm1, %zmm0, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vporq %zmm1, %zmm0, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
entry:		entry:
; Force the execution domain with an add.		; Force the execution domain with an add.
%a2 = add <8 x i64> %a, <i64 8, i64 8, i64 8, i64 8, i64 8, i64 8, i64 8, i64 8>		%a2 = add <8 x i64> %a, <i64 8, i64 8, i64 8, i64 8, i64 8, i64 8, i64 8, i64 8>
%x = or <8 x i64> %a2, %b		%x = or <8 x i64> %a2, %b
ret <8 x i64> %x		ret <8 x i64> %x
}		}

define <8 x i64> @vpxorq(<8 x i64> %a, <8 x i64> %b) nounwind uwtable readnone ssp {		define <8 x i64> @vpxorq(<8 x i64> %a, <8 x i64> %b) nounwind uwtable readnone ssp {
; GENERIC-LABEL: vpxorq:		; GENERIC-LABEL: vpxorq:
; GENERIC: # %bb.0: # %entry		; GENERIC: # %bb.0: # %entry
; GENERIC-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [7:1.00]		; GENERIC-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:1.00]
; GENERIC-NEXT: vpxorq %zmm1, %zmm0, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpxorq %zmm1, %zmm0, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: vpxorq:		; SKX-LABEL: vpxorq:
; SKX: # %bb.0: # %entry		; SKX: # %bb.0: # %entry
; SKX-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:0.50]		; SKX-NEXT: vpaddq {{.*}}(%rip){1to8}, %zmm0, %zmm0 # sched: [8:0.50]
; SKX-NEXT: vpxorq %zmm1, %zmm0, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vpxorq %zmm1, %zmm0, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
▲ Show 20 Lines • Show All 1,558 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%m2 = bitcast <8 x i1> %m1 to i8		%m2 = bitcast <8 x i1> %m1 to i8
%ret = zext i8 %m2 to i32		%ret = zext i8 %m2 to i32
ret i32 %ret		ret i32 %ret
}		}

define void @mask16_mem(i16* %ptr) {		define void @mask16_mem(i16* %ptr) {
; GENERIC-LABEL: mask16_mem:		; GENERIC-LABEL: mask16_mem:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: kmovw (%rdi), %k0 # sched: [4:0.50]		; GENERIC-NEXT: kmovw (%rdi), %k0 # sched: [5:0.50]
; GENERIC-NEXT: knotw %k0, %k0 # sched: [1:1.00]		; GENERIC-NEXT: knotw %k0, %k0 # sched: [1:1.00]
; GENERIC-NEXT: kmovw %k0, (%rdi) # sched: [1:1.00]		; GENERIC-NEXT: kmovw %k0, (%rdi) # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: mask16_mem:		; SKX-LABEL: mask16_mem:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: kmovw (%rdi), %k0 # sched: [7:1.00]		; SKX-NEXT: kmovw (%rdi), %k0 # sched: [7:1.00]
; SKX-NEXT: knotw %k0, %k0 # sched: [1:1.00]		; SKX-NEXT: knotw %k0, %k0 # sched: [1:1.00]
; SKX-NEXT: kmovw %k0, (%rdi) # sched: [1:1.00]		; SKX-NEXT: kmovw %k0, (%rdi) # sched: [1:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%x = load i16, i16* %ptr, align 4		%x = load i16, i16* %ptr, align 4
%m0 = bitcast i16 %x to <16 x i1>		%m0 = bitcast i16 %x to <16 x i1>
%m1 = xor <16 x i1> %m0, <i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1>		%m1 = xor <16 x i1> %m0, <i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1>
%ret = bitcast <16 x i1> %m1 to i16		%ret = bitcast <16 x i1> %m1 to i16
store i16 %ret, i16* %ptr, align 4		store i16 %ret, i16* %ptr, align 4
ret void		ret void
}		}

define void @mask8_mem(i8* %ptr) {		define void @mask8_mem(i8* %ptr) {
; GENERIC-LABEL: mask8_mem:		; GENERIC-LABEL: mask8_mem:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: kmovb (%rdi), %k0 # sched: [4:0.50]		; GENERIC-NEXT: kmovb (%rdi), %k0 # sched: [5:0.50]
; GENERIC-NEXT: knotb %k0, %k0 # sched: [1:1.00]		; GENERIC-NEXT: knotb %k0, %k0 # sched: [1:1.00]
; GENERIC-NEXT: kmovb %k0, (%rdi) # sched: [1:1.00]		; GENERIC-NEXT: kmovb %k0, (%rdi) # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: mask8_mem:		; SKX-LABEL: mask8_mem:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: kmovb (%rdi), %k0 # sched: [7:1.00]		; SKX-NEXT: kmovb (%rdi), %k0 # sched: [7:1.00]
; SKX-NEXT: knotb %k0, %k0 # sched: [1:1.00]		; SKX-NEXT: knotb %k0, %k0 # sched: [1:1.00]
Show All 32 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%me = or <16 x i1> %mc, %md		%me = or <16 x i1> %mc, %md
%ret = bitcast <16 x i1> %me to i16		%ret = bitcast <16 x i1> %me to i16
ret i16 %ret		ret i16 %ret
}		}

define i16 @mand16_mem(<16 x i1>* %x, <16 x i1>* %y) {		define i16 @mand16_mem(<16 x i1>* %x, <16 x i1>* %y) {
; GENERIC-LABEL: mand16_mem:		; GENERIC-LABEL: mand16_mem:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: kmovw (%rdi), %k0 # sched: [4:0.50]		; GENERIC-NEXT: kmovw (%rdi), %k0 # sched: [5:0.50]
; GENERIC-NEXT: kmovw (%rsi), %k1 # sched: [4:0.50]		; GENERIC-NEXT: kmovw (%rsi), %k1 # sched: [5:0.50]
; GENERIC-NEXT: kandw %k1, %k0, %k2 # sched: [1:1.00]		; GENERIC-NEXT: kandw %k1, %k0, %k2 # sched: [1:1.00]
; GENERIC-NEXT: kxorw %k1, %k0, %k0 # sched: [1:1.00]		; GENERIC-NEXT: kxorw %k1, %k0, %k0 # sched: [1:1.00]
; GENERIC-NEXT: korw %k0, %k2, %k0 # sched: [1:1.00]		; GENERIC-NEXT: korw %k0, %k2, %k0 # sched: [1:1.00]
; GENERIC-NEXT: kmovd %k0, %eax # sched: [1:0.33]		; GENERIC-NEXT: kmovd %k0, %eax # sched: [1:0.33]
; GENERIC-NEXT: # kill: def $ax killed $ax killed $eax		; GENERIC-NEXT: # kill: def $ax killed $ax killed $eax
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: mand16_mem:		; SKX-LABEL: mand16_mem:
▲ Show 20 Lines • Show All 757 Lines • ▼ Show 20 Lines
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%ret = select <32 x i1> <i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 false, i1 true, i1 false, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 false, i1 false, i1 true, i1 false, i1 true, i1 false, i1 false, i1 true, i1 true, i1 false, i1 true, i1 false>, <32 x i16> %x, <32 x i16> zeroinitializer		%ret = select <32 x i1> <i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 false, i1 true, i1 false, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 false, i1 false, i1 true, i1 false, i1 true, i1 false, i1 false, i1 true, i1 true, i1 false, i1 true, i1 false>, <32 x i16> %x, <32 x i16> zeroinitializer
ret <32 x i16> %ret		ret <32 x i16> %ret
}		}

define <64 x i8> @test_build_vec_v64i1(<64 x i8> %x) {		define <64 x i8> @test_build_vec_v64i1(<64 x i8> %x) {
; GENERIC-LABEL: test_build_vec_v64i1:		; GENERIC-LABEL: test_build_vec_v64i1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 = zero,zero,zmm0[2],zero,zero,zero,zmm0[6],zero,zmm0[8],zero,zmm0[10],zero,zmm0[12],zero,zero,zmm0[15],zero,zero,zmm0[18],zero,zmm0[20],zero,zmm0[22],zero,zmm0[24],zero,zero,zmm0[27],zero,zero,zmm0[30],zero,zmm0[32],zero,zmm0[34],zero,zero,zero,zmm0[38],zero,zmm0[40],zero,zero,zmm0[43,44],zero,zmm0[46],zero,zmm0[48],zero,zmm0[50],zero,zero,zero,zmm0[54],zero,zmm0[56],zero,zero,zmm0[59,60],zero,zmm0[62],zero sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 = zero,zero,zmm0[2],zero,zero,zero,zmm0[6],zero,zmm0[8],zero,zmm0[10],zero,zmm0[12],zero,zero,zmm0[15],zero,zero,zmm0[18],zero,zmm0[20],zero,zmm0[22],zero,zmm0[24],zero,zero,zmm0[27],zero,zero,zmm0[30],zero,zmm0[32],zero,zmm0[34],zero,zero,zero,zmm0[38],zero,zmm0[40],zero,zero,zmm0[43,44],zero,zmm0[46],zero,zmm0[48],zero,zmm0[50],zero,zero,zero,zmm0[54],zero,zmm0[56],zero,zero,zmm0[59,60],zero,zmm0[62],zero sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_build_vec_v64i1:		; SKX-LABEL: test_build_vec_v64i1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpshufb {{.*#+}} zmm0 = zero,zero,zmm0[2],zero,zero,zero,zmm0[6],zero,zmm0[8],zero,zmm0[10],zero,zmm0[12],zero,zero,zmm0[15],zero,zero,zmm0[18],zero,zmm0[20],zero,zmm0[22],zero,zmm0[24],zero,zero,zmm0[27],zero,zero,zmm0[30],zero,zmm0[32],zero,zmm0[34],zero,zero,zero,zmm0[38],zero,zmm0[40],zero,zero,zmm0[43,44],zero,zmm0[46],zero,zmm0[48],zero,zmm0[50],zero,zero,zero,zmm0[54],zero,zmm0[56],zero,zero,zmm0[59,60],zero,zmm0[62],zero sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} zmm0 = zero,zero,zmm0[2],zero,zero,zero,zmm0[6],zero,zmm0[8],zero,zmm0[10],zero,zmm0[12],zero,zero,zmm0[15],zero,zero,zmm0[18],zero,zmm0[20],zero,zmm0[22],zero,zmm0[24],zero,zero,zmm0[27],zero,zero,zmm0[30],zero,zmm0[32],zero,zmm0[34],zero,zero,zero,zmm0[38],zero,zmm0[40],zero,zero,zmm0[43,44],zero,zmm0[46],zero,zmm0[48],zero,zmm0[50],zero,zero,zero,zmm0[54],zero,zmm0[56],zero,zero,zmm0[59,60],zero,zmm0[62],zero sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%ret = select <64 x i1> <i1 false, i1 false, i1 true, i1 false, i1 false, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 false, i1 true, i1 false, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 false, i1 true, i1 false, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 false, i1 false, i1 true, i1 false, i1 true, i1 false, i1 false, i1 true, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 false, i1 false, i1 true, i1 false, i1 true, i1 false, i1 false, i1 true, i1 true, i1 false, i1 true, i1 false>, <64 x i8> %x, <64 x i8> zeroinitializer		%ret = select <64 x i1> <i1 false, i1 false, i1 true, i1 false, i1 false, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 false, i1 true, i1 false, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 false, i1 true, i1 false, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 false, i1 false, i1 true, i1 false, i1 true, i1 false, i1 false, i1 true, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 false, i1 false, i1 true, i1 false, i1 true, i1 false, i1 false, i1 true, i1 true, i1 false, i1 true, i1 false>, <64 x i8> %x, <64 x i8> zeroinitializer
ret <64 x i8> %ret		ret <64 x i8> %ret
▲ Show 20 Lines • Show All 136 Lines • ▼ Show 20 Lines	L2:
br label %End		br label %End
End:		End:
ret void		ret void
}		}

define <8 x i64> @load_8i1(<8 x i1>* %a) {		define <8 x i64> @load_8i1(<8 x i1>* %a) {
; GENERIC-LABEL: load_8i1:		; GENERIC-LABEL: load_8i1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: kmovb (%rdi), %k0 # sched: [4:0.50]		; GENERIC-NEXT: kmovb (%rdi), %k0 # sched: [5:0.50]
; GENERIC-NEXT: vpmovm2q %k0, %zmm0 # sched: [1:0.33]		; GENERIC-NEXT: vpmovm2q %k0, %zmm0 # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: load_8i1:		; SKX-LABEL: load_8i1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: kmovb (%rdi), %k0 # sched: [7:1.00]		; SKX-NEXT: kmovb (%rdi), %k0 # sched: [7:1.00]
; SKX-NEXT: vpmovm2q %k0, %zmm0 # sched: [1:0.25]		; SKX-NEXT: vpmovm2q %k0, %zmm0 # sched: [1:0.25]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%b = load <8 x i1>, <8 x i1>* %a		%b = load <8 x i1>, <8 x i1>* %a
%c = sext <8 x i1> %b to <8 x i64>		%c = sext <8 x i1> %b to <8 x i64>
ret <8 x i64> %c		ret <8 x i64> %c
}		}

define <16 x i32> @load_16i1(<16 x i1>* %a) {		define <16 x i32> @load_16i1(<16 x i1>* %a) {
; GENERIC-LABEL: load_16i1:		; GENERIC-LABEL: load_16i1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: kmovw (%rdi), %k0 # sched: [4:0.50]		; GENERIC-NEXT: kmovw (%rdi), %k0 # sched: [5:0.50]
; GENERIC-NEXT: vpmovm2d %k0, %zmm0 # sched: [1:0.33]		; GENERIC-NEXT: vpmovm2d %k0, %zmm0 # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: load_16i1:		; SKX-LABEL: load_16i1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: kmovw (%rdi), %k0 # sched: [7:1.00]		; SKX-NEXT: kmovw (%rdi), %k0 # sched: [7:1.00]
; SKX-NEXT: vpmovm2d %k0, %zmm0 # sched: [1:0.25]		; SKX-NEXT: vpmovm2d %k0, %zmm0 # sched: [1:0.25]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%b = load <16 x i1>, <16 x i1>* %a		%b = load <16 x i1>, <16 x i1>* %a
%c = sext <16 x i1> %b to <16 x i32>		%c = sext <16 x i1> %b to <16 x i32>
ret <16 x i32> %c		ret <16 x i32> %c
}		}

define <2 x i16> @load_2i1(<2 x i1>* %a) {		define <2 x i16> @load_2i1(<2 x i1>* %a) {
; GENERIC-LABEL: load_2i1:		; GENERIC-LABEL: load_2i1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: kmovb (%rdi), %k0 # sched: [4:0.50]		; GENERIC-NEXT: kmovb (%rdi), %k0 # sched: [5:0.50]
; GENERIC-NEXT: vpmovm2q %k0, %xmm0 # sched: [1:0.33]		; GENERIC-NEXT: vpmovm2q %k0, %xmm0 # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: load_2i1:		; SKX-LABEL: load_2i1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: kmovb (%rdi), %k0 # sched: [7:1.00]		; SKX-NEXT: kmovb (%rdi), %k0 # sched: [7:1.00]
; SKX-NEXT: vpmovm2q %k0, %xmm0 # sched: [1:0.25]		; SKX-NEXT: vpmovm2q %k0, %xmm0 # sched: [1:0.25]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%b = load <2 x i1>, <2 x i1>* %a		%b = load <2 x i1>, <2 x i1>* %a
%c = sext <2 x i1> %b to <2 x i16>		%c = sext <2 x i1> %b to <2 x i16>
ret <2 x i16> %c		ret <2 x i16> %c
}		}

define <4 x i16> @load_4i1(<4 x i1>* %a) {		define <4 x i16> @load_4i1(<4 x i1>* %a) {
; GENERIC-LABEL: load_4i1:		; GENERIC-LABEL: load_4i1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: kmovb (%rdi), %k0 # sched: [4:0.50]		; GENERIC-NEXT: kmovb (%rdi), %k0 # sched: [5:0.50]
; GENERIC-NEXT: vpmovm2d %k0, %xmm0 # sched: [1:0.33]		; GENERIC-NEXT: vpmovm2d %k0, %xmm0 # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: load_4i1:		; SKX-LABEL: load_4i1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: kmovb (%rdi), %k0 # sched: [7:1.00]		; SKX-NEXT: kmovb (%rdi), %k0 # sched: [7:1.00]
; SKX-NEXT: vpmovm2d %k0, %xmm0 # sched: [1:0.25]		; SKX-NEXT: vpmovm2d %k0, %xmm0 # sched: [1:0.25]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%b = load <4 x i1>, <4 x i1>* %a		%b = load <4 x i1>, <4 x i1>* %a
%c = sext <4 x i1> %b to <4 x i16>		%c = sext <4 x i1> %b to <4 x i16>
ret <4 x i16> %c		ret <4 x i16> %c
}		}

define <32 x i16> @load_32i1(<32 x i1>* %a) {		define <32 x i16> @load_32i1(<32 x i1>* %a) {
; GENERIC-LABEL: load_32i1:		; GENERIC-LABEL: load_32i1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: kmovd (%rdi), %k0 # sched: [4:0.50]		; GENERIC-NEXT: kmovd (%rdi), %k0 # sched: [5:0.50]
; GENERIC-NEXT: vpmovm2w %k0, %zmm0 # sched: [1:0.33]		; GENERIC-NEXT: vpmovm2w %k0, %zmm0 # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: load_32i1:		; SKX-LABEL: load_32i1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: kmovd (%rdi), %k0 # sched: [7:1.00]		; SKX-NEXT: kmovd (%rdi), %k0 # sched: [7:1.00]
; SKX-NEXT: vpmovm2w %k0, %zmm0 # sched: [1:0.25]		; SKX-NEXT: vpmovm2w %k0, %zmm0 # sched: [1:0.25]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%b = load <32 x i1>, <32 x i1>* %a		%b = load <32 x i1>, <32 x i1>* %a
%c = sext <32 x i1> %b to <32 x i16>		%c = sext <32 x i1> %b to <32 x i16>
ret <32 x i16> %c		ret <32 x i16> %c
}		}

define <64 x i8> @load_64i1(<64 x i1>* %a) {		define <64 x i8> @load_64i1(<64 x i1>* %a) {
; GENERIC-LABEL: load_64i1:		; GENERIC-LABEL: load_64i1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: kmovq (%rdi), %k0 # sched: [4:0.50]		; GENERIC-NEXT: kmovq (%rdi), %k0 # sched: [5:0.50]
; GENERIC-NEXT: vpmovm2b %k0, %zmm0 # sched: [1:0.33]		; GENERIC-NEXT: vpmovm2b %k0, %zmm0 # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: load_64i1:		; SKX-LABEL: load_64i1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: kmovq (%rdi), %k0 # sched: [7:1.00]		; SKX-NEXT: kmovq (%rdi), %k0 # sched: [7:1.00]
; SKX-NEXT: vpmovm2b %k0, %zmm0 # sched: [1:0.25]		; SKX-NEXT: vpmovm2b %k0, %zmm0 # sched: [1:0.25]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
▲ Show 20 Lines • Show All 414 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%c = shufflevector <16 x float> %b, <16 x float> undef, <16 x i32> zeroinitializer		%c = shufflevector <16 x float> %b, <16 x float> undef, <16 x i32> zeroinitializer
%r = select <16 x i1> %mask, <16 x float> %c, <16 x float> zeroinitializer		%r = select <16 x i1> %mask, <16 x float> %c, <16 x float> zeroinitializer
ret <16 x float> %r		ret <16 x float> %r
}		}

define <16 x float> @_ss16xfloat_load(float* %a.ptr) {		define <16 x float> @_ss16xfloat_load(float* %a.ptr) {
; GENERIC-LABEL: _ss16xfloat_load:		; GENERIC-LABEL: _ss16xfloat_load:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vbroadcastss (%rdi), %zmm0 # sched: [5:1.00]		; GENERIC-NEXT: vbroadcastss (%rdi), %zmm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: _ss16xfloat_load:		; SKX-LABEL: _ss16xfloat_load:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vbroadcastss (%rdi), %zmm0 # sched: [8:0.50]		; SKX-NEXT: vbroadcastss (%rdi), %zmm0 # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load float, float* %a.ptr		%a = load float, float* %a.ptr
%b = insertelement <16 x float> undef, float %a, i32 0		%b = insertelement <16 x float> undef, float %a, i32 0
%c = shufflevector <16 x float> %b, <16 x float> undef, <16 x i32> zeroinitializer		%c = shufflevector <16 x float> %b, <16 x float> undef, <16 x i32> zeroinitializer
ret <16 x float> %c		ret <16 x float> %c
}		}

define <16 x float> @_ss16xfloat_mask_load(float* %a.ptr, <16 x float> %i, <16 x i32> %mask1) {		define <16 x float> @_ss16xfloat_mask_load(float* %a.ptr, <16 x float> %i, <16 x i32> %mask1) {
; GENERIC-LABEL: _ss16xfloat_mask_load:		; GENERIC-LABEL: _ss16xfloat_mask_load:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vbroadcastss (%rdi), %zmm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vbroadcastss (%rdi), %zmm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: _ss16xfloat_mask_load:		; SKX-LABEL: _ss16xfloat_mask_load:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vbroadcastss (%rdi), %zmm0 {%k1} # sched: [8:0.50]		; SKX-NEXT: vbroadcastss (%rdi), %zmm0 {%k1} # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load float, float* %a.ptr		%a = load float, float* %a.ptr
%mask = icmp ne <16 x i32> %mask1, zeroinitializer		%mask = icmp ne <16 x i32> %mask1, zeroinitializer
%b = insertelement <16 x float> undef, float %a, i32 0		%b = insertelement <16 x float> undef, float %a, i32 0
%c = shufflevector <16 x float> %b, <16 x float> undef, <16 x i32> zeroinitializer		%c = shufflevector <16 x float> %b, <16 x float> undef, <16 x i32> zeroinitializer
%r = select <16 x i1> %mask, <16 x float> %c, <16 x float> %i		%r = select <16 x i1> %mask, <16 x float> %c, <16 x float> %i
ret <16 x float> %r		ret <16 x float> %r
}		}

define <16 x float> @_ss16xfloat_maskz_load(float* %a.ptr, <16 x i32> %mask1) {		define <16 x float> @_ss16xfloat_maskz_load(float* %a.ptr, <16 x i32> %mask1) {
; GENERIC-LABEL: _ss16xfloat_maskz_load:		; GENERIC-LABEL: _ss16xfloat_maskz_load:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestmd %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestmd %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vbroadcastss (%rdi), %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vbroadcastss (%rdi), %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: _ss16xfloat_maskz_load:		; SKX-LABEL: _ss16xfloat_maskz_load:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmd %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestmd %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vbroadcastss (%rdi), %zmm0 {%k1} {z} # sched: [8:0.50]		; SKX-NEXT: vbroadcastss (%rdi), %zmm0 {%k1} {z} # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load float, float* %a.ptr		%a = load float, float* %a.ptr
▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%c = shufflevector <8 x double> %b, <8 x double> undef, <8 x i32> zeroinitializer		%c = shufflevector <8 x double> %b, <8 x double> undef, <8 x i32> zeroinitializer
%r = select <8 x i1> %mask, <8 x double> %c, <8 x double> zeroinitializer		%r = select <8 x i1> %mask, <8 x double> %c, <8 x double> zeroinitializer
ret <8 x double> %r		ret <8 x double> %r
}		}

define <8 x double> @_sd8xdouble_load(double* %a.ptr) {		define <8 x double> @_sd8xdouble_load(double* %a.ptr) {
; GENERIC-LABEL: _sd8xdouble_load:		; GENERIC-LABEL: _sd8xdouble_load:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vbroadcastsd (%rdi), %zmm0 # sched: [5:1.00]		; GENERIC-NEXT: vbroadcastsd (%rdi), %zmm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: _sd8xdouble_load:		; SKX-LABEL: _sd8xdouble_load:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vbroadcastsd (%rdi), %zmm0 # sched: [8:0.50]		; SKX-NEXT: vbroadcastsd (%rdi), %zmm0 # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load double, double* %a.ptr		%a = load double, double* %a.ptr
%b = insertelement <8 x double> undef, double %a, i32 0		%b = insertelement <8 x double> undef, double %a, i32 0
%c = shufflevector <8 x double> %b, <8 x double> undef, <8 x i32> zeroinitializer		%c = shufflevector <8 x double> %b, <8 x double> undef, <8 x i32> zeroinitializer
ret <8 x double> %c		ret <8 x double> %c
}		}

define <8 x double> @_sd8xdouble_mask_load(double* %a.ptr, <8 x double> %i, <8 x i32> %mask1) {		define <8 x double> @_sd8xdouble_mask_load(double* %a.ptr, <8 x double> %i, <8 x i32> %mask1) {
; GENERIC-LABEL: _sd8xdouble_mask_load:		; GENERIC-LABEL: _sd8xdouble_mask_load:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vbroadcastsd (%rdi), %zmm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vbroadcastsd (%rdi), %zmm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: _sd8xdouble_mask_load:		; SKX-LABEL: _sd8xdouble_mask_load:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vbroadcastsd (%rdi), %zmm0 {%k1} # sched: [8:0.50]		; SKX-NEXT: vbroadcastsd (%rdi), %zmm0 {%k1} # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load double, double* %a.ptr		%a = load double, double* %a.ptr
%mask = icmp ne <8 x i32> %mask1, zeroinitializer		%mask = icmp ne <8 x i32> %mask1, zeroinitializer
%b = insertelement <8 x double> undef, double %a, i32 0		%b = insertelement <8 x double> undef, double %a, i32 0
%c = shufflevector <8 x double> %b, <8 x double> undef, <8 x i32> zeroinitializer		%c = shufflevector <8 x double> %b, <8 x double> undef, <8 x i32> zeroinitializer
%r = select <8 x i1> %mask, <8 x double> %c, <8 x double> %i		%r = select <8 x i1> %mask, <8 x double> %c, <8 x double> %i
ret <8 x double> %r		ret <8 x double> %r
}		}

define <8 x double> @_sd8xdouble_maskz_load(double* %a.ptr, <8 x i32> %mask1) {		define <8 x double> @_sd8xdouble_maskz_load(double* %a.ptr, <8 x i32> %mask1) {
; GENERIC-LABEL: _sd8xdouble_maskz_load:		; GENERIC-LABEL: _sd8xdouble_maskz_load:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestmd %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestmd %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vbroadcastsd (%rdi), %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vbroadcastsd (%rdi), %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: _sd8xdouble_maskz_load:		; SKX-LABEL: _sd8xdouble_maskz_load:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestmd %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestmd %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vbroadcastsd (%rdi), %zmm0 {%k1} {z} # sched: [8:0.50]		; SKX-NEXT: vbroadcastsd (%rdi), %zmm0 {%k1} {z} # sched: [8:0.50]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%a = load double, double* %a.ptr		%a = load double, double* %a.ptr
▲ Show 20 Lines • Show All 277 Lines • ▼ Show 20 Lines
define <16 x float> @broadcast_ss_spill(float %x) {		define <16 x float> @broadcast_ss_spill(float %x) {
; GENERIC-LABEL: broadcast_ss_spill:		; GENERIC-LABEL: broadcast_ss_spill:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: subq $24, %rsp # sched: [1:0.33]		; GENERIC-NEXT: subq $24, %rsp # sched: [1:0.33]
; GENERIC-NEXT: .cfi_def_cfa_offset 32		; GENERIC-NEXT: .cfi_def_cfa_offset 32
; GENERIC-NEXT: vaddss %xmm0, %xmm0, %xmm0 # sched: [3:1.00]		; GENERIC-NEXT: vaddss %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
; GENERIC-NEXT: vmovaps %xmm0, (%rsp) # 16-byte Spill sched: [1:1.00]		; GENERIC-NEXT: vmovaps %xmm0, (%rsp) # 16-byte Spill sched: [1:1.00]
; GENERIC-NEXT: callq func_f32		; GENERIC-NEXT: callq func_f32
; GENERIC-NEXT: vbroadcastss (%rsp), %zmm0 # 16-byte Folded Reload sched: [5:1.00]		; GENERIC-NEXT: vbroadcastss (%rsp), %zmm0 # 16-byte Folded Reload sched: [6:1.00]
; GENERIC-NEXT: addq $24, %rsp # sched: [1:0.33]		; GENERIC-NEXT: addq $24, %rsp # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: broadcast_ss_spill:		; SKX-LABEL: broadcast_ss_spill:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: subq $24, %rsp # sched: [1:0.25]		; SKX-NEXT: subq $24, %rsp # sched: [1:0.25]
; SKX-NEXT: .cfi_def_cfa_offset 32		; SKX-NEXT: .cfi_def_cfa_offset 32
; SKX-NEXT: vaddss %xmm0, %xmm0, %xmm0 # sched: [4:0.33]		; SKX-NEXT: vaddss %xmm0, %xmm0, %xmm0 # sched: [4:0.33]
Show All 13 Lines
define <8 x double> @broadcast_sd_spill(double %x) {		define <8 x double> @broadcast_sd_spill(double %x) {
; GENERIC-LABEL: broadcast_sd_spill:		; GENERIC-LABEL: broadcast_sd_spill:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: subq $24, %rsp # sched: [1:0.33]		; GENERIC-NEXT: subq $24, %rsp # sched: [1:0.33]
; GENERIC-NEXT: .cfi_def_cfa_offset 32		; GENERIC-NEXT: .cfi_def_cfa_offset 32
; GENERIC-NEXT: vaddsd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]		; GENERIC-NEXT: vaddsd %xmm0, %xmm0, %xmm0 # sched: [3:1.00]
; GENERIC-NEXT: vmovapd %xmm0, (%rsp) # 16-byte Spill sched: [1:1.00]		; GENERIC-NEXT: vmovapd %xmm0, (%rsp) # 16-byte Spill sched: [1:1.00]
; GENERIC-NEXT: callq func_f64		; GENERIC-NEXT: callq func_f64
; GENERIC-NEXT: vbroadcastsd (%rsp), %zmm0 # 16-byte Folded Reload sched: [5:1.00]		; GENERIC-NEXT: vbroadcastsd (%rsp), %zmm0 # 16-byte Folded Reload sched: [6:1.00]
; GENERIC-NEXT: addq $24, %rsp # sched: [1:0.33]		; GENERIC-NEXT: addq $24, %rsp # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: broadcast_sd_spill:		; SKX-LABEL: broadcast_sd_spill:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: subq $24, %rsp # sched: [1:0.25]		; SKX-NEXT: subq $24, %rsp # sched: [1:0.25]
; SKX-NEXT: .cfi_def_cfa_offset 32		; SKX-NEXT: .cfi_def_cfa_offset 32
; SKX-NEXT: vaddsd %xmm0, %xmm0, %xmm0 # sched: [4:0.33]		; SKX-NEXT: vaddsd %xmm0, %xmm0, %xmm0 # sched: [4:0.33]
Show All 11 Lines

llvm/trunk/test/CodeGen/X86/avx512-shuffle-schedule.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 196 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer
ret <16 x i16> %res		ret <16 x i16> %res
}		}
define <16 x i16> @test_16xi16_perm_mem_mask0(<16 x i16>* %vp) {		define <16 x i16> @test_16xi16_perm_mem_mask0(<16 x i16>* %vp) {
; GENERIC-LABEL: test_16xi16_perm_mem_mask0:		; GENERIC-LABEL: test_16xi16_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa {{.*#+}} ymm0 = [9,10,7,1,12,14,14,13,14,14,8,6,11,4,12,13] sched: [7:0.50]		; GENERIC-NEXT: vmovdqa {{.*#+}} ymm0 = [9,10,7,1,12,14,14,13,14,14,8,6,11,4,12,13] sched: [7:0.50]
; GENERIC-NEXT: vpermw (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermw (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xi16_perm_mem_mask0:		; SKX-LABEL: test_16xi16_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa {{.*#+}} ymm0 = [9,10,7,1,12,14,14,13,14,14,8,6,11,4,12,13] sched: [7:0.50]		; SKX-NEXT: vmovdqa {{.*#+}} ymm0 = [9,10,7,1,12,14,14,13,14,14,8,6,11,4,12,13] sched: [7:0.50]
; SKX-NEXT: vpermw (%rdi), %ymm0, %ymm0 # sched: [13:2.00]		; SKX-NEXT: vpermw (%rdi), %ymm0, %ymm0 # sched: [13:2.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%res = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 9, i32 10, i32 7, i32 1, i32 12, i32 14, i32 14, i32 13, i32 14, i32 14, i32 8, i32 6, i32 11, i32 4, i32 12, i32 13>		%res = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 9, i32 10, i32 7, i32 1, i32 12, i32 14, i32 14, i32 13, i32 14, i32 14, i32 8, i32 6, i32 11, i32 4, i32 12, i32 13>
ret <16 x i16> %res		ret <16 x i16> %res
}		}
define <16 x i16> @test_masked_16xi16_perm_mem_mask0(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {		define <16 x i16> @test_masked_16xi16_perm_mem_mask0(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_16xi16_perm_mem_mask0:		; GENERIC-LABEL: test_masked_16xi16_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa {{.*#+}} ymm2 = [9,10,7,1,12,14,14,13,14,14,8,6,11,4,12,13] sched: [7:0.50]		; GENERIC-NEXT: vmovdqa {{.*#+}} ymm2 = [9,10,7,1,12,14,14,13,14,14,8,6,11,4,12,13] sched: [7:0.50]
; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermw (%rdi), %ymm2, %ymm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermw (%rdi), %ymm2, %ymm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi16_perm_mem_mask0:		; SKX-LABEL: test_masked_16xi16_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa {{.*#+}} ymm2 = [9,10,7,1,12,14,14,13,14,14,8,6,11,4,12,13] sched: [7:0.50]		; SKX-NEXT: vmovdqa {{.*#+}} ymm2 = [9,10,7,1,12,14,14,13,14,14,8,6,11,4,12,13] sched: [7:0.50]
; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermw (%rdi), %ymm2, %ymm0 {%k1} # sched: [13:2.00]		; SKX-NEXT: vpermw (%rdi), %ymm2, %ymm0 {%k1} # sched: [13:2.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 9, i32 10, i32 7, i32 1, i32 12, i32 14, i32 14, i32 13, i32 14, i32 14, i32 8, i32 6, i32 11, i32 4, i32 12, i32 13>		%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 9, i32 10, i32 7, i32 1, i32 12, i32 14, i32 14, i32 13, i32 14, i32 14, i32 8, i32 6, i32 11, i32 4, i32 12, i32 13>
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2
ret <16 x i16> %res		ret <16 x i16> %res
}		}

define <16 x i16> @test_masked_z_16xi16_perm_mem_mask0(<16 x i16>* %vp, <16 x i16> %mask) {		define <16 x i16> @test_masked_z_16xi16_perm_mem_mask0(<16 x i16>* %vp, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_16xi16_perm_mem_mask0:		; GENERIC-LABEL: test_masked_z_16xi16_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa {{.*#+}} ymm1 = [9,10,7,1,12,14,14,13,14,14,8,6,11,4,12,13] sched: [7:0.50]		; GENERIC-NEXT: vmovdqa {{.*#+}} ymm1 = [9,10,7,1,12,14,14,13,14,14,8,6,11,4,12,13] sched: [7:0.50]
; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermw (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermw (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi16_perm_mem_mask0:		; SKX-LABEL: test_masked_z_16xi16_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa {{.*#+}} ymm1 = [9,10,7,1,12,14,14,13,14,14,8,6,11,4,12,13] sched: [7:0.50]		; SKX-NEXT: vmovdqa {{.*#+}} ymm1 = [9,10,7,1,12,14,14,13,14,14,8,6,11,4,12,13] sched: [7:0.50]
; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermw (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [13:2.00]		; SKX-NEXT: vpermw (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [13:2.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 9, i32 10, i32 7, i32 1, i32 12, i32 14, i32 14, i32 13, i32 14, i32 14, i32 8, i32 6, i32 11, i32 4, i32 12, i32 13>		%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 9, i32 10, i32 7, i32 1, i32 12, i32 14, i32 14, i32 13, i32 14, i32 14, i32 8, i32 6, i32 11, i32 4, i32 12, i32 13>
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer
ret <16 x i16> %res		ret <16 x i16> %res
}		}

define <16 x i16> @test_masked_16xi16_perm_mem_mask1(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {		define <16 x i16> @test_masked_16xi16_perm_mem_mask1(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_16xi16_perm_mem_mask1:		; GENERIC-LABEL: test_masked_16xi16_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa {{.*#+}} ymm2 = [14,9,15,9,7,10,15,14,12,1,9,7,10,13,3,11] sched: [7:0.50]		; GENERIC-NEXT: vmovdqa {{.*#+}} ymm2 = [14,9,15,9,7,10,15,14,12,1,9,7,10,13,3,11] sched: [7:0.50]
; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermw (%rdi), %ymm2, %ymm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermw (%rdi), %ymm2, %ymm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi16_perm_mem_mask1:		; SKX-LABEL: test_masked_16xi16_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa {{.*#+}} ymm2 = [14,9,15,9,7,10,15,14,12,1,9,7,10,13,3,11] sched: [7:0.50]		; SKX-NEXT: vmovdqa {{.*#+}} ymm2 = [14,9,15,9,7,10,15,14,12,1,9,7,10,13,3,11] sched: [7:0.50]
; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermw (%rdi), %ymm2, %ymm0 {%k1} # sched: [13:2.00]		; SKX-NEXT: vpermw (%rdi), %ymm2, %ymm0 {%k1} # sched: [13:2.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 14, i32 9, i32 15, i32 9, i32 7, i32 10, i32 15, i32 14, i32 12, i32 1, i32 9, i32 7, i32 10, i32 13, i32 3, i32 11>		%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 14, i32 9, i32 15, i32 9, i32 7, i32 10, i32 15, i32 14, i32 12, i32 1, i32 9, i32 7, i32 10, i32 13, i32 3, i32 11>
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2
ret <16 x i16> %res		ret <16 x i16> %res
}		}

define <16 x i16> @test_masked_z_16xi16_perm_mem_mask1(<16 x i16>* %vp, <16 x i16> %mask) {		define <16 x i16> @test_masked_z_16xi16_perm_mem_mask1(<16 x i16>* %vp, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_16xi16_perm_mem_mask1:		; GENERIC-LABEL: test_masked_z_16xi16_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa {{.*#+}} ymm1 = [14,9,15,9,7,10,15,14,12,1,9,7,10,13,3,11] sched: [7:0.50]		; GENERIC-NEXT: vmovdqa {{.*#+}} ymm1 = [14,9,15,9,7,10,15,14,12,1,9,7,10,13,3,11] sched: [7:0.50]
; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermw (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermw (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi16_perm_mem_mask1:		; SKX-LABEL: test_masked_z_16xi16_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa {{.*#+}} ymm1 = [14,9,15,9,7,10,15,14,12,1,9,7,10,13,3,11] sched: [7:0.50]		; SKX-NEXT: vmovdqa {{.*#+}} ymm1 = [14,9,15,9,7,10,15,14,12,1,9,7,10,13,3,11] sched: [7:0.50]
; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermw (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [13:2.00]		; SKX-NEXT: vpermw (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [13:2.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 14, i32 9, i32 15, i32 9, i32 7, i32 10, i32 15, i32 14, i32 12, i32 1, i32 9, i32 7, i32 10, i32 13, i32 3, i32 11>		%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 14, i32 9, i32 15, i32 9, i32 7, i32 10, i32 15, i32 14, i32 12, i32 1, i32 9, i32 7, i32 10, i32 13, i32 3, i32 11>
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer
ret <16 x i16> %res		ret <16 x i16> %res
}		}

define <16 x i16> @test_masked_16xi16_perm_mem_mask2(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {		define <16 x i16> @test_masked_16xi16_perm_mem_mask2(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_16xi16_perm_mem_mask2:		; GENERIC-LABEL: test_masked_16xi16_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa {{.*#+}} ymm2 = [1,3,12,5,13,1,2,11,0,9,14,8,10,0,10,9] sched: [7:0.50]		; GENERIC-NEXT: vmovdqa {{.*#+}} ymm2 = [1,3,12,5,13,1,2,11,0,9,14,8,10,0,10,9] sched: [7:0.50]
; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermw (%rdi), %ymm2, %ymm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermw (%rdi), %ymm2, %ymm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi16_perm_mem_mask2:		; SKX-LABEL: test_masked_16xi16_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa {{.*#+}} ymm2 = [1,3,12,5,13,1,2,11,0,9,14,8,10,0,10,9] sched: [7:0.50]		; SKX-NEXT: vmovdqa {{.*#+}} ymm2 = [1,3,12,5,13,1,2,11,0,9,14,8,10,0,10,9] sched: [7:0.50]
; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermw (%rdi), %ymm2, %ymm0 {%k1} # sched: [13:2.00]		; SKX-NEXT: vpermw (%rdi), %ymm2, %ymm0 {%k1} # sched: [13:2.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 1, i32 3, i32 12, i32 5, i32 13, i32 1, i32 2, i32 11, i32 0, i32 9, i32 14, i32 8, i32 10, i32 0, i32 10, i32 9>		%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 1, i32 3, i32 12, i32 5, i32 13, i32 1, i32 2, i32 11, i32 0, i32 9, i32 14, i32 8, i32 10, i32 0, i32 10, i32 9>
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2
ret <16 x i16> %res		ret <16 x i16> %res
}		}

define <16 x i16> @test_masked_z_16xi16_perm_mem_mask2(<16 x i16>* %vp, <16 x i16> %mask) {		define <16 x i16> @test_masked_z_16xi16_perm_mem_mask2(<16 x i16>* %vp, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_16xi16_perm_mem_mask2:		; GENERIC-LABEL: test_masked_z_16xi16_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa {{.*#+}} ymm1 = [1,3,12,5,13,1,2,11,0,9,14,8,10,0,10,9] sched: [7:0.50]		; GENERIC-NEXT: vmovdqa {{.*#+}} ymm1 = [1,3,12,5,13,1,2,11,0,9,14,8,10,0,10,9] sched: [7:0.50]
; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermw (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermw (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi16_perm_mem_mask2:		; SKX-LABEL: test_masked_z_16xi16_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa {{.*#+}} ymm1 = [1,3,12,5,13,1,2,11,0,9,14,8,10,0,10,9] sched: [7:0.50]		; SKX-NEXT: vmovdqa {{.*#+}} ymm1 = [1,3,12,5,13,1,2,11,0,9,14,8,10,0,10,9] sched: [7:0.50]
; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermw (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [13:2.00]		; SKX-NEXT: vpermw (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [13:2.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 1, i32 3, i32 12, i32 5, i32 13, i32 1, i32 2, i32 11, i32 0, i32 9, i32 14, i32 8, i32 10, i32 0, i32 10, i32 9>		%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 1, i32 3, i32 12, i32 5, i32 13, i32 1, i32 2, i32 11, i32 0, i32 9, i32 14, i32 8, i32 10, i32 0, i32 10, i32 9>
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer
ret <16 x i16> %res		ret <16 x i16> %res
}		}

define <16 x i16> @test_16xi16_perm_mem_mask3(<16 x i16>* %vp) {		define <16 x i16> @test_16xi16_perm_mem_mask3(<16 x i16>* %vp) {
; GENERIC-LABEL: test_16xi16_perm_mem_mask3:		; GENERIC-LABEL: test_16xi16_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa {{.*#+}} ymm0 = [9,6,5,15,0,0,15,2,1,3,12,14,0,6,1,4] sched: [7:0.50]		; GENERIC-NEXT: vmovdqa {{.*#+}} ymm0 = [9,6,5,15,0,0,15,2,1,3,12,14,0,6,1,4] sched: [7:0.50]
; GENERIC-NEXT: vpermw (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermw (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xi16_perm_mem_mask3:		; SKX-LABEL: test_16xi16_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa {{.*#+}} ymm0 = [9,6,5,15,0,0,15,2,1,3,12,14,0,6,1,4] sched: [7:0.50]		; SKX-NEXT: vmovdqa {{.*#+}} ymm0 = [9,6,5,15,0,0,15,2,1,3,12,14,0,6,1,4] sched: [7:0.50]
; SKX-NEXT: vpermw (%rdi), %ymm0, %ymm0 # sched: [13:2.00]		; SKX-NEXT: vpermw (%rdi), %ymm0, %ymm0 # sched: [13:2.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%res = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 9, i32 6, i32 5, i32 15, i32 0, i32 0, i32 15, i32 2, i32 1, i32 3, i32 12, i32 14, i32 0, i32 6, i32 1, i32 4>		%res = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 9, i32 6, i32 5, i32 15, i32 0, i32 0, i32 15, i32 2, i32 1, i32 3, i32 12, i32 14, i32 0, i32 6, i32 1, i32 4>
ret <16 x i16> %res		ret <16 x i16> %res
}		}
define <16 x i16> @test_masked_16xi16_perm_mem_mask3(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {		define <16 x i16> @test_masked_16xi16_perm_mem_mask3(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_16xi16_perm_mem_mask3:		; GENERIC-LABEL: test_masked_16xi16_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa {{.*#+}} ymm2 = [9,6,5,15,0,0,15,2,1,3,12,14,0,6,1,4] sched: [7:0.50]		; GENERIC-NEXT: vmovdqa {{.*#+}} ymm2 = [9,6,5,15,0,0,15,2,1,3,12,14,0,6,1,4] sched: [7:0.50]
; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermw (%rdi), %ymm2, %ymm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermw (%rdi), %ymm2, %ymm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi16_perm_mem_mask3:		; SKX-LABEL: test_masked_16xi16_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa {{.*#+}} ymm2 = [9,6,5,15,0,0,15,2,1,3,12,14,0,6,1,4] sched: [7:0.50]		; SKX-NEXT: vmovdqa {{.*#+}} ymm2 = [9,6,5,15,0,0,15,2,1,3,12,14,0,6,1,4] sched: [7:0.50]
; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermw (%rdi), %ymm2, %ymm0 {%k1} # sched: [13:2.00]		; SKX-NEXT: vpermw (%rdi), %ymm2, %ymm0 {%k1} # sched: [13:2.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 9, i32 6, i32 5, i32 15, i32 0, i32 0, i32 15, i32 2, i32 1, i32 3, i32 12, i32 14, i32 0, i32 6, i32 1, i32 4>		%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 9, i32 6, i32 5, i32 15, i32 0, i32 0, i32 15, i32 2, i32 1, i32 3, i32 12, i32 14, i32 0, i32 6, i32 1, i32 4>
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2
ret <16 x i16> %res		ret <16 x i16> %res
}		}

define <16 x i16> @test_masked_z_16xi16_perm_mem_mask3(<16 x i16>* %vp, <16 x i16> %mask) {		define <16 x i16> @test_masked_z_16xi16_perm_mem_mask3(<16 x i16>* %vp, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_16xi16_perm_mem_mask3:		; GENERIC-LABEL: test_masked_z_16xi16_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa {{.*#+}} ymm1 = [9,6,5,15,0,0,15,2,1,3,12,14,0,6,1,4] sched: [7:0.50]		; GENERIC-NEXT: vmovdqa {{.*#+}} ymm1 = [9,6,5,15,0,0,15,2,1,3,12,14,0,6,1,4] sched: [7:0.50]
; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermw (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermw (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi16_perm_mem_mask3:		; SKX-LABEL: test_masked_z_16xi16_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa {{.*#+}} ymm1 = [9,6,5,15,0,0,15,2,1,3,12,14,0,6,1,4] sched: [7:0.50]		; SKX-NEXT: vmovdqa {{.*#+}} ymm1 = [9,6,5,15,0,0,15,2,1,3,12,14,0,6,1,4] sched: [7:0.50]
; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermw (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [13:2.00]		; SKX-NEXT: vpermw (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [13:2.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
▲ Show 20 Lines • Show All 197 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer
ret <32 x i16> %res		ret <32 x i16> %res
}		}
define <32 x i16> @test_32xi16_perm_mem_mask0(<32 x i16>* %vp) {		define <32 x i16> @test_32xi16_perm_mem_mask0(<32 x i16>* %vp) {
; GENERIC-LABEL: test_32xi16_perm_mem_mask0:		; GENERIC-LABEL: test_32xi16_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm0 = [19,1,5,31,9,12,17,9,15,7,1,5,16,2,12,10,13,3,29,15,26,31,10,15,22,13,9,23,28,29,20,12] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm0 = [19,1,5,31,9,12,17,9,15,7,1,5,16,2,12,10,13,3,29,15,26,31,10,15,22,13,9,23,28,29,20,12] sched: [6:0.50]
; GENERIC-NEXT: vpermw (%rdi), %zmm0, %zmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermw (%rdi), %zmm0, %zmm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_32xi16_perm_mem_mask0:		; SKX-LABEL: test_32xi16_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm0 = [19,1,5,31,9,12,17,9,15,7,1,5,16,2,12,10,13,3,29,15,26,31,10,15,22,13,9,23,28,29,20,12] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm0 = [19,1,5,31,9,12,17,9,15,7,1,5,16,2,12,10,13,3,29,15,26,31,10,15,22,13,9,23,28,29,20,12] sched: [8:0.50]
; SKX-NEXT: vpermw (%rdi), %zmm0, %zmm0 # sched: [13:2.00]		; SKX-NEXT: vpermw (%rdi), %zmm0, %zmm0 # sched: [13:2.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%res = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 19, i32 1, i32 5, i32 31, i32 9, i32 12, i32 17, i32 9, i32 15, i32 7, i32 1, i32 5, i32 16, i32 2, i32 12, i32 10, i32 13, i32 3, i32 29, i32 15, i32 26, i32 31, i32 10, i32 15, i32 22, i32 13, i32 9, i32 23, i32 28, i32 29, i32 20, i32 12>		%res = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 19, i32 1, i32 5, i32 31, i32 9, i32 12, i32 17, i32 9, i32 15, i32 7, i32 1, i32 5, i32 16, i32 2, i32 12, i32 10, i32 13, i32 3, i32 29, i32 15, i32 26, i32 31, i32 10, i32 15, i32 22, i32 13, i32 9, i32 23, i32 28, i32 29, i32 20, i32 12>
ret <32 x i16> %res		ret <32 x i16> %res
}		}
define <32 x i16> @test_masked_32xi16_perm_mem_mask0(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {		define <32 x i16> @test_masked_32xi16_perm_mem_mask0(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_32xi16_perm_mem_mask0:		; GENERIC-LABEL: test_masked_32xi16_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [19,1,5,31,9,12,17,9,15,7,1,5,16,2,12,10,13,3,29,15,26,31,10,15,22,13,9,23,28,29,20,12] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [19,1,5,31,9,12,17,9,15,7,1,5,16,2,12,10,13,3,29,15,26,31,10,15,22,13,9,23,28,29,20,12] sched: [6:0.50]
; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermw (%rdi), %zmm2, %zmm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermw (%rdi), %zmm2, %zmm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_32xi16_perm_mem_mask0:		; SKX-LABEL: test_masked_32xi16_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [19,1,5,31,9,12,17,9,15,7,1,5,16,2,12,10,13,3,29,15,26,31,10,15,22,13,9,23,28,29,20,12] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [19,1,5,31,9,12,17,9,15,7,1,5,16,2,12,10,13,3,29,15,26,31,10,15,22,13,9,23,28,29,20,12] sched: [8:0.50]
; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermw (%rdi), %zmm2, %zmm0 {%k1} # sched: [13:2.00]		; SKX-NEXT: vpermw (%rdi), %zmm2, %zmm0 {%k1} # sched: [13:2.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 19, i32 1, i32 5, i32 31, i32 9, i32 12, i32 17, i32 9, i32 15, i32 7, i32 1, i32 5, i32 16, i32 2, i32 12, i32 10, i32 13, i32 3, i32 29, i32 15, i32 26, i32 31, i32 10, i32 15, i32 22, i32 13, i32 9, i32 23, i32 28, i32 29, i32 20, i32 12>		%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 19, i32 1, i32 5, i32 31, i32 9, i32 12, i32 17, i32 9, i32 15, i32 7, i32 1, i32 5, i32 16, i32 2, i32 12, i32 10, i32 13, i32 3, i32 29, i32 15, i32 26, i32 31, i32 10, i32 15, i32 22, i32 13, i32 9, i32 23, i32 28, i32 29, i32 20, i32 12>
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2
ret <32 x i16> %res		ret <32 x i16> %res
}		}

define <32 x i16> @test_masked_z_32xi16_perm_mem_mask0(<32 x i16>* %vp, <32 x i16> %mask) {		define <32 x i16> @test_masked_z_32xi16_perm_mem_mask0(<32 x i16>* %vp, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_32xi16_perm_mem_mask0:		; GENERIC-LABEL: test_masked_z_32xi16_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [19,1,5,31,9,12,17,9,15,7,1,5,16,2,12,10,13,3,29,15,26,31,10,15,22,13,9,23,28,29,20,12] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [19,1,5,31,9,12,17,9,15,7,1,5,16,2,12,10,13,3,29,15,26,31,10,15,22,13,9,23,28,29,20,12] sched: [6:0.50]
; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermw (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermw (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_32xi16_perm_mem_mask0:		; SKX-LABEL: test_masked_z_32xi16_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [19,1,5,31,9,12,17,9,15,7,1,5,16,2,12,10,13,3,29,15,26,31,10,15,22,13,9,23,28,29,20,12] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [19,1,5,31,9,12,17,9,15,7,1,5,16,2,12,10,13,3,29,15,26,31,10,15,22,13,9,23,28,29,20,12] sched: [8:0.50]
; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermw (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [13:2.00]		; SKX-NEXT: vpermw (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [13:2.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 19, i32 1, i32 5, i32 31, i32 9, i32 12, i32 17, i32 9, i32 15, i32 7, i32 1, i32 5, i32 16, i32 2, i32 12, i32 10, i32 13, i32 3, i32 29, i32 15, i32 26, i32 31, i32 10, i32 15, i32 22, i32 13, i32 9, i32 23, i32 28, i32 29, i32 20, i32 12>		%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 19, i32 1, i32 5, i32 31, i32 9, i32 12, i32 17, i32 9, i32 15, i32 7, i32 1, i32 5, i32 16, i32 2, i32 12, i32 10, i32 13, i32 3, i32 29, i32 15, i32 26, i32 31, i32 10, i32 15, i32 22, i32 13, i32 9, i32 23, i32 28, i32 29, i32 20, i32 12>
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer
ret <32 x i16> %res		ret <32 x i16> %res
}		}

define <32 x i16> @test_masked_32xi16_perm_mem_mask1(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {		define <32 x i16> @test_masked_32xi16_perm_mem_mask1(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_32xi16_perm_mem_mask1:		; GENERIC-LABEL: test_masked_32xi16_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [31,20,2,2,23,1,0,12,16,14,15,18,21,13,11,31,8,24,13,11,2,27,22,28,14,21,3,12,6,1,30,6] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [31,20,2,2,23,1,0,12,16,14,15,18,21,13,11,31,8,24,13,11,2,27,22,28,14,21,3,12,6,1,30,6] sched: [6:0.50]
; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermw (%rdi), %zmm2, %zmm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermw (%rdi), %zmm2, %zmm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_32xi16_perm_mem_mask1:		; SKX-LABEL: test_masked_32xi16_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [31,20,2,2,23,1,0,12,16,14,15,18,21,13,11,31,8,24,13,11,2,27,22,28,14,21,3,12,6,1,30,6] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [31,20,2,2,23,1,0,12,16,14,15,18,21,13,11,31,8,24,13,11,2,27,22,28,14,21,3,12,6,1,30,6] sched: [8:0.50]
; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermw (%rdi), %zmm2, %zmm0 {%k1} # sched: [13:2.00]		; SKX-NEXT: vpermw (%rdi), %zmm2, %zmm0 {%k1} # sched: [13:2.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 31, i32 20, i32 2, i32 2, i32 23, i32 1, i32 0, i32 12, i32 16, i32 14, i32 15, i32 18, i32 21, i32 13, i32 11, i32 31, i32 8, i32 24, i32 13, i32 11, i32 2, i32 27, i32 22, i32 28, i32 14, i32 21, i32 3, i32 12, i32 6, i32 1, i32 30, i32 6>		%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 31, i32 20, i32 2, i32 2, i32 23, i32 1, i32 0, i32 12, i32 16, i32 14, i32 15, i32 18, i32 21, i32 13, i32 11, i32 31, i32 8, i32 24, i32 13, i32 11, i32 2, i32 27, i32 22, i32 28, i32 14, i32 21, i32 3, i32 12, i32 6, i32 1, i32 30, i32 6>
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2
ret <32 x i16> %res		ret <32 x i16> %res
}		}

define <32 x i16> @test_masked_z_32xi16_perm_mem_mask1(<32 x i16>* %vp, <32 x i16> %mask) {		define <32 x i16> @test_masked_z_32xi16_perm_mem_mask1(<32 x i16>* %vp, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_32xi16_perm_mem_mask1:		; GENERIC-LABEL: test_masked_z_32xi16_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [31,20,2,2,23,1,0,12,16,14,15,18,21,13,11,31,8,24,13,11,2,27,22,28,14,21,3,12,6,1,30,6] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [31,20,2,2,23,1,0,12,16,14,15,18,21,13,11,31,8,24,13,11,2,27,22,28,14,21,3,12,6,1,30,6] sched: [6:0.50]
; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermw (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermw (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_32xi16_perm_mem_mask1:		; SKX-LABEL: test_masked_z_32xi16_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [31,20,2,2,23,1,0,12,16,14,15,18,21,13,11,31,8,24,13,11,2,27,22,28,14,21,3,12,6,1,30,6] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [31,20,2,2,23,1,0,12,16,14,15,18,21,13,11,31,8,24,13,11,2,27,22,28,14,21,3,12,6,1,30,6] sched: [8:0.50]
; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermw (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [13:2.00]		; SKX-NEXT: vpermw (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [13:2.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 31, i32 20, i32 2, i32 2, i32 23, i32 1, i32 0, i32 12, i32 16, i32 14, i32 15, i32 18, i32 21, i32 13, i32 11, i32 31, i32 8, i32 24, i32 13, i32 11, i32 2, i32 27, i32 22, i32 28, i32 14, i32 21, i32 3, i32 12, i32 6, i32 1, i32 30, i32 6>		%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 31, i32 20, i32 2, i32 2, i32 23, i32 1, i32 0, i32 12, i32 16, i32 14, i32 15, i32 18, i32 21, i32 13, i32 11, i32 31, i32 8, i32 24, i32 13, i32 11, i32 2, i32 27, i32 22, i32 28, i32 14, i32 21, i32 3, i32 12, i32 6, i32 1, i32 30, i32 6>
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer
ret <32 x i16> %res		ret <32 x i16> %res
}		}

define <32 x i16> @test_masked_32xi16_perm_mem_mask2(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {		define <32 x i16> @test_masked_32xi16_perm_mem_mask2(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_32xi16_perm_mem_mask2:		; GENERIC-LABEL: test_masked_32xi16_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [4,6,12,17,4,31,31,4,12,21,28,15,29,10,15,15,21,6,19,7,10,30,28,26,1,4,8,25,26,18,22,25] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [4,6,12,17,4,31,31,4,12,21,28,15,29,10,15,15,21,6,19,7,10,30,28,26,1,4,8,25,26,18,22,25] sched: [6:0.50]
; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermw (%rdi), %zmm2, %zmm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermw (%rdi), %zmm2, %zmm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_32xi16_perm_mem_mask2:		; SKX-LABEL: test_masked_32xi16_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [4,6,12,17,4,31,31,4,12,21,28,15,29,10,15,15,21,6,19,7,10,30,28,26,1,4,8,25,26,18,22,25] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [4,6,12,17,4,31,31,4,12,21,28,15,29,10,15,15,21,6,19,7,10,30,28,26,1,4,8,25,26,18,22,25] sched: [8:0.50]
; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermw (%rdi), %zmm2, %zmm0 {%k1} # sched: [13:2.00]		; SKX-NEXT: vpermw (%rdi), %zmm2, %zmm0 {%k1} # sched: [13:2.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 4, i32 6, i32 12, i32 17, i32 4, i32 31, i32 31, i32 4, i32 12, i32 21, i32 28, i32 15, i32 29, i32 10, i32 15, i32 15, i32 21, i32 6, i32 19, i32 7, i32 10, i32 30, i32 28, i32 26, i32 1, i32 4, i32 8, i32 25, i32 26, i32 18, i32 22, i32 25>		%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 4, i32 6, i32 12, i32 17, i32 4, i32 31, i32 31, i32 4, i32 12, i32 21, i32 28, i32 15, i32 29, i32 10, i32 15, i32 15, i32 21, i32 6, i32 19, i32 7, i32 10, i32 30, i32 28, i32 26, i32 1, i32 4, i32 8, i32 25, i32 26, i32 18, i32 22, i32 25>
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2
ret <32 x i16> %res		ret <32 x i16> %res
}		}

define <32 x i16> @test_masked_z_32xi16_perm_mem_mask2(<32 x i16>* %vp, <32 x i16> %mask) {		define <32 x i16> @test_masked_z_32xi16_perm_mem_mask2(<32 x i16>* %vp, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_32xi16_perm_mem_mask2:		; GENERIC-LABEL: test_masked_z_32xi16_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [4,6,12,17,4,31,31,4,12,21,28,15,29,10,15,15,21,6,19,7,10,30,28,26,1,4,8,25,26,18,22,25] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [4,6,12,17,4,31,31,4,12,21,28,15,29,10,15,15,21,6,19,7,10,30,28,26,1,4,8,25,26,18,22,25] sched: [6:0.50]
; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermw (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermw (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_32xi16_perm_mem_mask2:		; SKX-LABEL: test_masked_z_32xi16_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [4,6,12,17,4,31,31,4,12,21,28,15,29,10,15,15,21,6,19,7,10,30,28,26,1,4,8,25,26,18,22,25] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [4,6,12,17,4,31,31,4,12,21,28,15,29,10,15,15,21,6,19,7,10,30,28,26,1,4,8,25,26,18,22,25] sched: [8:0.50]
; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermw (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [13:2.00]		; SKX-NEXT: vpermw (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [13:2.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 4, i32 6, i32 12, i32 17, i32 4, i32 31, i32 31, i32 4, i32 12, i32 21, i32 28, i32 15, i32 29, i32 10, i32 15, i32 15, i32 21, i32 6, i32 19, i32 7, i32 10, i32 30, i32 28, i32 26, i32 1, i32 4, i32 8, i32 25, i32 26, i32 18, i32 22, i32 25>		%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 4, i32 6, i32 12, i32 17, i32 4, i32 31, i32 31, i32 4, i32 12, i32 21, i32 28, i32 15, i32 29, i32 10, i32 15, i32 15, i32 21, i32 6, i32 19, i32 7, i32 10, i32 30, i32 28, i32 26, i32 1, i32 4, i32 8, i32 25, i32 26, i32 18, i32 22, i32 25>
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer
ret <32 x i16> %res		ret <32 x i16> %res
}		}

define <32 x i16> @test_32xi16_perm_mem_mask3(<32 x i16>* %vp) {		define <32 x i16> @test_32xi16_perm_mem_mask3(<32 x i16>* %vp) {
; GENERIC-LABEL: test_32xi16_perm_mem_mask3:		; GENERIC-LABEL: test_32xi16_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm0 = [2,2,27,1,7,1,0,27,10,5,4,20,30,16,28,16,18,21,25,24,31,23,28,6,17,19,26,15,25,12,18,27] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm0 = [2,2,27,1,7,1,0,27,10,5,4,20,30,16,28,16,18,21,25,24,31,23,28,6,17,19,26,15,25,12,18,27] sched: [6:0.50]
; GENERIC-NEXT: vpermw (%rdi), %zmm0, %zmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermw (%rdi), %zmm0, %zmm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_32xi16_perm_mem_mask3:		; SKX-LABEL: test_32xi16_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm0 = [2,2,27,1,7,1,0,27,10,5,4,20,30,16,28,16,18,21,25,24,31,23,28,6,17,19,26,15,25,12,18,27] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm0 = [2,2,27,1,7,1,0,27,10,5,4,20,30,16,28,16,18,21,25,24,31,23,28,6,17,19,26,15,25,12,18,27] sched: [8:0.50]
; SKX-NEXT: vpermw (%rdi), %zmm0, %zmm0 # sched: [13:2.00]		; SKX-NEXT: vpermw (%rdi), %zmm0, %zmm0 # sched: [13:2.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%res = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 2, i32 2, i32 27, i32 1, i32 7, i32 1, i32 0, i32 27, i32 10, i32 5, i32 4, i32 20, i32 30, i32 16, i32 28, i32 16, i32 18, i32 21, i32 25, i32 24, i32 31, i32 23, i32 28, i32 6, i32 17, i32 19, i32 26, i32 15, i32 25, i32 12, i32 18, i32 27>		%res = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 2, i32 2, i32 27, i32 1, i32 7, i32 1, i32 0, i32 27, i32 10, i32 5, i32 4, i32 20, i32 30, i32 16, i32 28, i32 16, i32 18, i32 21, i32 25, i32 24, i32 31, i32 23, i32 28, i32 6, i32 17, i32 19, i32 26, i32 15, i32 25, i32 12, i32 18, i32 27>
ret <32 x i16> %res		ret <32 x i16> %res
}		}
define <32 x i16> @test_masked_32xi16_perm_mem_mask3(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {		define <32 x i16> @test_masked_32xi16_perm_mem_mask3(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_32xi16_perm_mem_mask3:		; GENERIC-LABEL: test_masked_32xi16_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [2,2,27,1,7,1,0,27,10,5,4,20,30,16,28,16,18,21,25,24,31,23,28,6,17,19,26,15,25,12,18,27] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [2,2,27,1,7,1,0,27,10,5,4,20,30,16,28,16,18,21,25,24,31,23,28,6,17,19,26,15,25,12,18,27] sched: [6:0.50]
; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermw (%rdi), %zmm2, %zmm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermw (%rdi), %zmm2, %zmm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_32xi16_perm_mem_mask3:		; SKX-LABEL: test_masked_32xi16_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [2,2,27,1,7,1,0,27,10,5,4,20,30,16,28,16,18,21,25,24,31,23,28,6,17,19,26,15,25,12,18,27] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [2,2,27,1,7,1,0,27,10,5,4,20,30,16,28,16,18,21,25,24,31,23,28,6,17,19,26,15,25,12,18,27] sched: [8:0.50]
; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermw (%rdi), %zmm2, %zmm0 {%k1} # sched: [13:2.00]		; SKX-NEXT: vpermw (%rdi), %zmm2, %zmm0 {%k1} # sched: [13:2.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 2, i32 2, i32 27, i32 1, i32 7, i32 1, i32 0, i32 27, i32 10, i32 5, i32 4, i32 20, i32 30, i32 16, i32 28, i32 16, i32 18, i32 21, i32 25, i32 24, i32 31, i32 23, i32 28, i32 6, i32 17, i32 19, i32 26, i32 15, i32 25, i32 12, i32 18, i32 27>		%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 2, i32 2, i32 27, i32 1, i32 7, i32 1, i32 0, i32 27, i32 10, i32 5, i32 4, i32 20, i32 30, i32 16, i32 28, i32 16, i32 18, i32 21, i32 25, i32 24, i32 31, i32 23, i32 28, i32 6, i32 17, i32 19, i32 26, i32 15, i32 25, i32 12, i32 18, i32 27>
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2
ret <32 x i16> %res		ret <32 x i16> %res
}		}

define <32 x i16> @test_masked_z_32xi16_perm_mem_mask3(<32 x i16>* %vp, <32 x i16> %mask) {		define <32 x i16> @test_masked_z_32xi16_perm_mem_mask3(<32 x i16>* %vp, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_32xi16_perm_mem_mask3:		; GENERIC-LABEL: test_masked_z_32xi16_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [2,2,27,1,7,1,0,27,10,5,4,20,30,16,28,16,18,21,25,24,31,23,28,6,17,19,26,15,25,12,18,27] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [2,2,27,1,7,1,0,27,10,5,4,20,30,16,28,16,18,21,25,24,31,23,28,6,17,19,26,15,25,12,18,27] sched: [6:0.50]
; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermw (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermw (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_32xi16_perm_mem_mask3:		; SKX-LABEL: test_masked_z_32xi16_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [2,2,27,1,7,1,0,27,10,5,4,20,30,16,28,16,18,21,25,24,31,23,28,6,17,19,26,15,25,12,18,27] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [2,2,27,1,7,1,0,27,10,5,4,20,30,16,28,16,18,21,25,24,31,23,28,6,17,19,26,15,25,12,18,27] sched: [8:0.50]
; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermw (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [13:2.00]		; SKX-NEXT: vpermw (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [13:2.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
▲ Show 20 Lines • Show All 197 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> zeroinitializer
ret <8 x i32> %res		ret <8 x i32> %res
}		}
define <8 x i32> @test_8xi32_perm_mem_mask0(<8 x i32>* %vp) {		define <8 x i32> @test_8xi32_perm_mem_mask0(<8 x i32>* %vp) {
; GENERIC-LABEL: test_8xi32_perm_mem_mask0:		; GENERIC-LABEL: test_8xi32_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} ymm0 = [3,7,4,3,5,2,0,5] sched: [7:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} ymm0 = [3,7,4,3,5,2,0,5] sched: [7:0.50]
; GENERIC-NEXT: vpermps (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi32_perm_mem_mask0:		; SKX-LABEL: test_8xi32_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} ymm0 = [3,7,4,3,5,2,0,5] sched: [7:0.50]		; SKX-NEXT: vmovaps {{.*#+}} ymm0 = [3,7,4,3,5,2,0,5] sched: [7:0.50]
; SKX-NEXT: vpermps (%rdi), %ymm0, %ymm0 # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i32>, <8 x i32>* %vp		%vec = load <8 x i32>, <8 x i32>* %vp
%res = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 3, i32 7, i32 4, i32 3, i32 5, i32 2, i32 0, i32 5>		%res = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 3, i32 7, i32 4, i32 3, i32 5, i32 2, i32 0, i32 5>
ret <8 x i32> %res		ret <8 x i32> %res
}		}
define <8 x i32> @test_masked_8xi32_perm_mem_mask0(<8 x i32>* %vp, <8 x i32> %vec2, <8 x i32> %mask) {		define <8 x i32> @test_masked_8xi32_perm_mem_mask0(<8 x i32>* %vp, <8 x i32> %vec2, <8 x i32> %mask) {
; GENERIC-LABEL: test_masked_8xi32_perm_mem_mask0:		; GENERIC-LABEL: test_masked_8xi32_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa {{.*#+}} ymm2 = [3,7,4,3,5,2,0,5] sched: [7:0.50]		; GENERIC-NEXT: vmovdqa {{.*#+}} ymm2 = [3,7,4,3,5,2,0,5] sched: [7:0.50]
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermd (%rdi), %ymm2, %ymm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermd (%rdi), %ymm2, %ymm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xi32_perm_mem_mask0:		; SKX-LABEL: test_masked_8xi32_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa {{.*#+}} ymm2 = [3,7,4,3,5,2,0,5] sched: [7:0.50]		; SKX-NEXT: vmovdqa {{.*#+}} ymm2 = [3,7,4,3,5,2,0,5] sched: [7:0.50]
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermd (%rdi), %ymm2, %ymm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermd (%rdi), %ymm2, %ymm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i32>, <8 x i32>* %vp		%vec = load <8 x i32>, <8 x i32>* %vp
%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 3, i32 7, i32 4, i32 3, i32 5, i32 2, i32 0, i32 5>		%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 3, i32 7, i32 4, i32 3, i32 5, i32 2, i32 0, i32 5>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec2		%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec2
ret <8 x i32> %res		ret <8 x i32> %res
}		}

define <8 x i32> @test_masked_z_8xi32_perm_mem_mask0(<8 x i32>* %vp, <8 x i32> %mask) {		define <8 x i32> @test_masked_z_8xi32_perm_mem_mask0(<8 x i32>* %vp, <8 x i32> %mask) {
; GENERIC-LABEL: test_masked_z_8xi32_perm_mem_mask0:		; GENERIC-LABEL: test_masked_z_8xi32_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa {{.*#+}} ymm1 = [3,7,4,3,5,2,0,5] sched: [7:0.50]		; GENERIC-NEXT: vmovdqa {{.*#+}} ymm1 = [3,7,4,3,5,2,0,5] sched: [7:0.50]
; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermd (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermd (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xi32_perm_mem_mask0:		; SKX-LABEL: test_masked_z_8xi32_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa {{.*#+}} ymm1 = [3,7,4,3,5,2,0,5] sched: [7:0.50]		; SKX-NEXT: vmovdqa {{.*#+}} ymm1 = [3,7,4,3,5,2,0,5] sched: [7:0.50]
; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermd (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermd (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i32>, <8 x i32>* %vp		%vec = load <8 x i32>, <8 x i32>* %vp
%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 3, i32 7, i32 4, i32 3, i32 5, i32 2, i32 0, i32 5>		%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 3, i32 7, i32 4, i32 3, i32 5, i32 2, i32 0, i32 5>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> zeroinitializer
ret <8 x i32> %res		ret <8 x i32> %res
}		}

define <8 x i32> @test_masked_8xi32_perm_mem_mask1(<8 x i32>* %vp, <8 x i32> %vec2, <8 x i32> %mask) {		define <8 x i32> @test_masked_8xi32_perm_mem_mask1(<8 x i32>* %vp, <8 x i32> %vec2, <8 x i32> %mask) {
; GENERIC-LABEL: test_masked_8xi32_perm_mem_mask1:		; GENERIC-LABEL: test_masked_8xi32_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa {{.*#+}} ymm2 = [4,6,1,7,6,7,6,5] sched: [7:0.50]		; GENERIC-NEXT: vmovdqa {{.*#+}} ymm2 = [4,6,1,7,6,7,6,5] sched: [7:0.50]
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermd (%rdi), %ymm2, %ymm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermd (%rdi), %ymm2, %ymm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xi32_perm_mem_mask1:		; SKX-LABEL: test_masked_8xi32_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa {{.*#+}} ymm2 = [4,6,1,7,6,7,6,5] sched: [7:0.50]		; SKX-NEXT: vmovdqa {{.*#+}} ymm2 = [4,6,1,7,6,7,6,5] sched: [7:0.50]
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermd (%rdi), %ymm2, %ymm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermd (%rdi), %ymm2, %ymm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i32>, <8 x i32>* %vp		%vec = load <8 x i32>, <8 x i32>* %vp
%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 4, i32 6, i32 1, i32 7, i32 6, i32 7, i32 6, i32 5>		%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 4, i32 6, i32 1, i32 7, i32 6, i32 7, i32 6, i32 5>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec2		%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec2
ret <8 x i32> %res		ret <8 x i32> %res
}		}

define <8 x i32> @test_masked_z_8xi32_perm_mem_mask1(<8 x i32>* %vp, <8 x i32> %mask) {		define <8 x i32> @test_masked_z_8xi32_perm_mem_mask1(<8 x i32>* %vp, <8 x i32> %mask) {
; GENERIC-LABEL: test_masked_z_8xi32_perm_mem_mask1:		; GENERIC-LABEL: test_masked_z_8xi32_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa {{.*#+}} ymm1 = [4,6,1,7,6,7,6,5] sched: [7:0.50]		; GENERIC-NEXT: vmovdqa {{.*#+}} ymm1 = [4,6,1,7,6,7,6,5] sched: [7:0.50]
; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermd (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermd (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xi32_perm_mem_mask1:		; SKX-LABEL: test_masked_z_8xi32_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa {{.*#+}} ymm1 = [4,6,1,7,6,7,6,5] sched: [7:0.50]		; SKX-NEXT: vmovdqa {{.*#+}} ymm1 = [4,6,1,7,6,7,6,5] sched: [7:0.50]
; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermd (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermd (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i32>, <8 x i32>* %vp		%vec = load <8 x i32>, <8 x i32>* %vp
%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 4, i32 6, i32 1, i32 7, i32 6, i32 7, i32 6, i32 5>		%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 4, i32 6, i32 1, i32 7, i32 6, i32 7, i32 6, i32 5>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> zeroinitializer
ret <8 x i32> %res		ret <8 x i32> %res
}		}

define <8 x i32> @test_masked_8xi32_perm_mem_mask2(<8 x i32>* %vp, <8 x i32> %vec2, <8 x i32> %mask) {		define <8 x i32> @test_masked_8xi32_perm_mem_mask2(<8 x i32>* %vp, <8 x i32> %vec2, <8 x i32> %mask) {
; GENERIC-LABEL: test_masked_8xi32_perm_mem_mask2:		; GENERIC-LABEL: test_masked_8xi32_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa {{.*#+}} ymm2 = [6,4,6,1,6,3,6,3] sched: [7:0.50]		; GENERIC-NEXT: vmovdqa {{.*#+}} ymm2 = [6,4,6,1,6,3,6,3] sched: [7:0.50]
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermd (%rdi), %ymm2, %ymm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermd (%rdi), %ymm2, %ymm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xi32_perm_mem_mask2:		; SKX-LABEL: test_masked_8xi32_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa {{.*#+}} ymm2 = [6,4,6,1,6,3,6,3] sched: [7:0.50]		; SKX-NEXT: vmovdqa {{.*#+}} ymm2 = [6,4,6,1,6,3,6,3] sched: [7:0.50]
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermd (%rdi), %ymm2, %ymm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermd (%rdi), %ymm2, %ymm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i32>, <8 x i32>* %vp		%vec = load <8 x i32>, <8 x i32>* %vp
%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 6, i32 4, i32 6, i32 1, i32 6, i32 3, i32 6, i32 3>		%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 6, i32 4, i32 6, i32 1, i32 6, i32 3, i32 6, i32 3>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec2		%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec2
ret <8 x i32> %res		ret <8 x i32> %res
}		}

define <8 x i32> @test_masked_z_8xi32_perm_mem_mask2(<8 x i32>* %vp, <8 x i32> %mask) {		define <8 x i32> @test_masked_z_8xi32_perm_mem_mask2(<8 x i32>* %vp, <8 x i32> %mask) {
; GENERIC-LABEL: test_masked_z_8xi32_perm_mem_mask2:		; GENERIC-LABEL: test_masked_z_8xi32_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa {{.*#+}} ymm1 = [6,4,6,1,6,3,6,3] sched: [7:0.50]		; GENERIC-NEXT: vmovdqa {{.*#+}} ymm1 = [6,4,6,1,6,3,6,3] sched: [7:0.50]
; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermd (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermd (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xi32_perm_mem_mask2:		; SKX-LABEL: test_masked_z_8xi32_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa {{.*#+}} ymm1 = [6,4,6,1,6,3,6,3] sched: [7:0.50]		; SKX-NEXT: vmovdqa {{.*#+}} ymm1 = [6,4,6,1,6,3,6,3] sched: [7:0.50]
; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermd (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermd (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i32>, <8 x i32>* %vp		%vec = load <8 x i32>, <8 x i32>* %vp
%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 6, i32 4, i32 6, i32 1, i32 6, i32 3, i32 6, i32 3>		%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 6, i32 4, i32 6, i32 1, i32 6, i32 3, i32 6, i32 3>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> zeroinitializer
ret <8 x i32> %res		ret <8 x i32> %res
}		}

define <8 x i32> @test_8xi32_perm_mem_mask3(<8 x i32>* %vp) {		define <8 x i32> @test_8xi32_perm_mem_mask3(<8 x i32>* %vp) {
; GENERIC-LABEL: test_8xi32_perm_mem_mask3:		; GENERIC-LABEL: test_8xi32_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} ymm0 = [6,0,0,7,3,7,7,5] sched: [7:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} ymm0 = [6,0,0,7,3,7,7,5] sched: [7:0.50]
; GENERIC-NEXT: vpermps (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi32_perm_mem_mask3:		; SKX-LABEL: test_8xi32_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} ymm0 = [6,0,0,7,3,7,7,5] sched: [7:0.50]		; SKX-NEXT: vmovaps {{.*#+}} ymm0 = [6,0,0,7,3,7,7,5] sched: [7:0.50]
; SKX-NEXT: vpermps (%rdi), %ymm0, %ymm0 # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i32>, <8 x i32>* %vp		%vec = load <8 x i32>, <8 x i32>* %vp
%res = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 6, i32 0, i32 0, i32 7, i32 3, i32 7, i32 7, i32 5>		%res = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 6, i32 0, i32 0, i32 7, i32 3, i32 7, i32 7, i32 5>
ret <8 x i32> %res		ret <8 x i32> %res
}		}
define <8 x i32> @test_masked_8xi32_perm_mem_mask3(<8 x i32>* %vp, <8 x i32> %vec2, <8 x i32> %mask) {		define <8 x i32> @test_masked_8xi32_perm_mem_mask3(<8 x i32>* %vp, <8 x i32> %vec2, <8 x i32> %mask) {
; GENERIC-LABEL: test_masked_8xi32_perm_mem_mask3:		; GENERIC-LABEL: test_masked_8xi32_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa {{.*#+}} ymm2 = [6,0,0,7,3,7,7,5] sched: [7:0.50]		; GENERIC-NEXT: vmovdqa {{.*#+}} ymm2 = [6,0,0,7,3,7,7,5] sched: [7:0.50]
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermd (%rdi), %ymm2, %ymm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermd (%rdi), %ymm2, %ymm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xi32_perm_mem_mask3:		; SKX-LABEL: test_masked_8xi32_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa {{.*#+}} ymm2 = [6,0,0,7,3,7,7,5] sched: [7:0.50]		; SKX-NEXT: vmovdqa {{.*#+}} ymm2 = [6,0,0,7,3,7,7,5] sched: [7:0.50]
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermd (%rdi), %ymm2, %ymm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermd (%rdi), %ymm2, %ymm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i32>, <8 x i32>* %vp		%vec = load <8 x i32>, <8 x i32>* %vp
%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 6, i32 0, i32 0, i32 7, i32 3, i32 7, i32 7, i32 5>		%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 6, i32 0, i32 0, i32 7, i32 3, i32 7, i32 7, i32 5>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec2		%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec2
ret <8 x i32> %res		ret <8 x i32> %res
}		}

define <8 x i32> @test_masked_z_8xi32_perm_mem_mask3(<8 x i32>* %vp, <8 x i32> %mask) {		define <8 x i32> @test_masked_z_8xi32_perm_mem_mask3(<8 x i32>* %vp, <8 x i32> %mask) {
; GENERIC-LABEL: test_masked_z_8xi32_perm_mem_mask3:		; GENERIC-LABEL: test_masked_z_8xi32_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa {{.*#+}} ymm1 = [6,0,0,7,3,7,7,5] sched: [7:0.50]		; GENERIC-NEXT: vmovdqa {{.*#+}} ymm1 = [6,0,0,7,3,7,7,5] sched: [7:0.50]
; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermd (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermd (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xi32_perm_mem_mask3:		; SKX-LABEL: test_masked_z_8xi32_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa {{.*#+}} ymm1 = [6,0,0,7,3,7,7,5] sched: [7:0.50]		; SKX-NEXT: vmovdqa {{.*#+}} ymm1 = [6,0,0,7,3,7,7,5] sched: [7:0.50]
; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermd (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermd (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
▲ Show 20 Lines • Show All 197 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer
ret <16 x i32> %res		ret <16 x i32> %res
}		}
define <16 x i32> @test_16xi32_perm_mem_mask0(<16 x i32>* %vp) {		define <16 x i32> @test_16xi32_perm_mem_mask0(<16 x i32>* %vp) {
; GENERIC-LABEL: test_16xi32_perm_mem_mask0:		; GENERIC-LABEL: test_16xi32_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} zmm0 = [0,1,1,6,8,11,2,6,10,1,7,5,15,0,6,6] sched: [6:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} zmm0 = [0,1,1,6,8,11,2,6,10,1,7,5,15,0,6,6] sched: [6:0.50]
; GENERIC-NEXT: vpermps (%rdi), %zmm0, %zmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %zmm0, %zmm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xi32_perm_mem_mask0:		; SKX-LABEL: test_16xi32_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} zmm0 = [0,1,1,6,8,11,2,6,10,1,7,5,15,0,6,6] sched: [8:0.50]		; SKX-NEXT: vmovaps {{.*#+}} zmm0 = [0,1,1,6,8,11,2,6,10,1,7,5,15,0,6,6] sched: [8:0.50]
; SKX-NEXT: vpermps (%rdi), %zmm0, %zmm0 # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %zmm0, %zmm0 # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i32>, <16 x i32>* %vp		%vec = load <16 x i32>, <16 x i32>* %vp
%res = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 0, i32 1, i32 1, i32 6, i32 8, i32 11, i32 2, i32 6, i32 10, i32 1, i32 7, i32 5, i32 15, i32 0, i32 6, i32 6>		%res = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 0, i32 1, i32 1, i32 6, i32 8, i32 11, i32 2, i32 6, i32 10, i32 1, i32 7, i32 5, i32 15, i32 0, i32 6, i32 6>
ret <16 x i32> %res		ret <16 x i32> %res
}		}
define <16 x i32> @test_masked_16xi32_perm_mem_mask0(<16 x i32>* %vp, <16 x i32> %vec2, <16 x i32> %mask) {		define <16 x i32> @test_masked_16xi32_perm_mem_mask0(<16 x i32>* %vp, <16 x i32> %vec2, <16 x i32> %mask) {
; GENERIC-LABEL: test_masked_16xi32_perm_mem_mask0:		; GENERIC-LABEL: test_masked_16xi32_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,1,1,6,8,11,2,6,10,1,7,5,15,0,6,6] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,1,1,6,8,11,2,6,10,1,7,5,15,0,6,6] sched: [6:0.50]
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermd (%rdi), %zmm2, %zmm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermd (%rdi), %zmm2, %zmm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi32_perm_mem_mask0:		; SKX-LABEL: test_masked_16xi32_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,1,1,6,8,11,2,6,10,1,7,5,15,0,6,6] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,1,1,6,8,11,2,6,10,1,7,5,15,0,6,6] sched: [8:0.50]
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermd (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermd (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i32>, <16 x i32>* %vp		%vec = load <16 x i32>, <16 x i32>* %vp
%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 0, i32 1, i32 1, i32 6, i32 8, i32 11, i32 2, i32 6, i32 10, i32 1, i32 7, i32 5, i32 15, i32 0, i32 6, i32 6>		%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 0, i32 1, i32 1, i32 6, i32 8, i32 11, i32 2, i32 6, i32 10, i32 1, i32 7, i32 5, i32 15, i32 0, i32 6, i32 6>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec2		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec2
ret <16 x i32> %res		ret <16 x i32> %res
}		}

define <16 x i32> @test_masked_z_16xi32_perm_mem_mask0(<16 x i32>* %vp, <16 x i32> %mask) {		define <16 x i32> @test_masked_z_16xi32_perm_mem_mask0(<16 x i32>* %vp, <16 x i32> %mask) {
; GENERIC-LABEL: test_masked_z_16xi32_perm_mem_mask0:		; GENERIC-LABEL: test_masked_z_16xi32_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,1,1,6,8,11,2,6,10,1,7,5,15,0,6,6] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,1,1,6,8,11,2,6,10,1,7,5,15,0,6,6] sched: [6:0.50]
; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi32_perm_mem_mask0:		; SKX-LABEL: test_masked_z_16xi32_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,1,1,6,8,11,2,6,10,1,7,5,15,0,6,6] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,1,1,6,8,11,2,6,10,1,7,5,15,0,6,6] sched: [8:0.50]
; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i32>, <16 x i32>* %vp		%vec = load <16 x i32>, <16 x i32>* %vp
%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 0, i32 1, i32 1, i32 6, i32 8, i32 11, i32 2, i32 6, i32 10, i32 1, i32 7, i32 5, i32 15, i32 0, i32 6, i32 6>		%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 0, i32 1, i32 1, i32 6, i32 8, i32 11, i32 2, i32 6, i32 10, i32 1, i32 7, i32 5, i32 15, i32 0, i32 6, i32 6>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer
ret <16 x i32> %res		ret <16 x i32> %res
}		}

define <16 x i32> @test_masked_16xi32_perm_mem_mask1(<16 x i32>* %vp, <16 x i32> %vec2, <16 x i32> %mask) {		define <16 x i32> @test_masked_16xi32_perm_mem_mask1(<16 x i32>* %vp, <16 x i32> %vec2, <16 x i32> %mask) {
; GENERIC-LABEL: test_masked_16xi32_perm_mem_mask1:		; GENERIC-LABEL: test_masked_16xi32_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [11,5,3,4,7,15,12,4,8,11,12,7,6,12,6,3] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [11,5,3,4,7,15,12,4,8,11,12,7,6,12,6,3] sched: [6:0.50]
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermd (%rdi), %zmm2, %zmm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermd (%rdi), %zmm2, %zmm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi32_perm_mem_mask1:		; SKX-LABEL: test_masked_16xi32_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [11,5,3,4,7,15,12,4,8,11,12,7,6,12,6,3] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [11,5,3,4,7,15,12,4,8,11,12,7,6,12,6,3] sched: [8:0.50]
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermd (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermd (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i32>, <16 x i32>* %vp		%vec = load <16 x i32>, <16 x i32>* %vp
%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 11, i32 5, i32 3, i32 4, i32 7, i32 15, i32 12, i32 4, i32 8, i32 11, i32 12, i32 7, i32 6, i32 12, i32 6, i32 3>		%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 11, i32 5, i32 3, i32 4, i32 7, i32 15, i32 12, i32 4, i32 8, i32 11, i32 12, i32 7, i32 6, i32 12, i32 6, i32 3>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec2		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec2
ret <16 x i32> %res		ret <16 x i32> %res
}		}

define <16 x i32> @test_masked_z_16xi32_perm_mem_mask1(<16 x i32>* %vp, <16 x i32> %mask) {		define <16 x i32> @test_masked_z_16xi32_perm_mem_mask1(<16 x i32>* %vp, <16 x i32> %mask) {
; GENERIC-LABEL: test_masked_z_16xi32_perm_mem_mask1:		; GENERIC-LABEL: test_masked_z_16xi32_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [11,5,3,4,7,15,12,4,8,11,12,7,6,12,6,3] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [11,5,3,4,7,15,12,4,8,11,12,7,6,12,6,3] sched: [6:0.50]
; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi32_perm_mem_mask1:		; SKX-LABEL: test_masked_z_16xi32_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [11,5,3,4,7,15,12,4,8,11,12,7,6,12,6,3] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [11,5,3,4,7,15,12,4,8,11,12,7,6,12,6,3] sched: [8:0.50]
; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i32>, <16 x i32>* %vp		%vec = load <16 x i32>, <16 x i32>* %vp
%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 11, i32 5, i32 3, i32 4, i32 7, i32 15, i32 12, i32 4, i32 8, i32 11, i32 12, i32 7, i32 6, i32 12, i32 6, i32 3>		%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 11, i32 5, i32 3, i32 4, i32 7, i32 15, i32 12, i32 4, i32 8, i32 11, i32 12, i32 7, i32 6, i32 12, i32 6, i32 3>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer
ret <16 x i32> %res		ret <16 x i32> %res
}		}

define <16 x i32> @test_masked_16xi32_perm_mem_mask2(<16 x i32>* %vp, <16 x i32> %vec2, <16 x i32> %mask) {		define <16 x i32> @test_masked_16xi32_perm_mem_mask2(<16 x i32>* %vp, <16 x i32> %vec2, <16 x i32> %mask) {
; GENERIC-LABEL: test_masked_16xi32_perm_mem_mask2:		; GENERIC-LABEL: test_masked_16xi32_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [7,14,2,7,10,7,3,0,11,9,0,4,12,10,8,2] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [7,14,2,7,10,7,3,0,11,9,0,4,12,10,8,2] sched: [6:0.50]
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermd (%rdi), %zmm2, %zmm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermd (%rdi), %zmm2, %zmm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi32_perm_mem_mask2:		; SKX-LABEL: test_masked_16xi32_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [7,14,2,7,10,7,3,0,11,9,0,4,12,10,8,2] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [7,14,2,7,10,7,3,0,11,9,0,4,12,10,8,2] sched: [8:0.50]
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermd (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermd (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i32>, <16 x i32>* %vp		%vec = load <16 x i32>, <16 x i32>* %vp
%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 7, i32 14, i32 2, i32 7, i32 10, i32 7, i32 3, i32 0, i32 11, i32 9, i32 0, i32 4, i32 12, i32 10, i32 8, i32 2>		%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 7, i32 14, i32 2, i32 7, i32 10, i32 7, i32 3, i32 0, i32 11, i32 9, i32 0, i32 4, i32 12, i32 10, i32 8, i32 2>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec2		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec2
ret <16 x i32> %res		ret <16 x i32> %res
}		}

define <16 x i32> @test_masked_z_16xi32_perm_mem_mask2(<16 x i32>* %vp, <16 x i32> %mask) {		define <16 x i32> @test_masked_z_16xi32_perm_mem_mask2(<16 x i32>* %vp, <16 x i32> %mask) {
; GENERIC-LABEL: test_masked_z_16xi32_perm_mem_mask2:		; GENERIC-LABEL: test_masked_z_16xi32_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [7,14,2,7,10,7,3,0,11,9,0,4,12,10,8,2] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [7,14,2,7,10,7,3,0,11,9,0,4,12,10,8,2] sched: [6:0.50]
; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi32_perm_mem_mask2:		; SKX-LABEL: test_masked_z_16xi32_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [7,14,2,7,10,7,3,0,11,9,0,4,12,10,8,2] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [7,14,2,7,10,7,3,0,11,9,0,4,12,10,8,2] sched: [8:0.50]
; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i32>, <16 x i32>* %vp		%vec = load <16 x i32>, <16 x i32>* %vp
%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 7, i32 14, i32 2, i32 7, i32 10, i32 7, i32 3, i32 0, i32 11, i32 9, i32 0, i32 4, i32 12, i32 10, i32 8, i32 2>		%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 7, i32 14, i32 2, i32 7, i32 10, i32 7, i32 3, i32 0, i32 11, i32 9, i32 0, i32 4, i32 12, i32 10, i32 8, i32 2>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer
ret <16 x i32> %res		ret <16 x i32> %res
}		}

define <16 x i32> @test_16xi32_perm_mem_mask3(<16 x i32>* %vp) {		define <16 x i32> @test_16xi32_perm_mem_mask3(<16 x i32>* %vp) {
; GENERIC-LABEL: test_16xi32_perm_mem_mask3:		; GENERIC-LABEL: test_16xi32_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} zmm0 = [11,7,10,12,3,12,4,15,1,14,0,4,8,9,6,1] sched: [6:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} zmm0 = [11,7,10,12,3,12,4,15,1,14,0,4,8,9,6,1] sched: [6:0.50]
; GENERIC-NEXT: vpermps (%rdi), %zmm0, %zmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %zmm0, %zmm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xi32_perm_mem_mask3:		; SKX-LABEL: test_16xi32_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} zmm0 = [11,7,10,12,3,12,4,15,1,14,0,4,8,9,6,1] sched: [8:0.50]		; SKX-NEXT: vmovaps {{.*#+}} zmm0 = [11,7,10,12,3,12,4,15,1,14,0,4,8,9,6,1] sched: [8:0.50]
; SKX-NEXT: vpermps (%rdi), %zmm0, %zmm0 # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %zmm0, %zmm0 # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i32>, <16 x i32>* %vp		%vec = load <16 x i32>, <16 x i32>* %vp
%res = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 11, i32 7, i32 10, i32 12, i32 3, i32 12, i32 4, i32 15, i32 1, i32 14, i32 0, i32 4, i32 8, i32 9, i32 6, i32 1>		%res = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 11, i32 7, i32 10, i32 12, i32 3, i32 12, i32 4, i32 15, i32 1, i32 14, i32 0, i32 4, i32 8, i32 9, i32 6, i32 1>
ret <16 x i32> %res		ret <16 x i32> %res
}		}
define <16 x i32> @test_masked_16xi32_perm_mem_mask3(<16 x i32>* %vp, <16 x i32> %vec2, <16 x i32> %mask) {		define <16 x i32> @test_masked_16xi32_perm_mem_mask3(<16 x i32>* %vp, <16 x i32> %vec2, <16 x i32> %mask) {
; GENERIC-LABEL: test_masked_16xi32_perm_mem_mask3:		; GENERIC-LABEL: test_masked_16xi32_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [11,7,10,12,3,12,4,15,1,14,0,4,8,9,6,1] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [11,7,10,12,3,12,4,15,1,14,0,4,8,9,6,1] sched: [6:0.50]
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermd (%rdi), %zmm2, %zmm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermd (%rdi), %zmm2, %zmm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi32_perm_mem_mask3:		; SKX-LABEL: test_masked_16xi32_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [11,7,10,12,3,12,4,15,1,14,0,4,8,9,6,1] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [11,7,10,12,3,12,4,15,1,14,0,4,8,9,6,1] sched: [8:0.50]
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermd (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermd (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i32>, <16 x i32>* %vp		%vec = load <16 x i32>, <16 x i32>* %vp
%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 11, i32 7, i32 10, i32 12, i32 3, i32 12, i32 4, i32 15, i32 1, i32 14, i32 0, i32 4, i32 8, i32 9, i32 6, i32 1>		%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 11, i32 7, i32 10, i32 12, i32 3, i32 12, i32 4, i32 15, i32 1, i32 14, i32 0, i32 4, i32 8, i32 9, i32 6, i32 1>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec2		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec2
ret <16 x i32> %res		ret <16 x i32> %res
}		}

define <16 x i32> @test_masked_z_16xi32_perm_mem_mask3(<16 x i32>* %vp, <16 x i32> %mask) {		define <16 x i32> @test_masked_z_16xi32_perm_mem_mask3(<16 x i32>* %vp, <16 x i32> %mask) {
; GENERIC-LABEL: test_masked_z_16xi32_perm_mem_mask3:		; GENERIC-LABEL: test_masked_z_16xi32_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [11,7,10,12,3,12,4,15,1,14,0,4,8,9,6,1] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [11,7,10,12,3,12,4,15,1,14,0,4,8,9,6,1] sched: [6:0.50]
; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi32_perm_mem_mask3:		; SKX-LABEL: test_masked_z_16xi32_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [11,7,10,12,3,12,4,15,1,14,0,4,8,9,6,1] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [11,7,10,12,3,12,4,15,1,14,0,4,8,9,6,1] sched: [8:0.50]
; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
▲ Show 20 Lines • Show All 176 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <4 x i64> %vec, <4 x i64> undef, <4 x i32> <i32 2, i32 1, i32 3, i32 3>		%shuf = shufflevector <4 x i64> %vec, <4 x i64> undef, <4 x i32> <i32 2, i32 1, i32 3, i32 3>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> zeroinitializer		%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> zeroinitializer
ret <4 x i64> %res		ret <4 x i64> %res
}		}
define <4 x i64> @test_4xi64_perm_mem_mask0(<4 x i64>* %vp) {		define <4 x i64> @test_4xi64_perm_mem_mask0(<4 x i64>* %vp) {
; GENERIC-LABEL: test_4xi64_perm_mem_mask0:		; GENERIC-LABEL: test_4xi64_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 = mem[2,1,2,0] sched: [5:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 = mem[2,1,2,0] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xi64_perm_mem_mask0:		; SKX-LABEL: test_4xi64_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpermpd {{.*#+}} ymm0 = mem[2,1,2,0] sched: [10:1.00]		; SKX-NEXT: vpermpd {{.*#+}} ymm0 = mem[2,1,2,0] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x i64>, <4 x i64>* %vp		%vec = load <4 x i64>, <4 x i64>* %vp
%res = shufflevector <4 x i64> %vec, <4 x i64> undef, <4 x i32> <i32 2, i32 1, i32 2, i32 0>		%res = shufflevector <4 x i64> %vec, <4 x i64> undef, <4 x i32> <i32 2, i32 1, i32 2, i32 0>
ret <4 x i64> %res		ret <4 x i64> %res
}		}
define <4 x i64> @test_masked_4xi64_perm_mem_mask0(<4 x i64>* %vp, <4 x i64> %vec2, <4 x i64> %mask) {		define <4 x i64> @test_masked_4xi64_perm_mem_mask0(<4 x i64>* %vp, <4 x i64> %vec2, <4 x i64> %mask) {
; GENERIC-LABEL: test_masked_4xi64_perm_mem_mask0:		; GENERIC-LABEL: test_masked_4xi64_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq {{.*#+}} ymm0 {%k1} = mem[2,1,2,0] sched: [5:1.00]		; GENERIC-NEXT: vpermq {{.*#+}} ymm0 {%k1} = mem[2,1,2,0] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_4xi64_perm_mem_mask0:		; SKX-LABEL: test_masked_4xi64_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq {{.*#+}} ymm0 {%k1} = mem[2,1,2,0] sched: [10:1.00]		; SKX-NEXT: vpermq {{.*#+}} ymm0 {%k1} = mem[2,1,2,0] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x i64>, <4 x i64>* %vp		%vec = load <4 x i64>, <4 x i64>* %vp
%shuf = shufflevector <4 x i64> %vec, <4 x i64> undef, <4 x i32> <i32 2, i32 1, i32 2, i32 0>		%shuf = shufflevector <4 x i64> %vec, <4 x i64> undef, <4 x i32> <i32 2, i32 1, i32 2, i32 0>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> %vec2		%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> %vec2
ret <4 x i64> %res		ret <4 x i64> %res
}		}

define <4 x i64> @test_masked_z_4xi64_perm_mem_mask0(<4 x i64>* %vp, <4 x i64> %mask) {		define <4 x i64> @test_masked_z_4xi64_perm_mem_mask0(<4 x i64>* %vp, <4 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_4xi64_perm_mem_mask0:		; GENERIC-LABEL: test_masked_z_4xi64_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq {{.*#+}} ymm0 {%k1} {z} = mem[2,1,2,0] sched: [5:1.00]		; GENERIC-NEXT: vpermq {{.*#+}} ymm0 {%k1} {z} = mem[2,1,2,0] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_4xi64_perm_mem_mask0:		; SKX-LABEL: test_masked_z_4xi64_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq {{.*#+}} ymm0 {%k1} {z} = mem[2,1,2,0] sched: [10:1.00]		; SKX-NEXT: vpermq {{.*#+}} ymm0 {%k1} {z} = mem[2,1,2,0] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x i64>, <4 x i64>* %vp		%vec = load <4 x i64>, <4 x i64>* %vp
%shuf = shufflevector <4 x i64> %vec, <4 x i64> undef, <4 x i32> <i32 2, i32 1, i32 2, i32 0>		%shuf = shufflevector <4 x i64> %vec, <4 x i64> undef, <4 x i32> <i32 2, i32 1, i32 2, i32 0>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> zeroinitializer		%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> zeroinitializer
ret <4 x i64> %res		ret <4 x i64> %res
}		}

define <4 x i64> @test_masked_4xi64_perm_mem_mask1(<4 x i64>* %vp, <4 x i64> %vec2, <4 x i64> %mask) {		define <4 x i64> @test_masked_4xi64_perm_mem_mask1(<4 x i64>* %vp, <4 x i64> %vec2, <4 x i64> %mask) {
; GENERIC-LABEL: test_masked_4xi64_perm_mem_mask1:		; GENERIC-LABEL: test_masked_4xi64_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq {{.*#+}} ymm0 {%k1} = mem[2,1,1,1] sched: [5:1.00]		; GENERIC-NEXT: vpermq {{.*#+}} ymm0 {%k1} = mem[2,1,1,1] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_4xi64_perm_mem_mask1:		; SKX-LABEL: test_masked_4xi64_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq {{.*#+}} ymm0 {%k1} = mem[2,1,1,1] sched: [10:1.00]		; SKX-NEXT: vpermq {{.*#+}} ymm0 {%k1} = mem[2,1,1,1] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x i64>, <4 x i64>* %vp		%vec = load <4 x i64>, <4 x i64>* %vp
%shuf = shufflevector <4 x i64> %vec, <4 x i64> undef, <4 x i32> <i32 2, i32 1, i32 1, i32 1>		%shuf = shufflevector <4 x i64> %vec, <4 x i64> undef, <4 x i32> <i32 2, i32 1, i32 1, i32 1>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> %vec2		%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> %vec2
ret <4 x i64> %res		ret <4 x i64> %res
}		}

define <4 x i64> @test_masked_z_4xi64_perm_mem_mask1(<4 x i64>* %vp, <4 x i64> %mask) {		define <4 x i64> @test_masked_z_4xi64_perm_mem_mask1(<4 x i64>* %vp, <4 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_4xi64_perm_mem_mask1:		; GENERIC-LABEL: test_masked_z_4xi64_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq {{.*#+}} ymm0 {%k1} {z} = mem[2,1,1,1] sched: [5:1.00]		; GENERIC-NEXT: vpermq {{.*#+}} ymm0 {%k1} {z} = mem[2,1,1,1] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_4xi64_perm_mem_mask1:		; SKX-LABEL: test_masked_z_4xi64_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq {{.*#+}} ymm0 {%k1} {z} = mem[2,1,1,1] sched: [10:1.00]		; SKX-NEXT: vpermq {{.*#+}} ymm0 {%k1} {z} = mem[2,1,1,1] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x i64>, <4 x i64>* %vp		%vec = load <4 x i64>, <4 x i64>* %vp
%shuf = shufflevector <4 x i64> %vec, <4 x i64> undef, <4 x i32> <i32 2, i32 1, i32 1, i32 1>		%shuf = shufflevector <4 x i64> %vec, <4 x i64> undef, <4 x i32> <i32 2, i32 1, i32 1, i32 1>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> zeroinitializer		%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> zeroinitializer
ret <4 x i64> %res		ret <4 x i64> %res
}		}

define <4 x i64> @test_masked_4xi64_perm_mem_mask2(<4 x i64>* %vp, <4 x i64> %vec2, <4 x i64> %mask) {		define <4 x i64> @test_masked_4xi64_perm_mem_mask2(<4 x i64>* %vp, <4 x i64> %vec2, <4 x i64> %mask) {
; GENERIC-LABEL: test_masked_4xi64_perm_mem_mask2:		; GENERIC-LABEL: test_masked_4xi64_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq {{.*#+}} ymm0 {%k1} = mem[0,1,2,0] sched: [5:1.00]		; GENERIC-NEXT: vpermq {{.*#+}} ymm0 {%k1} = mem[0,1,2,0] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_4xi64_perm_mem_mask2:		; SKX-LABEL: test_masked_4xi64_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq {{.*#+}} ymm0 {%k1} = mem[0,1,2,0] sched: [10:1.00]		; SKX-NEXT: vpermq {{.*#+}} ymm0 {%k1} = mem[0,1,2,0] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x i64>, <4 x i64>* %vp		%vec = load <4 x i64>, <4 x i64>* %vp
%shuf = shufflevector <4 x i64> %vec, <4 x i64> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 0>		%shuf = shufflevector <4 x i64> %vec, <4 x i64> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 0>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> %vec2		%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> %vec2
ret <4 x i64> %res		ret <4 x i64> %res
}		}

define <4 x i64> @test_masked_z_4xi64_perm_mem_mask2(<4 x i64>* %vp, <4 x i64> %mask) {		define <4 x i64> @test_masked_z_4xi64_perm_mem_mask2(<4 x i64>* %vp, <4 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_4xi64_perm_mem_mask2:		; GENERIC-LABEL: test_masked_z_4xi64_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq {{.*#+}} ymm0 {%k1} {z} = mem[0,1,2,0] sched: [5:1.00]		; GENERIC-NEXT: vpermq {{.*#+}} ymm0 {%k1} {z} = mem[0,1,2,0] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_4xi64_perm_mem_mask2:		; SKX-LABEL: test_masked_z_4xi64_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq {{.*#+}} ymm0 {%k1} {z} = mem[0,1,2,0] sched: [10:1.00]		; SKX-NEXT: vpermq {{.*#+}} ymm0 {%k1} {z} = mem[0,1,2,0] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x i64>, <4 x i64>* %vp		%vec = load <4 x i64>, <4 x i64>* %vp
%shuf = shufflevector <4 x i64> %vec, <4 x i64> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 0>		%shuf = shufflevector <4 x i64> %vec, <4 x i64> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 0>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> zeroinitializer		%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> zeroinitializer
ret <4 x i64> %res		ret <4 x i64> %res
}		}

define <4 x i64> @test_4xi64_perm_mem_mask3(<4 x i64>* %vp) {		define <4 x i64> @test_4xi64_perm_mem_mask3(<4 x i64>* %vp) {
; GENERIC-LABEL: test_4xi64_perm_mem_mask3:		; GENERIC-LABEL: test_4xi64_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 = mem[2,0,1,3] sched: [5:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 = mem[2,0,1,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xi64_perm_mem_mask3:		; SKX-LABEL: test_4xi64_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpermpd {{.*#+}} ymm0 = mem[2,0,1,3] sched: [10:1.00]		; SKX-NEXT: vpermpd {{.*#+}} ymm0 = mem[2,0,1,3] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x i64>, <4 x i64>* %vp		%vec = load <4 x i64>, <4 x i64>* %vp
%res = shufflevector <4 x i64> %vec, <4 x i64> undef, <4 x i32> <i32 2, i32 0, i32 1, i32 3>		%res = shufflevector <4 x i64> %vec, <4 x i64> undef, <4 x i32> <i32 2, i32 0, i32 1, i32 3>
ret <4 x i64> %res		ret <4 x i64> %res
}		}
define <4 x i64> @test_masked_4xi64_perm_mem_mask3(<4 x i64>* %vp, <4 x i64> %vec2, <4 x i64> %mask) {		define <4 x i64> @test_masked_4xi64_perm_mem_mask3(<4 x i64>* %vp, <4 x i64> %vec2, <4 x i64> %mask) {
; GENERIC-LABEL: test_masked_4xi64_perm_mem_mask3:		; GENERIC-LABEL: test_masked_4xi64_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq {{.*#+}} ymm0 {%k1} = mem[2,0,1,3] sched: [5:1.00]		; GENERIC-NEXT: vpermq {{.*#+}} ymm0 {%k1} = mem[2,0,1,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_4xi64_perm_mem_mask3:		; SKX-LABEL: test_masked_4xi64_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq {{.*#+}} ymm0 {%k1} = mem[2,0,1,3] sched: [10:1.00]		; SKX-NEXT: vpermq {{.*#+}} ymm0 {%k1} = mem[2,0,1,3] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x i64>, <4 x i64>* %vp		%vec = load <4 x i64>, <4 x i64>* %vp
%shuf = shufflevector <4 x i64> %vec, <4 x i64> undef, <4 x i32> <i32 2, i32 0, i32 1, i32 3>		%shuf = shufflevector <4 x i64> %vec, <4 x i64> undef, <4 x i32> <i32 2, i32 0, i32 1, i32 3>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> %vec2		%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> %vec2
ret <4 x i64> %res		ret <4 x i64> %res
}		}

define <4 x i64> @test_masked_z_4xi64_perm_mem_mask3(<4 x i64>* %vp, <4 x i64> %mask) {		define <4 x i64> @test_masked_z_4xi64_perm_mem_mask3(<4 x i64>* %vp, <4 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_4xi64_perm_mem_mask3:		; GENERIC-LABEL: test_masked_z_4xi64_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq {{.*#+}} ymm0 {%k1} {z} = mem[2,0,1,3] sched: [5:1.00]		; GENERIC-NEXT: vpermq {{.*#+}} ymm0 {%k1} {z} = mem[2,0,1,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_4xi64_perm_mem_mask3:		; SKX-LABEL: test_masked_z_4xi64_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq {{.*#+}} ymm0 {%k1} {z} = mem[2,0,1,3] sched: [10:1.00]		; SKX-NEXT: vpermq {{.*#+}} ymm0 {%k1} {z} = mem[2,0,1,3] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x i64>, <4 x i64>* %vp		%vec = load <4 x i64>, <4 x i64>* %vp
▲ Show 20 Lines • Show All 357 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer
ret <8 x i64> %res		ret <8 x i64> %res
}		}
define <8 x i64> @test_8xi64_perm_mem_mask0(<8 x i64>* %vp) {		define <8 x i64> @test_8xi64_perm_mem_mask0(<8 x i64>* %vp) {
; GENERIC-LABEL: test_8xi64_perm_mem_mask0:		; GENERIC-LABEL: test_8xi64_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} zmm0 = [5,1,6,5,7,3,7,3] sched: [6:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} zmm0 = [5,1,6,5,7,3,7,3] sched: [6:0.50]
; GENERIC-NEXT: vpermpd (%rdi), %zmm0, %zmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermpd (%rdi), %zmm0, %zmm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi64_perm_mem_mask0:		; SKX-LABEL: test_8xi64_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} zmm0 = [5,1,6,5,7,3,7,3] sched: [8:0.50]		; SKX-NEXT: vmovaps {{.*#+}} zmm0 = [5,1,6,5,7,3,7,3] sched: [8:0.50]
; SKX-NEXT: vpermpd (%rdi), %zmm0, %zmm0 # sched: [10:1.00]		; SKX-NEXT: vpermpd (%rdi), %zmm0, %zmm0 # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i64>, <8 x i64>* %vp		%vec = load <8 x i64>, <8 x i64>* %vp
%res = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 5, i32 1, i32 6, i32 5, i32 7, i32 3, i32 7, i32 3>		%res = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 5, i32 1, i32 6, i32 5, i32 7, i32 3, i32 7, i32 3>
ret <8 x i64> %res		ret <8 x i64> %res
}		}
define <8 x i64> @test_masked_8xi64_perm_mem_mask0(<8 x i64>* %vp, <8 x i64> %vec2, <8 x i64> %mask) {		define <8 x i64> @test_masked_8xi64_perm_mem_mask0(<8 x i64>* %vp, <8 x i64> %vec2, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_8xi64_perm_mem_mask0:		; GENERIC-LABEL: test_masked_8xi64_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [5,1,6,5,7,3,7,3] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [5,1,6,5,7,3,7,3] sched: [6:0.50]
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq (%rdi), %zmm2, %zmm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermq (%rdi), %zmm2, %zmm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xi64_perm_mem_mask0:		; SKX-LABEL: test_masked_8xi64_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [5,1,6,5,7,3,7,3] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [5,1,6,5,7,3,7,3] sched: [8:0.50]
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermq (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i64>, <8 x i64>* %vp		%vec = load <8 x i64>, <8 x i64>* %vp
%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 5, i32 1, i32 6, i32 5, i32 7, i32 3, i32 7, i32 3>		%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 5, i32 1, i32 6, i32 5, i32 7, i32 3, i32 7, i32 3>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec2		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec2
ret <8 x i64> %res		ret <8 x i64> %res
}		}

define <8 x i64> @test_masked_z_8xi64_perm_mem_mask0(<8 x i64>* %vp, <8 x i64> %mask) {		define <8 x i64> @test_masked_z_8xi64_perm_mem_mask0(<8 x i64>* %vp, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_8xi64_perm_mem_mask0:		; GENERIC-LABEL: test_masked_z_8xi64_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [5,1,6,5,7,3,7,3] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [5,1,6,5,7,3,7,3] sched: [6:0.50]
; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermq (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xi64_perm_mem_mask0:		; SKX-LABEL: test_masked_z_8xi64_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [5,1,6,5,7,3,7,3] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [5,1,6,5,7,3,7,3] sched: [8:0.50]
; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermq (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i64>, <8 x i64>* %vp		%vec = load <8 x i64>, <8 x i64>* %vp
%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 5, i32 1, i32 6, i32 5, i32 7, i32 3, i32 7, i32 3>		%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 5, i32 1, i32 6, i32 5, i32 7, i32 3, i32 7, i32 3>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer
ret <8 x i64> %res		ret <8 x i64> %res
}		}

define <8 x i64> @test_masked_8xi64_perm_imm_mem_mask1(<8 x i64>* %vp, <8 x i64> %vec2, <8 x i64> %mask) {		define <8 x i64> @test_masked_8xi64_perm_imm_mem_mask1(<8 x i64>* %vp, <8 x i64> %vec2, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_8xi64_perm_imm_mem_mask1:		; GENERIC-LABEL: test_masked_8xi64_perm_imm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq {{.*#+}} zmm0 {%k1} = mem[1,1,1,0,5,5,5,4] sched: [5:1.00]		; GENERIC-NEXT: vpermq {{.*#+}} zmm0 {%k1} = mem[1,1,1,0,5,5,5,4] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xi64_perm_imm_mem_mask1:		; SKX-LABEL: test_masked_8xi64_perm_imm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq {{.*#+}} zmm0 {%k1} = mem[1,1,1,0,5,5,5,4] sched: [10:1.00]		; SKX-NEXT: vpermq {{.*#+}} zmm0 {%k1} = mem[1,1,1,0,5,5,5,4] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i64>, <8 x i64>* %vp		%vec = load <8 x i64>, <8 x i64>* %vp
%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 1, i32 1, i32 1, i32 0, i32 5, i32 5, i32 5, i32 4>		%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 1, i32 1, i32 1, i32 0, i32 5, i32 5, i32 5, i32 4>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec2		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec2
ret <8 x i64> %res		ret <8 x i64> %res
}		}

define <8 x i64> @test_masked_z_8xi64_perm_imm_mem_mask1(<8 x i64>* %vp, <8 x i64> %mask) {		define <8 x i64> @test_masked_z_8xi64_perm_imm_mem_mask1(<8 x i64>* %vp, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_8xi64_perm_imm_mem_mask1:		; GENERIC-LABEL: test_masked_z_8xi64_perm_imm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq {{.*#+}} zmm0 {%k1} {z} = mem[1,1,1,0,5,5,5,4] sched: [5:1.00]		; GENERIC-NEXT: vpermq {{.*#+}} zmm0 {%k1} {z} = mem[1,1,1,0,5,5,5,4] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xi64_perm_imm_mem_mask1:		; SKX-LABEL: test_masked_z_8xi64_perm_imm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq {{.*#+}} zmm0 {%k1} {z} = mem[1,1,1,0,5,5,5,4] sched: [10:1.00]		; SKX-NEXT: vpermq {{.*#+}} zmm0 {%k1} {z} = mem[1,1,1,0,5,5,5,4] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i64>, <8 x i64>* %vp		%vec = load <8 x i64>, <8 x i64>* %vp
%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 1, i32 1, i32 1, i32 0, i32 5, i32 5, i32 5, i32 4>		%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 1, i32 1, i32 1, i32 0, i32 5, i32 5, i32 5, i32 4>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer
ret <8 x i64> %res		ret <8 x i64> %res
}		}

define <8 x i64> @test_masked_8xi64_perm_mem_mask2(<8 x i64>* %vp, <8 x i64> %vec2, <8 x i64> %mask) {		define <8 x i64> @test_masked_8xi64_perm_mem_mask2(<8 x i64>* %vp, <8 x i64> %vec2, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_8xi64_perm_mem_mask2:		; GENERIC-LABEL: test_masked_8xi64_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,2,1,4,1,1,5,5] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,2,1,4,1,1,5,5] sched: [6:0.50]
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq (%rdi), %zmm2, %zmm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermq (%rdi), %zmm2, %zmm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xi64_perm_mem_mask2:		; SKX-LABEL: test_masked_8xi64_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,2,1,4,1,1,5,5] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,2,1,4,1,1,5,5] sched: [8:0.50]
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermq (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i64>, <8 x i64>* %vp		%vec = load <8 x i64>, <8 x i64>* %vp
%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 0, i32 2, i32 1, i32 4, i32 1, i32 1, i32 5, i32 5>		%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 0, i32 2, i32 1, i32 4, i32 1, i32 1, i32 5, i32 5>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec2		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec2
ret <8 x i64> %res		ret <8 x i64> %res
}		}

define <8 x i64> @test_masked_z_8xi64_perm_mem_mask2(<8 x i64>* %vp, <8 x i64> %mask) {		define <8 x i64> @test_masked_z_8xi64_perm_mem_mask2(<8 x i64>* %vp, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_8xi64_perm_mem_mask2:		; GENERIC-LABEL: test_masked_z_8xi64_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,2,1,4,1,1,5,5] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,2,1,4,1,1,5,5] sched: [6:0.50]
; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermq (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xi64_perm_mem_mask2:		; SKX-LABEL: test_masked_z_8xi64_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,2,1,4,1,1,5,5] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,2,1,4,1,1,5,5] sched: [8:0.50]
; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermq (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i64>, <8 x i64>* %vp		%vec = load <8 x i64>, <8 x i64>* %vp
%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 0, i32 2, i32 1, i32 4, i32 1, i32 1, i32 5, i32 5>		%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 0, i32 2, i32 1, i32 4, i32 1, i32 1, i32 5, i32 5>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer
ret <8 x i64> %res		ret <8 x i64> %res
}		}

define <8 x i64> @test_8xi64_perm_imm_mem_mask3(<8 x i64>* %vp) {		define <8 x i64> @test_8xi64_perm_imm_mem_mask3(<8 x i64>* %vp) {
; GENERIC-LABEL: test_8xi64_perm_imm_mem_mask3:		; GENERIC-LABEL: test_8xi64_perm_imm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpermpd {{.*#+}} zmm0 = mem[1,3,1,1,5,7,5,5] sched: [5:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} zmm0 = mem[1,3,1,1,5,7,5,5] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi64_perm_imm_mem_mask3:		; SKX-LABEL: test_8xi64_perm_imm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpermpd {{.*#+}} zmm0 = mem[1,3,1,1,5,7,5,5] sched: [10:1.00]		; SKX-NEXT: vpermpd {{.*#+}} zmm0 = mem[1,3,1,1,5,7,5,5] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i64>, <8 x i64>* %vp		%vec = load <8 x i64>, <8 x i64>* %vp
%res = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 1, i32 3, i32 1, i32 1, i32 5, i32 7, i32 5, i32 5>		%res = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 1, i32 3, i32 1, i32 1, i32 5, i32 7, i32 5, i32 5>
ret <8 x i64> %res		ret <8 x i64> %res
}		}
define <8 x i64> @test_masked_8xi64_perm_imm_mem_mask3(<8 x i64>* %vp, <8 x i64> %vec2, <8 x i64> %mask) {		define <8 x i64> @test_masked_8xi64_perm_imm_mem_mask3(<8 x i64>* %vp, <8 x i64> %vec2, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_8xi64_perm_imm_mem_mask3:		; GENERIC-LABEL: test_masked_8xi64_perm_imm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq {{.*#+}} zmm0 {%k1} = mem[1,3,1,1,5,7,5,5] sched: [5:1.00]		; GENERIC-NEXT: vpermq {{.*#+}} zmm0 {%k1} = mem[1,3,1,1,5,7,5,5] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xi64_perm_imm_mem_mask3:		; SKX-LABEL: test_masked_8xi64_perm_imm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq {{.*#+}} zmm0 {%k1} = mem[1,3,1,1,5,7,5,5] sched: [10:1.00]		; SKX-NEXT: vpermq {{.*#+}} zmm0 {%k1} = mem[1,3,1,1,5,7,5,5] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i64>, <8 x i64>* %vp		%vec = load <8 x i64>, <8 x i64>* %vp
%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 1, i32 3, i32 1, i32 1, i32 5, i32 7, i32 5, i32 5>		%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 1, i32 3, i32 1, i32 1, i32 5, i32 7, i32 5, i32 5>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec2		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec2
ret <8 x i64> %res		ret <8 x i64> %res
}		}

define <8 x i64> @test_masked_z_8xi64_perm_imm_mem_mask3(<8 x i64>* %vp, <8 x i64> %mask) {		define <8 x i64> @test_masked_z_8xi64_perm_imm_mem_mask3(<8 x i64>* %vp, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_8xi64_perm_imm_mem_mask3:		; GENERIC-LABEL: test_masked_z_8xi64_perm_imm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq {{.*#+}} zmm0 {%k1} {z} = mem[1,3,1,1,5,7,5,5] sched: [5:1.00]		; GENERIC-NEXT: vpermq {{.*#+}} zmm0 {%k1} {z} = mem[1,3,1,1,5,7,5,5] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xi64_perm_imm_mem_mask3:		; SKX-LABEL: test_masked_z_8xi64_perm_imm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq {{.*#+}} zmm0 {%k1} {z} = mem[1,3,1,1,5,7,5,5] sched: [10:1.00]		; SKX-NEXT: vpermq {{.*#+}} zmm0 {%k1} {z} = mem[1,3,1,1,5,7,5,5] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i64>, <8 x i64>* %vp		%vec = load <8 x i64>, <8 x i64>* %vp
%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 1, i32 3, i32 1, i32 1, i32 5, i32 7, i32 5, i32 5>		%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 1, i32 3, i32 1, i32 1, i32 5, i32 7, i32 5, i32 5>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer
ret <8 x i64> %res		ret <8 x i64> %res
}		}

define <8 x i64> @test_masked_8xi64_perm_mem_mask4(<8 x i64>* %vp, <8 x i64> %vec2, <8 x i64> %mask) {		define <8 x i64> @test_masked_8xi64_perm_mem_mask4(<8 x i64>* %vp, <8 x i64> %vec2, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_8xi64_perm_mem_mask4:		; GENERIC-LABEL: test_masked_8xi64_perm_mem_mask4:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [5,0,7,0,3,5,0,6] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [5,0,7,0,3,5,0,6] sched: [6:0.50]
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq (%rdi), %zmm2, %zmm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermq (%rdi), %zmm2, %zmm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xi64_perm_mem_mask4:		; SKX-LABEL: test_masked_8xi64_perm_mem_mask4:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [5,0,7,0,3,5,0,6] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [5,0,7,0,3,5,0,6] sched: [8:0.50]
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermq (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i64>, <8 x i64>* %vp		%vec = load <8 x i64>, <8 x i64>* %vp
%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 5, i32 0, i32 7, i32 0, i32 3, i32 5, i32 0, i32 6>		%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 5, i32 0, i32 7, i32 0, i32 3, i32 5, i32 0, i32 6>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec2		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec2
ret <8 x i64> %res		ret <8 x i64> %res
}		}

define <8 x i64> @test_masked_z_8xi64_perm_mem_mask4(<8 x i64>* %vp, <8 x i64> %mask) {		define <8 x i64> @test_masked_z_8xi64_perm_mem_mask4(<8 x i64>* %vp, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_8xi64_perm_mem_mask4:		; GENERIC-LABEL: test_masked_z_8xi64_perm_mem_mask4:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [5,0,7,0,3,5,0,6] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [5,0,7,0,3,5,0,6] sched: [6:0.50]
; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermq (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xi64_perm_mem_mask4:		; SKX-LABEL: test_masked_z_8xi64_perm_mem_mask4:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [5,0,7,0,3,5,0,6] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [5,0,7,0,3,5,0,6] sched: [8:0.50]
; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermq (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i64>, <8 x i64>* %vp		%vec = load <8 x i64>, <8 x i64>* %vp
%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 5, i32 0, i32 7, i32 0, i32 3, i32 5, i32 0, i32 6>		%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 5, i32 0, i32 7, i32 0, i32 3, i32 5, i32 0, i32 6>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer
ret <8 x i64> %res		ret <8 x i64> %res
}		}

define <8 x i64> @test_masked_8xi64_perm_imm_mem_mask5(<8 x i64>* %vp, <8 x i64> %vec2, <8 x i64> %mask) {		define <8 x i64> @test_masked_8xi64_perm_imm_mem_mask5(<8 x i64>* %vp, <8 x i64> %vec2, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_8xi64_perm_imm_mem_mask5:		; GENERIC-LABEL: test_masked_8xi64_perm_imm_mem_mask5:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq {{.*#+}} zmm0 {%k1} = mem[3,1,0,0,7,5,4,4] sched: [5:1.00]		; GENERIC-NEXT: vpermq {{.*#+}} zmm0 {%k1} = mem[3,1,0,0,7,5,4,4] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xi64_perm_imm_mem_mask5:		; SKX-LABEL: test_masked_8xi64_perm_imm_mem_mask5:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq {{.*#+}} zmm0 {%k1} = mem[3,1,0,0,7,5,4,4] sched: [10:1.00]		; SKX-NEXT: vpermq {{.*#+}} zmm0 {%k1} = mem[3,1,0,0,7,5,4,4] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i64>, <8 x i64>* %vp		%vec = load <8 x i64>, <8 x i64>* %vp
%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 3, i32 1, i32 0, i32 0, i32 7, i32 5, i32 4, i32 4>		%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 3, i32 1, i32 0, i32 0, i32 7, i32 5, i32 4, i32 4>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec2		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec2
ret <8 x i64> %res		ret <8 x i64> %res
}		}

define <8 x i64> @test_masked_z_8xi64_perm_imm_mem_mask5(<8 x i64>* %vp, <8 x i64> %mask) {		define <8 x i64> @test_masked_z_8xi64_perm_imm_mem_mask5(<8 x i64>* %vp, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_8xi64_perm_imm_mem_mask5:		; GENERIC-LABEL: test_masked_z_8xi64_perm_imm_mem_mask5:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq {{.*#+}} zmm0 {%k1} {z} = mem[3,1,0,0,7,5,4,4] sched: [5:1.00]		; GENERIC-NEXT: vpermq {{.*#+}} zmm0 {%k1} {z} = mem[3,1,0,0,7,5,4,4] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xi64_perm_imm_mem_mask5:		; SKX-LABEL: test_masked_z_8xi64_perm_imm_mem_mask5:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq {{.*#+}} zmm0 {%k1} {z} = mem[3,1,0,0,7,5,4,4] sched: [10:1.00]		; SKX-NEXT: vpermq {{.*#+}} zmm0 {%k1} {z} = mem[3,1,0,0,7,5,4,4] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i64>, <8 x i64>* %vp		%vec = load <8 x i64>, <8 x i64>* %vp
%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 3, i32 1, i32 0, i32 0, i32 7, i32 5, i32 4, i32 4>		%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 3, i32 1, i32 0, i32 0, i32 7, i32 5, i32 4, i32 4>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer
ret <8 x i64> %res		ret <8 x i64> %res
}		}

define <8 x i64> @test_8xi64_perm_mem_mask6(<8 x i64>* %vp) {		define <8 x i64> @test_8xi64_perm_mem_mask6(<8 x i64>* %vp) {
; GENERIC-LABEL: test_8xi64_perm_mem_mask6:		; GENERIC-LABEL: test_8xi64_perm_mem_mask6:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} zmm0 = [0,6,3,7,3,0,3,6] sched: [6:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} zmm0 = [0,6,3,7,3,0,3,6] sched: [6:0.50]
; GENERIC-NEXT: vpermpd (%rdi), %zmm0, %zmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermpd (%rdi), %zmm0, %zmm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi64_perm_mem_mask6:		; SKX-LABEL: test_8xi64_perm_mem_mask6:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} zmm0 = [0,6,3,7,3,0,3,6] sched: [8:0.50]		; SKX-NEXT: vmovaps {{.*#+}} zmm0 = [0,6,3,7,3,0,3,6] sched: [8:0.50]
; SKX-NEXT: vpermpd (%rdi), %zmm0, %zmm0 # sched: [10:1.00]		; SKX-NEXT: vpermpd (%rdi), %zmm0, %zmm0 # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i64>, <8 x i64>* %vp		%vec = load <8 x i64>, <8 x i64>* %vp
%res = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 0, i32 6, i32 3, i32 7, i32 3, i32 0, i32 3, i32 6>		%res = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 0, i32 6, i32 3, i32 7, i32 3, i32 0, i32 3, i32 6>
ret <8 x i64> %res		ret <8 x i64> %res
}		}
define <8 x i64> @test_masked_8xi64_perm_mem_mask6(<8 x i64>* %vp, <8 x i64> %vec2, <8 x i64> %mask) {		define <8 x i64> @test_masked_8xi64_perm_mem_mask6(<8 x i64>* %vp, <8 x i64> %vec2, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_8xi64_perm_mem_mask6:		; GENERIC-LABEL: test_masked_8xi64_perm_mem_mask6:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,6,3,7,3,0,3,6] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,6,3,7,3,0,3,6] sched: [6:0.50]
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq (%rdi), %zmm2, %zmm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermq (%rdi), %zmm2, %zmm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xi64_perm_mem_mask6:		; SKX-LABEL: test_masked_8xi64_perm_mem_mask6:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,6,3,7,3,0,3,6] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm2 = [0,6,3,7,3,0,3,6] sched: [8:0.50]
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermq (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i64>, <8 x i64>* %vp		%vec = load <8 x i64>, <8 x i64>* %vp
%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 0, i32 6, i32 3, i32 7, i32 3, i32 0, i32 3, i32 6>		%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 0, i32 6, i32 3, i32 7, i32 3, i32 0, i32 3, i32 6>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec2		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec2
ret <8 x i64> %res		ret <8 x i64> %res
}		}

define <8 x i64> @test_masked_z_8xi64_perm_mem_mask6(<8 x i64>* %vp, <8 x i64> %mask) {		define <8 x i64> @test_masked_z_8xi64_perm_mem_mask6(<8 x i64>* %vp, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_8xi64_perm_mem_mask6:		; GENERIC-LABEL: test_masked_z_8xi64_perm_mem_mask6:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,6,3,7,3,0,3,6] sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,6,3,7,3,0,3,6] sched: [6:0.50]
; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermq (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xi64_perm_mem_mask6:		; SKX-LABEL: test_masked_z_8xi64_perm_mem_mask6:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,6,3,7,3,0,3,6] sched: [8:0.50]		; SKX-NEXT: vmovdqa64 {{.*#+}} zmm1 = [0,6,3,7,3,0,3,6] sched: [8:0.50]
; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermq (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i64>, <8 x i64>* %vp		%vec = load <8 x i64>, <8 x i64>* %vp
%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 0, i32 6, i32 3, i32 7, i32 3, i32 0, i32 3, i32 6>		%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 0, i32 6, i32 3, i32 7, i32 3, i32 0, i32 3, i32 6>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer
ret <8 x i64> %res		ret <8 x i64> %res
}		}

define <8 x i64> @test_masked_8xi64_perm_imm_mem_mask7(<8 x i64>* %vp, <8 x i64> %vec2, <8 x i64> %mask) {		define <8 x i64> @test_masked_8xi64_perm_imm_mem_mask7(<8 x i64>* %vp, <8 x i64> %vec2, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_8xi64_perm_imm_mem_mask7:		; GENERIC-LABEL: test_masked_8xi64_perm_imm_mem_mask7:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq {{.*#+}} zmm0 {%k1} = mem[3,0,0,1,7,4,4,5] sched: [5:1.00]		; GENERIC-NEXT: vpermq {{.*#+}} zmm0 {%k1} = mem[3,0,0,1,7,4,4,5] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xi64_perm_imm_mem_mask7:		; SKX-LABEL: test_masked_8xi64_perm_imm_mem_mask7:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq {{.*#+}} zmm0 {%k1} = mem[3,0,0,1,7,4,4,5] sched: [10:1.00]		; SKX-NEXT: vpermq {{.*#+}} zmm0 {%k1} = mem[3,0,0,1,7,4,4,5] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i64>, <8 x i64>* %vp		%vec = load <8 x i64>, <8 x i64>* %vp
%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 3, i32 0, i32 0, i32 1, i32 7, i32 4, i32 4, i32 5>		%shuf = shufflevector <8 x i64> %vec, <8 x i64> undef, <8 x i32> <i32 3, i32 0, i32 0, i32 1, i32 7, i32 4, i32 4, i32 5>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec2		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec2
ret <8 x i64> %res		ret <8 x i64> %res
}		}

define <8 x i64> @test_masked_z_8xi64_perm_imm_mem_mask7(<8 x i64>* %vp, <8 x i64> %mask) {		define <8 x i64> @test_masked_z_8xi64_perm_imm_mem_mask7(<8 x i64>* %vp, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_8xi64_perm_imm_mem_mask7:		; GENERIC-LABEL: test_masked_z_8xi64_perm_imm_mem_mask7:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermq {{.*#+}} zmm0 {%k1} {z} = mem[3,0,0,1,7,4,4,5] sched: [5:1.00]		; GENERIC-NEXT: vpermq {{.*#+}} zmm0 {%k1} {z} = mem[3,0,0,1,7,4,4,5] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xi64_perm_imm_mem_mask7:		; SKX-LABEL: test_masked_z_8xi64_perm_imm_mem_mask7:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermq {{.*#+}} zmm0 {%k1} {z} = mem[3,0,0,1,7,4,4,5] sched: [10:1.00]		; SKX-NEXT: vpermq {{.*#+}} zmm0 {%k1} {z} = mem[3,0,0,1,7,4,4,5] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i64>, <8 x i64>* %vp		%vec = load <8 x i64>, <8 x i64>* %vp
▲ Show 20 Lines • Show All 196 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> zeroinitializer		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> zeroinitializer
ret <8 x float> %res		ret <8 x float> %res
}		}
define <8 x float> @test_8xfloat_perm_mem_mask0(<8 x float>* %vp) {		define <8 x float> @test_8xfloat_perm_mem_mask0(<8 x float>* %vp) {
; GENERIC-LABEL: test_8xfloat_perm_mem_mask0:		; GENERIC-LABEL: test_8xfloat_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} ymm0 = [5,2,1,6,4,2,4,0] sched: [7:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} ymm0 = [5,2,1,6,4,2,4,0] sched: [7:0.50]
; GENERIC-NEXT: vpermps (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_perm_mem_mask0:		; SKX-LABEL: test_8xfloat_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} ymm0 = [5,2,1,6,4,2,4,0] sched: [7:0.50]		; SKX-NEXT: vmovaps {{.*#+}} ymm0 = [5,2,1,6,4,2,4,0] sched: [7:0.50]
; SKX-NEXT: vpermps (%rdi), %ymm0, %ymm0 # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x float>, <8 x float>* %vp		%vec = load <8 x float>, <8 x float>* %vp
%res = shufflevector <8 x float> %vec, <8 x float> undef, <8 x i32> <i32 5, i32 2, i32 1, i32 6, i32 4, i32 2, i32 4, i32 0>		%res = shufflevector <8 x float> %vec, <8 x float> undef, <8 x i32> <i32 5, i32 2, i32 1, i32 6, i32 4, i32 2, i32 4, i32 0>
ret <8 x float> %res		ret <8 x float> %res
}		}
define <8 x float> @test_masked_8xfloat_perm_mem_mask0(<8 x float>* %vp, <8 x float> %vec2, <8 x i32> %mask) {		define <8 x float> @test_masked_8xfloat_perm_mem_mask0(<8 x float>* %vp, <8 x float> %vec2, <8 x i32> %mask) {
; GENERIC-LABEL: test_masked_8xfloat_perm_mem_mask0:		; GENERIC-LABEL: test_masked_8xfloat_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} ymm2 = [5,2,1,6,4,2,4,0] sched: [7:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} ymm2 = [5,2,1,6,4,2,4,0] sched: [7:0.50]
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermps (%rdi), %ymm2, %ymm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %ymm2, %ymm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xfloat_perm_mem_mask0:		; SKX-LABEL: test_masked_8xfloat_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} ymm2 = [5,2,1,6,4,2,4,0] sched: [7:0.50]		; SKX-NEXT: vmovaps {{.*#+}} ymm2 = [5,2,1,6,4,2,4,0] sched: [7:0.50]
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermps (%rdi), %ymm2, %ymm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %ymm2, %ymm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x float>, <8 x float>* %vp		%vec = load <8 x float>, <8 x float>* %vp
%shuf = shufflevector <8 x float> %vec, <8 x float> undef, <8 x i32> <i32 5, i32 2, i32 1, i32 6, i32 4, i32 2, i32 4, i32 0>		%shuf = shufflevector <8 x float> %vec, <8 x float> undef, <8 x i32> <i32 5, i32 2, i32 1, i32 6, i32 4, i32 2, i32 4, i32 0>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec2		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec2
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_masked_z_8xfloat_perm_mem_mask0(<8 x float>* %vp, <8 x i32> %mask) {		define <8 x float> @test_masked_z_8xfloat_perm_mem_mask0(<8 x float>* %vp, <8 x i32> %mask) {
; GENERIC-LABEL: test_masked_z_8xfloat_perm_mem_mask0:		; GENERIC-LABEL: test_masked_z_8xfloat_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} ymm1 = [5,2,1,6,4,2,4,0] sched: [7:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} ymm1 = [5,2,1,6,4,2,4,0] sched: [7:0.50]
; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermps (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xfloat_perm_mem_mask0:		; SKX-LABEL: test_masked_z_8xfloat_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} ymm1 = [5,2,1,6,4,2,4,0] sched: [7:0.50]		; SKX-NEXT: vmovaps {{.*#+}} ymm1 = [5,2,1,6,4,2,4,0] sched: [7:0.50]
; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermps (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x float>, <8 x float>* %vp		%vec = load <8 x float>, <8 x float>* %vp
%shuf = shufflevector <8 x float> %vec, <8 x float> undef, <8 x i32> <i32 5, i32 2, i32 1, i32 6, i32 4, i32 2, i32 4, i32 0>		%shuf = shufflevector <8 x float> %vec, <8 x float> undef, <8 x i32> <i32 5, i32 2, i32 1, i32 6, i32 4, i32 2, i32 4, i32 0>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> zeroinitializer		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> zeroinitializer
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_masked_8xfloat_perm_mem_mask1(<8 x float>* %vp, <8 x float> %vec2, <8 x i32> %mask) {		define <8 x float> @test_masked_8xfloat_perm_mem_mask1(<8 x float>* %vp, <8 x float> %vec2, <8 x i32> %mask) {
; GENERIC-LABEL: test_masked_8xfloat_perm_mem_mask1:		; GENERIC-LABEL: test_masked_8xfloat_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} ymm2 = [1,3,7,4,0,6,6,6] sched: [7:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} ymm2 = [1,3,7,4,0,6,6,6] sched: [7:0.50]
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermps (%rdi), %ymm2, %ymm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %ymm2, %ymm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xfloat_perm_mem_mask1:		; SKX-LABEL: test_masked_8xfloat_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} ymm2 = [1,3,7,4,0,6,6,6] sched: [7:0.50]		; SKX-NEXT: vmovaps {{.*#+}} ymm2 = [1,3,7,4,0,6,6,6] sched: [7:0.50]
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermps (%rdi), %ymm2, %ymm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %ymm2, %ymm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x float>, <8 x float>* %vp		%vec = load <8 x float>, <8 x float>* %vp
%shuf = shufflevector <8 x float> %vec, <8 x float> undef, <8 x i32> <i32 1, i32 3, i32 7, i32 4, i32 0, i32 6, i32 6, i32 6>		%shuf = shufflevector <8 x float> %vec, <8 x float> undef, <8 x i32> <i32 1, i32 3, i32 7, i32 4, i32 0, i32 6, i32 6, i32 6>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec2		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec2
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_masked_z_8xfloat_perm_mem_mask1(<8 x float>* %vp, <8 x i32> %mask) {		define <8 x float> @test_masked_z_8xfloat_perm_mem_mask1(<8 x float>* %vp, <8 x i32> %mask) {
; GENERIC-LABEL: test_masked_z_8xfloat_perm_mem_mask1:		; GENERIC-LABEL: test_masked_z_8xfloat_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} ymm1 = [1,3,7,4,0,6,6,6] sched: [7:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} ymm1 = [1,3,7,4,0,6,6,6] sched: [7:0.50]
; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermps (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xfloat_perm_mem_mask1:		; SKX-LABEL: test_masked_z_8xfloat_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} ymm1 = [1,3,7,4,0,6,6,6] sched: [7:0.50]		; SKX-NEXT: vmovaps {{.*#+}} ymm1 = [1,3,7,4,0,6,6,6] sched: [7:0.50]
; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermps (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x float>, <8 x float>* %vp		%vec = load <8 x float>, <8 x float>* %vp
%shuf = shufflevector <8 x float> %vec, <8 x float> undef, <8 x i32> <i32 1, i32 3, i32 7, i32 4, i32 0, i32 6, i32 6, i32 6>		%shuf = shufflevector <8 x float> %vec, <8 x float> undef, <8 x i32> <i32 1, i32 3, i32 7, i32 4, i32 0, i32 6, i32 6, i32 6>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> zeroinitializer		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> zeroinitializer
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_masked_8xfloat_perm_mem_mask2(<8 x float>* %vp, <8 x float> %vec2, <8 x i32> %mask) {		define <8 x float> @test_masked_8xfloat_perm_mem_mask2(<8 x float>* %vp, <8 x float> %vec2, <8 x i32> %mask) {
; GENERIC-LABEL: test_masked_8xfloat_perm_mem_mask2:		; GENERIC-LABEL: test_masked_8xfloat_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} ymm2 = [4,5,1,5,6,6,2,4] sched: [7:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} ymm2 = [4,5,1,5,6,6,2,4] sched: [7:0.50]
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermps (%rdi), %ymm2, %ymm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %ymm2, %ymm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xfloat_perm_mem_mask2:		; SKX-LABEL: test_masked_8xfloat_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} ymm2 = [4,5,1,5,6,6,2,4] sched: [7:0.50]		; SKX-NEXT: vmovaps {{.*#+}} ymm2 = [4,5,1,5,6,6,2,4] sched: [7:0.50]
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermps (%rdi), %ymm2, %ymm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %ymm2, %ymm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x float>, <8 x float>* %vp		%vec = load <8 x float>, <8 x float>* %vp
%shuf = shufflevector <8 x float> %vec, <8 x float> undef, <8 x i32> <i32 4, i32 5, i32 1, i32 5, i32 6, i32 6, i32 2, i32 4>		%shuf = shufflevector <8 x float> %vec, <8 x float> undef, <8 x i32> <i32 4, i32 5, i32 1, i32 5, i32 6, i32 6, i32 2, i32 4>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec2		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec2
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_masked_z_8xfloat_perm_mem_mask2(<8 x float>* %vp, <8 x i32> %mask) {		define <8 x float> @test_masked_z_8xfloat_perm_mem_mask2(<8 x float>* %vp, <8 x i32> %mask) {
; GENERIC-LABEL: test_masked_z_8xfloat_perm_mem_mask2:		; GENERIC-LABEL: test_masked_z_8xfloat_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} ymm1 = [4,5,1,5,6,6,2,4] sched: [7:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} ymm1 = [4,5,1,5,6,6,2,4] sched: [7:0.50]
; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermps (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xfloat_perm_mem_mask2:		; SKX-LABEL: test_masked_z_8xfloat_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} ymm1 = [4,5,1,5,6,6,2,4] sched: [7:0.50]		; SKX-NEXT: vmovaps {{.*#+}} ymm1 = [4,5,1,5,6,6,2,4] sched: [7:0.50]
; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermps (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x float>, <8 x float>* %vp		%vec = load <8 x float>, <8 x float>* %vp
%shuf = shufflevector <8 x float> %vec, <8 x float> undef, <8 x i32> <i32 4, i32 5, i32 1, i32 5, i32 6, i32 6, i32 2, i32 4>		%shuf = shufflevector <8 x float> %vec, <8 x float> undef, <8 x i32> <i32 4, i32 5, i32 1, i32 5, i32 6, i32 6, i32 2, i32 4>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> zeroinitializer		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> zeroinitializer
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_8xfloat_perm_mem_mask3(<8 x float>* %vp, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_perm_mem_mask3(<8 x float>* %vp, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_perm_mem_mask3:		; GENERIC-LABEL: test_8xfloat_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} ymm0 = [5,7,0,6,4,2,3,0] sched: [7:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} ymm0 = [5,7,0,6,4,2,3,0] sched: [7:0.50]
; GENERIC-NEXT: vpermps (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_perm_mem_mask3:		; SKX-LABEL: test_8xfloat_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} ymm0 = [5,7,0,6,4,2,3,0] sched: [7:0.50]		; SKX-NEXT: vmovaps {{.*#+}} ymm0 = [5,7,0,6,4,2,3,0] sched: [7:0.50]
; SKX-NEXT: vpermps (%rdi), %ymm0, %ymm0 # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %ymm0, %ymm0 # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x float>, <8 x float>* %vp		%vec = load <8 x float>, <8 x float>* %vp
%res = shufflevector <8 x float> %vec, <8 x float> undef, <8 x i32> <i32 5, i32 7, i32 0, i32 6, i32 4, i32 2, i32 3, i32 0>		%res = shufflevector <8 x float> %vec, <8 x float> undef, <8 x i32> <i32 5, i32 7, i32 0, i32 6, i32 4, i32 2, i32 3, i32 0>
ret <8 x float> %res		ret <8 x float> %res
}		}
define <8 x float> @test_masked_8xfloat_perm_mem_mask3(<8 x float>* %vp, <8 x float> %vec2, <8 x i32> %mask) {		define <8 x float> @test_masked_8xfloat_perm_mem_mask3(<8 x float>* %vp, <8 x float> %vec2, <8 x i32> %mask) {
; GENERIC-LABEL: test_masked_8xfloat_perm_mem_mask3:		; GENERIC-LABEL: test_masked_8xfloat_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} ymm2 = [5,7,0,6,4,2,3,0] sched: [7:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} ymm2 = [5,7,0,6,4,2,3,0] sched: [7:0.50]
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermps (%rdi), %ymm2, %ymm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %ymm2, %ymm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xfloat_perm_mem_mask3:		; SKX-LABEL: test_masked_8xfloat_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} ymm2 = [5,7,0,6,4,2,3,0] sched: [7:0.50]		; SKX-NEXT: vmovaps {{.*#+}} ymm2 = [5,7,0,6,4,2,3,0] sched: [7:0.50]
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermps (%rdi), %ymm2, %ymm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %ymm2, %ymm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x float>, <8 x float>* %vp		%vec = load <8 x float>, <8 x float>* %vp
%shuf = shufflevector <8 x float> %vec, <8 x float> undef, <8 x i32> <i32 5, i32 7, i32 0, i32 6, i32 4, i32 2, i32 3, i32 0>		%shuf = shufflevector <8 x float> %vec, <8 x float> undef, <8 x i32> <i32 5, i32 7, i32 0, i32 6, i32 4, i32 2, i32 3, i32 0>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec2		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec2
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_masked_z_8xfloat_perm_mem_mask3(<8 x float>* %vp, <8 x i32> %mask) {		define <8 x float> @test_masked_z_8xfloat_perm_mem_mask3(<8 x float>* %vp, <8 x i32> %mask) {
; GENERIC-LABEL: test_masked_z_8xfloat_perm_mem_mask3:		; GENERIC-LABEL: test_masked_z_8xfloat_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} ymm1 = [5,7,0,6,4,2,3,0] sched: [7:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} ymm1 = [5,7,0,6,4,2,3,0] sched: [7:0.50]
; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermps (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xfloat_perm_mem_mask3:		; SKX-LABEL: test_masked_z_8xfloat_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} ymm1 = [5,7,0,6,4,2,3,0] sched: [7:0.50]		; SKX-NEXT: vmovaps {{.*#+}} ymm1 = [5,7,0,6,4,2,3,0] sched: [7:0.50]
; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermps (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %ymm1, %ymm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
▲ Show 20 Lines • Show All 197 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer
ret <16 x float> %res		ret <16 x float> %res
}		}
define <16 x float> @test_16xfloat_perm_mem_mask0(<16 x float>* %vp) {		define <16 x float> @test_16xfloat_perm_mem_mask0(<16 x float>* %vp) {
; GENERIC-LABEL: test_16xfloat_perm_mem_mask0:		; GENERIC-LABEL: test_16xfloat_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} zmm0 = [10,2,1,14,9,9,7,2,9,4,12,11,0,14,0,1] sched: [6:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} zmm0 = [10,2,1,14,9,9,7,2,9,4,12,11,0,14,0,1] sched: [6:0.50]
; GENERIC-NEXT: vpermps (%rdi), %zmm0, %zmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %zmm0, %zmm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_perm_mem_mask0:		; SKX-LABEL: test_16xfloat_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} zmm0 = [10,2,1,14,9,9,7,2,9,4,12,11,0,14,0,1] sched: [8:0.50]		; SKX-NEXT: vmovaps {{.*#+}} zmm0 = [10,2,1,14,9,9,7,2,9,4,12,11,0,14,0,1] sched: [8:0.50]
; SKX-NEXT: vpermps (%rdi), %zmm0, %zmm0 # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %zmm0, %zmm0 # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x float>, <16 x float>* %vp		%vec = load <16 x float>, <16 x float>* %vp
%res = shufflevector <16 x float> %vec, <16 x float> undef, <16 x i32> <i32 10, i32 2, i32 1, i32 14, i32 9, i32 9, i32 7, i32 2, i32 9, i32 4, i32 12, i32 11, i32 0, i32 14, i32 0, i32 1>		%res = shufflevector <16 x float> %vec, <16 x float> undef, <16 x i32> <i32 10, i32 2, i32 1, i32 14, i32 9, i32 9, i32 7, i32 2, i32 9, i32 4, i32 12, i32 11, i32 0, i32 14, i32 0, i32 1>
ret <16 x float> %res		ret <16 x float> %res
}		}
define <16 x float> @test_masked_16xfloat_perm_mem_mask0(<16 x float>* %vp, <16 x float> %vec2, <16 x i32> %mask) {		define <16 x float> @test_masked_16xfloat_perm_mem_mask0(<16 x float>* %vp, <16 x float> %vec2, <16 x i32> %mask) {
; GENERIC-LABEL: test_masked_16xfloat_perm_mem_mask0:		; GENERIC-LABEL: test_masked_16xfloat_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} zmm2 = [10,2,1,14,9,9,7,2,9,4,12,11,0,14,0,1] sched: [6:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} zmm2 = [10,2,1,14,9,9,7,2,9,4,12,11,0,14,0,1] sched: [6:0.50]
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermps (%rdi), %zmm2, %zmm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %zmm2, %zmm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xfloat_perm_mem_mask0:		; SKX-LABEL: test_masked_16xfloat_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} zmm2 = [10,2,1,14,9,9,7,2,9,4,12,11,0,14,0,1] sched: [8:0.50]		; SKX-NEXT: vmovaps {{.*#+}} zmm2 = [10,2,1,14,9,9,7,2,9,4,12,11,0,14,0,1] sched: [8:0.50]
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermps (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x float>, <16 x float>* %vp		%vec = load <16 x float>, <16 x float>* %vp
%shuf = shufflevector <16 x float> %vec, <16 x float> undef, <16 x i32> <i32 10, i32 2, i32 1, i32 14, i32 9, i32 9, i32 7, i32 2, i32 9, i32 4, i32 12, i32 11, i32 0, i32 14, i32 0, i32 1>		%shuf = shufflevector <16 x float> %vec, <16 x float> undef, <16 x i32> <i32 10, i32 2, i32 1, i32 14, i32 9, i32 9, i32 7, i32 2, i32 9, i32 4, i32 12, i32 11, i32 0, i32 14, i32 0, i32 1>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec2		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec2
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_masked_z_16xfloat_perm_mem_mask0(<16 x float>* %vp, <16 x i32> %mask) {		define <16 x float> @test_masked_z_16xfloat_perm_mem_mask0(<16 x float>* %vp, <16 x i32> %mask) {
; GENERIC-LABEL: test_masked_z_16xfloat_perm_mem_mask0:		; GENERIC-LABEL: test_masked_z_16xfloat_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} zmm1 = [10,2,1,14,9,9,7,2,9,4,12,11,0,14,0,1] sched: [6:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} zmm1 = [10,2,1,14,9,9,7,2,9,4,12,11,0,14,0,1] sched: [6:0.50]
; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermps (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xfloat_perm_mem_mask0:		; SKX-LABEL: test_masked_z_16xfloat_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} zmm1 = [10,2,1,14,9,9,7,2,9,4,12,11,0,14,0,1] sched: [8:0.50]		; SKX-NEXT: vmovaps {{.*#+}} zmm1 = [10,2,1,14,9,9,7,2,9,4,12,11,0,14,0,1] sched: [8:0.50]
; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermps (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x float>, <16 x float>* %vp		%vec = load <16 x float>, <16 x float>* %vp
%shuf = shufflevector <16 x float> %vec, <16 x float> undef, <16 x i32> <i32 10, i32 2, i32 1, i32 14, i32 9, i32 9, i32 7, i32 2, i32 9, i32 4, i32 12, i32 11, i32 0, i32 14, i32 0, i32 1>		%shuf = shufflevector <16 x float> %vec, <16 x float> undef, <16 x i32> <i32 10, i32 2, i32 1, i32 14, i32 9, i32 9, i32 7, i32 2, i32 9, i32 4, i32 12, i32 11, i32 0, i32 14, i32 0, i32 1>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_masked_16xfloat_perm_mem_mask1(<16 x float>* %vp, <16 x float> %vec2, <16 x i32> %mask) {		define <16 x float> @test_masked_16xfloat_perm_mem_mask1(<16 x float>* %vp, <16 x float> %vec2, <16 x i32> %mask) {
; GENERIC-LABEL: test_masked_16xfloat_perm_mem_mask1:		; GENERIC-LABEL: test_masked_16xfloat_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} zmm2 = [4,2,3,5,11,6,4,7,6,4,14,8,15,12,9,4] sched: [6:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} zmm2 = [4,2,3,5,11,6,4,7,6,4,14,8,15,12,9,4] sched: [6:0.50]
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermps (%rdi), %zmm2, %zmm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %zmm2, %zmm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xfloat_perm_mem_mask1:		; SKX-LABEL: test_masked_16xfloat_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} zmm2 = [4,2,3,5,11,6,4,7,6,4,14,8,15,12,9,4] sched: [8:0.50]		; SKX-NEXT: vmovaps {{.*#+}} zmm2 = [4,2,3,5,11,6,4,7,6,4,14,8,15,12,9,4] sched: [8:0.50]
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermps (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x float>, <16 x float>* %vp		%vec = load <16 x float>, <16 x float>* %vp
%shuf = shufflevector <16 x float> %vec, <16 x float> undef, <16 x i32> <i32 4, i32 2, i32 3, i32 5, i32 11, i32 6, i32 4, i32 7, i32 6, i32 4, i32 14, i32 8, i32 15, i32 12, i32 9, i32 4>		%shuf = shufflevector <16 x float> %vec, <16 x float> undef, <16 x i32> <i32 4, i32 2, i32 3, i32 5, i32 11, i32 6, i32 4, i32 7, i32 6, i32 4, i32 14, i32 8, i32 15, i32 12, i32 9, i32 4>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec2		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec2
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_masked_z_16xfloat_perm_mem_mask1(<16 x float>* %vp, <16 x i32> %mask) {		define <16 x float> @test_masked_z_16xfloat_perm_mem_mask1(<16 x float>* %vp, <16 x i32> %mask) {
; GENERIC-LABEL: test_masked_z_16xfloat_perm_mem_mask1:		; GENERIC-LABEL: test_masked_z_16xfloat_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} zmm1 = [4,2,3,5,11,6,4,7,6,4,14,8,15,12,9,4] sched: [6:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} zmm1 = [4,2,3,5,11,6,4,7,6,4,14,8,15,12,9,4] sched: [6:0.50]
; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermps (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xfloat_perm_mem_mask1:		; SKX-LABEL: test_masked_z_16xfloat_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} zmm1 = [4,2,3,5,11,6,4,7,6,4,14,8,15,12,9,4] sched: [8:0.50]		; SKX-NEXT: vmovaps {{.*#+}} zmm1 = [4,2,3,5,11,6,4,7,6,4,14,8,15,12,9,4] sched: [8:0.50]
; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermps (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x float>, <16 x float>* %vp		%vec = load <16 x float>, <16 x float>* %vp
%shuf = shufflevector <16 x float> %vec, <16 x float> undef, <16 x i32> <i32 4, i32 2, i32 3, i32 5, i32 11, i32 6, i32 4, i32 7, i32 6, i32 4, i32 14, i32 8, i32 15, i32 12, i32 9, i32 4>		%shuf = shufflevector <16 x float> %vec, <16 x float> undef, <16 x i32> <i32 4, i32 2, i32 3, i32 5, i32 11, i32 6, i32 4, i32 7, i32 6, i32 4, i32 14, i32 8, i32 15, i32 12, i32 9, i32 4>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_masked_16xfloat_perm_mem_mask2(<16 x float>* %vp, <16 x float> %vec2, <16 x i32> %mask) {		define <16 x float> @test_masked_16xfloat_perm_mem_mask2(<16 x float>* %vp, <16 x float> %vec2, <16 x i32> %mask) {
; GENERIC-LABEL: test_masked_16xfloat_perm_mem_mask2:		; GENERIC-LABEL: test_masked_16xfloat_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} zmm2 = [10,7,11,6,7,0,11,0,10,9,12,4,10,3,8,5] sched: [6:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} zmm2 = [10,7,11,6,7,0,11,0,10,9,12,4,10,3,8,5] sched: [6:0.50]
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermps (%rdi), %zmm2, %zmm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %zmm2, %zmm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xfloat_perm_mem_mask2:		; SKX-LABEL: test_masked_16xfloat_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} zmm2 = [10,7,11,6,7,0,11,0,10,9,12,4,10,3,8,5] sched: [8:0.50]		; SKX-NEXT: vmovaps {{.*#+}} zmm2 = [10,7,11,6,7,0,11,0,10,9,12,4,10,3,8,5] sched: [8:0.50]
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermps (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x float>, <16 x float>* %vp		%vec = load <16 x float>, <16 x float>* %vp
%shuf = shufflevector <16 x float> %vec, <16 x float> undef, <16 x i32> <i32 10, i32 7, i32 11, i32 6, i32 7, i32 0, i32 11, i32 0, i32 10, i32 9, i32 12, i32 4, i32 10, i32 3, i32 8, i32 5>		%shuf = shufflevector <16 x float> %vec, <16 x float> undef, <16 x i32> <i32 10, i32 7, i32 11, i32 6, i32 7, i32 0, i32 11, i32 0, i32 10, i32 9, i32 12, i32 4, i32 10, i32 3, i32 8, i32 5>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec2		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec2
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_masked_z_16xfloat_perm_mem_mask2(<16 x float>* %vp, <16 x i32> %mask) {		define <16 x float> @test_masked_z_16xfloat_perm_mem_mask2(<16 x float>* %vp, <16 x i32> %mask) {
; GENERIC-LABEL: test_masked_z_16xfloat_perm_mem_mask2:		; GENERIC-LABEL: test_masked_z_16xfloat_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} zmm1 = [10,7,11,6,7,0,11,0,10,9,12,4,10,3,8,5] sched: [6:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} zmm1 = [10,7,11,6,7,0,11,0,10,9,12,4,10,3,8,5] sched: [6:0.50]
; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermps (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xfloat_perm_mem_mask2:		; SKX-LABEL: test_masked_z_16xfloat_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} zmm1 = [10,7,11,6,7,0,11,0,10,9,12,4,10,3,8,5] sched: [8:0.50]		; SKX-NEXT: vmovaps {{.*#+}} zmm1 = [10,7,11,6,7,0,11,0,10,9,12,4,10,3,8,5] sched: [8:0.50]
; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermps (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x float>, <16 x float>* %vp		%vec = load <16 x float>, <16 x float>* %vp
%shuf = shufflevector <16 x float> %vec, <16 x float> undef, <16 x i32> <i32 10, i32 7, i32 11, i32 6, i32 7, i32 0, i32 11, i32 0, i32 10, i32 9, i32 12, i32 4, i32 10, i32 3, i32 8, i32 5>		%shuf = shufflevector <16 x float> %vec, <16 x float> undef, <16 x i32> <i32 10, i32 7, i32 11, i32 6, i32 7, i32 0, i32 11, i32 0, i32 10, i32 9, i32 12, i32 4, i32 10, i32 3, i32 8, i32 5>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_16xfloat_perm_mem_mask3(<16 x float>* %vp) {		define <16 x float> @test_16xfloat_perm_mem_mask3(<16 x float>* %vp) {
; GENERIC-LABEL: test_16xfloat_perm_mem_mask3:		; GENERIC-LABEL: test_16xfloat_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} zmm0 = [15,15,3,9,5,15,14,9,11,10,5,14,14,5,11,0] sched: [6:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} zmm0 = [15,15,3,9,5,15,14,9,11,10,5,14,14,5,11,0] sched: [6:0.50]
; GENERIC-NEXT: vpermps (%rdi), %zmm0, %zmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %zmm0, %zmm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_perm_mem_mask3:		; SKX-LABEL: test_16xfloat_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} zmm0 = [15,15,3,9,5,15,14,9,11,10,5,14,14,5,11,0] sched: [8:0.50]		; SKX-NEXT: vmovaps {{.*#+}} zmm0 = [15,15,3,9,5,15,14,9,11,10,5,14,14,5,11,0] sched: [8:0.50]
; SKX-NEXT: vpermps (%rdi), %zmm0, %zmm0 # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %zmm0, %zmm0 # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x float>, <16 x float>* %vp		%vec = load <16 x float>, <16 x float>* %vp
%res = shufflevector <16 x float> %vec, <16 x float> undef, <16 x i32> <i32 15, i32 15, i32 3, i32 9, i32 5, i32 15, i32 14, i32 9, i32 11, i32 10, i32 5, i32 14, i32 14, i32 5, i32 11, i32 0>		%res = shufflevector <16 x float> %vec, <16 x float> undef, <16 x i32> <i32 15, i32 15, i32 3, i32 9, i32 5, i32 15, i32 14, i32 9, i32 11, i32 10, i32 5, i32 14, i32 14, i32 5, i32 11, i32 0>
ret <16 x float> %res		ret <16 x float> %res
}		}
define <16 x float> @test_masked_16xfloat_perm_mem_mask3(<16 x float>* %vp, <16 x float> %vec2, <16 x i32> %mask) {		define <16 x float> @test_masked_16xfloat_perm_mem_mask3(<16 x float>* %vp, <16 x float> %vec2, <16 x i32> %mask) {
; GENERIC-LABEL: test_masked_16xfloat_perm_mem_mask3:		; GENERIC-LABEL: test_masked_16xfloat_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} zmm2 = [15,15,3,9,5,15,14,9,11,10,5,14,14,5,11,0] sched: [6:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} zmm2 = [15,15,3,9,5,15,14,9,11,10,5,14,14,5,11,0] sched: [6:0.50]
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermps (%rdi), %zmm2, %zmm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %zmm2, %zmm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xfloat_perm_mem_mask3:		; SKX-LABEL: test_masked_16xfloat_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} zmm2 = [15,15,3,9,5,15,14,9,11,10,5,14,14,5,11,0] sched: [8:0.50]		; SKX-NEXT: vmovaps {{.*#+}} zmm2 = [15,15,3,9,5,15,14,9,11,10,5,14,14,5,11,0] sched: [8:0.50]
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermps (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x float>, <16 x float>* %vp		%vec = load <16 x float>, <16 x float>* %vp
%shuf = shufflevector <16 x float> %vec, <16 x float> undef, <16 x i32> <i32 15, i32 15, i32 3, i32 9, i32 5, i32 15, i32 14, i32 9, i32 11, i32 10, i32 5, i32 14, i32 14, i32 5, i32 11, i32 0>		%shuf = shufflevector <16 x float> %vec, <16 x float> undef, <16 x i32> <i32 15, i32 15, i32 3, i32 9, i32 5, i32 15, i32 14, i32 9, i32 11, i32 10, i32 5, i32 14, i32 14, i32 5, i32 11, i32 0>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec2		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec2
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_masked_z_16xfloat_perm_mem_mask3(<16 x float>* %vp, <16 x i32> %mask) {		define <16 x float> @test_masked_z_16xfloat_perm_mem_mask3(<16 x float>* %vp, <16 x i32> %mask) {
; GENERIC-LABEL: test_masked_z_16xfloat_perm_mem_mask3:		; GENERIC-LABEL: test_masked_z_16xfloat_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} zmm1 = [15,15,3,9,5,15,14,9,11,10,5,14,14,5,11,0] sched: [6:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} zmm1 = [15,15,3,9,5,15,14,9,11,10,5,14,14,5,11,0] sched: [6:0.50]
; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermps (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermps (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xfloat_perm_mem_mask3:		; SKX-LABEL: test_masked_z_16xfloat_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} zmm1 = [15,15,3,9,5,15,14,9,11,10,5,14,14,5,11,0] sched: [8:0.50]		; SKX-NEXT: vmovaps {{.*#+}} zmm1 = [15,15,3,9,5,15,14,9,11,10,5,14,14,5,11,0] sched: [8:0.50]
; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermps (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermps (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
▲ Show 20 Lines • Show All 176 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <4 x double> %vec, <4 x double> undef, <4 x i32> <i32 3, i32 3, i32 3, i32 2>		%shuf = shufflevector <4 x double> %vec, <4 x double> undef, <4 x i32> <i32 3, i32 3, i32 3, i32 2>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> zeroinitializer		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> zeroinitializer
ret <4 x double> %res		ret <4 x double> %res
}		}
define <4 x double> @test_4xdouble_perm_mem_mask0(<4 x double>* %vp) {		define <4 x double> @test_4xdouble_perm_mem_mask0(<4 x double>* %vp) {
; GENERIC-LABEL: test_4xdouble_perm_mem_mask0:		; GENERIC-LABEL: test_4xdouble_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 = mem[0,0,2,0] sched: [5:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 = mem[0,0,2,0] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_perm_mem_mask0:		; SKX-LABEL: test_4xdouble_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpermpd {{.*#+}} ymm0 = mem[0,0,2,0] sched: [10:1.00]		; SKX-NEXT: vpermpd {{.*#+}} ymm0 = mem[0,0,2,0] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x double>, <4 x double>* %vp		%vec = load <4 x double>, <4 x double>* %vp
%res = shufflevector <4 x double> %vec, <4 x double> undef, <4 x i32> <i32 0, i32 0, i32 2, i32 0>		%res = shufflevector <4 x double> %vec, <4 x double> undef, <4 x i32> <i32 0, i32 0, i32 2, i32 0>
ret <4 x double> %res		ret <4 x double> %res
}		}
define <4 x double> @test_masked_4xdouble_perm_mem_mask0(<4 x double>* %vp, <4 x double> %vec2, <4 x i64> %mask) {		define <4 x double> @test_masked_4xdouble_perm_mem_mask0(<4 x double>* %vp, <4 x double> %vec2, <4 x i64> %mask) {
; GENERIC-LABEL: test_masked_4xdouble_perm_mem_mask0:		; GENERIC-LABEL: test_masked_4xdouble_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 {%k1} = mem[0,0,2,0] sched: [5:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 {%k1} = mem[0,0,2,0] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_4xdouble_perm_mem_mask0:		; SKX-LABEL: test_masked_4xdouble_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd {{.*#+}} ymm0 {%k1} = mem[0,0,2,0] sched: [10:1.00]		; SKX-NEXT: vpermpd {{.*#+}} ymm0 {%k1} = mem[0,0,2,0] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x double>, <4 x double>* %vp		%vec = load <4 x double>, <4 x double>* %vp
%shuf = shufflevector <4 x double> %vec, <4 x double> undef, <4 x i32> <i32 0, i32 0, i32 2, i32 0>		%shuf = shufflevector <4 x double> %vec, <4 x double> undef, <4 x i32> <i32 0, i32 0, i32 2, i32 0>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec2		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec2
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_masked_z_4xdouble_perm_mem_mask0(<4 x double>* %vp, <4 x i64> %mask) {		define <4 x double> @test_masked_z_4xdouble_perm_mem_mask0(<4 x double>* %vp, <4 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_4xdouble_perm_mem_mask0:		; GENERIC-LABEL: test_masked_z_4xdouble_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 {%k1} {z} = mem[0,0,2,0] sched: [5:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 {%k1} {z} = mem[0,0,2,0] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_4xdouble_perm_mem_mask0:		; SKX-LABEL: test_masked_z_4xdouble_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd {{.*#+}} ymm0 {%k1} {z} = mem[0,0,2,0] sched: [10:1.00]		; SKX-NEXT: vpermpd {{.*#+}} ymm0 {%k1} {z} = mem[0,0,2,0] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x double>, <4 x double>* %vp		%vec = load <4 x double>, <4 x double>* %vp
%shuf = shufflevector <4 x double> %vec, <4 x double> undef, <4 x i32> <i32 0, i32 0, i32 2, i32 0>		%shuf = shufflevector <4 x double> %vec, <4 x double> undef, <4 x i32> <i32 0, i32 0, i32 2, i32 0>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> zeroinitializer		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> zeroinitializer
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_masked_4xdouble_perm_mem_mask1(<4 x double>* %vp, <4 x double> %vec2, <4 x i64> %mask) {		define <4 x double> @test_masked_4xdouble_perm_mem_mask1(<4 x double>* %vp, <4 x double> %vec2, <4 x i64> %mask) {
; GENERIC-LABEL: test_masked_4xdouble_perm_mem_mask1:		; GENERIC-LABEL: test_masked_4xdouble_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 {%k1} = mem[0,2,3,2] sched: [5:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 {%k1} = mem[0,2,3,2] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_4xdouble_perm_mem_mask1:		; SKX-LABEL: test_masked_4xdouble_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd {{.*#+}} ymm0 {%k1} = mem[0,2,3,2] sched: [10:1.00]		; SKX-NEXT: vpermpd {{.*#+}} ymm0 {%k1} = mem[0,2,3,2] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x double>, <4 x double>* %vp		%vec = load <4 x double>, <4 x double>* %vp
%shuf = shufflevector <4 x double> %vec, <4 x double> undef, <4 x i32> <i32 0, i32 2, i32 3, i32 2>		%shuf = shufflevector <4 x double> %vec, <4 x double> undef, <4 x i32> <i32 0, i32 2, i32 3, i32 2>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec2		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec2
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_masked_z_4xdouble_perm_mem_mask1(<4 x double>* %vp, <4 x i64> %mask) {		define <4 x double> @test_masked_z_4xdouble_perm_mem_mask1(<4 x double>* %vp, <4 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_4xdouble_perm_mem_mask1:		; GENERIC-LABEL: test_masked_z_4xdouble_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 {%k1} {z} = mem[0,2,3,2] sched: [5:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 {%k1} {z} = mem[0,2,3,2] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_4xdouble_perm_mem_mask1:		; SKX-LABEL: test_masked_z_4xdouble_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd {{.*#+}} ymm0 {%k1} {z} = mem[0,2,3,2] sched: [10:1.00]		; SKX-NEXT: vpermpd {{.*#+}} ymm0 {%k1} {z} = mem[0,2,3,2] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x double>, <4 x double>* %vp		%vec = load <4 x double>, <4 x double>* %vp
%shuf = shufflevector <4 x double> %vec, <4 x double> undef, <4 x i32> <i32 0, i32 2, i32 3, i32 2>		%shuf = shufflevector <4 x double> %vec, <4 x double> undef, <4 x i32> <i32 0, i32 2, i32 3, i32 2>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> zeroinitializer		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> zeroinitializer
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_masked_4xdouble_perm_mem_mask2(<4 x double>* %vp, <4 x double> %vec2, <4 x i64> %mask) {		define <4 x double> @test_masked_4xdouble_perm_mem_mask2(<4 x double>* %vp, <4 x double> %vec2, <4 x i64> %mask) {
; GENERIC-LABEL: test_masked_4xdouble_perm_mem_mask2:		; GENERIC-LABEL: test_masked_4xdouble_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 {%k1} = mem[3,1,1,1] sched: [5:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 {%k1} = mem[3,1,1,1] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_4xdouble_perm_mem_mask2:		; SKX-LABEL: test_masked_4xdouble_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd {{.*#+}} ymm0 {%k1} = mem[3,1,1,1] sched: [10:1.00]		; SKX-NEXT: vpermpd {{.*#+}} ymm0 {%k1} = mem[3,1,1,1] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x double>, <4 x double>* %vp		%vec = load <4 x double>, <4 x double>* %vp
%shuf = shufflevector <4 x double> %vec, <4 x double> undef, <4 x i32> <i32 3, i32 1, i32 1, i32 1>		%shuf = shufflevector <4 x double> %vec, <4 x double> undef, <4 x i32> <i32 3, i32 1, i32 1, i32 1>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec2		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec2
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_masked_z_4xdouble_perm_mem_mask2(<4 x double>* %vp, <4 x i64> %mask) {		define <4 x double> @test_masked_z_4xdouble_perm_mem_mask2(<4 x double>* %vp, <4 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_4xdouble_perm_mem_mask2:		; GENERIC-LABEL: test_masked_z_4xdouble_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 {%k1} {z} = mem[3,1,1,1] sched: [5:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 {%k1} {z} = mem[3,1,1,1] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_4xdouble_perm_mem_mask2:		; SKX-LABEL: test_masked_z_4xdouble_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd {{.*#+}} ymm0 {%k1} {z} = mem[3,1,1,1] sched: [10:1.00]		; SKX-NEXT: vpermpd {{.*#+}} ymm0 {%k1} {z} = mem[3,1,1,1] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x double>, <4 x double>* %vp		%vec = load <4 x double>, <4 x double>* %vp
%shuf = shufflevector <4 x double> %vec, <4 x double> undef, <4 x i32> <i32 3, i32 1, i32 1, i32 1>		%shuf = shufflevector <4 x double> %vec, <4 x double> undef, <4 x i32> <i32 3, i32 1, i32 1, i32 1>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> zeroinitializer		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> zeroinitializer
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_4xdouble_perm_mem_mask3(<4 x double>* %vp) {		define <4 x double> @test_4xdouble_perm_mem_mask3(<4 x double>* %vp) {
; GENERIC-LABEL: test_4xdouble_perm_mem_mask3:		; GENERIC-LABEL: test_4xdouble_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 = mem[3,2,3,2] sched: [5:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 = mem[3,2,3,2] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_perm_mem_mask3:		; SKX-LABEL: test_4xdouble_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpermpd {{.*#+}} ymm0 = mem[3,2,3,2] sched: [10:1.00]		; SKX-NEXT: vpermpd {{.*#+}} ymm0 = mem[3,2,3,2] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x double>, <4 x double>* %vp		%vec = load <4 x double>, <4 x double>* %vp
%res = shufflevector <4 x double> %vec, <4 x double> undef, <4 x i32> <i32 3, i32 2, i32 3, i32 2>		%res = shufflevector <4 x double> %vec, <4 x double> undef, <4 x i32> <i32 3, i32 2, i32 3, i32 2>
ret <4 x double> %res		ret <4 x double> %res
}		}
define <4 x double> @test_masked_4xdouble_perm_mem_mask3(<4 x double>* %vp, <4 x double> %vec2, <4 x i64> %mask) {		define <4 x double> @test_masked_4xdouble_perm_mem_mask3(<4 x double>* %vp, <4 x double> %vec2, <4 x i64> %mask) {
; GENERIC-LABEL: test_masked_4xdouble_perm_mem_mask3:		; GENERIC-LABEL: test_masked_4xdouble_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 {%k1} = mem[3,2,3,2] sched: [5:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 {%k1} = mem[3,2,3,2] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_4xdouble_perm_mem_mask3:		; SKX-LABEL: test_masked_4xdouble_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd {{.*#+}} ymm0 {%k1} = mem[3,2,3,2] sched: [10:1.00]		; SKX-NEXT: vpermpd {{.*#+}} ymm0 {%k1} = mem[3,2,3,2] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x double>, <4 x double>* %vp		%vec = load <4 x double>, <4 x double>* %vp
%shuf = shufflevector <4 x double> %vec, <4 x double> undef, <4 x i32> <i32 3, i32 2, i32 3, i32 2>		%shuf = shufflevector <4 x double> %vec, <4 x double> undef, <4 x i32> <i32 3, i32 2, i32 3, i32 2>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec2		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec2
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_masked_z_4xdouble_perm_mem_mask3(<4 x double>* %vp, <4 x i64> %mask) {		define <4 x double> @test_masked_z_4xdouble_perm_mem_mask3(<4 x double>* %vp, <4 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_4xdouble_perm_mem_mask3:		; GENERIC-LABEL: test_masked_z_4xdouble_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 {%k1} {z} = mem[3,2,3,2] sched: [5:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} ymm0 {%k1} {z} = mem[3,2,3,2] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_4xdouble_perm_mem_mask3:		; SKX-LABEL: test_masked_z_4xdouble_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd {{.*#+}} ymm0 {%k1} {z} = mem[3,2,3,2] sched: [10:1.00]		; SKX-NEXT: vpermpd {{.*#+}} ymm0 {%k1} {z} = mem[3,2,3,2] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x double>, <4 x double>* %vp		%vec = load <4 x double>, <4 x double>* %vp
▲ Show 20 Lines • Show All 357 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer
ret <8 x double> %res		ret <8 x double> %res
}		}
define <8 x double> @test_8xdouble_perm_mem_mask0(<8 x double>* %vp) {		define <8 x double> @test_8xdouble_perm_mem_mask0(<8 x double>* %vp) {
; GENERIC-LABEL: test_8xdouble_perm_mem_mask0:		; GENERIC-LABEL: test_8xdouble_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} zmm0 = [0,3,4,0,4,2,0,1] sched: [6:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} zmm0 = [0,3,4,0,4,2,0,1] sched: [6:0.50]
; GENERIC-NEXT: vpermpd (%rdi), %zmm0, %zmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermpd (%rdi), %zmm0, %zmm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_perm_mem_mask0:		; SKX-LABEL: test_8xdouble_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} zmm0 = [0,3,4,0,4,2,0,1] sched: [8:0.50]		; SKX-NEXT: vmovaps {{.*#+}} zmm0 = [0,3,4,0,4,2,0,1] sched: [8:0.50]
; SKX-NEXT: vpermpd (%rdi), %zmm0, %zmm0 # sched: [10:1.00]		; SKX-NEXT: vpermpd (%rdi), %zmm0, %zmm0 # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x double>, <8 x double>* %vp		%vec = load <8 x double>, <8 x double>* %vp
%res = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 0, i32 3, i32 4, i32 0, i32 4, i32 2, i32 0, i32 1>		%res = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 0, i32 3, i32 4, i32 0, i32 4, i32 2, i32 0, i32 1>
ret <8 x double> %res		ret <8 x double> %res
}		}
define <8 x double> @test_masked_8xdouble_perm_mem_mask0(<8 x double>* %vp, <8 x double> %vec2, <8 x i64> %mask) {		define <8 x double> @test_masked_8xdouble_perm_mem_mask0(<8 x double>* %vp, <8 x double> %vec2, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_8xdouble_perm_mem_mask0:		; GENERIC-LABEL: test_masked_8xdouble_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovapd {{.*#+}} zmm2 = [0,3,4,0,4,2,0,1] sched: [6:0.50]		; GENERIC-NEXT: vmovapd {{.*#+}} zmm2 = [0,3,4,0,4,2,0,1] sched: [6:0.50]
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd (%rdi), %zmm2, %zmm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermpd (%rdi), %zmm2, %zmm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xdouble_perm_mem_mask0:		; SKX-LABEL: test_masked_8xdouble_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovapd {{.*#+}} zmm2 = [0,3,4,0,4,2,0,1] sched: [8:0.50]		; SKX-NEXT: vmovapd {{.*#+}} zmm2 = [0,3,4,0,4,2,0,1] sched: [8:0.50]
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermpd (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x double>, <8 x double>* %vp		%vec = load <8 x double>, <8 x double>* %vp
%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 0, i32 3, i32 4, i32 0, i32 4, i32 2, i32 0, i32 1>		%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 0, i32 3, i32 4, i32 0, i32 4, i32 2, i32 0, i32 1>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec2		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec2
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_masked_z_8xdouble_perm_mem_mask0(<8 x double>* %vp, <8 x i64> %mask) {		define <8 x double> @test_masked_z_8xdouble_perm_mem_mask0(<8 x double>* %vp, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_8xdouble_perm_mem_mask0:		; GENERIC-LABEL: test_masked_z_8xdouble_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovapd {{.*#+}} zmm1 = [0,3,4,0,4,2,0,1] sched: [6:0.50]		; GENERIC-NEXT: vmovapd {{.*#+}} zmm1 = [0,3,4,0,4,2,0,1] sched: [6:0.50]
; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermpd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xdouble_perm_mem_mask0:		; SKX-LABEL: test_masked_z_8xdouble_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovapd {{.*#+}} zmm1 = [0,3,4,0,4,2,0,1] sched: [8:0.50]		; SKX-NEXT: vmovapd {{.*#+}} zmm1 = [0,3,4,0,4,2,0,1] sched: [8:0.50]
; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermpd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x double>, <8 x double>* %vp		%vec = load <8 x double>, <8 x double>* %vp
%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 0, i32 3, i32 4, i32 0, i32 4, i32 2, i32 0, i32 1>		%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 0, i32 3, i32 4, i32 0, i32 4, i32 2, i32 0, i32 1>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_masked_8xdouble_perm_imm_mem_mask1(<8 x double>* %vp, <8 x double> %vec2, <8 x i64> %mask) {		define <8 x double> @test_masked_8xdouble_perm_imm_mem_mask1(<8 x double>* %vp, <8 x double> %vec2, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_8xdouble_perm_imm_mem_mask1:		; GENERIC-LABEL: test_masked_8xdouble_perm_imm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd {{.*#+}} zmm0 {%k1} = mem[0,2,0,3,4,6,4,7] sched: [5:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} zmm0 {%k1} = mem[0,2,0,3,4,6,4,7] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xdouble_perm_imm_mem_mask1:		; SKX-LABEL: test_masked_8xdouble_perm_imm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd {{.*#+}} zmm0 {%k1} = mem[0,2,0,3,4,6,4,7] sched: [10:1.00]		; SKX-NEXT: vpermpd {{.*#+}} zmm0 {%k1} = mem[0,2,0,3,4,6,4,7] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x double>, <8 x double>* %vp		%vec = load <8 x double>, <8 x double>* %vp
%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 0, i32 2, i32 0, i32 3, i32 4, i32 6, i32 4, i32 7>		%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 0, i32 2, i32 0, i32 3, i32 4, i32 6, i32 4, i32 7>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec2		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec2
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_masked_z_8xdouble_perm_imm_mem_mask1(<8 x double>* %vp, <8 x i64> %mask) {		define <8 x double> @test_masked_z_8xdouble_perm_imm_mem_mask1(<8 x double>* %vp, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_8xdouble_perm_imm_mem_mask1:		; GENERIC-LABEL: test_masked_z_8xdouble_perm_imm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd {{.*#+}} zmm0 {%k1} {z} = mem[0,2,0,3,4,6,4,7] sched: [5:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} zmm0 {%k1} {z} = mem[0,2,0,3,4,6,4,7] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xdouble_perm_imm_mem_mask1:		; SKX-LABEL: test_masked_z_8xdouble_perm_imm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd {{.*#+}} zmm0 {%k1} {z} = mem[0,2,0,3,4,6,4,7] sched: [10:1.00]		; SKX-NEXT: vpermpd {{.*#+}} zmm0 {%k1} {z} = mem[0,2,0,3,4,6,4,7] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x double>, <8 x double>* %vp		%vec = load <8 x double>, <8 x double>* %vp
%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 0, i32 2, i32 0, i32 3, i32 4, i32 6, i32 4, i32 7>		%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 0, i32 2, i32 0, i32 3, i32 4, i32 6, i32 4, i32 7>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_masked_8xdouble_perm_mem_mask2(<8 x double>* %vp, <8 x double> %vec2, <8 x i64> %mask) {		define <8 x double> @test_masked_8xdouble_perm_mem_mask2(<8 x double>* %vp, <8 x double> %vec2, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_8xdouble_perm_mem_mask2:		; GENERIC-LABEL: test_masked_8xdouble_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovapd {{.*#+}} zmm2 = [6,7,2,7,7,6,2,5] sched: [6:0.50]		; GENERIC-NEXT: vmovapd {{.*#+}} zmm2 = [6,7,2,7,7,6,2,5] sched: [6:0.50]
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd (%rdi), %zmm2, %zmm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermpd (%rdi), %zmm2, %zmm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xdouble_perm_mem_mask2:		; SKX-LABEL: test_masked_8xdouble_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovapd {{.*#+}} zmm2 = [6,7,2,7,7,6,2,5] sched: [8:0.50]		; SKX-NEXT: vmovapd {{.*#+}} zmm2 = [6,7,2,7,7,6,2,5] sched: [8:0.50]
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermpd (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x double>, <8 x double>* %vp		%vec = load <8 x double>, <8 x double>* %vp
%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 6, i32 7, i32 2, i32 7, i32 7, i32 6, i32 2, i32 5>		%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 6, i32 7, i32 2, i32 7, i32 7, i32 6, i32 2, i32 5>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec2		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec2
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_masked_z_8xdouble_perm_mem_mask2(<8 x double>* %vp, <8 x i64> %mask) {		define <8 x double> @test_masked_z_8xdouble_perm_mem_mask2(<8 x double>* %vp, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_8xdouble_perm_mem_mask2:		; GENERIC-LABEL: test_masked_z_8xdouble_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovapd {{.*#+}} zmm1 = [6,7,2,7,7,6,2,5] sched: [6:0.50]		; GENERIC-NEXT: vmovapd {{.*#+}} zmm1 = [6,7,2,7,7,6,2,5] sched: [6:0.50]
; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermpd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xdouble_perm_mem_mask2:		; SKX-LABEL: test_masked_z_8xdouble_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovapd {{.*#+}} zmm1 = [6,7,2,7,7,6,2,5] sched: [8:0.50]		; SKX-NEXT: vmovapd {{.*#+}} zmm1 = [6,7,2,7,7,6,2,5] sched: [8:0.50]
; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermpd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x double>, <8 x double>* %vp		%vec = load <8 x double>, <8 x double>* %vp
%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 6, i32 7, i32 2, i32 7, i32 7, i32 6, i32 2, i32 5>		%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 6, i32 7, i32 2, i32 7, i32 7, i32 6, i32 2, i32 5>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_8xdouble_perm_imm_mem_mask3(<8 x double>* %vp) {		define <8 x double> @test_8xdouble_perm_imm_mem_mask3(<8 x double>* %vp) {
; GENERIC-LABEL: test_8xdouble_perm_imm_mem_mask3:		; GENERIC-LABEL: test_8xdouble_perm_imm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpermpd {{.*#+}} zmm0 = mem[2,1,1,0,6,5,5,4] sched: [5:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} zmm0 = mem[2,1,1,0,6,5,5,4] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_perm_imm_mem_mask3:		; SKX-LABEL: test_8xdouble_perm_imm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpermpd {{.*#+}} zmm0 = mem[2,1,1,0,6,5,5,4] sched: [10:1.00]		; SKX-NEXT: vpermpd {{.*#+}} zmm0 = mem[2,1,1,0,6,5,5,4] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x double>, <8 x double>* %vp		%vec = load <8 x double>, <8 x double>* %vp
%res = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 2, i32 1, i32 1, i32 0, i32 6, i32 5, i32 5, i32 4>		%res = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 2, i32 1, i32 1, i32 0, i32 6, i32 5, i32 5, i32 4>
ret <8 x double> %res		ret <8 x double> %res
}		}
define <8 x double> @test_masked_8xdouble_perm_imm_mem_mask3(<8 x double>* %vp, <8 x double> %vec2, <8 x i64> %mask) {		define <8 x double> @test_masked_8xdouble_perm_imm_mem_mask3(<8 x double>* %vp, <8 x double> %vec2, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_8xdouble_perm_imm_mem_mask3:		; GENERIC-LABEL: test_masked_8xdouble_perm_imm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd {{.*#+}} zmm0 {%k1} = mem[2,1,1,0,6,5,5,4] sched: [5:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} zmm0 {%k1} = mem[2,1,1,0,6,5,5,4] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xdouble_perm_imm_mem_mask3:		; SKX-LABEL: test_masked_8xdouble_perm_imm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd {{.*#+}} zmm0 {%k1} = mem[2,1,1,0,6,5,5,4] sched: [10:1.00]		; SKX-NEXT: vpermpd {{.*#+}} zmm0 {%k1} = mem[2,1,1,0,6,5,5,4] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x double>, <8 x double>* %vp		%vec = load <8 x double>, <8 x double>* %vp
%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 2, i32 1, i32 1, i32 0, i32 6, i32 5, i32 5, i32 4>		%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 2, i32 1, i32 1, i32 0, i32 6, i32 5, i32 5, i32 4>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec2		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec2
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_masked_z_8xdouble_perm_imm_mem_mask3(<8 x double>* %vp, <8 x i64> %mask) {		define <8 x double> @test_masked_z_8xdouble_perm_imm_mem_mask3(<8 x double>* %vp, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_8xdouble_perm_imm_mem_mask3:		; GENERIC-LABEL: test_masked_z_8xdouble_perm_imm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd {{.*#+}} zmm0 {%k1} {z} = mem[2,1,1,0,6,5,5,4] sched: [5:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} zmm0 {%k1} {z} = mem[2,1,1,0,6,5,5,4] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xdouble_perm_imm_mem_mask3:		; SKX-LABEL: test_masked_z_8xdouble_perm_imm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd {{.*#+}} zmm0 {%k1} {z} = mem[2,1,1,0,6,5,5,4] sched: [10:1.00]		; SKX-NEXT: vpermpd {{.*#+}} zmm0 {%k1} {z} = mem[2,1,1,0,6,5,5,4] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x double>, <8 x double>* %vp		%vec = load <8 x double>, <8 x double>* %vp
%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 2, i32 1, i32 1, i32 0, i32 6, i32 5, i32 5, i32 4>		%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 2, i32 1, i32 1, i32 0, i32 6, i32 5, i32 5, i32 4>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_masked_8xdouble_perm_mem_mask4(<8 x double>* %vp, <8 x double> %vec2, <8 x i64> %mask) {		define <8 x double> @test_masked_8xdouble_perm_mem_mask4(<8 x double>* %vp, <8 x double> %vec2, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_8xdouble_perm_mem_mask4:		; GENERIC-LABEL: test_masked_8xdouble_perm_mem_mask4:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovapd {{.*#+}} zmm2 = [1,1,3,5,6,0,6,0] sched: [6:0.50]		; GENERIC-NEXT: vmovapd {{.*#+}} zmm2 = [1,1,3,5,6,0,6,0] sched: [6:0.50]
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd (%rdi), %zmm2, %zmm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermpd (%rdi), %zmm2, %zmm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xdouble_perm_mem_mask4:		; SKX-LABEL: test_masked_8xdouble_perm_mem_mask4:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovapd {{.*#+}} zmm2 = [1,1,3,5,6,0,6,0] sched: [8:0.50]		; SKX-NEXT: vmovapd {{.*#+}} zmm2 = [1,1,3,5,6,0,6,0] sched: [8:0.50]
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermpd (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x double>, <8 x double>* %vp		%vec = load <8 x double>, <8 x double>* %vp
%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 1, i32 1, i32 3, i32 5, i32 6, i32 0, i32 6, i32 0>		%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 1, i32 1, i32 3, i32 5, i32 6, i32 0, i32 6, i32 0>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec2		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec2
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_masked_z_8xdouble_perm_mem_mask4(<8 x double>* %vp, <8 x i64> %mask) {		define <8 x double> @test_masked_z_8xdouble_perm_mem_mask4(<8 x double>* %vp, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_8xdouble_perm_mem_mask4:		; GENERIC-LABEL: test_masked_z_8xdouble_perm_mem_mask4:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovapd {{.*#+}} zmm1 = [1,1,3,5,6,0,6,0] sched: [6:0.50]		; GENERIC-NEXT: vmovapd {{.*#+}} zmm1 = [1,1,3,5,6,0,6,0] sched: [6:0.50]
; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermpd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xdouble_perm_mem_mask4:		; SKX-LABEL: test_masked_z_8xdouble_perm_mem_mask4:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovapd {{.*#+}} zmm1 = [1,1,3,5,6,0,6,0] sched: [8:0.50]		; SKX-NEXT: vmovapd {{.*#+}} zmm1 = [1,1,3,5,6,0,6,0] sched: [8:0.50]
; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermpd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x double>, <8 x double>* %vp		%vec = load <8 x double>, <8 x double>* %vp
%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 1, i32 1, i32 3, i32 5, i32 6, i32 0, i32 6, i32 0>		%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 1, i32 1, i32 3, i32 5, i32 6, i32 0, i32 6, i32 0>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_masked_8xdouble_perm_imm_mem_mask5(<8 x double>* %vp, <8 x double> %vec2, <8 x i64> %mask) {		define <8 x double> @test_masked_8xdouble_perm_imm_mem_mask5(<8 x double>* %vp, <8 x double> %vec2, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_8xdouble_perm_imm_mem_mask5:		; GENERIC-LABEL: test_masked_8xdouble_perm_imm_mem_mask5:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd {{.*#+}} zmm0 {%k1} = mem[2,2,2,3,6,6,6,7] sched: [5:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} zmm0 {%k1} = mem[2,2,2,3,6,6,6,7] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xdouble_perm_imm_mem_mask5:		; SKX-LABEL: test_masked_8xdouble_perm_imm_mem_mask5:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd {{.*#+}} zmm0 {%k1} = mem[2,2,2,3,6,6,6,7] sched: [10:1.00]		; SKX-NEXT: vpermpd {{.*#+}} zmm0 {%k1} = mem[2,2,2,3,6,6,6,7] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x double>, <8 x double>* %vp		%vec = load <8 x double>, <8 x double>* %vp
%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 2, i32 2, i32 2, i32 3, i32 6, i32 6, i32 6, i32 7>		%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 2, i32 2, i32 2, i32 3, i32 6, i32 6, i32 6, i32 7>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec2		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec2
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_masked_z_8xdouble_perm_imm_mem_mask5(<8 x double>* %vp, <8 x i64> %mask) {		define <8 x double> @test_masked_z_8xdouble_perm_imm_mem_mask5(<8 x double>* %vp, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_8xdouble_perm_imm_mem_mask5:		; GENERIC-LABEL: test_masked_z_8xdouble_perm_imm_mem_mask5:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd {{.*#+}} zmm0 {%k1} {z} = mem[2,2,2,3,6,6,6,7] sched: [5:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} zmm0 {%k1} {z} = mem[2,2,2,3,6,6,6,7] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xdouble_perm_imm_mem_mask5:		; SKX-LABEL: test_masked_z_8xdouble_perm_imm_mem_mask5:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd {{.*#+}} zmm0 {%k1} {z} = mem[2,2,2,3,6,6,6,7] sched: [10:1.00]		; SKX-NEXT: vpermpd {{.*#+}} zmm0 {%k1} {z} = mem[2,2,2,3,6,6,6,7] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x double>, <8 x double>* %vp		%vec = load <8 x double>, <8 x double>* %vp
%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 2, i32 2, i32 2, i32 3, i32 6, i32 6, i32 6, i32 7>		%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 2, i32 2, i32 2, i32 3, i32 6, i32 6, i32 6, i32 7>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_8xdouble_perm_mem_mask6(<8 x double>* %vp) {		define <8 x double> @test_8xdouble_perm_mem_mask6(<8 x double>* %vp) {
; GENERIC-LABEL: test_8xdouble_perm_mem_mask6:		; GENERIC-LABEL: test_8xdouble_perm_mem_mask6:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovaps {{.*#+}} zmm0 = [2,4,0,4,6,1,2,5] sched: [6:0.50]		; GENERIC-NEXT: vmovaps {{.*#+}} zmm0 = [2,4,0,4,6,1,2,5] sched: [6:0.50]
; GENERIC-NEXT: vpermpd (%rdi), %zmm0, %zmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermpd (%rdi), %zmm0, %zmm0 # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_perm_mem_mask6:		; SKX-LABEL: test_8xdouble_perm_mem_mask6:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovaps {{.*#+}} zmm0 = [2,4,0,4,6,1,2,5] sched: [8:0.50]		; SKX-NEXT: vmovaps {{.*#+}} zmm0 = [2,4,0,4,6,1,2,5] sched: [8:0.50]
; SKX-NEXT: vpermpd (%rdi), %zmm0, %zmm0 # sched: [10:1.00]		; SKX-NEXT: vpermpd (%rdi), %zmm0, %zmm0 # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x double>, <8 x double>* %vp		%vec = load <8 x double>, <8 x double>* %vp
%res = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 2, i32 4, i32 0, i32 4, i32 6, i32 1, i32 2, i32 5>		%res = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 2, i32 4, i32 0, i32 4, i32 6, i32 1, i32 2, i32 5>
ret <8 x double> %res		ret <8 x double> %res
}		}
define <8 x double> @test_masked_8xdouble_perm_mem_mask6(<8 x double>* %vp, <8 x double> %vec2, <8 x i64> %mask) {		define <8 x double> @test_masked_8xdouble_perm_mem_mask6(<8 x double>* %vp, <8 x double> %vec2, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_8xdouble_perm_mem_mask6:		; GENERIC-LABEL: test_masked_8xdouble_perm_mem_mask6:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovapd {{.*#+}} zmm2 = [2,4,0,4,6,1,2,5] sched: [6:0.50]		; GENERIC-NEXT: vmovapd {{.*#+}} zmm2 = [2,4,0,4,6,1,2,5] sched: [6:0.50]
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd (%rdi), %zmm2, %zmm0 {%k1} # sched: [5:1.00]		; GENERIC-NEXT: vpermpd (%rdi), %zmm2, %zmm0 {%k1} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xdouble_perm_mem_mask6:		; SKX-LABEL: test_masked_8xdouble_perm_mem_mask6:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovapd {{.*#+}} zmm2 = [2,4,0,4,6,1,2,5] sched: [8:0.50]		; SKX-NEXT: vmovapd {{.*#+}} zmm2 = [2,4,0,4,6,1,2,5] sched: [8:0.50]
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]		; SKX-NEXT: vpermpd (%rdi), %zmm2, %zmm0 {%k1} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x double>, <8 x double>* %vp		%vec = load <8 x double>, <8 x double>* %vp
%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 2, i32 4, i32 0, i32 4, i32 6, i32 1, i32 2, i32 5>		%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 2, i32 4, i32 0, i32 4, i32 6, i32 1, i32 2, i32 5>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec2		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec2
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_masked_z_8xdouble_perm_mem_mask6(<8 x double>* %vp, <8 x i64> %mask) {		define <8 x double> @test_masked_z_8xdouble_perm_mem_mask6(<8 x double>* %vp, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_8xdouble_perm_mem_mask6:		; GENERIC-LABEL: test_masked_z_8xdouble_perm_mem_mask6:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovapd {{.*#+}} zmm1 = [2,4,0,4,6,1,2,5] sched: [6:0.50]		; GENERIC-NEXT: vmovapd {{.*#+}} zmm1 = [2,4,0,4,6,1,2,5] sched: [6:0.50]
; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [5:1.00]		; GENERIC-NEXT: vpermpd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xdouble_perm_mem_mask6:		; SKX-LABEL: test_masked_z_8xdouble_perm_mem_mask6:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovapd {{.*#+}} zmm1 = [2,4,0,4,6,1,2,5] sched: [8:0.50]		; SKX-NEXT: vmovapd {{.*#+}} zmm1 = [2,4,0,4,6,1,2,5] sched: [8:0.50]
; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]		; SKX-NEXT: vpermpd (%rdi), %zmm1, %zmm0 {%k1} {z} # sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x double>, <8 x double>* %vp		%vec = load <8 x double>, <8 x double>* %vp
%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 2, i32 4, i32 0, i32 4, i32 6, i32 1, i32 2, i32 5>		%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 2, i32 4, i32 0, i32 4, i32 6, i32 1, i32 2, i32 5>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_masked_8xdouble_perm_imm_mem_mask7(<8 x double>* %vp, <8 x double> %vec2, <8 x i64> %mask) {		define <8 x double> @test_masked_8xdouble_perm_imm_mem_mask7(<8 x double>* %vp, <8 x double> %vec2, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_8xdouble_perm_imm_mem_mask7:		; GENERIC-LABEL: test_masked_8xdouble_perm_imm_mem_mask7:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd {{.*#+}} zmm0 {%k1} = mem[0,3,2,0,4,7,6,4] sched: [5:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} zmm0 {%k1} = mem[0,3,2,0,4,7,6,4] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xdouble_perm_imm_mem_mask7:		; SKX-LABEL: test_masked_8xdouble_perm_imm_mem_mask7:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd {{.*#+}} zmm0 {%k1} = mem[0,3,2,0,4,7,6,4] sched: [10:1.00]		; SKX-NEXT: vpermpd {{.*#+}} zmm0 {%k1} = mem[0,3,2,0,4,7,6,4] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x double>, <8 x double>* %vp		%vec = load <8 x double>, <8 x double>* %vp
%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 0, i32 3, i32 2, i32 0, i32 4, i32 7, i32 6, i32 4>		%shuf = shufflevector <8 x double> %vec, <8 x double> undef, <8 x i32> <i32 0, i32 3, i32 2, i32 0, i32 4, i32 7, i32 6, i32 4>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec2		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec2
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_masked_z_8xdouble_perm_imm_mem_mask7(<8 x double>* %vp, <8 x i64> %mask) {		define <8 x double> @test_masked_z_8xdouble_perm_imm_mem_mask7(<8 x double>* %vp, <8 x i64> %mask) {
; GENERIC-LABEL: test_masked_z_8xdouble_perm_imm_mem_mask7:		; GENERIC-LABEL: test_masked_z_8xdouble_perm_imm_mem_mask7:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpermpd {{.*#+}} zmm0 {%k1} {z} = mem[0,3,2,0,4,7,6,4] sched: [5:1.00]		; GENERIC-NEXT: vpermpd {{.*#+}} zmm0 {%k1} {z} = mem[0,3,2,0,4,7,6,4] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xdouble_perm_imm_mem_mask7:		; SKX-LABEL: test_masked_z_8xdouble_perm_imm_mem_mask7:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpermpd {{.*#+}} zmm0 {%k1} {z} = mem[0,3,2,0,4,7,6,4] sched: [10:1.00]		; SKX-NEXT: vpermpd {{.*#+}} zmm0 {%k1} {z} = mem[0,3,2,0,4,7,6,4] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x double>, <8 x double>* %vp		%vec = load <8 x double>, <8 x double>* %vp
Show All 15 Lines
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%res = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 8, i32 6, i32 12, i32 4, i32 7, i32 9, i32 14, i32 8, i32 4, i32 12, i32 9, i32 4, i32 14, i32 15, i32 12, i32 14>		%res = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 8, i32 6, i32 12, i32 4, i32 7, i32 9, i32 14, i32 8, i32 4, i32 12, i32 9, i32 4, i32 14, i32 15, i32 12, i32 14>
ret <16 x i8> %res		ret <16 x i8> %res
}		}
define <16 x i8> @test_masked_16xi8_perm_mask0(<16 x i8> %vec, <16 x i8> %vec2, <16 x i8> %mask) {		define <16 x i8> @test_masked_16xi8_perm_mask0(<16 x i8> %vec, <16 x i8> %vec2, <16 x i8> %mask) {
; GENERIC-LABEL: test_masked_16xi8_perm_mask0:		; GENERIC-LABEL: test_masked_16xi8_perm_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %xmm2, %xmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %xmm2, %xmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} xmm1 {%k1} = xmm0[8,6,12,4,7,9,14,8,4,12,9,4,14,15,12,14] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} xmm1 {%k1} = xmm0[8,6,12,4,7,9,14,8,4,12,9,4,14,15,12,14] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa %xmm1, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa %xmm1, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi8_perm_mask0:		; SKX-LABEL: test_masked_16xi8_perm_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %xmm2, %xmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %xmm2, %xmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} xmm1 {%k1} = xmm0[8,6,12,4,7,9,14,8,4,12,9,4,14,15,12,14] sched: [7:1.00]		; SKX-NEXT: vpshufb {{.*#+}} xmm1 {%k1} = xmm0[8,6,12,4,7,9,14,8,4,12,9,4,14,15,12,14] sched: [7:1.00]
; SKX-NEXT: vmovdqa %xmm1, %xmm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa %xmm1, %xmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 8, i32 6, i32 12, i32 4, i32 7, i32 9, i32 14, i32 8, i32 4, i32 12, i32 9, i32 4, i32 14, i32 15, i32 12, i32 14>		%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 8, i32 6, i32 12, i32 4, i32 7, i32 9, i32 14, i32 8, i32 4, i32 12, i32 9, i32 4, i32 14, i32 15, i32 12, i32 14>
%cmp = icmp eq <16 x i8> %mask, zeroinitializer		%cmp = icmp eq <16 x i8> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> %vec2		%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> %vec2
ret <16 x i8> %res		ret <16 x i8> %res
}		}

define <16 x i8> @test_masked_z_16xi8_perm_mask0(<16 x i8> %vec, <16 x i8> %mask) {		define <16 x i8> @test_masked_z_16xi8_perm_mask0(<16 x i8> %vec, <16 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_16xi8_perm_mask0:		; GENERIC-LABEL: test_masked_z_16xi8_perm_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm0[8,6,12,4,7,9,14,8,4,12,9,4,14,15,12,14] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm0[8,6,12,4,7,9,14,8,4,12,9,4,14,15,12,14] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi8_perm_mask0:		; SKX-LABEL: test_masked_z_16xi8_perm_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm0[8,6,12,4,7,9,14,8,4,12,9,4,14,15,12,14] sched: [7:1.00]		; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm0[8,6,12,4,7,9,14,8,4,12,9,4,14,15,12,14] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 8, i32 6, i32 12, i32 4, i32 7, i32 9, i32 14, i32 8, i32 4, i32 12, i32 9, i32 4, i32 14, i32 15, i32 12, i32 14>		%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 8, i32 6, i32 12, i32 4, i32 7, i32 9, i32 14, i32 8, i32 4, i32 12, i32 9, i32 4, i32 14, i32 15, i32 12, i32 14>
%cmp = icmp eq <16 x i8> %mask, zeroinitializer		%cmp = icmp eq <16 x i8> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> zeroinitializer
ret <16 x i8> %res		ret <16 x i8> %res
}		}
define <16 x i8> @test_masked_16xi8_perm_mask1(<16 x i8> %vec, <16 x i8> %vec2, <16 x i8> %mask) {		define <16 x i8> @test_masked_16xi8_perm_mask1(<16 x i8> %vec, <16 x i8> %vec2, <16 x i8> %mask) {
; GENERIC-LABEL: test_masked_16xi8_perm_mask1:		; GENERIC-LABEL: test_masked_16xi8_perm_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %xmm2, %xmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %xmm2, %xmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} xmm1 {%k1} = xmm0[4,11,14,10,7,1,6,9,14,15,7,13,4,12,8,0] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} xmm1 {%k1} = xmm0[4,11,14,10,7,1,6,9,14,15,7,13,4,12,8,0] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa %xmm1, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa %xmm1, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi8_perm_mask1:		; SKX-LABEL: test_masked_16xi8_perm_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %xmm2, %xmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %xmm2, %xmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} xmm1 {%k1} = xmm0[4,11,14,10,7,1,6,9,14,15,7,13,4,12,8,0] sched: [7:1.00]		; SKX-NEXT: vpshufb {{.*#+}} xmm1 {%k1} = xmm0[4,11,14,10,7,1,6,9,14,15,7,13,4,12,8,0] sched: [7:1.00]
; SKX-NEXT: vmovdqa %xmm1, %xmm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa %xmm1, %xmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 4, i32 11, i32 14, i32 10, i32 7, i32 1, i32 6, i32 9, i32 14, i32 15, i32 7, i32 13, i32 4, i32 12, i32 8, i32 0>		%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 4, i32 11, i32 14, i32 10, i32 7, i32 1, i32 6, i32 9, i32 14, i32 15, i32 7, i32 13, i32 4, i32 12, i32 8, i32 0>
%cmp = icmp eq <16 x i8> %mask, zeroinitializer		%cmp = icmp eq <16 x i8> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> %vec2		%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> %vec2
ret <16 x i8> %res		ret <16 x i8> %res
}		}

define <16 x i8> @test_masked_z_16xi8_perm_mask1(<16 x i8> %vec, <16 x i8> %mask) {		define <16 x i8> @test_masked_z_16xi8_perm_mask1(<16 x i8> %vec, <16 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_16xi8_perm_mask1:		; GENERIC-LABEL: test_masked_z_16xi8_perm_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm0[4,11,14,10,7,1,6,9,14,15,7,13,4,12,8,0] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm0[4,11,14,10,7,1,6,9,14,15,7,13,4,12,8,0] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi8_perm_mask1:		; SKX-LABEL: test_masked_z_16xi8_perm_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm0[4,11,14,10,7,1,6,9,14,15,7,13,4,12,8,0] sched: [7:1.00]		; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm0[4,11,14,10,7,1,6,9,14,15,7,13,4,12,8,0] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 4, i32 11, i32 14, i32 10, i32 7, i32 1, i32 6, i32 9, i32 14, i32 15, i32 7, i32 13, i32 4, i32 12, i32 8, i32 0>		%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 4, i32 11, i32 14, i32 10, i32 7, i32 1, i32 6, i32 9, i32 14, i32 15, i32 7, i32 13, i32 4, i32 12, i32 8, i32 0>
%cmp = icmp eq <16 x i8> %mask, zeroinitializer		%cmp = icmp eq <16 x i8> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> zeroinitializer
ret <16 x i8> %res		ret <16 x i8> %res
}		}
define <16 x i8> @test_masked_16xi8_perm_mask2(<16 x i8> %vec, <16 x i8> %vec2, <16 x i8> %mask) {		define <16 x i8> @test_masked_16xi8_perm_mask2(<16 x i8> %vec, <16 x i8> %vec2, <16 x i8> %mask) {
; GENERIC-LABEL: test_masked_16xi8_perm_mask2:		; GENERIC-LABEL: test_masked_16xi8_perm_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %xmm2, %xmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %xmm2, %xmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} xmm1 {%k1} = xmm0[11,6,13,10,0,7,13,3,5,13,3,9,3,15,12,7] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} xmm1 {%k1} = xmm0[11,6,13,10,0,7,13,3,5,13,3,9,3,15,12,7] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa %xmm1, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa %xmm1, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi8_perm_mask2:		; SKX-LABEL: test_masked_16xi8_perm_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %xmm2, %xmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %xmm2, %xmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} xmm1 {%k1} = xmm0[11,6,13,10,0,7,13,3,5,13,3,9,3,15,12,7] sched: [7:1.00]		; SKX-NEXT: vpshufb {{.*#+}} xmm1 {%k1} = xmm0[11,6,13,10,0,7,13,3,5,13,3,9,3,15,12,7] sched: [7:1.00]
; SKX-NEXT: vmovdqa %xmm1, %xmm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa %xmm1, %xmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 11, i32 6, i32 13, i32 10, i32 0, i32 7, i32 13, i32 3, i32 5, i32 13, i32 3, i32 9, i32 3, i32 15, i32 12, i32 7>		%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 11, i32 6, i32 13, i32 10, i32 0, i32 7, i32 13, i32 3, i32 5, i32 13, i32 3, i32 9, i32 3, i32 15, i32 12, i32 7>
%cmp = icmp eq <16 x i8> %mask, zeroinitializer		%cmp = icmp eq <16 x i8> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> %vec2		%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> %vec2
ret <16 x i8> %res		ret <16 x i8> %res
}		}

define <16 x i8> @test_masked_z_16xi8_perm_mask2(<16 x i8> %vec, <16 x i8> %mask) {		define <16 x i8> @test_masked_z_16xi8_perm_mask2(<16 x i8> %vec, <16 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_16xi8_perm_mask2:		; GENERIC-LABEL: test_masked_z_16xi8_perm_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm0[11,6,13,10,0,7,13,3,5,13,3,9,3,15,12,7] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm0[11,6,13,10,0,7,13,3,5,13,3,9,3,15,12,7] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi8_perm_mask2:		; SKX-LABEL: test_masked_z_16xi8_perm_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm0[11,6,13,10,0,7,13,3,5,13,3,9,3,15,12,7] sched: [7:1.00]		; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm0[11,6,13,10,0,7,13,3,5,13,3,9,3,15,12,7] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 11, i32 6, i32 13, i32 10, i32 0, i32 7, i32 13, i32 3, i32 5, i32 13, i32 3, i32 9, i32 3, i32 15, i32 12, i32 7>		%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 11, i32 6, i32 13, i32 10, i32 0, i32 7, i32 13, i32 3, i32 5, i32 13, i32 3, i32 9, i32 3, i32 15, i32 12, i32 7>
Show All 13 Lines
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%res = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 1, i32 5, i32 8, i32 14, i32 1, i32 8, i32 11, i32 8, i32 13, i32 8, i32 15, i32 9, i32 9, i32 7, i32 9, i32 6>		%res = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 1, i32 5, i32 8, i32 14, i32 1, i32 8, i32 11, i32 8, i32 13, i32 8, i32 15, i32 9, i32 9, i32 7, i32 9, i32 6>
ret <16 x i8> %res		ret <16 x i8> %res
}		}
define <16 x i8> @test_masked_16xi8_perm_mask3(<16 x i8> %vec, <16 x i8> %vec2, <16 x i8> %mask) {		define <16 x i8> @test_masked_16xi8_perm_mask3(<16 x i8> %vec, <16 x i8> %vec2, <16 x i8> %mask) {
; GENERIC-LABEL: test_masked_16xi8_perm_mask3:		; GENERIC-LABEL: test_masked_16xi8_perm_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %xmm2, %xmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %xmm2, %xmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} xmm1 {%k1} = xmm0[1,5,8,14,1,8,11,8,13,8,15,9,9,7,9,6] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} xmm1 {%k1} = xmm0[1,5,8,14,1,8,11,8,13,8,15,9,9,7,9,6] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa %xmm1, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa %xmm1, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi8_perm_mask3:		; SKX-LABEL: test_masked_16xi8_perm_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %xmm2, %xmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %xmm2, %xmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} xmm1 {%k1} = xmm0[1,5,8,14,1,8,11,8,13,8,15,9,9,7,9,6] sched: [7:1.00]		; SKX-NEXT: vpshufb {{.*#+}} xmm1 {%k1} = xmm0[1,5,8,14,1,8,11,8,13,8,15,9,9,7,9,6] sched: [7:1.00]
; SKX-NEXT: vmovdqa %xmm1, %xmm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa %xmm1, %xmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 1, i32 5, i32 8, i32 14, i32 1, i32 8, i32 11, i32 8, i32 13, i32 8, i32 15, i32 9, i32 9, i32 7, i32 9, i32 6>		%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 1, i32 5, i32 8, i32 14, i32 1, i32 8, i32 11, i32 8, i32 13, i32 8, i32 15, i32 9, i32 9, i32 7, i32 9, i32 6>
%cmp = icmp eq <16 x i8> %mask, zeroinitializer		%cmp = icmp eq <16 x i8> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> %vec2		%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> %vec2
ret <16 x i8> %res		ret <16 x i8> %res
}		}

define <16 x i8> @test_masked_z_16xi8_perm_mask3(<16 x i8> %vec, <16 x i8> %mask) {		define <16 x i8> @test_masked_z_16xi8_perm_mask3(<16 x i8> %vec, <16 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_16xi8_perm_mask3:		; GENERIC-LABEL: test_masked_z_16xi8_perm_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm0[1,5,8,14,1,8,11,8,13,8,15,9,9,7,9,6] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm0[1,5,8,14,1,8,11,8,13,8,15,9,9,7,9,6] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi8_perm_mask3:		; SKX-LABEL: test_masked_z_16xi8_perm_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm0[1,5,8,14,1,8,11,8,13,8,15,9,9,7,9,6] sched: [7:1.00]		; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm0[1,5,8,14,1,8,11,8,13,8,15,9,9,7,9,6] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 1, i32 5, i32 8, i32 14, i32 1, i32 8, i32 11, i32 8, i32 13, i32 8, i32 15, i32 9, i32 9, i32 7, i32 9, i32 6>		%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 1, i32 5, i32 8, i32 14, i32 1, i32 8, i32 11, i32 8, i32 13, i32 8, i32 15, i32 9, i32 9, i32 7, i32 9, i32 6>
Show All 17 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%res = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 9, i32 10, i32 7, i32 1, i32 12, i32 14, i32 14, i32 13, i32 14, i32 14, i32 8, i32 6, i32 11, i32 4, i32 12, i32 13>		%res = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 9, i32 10, i32 7, i32 1, i32 12, i32 14, i32 14, i32 13, i32 14, i32 14, i32 8, i32 6, i32 11, i32 4, i32 12, i32 13>
ret <16 x i8> %res		ret <16 x i8> %res
}		}
define <16 x i8> @test_masked_16xi8_perm_mem_mask0(<16 x i8>* %vp, <16 x i8> %vec2, <16 x i8> %mask) {		define <16 x i8> @test_masked_16xi8_perm_mem_mask0(<16 x i8>* %vp, <16 x i8> %vec2, <16 x i8> %mask) {
; GENERIC-LABEL: test_masked_16xi8_perm_mem_mask0:		; GENERIC-LABEL: test_masked_16xi8_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa (%rdi), %xmm2 # sched: [6:0.50]		; GENERIC-NEXT: vmovdqa (%rdi), %xmm2 # sched: [6:0.50]
; GENERIC-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} = xmm2[9,10,7,1,12,14,14,13,14,14,8,6,11,4,12,13] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} = xmm2[9,10,7,1,12,14,14,13,14,14,8,6,11,4,12,13] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi8_perm_mem_mask0:		; SKX-LABEL: test_masked_16xi8_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa (%rdi), %xmm2 # sched: [6:0.50]		; SKX-NEXT: vmovdqa (%rdi), %xmm2 # sched: [6:0.50]
; SKX-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} = xmm2[9,10,7,1,12,14,14,13,14,14,8,6,11,4,12,13] sched: [7:1.00]		; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} = xmm2[9,10,7,1,12,14,14,13,14,14,8,6,11,4,12,13] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i8>, <16 x i8>* %vp		%vec = load <16 x i8>, <16 x i8>* %vp
%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 9, i32 10, i32 7, i32 1, i32 12, i32 14, i32 14, i32 13, i32 14, i32 14, i32 8, i32 6, i32 11, i32 4, i32 12, i32 13>		%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 9, i32 10, i32 7, i32 1, i32 12, i32 14, i32 14, i32 13, i32 14, i32 14, i32 8, i32 6, i32 11, i32 4, i32 12, i32 13>
%cmp = icmp eq <16 x i8> %mask, zeroinitializer		%cmp = icmp eq <16 x i8> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> %vec2		%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> %vec2
ret <16 x i8> %res		ret <16 x i8> %res
}		}

define <16 x i8> @test_masked_z_16xi8_perm_mem_mask0(<16 x i8>* %vp, <16 x i8> %mask) {		define <16 x i8> @test_masked_z_16xi8_perm_mem_mask0(<16 x i8>* %vp, <16 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_16xi8_perm_mem_mask0:		; GENERIC-LABEL: test_masked_z_16xi8_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa (%rdi), %xmm1 # sched: [6:0.50]		; GENERIC-NEXT: vmovdqa (%rdi), %xmm1 # sched: [6:0.50]
; GENERIC-NEXT: vptestnmb %xmm0, %xmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %xmm0, %xmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm1[9,10,7,1,12,14,14,13,14,14,8,6,11,4,12,13] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm1[9,10,7,1,12,14,14,13,14,14,8,6,11,4,12,13] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi8_perm_mem_mask0:		; SKX-LABEL: test_masked_z_16xi8_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa (%rdi), %xmm1 # sched: [6:0.50]		; SKX-NEXT: vmovdqa (%rdi), %xmm1 # sched: [6:0.50]
; SKX-NEXT: vptestnmb %xmm0, %xmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %xmm0, %xmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm1[9,10,7,1,12,14,14,13,14,14,8,6,11,4,12,13] sched: [7:1.00]		; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm1[9,10,7,1,12,14,14,13,14,14,8,6,11,4,12,13] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i8>, <16 x i8>* %vp		%vec = load <16 x i8>, <16 x i8>* %vp
%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 9, i32 10, i32 7, i32 1, i32 12, i32 14, i32 14, i32 13, i32 14, i32 14, i32 8, i32 6, i32 11, i32 4, i32 12, i32 13>		%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 9, i32 10, i32 7, i32 1, i32 12, i32 14, i32 14, i32 13, i32 14, i32 14, i32 8, i32 6, i32 11, i32 4, i32 12, i32 13>
%cmp = icmp eq <16 x i8> %mask, zeroinitializer		%cmp = icmp eq <16 x i8> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> zeroinitializer
ret <16 x i8> %res		ret <16 x i8> %res
}		}

define <16 x i8> @test_masked_16xi8_perm_mem_mask1(<16 x i8>* %vp, <16 x i8> %vec2, <16 x i8> %mask) {		define <16 x i8> @test_masked_16xi8_perm_mem_mask1(<16 x i8>* %vp, <16 x i8> %vec2, <16 x i8> %mask) {
; GENERIC-LABEL: test_masked_16xi8_perm_mem_mask1:		; GENERIC-LABEL: test_masked_16xi8_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa (%rdi), %xmm2 # sched: [6:0.50]		; GENERIC-NEXT: vmovdqa (%rdi), %xmm2 # sched: [6:0.50]
; GENERIC-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} = xmm2[14,9,15,9,7,10,15,14,12,1,9,7,10,13,3,11] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} = xmm2[14,9,15,9,7,10,15,14,12,1,9,7,10,13,3,11] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi8_perm_mem_mask1:		; SKX-LABEL: test_masked_16xi8_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa (%rdi), %xmm2 # sched: [6:0.50]		; SKX-NEXT: vmovdqa (%rdi), %xmm2 # sched: [6:0.50]
; SKX-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} = xmm2[14,9,15,9,7,10,15,14,12,1,9,7,10,13,3,11] sched: [7:1.00]		; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} = xmm2[14,9,15,9,7,10,15,14,12,1,9,7,10,13,3,11] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i8>, <16 x i8>* %vp		%vec = load <16 x i8>, <16 x i8>* %vp
%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 14, i32 9, i32 15, i32 9, i32 7, i32 10, i32 15, i32 14, i32 12, i32 1, i32 9, i32 7, i32 10, i32 13, i32 3, i32 11>		%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 14, i32 9, i32 15, i32 9, i32 7, i32 10, i32 15, i32 14, i32 12, i32 1, i32 9, i32 7, i32 10, i32 13, i32 3, i32 11>
%cmp = icmp eq <16 x i8> %mask, zeroinitializer		%cmp = icmp eq <16 x i8> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> %vec2		%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> %vec2
ret <16 x i8> %res		ret <16 x i8> %res
}		}

define <16 x i8> @test_masked_z_16xi8_perm_mem_mask1(<16 x i8>* %vp, <16 x i8> %mask) {		define <16 x i8> @test_masked_z_16xi8_perm_mem_mask1(<16 x i8>* %vp, <16 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_16xi8_perm_mem_mask1:		; GENERIC-LABEL: test_masked_z_16xi8_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa (%rdi), %xmm1 # sched: [6:0.50]		; GENERIC-NEXT: vmovdqa (%rdi), %xmm1 # sched: [6:0.50]
; GENERIC-NEXT: vptestnmb %xmm0, %xmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %xmm0, %xmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm1[14,9,15,9,7,10,15,14,12,1,9,7,10,13,3,11] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm1[14,9,15,9,7,10,15,14,12,1,9,7,10,13,3,11] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi8_perm_mem_mask1:		; SKX-LABEL: test_masked_z_16xi8_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa (%rdi), %xmm1 # sched: [6:0.50]		; SKX-NEXT: vmovdqa (%rdi), %xmm1 # sched: [6:0.50]
; SKX-NEXT: vptestnmb %xmm0, %xmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %xmm0, %xmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm1[14,9,15,9,7,10,15,14,12,1,9,7,10,13,3,11] sched: [7:1.00]		; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm1[14,9,15,9,7,10,15,14,12,1,9,7,10,13,3,11] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i8>, <16 x i8>* %vp		%vec = load <16 x i8>, <16 x i8>* %vp
%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 14, i32 9, i32 15, i32 9, i32 7, i32 10, i32 15, i32 14, i32 12, i32 1, i32 9, i32 7, i32 10, i32 13, i32 3, i32 11>		%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 14, i32 9, i32 15, i32 9, i32 7, i32 10, i32 15, i32 14, i32 12, i32 1, i32 9, i32 7, i32 10, i32 13, i32 3, i32 11>
%cmp = icmp eq <16 x i8> %mask, zeroinitializer		%cmp = icmp eq <16 x i8> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> zeroinitializer
ret <16 x i8> %res		ret <16 x i8> %res
}		}

define <16 x i8> @test_masked_16xi8_perm_mem_mask2(<16 x i8>* %vp, <16 x i8> %vec2, <16 x i8> %mask) {		define <16 x i8> @test_masked_16xi8_perm_mem_mask2(<16 x i8>* %vp, <16 x i8> %vec2, <16 x i8> %mask) {
; GENERIC-LABEL: test_masked_16xi8_perm_mem_mask2:		; GENERIC-LABEL: test_masked_16xi8_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa (%rdi), %xmm2 # sched: [6:0.50]		; GENERIC-NEXT: vmovdqa (%rdi), %xmm2 # sched: [6:0.50]
; GENERIC-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} = xmm2[1,3,12,5,13,1,2,11,0,9,14,8,10,0,10,9] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} = xmm2[1,3,12,5,13,1,2,11,0,9,14,8,10,0,10,9] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi8_perm_mem_mask2:		; SKX-LABEL: test_masked_16xi8_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa (%rdi), %xmm2 # sched: [6:0.50]		; SKX-NEXT: vmovdqa (%rdi), %xmm2 # sched: [6:0.50]
; SKX-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} = xmm2[1,3,12,5,13,1,2,11,0,9,14,8,10,0,10,9] sched: [7:1.00]		; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} = xmm2[1,3,12,5,13,1,2,11,0,9,14,8,10,0,10,9] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i8>, <16 x i8>* %vp		%vec = load <16 x i8>, <16 x i8>* %vp
%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 1, i32 3, i32 12, i32 5, i32 13, i32 1, i32 2, i32 11, i32 0, i32 9, i32 14, i32 8, i32 10, i32 0, i32 10, i32 9>		%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 1, i32 3, i32 12, i32 5, i32 13, i32 1, i32 2, i32 11, i32 0, i32 9, i32 14, i32 8, i32 10, i32 0, i32 10, i32 9>
%cmp = icmp eq <16 x i8> %mask, zeroinitializer		%cmp = icmp eq <16 x i8> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> %vec2		%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> %vec2
ret <16 x i8> %res		ret <16 x i8> %res
}		}

define <16 x i8> @test_masked_z_16xi8_perm_mem_mask2(<16 x i8>* %vp, <16 x i8> %mask) {		define <16 x i8> @test_masked_z_16xi8_perm_mem_mask2(<16 x i8>* %vp, <16 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_16xi8_perm_mem_mask2:		; GENERIC-LABEL: test_masked_z_16xi8_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa (%rdi), %xmm1 # sched: [6:0.50]		; GENERIC-NEXT: vmovdqa (%rdi), %xmm1 # sched: [6:0.50]
; GENERIC-NEXT: vptestnmb %xmm0, %xmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %xmm0, %xmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm1[1,3,12,5,13,1,2,11,0,9,14,8,10,0,10,9] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm1[1,3,12,5,13,1,2,11,0,9,14,8,10,0,10,9] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi8_perm_mem_mask2:		; SKX-LABEL: test_masked_z_16xi8_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa (%rdi), %xmm1 # sched: [6:0.50]		; SKX-NEXT: vmovdqa (%rdi), %xmm1 # sched: [6:0.50]
; SKX-NEXT: vptestnmb %xmm0, %xmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %xmm0, %xmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm1[1,3,12,5,13,1,2,11,0,9,14,8,10,0,10,9] sched: [7:1.00]		; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm1[1,3,12,5,13,1,2,11,0,9,14,8,10,0,10,9] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
Show All 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%res = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 9, i32 6, i32 5, i32 15, i32 0, i32 0, i32 15, i32 2, i32 1, i32 3, i32 12, i32 14, i32 0, i32 6, i32 1, i32 4>		%res = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 9, i32 6, i32 5, i32 15, i32 0, i32 0, i32 15, i32 2, i32 1, i32 3, i32 12, i32 14, i32 0, i32 6, i32 1, i32 4>
ret <16 x i8> %res		ret <16 x i8> %res
}		}
define <16 x i8> @test_masked_16xi8_perm_mem_mask3(<16 x i8>* %vp, <16 x i8> %vec2, <16 x i8> %mask) {		define <16 x i8> @test_masked_16xi8_perm_mem_mask3(<16 x i8>* %vp, <16 x i8> %vec2, <16 x i8> %mask) {
; GENERIC-LABEL: test_masked_16xi8_perm_mem_mask3:		; GENERIC-LABEL: test_masked_16xi8_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa (%rdi), %xmm2 # sched: [6:0.50]		; GENERIC-NEXT: vmovdqa (%rdi), %xmm2 # sched: [6:0.50]
; GENERIC-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} = xmm2[9,6,5,15,0,0,15,2,1,3,12,14,0,6,1,4] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} = xmm2[9,6,5,15,0,0,15,2,1,3,12,14,0,6,1,4] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi8_perm_mem_mask3:		; SKX-LABEL: test_masked_16xi8_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa (%rdi), %xmm2 # sched: [6:0.50]		; SKX-NEXT: vmovdqa (%rdi), %xmm2 # sched: [6:0.50]
; SKX-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} = xmm2[9,6,5,15,0,0,15,2,1,3,12,14,0,6,1,4] sched: [7:1.00]		; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} = xmm2[9,6,5,15,0,0,15,2,1,3,12,14,0,6,1,4] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i8>, <16 x i8>* %vp		%vec = load <16 x i8>, <16 x i8>* %vp
%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 9, i32 6, i32 5, i32 15, i32 0, i32 0, i32 15, i32 2, i32 1, i32 3, i32 12, i32 14, i32 0, i32 6, i32 1, i32 4>		%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 9, i32 6, i32 5, i32 15, i32 0, i32 0, i32 15, i32 2, i32 1, i32 3, i32 12, i32 14, i32 0, i32 6, i32 1, i32 4>
%cmp = icmp eq <16 x i8> %mask, zeroinitializer		%cmp = icmp eq <16 x i8> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> %vec2		%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> %vec2
ret <16 x i8> %res		ret <16 x i8> %res
}		}

define <16 x i8> @test_masked_z_16xi8_perm_mem_mask3(<16 x i8>* %vp, <16 x i8> %mask) {		define <16 x i8> @test_masked_z_16xi8_perm_mem_mask3(<16 x i8>* %vp, <16 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_16xi8_perm_mem_mask3:		; GENERIC-LABEL: test_masked_z_16xi8_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa (%rdi), %xmm1 # sched: [6:0.50]		; GENERIC-NEXT: vmovdqa (%rdi), %xmm1 # sched: [6:0.50]
; GENERIC-NEXT: vptestnmb %xmm0, %xmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %xmm0, %xmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm1[9,6,5,15,0,0,15,2,1,3,12,14,0,6,1,4] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm1[9,6,5,15,0,0,15,2,1,3,12,14,0,6,1,4] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi8_perm_mem_mask3:		; SKX-LABEL: test_masked_z_16xi8_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa (%rdi), %xmm1 # sched: [6:0.50]		; SKX-NEXT: vmovdqa (%rdi), %xmm1 # sched: [6:0.50]
; SKX-NEXT: vptestnmb %xmm0, %xmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %xmm0, %xmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm1[9,6,5,15,0,0,15,2,1,3,12,14,0,6,1,4] sched: [7:1.00]		; SKX-NEXT: vpshufb {{.*#+}} xmm0 {%k1} {z} = xmm1[9,6,5,15,0,0,15,2,1,3,12,14,0,6,1,4] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i8>, <16 x i8>* %vp		%vec = load <16 x i8>, <16 x i8>* %vp
%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 9, i32 6, i32 5, i32 15, i32 0, i32 0, i32 15, i32 2, i32 1, i32 3, i32 12, i32 14, i32 0, i32 6, i32 1, i32 4>		%shuf = shufflevector <16 x i8> %vec, <16 x i8> undef, <16 x i32> <i32 9, i32 6, i32 5, i32 15, i32 0, i32 0, i32 15, i32 2, i32 1, i32 3, i32 12, i32 14, i32 0, i32 6, i32 1, i32 4>
%cmp = icmp eq <16 x i8> %mask, zeroinitializer		%cmp = icmp eq <16 x i8> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i8> %shuf, <16 x i8> zeroinitializer
ret <16 x i8> %res		ret <16 x i8> %res
}		}

define <32 x i8> @test_32xi8_perm_mask0(<32 x i8> %vec) {		define <32 x i8> @test_32xi8_perm_mask0(<32 x i8> %vec) {
; GENERIC-LABEL: test_32xi8_perm_mask0:		; GENERIC-LABEL: test_32xi8_perm_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[8,0,1,15,3,5,11,13,14,2,10,15,0,10,13,5,20,25,23,18,23,22,25,24,20,21,29,20,24,16,27,21] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[8,0,1,15,3,5,11,13,14,2,10,15,0,10,13,5,20,25,23,18,23,22,25,24,20,21,29,20,24,16,27,21] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_32xi8_perm_mask0:		; SKX-LABEL: test_32xi8_perm_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[8,0,1,15,3,5,11,13,14,2,10,15,0,10,13,5,20,25,23,18,23,22,25,24,20,21,29,20,24,16,27,21] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[8,0,1,15,3,5,11,13,14,2,10,15,0,10,13,5,20,25,23,18,23,22,25,24,20,21,29,20,24,16,27,21] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%res = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 8, i32 0, i32 1, i32 15, i32 3, i32 5, i32 11, i32 13, i32 14, i32 2, i32 10, i32 15, i32 0, i32 10, i32 13, i32 5, i32 20, i32 25, i32 23, i32 18, i32 23, i32 22, i32 25, i32 24, i32 20, i32 21, i32 29, i32 20, i32 24, i32 16, i32 27, i32 21>		%res = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 8, i32 0, i32 1, i32 15, i32 3, i32 5, i32 11, i32 13, i32 14, i32 2, i32 10, i32 15, i32 0, i32 10, i32 13, i32 5, i32 20, i32 25, i32 23, i32 18, i32 23, i32 22, i32 25, i32 24, i32 20, i32 21, i32 29, i32 20, i32 24, i32 16, i32 27, i32 21>
ret <32 x i8> %res		ret <32 x i8> %res
}		}
define <32 x i8> @test_masked_32xi8_perm_mask0(<32 x i8> %vec, <32 x i8> %vec2, <32 x i8> %mask) {		define <32 x i8> @test_masked_32xi8_perm_mask0(<32 x i8> %vec, <32 x i8> %vec2, <32 x i8> %mask) {
; GENERIC-LABEL: test_masked_32xi8_perm_mask0:		; GENERIC-LABEL: test_masked_32xi8_perm_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} ymm1 {%k1} = ymm0[8,0,1,15,3,5,11,13,14,2,10,15,0,10,13,5,20,25,23,18,23,22,25,24,20,21,29,20,24,16,27,21] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} ymm1 {%k1} = ymm0[8,0,1,15,3,5,11,13,14,2,10,15,0,10,13,5,20,25,23,18,23,22,25,24,20,21,29,20,24,16,27,21] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_32xi8_perm_mask0:		; SKX-LABEL: test_masked_32xi8_perm_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} ymm1 {%k1} = ymm0[8,0,1,15,3,5,11,13,14,2,10,15,0,10,13,5,20,25,23,18,23,22,25,24,20,21,29,20,24,16,27,21] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} ymm1 {%k1} = ymm0[8,0,1,15,3,5,11,13,14,2,10,15,0,10,13,5,20,25,23,18,23,22,25,24,20,21,29,20,24,16,27,21] sched: [8:1.00]
; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 8, i32 0, i32 1, i32 15, i32 3, i32 5, i32 11, i32 13, i32 14, i32 2, i32 10, i32 15, i32 0, i32 10, i32 13, i32 5, i32 20, i32 25, i32 23, i32 18, i32 23, i32 22, i32 25, i32 24, i32 20, i32 21, i32 29, i32 20, i32 24, i32 16, i32 27, i32 21>		%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 8, i32 0, i32 1, i32 15, i32 3, i32 5, i32 11, i32 13, i32 14, i32 2, i32 10, i32 15, i32 0, i32 10, i32 13, i32 5, i32 20, i32 25, i32 23, i32 18, i32 23, i32 22, i32 25, i32 24, i32 20, i32 21, i32 29, i32 20, i32 24, i32 16, i32 27, i32 21>
%cmp = icmp eq <32 x i8> %mask, zeroinitializer		%cmp = icmp eq <32 x i8> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> %vec2		%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> %vec2
ret <32 x i8> %res		ret <32 x i8> %res
}		}

define <32 x i8> @test_masked_z_32xi8_perm_mask0(<32 x i8> %vec, <32 x i8> %mask) {		define <32 x i8> @test_masked_z_32xi8_perm_mask0(<32 x i8> %vec, <32 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_32xi8_perm_mask0:		; GENERIC-LABEL: test_masked_z_32xi8_perm_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm0[8,0,1,15,3,5,11,13,14,2,10,15,0,10,13,5,20,25,23,18,23,22,25,24,20,21,29,20,24,16,27,21] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm0[8,0,1,15,3,5,11,13,14,2,10,15,0,10,13,5,20,25,23,18,23,22,25,24,20,21,29,20,24,16,27,21] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_32xi8_perm_mask0:		; SKX-LABEL: test_masked_z_32xi8_perm_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm0[8,0,1,15,3,5,11,13,14,2,10,15,0,10,13,5,20,25,23,18,23,22,25,24,20,21,29,20,24,16,27,21] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm0[8,0,1,15,3,5,11,13,14,2,10,15,0,10,13,5,20,25,23,18,23,22,25,24,20,21,29,20,24,16,27,21] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 8, i32 0, i32 1, i32 15, i32 3, i32 5, i32 11, i32 13, i32 14, i32 2, i32 10, i32 15, i32 0, i32 10, i32 13, i32 5, i32 20, i32 25, i32 23, i32 18, i32 23, i32 22, i32 25, i32 24, i32 20, i32 21, i32 29, i32 20, i32 24, i32 16, i32 27, i32 21>		%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 8, i32 0, i32 1, i32 15, i32 3, i32 5, i32 11, i32 13, i32 14, i32 2, i32 10, i32 15, i32 0, i32 10, i32 13, i32 5, i32 20, i32 25, i32 23, i32 18, i32 23, i32 22, i32 25, i32 24, i32 20, i32 21, i32 29, i32 20, i32 24, i32 16, i32 27, i32 21>
%cmp = icmp eq <32 x i8> %mask, zeroinitializer		%cmp = icmp eq <32 x i8> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> zeroinitializer		%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> zeroinitializer
ret <32 x i8> %res		ret <32 x i8> %res
}		}
define <32 x i8> @test_masked_32xi8_perm_mask1(<32 x i8> %vec, <32 x i8> %vec2, <32 x i8> %mask) {		define <32 x i8> @test_masked_32xi8_perm_mask1(<32 x i8> %vec, <32 x i8> %vec2, <32 x i8> %mask) {
; GENERIC-LABEL: test_masked_32xi8_perm_mask1:		; GENERIC-LABEL: test_masked_32xi8_perm_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} ymm1 {%k1} = ymm0[0,4,3,15,5,4,5,15,10,9,11,6,6,10,0,3,21,19,26,22,30,25,22,22,27,22,26,16,23,20,18,24] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} ymm1 {%k1} = ymm0[0,4,3,15,5,4,5,15,10,9,11,6,6,10,0,3,21,19,26,22,30,25,22,22,27,22,26,16,23,20,18,24] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_32xi8_perm_mask1:		; SKX-LABEL: test_masked_32xi8_perm_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} ymm1 {%k1} = ymm0[0,4,3,15,5,4,5,15,10,9,11,6,6,10,0,3,21,19,26,22,30,25,22,22,27,22,26,16,23,20,18,24] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} ymm1 {%k1} = ymm0[0,4,3,15,5,4,5,15,10,9,11,6,6,10,0,3,21,19,26,22,30,25,22,22,27,22,26,16,23,20,18,24] sched: [8:1.00]
; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 0, i32 4, i32 3, i32 15, i32 5, i32 4, i32 5, i32 15, i32 10, i32 9, i32 11, i32 6, i32 6, i32 10, i32 0, i32 3, i32 21, i32 19, i32 26, i32 22, i32 30, i32 25, i32 22, i32 22, i32 27, i32 22, i32 26, i32 16, i32 23, i32 20, i32 18, i32 24>		%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 0, i32 4, i32 3, i32 15, i32 5, i32 4, i32 5, i32 15, i32 10, i32 9, i32 11, i32 6, i32 6, i32 10, i32 0, i32 3, i32 21, i32 19, i32 26, i32 22, i32 30, i32 25, i32 22, i32 22, i32 27, i32 22, i32 26, i32 16, i32 23, i32 20, i32 18, i32 24>
%cmp = icmp eq <32 x i8> %mask, zeroinitializer		%cmp = icmp eq <32 x i8> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> %vec2		%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> %vec2
ret <32 x i8> %res		ret <32 x i8> %res
}		}

define <32 x i8> @test_masked_z_32xi8_perm_mask1(<32 x i8> %vec, <32 x i8> %mask) {		define <32 x i8> @test_masked_z_32xi8_perm_mask1(<32 x i8> %vec, <32 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_32xi8_perm_mask1:		; GENERIC-LABEL: test_masked_z_32xi8_perm_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm0[0,4,3,15,5,4,5,15,10,9,11,6,6,10,0,3,21,19,26,22,30,25,22,22,27,22,26,16,23,20,18,24] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm0[0,4,3,15,5,4,5,15,10,9,11,6,6,10,0,3,21,19,26,22,30,25,22,22,27,22,26,16,23,20,18,24] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_32xi8_perm_mask1:		; SKX-LABEL: test_masked_z_32xi8_perm_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm0[0,4,3,15,5,4,5,15,10,9,11,6,6,10,0,3,21,19,26,22,30,25,22,22,27,22,26,16,23,20,18,24] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm0[0,4,3,15,5,4,5,15,10,9,11,6,6,10,0,3,21,19,26,22,30,25,22,22,27,22,26,16,23,20,18,24] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 0, i32 4, i32 3, i32 15, i32 5, i32 4, i32 5, i32 15, i32 10, i32 9, i32 11, i32 6, i32 6, i32 10, i32 0, i32 3, i32 21, i32 19, i32 26, i32 22, i32 30, i32 25, i32 22, i32 22, i32 27, i32 22, i32 26, i32 16, i32 23, i32 20, i32 18, i32 24>		%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 0, i32 4, i32 3, i32 15, i32 5, i32 4, i32 5, i32 15, i32 10, i32 9, i32 11, i32 6, i32 6, i32 10, i32 0, i32 3, i32 21, i32 19, i32 26, i32 22, i32 30, i32 25, i32 22, i32 22, i32 27, i32 22, i32 26, i32 16, i32 23, i32 20, i32 18, i32 24>
%cmp = icmp eq <32 x i8> %mask, zeroinitializer		%cmp = icmp eq <32 x i8> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> zeroinitializer		%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> zeroinitializer
ret <32 x i8> %res		ret <32 x i8> %res
}		}
define <32 x i8> @test_masked_32xi8_perm_mask2(<32 x i8> %vec, <32 x i8> %vec2, <32 x i8> %mask) {		define <32 x i8> @test_masked_32xi8_perm_mask2(<32 x i8> %vec, <32 x i8> %vec2, <32 x i8> %mask) {
; GENERIC-LABEL: test_masked_32xi8_perm_mask2:		; GENERIC-LABEL: test_masked_32xi8_perm_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} ymm1 {%k1} = ymm0[7,8,12,14,7,4,7,12,14,12,3,15,10,1,11,15,22,26,21,19,27,16,29,24,17,17,26,29,20,31,17,29] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} ymm1 {%k1} = ymm0[7,8,12,14,7,4,7,12,14,12,3,15,10,1,11,15,22,26,21,19,27,16,29,24,17,17,26,29,20,31,17,29] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_32xi8_perm_mask2:		; SKX-LABEL: test_masked_32xi8_perm_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} ymm1 {%k1} = ymm0[7,8,12,14,7,4,7,12,14,12,3,15,10,1,11,15,22,26,21,19,27,16,29,24,17,17,26,29,20,31,17,29] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} ymm1 {%k1} = ymm0[7,8,12,14,7,4,7,12,14,12,3,15,10,1,11,15,22,26,21,19,27,16,29,24,17,17,26,29,20,31,17,29] sched: [8:1.00]
; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 7, i32 8, i32 12, i32 14, i32 7, i32 4, i32 7, i32 12, i32 14, i32 12, i32 3, i32 15, i32 10, i32 1, i32 11, i32 15, i32 22, i32 26, i32 21, i32 19, i32 27, i32 16, i32 29, i32 24, i32 17, i32 17, i32 26, i32 29, i32 20, i32 31, i32 17, i32 29>		%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 7, i32 8, i32 12, i32 14, i32 7, i32 4, i32 7, i32 12, i32 14, i32 12, i32 3, i32 15, i32 10, i32 1, i32 11, i32 15, i32 22, i32 26, i32 21, i32 19, i32 27, i32 16, i32 29, i32 24, i32 17, i32 17, i32 26, i32 29, i32 20, i32 31, i32 17, i32 29>
%cmp = icmp eq <32 x i8> %mask, zeroinitializer		%cmp = icmp eq <32 x i8> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> %vec2		%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> %vec2
ret <32 x i8> %res		ret <32 x i8> %res
}		}

define <32 x i8> @test_masked_z_32xi8_perm_mask2(<32 x i8> %vec, <32 x i8> %mask) {		define <32 x i8> @test_masked_z_32xi8_perm_mask2(<32 x i8> %vec, <32 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_32xi8_perm_mask2:		; GENERIC-LABEL: test_masked_z_32xi8_perm_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm0[7,8,12,14,7,4,7,12,14,12,3,15,10,1,11,15,22,26,21,19,27,16,29,24,17,17,26,29,20,31,17,29] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm0[7,8,12,14,7,4,7,12,14,12,3,15,10,1,11,15,22,26,21,19,27,16,29,24,17,17,26,29,20,31,17,29] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_32xi8_perm_mask2:		; SKX-LABEL: test_masked_z_32xi8_perm_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm0[7,8,12,14,7,4,7,12,14,12,3,15,10,1,11,15,22,26,21,19,27,16,29,24,17,17,26,29,20,31,17,29] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm0[7,8,12,14,7,4,7,12,14,12,3,15,10,1,11,15,22,26,21,19,27,16,29,24,17,17,26,29,20,31,17,29] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 7, i32 8, i32 12, i32 14, i32 7, i32 4, i32 7, i32 12, i32 14, i32 12, i32 3, i32 15, i32 10, i32 1, i32 11, i32 15, i32 22, i32 26, i32 21, i32 19, i32 27, i32 16, i32 29, i32 24, i32 17, i32 17, i32 26, i32 29, i32 20, i32 31, i32 17, i32 29>		%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 7, i32 8, i32 12, i32 14, i32 7, i32 4, i32 7, i32 12, i32 14, i32 12, i32 3, i32 15, i32 10, i32 1, i32 11, i32 15, i32 22, i32 26, i32 21, i32 19, i32 27, i32 16, i32 29, i32 24, i32 17, i32 17, i32 26, i32 29, i32 20, i32 31, i32 17, i32 29>
%cmp = icmp eq <32 x i8> %mask, zeroinitializer		%cmp = icmp eq <32 x i8> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> zeroinitializer		%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> zeroinitializer
ret <32 x i8> %res		ret <32 x i8> %res
}		}
define <32 x i8> @test_32xi8_perm_mask3(<32 x i8> %vec) {		define <32 x i8> @test_32xi8_perm_mask3(<32 x i8> %vec) {
; GENERIC-LABEL: test_32xi8_perm_mask3:		; GENERIC-LABEL: test_32xi8_perm_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[6,1,4,7,12,13,2,8,10,5,13,4,0,0,10,8,31,31,30,16,27,27,26,27,30,26,21,24,19,25,16,18] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[6,1,4,7,12,13,2,8,10,5,13,4,0,0,10,8,31,31,30,16,27,27,26,27,30,26,21,24,19,25,16,18] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_32xi8_perm_mask3:		; SKX-LABEL: test_32xi8_perm_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[6,1,4,7,12,13,2,8,10,5,13,4,0,0,10,8,31,31,30,16,27,27,26,27,30,26,21,24,19,25,16,18] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[6,1,4,7,12,13,2,8,10,5,13,4,0,0,10,8,31,31,30,16,27,27,26,27,30,26,21,24,19,25,16,18] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%res = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 6, i32 1, i32 4, i32 7, i32 12, i32 13, i32 2, i32 8, i32 10, i32 5, i32 13, i32 4, i32 0, i32 0, i32 10, i32 8, i32 31, i32 31, i32 30, i32 16, i32 27, i32 27, i32 26, i32 27, i32 30, i32 26, i32 21, i32 24, i32 19, i32 25, i32 16, i32 18>		%res = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 6, i32 1, i32 4, i32 7, i32 12, i32 13, i32 2, i32 8, i32 10, i32 5, i32 13, i32 4, i32 0, i32 0, i32 10, i32 8, i32 31, i32 31, i32 30, i32 16, i32 27, i32 27, i32 26, i32 27, i32 30, i32 26, i32 21, i32 24, i32 19, i32 25, i32 16, i32 18>
ret <32 x i8> %res		ret <32 x i8> %res
}		}
define <32 x i8> @test_masked_32xi8_perm_mask3(<32 x i8> %vec, <32 x i8> %vec2, <32 x i8> %mask) {		define <32 x i8> @test_masked_32xi8_perm_mask3(<32 x i8> %vec, <32 x i8> %vec2, <32 x i8> %mask) {
; GENERIC-LABEL: test_masked_32xi8_perm_mask3:		; GENERIC-LABEL: test_masked_32xi8_perm_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} ymm1 {%k1} = ymm0[6,1,4,7,12,13,2,8,10,5,13,4,0,0,10,8,31,31,30,16,27,27,26,27,30,26,21,24,19,25,16,18] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} ymm1 {%k1} = ymm0[6,1,4,7,12,13,2,8,10,5,13,4,0,0,10,8,31,31,30,16,27,27,26,27,30,26,21,24,19,25,16,18] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_32xi8_perm_mask3:		; SKX-LABEL: test_masked_32xi8_perm_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} ymm1 {%k1} = ymm0[6,1,4,7,12,13,2,8,10,5,13,4,0,0,10,8,31,31,30,16,27,27,26,27,30,26,21,24,19,25,16,18] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} ymm1 {%k1} = ymm0[6,1,4,7,12,13,2,8,10,5,13,4,0,0,10,8,31,31,30,16,27,27,26,27,30,26,21,24,19,25,16,18] sched: [8:1.00]
; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 6, i32 1, i32 4, i32 7, i32 12, i32 13, i32 2, i32 8, i32 10, i32 5, i32 13, i32 4, i32 0, i32 0, i32 10, i32 8, i32 31, i32 31, i32 30, i32 16, i32 27, i32 27, i32 26, i32 27, i32 30, i32 26, i32 21, i32 24, i32 19, i32 25, i32 16, i32 18>		%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 6, i32 1, i32 4, i32 7, i32 12, i32 13, i32 2, i32 8, i32 10, i32 5, i32 13, i32 4, i32 0, i32 0, i32 10, i32 8, i32 31, i32 31, i32 30, i32 16, i32 27, i32 27, i32 26, i32 27, i32 30, i32 26, i32 21, i32 24, i32 19, i32 25, i32 16, i32 18>
%cmp = icmp eq <32 x i8> %mask, zeroinitializer		%cmp = icmp eq <32 x i8> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> %vec2		%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> %vec2
ret <32 x i8> %res		ret <32 x i8> %res
}		}

define <32 x i8> @test_masked_z_32xi8_perm_mask3(<32 x i8> %vec, <32 x i8> %mask) {		define <32 x i8> @test_masked_z_32xi8_perm_mask3(<32 x i8> %vec, <32 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_32xi8_perm_mask3:		; GENERIC-LABEL: test_masked_z_32xi8_perm_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm0[6,1,4,7,12,13,2,8,10,5,13,4,0,0,10,8,31,31,30,16,27,27,26,27,30,26,21,24,19,25,16,18] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm0[6,1,4,7,12,13,2,8,10,5,13,4,0,0,10,8,31,31,30,16,27,27,26,27,30,26,21,24,19,25,16,18] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_32xi8_perm_mask3:		; SKX-LABEL: test_masked_z_32xi8_perm_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm0[6,1,4,7,12,13,2,8,10,5,13,4,0,0,10,8,31,31,30,16,27,27,26,27,30,26,21,24,19,25,16,18] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm0[6,1,4,7,12,13,2,8,10,5,13,4,0,0,10,8,31,31,30,16,27,27,26,27,30,26,21,24,19,25,16,18] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 6, i32 1, i32 4, i32 7, i32 12, i32 13, i32 2, i32 8, i32 10, i32 5, i32 13, i32 4, i32 0, i32 0, i32 10, i32 8, i32 31, i32 31, i32 30, i32 16, i32 27, i32 27, i32 26, i32 27, i32 30, i32 26, i32 21, i32 24, i32 19, i32 25, i32 16, i32 18>		%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 6, i32 1, i32 4, i32 7, i32 12, i32 13, i32 2, i32 8, i32 10, i32 5, i32 13, i32 4, i32 0, i32 0, i32 10, i32 8, i32 31, i32 31, i32 30, i32 16, i32 27, i32 27, i32 26, i32 27, i32 30, i32 26, i32 21, i32 24, i32 19, i32 25, i32 16, i32 18>
%cmp = icmp eq <32 x i8> %mask, zeroinitializer		%cmp = icmp eq <32 x i8> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> zeroinitializer		%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> zeroinitializer
ret <32 x i8> %res		ret <32 x i8> %res
}		}
define <32 x i8> @test_32xi8_perm_mem_mask0(<32 x i8>* %vp) {		define <32 x i8> @test_32xi8_perm_mem_mask0(<32 x i8>* %vp) {
; GENERIC-LABEL: test_32xi8_perm_mem_mask0:		; GENERIC-LABEL: test_32xi8_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa (%rdi), %ymm0 # sched: [7:0.50]		; GENERIC-NEXT: vmovdqa (%rdi), %ymm0 # sched: [7:0.50]
; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[9,0,2,15,4,6,8,4,7,3,0,2,8,1,6,5,22,17,30,23,29,31,21,23,27,22,20,27,30,30,26,22] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[9,0,2,15,4,6,8,4,7,3,0,2,8,1,6,5,22,17,30,23,29,31,21,23,27,22,20,27,30,30,26,22] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_32xi8_perm_mem_mask0:		; SKX-LABEL: test_32xi8_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa (%rdi), %ymm0 # sched: [7:0.50]		; SKX-NEXT: vmovdqa (%rdi), %ymm0 # sched: [7:0.50]
; SKX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[9,0,2,15,4,6,8,4,7,3,0,2,8,1,6,5,22,17,30,23,29,31,21,23,27,22,20,27,30,30,26,22] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[9,0,2,15,4,6,8,4,7,3,0,2,8,1,6,5,22,17,30,23,29,31,21,23,27,22,20,27,30,30,26,22] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i8>, <32 x i8>* %vp		%vec = load <32 x i8>, <32 x i8>* %vp
%res = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 9, i32 0, i32 2, i32 15, i32 4, i32 6, i32 8, i32 4, i32 7, i32 3, i32 0, i32 2, i32 8, i32 1, i32 6, i32 5, i32 22, i32 17, i32 30, i32 23, i32 29, i32 31, i32 21, i32 23, i32 27, i32 22, i32 20, i32 27, i32 30, i32 30, i32 26, i32 22>		%res = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 9, i32 0, i32 2, i32 15, i32 4, i32 6, i32 8, i32 4, i32 7, i32 3, i32 0, i32 2, i32 8, i32 1, i32 6, i32 5, i32 22, i32 17, i32 30, i32 23, i32 29, i32 31, i32 21, i32 23, i32 27, i32 22, i32 20, i32 27, i32 30, i32 30, i32 26, i32 22>
ret <32 x i8> %res		ret <32 x i8> %res
}		}
define <32 x i8> @test_masked_32xi8_perm_mem_mask0(<32 x i8>* %vp, <32 x i8> %vec2, <32 x i8> %mask) {		define <32 x i8> @test_masked_32xi8_perm_mem_mask0(<32 x i8>* %vp, <32 x i8> %vec2, <32 x i8> %mask) {
; GENERIC-LABEL: test_masked_32xi8_perm_mem_mask0:		; GENERIC-LABEL: test_masked_32xi8_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa (%rdi), %ymm2 # sched: [7:0.50]		; GENERIC-NEXT: vmovdqa (%rdi), %ymm2 # sched: [7:0.50]
; GENERIC-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} = ymm2[9,0,2,15,4,6,8,4,7,3,0,2,8,1,6,5,22,17,30,23,29,31,21,23,27,22,20,27,30,30,26,22] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} = ymm2[9,0,2,15,4,6,8,4,7,3,0,2,8,1,6,5,22,17,30,23,29,31,21,23,27,22,20,27,30,30,26,22] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_32xi8_perm_mem_mask0:		; SKX-LABEL: test_masked_32xi8_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa (%rdi), %ymm2 # sched: [7:0.50]		; SKX-NEXT: vmovdqa (%rdi), %ymm2 # sched: [7:0.50]
; SKX-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} = ymm2[9,0,2,15,4,6,8,4,7,3,0,2,8,1,6,5,22,17,30,23,29,31,21,23,27,22,20,27,30,30,26,22] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} = ymm2[9,0,2,15,4,6,8,4,7,3,0,2,8,1,6,5,22,17,30,23,29,31,21,23,27,22,20,27,30,30,26,22] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i8>, <32 x i8>* %vp		%vec = load <32 x i8>, <32 x i8>* %vp
%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 9, i32 0, i32 2, i32 15, i32 4, i32 6, i32 8, i32 4, i32 7, i32 3, i32 0, i32 2, i32 8, i32 1, i32 6, i32 5, i32 22, i32 17, i32 30, i32 23, i32 29, i32 31, i32 21, i32 23, i32 27, i32 22, i32 20, i32 27, i32 30, i32 30, i32 26, i32 22>		%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 9, i32 0, i32 2, i32 15, i32 4, i32 6, i32 8, i32 4, i32 7, i32 3, i32 0, i32 2, i32 8, i32 1, i32 6, i32 5, i32 22, i32 17, i32 30, i32 23, i32 29, i32 31, i32 21, i32 23, i32 27, i32 22, i32 20, i32 27, i32 30, i32 30, i32 26, i32 22>
%cmp = icmp eq <32 x i8> %mask, zeroinitializer		%cmp = icmp eq <32 x i8> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> %vec2		%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> %vec2
ret <32 x i8> %res		ret <32 x i8> %res
}		}

define <32 x i8> @test_masked_z_32xi8_perm_mem_mask0(<32 x i8>* %vp, <32 x i8> %mask) {		define <32 x i8> @test_masked_z_32xi8_perm_mem_mask0(<32 x i8>* %vp, <32 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_32xi8_perm_mem_mask0:		; GENERIC-LABEL: test_masked_z_32xi8_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa (%rdi), %ymm1 # sched: [7:0.50]		; GENERIC-NEXT: vmovdqa (%rdi), %ymm1 # sched: [7:0.50]
; GENERIC-NEXT: vptestnmb %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm1[9,0,2,15,4,6,8,4,7,3,0,2,8,1,6,5,22,17,30,23,29,31,21,23,27,22,20,27,30,30,26,22] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm1[9,0,2,15,4,6,8,4,7,3,0,2,8,1,6,5,22,17,30,23,29,31,21,23,27,22,20,27,30,30,26,22] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_32xi8_perm_mem_mask0:		; SKX-LABEL: test_masked_z_32xi8_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa (%rdi), %ymm1 # sched: [7:0.50]		; SKX-NEXT: vmovdqa (%rdi), %ymm1 # sched: [7:0.50]
; SKX-NEXT: vptestnmb %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm1[9,0,2,15,4,6,8,4,7,3,0,2,8,1,6,5,22,17,30,23,29,31,21,23,27,22,20,27,30,30,26,22] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm1[9,0,2,15,4,6,8,4,7,3,0,2,8,1,6,5,22,17,30,23,29,31,21,23,27,22,20,27,30,30,26,22] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i8>, <32 x i8>* %vp		%vec = load <32 x i8>, <32 x i8>* %vp
%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 9, i32 0, i32 2, i32 15, i32 4, i32 6, i32 8, i32 4, i32 7, i32 3, i32 0, i32 2, i32 8, i32 1, i32 6, i32 5, i32 22, i32 17, i32 30, i32 23, i32 29, i32 31, i32 21, i32 23, i32 27, i32 22, i32 20, i32 27, i32 30, i32 30, i32 26, i32 22>		%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 9, i32 0, i32 2, i32 15, i32 4, i32 6, i32 8, i32 4, i32 7, i32 3, i32 0, i32 2, i32 8, i32 1, i32 6, i32 5, i32 22, i32 17, i32 30, i32 23, i32 29, i32 31, i32 21, i32 23, i32 27, i32 22, i32 20, i32 27, i32 30, i32 30, i32 26, i32 22>
%cmp = icmp eq <32 x i8> %mask, zeroinitializer		%cmp = icmp eq <32 x i8> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> zeroinitializer		%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> zeroinitializer
ret <32 x i8> %res		ret <32 x i8> %res
}		}

define <32 x i8> @test_masked_32xi8_perm_mem_mask1(<32 x i8>* %vp, <32 x i8> %vec2, <32 x i8> %mask) {		define <32 x i8> @test_masked_32xi8_perm_mem_mask1(<32 x i8>* %vp, <32 x i8> %vec2, <32 x i8> %mask) {
; GENERIC-LABEL: test_masked_32xi8_perm_mem_mask1:		; GENERIC-LABEL: test_masked_32xi8_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa (%rdi), %ymm2 # sched: [7:0.50]		; GENERIC-NEXT: vmovdqa (%rdi), %ymm2 # sched: [7:0.50]
; GENERIC-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} = ymm2[15,10,1,1,11,0,0,6,8,7,7,9,10,6,5,15,20,28,22,21,17,29,27,30,23,26,17,22,19,16,31,19] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} = ymm2[15,10,1,1,11,0,0,6,8,7,7,9,10,6,5,15,20,28,22,21,17,29,27,30,23,26,17,22,19,16,31,19] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_32xi8_perm_mem_mask1:		; SKX-LABEL: test_masked_32xi8_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa (%rdi), %ymm2 # sched: [7:0.50]		; SKX-NEXT: vmovdqa (%rdi), %ymm2 # sched: [7:0.50]
; SKX-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} = ymm2[15,10,1,1,11,0,0,6,8,7,7,9,10,6,5,15,20,28,22,21,17,29,27,30,23,26,17,22,19,16,31,19] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} = ymm2[15,10,1,1,11,0,0,6,8,7,7,9,10,6,5,15,20,28,22,21,17,29,27,30,23,26,17,22,19,16,31,19] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i8>, <32 x i8>* %vp		%vec = load <32 x i8>, <32 x i8>* %vp
%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 15, i32 10, i32 1, i32 1, i32 11, i32 0, i32 0, i32 6, i32 8, i32 7, i32 7, i32 9, i32 10, i32 6, i32 5, i32 15, i32 20, i32 28, i32 22, i32 21, i32 17, i32 29, i32 27, i32 30, i32 23, i32 26, i32 17, i32 22, i32 19, i32 16, i32 31, i32 19>		%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 15, i32 10, i32 1, i32 1, i32 11, i32 0, i32 0, i32 6, i32 8, i32 7, i32 7, i32 9, i32 10, i32 6, i32 5, i32 15, i32 20, i32 28, i32 22, i32 21, i32 17, i32 29, i32 27, i32 30, i32 23, i32 26, i32 17, i32 22, i32 19, i32 16, i32 31, i32 19>
%cmp = icmp eq <32 x i8> %mask, zeroinitializer		%cmp = icmp eq <32 x i8> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> %vec2		%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> %vec2
ret <32 x i8> %res		ret <32 x i8> %res
}		}

define <32 x i8> @test_masked_z_32xi8_perm_mem_mask1(<32 x i8>* %vp, <32 x i8> %mask) {		define <32 x i8> @test_masked_z_32xi8_perm_mem_mask1(<32 x i8>* %vp, <32 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_32xi8_perm_mem_mask1:		; GENERIC-LABEL: test_masked_z_32xi8_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa (%rdi), %ymm1 # sched: [7:0.50]		; GENERIC-NEXT: vmovdqa (%rdi), %ymm1 # sched: [7:0.50]
; GENERIC-NEXT: vptestnmb %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm1[15,10,1,1,11,0,0,6,8,7,7,9,10,6,5,15,20,28,22,21,17,29,27,30,23,26,17,22,19,16,31,19] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm1[15,10,1,1,11,0,0,6,8,7,7,9,10,6,5,15,20,28,22,21,17,29,27,30,23,26,17,22,19,16,31,19] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_32xi8_perm_mem_mask1:		; SKX-LABEL: test_masked_z_32xi8_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa (%rdi), %ymm1 # sched: [7:0.50]		; SKX-NEXT: vmovdqa (%rdi), %ymm1 # sched: [7:0.50]
; SKX-NEXT: vptestnmb %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm1[15,10,1,1,11,0,0,6,8,7,7,9,10,6,5,15,20,28,22,21,17,29,27,30,23,26,17,22,19,16,31,19] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm1[15,10,1,1,11,0,0,6,8,7,7,9,10,6,5,15,20,28,22,21,17,29,27,30,23,26,17,22,19,16,31,19] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i8>, <32 x i8>* %vp		%vec = load <32 x i8>, <32 x i8>* %vp
%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 15, i32 10, i32 1, i32 1, i32 11, i32 0, i32 0, i32 6, i32 8, i32 7, i32 7, i32 9, i32 10, i32 6, i32 5, i32 15, i32 20, i32 28, i32 22, i32 21, i32 17, i32 29, i32 27, i32 30, i32 23, i32 26, i32 17, i32 22, i32 19, i32 16, i32 31, i32 19>		%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 15, i32 10, i32 1, i32 1, i32 11, i32 0, i32 0, i32 6, i32 8, i32 7, i32 7, i32 9, i32 10, i32 6, i32 5, i32 15, i32 20, i32 28, i32 22, i32 21, i32 17, i32 29, i32 27, i32 30, i32 23, i32 26, i32 17, i32 22, i32 19, i32 16, i32 31, i32 19>
%cmp = icmp eq <32 x i8> %mask, zeroinitializer		%cmp = icmp eq <32 x i8> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> zeroinitializer		%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> zeroinitializer
ret <32 x i8> %res		ret <32 x i8> %res
}		}

define <32 x i8> @test_masked_32xi8_perm_mem_mask2(<32 x i8>* %vp, <32 x i8> %vec2, <32 x i8> %mask) {		define <32 x i8> @test_masked_32xi8_perm_mem_mask2(<32 x i8>* %vp, <32 x i8> %vec2, <32 x i8> %mask) {
; GENERIC-LABEL: test_masked_32xi8_perm_mem_mask2:		; GENERIC-LABEL: test_masked_32xi8_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa (%rdi), %ymm2 # sched: [7:0.50]		; GENERIC-NEXT: vmovdqa (%rdi), %ymm2 # sched: [7:0.50]
; GENERIC-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} = ymm2[2,3,6,8,2,15,15,2,6,10,14,7,14,5,7,7,26,19,25,19,21,31,30,29,16,18,20,28,29,25,27,28] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} = ymm2[2,3,6,8,2,15,15,2,6,10,14,7,14,5,7,7,26,19,25,19,21,31,30,29,16,18,20,28,29,25,27,28] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_32xi8_perm_mem_mask2:		; SKX-LABEL: test_masked_32xi8_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa (%rdi), %ymm2 # sched: [7:0.50]		; SKX-NEXT: vmovdqa (%rdi), %ymm2 # sched: [7:0.50]
; SKX-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} = ymm2[2,3,6,8,2,15,15,2,6,10,14,7,14,5,7,7,26,19,25,19,21,31,30,29,16,18,20,28,29,25,27,28] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} = ymm2[2,3,6,8,2,15,15,2,6,10,14,7,14,5,7,7,26,19,25,19,21,31,30,29,16,18,20,28,29,25,27,28] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i8>, <32 x i8>* %vp		%vec = load <32 x i8>, <32 x i8>* %vp
%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 2, i32 3, i32 6, i32 8, i32 2, i32 15, i32 15, i32 2, i32 6, i32 10, i32 14, i32 7, i32 14, i32 5, i32 7, i32 7, i32 26, i32 19, i32 25, i32 19, i32 21, i32 31, i32 30, i32 29, i32 16, i32 18, i32 20, i32 28, i32 29, i32 25, i32 27, i32 28>		%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 2, i32 3, i32 6, i32 8, i32 2, i32 15, i32 15, i32 2, i32 6, i32 10, i32 14, i32 7, i32 14, i32 5, i32 7, i32 7, i32 26, i32 19, i32 25, i32 19, i32 21, i32 31, i32 30, i32 29, i32 16, i32 18, i32 20, i32 28, i32 29, i32 25, i32 27, i32 28>
%cmp = icmp eq <32 x i8> %mask, zeroinitializer		%cmp = icmp eq <32 x i8> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> %vec2		%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> %vec2
ret <32 x i8> %res		ret <32 x i8> %res
}		}

define <32 x i8> @test_masked_z_32xi8_perm_mem_mask2(<32 x i8>* %vp, <32 x i8> %mask) {		define <32 x i8> @test_masked_z_32xi8_perm_mem_mask2(<32 x i8>* %vp, <32 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_32xi8_perm_mem_mask2:		; GENERIC-LABEL: test_masked_z_32xi8_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa (%rdi), %ymm1 # sched: [7:0.50]		; GENERIC-NEXT: vmovdqa (%rdi), %ymm1 # sched: [7:0.50]
; GENERIC-NEXT: vptestnmb %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm1[2,3,6,8,2,15,15,2,6,10,14,7,14,5,7,7,26,19,25,19,21,31,30,29,16,18,20,28,29,25,27,28] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm1[2,3,6,8,2,15,15,2,6,10,14,7,14,5,7,7,26,19,25,19,21,31,30,29,16,18,20,28,29,25,27,28] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_32xi8_perm_mem_mask2:		; SKX-LABEL: test_masked_z_32xi8_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa (%rdi), %ymm1 # sched: [7:0.50]		; SKX-NEXT: vmovdqa (%rdi), %ymm1 # sched: [7:0.50]
; SKX-NEXT: vptestnmb %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm1[2,3,6,8,2,15,15,2,6,10,14,7,14,5,7,7,26,19,25,19,21,31,30,29,16,18,20,28,29,25,27,28] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm1[2,3,6,8,2,15,15,2,6,10,14,7,14,5,7,7,26,19,25,19,21,31,30,29,16,18,20,28,29,25,27,28] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i8>, <32 x i8>* %vp		%vec = load <32 x i8>, <32 x i8>* %vp
%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 2, i32 3, i32 6, i32 8, i32 2, i32 15, i32 15, i32 2, i32 6, i32 10, i32 14, i32 7, i32 14, i32 5, i32 7, i32 7, i32 26, i32 19, i32 25, i32 19, i32 21, i32 31, i32 30, i32 29, i32 16, i32 18, i32 20, i32 28, i32 29, i32 25, i32 27, i32 28>		%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 2, i32 3, i32 6, i32 8, i32 2, i32 15, i32 15, i32 2, i32 6, i32 10, i32 14, i32 7, i32 14, i32 5, i32 7, i32 7, i32 26, i32 19, i32 25, i32 19, i32 21, i32 31, i32 30, i32 29, i32 16, i32 18, i32 20, i32 28, i32 29, i32 25, i32 27, i32 28>
%cmp = icmp eq <32 x i8> %mask, zeroinitializer		%cmp = icmp eq <32 x i8> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> zeroinitializer		%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> zeroinitializer
ret <32 x i8> %res		ret <32 x i8> %res
}		}

define <32 x i8> @test_32xi8_perm_mem_mask3(<32 x i8>* %vp) {		define <32 x i8> @test_32xi8_perm_mem_mask3(<32 x i8>* %vp) {
; GENERIC-LABEL: test_32xi8_perm_mem_mask3:		; GENERIC-LABEL: test_32xi8_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa (%rdi), %ymm0 # sched: [7:0.50]		; GENERIC-NEXT: vmovdqa (%rdi), %ymm0 # sched: [7:0.50]
; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[1,1,13,0,3,0,0,13,5,2,2,10,15,8,14,8,25,26,28,28,31,27,30,19,24,25,29,23,28,22,25,29] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[1,1,13,0,3,0,0,13,5,2,2,10,15,8,14,8,25,26,28,28,31,27,30,19,24,25,29,23,28,22,25,29] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_32xi8_perm_mem_mask3:		; SKX-LABEL: test_32xi8_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa (%rdi), %ymm0 # sched: [7:0.50]		; SKX-NEXT: vmovdqa (%rdi), %ymm0 # sched: [7:0.50]
; SKX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[1,1,13,0,3,0,0,13,5,2,2,10,15,8,14,8,25,26,28,28,31,27,30,19,24,25,29,23,28,22,25,29] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[1,1,13,0,3,0,0,13,5,2,2,10,15,8,14,8,25,26,28,28,31,27,30,19,24,25,29,23,28,22,25,29] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i8>, <32 x i8>* %vp		%vec = load <32 x i8>, <32 x i8>* %vp
%res = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 1, i32 1, i32 13, i32 0, i32 3, i32 0, i32 0, i32 13, i32 5, i32 2, i32 2, i32 10, i32 15, i32 8, i32 14, i32 8, i32 25, i32 26, i32 28, i32 28, i32 31, i32 27, i32 30, i32 19, i32 24, i32 25, i32 29, i32 23, i32 28, i32 22, i32 25, i32 29>		%res = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 1, i32 1, i32 13, i32 0, i32 3, i32 0, i32 0, i32 13, i32 5, i32 2, i32 2, i32 10, i32 15, i32 8, i32 14, i32 8, i32 25, i32 26, i32 28, i32 28, i32 31, i32 27, i32 30, i32 19, i32 24, i32 25, i32 29, i32 23, i32 28, i32 22, i32 25, i32 29>
ret <32 x i8> %res		ret <32 x i8> %res
}		}
define <32 x i8> @test_masked_32xi8_perm_mem_mask3(<32 x i8>* %vp, <32 x i8> %vec2, <32 x i8> %mask) {		define <32 x i8> @test_masked_32xi8_perm_mem_mask3(<32 x i8>* %vp, <32 x i8> %vec2, <32 x i8> %mask) {
; GENERIC-LABEL: test_masked_32xi8_perm_mem_mask3:		; GENERIC-LABEL: test_masked_32xi8_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa (%rdi), %ymm2 # sched: [7:0.50]		; GENERIC-NEXT: vmovdqa (%rdi), %ymm2 # sched: [7:0.50]
; GENERIC-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} = ymm2[1,1,13,0,3,0,0,13,5,2,2,10,15,8,14,8,25,26,28,28,31,27,30,19,24,25,29,23,28,22,25,29] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} = ymm2[1,1,13,0,3,0,0,13,5,2,2,10,15,8,14,8,25,26,28,28,31,27,30,19,24,25,29,23,28,22,25,29] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_32xi8_perm_mem_mask3:		; SKX-LABEL: test_masked_32xi8_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa (%rdi), %ymm2 # sched: [7:0.50]		; SKX-NEXT: vmovdqa (%rdi), %ymm2 # sched: [7:0.50]
; SKX-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} = ymm2[1,1,13,0,3,0,0,13,5,2,2,10,15,8,14,8,25,26,28,28,31,27,30,19,24,25,29,23,28,22,25,29] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} = ymm2[1,1,13,0,3,0,0,13,5,2,2,10,15,8,14,8,25,26,28,28,31,27,30,19,24,25,29,23,28,22,25,29] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i8>, <32 x i8>* %vp		%vec = load <32 x i8>, <32 x i8>* %vp
%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 1, i32 1, i32 13, i32 0, i32 3, i32 0, i32 0, i32 13, i32 5, i32 2, i32 2, i32 10, i32 15, i32 8, i32 14, i32 8, i32 25, i32 26, i32 28, i32 28, i32 31, i32 27, i32 30, i32 19, i32 24, i32 25, i32 29, i32 23, i32 28, i32 22, i32 25, i32 29>		%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 1, i32 1, i32 13, i32 0, i32 3, i32 0, i32 0, i32 13, i32 5, i32 2, i32 2, i32 10, i32 15, i32 8, i32 14, i32 8, i32 25, i32 26, i32 28, i32 28, i32 31, i32 27, i32 30, i32 19, i32 24, i32 25, i32 29, i32 23, i32 28, i32 22, i32 25, i32 29>
%cmp = icmp eq <32 x i8> %mask, zeroinitializer		%cmp = icmp eq <32 x i8> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> %vec2		%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> %vec2
ret <32 x i8> %res		ret <32 x i8> %res
}		}

define <32 x i8> @test_masked_z_32xi8_perm_mem_mask3(<32 x i8>* %vp, <32 x i8> %mask) {		define <32 x i8> @test_masked_z_32xi8_perm_mem_mask3(<32 x i8>* %vp, <32 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_32xi8_perm_mem_mask3:		; GENERIC-LABEL: test_masked_z_32xi8_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa (%rdi), %ymm1 # sched: [7:0.50]		; GENERIC-NEXT: vmovdqa (%rdi), %ymm1 # sched: [7:0.50]
; GENERIC-NEXT: vptestnmb %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm1[1,1,13,0,3,0,0,13,5,2,2,10,15,8,14,8,25,26,28,28,31,27,30,19,24,25,29,23,28,22,25,29] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm1[1,1,13,0,3,0,0,13,5,2,2,10,15,8,14,8,25,26,28,28,31,27,30,19,24,25,29,23,28,22,25,29] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_32xi8_perm_mem_mask3:		; SKX-LABEL: test_masked_z_32xi8_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa (%rdi), %ymm1 # sched: [7:0.50]		; SKX-NEXT: vmovdqa (%rdi), %ymm1 # sched: [7:0.50]
; SKX-NEXT: vptestnmb %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm1[1,1,13,0,3,0,0,13,5,2,2,10,15,8,14,8,25,26,28,28,31,27,30,19,24,25,29,23,28,22,25,29] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} ymm0 {%k1} {z} = ymm1[1,1,13,0,3,0,0,13,5,2,2,10,15,8,14,8,25,26,28,28,31,27,30,19,24,25,29,23,28,22,25,29] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i8>, <32 x i8>* %vp		%vec = load <32 x i8>, <32 x i8>* %vp
%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 1, i32 1, i32 13, i32 0, i32 3, i32 0, i32 0, i32 13, i32 5, i32 2, i32 2, i32 10, i32 15, i32 8, i32 14, i32 8, i32 25, i32 26, i32 28, i32 28, i32 31, i32 27, i32 30, i32 19, i32 24, i32 25, i32 29, i32 23, i32 28, i32 22, i32 25, i32 29>		%shuf = shufflevector <32 x i8> %vec, <32 x i8> undef, <32 x i32> <i32 1, i32 1, i32 13, i32 0, i32 3, i32 0, i32 0, i32 13, i32 5, i32 2, i32 2, i32 10, i32 15, i32 8, i32 14, i32 8, i32 25, i32 26, i32 28, i32 28, i32 31, i32 27, i32 30, i32 19, i32 24, i32 25, i32 29, i32 23, i32 28, i32 22, i32 25, i32 29>
%cmp = icmp eq <32 x i8> %mask, zeroinitializer		%cmp = icmp eq <32 x i8> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> zeroinitializer		%res = select <32 x i1> %cmp, <32 x i8> %shuf, <32 x i8> zeroinitializer
ret <32 x i8> %res		ret <32 x i8> %res
}		}

define <64 x i8> @test_64xi8_perm_mask0(<64 x i8> %vec) {		define <64 x i8> @test_64xi8_perm_mask0(<64 x i8> %vec) {
; GENERIC-LABEL: test_64xi8_perm_mask0:		; GENERIC-LABEL: test_64xi8_perm_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 = zmm0[8,4,1,13,15,4,6,12,0,10,2,4,13,0,0,6,23,29,27,26,18,31,22,25,22,16,23,18,16,25,26,17,40,37,38,44,39,46,41,39,42,37,33,42,41,44,34,46,60,62,61,58,60,56,60,51,60,55,60,55,60,49,48,62] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 = zmm0[8,4,1,13,15,4,6,12,0,10,2,4,13,0,0,6,23,29,27,26,18,31,22,25,22,16,23,18,16,25,26,17,40,37,38,44,39,46,41,39,42,37,33,42,41,44,34,46,60,62,61,58,60,56,60,51,60,55,60,55,60,49,48,62] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_64xi8_perm_mask0:		; SKX-LABEL: test_64xi8_perm_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpshufb {{.*#+}} zmm0 = zmm0[8,4,1,13,15,4,6,12,0,10,2,4,13,0,0,6,23,29,27,26,18,31,22,25,22,16,23,18,16,25,26,17,40,37,38,44,39,46,41,39,42,37,33,42,41,44,34,46,60,62,61,58,60,56,60,51,60,55,60,55,60,49,48,62] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} zmm0 = zmm0[8,4,1,13,15,4,6,12,0,10,2,4,13,0,0,6,23,29,27,26,18,31,22,25,22,16,23,18,16,25,26,17,40,37,38,44,39,46,41,39,42,37,33,42,41,44,34,46,60,62,61,58,60,56,60,51,60,55,60,55,60,49,48,62] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%res = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 8, i32 4, i32 1, i32 13, i32 15, i32 4, i32 6, i32 12, i32 0, i32 10, i32 2, i32 4, i32 13, i32 0, i32 0, i32 6, i32 23, i32 29, i32 27, i32 26, i32 18, i32 31, i32 22, i32 25, i32 22, i32 16, i32 23, i32 18, i32 16, i32 25, i32 26, i32 17, i32 40, i32 37, i32 38, i32 44, i32 39, i32 46, i32 41, i32 39, i32 42, i32 37, i32 33, i32 42, i32 41, i32 44, i32 34, i32 46, i32 60, i32 62, i32 61, i32 58, i32 60, i32 56, i32 60, i32 51, i32 60, i32 55, i32 60, i32 55, i32 60, i32 49, i32 48, i32 62>		%res = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 8, i32 4, i32 1, i32 13, i32 15, i32 4, i32 6, i32 12, i32 0, i32 10, i32 2, i32 4, i32 13, i32 0, i32 0, i32 6, i32 23, i32 29, i32 27, i32 26, i32 18, i32 31, i32 22, i32 25, i32 22, i32 16, i32 23, i32 18, i32 16, i32 25, i32 26, i32 17, i32 40, i32 37, i32 38, i32 44, i32 39, i32 46, i32 41, i32 39, i32 42, i32 37, i32 33, i32 42, i32 41, i32 44, i32 34, i32 46, i32 60, i32 62, i32 61, i32 58, i32 60, i32 56, i32 60, i32 51, i32 60, i32 55, i32 60, i32 55, i32 60, i32 49, i32 48, i32 62>
ret <64 x i8> %res		ret <64 x i8> %res
}		}
define <64 x i8> @test_masked_64xi8_perm_mask0(<64 x i8> %vec, <64 x i8> %vec2, <64 x i8> %mask) {		define <64 x i8> @test_masked_64xi8_perm_mask0(<64 x i8> %vec, <64 x i8> %vec2, <64 x i8> %mask) {
; GENERIC-LABEL: test_masked_64xi8_perm_mask0:		; GENERIC-LABEL: test_masked_64xi8_perm_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} zmm1 {%k1} = zmm0[8,4,1,13,15,4,6,12,0,10,2,4,13,0,0,6,23,29,27,26,18,31,22,25,22,16,23,18,16,25,26,17,40,37,38,44,39,46,41,39,42,37,33,42,41,44,34,46,60,62,61,58,60,56,60,51,60,55,60,55,60,49,48,62] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} zmm1 {%k1} = zmm0[8,4,1,13,15,4,6,12,0,10,2,4,13,0,0,6,23,29,27,26,18,31,22,25,22,16,23,18,16,25,26,17,40,37,38,44,39,46,41,39,42,37,33,42,41,44,34,46,60,62,61,58,60,56,60,51,60,55,60,55,60,49,48,62] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_64xi8_perm_mask0:		; SKX-LABEL: test_masked_64xi8_perm_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} zmm1 {%k1} = zmm0[8,4,1,13,15,4,6,12,0,10,2,4,13,0,0,6,23,29,27,26,18,31,22,25,22,16,23,18,16,25,26,17,40,37,38,44,39,46,41,39,42,37,33,42,41,44,34,46,60,62,61,58,60,56,60,51,60,55,60,55,60,49,48,62] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} zmm1 {%k1} = zmm0[8,4,1,13,15,4,6,12,0,10,2,4,13,0,0,6,23,29,27,26,18,31,22,25,22,16,23,18,16,25,26,17,40,37,38,44,39,46,41,39,42,37,33,42,41,44,34,46,60,62,61,58,60,56,60,51,60,55,60,55,60,49,48,62] sched: [8:1.00]
; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 8, i32 4, i32 1, i32 13, i32 15, i32 4, i32 6, i32 12, i32 0, i32 10, i32 2, i32 4, i32 13, i32 0, i32 0, i32 6, i32 23, i32 29, i32 27, i32 26, i32 18, i32 31, i32 22, i32 25, i32 22, i32 16, i32 23, i32 18, i32 16, i32 25, i32 26, i32 17, i32 40, i32 37, i32 38, i32 44, i32 39, i32 46, i32 41, i32 39, i32 42, i32 37, i32 33, i32 42, i32 41, i32 44, i32 34, i32 46, i32 60, i32 62, i32 61, i32 58, i32 60, i32 56, i32 60, i32 51, i32 60, i32 55, i32 60, i32 55, i32 60, i32 49, i32 48, i32 62>		%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 8, i32 4, i32 1, i32 13, i32 15, i32 4, i32 6, i32 12, i32 0, i32 10, i32 2, i32 4, i32 13, i32 0, i32 0, i32 6, i32 23, i32 29, i32 27, i32 26, i32 18, i32 31, i32 22, i32 25, i32 22, i32 16, i32 23, i32 18, i32 16, i32 25, i32 26, i32 17, i32 40, i32 37, i32 38, i32 44, i32 39, i32 46, i32 41, i32 39, i32 42, i32 37, i32 33, i32 42, i32 41, i32 44, i32 34, i32 46, i32 60, i32 62, i32 61, i32 58, i32 60, i32 56, i32 60, i32 51, i32 60, i32 55, i32 60, i32 55, i32 60, i32 49, i32 48, i32 62>
%cmp = icmp eq <64 x i8> %mask, zeroinitializer		%cmp = icmp eq <64 x i8> %mask, zeroinitializer
%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> %vec2		%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> %vec2
ret <64 x i8> %res		ret <64 x i8> %res
}		}

define <64 x i8> @test_masked_z_64xi8_perm_mask0(<64 x i8> %vec, <64 x i8> %mask) {		define <64 x i8> @test_masked_z_64xi8_perm_mask0(<64 x i8> %vec, <64 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_64xi8_perm_mask0:		; GENERIC-LABEL: test_masked_z_64xi8_perm_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm0[8,4,1,13,15,4,6,12,0,10,2,4,13,0,0,6,23,29,27,26,18,31,22,25,22,16,23,18,16,25,26,17,40,37,38,44,39,46,41,39,42,37,33,42,41,44,34,46,60,62,61,58,60,56,60,51,60,55,60,55,60,49,48,62] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm0[8,4,1,13,15,4,6,12,0,10,2,4,13,0,0,6,23,29,27,26,18,31,22,25,22,16,23,18,16,25,26,17,40,37,38,44,39,46,41,39,42,37,33,42,41,44,34,46,60,62,61,58,60,56,60,51,60,55,60,55,60,49,48,62] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_64xi8_perm_mask0:		; SKX-LABEL: test_masked_z_64xi8_perm_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm0[8,4,1,13,15,4,6,12,0,10,2,4,13,0,0,6,23,29,27,26,18,31,22,25,22,16,23,18,16,25,26,17,40,37,38,44,39,46,41,39,42,37,33,42,41,44,34,46,60,62,61,58,60,56,60,51,60,55,60,55,60,49,48,62] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm0[8,4,1,13,15,4,6,12,0,10,2,4,13,0,0,6,23,29,27,26,18,31,22,25,22,16,23,18,16,25,26,17,40,37,38,44,39,46,41,39,42,37,33,42,41,44,34,46,60,62,61,58,60,56,60,51,60,55,60,55,60,49,48,62] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 8, i32 4, i32 1, i32 13, i32 15, i32 4, i32 6, i32 12, i32 0, i32 10, i32 2, i32 4, i32 13, i32 0, i32 0, i32 6, i32 23, i32 29, i32 27, i32 26, i32 18, i32 31, i32 22, i32 25, i32 22, i32 16, i32 23, i32 18, i32 16, i32 25, i32 26, i32 17, i32 40, i32 37, i32 38, i32 44, i32 39, i32 46, i32 41, i32 39, i32 42, i32 37, i32 33, i32 42, i32 41, i32 44, i32 34, i32 46, i32 60, i32 62, i32 61, i32 58, i32 60, i32 56, i32 60, i32 51, i32 60, i32 55, i32 60, i32 55, i32 60, i32 49, i32 48, i32 62>		%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 8, i32 4, i32 1, i32 13, i32 15, i32 4, i32 6, i32 12, i32 0, i32 10, i32 2, i32 4, i32 13, i32 0, i32 0, i32 6, i32 23, i32 29, i32 27, i32 26, i32 18, i32 31, i32 22, i32 25, i32 22, i32 16, i32 23, i32 18, i32 16, i32 25, i32 26, i32 17, i32 40, i32 37, i32 38, i32 44, i32 39, i32 46, i32 41, i32 39, i32 42, i32 37, i32 33, i32 42, i32 41, i32 44, i32 34, i32 46, i32 60, i32 62, i32 61, i32 58, i32 60, i32 56, i32 60, i32 51, i32 60, i32 55, i32 60, i32 55, i32 60, i32 49, i32 48, i32 62>
%cmp = icmp eq <64 x i8> %mask, zeroinitializer		%cmp = icmp eq <64 x i8> %mask, zeroinitializer
%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> zeroinitializer		%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> zeroinitializer
ret <64 x i8> %res		ret <64 x i8> %res
}		}
define <64 x i8> @test_masked_64xi8_perm_mask1(<64 x i8> %vec, <64 x i8> %vec2, <64 x i8> %mask) {		define <64 x i8> @test_masked_64xi8_perm_mask1(<64 x i8> %vec, <64 x i8> %vec2, <64 x i8> %mask) {
; GENERIC-LABEL: test_masked_64xi8_perm_mask1:		; GENERIC-LABEL: test_masked_64xi8_perm_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} zmm1 {%k1} = zmm0[7,14,15,10,9,3,1,13,14,12,11,6,4,1,6,9,30,30,22,17,28,27,16,23,26,16,30,31,27,17,17,21,32,37,32,47,45,33,46,35,35,42,47,33,32,37,32,41,61,50,49,53,63,50,63,53,55,52,62,63,58,50,63,49] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} zmm1 {%k1} = zmm0[7,14,15,10,9,3,1,13,14,12,11,6,4,1,6,9,30,30,22,17,28,27,16,23,26,16,30,31,27,17,17,21,32,37,32,47,45,33,46,35,35,42,47,33,32,37,32,41,61,50,49,53,63,50,63,53,55,52,62,63,58,50,63,49] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_64xi8_perm_mask1:		; SKX-LABEL: test_masked_64xi8_perm_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} zmm1 {%k1} = zmm0[7,14,15,10,9,3,1,13,14,12,11,6,4,1,6,9,30,30,22,17,28,27,16,23,26,16,30,31,27,17,17,21,32,37,32,47,45,33,46,35,35,42,47,33,32,37,32,41,61,50,49,53,63,50,63,53,55,52,62,63,58,50,63,49] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} zmm1 {%k1} = zmm0[7,14,15,10,9,3,1,13,14,12,11,6,4,1,6,9,30,30,22,17,28,27,16,23,26,16,30,31,27,17,17,21,32,37,32,47,45,33,46,35,35,42,47,33,32,37,32,41,61,50,49,53,63,50,63,53,55,52,62,63,58,50,63,49] sched: [8:1.00]
; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 7, i32 14, i32 15, i32 10, i32 9, i32 3, i32 1, i32 13, i32 14, i32 12, i32 11, i32 6, i32 4, i32 1, i32 6, i32 9, i32 30, i32 30, i32 22, i32 17, i32 28, i32 27, i32 16, i32 23, i32 26, i32 16, i32 30, i32 31, i32 27, i32 17, i32 17, i32 21, i32 32, i32 37, i32 32, i32 47, i32 45, i32 33, i32 46, i32 35, i32 35, i32 42, i32 47, i32 33, i32 32, i32 37, i32 32, i32 41, i32 61, i32 50, i32 49, i32 53, i32 63, i32 50, i32 63, i32 53, i32 55, i32 52, i32 62, i32 63, i32 58, i32 50, i32 63, i32 49>		%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 7, i32 14, i32 15, i32 10, i32 9, i32 3, i32 1, i32 13, i32 14, i32 12, i32 11, i32 6, i32 4, i32 1, i32 6, i32 9, i32 30, i32 30, i32 22, i32 17, i32 28, i32 27, i32 16, i32 23, i32 26, i32 16, i32 30, i32 31, i32 27, i32 17, i32 17, i32 21, i32 32, i32 37, i32 32, i32 47, i32 45, i32 33, i32 46, i32 35, i32 35, i32 42, i32 47, i32 33, i32 32, i32 37, i32 32, i32 41, i32 61, i32 50, i32 49, i32 53, i32 63, i32 50, i32 63, i32 53, i32 55, i32 52, i32 62, i32 63, i32 58, i32 50, i32 63, i32 49>
%cmp = icmp eq <64 x i8> %mask, zeroinitializer		%cmp = icmp eq <64 x i8> %mask, zeroinitializer
%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> %vec2		%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> %vec2
ret <64 x i8> %res		ret <64 x i8> %res
}		}

define <64 x i8> @test_masked_z_64xi8_perm_mask1(<64 x i8> %vec, <64 x i8> %mask) {		define <64 x i8> @test_masked_z_64xi8_perm_mask1(<64 x i8> %vec, <64 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_64xi8_perm_mask1:		; GENERIC-LABEL: test_masked_z_64xi8_perm_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm0[7,14,15,10,9,3,1,13,14,12,11,6,4,1,6,9,30,30,22,17,28,27,16,23,26,16,30,31,27,17,17,21,32,37,32,47,45,33,46,35,35,42,47,33,32,37,32,41,61,50,49,53,63,50,63,53,55,52,62,63,58,50,63,49] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm0[7,14,15,10,9,3,1,13,14,12,11,6,4,1,6,9,30,30,22,17,28,27,16,23,26,16,30,31,27,17,17,21,32,37,32,47,45,33,46,35,35,42,47,33,32,37,32,41,61,50,49,53,63,50,63,53,55,52,62,63,58,50,63,49] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_64xi8_perm_mask1:		; SKX-LABEL: test_masked_z_64xi8_perm_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm0[7,14,15,10,9,3,1,13,14,12,11,6,4,1,6,9,30,30,22,17,28,27,16,23,26,16,30,31,27,17,17,21,32,37,32,47,45,33,46,35,35,42,47,33,32,37,32,41,61,50,49,53,63,50,63,53,55,52,62,63,58,50,63,49] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm0[7,14,15,10,9,3,1,13,14,12,11,6,4,1,6,9,30,30,22,17,28,27,16,23,26,16,30,31,27,17,17,21,32,37,32,47,45,33,46,35,35,42,47,33,32,37,32,41,61,50,49,53,63,50,63,53,55,52,62,63,58,50,63,49] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 7, i32 14, i32 15, i32 10, i32 9, i32 3, i32 1, i32 13, i32 14, i32 12, i32 11, i32 6, i32 4, i32 1, i32 6, i32 9, i32 30, i32 30, i32 22, i32 17, i32 28, i32 27, i32 16, i32 23, i32 26, i32 16, i32 30, i32 31, i32 27, i32 17, i32 17, i32 21, i32 32, i32 37, i32 32, i32 47, i32 45, i32 33, i32 46, i32 35, i32 35, i32 42, i32 47, i32 33, i32 32, i32 37, i32 32, i32 41, i32 61, i32 50, i32 49, i32 53, i32 63, i32 50, i32 63, i32 53, i32 55, i32 52, i32 62, i32 63, i32 58, i32 50, i32 63, i32 49>		%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 7, i32 14, i32 15, i32 10, i32 9, i32 3, i32 1, i32 13, i32 14, i32 12, i32 11, i32 6, i32 4, i32 1, i32 6, i32 9, i32 30, i32 30, i32 22, i32 17, i32 28, i32 27, i32 16, i32 23, i32 26, i32 16, i32 30, i32 31, i32 27, i32 17, i32 17, i32 21, i32 32, i32 37, i32 32, i32 47, i32 45, i32 33, i32 46, i32 35, i32 35, i32 42, i32 47, i32 33, i32 32, i32 37, i32 32, i32 41, i32 61, i32 50, i32 49, i32 53, i32 63, i32 50, i32 63, i32 53, i32 55, i32 52, i32 62, i32 63, i32 58, i32 50, i32 63, i32 49>
%cmp = icmp eq <64 x i8> %mask, zeroinitializer		%cmp = icmp eq <64 x i8> %mask, zeroinitializer
%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> zeroinitializer		%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> zeroinitializer
ret <64 x i8> %res		ret <64 x i8> %res
}		}
define <64 x i8> @test_masked_64xi8_perm_mask2(<64 x i8> %vec, <64 x i8> %vec2, <64 x i8> %mask) {		define <64 x i8> @test_masked_64xi8_perm_mask2(<64 x i8> %vec, <64 x i8> %vec2, <64 x i8> %mask) {
; GENERIC-LABEL: test_masked_64xi8_perm_mask2:		; GENERIC-LABEL: test_masked_64xi8_perm_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} zmm1 {%k1} = zmm0[9,2,14,15,12,5,3,12,4,6,0,2,0,1,1,6,24,27,18,22,26,17,23,21,31,16,22,22,27,21,19,20,39,47,44,36,40,43,44,39,38,44,38,35,39,46,34,39,58,55,51,48,59,57,48,52,60,58,56,50,59,55,58,60] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} zmm1 {%k1} = zmm0[9,2,14,15,12,5,3,12,4,6,0,2,0,1,1,6,24,27,18,22,26,17,23,21,31,16,22,22,27,21,19,20,39,47,44,36,40,43,44,39,38,44,38,35,39,46,34,39,58,55,51,48,59,57,48,52,60,58,56,50,59,55,58,60] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_64xi8_perm_mask2:		; SKX-LABEL: test_masked_64xi8_perm_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} zmm1 {%k1} = zmm0[9,2,14,15,12,5,3,12,4,6,0,2,0,1,1,6,24,27,18,22,26,17,23,21,31,16,22,22,27,21,19,20,39,47,44,36,40,43,44,39,38,44,38,35,39,46,34,39,58,55,51,48,59,57,48,52,60,58,56,50,59,55,58,60] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} zmm1 {%k1} = zmm0[9,2,14,15,12,5,3,12,4,6,0,2,0,1,1,6,24,27,18,22,26,17,23,21,31,16,22,22,27,21,19,20,39,47,44,36,40,43,44,39,38,44,38,35,39,46,34,39,58,55,51,48,59,57,48,52,60,58,56,50,59,55,58,60] sched: [8:1.00]
; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 9, i32 2, i32 14, i32 15, i32 12, i32 5, i32 3, i32 12, i32 4, i32 6, i32 0, i32 2, i32 0, i32 1, i32 1, i32 6, i32 24, i32 27, i32 18, i32 22, i32 26, i32 17, i32 23, i32 21, i32 31, i32 16, i32 22, i32 22, i32 27, i32 21, i32 19, i32 20, i32 39, i32 47, i32 44, i32 36, i32 40, i32 43, i32 44, i32 39, i32 38, i32 44, i32 38, i32 35, i32 39, i32 46, i32 34, i32 39, i32 58, i32 55, i32 51, i32 48, i32 59, i32 57, i32 48, i32 52, i32 60, i32 58, i32 56, i32 50, i32 59, i32 55, i32 58, i32 60>		%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 9, i32 2, i32 14, i32 15, i32 12, i32 5, i32 3, i32 12, i32 4, i32 6, i32 0, i32 2, i32 0, i32 1, i32 1, i32 6, i32 24, i32 27, i32 18, i32 22, i32 26, i32 17, i32 23, i32 21, i32 31, i32 16, i32 22, i32 22, i32 27, i32 21, i32 19, i32 20, i32 39, i32 47, i32 44, i32 36, i32 40, i32 43, i32 44, i32 39, i32 38, i32 44, i32 38, i32 35, i32 39, i32 46, i32 34, i32 39, i32 58, i32 55, i32 51, i32 48, i32 59, i32 57, i32 48, i32 52, i32 60, i32 58, i32 56, i32 50, i32 59, i32 55, i32 58, i32 60>
%cmp = icmp eq <64 x i8> %mask, zeroinitializer		%cmp = icmp eq <64 x i8> %mask, zeroinitializer
%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> %vec2		%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> %vec2
ret <64 x i8> %res		ret <64 x i8> %res
}		}

define <64 x i8> @test_masked_z_64xi8_perm_mask2(<64 x i8> %vec, <64 x i8> %mask) {		define <64 x i8> @test_masked_z_64xi8_perm_mask2(<64 x i8> %vec, <64 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_64xi8_perm_mask2:		; GENERIC-LABEL: test_masked_z_64xi8_perm_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm0[9,2,14,15,12,5,3,12,4,6,0,2,0,1,1,6,24,27,18,22,26,17,23,21,31,16,22,22,27,21,19,20,39,47,44,36,40,43,44,39,38,44,38,35,39,46,34,39,58,55,51,48,59,57,48,52,60,58,56,50,59,55,58,60] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm0[9,2,14,15,12,5,3,12,4,6,0,2,0,1,1,6,24,27,18,22,26,17,23,21,31,16,22,22,27,21,19,20,39,47,44,36,40,43,44,39,38,44,38,35,39,46,34,39,58,55,51,48,59,57,48,52,60,58,56,50,59,55,58,60] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_64xi8_perm_mask2:		; SKX-LABEL: test_masked_z_64xi8_perm_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm0[9,2,14,15,12,5,3,12,4,6,0,2,0,1,1,6,24,27,18,22,26,17,23,21,31,16,22,22,27,21,19,20,39,47,44,36,40,43,44,39,38,44,38,35,39,46,34,39,58,55,51,48,59,57,48,52,60,58,56,50,59,55,58,60] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm0[9,2,14,15,12,5,3,12,4,6,0,2,0,1,1,6,24,27,18,22,26,17,23,21,31,16,22,22,27,21,19,20,39,47,44,36,40,43,44,39,38,44,38,35,39,46,34,39,58,55,51,48,59,57,48,52,60,58,56,50,59,55,58,60] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 9, i32 2, i32 14, i32 15, i32 12, i32 5, i32 3, i32 12, i32 4, i32 6, i32 0, i32 2, i32 0, i32 1, i32 1, i32 6, i32 24, i32 27, i32 18, i32 22, i32 26, i32 17, i32 23, i32 21, i32 31, i32 16, i32 22, i32 22, i32 27, i32 21, i32 19, i32 20, i32 39, i32 47, i32 44, i32 36, i32 40, i32 43, i32 44, i32 39, i32 38, i32 44, i32 38, i32 35, i32 39, i32 46, i32 34, i32 39, i32 58, i32 55, i32 51, i32 48, i32 59, i32 57, i32 48, i32 52, i32 60, i32 58, i32 56, i32 50, i32 59, i32 55, i32 58, i32 60>		%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 9, i32 2, i32 14, i32 15, i32 12, i32 5, i32 3, i32 12, i32 4, i32 6, i32 0, i32 2, i32 0, i32 1, i32 1, i32 6, i32 24, i32 27, i32 18, i32 22, i32 26, i32 17, i32 23, i32 21, i32 31, i32 16, i32 22, i32 22, i32 27, i32 21, i32 19, i32 20, i32 39, i32 47, i32 44, i32 36, i32 40, i32 43, i32 44, i32 39, i32 38, i32 44, i32 38, i32 35, i32 39, i32 46, i32 34, i32 39, i32 58, i32 55, i32 51, i32 48, i32 59, i32 57, i32 48, i32 52, i32 60, i32 58, i32 56, i32 50, i32 59, i32 55, i32 58, i32 60>
%cmp = icmp eq <64 x i8> %mask, zeroinitializer		%cmp = icmp eq <64 x i8> %mask, zeroinitializer
%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> zeroinitializer		%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> zeroinitializer
ret <64 x i8> %res		ret <64 x i8> %res
}		}
define <64 x i8> @test_64xi8_perm_mask3(<64 x i8> %vec) {		define <64 x i8> @test_64xi8_perm_mask3(<64 x i8> %vec) {
; GENERIC-LABEL: test_64xi8_perm_mask3:		; GENERIC-LABEL: test_64xi8_perm_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 = zmm0[3,12,4,15,1,14,0,4,8,9,6,1,4,4,12,14,25,16,28,20,21,24,19,30,18,22,20,24,25,26,24,22,42,38,44,44,36,37,42,34,43,38,41,34,42,37,39,38,55,59,53,58,48,52,59,48,57,48,55,62,48,56,49,61] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 = zmm0[3,12,4,15,1,14,0,4,8,9,6,1,4,4,12,14,25,16,28,20,21,24,19,30,18,22,20,24,25,26,24,22,42,38,44,44,36,37,42,34,43,38,41,34,42,37,39,38,55,59,53,58,48,52,59,48,57,48,55,62,48,56,49,61] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_64xi8_perm_mask3:		; SKX-LABEL: test_64xi8_perm_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpshufb {{.*#+}} zmm0 = zmm0[3,12,4,15,1,14,0,4,8,9,6,1,4,4,12,14,25,16,28,20,21,24,19,30,18,22,20,24,25,26,24,22,42,38,44,44,36,37,42,34,43,38,41,34,42,37,39,38,55,59,53,58,48,52,59,48,57,48,55,62,48,56,49,61] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} zmm0 = zmm0[3,12,4,15,1,14,0,4,8,9,6,1,4,4,12,14,25,16,28,20,21,24,19,30,18,22,20,24,25,26,24,22,42,38,44,44,36,37,42,34,43,38,41,34,42,37,39,38,55,59,53,58,48,52,59,48,57,48,55,62,48,56,49,61] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%res = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 3, i32 12, i32 4, i32 15, i32 1, i32 14, i32 0, i32 4, i32 8, i32 9, i32 6, i32 1, i32 4, i32 4, i32 12, i32 14, i32 25, i32 16, i32 28, i32 20, i32 21, i32 24, i32 19, i32 30, i32 18, i32 22, i32 20, i32 24, i32 25, i32 26, i32 24, i32 22, i32 42, i32 38, i32 44, i32 44, i32 36, i32 37, i32 42, i32 34, i32 43, i32 38, i32 41, i32 34, i32 42, i32 37, i32 39, i32 38, i32 55, i32 59, i32 53, i32 58, i32 48, i32 52, i32 59, i32 48, i32 57, i32 48, i32 55, i32 62, i32 48, i32 56, i32 49, i32 61>		%res = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 3, i32 12, i32 4, i32 15, i32 1, i32 14, i32 0, i32 4, i32 8, i32 9, i32 6, i32 1, i32 4, i32 4, i32 12, i32 14, i32 25, i32 16, i32 28, i32 20, i32 21, i32 24, i32 19, i32 30, i32 18, i32 22, i32 20, i32 24, i32 25, i32 26, i32 24, i32 22, i32 42, i32 38, i32 44, i32 44, i32 36, i32 37, i32 42, i32 34, i32 43, i32 38, i32 41, i32 34, i32 42, i32 37, i32 39, i32 38, i32 55, i32 59, i32 53, i32 58, i32 48, i32 52, i32 59, i32 48, i32 57, i32 48, i32 55, i32 62, i32 48, i32 56, i32 49, i32 61>
ret <64 x i8> %res		ret <64 x i8> %res
}		}
define <64 x i8> @test_masked_64xi8_perm_mask3(<64 x i8> %vec, <64 x i8> %vec2, <64 x i8> %mask) {		define <64 x i8> @test_masked_64xi8_perm_mask3(<64 x i8> %vec, <64 x i8> %vec2, <64 x i8> %mask) {
; GENERIC-LABEL: test_masked_64xi8_perm_mask3:		; GENERIC-LABEL: test_masked_64xi8_perm_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} zmm1 {%k1} = zmm0[3,12,4,15,1,14,0,4,8,9,6,1,4,4,12,14,25,16,28,20,21,24,19,30,18,22,20,24,25,26,24,22,42,38,44,44,36,37,42,34,43,38,41,34,42,37,39,38,55,59,53,58,48,52,59,48,57,48,55,62,48,56,49,61] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} zmm1 {%k1} = zmm0[3,12,4,15,1,14,0,4,8,9,6,1,4,4,12,14,25,16,28,20,21,24,19,30,18,22,20,24,25,26,24,22,42,38,44,44,36,37,42,34,43,38,41,34,42,37,39,38,55,59,53,58,48,52,59,48,57,48,55,62,48,56,49,61] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_64xi8_perm_mask3:		; SKX-LABEL: test_masked_64xi8_perm_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} zmm1 {%k1} = zmm0[3,12,4,15,1,14,0,4,8,9,6,1,4,4,12,14,25,16,28,20,21,24,19,30,18,22,20,24,25,26,24,22,42,38,44,44,36,37,42,34,43,38,41,34,42,37,39,38,55,59,53,58,48,52,59,48,57,48,55,62,48,56,49,61] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} zmm1 {%k1} = zmm0[3,12,4,15,1,14,0,4,8,9,6,1,4,4,12,14,25,16,28,20,21,24,19,30,18,22,20,24,25,26,24,22,42,38,44,44,36,37,42,34,43,38,41,34,42,37,39,38,55,59,53,58,48,52,59,48,57,48,55,62,48,56,49,61] sched: [8:1.00]
; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 3, i32 12, i32 4, i32 15, i32 1, i32 14, i32 0, i32 4, i32 8, i32 9, i32 6, i32 1, i32 4, i32 4, i32 12, i32 14, i32 25, i32 16, i32 28, i32 20, i32 21, i32 24, i32 19, i32 30, i32 18, i32 22, i32 20, i32 24, i32 25, i32 26, i32 24, i32 22, i32 42, i32 38, i32 44, i32 44, i32 36, i32 37, i32 42, i32 34, i32 43, i32 38, i32 41, i32 34, i32 42, i32 37, i32 39, i32 38, i32 55, i32 59, i32 53, i32 58, i32 48, i32 52, i32 59, i32 48, i32 57, i32 48, i32 55, i32 62, i32 48, i32 56, i32 49, i32 61>		%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 3, i32 12, i32 4, i32 15, i32 1, i32 14, i32 0, i32 4, i32 8, i32 9, i32 6, i32 1, i32 4, i32 4, i32 12, i32 14, i32 25, i32 16, i32 28, i32 20, i32 21, i32 24, i32 19, i32 30, i32 18, i32 22, i32 20, i32 24, i32 25, i32 26, i32 24, i32 22, i32 42, i32 38, i32 44, i32 44, i32 36, i32 37, i32 42, i32 34, i32 43, i32 38, i32 41, i32 34, i32 42, i32 37, i32 39, i32 38, i32 55, i32 59, i32 53, i32 58, i32 48, i32 52, i32 59, i32 48, i32 57, i32 48, i32 55, i32 62, i32 48, i32 56, i32 49, i32 61>
%cmp = icmp eq <64 x i8> %mask, zeroinitializer		%cmp = icmp eq <64 x i8> %mask, zeroinitializer
%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> %vec2		%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> %vec2
ret <64 x i8> %res		ret <64 x i8> %res
}		}

define <64 x i8> @test_masked_z_64xi8_perm_mask3(<64 x i8> %vec, <64 x i8> %mask) {		define <64 x i8> @test_masked_z_64xi8_perm_mask3(<64 x i8> %vec, <64 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_64xi8_perm_mask3:		; GENERIC-LABEL: test_masked_z_64xi8_perm_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm0[3,12,4,15,1,14,0,4,8,9,6,1,4,4,12,14,25,16,28,20,21,24,19,30,18,22,20,24,25,26,24,22,42,38,44,44,36,37,42,34,43,38,41,34,42,37,39,38,55,59,53,58,48,52,59,48,57,48,55,62,48,56,49,61] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm0[3,12,4,15,1,14,0,4,8,9,6,1,4,4,12,14,25,16,28,20,21,24,19,30,18,22,20,24,25,26,24,22,42,38,44,44,36,37,42,34,43,38,41,34,42,37,39,38,55,59,53,58,48,52,59,48,57,48,55,62,48,56,49,61] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_64xi8_perm_mask3:		; SKX-LABEL: test_masked_z_64xi8_perm_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm0[3,12,4,15,1,14,0,4,8,9,6,1,4,4,12,14,25,16,28,20,21,24,19,30,18,22,20,24,25,26,24,22,42,38,44,44,36,37,42,34,43,38,41,34,42,37,39,38,55,59,53,58,48,52,59,48,57,48,55,62,48,56,49,61] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm0[3,12,4,15,1,14,0,4,8,9,6,1,4,4,12,14,25,16,28,20,21,24,19,30,18,22,20,24,25,26,24,22,42,38,44,44,36,37,42,34,43,38,41,34,42,37,39,38,55,59,53,58,48,52,59,48,57,48,55,62,48,56,49,61] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 3, i32 12, i32 4, i32 15, i32 1, i32 14, i32 0, i32 4, i32 8, i32 9, i32 6, i32 1, i32 4, i32 4, i32 12, i32 14, i32 25, i32 16, i32 28, i32 20, i32 21, i32 24, i32 19, i32 30, i32 18, i32 22, i32 20, i32 24, i32 25, i32 26, i32 24, i32 22, i32 42, i32 38, i32 44, i32 44, i32 36, i32 37, i32 42, i32 34, i32 43, i32 38, i32 41, i32 34, i32 42, i32 37, i32 39, i32 38, i32 55, i32 59, i32 53, i32 58, i32 48, i32 52, i32 59, i32 48, i32 57, i32 48, i32 55, i32 62, i32 48, i32 56, i32 49, i32 61>		%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 3, i32 12, i32 4, i32 15, i32 1, i32 14, i32 0, i32 4, i32 8, i32 9, i32 6, i32 1, i32 4, i32 4, i32 12, i32 14, i32 25, i32 16, i32 28, i32 20, i32 21, i32 24, i32 19, i32 30, i32 18, i32 22, i32 20, i32 24, i32 25, i32 26, i32 24, i32 22, i32 42, i32 38, i32 44, i32 44, i32 36, i32 37, i32 42, i32 34, i32 43, i32 38, i32 41, i32 34, i32 42, i32 37, i32 39, i32 38, i32 55, i32 59, i32 53, i32 58, i32 48, i32 52, i32 59, i32 48, i32 57, i32 48, i32 55, i32 62, i32 48, i32 56, i32 49, i32 61>
%cmp = icmp eq <64 x i8> %mask, zeroinitializer		%cmp = icmp eq <64 x i8> %mask, zeroinitializer
%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> zeroinitializer		%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> zeroinitializer
ret <64 x i8> %res		ret <64 x i8> %res
}		}
define <64 x i8> @test_64xi8_perm_mem_mask0(<64 x i8>* %vp) {		define <64 x i8> @test_64xi8_perm_mem_mask0(<64 x i8>* %vp) {
; GENERIC-LABEL: test_64xi8_perm_mem_mask0:		; GENERIC-LABEL: test_64xi8_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 (%rdi), %zmm0 # sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 (%rdi), %zmm0 # sched: [6:0.50]
; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 = zmm0[0,9,15,13,11,11,3,12,4,1,7,5,2,6,14,6,23,27,24,18,30,23,28,22,28,22,19,19,31,25,16,22,35,33,34,32,42,34,41,41,43,40,36,46,37,39,42,40,63,63,62,62,57,55,59,51,52,48,50,48,58,50,60,58] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 = zmm0[0,9,15,13,11,11,3,12,4,1,7,5,2,6,14,6,23,27,24,18,30,23,28,22,28,22,19,19,31,25,16,22,35,33,34,32,42,34,41,41,43,40,36,46,37,39,42,40,63,63,62,62,57,55,59,51,52,48,50,48,58,50,60,58] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_64xi8_perm_mem_mask0:		; SKX-LABEL: test_64xi8_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 (%rdi), %zmm0 # sched: [8:0.50]		; SKX-NEXT: vmovdqa64 (%rdi), %zmm0 # sched: [8:0.50]
; SKX-NEXT: vpshufb {{.*#+}} zmm0 = zmm0[0,9,15,13,11,11,3,12,4,1,7,5,2,6,14,6,23,27,24,18,30,23,28,22,28,22,19,19,31,25,16,22,35,33,34,32,42,34,41,41,43,40,36,46,37,39,42,40,63,63,62,62,57,55,59,51,52,48,50,48,58,50,60,58] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} zmm0 = zmm0[0,9,15,13,11,11,3,12,4,1,7,5,2,6,14,6,23,27,24,18,30,23,28,22,28,22,19,19,31,25,16,22,35,33,34,32,42,34,41,41,43,40,36,46,37,39,42,40,63,63,62,62,57,55,59,51,52,48,50,48,58,50,60,58] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <64 x i8>, <64 x i8>* %vp		%vec = load <64 x i8>, <64 x i8>* %vp
%res = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 0, i32 9, i32 15, i32 13, i32 11, i32 11, i32 3, i32 12, i32 4, i32 1, i32 7, i32 5, i32 2, i32 6, i32 14, i32 6, i32 23, i32 27, i32 24, i32 18, i32 30, i32 23, i32 28, i32 22, i32 28, i32 22, i32 19, i32 19, i32 31, i32 25, i32 16, i32 22, i32 35, i32 33, i32 34, i32 32, i32 42, i32 34, i32 41, i32 41, i32 43, i32 40, i32 36, i32 46, i32 37, i32 39, i32 42, i32 40, i32 63, i32 63, i32 62, i32 62, i32 57, i32 55, i32 59, i32 51, i32 52, i32 48, i32 50, i32 48, i32 58, i32 50, i32 60, i32 58>		%res = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 0, i32 9, i32 15, i32 13, i32 11, i32 11, i32 3, i32 12, i32 4, i32 1, i32 7, i32 5, i32 2, i32 6, i32 14, i32 6, i32 23, i32 27, i32 24, i32 18, i32 30, i32 23, i32 28, i32 22, i32 28, i32 22, i32 19, i32 19, i32 31, i32 25, i32 16, i32 22, i32 35, i32 33, i32 34, i32 32, i32 42, i32 34, i32 41, i32 41, i32 43, i32 40, i32 36, i32 46, i32 37, i32 39, i32 42, i32 40, i32 63, i32 63, i32 62, i32 62, i32 57, i32 55, i32 59, i32 51, i32 52, i32 48, i32 50, i32 48, i32 58, i32 50, i32 60, i32 58>
ret <64 x i8> %res		ret <64 x i8> %res
}		}
define <64 x i8> @test_masked_64xi8_perm_mem_mask0(<64 x i8>* %vp, <64 x i8> %vec2, <64 x i8> %mask) {		define <64 x i8> @test_masked_64xi8_perm_mem_mask0(<64 x i8>* %vp, <64 x i8> %vec2, <64 x i8> %mask) {
; GENERIC-LABEL: test_masked_64xi8_perm_mem_mask0:		; GENERIC-LABEL: test_masked_64xi8_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 (%rdi), %zmm2 # sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 (%rdi), %zmm2 # sched: [6:0.50]
; GENERIC-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} = zmm2[0,9,15,13,11,11,3,12,4,1,7,5,2,6,14,6,23,27,24,18,30,23,28,22,28,22,19,19,31,25,16,22,35,33,34,32,42,34,41,41,43,40,36,46,37,39,42,40,63,63,62,62,57,55,59,51,52,48,50,48,58,50,60,58] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} = zmm2[0,9,15,13,11,11,3,12,4,1,7,5,2,6,14,6,23,27,24,18,30,23,28,22,28,22,19,19,31,25,16,22,35,33,34,32,42,34,41,41,43,40,36,46,37,39,42,40,63,63,62,62,57,55,59,51,52,48,50,48,58,50,60,58] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_64xi8_perm_mem_mask0:		; SKX-LABEL: test_masked_64xi8_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 (%rdi), %zmm2 # sched: [8:0.50]		; SKX-NEXT: vmovdqa64 (%rdi), %zmm2 # sched: [8:0.50]
; SKX-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} = zmm2[0,9,15,13,11,11,3,12,4,1,7,5,2,6,14,6,23,27,24,18,30,23,28,22,28,22,19,19,31,25,16,22,35,33,34,32,42,34,41,41,43,40,36,46,37,39,42,40,63,63,62,62,57,55,59,51,52,48,50,48,58,50,60,58] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} = zmm2[0,9,15,13,11,11,3,12,4,1,7,5,2,6,14,6,23,27,24,18,30,23,28,22,28,22,19,19,31,25,16,22,35,33,34,32,42,34,41,41,43,40,36,46,37,39,42,40,63,63,62,62,57,55,59,51,52,48,50,48,58,50,60,58] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <64 x i8>, <64 x i8>* %vp		%vec = load <64 x i8>, <64 x i8>* %vp
%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 0, i32 9, i32 15, i32 13, i32 11, i32 11, i32 3, i32 12, i32 4, i32 1, i32 7, i32 5, i32 2, i32 6, i32 14, i32 6, i32 23, i32 27, i32 24, i32 18, i32 30, i32 23, i32 28, i32 22, i32 28, i32 22, i32 19, i32 19, i32 31, i32 25, i32 16, i32 22, i32 35, i32 33, i32 34, i32 32, i32 42, i32 34, i32 41, i32 41, i32 43, i32 40, i32 36, i32 46, i32 37, i32 39, i32 42, i32 40, i32 63, i32 63, i32 62, i32 62, i32 57, i32 55, i32 59, i32 51, i32 52, i32 48, i32 50, i32 48, i32 58, i32 50, i32 60, i32 58>		%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 0, i32 9, i32 15, i32 13, i32 11, i32 11, i32 3, i32 12, i32 4, i32 1, i32 7, i32 5, i32 2, i32 6, i32 14, i32 6, i32 23, i32 27, i32 24, i32 18, i32 30, i32 23, i32 28, i32 22, i32 28, i32 22, i32 19, i32 19, i32 31, i32 25, i32 16, i32 22, i32 35, i32 33, i32 34, i32 32, i32 42, i32 34, i32 41, i32 41, i32 43, i32 40, i32 36, i32 46, i32 37, i32 39, i32 42, i32 40, i32 63, i32 63, i32 62, i32 62, i32 57, i32 55, i32 59, i32 51, i32 52, i32 48, i32 50, i32 48, i32 58, i32 50, i32 60, i32 58>
%cmp = icmp eq <64 x i8> %mask, zeroinitializer		%cmp = icmp eq <64 x i8> %mask, zeroinitializer
%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> %vec2		%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> %vec2
ret <64 x i8> %res		ret <64 x i8> %res
}		}

define <64 x i8> @test_masked_z_64xi8_perm_mem_mask0(<64 x i8>* %vp, <64 x i8> %mask) {		define <64 x i8> @test_masked_z_64xi8_perm_mem_mask0(<64 x i8>* %vp, <64 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_64xi8_perm_mem_mask0:		; GENERIC-LABEL: test_masked_z_64xi8_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 (%rdi), %zmm1 # sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 (%rdi), %zmm1 # sched: [6:0.50]
; GENERIC-NEXT: vptestnmb %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm1[0,9,15,13,11,11,3,12,4,1,7,5,2,6,14,6,23,27,24,18,30,23,28,22,28,22,19,19,31,25,16,22,35,33,34,32,42,34,41,41,43,40,36,46,37,39,42,40,63,63,62,62,57,55,59,51,52,48,50,48,58,50,60,58] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm1[0,9,15,13,11,11,3,12,4,1,7,5,2,6,14,6,23,27,24,18,30,23,28,22,28,22,19,19,31,25,16,22,35,33,34,32,42,34,41,41,43,40,36,46,37,39,42,40,63,63,62,62,57,55,59,51,52,48,50,48,58,50,60,58] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_64xi8_perm_mem_mask0:		; SKX-LABEL: test_masked_z_64xi8_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 (%rdi), %zmm1 # sched: [8:0.50]		; SKX-NEXT: vmovdqa64 (%rdi), %zmm1 # sched: [8:0.50]
; SKX-NEXT: vptestnmb %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm1[0,9,15,13,11,11,3,12,4,1,7,5,2,6,14,6,23,27,24,18,30,23,28,22,28,22,19,19,31,25,16,22,35,33,34,32,42,34,41,41,43,40,36,46,37,39,42,40,63,63,62,62,57,55,59,51,52,48,50,48,58,50,60,58] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm1[0,9,15,13,11,11,3,12,4,1,7,5,2,6,14,6,23,27,24,18,30,23,28,22,28,22,19,19,31,25,16,22,35,33,34,32,42,34,41,41,43,40,36,46,37,39,42,40,63,63,62,62,57,55,59,51,52,48,50,48,58,50,60,58] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <64 x i8>, <64 x i8>* %vp		%vec = load <64 x i8>, <64 x i8>* %vp
%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 0, i32 9, i32 15, i32 13, i32 11, i32 11, i32 3, i32 12, i32 4, i32 1, i32 7, i32 5, i32 2, i32 6, i32 14, i32 6, i32 23, i32 27, i32 24, i32 18, i32 30, i32 23, i32 28, i32 22, i32 28, i32 22, i32 19, i32 19, i32 31, i32 25, i32 16, i32 22, i32 35, i32 33, i32 34, i32 32, i32 42, i32 34, i32 41, i32 41, i32 43, i32 40, i32 36, i32 46, i32 37, i32 39, i32 42, i32 40, i32 63, i32 63, i32 62, i32 62, i32 57, i32 55, i32 59, i32 51, i32 52, i32 48, i32 50, i32 48, i32 58, i32 50, i32 60, i32 58>		%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 0, i32 9, i32 15, i32 13, i32 11, i32 11, i32 3, i32 12, i32 4, i32 1, i32 7, i32 5, i32 2, i32 6, i32 14, i32 6, i32 23, i32 27, i32 24, i32 18, i32 30, i32 23, i32 28, i32 22, i32 28, i32 22, i32 19, i32 19, i32 31, i32 25, i32 16, i32 22, i32 35, i32 33, i32 34, i32 32, i32 42, i32 34, i32 41, i32 41, i32 43, i32 40, i32 36, i32 46, i32 37, i32 39, i32 42, i32 40, i32 63, i32 63, i32 62, i32 62, i32 57, i32 55, i32 59, i32 51, i32 52, i32 48, i32 50, i32 48, i32 58, i32 50, i32 60, i32 58>
%cmp = icmp eq <64 x i8> %mask, zeroinitializer		%cmp = icmp eq <64 x i8> %mask, zeroinitializer
%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> zeroinitializer		%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> zeroinitializer
ret <64 x i8> %res		ret <64 x i8> %res
}		}

define <64 x i8> @test_masked_64xi8_perm_mem_mask1(<64 x i8>* %vp, <64 x i8> %vec2, <64 x i8> %mask) {		define <64 x i8> @test_masked_64xi8_perm_mem_mask1(<64 x i8>* %vp, <64 x i8> %vec2, <64 x i8> %mask) {
; GENERIC-LABEL: test_masked_64xi8_perm_mem_mask1:		; GENERIC-LABEL: test_masked_64xi8_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 (%rdi), %zmm2 # sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 (%rdi), %zmm2 # sched: [6:0.50]
; GENERIC-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} = zmm2[15,6,14,7,5,1,14,12,5,7,5,0,0,5,3,8,19,19,26,27,20,29,20,21,27,16,30,17,23,27,16,28,47,39,33,33,33,44,38,46,39,33,38,44,45,32,34,39,50,61,62,53,54,56,52,56,51,52,55,57,56,52,51,49] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} = zmm2[15,6,14,7,5,1,14,12,5,7,5,0,0,5,3,8,19,19,26,27,20,29,20,21,27,16,30,17,23,27,16,28,47,39,33,33,33,44,38,46,39,33,38,44,45,32,34,39,50,61,62,53,54,56,52,56,51,52,55,57,56,52,51,49] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_64xi8_perm_mem_mask1:		; SKX-LABEL: test_masked_64xi8_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 (%rdi), %zmm2 # sched: [8:0.50]		; SKX-NEXT: vmovdqa64 (%rdi), %zmm2 # sched: [8:0.50]
; SKX-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} = zmm2[15,6,14,7,5,1,14,12,5,7,5,0,0,5,3,8,19,19,26,27,20,29,20,21,27,16,30,17,23,27,16,28,47,39,33,33,33,44,38,46,39,33,38,44,45,32,34,39,50,61,62,53,54,56,52,56,51,52,55,57,56,52,51,49] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} = zmm2[15,6,14,7,5,1,14,12,5,7,5,0,0,5,3,8,19,19,26,27,20,29,20,21,27,16,30,17,23,27,16,28,47,39,33,33,33,44,38,46,39,33,38,44,45,32,34,39,50,61,62,53,54,56,52,56,51,52,55,57,56,52,51,49] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <64 x i8>, <64 x i8>* %vp		%vec = load <64 x i8>, <64 x i8>* %vp
%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 15, i32 6, i32 14, i32 7, i32 5, i32 1, i32 14, i32 12, i32 5, i32 7, i32 5, i32 0, i32 0, i32 5, i32 3, i32 8, i32 19, i32 19, i32 26, i32 27, i32 20, i32 29, i32 20, i32 21, i32 27, i32 16, i32 30, i32 17, i32 23, i32 27, i32 16, i32 28, i32 47, i32 39, i32 33, i32 33, i32 33, i32 44, i32 38, i32 46, i32 39, i32 33, i32 38, i32 44, i32 45, i32 32, i32 34, i32 39, i32 50, i32 61, i32 62, i32 53, i32 54, i32 56, i32 52, i32 56, i32 51, i32 52, i32 55, i32 57, i32 56, i32 52, i32 51, i32 49>		%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 15, i32 6, i32 14, i32 7, i32 5, i32 1, i32 14, i32 12, i32 5, i32 7, i32 5, i32 0, i32 0, i32 5, i32 3, i32 8, i32 19, i32 19, i32 26, i32 27, i32 20, i32 29, i32 20, i32 21, i32 27, i32 16, i32 30, i32 17, i32 23, i32 27, i32 16, i32 28, i32 47, i32 39, i32 33, i32 33, i32 33, i32 44, i32 38, i32 46, i32 39, i32 33, i32 38, i32 44, i32 45, i32 32, i32 34, i32 39, i32 50, i32 61, i32 62, i32 53, i32 54, i32 56, i32 52, i32 56, i32 51, i32 52, i32 55, i32 57, i32 56, i32 52, i32 51, i32 49>
%cmp = icmp eq <64 x i8> %mask, zeroinitializer		%cmp = icmp eq <64 x i8> %mask, zeroinitializer
%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> %vec2		%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> %vec2
ret <64 x i8> %res		ret <64 x i8> %res
}		}

define <64 x i8> @test_masked_z_64xi8_perm_mem_mask1(<64 x i8>* %vp, <64 x i8> %mask) {		define <64 x i8> @test_masked_z_64xi8_perm_mem_mask1(<64 x i8>* %vp, <64 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_64xi8_perm_mem_mask1:		; GENERIC-LABEL: test_masked_z_64xi8_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 (%rdi), %zmm1 # sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 (%rdi), %zmm1 # sched: [6:0.50]
; GENERIC-NEXT: vptestnmb %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm1[15,6,14,7,5,1,14,12,5,7,5,0,0,5,3,8,19,19,26,27,20,29,20,21,27,16,30,17,23,27,16,28,47,39,33,33,33,44,38,46,39,33,38,44,45,32,34,39,50,61,62,53,54,56,52,56,51,52,55,57,56,52,51,49] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm1[15,6,14,7,5,1,14,12,5,7,5,0,0,5,3,8,19,19,26,27,20,29,20,21,27,16,30,17,23,27,16,28,47,39,33,33,33,44,38,46,39,33,38,44,45,32,34,39,50,61,62,53,54,56,52,56,51,52,55,57,56,52,51,49] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_64xi8_perm_mem_mask1:		; SKX-LABEL: test_masked_z_64xi8_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 (%rdi), %zmm1 # sched: [8:0.50]		; SKX-NEXT: vmovdqa64 (%rdi), %zmm1 # sched: [8:0.50]
; SKX-NEXT: vptestnmb %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm1[15,6,14,7,5,1,14,12,5,7,5,0,0,5,3,8,19,19,26,27,20,29,20,21,27,16,30,17,23,27,16,28,47,39,33,33,33,44,38,46,39,33,38,44,45,32,34,39,50,61,62,53,54,56,52,56,51,52,55,57,56,52,51,49] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm1[15,6,14,7,5,1,14,12,5,7,5,0,0,5,3,8,19,19,26,27,20,29,20,21,27,16,30,17,23,27,16,28,47,39,33,33,33,44,38,46,39,33,38,44,45,32,34,39,50,61,62,53,54,56,52,56,51,52,55,57,56,52,51,49] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <64 x i8>, <64 x i8>* %vp		%vec = load <64 x i8>, <64 x i8>* %vp
%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 15, i32 6, i32 14, i32 7, i32 5, i32 1, i32 14, i32 12, i32 5, i32 7, i32 5, i32 0, i32 0, i32 5, i32 3, i32 8, i32 19, i32 19, i32 26, i32 27, i32 20, i32 29, i32 20, i32 21, i32 27, i32 16, i32 30, i32 17, i32 23, i32 27, i32 16, i32 28, i32 47, i32 39, i32 33, i32 33, i32 33, i32 44, i32 38, i32 46, i32 39, i32 33, i32 38, i32 44, i32 45, i32 32, i32 34, i32 39, i32 50, i32 61, i32 62, i32 53, i32 54, i32 56, i32 52, i32 56, i32 51, i32 52, i32 55, i32 57, i32 56, i32 52, i32 51, i32 49>		%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 15, i32 6, i32 14, i32 7, i32 5, i32 1, i32 14, i32 12, i32 5, i32 7, i32 5, i32 0, i32 0, i32 5, i32 3, i32 8, i32 19, i32 19, i32 26, i32 27, i32 20, i32 29, i32 20, i32 21, i32 27, i32 16, i32 30, i32 17, i32 23, i32 27, i32 16, i32 28, i32 47, i32 39, i32 33, i32 33, i32 33, i32 44, i32 38, i32 46, i32 39, i32 33, i32 38, i32 44, i32 45, i32 32, i32 34, i32 39, i32 50, i32 61, i32 62, i32 53, i32 54, i32 56, i32 52, i32 56, i32 51, i32 52, i32 55, i32 57, i32 56, i32 52, i32 51, i32 49>
%cmp = icmp eq <64 x i8> %mask, zeroinitializer		%cmp = icmp eq <64 x i8> %mask, zeroinitializer
%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> zeroinitializer		%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> zeroinitializer
ret <64 x i8> %res		ret <64 x i8> %res
}		}

define <64 x i8> @test_masked_64xi8_perm_mem_mask2(<64 x i8>* %vp, <64 x i8> %vec2, <64 x i8> %mask) {		define <64 x i8> @test_masked_64xi8_perm_mem_mask2(<64 x i8>* %vp, <64 x i8> %vec2, <64 x i8> %mask) {
; GENERIC-LABEL: test_masked_64xi8_perm_mem_mask2:		; GENERIC-LABEL: test_masked_64xi8_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 (%rdi), %zmm2 # sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 (%rdi), %zmm2 # sched: [6:0.50]
; GENERIC-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} = zmm2[12,1,11,3,4,11,10,11,8,13,1,10,1,11,5,10,27,26,19,29,19,24,26,19,26,20,18,28,24,21,25,16,34,38,47,40,33,44,44,44,41,43,35,43,45,44,37,41,58,62,49,61,56,53,55,48,51,58,58,55,63,55,53,61] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} = zmm2[12,1,11,3,4,11,10,11,8,13,1,10,1,11,5,10,27,26,19,29,19,24,26,19,26,20,18,28,24,21,25,16,34,38,47,40,33,44,44,44,41,43,35,43,45,44,37,41,58,62,49,61,56,53,55,48,51,58,58,55,63,55,53,61] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_64xi8_perm_mem_mask2:		; SKX-LABEL: test_masked_64xi8_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 (%rdi), %zmm2 # sched: [8:0.50]		; SKX-NEXT: vmovdqa64 (%rdi), %zmm2 # sched: [8:0.50]
; SKX-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} = zmm2[12,1,11,3,4,11,10,11,8,13,1,10,1,11,5,10,27,26,19,29,19,24,26,19,26,20,18,28,24,21,25,16,34,38,47,40,33,44,44,44,41,43,35,43,45,44,37,41,58,62,49,61,56,53,55,48,51,58,58,55,63,55,53,61] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} = zmm2[12,1,11,3,4,11,10,11,8,13,1,10,1,11,5,10,27,26,19,29,19,24,26,19,26,20,18,28,24,21,25,16,34,38,47,40,33,44,44,44,41,43,35,43,45,44,37,41,58,62,49,61,56,53,55,48,51,58,58,55,63,55,53,61] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <64 x i8>, <64 x i8>* %vp		%vec = load <64 x i8>, <64 x i8>* %vp
%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 12, i32 1, i32 11, i32 3, i32 4, i32 11, i32 10, i32 11, i32 8, i32 13, i32 1, i32 10, i32 1, i32 11, i32 5, i32 10, i32 27, i32 26, i32 19, i32 29, i32 19, i32 24, i32 26, i32 19, i32 26, i32 20, i32 18, i32 28, i32 24, i32 21, i32 25, i32 16, i32 34, i32 38, i32 47, i32 40, i32 33, i32 44, i32 44, i32 44, i32 41, i32 43, i32 35, i32 43, i32 45, i32 44, i32 37, i32 41, i32 58, i32 62, i32 49, i32 61, i32 56, i32 53, i32 55, i32 48, i32 51, i32 58, i32 58, i32 55, i32 63, i32 55, i32 53, i32 61>		%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 12, i32 1, i32 11, i32 3, i32 4, i32 11, i32 10, i32 11, i32 8, i32 13, i32 1, i32 10, i32 1, i32 11, i32 5, i32 10, i32 27, i32 26, i32 19, i32 29, i32 19, i32 24, i32 26, i32 19, i32 26, i32 20, i32 18, i32 28, i32 24, i32 21, i32 25, i32 16, i32 34, i32 38, i32 47, i32 40, i32 33, i32 44, i32 44, i32 44, i32 41, i32 43, i32 35, i32 43, i32 45, i32 44, i32 37, i32 41, i32 58, i32 62, i32 49, i32 61, i32 56, i32 53, i32 55, i32 48, i32 51, i32 58, i32 58, i32 55, i32 63, i32 55, i32 53, i32 61>
%cmp = icmp eq <64 x i8> %mask, zeroinitializer		%cmp = icmp eq <64 x i8> %mask, zeroinitializer
%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> %vec2		%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> %vec2
ret <64 x i8> %res		ret <64 x i8> %res
}		}

define <64 x i8> @test_masked_z_64xi8_perm_mem_mask2(<64 x i8>* %vp, <64 x i8> %mask) {		define <64 x i8> @test_masked_z_64xi8_perm_mem_mask2(<64 x i8>* %vp, <64 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_64xi8_perm_mem_mask2:		; GENERIC-LABEL: test_masked_z_64xi8_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 (%rdi), %zmm1 # sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 (%rdi), %zmm1 # sched: [6:0.50]
; GENERIC-NEXT: vptestnmb %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm1[12,1,11,3,4,11,10,11,8,13,1,10,1,11,5,10,27,26,19,29,19,24,26,19,26,20,18,28,24,21,25,16,34,38,47,40,33,44,44,44,41,43,35,43,45,44,37,41,58,62,49,61,56,53,55,48,51,58,58,55,63,55,53,61] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm1[12,1,11,3,4,11,10,11,8,13,1,10,1,11,5,10,27,26,19,29,19,24,26,19,26,20,18,28,24,21,25,16,34,38,47,40,33,44,44,44,41,43,35,43,45,44,37,41,58,62,49,61,56,53,55,48,51,58,58,55,63,55,53,61] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_64xi8_perm_mem_mask2:		; SKX-LABEL: test_masked_z_64xi8_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 (%rdi), %zmm1 # sched: [8:0.50]		; SKX-NEXT: vmovdqa64 (%rdi), %zmm1 # sched: [8:0.50]
; SKX-NEXT: vptestnmb %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm1[12,1,11,3,4,11,10,11,8,13,1,10,1,11,5,10,27,26,19,29,19,24,26,19,26,20,18,28,24,21,25,16,34,38,47,40,33,44,44,44,41,43,35,43,45,44,37,41,58,62,49,61,56,53,55,48,51,58,58,55,63,55,53,61] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm1[12,1,11,3,4,11,10,11,8,13,1,10,1,11,5,10,27,26,19,29,19,24,26,19,26,20,18,28,24,21,25,16,34,38,47,40,33,44,44,44,41,43,35,43,45,44,37,41,58,62,49,61,56,53,55,48,51,58,58,55,63,55,53,61] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <64 x i8>, <64 x i8>* %vp		%vec = load <64 x i8>, <64 x i8>* %vp
%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 12, i32 1, i32 11, i32 3, i32 4, i32 11, i32 10, i32 11, i32 8, i32 13, i32 1, i32 10, i32 1, i32 11, i32 5, i32 10, i32 27, i32 26, i32 19, i32 29, i32 19, i32 24, i32 26, i32 19, i32 26, i32 20, i32 18, i32 28, i32 24, i32 21, i32 25, i32 16, i32 34, i32 38, i32 47, i32 40, i32 33, i32 44, i32 44, i32 44, i32 41, i32 43, i32 35, i32 43, i32 45, i32 44, i32 37, i32 41, i32 58, i32 62, i32 49, i32 61, i32 56, i32 53, i32 55, i32 48, i32 51, i32 58, i32 58, i32 55, i32 63, i32 55, i32 53, i32 61>		%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 12, i32 1, i32 11, i32 3, i32 4, i32 11, i32 10, i32 11, i32 8, i32 13, i32 1, i32 10, i32 1, i32 11, i32 5, i32 10, i32 27, i32 26, i32 19, i32 29, i32 19, i32 24, i32 26, i32 19, i32 26, i32 20, i32 18, i32 28, i32 24, i32 21, i32 25, i32 16, i32 34, i32 38, i32 47, i32 40, i32 33, i32 44, i32 44, i32 44, i32 41, i32 43, i32 35, i32 43, i32 45, i32 44, i32 37, i32 41, i32 58, i32 62, i32 49, i32 61, i32 56, i32 53, i32 55, i32 48, i32 51, i32 58, i32 58, i32 55, i32 63, i32 55, i32 53, i32 61>
%cmp = icmp eq <64 x i8> %mask, zeroinitializer		%cmp = icmp eq <64 x i8> %mask, zeroinitializer
%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> zeroinitializer		%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> zeroinitializer
ret <64 x i8> %res		ret <64 x i8> %res
}		}

define <64 x i8> @test_64xi8_perm_mem_mask3(<64 x i8>* %vp) {		define <64 x i8> @test_64xi8_perm_mem_mask3(<64 x i8>* %vp) {
; GENERIC-LABEL: test_64xi8_perm_mem_mask3:		; GENERIC-LABEL: test_64xi8_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 (%rdi), %zmm0 # sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 (%rdi), %zmm0 # sched: [6:0.50]
; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 = zmm0[4,9,11,13,12,6,0,0,11,15,5,7,11,10,4,10,20,21,24,27,18,16,26,16,16,19,26,17,16,31,22,30,35,38,37,34,37,47,43,38,38,36,40,43,42,39,32,46,54,54,48,50,61,56,59,50,53,61,61,51,48,60,50,60] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 = zmm0[4,9,11,13,12,6,0,0,11,15,5,7,11,10,4,10,20,21,24,27,18,16,26,16,16,19,26,17,16,31,22,30,35,38,37,34,37,47,43,38,38,36,40,43,42,39,32,46,54,54,48,50,61,56,59,50,53,61,61,51,48,60,50,60] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_64xi8_perm_mem_mask3:		; SKX-LABEL: test_64xi8_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 (%rdi), %zmm0 # sched: [8:0.50]		; SKX-NEXT: vmovdqa64 (%rdi), %zmm0 # sched: [8:0.50]
; SKX-NEXT: vpshufb {{.*#+}} zmm0 = zmm0[4,9,11,13,12,6,0,0,11,15,5,7,11,10,4,10,20,21,24,27,18,16,26,16,16,19,26,17,16,31,22,30,35,38,37,34,37,47,43,38,38,36,40,43,42,39,32,46,54,54,48,50,61,56,59,50,53,61,61,51,48,60,50,60] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} zmm0 = zmm0[4,9,11,13,12,6,0,0,11,15,5,7,11,10,4,10,20,21,24,27,18,16,26,16,16,19,26,17,16,31,22,30,35,38,37,34,37,47,43,38,38,36,40,43,42,39,32,46,54,54,48,50,61,56,59,50,53,61,61,51,48,60,50,60] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <64 x i8>, <64 x i8>* %vp		%vec = load <64 x i8>, <64 x i8>* %vp
%res = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 4, i32 9, i32 11, i32 13, i32 12, i32 6, i32 0, i32 0, i32 11, i32 15, i32 5, i32 7, i32 11, i32 10, i32 4, i32 10, i32 20, i32 21, i32 24, i32 27, i32 18, i32 16, i32 26, i32 16, i32 16, i32 19, i32 26, i32 17, i32 16, i32 31, i32 22, i32 30, i32 35, i32 38, i32 37, i32 34, i32 37, i32 47, i32 43, i32 38, i32 38, i32 36, i32 40, i32 43, i32 42, i32 39, i32 32, i32 46, i32 54, i32 54, i32 48, i32 50, i32 61, i32 56, i32 59, i32 50, i32 53, i32 61, i32 61, i32 51, i32 48, i32 60, i32 50, i32 60>		%res = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 4, i32 9, i32 11, i32 13, i32 12, i32 6, i32 0, i32 0, i32 11, i32 15, i32 5, i32 7, i32 11, i32 10, i32 4, i32 10, i32 20, i32 21, i32 24, i32 27, i32 18, i32 16, i32 26, i32 16, i32 16, i32 19, i32 26, i32 17, i32 16, i32 31, i32 22, i32 30, i32 35, i32 38, i32 37, i32 34, i32 37, i32 47, i32 43, i32 38, i32 38, i32 36, i32 40, i32 43, i32 42, i32 39, i32 32, i32 46, i32 54, i32 54, i32 48, i32 50, i32 61, i32 56, i32 59, i32 50, i32 53, i32 61, i32 61, i32 51, i32 48, i32 60, i32 50, i32 60>
ret <64 x i8> %res		ret <64 x i8> %res
}		}
define <64 x i8> @test_masked_64xi8_perm_mem_mask3(<64 x i8>* %vp, <64 x i8> %vec2, <64 x i8> %mask) {		define <64 x i8> @test_masked_64xi8_perm_mem_mask3(<64 x i8>* %vp, <64 x i8> %vec2, <64 x i8> %mask) {
; GENERIC-LABEL: test_masked_64xi8_perm_mem_mask3:		; GENERIC-LABEL: test_masked_64xi8_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 (%rdi), %zmm2 # sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 (%rdi), %zmm2 # sched: [6:0.50]
; GENERIC-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} = zmm2[4,9,11,13,12,6,0,0,11,15,5,7,11,10,4,10,20,21,24,27,18,16,26,16,16,19,26,17,16,31,22,30,35,38,37,34,37,47,43,38,38,36,40,43,42,39,32,46,54,54,48,50,61,56,59,50,53,61,61,51,48,60,50,60] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} = zmm2[4,9,11,13,12,6,0,0,11,15,5,7,11,10,4,10,20,21,24,27,18,16,26,16,16,19,26,17,16,31,22,30,35,38,37,34,37,47,43,38,38,36,40,43,42,39,32,46,54,54,48,50,61,56,59,50,53,61,61,51,48,60,50,60] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_64xi8_perm_mem_mask3:		; SKX-LABEL: test_masked_64xi8_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 (%rdi), %zmm2 # sched: [8:0.50]		; SKX-NEXT: vmovdqa64 (%rdi), %zmm2 # sched: [8:0.50]
; SKX-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} = zmm2[4,9,11,13,12,6,0,0,11,15,5,7,11,10,4,10,20,21,24,27,18,16,26,16,16,19,26,17,16,31,22,30,35,38,37,34,37,47,43,38,38,36,40,43,42,39,32,46,54,54,48,50,61,56,59,50,53,61,61,51,48,60,50,60] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} = zmm2[4,9,11,13,12,6,0,0,11,15,5,7,11,10,4,10,20,21,24,27,18,16,26,16,16,19,26,17,16,31,22,30,35,38,37,34,37,47,43,38,38,36,40,43,42,39,32,46,54,54,48,50,61,56,59,50,53,61,61,51,48,60,50,60] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <64 x i8>, <64 x i8>* %vp		%vec = load <64 x i8>, <64 x i8>* %vp
%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 4, i32 9, i32 11, i32 13, i32 12, i32 6, i32 0, i32 0, i32 11, i32 15, i32 5, i32 7, i32 11, i32 10, i32 4, i32 10, i32 20, i32 21, i32 24, i32 27, i32 18, i32 16, i32 26, i32 16, i32 16, i32 19, i32 26, i32 17, i32 16, i32 31, i32 22, i32 30, i32 35, i32 38, i32 37, i32 34, i32 37, i32 47, i32 43, i32 38, i32 38, i32 36, i32 40, i32 43, i32 42, i32 39, i32 32, i32 46, i32 54, i32 54, i32 48, i32 50, i32 61, i32 56, i32 59, i32 50, i32 53, i32 61, i32 61, i32 51, i32 48, i32 60, i32 50, i32 60>		%shuf = shufflevector <64 x i8> %vec, <64 x i8> undef, <64 x i32> <i32 4, i32 9, i32 11, i32 13, i32 12, i32 6, i32 0, i32 0, i32 11, i32 15, i32 5, i32 7, i32 11, i32 10, i32 4, i32 10, i32 20, i32 21, i32 24, i32 27, i32 18, i32 16, i32 26, i32 16, i32 16, i32 19, i32 26, i32 17, i32 16, i32 31, i32 22, i32 30, i32 35, i32 38, i32 37, i32 34, i32 37, i32 47, i32 43, i32 38, i32 38, i32 36, i32 40, i32 43, i32 42, i32 39, i32 32, i32 46, i32 54, i32 54, i32 48, i32 50, i32 61, i32 56, i32 59, i32 50, i32 53, i32 61, i32 61, i32 51, i32 48, i32 60, i32 50, i32 60>
%cmp = icmp eq <64 x i8> %mask, zeroinitializer		%cmp = icmp eq <64 x i8> %mask, zeroinitializer
%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> %vec2		%res = select <64 x i1> %cmp, <64 x i8> %shuf, <64 x i8> %vec2
ret <64 x i8> %res		ret <64 x i8> %res
}		}

define <64 x i8> @test_masked_z_64xi8_perm_mem_mask3(<64 x i8>* %vp, <64 x i8> %mask) {		define <64 x i8> @test_masked_z_64xi8_perm_mem_mask3(<64 x i8>* %vp, <64 x i8> %mask) {
; GENERIC-LABEL: test_masked_z_64xi8_perm_mem_mask3:		; GENERIC-LABEL: test_masked_z_64xi8_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vmovdqa64 (%rdi), %zmm1 # sched: [6:0.50]		; GENERIC-NEXT: vmovdqa64 (%rdi), %zmm1 # sched: [6:0.50]
; GENERIC-NEXT: vptestnmb %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmb %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm1[4,9,11,13,12,6,0,0,11,15,5,7,11,10,4,10,20,21,24,27,18,16,26,16,16,19,26,17,16,31,22,30,35,38,37,34,37,47,43,38,38,36,40,43,42,39,32,46,54,54,48,50,61,56,59,50,53,61,61,51,48,60,50,60] sched: [5:1.00]		; GENERIC-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm1[4,9,11,13,12,6,0,0,11,15,5,7,11,10,4,10,20,21,24,27,18,16,26,16,16,19,26,17,16,31,22,30,35,38,37,34,37,47,43,38,38,36,40,43,42,39,32,46,54,54,48,50,61,56,59,50,53,61,61,51,48,60,50,60] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_64xi8_perm_mem_mask3:		; SKX-LABEL: test_masked_z_64xi8_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vmovdqa64 (%rdi), %zmm1 # sched: [8:0.50]		; SKX-NEXT: vmovdqa64 (%rdi), %zmm1 # sched: [8:0.50]
; SKX-NEXT: vptestnmb %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmb %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm1[4,9,11,13,12,6,0,0,11,15,5,7,11,10,4,10,20,21,24,27,18,16,26,16,16,19,26,17,16,31,22,30,35,38,37,34,37,47,43,38,38,36,40,43,42,39,32,46,54,54,48,50,61,56,59,50,53,61,61,51,48,60,50,60] sched: [8:1.00]		; SKX-NEXT: vpshufb {{.*#+}} zmm0 {%k1} {z} = zmm1[4,9,11,13,12,6,0,0,11,15,5,7,11,10,4,10,20,21,24,27,18,16,26,16,16,19,26,17,16,31,22,30,35,38,37,34,37,47,43,38,38,36,40,43,42,39,32,46,54,54,48,50,61,56,59,50,53,61,61,51,48,60,50,60] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
▲ Show 20 Lines • Show All 352 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i16>, <8 x i16>* %vp		%vec = load <8 x i16>, <8 x i16>* %vp
%res = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 7, i32 4, i32 6>		%res = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 7, i32 4, i32 6>
ret <8 x i16> %res		ret <8 x i16> %res
}		}
define <8 x i16> @test_masked_8xi16_perm_high_mem_mask0(<8 x i16>* %vp, <8 x i16> %vec2, <8 x i16> %mask) {		define <8 x i16> @test_masked_8xi16_perm_high_mem_mask0(<8 x i16>* %vp, <8 x i16> %vec2, <8 x i16> %mask) {
; GENERIC-LABEL: test_masked_8xi16_perm_high_mem_mask0:		; GENERIC-LABEL: test_masked_8xi16_perm_high_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} = mem[0,1,2,3,7,7,4,6] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} = mem[0,1,2,3,7,7,4,6] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xi16_perm_high_mem_mask0:		; SKX-LABEL: test_masked_8xi16_perm_high_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} = mem[0,1,2,3,7,7,4,6] sched: [7:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} = mem[0,1,2,3,7,7,4,6] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i16>, <8 x i16>* %vp		%vec = load <8 x i16>, <8 x i16>* %vp
%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 7, i32 4, i32 6>		%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 7, i32 4, i32 6>
%cmp = icmp eq <8 x i16> %mask, zeroinitializer		%cmp = icmp eq <8 x i16> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> %vec2		%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> %vec2
ret <8 x i16> %res		ret <8 x i16> %res
}		}

define <8 x i16> @test_masked_z_8xi16_perm_high_mem_mask0(<8 x i16>* %vp, <8 x i16> %mask) {		define <8 x i16> @test_masked_z_8xi16_perm_high_mem_mask0(<8 x i16>* %vp, <8 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_8xi16_perm_high_mem_mask0:		; GENERIC-LABEL: test_masked_z_8xi16_perm_high_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} {z} = mem[0,1,2,3,7,7,4,6] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} {z} = mem[0,1,2,3,7,7,4,6] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xi16_perm_high_mem_mask0:		; SKX-LABEL: test_masked_z_8xi16_perm_high_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} {z} = mem[0,1,2,3,7,7,4,6] sched: [7:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} {z} = mem[0,1,2,3,7,7,4,6] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i16>, <8 x i16>* %vp		%vec = load <8 x i16>, <8 x i16>* %vp
%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 7, i32 4, i32 6>		%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 7, i32 4, i32 6>
%cmp = icmp eq <8 x i16> %mask, zeroinitializer		%cmp = icmp eq <8 x i16> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> zeroinitializer
ret <8 x i16> %res		ret <8 x i16> %res
}		}

define <8 x i16> @test_masked_8xi16_perm_low_mem_mask1(<8 x i16>* %vp, <8 x i16> %vec2, <8 x i16> %mask) {		define <8 x i16> @test_masked_8xi16_perm_low_mem_mask1(<8 x i16>* %vp, <8 x i16> %vec2, <8 x i16> %mask) {
; GENERIC-LABEL: test_masked_8xi16_perm_low_mem_mask1:		; GENERIC-LABEL: test_masked_8xi16_perm_low_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} = mem[1,3,3,2,4,5,6,7] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} = mem[1,3,3,2,4,5,6,7] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xi16_perm_low_mem_mask1:		; SKX-LABEL: test_masked_8xi16_perm_low_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} = mem[1,3,3,2,4,5,6,7] sched: [7:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} = mem[1,3,3,2,4,5,6,7] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i16>, <8 x i16>* %vp		%vec = load <8 x i16>, <8 x i16>* %vp
%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 1, i32 3, i32 3, i32 2, i32 4, i32 5, i32 6, i32 7>		%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 1, i32 3, i32 3, i32 2, i32 4, i32 5, i32 6, i32 7>
%cmp = icmp eq <8 x i16> %mask, zeroinitializer		%cmp = icmp eq <8 x i16> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> %vec2		%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> %vec2
ret <8 x i16> %res		ret <8 x i16> %res
}		}

define <8 x i16> @test_masked_z_8xi16_perm_low_mem_mask1(<8 x i16>* %vp, <8 x i16> %mask) {		define <8 x i16> @test_masked_z_8xi16_perm_low_mem_mask1(<8 x i16>* %vp, <8 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_8xi16_perm_low_mem_mask1:		; GENERIC-LABEL: test_masked_z_8xi16_perm_low_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} {z} = mem[1,3,3,2,4,5,6,7] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} {z} = mem[1,3,3,2,4,5,6,7] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xi16_perm_low_mem_mask1:		; SKX-LABEL: test_masked_z_8xi16_perm_low_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} {z} = mem[1,3,3,2,4,5,6,7] sched: [7:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} {z} = mem[1,3,3,2,4,5,6,7] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i16>, <8 x i16>* %vp		%vec = load <8 x i16>, <8 x i16>* %vp
%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 1, i32 3, i32 3, i32 2, i32 4, i32 5, i32 6, i32 7>		%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 1, i32 3, i32 3, i32 2, i32 4, i32 5, i32 6, i32 7>
%cmp = icmp eq <8 x i16> %mask, zeroinitializer		%cmp = icmp eq <8 x i16> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> zeroinitializer
ret <8 x i16> %res		ret <8 x i16> %res
}		}

define <8 x i16> @test_masked_8xi16_perm_high_mem_mask2(<8 x i16>* %vp, <8 x i16> %vec2, <8 x i16> %mask) {		define <8 x i16> @test_masked_8xi16_perm_high_mem_mask2(<8 x i16>* %vp, <8 x i16> %vec2, <8 x i16> %mask) {
; GENERIC-LABEL: test_masked_8xi16_perm_high_mem_mask2:		; GENERIC-LABEL: test_masked_8xi16_perm_high_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} = mem[0,1,2,3,6,6,5,7] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} = mem[0,1,2,3,6,6,5,7] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xi16_perm_high_mem_mask2:		; SKX-LABEL: test_masked_8xi16_perm_high_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} = mem[0,1,2,3,6,6,5,7] sched: [7:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} = mem[0,1,2,3,6,6,5,7] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i16>, <8 x i16>* %vp		%vec = load <8 x i16>, <8 x i16>* %vp
%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 6, i32 6, i32 5, i32 7>		%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 6, i32 6, i32 5, i32 7>
%cmp = icmp eq <8 x i16> %mask, zeroinitializer		%cmp = icmp eq <8 x i16> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> %vec2		%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> %vec2
ret <8 x i16> %res		ret <8 x i16> %res
}		}

define <8 x i16> @test_masked_z_8xi16_perm_high_mem_mask2(<8 x i16>* %vp, <8 x i16> %mask) {		define <8 x i16> @test_masked_z_8xi16_perm_high_mem_mask2(<8 x i16>* %vp, <8 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_8xi16_perm_high_mem_mask2:		; GENERIC-LABEL: test_masked_z_8xi16_perm_high_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} {z} = mem[0,1,2,3,6,6,5,7] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} {z} = mem[0,1,2,3,6,6,5,7] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xi16_perm_high_mem_mask2:		; SKX-LABEL: test_masked_z_8xi16_perm_high_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} {z} = mem[0,1,2,3,6,6,5,7] sched: [7:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} {z} = mem[0,1,2,3,6,6,5,7] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i16>, <8 x i16>* %vp		%vec = load <8 x i16>, <8 x i16>* %vp
Show All 16 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i16>, <8 x i16>* %vp		%vec = load <8 x i16>, <8 x i16>* %vp
%res = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 3, i32 1, i32 2, i32 0, i32 4, i32 5, i32 6, i32 7>		%res = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 3, i32 1, i32 2, i32 0, i32 4, i32 5, i32 6, i32 7>
ret <8 x i16> %res		ret <8 x i16> %res
}		}
define <8 x i16> @test_masked_8xi16_perm_low_mem_mask3(<8 x i16>* %vp, <8 x i16> %vec2, <8 x i16> %mask) {		define <8 x i16> @test_masked_8xi16_perm_low_mem_mask3(<8 x i16>* %vp, <8 x i16> %vec2, <8 x i16> %mask) {
; GENERIC-LABEL: test_masked_8xi16_perm_low_mem_mask3:		; GENERIC-LABEL: test_masked_8xi16_perm_low_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} = mem[3,1,2,0,4,5,6,7] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} = mem[3,1,2,0,4,5,6,7] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xi16_perm_low_mem_mask3:		; SKX-LABEL: test_masked_8xi16_perm_low_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} = mem[3,1,2,0,4,5,6,7] sched: [7:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} = mem[3,1,2,0,4,5,6,7] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i16>, <8 x i16>* %vp		%vec = load <8 x i16>, <8 x i16>* %vp
%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 3, i32 1, i32 2, i32 0, i32 4, i32 5, i32 6, i32 7>		%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 3, i32 1, i32 2, i32 0, i32 4, i32 5, i32 6, i32 7>
%cmp = icmp eq <8 x i16> %mask, zeroinitializer		%cmp = icmp eq <8 x i16> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> %vec2		%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> %vec2
ret <8 x i16> %res		ret <8 x i16> %res
}		}

define <8 x i16> @test_masked_z_8xi16_perm_low_mem_mask3(<8 x i16>* %vp, <8 x i16> %mask) {		define <8 x i16> @test_masked_z_8xi16_perm_low_mem_mask3(<8 x i16>* %vp, <8 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_8xi16_perm_low_mem_mask3:		; GENERIC-LABEL: test_masked_z_8xi16_perm_low_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} {z} = mem[3,1,2,0,4,5,6,7] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} {z} = mem[3,1,2,0,4,5,6,7] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xi16_perm_low_mem_mask3:		; SKX-LABEL: test_masked_z_8xi16_perm_low_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} {z} = mem[3,1,2,0,4,5,6,7] sched: [7:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} {z} = mem[3,1,2,0,4,5,6,7] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i16>, <8 x i16>* %vp		%vec = load <8 x i16>, <8 x i16>* %vp
%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 3, i32 1, i32 2, i32 0, i32 4, i32 5, i32 6, i32 7>		%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 3, i32 1, i32 2, i32 0, i32 4, i32 5, i32 6, i32 7>
%cmp = icmp eq <8 x i16> %mask, zeroinitializer		%cmp = icmp eq <8 x i16> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> zeroinitializer
ret <8 x i16> %res		ret <8 x i16> %res
}		}

define <8 x i16> @test_masked_8xi16_perm_high_mem_mask4(<8 x i16>* %vp, <8 x i16> %vec2, <8 x i16> %mask) {		define <8 x i16> @test_masked_8xi16_perm_high_mem_mask4(<8 x i16>* %vp, <8 x i16> %vec2, <8 x i16> %mask) {
; GENERIC-LABEL: test_masked_8xi16_perm_high_mem_mask4:		; GENERIC-LABEL: test_masked_8xi16_perm_high_mem_mask4:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} = mem[0,1,2,3,7,6,7,5] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} = mem[0,1,2,3,7,6,7,5] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xi16_perm_high_mem_mask4:		; SKX-LABEL: test_masked_8xi16_perm_high_mem_mask4:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} = mem[0,1,2,3,7,6,7,5] sched: [7:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} = mem[0,1,2,3,7,6,7,5] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i16>, <8 x i16>* %vp		%vec = load <8 x i16>, <8 x i16>* %vp
%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 6, i32 7, i32 5>		%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 6, i32 7, i32 5>
%cmp = icmp eq <8 x i16> %mask, zeroinitializer		%cmp = icmp eq <8 x i16> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> %vec2		%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> %vec2
ret <8 x i16> %res		ret <8 x i16> %res
}		}

define <8 x i16> @test_masked_z_8xi16_perm_high_mem_mask4(<8 x i16>* %vp, <8 x i16> %mask) {		define <8 x i16> @test_masked_z_8xi16_perm_high_mem_mask4(<8 x i16>* %vp, <8 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_8xi16_perm_high_mem_mask4:		; GENERIC-LABEL: test_masked_z_8xi16_perm_high_mem_mask4:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} {z} = mem[0,1,2,3,7,6,7,5] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} {z} = mem[0,1,2,3,7,6,7,5] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xi16_perm_high_mem_mask4:		; SKX-LABEL: test_masked_z_8xi16_perm_high_mem_mask4:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} {z} = mem[0,1,2,3,7,6,7,5] sched: [7:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} {z} = mem[0,1,2,3,7,6,7,5] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i16>, <8 x i16>* %vp		%vec = load <8 x i16>, <8 x i16>* %vp
%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 6, i32 7, i32 5>		%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 6, i32 7, i32 5>
%cmp = icmp eq <8 x i16> %mask, zeroinitializer		%cmp = icmp eq <8 x i16> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> zeroinitializer
ret <8 x i16> %res		ret <8 x i16> %res
}		}

define <8 x i16> @test_masked_8xi16_perm_low_mem_mask5(<8 x i16>* %vp, <8 x i16> %vec2, <8 x i16> %mask) {		define <8 x i16> @test_masked_8xi16_perm_low_mem_mask5(<8 x i16>* %vp, <8 x i16> %vec2, <8 x i16> %mask) {
; GENERIC-LABEL: test_masked_8xi16_perm_low_mem_mask5:		; GENERIC-LABEL: test_masked_8xi16_perm_low_mem_mask5:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} = mem[2,1,3,2,4,5,6,7] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} = mem[2,1,3,2,4,5,6,7] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xi16_perm_low_mem_mask5:		; SKX-LABEL: test_masked_8xi16_perm_low_mem_mask5:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} = mem[2,1,3,2,4,5,6,7] sched: [7:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} = mem[2,1,3,2,4,5,6,7] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i16>, <8 x i16>* %vp		%vec = load <8 x i16>, <8 x i16>* %vp
%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 2, i32 1, i32 3, i32 2, i32 4, i32 5, i32 6, i32 7>		%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 2, i32 1, i32 3, i32 2, i32 4, i32 5, i32 6, i32 7>
%cmp = icmp eq <8 x i16> %mask, zeroinitializer		%cmp = icmp eq <8 x i16> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> %vec2		%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> %vec2
ret <8 x i16> %res		ret <8 x i16> %res
}		}

define <8 x i16> @test_masked_z_8xi16_perm_low_mem_mask5(<8 x i16>* %vp, <8 x i16> %mask) {		define <8 x i16> @test_masked_z_8xi16_perm_low_mem_mask5(<8 x i16>* %vp, <8 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_8xi16_perm_low_mem_mask5:		; GENERIC-LABEL: test_masked_z_8xi16_perm_low_mem_mask5:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} {z} = mem[2,1,3,2,4,5,6,7] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} {z} = mem[2,1,3,2,4,5,6,7] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xi16_perm_low_mem_mask5:		; SKX-LABEL: test_masked_z_8xi16_perm_low_mem_mask5:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} {z} = mem[2,1,3,2,4,5,6,7] sched: [7:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} {z} = mem[2,1,3,2,4,5,6,7] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i16>, <8 x i16>* %vp		%vec = load <8 x i16>, <8 x i16>* %vp
Show All 16 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i16>, <8 x i16>* %vp		%vec = load <8 x i16>, <8 x i16>* %vp
%res = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 4, i32 4, i32 4>		%res = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 4, i32 4, i32 4>
ret <8 x i16> %res		ret <8 x i16> %res
}		}
define <8 x i16> @test_masked_8xi16_perm_high_mem_mask6(<8 x i16>* %vp, <8 x i16> %vec2, <8 x i16> %mask) {		define <8 x i16> @test_masked_8xi16_perm_high_mem_mask6(<8 x i16>* %vp, <8 x i16> %vec2, <8 x i16> %mask) {
; GENERIC-LABEL: test_masked_8xi16_perm_high_mem_mask6:		; GENERIC-LABEL: test_masked_8xi16_perm_high_mem_mask6:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} = mem[0,1,2,3,7,4,4,4] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} = mem[0,1,2,3,7,4,4,4] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xi16_perm_high_mem_mask6:		; SKX-LABEL: test_masked_8xi16_perm_high_mem_mask6:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} = mem[0,1,2,3,7,4,4,4] sched: [7:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} = mem[0,1,2,3,7,4,4,4] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i16>, <8 x i16>* %vp		%vec = load <8 x i16>, <8 x i16>* %vp
%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 4, i32 4, i32 4>		%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 4, i32 4, i32 4>
%cmp = icmp eq <8 x i16> %mask, zeroinitializer		%cmp = icmp eq <8 x i16> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> %vec2		%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> %vec2
ret <8 x i16> %res		ret <8 x i16> %res
}		}

define <8 x i16> @test_masked_z_8xi16_perm_high_mem_mask6(<8 x i16>* %vp, <8 x i16> %mask) {		define <8 x i16> @test_masked_z_8xi16_perm_high_mem_mask6(<8 x i16>* %vp, <8 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_8xi16_perm_high_mem_mask6:		; GENERIC-LABEL: test_masked_z_8xi16_perm_high_mem_mask6:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} {z} = mem[0,1,2,3,7,4,4,4] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} {z} = mem[0,1,2,3,7,4,4,4] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xi16_perm_high_mem_mask6:		; SKX-LABEL: test_masked_z_8xi16_perm_high_mem_mask6:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} {z} = mem[0,1,2,3,7,4,4,4] sched: [7:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} xmm0 {%k1} {z} = mem[0,1,2,3,7,4,4,4] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i16>, <8 x i16>* %vp		%vec = load <8 x i16>, <8 x i16>* %vp
%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 4, i32 4, i32 4>		%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 4, i32 4, i32 4>
%cmp = icmp eq <8 x i16> %mask, zeroinitializer		%cmp = icmp eq <8 x i16> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> zeroinitializer
ret <8 x i16> %res		ret <8 x i16> %res
}		}

define <8 x i16> @test_masked_8xi16_perm_low_mem_mask7(<8 x i16>* %vp, <8 x i16> %vec2, <8 x i16> %mask) {		define <8 x i16> @test_masked_8xi16_perm_low_mem_mask7(<8 x i16>* %vp, <8 x i16> %vec2, <8 x i16> %mask) {
; GENERIC-LABEL: test_masked_8xi16_perm_low_mem_mask7:		; GENERIC-LABEL: test_masked_8xi16_perm_low_mem_mask7:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} = mem[0,3,3,1,4,5,6,7] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} = mem[0,3,3,1,4,5,6,7] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_8xi16_perm_low_mem_mask7:		; SKX-LABEL: test_masked_8xi16_perm_low_mem_mask7:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} = mem[0,3,3,1,4,5,6,7] sched: [7:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} = mem[0,3,3,1,4,5,6,7] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i16>, <8 x i16>* %vp		%vec = load <8 x i16>, <8 x i16>* %vp
%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 0, i32 3, i32 3, i32 1, i32 4, i32 5, i32 6, i32 7>		%shuf = shufflevector <8 x i16> %vec, <8 x i16> undef, <8 x i32> <i32 0, i32 3, i32 3, i32 1, i32 4, i32 5, i32 6, i32 7>
%cmp = icmp eq <8 x i16> %mask, zeroinitializer		%cmp = icmp eq <8 x i16> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> %vec2		%res = select <8 x i1> %cmp, <8 x i16> %shuf, <8 x i16> %vec2
ret <8 x i16> %res		ret <8 x i16> %res
}		}

define <8 x i16> @test_masked_z_8xi16_perm_low_mem_mask7(<8 x i16>* %vp, <8 x i16> %mask) {		define <8 x i16> @test_masked_z_8xi16_perm_low_mem_mask7(<8 x i16>* %vp, <8 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_8xi16_perm_low_mem_mask7:		; GENERIC-LABEL: test_masked_z_8xi16_perm_low_mem_mask7:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} {z} = mem[0,3,3,1,4,5,6,7] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} {z} = mem[0,3,3,1,4,5,6,7] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_8xi16_perm_low_mem_mask7:		; SKX-LABEL: test_masked_z_8xi16_perm_low_mem_mask7:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %xmm0, %xmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} {z} = mem[0,3,3,1,4,5,6,7] sched: [7:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} xmm0 {%k1} {z} = mem[0,3,3,1,4,5,6,7] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i16>, <8 x i16>* %vp		%vec = load <8 x i16>, <8 x i16>* %vp
▲ Show 20 Lines • Show All 336 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 3, i32 2, i32 1, i32 2, i32 4, i32 5, i32 6, i32 7, i32 11, i32 10, i32 9, i32 10, i32 12, i32 13, i32 14, i32 15>		%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 3, i32 2, i32 1, i32 2, i32 4, i32 5, i32 6, i32 7, i32 11, i32 10, i32 9, i32 10, i32 12, i32 13, i32 14, i32 15>
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer
ret <16 x i16> %res		ret <16 x i16> %res
}		}
define <16 x i16> @test_16xi16_perm_high_mem_mask0(<16 x i16>* %vp) {		define <16 x i16> @test_16xi16_perm_high_mem_mask0(<16 x i16>* %vp) {
; GENERIC-LABEL: test_16xi16_perm_high_mem_mask0:		; GENERIC-LABEL: test_16xi16_perm_high_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpshufhw {{.*#+}} ymm0 = mem[0,1,2,3,5,6,4,7,8,9,10,11,13,14,12,15] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} ymm0 = mem[0,1,2,3,5,6,4,7,8,9,10,11,13,14,12,15] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xi16_perm_high_mem_mask0:		; SKX-LABEL: test_16xi16_perm_high_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpshufhw {{.*#+}} ymm0 = mem[0,1,2,3,5,6,4,7,8,9,10,11,13,14,12,15] sched: [8:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} ymm0 = mem[0,1,2,3,5,6,4,7,8,9,10,11,13,14,12,15] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%res = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 6, i32 4, i32 7, i32 8, i32 9, i32 10, i32 11, i32 13, i32 14, i32 12, i32 15>		%res = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 6, i32 4, i32 7, i32 8, i32 9, i32 10, i32 11, i32 13, i32 14, i32 12, i32 15>
ret <16 x i16> %res		ret <16 x i16> %res
}		}
define <16 x i16> @test_masked_16xi16_perm_high_mem_mask0(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {		define <16 x i16> @test_masked_16xi16_perm_high_mem_mask0(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_16xi16_perm_high_mem_mask0:		; GENERIC-LABEL: test_masked_16xi16_perm_high_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} = mem[0,1,2,3,5,6,4,7,8,9,10,11,13,14,12,15] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} = mem[0,1,2,3,5,6,4,7,8,9,10,11,13,14,12,15] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi16_perm_high_mem_mask0:		; SKX-LABEL: test_masked_16xi16_perm_high_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} = mem[0,1,2,3,5,6,4,7,8,9,10,11,13,14,12,15] sched: [8:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} = mem[0,1,2,3,5,6,4,7,8,9,10,11,13,14,12,15] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 6, i32 4, i32 7, i32 8, i32 9, i32 10, i32 11, i32 13, i32 14, i32 12, i32 15>		%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 6, i32 4, i32 7, i32 8, i32 9, i32 10, i32 11, i32 13, i32 14, i32 12, i32 15>
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2
ret <16 x i16> %res		ret <16 x i16> %res
}		}

define <16 x i16> @test_masked_z_16xi16_perm_high_mem_mask0(<16 x i16>* %vp, <16 x i16> %mask) {		define <16 x i16> @test_masked_z_16xi16_perm_high_mem_mask0(<16 x i16>* %vp, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_16xi16_perm_high_mem_mask0:		; GENERIC-LABEL: test_masked_z_16xi16_perm_high_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} {z} = mem[0,1,2,3,5,6,4,7,8,9,10,11,13,14,12,15] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} {z} = mem[0,1,2,3,5,6,4,7,8,9,10,11,13,14,12,15] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi16_perm_high_mem_mask0:		; SKX-LABEL: test_masked_z_16xi16_perm_high_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} {z} = mem[0,1,2,3,5,6,4,7,8,9,10,11,13,14,12,15] sched: [8:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} {z} = mem[0,1,2,3,5,6,4,7,8,9,10,11,13,14,12,15] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 6, i32 4, i32 7, i32 8, i32 9, i32 10, i32 11, i32 13, i32 14, i32 12, i32 15>		%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 6, i32 4, i32 7, i32 8, i32 9, i32 10, i32 11, i32 13, i32 14, i32 12, i32 15>
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer
ret <16 x i16> %res		ret <16 x i16> %res
}		}

define <16 x i16> @test_masked_16xi16_perm_low_mem_mask1(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {		define <16 x i16> @test_masked_16xi16_perm_low_mem_mask1(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_16xi16_perm_low_mem_mask1:		; GENERIC-LABEL: test_masked_16xi16_perm_low_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} = mem[1,3,3,0,4,5,6,7,9,11,11,8,12,13,14,15] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} = mem[1,3,3,0,4,5,6,7,9,11,11,8,12,13,14,15] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi16_perm_low_mem_mask1:		; SKX-LABEL: test_masked_16xi16_perm_low_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} = mem[1,3,3,0,4,5,6,7,9,11,11,8,12,13,14,15] sched: [8:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} = mem[1,3,3,0,4,5,6,7,9,11,11,8,12,13,14,15] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 1, i32 3, i32 3, i32 0, i32 4, i32 5, i32 6, i32 7, i32 9, i32 11, i32 11, i32 8, i32 12, i32 13, i32 14, i32 15>		%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 1, i32 3, i32 3, i32 0, i32 4, i32 5, i32 6, i32 7, i32 9, i32 11, i32 11, i32 8, i32 12, i32 13, i32 14, i32 15>
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2
ret <16 x i16> %res		ret <16 x i16> %res
}		}

define <16 x i16> @test_masked_z_16xi16_perm_low_mem_mask1(<16 x i16>* %vp, <16 x i16> %mask) {		define <16 x i16> @test_masked_z_16xi16_perm_low_mem_mask1(<16 x i16>* %vp, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_16xi16_perm_low_mem_mask1:		; GENERIC-LABEL: test_masked_z_16xi16_perm_low_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} {z} = mem[1,3,3,0,4,5,6,7,9,11,11,8,12,13,14,15] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} {z} = mem[1,3,3,0,4,5,6,7,9,11,11,8,12,13,14,15] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi16_perm_low_mem_mask1:		; SKX-LABEL: test_masked_z_16xi16_perm_low_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} {z} = mem[1,3,3,0,4,5,6,7,9,11,11,8,12,13,14,15] sched: [8:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} {z} = mem[1,3,3,0,4,5,6,7,9,11,11,8,12,13,14,15] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 1, i32 3, i32 3, i32 0, i32 4, i32 5, i32 6, i32 7, i32 9, i32 11, i32 11, i32 8, i32 12, i32 13, i32 14, i32 15>		%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 1, i32 3, i32 3, i32 0, i32 4, i32 5, i32 6, i32 7, i32 9, i32 11, i32 11, i32 8, i32 12, i32 13, i32 14, i32 15>
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer
ret <16 x i16> %res		ret <16 x i16> %res
}		}

define <16 x i16> @test_masked_16xi16_perm_high_mem_mask2(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {		define <16 x i16> @test_masked_16xi16_perm_high_mem_mask2(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_16xi16_perm_high_mem_mask2:		; GENERIC-LABEL: test_masked_16xi16_perm_high_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} = mem[0,1,2,3,5,6,5,6,8,9,10,11,13,14,13,14] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} = mem[0,1,2,3,5,6,5,6,8,9,10,11,13,14,13,14] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi16_perm_high_mem_mask2:		; SKX-LABEL: test_masked_16xi16_perm_high_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} = mem[0,1,2,3,5,6,5,6,8,9,10,11,13,14,13,14] sched: [8:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} = mem[0,1,2,3,5,6,5,6,8,9,10,11,13,14,13,14] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 6, i32 5, i32 6, i32 8, i32 9, i32 10, i32 11, i32 13, i32 14, i32 13, i32 14>		%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 6, i32 5, i32 6, i32 8, i32 9, i32 10, i32 11, i32 13, i32 14, i32 13, i32 14>
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2
ret <16 x i16> %res		ret <16 x i16> %res
}		}

define <16 x i16> @test_masked_z_16xi16_perm_high_mem_mask2(<16 x i16>* %vp, <16 x i16> %mask) {		define <16 x i16> @test_masked_z_16xi16_perm_high_mem_mask2(<16 x i16>* %vp, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_16xi16_perm_high_mem_mask2:		; GENERIC-LABEL: test_masked_z_16xi16_perm_high_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} {z} = mem[0,1,2,3,5,6,5,6,8,9,10,11,13,14,13,14] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} {z} = mem[0,1,2,3,5,6,5,6,8,9,10,11,13,14,13,14] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi16_perm_high_mem_mask2:		; SKX-LABEL: test_masked_z_16xi16_perm_high_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} {z} = mem[0,1,2,3,5,6,5,6,8,9,10,11,13,14,13,14] sched: [8:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} {z} = mem[0,1,2,3,5,6,5,6,8,9,10,11,13,14,13,14] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 6, i32 5, i32 6, i32 8, i32 9, i32 10, i32 11, i32 13, i32 14, i32 13, i32 14>		%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 5, i32 6, i32 5, i32 6, i32 8, i32 9, i32 10, i32 11, i32 13, i32 14, i32 13, i32 14>
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer
ret <16 x i16> %res		ret <16 x i16> %res
}		}

define <16 x i16> @test_16xi16_perm_low_mem_mask3(<16 x i16>* %vp) {		define <16 x i16> @test_16xi16_perm_low_mem_mask3(<16 x i16>* %vp) {
; GENERIC-LABEL: test_16xi16_perm_low_mem_mask3:		; GENERIC-LABEL: test_16xi16_perm_low_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpshuflw {{.*#+}} ymm0 = mem[3,2,3,0,4,5,6,7,11,10,11,8,12,13,14,15] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} ymm0 = mem[3,2,3,0,4,5,6,7,11,10,11,8,12,13,14,15] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xi16_perm_low_mem_mask3:		; SKX-LABEL: test_16xi16_perm_low_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpshuflw {{.*#+}} ymm0 = mem[3,2,3,0,4,5,6,7,11,10,11,8,12,13,14,15] sched: [8:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} ymm0 = mem[3,2,3,0,4,5,6,7,11,10,11,8,12,13,14,15] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%res = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 3, i32 2, i32 3, i32 0, i32 4, i32 5, i32 6, i32 7, i32 11, i32 10, i32 11, i32 8, i32 12, i32 13, i32 14, i32 15>		%res = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 3, i32 2, i32 3, i32 0, i32 4, i32 5, i32 6, i32 7, i32 11, i32 10, i32 11, i32 8, i32 12, i32 13, i32 14, i32 15>
ret <16 x i16> %res		ret <16 x i16> %res
}		}
define <16 x i16> @test_masked_16xi16_perm_low_mem_mask3(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {		define <16 x i16> @test_masked_16xi16_perm_low_mem_mask3(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_16xi16_perm_low_mem_mask3:		; GENERIC-LABEL: test_masked_16xi16_perm_low_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} = mem[3,2,3,0,4,5,6,7,11,10,11,8,12,13,14,15] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} = mem[3,2,3,0,4,5,6,7,11,10,11,8,12,13,14,15] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi16_perm_low_mem_mask3:		; SKX-LABEL: test_masked_16xi16_perm_low_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} = mem[3,2,3,0,4,5,6,7,11,10,11,8,12,13,14,15] sched: [8:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} = mem[3,2,3,0,4,5,6,7,11,10,11,8,12,13,14,15] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 3, i32 2, i32 3, i32 0, i32 4, i32 5, i32 6, i32 7, i32 11, i32 10, i32 11, i32 8, i32 12, i32 13, i32 14, i32 15>		%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 3, i32 2, i32 3, i32 0, i32 4, i32 5, i32 6, i32 7, i32 11, i32 10, i32 11, i32 8, i32 12, i32 13, i32 14, i32 15>
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2
ret <16 x i16> %res		ret <16 x i16> %res
}		}

define <16 x i16> @test_masked_z_16xi16_perm_low_mem_mask3(<16 x i16>* %vp, <16 x i16> %mask) {		define <16 x i16> @test_masked_z_16xi16_perm_low_mem_mask3(<16 x i16>* %vp, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_16xi16_perm_low_mem_mask3:		; GENERIC-LABEL: test_masked_z_16xi16_perm_low_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} {z} = mem[3,2,3,0,4,5,6,7,11,10,11,8,12,13,14,15] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} {z} = mem[3,2,3,0,4,5,6,7,11,10,11,8,12,13,14,15] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi16_perm_low_mem_mask3:		; SKX-LABEL: test_masked_z_16xi16_perm_low_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} {z} = mem[3,2,3,0,4,5,6,7,11,10,11,8,12,13,14,15] sched: [8:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} {z} = mem[3,2,3,0,4,5,6,7,11,10,11,8,12,13,14,15] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 3, i32 2, i32 3, i32 0, i32 4, i32 5, i32 6, i32 7, i32 11, i32 10, i32 11, i32 8, i32 12, i32 13, i32 14, i32 15>		%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 3, i32 2, i32 3, i32 0, i32 4, i32 5, i32 6, i32 7, i32 11, i32 10, i32 11, i32 8, i32 12, i32 13, i32 14, i32 15>
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer
ret <16 x i16> %res		ret <16 x i16> %res
}		}

define <16 x i16> @test_masked_16xi16_perm_high_mem_mask4(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {		define <16 x i16> @test_masked_16xi16_perm_high_mem_mask4(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_16xi16_perm_high_mem_mask4:		; GENERIC-LABEL: test_masked_16xi16_perm_high_mem_mask4:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} = mem[0,1,2,3,7,7,6,7,8,9,10,11,15,15,14,15] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} = mem[0,1,2,3,7,7,6,7,8,9,10,11,15,15,14,15] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi16_perm_high_mem_mask4:		; SKX-LABEL: test_masked_16xi16_perm_high_mem_mask4:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} = mem[0,1,2,3,7,7,6,7,8,9,10,11,15,15,14,15] sched: [8:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} = mem[0,1,2,3,7,7,6,7,8,9,10,11,15,15,14,15] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 7, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 15, i32 15, i32 14, i32 15>		%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 7, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 15, i32 15, i32 14, i32 15>
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2
ret <16 x i16> %res		ret <16 x i16> %res
}		}

define <16 x i16> @test_masked_z_16xi16_perm_high_mem_mask4(<16 x i16>* %vp, <16 x i16> %mask) {		define <16 x i16> @test_masked_z_16xi16_perm_high_mem_mask4(<16 x i16>* %vp, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_16xi16_perm_high_mem_mask4:		; GENERIC-LABEL: test_masked_z_16xi16_perm_high_mem_mask4:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} {z} = mem[0,1,2,3,7,7,6,7,8,9,10,11,15,15,14,15] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} {z} = mem[0,1,2,3,7,7,6,7,8,9,10,11,15,15,14,15] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi16_perm_high_mem_mask4:		; SKX-LABEL: test_masked_z_16xi16_perm_high_mem_mask4:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} {z} = mem[0,1,2,3,7,7,6,7,8,9,10,11,15,15,14,15] sched: [8:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} {z} = mem[0,1,2,3,7,7,6,7,8,9,10,11,15,15,14,15] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 7, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 15, i32 15, i32 14, i32 15>		%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 7, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 15, i32 15, i32 14, i32 15>
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer
ret <16 x i16> %res		ret <16 x i16> %res
}		}

define <16 x i16> @test_masked_16xi16_perm_low_mem_mask5(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {		define <16 x i16> @test_masked_16xi16_perm_low_mem_mask5(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_16xi16_perm_low_mem_mask5:		; GENERIC-LABEL: test_masked_16xi16_perm_low_mem_mask5:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} = mem[1,3,3,2,4,5,6,7,9,11,11,10,12,13,14,15] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} = mem[1,3,3,2,4,5,6,7,9,11,11,10,12,13,14,15] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi16_perm_low_mem_mask5:		; SKX-LABEL: test_masked_16xi16_perm_low_mem_mask5:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} = mem[1,3,3,2,4,5,6,7,9,11,11,10,12,13,14,15] sched: [8:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} = mem[1,3,3,2,4,5,6,7,9,11,11,10,12,13,14,15] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 1, i32 3, i32 3, i32 2, i32 4, i32 5, i32 6, i32 7, i32 9, i32 11, i32 11, i32 10, i32 12, i32 13, i32 14, i32 15>		%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 1, i32 3, i32 3, i32 2, i32 4, i32 5, i32 6, i32 7, i32 9, i32 11, i32 11, i32 10, i32 12, i32 13, i32 14, i32 15>
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2
ret <16 x i16> %res		ret <16 x i16> %res
}		}

define <16 x i16> @test_masked_z_16xi16_perm_low_mem_mask5(<16 x i16>* %vp, <16 x i16> %mask) {		define <16 x i16> @test_masked_z_16xi16_perm_low_mem_mask5(<16 x i16>* %vp, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_16xi16_perm_low_mem_mask5:		; GENERIC-LABEL: test_masked_z_16xi16_perm_low_mem_mask5:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} {z} = mem[1,3,3,2,4,5,6,7,9,11,11,10,12,13,14,15] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} {z} = mem[1,3,3,2,4,5,6,7,9,11,11,10,12,13,14,15] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi16_perm_low_mem_mask5:		; SKX-LABEL: test_masked_z_16xi16_perm_low_mem_mask5:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} {z} = mem[1,3,3,2,4,5,6,7,9,11,11,10,12,13,14,15] sched: [8:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} {z} = mem[1,3,3,2,4,5,6,7,9,11,11,10,12,13,14,15] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 1, i32 3, i32 3, i32 2, i32 4, i32 5, i32 6, i32 7, i32 9, i32 11, i32 11, i32 10, i32 12, i32 13, i32 14, i32 15>		%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 1, i32 3, i32 3, i32 2, i32 4, i32 5, i32 6, i32 7, i32 9, i32 11, i32 11, i32 10, i32 12, i32 13, i32 14, i32 15>
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer
ret <16 x i16> %res		ret <16 x i16> %res
}		}

define <16 x i16> @test_16xi16_perm_high_mem_mask6(<16 x i16>* %vp) {		define <16 x i16> @test_16xi16_perm_high_mem_mask6(<16 x i16>* %vp) {
; GENERIC-LABEL: test_16xi16_perm_high_mem_mask6:		; GENERIC-LABEL: test_16xi16_perm_high_mem_mask6:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpshufhw {{.*#+}} ymm0 = mem[0,1,2,3,4,4,4,5,8,9,10,11,12,12,12,13] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} ymm0 = mem[0,1,2,3,4,4,4,5,8,9,10,11,12,12,12,13] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xi16_perm_high_mem_mask6:		; SKX-LABEL: test_16xi16_perm_high_mem_mask6:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpshufhw {{.*#+}} ymm0 = mem[0,1,2,3,4,4,4,5,8,9,10,11,12,12,12,13] sched: [8:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} ymm0 = mem[0,1,2,3,4,4,4,5,8,9,10,11,12,12,12,13] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%res = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 4, i32 4, i32 5, i32 8, i32 9, i32 10, i32 11, i32 12, i32 12, i32 12, i32 13>		%res = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 4, i32 4, i32 5, i32 8, i32 9, i32 10, i32 11, i32 12, i32 12, i32 12, i32 13>
ret <16 x i16> %res		ret <16 x i16> %res
}		}
define <16 x i16> @test_masked_16xi16_perm_high_mem_mask6(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {		define <16 x i16> @test_masked_16xi16_perm_high_mem_mask6(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_16xi16_perm_high_mem_mask6:		; GENERIC-LABEL: test_masked_16xi16_perm_high_mem_mask6:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} = mem[0,1,2,3,4,4,4,5,8,9,10,11,12,12,12,13] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} = mem[0,1,2,3,4,4,4,5,8,9,10,11,12,12,12,13] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi16_perm_high_mem_mask6:		; SKX-LABEL: test_masked_16xi16_perm_high_mem_mask6:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} = mem[0,1,2,3,4,4,4,5,8,9,10,11,12,12,12,13] sched: [8:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} = mem[0,1,2,3,4,4,4,5,8,9,10,11,12,12,12,13] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 4, i32 4, i32 5, i32 8, i32 9, i32 10, i32 11, i32 12, i32 12, i32 12, i32 13>		%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 4, i32 4, i32 5, i32 8, i32 9, i32 10, i32 11, i32 12, i32 12, i32 12, i32 13>
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2
ret <16 x i16> %res		ret <16 x i16> %res
}		}

define <16 x i16> @test_masked_z_16xi16_perm_high_mem_mask6(<16 x i16>* %vp, <16 x i16> %mask) {		define <16 x i16> @test_masked_z_16xi16_perm_high_mem_mask6(<16 x i16>* %vp, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_16xi16_perm_high_mem_mask6:		; GENERIC-LABEL: test_masked_z_16xi16_perm_high_mem_mask6:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} {z} = mem[0,1,2,3,4,4,4,5,8,9,10,11,12,12,12,13] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} {z} = mem[0,1,2,3,4,4,4,5,8,9,10,11,12,12,12,13] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi16_perm_high_mem_mask6:		; SKX-LABEL: test_masked_z_16xi16_perm_high_mem_mask6:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} {z} = mem[0,1,2,3,4,4,4,5,8,9,10,11,12,12,12,13] sched: [8:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} ymm0 {%k1} {z} = mem[0,1,2,3,4,4,4,5,8,9,10,11,12,12,12,13] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 4, i32 4, i32 5, i32 8, i32 9, i32 10, i32 11, i32 12, i32 12, i32 12, i32 13>		%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 4, i32 4, i32 5, i32 8, i32 9, i32 10, i32 11, i32 12, i32 12, i32 12, i32 13>
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> zeroinitializer
ret <16 x i16> %res		ret <16 x i16> %res
}		}

define <16 x i16> @test_masked_16xi16_perm_low_mem_mask7(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {		define <16 x i16> @test_masked_16xi16_perm_low_mem_mask7(<16 x i16>* %vp, <16 x i16> %vec2, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_16xi16_perm_low_mem_mask7:		; GENERIC-LABEL: test_masked_16xi16_perm_low_mem_mask7:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} = mem[3,1,3,2,4,5,6,7,11,9,11,10,12,13,14,15] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} = mem[3,1,3,2,4,5,6,7,11,9,11,10,12,13,14,15] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_16xi16_perm_low_mem_mask7:		; SKX-LABEL: test_masked_16xi16_perm_low_mem_mask7:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} = mem[3,1,3,2,4,5,6,7,11,9,11,10,12,13,14,15] sched: [8:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} = mem[3,1,3,2,4,5,6,7,11,9,11,10,12,13,14,15] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 3, i32 1, i32 3, i32 2, i32 4, i32 5, i32 6, i32 7, i32 11, i32 9, i32 11, i32 10, i32 12, i32 13, i32 14, i32 15>		%shuf = shufflevector <16 x i16> %vec, <16 x i16> undef, <16 x i32> <i32 3, i32 1, i32 3, i32 2, i32 4, i32 5, i32 6, i32 7, i32 11, i32 9, i32 11, i32 10, i32 12, i32 13, i32 14, i32 15>
%cmp = icmp eq <16 x i16> %mask, zeroinitializer		%cmp = icmp eq <16 x i16> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2		%res = select <16 x i1> %cmp, <16 x i16> %shuf, <16 x i16> %vec2
ret <16 x i16> %res		ret <16 x i16> %res
}		}

define <16 x i16> @test_masked_z_16xi16_perm_low_mem_mask7(<16 x i16>* %vp, <16 x i16> %mask) {		define <16 x i16> @test_masked_z_16xi16_perm_low_mem_mask7(<16 x i16>* %vp, <16 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_16xi16_perm_low_mem_mask7:		; GENERIC-LABEL: test_masked_z_16xi16_perm_low_mem_mask7:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} {z} = mem[3,1,3,2,4,5,6,7,11,9,11,10,12,13,14,15] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} {z} = mem[3,1,3,2,4,5,6,7,11,9,11,10,12,13,14,15] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_16xi16_perm_low_mem_mask7:		; SKX-LABEL: test_masked_z_16xi16_perm_low_mem_mask7:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} {z} = mem[3,1,3,2,4,5,6,7,11,9,11,10,12,13,14,15] sched: [8:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} ymm0 {%k1} {z} = mem[3,1,3,2,4,5,6,7,11,9,11,10,12,13,14,15] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i16>, <16 x i16>* %vp		%vec = load <16 x i16>, <16 x i16>* %vp
▲ Show 20 Lines • Show All 336 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 3, i32 0, i32 3, i32 0, i32 4, i32 5, i32 6, i32 7, i32 11, i32 8, i32 11, i32 8, i32 12, i32 13, i32 14, i32 15, i32 19, i32 16, i32 19, i32 16, i32 20, i32 21, i32 22, i32 23, i32 27, i32 24, i32 27, i32 24, i32 28, i32 29, i32 30, i32 31>		%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 3, i32 0, i32 3, i32 0, i32 4, i32 5, i32 6, i32 7, i32 11, i32 8, i32 11, i32 8, i32 12, i32 13, i32 14, i32 15, i32 19, i32 16, i32 19, i32 16, i32 20, i32 21, i32 22, i32 23, i32 27, i32 24, i32 27, i32 24, i32 28, i32 29, i32 30, i32 31>
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer
ret <32 x i16> %res		ret <32 x i16> %res
}		}
define <32 x i16> @test_32xi16_perm_high_mem_mask0(<32 x i16>* %vp) {		define <32 x i16> @test_32xi16_perm_high_mem_mask0(<32 x i16>* %vp) {
; GENERIC-LABEL: test_32xi16_perm_high_mem_mask0:		; GENERIC-LABEL: test_32xi16_perm_high_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpshufhw {{.*#+}} zmm0 = mem[0,1,2,3,7,4,5,6,8,9,10,11,15,12,13,14,16,17,18,19,23,20,21,22,24,25,26,27,31,28,29,30] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} zmm0 = mem[0,1,2,3,7,4,5,6,8,9,10,11,15,12,13,14,16,17,18,19,23,20,21,22,24,25,26,27,31,28,29,30] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_32xi16_perm_high_mem_mask0:		; SKX-LABEL: test_32xi16_perm_high_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpshufhw {{.*#+}} zmm0 = mem[0,1,2,3,7,4,5,6,8,9,10,11,15,12,13,14,16,17,18,19,23,20,21,22,24,25,26,27,31,28,29,30] sched: [8:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} zmm0 = mem[0,1,2,3,7,4,5,6,8,9,10,11,15,12,13,14,16,17,18,19,23,20,21,22,24,25,26,27,31,28,29,30] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%res = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 4, i32 5, i32 6, i32 8, i32 9, i32 10, i32 11, i32 15, i32 12, i32 13, i32 14, i32 16, i32 17, i32 18, i32 19, i32 23, i32 20, i32 21, i32 22, i32 24, i32 25, i32 26, i32 27, i32 31, i32 28, i32 29, i32 30>		%res = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 4, i32 5, i32 6, i32 8, i32 9, i32 10, i32 11, i32 15, i32 12, i32 13, i32 14, i32 16, i32 17, i32 18, i32 19, i32 23, i32 20, i32 21, i32 22, i32 24, i32 25, i32 26, i32 27, i32 31, i32 28, i32 29, i32 30>
ret <32 x i16> %res		ret <32 x i16> %res
}		}
define <32 x i16> @test_masked_32xi16_perm_high_mem_mask0(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {		define <32 x i16> @test_masked_32xi16_perm_high_mem_mask0(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_32xi16_perm_high_mem_mask0:		; GENERIC-LABEL: test_masked_32xi16_perm_high_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} = mem[0,1,2,3,7,4,5,6,8,9,10,11,15,12,13,14,16,17,18,19,23,20,21,22,24,25,26,27,31,28,29,30] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} = mem[0,1,2,3,7,4,5,6,8,9,10,11,15,12,13,14,16,17,18,19,23,20,21,22,24,25,26,27,31,28,29,30] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_32xi16_perm_high_mem_mask0:		; SKX-LABEL: test_masked_32xi16_perm_high_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} = mem[0,1,2,3,7,4,5,6,8,9,10,11,15,12,13,14,16,17,18,19,23,20,21,22,24,25,26,27,31,28,29,30] sched: [8:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} = mem[0,1,2,3,7,4,5,6,8,9,10,11,15,12,13,14,16,17,18,19,23,20,21,22,24,25,26,27,31,28,29,30] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 4, i32 5, i32 6, i32 8, i32 9, i32 10, i32 11, i32 15, i32 12, i32 13, i32 14, i32 16, i32 17, i32 18, i32 19, i32 23, i32 20, i32 21, i32 22, i32 24, i32 25, i32 26, i32 27, i32 31, i32 28, i32 29, i32 30>		%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 4, i32 5, i32 6, i32 8, i32 9, i32 10, i32 11, i32 15, i32 12, i32 13, i32 14, i32 16, i32 17, i32 18, i32 19, i32 23, i32 20, i32 21, i32 22, i32 24, i32 25, i32 26, i32 27, i32 31, i32 28, i32 29, i32 30>
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2
ret <32 x i16> %res		ret <32 x i16> %res
}		}

define <32 x i16> @test_masked_z_32xi16_perm_high_mem_mask0(<32 x i16>* %vp, <32 x i16> %mask) {		define <32 x i16> @test_masked_z_32xi16_perm_high_mem_mask0(<32 x i16>* %vp, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_32xi16_perm_high_mem_mask0:		; GENERIC-LABEL: test_masked_z_32xi16_perm_high_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} {z} = mem[0,1,2,3,7,4,5,6,8,9,10,11,15,12,13,14,16,17,18,19,23,20,21,22,24,25,26,27,31,28,29,30] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} {z} = mem[0,1,2,3,7,4,5,6,8,9,10,11,15,12,13,14,16,17,18,19,23,20,21,22,24,25,26,27,31,28,29,30] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_32xi16_perm_high_mem_mask0:		; SKX-LABEL: test_masked_z_32xi16_perm_high_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} {z} = mem[0,1,2,3,7,4,5,6,8,9,10,11,15,12,13,14,16,17,18,19,23,20,21,22,24,25,26,27,31,28,29,30] sched: [8:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} {z} = mem[0,1,2,3,7,4,5,6,8,9,10,11,15,12,13,14,16,17,18,19,23,20,21,22,24,25,26,27,31,28,29,30] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 4, i32 5, i32 6, i32 8, i32 9, i32 10, i32 11, i32 15, i32 12, i32 13, i32 14, i32 16, i32 17, i32 18, i32 19, i32 23, i32 20, i32 21, i32 22, i32 24, i32 25, i32 26, i32 27, i32 31, i32 28, i32 29, i32 30>		%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 4, i32 5, i32 6, i32 8, i32 9, i32 10, i32 11, i32 15, i32 12, i32 13, i32 14, i32 16, i32 17, i32 18, i32 19, i32 23, i32 20, i32 21, i32 22, i32 24, i32 25, i32 26, i32 27, i32 31, i32 28, i32 29, i32 30>
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer
ret <32 x i16> %res		ret <32 x i16> %res
}		}

define <32 x i16> @test_masked_32xi16_perm_low_mem_mask1(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {		define <32 x i16> @test_masked_32xi16_perm_low_mem_mask1(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_32xi16_perm_low_mem_mask1:		; GENERIC-LABEL: test_masked_32xi16_perm_low_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} = mem[1,1,3,3,4,5,6,7,9,9,11,11,12,13,14,15,17,17,19,19,20,21,22,23,25,25,27,27,28,29,30,31] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} = mem[1,1,3,3,4,5,6,7,9,9,11,11,12,13,14,15,17,17,19,19,20,21,22,23,25,25,27,27,28,29,30,31] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_32xi16_perm_low_mem_mask1:		; SKX-LABEL: test_masked_32xi16_perm_low_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} = mem[1,1,3,3,4,5,6,7,9,9,11,11,12,13,14,15,17,17,19,19,20,21,22,23,25,25,27,27,28,29,30,31] sched: [8:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} = mem[1,1,3,3,4,5,6,7,9,9,11,11,12,13,14,15,17,17,19,19,20,21,22,23,25,25,27,27,28,29,30,31] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 1, i32 1, i32 3, i32 3, i32 4, i32 5, i32 6, i32 7, i32 9, i32 9, i32 11, i32 11, i32 12, i32 13, i32 14, i32 15, i32 17, i32 17, i32 19, i32 19, i32 20, i32 21, i32 22, i32 23, i32 25, i32 25, i32 27, i32 27, i32 28, i32 29, i32 30, i32 31>		%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 1, i32 1, i32 3, i32 3, i32 4, i32 5, i32 6, i32 7, i32 9, i32 9, i32 11, i32 11, i32 12, i32 13, i32 14, i32 15, i32 17, i32 17, i32 19, i32 19, i32 20, i32 21, i32 22, i32 23, i32 25, i32 25, i32 27, i32 27, i32 28, i32 29, i32 30, i32 31>
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2
ret <32 x i16> %res		ret <32 x i16> %res
}		}

define <32 x i16> @test_masked_z_32xi16_perm_low_mem_mask1(<32 x i16>* %vp, <32 x i16> %mask) {		define <32 x i16> @test_masked_z_32xi16_perm_low_mem_mask1(<32 x i16>* %vp, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_32xi16_perm_low_mem_mask1:		; GENERIC-LABEL: test_masked_z_32xi16_perm_low_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} {z} = mem[1,1,3,3,4,5,6,7,9,9,11,11,12,13,14,15,17,17,19,19,20,21,22,23,25,25,27,27,28,29,30,31] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} {z} = mem[1,1,3,3,4,5,6,7,9,9,11,11,12,13,14,15,17,17,19,19,20,21,22,23,25,25,27,27,28,29,30,31] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_32xi16_perm_low_mem_mask1:		; SKX-LABEL: test_masked_z_32xi16_perm_low_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} {z} = mem[1,1,3,3,4,5,6,7,9,9,11,11,12,13,14,15,17,17,19,19,20,21,22,23,25,25,27,27,28,29,30,31] sched: [8:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} {z} = mem[1,1,3,3,4,5,6,7,9,9,11,11,12,13,14,15,17,17,19,19,20,21,22,23,25,25,27,27,28,29,30,31] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 1, i32 1, i32 3, i32 3, i32 4, i32 5, i32 6, i32 7, i32 9, i32 9, i32 11, i32 11, i32 12, i32 13, i32 14, i32 15, i32 17, i32 17, i32 19, i32 19, i32 20, i32 21, i32 22, i32 23, i32 25, i32 25, i32 27, i32 27, i32 28, i32 29, i32 30, i32 31>		%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 1, i32 1, i32 3, i32 3, i32 4, i32 5, i32 6, i32 7, i32 9, i32 9, i32 11, i32 11, i32 12, i32 13, i32 14, i32 15, i32 17, i32 17, i32 19, i32 19, i32 20, i32 21, i32 22, i32 23, i32 25, i32 25, i32 27, i32 27, i32 28, i32 29, i32 30, i32 31>
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer
ret <32 x i16> %res		ret <32 x i16> %res
}		}

define <32 x i16> @test_masked_32xi16_perm_high_mem_mask2(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {		define <32 x i16> @test_masked_32xi16_perm_high_mem_mask2(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_32xi16_perm_high_mem_mask2:		; GENERIC-LABEL: test_masked_32xi16_perm_high_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} = mem[0,1,2,3,4,7,6,4,8,9,10,11,12,15,14,12,16,17,18,19,20,23,22,20,24,25,26,27,28,31,30,28] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} = mem[0,1,2,3,4,7,6,4,8,9,10,11,12,15,14,12,16,17,18,19,20,23,22,20,24,25,26,27,28,31,30,28] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_32xi16_perm_high_mem_mask2:		; SKX-LABEL: test_masked_32xi16_perm_high_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} = mem[0,1,2,3,4,7,6,4,8,9,10,11,12,15,14,12,16,17,18,19,20,23,22,20,24,25,26,27,28,31,30,28] sched: [8:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} = mem[0,1,2,3,4,7,6,4,8,9,10,11,12,15,14,12,16,17,18,19,20,23,22,20,24,25,26,27,28,31,30,28] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 7, i32 6, i32 4, i32 8, i32 9, i32 10, i32 11, i32 12, i32 15, i32 14, i32 12, i32 16, i32 17, i32 18, i32 19, i32 20, i32 23, i32 22, i32 20, i32 24, i32 25, i32 26, i32 27, i32 28, i32 31, i32 30, i32 28>		%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 7, i32 6, i32 4, i32 8, i32 9, i32 10, i32 11, i32 12, i32 15, i32 14, i32 12, i32 16, i32 17, i32 18, i32 19, i32 20, i32 23, i32 22, i32 20, i32 24, i32 25, i32 26, i32 27, i32 28, i32 31, i32 30, i32 28>
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2
ret <32 x i16> %res		ret <32 x i16> %res
}		}

define <32 x i16> @test_masked_z_32xi16_perm_high_mem_mask2(<32 x i16>* %vp, <32 x i16> %mask) {		define <32 x i16> @test_masked_z_32xi16_perm_high_mem_mask2(<32 x i16>* %vp, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_32xi16_perm_high_mem_mask2:		; GENERIC-LABEL: test_masked_z_32xi16_perm_high_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} {z} = mem[0,1,2,3,4,7,6,4,8,9,10,11,12,15,14,12,16,17,18,19,20,23,22,20,24,25,26,27,28,31,30,28] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} {z} = mem[0,1,2,3,4,7,6,4,8,9,10,11,12,15,14,12,16,17,18,19,20,23,22,20,24,25,26,27,28,31,30,28] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_32xi16_perm_high_mem_mask2:		; SKX-LABEL: test_masked_z_32xi16_perm_high_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} {z} = mem[0,1,2,3,4,7,6,4,8,9,10,11,12,15,14,12,16,17,18,19,20,23,22,20,24,25,26,27,28,31,30,28] sched: [8:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} {z} = mem[0,1,2,3,4,7,6,4,8,9,10,11,12,15,14,12,16,17,18,19,20,23,22,20,24,25,26,27,28,31,30,28] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 7, i32 6, i32 4, i32 8, i32 9, i32 10, i32 11, i32 12, i32 15, i32 14, i32 12, i32 16, i32 17, i32 18, i32 19, i32 20, i32 23, i32 22, i32 20, i32 24, i32 25, i32 26, i32 27, i32 28, i32 31, i32 30, i32 28>		%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 7, i32 6, i32 4, i32 8, i32 9, i32 10, i32 11, i32 12, i32 15, i32 14, i32 12, i32 16, i32 17, i32 18, i32 19, i32 20, i32 23, i32 22, i32 20, i32 24, i32 25, i32 26, i32 27, i32 28, i32 31, i32 30, i32 28>
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer
ret <32 x i16> %res		ret <32 x i16> %res
}		}

define <32 x i16> @test_32xi16_perm_low_mem_mask3(<32 x i16>* %vp) {		define <32 x i16> @test_32xi16_perm_low_mem_mask3(<32 x i16>* %vp) {
; GENERIC-LABEL: test_32xi16_perm_low_mem_mask3:		; GENERIC-LABEL: test_32xi16_perm_low_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpshuflw {{.*#+}} zmm0 = mem[2,2,0,3,4,5,6,7,10,10,8,11,12,13,14,15,18,18,16,19,20,21,22,23,26,26,24,27,28,29,30,31] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} zmm0 = mem[2,2,0,3,4,5,6,7,10,10,8,11,12,13,14,15,18,18,16,19,20,21,22,23,26,26,24,27,28,29,30,31] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_32xi16_perm_low_mem_mask3:		; SKX-LABEL: test_32xi16_perm_low_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpshuflw {{.*#+}} zmm0 = mem[2,2,0,3,4,5,6,7,10,10,8,11,12,13,14,15,18,18,16,19,20,21,22,23,26,26,24,27,28,29,30,31] sched: [8:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} zmm0 = mem[2,2,0,3,4,5,6,7,10,10,8,11,12,13,14,15,18,18,16,19,20,21,22,23,26,26,24,27,28,29,30,31] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%res = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 2, i32 2, i32 0, i32 3, i32 4, i32 5, i32 6, i32 7, i32 10, i32 10, i32 8, i32 11, i32 12, i32 13, i32 14, i32 15, i32 18, i32 18, i32 16, i32 19, i32 20, i32 21, i32 22, i32 23, i32 26, i32 26, i32 24, i32 27, i32 28, i32 29, i32 30, i32 31>		%res = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 2, i32 2, i32 0, i32 3, i32 4, i32 5, i32 6, i32 7, i32 10, i32 10, i32 8, i32 11, i32 12, i32 13, i32 14, i32 15, i32 18, i32 18, i32 16, i32 19, i32 20, i32 21, i32 22, i32 23, i32 26, i32 26, i32 24, i32 27, i32 28, i32 29, i32 30, i32 31>
ret <32 x i16> %res		ret <32 x i16> %res
}		}
define <32 x i16> @test_masked_32xi16_perm_low_mem_mask3(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {		define <32 x i16> @test_masked_32xi16_perm_low_mem_mask3(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_32xi16_perm_low_mem_mask3:		; GENERIC-LABEL: test_masked_32xi16_perm_low_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} = mem[2,2,0,3,4,5,6,7,10,10,8,11,12,13,14,15,18,18,16,19,20,21,22,23,26,26,24,27,28,29,30,31] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} = mem[2,2,0,3,4,5,6,7,10,10,8,11,12,13,14,15,18,18,16,19,20,21,22,23,26,26,24,27,28,29,30,31] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_32xi16_perm_low_mem_mask3:		; SKX-LABEL: test_masked_32xi16_perm_low_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} = mem[2,2,0,3,4,5,6,7,10,10,8,11,12,13,14,15,18,18,16,19,20,21,22,23,26,26,24,27,28,29,30,31] sched: [8:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} = mem[2,2,0,3,4,5,6,7,10,10,8,11,12,13,14,15,18,18,16,19,20,21,22,23,26,26,24,27,28,29,30,31] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 2, i32 2, i32 0, i32 3, i32 4, i32 5, i32 6, i32 7, i32 10, i32 10, i32 8, i32 11, i32 12, i32 13, i32 14, i32 15, i32 18, i32 18, i32 16, i32 19, i32 20, i32 21, i32 22, i32 23, i32 26, i32 26, i32 24, i32 27, i32 28, i32 29, i32 30, i32 31>		%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 2, i32 2, i32 0, i32 3, i32 4, i32 5, i32 6, i32 7, i32 10, i32 10, i32 8, i32 11, i32 12, i32 13, i32 14, i32 15, i32 18, i32 18, i32 16, i32 19, i32 20, i32 21, i32 22, i32 23, i32 26, i32 26, i32 24, i32 27, i32 28, i32 29, i32 30, i32 31>
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2
ret <32 x i16> %res		ret <32 x i16> %res
}		}

define <32 x i16> @test_masked_z_32xi16_perm_low_mem_mask3(<32 x i16>* %vp, <32 x i16> %mask) {		define <32 x i16> @test_masked_z_32xi16_perm_low_mem_mask3(<32 x i16>* %vp, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_32xi16_perm_low_mem_mask3:		; GENERIC-LABEL: test_masked_z_32xi16_perm_low_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} {z} = mem[2,2,0,3,4,5,6,7,10,10,8,11,12,13,14,15,18,18,16,19,20,21,22,23,26,26,24,27,28,29,30,31] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} {z} = mem[2,2,0,3,4,5,6,7,10,10,8,11,12,13,14,15,18,18,16,19,20,21,22,23,26,26,24,27,28,29,30,31] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_32xi16_perm_low_mem_mask3:		; SKX-LABEL: test_masked_z_32xi16_perm_low_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} {z} = mem[2,2,0,3,4,5,6,7,10,10,8,11,12,13,14,15,18,18,16,19,20,21,22,23,26,26,24,27,28,29,30,31] sched: [8:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} {z} = mem[2,2,0,3,4,5,6,7,10,10,8,11,12,13,14,15,18,18,16,19,20,21,22,23,26,26,24,27,28,29,30,31] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 2, i32 2, i32 0, i32 3, i32 4, i32 5, i32 6, i32 7, i32 10, i32 10, i32 8, i32 11, i32 12, i32 13, i32 14, i32 15, i32 18, i32 18, i32 16, i32 19, i32 20, i32 21, i32 22, i32 23, i32 26, i32 26, i32 24, i32 27, i32 28, i32 29, i32 30, i32 31>		%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 2, i32 2, i32 0, i32 3, i32 4, i32 5, i32 6, i32 7, i32 10, i32 10, i32 8, i32 11, i32 12, i32 13, i32 14, i32 15, i32 18, i32 18, i32 16, i32 19, i32 20, i32 21, i32 22, i32 23, i32 26, i32 26, i32 24, i32 27, i32 28, i32 29, i32 30, i32 31>
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer
ret <32 x i16> %res		ret <32 x i16> %res
}		}

define <32 x i16> @test_masked_32xi16_perm_high_mem_mask4(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {		define <32 x i16> @test_masked_32xi16_perm_high_mem_mask4(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_32xi16_perm_high_mem_mask4:		; GENERIC-LABEL: test_masked_32xi16_perm_high_mem_mask4:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} = mem[0,1,2,3,7,4,6,5,8,9,10,11,15,12,14,13,16,17,18,19,23,20,22,21,24,25,26,27,31,28,30,29] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} = mem[0,1,2,3,7,4,6,5,8,9,10,11,15,12,14,13,16,17,18,19,23,20,22,21,24,25,26,27,31,28,30,29] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_32xi16_perm_high_mem_mask4:		; SKX-LABEL: test_masked_32xi16_perm_high_mem_mask4:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} = mem[0,1,2,3,7,4,6,5,8,9,10,11,15,12,14,13,16,17,18,19,23,20,22,21,24,25,26,27,31,28,30,29] sched: [8:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} = mem[0,1,2,3,7,4,6,5,8,9,10,11,15,12,14,13,16,17,18,19,23,20,22,21,24,25,26,27,31,28,30,29] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 4, i32 6, i32 5, i32 8, i32 9, i32 10, i32 11, i32 15, i32 12, i32 14, i32 13, i32 16, i32 17, i32 18, i32 19, i32 23, i32 20, i32 22, i32 21, i32 24, i32 25, i32 26, i32 27, i32 31, i32 28, i32 30, i32 29>		%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 4, i32 6, i32 5, i32 8, i32 9, i32 10, i32 11, i32 15, i32 12, i32 14, i32 13, i32 16, i32 17, i32 18, i32 19, i32 23, i32 20, i32 22, i32 21, i32 24, i32 25, i32 26, i32 27, i32 31, i32 28, i32 30, i32 29>
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2
ret <32 x i16> %res		ret <32 x i16> %res
}		}

define <32 x i16> @test_masked_z_32xi16_perm_high_mem_mask4(<32 x i16>* %vp, <32 x i16> %mask) {		define <32 x i16> @test_masked_z_32xi16_perm_high_mem_mask4(<32 x i16>* %vp, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_32xi16_perm_high_mem_mask4:		; GENERIC-LABEL: test_masked_z_32xi16_perm_high_mem_mask4:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} {z} = mem[0,1,2,3,7,4,6,5,8,9,10,11,15,12,14,13,16,17,18,19,23,20,22,21,24,25,26,27,31,28,30,29] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} {z} = mem[0,1,2,3,7,4,6,5,8,9,10,11,15,12,14,13,16,17,18,19,23,20,22,21,24,25,26,27,31,28,30,29] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_32xi16_perm_high_mem_mask4:		; SKX-LABEL: test_masked_z_32xi16_perm_high_mem_mask4:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} {z} = mem[0,1,2,3,7,4,6,5,8,9,10,11,15,12,14,13,16,17,18,19,23,20,22,21,24,25,26,27,31,28,30,29] sched: [8:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} {z} = mem[0,1,2,3,7,4,6,5,8,9,10,11,15,12,14,13,16,17,18,19,23,20,22,21,24,25,26,27,31,28,30,29] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 4, i32 6, i32 5, i32 8, i32 9, i32 10, i32 11, i32 15, i32 12, i32 14, i32 13, i32 16, i32 17, i32 18, i32 19, i32 23, i32 20, i32 22, i32 21, i32 24, i32 25, i32 26, i32 27, i32 31, i32 28, i32 30, i32 29>		%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 7, i32 4, i32 6, i32 5, i32 8, i32 9, i32 10, i32 11, i32 15, i32 12, i32 14, i32 13, i32 16, i32 17, i32 18, i32 19, i32 23, i32 20, i32 22, i32 21, i32 24, i32 25, i32 26, i32 27, i32 31, i32 28, i32 30, i32 29>
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer
ret <32 x i16> %res		ret <32 x i16> %res
}		}

define <32 x i16> @test_masked_32xi16_perm_low_mem_mask5(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {		define <32 x i16> @test_masked_32xi16_perm_low_mem_mask5(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_32xi16_perm_low_mem_mask5:		; GENERIC-LABEL: test_masked_32xi16_perm_low_mem_mask5:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpshufd {{.*#+}} zmm2 = mem[0,0,2,3,4,4,6,7,8,8,10,11,12,12,14,15] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} zmm2 = mem[0,0,2,3,4,4,6,7,8,8,10,11,12,12,14,15] sched: [6:1.00]
; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vmovdqu16 %zmm2, %zmm0 {%k1} # sched: [1:0.50]		; GENERIC-NEXT: vmovdqu16 %zmm2, %zmm0 {%k1} # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_32xi16_perm_low_mem_mask5:		; SKX-LABEL: test_masked_32xi16_perm_low_mem_mask5:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpshufd {{.*#+}} zmm2 = mem[0,0,2,3,4,4,6,7,8,8,10,11,12,12,14,15] sched: [8:1.00]		; SKX-NEXT: vpshufd {{.*#+}} zmm2 = mem[0,0,2,3,4,4,6,7,8,8,10,11,12,12,14,15] sched: [8:1.00]
; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vmovdqu16 %zmm2, %zmm0 {%k1} # sched: [1:0.33]		; SKX-NEXT: vmovdqu16 %zmm2, %zmm0 {%k1} # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 0, i32 1, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 8, i32 9, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 16, i32 17, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 24, i32 25, i32 28, i32 29, i32 30, i32 31>		%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 0, i32 1, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 8, i32 9, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 16, i32 17, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 24, i32 25, i32 28, i32 29, i32 30, i32 31>
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2
ret <32 x i16> %res		ret <32 x i16> %res
}		}

define <32 x i16> @test_masked_z_32xi16_perm_low_mem_mask5(<32 x i16>* %vp, <32 x i16> %mask) {		define <32 x i16> @test_masked_z_32xi16_perm_low_mem_mask5(<32 x i16>* %vp, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_32xi16_perm_low_mem_mask5:		; GENERIC-LABEL: test_masked_z_32xi16_perm_low_mem_mask5:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpshufd {{.*#+}} zmm1 = mem[0,0,2,3,4,4,6,7,8,8,10,11,12,12,14,15] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} zmm1 = mem[0,0,2,3,4,4,6,7,8,8,10,11,12,12,14,15] sched: [6:1.00]
; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vmovdqu16 %zmm1, %zmm0 {%k1} {z} # sched: [1:0.50]		; GENERIC-NEXT: vmovdqu16 %zmm1, %zmm0 {%k1} {z} # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_32xi16_perm_low_mem_mask5:		; SKX-LABEL: test_masked_z_32xi16_perm_low_mem_mask5:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpshufd {{.*#+}} zmm1 = mem[0,0,2,3,4,4,6,7,8,8,10,11,12,12,14,15] sched: [8:1.00]		; SKX-NEXT: vpshufd {{.*#+}} zmm1 = mem[0,0,2,3,4,4,6,7,8,8,10,11,12,12,14,15] sched: [8:1.00]
; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vmovdqu16 %zmm1, %zmm0 {%k1} {z} # sched: [1:0.33]		; SKX-NEXT: vmovdqu16 %zmm1, %zmm0 {%k1} {z} # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 0, i32 1, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 8, i32 9, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 16, i32 17, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 24, i32 25, i32 28, i32 29, i32 30, i32 31>		%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 0, i32 1, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 8, i32 9, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 16, i32 17, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 24, i32 25, i32 28, i32 29, i32 30, i32 31>
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer
ret <32 x i16> %res		ret <32 x i16> %res
}		}

define <32 x i16> @test_32xi16_perm_high_mem_mask6(<32 x i16>* %vp) {		define <32 x i16> @test_32xi16_perm_high_mem_mask6(<32 x i16>* %vp) {
; GENERIC-LABEL: test_32xi16_perm_high_mem_mask6:		; GENERIC-LABEL: test_32xi16_perm_high_mem_mask6:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpshufhw {{.*#+}} zmm0 = mem[0,1,2,3,6,5,6,6,8,9,10,11,14,13,14,14,16,17,18,19,22,21,22,22,24,25,26,27,30,29,30,30] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} zmm0 = mem[0,1,2,3,6,5,6,6,8,9,10,11,14,13,14,14,16,17,18,19,22,21,22,22,24,25,26,27,30,29,30,30] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_32xi16_perm_high_mem_mask6:		; SKX-LABEL: test_32xi16_perm_high_mem_mask6:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpshufhw {{.*#+}} zmm0 = mem[0,1,2,3,6,5,6,6,8,9,10,11,14,13,14,14,16,17,18,19,22,21,22,22,24,25,26,27,30,29,30,30] sched: [8:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} zmm0 = mem[0,1,2,3,6,5,6,6,8,9,10,11,14,13,14,14,16,17,18,19,22,21,22,22,24,25,26,27,30,29,30,30] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%res = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 6, i32 5, i32 6, i32 6, i32 8, i32 9, i32 10, i32 11, i32 14, i32 13, i32 14, i32 14, i32 16, i32 17, i32 18, i32 19, i32 22, i32 21, i32 22, i32 22, i32 24, i32 25, i32 26, i32 27, i32 30, i32 29, i32 30, i32 30>		%res = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 6, i32 5, i32 6, i32 6, i32 8, i32 9, i32 10, i32 11, i32 14, i32 13, i32 14, i32 14, i32 16, i32 17, i32 18, i32 19, i32 22, i32 21, i32 22, i32 22, i32 24, i32 25, i32 26, i32 27, i32 30, i32 29, i32 30, i32 30>
ret <32 x i16> %res		ret <32 x i16> %res
}		}
define <32 x i16> @test_masked_32xi16_perm_high_mem_mask6(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {		define <32 x i16> @test_masked_32xi16_perm_high_mem_mask6(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_32xi16_perm_high_mem_mask6:		; GENERIC-LABEL: test_masked_32xi16_perm_high_mem_mask6:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} = mem[0,1,2,3,6,5,6,6,8,9,10,11,14,13,14,14,16,17,18,19,22,21,22,22,24,25,26,27,30,29,30,30] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} = mem[0,1,2,3,6,5,6,6,8,9,10,11,14,13,14,14,16,17,18,19,22,21,22,22,24,25,26,27,30,29,30,30] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_32xi16_perm_high_mem_mask6:		; SKX-LABEL: test_masked_32xi16_perm_high_mem_mask6:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} = mem[0,1,2,3,6,5,6,6,8,9,10,11,14,13,14,14,16,17,18,19,22,21,22,22,24,25,26,27,30,29,30,30] sched: [8:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} = mem[0,1,2,3,6,5,6,6,8,9,10,11,14,13,14,14,16,17,18,19,22,21,22,22,24,25,26,27,30,29,30,30] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 6, i32 5, i32 6, i32 6, i32 8, i32 9, i32 10, i32 11, i32 14, i32 13, i32 14, i32 14, i32 16, i32 17, i32 18, i32 19, i32 22, i32 21, i32 22, i32 22, i32 24, i32 25, i32 26, i32 27, i32 30, i32 29, i32 30, i32 30>		%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 6, i32 5, i32 6, i32 6, i32 8, i32 9, i32 10, i32 11, i32 14, i32 13, i32 14, i32 14, i32 16, i32 17, i32 18, i32 19, i32 22, i32 21, i32 22, i32 22, i32 24, i32 25, i32 26, i32 27, i32 30, i32 29, i32 30, i32 30>
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2
ret <32 x i16> %res		ret <32 x i16> %res
}		}

define <32 x i16> @test_masked_z_32xi16_perm_high_mem_mask6(<32 x i16>* %vp, <32 x i16> %mask) {		define <32 x i16> @test_masked_z_32xi16_perm_high_mem_mask6(<32 x i16>* %vp, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_32xi16_perm_high_mem_mask6:		; GENERIC-LABEL: test_masked_z_32xi16_perm_high_mem_mask6:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} {z} = mem[0,1,2,3,6,5,6,6,8,9,10,11,14,13,14,14,16,17,18,19,22,21,22,22,24,25,26,27,30,29,30,30] sched: [5:1.00]		; GENERIC-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} {z} = mem[0,1,2,3,6,5,6,6,8,9,10,11,14,13,14,14,16,17,18,19,22,21,22,22,24,25,26,27,30,29,30,30] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_32xi16_perm_high_mem_mask6:		; SKX-LABEL: test_masked_z_32xi16_perm_high_mem_mask6:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} {z} = mem[0,1,2,3,6,5,6,6,8,9,10,11,14,13,14,14,16,17,18,19,22,21,22,22,24,25,26,27,30,29,30,30] sched: [8:1.00]		; SKX-NEXT: vpshufhw {{.*#+}} zmm0 {%k1} {z} = mem[0,1,2,3,6,5,6,6,8,9,10,11,14,13,14,14,16,17,18,19,22,21,22,22,24,25,26,27,30,29,30,30] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 6, i32 5, i32 6, i32 6, i32 8, i32 9, i32 10, i32 11, i32 14, i32 13, i32 14, i32 14, i32 16, i32 17, i32 18, i32 19, i32 22, i32 21, i32 22, i32 22, i32 24, i32 25, i32 26, i32 27, i32 30, i32 29, i32 30, i32 30>		%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 0, i32 1, i32 2, i32 3, i32 6, i32 5, i32 6, i32 6, i32 8, i32 9, i32 10, i32 11, i32 14, i32 13, i32 14, i32 14, i32 16, i32 17, i32 18, i32 19, i32 22, i32 21, i32 22, i32 22, i32 24, i32 25, i32 26, i32 27, i32 30, i32 29, i32 30, i32 30>
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> zeroinitializer
ret <32 x i16> %res		ret <32 x i16> %res
}		}

define <32 x i16> @test_masked_32xi16_perm_low_mem_mask7(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {		define <32 x i16> @test_masked_32xi16_perm_low_mem_mask7(<32 x i16>* %vp, <32 x i16> %vec2, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_32xi16_perm_low_mem_mask7:		; GENERIC-LABEL: test_masked_32xi16_perm_low_mem_mask7:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} = mem[3,1,3,0,4,5,6,7,11,9,11,8,12,13,14,15,19,17,19,16,20,21,22,23,27,25,27,24,28,29,30,31] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} = mem[3,1,3,0,4,5,6,7,11,9,11,8,12,13,14,15,19,17,19,16,20,21,22,23,27,25,27,24,28,29,30,31] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_32xi16_perm_low_mem_mask7:		; SKX-LABEL: test_masked_32xi16_perm_low_mem_mask7:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} = mem[3,1,3,0,4,5,6,7,11,9,11,8,12,13,14,15,19,17,19,16,20,21,22,23,27,25,27,24,28,29,30,31] sched: [8:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} = mem[3,1,3,0,4,5,6,7,11,9,11,8,12,13,14,15,19,17,19,16,20,21,22,23,27,25,27,24,28,29,30,31] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 3, i32 1, i32 3, i32 0, i32 4, i32 5, i32 6, i32 7, i32 11, i32 9, i32 11, i32 8, i32 12, i32 13, i32 14, i32 15, i32 19, i32 17, i32 19, i32 16, i32 20, i32 21, i32 22, i32 23, i32 27, i32 25, i32 27, i32 24, i32 28, i32 29, i32 30, i32 31>		%shuf = shufflevector <32 x i16> %vec, <32 x i16> undef, <32 x i32> <i32 3, i32 1, i32 3, i32 0, i32 4, i32 5, i32 6, i32 7, i32 11, i32 9, i32 11, i32 8, i32 12, i32 13, i32 14, i32 15, i32 19, i32 17, i32 19, i32 16, i32 20, i32 21, i32 22, i32 23, i32 27, i32 25, i32 27, i32 24, i32 28, i32 29, i32 30, i32 31>
%cmp = icmp eq <32 x i16> %mask, zeroinitializer		%cmp = icmp eq <32 x i16> %mask, zeroinitializer
%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2		%res = select <32 x i1> %cmp, <32 x i16> %shuf, <32 x i16> %vec2
ret <32 x i16> %res		ret <32 x i16> %res
}		}

define <32 x i16> @test_masked_z_32xi16_perm_low_mem_mask7(<32 x i16>* %vp, <32 x i16> %mask) {		define <32 x i16> @test_masked_z_32xi16_perm_low_mem_mask7(<32 x i16>* %vp, <32 x i16> %mask) {
; GENERIC-LABEL: test_masked_z_32xi16_perm_low_mem_mask7:		; GENERIC-LABEL: test_masked_z_32xi16_perm_low_mem_mask7:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} {z} = mem[3,1,3,0,4,5,6,7,11,9,11,8,12,13,14,15,19,17,19,16,20,21,22,23,27,25,27,24,28,29,30,31] sched: [5:1.00]		; GENERIC-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} {z} = mem[3,1,3,0,4,5,6,7,11,9,11,8,12,13,14,15,19,17,19,16,20,21,22,23,27,25,27,24,28,29,30,31] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_32xi16_perm_low_mem_mask7:		; SKX-LABEL: test_masked_z_32xi16_perm_low_mem_mask7:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmw %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} {z} = mem[3,1,3,0,4,5,6,7,11,9,11,8,12,13,14,15,19,17,19,16,20,21,22,23,27,25,27,24,28,29,30,31] sched: [8:1.00]		; SKX-NEXT: vpshuflw {{.*#+}} zmm0 {%k1} {z} = mem[3,1,3,0,4,5,6,7,11,9,11,8,12,13,14,15,19,17,19,16,20,21,22,23,27,25,27,24,28,29,30,31] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <32 x i16>, <32 x i16>* %vp		%vec = load <32 x i16>, <32 x i16>* %vp
▲ Show 20 Lines • Show All 190 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x i32>, <4 x i32>* %vp		%vec = load <4 x i32>, <4 x i32>* %vp
%res = shufflevector <4 x i32> %vec, <4 x i32> undef, <4 x i32> <i32 0, i32 1, i32 3, i32 3>		%res = shufflevector <4 x i32> %vec, <4 x i32> undef, <4 x i32> <i32 0, i32 1, i32 3, i32 3>
ret <4 x i32> %res		ret <4 x i32> %res
}		}
define <4 x i32> @test_masked_4xi32_perm_mem_mask0(<4 x i32>* %vp, <4 x i32> %vec2, <4 x i32> %mask) {		define <4 x i32> @test_masked_4xi32_perm_mem_mask0(<4 x i32>* %vp, <4 x i32> %vec2, <4 x i32> %mask) {
; GENERIC-LABEL: test_masked_4xi32_perm_mem_mask0:		; GENERIC-LABEL: test_masked_4xi32_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} xmm0 {%k1} = mem[0,1,3,3] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} xmm0 {%k1} = mem[0,1,3,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_4xi32_perm_mem_mask0:		; SKX-LABEL: test_masked_4xi32_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} xmm0 {%k1} = mem[0,1,3,3] sched: [7:1.00]		; SKX-NEXT: vpshufd {{.*#+}} xmm0 {%k1} = mem[0,1,3,3] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x i32>, <4 x i32>* %vp		%vec = load <4 x i32>, <4 x i32>* %vp
%shuf = shufflevector <4 x i32> %vec, <4 x i32> undef, <4 x i32> <i32 0, i32 1, i32 3, i32 3>		%shuf = shufflevector <4 x i32> %vec, <4 x i32> undef, <4 x i32> <i32 0, i32 1, i32 3, i32 3>
%cmp = icmp eq <4 x i32> %mask, zeroinitializer		%cmp = icmp eq <4 x i32> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x i32> %shuf, <4 x i32> %vec2		%res = select <4 x i1> %cmp, <4 x i32> %shuf, <4 x i32> %vec2
ret <4 x i32> %res		ret <4 x i32> %res
}		}

define <4 x i32> @test_masked_z_4xi32_perm_mem_mask0(<4 x i32>* %vp, <4 x i32> %mask) {		define <4 x i32> @test_masked_z_4xi32_perm_mem_mask0(<4 x i32>* %vp, <4 x i32> %mask) {
; GENERIC-LABEL: test_masked_z_4xi32_perm_mem_mask0:		; GENERIC-LABEL: test_masked_z_4xi32_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm0, %xmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm0, %xmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} xmm0 {%k1} {z} = mem[0,1,3,3] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} xmm0 {%k1} {z} = mem[0,1,3,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_4xi32_perm_mem_mask0:		; SKX-LABEL: test_masked_z_4xi32_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm0, %xmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm0, %xmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} xmm0 {%k1} {z} = mem[0,1,3,3] sched: [7:1.00]		; SKX-NEXT: vpshufd {{.*#+}} xmm0 {%k1} {z} = mem[0,1,3,3] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x i32>, <4 x i32>* %vp		%vec = load <4 x i32>, <4 x i32>* %vp
%shuf = shufflevector <4 x i32> %vec, <4 x i32> undef, <4 x i32> <i32 0, i32 1, i32 3, i32 3>		%shuf = shufflevector <4 x i32> %vec, <4 x i32> undef, <4 x i32> <i32 0, i32 1, i32 3, i32 3>
%cmp = icmp eq <4 x i32> %mask, zeroinitializer		%cmp = icmp eq <4 x i32> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x i32> %shuf, <4 x i32> zeroinitializer		%res = select <4 x i1> %cmp, <4 x i32> %shuf, <4 x i32> zeroinitializer
ret <4 x i32> %res		ret <4 x i32> %res
}		}

define <4 x i32> @test_masked_4xi32_perm_mem_mask1(<4 x i32>* %vp, <4 x i32> %vec2, <4 x i32> %mask) {		define <4 x i32> @test_masked_4xi32_perm_mem_mask1(<4 x i32>* %vp, <4 x i32> %vec2, <4 x i32> %mask) {
; GENERIC-LABEL: test_masked_4xi32_perm_mem_mask1:		; GENERIC-LABEL: test_masked_4xi32_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} xmm0 {%k1} = mem[2,2,3,1] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} xmm0 {%k1} = mem[2,2,3,1] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_4xi32_perm_mem_mask1:		; SKX-LABEL: test_masked_4xi32_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} xmm0 {%k1} = mem[2,2,3,1] sched: [7:1.00]		; SKX-NEXT: vpshufd {{.*#+}} xmm0 {%k1} = mem[2,2,3,1] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x i32>, <4 x i32>* %vp		%vec = load <4 x i32>, <4 x i32>* %vp
%shuf = shufflevector <4 x i32> %vec, <4 x i32> undef, <4 x i32> <i32 2, i32 2, i32 3, i32 1>		%shuf = shufflevector <4 x i32> %vec, <4 x i32> undef, <4 x i32> <i32 2, i32 2, i32 3, i32 1>
%cmp = icmp eq <4 x i32> %mask, zeroinitializer		%cmp = icmp eq <4 x i32> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x i32> %shuf, <4 x i32> %vec2		%res = select <4 x i1> %cmp, <4 x i32> %shuf, <4 x i32> %vec2
ret <4 x i32> %res		ret <4 x i32> %res
}		}

define <4 x i32> @test_masked_z_4xi32_perm_mem_mask1(<4 x i32>* %vp, <4 x i32> %mask) {		define <4 x i32> @test_masked_z_4xi32_perm_mem_mask1(<4 x i32>* %vp, <4 x i32> %mask) {
; GENERIC-LABEL: test_masked_z_4xi32_perm_mem_mask1:		; GENERIC-LABEL: test_masked_z_4xi32_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm0, %xmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm0, %xmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} xmm0 {%k1} {z} = mem[2,2,3,1] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} xmm0 {%k1} {z} = mem[2,2,3,1] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_4xi32_perm_mem_mask1:		; SKX-LABEL: test_masked_z_4xi32_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm0, %xmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm0, %xmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} xmm0 {%k1} {z} = mem[2,2,3,1] sched: [7:1.00]		; SKX-NEXT: vpshufd {{.*#+}} xmm0 {%k1} {z} = mem[2,2,3,1] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x i32>, <4 x i32>* %vp		%vec = load <4 x i32>, <4 x i32>* %vp
%shuf = shufflevector <4 x i32> %vec, <4 x i32> undef, <4 x i32> <i32 2, i32 2, i32 3, i32 1>		%shuf = shufflevector <4 x i32> %vec, <4 x i32> undef, <4 x i32> <i32 2, i32 2, i32 3, i32 1>
%cmp = icmp eq <4 x i32> %mask, zeroinitializer		%cmp = icmp eq <4 x i32> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x i32> %shuf, <4 x i32> zeroinitializer		%res = select <4 x i1> %cmp, <4 x i32> %shuf, <4 x i32> zeroinitializer
ret <4 x i32> %res		ret <4 x i32> %res
}		}

define <4 x i32> @test_masked_4xi32_perm_mem_mask2(<4 x i32>* %vp, <4 x i32> %vec2, <4 x i32> %mask) {		define <4 x i32> @test_masked_4xi32_perm_mem_mask2(<4 x i32>* %vp, <4 x i32> %vec2, <4 x i32> %mask) {
; GENERIC-LABEL: test_masked_4xi32_perm_mem_mask2:		; GENERIC-LABEL: test_masked_4xi32_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} xmm0 {%k1} = mem[0,3,0,1] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} xmm0 {%k1} = mem[0,3,0,1] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_4xi32_perm_mem_mask2:		; SKX-LABEL: test_masked_4xi32_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} xmm0 {%k1} = mem[0,3,0,1] sched: [7:1.00]		; SKX-NEXT: vpshufd {{.*#+}} xmm0 {%k1} = mem[0,3,0,1] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x i32>, <4 x i32>* %vp		%vec = load <4 x i32>, <4 x i32>* %vp
%shuf = shufflevector <4 x i32> %vec, <4 x i32> undef, <4 x i32> <i32 0, i32 3, i32 0, i32 1>		%shuf = shufflevector <4 x i32> %vec, <4 x i32> undef, <4 x i32> <i32 0, i32 3, i32 0, i32 1>
%cmp = icmp eq <4 x i32> %mask, zeroinitializer		%cmp = icmp eq <4 x i32> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x i32> %shuf, <4 x i32> %vec2		%res = select <4 x i1> %cmp, <4 x i32> %shuf, <4 x i32> %vec2
ret <4 x i32> %res		ret <4 x i32> %res
}		}

define <4 x i32> @test_masked_z_4xi32_perm_mem_mask2(<4 x i32>* %vp, <4 x i32> %mask) {		define <4 x i32> @test_masked_z_4xi32_perm_mem_mask2(<4 x i32>* %vp, <4 x i32> %mask) {
; GENERIC-LABEL: test_masked_z_4xi32_perm_mem_mask2:		; GENERIC-LABEL: test_masked_z_4xi32_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm0, %xmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm0, %xmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} xmm0 {%k1} {z} = mem[0,3,0,1] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} xmm0 {%k1} {z} = mem[0,3,0,1] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_4xi32_perm_mem_mask2:		; SKX-LABEL: test_masked_z_4xi32_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm0, %xmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm0, %xmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} xmm0 {%k1} {z} = mem[0,3,0,1] sched: [7:1.00]		; SKX-NEXT: vpshufd {{.*#+}} xmm0 {%k1} {z} = mem[0,3,0,1] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x i32>, <4 x i32>* %vp		%vec = load <4 x i32>, <4 x i32>* %vp
Show All 16 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x i32>, <4 x i32>* %vp		%vec = load <4 x i32>, <4 x i32>* %vp
%res = shufflevector <4 x i32> %vec, <4 x i32> undef, <4 x i32> <i32 1, i32 0, i32 1, i32 0>		%res = shufflevector <4 x i32> %vec, <4 x i32> undef, <4 x i32> <i32 1, i32 0, i32 1, i32 0>
ret <4 x i32> %res		ret <4 x i32> %res
}		}
define <4 x i32> @test_masked_4xi32_perm_mem_mask3(<4 x i32>* %vp, <4 x i32> %vec2, <4 x i32> %mask) {		define <4 x i32> @test_masked_4xi32_perm_mem_mask3(<4 x i32>* %vp, <4 x i32> %vec2, <4 x i32> %mask) {
; GENERIC-LABEL: test_masked_4xi32_perm_mem_mask3:		; GENERIC-LABEL: test_masked_4xi32_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} xmm0 {%k1} = mem[1,0,1,0] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} xmm0 {%k1} = mem[1,0,1,0] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_4xi32_perm_mem_mask3:		; SKX-LABEL: test_masked_4xi32_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} xmm0 {%k1} = mem[1,0,1,0] sched: [7:1.00]		; SKX-NEXT: vpshufd {{.*#+}} xmm0 {%k1} = mem[1,0,1,0] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x i32>, <4 x i32>* %vp		%vec = load <4 x i32>, <4 x i32>* %vp
%shuf = shufflevector <4 x i32> %vec, <4 x i32> undef, <4 x i32> <i32 1, i32 0, i32 1, i32 0>		%shuf = shufflevector <4 x i32> %vec, <4 x i32> undef, <4 x i32> <i32 1, i32 0, i32 1, i32 0>
%cmp = icmp eq <4 x i32> %mask, zeroinitializer		%cmp = icmp eq <4 x i32> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x i32> %shuf, <4 x i32> %vec2		%res = select <4 x i1> %cmp, <4 x i32> %shuf, <4 x i32> %vec2
ret <4 x i32> %res		ret <4 x i32> %res
}		}

define <4 x i32> @test_masked_z_4xi32_perm_mem_mask3(<4 x i32>* %vp, <4 x i32> %mask) {		define <4 x i32> @test_masked_z_4xi32_perm_mem_mask3(<4 x i32>* %vp, <4 x i32> %mask) {
; GENERIC-LABEL: test_masked_z_4xi32_perm_mem_mask3:		; GENERIC-LABEL: test_masked_z_4xi32_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm0, %xmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm0, %xmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} xmm0 {%k1} {z} = mem[1,0,1,0] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} xmm0 {%k1} {z} = mem[1,0,1,0] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_masked_z_4xi32_perm_mem_mask3:		; SKX-LABEL: test_masked_z_4xi32_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm0, %xmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm0, %xmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} xmm0 {%k1} {z} = mem[1,0,1,0] sched: [7:1.00]		; SKX-NEXT: vpshufd {{.*#+}} xmm0 {%k1} {z} = mem[1,0,1,0] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <4 x i32>, <4 x i32>* %vp		%vec = load <4 x i32>, <4 x i32>* %vp
▲ Show 20 Lines • Show All 190 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i32>, <8 x i32>* %vp		%vec = load <8 x i32>, <8 x i32>* %vp
%res = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 1, i32 0, i32 2, i32 0, i32 5, i32 4, i32 6, i32 4>		%res = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 1, i32 0, i32 2, i32 0, i32 5, i32 4, i32 6, i32 4>
ret <8 x i32> %res		ret <8 x i32> %res
}		}
define <8 x i32> @test2_masked_8xi32_perm_mem_mask0(<8 x i32>* %vp, <8 x i32> %vec2, <8 x i32> %mask) {		define <8 x i32> @test2_masked_8xi32_perm_mem_mask0(<8 x i32>* %vp, <8 x i32> %vec2, <8 x i32> %mask) {
; GENERIC-LABEL: test2_masked_8xi32_perm_mem_mask0:		; GENERIC-LABEL: test2_masked_8xi32_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} ymm0 {%k1} = mem[1,0,2,0,5,4,6,4] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} ymm0 {%k1} = mem[1,0,2,0,5,4,6,4] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test2_masked_8xi32_perm_mem_mask0:		; SKX-LABEL: test2_masked_8xi32_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} ymm0 {%k1} = mem[1,0,2,0,5,4,6,4] sched: [8:1.00]		; SKX-NEXT: vpshufd {{.*#+}} ymm0 {%k1} = mem[1,0,2,0,5,4,6,4] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i32>, <8 x i32>* %vp		%vec = load <8 x i32>, <8 x i32>* %vp
%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 1, i32 0, i32 2, i32 0, i32 5, i32 4, i32 6, i32 4>		%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 1, i32 0, i32 2, i32 0, i32 5, i32 4, i32 6, i32 4>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec2		%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec2
ret <8 x i32> %res		ret <8 x i32> %res
}		}

define <8 x i32> @test2_masked_z_8xi32_perm_mem_mask0(<8 x i32>* %vp, <8 x i32> %mask) {		define <8 x i32> @test2_masked_z_8xi32_perm_mem_mask0(<8 x i32>* %vp, <8 x i32> %mask) {
; GENERIC-LABEL: test2_masked_z_8xi32_perm_mem_mask0:		; GENERIC-LABEL: test2_masked_z_8xi32_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} ymm0 {%k1} {z} = mem[1,0,2,0,5,4,6,4] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} ymm0 {%k1} {z} = mem[1,0,2,0,5,4,6,4] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test2_masked_z_8xi32_perm_mem_mask0:		; SKX-LABEL: test2_masked_z_8xi32_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} ymm0 {%k1} {z} = mem[1,0,2,0,5,4,6,4] sched: [8:1.00]		; SKX-NEXT: vpshufd {{.*#+}} ymm0 {%k1} {z} = mem[1,0,2,0,5,4,6,4] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i32>, <8 x i32>* %vp		%vec = load <8 x i32>, <8 x i32>* %vp
%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 1, i32 0, i32 2, i32 0, i32 5, i32 4, i32 6, i32 4>		%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 1, i32 0, i32 2, i32 0, i32 5, i32 4, i32 6, i32 4>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> zeroinitializer
ret <8 x i32> %res		ret <8 x i32> %res
}		}

define <8 x i32> @test2_masked_8xi32_perm_mem_mask1(<8 x i32>* %vp, <8 x i32> %vec2, <8 x i32> %mask) {		define <8 x i32> @test2_masked_8xi32_perm_mem_mask1(<8 x i32>* %vp, <8 x i32> %vec2, <8 x i32> %mask) {
; GENERIC-LABEL: test2_masked_8xi32_perm_mem_mask1:		; GENERIC-LABEL: test2_masked_8xi32_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} ymm0 {%k1} = mem[0,3,2,0,4,7,6,4] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} ymm0 {%k1} = mem[0,3,2,0,4,7,6,4] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test2_masked_8xi32_perm_mem_mask1:		; SKX-LABEL: test2_masked_8xi32_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} ymm0 {%k1} = mem[0,3,2,0,4,7,6,4] sched: [8:1.00]		; SKX-NEXT: vpshufd {{.*#+}} ymm0 {%k1} = mem[0,3,2,0,4,7,6,4] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i32>, <8 x i32>* %vp		%vec = load <8 x i32>, <8 x i32>* %vp
%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 0, i32 3, i32 2, i32 0, i32 4, i32 7, i32 6, i32 4>		%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 0, i32 3, i32 2, i32 0, i32 4, i32 7, i32 6, i32 4>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec2		%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec2
ret <8 x i32> %res		ret <8 x i32> %res
}		}

define <8 x i32> @test2_masked_z_8xi32_perm_mem_mask1(<8 x i32>* %vp, <8 x i32> %mask) {		define <8 x i32> @test2_masked_z_8xi32_perm_mem_mask1(<8 x i32>* %vp, <8 x i32> %mask) {
; GENERIC-LABEL: test2_masked_z_8xi32_perm_mem_mask1:		; GENERIC-LABEL: test2_masked_z_8xi32_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} ymm0 {%k1} {z} = mem[0,3,2,0,4,7,6,4] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} ymm0 {%k1} {z} = mem[0,3,2,0,4,7,6,4] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test2_masked_z_8xi32_perm_mem_mask1:		; SKX-LABEL: test2_masked_z_8xi32_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} ymm0 {%k1} {z} = mem[0,3,2,0,4,7,6,4] sched: [8:1.00]		; SKX-NEXT: vpshufd {{.*#+}} ymm0 {%k1} {z} = mem[0,3,2,0,4,7,6,4] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i32>, <8 x i32>* %vp		%vec = load <8 x i32>, <8 x i32>* %vp
%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 0, i32 3, i32 2, i32 0, i32 4, i32 7, i32 6, i32 4>		%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 0, i32 3, i32 2, i32 0, i32 4, i32 7, i32 6, i32 4>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> zeroinitializer
ret <8 x i32> %res		ret <8 x i32> %res
}		}

define <8 x i32> @test2_masked_8xi32_perm_mem_mask2(<8 x i32>* %vp, <8 x i32> %vec2, <8 x i32> %mask) {		define <8 x i32> @test2_masked_8xi32_perm_mem_mask2(<8 x i32>* %vp, <8 x i32> %vec2, <8 x i32> %mask) {
; GENERIC-LABEL: test2_masked_8xi32_perm_mem_mask2:		; GENERIC-LABEL: test2_masked_8xi32_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} ymm0 {%k1} = mem[3,2,3,1,7,6,7,5] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} ymm0 {%k1} = mem[3,2,3,1,7,6,7,5] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test2_masked_8xi32_perm_mem_mask2:		; SKX-LABEL: test2_masked_8xi32_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} ymm0 {%k1} = mem[3,2,3,1,7,6,7,5] sched: [8:1.00]		; SKX-NEXT: vpshufd {{.*#+}} ymm0 {%k1} = mem[3,2,3,1,7,6,7,5] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i32>, <8 x i32>* %vp		%vec = load <8 x i32>, <8 x i32>* %vp
%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 3, i32 2, i32 3, i32 1, i32 7, i32 6, i32 7, i32 5>		%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 3, i32 2, i32 3, i32 1, i32 7, i32 6, i32 7, i32 5>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec2		%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec2
ret <8 x i32> %res		ret <8 x i32> %res
}		}

define <8 x i32> @test2_masked_z_8xi32_perm_mem_mask2(<8 x i32>* %vp, <8 x i32> %mask) {		define <8 x i32> @test2_masked_z_8xi32_perm_mem_mask2(<8 x i32>* %vp, <8 x i32> %mask) {
; GENERIC-LABEL: test2_masked_z_8xi32_perm_mem_mask2:		; GENERIC-LABEL: test2_masked_z_8xi32_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} ymm0 {%k1} {z} = mem[3,2,3,1,7,6,7,5] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} ymm0 {%k1} {z} = mem[3,2,3,1,7,6,7,5] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test2_masked_z_8xi32_perm_mem_mask2:		; SKX-LABEL: test2_masked_z_8xi32_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} ymm0 {%k1} {z} = mem[3,2,3,1,7,6,7,5] sched: [8:1.00]		; SKX-NEXT: vpshufd {{.*#+}} ymm0 {%k1} {z} = mem[3,2,3,1,7,6,7,5] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i32>, <8 x i32>* %vp		%vec = load <8 x i32>, <8 x i32>* %vp
Show All 16 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i32>, <8 x i32>* %vp		%vec = load <8 x i32>, <8 x i32>* %vp
%res = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 3, i32 2, i32 0, i32 0, i32 7, i32 6, i32 4, i32 4>		%res = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 3, i32 2, i32 0, i32 0, i32 7, i32 6, i32 4, i32 4>
ret <8 x i32> %res		ret <8 x i32> %res
}		}
define <8 x i32> @test2_masked_8xi32_perm_mem_mask3(<8 x i32>* %vp, <8 x i32> %vec2, <8 x i32> %mask) {		define <8 x i32> @test2_masked_8xi32_perm_mem_mask3(<8 x i32>* %vp, <8 x i32> %vec2, <8 x i32> %mask) {
; GENERIC-LABEL: test2_masked_8xi32_perm_mem_mask3:		; GENERIC-LABEL: test2_masked_8xi32_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} ymm0 {%k1} = mem[3,2,0,0,7,6,4,4] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} ymm0 {%k1} = mem[3,2,0,0,7,6,4,4] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test2_masked_8xi32_perm_mem_mask3:		; SKX-LABEL: test2_masked_8xi32_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} ymm0 {%k1} = mem[3,2,0,0,7,6,4,4] sched: [8:1.00]		; SKX-NEXT: vpshufd {{.*#+}} ymm0 {%k1} = mem[3,2,0,0,7,6,4,4] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i32>, <8 x i32>* %vp		%vec = load <8 x i32>, <8 x i32>* %vp
%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 3, i32 2, i32 0, i32 0, i32 7, i32 6, i32 4, i32 4>		%shuf = shufflevector <8 x i32> %vec, <8 x i32> undef, <8 x i32> <i32 3, i32 2, i32 0, i32 0, i32 7, i32 6, i32 4, i32 4>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec2		%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec2
ret <8 x i32> %res		ret <8 x i32> %res
}		}

define <8 x i32> @test2_masked_z_8xi32_perm_mem_mask3(<8 x i32>* %vp, <8 x i32> %mask) {		define <8 x i32> @test2_masked_z_8xi32_perm_mem_mask3(<8 x i32>* %vp, <8 x i32> %mask) {
; GENERIC-LABEL: test2_masked_z_8xi32_perm_mem_mask3:		; GENERIC-LABEL: test2_masked_z_8xi32_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} ymm0 {%k1} {z} = mem[3,2,0,0,7,6,4,4] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} ymm0 {%k1} {z} = mem[3,2,0,0,7,6,4,4] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test2_masked_z_8xi32_perm_mem_mask3:		; SKX-LABEL: test2_masked_z_8xi32_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm0, %ymm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} ymm0 {%k1} {z} = mem[3,2,0,0,7,6,4,4] sched: [8:1.00]		; SKX-NEXT: vpshufd {{.*#+}} ymm0 {%k1} {z} = mem[3,2,0,0,7,6,4,4] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <8 x i32>, <8 x i32>* %vp		%vec = load <8 x i32>, <8 x i32>* %vp
▲ Show 20 Lines • Show All 175 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 3, i32 2, i32 0, i32 3, i32 7, i32 6, i32 4, i32 7, i32 11, i32 10, i32 8, i32 11, i32 15, i32 14, i32 12, i32 15>		%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 3, i32 2, i32 0, i32 3, i32 7, i32 6, i32 4, i32 7, i32 11, i32 10, i32 8, i32 11, i32 15, i32 14, i32 12, i32 15>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer
ret <16 x i32> %res		ret <16 x i32> %res
}		}
define <16 x i32> @test2_16xi32_perm_mem_mask0(<16 x i32>* %vp) {		define <16 x i32> @test2_16xi32_perm_mem_mask0(<16 x i32>* %vp) {
; GENERIC-LABEL: test2_16xi32_perm_mem_mask0:		; GENERIC-LABEL: test2_16xi32_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpermilps {{.*#+}} zmm0 = mem[1,0,1,3,5,4,5,7,9,8,9,11,13,12,13,15] sched: [5:1.00]		; GENERIC-NEXT: vpermilps {{.*#+}} zmm0 = mem[1,0,1,3,5,4,5,7,9,8,9,11,13,12,13,15] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test2_16xi32_perm_mem_mask0:		; SKX-LABEL: test2_16xi32_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpermilps {{.*#+}} zmm0 = mem[1,0,1,3,5,4,5,7,9,8,9,11,13,12,13,15] sched: [8:1.00]		; SKX-NEXT: vpermilps {{.*#+}} zmm0 = mem[1,0,1,3,5,4,5,7,9,8,9,11,13,12,13,15] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i32>, <16 x i32>* %vp		%vec = load <16 x i32>, <16 x i32>* %vp
%res = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 1, i32 0, i32 1, i32 3, i32 5, i32 4, i32 5, i32 7, i32 9, i32 8, i32 9, i32 11, i32 13, i32 12, i32 13, i32 15>		%res = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 1, i32 0, i32 1, i32 3, i32 5, i32 4, i32 5, i32 7, i32 9, i32 8, i32 9, i32 11, i32 13, i32 12, i32 13, i32 15>
ret <16 x i32> %res		ret <16 x i32> %res
}		}
define <16 x i32> @test2_masked_16xi32_perm_mem_mask0(<16 x i32>* %vp, <16 x i32> %vec2, <16 x i32> %mask) {		define <16 x i32> @test2_masked_16xi32_perm_mem_mask0(<16 x i32>* %vp, <16 x i32> %vec2, <16 x i32> %mask) {
; GENERIC-LABEL: test2_masked_16xi32_perm_mem_mask0:		; GENERIC-LABEL: test2_masked_16xi32_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} zmm0 {%k1} = mem[1,0,1,3,5,4,5,7,9,8,9,11,13,12,13,15] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} zmm0 {%k1} = mem[1,0,1,3,5,4,5,7,9,8,9,11,13,12,13,15] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test2_masked_16xi32_perm_mem_mask0:		; SKX-LABEL: test2_masked_16xi32_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} zmm0 {%k1} = mem[1,0,1,3,5,4,5,7,9,8,9,11,13,12,13,15] sched: [8:1.00]		; SKX-NEXT: vpshufd {{.*#+}} zmm0 {%k1} = mem[1,0,1,3,5,4,5,7,9,8,9,11,13,12,13,15] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i32>, <16 x i32>* %vp		%vec = load <16 x i32>, <16 x i32>* %vp
%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 1, i32 0, i32 1, i32 3, i32 5, i32 4, i32 5, i32 7, i32 9, i32 8, i32 9, i32 11, i32 13, i32 12, i32 13, i32 15>		%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 1, i32 0, i32 1, i32 3, i32 5, i32 4, i32 5, i32 7, i32 9, i32 8, i32 9, i32 11, i32 13, i32 12, i32 13, i32 15>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec2		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec2
ret <16 x i32> %res		ret <16 x i32> %res
}		}

define <16 x i32> @test2_masked_z_16xi32_perm_mem_mask0(<16 x i32>* %vp, <16 x i32> %mask) {		define <16 x i32> @test2_masked_z_16xi32_perm_mem_mask0(<16 x i32>* %vp, <16 x i32> %mask) {
; GENERIC-LABEL: test2_masked_z_16xi32_perm_mem_mask0:		; GENERIC-LABEL: test2_masked_z_16xi32_perm_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} zmm0 {%k1} {z} = mem[1,0,1,3,5,4,5,7,9,8,9,11,13,12,13,15] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} zmm0 {%k1} {z} = mem[1,0,1,3,5,4,5,7,9,8,9,11,13,12,13,15] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test2_masked_z_16xi32_perm_mem_mask0:		; SKX-LABEL: test2_masked_z_16xi32_perm_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} zmm0 {%k1} {z} = mem[1,0,1,3,5,4,5,7,9,8,9,11,13,12,13,15] sched: [8:1.00]		; SKX-NEXT: vpshufd {{.*#+}} zmm0 {%k1} {z} = mem[1,0,1,3,5,4,5,7,9,8,9,11,13,12,13,15] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i32>, <16 x i32>* %vp		%vec = load <16 x i32>, <16 x i32>* %vp
%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 1, i32 0, i32 1, i32 3, i32 5, i32 4, i32 5, i32 7, i32 9, i32 8, i32 9, i32 11, i32 13, i32 12, i32 13, i32 15>		%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 1, i32 0, i32 1, i32 3, i32 5, i32 4, i32 5, i32 7, i32 9, i32 8, i32 9, i32 11, i32 13, i32 12, i32 13, i32 15>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer
ret <16 x i32> %res		ret <16 x i32> %res
}		}

define <16 x i32> @test2_masked_16xi32_perm_mem_mask1(<16 x i32>* %vp, <16 x i32> %vec2, <16 x i32> %mask) {		define <16 x i32> @test2_masked_16xi32_perm_mem_mask1(<16 x i32>* %vp, <16 x i32> %vec2, <16 x i32> %mask) {
; GENERIC-LABEL: test2_masked_16xi32_perm_mem_mask1:		; GENERIC-LABEL: test2_masked_16xi32_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} zmm0 {%k1} = mem[1,0,0,2,5,4,4,6,9,8,8,10,13,12,12,14] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} zmm0 {%k1} = mem[1,0,0,2,5,4,4,6,9,8,8,10,13,12,12,14] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test2_masked_16xi32_perm_mem_mask1:		; SKX-LABEL: test2_masked_16xi32_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} zmm0 {%k1} = mem[1,0,0,2,5,4,4,6,9,8,8,10,13,12,12,14] sched: [8:1.00]		; SKX-NEXT: vpshufd {{.*#+}} zmm0 {%k1} = mem[1,0,0,2,5,4,4,6,9,8,8,10,13,12,12,14] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i32>, <16 x i32>* %vp		%vec = load <16 x i32>, <16 x i32>* %vp
%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 1, i32 0, i32 0, i32 2, i32 5, i32 4, i32 4, i32 6, i32 9, i32 8, i32 8, i32 10, i32 13, i32 12, i32 12, i32 14>		%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 1, i32 0, i32 0, i32 2, i32 5, i32 4, i32 4, i32 6, i32 9, i32 8, i32 8, i32 10, i32 13, i32 12, i32 12, i32 14>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec2		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec2
ret <16 x i32> %res		ret <16 x i32> %res
}		}

define <16 x i32> @test2_masked_z_16xi32_perm_mem_mask1(<16 x i32>* %vp, <16 x i32> %mask) {		define <16 x i32> @test2_masked_z_16xi32_perm_mem_mask1(<16 x i32>* %vp, <16 x i32> %mask) {
; GENERIC-LABEL: test2_masked_z_16xi32_perm_mem_mask1:		; GENERIC-LABEL: test2_masked_z_16xi32_perm_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} zmm0 {%k1} {z} = mem[1,0,0,2,5,4,4,6,9,8,8,10,13,12,12,14] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} zmm0 {%k1} {z} = mem[1,0,0,2,5,4,4,6,9,8,8,10,13,12,12,14] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test2_masked_z_16xi32_perm_mem_mask1:		; SKX-LABEL: test2_masked_z_16xi32_perm_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} zmm0 {%k1} {z} = mem[1,0,0,2,5,4,4,6,9,8,8,10,13,12,12,14] sched: [8:1.00]		; SKX-NEXT: vpshufd {{.*#+}} zmm0 {%k1} {z} = mem[1,0,0,2,5,4,4,6,9,8,8,10,13,12,12,14] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i32>, <16 x i32>* %vp		%vec = load <16 x i32>, <16 x i32>* %vp
%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 1, i32 0, i32 0, i32 2, i32 5, i32 4, i32 4, i32 6, i32 9, i32 8, i32 8, i32 10, i32 13, i32 12, i32 12, i32 14>		%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 1, i32 0, i32 0, i32 2, i32 5, i32 4, i32 4, i32 6, i32 9, i32 8, i32 8, i32 10, i32 13, i32 12, i32 12, i32 14>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer
ret <16 x i32> %res		ret <16 x i32> %res
}		}

define <16 x i32> @test2_masked_16xi32_perm_mem_mask2(<16 x i32>* %vp, <16 x i32> %vec2, <16 x i32> %mask) {		define <16 x i32> @test2_masked_16xi32_perm_mem_mask2(<16 x i32>* %vp, <16 x i32> %vec2, <16 x i32> %mask) {
; GENERIC-LABEL: test2_masked_16xi32_perm_mem_mask2:		; GENERIC-LABEL: test2_masked_16xi32_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} zmm0 {%k1} = mem[2,0,1,2,6,4,5,6,10,8,9,10,14,12,13,14] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} zmm0 {%k1} = mem[2,0,1,2,6,4,5,6,10,8,9,10,14,12,13,14] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test2_masked_16xi32_perm_mem_mask2:		; SKX-LABEL: test2_masked_16xi32_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} zmm0 {%k1} = mem[2,0,1,2,6,4,5,6,10,8,9,10,14,12,13,14] sched: [8:1.00]		; SKX-NEXT: vpshufd {{.*#+}} zmm0 {%k1} = mem[2,0,1,2,6,4,5,6,10,8,9,10,14,12,13,14] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i32>, <16 x i32>* %vp		%vec = load <16 x i32>, <16 x i32>* %vp
%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 2, i32 0, i32 1, i32 2, i32 6, i32 4, i32 5, i32 6, i32 10, i32 8, i32 9, i32 10, i32 14, i32 12, i32 13, i32 14>		%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 2, i32 0, i32 1, i32 2, i32 6, i32 4, i32 5, i32 6, i32 10, i32 8, i32 9, i32 10, i32 14, i32 12, i32 13, i32 14>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec2		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec2
ret <16 x i32> %res		ret <16 x i32> %res
}		}

define <16 x i32> @test2_masked_z_16xi32_perm_mem_mask2(<16 x i32>* %vp, <16 x i32> %mask) {		define <16 x i32> @test2_masked_z_16xi32_perm_mem_mask2(<16 x i32>* %vp, <16 x i32> %mask) {
; GENERIC-LABEL: test2_masked_z_16xi32_perm_mem_mask2:		; GENERIC-LABEL: test2_masked_z_16xi32_perm_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} zmm0 {%k1} {z} = mem[2,0,1,2,6,4,5,6,10,8,9,10,14,12,13,14] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} zmm0 {%k1} {z} = mem[2,0,1,2,6,4,5,6,10,8,9,10,14,12,13,14] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test2_masked_z_16xi32_perm_mem_mask2:		; SKX-LABEL: test2_masked_z_16xi32_perm_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} zmm0 {%k1} {z} = mem[2,0,1,2,6,4,5,6,10,8,9,10,14,12,13,14] sched: [8:1.00]		; SKX-NEXT: vpshufd {{.*#+}} zmm0 {%k1} {z} = mem[2,0,1,2,6,4,5,6,10,8,9,10,14,12,13,14] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i32>, <16 x i32>* %vp		%vec = load <16 x i32>, <16 x i32>* %vp
%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 2, i32 0, i32 1, i32 2, i32 6, i32 4, i32 5, i32 6, i32 10, i32 8, i32 9, i32 10, i32 14, i32 12, i32 13, i32 14>		%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 2, i32 0, i32 1, i32 2, i32 6, i32 4, i32 5, i32 6, i32 10, i32 8, i32 9, i32 10, i32 14, i32 12, i32 13, i32 14>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer
ret <16 x i32> %res		ret <16 x i32> %res
}		}

define <16 x i32> @test2_16xi32_perm_mem_mask3(<16 x i32>* %vp) {		define <16 x i32> @test2_16xi32_perm_mem_mask3(<16 x i32>* %vp) {
; GENERIC-LABEL: test2_16xi32_perm_mem_mask3:		; GENERIC-LABEL: test2_16xi32_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vpermilps {{.*#+}} zmm0 = mem[3,1,1,1,7,5,5,5,11,9,9,9,15,13,13,13] sched: [5:1.00]		; GENERIC-NEXT: vpermilps {{.*#+}} zmm0 = mem[3,1,1,1,7,5,5,5,11,9,9,9,15,13,13,13] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test2_16xi32_perm_mem_mask3:		; SKX-LABEL: test2_16xi32_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vpermilps {{.*#+}} zmm0 = mem[3,1,1,1,7,5,5,5,11,9,9,9,15,13,13,13] sched: [8:1.00]		; SKX-NEXT: vpermilps {{.*#+}} zmm0 = mem[3,1,1,1,7,5,5,5,11,9,9,9,15,13,13,13] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i32>, <16 x i32>* %vp		%vec = load <16 x i32>, <16 x i32>* %vp
%res = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 3, i32 1, i32 1, i32 1, i32 7, i32 5, i32 5, i32 5, i32 11, i32 9, i32 9, i32 9, i32 15, i32 13, i32 13, i32 13>		%res = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 3, i32 1, i32 1, i32 1, i32 7, i32 5, i32 5, i32 5, i32 11, i32 9, i32 9, i32 9, i32 15, i32 13, i32 13, i32 13>
ret <16 x i32> %res		ret <16 x i32> %res
}		}
define <16 x i32> @test2_masked_16xi32_perm_mem_mask3(<16 x i32>* %vp, <16 x i32> %vec2, <16 x i32> %mask) {		define <16 x i32> @test2_masked_16xi32_perm_mem_mask3(<16 x i32>* %vp, <16 x i32> %vec2, <16 x i32> %mask) {
; GENERIC-LABEL: test2_masked_16xi32_perm_mem_mask3:		; GENERIC-LABEL: test2_masked_16xi32_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} zmm0 {%k1} = mem[3,1,1,1,7,5,5,5,11,9,9,9,15,13,13,13] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} zmm0 {%k1} = mem[3,1,1,1,7,5,5,5,11,9,9,9,15,13,13,13] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test2_masked_16xi32_perm_mem_mask3:		; SKX-LABEL: test2_masked_16xi32_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} zmm0 {%k1} = mem[3,1,1,1,7,5,5,5,11,9,9,9,15,13,13,13] sched: [8:1.00]		; SKX-NEXT: vpshufd {{.*#+}} zmm0 {%k1} = mem[3,1,1,1,7,5,5,5,11,9,9,9,15,13,13,13] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i32>, <16 x i32>* %vp		%vec = load <16 x i32>, <16 x i32>* %vp
%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 3, i32 1, i32 1, i32 1, i32 7, i32 5, i32 5, i32 5, i32 11, i32 9, i32 9, i32 9, i32 15, i32 13, i32 13, i32 13>		%shuf = shufflevector <16 x i32> %vec, <16 x i32> undef, <16 x i32> <i32 3, i32 1, i32 1, i32 1, i32 7, i32 5, i32 5, i32 5, i32 11, i32 9, i32 9, i32 9, i32 15, i32 13, i32 13, i32 13>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec2		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec2
ret <16 x i32> %res		ret <16 x i32> %res
}		}

define <16 x i32> @test2_masked_z_16xi32_perm_mem_mask3(<16 x i32>* %vp, <16 x i32> %mask) {		define <16 x i32> @test2_masked_z_16xi32_perm_mem_mask3(<16 x i32>* %vp, <16 x i32> %mask) {
; GENERIC-LABEL: test2_masked_z_16xi32_perm_mem_mask3:		; GENERIC-LABEL: test2_masked_z_16xi32_perm_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vpshufd {{.*#+}} zmm0 {%k1} {z} = mem[3,1,1,1,7,5,5,5,11,9,9,9,15,13,13,13] sched: [5:1.00]		; GENERIC-NEXT: vpshufd {{.*#+}} zmm0 {%k1} {z} = mem[3,1,1,1,7,5,5,5,11,9,9,9,15,13,13,13] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test2_masked_z_16xi32_perm_mem_mask3:		; SKX-LABEL: test2_masked_z_16xi32_perm_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm0, %zmm0, %k1 # sched: [3:1.00]
; SKX-NEXT: vpshufd {{.*#+}} zmm0 {%k1} {z} = mem[3,1,1,1,7,5,5,5,11,9,9,9,15,13,13,13] sched: [8:1.00]		; SKX-NEXT: vpshufd {{.*#+}} zmm0 {%k1} {z} = mem[3,1,1,1,7,5,5,5,11,9,9,9,15,13,13,13] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec = load <16 x i32>, <16 x i32>* %vp		%vec = load <16 x i32>, <16 x i32>* %vp
▲ Show 20 Lines • Show All 190 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%res = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 12, i32 13, i32 14, i32 15>		%res = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 12, i32 13, i32 14, i32 15>
ret <8 x float> %res		ret <8 x float> %res
}		}
define <8 x float> @test_8xfloat_masked_shuff_mem_mask0(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_masked_shuff_mem_mask0(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_masked_shuff_mem_mask0:		; GENERIC-LABEL: test_8xfloat_masked_shuff_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [5:1.00]		; GENERIC-NEXT: vshuff32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [6:1.00]
; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_masked_shuff_mem_mask0:		; SKX-LABEL: test_8xfloat_masked_shuff_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [10:1.00]		; SKX-NEXT: vshuff32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [10:1.00]
; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 12, i32 13, i32 14, i32 15>		%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 12, i32 13, i32 14, i32 15>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_8xfloat_zero_masked_shuff_mem_mask0(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_zero_masked_shuff_mem_mask0(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_zero_masked_shuff_mem_mask0:		; GENERIC-LABEL: test_8xfloat_zero_masked_shuff_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [5:1.00]		; GENERIC-NEXT: vshuff32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_zero_masked_shuff_mem_mask0:		; SKX-LABEL: test_8xfloat_zero_masked_shuff_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [10:1.00]		; SKX-NEXT: vshuff32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 12, i32 13, i32 14, i32 15>		%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 12, i32 13, i32 14, i32 15>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> zeroinitializer		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> zeroinitializer
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_8xfloat_masked_shuff_mem_mask1(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_masked_shuff_mem_mask1(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_masked_shuff_mem_mask1:		; GENERIC-LABEL: test_8xfloat_masked_shuff_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [5:1.00]		; GENERIC-NEXT: vshuff32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [6:1.00]
; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_masked_shuff_mem_mask1:		; SKX-LABEL: test_8xfloat_masked_shuff_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [10:1.00]		; SKX-NEXT: vshuff32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [10:1.00]
; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 12, i32 13, i32 14, i32 15>		%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 12, i32 13, i32 14, i32 15>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_8xfloat_zero_masked_shuff_mem_mask1(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_zero_masked_shuff_mem_mask1(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_zero_masked_shuff_mem_mask1:		; GENERIC-LABEL: test_8xfloat_zero_masked_shuff_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [5:1.00]		; GENERIC-NEXT: vshuff32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_zero_masked_shuff_mem_mask1:		; SKX-LABEL: test_8xfloat_zero_masked_shuff_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [10:1.00]		; SKX-NEXT: vshuff32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 12, i32 13, i32 14, i32 15>		%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 12, i32 13, i32 14, i32 15>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> zeroinitializer		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> zeroinitializer
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_8xfloat_masked_shuff_mem_mask2(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_masked_shuff_mem_mask2(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_masked_shuff_mem_mask2:		; GENERIC-LABEL: test_8xfloat_masked_shuff_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [5:1.00]		; GENERIC-NEXT: vshuff32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [6:1.00]
; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_masked_shuff_mem_mask2:		; SKX-LABEL: test_8xfloat_masked_shuff_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [10:1.00]		; SKX-NEXT: vshuff32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [10:1.00]
; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>		%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_8xfloat_zero_masked_shuff_mem_mask2(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_zero_masked_shuff_mem_mask2(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_zero_masked_shuff_mem_mask2:		; GENERIC-LABEL: test_8xfloat_zero_masked_shuff_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [5:1.00]		; GENERIC-NEXT: vshuff32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_zero_masked_shuff_mem_mask2:		; SKX-LABEL: test_8xfloat_zero_masked_shuff_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [10:1.00]		; SKX-NEXT: vshuff32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
Show All 16 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%res = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>		%res = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>
ret <8 x float> %res		ret <8 x float> %res
}		}
define <8 x float> @test_8xfloat_masked_shuff_mem_mask3(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_masked_shuff_mem_mask3(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_masked_shuff_mem_mask3:		; GENERIC-LABEL: test_8xfloat_masked_shuff_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [5:1.00]		; GENERIC-NEXT: vshuff32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [6:1.00]
; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_masked_shuff_mem_mask3:		; SKX-LABEL: test_8xfloat_masked_shuff_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [10:1.00]		; SKX-NEXT: vshuff32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [10:1.00]
; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>		%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_8xfloat_zero_masked_shuff_mem_mask3(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_zero_masked_shuff_mem_mask3(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_zero_masked_shuff_mem_mask3:		; GENERIC-LABEL: test_8xfloat_zero_masked_shuff_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [5:1.00]		; GENERIC-NEXT: vshuff32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_zero_masked_shuff_mem_mask3:		; SKX-LABEL: test_8xfloat_zero_masked_shuff_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [10:1.00]		; SKX-NEXT: vshuff32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
▲ Show 20 Lines • Show All 175 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 24, i32 25, i32 26, i32 27>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15, i32 16, i32 17, i32 18, i32 19, i32 24, i32 25, i32 26, i32 27>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer
ret <16 x float> %res		ret <16 x float> %res
}		}
define <16 x float> @test_16xfloat_shuff_mem_mask0(<16 x float> %vec1, <16 x float>* %vec2p) {		define <16 x float> @test_16xfloat_shuff_mem_mask0(<16 x float> %vec1, <16 x float>* %vec2p) {
; GENERIC-LABEL: test_16xfloat_shuff_mem_mask0:		; GENERIC-LABEL: test_16xfloat_shuff_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vshuff32x4 {{.*#+}} zmm0 = zmm0[12,13,14,15,8,9,10,11],mem[8,9,10,11,4,5,6,7] sched: [5:1.00]		; GENERIC-NEXT: vshuff32x4 {{.*#+}} zmm0 = zmm0[12,13,14,15,8,9,10,11],mem[8,9,10,11,4,5,6,7] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_shuff_mem_mask0:		; SKX-LABEL: test_16xfloat_shuff_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vshuff32x4 {{.*#+}} zmm0 = zmm0[12,13,14,15,8,9,10,11],mem[8,9,10,11,4,5,6,7] sched: [10:1.00]		; SKX-NEXT: vshuff32x4 {{.*#+}} zmm0 = zmm0[12,13,14,15,8,9,10,11],mem[8,9,10,11,4,5,6,7] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%res = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 12, i32 13, i32 14, i32 15, i32 8, i32 9, i32 10, i32 11, i32 24, i32 25, i32 26, i32 27, i32 20, i32 21, i32 22, i32 23>		%res = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 12, i32 13, i32 14, i32 15, i32 8, i32 9, i32 10, i32 11, i32 24, i32 25, i32 26, i32 27, i32 20, i32 21, i32 22, i32 23>
ret <16 x float> %res		ret <16 x float> %res
}		}
define <16 x float> @test_16xfloat_masked_shuff_mem_mask0(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_masked_shuff_mem_mask0(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_masked_shuff_mem_mask0:		; GENERIC-LABEL: test_16xfloat_masked_shuff_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff32x4 {{.*#+}} zmm1 {%k1} = zmm0[12,13,14,15,8,9,10,11],mem[8,9,10,11,4,5,6,7] sched: [5:1.00]		; GENERIC-NEXT: vshuff32x4 {{.*#+}} zmm1 {%k1} = zmm0[12,13,14,15,8,9,10,11],mem[8,9,10,11,4,5,6,7] sched: [6:1.00]
; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_masked_shuff_mem_mask0:		; SKX-LABEL: test_16xfloat_masked_shuff_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff32x4 {{.*#+}} zmm1 {%k1} = zmm0[12,13,14,15,8,9,10,11],mem[8,9,10,11,4,5,6,7] sched: [10:1.00]		; SKX-NEXT: vshuff32x4 {{.*#+}} zmm1 {%k1} = zmm0[12,13,14,15,8,9,10,11],mem[8,9,10,11,4,5,6,7] sched: [10:1.00]
; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 12, i32 13, i32 14, i32 15, i32 8, i32 9, i32 10, i32 11, i32 24, i32 25, i32 26, i32 27, i32 20, i32 21, i32 22, i32 23>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 12, i32 13, i32 14, i32 15, i32 8, i32 9, i32 10, i32 11, i32 24, i32 25, i32 26, i32 27, i32 20, i32 21, i32 22, i32 23>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_16xfloat_zero_masked_shuff_mem_mask0(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_zero_masked_shuff_mem_mask0(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_zero_masked_shuff_mem_mask0:		; GENERIC-LABEL: test_16xfloat_zero_masked_shuff_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[12,13,14,15,8,9,10,11],mem[8,9,10,11,4,5,6,7] sched: [5:1.00]		; GENERIC-NEXT: vshuff32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[12,13,14,15,8,9,10,11],mem[8,9,10,11,4,5,6,7] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_zero_masked_shuff_mem_mask0:		; SKX-LABEL: test_16xfloat_zero_masked_shuff_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[12,13,14,15,8,9,10,11],mem[8,9,10,11,4,5,6,7] sched: [10:1.00]		; SKX-NEXT: vshuff32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[12,13,14,15,8,9,10,11],mem[8,9,10,11,4,5,6,7] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 12, i32 13, i32 14, i32 15, i32 8, i32 9, i32 10, i32 11, i32 24, i32 25, i32 26, i32 27, i32 20, i32 21, i32 22, i32 23>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 12, i32 13, i32 14, i32 15, i32 8, i32 9, i32 10, i32 11, i32 24, i32 25, i32 26, i32 27, i32 20, i32 21, i32 22, i32 23>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_16xfloat_masked_shuff_mem_mask1(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_masked_shuff_mem_mask1(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_masked_shuff_mem_mask1:		; GENERIC-LABEL: test_16xfloat_masked_shuff_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff32x4 {{.*#+}} zmm1 {%k1} = zmm0[8,9,10,11,4,5,6,7],mem[8,9,10,11,4,5,6,7] sched: [5:1.00]		; GENERIC-NEXT: vshuff32x4 {{.*#+}} zmm1 {%k1} = zmm0[8,9,10,11,4,5,6,7],mem[8,9,10,11,4,5,6,7] sched: [6:1.00]
; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_masked_shuff_mem_mask1:		; SKX-LABEL: test_16xfloat_masked_shuff_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff32x4 {{.*#+}} zmm1 {%k1} = zmm0[8,9,10,11,4,5,6,7],mem[8,9,10,11,4,5,6,7] sched: [10:1.00]		; SKX-NEXT: vshuff32x4 {{.*#+}} zmm1 {%k1} = zmm0[8,9,10,11,4,5,6,7],mem[8,9,10,11,4,5,6,7] sched: [10:1.00]
; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 8, i32 9, i32 10, i32 11, i32 4, i32 5, i32 6, i32 7, i32 24, i32 25, i32 26, i32 27, i32 20, i32 21, i32 22, i32 23>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 8, i32 9, i32 10, i32 11, i32 4, i32 5, i32 6, i32 7, i32 24, i32 25, i32 26, i32 27, i32 20, i32 21, i32 22, i32 23>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_16xfloat_zero_masked_shuff_mem_mask1(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_zero_masked_shuff_mem_mask1(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_zero_masked_shuff_mem_mask1:		; GENERIC-LABEL: test_16xfloat_zero_masked_shuff_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[8,9,10,11,4,5,6,7],mem[8,9,10,11,4,5,6,7] sched: [5:1.00]		; GENERIC-NEXT: vshuff32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[8,9,10,11,4,5,6,7],mem[8,9,10,11,4,5,6,7] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_zero_masked_shuff_mem_mask1:		; SKX-LABEL: test_16xfloat_zero_masked_shuff_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[8,9,10,11,4,5,6,7],mem[8,9,10,11,4,5,6,7] sched: [10:1.00]		; SKX-NEXT: vshuff32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[8,9,10,11,4,5,6,7],mem[8,9,10,11,4,5,6,7] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 8, i32 9, i32 10, i32 11, i32 4, i32 5, i32 6, i32 7, i32 24, i32 25, i32 26, i32 27, i32 20, i32 21, i32 22, i32 23>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 8, i32 9, i32 10, i32 11, i32 4, i32 5, i32 6, i32 7, i32 24, i32 25, i32 26, i32 27, i32 20, i32 21, i32 22, i32 23>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_16xfloat_masked_shuff_mem_mask2(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_masked_shuff_mem_mask2(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_masked_shuff_mem_mask2:		; GENERIC-LABEL: test_16xfloat_masked_shuff_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff32x4 {{.*#+}} zmm1 {%k1} = zmm0[0,1,2,3,0,1,2,3],mem[8,9,10,11,8,9,10,11] sched: [5:1.00]		; GENERIC-NEXT: vshuff32x4 {{.*#+}} zmm1 {%k1} = zmm0[0,1,2,3,0,1,2,3],mem[8,9,10,11,8,9,10,11] sched: [6:1.00]
; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_masked_shuff_mem_mask2:		; SKX-LABEL: test_16xfloat_masked_shuff_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff32x4 {{.*#+}} zmm1 {%k1} = zmm0[0,1,2,3,0,1,2,3],mem[8,9,10,11,8,9,10,11] sched: [10:1.00]		; SKX-NEXT: vshuff32x4 {{.*#+}} zmm1 {%k1} = zmm0[0,1,2,3,0,1,2,3],mem[8,9,10,11,8,9,10,11] sched: [10:1.00]
; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3, i32 24, i32 25, i32 26, i32 27, i32 24, i32 25, i32 26, i32 27>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3, i32 24, i32 25, i32 26, i32 27, i32 24, i32 25, i32 26, i32 27>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_16xfloat_zero_masked_shuff_mem_mask2(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_zero_masked_shuff_mem_mask2(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_zero_masked_shuff_mem_mask2:		; GENERIC-LABEL: test_16xfloat_zero_masked_shuff_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[0,1,2,3,0,1,2,3],mem[8,9,10,11,8,9,10,11] sched: [5:1.00]		; GENERIC-NEXT: vshuff32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[0,1,2,3,0,1,2,3],mem[8,9,10,11,8,9,10,11] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_zero_masked_shuff_mem_mask2:		; SKX-LABEL: test_16xfloat_zero_masked_shuff_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[0,1,2,3,0,1,2,3],mem[8,9,10,11,8,9,10,11] sched: [10:1.00]		; SKX-NEXT: vshuff32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[0,1,2,3,0,1,2,3],mem[8,9,10,11,8,9,10,11] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3, i32 24, i32 25, i32 26, i32 27, i32 24, i32 25, i32 26, i32 27>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3, i32 24, i32 25, i32 26, i32 27, i32 24, i32 25, i32 26, i32 27>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_16xfloat_shuff_mem_mask3(<16 x float> %vec1, <16 x float>* %vec2p) {		define <16 x float> @test_16xfloat_shuff_mem_mask3(<16 x float> %vec1, <16 x float>* %vec2p) {
; GENERIC-LABEL: test_16xfloat_shuff_mem_mask3:		; GENERIC-LABEL: test_16xfloat_shuff_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vshuff32x4 {{.*#+}} zmm0 = zmm0[4,5,6,7,0,1,2,3],mem[12,13,14,15,12,13,14,15] sched: [5:1.00]		; GENERIC-NEXT: vshuff32x4 {{.*#+}} zmm0 = zmm0[4,5,6,7,0,1,2,3],mem[12,13,14,15,12,13,14,15] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_shuff_mem_mask3:		; SKX-LABEL: test_16xfloat_shuff_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vshuff32x4 {{.*#+}} zmm0 = zmm0[4,5,6,7,0,1,2,3],mem[12,13,14,15,12,13,14,15] sched: [10:1.00]		; SKX-NEXT: vshuff32x4 {{.*#+}} zmm0 = zmm0[4,5,6,7,0,1,2,3],mem[12,13,14,15,12,13,14,15] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%res = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 4, i32 5, i32 6, i32 7, i32 0, i32 1, i32 2, i32 3, i32 28, i32 29, i32 30, i32 31, i32 28, i32 29, i32 30, i32 31>		%res = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 4, i32 5, i32 6, i32 7, i32 0, i32 1, i32 2, i32 3, i32 28, i32 29, i32 30, i32 31, i32 28, i32 29, i32 30, i32 31>
ret <16 x float> %res		ret <16 x float> %res
}		}
define <16 x float> @test_16xfloat_masked_shuff_mem_mask3(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_masked_shuff_mem_mask3(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_masked_shuff_mem_mask3:		; GENERIC-LABEL: test_16xfloat_masked_shuff_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff32x4 {{.*#+}} zmm1 {%k1} = zmm0[4,5,6,7,0,1,2,3],mem[12,13,14,15,12,13,14,15] sched: [5:1.00]		; GENERIC-NEXT: vshuff32x4 {{.*#+}} zmm1 {%k1} = zmm0[4,5,6,7,0,1,2,3],mem[12,13,14,15,12,13,14,15] sched: [6:1.00]
; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_masked_shuff_mem_mask3:		; SKX-LABEL: test_16xfloat_masked_shuff_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff32x4 {{.*#+}} zmm1 {%k1} = zmm0[4,5,6,7,0,1,2,3],mem[12,13,14,15,12,13,14,15] sched: [10:1.00]		; SKX-NEXT: vshuff32x4 {{.*#+}} zmm1 {%k1} = zmm0[4,5,6,7,0,1,2,3],mem[12,13,14,15,12,13,14,15] sched: [10:1.00]
; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 4, i32 5, i32 6, i32 7, i32 0, i32 1, i32 2, i32 3, i32 28, i32 29, i32 30, i32 31, i32 28, i32 29, i32 30, i32 31>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 4, i32 5, i32 6, i32 7, i32 0, i32 1, i32 2, i32 3, i32 28, i32 29, i32 30, i32 31, i32 28, i32 29, i32 30, i32 31>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_16xfloat_zero_masked_shuff_mem_mask3(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_zero_masked_shuff_mem_mask3(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_zero_masked_shuff_mem_mask3:		; GENERIC-LABEL: test_16xfloat_zero_masked_shuff_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[4,5,6,7,0,1,2,3],mem[12,13,14,15,12,13,14,15] sched: [5:1.00]		; GENERIC-NEXT: vshuff32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[4,5,6,7,0,1,2,3],mem[12,13,14,15,12,13,14,15] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_zero_masked_shuff_mem_mask3:		; SKX-LABEL: test_16xfloat_zero_masked_shuff_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[4,5,6,7,0,1,2,3],mem[12,13,14,15,12,13,14,15] sched: [10:1.00]		; SKX-NEXT: vshuff32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[4,5,6,7,0,1,2,3],mem[12,13,14,15,12,13,14,15] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
▲ Show 20 Lines • Show All 190 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%res = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 2, i32 3, i32 6, i32 7>		%res = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 2, i32 3, i32 6, i32 7>
ret <4 x double> %res		ret <4 x double> %res
}		}
define <4 x double> @test_4xdouble_masked_shuff_mem_mask0(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_masked_shuff_mem_mask0(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_masked_shuff_mem_mask0:		; GENERIC-LABEL: test_4xdouble_masked_shuff_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[2,3] sched: [5:1.00]		; GENERIC-NEXT: vshuff64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[2,3] sched: [6:1.00]
; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_masked_shuff_mem_mask0:		; SKX-LABEL: test_4xdouble_masked_shuff_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[2,3] sched: [10:1.00]		; SKX-NEXT: vshuff64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[2,3] sched: [10:1.00]
; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 2, i32 3, i32 6, i32 7>		%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 2, i32 3, i32 6, i32 7>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_4xdouble_zero_masked_shuff_mem_mask0(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_zero_masked_shuff_mem_mask0(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_zero_masked_shuff_mem_mask0:		; GENERIC-LABEL: test_4xdouble_zero_masked_shuff_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[2,3] sched: [5:1.00]		; GENERIC-NEXT: vshuff64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[2,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_zero_masked_shuff_mem_mask0:		; SKX-LABEL: test_4xdouble_zero_masked_shuff_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[2,3] sched: [10:1.00]		; SKX-NEXT: vshuff64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[2,3] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 2, i32 3, i32 6, i32 7>		%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 2, i32 3, i32 6, i32 7>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> zeroinitializer		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> zeroinitializer
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_4xdouble_masked_shuff_mem_mask1(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_masked_shuff_mem_mask1(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_masked_shuff_mem_mask1:		; GENERIC-LABEL: test_4xdouble_masked_shuff_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[0,1] sched: [5:1.00]		; GENERIC-NEXT: vshuff64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[0,1] sched: [6:1.00]
; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_masked_shuff_mem_mask1:		; SKX-LABEL: test_4xdouble_masked_shuff_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[0,1] sched: [10:1.00]		; SKX-NEXT: vshuff64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[0,1] sched: [10:1.00]
; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 2, i32 3, i32 4, i32 5>		%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 2, i32 3, i32 4, i32 5>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_4xdouble_zero_masked_shuff_mem_mask1(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_zero_masked_shuff_mem_mask1(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_zero_masked_shuff_mem_mask1:		; GENERIC-LABEL: test_4xdouble_zero_masked_shuff_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[0,1] sched: [5:1.00]		; GENERIC-NEXT: vshuff64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[0,1] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_zero_masked_shuff_mem_mask1:		; SKX-LABEL: test_4xdouble_zero_masked_shuff_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[0,1] sched: [10:1.00]		; SKX-NEXT: vshuff64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[0,1] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 2, i32 3, i32 4, i32 5>		%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 2, i32 3, i32 4, i32 5>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> zeroinitializer		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> zeroinitializer
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_4xdouble_masked_shuff_mem_mask2(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_masked_shuff_mem_mask2(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_masked_shuff_mem_mask2:		; GENERIC-LABEL: test_4xdouble_masked_shuff_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[0,1] sched: [5:1.00]		; GENERIC-NEXT: vshuff64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[0,1] sched: [6:1.00]
; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_masked_shuff_mem_mask2:		; SKX-LABEL: test_4xdouble_masked_shuff_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[0,1] sched: [10:1.00]		; SKX-NEXT: vshuff64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[0,1] sched: [10:1.00]
; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 2, i32 3, i32 4, i32 5>		%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 2, i32 3, i32 4, i32 5>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_4xdouble_zero_masked_shuff_mem_mask2(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_zero_masked_shuff_mem_mask2(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_zero_masked_shuff_mem_mask2:		; GENERIC-LABEL: test_4xdouble_zero_masked_shuff_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[0,1] sched: [5:1.00]		; GENERIC-NEXT: vshuff64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[0,1] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_zero_masked_shuff_mem_mask2:		; SKX-LABEL: test_4xdouble_zero_masked_shuff_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[0,1] sched: [10:1.00]		; SKX-NEXT: vshuff64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[0,1] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
Show All 16 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%res = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 2, i32 3, i32 6, i32 7>		%res = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 2, i32 3, i32 6, i32 7>
ret <4 x double> %res		ret <4 x double> %res
}		}
define <4 x double> @test_4xdouble_masked_shuff_mem_mask3(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_masked_shuff_mem_mask3(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_masked_shuff_mem_mask3:		; GENERIC-LABEL: test_4xdouble_masked_shuff_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[2,3] sched: [5:1.00]		; GENERIC-NEXT: vshuff64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[2,3] sched: [6:1.00]
; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_masked_shuff_mem_mask3:		; SKX-LABEL: test_4xdouble_masked_shuff_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[2,3] sched: [10:1.00]		; SKX-NEXT: vshuff64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[2,3] sched: [10:1.00]
; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 2, i32 3, i32 6, i32 7>		%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 2, i32 3, i32 6, i32 7>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_4xdouble_zero_masked_shuff_mem_mask3(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_zero_masked_shuff_mem_mask3(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_zero_masked_shuff_mem_mask3:		; GENERIC-LABEL: test_4xdouble_zero_masked_shuff_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[2,3] sched: [5:1.00]		; GENERIC-NEXT: vshuff64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[2,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_zero_masked_shuff_mem_mask3:		; SKX-LABEL: test_4xdouble_zero_masked_shuff_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[2,3] sched: [10:1.00]		; SKX-NEXT: vshuff64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[2,3] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
▲ Show 20 Lines • Show All 175 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 4, i32 5, i32 4, i32 5, i32 12, i32 13, i32 10, i32 11>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 4, i32 5, i32 4, i32 5, i32 12, i32 13, i32 10, i32 11>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer
ret <8 x double> %res		ret <8 x double> %res
}		}
define <8 x double> @test_8xdouble_shuff_mem_mask0(<8 x double> %vec1, <8 x double>* %vec2p) {		define <8 x double> @test_8xdouble_shuff_mem_mask0(<8 x double> %vec1, <8 x double>* %vec2p) {
; GENERIC-LABEL: test_8xdouble_shuff_mem_mask0:		; GENERIC-LABEL: test_8xdouble_shuff_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vshuff64x2 {{.*#+}} zmm0 = zmm0[6,7,0,1],mem[0,1,0,1] sched: [5:1.00]		; GENERIC-NEXT: vshuff64x2 {{.*#+}} zmm0 = zmm0[6,7,0,1],mem[0,1,0,1] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_shuff_mem_mask0:		; SKX-LABEL: test_8xdouble_shuff_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vshuff64x2 {{.*#+}} zmm0 = zmm0[6,7,0,1],mem[0,1,0,1] sched: [10:1.00]		; SKX-NEXT: vshuff64x2 {{.*#+}} zmm0 = zmm0[6,7,0,1],mem[0,1,0,1] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%res = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 6, i32 7, i32 0, i32 1, i32 8, i32 9, i32 8, i32 9>		%res = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 6, i32 7, i32 0, i32 1, i32 8, i32 9, i32 8, i32 9>
ret <8 x double> %res		ret <8 x double> %res
}		}
define <8 x double> @test_8xdouble_masked_shuff_mem_mask0(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_masked_shuff_mem_mask0(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_masked_shuff_mem_mask0:		; GENERIC-LABEL: test_8xdouble_masked_shuff_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff64x2 {{.*#+}} zmm1 {%k1} = zmm0[6,7,0,1],mem[0,1,0,1] sched: [5:1.00]		; GENERIC-NEXT: vshuff64x2 {{.*#+}} zmm1 {%k1} = zmm0[6,7,0,1],mem[0,1,0,1] sched: [6:1.00]
; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_masked_shuff_mem_mask0:		; SKX-LABEL: test_8xdouble_masked_shuff_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff64x2 {{.*#+}} zmm1 {%k1} = zmm0[6,7,0,1],mem[0,1,0,1] sched: [10:1.00]		; SKX-NEXT: vshuff64x2 {{.*#+}} zmm1 {%k1} = zmm0[6,7,0,1],mem[0,1,0,1] sched: [10:1.00]
; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 6, i32 7, i32 0, i32 1, i32 8, i32 9, i32 8, i32 9>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 6, i32 7, i32 0, i32 1, i32 8, i32 9, i32 8, i32 9>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_8xdouble_zero_masked_shuff_mem_mask0(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_zero_masked_shuff_mem_mask0(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_zero_masked_shuff_mem_mask0:		; GENERIC-LABEL: test_8xdouble_zero_masked_shuff_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[6,7,0,1],mem[0,1,0,1] sched: [5:1.00]		; GENERIC-NEXT: vshuff64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[6,7,0,1],mem[0,1,0,1] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_zero_masked_shuff_mem_mask0:		; SKX-LABEL: test_8xdouble_zero_masked_shuff_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[6,7,0,1],mem[0,1,0,1] sched: [10:1.00]		; SKX-NEXT: vshuff64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[6,7,0,1],mem[0,1,0,1] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 6, i32 7, i32 0, i32 1, i32 8, i32 9, i32 8, i32 9>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 6, i32 7, i32 0, i32 1, i32 8, i32 9, i32 8, i32 9>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_8xdouble_masked_shuff_mem_mask1(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_masked_shuff_mem_mask1(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_masked_shuff_mem_mask1:		; GENERIC-LABEL: test_8xdouble_masked_shuff_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff64x2 {{.*#+}} zmm1 {%k1} = zmm0[6,7,6,7],mem[0,1,2,3] sched: [5:1.00]		; GENERIC-NEXT: vshuff64x2 {{.*#+}} zmm1 {%k1} = zmm0[6,7,6,7],mem[0,1,2,3] sched: [6:1.00]
; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_masked_shuff_mem_mask1:		; SKX-LABEL: test_8xdouble_masked_shuff_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff64x2 {{.*#+}} zmm1 {%k1} = zmm0[6,7,6,7],mem[0,1,2,3] sched: [10:1.00]		; SKX-NEXT: vshuff64x2 {{.*#+}} zmm1 {%k1} = zmm0[6,7,6,7],mem[0,1,2,3] sched: [10:1.00]
; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 6, i32 7, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 6, i32 7, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_8xdouble_zero_masked_shuff_mem_mask1(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_zero_masked_shuff_mem_mask1(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_zero_masked_shuff_mem_mask1:		; GENERIC-LABEL: test_8xdouble_zero_masked_shuff_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[6,7,6,7],mem[0,1,2,3] sched: [5:1.00]		; GENERIC-NEXT: vshuff64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[6,7,6,7],mem[0,1,2,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_zero_masked_shuff_mem_mask1:		; SKX-LABEL: test_8xdouble_zero_masked_shuff_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[6,7,6,7],mem[0,1,2,3] sched: [10:1.00]		; SKX-NEXT: vshuff64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[6,7,6,7],mem[0,1,2,3] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 6, i32 7, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 6, i32 7, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_8xdouble_masked_shuff_mem_mask2(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_masked_shuff_mem_mask2(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_masked_shuff_mem_mask2:		; GENERIC-LABEL: test_8xdouble_masked_shuff_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff64x2 {{.*#+}} zmm1 {%k1} = zmm0[0,1,2,3],mem[0,1,4,5] sched: [5:1.00]		; GENERIC-NEXT: vshuff64x2 {{.*#+}} zmm1 {%k1} = zmm0[0,1,2,3],mem[0,1,4,5] sched: [6:1.00]
; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_masked_shuff_mem_mask2:		; SKX-LABEL: test_8xdouble_masked_shuff_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff64x2 {{.*#+}} zmm1 {%k1} = zmm0[0,1,2,3],mem[0,1,4,5] sched: [10:1.00]		; SKX-NEXT: vshuff64x2 {{.*#+}} zmm1 {%k1} = zmm0[0,1,2,3],mem[0,1,4,5] sched: [10:1.00]
; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 8, i32 9, i32 12, i32 13>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 8, i32 9, i32 12, i32 13>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_8xdouble_zero_masked_shuff_mem_mask2(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_zero_masked_shuff_mem_mask2(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_zero_masked_shuff_mem_mask2:		; GENERIC-LABEL: test_8xdouble_zero_masked_shuff_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[0,1,2,3],mem[0,1,4,5] sched: [5:1.00]		; GENERIC-NEXT: vshuff64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[0,1,2,3],mem[0,1,4,5] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_zero_masked_shuff_mem_mask2:		; SKX-LABEL: test_8xdouble_zero_masked_shuff_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[0,1,2,3],mem[0,1,4,5] sched: [10:1.00]		; SKX-NEXT: vshuff64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[0,1,2,3],mem[0,1,4,5] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 8, i32 9, i32 12, i32 13>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 8, i32 9, i32 12, i32 13>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_8xdouble_shuff_mem_mask3(<8 x double> %vec1, <8 x double>* %vec2p) {		define <8 x double> @test_8xdouble_shuff_mem_mask3(<8 x double> %vec1, <8 x double>* %vec2p) {
; GENERIC-LABEL: test_8xdouble_shuff_mem_mask3:		; GENERIC-LABEL: test_8xdouble_shuff_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vshuff64x2 {{.*#+}} zmm0 = zmm0[2,3,0,1],mem[4,5,0,1] sched: [5:1.00]		; GENERIC-NEXT: vshuff64x2 {{.*#+}} zmm0 = zmm0[2,3,0,1],mem[4,5,0,1] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_shuff_mem_mask3:		; SKX-LABEL: test_8xdouble_shuff_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vshuff64x2 {{.*#+}} zmm0 = zmm0[2,3,0,1],mem[4,5,0,1] sched: [10:1.00]		; SKX-NEXT: vshuff64x2 {{.*#+}} zmm0 = zmm0[2,3,0,1],mem[4,5,0,1] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%res = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 2, i32 3, i32 0, i32 1, i32 12, i32 13, i32 8, i32 9>		%res = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 2, i32 3, i32 0, i32 1, i32 12, i32 13, i32 8, i32 9>
ret <8 x double> %res		ret <8 x double> %res
}		}
define <8 x double> @test_8xdouble_masked_shuff_mem_mask3(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_masked_shuff_mem_mask3(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_masked_shuff_mem_mask3:		; GENERIC-LABEL: test_8xdouble_masked_shuff_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff64x2 {{.*#+}} zmm1 {%k1} = zmm0[2,3,0,1],mem[4,5,0,1] sched: [5:1.00]		; GENERIC-NEXT: vshuff64x2 {{.*#+}} zmm1 {%k1} = zmm0[2,3,0,1],mem[4,5,0,1] sched: [6:1.00]
; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_masked_shuff_mem_mask3:		; SKX-LABEL: test_8xdouble_masked_shuff_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff64x2 {{.*#+}} zmm1 {%k1} = zmm0[2,3,0,1],mem[4,5,0,1] sched: [10:1.00]		; SKX-NEXT: vshuff64x2 {{.*#+}} zmm1 {%k1} = zmm0[2,3,0,1],mem[4,5,0,1] sched: [10:1.00]
; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 2, i32 3, i32 0, i32 1, i32 12, i32 13, i32 8, i32 9>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 2, i32 3, i32 0, i32 1, i32 12, i32 13, i32 8, i32 9>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_8xdouble_zero_masked_shuff_mem_mask3(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_zero_masked_shuff_mem_mask3(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_zero_masked_shuff_mem_mask3:		; GENERIC-LABEL: test_8xdouble_zero_masked_shuff_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshuff64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[2,3,0,1],mem[4,5,0,1] sched: [5:1.00]		; GENERIC-NEXT: vshuff64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[2,3,0,1],mem[4,5,0,1] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_zero_masked_shuff_mem_mask3:		; SKX-LABEL: test_8xdouble_zero_masked_shuff_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshuff64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[2,3,0,1],mem[4,5,0,1] sched: [10:1.00]		; SKX-NEXT: vshuff64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[2,3,0,1],mem[4,5,0,1] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
▲ Show 20 Lines • Show All 175 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <8 x i32> %vec1, <8 x i32> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>		%shuf = shufflevector <8 x i32> %vec1, <8 x i32> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> zeroinitializer
ret <8 x i32> %res		ret <8 x i32> %res
}		}
define <8 x i32> @test_8xi32_shuff_mem_mask0(<8 x i32> %vec1, <8 x i32>* %vec2p) {		define <8 x i32> @test_8xi32_shuff_mem_mask0(<8 x i32> %vec1, <8 x i32>* %vec2p) {
; GENERIC-LABEL: test_8xi32_shuff_mem_mask0:		; GENERIC-LABEL: test_8xi32_shuff_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vperm2i128 {{.*#+}} ymm0 = ymm0[2,3],mem[2,3] sched: [5:1.00]		; GENERIC-NEXT: vperm2i128 {{.*#+}} ymm0 = ymm0[2,3],mem[2,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi32_shuff_mem_mask0:		; SKX-LABEL: test_8xi32_shuff_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vperm2i128 {{.*#+}} ymm0 = ymm0[2,3],mem[2,3] sched: [10:1.00]		; SKX-NEXT: vperm2i128 {{.*#+}} ymm0 = ymm0[2,3],mem[2,3] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x i32>, <8 x i32>* %vec2p		%vec2 = load <8 x i32>, <8 x i32>* %vec2p
%res = shufflevector <8 x i32> %vec1, <8 x i32> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 12, i32 13, i32 14, i32 15>		%res = shufflevector <8 x i32> %vec1, <8 x i32> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 12, i32 13, i32 14, i32 15>
ret <8 x i32> %res		ret <8 x i32> %res
}		}
define <8 x i32> @test_8xi32_masked_shuff_mem_mask0(<8 x i32> %vec1, <8 x i32>* %vec2p, <8 x i32> %vec3, <8 x i32> %mask) {		define <8 x i32> @test_8xi32_masked_shuff_mem_mask0(<8 x i32> %vec1, <8 x i32>* %vec2p, <8 x i32> %vec3, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xi32_masked_shuff_mem_mask0:		; GENERIC-LABEL: test_8xi32_masked_shuff_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [5:1.00]		; GENERIC-NEXT: vshufi32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi32_masked_shuff_mem_mask0:		; SKX-LABEL: test_8xi32_masked_shuff_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [10:1.00]		; SKX-NEXT: vshufi32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [10:1.00]
; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x i32>, <8 x i32>* %vec2p		%vec2 = load <8 x i32>, <8 x i32>* %vec2p
%shuf = shufflevector <8 x i32> %vec1, <8 x i32> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 12, i32 13, i32 14, i32 15>		%shuf = shufflevector <8 x i32> %vec1, <8 x i32> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 12, i32 13, i32 14, i32 15>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec3		%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec3
ret <8 x i32> %res		ret <8 x i32> %res
}		}

define <8 x i32> @test_8xi32_zero_masked_shuff_mem_mask0(<8 x i32> %vec1, <8 x i32>* %vec2p, <8 x i32> %mask) {		define <8 x i32> @test_8xi32_zero_masked_shuff_mem_mask0(<8 x i32> %vec1, <8 x i32>* %vec2p, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xi32_zero_masked_shuff_mem_mask0:		; GENERIC-LABEL: test_8xi32_zero_masked_shuff_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [5:1.00]		; GENERIC-NEXT: vshufi32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi32_zero_masked_shuff_mem_mask0:		; SKX-LABEL: test_8xi32_zero_masked_shuff_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [10:1.00]		; SKX-NEXT: vshufi32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[4,5,6,7] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x i32>, <8 x i32>* %vec2p		%vec2 = load <8 x i32>, <8 x i32>* %vec2p
%shuf = shufflevector <8 x i32> %vec1, <8 x i32> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 12, i32 13, i32 14, i32 15>		%shuf = shufflevector <8 x i32> %vec1, <8 x i32> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 12, i32 13, i32 14, i32 15>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> zeroinitializer
ret <8 x i32> %res		ret <8 x i32> %res
}		}

define <8 x i32> @test_8xi32_masked_shuff_mem_mask1(<8 x i32> %vec1, <8 x i32>* %vec2p, <8 x i32> %vec3, <8 x i32> %mask) {		define <8 x i32> @test_8xi32_masked_shuff_mem_mask1(<8 x i32> %vec1, <8 x i32>* %vec2p, <8 x i32> %vec3, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xi32_masked_shuff_mem_mask1:		; GENERIC-LABEL: test_8xi32_masked_shuff_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [5:1.00]		; GENERIC-NEXT: vshufi32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi32_masked_shuff_mem_mask1:		; SKX-LABEL: test_8xi32_masked_shuff_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [10:1.00]		; SKX-NEXT: vshufi32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [10:1.00]
; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x i32>, <8 x i32>* %vec2p		%vec2 = load <8 x i32>, <8 x i32>* %vec2p
%shuf = shufflevector <8 x i32> %vec1, <8 x i32> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>		%shuf = shufflevector <8 x i32> %vec1, <8 x i32> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec3		%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec3
ret <8 x i32> %res		ret <8 x i32> %res
}		}

define <8 x i32> @test_8xi32_zero_masked_shuff_mem_mask1(<8 x i32> %vec1, <8 x i32>* %vec2p, <8 x i32> %mask) {		define <8 x i32> @test_8xi32_zero_masked_shuff_mem_mask1(<8 x i32> %vec1, <8 x i32>* %vec2p, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xi32_zero_masked_shuff_mem_mask1:		; GENERIC-LABEL: test_8xi32_zero_masked_shuff_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [5:1.00]		; GENERIC-NEXT: vshufi32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi32_zero_masked_shuff_mem_mask1:		; SKX-LABEL: test_8xi32_zero_masked_shuff_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [10:1.00]		; SKX-NEXT: vshufi32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x i32>, <8 x i32>* %vec2p		%vec2 = load <8 x i32>, <8 x i32>* %vec2p
%shuf = shufflevector <8 x i32> %vec1, <8 x i32> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>		%shuf = shufflevector <8 x i32> %vec1, <8 x i32> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> zeroinitializer
ret <8 x i32> %res		ret <8 x i32> %res
}		}

define <8 x i32> @test_8xi32_masked_shuff_mem_mask2(<8 x i32> %vec1, <8 x i32>* %vec2p, <8 x i32> %vec3, <8 x i32> %mask) {		define <8 x i32> @test_8xi32_masked_shuff_mem_mask2(<8 x i32> %vec1, <8 x i32>* %vec2p, <8 x i32> %vec3, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xi32_masked_shuff_mem_mask2:		; GENERIC-LABEL: test_8xi32_masked_shuff_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [5:1.00]		; GENERIC-NEXT: vshufi32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi32_masked_shuff_mem_mask2:		; SKX-LABEL: test_8xi32_masked_shuff_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [10:1.00]		; SKX-NEXT: vshufi32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [10:1.00]
; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x i32>, <8 x i32>* %vec2p		%vec2 = load <8 x i32>, <8 x i32>* %vec2p
%shuf = shufflevector <8 x i32> %vec1, <8 x i32> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>		%shuf = shufflevector <8 x i32> %vec1, <8 x i32> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec3		%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec3
ret <8 x i32> %res		ret <8 x i32> %res
}		}

define <8 x i32> @test_8xi32_zero_masked_shuff_mem_mask2(<8 x i32> %vec1, <8 x i32>* %vec2p, <8 x i32> %mask) {		define <8 x i32> @test_8xi32_zero_masked_shuff_mem_mask2(<8 x i32> %vec1, <8 x i32>* %vec2p, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xi32_zero_masked_shuff_mem_mask2:		; GENERIC-LABEL: test_8xi32_zero_masked_shuff_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [5:1.00]		; GENERIC-NEXT: vshufi32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi32_zero_masked_shuff_mem_mask2:		; SKX-LABEL: test_8xi32_zero_masked_shuff_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [10:1.00]		; SKX-NEXT: vshufi32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x i32>, <8 x i32>* %vec2p		%vec2 = load <8 x i32>, <8 x i32>* %vec2p
%shuf = shufflevector <8 x i32> %vec1, <8 x i32> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>		%shuf = shufflevector <8 x i32> %vec1, <8 x i32> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> zeroinitializer
ret <8 x i32> %res		ret <8 x i32> %res
}		}

define <8 x i32> @test_8xi32_shuff_mem_mask3(<8 x i32> %vec1, <8 x i32>* %vec2p) {		define <8 x i32> @test_8xi32_shuff_mem_mask3(<8 x i32> %vec1, <8 x i32>* %vec2p) {
; GENERIC-LABEL: test_8xi32_shuff_mem_mask3:		; GENERIC-LABEL: test_8xi32_shuff_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vperm2i128 {{.*#+}} ymm0 = ymm0[2,3],mem[0,1] sched: [5:1.00]		; GENERIC-NEXT: vperm2i128 {{.*#+}} ymm0 = ymm0[2,3],mem[0,1] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi32_shuff_mem_mask3:		; SKX-LABEL: test_8xi32_shuff_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vperm2i128 {{.*#+}} ymm0 = ymm0[2,3],mem[0,1] sched: [10:1.00]		; SKX-NEXT: vperm2i128 {{.*#+}} ymm0 = ymm0[2,3],mem[0,1] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x i32>, <8 x i32>* %vec2p		%vec2 = load <8 x i32>, <8 x i32>* %vec2p
%res = shufflevector <8 x i32> %vec1, <8 x i32> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>		%res = shufflevector <8 x i32> %vec1, <8 x i32> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>
ret <8 x i32> %res		ret <8 x i32> %res
}		}
define <8 x i32> @test_8xi32_masked_shuff_mem_mask3(<8 x i32> %vec1, <8 x i32>* %vec2p, <8 x i32> %vec3, <8 x i32> %mask) {		define <8 x i32> @test_8xi32_masked_shuff_mem_mask3(<8 x i32> %vec1, <8 x i32>* %vec2p, <8 x i32> %vec3, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xi32_masked_shuff_mem_mask3:		; GENERIC-LABEL: test_8xi32_masked_shuff_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [5:1.00]		; GENERIC-NEXT: vshufi32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi32_masked_shuff_mem_mask3:		; SKX-LABEL: test_8xi32_masked_shuff_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [10:1.00]		; SKX-NEXT: vshufi32x4 {{.*#+}} ymm1 {%k1} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [10:1.00]
; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x i32>, <8 x i32>* %vec2p		%vec2 = load <8 x i32>, <8 x i32>* %vec2p
%shuf = shufflevector <8 x i32> %vec1, <8 x i32> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>		%shuf = shufflevector <8 x i32> %vec1, <8 x i32> %vec2, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec3		%res = select <8 x i1> %cmp, <8 x i32> %shuf, <8 x i32> %vec3
ret <8 x i32> %res		ret <8 x i32> %res
}		}

define <8 x i32> @test_8xi32_zero_masked_shuff_mem_mask3(<8 x i32> %vec1, <8 x i32>* %vec2p, <8 x i32> %mask) {		define <8 x i32> @test_8xi32_zero_masked_shuff_mem_mask3(<8 x i32> %vec1, <8 x i32>* %vec2p, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xi32_zero_masked_shuff_mem_mask3:		; GENERIC-LABEL: test_8xi32_zero_masked_shuff_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [5:1.00]		; GENERIC-NEXT: vshufi32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi32_zero_masked_shuff_mem_mask3:		; SKX-LABEL: test_8xi32_zero_masked_shuff_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [10:1.00]		; SKX-NEXT: vshufi32x4 {{.*#+}} ymm0 {%k1} {z} = ymm0[4,5,6,7],mem[0,1,2,3] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x i32>, <8 x i32>* %vec2p		%vec2 = load <8 x i32>, <8 x i32>* %vec2p
▲ Show 20 Lines • Show All 175 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <16 x i32> %vec1, <16 x i32> %vec2, <16 x i32> <i32 4, i32 5, i32 6, i32 7, i32 0, i32 1, i32 2, i32 3, i32 24, i32 25, i32 26, i32 27, i32 20, i32 21, i32 22, i32 23>		%shuf = shufflevector <16 x i32> %vec1, <16 x i32> %vec2, <16 x i32> <i32 4, i32 5, i32 6, i32 7, i32 0, i32 1, i32 2, i32 3, i32 24, i32 25, i32 26, i32 27, i32 20, i32 21, i32 22, i32 23>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer
ret <16 x i32> %res		ret <16 x i32> %res
}		}
define <16 x i32> @test_16xi32_shuff_mem_mask0(<16 x i32> %vec1, <16 x i32>* %vec2p) {		define <16 x i32> @test_16xi32_shuff_mem_mask0(<16 x i32> %vec1, <16 x i32>* %vec2p) {
; GENERIC-LABEL: test_16xi32_shuff_mem_mask0:		; GENERIC-LABEL: test_16xi32_shuff_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vshufi32x4 {{.*#+}} zmm0 = zmm0[8,9,10,11,4,5,6,7],mem[8,9,10,11,0,1,2,3] sched: [5:1.00]		; GENERIC-NEXT: vshufi32x4 {{.*#+}} zmm0 = zmm0[8,9,10,11,4,5,6,7],mem[8,9,10,11,0,1,2,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xi32_shuff_mem_mask0:		; SKX-LABEL: test_16xi32_shuff_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vshufi32x4 {{.*#+}} zmm0 = zmm0[8,9,10,11,4,5,6,7],mem[8,9,10,11,0,1,2,3] sched: [10:1.00]		; SKX-NEXT: vshufi32x4 {{.*#+}} zmm0 = zmm0[8,9,10,11,4,5,6,7],mem[8,9,10,11,0,1,2,3] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x i32>, <16 x i32>* %vec2p		%vec2 = load <16 x i32>, <16 x i32>* %vec2p
%res = shufflevector <16 x i32> %vec1, <16 x i32> %vec2, <16 x i32> <i32 8, i32 9, i32 10, i32 11, i32 4, i32 5, i32 6, i32 7, i32 24, i32 25, i32 26, i32 27, i32 16, i32 17, i32 18, i32 19>		%res = shufflevector <16 x i32> %vec1, <16 x i32> %vec2, <16 x i32> <i32 8, i32 9, i32 10, i32 11, i32 4, i32 5, i32 6, i32 7, i32 24, i32 25, i32 26, i32 27, i32 16, i32 17, i32 18, i32 19>
ret <16 x i32> %res		ret <16 x i32> %res
}		}
define <16 x i32> @test_16xi32_masked_shuff_mem_mask0(<16 x i32> %vec1, <16 x i32>* %vec2p, <16 x i32> %vec3, <16 x i32> %mask) {		define <16 x i32> @test_16xi32_masked_shuff_mem_mask0(<16 x i32> %vec1, <16 x i32>* %vec2p, <16 x i32> %vec3, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xi32_masked_shuff_mem_mask0:		; GENERIC-LABEL: test_16xi32_masked_shuff_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi32x4 {{.*#+}} zmm1 {%k1} = zmm0[8,9,10,11,4,5,6,7],mem[8,9,10,11,0,1,2,3] sched: [5:1.00]		; GENERIC-NEXT: vshufi32x4 {{.*#+}} zmm1 {%k1} = zmm0[8,9,10,11,4,5,6,7],mem[8,9,10,11,0,1,2,3] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xi32_masked_shuff_mem_mask0:		; SKX-LABEL: test_16xi32_masked_shuff_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi32x4 {{.*#+}} zmm1 {%k1} = zmm0[8,9,10,11,4,5,6,7],mem[8,9,10,11,0,1,2,3] sched: [10:1.00]		; SKX-NEXT: vshufi32x4 {{.*#+}} zmm1 {%k1} = zmm0[8,9,10,11,4,5,6,7],mem[8,9,10,11,0,1,2,3] sched: [10:1.00]
; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x i32>, <16 x i32>* %vec2p		%vec2 = load <16 x i32>, <16 x i32>* %vec2p
%shuf = shufflevector <16 x i32> %vec1, <16 x i32> %vec2, <16 x i32> <i32 8, i32 9, i32 10, i32 11, i32 4, i32 5, i32 6, i32 7, i32 24, i32 25, i32 26, i32 27, i32 16, i32 17, i32 18, i32 19>		%shuf = shufflevector <16 x i32> %vec1, <16 x i32> %vec2, <16 x i32> <i32 8, i32 9, i32 10, i32 11, i32 4, i32 5, i32 6, i32 7, i32 24, i32 25, i32 26, i32 27, i32 16, i32 17, i32 18, i32 19>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec3		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec3
ret <16 x i32> %res		ret <16 x i32> %res
}		}

define <16 x i32> @test_16xi32_zero_masked_shuff_mem_mask0(<16 x i32> %vec1, <16 x i32>* %vec2p, <16 x i32> %mask) {		define <16 x i32> @test_16xi32_zero_masked_shuff_mem_mask0(<16 x i32> %vec1, <16 x i32>* %vec2p, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xi32_zero_masked_shuff_mem_mask0:		; GENERIC-LABEL: test_16xi32_zero_masked_shuff_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[8,9,10,11,4,5,6,7],mem[8,9,10,11,0,1,2,3] sched: [5:1.00]		; GENERIC-NEXT: vshufi32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[8,9,10,11,4,5,6,7],mem[8,9,10,11,0,1,2,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xi32_zero_masked_shuff_mem_mask0:		; SKX-LABEL: test_16xi32_zero_masked_shuff_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[8,9,10,11,4,5,6,7],mem[8,9,10,11,0,1,2,3] sched: [10:1.00]		; SKX-NEXT: vshufi32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[8,9,10,11,4,5,6,7],mem[8,9,10,11,0,1,2,3] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x i32>, <16 x i32>* %vec2p		%vec2 = load <16 x i32>, <16 x i32>* %vec2p
%shuf = shufflevector <16 x i32> %vec1, <16 x i32> %vec2, <16 x i32> <i32 8, i32 9, i32 10, i32 11, i32 4, i32 5, i32 6, i32 7, i32 24, i32 25, i32 26, i32 27, i32 16, i32 17, i32 18, i32 19>		%shuf = shufflevector <16 x i32> %vec1, <16 x i32> %vec2, <16 x i32> <i32 8, i32 9, i32 10, i32 11, i32 4, i32 5, i32 6, i32 7, i32 24, i32 25, i32 26, i32 27, i32 16, i32 17, i32 18, i32 19>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer
ret <16 x i32> %res		ret <16 x i32> %res
}		}

define <16 x i32> @test_16xi32_masked_shuff_mem_mask1(<16 x i32> %vec1, <16 x i32>* %vec2p, <16 x i32> %vec3, <16 x i32> %mask) {		define <16 x i32> @test_16xi32_masked_shuff_mem_mask1(<16 x i32> %vec1, <16 x i32>* %vec2p, <16 x i32> %vec3, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xi32_masked_shuff_mem_mask1:		; GENERIC-LABEL: test_16xi32_masked_shuff_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi32x4 {{.*#+}} zmm1 {%k1} = zmm0[4,5,6,7,4,5,6,7],mem[0,1,2,3,8,9,10,11] sched: [5:1.00]		; GENERIC-NEXT: vshufi32x4 {{.*#+}} zmm1 {%k1} = zmm0[4,5,6,7,4,5,6,7],mem[0,1,2,3,8,9,10,11] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xi32_masked_shuff_mem_mask1:		; SKX-LABEL: test_16xi32_masked_shuff_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi32x4 {{.*#+}} zmm1 {%k1} = zmm0[4,5,6,7,4,5,6,7],mem[0,1,2,3,8,9,10,11] sched: [10:1.00]		; SKX-NEXT: vshufi32x4 {{.*#+}} zmm1 {%k1} = zmm0[4,5,6,7,4,5,6,7],mem[0,1,2,3,8,9,10,11] sched: [10:1.00]
; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x i32>, <16 x i32>* %vec2p		%vec2 = load <16 x i32>, <16 x i32>* %vec2p
%shuf = shufflevector <16 x i32> %vec1, <16 x i32> %vec2, <16 x i32> <i32 4, i32 5, i32 6, i32 7, i32 4, i32 5, i32 6, i32 7, i32 16, i32 17, i32 18, i32 19, i32 24, i32 25, i32 26, i32 27>		%shuf = shufflevector <16 x i32> %vec1, <16 x i32> %vec2, <16 x i32> <i32 4, i32 5, i32 6, i32 7, i32 4, i32 5, i32 6, i32 7, i32 16, i32 17, i32 18, i32 19, i32 24, i32 25, i32 26, i32 27>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec3		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec3
ret <16 x i32> %res		ret <16 x i32> %res
}		}

define <16 x i32> @test_16xi32_zero_masked_shuff_mem_mask1(<16 x i32> %vec1, <16 x i32>* %vec2p, <16 x i32> %mask) {		define <16 x i32> @test_16xi32_zero_masked_shuff_mem_mask1(<16 x i32> %vec1, <16 x i32>* %vec2p, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xi32_zero_masked_shuff_mem_mask1:		; GENERIC-LABEL: test_16xi32_zero_masked_shuff_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[4,5,6,7,4,5,6,7],mem[0,1,2,3,8,9,10,11] sched: [5:1.00]		; GENERIC-NEXT: vshufi32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[4,5,6,7,4,5,6,7],mem[0,1,2,3,8,9,10,11] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xi32_zero_masked_shuff_mem_mask1:		; SKX-LABEL: test_16xi32_zero_masked_shuff_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[4,5,6,7,4,5,6,7],mem[0,1,2,3,8,9,10,11] sched: [10:1.00]		; SKX-NEXT: vshufi32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[4,5,6,7,4,5,6,7],mem[0,1,2,3,8,9,10,11] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x i32>, <16 x i32>* %vec2p		%vec2 = load <16 x i32>, <16 x i32>* %vec2p
%shuf = shufflevector <16 x i32> %vec1, <16 x i32> %vec2, <16 x i32> <i32 4, i32 5, i32 6, i32 7, i32 4, i32 5, i32 6, i32 7, i32 16, i32 17, i32 18, i32 19, i32 24, i32 25, i32 26, i32 27>		%shuf = shufflevector <16 x i32> %vec1, <16 x i32> %vec2, <16 x i32> <i32 4, i32 5, i32 6, i32 7, i32 4, i32 5, i32 6, i32 7, i32 16, i32 17, i32 18, i32 19, i32 24, i32 25, i32 26, i32 27>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer
ret <16 x i32> %res		ret <16 x i32> %res
}		}

define <16 x i32> @test_16xi32_masked_shuff_mem_mask2(<16 x i32> %vec1, <16 x i32>* %vec2p, <16 x i32> %vec3, <16 x i32> %mask) {		define <16 x i32> @test_16xi32_masked_shuff_mem_mask2(<16 x i32> %vec1, <16 x i32>* %vec2p, <16 x i32> %vec3, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xi32_masked_shuff_mem_mask2:		; GENERIC-LABEL: test_16xi32_masked_shuff_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi32x4 {{.*#+}} zmm1 {%k1} = zmm0[4,5,6,7,8,9,10,11],mem[12,13,14,15,12,13,14,15] sched: [5:1.00]		; GENERIC-NEXT: vshufi32x4 {{.*#+}} zmm1 {%k1} = zmm0[4,5,6,7,8,9,10,11],mem[12,13,14,15,12,13,14,15] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xi32_masked_shuff_mem_mask2:		; SKX-LABEL: test_16xi32_masked_shuff_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi32x4 {{.*#+}} zmm1 {%k1} = zmm0[4,5,6,7,8,9,10,11],mem[12,13,14,15,12,13,14,15] sched: [10:1.00]		; SKX-NEXT: vshufi32x4 {{.*#+}} zmm1 {%k1} = zmm0[4,5,6,7,8,9,10,11],mem[12,13,14,15,12,13,14,15] sched: [10:1.00]
; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x i32>, <16 x i32>* %vec2p		%vec2 = load <16 x i32>, <16 x i32>* %vec2p
%shuf = shufflevector <16 x i32> %vec1, <16 x i32> %vec2, <16 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 28, i32 29, i32 30, i32 31, i32 28, i32 29, i32 30, i32 31>		%shuf = shufflevector <16 x i32> %vec1, <16 x i32> %vec2, <16 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 28, i32 29, i32 30, i32 31, i32 28, i32 29, i32 30, i32 31>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec3		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec3
ret <16 x i32> %res		ret <16 x i32> %res
}		}

define <16 x i32> @test_16xi32_zero_masked_shuff_mem_mask2(<16 x i32> %vec1, <16 x i32>* %vec2p, <16 x i32> %mask) {		define <16 x i32> @test_16xi32_zero_masked_shuff_mem_mask2(<16 x i32> %vec1, <16 x i32>* %vec2p, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xi32_zero_masked_shuff_mem_mask2:		; GENERIC-LABEL: test_16xi32_zero_masked_shuff_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[4,5,6,7,8,9,10,11],mem[12,13,14,15,12,13,14,15] sched: [5:1.00]		; GENERIC-NEXT: vshufi32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[4,5,6,7,8,9,10,11],mem[12,13,14,15,12,13,14,15] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xi32_zero_masked_shuff_mem_mask2:		; SKX-LABEL: test_16xi32_zero_masked_shuff_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[4,5,6,7,8,9,10,11],mem[12,13,14,15,12,13,14,15] sched: [10:1.00]		; SKX-NEXT: vshufi32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[4,5,6,7,8,9,10,11],mem[12,13,14,15,12,13,14,15] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x i32>, <16 x i32>* %vec2p		%vec2 = load <16 x i32>, <16 x i32>* %vec2p
%shuf = shufflevector <16 x i32> %vec1, <16 x i32> %vec2, <16 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 28, i32 29, i32 30, i32 31, i32 28, i32 29, i32 30, i32 31>		%shuf = shufflevector <16 x i32> %vec1, <16 x i32> %vec2, <16 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 28, i32 29, i32 30, i32 31, i32 28, i32 29, i32 30, i32 31>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> zeroinitializer
ret <16 x i32> %res		ret <16 x i32> %res
}		}

define <16 x i32> @test_16xi32_shuff_mem_mask3(<16 x i32> %vec1, <16 x i32>* %vec2p) {		define <16 x i32> @test_16xi32_shuff_mem_mask3(<16 x i32> %vec1, <16 x i32>* %vec2p) {
; GENERIC-LABEL: test_16xi32_shuff_mem_mask3:		; GENERIC-LABEL: test_16xi32_shuff_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vshufi32x4 {{.*#+}} zmm0 = zmm0[4,5,6,7,4,5,6,7],mem[4,5,6,7,12,13,14,15] sched: [5:1.00]		; GENERIC-NEXT: vshufi32x4 {{.*#+}} zmm0 = zmm0[4,5,6,7,4,5,6,7],mem[4,5,6,7,12,13,14,15] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xi32_shuff_mem_mask3:		; SKX-LABEL: test_16xi32_shuff_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vshufi32x4 {{.*#+}} zmm0 = zmm0[4,5,6,7,4,5,6,7],mem[4,5,6,7,12,13,14,15] sched: [10:1.00]		; SKX-NEXT: vshufi32x4 {{.*#+}} zmm0 = zmm0[4,5,6,7,4,5,6,7],mem[4,5,6,7,12,13,14,15] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x i32>, <16 x i32>* %vec2p		%vec2 = load <16 x i32>, <16 x i32>* %vec2p
%res = shufflevector <16 x i32> %vec1, <16 x i32> %vec2, <16 x i32> <i32 4, i32 5, i32 6, i32 7, i32 4, i32 5, i32 6, i32 7, i32 20, i32 21, i32 22, i32 23, i32 28, i32 29, i32 30, i32 31>		%res = shufflevector <16 x i32> %vec1, <16 x i32> %vec2, <16 x i32> <i32 4, i32 5, i32 6, i32 7, i32 4, i32 5, i32 6, i32 7, i32 20, i32 21, i32 22, i32 23, i32 28, i32 29, i32 30, i32 31>
ret <16 x i32> %res		ret <16 x i32> %res
}		}
define <16 x i32> @test_16xi32_masked_shuff_mem_mask3(<16 x i32> %vec1, <16 x i32>* %vec2p, <16 x i32> %vec3, <16 x i32> %mask) {		define <16 x i32> @test_16xi32_masked_shuff_mem_mask3(<16 x i32> %vec1, <16 x i32>* %vec2p, <16 x i32> %vec3, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xi32_masked_shuff_mem_mask3:		; GENERIC-LABEL: test_16xi32_masked_shuff_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi32x4 {{.*#+}} zmm1 {%k1} = zmm0[4,5,6,7,4,5,6,7],mem[4,5,6,7,12,13,14,15] sched: [5:1.00]		; GENERIC-NEXT: vshufi32x4 {{.*#+}} zmm1 {%k1} = zmm0[4,5,6,7,4,5,6,7],mem[4,5,6,7,12,13,14,15] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xi32_masked_shuff_mem_mask3:		; SKX-LABEL: test_16xi32_masked_shuff_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi32x4 {{.*#+}} zmm1 {%k1} = zmm0[4,5,6,7,4,5,6,7],mem[4,5,6,7,12,13,14,15] sched: [10:1.00]		; SKX-NEXT: vshufi32x4 {{.*#+}} zmm1 {%k1} = zmm0[4,5,6,7,4,5,6,7],mem[4,5,6,7,12,13,14,15] sched: [10:1.00]
; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x i32>, <16 x i32>* %vec2p		%vec2 = load <16 x i32>, <16 x i32>* %vec2p
%shuf = shufflevector <16 x i32> %vec1, <16 x i32> %vec2, <16 x i32> <i32 4, i32 5, i32 6, i32 7, i32 4, i32 5, i32 6, i32 7, i32 20, i32 21, i32 22, i32 23, i32 28, i32 29, i32 30, i32 31>		%shuf = shufflevector <16 x i32> %vec1, <16 x i32> %vec2, <16 x i32> <i32 4, i32 5, i32 6, i32 7, i32 4, i32 5, i32 6, i32 7, i32 20, i32 21, i32 22, i32 23, i32 28, i32 29, i32 30, i32 31>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec3		%res = select <16 x i1> %cmp, <16 x i32> %shuf, <16 x i32> %vec3
ret <16 x i32> %res		ret <16 x i32> %res
}		}

define <16 x i32> @test_16xi32_zero_masked_shuff_mem_mask3(<16 x i32> %vec1, <16 x i32>* %vec2p, <16 x i32> %mask) {		define <16 x i32> @test_16xi32_zero_masked_shuff_mem_mask3(<16 x i32> %vec1, <16 x i32>* %vec2p, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xi32_zero_masked_shuff_mem_mask3:		; GENERIC-LABEL: test_16xi32_zero_masked_shuff_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[4,5,6,7,4,5,6,7],mem[4,5,6,7,12,13,14,15] sched: [5:1.00]		; GENERIC-NEXT: vshufi32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[4,5,6,7,4,5,6,7],mem[4,5,6,7,12,13,14,15] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xi32_zero_masked_shuff_mem_mask3:		; SKX-LABEL: test_16xi32_zero_masked_shuff_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[4,5,6,7,4,5,6,7],mem[4,5,6,7,12,13,14,15] sched: [10:1.00]		; SKX-NEXT: vshufi32x4 {{.*#+}} zmm0 {%k1} {z} = zmm0[4,5,6,7,4,5,6,7],mem[4,5,6,7,12,13,14,15] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x i32>, <16 x i32>* %vec2p		%vec2 = load <16 x i32>, <16 x i32>* %vec2p
▲ Show 20 Lines • Show All 175 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <4 x i64> %vec1, <4 x i64> %vec2, <4 x i32> <i32 2, i32 3, i32 6, i32 7>		%shuf = shufflevector <4 x i64> %vec1, <4 x i64> %vec2, <4 x i32> <i32 2, i32 3, i32 6, i32 7>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> zeroinitializer		%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> zeroinitializer
ret <4 x i64> %res		ret <4 x i64> %res
}		}
define <4 x i64> @test_4xi64_shuff_mem_mask0(<4 x i64> %vec1, <4 x i64>* %vec2p) {		define <4 x i64> @test_4xi64_shuff_mem_mask0(<4 x i64> %vec1, <4 x i64>* %vec2p) {
; GENERIC-LABEL: test_4xi64_shuff_mem_mask0:		; GENERIC-LABEL: test_4xi64_shuff_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vperm2i128 {{.*#+}} ymm0 = ymm0[2,3],mem[2,3] sched: [5:1.00]		; GENERIC-NEXT: vperm2i128 {{.*#+}} ymm0 = ymm0[2,3],mem[2,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xi64_shuff_mem_mask0:		; SKX-LABEL: test_4xi64_shuff_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vperm2i128 {{.*#+}} ymm0 = ymm0[2,3],mem[2,3] sched: [10:1.00]		; SKX-NEXT: vperm2i128 {{.*#+}} ymm0 = ymm0[2,3],mem[2,3] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x i64>, <4 x i64>* %vec2p		%vec2 = load <4 x i64>, <4 x i64>* %vec2p
%res = shufflevector <4 x i64> %vec1, <4 x i64> %vec2, <4 x i32> <i32 2, i32 3, i32 6, i32 7>		%res = shufflevector <4 x i64> %vec1, <4 x i64> %vec2, <4 x i32> <i32 2, i32 3, i32 6, i32 7>
ret <4 x i64> %res		ret <4 x i64> %res
}		}
define <4 x i64> @test_4xi64_masked_shuff_mem_mask0(<4 x i64> %vec1, <4 x i64>* %vec2p, <4 x i64> %vec3, <4 x i64> %mask) {		define <4 x i64> @test_4xi64_masked_shuff_mem_mask0(<4 x i64> %vec1, <4 x i64>* %vec2p, <4 x i64> %vec3, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xi64_masked_shuff_mem_mask0:		; GENERIC-LABEL: test_4xi64_masked_shuff_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[2,3] sched: [5:1.00]		; GENERIC-NEXT: vshufi64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[2,3] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xi64_masked_shuff_mem_mask0:		; SKX-LABEL: test_4xi64_masked_shuff_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[2,3] sched: [10:1.00]		; SKX-NEXT: vshufi64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[2,3] sched: [10:1.00]
; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x i64>, <4 x i64>* %vec2p		%vec2 = load <4 x i64>, <4 x i64>* %vec2p
%shuf = shufflevector <4 x i64> %vec1, <4 x i64> %vec2, <4 x i32> <i32 2, i32 3, i32 6, i32 7>		%shuf = shufflevector <4 x i64> %vec1, <4 x i64> %vec2, <4 x i32> <i32 2, i32 3, i32 6, i32 7>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> %vec3		%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> %vec3
ret <4 x i64> %res		ret <4 x i64> %res
}		}

define <4 x i64> @test_4xi64_zero_masked_shuff_mem_mask0(<4 x i64> %vec1, <4 x i64>* %vec2p, <4 x i64> %mask) {		define <4 x i64> @test_4xi64_zero_masked_shuff_mem_mask0(<4 x i64> %vec1, <4 x i64>* %vec2p, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xi64_zero_masked_shuff_mem_mask0:		; GENERIC-LABEL: test_4xi64_zero_masked_shuff_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[2,3] sched: [5:1.00]		; GENERIC-NEXT: vshufi64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[2,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xi64_zero_masked_shuff_mem_mask0:		; SKX-LABEL: test_4xi64_zero_masked_shuff_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[2,3] sched: [10:1.00]		; SKX-NEXT: vshufi64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[2,3] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x i64>, <4 x i64>* %vec2p		%vec2 = load <4 x i64>, <4 x i64>* %vec2p
%shuf = shufflevector <4 x i64> %vec1, <4 x i64> %vec2, <4 x i32> <i32 2, i32 3, i32 6, i32 7>		%shuf = shufflevector <4 x i64> %vec1, <4 x i64> %vec2, <4 x i32> <i32 2, i32 3, i32 6, i32 7>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> zeroinitializer		%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> zeroinitializer
ret <4 x i64> %res		ret <4 x i64> %res
}		}

define <4 x i64> @test_4xi64_masked_shuff_mem_mask1(<4 x i64> %vec1, <4 x i64>* %vec2p, <4 x i64> %vec3, <4 x i64> %mask) {		define <4 x i64> @test_4xi64_masked_shuff_mem_mask1(<4 x i64> %vec1, <4 x i64>* %vec2p, <4 x i64> %vec3, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xi64_masked_shuff_mem_mask1:		; GENERIC-LABEL: test_4xi64_masked_shuff_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[0,1] sched: [5:1.00]		; GENERIC-NEXT: vshufi64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[0,1] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xi64_masked_shuff_mem_mask1:		; SKX-LABEL: test_4xi64_masked_shuff_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[0,1] sched: [10:1.00]		; SKX-NEXT: vshufi64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[0,1] sched: [10:1.00]
; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x i64>, <4 x i64>* %vec2p		%vec2 = load <4 x i64>, <4 x i64>* %vec2p
%shuf = shufflevector <4 x i64> %vec1, <4 x i64> %vec2, <4 x i32> <i32 2, i32 3, i32 4, i32 5>		%shuf = shufflevector <4 x i64> %vec1, <4 x i64> %vec2, <4 x i32> <i32 2, i32 3, i32 4, i32 5>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> %vec3		%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> %vec3
ret <4 x i64> %res		ret <4 x i64> %res
}		}

define <4 x i64> @test_4xi64_zero_masked_shuff_mem_mask1(<4 x i64> %vec1, <4 x i64>* %vec2p, <4 x i64> %mask) {		define <4 x i64> @test_4xi64_zero_masked_shuff_mem_mask1(<4 x i64> %vec1, <4 x i64>* %vec2p, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xi64_zero_masked_shuff_mem_mask1:		; GENERIC-LABEL: test_4xi64_zero_masked_shuff_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[0,1] sched: [5:1.00]		; GENERIC-NEXT: vshufi64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[0,1] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xi64_zero_masked_shuff_mem_mask1:		; SKX-LABEL: test_4xi64_zero_masked_shuff_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[0,1] sched: [10:1.00]		; SKX-NEXT: vshufi64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[0,1] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x i64>, <4 x i64>* %vec2p		%vec2 = load <4 x i64>, <4 x i64>* %vec2p
%shuf = shufflevector <4 x i64> %vec1, <4 x i64> %vec2, <4 x i32> <i32 2, i32 3, i32 4, i32 5>		%shuf = shufflevector <4 x i64> %vec1, <4 x i64> %vec2, <4 x i32> <i32 2, i32 3, i32 4, i32 5>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> zeroinitializer		%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> zeroinitializer
ret <4 x i64> %res		ret <4 x i64> %res
}		}

define <4 x i64> @test_4xi64_masked_shuff_mem_mask2(<4 x i64> %vec1, <4 x i64>* %vec2p, <4 x i64> %vec3, <4 x i64> %mask) {		define <4 x i64> @test_4xi64_masked_shuff_mem_mask2(<4 x i64> %vec1, <4 x i64>* %vec2p, <4 x i64> %vec3, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xi64_masked_shuff_mem_mask2:		; GENERIC-LABEL: test_4xi64_masked_shuff_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[0,1] sched: [5:1.00]		; GENERIC-NEXT: vshufi64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[0,1] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xi64_masked_shuff_mem_mask2:		; SKX-LABEL: test_4xi64_masked_shuff_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[0,1] sched: [10:1.00]		; SKX-NEXT: vshufi64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[0,1] sched: [10:1.00]
; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x i64>, <4 x i64>* %vec2p		%vec2 = load <4 x i64>, <4 x i64>* %vec2p
%shuf = shufflevector <4 x i64> %vec1, <4 x i64> %vec2, <4 x i32> <i32 2, i32 3, i32 4, i32 5>		%shuf = shufflevector <4 x i64> %vec1, <4 x i64> %vec2, <4 x i32> <i32 2, i32 3, i32 4, i32 5>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> %vec3		%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> %vec3
ret <4 x i64> %res		ret <4 x i64> %res
}		}

define <4 x i64> @test_4xi64_zero_masked_shuff_mem_mask2(<4 x i64> %vec1, <4 x i64>* %vec2p, <4 x i64> %mask) {		define <4 x i64> @test_4xi64_zero_masked_shuff_mem_mask2(<4 x i64> %vec1, <4 x i64>* %vec2p, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xi64_zero_masked_shuff_mem_mask2:		; GENERIC-LABEL: test_4xi64_zero_masked_shuff_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[0,1] sched: [5:1.00]		; GENERIC-NEXT: vshufi64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[0,1] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xi64_zero_masked_shuff_mem_mask2:		; SKX-LABEL: test_4xi64_zero_masked_shuff_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[0,1] sched: [10:1.00]		; SKX-NEXT: vshufi64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[0,1] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x i64>, <4 x i64>* %vec2p		%vec2 = load <4 x i64>, <4 x i64>* %vec2p
%shuf = shufflevector <4 x i64> %vec1, <4 x i64> %vec2, <4 x i32> <i32 2, i32 3, i32 4, i32 5>		%shuf = shufflevector <4 x i64> %vec1, <4 x i64> %vec2, <4 x i32> <i32 2, i32 3, i32 4, i32 5>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> zeroinitializer		%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> zeroinitializer
ret <4 x i64> %res		ret <4 x i64> %res
}		}

define <4 x i64> @test_4xi64_shuff_mem_mask3(<4 x i64> %vec1, <4 x i64>* %vec2p) {		define <4 x i64> @test_4xi64_shuff_mem_mask3(<4 x i64> %vec1, <4 x i64>* %vec2p) {
; GENERIC-LABEL: test_4xi64_shuff_mem_mask3:		; GENERIC-LABEL: test_4xi64_shuff_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vperm2i128 {{.*#+}} ymm0 = ymm0[2,3],mem[2,3] sched: [5:1.00]		; GENERIC-NEXT: vperm2i128 {{.*#+}} ymm0 = ymm0[2,3],mem[2,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xi64_shuff_mem_mask3:		; SKX-LABEL: test_4xi64_shuff_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vperm2i128 {{.*#+}} ymm0 = ymm0[2,3],mem[2,3] sched: [10:1.00]		; SKX-NEXT: vperm2i128 {{.*#+}} ymm0 = ymm0[2,3],mem[2,3] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x i64>, <4 x i64>* %vec2p		%vec2 = load <4 x i64>, <4 x i64>* %vec2p
%res = shufflevector <4 x i64> %vec1, <4 x i64> %vec2, <4 x i32> <i32 2, i32 3, i32 6, i32 7>		%res = shufflevector <4 x i64> %vec1, <4 x i64> %vec2, <4 x i32> <i32 2, i32 3, i32 6, i32 7>
ret <4 x i64> %res		ret <4 x i64> %res
}		}
define <4 x i64> @test_4xi64_masked_shuff_mem_mask3(<4 x i64> %vec1, <4 x i64>* %vec2p, <4 x i64> %vec3, <4 x i64> %mask) {		define <4 x i64> @test_4xi64_masked_shuff_mem_mask3(<4 x i64> %vec1, <4 x i64>* %vec2p, <4 x i64> %vec3, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xi64_masked_shuff_mem_mask3:		; GENERIC-LABEL: test_4xi64_masked_shuff_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[2,3] sched: [5:1.00]		; GENERIC-NEXT: vshufi64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[2,3] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xi64_masked_shuff_mem_mask3:		; SKX-LABEL: test_4xi64_masked_shuff_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[2,3] sched: [10:1.00]		; SKX-NEXT: vshufi64x2 {{.*#+}} ymm1 {%k1} = ymm0[2,3],mem[2,3] sched: [10:1.00]
; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x i64>, <4 x i64>* %vec2p		%vec2 = load <4 x i64>, <4 x i64>* %vec2p
%shuf = shufflevector <4 x i64> %vec1, <4 x i64> %vec2, <4 x i32> <i32 2, i32 3, i32 6, i32 7>		%shuf = shufflevector <4 x i64> %vec1, <4 x i64> %vec2, <4 x i32> <i32 2, i32 3, i32 6, i32 7>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> %vec3		%res = select <4 x i1> %cmp, <4 x i64> %shuf, <4 x i64> %vec3
ret <4 x i64> %res		ret <4 x i64> %res
}		}

define <4 x i64> @test_4xi64_zero_masked_shuff_mem_mask3(<4 x i64> %vec1, <4 x i64>* %vec2p, <4 x i64> %mask) {		define <4 x i64> @test_4xi64_zero_masked_shuff_mem_mask3(<4 x i64> %vec1, <4 x i64>* %vec2p, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xi64_zero_masked_shuff_mem_mask3:		; GENERIC-LABEL: test_4xi64_zero_masked_shuff_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[2,3] sched: [5:1.00]		; GENERIC-NEXT: vshufi64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[2,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xi64_zero_masked_shuff_mem_mask3:		; SKX-LABEL: test_4xi64_zero_masked_shuff_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[2,3] sched: [10:1.00]		; SKX-NEXT: vshufi64x2 {{.*#+}} ymm0 {%k1} {z} = ymm0[2,3],mem[2,3] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x i64>, <4 x i64>* %vec2p		%vec2 = load <4 x i64>, <4 x i64>* %vec2p
▲ Show 20 Lines • Show All 175 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <8 x i64> %vec1, <8 x i64> %vec2, <8 x i32> <i32 2, i32 3, i32 6, i32 7, i32 12, i32 13, i32 10, i32 11>		%shuf = shufflevector <8 x i64> %vec1, <8 x i64> %vec2, <8 x i32> <i32 2, i32 3, i32 6, i32 7, i32 12, i32 13, i32 10, i32 11>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer
ret <8 x i64> %res		ret <8 x i64> %res
}		}
define <8 x i64> @test_8xi64_shuff_mem_mask0(<8 x i64> %vec1, <8 x i64>* %vec2p) {		define <8 x i64> @test_8xi64_shuff_mem_mask0(<8 x i64> %vec1, <8 x i64>* %vec2p) {
; GENERIC-LABEL: test_8xi64_shuff_mem_mask0:		; GENERIC-LABEL: test_8xi64_shuff_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vshufi64x2 {{.*#+}} zmm0 = zmm0[2,3,2,3],mem[4,5,2,3] sched: [5:1.00]		; GENERIC-NEXT: vshufi64x2 {{.*#+}} zmm0 = zmm0[2,3,2,3],mem[4,5,2,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi64_shuff_mem_mask0:		; SKX-LABEL: test_8xi64_shuff_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vshufi64x2 {{.*#+}} zmm0 = zmm0[2,3,2,3],mem[4,5,2,3] sched: [10:1.00]		; SKX-NEXT: vshufi64x2 {{.*#+}} zmm0 = zmm0[2,3,2,3],mem[4,5,2,3] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x i64>, <8 x i64>* %vec2p		%vec2 = load <8 x i64>, <8 x i64>* %vec2p
%res = shufflevector <8 x i64> %vec1, <8 x i64> %vec2, <8 x i32> <i32 2, i32 3, i32 2, i32 3, i32 12, i32 13, i32 10, i32 11>		%res = shufflevector <8 x i64> %vec1, <8 x i64> %vec2, <8 x i32> <i32 2, i32 3, i32 2, i32 3, i32 12, i32 13, i32 10, i32 11>
ret <8 x i64> %res		ret <8 x i64> %res
}		}
define <8 x i64> @test_8xi64_masked_shuff_mem_mask0(<8 x i64> %vec1, <8 x i64>* %vec2p, <8 x i64> %vec3, <8 x i64> %mask) {		define <8 x i64> @test_8xi64_masked_shuff_mem_mask0(<8 x i64> %vec1, <8 x i64>* %vec2p, <8 x i64> %vec3, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xi64_masked_shuff_mem_mask0:		; GENERIC-LABEL: test_8xi64_masked_shuff_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi64x2 {{.*#+}} zmm1 {%k1} = zmm0[2,3,2,3],mem[4,5,2,3] sched: [5:1.00]		; GENERIC-NEXT: vshufi64x2 {{.*#+}} zmm1 {%k1} = zmm0[2,3,2,3],mem[4,5,2,3] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi64_masked_shuff_mem_mask0:		; SKX-LABEL: test_8xi64_masked_shuff_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi64x2 {{.*#+}} zmm1 {%k1} = zmm0[2,3,2,3],mem[4,5,2,3] sched: [10:1.00]		; SKX-NEXT: vshufi64x2 {{.*#+}} zmm1 {%k1} = zmm0[2,3,2,3],mem[4,5,2,3] sched: [10:1.00]
; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x i64>, <8 x i64>* %vec2p		%vec2 = load <8 x i64>, <8 x i64>* %vec2p
%shuf = shufflevector <8 x i64> %vec1, <8 x i64> %vec2, <8 x i32> <i32 2, i32 3, i32 2, i32 3, i32 12, i32 13, i32 10, i32 11>		%shuf = shufflevector <8 x i64> %vec1, <8 x i64> %vec2, <8 x i32> <i32 2, i32 3, i32 2, i32 3, i32 12, i32 13, i32 10, i32 11>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec3		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec3
ret <8 x i64> %res		ret <8 x i64> %res
}		}

define <8 x i64> @test_8xi64_zero_masked_shuff_mem_mask0(<8 x i64> %vec1, <8 x i64>* %vec2p, <8 x i64> %mask) {		define <8 x i64> @test_8xi64_zero_masked_shuff_mem_mask0(<8 x i64> %vec1, <8 x i64>* %vec2p, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xi64_zero_masked_shuff_mem_mask0:		; GENERIC-LABEL: test_8xi64_zero_masked_shuff_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[2,3,2,3],mem[4,5,2,3] sched: [5:1.00]		; GENERIC-NEXT: vshufi64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[2,3,2,3],mem[4,5,2,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi64_zero_masked_shuff_mem_mask0:		; SKX-LABEL: test_8xi64_zero_masked_shuff_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[2,3,2,3],mem[4,5,2,3] sched: [10:1.00]		; SKX-NEXT: vshufi64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[2,3,2,3],mem[4,5,2,3] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x i64>, <8 x i64>* %vec2p		%vec2 = load <8 x i64>, <8 x i64>* %vec2p
%shuf = shufflevector <8 x i64> %vec1, <8 x i64> %vec2, <8 x i32> <i32 2, i32 3, i32 2, i32 3, i32 12, i32 13, i32 10, i32 11>		%shuf = shufflevector <8 x i64> %vec1, <8 x i64> %vec2, <8 x i32> <i32 2, i32 3, i32 2, i32 3, i32 12, i32 13, i32 10, i32 11>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer
ret <8 x i64> %res		ret <8 x i64> %res
}		}

define <8 x i64> @test_8xi64_masked_shuff_mem_mask1(<8 x i64> %vec1, <8 x i64>* %vec2p, <8 x i64> %vec3, <8 x i64> %mask) {		define <8 x i64> @test_8xi64_masked_shuff_mem_mask1(<8 x i64> %vec1, <8 x i64>* %vec2p, <8 x i64> %vec3, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xi64_masked_shuff_mem_mask1:		; GENERIC-LABEL: test_8xi64_masked_shuff_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi64x2 {{.*#+}} zmm1 {%k1} = zmm0[2,3,0,1],mem[0,1,0,1] sched: [5:1.00]		; GENERIC-NEXT: vshufi64x2 {{.*#+}} zmm1 {%k1} = zmm0[2,3,0,1],mem[0,1,0,1] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi64_masked_shuff_mem_mask1:		; SKX-LABEL: test_8xi64_masked_shuff_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi64x2 {{.*#+}} zmm1 {%k1} = zmm0[2,3,0,1],mem[0,1,0,1] sched: [10:1.00]		; SKX-NEXT: vshufi64x2 {{.*#+}} zmm1 {%k1} = zmm0[2,3,0,1],mem[0,1,0,1] sched: [10:1.00]
; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x i64>, <8 x i64>* %vec2p		%vec2 = load <8 x i64>, <8 x i64>* %vec2p
%shuf = shufflevector <8 x i64> %vec1, <8 x i64> %vec2, <8 x i32> <i32 2, i32 3, i32 0, i32 1, i32 8, i32 9, i32 8, i32 9>		%shuf = shufflevector <8 x i64> %vec1, <8 x i64> %vec2, <8 x i32> <i32 2, i32 3, i32 0, i32 1, i32 8, i32 9, i32 8, i32 9>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec3		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec3
ret <8 x i64> %res		ret <8 x i64> %res
}		}

define <8 x i64> @test_8xi64_zero_masked_shuff_mem_mask1(<8 x i64> %vec1, <8 x i64>* %vec2p, <8 x i64> %mask) {		define <8 x i64> @test_8xi64_zero_masked_shuff_mem_mask1(<8 x i64> %vec1, <8 x i64>* %vec2p, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xi64_zero_masked_shuff_mem_mask1:		; GENERIC-LABEL: test_8xi64_zero_masked_shuff_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[2,3,0,1],mem[0,1,0,1] sched: [5:1.00]		; GENERIC-NEXT: vshufi64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[2,3,0,1],mem[0,1,0,1] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi64_zero_masked_shuff_mem_mask1:		; SKX-LABEL: test_8xi64_zero_masked_shuff_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[2,3,0,1],mem[0,1,0,1] sched: [10:1.00]		; SKX-NEXT: vshufi64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[2,3,0,1],mem[0,1,0,1] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x i64>, <8 x i64>* %vec2p		%vec2 = load <8 x i64>, <8 x i64>* %vec2p
%shuf = shufflevector <8 x i64> %vec1, <8 x i64> %vec2, <8 x i32> <i32 2, i32 3, i32 0, i32 1, i32 8, i32 9, i32 8, i32 9>		%shuf = shufflevector <8 x i64> %vec1, <8 x i64> %vec2, <8 x i32> <i32 2, i32 3, i32 0, i32 1, i32 8, i32 9, i32 8, i32 9>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer
ret <8 x i64> %res		ret <8 x i64> %res
}		}

define <8 x i64> @test_8xi64_masked_shuff_mem_mask2(<8 x i64> %vec1, <8 x i64>* %vec2p, <8 x i64> %vec3, <8 x i64> %mask) {		define <8 x i64> @test_8xi64_masked_shuff_mem_mask2(<8 x i64> %vec1, <8 x i64>* %vec2p, <8 x i64> %vec3, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xi64_masked_shuff_mem_mask2:		; GENERIC-LABEL: test_8xi64_masked_shuff_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi64x2 {{.*#+}} zmm1 {%k1} = zmm0[4,5,0,1],mem[2,3,2,3] sched: [5:1.00]		; GENERIC-NEXT: vshufi64x2 {{.*#+}} zmm1 {%k1} = zmm0[4,5,0,1],mem[2,3,2,3] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi64_masked_shuff_mem_mask2:		; SKX-LABEL: test_8xi64_masked_shuff_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi64x2 {{.*#+}} zmm1 {%k1} = zmm0[4,5,0,1],mem[2,3,2,3] sched: [10:1.00]		; SKX-NEXT: vshufi64x2 {{.*#+}} zmm1 {%k1} = zmm0[4,5,0,1],mem[2,3,2,3] sched: [10:1.00]
; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x i64>, <8 x i64>* %vec2p		%vec2 = load <8 x i64>, <8 x i64>* %vec2p
%shuf = shufflevector <8 x i64> %vec1, <8 x i64> %vec2, <8 x i32> <i32 4, i32 5, i32 0, i32 1, i32 10, i32 11, i32 10, i32 11>		%shuf = shufflevector <8 x i64> %vec1, <8 x i64> %vec2, <8 x i32> <i32 4, i32 5, i32 0, i32 1, i32 10, i32 11, i32 10, i32 11>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec3		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec3
ret <8 x i64> %res		ret <8 x i64> %res
}		}

define <8 x i64> @test_8xi64_zero_masked_shuff_mem_mask2(<8 x i64> %vec1, <8 x i64>* %vec2p, <8 x i64> %mask) {		define <8 x i64> @test_8xi64_zero_masked_shuff_mem_mask2(<8 x i64> %vec1, <8 x i64>* %vec2p, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xi64_zero_masked_shuff_mem_mask2:		; GENERIC-LABEL: test_8xi64_zero_masked_shuff_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[4,5,0,1],mem[2,3,2,3] sched: [5:1.00]		; GENERIC-NEXT: vshufi64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[4,5,0,1],mem[2,3,2,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi64_zero_masked_shuff_mem_mask2:		; SKX-LABEL: test_8xi64_zero_masked_shuff_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[4,5,0,1],mem[2,3,2,3] sched: [10:1.00]		; SKX-NEXT: vshufi64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[4,5,0,1],mem[2,3,2,3] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x i64>, <8 x i64>* %vec2p		%vec2 = load <8 x i64>, <8 x i64>* %vec2p
%shuf = shufflevector <8 x i64> %vec1, <8 x i64> %vec2, <8 x i32> <i32 4, i32 5, i32 0, i32 1, i32 10, i32 11, i32 10, i32 11>		%shuf = shufflevector <8 x i64> %vec1, <8 x i64> %vec2, <8 x i32> <i32 4, i32 5, i32 0, i32 1, i32 10, i32 11, i32 10, i32 11>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> zeroinitializer
ret <8 x i64> %res		ret <8 x i64> %res
}		}

define <8 x i64> @test_8xi64_shuff_mem_mask3(<8 x i64> %vec1, <8 x i64>* %vec2p) {		define <8 x i64> @test_8xi64_shuff_mem_mask3(<8 x i64> %vec1, <8 x i64>* %vec2p) {
; GENERIC-LABEL: test_8xi64_shuff_mem_mask3:		; GENERIC-LABEL: test_8xi64_shuff_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vshufi64x2 {{.*#+}} zmm0 = zmm0[2,3,0,1],mem[6,7,2,3] sched: [5:1.00]		; GENERIC-NEXT: vshufi64x2 {{.*#+}} zmm0 = zmm0[2,3,0,1],mem[6,7,2,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi64_shuff_mem_mask3:		; SKX-LABEL: test_8xi64_shuff_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vshufi64x2 {{.*#+}} zmm0 = zmm0[2,3,0,1],mem[6,7,2,3] sched: [10:1.00]		; SKX-NEXT: vshufi64x2 {{.*#+}} zmm0 = zmm0[2,3,0,1],mem[6,7,2,3] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x i64>, <8 x i64>* %vec2p		%vec2 = load <8 x i64>, <8 x i64>* %vec2p
%res = shufflevector <8 x i64> %vec1, <8 x i64> %vec2, <8 x i32> <i32 2, i32 3, i32 0, i32 1, i32 14, i32 15, i32 10, i32 11>		%res = shufflevector <8 x i64> %vec1, <8 x i64> %vec2, <8 x i32> <i32 2, i32 3, i32 0, i32 1, i32 14, i32 15, i32 10, i32 11>
ret <8 x i64> %res		ret <8 x i64> %res
}		}
define <8 x i64> @test_8xi64_masked_shuff_mem_mask3(<8 x i64> %vec1, <8 x i64>* %vec2p, <8 x i64> %vec3, <8 x i64> %mask) {		define <8 x i64> @test_8xi64_masked_shuff_mem_mask3(<8 x i64> %vec1, <8 x i64>* %vec2p, <8 x i64> %vec3, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xi64_masked_shuff_mem_mask3:		; GENERIC-LABEL: test_8xi64_masked_shuff_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi64x2 {{.*#+}} zmm1 {%k1} = zmm0[2,3,0,1],mem[6,7,2,3] sched: [5:1.00]		; GENERIC-NEXT: vshufi64x2 {{.*#+}} zmm1 {%k1} = zmm0[2,3,0,1],mem[6,7,2,3] sched: [6:1.00]
; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]		; GENERIC-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.50]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi64_masked_shuff_mem_mask3:		; SKX-LABEL: test_8xi64_masked_shuff_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi64x2 {{.*#+}} zmm1 {%k1} = zmm0[2,3,0,1],mem[6,7,2,3] sched: [10:1.00]		; SKX-NEXT: vshufi64x2 {{.*#+}} zmm1 {%k1} = zmm0[2,3,0,1],mem[6,7,2,3] sched: [10:1.00]
; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovdqa64 %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x i64>, <8 x i64>* %vec2p		%vec2 = load <8 x i64>, <8 x i64>* %vec2p
%shuf = shufflevector <8 x i64> %vec1, <8 x i64> %vec2, <8 x i32> <i32 2, i32 3, i32 0, i32 1, i32 14, i32 15, i32 10, i32 11>		%shuf = shufflevector <8 x i64> %vec1, <8 x i64> %vec2, <8 x i32> <i32 2, i32 3, i32 0, i32 1, i32 14, i32 15, i32 10, i32 11>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec3		%res = select <8 x i1> %cmp, <8 x i64> %shuf, <8 x i64> %vec3
ret <8 x i64> %res		ret <8 x i64> %res
}		}

define <8 x i64> @test_8xi64_zero_masked_shuff_mem_mask3(<8 x i64> %vec1, <8 x i64>* %vec2p, <8 x i64> %mask) {		define <8 x i64> @test_8xi64_zero_masked_shuff_mem_mask3(<8 x i64> %vec1, <8 x i64>* %vec2p, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xi64_zero_masked_shuff_mem_mask3:		; GENERIC-LABEL: test_8xi64_zero_masked_shuff_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vshufi64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[2,3,0,1],mem[6,7,2,3] sched: [5:1.00]		; GENERIC-NEXT: vshufi64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[2,3,0,1],mem[6,7,2,3] sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xi64_zero_masked_shuff_mem_mask3:		; SKX-LABEL: test_8xi64_zero_masked_shuff_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vshufi64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[2,3,0,1],mem[6,7,2,3] sched: [10:1.00]		; SKX-NEXT: vshufi64x2 {{.*#+}} zmm0 {%k1} {z} = zmm0[2,3,0,1],mem[6,7,2,3] sched: [10:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x i64>, <8 x i64>* %vec2p		%vec2 = load <8 x i64>, <8 x i64>* %vec2p
▲ Show 20 Lines • Show All 190 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x float>, <4 x float>* %vec2p		%vec2 = load <4 x float>, <4 x float>* %vec2p
%res = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 0, i32 4, i32 1, i32 5>		%res = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 0, i32 4, i32 1, i32 5>
ret <4 x float> %res		ret <4 x float> %res
}		}
define <4 x float> @test_4xfloat_masked_unpack_low_mem_mask0(<4 x float> %vec1, <4 x float>* %vec2p, <4 x float> %vec3, <4 x i32> %mask) {		define <4 x float> @test_4xfloat_masked_unpack_low_mem_mask0(<4 x float> %vec1, <4 x float>* %vec2p, <4 x float> %vec3, <4 x i32> %mask) {
; GENERIC-LABEL: test_4xfloat_masked_unpack_low_mem_mask0:		; GENERIC-LABEL: test_4xfloat_masked_unpack_low_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xfloat_masked_unpack_low_mem_mask0:		; SKX-LABEL: test_4xfloat_masked_unpack_low_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]
; SKX-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x float>, <4 x float>* %vec2p		%vec2 = load <4 x float>, <4 x float>* %vec2p
%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 0, i32 4, i32 1, i32 5>		%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 0, i32 4, i32 1, i32 5>
%cmp = icmp eq <4 x i32> %mask, zeroinitializer		%cmp = icmp eq <4 x i32> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> %vec3		%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> %vec3
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_4xfloat_zero_masked_unpack_low_mem_mask0(<4 x float> %vec1, <4 x float>* %vec2p, <4 x i32> %mask) {		define <4 x float> @test_4xfloat_zero_masked_unpack_low_mem_mask0(<4 x float> %vec1, <4 x float>* %vec2p, <4 x i32> %mask) {
; GENERIC-LABEL: test_4xfloat_zero_masked_unpack_low_mem_mask0:		; GENERIC-LABEL: test_4xfloat_zero_masked_unpack_low_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xfloat_zero_masked_unpack_low_mem_mask0:		; SKX-LABEL: test_4xfloat_zero_masked_unpack_low_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x float>, <4 x float>* %vec2p		%vec2 = load <4 x float>, <4 x float>* %vec2p
%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 0, i32 4, i32 1, i32 5>		%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 0, i32 4, i32 1, i32 5>
%cmp = icmp eq <4 x i32> %mask, zeroinitializer		%cmp = icmp eq <4 x i32> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> zeroinitializer		%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> zeroinitializer
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_4xfloat_masked_unpack_low_mem_mask1(<4 x float> %vec1, <4 x float>* %vec2p, <4 x float> %vec3, <4 x i32> %mask) {		define <4 x float> @test_4xfloat_masked_unpack_low_mem_mask1(<4 x float> %vec1, <4 x float>* %vec2p, <4 x float> %vec3, <4 x i32> %mask) {
; GENERIC-LABEL: test_4xfloat_masked_unpack_low_mem_mask1:		; GENERIC-LABEL: test_4xfloat_masked_unpack_low_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xfloat_masked_unpack_low_mem_mask1:		; SKX-LABEL: test_4xfloat_masked_unpack_low_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]
; SKX-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x float>, <4 x float>* %vec2p		%vec2 = load <4 x float>, <4 x float>* %vec2p
%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 0, i32 4, i32 1, i32 5>		%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 0, i32 4, i32 1, i32 5>
%cmp = icmp eq <4 x i32> %mask, zeroinitializer		%cmp = icmp eq <4 x i32> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> %vec3		%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> %vec3
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_4xfloat_zero_masked_unpack_low_mem_mask1(<4 x float> %vec1, <4 x float>* %vec2p, <4 x i32> %mask) {		define <4 x float> @test_4xfloat_zero_masked_unpack_low_mem_mask1(<4 x float> %vec1, <4 x float>* %vec2p, <4 x i32> %mask) {
; GENERIC-LABEL: test_4xfloat_zero_masked_unpack_low_mem_mask1:		; GENERIC-LABEL: test_4xfloat_zero_masked_unpack_low_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xfloat_zero_masked_unpack_low_mem_mask1:		; SKX-LABEL: test_4xfloat_zero_masked_unpack_low_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x float>, <4 x float>* %vec2p		%vec2 = load <4 x float>, <4 x float>* %vec2p
%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 0, i32 4, i32 1, i32 5>		%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 0, i32 4, i32 1, i32 5>
%cmp = icmp eq <4 x i32> %mask, zeroinitializer		%cmp = icmp eq <4 x i32> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> zeroinitializer		%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> zeroinitializer
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_4xfloat_masked_unpack_low_mem_mask2(<4 x float> %vec1, <4 x float>* %vec2p, <4 x float> %vec3, <4 x i32> %mask) {		define <4 x float> @test_4xfloat_masked_unpack_low_mem_mask2(<4 x float> %vec1, <4 x float>* %vec2p, <4 x float> %vec3, <4 x i32> %mask) {
; GENERIC-LABEL: test_4xfloat_masked_unpack_low_mem_mask2:		; GENERIC-LABEL: test_4xfloat_masked_unpack_low_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xfloat_masked_unpack_low_mem_mask2:		; SKX-LABEL: test_4xfloat_masked_unpack_low_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]
; SKX-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x float>, <4 x float>* %vec2p		%vec2 = load <4 x float>, <4 x float>* %vec2p
%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 0, i32 4, i32 1, i32 5>		%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 0, i32 4, i32 1, i32 5>
%cmp = icmp eq <4 x i32> %mask, zeroinitializer		%cmp = icmp eq <4 x i32> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> %vec3		%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> %vec3
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_4xfloat_zero_masked_unpack_low_mem_mask2(<4 x float> %vec1, <4 x float>* %vec2p, <4 x i32> %mask) {		define <4 x float> @test_4xfloat_zero_masked_unpack_low_mem_mask2(<4 x float> %vec1, <4 x float>* %vec2p, <4 x i32> %mask) {
; GENERIC-LABEL: test_4xfloat_zero_masked_unpack_low_mem_mask2:		; GENERIC-LABEL: test_4xfloat_zero_masked_unpack_low_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xfloat_zero_masked_unpack_low_mem_mask2:		; SKX-LABEL: test_4xfloat_zero_masked_unpack_low_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x float>, <4 x float>* %vec2p		%vec2 = load <4 x float>, <4 x float>* %vec2p
Show All 16 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x float>, <4 x float>* %vec2p		%vec2 = load <4 x float>, <4 x float>* %vec2p
%res = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 0, i32 4, i32 1, i32 5>		%res = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 0, i32 4, i32 1, i32 5>
ret <4 x float> %res		ret <4 x float> %res
}		}
define <4 x float> @test_4xfloat_masked_unpack_low_mem_mask3(<4 x float> %vec1, <4 x float>* %vec2p, <4 x float> %vec3, <4 x i32> %mask) {		define <4 x float> @test_4xfloat_masked_unpack_low_mem_mask3(<4 x float> %vec1, <4 x float>* %vec2p, <4 x float> %vec3, <4 x i32> %mask) {
; GENERIC-LABEL: test_4xfloat_masked_unpack_low_mem_mask3:		; GENERIC-LABEL: test_4xfloat_masked_unpack_low_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xfloat_masked_unpack_low_mem_mask3:		; SKX-LABEL: test_4xfloat_masked_unpack_low_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]
; SKX-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x float>, <4 x float>* %vec2p		%vec2 = load <4 x float>, <4 x float>* %vec2p
%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 0, i32 4, i32 1, i32 5>		%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 0, i32 4, i32 1, i32 5>
%cmp = icmp eq <4 x i32> %mask, zeroinitializer		%cmp = icmp eq <4 x i32> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> %vec3		%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> %vec3
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_4xfloat_zero_masked_unpack_low_mem_mask3(<4 x float> %vec1, <4 x float>* %vec2p, <4 x i32> %mask) {		define <4 x float> @test_4xfloat_zero_masked_unpack_low_mem_mask3(<4 x float> %vec1, <4 x float>* %vec2p, <4 x i32> %mask) {
; GENERIC-LABEL: test_4xfloat_zero_masked_unpack_low_mem_mask3:		; GENERIC-LABEL: test_4xfloat_zero_masked_unpack_low_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xfloat_zero_masked_unpack_low_mem_mask3:		; SKX-LABEL: test_4xfloat_zero_masked_unpack_low_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0],xmm0[1],mem[1] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x float>, <4 x float>* %vec2p		%vec2 = load <4 x float>, <4 x float>* %vec2p
▲ Show 20 Lines • Show All 190 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%res = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>		%res = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>
ret <8 x float> %res		ret <8 x float> %res
}		}
define <8 x float> @test_8xfloat_masked_unpack_low_mem_mask0(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_masked_unpack_low_mem_mask0(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_masked_unpack_low_mem_mask0:		; GENERIC-LABEL: test_8xfloat_masked_unpack_low_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_masked_unpack_low_mem_mask0:		; SKX-LABEL: test_8xfloat_masked_unpack_low_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]
; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>		%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_8xfloat_zero_masked_unpack_low_mem_mask0(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_zero_masked_unpack_low_mem_mask0(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_zero_masked_unpack_low_mem_mask0:		; GENERIC-LABEL: test_8xfloat_zero_masked_unpack_low_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_zero_masked_unpack_low_mem_mask0:		; SKX-LABEL: test_8xfloat_zero_masked_unpack_low_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>		%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> zeroinitializer		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> zeroinitializer
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_8xfloat_masked_unpack_low_mem_mask1(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_masked_unpack_low_mem_mask1(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_masked_unpack_low_mem_mask1:		; GENERIC-LABEL: test_8xfloat_masked_unpack_low_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_masked_unpack_low_mem_mask1:		; SKX-LABEL: test_8xfloat_masked_unpack_low_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]
; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>		%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_8xfloat_zero_masked_unpack_low_mem_mask1(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_zero_masked_unpack_low_mem_mask1(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_zero_masked_unpack_low_mem_mask1:		; GENERIC-LABEL: test_8xfloat_zero_masked_unpack_low_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_zero_masked_unpack_low_mem_mask1:		; SKX-LABEL: test_8xfloat_zero_masked_unpack_low_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>		%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> zeroinitializer		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> zeroinitializer
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_8xfloat_masked_unpack_low_mem_mask2(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_masked_unpack_low_mem_mask2(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_masked_unpack_low_mem_mask2:		; GENERIC-LABEL: test_8xfloat_masked_unpack_low_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_masked_unpack_low_mem_mask2:		; SKX-LABEL: test_8xfloat_masked_unpack_low_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]
; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>		%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_8xfloat_zero_masked_unpack_low_mem_mask2(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_zero_masked_unpack_low_mem_mask2(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_zero_masked_unpack_low_mem_mask2:		; GENERIC-LABEL: test_8xfloat_zero_masked_unpack_low_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_zero_masked_unpack_low_mem_mask2:		; SKX-LABEL: test_8xfloat_zero_masked_unpack_low_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
Show All 16 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%res = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>		%res = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>
ret <8 x float> %res		ret <8 x float> %res
}		}
define <8 x float> @test_8xfloat_masked_unpack_low_mem_mask3(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_masked_unpack_low_mem_mask3(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_masked_unpack_low_mem_mask3:		; GENERIC-LABEL: test_8xfloat_masked_unpack_low_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_masked_unpack_low_mem_mask3:		; SKX-LABEL: test_8xfloat_masked_unpack_low_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]
; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>		%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 4, i32 12, i32 5, i32 13>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_8xfloat_zero_masked_unpack_low_mem_mask3(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_zero_masked_unpack_low_mem_mask3(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_zero_masked_unpack_low_mem_mask3:		; GENERIC-LABEL: test_8xfloat_zero_masked_unpack_low_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_zero_masked_unpack_low_mem_mask3:		; SKX-LABEL: test_8xfloat_zero_masked_unpack_low_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[1],mem[1],ymm0[4],mem[4],ymm0[5],mem[5] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
▲ Show 20 Lines • Show All 175 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer
ret <16 x float> %res		ret <16 x float> %res
}		}
define <16 x float> @test_16xfloat_unpack_low_mem_mask0(<16 x float> %vec1, <16 x float>* %vec2p) {		define <16 x float> @test_16xfloat_unpack_low_mem_mask0(<16 x float> %vec1, <16 x float>* %vec2p) {
; GENERIC-LABEL: test_16xfloat_unpack_low_mem_mask0:		; GENERIC-LABEL: test_16xfloat_unpack_low_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vunpcklps {{.*#+}} zmm0 = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} zmm0 = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_unpack_low_mem_mask0:		; SKX-LABEL: test_16xfloat_unpack_low_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vunpcklps {{.*#+}} zmm0 = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} zmm0 = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%res = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>		%res = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>
ret <16 x float> %res		ret <16 x float> %res
}		}
define <16 x float> @test_16xfloat_masked_unpack_low_mem_mask0(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_masked_unpack_low_mem_mask0(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_masked_unpack_low_mem_mask0:		; GENERIC-LABEL: test_16xfloat_masked_unpack_low_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_masked_unpack_low_mem_mask0:		; SKX-LABEL: test_16xfloat_masked_unpack_low_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]
; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_16xfloat_zero_masked_unpack_low_mem_mask0(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_zero_masked_unpack_low_mem_mask0(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_zero_masked_unpack_low_mem_mask0:		; GENERIC-LABEL: test_16xfloat_zero_masked_unpack_low_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_zero_masked_unpack_low_mem_mask0:		; SKX-LABEL: test_16xfloat_zero_masked_unpack_low_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_16xfloat_masked_unpack_low_mem_mask1(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_masked_unpack_low_mem_mask1(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_masked_unpack_low_mem_mask1:		; GENERIC-LABEL: test_16xfloat_masked_unpack_low_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_masked_unpack_low_mem_mask1:		; SKX-LABEL: test_16xfloat_masked_unpack_low_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]
; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_16xfloat_zero_masked_unpack_low_mem_mask1(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_zero_masked_unpack_low_mem_mask1(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_zero_masked_unpack_low_mem_mask1:		; GENERIC-LABEL: test_16xfloat_zero_masked_unpack_low_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_zero_masked_unpack_low_mem_mask1:		; SKX-LABEL: test_16xfloat_zero_masked_unpack_low_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_16xfloat_masked_unpack_low_mem_mask2(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_masked_unpack_low_mem_mask2(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_masked_unpack_low_mem_mask2:		; GENERIC-LABEL: test_16xfloat_masked_unpack_low_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_masked_unpack_low_mem_mask2:		; SKX-LABEL: test_16xfloat_masked_unpack_low_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]
; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_16xfloat_zero_masked_unpack_low_mem_mask2(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_zero_masked_unpack_low_mem_mask2(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_zero_masked_unpack_low_mem_mask2:		; GENERIC-LABEL: test_16xfloat_zero_masked_unpack_low_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_zero_masked_unpack_low_mem_mask2:		; SKX-LABEL: test_16xfloat_zero_masked_unpack_low_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_16xfloat_unpack_low_mem_mask3(<16 x float> %vec1, <16 x float>* %vec2p) {		define <16 x float> @test_16xfloat_unpack_low_mem_mask3(<16 x float> %vec1, <16 x float>* %vec2p) {
; GENERIC-LABEL: test_16xfloat_unpack_low_mem_mask3:		; GENERIC-LABEL: test_16xfloat_unpack_low_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vunpcklps {{.*#+}} zmm0 = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} zmm0 = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_unpack_low_mem_mask3:		; SKX-LABEL: test_16xfloat_unpack_low_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vunpcklps {{.*#+}} zmm0 = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} zmm0 = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%res = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>		%res = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>
ret <16 x float> %res		ret <16 x float> %res
}		}
define <16 x float> @test_16xfloat_masked_unpack_low_mem_mask3(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_masked_unpack_low_mem_mask3(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_masked_unpack_low_mem_mask3:		; GENERIC-LABEL: test_16xfloat_masked_unpack_low_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_masked_unpack_low_mem_mask3:		; SKX-LABEL: test_16xfloat_masked_unpack_low_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]
; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 0, i32 16, i32 1, i32 17, i32 4, i32 20, i32 5, i32 21, i32 8, i32 24, i32 9, i32 25, i32 12, i32 28, i32 13, i32 29>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_16xfloat_zero_masked_unpack_low_mem_mask3(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_zero_masked_unpack_low_mem_mask3(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_zero_masked_unpack_low_mem_mask3:		; GENERIC-LABEL: test_16xfloat_zero_masked_unpack_low_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklps {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [7:1.00]		; GENERIC-NEXT: vunpcklps {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_zero_masked_unpack_low_mem_mask3:		; SKX-LABEL: test_16xfloat_zero_masked_unpack_low_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklps {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]		; SKX-NEXT: vunpcklps {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[1],mem[1],zmm0[4],mem[4],zmm0[5],mem[5],zmm0[8],mem[8],zmm0[9],mem[9],zmm0[12],mem[12],zmm0[13],mem[13] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
▲ Show 20 Lines • Show All 103 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <2 x double>, <2 x double>* %vec2p		%vec2 = load <2 x double>, <2 x double>* %vec2p
%res = shufflevector <2 x double> %vec1, <2 x double> %vec2, <2 x i32> <i32 0, i32 2>		%res = shufflevector <2 x double> %vec1, <2 x double> %vec2, <2 x i32> <i32 0, i32 2>
ret <2 x double> %res		ret <2 x double> %res
}		}
define <2 x double> @test_2xdouble_masked_unpack_low_mem_mask0(<2 x double> %vec1, <2 x double>* %vec2p, <2 x double> %vec3, <2 x i64> %mask) {		define <2 x double> @test_2xdouble_masked_unpack_low_mem_mask0(<2 x double> %vec1, <2 x double>* %vec2p, <2 x double> %vec3, <2 x i64> %mask) {
; GENERIC-LABEL: test_2xdouble_masked_unpack_low_mem_mask0:		; GENERIC-LABEL: test_2xdouble_masked_unpack_low_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %xmm2, %xmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %xmm2, %xmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklpd {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0] sched: [7:1.00]		; GENERIC-NEXT: vunpcklpd {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0] sched: [8:1.00]
; GENERIC-NEXT: vmovapd %xmm1, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %xmm1, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_2xdouble_masked_unpack_low_mem_mask0:		; SKX-LABEL: test_2xdouble_masked_unpack_low_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %xmm2, %xmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %xmm2, %xmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklpd {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0] sched: [7:1.00]		; SKX-NEXT: vunpcklpd {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0] sched: [7:1.00]
; SKX-NEXT: vmovapd %xmm1, %xmm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %xmm1, %xmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <2 x double>, <2 x double>* %vec2p		%vec2 = load <2 x double>, <2 x double>* %vec2p
%shuf = shufflevector <2 x double> %vec1, <2 x double> %vec2, <2 x i32> <i32 0, i32 2>		%shuf = shufflevector <2 x double> %vec1, <2 x double> %vec2, <2 x i32> <i32 0, i32 2>
%cmp = icmp eq <2 x i64> %mask, zeroinitializer		%cmp = icmp eq <2 x i64> %mask, zeroinitializer
%res = select <2 x i1> %cmp, <2 x double> %shuf, <2 x double> %vec3		%res = select <2 x i1> %cmp, <2 x double> %shuf, <2 x double> %vec3
ret <2 x double> %res		ret <2 x double> %res
}		}

define <2 x double> @test_2xdouble_zero_masked_unpack_low_mem_mask0(<2 x double> %vec1, <2 x double>* %vec2p, <2 x i64> %mask) {		define <2 x double> @test_2xdouble_zero_masked_unpack_low_mem_mask0(<2 x double> %vec1, <2 x double>* %vec2p, <2 x i64> %mask) {
; GENERIC-LABEL: test_2xdouble_zero_masked_unpack_low_mem_mask0:		; GENERIC-LABEL: test_2xdouble_zero_masked_unpack_low_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklpd {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0] sched: [7:1.00]		; GENERIC-NEXT: vunpcklpd {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_2xdouble_zero_masked_unpack_low_mem_mask0:		; SKX-LABEL: test_2xdouble_zero_masked_unpack_low_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklpd {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0] sched: [7:1.00]		; SKX-NEXT: vunpcklpd {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <2 x double>, <2 x double>* %vec2p		%vec2 = load <2 x double>, <2 x double>* %vec2p
%shuf = shufflevector <2 x double> %vec1, <2 x double> %vec2, <2 x i32> <i32 0, i32 2>		%shuf = shufflevector <2 x double> %vec1, <2 x double> %vec2, <2 x i32> <i32 0, i32 2>
%cmp = icmp eq <2 x i64> %mask, zeroinitializer		%cmp = icmp eq <2 x i64> %mask, zeroinitializer
%res = select <2 x i1> %cmp, <2 x double> %shuf, <2 x double> zeroinitializer		%res = select <2 x i1> %cmp, <2 x double> %shuf, <2 x double> zeroinitializer
ret <2 x double> %res		ret <2 x double> %res
}		}

define <2 x double> @test_2xdouble_masked_unpack_low_mem_mask1(<2 x double> %vec1, <2 x double>* %vec2p, <2 x double> %vec3, <2 x i64> %mask) {		define <2 x double> @test_2xdouble_masked_unpack_low_mem_mask1(<2 x double> %vec1, <2 x double>* %vec2p, <2 x double> %vec3, <2 x i64> %mask) {
; GENERIC-LABEL: test_2xdouble_masked_unpack_low_mem_mask1:		; GENERIC-LABEL: test_2xdouble_masked_unpack_low_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %xmm2, %xmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %xmm2, %xmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklpd {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0] sched: [7:1.00]		; GENERIC-NEXT: vunpcklpd {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0] sched: [8:1.00]
; GENERIC-NEXT: vmovapd %xmm1, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %xmm1, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_2xdouble_masked_unpack_low_mem_mask1:		; SKX-LABEL: test_2xdouble_masked_unpack_low_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %xmm2, %xmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %xmm2, %xmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklpd {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0] sched: [7:1.00]		; SKX-NEXT: vunpcklpd {{.*#+}} xmm1 {%k1} = xmm0[0],mem[0] sched: [7:1.00]
; SKX-NEXT: vmovapd %xmm1, %xmm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %xmm1, %xmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <2 x double>, <2 x double>* %vec2p		%vec2 = load <2 x double>, <2 x double>* %vec2p
%shuf = shufflevector <2 x double> %vec1, <2 x double> %vec2, <2 x i32> <i32 0, i32 2>		%shuf = shufflevector <2 x double> %vec1, <2 x double> %vec2, <2 x i32> <i32 0, i32 2>
%cmp = icmp eq <2 x i64> %mask, zeroinitializer		%cmp = icmp eq <2 x i64> %mask, zeroinitializer
%res = select <2 x i1> %cmp, <2 x double> %shuf, <2 x double> %vec3		%res = select <2 x i1> %cmp, <2 x double> %shuf, <2 x double> %vec3
ret <2 x double> %res		ret <2 x double> %res
}		}

define <2 x double> @test_2xdouble_zero_masked_unpack_low_mem_mask1(<2 x double> %vec1, <2 x double>* %vec2p, <2 x i64> %mask) {		define <2 x double> @test_2xdouble_zero_masked_unpack_low_mem_mask1(<2 x double> %vec1, <2 x double>* %vec2p, <2 x i64> %mask) {
; GENERIC-LABEL: test_2xdouble_zero_masked_unpack_low_mem_mask1:		; GENERIC-LABEL: test_2xdouble_zero_masked_unpack_low_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklpd {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0] sched: [7:1.00]		; GENERIC-NEXT: vunpcklpd {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_2xdouble_zero_masked_unpack_low_mem_mask1:		; SKX-LABEL: test_2xdouble_zero_masked_unpack_low_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklpd {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0] sched: [7:1.00]		; SKX-NEXT: vunpcklpd {{.*#+}} xmm0 {%k1} {z} = xmm0[0],mem[0] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <2 x double>, <2 x double>* %vec2p		%vec2 = load <2 x double>, <2 x double>* %vec2p
▲ Show 20 Lines • Show All 190 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%res = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 0, i32 4, i32 2, i32 6>		%res = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 0, i32 4, i32 2, i32 6>
ret <4 x double> %res		ret <4 x double> %res
}		}
define <4 x double> @test_4xdouble_masked_unpack_low_mem_mask0(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_masked_unpack_low_mem_mask0(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_masked_unpack_low_mem_mask0:		; GENERIC-LABEL: test_4xdouble_masked_unpack_low_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklpd {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [7:1.00]		; GENERIC-NEXT: vunpcklpd {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]
; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_masked_unpack_low_mem_mask0:		; SKX-LABEL: test_4xdouble_masked_unpack_low_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklpd {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]		; SKX-NEXT: vunpcklpd {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]
; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 0, i32 4, i32 2, i32 6>		%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 0, i32 4, i32 2, i32 6>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_4xdouble_zero_masked_unpack_low_mem_mask0(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_zero_masked_unpack_low_mem_mask0(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_zero_masked_unpack_low_mem_mask0:		; GENERIC-LABEL: test_4xdouble_zero_masked_unpack_low_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklpd {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [7:1.00]		; GENERIC-NEXT: vunpcklpd {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_zero_masked_unpack_low_mem_mask0:		; SKX-LABEL: test_4xdouble_zero_masked_unpack_low_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklpd {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]		; SKX-NEXT: vunpcklpd {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 0, i32 4, i32 2, i32 6>		%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 0, i32 4, i32 2, i32 6>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> zeroinitializer		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> zeroinitializer
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_4xdouble_masked_unpack_low_mem_mask1(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_masked_unpack_low_mem_mask1(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_masked_unpack_low_mem_mask1:		; GENERIC-LABEL: test_4xdouble_masked_unpack_low_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklpd {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [7:1.00]		; GENERIC-NEXT: vunpcklpd {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]
; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_masked_unpack_low_mem_mask1:		; SKX-LABEL: test_4xdouble_masked_unpack_low_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklpd {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]		; SKX-NEXT: vunpcklpd {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]
; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 0, i32 4, i32 2, i32 6>		%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 0, i32 4, i32 2, i32 6>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_4xdouble_zero_masked_unpack_low_mem_mask1(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_zero_masked_unpack_low_mem_mask1(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_zero_masked_unpack_low_mem_mask1:		; GENERIC-LABEL: test_4xdouble_zero_masked_unpack_low_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklpd {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [7:1.00]		; GENERIC-NEXT: vunpcklpd {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_zero_masked_unpack_low_mem_mask1:		; SKX-LABEL: test_4xdouble_zero_masked_unpack_low_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklpd {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]		; SKX-NEXT: vunpcklpd {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 0, i32 4, i32 2, i32 6>		%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 0, i32 4, i32 2, i32 6>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> zeroinitializer		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> zeroinitializer
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_4xdouble_masked_unpack_low_mem_mask2(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_masked_unpack_low_mem_mask2(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_masked_unpack_low_mem_mask2:		; GENERIC-LABEL: test_4xdouble_masked_unpack_low_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklpd {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [7:1.00]		; GENERIC-NEXT: vunpcklpd {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]
; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_masked_unpack_low_mem_mask2:		; SKX-LABEL: test_4xdouble_masked_unpack_low_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklpd {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]		; SKX-NEXT: vunpcklpd {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]
; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 0, i32 4, i32 2, i32 6>		%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 0, i32 4, i32 2, i32 6>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_4xdouble_zero_masked_unpack_low_mem_mask2(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_zero_masked_unpack_low_mem_mask2(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_zero_masked_unpack_low_mem_mask2:		; GENERIC-LABEL: test_4xdouble_zero_masked_unpack_low_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklpd {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [7:1.00]		; GENERIC-NEXT: vunpcklpd {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_zero_masked_unpack_low_mem_mask2:		; SKX-LABEL: test_4xdouble_zero_masked_unpack_low_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklpd {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]		; SKX-NEXT: vunpcklpd {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
Show All 16 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%res = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 0, i32 4, i32 2, i32 6>		%res = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 0, i32 4, i32 2, i32 6>
ret <4 x double> %res		ret <4 x double> %res
}		}
define <4 x double> @test_4xdouble_masked_unpack_low_mem_mask3(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_masked_unpack_low_mem_mask3(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_masked_unpack_low_mem_mask3:		; GENERIC-LABEL: test_4xdouble_masked_unpack_low_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklpd {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [7:1.00]		; GENERIC-NEXT: vunpcklpd {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]
; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_masked_unpack_low_mem_mask3:		; SKX-LABEL: test_4xdouble_masked_unpack_low_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklpd {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]		; SKX-NEXT: vunpcklpd {{.*#+}} ymm1 {%k1} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]
; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 0, i32 4, i32 2, i32 6>		%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 0, i32 4, i32 2, i32 6>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_4xdouble_zero_masked_unpack_low_mem_mask3(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_zero_masked_unpack_low_mem_mask3(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_zero_masked_unpack_low_mem_mask3:		; GENERIC-LABEL: test_4xdouble_zero_masked_unpack_low_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklpd {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [7:1.00]		; GENERIC-NEXT: vunpcklpd {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_zero_masked_unpack_low_mem_mask3:		; SKX-LABEL: test_4xdouble_zero_masked_unpack_low_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklpd {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]		; SKX-NEXT: vunpcklpd {{.*#+}} ymm0 {%k1} {z} = ymm0[0],mem[0],ymm0[2],mem[2] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
▲ Show 20 Lines • Show All 175 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 8, i32 2, i32 10, i32 4, i32 12, i32 6, i32 14>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 8, i32 2, i32 10, i32 4, i32 12, i32 6, i32 14>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer
ret <8 x double> %res		ret <8 x double> %res
}		}
define <8 x double> @test_8xdouble_unpack_low_mem_mask0(<8 x double> %vec1, <8 x double>* %vec2p) {		define <8 x double> @test_8xdouble_unpack_low_mem_mask0(<8 x double> %vec1, <8 x double>* %vec2p) {
; GENERIC-LABEL: test_8xdouble_unpack_low_mem_mask0:		; GENERIC-LABEL: test_8xdouble_unpack_low_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vunpcklpd {{.*#+}} zmm0 = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [7:1.00]		; GENERIC-NEXT: vunpcklpd {{.*#+}} zmm0 = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_unpack_low_mem_mask0:		; SKX-LABEL: test_8xdouble_unpack_low_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vunpcklpd {{.*#+}} zmm0 = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]		; SKX-NEXT: vunpcklpd {{.*#+}} zmm0 = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%res = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 8, i32 2, i32 10, i32 4, i32 12, i32 6, i32 14>		%res = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 8, i32 2, i32 10, i32 4, i32 12, i32 6, i32 14>
ret <8 x double> %res		ret <8 x double> %res
}		}
define <8 x double> @test_8xdouble_masked_unpack_low_mem_mask0(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_masked_unpack_low_mem_mask0(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_masked_unpack_low_mem_mask0:		; GENERIC-LABEL: test_8xdouble_masked_unpack_low_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklpd {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [7:1.00]		; GENERIC-NEXT: vunpcklpd {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]
; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_masked_unpack_low_mem_mask0:		; SKX-LABEL: test_8xdouble_masked_unpack_low_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklpd {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]		; SKX-NEXT: vunpcklpd {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]
; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 8, i32 2, i32 10, i32 4, i32 12, i32 6, i32 14>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 8, i32 2, i32 10, i32 4, i32 12, i32 6, i32 14>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_8xdouble_zero_masked_unpack_low_mem_mask0(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_zero_masked_unpack_low_mem_mask0(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_zero_masked_unpack_low_mem_mask0:		; GENERIC-LABEL: test_8xdouble_zero_masked_unpack_low_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklpd {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [7:1.00]		; GENERIC-NEXT: vunpcklpd {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_zero_masked_unpack_low_mem_mask0:		; SKX-LABEL: test_8xdouble_zero_masked_unpack_low_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklpd {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]		; SKX-NEXT: vunpcklpd {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 8, i32 2, i32 10, i32 4, i32 12, i32 6, i32 14>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 8, i32 2, i32 10, i32 4, i32 12, i32 6, i32 14>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_8xdouble_masked_unpack_low_mem_mask1(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_masked_unpack_low_mem_mask1(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_masked_unpack_low_mem_mask1:		; GENERIC-LABEL: test_8xdouble_masked_unpack_low_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklpd {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [7:1.00]		; GENERIC-NEXT: vunpcklpd {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]
; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_masked_unpack_low_mem_mask1:		; SKX-LABEL: test_8xdouble_masked_unpack_low_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklpd {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]		; SKX-NEXT: vunpcklpd {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]
; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 8, i32 2, i32 10, i32 4, i32 12, i32 6, i32 14>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 8, i32 2, i32 10, i32 4, i32 12, i32 6, i32 14>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_8xdouble_zero_masked_unpack_low_mem_mask1(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_zero_masked_unpack_low_mem_mask1(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_zero_masked_unpack_low_mem_mask1:		; GENERIC-LABEL: test_8xdouble_zero_masked_unpack_low_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklpd {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [7:1.00]		; GENERIC-NEXT: vunpcklpd {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_zero_masked_unpack_low_mem_mask1:		; SKX-LABEL: test_8xdouble_zero_masked_unpack_low_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklpd {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]		; SKX-NEXT: vunpcklpd {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 8, i32 2, i32 10, i32 4, i32 12, i32 6, i32 14>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 8, i32 2, i32 10, i32 4, i32 12, i32 6, i32 14>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_8xdouble_masked_unpack_low_mem_mask2(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_masked_unpack_low_mem_mask2(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_masked_unpack_low_mem_mask2:		; GENERIC-LABEL: test_8xdouble_masked_unpack_low_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklpd {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [7:1.00]		; GENERIC-NEXT: vunpcklpd {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]
; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_masked_unpack_low_mem_mask2:		; SKX-LABEL: test_8xdouble_masked_unpack_low_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklpd {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]		; SKX-NEXT: vunpcklpd {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]
; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 8, i32 2, i32 10, i32 4, i32 12, i32 6, i32 14>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 8, i32 2, i32 10, i32 4, i32 12, i32 6, i32 14>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_8xdouble_zero_masked_unpack_low_mem_mask2(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_zero_masked_unpack_low_mem_mask2(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_zero_masked_unpack_low_mem_mask2:		; GENERIC-LABEL: test_8xdouble_zero_masked_unpack_low_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklpd {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [7:1.00]		; GENERIC-NEXT: vunpcklpd {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_zero_masked_unpack_low_mem_mask2:		; SKX-LABEL: test_8xdouble_zero_masked_unpack_low_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklpd {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]		; SKX-NEXT: vunpcklpd {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 8, i32 2, i32 10, i32 4, i32 12, i32 6, i32 14>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 8, i32 2, i32 10, i32 4, i32 12, i32 6, i32 14>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_8xdouble_unpack_low_mem_mask3(<8 x double> %vec1, <8 x double>* %vec2p) {		define <8 x double> @test_8xdouble_unpack_low_mem_mask3(<8 x double> %vec1, <8 x double>* %vec2p) {
; GENERIC-LABEL: test_8xdouble_unpack_low_mem_mask3:		; GENERIC-LABEL: test_8xdouble_unpack_low_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vunpcklpd {{.*#+}} zmm0 = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [7:1.00]		; GENERIC-NEXT: vunpcklpd {{.*#+}} zmm0 = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_unpack_low_mem_mask3:		; SKX-LABEL: test_8xdouble_unpack_low_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vunpcklpd {{.*#+}} zmm0 = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]		; SKX-NEXT: vunpcklpd {{.*#+}} zmm0 = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%res = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 8, i32 2, i32 10, i32 4, i32 12, i32 6, i32 14>		%res = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 8, i32 2, i32 10, i32 4, i32 12, i32 6, i32 14>
ret <8 x double> %res		ret <8 x double> %res
}		}
define <8 x double> @test_8xdouble_masked_unpack_low_mem_mask3(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_masked_unpack_low_mem_mask3(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_masked_unpack_low_mem_mask3:		; GENERIC-LABEL: test_8xdouble_masked_unpack_low_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklpd {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [7:1.00]		; GENERIC-NEXT: vunpcklpd {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]
; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_masked_unpack_low_mem_mask3:		; SKX-LABEL: test_8xdouble_masked_unpack_low_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklpd {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]		; SKX-NEXT: vunpcklpd {{.*#+}} zmm1 {%k1} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]
; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 8, i32 2, i32 10, i32 4, i32 12, i32 6, i32 14>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 0, i32 8, i32 2, i32 10, i32 4, i32 12, i32 6, i32 14>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_8xdouble_zero_masked_unpack_low_mem_mask3(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_zero_masked_unpack_low_mem_mask3(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_zero_masked_unpack_low_mem_mask3:		; GENERIC-LABEL: test_8xdouble_zero_masked_unpack_low_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpcklpd {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [7:1.00]		; GENERIC-NEXT: vunpcklpd {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_zero_masked_unpack_low_mem_mask3:		; SKX-LABEL: test_8xdouble_zero_masked_unpack_low_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpcklpd {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]		; SKX-NEXT: vunpcklpd {{.*#+}} zmm0 {%k1} {z} = zmm0[0],mem[0],zmm0[2],mem[2],zmm0[4],mem[4],zmm0[6],mem[6] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
▲ Show 20 Lines • Show All 190 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x float>, <4 x float>* %vec2p		%vec2 = load <4 x float>, <4 x float>* %vec2p
%res = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 2, i32 6, i32 3, i32 7>		%res = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 2, i32 6, i32 3, i32 7>
ret <4 x float> %res		ret <4 x float> %res
}		}
define <4 x float> @test_4xfloat_masked_unpack_high_mem_mask0(<4 x float> %vec1, <4 x float>* %vec2p, <4 x float> %vec3, <4 x i32> %mask) {		define <4 x float> @test_4xfloat_masked_unpack_high_mem_mask0(<4 x float> %vec1, <4 x float>* %vec2p, <4 x float> %vec3, <4 x i32> %mask) {
; GENERIC-LABEL: test_4xfloat_masked_unpack_high_mem_mask0:		; GENERIC-LABEL: test_4xfloat_masked_unpack_high_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} xmm1 {%k1} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} xmm1 {%k1} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xfloat_masked_unpack_high_mem_mask0:		; SKX-LABEL: test_4xfloat_masked_unpack_high_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} xmm1 {%k1} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} xmm1 {%k1} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]
; SKX-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x float>, <4 x float>* %vec2p		%vec2 = load <4 x float>, <4 x float>* %vec2p
%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 2, i32 6, i32 3, i32 7>		%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 2, i32 6, i32 3, i32 7>
%cmp = icmp eq <4 x i32> %mask, zeroinitializer		%cmp = icmp eq <4 x i32> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> %vec3		%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> %vec3
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_4xfloat_zero_masked_unpack_high_mem_mask0(<4 x float> %vec1, <4 x float>* %vec2p, <4 x i32> %mask) {		define <4 x float> @test_4xfloat_zero_masked_unpack_high_mem_mask0(<4 x float> %vec1, <4 x float>* %vec2p, <4 x i32> %mask) {
; GENERIC-LABEL: test_4xfloat_zero_masked_unpack_high_mem_mask0:		; GENERIC-LABEL: test_4xfloat_zero_masked_unpack_high_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} xmm0 {%k1} {z} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} xmm0 {%k1} {z} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xfloat_zero_masked_unpack_high_mem_mask0:		; SKX-LABEL: test_4xfloat_zero_masked_unpack_high_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} xmm0 {%k1} {z} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} xmm0 {%k1} {z} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x float>, <4 x float>* %vec2p		%vec2 = load <4 x float>, <4 x float>* %vec2p
%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 2, i32 6, i32 3, i32 7>		%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 2, i32 6, i32 3, i32 7>
%cmp = icmp eq <4 x i32> %mask, zeroinitializer		%cmp = icmp eq <4 x i32> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> zeroinitializer		%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> zeroinitializer
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_4xfloat_masked_unpack_high_mem_mask1(<4 x float> %vec1, <4 x float>* %vec2p, <4 x float> %vec3, <4 x i32> %mask) {		define <4 x float> @test_4xfloat_masked_unpack_high_mem_mask1(<4 x float> %vec1, <4 x float>* %vec2p, <4 x float> %vec3, <4 x i32> %mask) {
; GENERIC-LABEL: test_4xfloat_masked_unpack_high_mem_mask1:		; GENERIC-LABEL: test_4xfloat_masked_unpack_high_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} xmm1 {%k1} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} xmm1 {%k1} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xfloat_masked_unpack_high_mem_mask1:		; SKX-LABEL: test_4xfloat_masked_unpack_high_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} xmm1 {%k1} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} xmm1 {%k1} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]
; SKX-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x float>, <4 x float>* %vec2p		%vec2 = load <4 x float>, <4 x float>* %vec2p
%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 2, i32 6, i32 3, i32 7>		%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 2, i32 6, i32 3, i32 7>
%cmp = icmp eq <4 x i32> %mask, zeroinitializer		%cmp = icmp eq <4 x i32> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> %vec3		%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> %vec3
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_4xfloat_zero_masked_unpack_high_mem_mask1(<4 x float> %vec1, <4 x float>* %vec2p, <4 x i32> %mask) {		define <4 x float> @test_4xfloat_zero_masked_unpack_high_mem_mask1(<4 x float> %vec1, <4 x float>* %vec2p, <4 x i32> %mask) {
; GENERIC-LABEL: test_4xfloat_zero_masked_unpack_high_mem_mask1:		; GENERIC-LABEL: test_4xfloat_zero_masked_unpack_high_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} xmm0 {%k1} {z} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} xmm0 {%k1} {z} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xfloat_zero_masked_unpack_high_mem_mask1:		; SKX-LABEL: test_4xfloat_zero_masked_unpack_high_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} xmm0 {%k1} {z} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} xmm0 {%k1} {z} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x float>, <4 x float>* %vec2p		%vec2 = load <4 x float>, <4 x float>* %vec2p
%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 2, i32 6, i32 3, i32 7>		%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 2, i32 6, i32 3, i32 7>
%cmp = icmp eq <4 x i32> %mask, zeroinitializer		%cmp = icmp eq <4 x i32> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> zeroinitializer		%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> zeroinitializer
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_4xfloat_masked_unpack_high_mem_mask2(<4 x float> %vec1, <4 x float>* %vec2p, <4 x float> %vec3, <4 x i32> %mask) {		define <4 x float> @test_4xfloat_masked_unpack_high_mem_mask2(<4 x float> %vec1, <4 x float>* %vec2p, <4 x float> %vec3, <4 x i32> %mask) {
; GENERIC-LABEL: test_4xfloat_masked_unpack_high_mem_mask2:		; GENERIC-LABEL: test_4xfloat_masked_unpack_high_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} xmm1 {%k1} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} xmm1 {%k1} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xfloat_masked_unpack_high_mem_mask2:		; SKX-LABEL: test_4xfloat_masked_unpack_high_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} xmm1 {%k1} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} xmm1 {%k1} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]
; SKX-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x float>, <4 x float>* %vec2p		%vec2 = load <4 x float>, <4 x float>* %vec2p
%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 2, i32 6, i32 3, i32 7>		%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 2, i32 6, i32 3, i32 7>
%cmp = icmp eq <4 x i32> %mask, zeroinitializer		%cmp = icmp eq <4 x i32> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> %vec3		%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> %vec3
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_4xfloat_zero_masked_unpack_high_mem_mask2(<4 x float> %vec1, <4 x float>* %vec2p, <4 x i32> %mask) {		define <4 x float> @test_4xfloat_zero_masked_unpack_high_mem_mask2(<4 x float> %vec1, <4 x float>* %vec2p, <4 x i32> %mask) {
; GENERIC-LABEL: test_4xfloat_zero_masked_unpack_high_mem_mask2:		; GENERIC-LABEL: test_4xfloat_zero_masked_unpack_high_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} xmm0 {%k1} {z} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} xmm0 {%k1} {z} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xfloat_zero_masked_unpack_high_mem_mask2:		; SKX-LABEL: test_4xfloat_zero_masked_unpack_high_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} xmm0 {%k1} {z} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} xmm0 {%k1} {z} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x float>, <4 x float>* %vec2p		%vec2 = load <4 x float>, <4 x float>* %vec2p
Show All 16 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x float>, <4 x float>* %vec2p		%vec2 = load <4 x float>, <4 x float>* %vec2p
%res = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 2, i32 6, i32 3, i32 7>		%res = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 2, i32 6, i32 3, i32 7>
ret <4 x float> %res		ret <4 x float> %res
}		}
define <4 x float> @test_4xfloat_masked_unpack_high_mem_mask3(<4 x float> %vec1, <4 x float>* %vec2p, <4 x float> %vec3, <4 x i32> %mask) {		define <4 x float> @test_4xfloat_masked_unpack_high_mem_mask3(<4 x float> %vec1, <4 x float>* %vec2p, <4 x float> %vec3, <4 x i32> %mask) {
; GENERIC-LABEL: test_4xfloat_masked_unpack_high_mem_mask3:		; GENERIC-LABEL: test_4xfloat_masked_unpack_high_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} xmm1 {%k1} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} xmm1 {%k1} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xfloat_masked_unpack_high_mem_mask3:		; SKX-LABEL: test_4xfloat_masked_unpack_high_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm2, %xmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} xmm1 {%k1} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} xmm1 {%k1} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]
; SKX-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %xmm1, %xmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x float>, <4 x float>* %vec2p		%vec2 = load <4 x float>, <4 x float>* %vec2p
%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 2, i32 6, i32 3, i32 7>		%shuf = shufflevector <4 x float> %vec1, <4 x float> %vec2, <4 x i32> <i32 2, i32 6, i32 3, i32 7>
%cmp = icmp eq <4 x i32> %mask, zeroinitializer		%cmp = icmp eq <4 x i32> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> %vec3		%res = select <4 x i1> %cmp, <4 x float> %shuf, <4 x float> %vec3
ret <4 x float> %res		ret <4 x float> %res
}		}

define <4 x float> @test_4xfloat_zero_masked_unpack_high_mem_mask3(<4 x float> %vec1, <4 x float>* %vec2p, <4 x i32> %mask) {		define <4 x float> @test_4xfloat_zero_masked_unpack_high_mem_mask3(<4 x float> %vec1, <4 x float>* %vec2p, <4 x i32> %mask) {
; GENERIC-LABEL: test_4xfloat_zero_masked_unpack_high_mem_mask3:		; GENERIC-LABEL: test_4xfloat_zero_masked_unpack_high_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} xmm0 {%k1} {z} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} xmm0 {%k1} {z} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xfloat_zero_masked_unpack_high_mem_mask3:		; SKX-LABEL: test_4xfloat_zero_masked_unpack_high_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} xmm0 {%k1} {z} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} xmm0 {%k1} {z} = xmm0[2],mem[2],xmm0[3],mem[3] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x float>, <4 x float>* %vec2p		%vec2 = load <4 x float>, <4 x float>* %vec2p
▲ Show 20 Lines • Show All 190 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%res = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>		%res = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>
ret <8 x float> %res		ret <8 x float> %res
}		}
define <8 x float> @test_8xfloat_masked_unpack_high_mem_mask0(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_masked_unpack_high_mem_mask0(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_masked_unpack_high_mem_mask0:		; GENERIC-LABEL: test_8xfloat_masked_unpack_high_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} ymm1 {%k1} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} ymm1 {%k1} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_masked_unpack_high_mem_mask0:		; SKX-LABEL: test_8xfloat_masked_unpack_high_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} ymm1 {%k1} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} ymm1 {%k1} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]
; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>		%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_8xfloat_zero_masked_unpack_high_mem_mask0(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_zero_masked_unpack_high_mem_mask0(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_zero_masked_unpack_high_mem_mask0:		; GENERIC-LABEL: test_8xfloat_zero_masked_unpack_high_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} ymm0 {%k1} {z} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} ymm0 {%k1} {z} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_zero_masked_unpack_high_mem_mask0:		; SKX-LABEL: test_8xfloat_zero_masked_unpack_high_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} ymm0 {%k1} {z} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} ymm0 {%k1} {z} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>		%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> zeroinitializer		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> zeroinitializer
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_8xfloat_masked_unpack_high_mem_mask1(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_masked_unpack_high_mem_mask1(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_masked_unpack_high_mem_mask1:		; GENERIC-LABEL: test_8xfloat_masked_unpack_high_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} ymm1 {%k1} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} ymm1 {%k1} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_masked_unpack_high_mem_mask1:		; SKX-LABEL: test_8xfloat_masked_unpack_high_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} ymm1 {%k1} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} ymm1 {%k1} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]
; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>		%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_8xfloat_zero_masked_unpack_high_mem_mask1(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_zero_masked_unpack_high_mem_mask1(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_zero_masked_unpack_high_mem_mask1:		; GENERIC-LABEL: test_8xfloat_zero_masked_unpack_high_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} ymm0 {%k1} {z} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} ymm0 {%k1} {z} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_zero_masked_unpack_high_mem_mask1:		; SKX-LABEL: test_8xfloat_zero_masked_unpack_high_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} ymm0 {%k1} {z} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} ymm0 {%k1} {z} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>		%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> zeroinitializer		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> zeroinitializer
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_8xfloat_masked_unpack_high_mem_mask2(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_masked_unpack_high_mem_mask2(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_masked_unpack_high_mem_mask2:		; GENERIC-LABEL: test_8xfloat_masked_unpack_high_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} ymm1 {%k1} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} ymm1 {%k1} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_masked_unpack_high_mem_mask2:		; SKX-LABEL: test_8xfloat_masked_unpack_high_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} ymm1 {%k1} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} ymm1 {%k1} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]
; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>		%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_8xfloat_zero_masked_unpack_high_mem_mask2(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_zero_masked_unpack_high_mem_mask2(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_zero_masked_unpack_high_mem_mask2:		; GENERIC-LABEL: test_8xfloat_zero_masked_unpack_high_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} ymm0 {%k1} {z} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} ymm0 {%k1} {z} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_zero_masked_unpack_high_mem_mask2:		; SKX-LABEL: test_8xfloat_zero_masked_unpack_high_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} ymm0 {%k1} {z} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} ymm0 {%k1} {z} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
Show All 16 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%res = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>		%res = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>
ret <8 x float> %res		ret <8 x float> %res
}		}
define <8 x float> @test_8xfloat_masked_unpack_high_mem_mask3(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_masked_unpack_high_mem_mask3(<8 x float> %vec1, <8 x float>* %vec2p, <8 x float> %vec3, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_masked_unpack_high_mem_mask3:		; GENERIC-LABEL: test_8xfloat_masked_unpack_high_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} ymm1 {%k1} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} ymm1 {%k1} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_masked_unpack_high_mem_mask3:		; SKX-LABEL: test_8xfloat_masked_unpack_high_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} ymm1 {%k1} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} ymm1 {%k1} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]
; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>		%shuf = shufflevector <8 x float> %vec1, <8 x float> %vec2, <8 x i32> <i32 2, i32 10, i32 3, i32 11, i32 6, i32 14, i32 7, i32 15>
%cmp = icmp eq <8 x i32> %mask, zeroinitializer		%cmp = icmp eq <8 x i32> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3		%res = select <8 x i1> %cmp, <8 x float> %shuf, <8 x float> %vec3
ret <8 x float> %res		ret <8 x float> %res
}		}

define <8 x float> @test_8xfloat_zero_masked_unpack_high_mem_mask3(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {		define <8 x float> @test_8xfloat_zero_masked_unpack_high_mem_mask3(<8 x float> %vec1, <8 x float>* %vec2p, <8 x i32> %mask) {
; GENERIC-LABEL: test_8xfloat_zero_masked_unpack_high_mem_mask3:		; GENERIC-LABEL: test_8xfloat_zero_masked_unpack_high_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} ymm0 {%k1} {z} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} ymm0 {%k1} {z} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xfloat_zero_masked_unpack_high_mem_mask3:		; SKX-LABEL: test_8xfloat_zero_masked_unpack_high_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} ymm0 {%k1} {z} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} ymm0 {%k1} {z} = ymm0[2],mem[2],ymm0[3],mem[3],ymm0[6],mem[6],ymm0[7],mem[7] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x float>, <8 x float>* %vec2p		%vec2 = load <8 x float>, <8 x float>* %vec2p
▲ Show 20 Lines • Show All 175 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer
ret <16 x float> %res		ret <16 x float> %res
}		}
define <16 x float> @test_16xfloat_unpack_high_mem_mask0(<16 x float> %vec1, <16 x float>* %vec2p) {		define <16 x float> @test_16xfloat_unpack_high_mem_mask0(<16 x float> %vec1, <16 x float>* %vec2p) {
; GENERIC-LABEL: test_16xfloat_unpack_high_mem_mask0:		; GENERIC-LABEL: test_16xfloat_unpack_high_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vunpckhps {{.*#+}} zmm0 = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} zmm0 = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_unpack_high_mem_mask0:		; SKX-LABEL: test_16xfloat_unpack_high_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vunpckhps {{.*#+}} zmm0 = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} zmm0 = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%res = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>		%res = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>
ret <16 x float> %res		ret <16 x float> %res
}		}
define <16 x float> @test_16xfloat_masked_unpack_high_mem_mask0(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_masked_unpack_high_mem_mask0(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_masked_unpack_high_mem_mask0:		; GENERIC-LABEL: test_16xfloat_masked_unpack_high_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} zmm1 {%k1} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} zmm1 {%k1} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_masked_unpack_high_mem_mask0:		; SKX-LABEL: test_16xfloat_masked_unpack_high_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} zmm1 {%k1} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} zmm1 {%k1} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]
; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_16xfloat_zero_masked_unpack_high_mem_mask0(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_zero_masked_unpack_high_mem_mask0(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_zero_masked_unpack_high_mem_mask0:		; GENERIC-LABEL: test_16xfloat_zero_masked_unpack_high_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} zmm0 {%k1} {z} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} zmm0 {%k1} {z} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_zero_masked_unpack_high_mem_mask0:		; SKX-LABEL: test_16xfloat_zero_masked_unpack_high_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} zmm0 {%k1} {z} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} zmm0 {%k1} {z} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_16xfloat_masked_unpack_high_mem_mask1(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_masked_unpack_high_mem_mask1(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_masked_unpack_high_mem_mask1:		; GENERIC-LABEL: test_16xfloat_masked_unpack_high_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} zmm1 {%k1} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} zmm1 {%k1} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_masked_unpack_high_mem_mask1:		; SKX-LABEL: test_16xfloat_masked_unpack_high_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} zmm1 {%k1} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} zmm1 {%k1} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]
; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_16xfloat_zero_masked_unpack_high_mem_mask1(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_zero_masked_unpack_high_mem_mask1(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_zero_masked_unpack_high_mem_mask1:		; GENERIC-LABEL: test_16xfloat_zero_masked_unpack_high_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} zmm0 {%k1} {z} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} zmm0 {%k1} {z} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_zero_masked_unpack_high_mem_mask1:		; SKX-LABEL: test_16xfloat_zero_masked_unpack_high_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} zmm0 {%k1} {z} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} zmm0 {%k1} {z} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_16xfloat_masked_unpack_high_mem_mask2(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_masked_unpack_high_mem_mask2(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_masked_unpack_high_mem_mask2:		; GENERIC-LABEL: test_16xfloat_masked_unpack_high_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} zmm1 {%k1} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} zmm1 {%k1} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_masked_unpack_high_mem_mask2:		; SKX-LABEL: test_16xfloat_masked_unpack_high_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} zmm1 {%k1} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} zmm1 {%k1} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]
; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_16xfloat_zero_masked_unpack_high_mem_mask2(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_zero_masked_unpack_high_mem_mask2(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_zero_masked_unpack_high_mem_mask2:		; GENERIC-LABEL: test_16xfloat_zero_masked_unpack_high_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} zmm0 {%k1} {z} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} zmm0 {%k1} {z} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_zero_masked_unpack_high_mem_mask2:		; SKX-LABEL: test_16xfloat_zero_masked_unpack_high_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} zmm0 {%k1} {z} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} zmm0 {%k1} {z} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> zeroinitializer
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_16xfloat_unpack_high_mem_mask3(<16 x float> %vec1, <16 x float>* %vec2p) {		define <16 x float> @test_16xfloat_unpack_high_mem_mask3(<16 x float> %vec1, <16 x float>* %vec2p) {
; GENERIC-LABEL: test_16xfloat_unpack_high_mem_mask3:		; GENERIC-LABEL: test_16xfloat_unpack_high_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vunpckhps {{.*#+}} zmm0 = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} zmm0 = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_unpack_high_mem_mask3:		; SKX-LABEL: test_16xfloat_unpack_high_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vunpckhps {{.*#+}} zmm0 = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} zmm0 = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%res = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>		%res = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>
ret <16 x float> %res		ret <16 x float> %res
}		}
define <16 x float> @test_16xfloat_masked_unpack_high_mem_mask3(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_masked_unpack_high_mem_mask3(<16 x float> %vec1, <16 x float>* %vec2p, <16 x float> %vec3, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_masked_unpack_high_mem_mask3:		; GENERIC-LABEL: test_16xfloat_masked_unpack_high_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} zmm1 {%k1} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} zmm1 {%k1} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]
; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_masked_unpack_high_mem_mask3:		; SKX-LABEL: test_16xfloat_masked_unpack_high_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} zmm1 {%k1} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} zmm1 {%k1} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]
; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovaps %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>		%shuf = shufflevector <16 x float> %vec1, <16 x float> %vec2, <16 x i32> <i32 2, i32 18, i32 3, i32 19, i32 6, i32 22, i32 7, i32 23, i32 10, i32 26, i32 11, i32 27, i32 14, i32 30, i32 15, i32 31>
%cmp = icmp eq <16 x i32> %mask, zeroinitializer		%cmp = icmp eq <16 x i32> %mask, zeroinitializer
%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3		%res = select <16 x i1> %cmp, <16 x float> %shuf, <16 x float> %vec3
ret <16 x float> %res		ret <16 x float> %res
}		}

define <16 x float> @test_16xfloat_zero_masked_unpack_high_mem_mask3(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {		define <16 x float> @test_16xfloat_zero_masked_unpack_high_mem_mask3(<16 x float> %vec1, <16 x float>* %vec2p, <16 x i32> %mask) {
; GENERIC-LABEL: test_16xfloat_zero_masked_unpack_high_mem_mask3:		; GENERIC-LABEL: test_16xfloat_zero_masked_unpack_high_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhps {{.*#+}} zmm0 {%k1} {z} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [7:1.00]		; GENERIC-NEXT: vunpckhps {{.*#+}} zmm0 {%k1} {z} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_16xfloat_zero_masked_unpack_high_mem_mask3:		; SKX-LABEL: test_16xfloat_zero_masked_unpack_high_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmd %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhps {{.*#+}} zmm0 {%k1} {z} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]		; SKX-NEXT: vunpckhps {{.*#+}} zmm0 {%k1} {z} = zmm0[2],mem[2],zmm0[3],mem[3],zmm0[6],mem[6],zmm0[7],mem[7],zmm0[10],mem[10],zmm0[11],mem[11],zmm0[14],mem[14],zmm0[15],mem[15] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <16 x float>, <16 x float>* %vec2p		%vec2 = load <16 x float>, <16 x float>* %vec2p
▲ Show 20 Lines • Show All 103 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <2 x double>, <2 x double>* %vec2p		%vec2 = load <2 x double>, <2 x double>* %vec2p
%res = shufflevector <2 x double> %vec1, <2 x double> %vec2, <2 x i32> <i32 1, i32 3>		%res = shufflevector <2 x double> %vec1, <2 x double> %vec2, <2 x i32> <i32 1, i32 3>
ret <2 x double> %res		ret <2 x double> %res
}		}
define <2 x double> @test_2xdouble_masked_unpack_high_mem_mask0(<2 x double> %vec1, <2 x double>* %vec2p, <2 x double> %vec3, <2 x i64> %mask) {		define <2 x double> @test_2xdouble_masked_unpack_high_mem_mask0(<2 x double> %vec1, <2 x double>* %vec2p, <2 x double> %vec3, <2 x i64> %mask) {
; GENERIC-LABEL: test_2xdouble_masked_unpack_high_mem_mask0:		; GENERIC-LABEL: test_2xdouble_masked_unpack_high_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %xmm2, %xmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %xmm2, %xmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhpd {{.*#+}} xmm1 {%k1} = xmm0[1],mem[1] sched: [7:1.00]		; GENERIC-NEXT: vunpckhpd {{.*#+}} xmm1 {%k1} = xmm0[1],mem[1] sched: [8:1.00]
; GENERIC-NEXT: vmovapd %xmm1, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %xmm1, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_2xdouble_masked_unpack_high_mem_mask0:		; SKX-LABEL: test_2xdouble_masked_unpack_high_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %xmm2, %xmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %xmm2, %xmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhpd {{.*#+}} xmm1 {%k1} = xmm0[1],mem[1] sched: [7:1.00]		; SKX-NEXT: vunpckhpd {{.*#+}} xmm1 {%k1} = xmm0[1],mem[1] sched: [7:1.00]
; SKX-NEXT: vmovapd %xmm1, %xmm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %xmm1, %xmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <2 x double>, <2 x double>* %vec2p		%vec2 = load <2 x double>, <2 x double>* %vec2p
%shuf = shufflevector <2 x double> %vec1, <2 x double> %vec2, <2 x i32> <i32 1, i32 3>		%shuf = shufflevector <2 x double> %vec1, <2 x double> %vec2, <2 x i32> <i32 1, i32 3>
%cmp = icmp eq <2 x i64> %mask, zeroinitializer		%cmp = icmp eq <2 x i64> %mask, zeroinitializer
%res = select <2 x i1> %cmp, <2 x double> %shuf, <2 x double> %vec3		%res = select <2 x i1> %cmp, <2 x double> %shuf, <2 x double> %vec3
ret <2 x double> %res		ret <2 x double> %res
}		}

define <2 x double> @test_2xdouble_zero_masked_unpack_high_mem_mask0(<2 x double> %vec1, <2 x double>* %vec2p, <2 x i64> %mask) {		define <2 x double> @test_2xdouble_zero_masked_unpack_high_mem_mask0(<2 x double> %vec1, <2 x double>* %vec2p, <2 x i64> %mask) {
; GENERIC-LABEL: test_2xdouble_zero_masked_unpack_high_mem_mask0:		; GENERIC-LABEL: test_2xdouble_zero_masked_unpack_high_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhpd {{.*#+}} xmm0 {%k1} {z} = xmm0[1],mem[1] sched: [7:1.00]		; GENERIC-NEXT: vunpckhpd {{.*#+}} xmm0 {%k1} {z} = xmm0[1],mem[1] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_2xdouble_zero_masked_unpack_high_mem_mask0:		; SKX-LABEL: test_2xdouble_zero_masked_unpack_high_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhpd {{.*#+}} xmm0 {%k1} {z} = xmm0[1],mem[1] sched: [7:1.00]		; SKX-NEXT: vunpckhpd {{.*#+}} xmm0 {%k1} {z} = xmm0[1],mem[1] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <2 x double>, <2 x double>* %vec2p		%vec2 = load <2 x double>, <2 x double>* %vec2p
%shuf = shufflevector <2 x double> %vec1, <2 x double> %vec2, <2 x i32> <i32 1, i32 3>		%shuf = shufflevector <2 x double> %vec1, <2 x double> %vec2, <2 x i32> <i32 1, i32 3>
%cmp = icmp eq <2 x i64> %mask, zeroinitializer		%cmp = icmp eq <2 x i64> %mask, zeroinitializer
%res = select <2 x i1> %cmp, <2 x double> %shuf, <2 x double> zeroinitializer		%res = select <2 x i1> %cmp, <2 x double> %shuf, <2 x double> zeroinitializer
ret <2 x double> %res		ret <2 x double> %res
}		}

define <2 x double> @test_2xdouble_masked_unpack_high_mem_mask1(<2 x double> %vec1, <2 x double>* %vec2p, <2 x double> %vec3, <2 x i64> %mask) {		define <2 x double> @test_2xdouble_masked_unpack_high_mem_mask1(<2 x double> %vec1, <2 x double>* %vec2p, <2 x double> %vec3, <2 x i64> %mask) {
; GENERIC-LABEL: test_2xdouble_masked_unpack_high_mem_mask1:		; GENERIC-LABEL: test_2xdouble_masked_unpack_high_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %xmm2, %xmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %xmm2, %xmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhpd {{.*#+}} xmm1 {%k1} = xmm0[1],mem[1] sched: [7:1.00]		; GENERIC-NEXT: vunpckhpd {{.*#+}} xmm1 {%k1} = xmm0[1],mem[1] sched: [8:1.00]
; GENERIC-NEXT: vmovapd %xmm1, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %xmm1, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_2xdouble_masked_unpack_high_mem_mask1:		; SKX-LABEL: test_2xdouble_masked_unpack_high_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %xmm2, %xmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %xmm2, %xmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhpd {{.*#+}} xmm1 {%k1} = xmm0[1],mem[1] sched: [7:1.00]		; SKX-NEXT: vunpckhpd {{.*#+}} xmm1 {%k1} = xmm0[1],mem[1] sched: [7:1.00]
; SKX-NEXT: vmovapd %xmm1, %xmm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %xmm1, %xmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <2 x double>, <2 x double>* %vec2p		%vec2 = load <2 x double>, <2 x double>* %vec2p
%shuf = shufflevector <2 x double> %vec1, <2 x double> %vec2, <2 x i32> <i32 1, i32 3>		%shuf = shufflevector <2 x double> %vec1, <2 x double> %vec2, <2 x i32> <i32 1, i32 3>
%cmp = icmp eq <2 x i64> %mask, zeroinitializer		%cmp = icmp eq <2 x i64> %mask, zeroinitializer
%res = select <2 x i1> %cmp, <2 x double> %shuf, <2 x double> %vec3		%res = select <2 x i1> %cmp, <2 x double> %shuf, <2 x double> %vec3
ret <2 x double> %res		ret <2 x double> %res
}		}

define <2 x double> @test_2xdouble_zero_masked_unpack_high_mem_mask1(<2 x double> %vec1, <2 x double>* %vec2p, <2 x i64> %mask) {		define <2 x double> @test_2xdouble_zero_masked_unpack_high_mem_mask1(<2 x double> %vec1, <2 x double>* %vec2p, <2 x i64> %mask) {
; GENERIC-LABEL: test_2xdouble_zero_masked_unpack_high_mem_mask1:		; GENERIC-LABEL: test_2xdouble_zero_masked_unpack_high_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %xmm1, %xmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %xmm1, %xmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhpd {{.*#+}} xmm0 {%k1} {z} = xmm0[1],mem[1] sched: [7:1.00]		; GENERIC-NEXT: vunpckhpd {{.*#+}} xmm0 {%k1} {z} = xmm0[1],mem[1] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_2xdouble_zero_masked_unpack_high_mem_mask1:		; SKX-LABEL: test_2xdouble_zero_masked_unpack_high_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %xmm1, %xmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %xmm1, %xmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhpd {{.*#+}} xmm0 {%k1} {z} = xmm0[1],mem[1] sched: [7:1.00]		; SKX-NEXT: vunpckhpd {{.*#+}} xmm0 {%k1} {z} = xmm0[1],mem[1] sched: [7:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <2 x double>, <2 x double>* %vec2p		%vec2 = load <2 x double>, <2 x double>* %vec2p
▲ Show 20 Lines • Show All 190 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%res = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 1, i32 5, i32 3, i32 7>		%res = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 1, i32 5, i32 3, i32 7>
ret <4 x double> %res		ret <4 x double> %res
}		}
define <4 x double> @test_4xdouble_masked_unpack_high_mem_mask0(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_masked_unpack_high_mem_mask0(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_masked_unpack_high_mem_mask0:		; GENERIC-LABEL: test_4xdouble_masked_unpack_high_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhpd {{.*#+}} ymm1 {%k1} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [7:1.00]		; GENERIC-NEXT: vunpckhpd {{.*#+}} ymm1 {%k1} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]
; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_masked_unpack_high_mem_mask0:		; SKX-LABEL: test_4xdouble_masked_unpack_high_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhpd {{.*#+}} ymm1 {%k1} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]		; SKX-NEXT: vunpckhpd {{.*#+}} ymm1 {%k1} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]
; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 1, i32 5, i32 3, i32 7>		%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 1, i32 5, i32 3, i32 7>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_4xdouble_zero_masked_unpack_high_mem_mask0(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_zero_masked_unpack_high_mem_mask0(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_zero_masked_unpack_high_mem_mask0:		; GENERIC-LABEL: test_4xdouble_zero_masked_unpack_high_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhpd {{.*#+}} ymm0 {%k1} {z} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [7:1.00]		; GENERIC-NEXT: vunpckhpd {{.*#+}} ymm0 {%k1} {z} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_zero_masked_unpack_high_mem_mask0:		; SKX-LABEL: test_4xdouble_zero_masked_unpack_high_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhpd {{.*#+}} ymm0 {%k1} {z} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]		; SKX-NEXT: vunpckhpd {{.*#+}} ymm0 {%k1} {z} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 1, i32 5, i32 3, i32 7>		%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 1, i32 5, i32 3, i32 7>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> zeroinitializer		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> zeroinitializer
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_4xdouble_masked_unpack_high_mem_mask1(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_masked_unpack_high_mem_mask1(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_masked_unpack_high_mem_mask1:		; GENERIC-LABEL: test_4xdouble_masked_unpack_high_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhpd {{.*#+}} ymm1 {%k1} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [7:1.00]		; GENERIC-NEXT: vunpckhpd {{.*#+}} ymm1 {%k1} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]
; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_masked_unpack_high_mem_mask1:		; SKX-LABEL: test_4xdouble_masked_unpack_high_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhpd {{.*#+}} ymm1 {%k1} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]		; SKX-NEXT: vunpckhpd {{.*#+}} ymm1 {%k1} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]
; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 1, i32 5, i32 3, i32 7>		%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 1, i32 5, i32 3, i32 7>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_4xdouble_zero_masked_unpack_high_mem_mask1(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_zero_masked_unpack_high_mem_mask1(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_zero_masked_unpack_high_mem_mask1:		; GENERIC-LABEL: test_4xdouble_zero_masked_unpack_high_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhpd {{.*#+}} ymm0 {%k1} {z} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [7:1.00]		; GENERIC-NEXT: vunpckhpd {{.*#+}} ymm0 {%k1} {z} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_zero_masked_unpack_high_mem_mask1:		; SKX-LABEL: test_4xdouble_zero_masked_unpack_high_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhpd {{.*#+}} ymm0 {%k1} {z} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]		; SKX-NEXT: vunpckhpd {{.*#+}} ymm0 {%k1} {z} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 1, i32 5, i32 3, i32 7>		%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 1, i32 5, i32 3, i32 7>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> zeroinitializer		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> zeroinitializer
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_4xdouble_masked_unpack_high_mem_mask2(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_masked_unpack_high_mem_mask2(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_masked_unpack_high_mem_mask2:		; GENERIC-LABEL: test_4xdouble_masked_unpack_high_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhpd {{.*#+}} ymm1 {%k1} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [7:1.00]		; GENERIC-NEXT: vunpckhpd {{.*#+}} ymm1 {%k1} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]
; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_masked_unpack_high_mem_mask2:		; SKX-LABEL: test_4xdouble_masked_unpack_high_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhpd {{.*#+}} ymm1 {%k1} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]		; SKX-NEXT: vunpckhpd {{.*#+}} ymm1 {%k1} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]
; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 1, i32 5, i32 3, i32 7>		%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 1, i32 5, i32 3, i32 7>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_4xdouble_zero_masked_unpack_high_mem_mask2(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_zero_masked_unpack_high_mem_mask2(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_zero_masked_unpack_high_mem_mask2:		; GENERIC-LABEL: test_4xdouble_zero_masked_unpack_high_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhpd {{.*#+}} ymm0 {%k1} {z} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [7:1.00]		; GENERIC-NEXT: vunpckhpd {{.*#+}} ymm0 {%k1} {z} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_zero_masked_unpack_high_mem_mask2:		; SKX-LABEL: test_4xdouble_zero_masked_unpack_high_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhpd {{.*#+}} ymm0 {%k1} {z} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]		; SKX-NEXT: vunpckhpd {{.*#+}} ymm0 {%k1} {z} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
Show All 16 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%res = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 1, i32 5, i32 3, i32 7>		%res = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 1, i32 5, i32 3, i32 7>
ret <4 x double> %res		ret <4 x double> %res
}		}
define <4 x double> @test_4xdouble_masked_unpack_high_mem_mask3(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_masked_unpack_high_mem_mask3(<4 x double> %vec1, <4 x double>* %vec2p, <4 x double> %vec3, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_masked_unpack_high_mem_mask3:		; GENERIC-LABEL: test_4xdouble_masked_unpack_high_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhpd {{.*#+}} ymm1 {%k1} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [7:1.00]		; GENERIC-NEXT: vunpckhpd {{.*#+}} ymm1 {%k1} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]
; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_masked_unpack_high_mem_mask3:		; SKX-LABEL: test_4xdouble_masked_unpack_high_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm2, %ymm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhpd {{.*#+}} ymm1 {%k1} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]		; SKX-NEXT: vunpckhpd {{.*#+}} ymm1 {%k1} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]
; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %ymm1, %ymm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 1, i32 5, i32 3, i32 7>		%shuf = shufflevector <4 x double> %vec1, <4 x double> %vec2, <4 x i32> <i32 1, i32 5, i32 3, i32 7>
%cmp = icmp eq <4 x i64> %mask, zeroinitializer		%cmp = icmp eq <4 x i64> %mask, zeroinitializer
%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3		%res = select <4 x i1> %cmp, <4 x double> %shuf, <4 x double> %vec3
ret <4 x double> %res		ret <4 x double> %res
}		}

define <4 x double> @test_4xdouble_zero_masked_unpack_high_mem_mask3(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {		define <4 x double> @test_4xdouble_zero_masked_unpack_high_mem_mask3(<4 x double> %vec1, <4 x double>* %vec2p, <4 x i64> %mask) {
; GENERIC-LABEL: test_4xdouble_zero_masked_unpack_high_mem_mask3:		; GENERIC-LABEL: test_4xdouble_zero_masked_unpack_high_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhpd {{.*#+}} ymm0 {%k1} {z} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [7:1.00]		; GENERIC-NEXT: vunpckhpd {{.*#+}} ymm0 {%k1} {z} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_4xdouble_zero_masked_unpack_high_mem_mask3:		; SKX-LABEL: test_4xdouble_zero_masked_unpack_high_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %ymm1, %ymm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhpd {{.*#+}} ymm0 {%k1} {z} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]		; SKX-NEXT: vunpckhpd {{.*#+}} ymm0 {%k1} {z} = ymm0[1],mem[1],ymm0[3],mem[3] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <4 x double>, <4 x double>* %vec2p		%vec2 = load <4 x double>, <4 x double>* %vec2p
▲ Show 20 Lines • Show All 175 Lines • ▼ Show 20 Lines	; SKX-NEXT: retq # sched: [7:1.00]
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 1, i32 9, i32 3, i32 11, i32 5, i32 13, i32 7, i32 15>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 1, i32 9, i32 3, i32 11, i32 5, i32 13, i32 7, i32 15>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer
ret <8 x double> %res		ret <8 x double> %res
}		}
define <8 x double> @test_8xdouble_unpack_high_mem_mask0(<8 x double> %vec1, <8 x double>* %vec2p) {		define <8 x double> @test_8xdouble_unpack_high_mem_mask0(<8 x double> %vec1, <8 x double>* %vec2p) {
; GENERIC-LABEL: test_8xdouble_unpack_high_mem_mask0:		; GENERIC-LABEL: test_8xdouble_unpack_high_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vunpckhpd {{.*#+}} zmm0 = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [7:1.00]		; GENERIC-NEXT: vunpckhpd {{.*#+}} zmm0 = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_unpack_high_mem_mask0:		; SKX-LABEL: test_8xdouble_unpack_high_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vunpckhpd {{.*#+}} zmm0 = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]		; SKX-NEXT: vunpckhpd {{.*#+}} zmm0 = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%res = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 1, i32 9, i32 3, i32 11, i32 5, i32 13, i32 7, i32 15>		%res = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 1, i32 9, i32 3, i32 11, i32 5, i32 13, i32 7, i32 15>
ret <8 x double> %res		ret <8 x double> %res
}		}
define <8 x double> @test_8xdouble_masked_unpack_high_mem_mask0(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_masked_unpack_high_mem_mask0(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_masked_unpack_high_mem_mask0:		; GENERIC-LABEL: test_8xdouble_masked_unpack_high_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhpd {{.*#+}} zmm1 {%k1} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [7:1.00]		; GENERIC-NEXT: vunpckhpd {{.*#+}} zmm1 {%k1} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]
; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_masked_unpack_high_mem_mask0:		; SKX-LABEL: test_8xdouble_masked_unpack_high_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhpd {{.*#+}} zmm1 {%k1} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]		; SKX-NEXT: vunpckhpd {{.*#+}} zmm1 {%k1} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]
; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 1, i32 9, i32 3, i32 11, i32 5, i32 13, i32 7, i32 15>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 1, i32 9, i32 3, i32 11, i32 5, i32 13, i32 7, i32 15>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_8xdouble_zero_masked_unpack_high_mem_mask0(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_zero_masked_unpack_high_mem_mask0(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_zero_masked_unpack_high_mem_mask0:		; GENERIC-LABEL: test_8xdouble_zero_masked_unpack_high_mem_mask0:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhpd {{.*#+}} zmm0 {%k1} {z} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [7:1.00]		; GENERIC-NEXT: vunpckhpd {{.*#+}} zmm0 {%k1} {z} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_zero_masked_unpack_high_mem_mask0:		; SKX-LABEL: test_8xdouble_zero_masked_unpack_high_mem_mask0:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhpd {{.*#+}} zmm0 {%k1} {z} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]		; SKX-NEXT: vunpckhpd {{.*#+}} zmm0 {%k1} {z} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 1, i32 9, i32 3, i32 11, i32 5, i32 13, i32 7, i32 15>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 1, i32 9, i32 3, i32 11, i32 5, i32 13, i32 7, i32 15>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_8xdouble_masked_unpack_high_mem_mask1(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_masked_unpack_high_mem_mask1(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_masked_unpack_high_mem_mask1:		; GENERIC-LABEL: test_8xdouble_masked_unpack_high_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhpd {{.*#+}} zmm1 {%k1} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [7:1.00]		; GENERIC-NEXT: vunpckhpd {{.*#+}} zmm1 {%k1} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]
; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_masked_unpack_high_mem_mask1:		; SKX-LABEL: test_8xdouble_masked_unpack_high_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhpd {{.*#+}} zmm1 {%k1} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]		; SKX-NEXT: vunpckhpd {{.*#+}} zmm1 {%k1} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]
; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 1, i32 9, i32 3, i32 11, i32 5, i32 13, i32 7, i32 15>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 1, i32 9, i32 3, i32 11, i32 5, i32 13, i32 7, i32 15>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_8xdouble_zero_masked_unpack_high_mem_mask1(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_zero_masked_unpack_high_mem_mask1(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_zero_masked_unpack_high_mem_mask1:		; GENERIC-LABEL: test_8xdouble_zero_masked_unpack_high_mem_mask1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhpd {{.*#+}} zmm0 {%k1} {z} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [7:1.00]		; GENERIC-NEXT: vunpckhpd {{.*#+}} zmm0 {%k1} {z} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_zero_masked_unpack_high_mem_mask1:		; SKX-LABEL: test_8xdouble_zero_masked_unpack_high_mem_mask1:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhpd {{.*#+}} zmm0 {%k1} {z} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]		; SKX-NEXT: vunpckhpd {{.*#+}} zmm0 {%k1} {z} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 1, i32 9, i32 3, i32 11, i32 5, i32 13, i32 7, i32 15>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 1, i32 9, i32 3, i32 11, i32 5, i32 13, i32 7, i32 15>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_8xdouble_masked_unpack_high_mem_mask2(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_masked_unpack_high_mem_mask2(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_masked_unpack_high_mem_mask2:		; GENERIC-LABEL: test_8xdouble_masked_unpack_high_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhpd {{.*#+}} zmm1 {%k1} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [7:1.00]		; GENERIC-NEXT: vunpckhpd {{.*#+}} zmm1 {%k1} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]
; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_masked_unpack_high_mem_mask2:		; SKX-LABEL: test_8xdouble_masked_unpack_high_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhpd {{.*#+}} zmm1 {%k1} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]		; SKX-NEXT: vunpckhpd {{.*#+}} zmm1 {%k1} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]
; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 1, i32 9, i32 3, i32 11, i32 5, i32 13, i32 7, i32 15>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 1, i32 9, i32 3, i32 11, i32 5, i32 13, i32 7, i32 15>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_8xdouble_zero_masked_unpack_high_mem_mask2(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_zero_masked_unpack_high_mem_mask2(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_zero_masked_unpack_high_mem_mask2:		; GENERIC-LABEL: test_8xdouble_zero_masked_unpack_high_mem_mask2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhpd {{.*#+}} zmm0 {%k1} {z} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [7:1.00]		; GENERIC-NEXT: vunpckhpd {{.*#+}} zmm0 {%k1} {z} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_zero_masked_unpack_high_mem_mask2:		; SKX-LABEL: test_8xdouble_zero_masked_unpack_high_mem_mask2:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhpd {{.*#+}} zmm0 {%k1} {z} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]		; SKX-NEXT: vunpckhpd {{.*#+}} zmm0 {%k1} {z} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 1, i32 9, i32 3, i32 11, i32 5, i32 13, i32 7, i32 15>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 1, i32 9, i32 3, i32 11, i32 5, i32 13, i32 7, i32 15>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_8xdouble_unpack_high_mem_mask3(<8 x double> %vec1, <8 x double>* %vec2p) {		define <8 x double> @test_8xdouble_unpack_high_mem_mask3(<8 x double> %vec1, <8 x double>* %vec2p) {
; GENERIC-LABEL: test_8xdouble_unpack_high_mem_mask3:		; GENERIC-LABEL: test_8xdouble_unpack_high_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vunpckhpd {{.*#+}} zmm0 = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [7:1.00]		; GENERIC-NEXT: vunpckhpd {{.*#+}} zmm0 = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_unpack_high_mem_mask3:		; SKX-LABEL: test_8xdouble_unpack_high_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vunpckhpd {{.*#+}} zmm0 = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]		; SKX-NEXT: vunpckhpd {{.*#+}} zmm0 = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%res = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 1, i32 9, i32 3, i32 11, i32 5, i32 13, i32 7, i32 15>		%res = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 1, i32 9, i32 3, i32 11, i32 5, i32 13, i32 7, i32 15>
ret <8 x double> %res		ret <8 x double> %res
}		}
define <8 x double> @test_8xdouble_masked_unpack_high_mem_mask3(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_masked_unpack_high_mem_mask3(<8 x double> %vec1, <8 x double>* %vec2p, <8 x double> %vec3, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_masked_unpack_high_mem_mask3:		; GENERIC-LABEL: test_8xdouble_masked_unpack_high_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhpd {{.*#+}} zmm1 {%k1} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [7:1.00]		; GENERIC-NEXT: vunpckhpd {{.*#+}} zmm1 {%k1} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]
; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]		; GENERIC-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_masked_unpack_high_mem_mask3:		; SKX-LABEL: test_8xdouble_masked_unpack_high_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm2, %zmm2, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhpd {{.*#+}} zmm1 {%k1} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]		; SKX-NEXT: vunpckhpd {{.*#+}} zmm1 {%k1} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]
; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]		; SKX-NEXT: vmovapd %zmm1, %zmm0 # sched: [1:0.33]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 1, i32 9, i32 3, i32 11, i32 5, i32 13, i32 7, i32 15>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 1, i32 9, i32 3, i32 11, i32 5, i32 13, i32 7, i32 15>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> %vec3
ret <8 x double> %res		ret <8 x double> %res
}		}

define <8 x double> @test_8xdouble_zero_masked_unpack_high_mem_mask3(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {		define <8 x double> @test_8xdouble_zero_masked_unpack_high_mem_mask3(<8 x double> %vec1, <8 x double>* %vec2p, <8 x i64> %mask) {
; GENERIC-LABEL: test_8xdouble_zero_masked_unpack_high_mem_mask3:		; GENERIC-LABEL: test_8xdouble_zero_masked_unpack_high_mem_mask3:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]		; GENERIC-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [1:1.00]
; GENERIC-NEXT: vunpckhpd {{.*#+}} zmm0 {%k1} {z} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [7:1.00]		; GENERIC-NEXT: vunpckhpd {{.*#+}} zmm0 {%k1} {z} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SKX-LABEL: test_8xdouble_zero_masked_unpack_high_mem_mask3:		; SKX-LABEL: test_8xdouble_zero_masked_unpack_high_mem_mask3:
; SKX: # %bb.0:		; SKX: # %bb.0:
; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]		; SKX-NEXT: vptestnmq %zmm1, %zmm1, %k1 # sched: [3:1.00]
; SKX-NEXT: vunpckhpd {{.*#+}} zmm0 {%k1} {z} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]		; SKX-NEXT: vunpckhpd {{.*#+}} zmm0 {%k1} {z} = zmm0[1],mem[1],zmm0[3],mem[3],zmm0[5],mem[5],zmm0[7],mem[7] sched: [8:1.00]
; SKX-NEXT: retq # sched: [7:1.00]		; SKX-NEXT: retq # sched: [7:1.00]
%vec2 = load <8 x double>, <8 x double>* %vec2p		%vec2 = load <8 x double>, <8 x double>* %vec2p
%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 1, i32 9, i32 3, i32 11, i32 5, i32 13, i32 7, i32 15>		%shuf = shufflevector <8 x double> %vec1, <8 x double> %vec2, <8 x i32> <i32 1, i32 9, i32 3, i32 11, i32 5, i32 13, i32 7, i32 15>
%cmp = icmp eq <8 x i64> %mask, zeroinitializer		%cmp = icmp eq <8 x i64> %mask, zeroinitializer
%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer		%res = select <8 x i1> %cmp, <8 x double> %shuf, <8 x double> zeroinitializer
ret <8 x double> %res		ret <8 x double> %res
}		}

llvm/trunk/test/CodeGen/X86/avx512vpopcntdq-schedule.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=x86-64 -mattr=+avx512vpopcntdq \| FileCheck %s --check-prefix=GENERIC			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=x86-64 -mattr=+avx512vpopcntdq \| FileCheck %s --check-prefix=GENERIC
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=icelake \| FileCheck %s --check-prefix=ICELAKE			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=icelake \| FileCheck %s --check-prefix=ICELAKE

	define void @test_vpopcntd(<16 x i32> %a0, <16 x i32> %a1, <16 x i32> *%a2, i16 %a3) {			define void @test_vpopcntd(<16 x i32> %a0, <16 x i32> %a1, <16 x i32> *%a2, i16 %a3) {
	; GENERIC-LABEL: test_vpopcntd:			; GENERIC-LABEL: test_vpopcntd:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: kmovw %esi, %k1 # sched: [1:0.33]			; GENERIC-NEXT: kmovw %esi, %k1 # sched: [1:0.33]
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vpopcntd %zmm1, %zmm0 # sched: [3:1.00]			; GENERIC-NEXT: vpopcntd %zmm1, %zmm0 # sched: [3:1.00]
	; GENERIC-NEXT: vpopcntd %zmm1, %zmm0 {%k1} # sched: [3:1.00]			; GENERIC-NEXT: vpopcntd %zmm1, %zmm0 {%k1} # sched: [3:1.00]
	; GENERIC-NEXT: vpopcntd %zmm1, %zmm0 {%k1} {z} # sched: [3:1.00]			; GENERIC-NEXT: vpopcntd %zmm1, %zmm0 {%k1} {z} # sched: [3:1.00]
	; GENERIC-NEXT: vpopcntd (%rdi), %zmm0 # sched: [7:1.00]			; GENERIC-NEXT: vpopcntd (%rdi), %zmm0 # sched: [8:1.00]
	; GENERIC-NEXT: vpopcntd (%rdi), %zmm0 {%k1} # sched: [7:1.00]			; GENERIC-NEXT: vpopcntd (%rdi), %zmm0 {%k1} # sched: [8:1.00]
	; GENERIC-NEXT: vpopcntd (%rdi), %zmm0 {%k1} {z} # sched: [7:1.00]			; GENERIC-NEXT: vpopcntd (%rdi), %zmm0 {%k1} {z} # sched: [8:1.00]
	; GENERIC-NEXT: vpopcntd (%rdi){1to16}, %zmm0 # sched: [7:1.00]			; GENERIC-NEXT: vpopcntd (%rdi){1to16}, %zmm0 # sched: [8:1.00]
	; GENERIC-NEXT: vpopcntd (%rdi){1to16}, %zmm0 {%k1} # sched: [7:1.00]			; GENERIC-NEXT: vpopcntd (%rdi){1to16}, %zmm0 {%k1} # sched: [8:1.00]
	; GENERIC-NEXT: vpopcntd (%rdi){1to16}, %zmm0 {%k1} {z} # sched: [7:1.00]			; GENERIC-NEXT: vpopcntd (%rdi){1to16}, %zmm0 {%k1} {z} # sched: [8:1.00]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; ICELAKE-LABEL: test_vpopcntd:			; ICELAKE-LABEL: test_vpopcntd:
	; ICELAKE: # %bb.0:			; ICELAKE: # %bb.0:
	; ICELAKE-NEXT: kmovd %esi, %k1 # sched: [1:1.00]			; ICELAKE-NEXT: kmovd %esi, %k1 # sched: [1:1.00]
	; ICELAKE-NEXT: #APP			; ICELAKE-NEXT: #APP
	Show All 16 Lines
	define void @test_vpopcntq(<8 x i64> %a0, <8 x i64> %a1, <8 x i64> *%a2, i8 %a3) {			define void @test_vpopcntq(<8 x i64> %a0, <8 x i64> %a1, <8 x i64> *%a2, i8 %a3) {
	; GENERIC-LABEL: test_vpopcntq:			; GENERIC-LABEL: test_vpopcntq:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: kmovw %esi, %k1 # sched: [1:0.33]			; GENERIC-NEXT: kmovw %esi, %k1 # sched: [1:0.33]
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vpopcntq %zmm1, %zmm0 # sched: [3:1.00]			; GENERIC-NEXT: vpopcntq %zmm1, %zmm0 # sched: [3:1.00]
	; GENERIC-NEXT: vpopcntq %zmm1, %zmm0 {%k1} # sched: [3:1.00]			; GENERIC-NEXT: vpopcntq %zmm1, %zmm0 {%k1} # sched: [3:1.00]
	; GENERIC-NEXT: vpopcntq %zmm1, %zmm0 {%k1} {z} # sched: [3:1.00]			; GENERIC-NEXT: vpopcntq %zmm1, %zmm0 {%k1} {z} # sched: [3:1.00]
	; GENERIC-NEXT: vpopcntq (%rdi), %zmm0 # sched: [7:1.00]			; GENERIC-NEXT: vpopcntq (%rdi), %zmm0 # sched: [8:1.00]
	; GENERIC-NEXT: vpopcntq (%rdi), %zmm0 {%k1} # sched: [7:1.00]			; GENERIC-NEXT: vpopcntq (%rdi), %zmm0 {%k1} # sched: [8:1.00]
	; GENERIC-NEXT: vpopcntq (%rdi), %zmm0 {%k1} {z} # sched: [7:1.00]			; GENERIC-NEXT: vpopcntq (%rdi), %zmm0 {%k1} {z} # sched: [8:1.00]
	; GENERIC-NEXT: vpopcntq (%rdi){1to8}, %zmm0 # sched: [7:1.00]			; GENERIC-NEXT: vpopcntq (%rdi){1to8}, %zmm0 # sched: [8:1.00]
	; GENERIC-NEXT: vpopcntq (%rdi){1to8}, %zmm0 {%k1} # sched: [7:1.00]			; GENERIC-NEXT: vpopcntq (%rdi){1to8}, %zmm0 {%k1} # sched: [8:1.00]
	; GENERIC-NEXT: vpopcntq (%rdi){1to8}, %zmm0 {%k1} {z} # sched: [7:1.00]			; GENERIC-NEXT: vpopcntq (%rdi){1to8}, %zmm0 {%k1} {z} # sched: [8:1.00]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; ICELAKE-LABEL: test_vpopcntq:			; ICELAKE-LABEL: test_vpopcntq:
	; ICELAKE: # %bb.0:			; ICELAKE: # %bb.0:
	; ICELAKE-NEXT: kmovd %esi, %k1 # sched: [1:1.00]			; ICELAKE-NEXT: kmovd %esi, %k1 # sched: [1:1.00]
	; ICELAKE-NEXT: #APP			; ICELAKE-NEXT: #APP
	Show All 15 Lines

llvm/trunk/test/CodeGen/X86/bmi-schedule.ll

Show First 20 Lines • Show All 67 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%5 = add i16 %3, %4		%5 = add i16 %3, %4
ret i16 %5		ret i16 %5
}		}

define i32 @test_andn_i32(i32 %a0, i32 %a1, i32 *%a2) {		define i32 @test_andn_i32(i32 %a0, i32 %a1, i32 *%a2) {
; GENERIC-LABEL: test_andn_i32:		; GENERIC-LABEL: test_andn_i32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: andnl %esi, %edi, %ecx # sched: [1:0.33]		; GENERIC-NEXT: andnl %esi, %edi, %ecx # sched: [1:0.33]
; GENERIC-NEXT: andnl (%rdx), %edi, %eax # sched: [5:0.50]		; GENERIC-NEXT: andnl (%rdx), %edi, %eax # sched: [6:0.50]
; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]		; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_andn_i32:		; HASWELL-LABEL: test_andn_i32:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: andnl %esi, %edi, %ecx # sched: [1:0.50]		; HASWELL-NEXT: andnl %esi, %edi, %ecx # sched: [1:0.50]
; HASWELL-NEXT: andnl (%rdx), %edi, %eax # sched: [6:0.50]		; HASWELL-NEXT: andnl (%rdx), %edi, %eax # sched: [6:0.50]
; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]		; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]
Show All 33 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%5 = add i32 %3, %4		%5 = add i32 %3, %4
ret i32 %5		ret i32 %5
}		}

define i64 @test_andn_i64(i64 %a0, i64 %a1, i64 *%a2) {		define i64 @test_andn_i64(i64 %a0, i64 %a1, i64 *%a2) {
; GENERIC-LABEL: test_andn_i64:		; GENERIC-LABEL: test_andn_i64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: andnq %rsi, %rdi, %rcx # sched: [1:0.33]		; GENERIC-NEXT: andnq %rsi, %rdi, %rcx # sched: [1:0.33]
; GENERIC-NEXT: andnq (%rdx), %rdi, %rax # sched: [5:0.50]		; GENERIC-NEXT: andnq (%rdx), %rdi, %rax # sched: [6:0.50]
; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]		; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_andn_i64:		; HASWELL-LABEL: test_andn_i64:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: andnq %rsi, %rdi, %rcx # sched: [1:0.50]		; HASWELL-NEXT: andnq %rsi, %rdi, %rcx # sched: [1:0.50]
; HASWELL-NEXT: andnq (%rdx), %rdi, %rax # sched: [6:0.50]		; HASWELL-NEXT: andnq (%rdx), %rdi, %rax # sched: [6:0.50]
; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]		; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = and i64 %2, %1		%4 = and i64 %2, %1
%5 = add i64 %3, %4		%5 = add i64 %3, %4
ret i64 %5		ret i64 %5
}		}

define i32 @test_bextr_i32(i32 %a0, i32 %a1, i32 *%a2) {		define i32 @test_bextr_i32(i32 %a0, i32 %a1, i32 *%a2) {
; GENERIC-LABEL: test_bextr_i32:		; GENERIC-LABEL: test_bextr_i32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: bextrl %edi, (%rdx), %ecx # sched: [6:1.00]		; GENERIC-NEXT: bextrl %edi, (%rdx), %ecx # sched: [7:1.00]
; GENERIC-NEXT: bextrl %edi, %esi, %eax # sched: [2:1.00]		; GENERIC-NEXT: bextrl %edi, %esi, %eax # sched: [2:1.00]
; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]		; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_bextr_i32:		; HASWELL-LABEL: test_bextr_i32:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: bextrl %edi, (%rdx), %ecx # sched: [7:0.50]		; HASWELL-NEXT: bextrl %edi, (%rdx), %ecx # sched: [7:0.50]
; HASWELL-NEXT: bextrl %edi, %esi, %eax # sched: [2:0.50]		; HASWELL-NEXT: bextrl %edi, %esi, %eax # sched: [2:0.50]
Show All 33 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add i32 %2, %3		%4 = add i32 %2, %3
ret i32 %4		ret i32 %4
}		}
declare i32 @llvm.x86.bmi.bextr.32(i32, i32)		declare i32 @llvm.x86.bmi.bextr.32(i32, i32)

define i64 @test_bextr_i64(i64 %a0, i64 %a1, i64 *%a2) {		define i64 @test_bextr_i64(i64 %a0, i64 %a1, i64 *%a2) {
; GENERIC-LABEL: test_bextr_i64:		; GENERIC-LABEL: test_bextr_i64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: bextrq %rdi, (%rdx), %rcx # sched: [6:1.00]		; GENERIC-NEXT: bextrq %rdi, (%rdx), %rcx # sched: [7:1.00]
; GENERIC-NEXT: bextrq %rdi, %rsi, %rax # sched: [2:1.00]		; GENERIC-NEXT: bextrq %rdi, %rsi, %rax # sched: [2:1.00]
; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]		; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_bextr_i64:		; HASWELL-LABEL: test_bextr_i64:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: bextrq %rdi, (%rdx), %rcx # sched: [7:0.50]		; HASWELL-NEXT: bextrq %rdi, (%rdx), %rcx # sched: [7:0.50]
; HASWELL-NEXT: bextrq %rdi, %rsi, %rax # sched: [2:0.50]		; HASWELL-NEXT: bextrq %rdi, %rsi, %rax # sched: [2:0.50]
Show All 33 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add i64 %2, %3		%4 = add i64 %2, %3
ret i64 %4		ret i64 %4
}		}
declare i64 @llvm.x86.bmi.bextr.64(i64, i64)		declare i64 @llvm.x86.bmi.bextr.64(i64, i64)

define i32 @test_blsi_i32(i32 %a0, i32 *%a1) {		define i32 @test_blsi_i32(i32 %a0, i32 *%a1) {
; GENERIC-LABEL: test_blsi_i32:		; GENERIC-LABEL: test_blsi_i32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: blsil (%rsi), %ecx # sched: [5:0.50]		; GENERIC-NEXT: blsil (%rsi), %ecx # sched: [6:0.50]
; GENERIC-NEXT: blsil %edi, %eax # sched: [1:0.33]		; GENERIC-NEXT: blsil %edi, %eax # sched: [1:0.33]
; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]		; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_blsi_i32:		; HASWELL-LABEL: test_blsi_i32:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: blsil (%rsi), %ecx # sched: [6:0.50]		; HASWELL-NEXT: blsil (%rsi), %ecx # sched: [6:0.50]
; HASWELL-NEXT: blsil %edi, %eax # sched: [1:0.50]		; HASWELL-NEXT: blsil %edi, %eax # sched: [1:0.50]
Show All 34 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%5 = and i32 %a0, %3		%5 = and i32 %a0, %3
%6 = add i32 %4, %5		%6 = add i32 %4, %5
ret i32 %6		ret i32 %6
}		}

define i64 @test_blsi_i64(i64 %a0, i64 *%a1) {		define i64 @test_blsi_i64(i64 %a0, i64 *%a1) {
; GENERIC-LABEL: test_blsi_i64:		; GENERIC-LABEL: test_blsi_i64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: blsiq (%rsi), %rcx # sched: [5:0.50]		; GENERIC-NEXT: blsiq (%rsi), %rcx # sched: [6:0.50]
; GENERIC-NEXT: blsiq %rdi, %rax # sched: [1:0.33]		; GENERIC-NEXT: blsiq %rdi, %rax # sched: [1:0.33]
; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]		; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_blsi_i64:		; HASWELL-LABEL: test_blsi_i64:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: blsiq (%rsi), %rcx # sched: [6:0.50]		; HASWELL-NEXT: blsiq (%rsi), %rcx # sched: [6:0.50]
; HASWELL-NEXT: blsiq %rdi, %rax # sched: [1:0.50]		; HASWELL-NEXT: blsiq %rdi, %rax # sched: [1:0.50]
Show All 34 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%5 = and i64 %a0, %3		%5 = and i64 %a0, %3
%6 = add i64 %4, %5		%6 = add i64 %4, %5
ret i64 %6		ret i64 %6
}		}

define i32 @test_blsmsk_i32(i32 %a0, i32 *%a1) {		define i32 @test_blsmsk_i32(i32 %a0, i32 *%a1) {
; GENERIC-LABEL: test_blsmsk_i32:		; GENERIC-LABEL: test_blsmsk_i32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: blsmskl (%rsi), %ecx # sched: [5:0.50]		; GENERIC-NEXT: blsmskl (%rsi), %ecx # sched: [6:0.50]
; GENERIC-NEXT: blsmskl %edi, %eax # sched: [1:0.33]		; GENERIC-NEXT: blsmskl %edi, %eax # sched: [1:0.33]
; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]		; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_blsmsk_i32:		; HASWELL-LABEL: test_blsmsk_i32:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: blsmskl (%rsi), %ecx # sched: [6:0.50]		; HASWELL-NEXT: blsmskl (%rsi), %ecx # sched: [6:0.50]
; HASWELL-NEXT: blsmskl %edi, %eax # sched: [1:0.50]		; HASWELL-NEXT: blsmskl %edi, %eax # sched: [1:0.50]
Show All 34 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%5 = xor i32 %a0, %3		%5 = xor i32 %a0, %3
%6 = add i32 %4, %5		%6 = add i32 %4, %5
ret i32 %6		ret i32 %6
}		}

define i64 @test_blsmsk_i64(i64 %a0, i64 *%a1) {		define i64 @test_blsmsk_i64(i64 %a0, i64 *%a1) {
; GENERIC-LABEL: test_blsmsk_i64:		; GENERIC-LABEL: test_blsmsk_i64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: blsmskq (%rsi), %rcx # sched: [5:0.50]		; GENERIC-NEXT: blsmskq (%rsi), %rcx # sched: [6:0.50]
; GENERIC-NEXT: blsmskq %rdi, %rax # sched: [1:0.33]		; GENERIC-NEXT: blsmskq %rdi, %rax # sched: [1:0.33]
; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]		; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_blsmsk_i64:		; HASWELL-LABEL: test_blsmsk_i64:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: blsmskq (%rsi), %rcx # sched: [6:0.50]		; HASWELL-NEXT: blsmskq (%rsi), %rcx # sched: [6:0.50]
; HASWELL-NEXT: blsmskq %rdi, %rax # sched: [1:0.50]		; HASWELL-NEXT: blsmskq %rdi, %rax # sched: [1:0.50]
Show All 34 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%5 = xor i64 %a0, %3		%5 = xor i64 %a0, %3
%6 = add i64 %4, %5		%6 = add i64 %4, %5
ret i64 %6		ret i64 %6
}		}

define i32 @test_blsr_i32(i32 %a0, i32 *%a1) {		define i32 @test_blsr_i32(i32 %a0, i32 *%a1) {
; GENERIC-LABEL: test_blsr_i32:		; GENERIC-LABEL: test_blsr_i32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: blsrl (%rsi), %ecx # sched: [5:0.50]		; GENERIC-NEXT: blsrl (%rsi), %ecx # sched: [6:0.50]
; GENERIC-NEXT: blsrl %edi, %eax # sched: [1:0.33]		; GENERIC-NEXT: blsrl %edi, %eax # sched: [1:0.33]
; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]		; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_blsr_i32:		; HASWELL-LABEL: test_blsr_i32:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: blsrl (%rsi), %ecx # sched: [6:0.50]		; HASWELL-NEXT: blsrl (%rsi), %ecx # sched: [6:0.50]
; HASWELL-NEXT: blsrl %edi, %eax # sched: [1:0.50]		; HASWELL-NEXT: blsrl %edi, %eax # sched: [1:0.50]
Show All 34 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%5 = and i32 %a0, %3		%5 = and i32 %a0, %3
%6 = add i32 %4, %5		%6 = add i32 %4, %5
ret i32 %6		ret i32 %6
}		}

define i64 @test_blsr_i64(i64 %a0, i64 *%a1) {		define i64 @test_blsr_i64(i64 %a0, i64 *%a1) {
; GENERIC-LABEL: test_blsr_i64:		; GENERIC-LABEL: test_blsr_i64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: blsrq (%rsi), %rcx # sched: [5:0.50]		; GENERIC-NEXT: blsrq (%rsi), %rcx # sched: [6:0.50]
; GENERIC-NEXT: blsrq %rdi, %rax # sched: [1:0.33]		; GENERIC-NEXT: blsrq %rdi, %rax # sched: [1:0.33]
; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]		; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_blsr_i64:		; HASWELL-LABEL: test_blsr_i64:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: blsrq (%rsi), %rcx # sched: [6:0.50]		; HASWELL-NEXT: blsrq (%rsi), %rcx # sched: [6:0.50]
; HASWELL-NEXT: blsrq %rdi, %rax # sched: [1:0.50]		; HASWELL-NEXT: blsrq %rdi, %rax # sched: [1:0.50]
▲ Show 20 Lines • Show All 194 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/bmi2-schedule.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=x86-64 -mattr=+bmi2 \| FileCheck %s --check-prefix=CHECK --check-prefix=GENERIC		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=x86-64 -mattr=+bmi2 \| FileCheck %s --check-prefix=CHECK --check-prefix=GENERIC
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=haswell \| FileCheck %s --check-prefix=CHECK --check-prefix=HASWELL		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=haswell \| FileCheck %s --check-prefix=CHECK --check-prefix=HASWELL
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=broadwell \| FileCheck %s --check-prefix=CHECK --check-prefix=BROADWELL		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=broadwell \| FileCheck %s --check-prefix=CHECK --check-prefix=BROADWELL
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=skylake \| FileCheck %s --check-prefix=CHECK --check-prefix=SKYLAKE		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=skylake \| FileCheck %s --check-prefix=CHECK --check-prefix=SKYLAKE
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=knl \| FileCheck %s --check-prefix=CHECK --check-prefix=KNL		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=knl \| FileCheck %s --check-prefix=CHECK --check-prefix=KNL
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=znver1 \| FileCheck %s --check-prefix=CHECK --check-prefix=ZNVER1		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=znver1 \| FileCheck %s --check-prefix=CHECK --check-prefix=ZNVER1

define i32 @test_bzhi_i32(i32 %a0, i32 %a1, i32 *%a2) {		define i32 @test_bzhi_i32(i32 %a0, i32 %a1, i32 *%a2) {
; GENERIC-LABEL: test_bzhi_i32:		; GENERIC-LABEL: test_bzhi_i32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: bzhil %edi, (%rdx), %ecx # sched: [5:1.00]		; GENERIC-NEXT: bzhil %edi, (%rdx), %ecx # sched: [6:1.00]
; GENERIC-NEXT: bzhil %edi, %esi, %eax # sched: [1:1.00]		; GENERIC-NEXT: bzhil %edi, %esi, %eax # sched: [1:1.00]
; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]		; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_bzhi_i32:		; HASWELL-LABEL: test_bzhi_i32:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: bzhil %edi, (%rdx), %ecx # sched: [6:0.50]		; HASWELL-NEXT: bzhil %edi, (%rdx), %ecx # sched: [6:0.50]
; HASWELL-NEXT: bzhil %edi, %esi, %eax # sched: [1:0.50]		; HASWELL-NEXT: bzhil %edi, %esi, %eax # sched: [1:0.50]
Show All 33 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add i32 %2, %3		%4 = add i32 %2, %3
ret i32 %4		ret i32 %4
}		}
declare i32 @llvm.x86.bmi.bzhi.32(i32, i32)		declare i32 @llvm.x86.bmi.bzhi.32(i32, i32)

define i64 @test_bzhi_i64(i64 %a0, i64 %a1, i64 *%a2) {		define i64 @test_bzhi_i64(i64 %a0, i64 %a1, i64 *%a2) {
; GENERIC-LABEL: test_bzhi_i64:		; GENERIC-LABEL: test_bzhi_i64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: bzhiq %rdi, (%rdx), %rcx # sched: [5:1.00]		; GENERIC-NEXT: bzhiq %rdi, (%rdx), %rcx # sched: [6:1.00]
; GENERIC-NEXT: bzhiq %rdi, %rsi, %rax # sched: [1:1.00]		; GENERIC-NEXT: bzhiq %rdi, %rsi, %rax # sched: [1:1.00]
; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]		; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_bzhi_i64:		; HASWELL-LABEL: test_bzhi_i64:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: bzhiq %rdi, (%rdx), %rcx # sched: [6:0.50]		; HASWELL-NEXT: bzhiq %rdi, (%rdx), %rcx # sched: [6:0.50]
; HASWELL-NEXT: bzhiq %rdi, %rsi, %rax # sched: [1:0.50]		; HASWELL-NEXT: bzhiq %rdi, %rsi, %rax # sched: [1:0.50]
Show All 35 Lines
}		}
declare i64 @llvm.x86.bmi.bzhi.64(i64, i64)		declare i64 @llvm.x86.bmi.bzhi.64(i64, i64)

define void @test_mulx_i32(i32 %a0, i32 %a1, i32* %a2) optsize {		define void @test_mulx_i32(i32 %a0, i32 %a1, i32* %a2) optsize {
; GENERIC-LABEL: test_mulx_i32:		; GENERIC-LABEL: test_mulx_i32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: mulxl %esi, %esi, %edi # sched: [3:1.00]		; GENERIC-NEXT: mulxl %esi, %esi, %edi # sched: [3:1.00]
; GENERIC-NEXT: mulxl (%rdx), %esi, %edi # sched: [7:1.00]		; GENERIC-NEXT: mulxl (%rdx), %esi, %edi # sched: [8:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_mulx_i32:		; HASWELL-LABEL: test_mulx_i32:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: #APP		; HASWELL-NEXT: #APP
; HASWELL-NEXT: mulxl %esi, %esi, %edi # sched: [4:1.00]		; HASWELL-NEXT: mulxl %esi, %esi, %edi # sched: [4:1.00]
; HASWELL-NEXT: mulxl (%rdx), %esi, %edi # sched: [9:1.00]		; HASWELL-NEXT: mulxl (%rdx), %esi, %edi # sched: [9:1.00]
Show All 36 Lines
}		}

define i64 @test_mulx_i64(i64 %a0, i64 %a1, i64 *%a2) {		define i64 @test_mulx_i64(i64 %a0, i64 %a1, i64 *%a2) {
; GENERIC-LABEL: test_mulx_i64:		; GENERIC-LABEL: test_mulx_i64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: movq %rdx, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %rdx, %rax # sched: [1:0.33]
; GENERIC-NEXT: movq %rdi, %rdx # sched: [1:0.33]		; GENERIC-NEXT: movq %rdi, %rdx # sched: [1:0.33]
; GENERIC-NEXT: mulxq %rsi, %rsi, %rcx # sched: [3:1.00]		; GENERIC-NEXT: mulxq %rsi, %rsi, %rcx # sched: [3:1.00]
; GENERIC-NEXT: mulxq (%rax), %rdx, %rax # sched: [7:1.00]		; GENERIC-NEXT: mulxq (%rax), %rdx, %rax # sched: [8:1.00]
; GENERIC-NEXT: orq %rcx, %rax # sched: [1:0.33]		; GENERIC-NEXT: orq %rcx, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_mulx_i64:		; HASWELL-LABEL: test_mulx_i64:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: movq %rdx, %rax # sched: [1:0.25]		; HASWELL-NEXT: movq %rdx, %rax # sched: [1:0.25]
; HASWELL-NEXT: movq %rdi, %rdx # sched: [1:0.25]		; HASWELL-NEXT: movq %rdi, %rdx # sched: [1:0.25]
; HASWELL-NEXT: mulxq %rsi, %rsi, %rcx # sched: [4:1.00]		; HASWELL-NEXT: mulxq %rsi, %rsi, %rcx # sched: [4:1.00]
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%10 = trunc i128 %8 to i64		%10 = trunc i128 %8 to i64
%11 = or i64 %9, %10		%11 = or i64 %9, %10
ret i64 %11		ret i64 %11
}		}

define i32 @test_pdep_i32(i32 %a0, i32 %a1, i32 *%a2) {		define i32 @test_pdep_i32(i32 %a0, i32 %a1, i32 *%a2) {
; GENERIC-LABEL: test_pdep_i32:		; GENERIC-LABEL: test_pdep_i32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: pdepl (%rdx), %edi, %ecx # sched: [5:0.50]		; GENERIC-NEXT: pdepl (%rdx), %edi, %ecx # sched: [6:0.50]
; GENERIC-NEXT: pdepl %esi, %edi, %eax # sched: [1:0.33]		; GENERIC-NEXT: pdepl %esi, %edi, %eax # sched: [1:0.33]
; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]		; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pdep_i32:		; HASWELL-LABEL: test_pdep_i32:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: pdepl (%rdx), %edi, %ecx # sched: [8:1.00]		; HASWELL-NEXT: pdepl (%rdx), %edi, %ecx # sched: [8:1.00]
; HASWELL-NEXT: pdepl %esi, %edi, %eax # sched: [3:1.00]		; HASWELL-NEXT: pdepl %esi, %edi, %eax # sched: [3:1.00]
Show All 33 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add i32 %2, %3		%4 = add i32 %2, %3
ret i32 %4		ret i32 %4
}		}
declare i32 @llvm.x86.bmi.pdep.32(i32, i32)		declare i32 @llvm.x86.bmi.pdep.32(i32, i32)

define i64 @test_pdep_i64(i64 %a0, i64 %a1, i64 *%a2) {		define i64 @test_pdep_i64(i64 %a0, i64 %a1, i64 *%a2) {
; GENERIC-LABEL: test_pdep_i64:		; GENERIC-LABEL: test_pdep_i64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: pdepq (%rdx), %rdi, %rcx # sched: [5:0.50]		; GENERIC-NEXT: pdepq (%rdx), %rdi, %rcx # sched: [6:0.50]
; GENERIC-NEXT: pdepq %rsi, %rdi, %rax # sched: [1:0.33]		; GENERIC-NEXT: pdepq %rsi, %rdi, %rax # sched: [1:0.33]
; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]		; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pdep_i64:		; HASWELL-LABEL: test_pdep_i64:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: pdepq (%rdx), %rdi, %rcx # sched: [8:1.00]		; HASWELL-NEXT: pdepq (%rdx), %rdi, %rcx # sched: [8:1.00]
; HASWELL-NEXT: pdepq %rsi, %rdi, %rax # sched: [3:1.00]		; HASWELL-NEXT: pdepq %rsi, %rdi, %rax # sched: [3:1.00]
Show All 33 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add i64 %2, %3		%4 = add i64 %2, %3
ret i64 %4		ret i64 %4
}		}
declare i64 @llvm.x86.bmi.pdep.64(i64, i64)		declare i64 @llvm.x86.bmi.pdep.64(i64, i64)

define i32 @test_pext_i32(i32 %a0, i32 %a1, i32 *%a2) {		define i32 @test_pext_i32(i32 %a0, i32 %a1, i32 *%a2) {
; GENERIC-LABEL: test_pext_i32:		; GENERIC-LABEL: test_pext_i32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: pextl (%rdx), %edi, %ecx # sched: [5:0.50]		; GENERIC-NEXT: pextl (%rdx), %edi, %ecx # sched: [6:0.50]
; GENERIC-NEXT: pextl %esi, %edi, %eax # sched: [1:0.33]		; GENERIC-NEXT: pextl %esi, %edi, %eax # sched: [1:0.33]
; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]		; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pext_i32:		; HASWELL-LABEL: test_pext_i32:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: pextl (%rdx), %edi, %ecx # sched: [8:1.00]		; HASWELL-NEXT: pextl (%rdx), %edi, %ecx # sched: [8:1.00]
; HASWELL-NEXT: pextl %esi, %edi, %eax # sched: [3:1.00]		; HASWELL-NEXT: pextl %esi, %edi, %eax # sched: [3:1.00]
Show All 33 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add i32 %2, %3		%4 = add i32 %2, %3
ret i32 %4		ret i32 %4
}		}
declare i32 @llvm.x86.bmi.pext.32(i32, i32)		declare i32 @llvm.x86.bmi.pext.32(i32, i32)

define i64 @test_pext_i64(i64 %a0, i64 %a1, i64 *%a2) {		define i64 @test_pext_i64(i64 %a0, i64 %a1, i64 *%a2) {
; GENERIC-LABEL: test_pext_i64:		; GENERIC-LABEL: test_pext_i64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: pextq (%rdx), %rdi, %rcx # sched: [5:0.50]		; GENERIC-NEXT: pextq (%rdx), %rdi, %rcx # sched: [6:0.50]
; GENERIC-NEXT: pextq %rsi, %rdi, %rax # sched: [1:0.33]		; GENERIC-NEXT: pextq %rsi, %rdi, %rax # sched: [1:0.33]
; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]		; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pext_i64:		; HASWELL-LABEL: test_pext_i64:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: pextq (%rdx), %rdi, %rcx # sched: [8:1.00]		; HASWELL-NEXT: pextq (%rdx), %rdi, %rcx # sched: [8:1.00]
; HASWELL-NEXT: pextq %rsi, %rdi, %rax # sched: [3:1.00]		; HASWELL-NEXT: pextq %rsi, %rdi, %rax # sched: [3:1.00]
Show All 34 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare i64 @llvm.x86.bmi.pext.64(i64, i64)		declare i64 @llvm.x86.bmi.pext.64(i64, i64)

define i32 @test_rorx_i32(i32 %a0, i32 %a1, i32 *%a2) {		define i32 @test_rorx_i32(i32 %a0, i32 %a1, i32 *%a2) {
; GENERIC-LABEL: test_rorx_i32:		; GENERIC-LABEL: test_rorx_i32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: rorxl $5, %edi, %ecx # sched: [1:0.50]		; GENERIC-NEXT: rorxl $5, %edi, %ecx # sched: [1:0.50]
; GENERIC-NEXT: rorxl $5, (%rdx), %eax # sched: [5:0.50]		; GENERIC-NEXT: rorxl $5, (%rdx), %eax # sched: [6:0.50]
; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]		; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_rorx_i32:		; HASWELL-LABEL: test_rorx_i32:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: rorxl $5, %edi, %ecx # sched: [1:0.50]		; HASWELL-NEXT: rorxl $5, %edi, %ecx # sched: [1:0.50]
; HASWELL-NEXT: rorxl $5, (%rdx), %eax # sched: [6:0.50]		; HASWELL-NEXT: rorxl $5, (%rdx), %eax # sched: [6:0.50]
; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]		; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]
Show All 36 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%8 = add i32 %4, %7		%8 = add i32 %4, %7
ret i32 %8		ret i32 %8
}		}

define i64 @test_rorx_i64(i64 %a0, i64 %a1, i64 *%a2) {		define i64 @test_rorx_i64(i64 %a0, i64 %a1, i64 *%a2) {
; GENERIC-LABEL: test_rorx_i64:		; GENERIC-LABEL: test_rorx_i64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: rorxq $5, %rdi, %rcx # sched: [1:0.50]		; GENERIC-NEXT: rorxq $5, %rdi, %rcx # sched: [1:0.50]
; GENERIC-NEXT: rorxq $5, (%rdx), %rax # sched: [5:0.50]		; GENERIC-NEXT: rorxq $5, (%rdx), %rax # sched: [6:0.50]
; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]		; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_rorx_i64:		; HASWELL-LABEL: test_rorx_i64:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: rorxq $5, %rdi, %rcx # sched: [1:0.50]		; HASWELL-NEXT: rorxq $5, %rdi, %rcx # sched: [1:0.50]
; HASWELL-NEXT: rorxq $5, (%rdx), %rax # sched: [6:0.50]		; HASWELL-NEXT: rorxq $5, (%rdx), %rax # sched: [6:0.50]
; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]		; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]
Show All 36 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%8 = add i64 %4, %7		%8 = add i64 %4, %7
ret i64 %8		ret i64 %8
}		}

define i32 @test_sarx_i32(i32 %a0, i32 %a1, i32 *%a2) {		define i32 @test_sarx_i32(i32 %a0, i32 %a1, i32 *%a2) {
; GENERIC-LABEL: test_sarx_i32:		; GENERIC-LABEL: test_sarx_i32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: sarxl %esi, %edi, %ecx # sched: [1:0.50]		; GENERIC-NEXT: sarxl %esi, %edi, %ecx # sched: [1:0.50]
; GENERIC-NEXT: sarxl %esi, (%rdx), %eax # sched: [5:0.50]		; GENERIC-NEXT: sarxl %esi, (%rdx), %eax # sched: [6:0.50]
; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]		; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_sarx_i32:		; HASWELL-LABEL: test_sarx_i32:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: sarxl %esi, %edi, %ecx # sched: [1:0.50]		; HASWELL-NEXT: sarxl %esi, %edi, %ecx # sched: [1:0.50]
; HASWELL-NEXT: sarxl %esi, (%rdx), %eax # sched: [6:0.50]		; HASWELL-NEXT: sarxl %esi, (%rdx), %eax # sched: [6:0.50]
; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]		; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add i32 %2, %3		%4 = add i32 %2, %3
ret i32 %4		ret i32 %4
}		}

define i64 @test_sarx_i64(i64 %a0, i64 %a1, i64 *%a2) {		define i64 @test_sarx_i64(i64 %a0, i64 %a1, i64 *%a2) {
; GENERIC-LABEL: test_sarx_i64:		; GENERIC-LABEL: test_sarx_i64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: sarxq %rsi, %rdi, %rcx # sched: [1:0.50]		; GENERIC-NEXT: sarxq %rsi, %rdi, %rcx # sched: [1:0.50]
; GENERIC-NEXT: sarxq %rsi, (%rdx), %rax # sched: [5:0.50]		; GENERIC-NEXT: sarxq %rsi, (%rdx), %rax # sched: [6:0.50]
; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]		; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_sarx_i64:		; HASWELL-LABEL: test_sarx_i64:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: sarxq %rsi, %rdi, %rcx # sched: [1:0.50]		; HASWELL-NEXT: sarxq %rsi, %rdi, %rcx # sched: [1:0.50]
; HASWELL-NEXT: sarxq %rsi, (%rdx), %rax # sched: [6:0.50]		; HASWELL-NEXT: sarxq %rsi, (%rdx), %rax # sched: [6:0.50]
; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]		; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add i64 %2, %3		%4 = add i64 %2, %3
ret i64 %4		ret i64 %4
}		}

define i32 @test_shlx_i32(i32 %a0, i32 %a1, i32 *%a2) {		define i32 @test_shlx_i32(i32 %a0, i32 %a1, i32 *%a2) {
; GENERIC-LABEL: test_shlx_i32:		; GENERIC-LABEL: test_shlx_i32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: shlxl %esi, %edi, %ecx # sched: [1:0.50]		; GENERIC-NEXT: shlxl %esi, %edi, %ecx # sched: [1:0.50]
; GENERIC-NEXT: shlxl %esi, (%rdx), %eax # sched: [5:0.50]		; GENERIC-NEXT: shlxl %esi, (%rdx), %eax # sched: [6:0.50]
; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]		; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_shlx_i32:		; HASWELL-LABEL: test_shlx_i32:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: shlxl %esi, %edi, %ecx # sched: [1:0.50]		; HASWELL-NEXT: shlxl %esi, %edi, %ecx # sched: [1:0.50]
; HASWELL-NEXT: shlxl %esi, (%rdx), %eax # sched: [6:0.50]		; HASWELL-NEXT: shlxl %esi, (%rdx), %eax # sched: [6:0.50]
; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]		; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add i32 %2, %3		%4 = add i32 %2, %3
ret i32 %4		ret i32 %4
}		}

define i64 @test_shlx_i64(i64 %a0, i64 %a1, i64 *%a2) {		define i64 @test_shlx_i64(i64 %a0, i64 %a1, i64 *%a2) {
; GENERIC-LABEL: test_shlx_i64:		; GENERIC-LABEL: test_shlx_i64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: shlxq %rsi, %rdi, %rcx # sched: [1:0.50]		; GENERIC-NEXT: shlxq %rsi, %rdi, %rcx # sched: [1:0.50]
; GENERIC-NEXT: shlxq %rsi, (%rdx), %rax # sched: [5:0.50]		; GENERIC-NEXT: shlxq %rsi, (%rdx), %rax # sched: [6:0.50]
; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]		; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_shlx_i64:		; HASWELL-LABEL: test_shlx_i64:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: shlxq %rsi, %rdi, %rcx # sched: [1:0.50]		; HASWELL-NEXT: shlxq %rsi, %rdi, %rcx # sched: [1:0.50]
; HASWELL-NEXT: shlxq %rsi, (%rdx), %rax # sched: [6:0.50]		; HASWELL-NEXT: shlxq %rsi, (%rdx), %rax # sched: [6:0.50]
; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]		; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add i64 %2, %3		%4 = add i64 %2, %3
ret i64 %4		ret i64 %4
}		}

define i32 @test_shrx_i32(i32 %a0, i32 %a1, i32 *%a2) {		define i32 @test_shrx_i32(i32 %a0, i32 %a1, i32 *%a2) {
; GENERIC-LABEL: test_shrx_i32:		; GENERIC-LABEL: test_shrx_i32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: shrxl %esi, %edi, %ecx # sched: [1:0.50]		; GENERIC-NEXT: shrxl %esi, %edi, %ecx # sched: [1:0.50]
; GENERIC-NEXT: shrxl %esi, (%rdx), %eax # sched: [5:0.50]		; GENERIC-NEXT: shrxl %esi, (%rdx), %eax # sched: [6:0.50]
; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]		; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_shrx_i32:		; HASWELL-LABEL: test_shrx_i32:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: shrxl %esi, %edi, %ecx # sched: [1:0.50]		; HASWELL-NEXT: shrxl %esi, %edi, %ecx # sched: [1:0.50]
; HASWELL-NEXT: shrxl %esi, (%rdx), %eax # sched: [6:0.50]		; HASWELL-NEXT: shrxl %esi, (%rdx), %eax # sched: [6:0.50]
; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]		; HASWELL-NEXT: addl %ecx, %eax # sched: [1:0.25]
Show All 32 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = add i32 %2, %3		%4 = add i32 %2, %3
ret i32 %4		ret i32 %4
}		}

define i64 @test_shrx_i64(i64 %a0, i64 %a1, i64 *%a2) {		define i64 @test_shrx_i64(i64 %a0, i64 %a1, i64 *%a2) {
; GENERIC-LABEL: test_shrx_i64:		; GENERIC-LABEL: test_shrx_i64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: shrxq %rsi, %rdi, %rcx # sched: [1:0.50]		; GENERIC-NEXT: shrxq %rsi, %rdi, %rcx # sched: [1:0.50]
; GENERIC-NEXT: shrxq %rsi, (%rdx), %rax # sched: [5:0.50]		; GENERIC-NEXT: shrxq %rsi, (%rdx), %rax # sched: [6:0.50]
; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]		; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_shrx_i64:		; HASWELL-LABEL: test_shrx_i64:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: shrxq %rsi, %rdi, %rcx # sched: [1:0.50]		; HASWELL-NEXT: shrxq %rsi, %rdi, %rcx # sched: [1:0.50]
; HASWELL-NEXT: shrxq %rsi, (%rdx), %rax # sched: [6:0.50]		; HASWELL-NEXT: shrxq %rsi, (%rdx), %rax # sched: [6:0.50]
; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]		; HASWELL-NEXT: addq %rcx, %rax # sched: [1:0.25]
Show All 35 Lines

llvm/trunk/test/CodeGen/X86/clwb-schedule.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=x86-64 -mattr=+clwb \| FileCheck %s --check-prefix=GENERIC			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=x86-64 -mattr=+clwb \| FileCheck %s --check-prefix=GENERIC
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=skx \| FileCheck %s --check-prefix=SKX			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=skx \| FileCheck %s --check-prefix=SKX

	define void @clwb(i8* %a0) nounwind {			define void @clwb(i8* %a0) nounwind {
	; GENERIC-LABEL: clwb:			; GENERIC-LABEL: clwb:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: clwb (%rdi) # sched: [4:0.50]			; GENERIC-NEXT: clwb (%rdi) # sched: [5:0.50]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; SKX-LABEL: clwb:			; SKX-LABEL: clwb:
	; SKX: # %bb.0:			; SKX: # %bb.0:
	; SKX-NEXT: clwb (%rdi) # sched: [5:0.50]			; SKX-NEXT: clwb (%rdi) # sched: [5:0.50]
	; SKX-NEXT: retq # sched: [7:1.00]			; SKX-NEXT: retq # sched: [7:1.00]
	tail call void @llvm.x86.clwb(i8* %a0)			tail call void @llvm.x86.clwb(i8* %a0)
	ret void			ret void
	}			}
	declare void @llvm.x86.clwb(i8*) nounwind			declare void @llvm.x86.clwb(i8*) nounwind

llvm/trunk/test/CodeGen/X86/f16c-schedule.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=x86-64 -mattr=+f16c \| FileCheck %s --check-prefix=CHECK --check-prefix=GENERIC		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=x86-64 -mattr=+f16c \| FileCheck %s --check-prefix=CHECK --check-prefix=GENERIC
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=ivybridge \| FileCheck %s --check-prefix=CHECK --check-prefix=IVY		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=ivybridge \| FileCheck %s --check-prefix=CHECK --check-prefix=IVY
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=haswell \| FileCheck %s --check-prefix=CHECK --check-prefix=HASWELL		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=haswell \| FileCheck %s --check-prefix=CHECK --check-prefix=HASWELL
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=broadwell \| FileCheck %s --check-prefix=CHECK --check-prefix=BROADWELL		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=broadwell \| FileCheck %s --check-prefix=CHECK --check-prefix=BROADWELL
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=skylake \| FileCheck %s --check-prefix=CHECK --check-prefix=SKYLAKE		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=skylake \| FileCheck %s --check-prefix=CHECK --check-prefix=SKYLAKE
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=btver2 \| FileCheck %s --check-prefix=CHECK --check-prefix=BTVER2		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=btver2 \| FileCheck %s --check-prefix=CHECK --check-prefix=BTVER2
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=znver1 \| FileCheck %s --check-prefix=CHECK --check-prefix=ZNVER1		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=znver1 \| FileCheck %s --check-prefix=CHECK --check-prefix=ZNVER1

define <4 x float> @test_vcvtph2ps_128(<8 x i16> %a0, <8 x i16> *%a1) {		define <4 x float> @test_vcvtph2ps_128(<8 x i16> %a0, <8 x i16> *%a1) {
; GENERIC-LABEL: test_vcvtph2ps_128:		; GENERIC-LABEL: test_vcvtph2ps_128:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vcvtph2ps (%rdi), %xmm1 # sched: [7:1.00]		; GENERIC-NEXT: vcvtph2ps (%rdi), %xmm1 # sched: [8:1.00]
; GENERIC-NEXT: vcvtph2ps %xmm0, %xmm0 # sched: [3:1.00]		; GENERIC-NEXT: vcvtph2ps %xmm0, %xmm0 # sched: [3:1.00]
; GENERIC-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]		; GENERIC-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; IVY-LABEL: test_vcvtph2ps_128:		; IVY-LABEL: test_vcvtph2ps_128:
; IVY: # %bb.0:		; IVY: # %bb.0:
; IVY-NEXT: vcvtph2ps (%rdi), %xmm1 # sched: [7:1.00]		; IVY-NEXT: vcvtph2ps (%rdi), %xmm1 # sched: [8:1.00]
; IVY-NEXT: vcvtph2ps %xmm0, %xmm0 # sched: [3:1.00]		; IVY-NEXT: vcvtph2ps %xmm0, %xmm0 # sched: [3:1.00]
; IVY-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]		; IVY-NEXT: vaddps %xmm0, %xmm1, %xmm0 # sched: [3:1.00]
; IVY-NEXT: retq # sched: [1:1.00]		; IVY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_vcvtph2ps_128:		; HASWELL-LABEL: test_vcvtph2ps_128:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vcvtph2ps (%rdi), %xmm1 # sched: [6:1.00]		; HASWELL-NEXT: vcvtph2ps (%rdi), %xmm1 # sched: [6:1.00]
; HASWELL-NEXT: vcvtph2ps %xmm0, %xmm0 # sched: [2:1.00]		; HASWELL-NEXT: vcvtph2ps %xmm0, %xmm0 # sched: [2:1.00]
Show All 33 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = fadd <4 x float> %2, %3		%4 = fadd <4 x float> %2, %3
ret <4 x float> %4		ret <4 x float> %4
}		}
declare <4 x float> @llvm.x86.vcvtph2ps.128(<8 x i16>)		declare <4 x float> @llvm.x86.vcvtph2ps.128(<8 x i16>)

define <8 x float> @test_vcvtph2ps_256(<8 x i16> %a0, <8 x i16> *%a1) {		define <8 x float> @test_vcvtph2ps_256(<8 x i16> %a0, <8 x i16> *%a1) {
; GENERIC-LABEL: test_vcvtph2ps_256:		; GENERIC-LABEL: test_vcvtph2ps_256:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vcvtph2ps (%rdi), %ymm1 # sched: [7:1.00]		; GENERIC-NEXT: vcvtph2ps (%rdi), %ymm1 # sched: [8:1.00]
; GENERIC-NEXT: vcvtph2ps %xmm0, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vcvtph2ps %xmm0, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]		; GENERIC-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; IVY-LABEL: test_vcvtph2ps_256:		; IVY-LABEL: test_vcvtph2ps_256:
; IVY: # %bb.0:		; IVY: # %bb.0:
; IVY-NEXT: vcvtph2ps (%rdi), %ymm1 # sched: [7:1.00]		; IVY-NEXT: vcvtph2ps (%rdi), %ymm1 # sched: [8:1.00]
; IVY-NEXT: vcvtph2ps %xmm0, %ymm0 # sched: [3:1.00]		; IVY-NEXT: vcvtph2ps %xmm0, %ymm0 # sched: [3:1.00]
; IVY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]		; IVY-NEXT: vaddps %ymm0, %ymm1, %ymm0 # sched: [3:1.00]
; IVY-NEXT: retq # sched: [1:1.00]		; IVY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_vcvtph2ps_256:		; HASWELL-LABEL: test_vcvtph2ps_256:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vcvtph2ps (%rdi), %ymm1 # sched: [7:1.00]		; HASWELL-NEXT: vcvtph2ps (%rdi), %ymm1 # sched: [7:1.00]
; HASWELL-NEXT: vcvtph2ps %xmm0, %ymm0 # sched: [2:1.00]		; HASWELL-NEXT: vcvtph2ps %xmm0, %ymm0 # sched: [2:1.00]
Show All 34 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <8 x float> %4		ret <8 x float> %4
}		}
declare <8 x float> @llvm.x86.vcvtph2ps.256(<8 x i16>)		declare <8 x float> @llvm.x86.vcvtph2ps.256(<8 x i16>)

define <8 x i16> @test_vcvtps2ph_128(<4 x float> %a0, <4 x float> %a1, <4 x i16> *%a2) {		define <8 x i16> @test_vcvtps2ph_128(<4 x float> %a0, <4 x float> %a1, <4 x i16> *%a2) {
; GENERIC-LABEL: test_vcvtps2ph_128:		; GENERIC-LABEL: test_vcvtps2ph_128:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vcvtps2ph $0, %xmm0, %xmm0 # sched: [3:1.00]		; GENERIC-NEXT: vcvtps2ph $0, %xmm0, %xmm0 # sched: [3:1.00]
; GENERIC-NEXT: vcvtps2ph $0, %xmm1, (%rdi) # sched: [7:1.00]		; GENERIC-NEXT: vcvtps2ph $0, %xmm1, (%rdi) # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; IVY-LABEL: test_vcvtps2ph_128:		; IVY-LABEL: test_vcvtps2ph_128:
; IVY: # %bb.0:		; IVY: # %bb.0:
; IVY-NEXT: vcvtps2ph $0, %xmm0, %xmm0 # sched: [3:1.00]		; IVY-NEXT: vcvtps2ph $0, %xmm0, %xmm0 # sched: [3:1.00]
; IVY-NEXT: vcvtps2ph $0, %xmm1, (%rdi) # sched: [7:1.00]		; IVY-NEXT: vcvtps2ph $0, %xmm1, (%rdi) # sched: [8:1.00]
; IVY-NEXT: retq # sched: [1:1.00]		; IVY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_vcvtps2ph_128:		; HASWELL-LABEL: test_vcvtps2ph_128:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vcvtps2ph $0, %xmm0, %xmm0 # sched: [4:1.00]		; HASWELL-NEXT: vcvtps2ph $0, %xmm0, %xmm0 # sched: [4:1.00]
; HASWELL-NEXT: vcvtps2ph $0, %xmm1, (%rdi) # sched: [5:1.00]		; HASWELL-NEXT: vcvtps2ph $0, %xmm1, (%rdi) # sched: [5:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
;		;
Show All 27 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <8 x i16> %1		ret <8 x i16> %1
}		}
declare <8 x i16> @llvm.x86.vcvtps2ph.128(<4 x float>, i32)		declare <8 x i16> @llvm.x86.vcvtps2ph.128(<4 x float>, i32)

define <8 x i16> @test_vcvtps2ph_256(<8 x float> %a0, <8 x float> %a1, <8 x i16> *%a2) {		define <8 x i16> @test_vcvtps2ph_256(<8 x float> %a0, <8 x float> %a1, <8 x i16> *%a2) {
; GENERIC-LABEL: test_vcvtps2ph_256:		; GENERIC-LABEL: test_vcvtps2ph_256:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: vcvtps2ph $0, %ymm0, %xmm0 # sched: [3:1.00]		; GENERIC-NEXT: vcvtps2ph $0, %ymm0, %xmm0 # sched: [3:1.00]
; GENERIC-NEXT: vcvtps2ph $0, %ymm1, (%rdi) # sched: [7:1.00]		; GENERIC-NEXT: vcvtps2ph $0, %ymm1, (%rdi) # sched: [8:1.00]
; GENERIC-NEXT: vzeroupper		; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; IVY-LABEL: test_vcvtps2ph_256:		; IVY-LABEL: test_vcvtps2ph_256:
; IVY: # %bb.0:		; IVY: # %bb.0:
; IVY-NEXT: vcvtps2ph $0, %ymm0, %xmm0 # sched: [3:1.00]		; IVY-NEXT: vcvtps2ph $0, %ymm0, %xmm0 # sched: [3:1.00]
; IVY-NEXT: vcvtps2ph $0, %ymm1, (%rdi) # sched: [7:1.00]		; IVY-NEXT: vcvtps2ph $0, %ymm1, (%rdi) # sched: [8:1.00]
; IVY-NEXT: vzeroupper		; IVY-NEXT: vzeroupper # sched: [100:0.33]
; IVY-NEXT: retq # sched: [1:1.00]		; IVY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_vcvtps2ph_256:		; HASWELL-LABEL: test_vcvtps2ph_256:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: vcvtps2ph $0, %ymm0, %xmm0 # sched: [6:1.00]		; HASWELL-NEXT: vcvtps2ph $0, %ymm0, %xmm0 # sched: [6:1.00]
; HASWELL-NEXT: vcvtps2ph $0, %ymm1, (%rdi) # sched: [7:1.00]		; HASWELL-NEXT: vcvtps2ph $0, %ymm1, (%rdi) # sched: [7:1.00]
; HASWELL-NEXT: vzeroupper # sched: [4:1.00]		; HASWELL-NEXT: vzeroupper # sched: [4:1.00]
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
Show All 33 Lines

llvm/trunk/test/CodeGen/X86/fma-schedule.ll

	Show All 12 Lines

	define void @test_vfmaddpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {			define void @test_vfmaddpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfmaddpd_128:			; GENERIC-LABEL: test_vfmaddpd_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmadd132pd {{.#+}} xmm0 = (xmm0 xmm2) + xmm1 sched: [5:0.50]			; GENERIC-NEXT: vfmadd132pd {{.#+}} xmm0 = (xmm0 xmm2) + xmm1 sched: [5:0.50]
	; GENERIC-NEXT: vfmadd213pd {{.#+}} xmm0 = (xmm1 xmm0) + xmm2 sched: [5:0.50]			; GENERIC-NEXT: vfmadd213pd {{.#+}} xmm0 = (xmm1 xmm0) + xmm2 sched: [5:0.50]
	; GENERIC-NEXT: vfmadd231pd {{.#+}} xmm0 = (xmm1 xmm2) + xmm0 sched: [5:0.50]			; GENERIC-NEXT: vfmadd231pd {{.#+}} xmm0 = (xmm1 xmm2) + xmm0 sched: [5:0.50]
	; GENERIC-NEXT: vfmadd132pd {{.#+}} xmm0 = (xmm0 mem) + xmm1 sched: [9:0.50]			; GENERIC-NEXT: vfmadd132pd {{.#+}} xmm0 = (xmm0 mem) + xmm1 sched: [10:0.50]
	; GENERIC-NEXT: vfmadd213pd {{.#+}} xmm0 = (xmm1 xmm0) + mem sched: [9:0.50]			; GENERIC-NEXT: vfmadd213pd {{.#+}} xmm0 = (xmm1 xmm0) + mem sched: [10:0.50]
	; GENERIC-NEXT: vfmadd231pd {{.#+}} xmm0 = (xmm1 mem) + xmm0 sched: [9:0.50]			; GENERIC-NEXT: vfmadd231pd {{.#+}} xmm0 = (xmm1 mem) + xmm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfmaddpd_128:			; HASWELL-LABEL: test_vfmaddpd_128:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfmadd132pd {{.#+}} xmm0 = (xmm0 xmm2) + xmm1 sched: [5:0.50]			; HASWELL-NEXT: vfmadd132pd {{.#+}} xmm0 = (xmm0 xmm2) + xmm1 sched: [5:0.50]
	; HASWELL-NEXT: vfmadd213pd {{.#+}} xmm0 = (xmm1 xmm0) + xmm2 sched: [5:0.50]			; HASWELL-NEXT: vfmadd213pd {{.#+}} xmm0 = (xmm1 xmm0) + xmm2 sched: [5:0.50]
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines

	define void @test_vfmaddpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {			define void @test_vfmaddpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfmaddpd_256:			; GENERIC-LABEL: test_vfmaddpd_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmadd132pd {{.#+}} ymm0 = (ymm0 ymm2) + ymm1 sched: [5:0.50]			; GENERIC-NEXT: vfmadd132pd {{.#+}} ymm0 = (ymm0 ymm2) + ymm1 sched: [5:0.50]
	; GENERIC-NEXT: vfmadd213pd {{.#+}} ymm0 = (ymm1 ymm0) + ymm2 sched: [5:0.50]			; GENERIC-NEXT: vfmadd213pd {{.#+}} ymm0 = (ymm1 ymm0) + ymm2 sched: [5:0.50]
	; GENERIC-NEXT: vfmadd231pd {{.#+}} ymm0 = (ymm1 ymm2) + ymm0 sched: [5:0.50]			; GENERIC-NEXT: vfmadd231pd {{.#+}} ymm0 = (ymm1 ymm2) + ymm0 sched: [5:0.50]
	; GENERIC-NEXT: vfmadd132pd {{.#+}} ymm0 = (ymm0 mem) + ymm1 sched: [9:0.50]			; GENERIC-NEXT: vfmadd132pd {{.#+}} ymm0 = (ymm0 mem) + ymm1 sched: [10:0.50]
	; GENERIC-NEXT: vfmadd213pd {{.#+}} ymm0 = (ymm1 ymm0) + mem sched: [9:0.50]			; GENERIC-NEXT: vfmadd213pd {{.#+}} ymm0 = (ymm1 ymm0) + mem sched: [10:0.50]
	; GENERIC-NEXT: vfmadd231pd {{.#+}} ymm0 = (ymm1 mem) + ymm0 sched: [9:0.50]			; GENERIC-NEXT: vfmadd231pd {{.#+}} ymm0 = (ymm1 mem) + ymm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfmaddpd_256:			; HASWELL-LABEL: test_vfmaddpd_256:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfmadd132pd {{.#+}} ymm0 = (ymm0 ymm2) + ymm1 sched: [5:0.50]			; HASWELL-NEXT: vfmadd132pd {{.#+}} ymm0 = (ymm0 ymm2) + ymm1 sched: [5:0.50]
	▲ Show 20 Lines • Show All 75 Lines • ▼ Show 20 Lines

	define void @test_vfmaddps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {			define void @test_vfmaddps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfmaddps_128:			; GENERIC-LABEL: test_vfmaddps_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmadd132ps {{.#+}} xmm0 = (xmm0 xmm2) + xmm1 sched: [5:0.50]			; GENERIC-NEXT: vfmadd132ps {{.#+}} xmm0 = (xmm0 xmm2) + xmm1 sched: [5:0.50]
	; GENERIC-NEXT: vfmadd213ps {{.#+}} xmm0 = (xmm1 xmm0) + xmm2 sched: [5:0.50]			; GENERIC-NEXT: vfmadd213ps {{.#+}} xmm0 = (xmm1 xmm0) + xmm2 sched: [5:0.50]
	; GENERIC-NEXT: vfmadd231ps {{.#+}} xmm0 = (xmm1 xmm2) + xmm0 sched: [5:0.50]			; GENERIC-NEXT: vfmadd231ps {{.#+}} xmm0 = (xmm1 xmm2) + xmm0 sched: [5:0.50]
	; GENERIC-NEXT: vfmadd132ps {{.#+}} xmm0 = (xmm0 mem) + xmm1 sched: [9:0.50]			; GENERIC-NEXT: vfmadd132ps {{.#+}} xmm0 = (xmm0 mem) + xmm1 sched: [10:0.50]
	; GENERIC-NEXT: vfmadd213ps {{.#+}} xmm0 = (xmm1 xmm0) + mem sched: [9:0.50]			; GENERIC-NEXT: vfmadd213ps {{.#+}} xmm0 = (xmm1 xmm0) + mem sched: [10:0.50]
	; GENERIC-NEXT: vfmadd231ps {{.#+}} xmm0 = (xmm1 mem) + xmm0 sched: [9:0.50]			; GENERIC-NEXT: vfmadd231ps {{.#+}} xmm0 = (xmm1 mem) + xmm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfmaddps_128:			; HASWELL-LABEL: test_vfmaddps_128:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfmadd132ps {{.#+}} xmm0 = (xmm0 xmm2) + xmm1 sched: [5:0.50]			; HASWELL-NEXT: vfmadd132ps {{.#+}} xmm0 = (xmm0 xmm2) + xmm1 sched: [5:0.50]
	; HASWELL-NEXT: vfmadd213ps {{.#+}} xmm0 = (xmm1 xmm0) + xmm2 sched: [5:0.50]			; HASWELL-NEXT: vfmadd213ps {{.#+}} xmm0 = (xmm1 xmm0) + xmm2 sched: [5:0.50]
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines

	define void @test_vfmaddps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {			define void @test_vfmaddps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfmaddps_256:			; GENERIC-LABEL: test_vfmaddps_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmadd132ps {{.#+}} ymm0 = (ymm0 ymm2) + ymm1 sched: [5:0.50]			; GENERIC-NEXT: vfmadd132ps {{.#+}} ymm0 = (ymm0 ymm2) + ymm1 sched: [5:0.50]
	; GENERIC-NEXT: vfmadd213ps {{.#+}} ymm0 = (ymm1 ymm0) + ymm2 sched: [5:0.50]			; GENERIC-NEXT: vfmadd213ps {{.#+}} ymm0 = (ymm1 ymm0) + ymm2 sched: [5:0.50]
	; GENERIC-NEXT: vfmadd231ps {{.#+}} ymm0 = (ymm1 ymm2) + ymm0 sched: [5:0.50]			; GENERIC-NEXT: vfmadd231ps {{.#+}} ymm0 = (ymm1 ymm2) + ymm0 sched: [5:0.50]
	; GENERIC-NEXT: vfmadd132ps {{.#+}} ymm0 = (ymm0 mem) + ymm1 sched: [9:0.50]			; GENERIC-NEXT: vfmadd132ps {{.#+}} ymm0 = (ymm0 mem) + ymm1 sched: [10:0.50]
	; GENERIC-NEXT: vfmadd213ps {{.#+}} ymm0 = (ymm1 ymm0) + mem sched: [9:0.50]			; GENERIC-NEXT: vfmadd213ps {{.#+}} ymm0 = (ymm1 ymm0) + mem sched: [10:0.50]
	; GENERIC-NEXT: vfmadd231ps {{.#+}} ymm0 = (ymm1 mem) + ymm0 sched: [9:0.50]			; GENERIC-NEXT: vfmadd231ps {{.#+}} ymm0 = (ymm1 mem) + ymm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfmaddps_256:			; HASWELL-LABEL: test_vfmaddps_256:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfmadd132ps {{.#+}} ymm0 = (ymm0 ymm2) + ymm1 sched: [5:0.50]			; HASWELL-NEXT: vfmadd132ps {{.#+}} ymm0 = (ymm0 ymm2) + ymm1 sched: [5:0.50]
	▲ Show 20 Lines • Show All 75 Lines • ▼ Show 20 Lines

	define void @test_vfmaddsd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {			define void @test_vfmaddsd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfmaddsd_128:			; GENERIC-LABEL: test_vfmaddsd_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmadd132sd {{.#+}} xmm0 = (xmm0 xmm2) + xmm1 sched: [5:0.50]			; GENERIC-NEXT: vfmadd132sd {{.#+}} xmm0 = (xmm0 xmm2) + xmm1 sched: [5:0.50]
	; GENERIC-NEXT: vfmadd213sd {{.#+}} xmm0 = (xmm1 xmm0) + xmm2 sched: [5:0.50]			; GENERIC-NEXT: vfmadd213sd {{.#+}} xmm0 = (xmm1 xmm0) + xmm2 sched: [5:0.50]
	; GENERIC-NEXT: vfmadd231sd {{.#+}} xmm0 = (xmm1 xmm2) + xmm0 sched: [5:0.50]			; GENERIC-NEXT: vfmadd231sd {{.#+}} xmm0 = (xmm1 xmm2) + xmm0 sched: [5:0.50]
	; GENERIC-NEXT: vfmadd132sd {{.#+}} xmm0 = (xmm0 mem) + xmm1 sched: [9:0.50]			; GENERIC-NEXT: vfmadd132sd {{.#+}} xmm0 = (xmm0 mem) + xmm1 sched: [10:0.50]
	; GENERIC-NEXT: vfmadd213sd {{.#+}} xmm0 = (xmm1 xmm0) + mem sched: [9:0.50]			; GENERIC-NEXT: vfmadd213sd {{.#+}} xmm0 = (xmm1 xmm0) + mem sched: [10:0.50]
	; GENERIC-NEXT: vfmadd231sd {{.#+}} xmm0 = (xmm1 mem) + xmm0 sched: [9:0.50]			; GENERIC-NEXT: vfmadd231sd {{.#+}} xmm0 = (xmm1 mem) + xmm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfmaddsd_128:			; HASWELL-LABEL: test_vfmaddsd_128:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfmadd132sd {{.#+}} xmm0 = (xmm0 xmm2) + xmm1 sched: [5:0.50]			; HASWELL-NEXT: vfmadd132sd {{.#+}} xmm0 = (xmm0 xmm2) + xmm1 sched: [5:0.50]
	; HASWELL-NEXT: vfmadd213sd {{.#+}} xmm0 = (xmm1 xmm0) + xmm2 sched: [5:0.50]			; HASWELL-NEXT: vfmadd213sd {{.#+}} xmm0 = (xmm1 xmm0) + xmm2 sched: [5:0.50]
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines

	define void @test_vfmaddss_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {			define void @test_vfmaddss_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfmaddss_128:			; GENERIC-LABEL: test_vfmaddss_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmadd132ss {{.#+}} xmm0 = (xmm0 xmm2) + xmm1 sched: [5:0.50]			; GENERIC-NEXT: vfmadd132ss {{.#+}} xmm0 = (xmm0 xmm2) + xmm1 sched: [5:0.50]
	; GENERIC-NEXT: vfmadd213ss {{.#+}} xmm0 = (xmm1 xmm0) + xmm2 sched: [5:0.50]			; GENERIC-NEXT: vfmadd213ss {{.#+}} xmm0 = (xmm1 xmm0) + xmm2 sched: [5:0.50]
	; GENERIC-NEXT: vfmadd231ss {{.#+}} xmm0 = (xmm1 xmm2) + xmm0 sched: [5:0.50]			; GENERIC-NEXT: vfmadd231ss {{.#+}} xmm0 = (xmm1 xmm2) + xmm0 sched: [5:0.50]
	; GENERIC-NEXT: vfmadd132ss {{.#+}} xmm0 = (xmm0 mem) + xmm1 sched: [9:0.50]			; GENERIC-NEXT: vfmadd132ss {{.#+}} xmm0 = (xmm0 mem) + xmm1 sched: [10:0.50]
	; GENERIC-NEXT: vfmadd213ss {{.#+}} xmm0 = (xmm1 xmm0) + mem sched: [9:0.50]			; GENERIC-NEXT: vfmadd213ss {{.#+}} xmm0 = (xmm1 xmm0) + mem sched: [10:0.50]
	; GENERIC-NEXT: vfmadd231ss {{.#+}} xmm0 = (xmm1 mem) + xmm0 sched: [9:0.50]			; GENERIC-NEXT: vfmadd231ss {{.#+}} xmm0 = (xmm1 mem) + xmm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfmaddss_128:			; HASWELL-LABEL: test_vfmaddss_128:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfmadd132ss {{.#+}} xmm0 = (xmm0 xmm2) + xmm1 sched: [5:0.50]			; HASWELL-NEXT: vfmadd132ss {{.#+}} xmm0 = (xmm0 xmm2) + xmm1 sched: [5:0.50]
	; HASWELL-NEXT: vfmadd213ss {{.#+}} xmm0 = (xmm1 xmm0) + xmm2 sched: [5:0.50]			; HASWELL-NEXT: vfmadd213ss {{.#+}} xmm0 = (xmm1 xmm0) + xmm2 sched: [5:0.50]
	▲ Show 20 Lines • Show All 73 Lines • ▼ Show 20 Lines

	define void @test_vfmaddsubpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {			define void @test_vfmaddsubpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfmaddsubpd_128:			; GENERIC-LABEL: test_vfmaddsubpd_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmaddsub132pd {{.#+}} xmm0 = (xmm0 xmm2) +/- xmm1 sched: [5:0.50]			; GENERIC-NEXT: vfmaddsub132pd {{.#+}} xmm0 = (xmm0 xmm2) +/- xmm1 sched: [5:0.50]
	; GENERIC-NEXT: vfmaddsub213pd {{.#+}} xmm0 = (xmm1 xmm0) +/- xmm2 sched: [5:0.50]			; GENERIC-NEXT: vfmaddsub213pd {{.#+}} xmm0 = (xmm1 xmm0) +/- xmm2 sched: [5:0.50]
	; GENERIC-NEXT: vfmaddsub231pd {{.#+}} xmm0 = (xmm1 xmm2) +/- xmm0 sched: [5:0.50]			; GENERIC-NEXT: vfmaddsub231pd {{.#+}} xmm0 = (xmm1 xmm2) +/- xmm0 sched: [5:0.50]
	; GENERIC-NEXT: vfmaddsub132pd {{.#+}} xmm0 = (xmm0 mem) +/- xmm1 sched: [9:0.50]			; GENERIC-NEXT: vfmaddsub132pd {{.#+}} xmm0 = (xmm0 mem) +/- xmm1 sched: [10:0.50]
	; GENERIC-NEXT: vfmaddsub213pd {{.#+}} xmm0 = (xmm1 xmm0) +/- mem sched: [9:0.50]			; GENERIC-NEXT: vfmaddsub213pd {{.#+}} xmm0 = (xmm1 xmm0) +/- mem sched: [10:0.50]
	; GENERIC-NEXT: vfmaddsub231pd {{.#+}} xmm0 = (xmm1 mem) +/- xmm0 sched: [9:0.50]			; GENERIC-NEXT: vfmaddsub231pd {{.#+}} xmm0 = (xmm1 mem) +/- xmm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfmaddsubpd_128:			; HASWELL-LABEL: test_vfmaddsubpd_128:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfmaddsub132pd {{.#+}} xmm0 = (xmm0 xmm2) +/- xmm1 sched: [5:0.50]			; HASWELL-NEXT: vfmaddsub132pd {{.#+}} xmm0 = (xmm0 xmm2) +/- xmm1 sched: [5:0.50]
	; HASWELL-NEXT: vfmaddsub213pd {{.#+}} xmm0 = (xmm1 xmm0) +/- xmm2 sched: [5:0.50]			; HASWELL-NEXT: vfmaddsub213pd {{.#+}} xmm0 = (xmm1 xmm0) +/- xmm2 sched: [5:0.50]
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines

	define void @test_vfmaddsubpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {			define void @test_vfmaddsubpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfmaddsubpd_256:			; GENERIC-LABEL: test_vfmaddsubpd_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmaddsub132pd {{.#+}} ymm0 = (ymm0 ymm2) +/- ymm1 sched: [5:0.50]			; GENERIC-NEXT: vfmaddsub132pd {{.#+}} ymm0 = (ymm0 ymm2) +/- ymm1 sched: [5:0.50]
	; GENERIC-NEXT: vfmaddsub213pd {{.#+}} ymm0 = (ymm1 ymm0) +/- ymm2 sched: [5:0.50]			; GENERIC-NEXT: vfmaddsub213pd {{.#+}} ymm0 = (ymm1 ymm0) +/- ymm2 sched: [5:0.50]
	; GENERIC-NEXT: vfmaddsub231pd {{.#+}} ymm0 = (ymm1 ymm2) +/- ymm0 sched: [5:0.50]			; GENERIC-NEXT: vfmaddsub231pd {{.#+}} ymm0 = (ymm1 ymm2) +/- ymm0 sched: [5:0.50]
	; GENERIC-NEXT: vfmaddsub132pd {{.#+}} ymm0 = (ymm0 mem) +/- ymm1 sched: [9:0.50]			; GENERIC-NEXT: vfmaddsub132pd {{.#+}} ymm0 = (ymm0 mem) +/- ymm1 sched: [10:0.50]
	; GENERIC-NEXT: vfmaddsub213pd {{.#+}} ymm0 = (ymm1 ymm0) +/- mem sched: [9:0.50]			; GENERIC-NEXT: vfmaddsub213pd {{.#+}} ymm0 = (ymm1 ymm0) +/- mem sched: [10:0.50]
	; GENERIC-NEXT: vfmaddsub231pd {{.#+}} ymm0 = (ymm1 mem) +/- ymm0 sched: [9:0.50]			; GENERIC-NEXT: vfmaddsub231pd {{.#+}} ymm0 = (ymm1 mem) +/- ymm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfmaddsubpd_256:			; HASWELL-LABEL: test_vfmaddsubpd_256:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfmaddsub132pd {{.#+}} ymm0 = (ymm0 ymm2) +/- ymm1 sched: [5:0.50]			; HASWELL-NEXT: vfmaddsub132pd {{.#+}} ymm0 = (ymm0 ymm2) +/- ymm1 sched: [5:0.50]
	▲ Show 20 Lines • Show All 75 Lines • ▼ Show 20 Lines

	define void @test_vfmaddsubps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {			define void @test_vfmaddsubps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfmaddsubps_128:			; GENERIC-LABEL: test_vfmaddsubps_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmaddsub132ps {{.#+}} xmm0 = (xmm0 xmm2) +/- xmm1 sched: [5:0.50]			; GENERIC-NEXT: vfmaddsub132ps {{.#+}} xmm0 = (xmm0 xmm2) +/- xmm1 sched: [5:0.50]
	; GENERIC-NEXT: vfmaddsub213ps {{.#+}} xmm0 = (xmm1 xmm0) +/- xmm2 sched: [5:0.50]			; GENERIC-NEXT: vfmaddsub213ps {{.#+}} xmm0 = (xmm1 xmm0) +/- xmm2 sched: [5:0.50]
	; GENERIC-NEXT: vfmaddsub231ps {{.#+}} xmm0 = (xmm1 xmm2) +/- xmm0 sched: [5:0.50]			; GENERIC-NEXT: vfmaddsub231ps {{.#+}} xmm0 = (xmm1 xmm2) +/- xmm0 sched: [5:0.50]
	; GENERIC-NEXT: vfmaddsub132ps {{.#+}} xmm0 = (xmm0 mem) +/- xmm1 sched: [9:0.50]			; GENERIC-NEXT: vfmaddsub132ps {{.#+}} xmm0 = (xmm0 mem) +/- xmm1 sched: [10:0.50]
	; GENERIC-NEXT: vfmaddsub213ps {{.#+}} xmm0 = (xmm1 xmm0) +/- mem sched: [9:0.50]			; GENERIC-NEXT: vfmaddsub213ps {{.#+}} xmm0 = (xmm1 xmm0) +/- mem sched: [10:0.50]
	; GENERIC-NEXT: vfmaddsub231ps {{.#+}} xmm0 = (xmm1 mem) +/- xmm0 sched: [9:0.50]			; GENERIC-NEXT: vfmaddsub231ps {{.#+}} xmm0 = (xmm1 mem) +/- xmm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfmaddsubps_128:			; HASWELL-LABEL: test_vfmaddsubps_128:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfmaddsub132ps {{.#+}} xmm0 = (xmm0 xmm2) +/- xmm1 sched: [5:0.50]			; HASWELL-NEXT: vfmaddsub132ps {{.#+}} xmm0 = (xmm0 xmm2) +/- xmm1 sched: [5:0.50]
	; HASWELL-NEXT: vfmaddsub213ps {{.#+}} xmm0 = (xmm1 xmm0) +/- xmm2 sched: [5:0.50]			; HASWELL-NEXT: vfmaddsub213ps {{.#+}} xmm0 = (xmm1 xmm0) +/- xmm2 sched: [5:0.50]
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines

	define void @test_vfmaddsubps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {			define void @test_vfmaddsubps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfmaddsubps_256:			; GENERIC-LABEL: test_vfmaddsubps_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmaddsub132ps {{.#+}} ymm0 = (ymm0 ymm2) +/- ymm1 sched: [5:0.50]			; GENERIC-NEXT: vfmaddsub132ps {{.#+}} ymm0 = (ymm0 ymm2) +/- ymm1 sched: [5:0.50]
	; GENERIC-NEXT: vfmaddsub213ps {{.#+}} ymm0 = (ymm1 ymm0) +/- ymm2 sched: [5:0.50]			; GENERIC-NEXT: vfmaddsub213ps {{.#+}} ymm0 = (ymm1 ymm0) +/- ymm2 sched: [5:0.50]
	; GENERIC-NEXT: vfmaddsub231ps {{.#+}} ymm0 = (ymm1 ymm2) +/- ymm0 sched: [5:0.50]			; GENERIC-NEXT: vfmaddsub231ps {{.#+}} ymm0 = (ymm1 ymm2) +/- ymm0 sched: [5:0.50]
	; GENERIC-NEXT: vfmaddsub132ps {{.#+}} ymm0 = (ymm0 mem) +/- ymm1 sched: [9:0.50]			; GENERIC-NEXT: vfmaddsub132ps {{.#+}} ymm0 = (ymm0 mem) +/- ymm1 sched: [10:0.50]
	; GENERIC-NEXT: vfmaddsub213ps {{.#+}} ymm0 = (ymm1 ymm0) +/- mem sched: [9:0.50]			; GENERIC-NEXT: vfmaddsub213ps {{.#+}} ymm0 = (ymm1 ymm0) +/- mem sched: [10:0.50]
	; GENERIC-NEXT: vfmaddsub231ps {{.#+}} ymm0 = (ymm1 mem) +/- ymm0 sched: [9:0.50]			; GENERIC-NEXT: vfmaddsub231ps {{.#+}} ymm0 = (ymm1 mem) +/- ymm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfmaddsubps_256:			; HASWELL-LABEL: test_vfmaddsubps_256:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfmaddsub132ps {{.#+}} ymm0 = (ymm0 ymm2) +/- ymm1 sched: [5:0.50]			; HASWELL-NEXT: vfmaddsub132ps {{.#+}} ymm0 = (ymm0 ymm2) +/- ymm1 sched: [5:0.50]
	▲ Show 20 Lines • Show All 79 Lines • ▼ Show 20 Lines

	define void @test_vfmsubaddpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {			define void @test_vfmsubaddpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfmsubaddpd_128:			; GENERIC-LABEL: test_vfmsubaddpd_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmsubadd132pd {{.#+}} xmm0 = (xmm0 xmm2) -/+ xmm1 sched: [5:0.50]			; GENERIC-NEXT: vfmsubadd132pd {{.#+}} xmm0 = (xmm0 xmm2) -/+ xmm1 sched: [5:0.50]
	; GENERIC-NEXT: vfmsubadd213pd {{.#+}} xmm0 = (xmm1 xmm0) -/+ xmm2 sched: [5:0.50]			; GENERIC-NEXT: vfmsubadd213pd {{.#+}} xmm0 = (xmm1 xmm0) -/+ xmm2 sched: [5:0.50]
	; GENERIC-NEXT: vfmsubadd231pd {{.#+}} xmm0 = (xmm1 xmm2) -/+ xmm0 sched: [5:0.50]			; GENERIC-NEXT: vfmsubadd231pd {{.#+}} xmm0 = (xmm1 xmm2) -/+ xmm0 sched: [5:0.50]
	; GENERIC-NEXT: vfmsubadd132pd {{.#+}} xmm0 = (xmm0 mem) -/+ xmm1 sched: [9:0.50]			; GENERIC-NEXT: vfmsubadd132pd {{.#+}} xmm0 = (xmm0 mem) -/+ xmm1 sched: [10:0.50]
	; GENERIC-NEXT: vfmsubadd213pd {{.#+}} xmm0 = (xmm1 xmm0) -/+ mem sched: [9:0.50]			; GENERIC-NEXT: vfmsubadd213pd {{.#+}} xmm0 = (xmm1 xmm0) -/+ mem sched: [10:0.50]
	; GENERIC-NEXT: vfmsubadd231pd {{.#+}} xmm0 = (xmm1 mem) -/+ xmm0 sched: [9:0.50]			; GENERIC-NEXT: vfmsubadd231pd {{.#+}} xmm0 = (xmm1 mem) -/+ xmm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfmsubaddpd_128:			; HASWELL-LABEL: test_vfmsubaddpd_128:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfmsubadd132pd {{.#+}} xmm0 = (xmm0 xmm2) -/+ xmm1 sched: [5:0.50]			; HASWELL-NEXT: vfmsubadd132pd {{.#+}} xmm0 = (xmm0 xmm2) -/+ xmm1 sched: [5:0.50]
	; HASWELL-NEXT: vfmsubadd213pd {{.#+}} xmm0 = (xmm1 xmm0) -/+ xmm2 sched: [5:0.50]			; HASWELL-NEXT: vfmsubadd213pd {{.#+}} xmm0 = (xmm1 xmm0) -/+ xmm2 sched: [5:0.50]
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines

	define void @test_vfmsubaddpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {			define void @test_vfmsubaddpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfmsubaddpd_256:			; GENERIC-LABEL: test_vfmsubaddpd_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmsubadd132pd {{.#+}} ymm0 = (ymm0 ymm2) -/+ ymm1 sched: [5:0.50]			; GENERIC-NEXT: vfmsubadd132pd {{.#+}} ymm0 = (ymm0 ymm2) -/+ ymm1 sched: [5:0.50]
	; GENERIC-NEXT: vfmsubadd213pd {{.#+}} ymm0 = (ymm1 ymm0) -/+ ymm2 sched: [5:0.50]			; GENERIC-NEXT: vfmsubadd213pd {{.#+}} ymm0 = (ymm1 ymm0) -/+ ymm2 sched: [5:0.50]
	; GENERIC-NEXT: vfmsubadd231pd {{.#+}} ymm0 = (ymm1 ymm2) -/+ ymm0 sched: [5:0.50]			; GENERIC-NEXT: vfmsubadd231pd {{.#+}} ymm0 = (ymm1 ymm2) -/+ ymm0 sched: [5:0.50]
	; GENERIC-NEXT: vfmsubadd132pd {{.#+}} ymm0 = (ymm0 mem) -/+ ymm1 sched: [9:0.50]			; GENERIC-NEXT: vfmsubadd132pd {{.#+}} ymm0 = (ymm0 mem) -/+ ymm1 sched: [10:0.50]
	; GENERIC-NEXT: vfmsubadd213pd {{.#+}} ymm0 = (ymm1 ymm0) -/+ mem sched: [9:0.50]			; GENERIC-NEXT: vfmsubadd213pd {{.#+}} ymm0 = (ymm1 ymm0) -/+ mem sched: [10:0.50]
	; GENERIC-NEXT: vfmsubadd231pd {{.#+}} ymm0 = (ymm1 mem) -/+ ymm0 sched: [9:0.50]			; GENERIC-NEXT: vfmsubadd231pd {{.#+}} ymm0 = (ymm1 mem) -/+ ymm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfmsubaddpd_256:			; HASWELL-LABEL: test_vfmsubaddpd_256:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfmsubadd132pd {{.#+}} ymm0 = (ymm0 ymm2) -/+ ymm1 sched: [5:0.50]			; HASWELL-NEXT: vfmsubadd132pd {{.#+}} ymm0 = (ymm0 ymm2) -/+ ymm1 sched: [5:0.50]
	▲ Show 20 Lines • Show All 75 Lines • ▼ Show 20 Lines

	define void @test_vfmsubaddps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {			define void @test_vfmsubaddps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfmsubaddps_128:			; GENERIC-LABEL: test_vfmsubaddps_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmsubadd132ps {{.#+}} xmm0 = (xmm0 xmm2) -/+ xmm1 sched: [5:0.50]			; GENERIC-NEXT: vfmsubadd132ps {{.#+}} xmm0 = (xmm0 xmm2) -/+ xmm1 sched: [5:0.50]
	; GENERIC-NEXT: vfmsubadd213ps {{.#+}} xmm0 = (xmm1 xmm0) -/+ xmm2 sched: [5:0.50]			; GENERIC-NEXT: vfmsubadd213ps {{.#+}} xmm0 = (xmm1 xmm0) -/+ xmm2 sched: [5:0.50]
	; GENERIC-NEXT: vfmsubadd231ps {{.#+}} xmm0 = (xmm1 xmm2) -/+ xmm0 sched: [5:0.50]			; GENERIC-NEXT: vfmsubadd231ps {{.#+}} xmm0 = (xmm1 xmm2) -/+ xmm0 sched: [5:0.50]
	; GENERIC-NEXT: vfmsubadd132ps {{.#+}} xmm0 = (xmm0 mem) -/+ xmm1 sched: [9:0.50]			; GENERIC-NEXT: vfmsubadd132ps {{.#+}} xmm0 = (xmm0 mem) -/+ xmm1 sched: [10:0.50]
	; GENERIC-NEXT: vfmsubadd213ps {{.#+}} xmm0 = (xmm1 xmm0) -/+ mem sched: [9:0.50]			; GENERIC-NEXT: vfmsubadd213ps {{.#+}} xmm0 = (xmm1 xmm0) -/+ mem sched: [10:0.50]
	; GENERIC-NEXT: vfmsubadd231ps {{.#+}} xmm0 = (xmm1 mem) -/+ xmm0 sched: [9:0.50]			; GENERIC-NEXT: vfmsubadd231ps {{.#+}} xmm0 = (xmm1 mem) -/+ xmm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfmsubaddps_128:			; HASWELL-LABEL: test_vfmsubaddps_128:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfmsubadd132ps {{.#+}} xmm0 = (xmm0 xmm2) -/+ xmm1 sched: [5:0.50]			; HASWELL-NEXT: vfmsubadd132ps {{.#+}} xmm0 = (xmm0 xmm2) -/+ xmm1 sched: [5:0.50]
	; HASWELL-NEXT: vfmsubadd213ps {{.#+}} xmm0 = (xmm1 xmm0) -/+ xmm2 sched: [5:0.50]			; HASWELL-NEXT: vfmsubadd213ps {{.#+}} xmm0 = (xmm1 xmm0) -/+ xmm2 sched: [5:0.50]
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines

	define void @test_vfmsubaddps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {			define void @test_vfmsubaddps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfmsubaddps_256:			; GENERIC-LABEL: test_vfmsubaddps_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmsubadd132ps {{.#+}} ymm0 = (ymm0 ymm2) -/+ ymm1 sched: [5:0.50]			; GENERIC-NEXT: vfmsubadd132ps {{.#+}} ymm0 = (ymm0 ymm2) -/+ ymm1 sched: [5:0.50]
	; GENERIC-NEXT: vfmsubadd213ps {{.#+}} ymm0 = (ymm1 ymm0) -/+ ymm2 sched: [5:0.50]			; GENERIC-NEXT: vfmsubadd213ps {{.#+}} ymm0 = (ymm1 ymm0) -/+ ymm2 sched: [5:0.50]
	; GENERIC-NEXT: vfmsubadd231ps {{.#+}} ymm0 = (ymm1 ymm2) -/+ ymm0 sched: [5:0.50]			; GENERIC-NEXT: vfmsubadd231ps {{.#+}} ymm0 = (ymm1 ymm2) -/+ ymm0 sched: [5:0.50]
	; GENERIC-NEXT: vfmsubadd132ps {{.#+}} ymm0 = (ymm0 mem) -/+ ymm1 sched: [9:0.50]			; GENERIC-NEXT: vfmsubadd132ps {{.#+}} ymm0 = (ymm0 mem) -/+ ymm1 sched: [10:0.50]
	; GENERIC-NEXT: vfmsubadd213ps {{.#+}} ymm0 = (ymm1 ymm0) -/+ mem sched: [9:0.50]			; GENERIC-NEXT: vfmsubadd213ps {{.#+}} ymm0 = (ymm1 ymm0) -/+ mem sched: [10:0.50]
	; GENERIC-NEXT: vfmsubadd231ps {{.#+}} ymm0 = (ymm1 mem) -/+ ymm0 sched: [9:0.50]			; GENERIC-NEXT: vfmsubadd231ps {{.#+}} ymm0 = (ymm1 mem) -/+ ymm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfmsubaddps_256:			; HASWELL-LABEL: test_vfmsubaddps_256:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfmsubadd132ps {{.#+}} ymm0 = (ymm0 ymm2) -/+ ymm1 sched: [5:0.50]			; HASWELL-NEXT: vfmsubadd132ps {{.#+}} ymm0 = (ymm0 ymm2) -/+ ymm1 sched: [5:0.50]
	▲ Show 20 Lines • Show All 79 Lines • ▼ Show 20 Lines

	define void @test_vfmsubpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {			define void @test_vfmsubpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfmsubpd_128:			; GENERIC-LABEL: test_vfmsubpd_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmsub132pd {{.#+}} xmm0 = (xmm0 xmm2) - xmm1 sched: [5:0.50]			; GENERIC-NEXT: vfmsub132pd {{.#+}} xmm0 = (xmm0 xmm2) - xmm1 sched: [5:0.50]
	; GENERIC-NEXT: vfmsub213pd {{.#+}} xmm0 = (xmm1 xmm0) - xmm2 sched: [5:0.50]			; GENERIC-NEXT: vfmsub213pd {{.#+}} xmm0 = (xmm1 xmm0) - xmm2 sched: [5:0.50]
	; GENERIC-NEXT: vfmsub231pd {{.#+}} xmm0 = (xmm1 xmm2) - xmm0 sched: [5:0.50]			; GENERIC-NEXT: vfmsub231pd {{.#+}} xmm0 = (xmm1 xmm2) - xmm0 sched: [5:0.50]
	; GENERIC-NEXT: vfmsub132pd {{.#+}} xmm0 = (xmm0 mem) - xmm1 sched: [9:0.50]			; GENERIC-NEXT: vfmsub132pd {{.#+}} xmm0 = (xmm0 mem) - xmm1 sched: [10:0.50]
	; GENERIC-NEXT: vfmsub213pd {{.#+}} xmm0 = (xmm1 xmm0) - mem sched: [9:0.50]			; GENERIC-NEXT: vfmsub213pd {{.#+}} xmm0 = (xmm1 xmm0) - mem sched: [10:0.50]
	; GENERIC-NEXT: vfmsub231pd {{.#+}} xmm0 = (xmm1 mem) - xmm0 sched: [9:0.50]			; GENERIC-NEXT: vfmsub231pd {{.#+}} xmm0 = (xmm1 mem) - xmm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfmsubpd_128:			; HASWELL-LABEL: test_vfmsubpd_128:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfmsub132pd {{.#+}} xmm0 = (xmm0 xmm2) - xmm1 sched: [5:0.50]			; HASWELL-NEXT: vfmsub132pd {{.#+}} xmm0 = (xmm0 xmm2) - xmm1 sched: [5:0.50]
	; HASWELL-NEXT: vfmsub213pd {{.#+}} xmm0 = (xmm1 xmm0) - xmm2 sched: [5:0.50]			; HASWELL-NEXT: vfmsub213pd {{.#+}} xmm0 = (xmm1 xmm0) - xmm2 sched: [5:0.50]
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines

	define void @test_vfmsubpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {			define void @test_vfmsubpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfmsubpd_256:			; GENERIC-LABEL: test_vfmsubpd_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmsub132pd {{.#+}} ymm0 = (ymm0 ymm2) - ymm1 sched: [5:0.50]			; GENERIC-NEXT: vfmsub132pd {{.#+}} ymm0 = (ymm0 ymm2) - ymm1 sched: [5:0.50]
	; GENERIC-NEXT: vfmsub213pd {{.#+}} ymm0 = (ymm1 ymm0) - ymm2 sched: [5:0.50]			; GENERIC-NEXT: vfmsub213pd {{.#+}} ymm0 = (ymm1 ymm0) - ymm2 sched: [5:0.50]
	; GENERIC-NEXT: vfmsub231pd {{.#+}} ymm0 = (ymm1 ymm2) - ymm0 sched: [5:0.50]			; GENERIC-NEXT: vfmsub231pd {{.#+}} ymm0 = (ymm1 ymm2) - ymm0 sched: [5:0.50]
	; GENERIC-NEXT: vfmsub132pd {{.#+}} ymm0 = (ymm0 mem) - ymm1 sched: [9:0.50]			; GENERIC-NEXT: vfmsub132pd {{.#+}} ymm0 = (ymm0 mem) - ymm1 sched: [10:0.50]
	; GENERIC-NEXT: vfmsub213pd {{.#+}} ymm0 = (ymm1 ymm0) - mem sched: [9:0.50]			; GENERIC-NEXT: vfmsub213pd {{.#+}} ymm0 = (ymm1 ymm0) - mem sched: [10:0.50]
	; GENERIC-NEXT: vfmsub231pd {{.#+}} ymm0 = (ymm1 mem) - ymm0 sched: [9:0.50]			; GENERIC-NEXT: vfmsub231pd {{.#+}} ymm0 = (ymm1 mem) - ymm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfmsubpd_256:			; HASWELL-LABEL: test_vfmsubpd_256:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfmsub132pd {{.#+}} ymm0 = (ymm0 ymm2) - ymm1 sched: [5:0.50]			; HASWELL-NEXT: vfmsub132pd {{.#+}} ymm0 = (ymm0 ymm2) - ymm1 sched: [5:0.50]
	▲ Show 20 Lines • Show All 75 Lines • ▼ Show 20 Lines

	define void @test_vfmsubps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {			define void @test_vfmsubps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfmsubps_128:			; GENERIC-LABEL: test_vfmsubps_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmsub132ps {{.#+}} xmm0 = (xmm0 xmm2) - xmm1 sched: [5:0.50]			; GENERIC-NEXT: vfmsub132ps {{.#+}} xmm0 = (xmm0 xmm2) - xmm1 sched: [5:0.50]
	; GENERIC-NEXT: vfmsub213ps {{.#+}} xmm0 = (xmm1 xmm0) - xmm2 sched: [5:0.50]			; GENERIC-NEXT: vfmsub213ps {{.#+}} xmm0 = (xmm1 xmm0) - xmm2 sched: [5:0.50]
	; GENERIC-NEXT: vfmsub231ps {{.#+}} xmm0 = (xmm1 xmm2) - xmm0 sched: [5:0.50]			; GENERIC-NEXT: vfmsub231ps {{.#+}} xmm0 = (xmm1 xmm2) - xmm0 sched: [5:0.50]
	; GENERIC-NEXT: vfmsub132ps {{.#+}} xmm0 = (xmm0 mem) - xmm1 sched: [9:0.50]			; GENERIC-NEXT: vfmsub132ps {{.#+}} xmm0 = (xmm0 mem) - xmm1 sched: [10:0.50]
	; GENERIC-NEXT: vfmsub213ps {{.#+}} xmm0 = (xmm1 xmm0) - mem sched: [9:0.50]			; GENERIC-NEXT: vfmsub213ps {{.#+}} xmm0 = (xmm1 xmm0) - mem sched: [10:0.50]
	; GENERIC-NEXT: vfmsub231ps {{.#+}} xmm0 = (xmm1 mem) - xmm0 sched: [9:0.50]			; GENERIC-NEXT: vfmsub231ps {{.#+}} xmm0 = (xmm1 mem) - xmm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfmsubps_128:			; HASWELL-LABEL: test_vfmsubps_128:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfmsub132ps {{.#+}} xmm0 = (xmm0 xmm2) - xmm1 sched: [5:0.50]			; HASWELL-NEXT: vfmsub132ps {{.#+}} xmm0 = (xmm0 xmm2) - xmm1 sched: [5:0.50]
	; HASWELL-NEXT: vfmsub213ps {{.#+}} xmm0 = (xmm1 xmm0) - xmm2 sched: [5:0.50]			; HASWELL-NEXT: vfmsub213ps {{.#+}} xmm0 = (xmm1 xmm0) - xmm2 sched: [5:0.50]
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines

	define void @test_vfmsubps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {			define void @test_vfmsubps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfmsubps_256:			; GENERIC-LABEL: test_vfmsubps_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmsub132ps {{.#+}} ymm0 = (ymm0 ymm2) - ymm1 sched: [5:0.50]			; GENERIC-NEXT: vfmsub132ps {{.#+}} ymm0 = (ymm0 ymm2) - ymm1 sched: [5:0.50]
	; GENERIC-NEXT: vfmsub213ps {{.#+}} ymm0 = (ymm1 ymm0) - ymm2 sched: [5:0.50]			; GENERIC-NEXT: vfmsub213ps {{.#+}} ymm0 = (ymm1 ymm0) - ymm2 sched: [5:0.50]
	; GENERIC-NEXT: vfmsub231ps {{.#+}} ymm0 = (ymm1 ymm2) - ymm0 sched: [5:0.50]			; GENERIC-NEXT: vfmsub231ps {{.#+}} ymm0 = (ymm1 ymm2) - ymm0 sched: [5:0.50]
	; GENERIC-NEXT: vfmsub132ps {{.#+}} ymm0 = (ymm0 mem) - ymm1 sched: [9:0.50]			; GENERIC-NEXT: vfmsub132ps {{.#+}} ymm0 = (ymm0 mem) - ymm1 sched: [10:0.50]
	; GENERIC-NEXT: vfmsub213ps {{.#+}} ymm0 = (ymm1 ymm0) - mem sched: [9:0.50]			; GENERIC-NEXT: vfmsub213ps {{.#+}} ymm0 = (ymm1 ymm0) - mem sched: [10:0.50]
	; GENERIC-NEXT: vfmsub231ps {{.#+}} ymm0 = (ymm1 mem) - ymm0 sched: [9:0.50]			; GENERIC-NEXT: vfmsub231ps {{.#+}} ymm0 = (ymm1 mem) - ymm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfmsubps_256:			; HASWELL-LABEL: test_vfmsubps_256:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfmsub132ps {{.#+}} ymm0 = (ymm0 ymm2) - ymm1 sched: [5:0.50]			; HASWELL-NEXT: vfmsub132ps {{.#+}} ymm0 = (ymm0 ymm2) - ymm1 sched: [5:0.50]
	▲ Show 20 Lines • Show All 75 Lines • ▼ Show 20 Lines

	define void @test_vfmsubsd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {			define void @test_vfmsubsd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfmsubsd_128:			; GENERIC-LABEL: test_vfmsubsd_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmsub132sd {{.#+}} xmm0 = (xmm0 xmm2) - xmm1 sched: [5:0.50]			; GENERIC-NEXT: vfmsub132sd {{.#+}} xmm0 = (xmm0 xmm2) - xmm1 sched: [5:0.50]
	; GENERIC-NEXT: vfmsub213sd {{.#+}} xmm0 = (xmm1 xmm0) - xmm2 sched: [5:0.50]			; GENERIC-NEXT: vfmsub213sd {{.#+}} xmm0 = (xmm1 xmm0) - xmm2 sched: [5:0.50]
	; GENERIC-NEXT: vfmsub231sd {{.#+}} xmm0 = (xmm1 xmm2) - xmm0 sched: [5:0.50]			; GENERIC-NEXT: vfmsub231sd {{.#+}} xmm0 = (xmm1 xmm2) - xmm0 sched: [5:0.50]
	; GENERIC-NEXT: vfmsub132sd {{.#+}} xmm0 = (xmm0 mem) - xmm1 sched: [9:0.50]			; GENERIC-NEXT: vfmsub132sd {{.#+}} xmm0 = (xmm0 mem) - xmm1 sched: [10:0.50]
	; GENERIC-NEXT: vfmsub213sd {{.#+}} xmm0 = (xmm1 xmm0) - mem sched: [9:0.50]			; GENERIC-NEXT: vfmsub213sd {{.#+}} xmm0 = (xmm1 xmm0) - mem sched: [10:0.50]
	; GENERIC-NEXT: vfmsub231sd {{.#+}} xmm0 = (xmm1 mem) - xmm0 sched: [9:0.50]			; GENERIC-NEXT: vfmsub231sd {{.#+}} xmm0 = (xmm1 mem) - xmm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfmsubsd_128:			; HASWELL-LABEL: test_vfmsubsd_128:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfmsub132sd {{.#+}} xmm0 = (xmm0 xmm2) - xmm1 sched: [5:0.50]			; HASWELL-NEXT: vfmsub132sd {{.#+}} xmm0 = (xmm0 xmm2) - xmm1 sched: [5:0.50]
	; HASWELL-NEXT: vfmsub213sd {{.#+}} xmm0 = (xmm1 xmm0) - xmm2 sched: [5:0.50]			; HASWELL-NEXT: vfmsub213sd {{.#+}} xmm0 = (xmm1 xmm0) - xmm2 sched: [5:0.50]
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines

	define void @test_vfmsubss_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {			define void @test_vfmsubss_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfmsubss_128:			; GENERIC-LABEL: test_vfmsubss_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmsub132ss {{.#+}} xmm0 = (xmm0 xmm2) - xmm1 sched: [5:0.50]			; GENERIC-NEXT: vfmsub132ss {{.#+}} xmm0 = (xmm0 xmm2) - xmm1 sched: [5:0.50]
	; GENERIC-NEXT: vfmsub213ss {{.#+}} xmm0 = (xmm1 xmm0) - xmm2 sched: [5:0.50]			; GENERIC-NEXT: vfmsub213ss {{.#+}} xmm0 = (xmm1 xmm0) - xmm2 sched: [5:0.50]
	; GENERIC-NEXT: vfmsub231ss {{.#+}} xmm0 = (xmm1 xmm2) - xmm0 sched: [5:0.50]			; GENERIC-NEXT: vfmsub231ss {{.#+}} xmm0 = (xmm1 xmm2) - xmm0 sched: [5:0.50]
	; GENERIC-NEXT: vfmsub132ss {{.#+}} xmm0 = (xmm0 mem) - xmm1 sched: [9:0.50]			; GENERIC-NEXT: vfmsub132ss {{.#+}} xmm0 = (xmm0 mem) - xmm1 sched: [10:0.50]
	; GENERIC-NEXT: vfmsub213ss {{.#+}} xmm0 = (xmm1 xmm0) - mem sched: [9:0.50]			; GENERIC-NEXT: vfmsub213ss {{.#+}} xmm0 = (xmm1 xmm0) - mem sched: [10:0.50]
	; GENERIC-NEXT: vfmsub231ss {{.#+}} xmm0 = (xmm1 mem) - xmm0 sched: [9:0.50]			; GENERIC-NEXT: vfmsub231ss {{.#+}} xmm0 = (xmm1 mem) - xmm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfmsubss_128:			; HASWELL-LABEL: test_vfmsubss_128:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfmsub132ss {{.#+}} xmm0 = (xmm0 xmm2) - xmm1 sched: [5:0.50]			; HASWELL-NEXT: vfmsub132ss {{.#+}} xmm0 = (xmm0 xmm2) - xmm1 sched: [5:0.50]
	; HASWELL-NEXT: vfmsub213ss {{.#+}} xmm0 = (xmm1 xmm0) - xmm2 sched: [5:0.50]			; HASWELL-NEXT: vfmsub213ss {{.#+}} xmm0 = (xmm1 xmm0) - xmm2 sched: [5:0.50]
	▲ Show 20 Lines • Show All 73 Lines • ▼ Show 20 Lines

	define void @test_vfnmaddpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {			define void @test_vfnmaddpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmaddpd_128:			; GENERIC-LABEL: test_vfnmaddpd_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmadd132pd {{.#+}} xmm0 = -(xmm0 xmm2) + xmm1 sched: [5:0.50]			; GENERIC-NEXT: vfnmadd132pd {{.#+}} xmm0 = -(xmm0 xmm2) + xmm1 sched: [5:0.50]
	; GENERIC-NEXT: vfnmadd213pd {{.#+}} xmm0 = -(xmm1 xmm0) + xmm2 sched: [5:0.50]			; GENERIC-NEXT: vfnmadd213pd {{.#+}} xmm0 = -(xmm1 xmm0) + xmm2 sched: [5:0.50]
	; GENERIC-NEXT: vfnmadd231pd {{.#+}} xmm0 = -(xmm1 xmm2) + xmm0 sched: [5:0.50]			; GENERIC-NEXT: vfnmadd231pd {{.#+}} xmm0 = -(xmm1 xmm2) + xmm0 sched: [5:0.50]
	; GENERIC-NEXT: vfnmadd132pd {{.#+}} xmm0 = -(xmm0 mem) + xmm1 sched: [9:0.50]			; GENERIC-NEXT: vfnmadd132pd {{.#+}} xmm0 = -(xmm0 mem) + xmm1 sched: [10:0.50]
	; GENERIC-NEXT: vfnmadd213pd {{.#+}} xmm0 = -(xmm1 xmm0) + mem sched: [9:0.50]			; GENERIC-NEXT: vfnmadd213pd {{.#+}} xmm0 = -(xmm1 xmm0) + mem sched: [10:0.50]
	; GENERIC-NEXT: vfnmadd231pd {{.#+}} xmm0 = -(xmm1 mem) + xmm0 sched: [9:0.50]			; GENERIC-NEXT: vfnmadd231pd {{.#+}} xmm0 = -(xmm1 mem) + xmm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfnmaddpd_128:			; HASWELL-LABEL: test_vfnmaddpd_128:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfnmadd132pd {{.#+}} xmm0 = -(xmm0 xmm2) + xmm1 sched: [5:0.50]			; HASWELL-NEXT: vfnmadd132pd {{.#+}} xmm0 = -(xmm0 xmm2) + xmm1 sched: [5:0.50]
	; HASWELL-NEXT: vfnmadd213pd {{.#+}} xmm0 = -(xmm1 xmm0) + xmm2 sched: [5:0.50]			; HASWELL-NEXT: vfnmadd213pd {{.#+}} xmm0 = -(xmm1 xmm0) + xmm2 sched: [5:0.50]
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines

	define void @test_vfnmaddpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {			define void @test_vfnmaddpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmaddpd_256:			; GENERIC-LABEL: test_vfnmaddpd_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmadd132pd {{.#+}} ymm0 = -(ymm0 ymm2) + ymm1 sched: [5:0.50]			; GENERIC-NEXT: vfnmadd132pd {{.#+}} ymm0 = -(ymm0 ymm2) + ymm1 sched: [5:0.50]
	; GENERIC-NEXT: vfnmadd213pd {{.#+}} ymm0 = -(ymm1 ymm0) + ymm2 sched: [5:0.50]			; GENERIC-NEXT: vfnmadd213pd {{.#+}} ymm0 = -(ymm1 ymm0) + ymm2 sched: [5:0.50]
	; GENERIC-NEXT: vfnmadd231pd {{.#+}} ymm0 = -(ymm1 ymm2) + ymm0 sched: [5:0.50]			; GENERIC-NEXT: vfnmadd231pd {{.#+}} ymm0 = -(ymm1 ymm2) + ymm0 sched: [5:0.50]
	; GENERIC-NEXT: vfnmadd132pd {{.#+}} ymm0 = -(ymm0 mem) + ymm1 sched: [9:0.50]			; GENERIC-NEXT: vfnmadd132pd {{.#+}} ymm0 = -(ymm0 mem) + ymm1 sched: [10:0.50]
	; GENERIC-NEXT: vfnmadd213pd {{.#+}} ymm0 = -(ymm1 ymm0) + mem sched: [9:0.50]			; GENERIC-NEXT: vfnmadd213pd {{.#+}} ymm0 = -(ymm1 ymm0) + mem sched: [10:0.50]
	; GENERIC-NEXT: vfnmadd231pd {{.#+}} ymm0 = -(ymm1 mem) + ymm0 sched: [9:0.50]			; GENERIC-NEXT: vfnmadd231pd {{.#+}} ymm0 = -(ymm1 mem) + ymm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfnmaddpd_256:			; HASWELL-LABEL: test_vfnmaddpd_256:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfnmadd132pd {{.#+}} ymm0 = -(ymm0 ymm2) + ymm1 sched: [5:0.50]			; HASWELL-NEXT: vfnmadd132pd {{.#+}} ymm0 = -(ymm0 ymm2) + ymm1 sched: [5:0.50]
	▲ Show 20 Lines • Show All 75 Lines • ▼ Show 20 Lines

	define void @test_vfnmaddps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {			define void @test_vfnmaddps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmaddps_128:			; GENERIC-LABEL: test_vfnmaddps_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmadd132ps {{.#+}} xmm0 = -(xmm0 xmm2) + xmm1 sched: [5:0.50]			; GENERIC-NEXT: vfnmadd132ps {{.#+}} xmm0 = -(xmm0 xmm2) + xmm1 sched: [5:0.50]
	; GENERIC-NEXT: vfnmadd213ps {{.#+}} xmm0 = -(xmm1 xmm0) + xmm2 sched: [5:0.50]			; GENERIC-NEXT: vfnmadd213ps {{.#+}} xmm0 = -(xmm1 xmm0) + xmm2 sched: [5:0.50]
	; GENERIC-NEXT: vfnmadd231ps {{.#+}} xmm0 = -(xmm1 xmm2) + xmm0 sched: [5:0.50]			; GENERIC-NEXT: vfnmadd231ps {{.#+}} xmm0 = -(xmm1 xmm2) + xmm0 sched: [5:0.50]
	; GENERIC-NEXT: vfnmadd132ps {{.#+}} xmm0 = -(xmm0 mem) + xmm1 sched: [9:0.50]			; GENERIC-NEXT: vfnmadd132ps {{.#+}} xmm0 = -(xmm0 mem) + xmm1 sched: [10:0.50]
	; GENERIC-NEXT: vfnmadd213ps {{.#+}} xmm0 = -(xmm1 xmm0) + mem sched: [9:0.50]			; GENERIC-NEXT: vfnmadd213ps {{.#+}} xmm0 = -(xmm1 xmm0) + mem sched: [10:0.50]
	; GENERIC-NEXT: vfnmadd231ps {{.#+}} xmm0 = -(xmm1 mem) + xmm0 sched: [9:0.50]			; GENERIC-NEXT: vfnmadd231ps {{.#+}} xmm0 = -(xmm1 mem) + xmm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfnmaddps_128:			; HASWELL-LABEL: test_vfnmaddps_128:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfnmadd132ps {{.#+}} xmm0 = -(xmm0 xmm2) + xmm1 sched: [5:0.50]			; HASWELL-NEXT: vfnmadd132ps {{.#+}} xmm0 = -(xmm0 xmm2) + xmm1 sched: [5:0.50]
	; HASWELL-NEXT: vfnmadd213ps {{.#+}} xmm0 = -(xmm1 xmm0) + xmm2 sched: [5:0.50]			; HASWELL-NEXT: vfnmadd213ps {{.#+}} xmm0 = -(xmm1 xmm0) + xmm2 sched: [5:0.50]
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines

	define void @test_vfnmaddps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {			define void @test_vfnmaddps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmaddps_256:			; GENERIC-LABEL: test_vfnmaddps_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmadd132ps {{.#+}} ymm0 = -(ymm0 ymm2) + ymm1 sched: [5:0.50]			; GENERIC-NEXT: vfnmadd132ps {{.#+}} ymm0 = -(ymm0 ymm2) + ymm1 sched: [5:0.50]
	; GENERIC-NEXT: vfnmadd213ps {{.#+}} ymm0 = -(ymm1 ymm0) + ymm2 sched: [5:0.50]			; GENERIC-NEXT: vfnmadd213ps {{.#+}} ymm0 = -(ymm1 ymm0) + ymm2 sched: [5:0.50]
	; GENERIC-NEXT: vfnmadd231ps {{.#+}} ymm0 = -(ymm1 ymm2) + ymm0 sched: [5:0.50]			; GENERIC-NEXT: vfnmadd231ps {{.#+}} ymm0 = -(ymm1 ymm2) + ymm0 sched: [5:0.50]
	; GENERIC-NEXT: vfnmadd132ps {{.#+}} ymm0 = -(ymm0 mem) + ymm1 sched: [9:0.50]			; GENERIC-NEXT: vfnmadd132ps {{.#+}} ymm0 = -(ymm0 mem) + ymm1 sched: [10:0.50]
	; GENERIC-NEXT: vfnmadd213ps {{.#+}} ymm0 = -(ymm1 ymm0) + mem sched: [9:0.50]			; GENERIC-NEXT: vfnmadd213ps {{.#+}} ymm0 = -(ymm1 ymm0) + mem sched: [10:0.50]
	; GENERIC-NEXT: vfnmadd231ps {{.#+}} ymm0 = -(ymm1 mem) + ymm0 sched: [9:0.50]			; GENERIC-NEXT: vfnmadd231ps {{.#+}} ymm0 = -(ymm1 mem) + ymm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfnmaddps_256:			; HASWELL-LABEL: test_vfnmaddps_256:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfnmadd132ps {{.#+}} ymm0 = -(ymm0 ymm2) + ymm1 sched: [5:0.50]			; HASWELL-NEXT: vfnmadd132ps {{.#+}} ymm0 = -(ymm0 ymm2) + ymm1 sched: [5:0.50]
	▲ Show 20 Lines • Show All 75 Lines • ▼ Show 20 Lines

	define void @test_vfnmaddsd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {			define void @test_vfnmaddsd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmaddsd_128:			; GENERIC-LABEL: test_vfnmaddsd_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmadd132sd {{.#+}} xmm0 = -(xmm0 xmm2) + xmm1 sched: [5:0.50]			; GENERIC-NEXT: vfnmadd132sd {{.#+}} xmm0 = -(xmm0 xmm2) + xmm1 sched: [5:0.50]
	; GENERIC-NEXT: vfnmadd213sd {{.#+}} xmm0 = -(xmm1 xmm0) + xmm2 sched: [5:0.50]			; GENERIC-NEXT: vfnmadd213sd {{.#+}} xmm0 = -(xmm1 xmm0) + xmm2 sched: [5:0.50]
	; GENERIC-NEXT: vfnmadd231sd {{.#+}} xmm0 = -(xmm1 xmm2) + xmm0 sched: [5:0.50]			; GENERIC-NEXT: vfnmadd231sd {{.#+}} xmm0 = -(xmm1 xmm2) + xmm0 sched: [5:0.50]
	; GENERIC-NEXT: vfnmadd132sd {{.#+}} xmm0 = -(xmm0 mem) + xmm1 sched: [9:0.50]			; GENERIC-NEXT: vfnmadd132sd {{.#+}} xmm0 = -(xmm0 mem) + xmm1 sched: [10:0.50]
	; GENERIC-NEXT: vfnmadd213sd {{.#+}} xmm0 = -(xmm1 xmm0) + mem sched: [9:0.50]			; GENERIC-NEXT: vfnmadd213sd {{.#+}} xmm0 = -(xmm1 xmm0) + mem sched: [10:0.50]
	; GENERIC-NEXT: vfnmadd231sd {{.#+}} xmm0 = -(xmm1 mem) + xmm0 sched: [9:0.50]			; GENERIC-NEXT: vfnmadd231sd {{.#+}} xmm0 = -(xmm1 mem) + xmm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfnmaddsd_128:			; HASWELL-LABEL: test_vfnmaddsd_128:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfnmadd132sd {{.#+}} xmm0 = -(xmm0 xmm2) + xmm1 sched: [5:0.50]			; HASWELL-NEXT: vfnmadd132sd {{.#+}} xmm0 = -(xmm0 xmm2) + xmm1 sched: [5:0.50]
	; HASWELL-NEXT: vfnmadd213sd {{.#+}} xmm0 = -(xmm1 xmm0) + xmm2 sched: [5:0.50]			; HASWELL-NEXT: vfnmadd213sd {{.#+}} xmm0 = -(xmm1 xmm0) + xmm2 sched: [5:0.50]
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines

	define void @test_vfnmaddss_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {			define void @test_vfnmaddss_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmaddss_128:			; GENERIC-LABEL: test_vfnmaddss_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmadd132ss {{.#+}} xmm0 = -(xmm0 xmm2) + xmm1 sched: [5:0.50]			; GENERIC-NEXT: vfnmadd132ss {{.#+}} xmm0 = -(xmm0 xmm2) + xmm1 sched: [5:0.50]
	; GENERIC-NEXT: vfnmadd213ss {{.#+}} xmm0 = -(xmm1 xmm0) + xmm2 sched: [5:0.50]			; GENERIC-NEXT: vfnmadd213ss {{.#+}} xmm0 = -(xmm1 xmm0) + xmm2 sched: [5:0.50]
	; GENERIC-NEXT: vfnmadd231ss {{.#+}} xmm0 = -(xmm1 xmm2) + xmm0 sched: [5:0.50]			; GENERIC-NEXT: vfnmadd231ss {{.#+}} xmm0 = -(xmm1 xmm2) + xmm0 sched: [5:0.50]
	; GENERIC-NEXT: vfnmadd132ss {{.#+}} xmm0 = -(xmm0 mem) + xmm1 sched: [9:0.50]			; GENERIC-NEXT: vfnmadd132ss {{.#+}} xmm0 = -(xmm0 mem) + xmm1 sched: [10:0.50]
	; GENERIC-NEXT: vfnmadd213ss {{.#+}} xmm0 = -(xmm1 xmm0) + mem sched: [9:0.50]			; GENERIC-NEXT: vfnmadd213ss {{.#+}} xmm0 = -(xmm1 xmm0) + mem sched: [10:0.50]
	; GENERIC-NEXT: vfnmadd231ss {{.#+}} xmm0 = -(xmm1 mem) + xmm0 sched: [9:0.50]			; GENERIC-NEXT: vfnmadd231ss {{.#+}} xmm0 = -(xmm1 mem) + xmm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfnmaddss_128:			; HASWELL-LABEL: test_vfnmaddss_128:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfnmadd132ss {{.#+}} xmm0 = -(xmm0 xmm2) + xmm1 sched: [5:0.50]			; HASWELL-NEXT: vfnmadd132ss {{.#+}} xmm0 = -(xmm0 xmm2) + xmm1 sched: [5:0.50]
	; HASWELL-NEXT: vfnmadd213ss {{.#+}} xmm0 = -(xmm1 xmm0) + xmm2 sched: [5:0.50]			; HASWELL-NEXT: vfnmadd213ss {{.#+}} xmm0 = -(xmm1 xmm0) + xmm2 sched: [5:0.50]
	▲ Show 20 Lines • Show All 73 Lines • ▼ Show 20 Lines

	define void @test_vfnmsubpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {			define void @test_vfnmsubpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmsubpd_128:			; GENERIC-LABEL: test_vfnmsubpd_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmsub132pd {{.#+}} xmm0 = -(xmm0 xmm2) - xmm1 sched: [5:0.50]			; GENERIC-NEXT: vfnmsub132pd {{.#+}} xmm0 = -(xmm0 xmm2) - xmm1 sched: [5:0.50]
	; GENERIC-NEXT: vfnmsub213pd {{.#+}} xmm0 = -(xmm1 xmm0) - xmm2 sched: [5:0.50]			; GENERIC-NEXT: vfnmsub213pd {{.#+}} xmm0 = -(xmm1 xmm0) - xmm2 sched: [5:0.50]
	; GENERIC-NEXT: vfnmsub231pd {{.#+}} xmm0 = -(xmm1 xmm2) - xmm0 sched: [5:0.50]			; GENERIC-NEXT: vfnmsub231pd {{.#+}} xmm0 = -(xmm1 xmm2) - xmm0 sched: [5:0.50]
	; GENERIC-NEXT: vfnmsub132pd {{.#+}} xmm0 = -(xmm0 mem) - xmm1 sched: [9:0.50]			; GENERIC-NEXT: vfnmsub132pd {{.#+}} xmm0 = -(xmm0 mem) - xmm1 sched: [10:0.50]
	; GENERIC-NEXT: vfnmsub213pd {{.#+}} xmm0 = -(xmm1 xmm0) - mem sched: [9:0.50]			; GENERIC-NEXT: vfnmsub213pd {{.#+}} xmm0 = -(xmm1 xmm0) - mem sched: [10:0.50]
	; GENERIC-NEXT: vfnmsub231pd {{.#+}} xmm0 = -(xmm1 mem) - xmm0 sched: [9:0.50]			; GENERIC-NEXT: vfnmsub231pd {{.#+}} xmm0 = -(xmm1 mem) - xmm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfnmsubpd_128:			; HASWELL-LABEL: test_vfnmsubpd_128:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfnmsub132pd {{.#+}} xmm0 = -(xmm0 xmm2) - xmm1 sched: [5:0.50]			; HASWELL-NEXT: vfnmsub132pd {{.#+}} xmm0 = -(xmm0 xmm2) - xmm1 sched: [5:0.50]
	; HASWELL-NEXT: vfnmsub213pd {{.#+}} xmm0 = -(xmm1 xmm0) - xmm2 sched: [5:0.50]			; HASWELL-NEXT: vfnmsub213pd {{.#+}} xmm0 = -(xmm1 xmm0) - xmm2 sched: [5:0.50]
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines

	define void @test_vfnmsubpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {			define void @test_vfnmsubpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmsubpd_256:			; GENERIC-LABEL: test_vfnmsubpd_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmsub132pd {{.#+}} ymm0 = -(ymm0 ymm2) - ymm1 sched: [5:0.50]			; GENERIC-NEXT: vfnmsub132pd {{.#+}} ymm0 = -(ymm0 ymm2) - ymm1 sched: [5:0.50]
	; GENERIC-NEXT: vfnmsub213pd {{.#+}} ymm0 = -(ymm1 ymm0) - ymm2 sched: [5:0.50]			; GENERIC-NEXT: vfnmsub213pd {{.#+}} ymm0 = -(ymm1 ymm0) - ymm2 sched: [5:0.50]
	; GENERIC-NEXT: vfnmsub231pd {{.#+}} ymm0 = -(ymm1 ymm2) - ymm0 sched: [5:0.50]			; GENERIC-NEXT: vfnmsub231pd {{.#+}} ymm0 = -(ymm1 ymm2) - ymm0 sched: [5:0.50]
	; GENERIC-NEXT: vfnmsub132pd {{.#+}} ymm0 = -(ymm0 mem) - ymm1 sched: [9:0.50]			; GENERIC-NEXT: vfnmsub132pd {{.#+}} ymm0 = -(ymm0 mem) - ymm1 sched: [10:0.50]
	; GENERIC-NEXT: vfnmsub213pd {{.#+}} ymm0 = -(ymm1 ymm0) - mem sched: [9:0.50]			; GENERIC-NEXT: vfnmsub213pd {{.#+}} ymm0 = -(ymm1 ymm0) - mem sched: [10:0.50]
	; GENERIC-NEXT: vfnmsub231pd {{.#+}} ymm0 = -(ymm1 mem) - ymm0 sched: [9:0.50]			; GENERIC-NEXT: vfnmsub231pd {{.#+}} ymm0 = -(ymm1 mem) - ymm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfnmsubpd_256:			; HASWELL-LABEL: test_vfnmsubpd_256:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfnmsub132pd {{.#+}} ymm0 = -(ymm0 ymm2) - ymm1 sched: [5:0.50]			; HASWELL-NEXT: vfnmsub132pd {{.#+}} ymm0 = -(ymm0 ymm2) - ymm1 sched: [5:0.50]
	▲ Show 20 Lines • Show All 75 Lines • ▼ Show 20 Lines

	define void @test_vfnmsubps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {			define void @test_vfnmsubps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmsubps_128:			; GENERIC-LABEL: test_vfnmsubps_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmsub132ps {{.#+}} xmm0 = -(xmm0 xmm2) - xmm1 sched: [5:0.50]			; GENERIC-NEXT: vfnmsub132ps {{.#+}} xmm0 = -(xmm0 xmm2) - xmm1 sched: [5:0.50]
	; GENERIC-NEXT: vfnmsub213ps {{.#+}} xmm0 = -(xmm1 xmm0) - xmm2 sched: [5:0.50]			; GENERIC-NEXT: vfnmsub213ps {{.#+}} xmm0 = -(xmm1 xmm0) - xmm2 sched: [5:0.50]
	; GENERIC-NEXT: vfnmsub231ps {{.#+}} xmm0 = -(xmm1 xmm2) - xmm0 sched: [5:0.50]			; GENERIC-NEXT: vfnmsub231ps {{.#+}} xmm0 = -(xmm1 xmm2) - xmm0 sched: [5:0.50]
	; GENERIC-NEXT: vfnmsub132ps {{.#+}} xmm0 = -(xmm0 mem) - xmm1 sched: [9:0.50]			; GENERIC-NEXT: vfnmsub132ps {{.#+}} xmm0 = -(xmm0 mem) - xmm1 sched: [10:0.50]
	; GENERIC-NEXT: vfnmsub213ps {{.#+}} xmm0 = -(xmm1 xmm0) - mem sched: [9:0.50]			; GENERIC-NEXT: vfnmsub213ps {{.#+}} xmm0 = -(xmm1 xmm0) - mem sched: [10:0.50]
	; GENERIC-NEXT: vfnmsub231ps {{.#+}} xmm0 = -(xmm1 mem) - xmm0 sched: [9:0.50]			; GENERIC-NEXT: vfnmsub231ps {{.#+}} xmm0 = -(xmm1 mem) - xmm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfnmsubps_128:			; HASWELL-LABEL: test_vfnmsubps_128:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfnmsub132ps {{.#+}} xmm0 = -(xmm0 xmm2) - xmm1 sched: [5:0.50]			; HASWELL-NEXT: vfnmsub132ps {{.#+}} xmm0 = -(xmm0 xmm2) - xmm1 sched: [5:0.50]
	; HASWELL-NEXT: vfnmsub213ps {{.#+}} xmm0 = -(xmm1 xmm0) - xmm2 sched: [5:0.50]			; HASWELL-NEXT: vfnmsub213ps {{.#+}} xmm0 = -(xmm1 xmm0) - xmm2 sched: [5:0.50]
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines

	define void @test_vfnmsubps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {			define void @test_vfnmsubps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmsubps_256:			; GENERIC-LABEL: test_vfnmsubps_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmsub132ps {{.#+}} ymm0 = -(ymm0 ymm2) - ymm1 sched: [5:0.50]			; GENERIC-NEXT: vfnmsub132ps {{.#+}} ymm0 = -(ymm0 ymm2) - ymm1 sched: [5:0.50]
	; GENERIC-NEXT: vfnmsub213ps {{.#+}} ymm0 = -(ymm1 ymm0) - ymm2 sched: [5:0.50]			; GENERIC-NEXT: vfnmsub213ps {{.#+}} ymm0 = -(ymm1 ymm0) - ymm2 sched: [5:0.50]
	; GENERIC-NEXT: vfnmsub231ps {{.#+}} ymm0 = -(ymm1 ymm2) - ymm0 sched: [5:0.50]			; GENERIC-NEXT: vfnmsub231ps {{.#+}} ymm0 = -(ymm1 ymm2) - ymm0 sched: [5:0.50]
	; GENERIC-NEXT: vfnmsub132ps {{.#+}} ymm0 = -(ymm0 mem) - ymm1 sched: [9:0.50]			; GENERIC-NEXT: vfnmsub132ps {{.#+}} ymm0 = -(ymm0 mem) - ymm1 sched: [10:0.50]
	; GENERIC-NEXT: vfnmsub213ps {{.#+}} ymm0 = -(ymm1 ymm0) - mem sched: [9:0.50]			; GENERIC-NEXT: vfnmsub213ps {{.#+}} ymm0 = -(ymm1 ymm0) - mem sched: [10:0.50]
	; GENERIC-NEXT: vfnmsub231ps {{.#+}} ymm0 = -(ymm1 mem) - ymm0 sched: [9:0.50]			; GENERIC-NEXT: vfnmsub231ps {{.#+}} ymm0 = -(ymm1 mem) - ymm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfnmsubps_256:			; HASWELL-LABEL: test_vfnmsubps_256:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfnmsub132ps {{.#+}} ymm0 = -(ymm0 ymm2) - ymm1 sched: [5:0.50]			; HASWELL-NEXT: vfnmsub132ps {{.#+}} ymm0 = -(ymm0 ymm2) - ymm1 sched: [5:0.50]
	▲ Show 20 Lines • Show All 75 Lines • ▼ Show 20 Lines

	define void @test_vfnmsubsd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {			define void @test_vfnmsubsd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmsubsd_128:			; GENERIC-LABEL: test_vfnmsubsd_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmsub132sd {{.#+}} xmm0 = -(xmm0 xmm2) - xmm1 sched: [5:0.50]			; GENERIC-NEXT: vfnmsub132sd {{.#+}} xmm0 = -(xmm0 xmm2) - xmm1 sched: [5:0.50]
	; GENERIC-NEXT: vfnmsub213sd {{.#+}} xmm0 = -(xmm1 xmm0) - xmm2 sched: [5:0.50]			; GENERIC-NEXT: vfnmsub213sd {{.#+}} xmm0 = -(xmm1 xmm0) - xmm2 sched: [5:0.50]
	; GENERIC-NEXT: vfnmsub231sd {{.#+}} xmm0 = -(xmm1 xmm2) - xmm0 sched: [5:0.50]			; GENERIC-NEXT: vfnmsub231sd {{.#+}} xmm0 = -(xmm1 xmm2) - xmm0 sched: [5:0.50]
	; GENERIC-NEXT: vfnmsub132sd {{.#+}} xmm0 = -(xmm0 mem) - xmm1 sched: [9:0.50]			; GENERIC-NEXT: vfnmsub132sd {{.#+}} xmm0 = -(xmm0 mem) - xmm1 sched: [10:0.50]
	; GENERIC-NEXT: vfnmsub213sd {{.#+}} xmm0 = -(xmm1 xmm0) - mem sched: [9:0.50]			; GENERIC-NEXT: vfnmsub213sd {{.#+}} xmm0 = -(xmm1 xmm0) - mem sched: [10:0.50]
	; GENERIC-NEXT: vfnmsub231sd {{.#+}} xmm0 = -(xmm1 mem) - xmm0 sched: [9:0.50]			; GENERIC-NEXT: vfnmsub231sd {{.#+}} xmm0 = -(xmm1 mem) - xmm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfnmsubsd_128:			; HASWELL-LABEL: test_vfnmsubsd_128:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfnmsub132sd {{.#+}} xmm0 = -(xmm0 xmm2) - xmm1 sched: [5:0.50]			; HASWELL-NEXT: vfnmsub132sd {{.#+}} xmm0 = -(xmm0 xmm2) - xmm1 sched: [5:0.50]
	; HASWELL-NEXT: vfnmsub213sd {{.#+}} xmm0 = -(xmm1 xmm0) - xmm2 sched: [5:0.50]			; HASWELL-NEXT: vfnmsub213sd {{.#+}} xmm0 = -(xmm1 xmm0) - xmm2 sched: [5:0.50]
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines

	define void @test_vfnmsubss_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {			define void @test_vfnmsubss_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmsubss_128:			; GENERIC-LABEL: test_vfnmsubss_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmsub132ss {{.#+}} xmm0 = -(xmm0 xmm2) - xmm1 sched: [5:0.50]			; GENERIC-NEXT: vfnmsub132ss {{.#+}} xmm0 = -(xmm0 xmm2) - xmm1 sched: [5:0.50]
	; GENERIC-NEXT: vfnmsub213ss {{.#+}} xmm0 = -(xmm1 xmm0) - xmm2 sched: [5:0.50]			; GENERIC-NEXT: vfnmsub213ss {{.#+}} xmm0 = -(xmm1 xmm0) - xmm2 sched: [5:0.50]
	; GENERIC-NEXT: vfnmsub231ss {{.#+}} xmm0 = -(xmm1 xmm2) - xmm0 sched: [5:0.50]			; GENERIC-NEXT: vfnmsub231ss {{.#+}} xmm0 = -(xmm1 xmm2) - xmm0 sched: [5:0.50]
	; GENERIC-NEXT: vfnmsub132ss {{.#+}} xmm0 = -(xmm0 mem) - xmm1 sched: [9:0.50]			; GENERIC-NEXT: vfnmsub132ss {{.#+}} xmm0 = -(xmm0 mem) - xmm1 sched: [10:0.50]
	; GENERIC-NEXT: vfnmsub213ss {{.#+}} xmm0 = -(xmm1 xmm0) - mem sched: [9:0.50]			; GENERIC-NEXT: vfnmsub213ss {{.#+}} xmm0 = -(xmm1 xmm0) - mem sched: [10:0.50]
	; GENERIC-NEXT: vfnmsub231ss {{.#+}} xmm0 = -(xmm1 mem) - xmm0 sched: [9:0.50]			; GENERIC-NEXT: vfnmsub231ss {{.#+}} xmm0 = -(xmm1 mem) - xmm0 sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; HASWELL-LABEL: test_vfnmsubss_128:			; HASWELL-LABEL: test_vfnmsubss_128:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: vfnmsub132ss {{.#+}} xmm0 = -(xmm0 xmm2) - xmm1 sched: [5:0.50]			; HASWELL-NEXT: vfnmsub132ss {{.#+}} xmm0 = -(xmm0 xmm2) - xmm1 sched: [5:0.50]
	; HASWELL-NEXT: vfnmsub213ss {{.#+}} xmm0 = -(xmm1 xmm0) - xmm2 sched: [5:0.50]			; HASWELL-NEXT: vfnmsub213ss {{.#+}} xmm0 = -(xmm1 xmm0) - xmm2 sched: [5:0.50]
	▲ Show 20 Lines • Show All 69 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/fma4-schedule.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=x86-64 -mattr=+fma4 \| FileCheck %s --check-prefix=CHECK --check-prefix=GENERIC			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=x86-64 -mattr=+fma4 \| FileCheck %s --check-prefix=CHECK --check-prefix=GENERIC
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=bdver1 \| FileCheck %s --check-prefix=CHECK --check-prefix=BDVER --check-prefix=BDVER1			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=bdver1 \| FileCheck %s --check-prefix=CHECK --check-prefix=BDVER --check-prefix=BDVER1
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=bdver2 -mattr=-fma \| FileCheck %s --check-prefix=CHECK --check-prefix=BDVER --check-prefix=BDVER1			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=bdver2 -mattr=-fma \| FileCheck %s --check-prefix=CHECK --check-prefix=BDVER --check-prefix=BDVER1
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=bdver3 -mattr=-fma \| FileCheck %s --check-prefix=CHECK --check-prefix=BDVER --check-prefix=BDVER1			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=bdver3 -mattr=-fma \| FileCheck %s --check-prefix=CHECK --check-prefix=BDVER --check-prefix=BDVER1
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=bdver4 -mattr=-fma \| FileCheck %s --check-prefix=CHECK --check-prefix=BDVER --check-prefix=BDVER1			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=bdver4 -mattr=-fma \| FileCheck %s --check-prefix=CHECK --check-prefix=BDVER --check-prefix=BDVER1

	;			;
	; VFMADD			; VFMADD
	;			;

	define void @test_vfmaddpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {			define void @test_vfmaddpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfmaddpd_128:			; GENERIC-LABEL: test_vfmaddpd_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmaddpd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; GENERIC-NEXT: vfmaddpd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfmaddpd (%rdi), %xmm1, %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmaddpd (%rdi), %xmm1, %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfmaddpd %xmm1, (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmaddpd %xmm1, (%rdi), %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfmaddpd_128:			; BDVER-LABEL: test_vfmaddpd_128:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfmaddpd %xmm2, %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmaddpd %xmm2, %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmaddpd (%rdi), %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmaddpd (%rdi), %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmaddpd %xmm1, (%rdi), %xmm0, %xmm0			; BDVER-NEXT: vfmaddpd %xmm1, (%rdi), %xmm0, %xmm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfmaddpd $2, $1, $0, $0 \0A\09 vfmaddpd $3, $1, $0, $0 \0A\09 vfmaddpd $1, $3, $0, $0", "x,x,x,m"(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> %a3) nounwind			tail call void asm "vfmaddpd $2, $1, $0, $0 \0A\09 vfmaddpd $3, $1, $0, $0 \0A\09 vfmaddpd $1, $3, $0, $0", "x,x,x,m"(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfmaddpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {			define void @test_vfmaddpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfmaddpd_256:			; GENERIC-LABEL: test_vfmaddpd_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmaddpd %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]			; GENERIC-NEXT: vfmaddpd %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfmaddpd (%rdi), %ymm1, %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmaddpd (%rdi), %ymm1, %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfmaddpd %ymm1, (%rdi), %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmaddpd %ymm1, (%rdi), %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfmaddpd_256:			; BDVER-LABEL: test_vfmaddpd_256:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfmaddpd %ymm2, %ymm1, %ymm0, %ymm0			; BDVER-NEXT: vfmaddpd %ymm2, %ymm1, %ymm0, %ymm0
	; BDVER-NEXT: vfmaddpd (%rdi), %ymm1, %ymm0, %ymm0			; BDVER-NEXT: vfmaddpd (%rdi), %ymm1, %ymm0, %ymm0
	; BDVER-NEXT: vfmaddpd %ymm1, (%rdi), %ymm0, %ymm0			; BDVER-NEXT: vfmaddpd %ymm1, (%rdi), %ymm0, %ymm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: vzeroupper			; BDVER-NEXT: vzeroupper
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfmaddpd $2, $1, $0, $0 \0A\09 vfmaddpd $3, $1, $0, $0 \0A\09 vfmaddpd $1, $3, $0, $0", "x,x,x,m"(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> %a3) nounwind			tail call void asm "vfmaddpd $2, $1, $0, $0 \0A\09 vfmaddpd $3, $1, $0, $0 \0A\09 vfmaddpd $1, $3, $0, $0", "x,x,x,m"(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfmaddps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {			define void @test_vfmaddps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfmaddps_128:			; GENERIC-LABEL: test_vfmaddps_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmaddps %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; GENERIC-NEXT: vfmaddps %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfmaddps (%rdi), %xmm1, %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmaddps (%rdi), %xmm1, %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfmaddps %xmm1, (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmaddps %xmm1, (%rdi), %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfmaddps_128:			; BDVER-LABEL: test_vfmaddps_128:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfmaddps %xmm2, %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmaddps %xmm2, %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmaddps (%rdi), %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmaddps (%rdi), %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmaddps %xmm1, (%rdi), %xmm0, %xmm0			; BDVER-NEXT: vfmaddps %xmm1, (%rdi), %xmm0, %xmm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfmaddps $2, $1, $0, $0 \0A\09 vfmaddps $3, $1, $0, $0 \0A\09 vfmaddps $1, $3, $0, $0", "x,x,x,m"(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> %a3) nounwind			tail call void asm "vfmaddps $2, $1, $0, $0 \0A\09 vfmaddps $3, $1, $0, $0 \0A\09 vfmaddps $1, $3, $0, $0", "x,x,x,m"(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfmaddps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {			define void @test_vfmaddps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfmaddps_256:			; GENERIC-LABEL: test_vfmaddps_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmaddps %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]			; GENERIC-NEXT: vfmaddps %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfmaddps (%rdi), %ymm1, %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmaddps (%rdi), %ymm1, %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfmaddps %ymm1, (%rdi), %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmaddps %ymm1, (%rdi), %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfmaddps_256:			; BDVER-LABEL: test_vfmaddps_256:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfmaddps %ymm2, %ymm1, %ymm0, %ymm0			; BDVER-NEXT: vfmaddps %ymm2, %ymm1, %ymm0, %ymm0
	; BDVER-NEXT: vfmaddps (%rdi), %ymm1, %ymm0, %ymm0			; BDVER-NEXT: vfmaddps (%rdi), %ymm1, %ymm0, %ymm0
	; BDVER-NEXT: vfmaddps %ymm1, (%rdi), %ymm0, %ymm0			; BDVER-NEXT: vfmaddps %ymm1, (%rdi), %ymm0, %ymm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: vzeroupper			; BDVER-NEXT: vzeroupper
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfmaddps $2, $1, $0, $0 \0A\09 vfmaddps $3, $1, $0, $0 \0A\09 vfmaddps $1, $3, $0, $0", "x,x,x,m"(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> %a3) nounwind			tail call void asm "vfmaddps $2, $1, $0, $0 \0A\09 vfmaddps $3, $1, $0, $0 \0A\09 vfmaddps $1, $3, $0, $0", "x,x,x,m"(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfmaddsd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {			define void @test_vfmaddsd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfmaddsd_128:			; GENERIC-LABEL: test_vfmaddsd_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmaddsd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; GENERIC-NEXT: vfmaddsd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfmaddsd (%rdi), %xmm1, %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmaddsd (%rdi), %xmm1, %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfmaddsd %xmm1, (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmaddsd %xmm1, (%rdi), %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfmaddsd_128:			; BDVER-LABEL: test_vfmaddsd_128:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfmaddsd %xmm2, %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmaddsd %xmm2, %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmaddsd (%rdi), %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmaddsd (%rdi), %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmaddsd %xmm1, (%rdi), %xmm0, %xmm0			; BDVER-NEXT: vfmaddsd %xmm1, (%rdi), %xmm0, %xmm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfmaddsd $2, $1, $0, $0 \0A\09 vfmaddsd $3, $1, $0, $0 \0A\09 vfmaddsd $1, $3, $0, $0", "x,x,x,m"(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> %a3) nounwind			tail call void asm "vfmaddsd $2, $1, $0, $0 \0A\09 vfmaddsd $3, $1, $0, $0 \0A\09 vfmaddsd $1, $3, $0, $0", "x,x,x,m"(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfmaddss_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {			define void @test_vfmaddss_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfmaddss_128:			; GENERIC-LABEL: test_vfmaddss_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmaddss %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; GENERIC-NEXT: vfmaddss %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfmaddss (%rdi), %xmm1, %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmaddss (%rdi), %xmm1, %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfmaddss %xmm1, (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmaddss %xmm1, (%rdi), %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfmaddss_128:			; BDVER-LABEL: test_vfmaddss_128:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfmaddss %xmm2, %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmaddss %xmm2, %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmaddss (%rdi), %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmaddss (%rdi), %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmaddss %xmm1, (%rdi), %xmm0, %xmm0			; BDVER-NEXT: vfmaddss %xmm1, (%rdi), %xmm0, %xmm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfmaddss $2, $1, $0, $0 \0A\09 vfmaddss $3, $1, $0, $0 \0A\09 vfmaddss $1, $3, $0, $0", "x,x,x,m"(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> %a3) nounwind			tail call void asm "vfmaddss $2, $1, $0, $0 \0A\09 vfmaddss $3, $1, $0, $0 \0A\09 vfmaddss $1, $3, $0, $0", "x,x,x,m"(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> %a3) nounwind
	ret void			ret void
	}			}

	;			;
	; VFMADDSUB			; VFMADDSUB
	;			;

	define void @test_vfmaddsubpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {			define void @test_vfmaddsubpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfmaddsubpd_128:			; GENERIC-LABEL: test_vfmaddsubpd_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmaddsubpd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; GENERIC-NEXT: vfmaddsubpd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfmaddsubpd (%rdi), %xmm1, %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmaddsubpd (%rdi), %xmm1, %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfmaddsubpd %xmm1, (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmaddsubpd %xmm1, (%rdi), %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfmaddsubpd_128:			; BDVER-LABEL: test_vfmaddsubpd_128:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfmaddsubpd %xmm2, %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmaddsubpd %xmm2, %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmaddsubpd (%rdi), %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmaddsubpd (%rdi), %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmaddsubpd %xmm1, (%rdi), %xmm0, %xmm0			; BDVER-NEXT: vfmaddsubpd %xmm1, (%rdi), %xmm0, %xmm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfmaddsubpd $2, $1, $0, $0 \0A\09 vfmaddsubpd $3, $1, $0, $0 \0A\09 vfmaddsubpd $1, $3, $0, $0", "x,x,x,m"(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> %a3) nounwind			tail call void asm "vfmaddsubpd $2, $1, $0, $0 \0A\09 vfmaddsubpd $3, $1, $0, $0 \0A\09 vfmaddsubpd $1, $3, $0, $0", "x,x,x,m"(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfmaddsubpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {			define void @test_vfmaddsubpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfmaddsubpd_256:			; GENERIC-LABEL: test_vfmaddsubpd_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmaddsubpd %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]			; GENERIC-NEXT: vfmaddsubpd %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfmaddsubpd (%rdi), %ymm1, %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmaddsubpd (%rdi), %ymm1, %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfmaddsubpd %ymm1, (%rdi), %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmaddsubpd %ymm1, (%rdi), %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfmaddsubpd_256:			; BDVER-LABEL: test_vfmaddsubpd_256:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfmaddsubpd %ymm2, %ymm1, %ymm0, %ymm0			; BDVER-NEXT: vfmaddsubpd %ymm2, %ymm1, %ymm0, %ymm0
	; BDVER-NEXT: vfmaddsubpd (%rdi), %ymm1, %ymm0, %ymm0			; BDVER-NEXT: vfmaddsubpd (%rdi), %ymm1, %ymm0, %ymm0
	; BDVER-NEXT: vfmaddsubpd %ymm1, (%rdi), %ymm0, %ymm0			; BDVER-NEXT: vfmaddsubpd %ymm1, (%rdi), %ymm0, %ymm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: vzeroupper			; BDVER-NEXT: vzeroupper
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfmaddsubpd $2, $1, $0, $0 \0A\09 vfmaddsubpd $3, $1, $0, $0 \0A\09 vfmaddsubpd $1, $3, $0, $0", "x,x,x,m"(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> %a3) nounwind			tail call void asm "vfmaddsubpd $2, $1, $0, $0 \0A\09 vfmaddsubpd $3, $1, $0, $0 \0A\09 vfmaddsubpd $1, $3, $0, $0", "x,x,x,m"(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfmaddsubps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {			define void @test_vfmaddsubps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfmaddsubps_128:			; GENERIC-LABEL: test_vfmaddsubps_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmaddsubps %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; GENERIC-NEXT: vfmaddsubps %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfmaddsubps (%rdi), %xmm1, %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmaddsubps (%rdi), %xmm1, %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfmaddsubps %xmm1, (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmaddsubps %xmm1, (%rdi), %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfmaddsubps_128:			; BDVER-LABEL: test_vfmaddsubps_128:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfmaddsubps %xmm2, %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmaddsubps %xmm2, %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmaddsubps (%rdi), %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmaddsubps (%rdi), %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmaddsubps %xmm1, (%rdi), %xmm0, %xmm0			; BDVER-NEXT: vfmaddsubps %xmm1, (%rdi), %xmm0, %xmm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfmaddsubps $2, $1, $0, $0 \0A\09 vfmaddsubps $3, $1, $0, $0 \0A\09 vfmaddsubps $1, $3, $0, $0", "x,x,x,m"(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> %a3) nounwind			tail call void asm "vfmaddsubps $2, $1, $0, $0 \0A\09 vfmaddsubps $3, $1, $0, $0 \0A\09 vfmaddsubps $1, $3, $0, $0", "x,x,x,m"(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfmaddsubps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {			define void @test_vfmaddsubps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfmaddsubps_256:			; GENERIC-LABEL: test_vfmaddsubps_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmaddsubps %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]			; GENERIC-NEXT: vfmaddsubps %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfmaddsubps (%rdi), %ymm1, %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmaddsubps (%rdi), %ymm1, %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfmaddsubps %ymm1, (%rdi), %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmaddsubps %ymm1, (%rdi), %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfmaddsubps_256:			; BDVER-LABEL: test_vfmaddsubps_256:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfmaddsubps %ymm2, %ymm1, %ymm0, %ymm0			; BDVER-NEXT: vfmaddsubps %ymm2, %ymm1, %ymm0, %ymm0
	Show All 10 Lines
	; VFMSUBADD			; VFMSUBADD
	;			;

	define void @test_vfmsubaddpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {			define void @test_vfmsubaddpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfmsubaddpd_128:			; GENERIC-LABEL: test_vfmsubaddpd_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmsubaddpd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; GENERIC-NEXT: vfmsubaddpd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfmsubaddpd (%rdi), %xmm1, %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmsubaddpd (%rdi), %xmm1, %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfmsubaddpd %xmm1, (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmsubaddpd %xmm1, (%rdi), %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfmsubaddpd_128:			; BDVER-LABEL: test_vfmsubaddpd_128:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfmsubaddpd %xmm2, %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmsubaddpd %xmm2, %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmsubaddpd (%rdi), %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmsubaddpd (%rdi), %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmsubaddpd %xmm1, (%rdi), %xmm0, %xmm0			; BDVER-NEXT: vfmsubaddpd %xmm1, (%rdi), %xmm0, %xmm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfmsubaddpd $2, $1, $0, $0 \0A\09 vfmsubaddpd $3, $1, $0, $0 \0A\09 vfmsubaddpd $1, $3, $0, $0", "x,x,x,m"(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> %a3) nounwind			tail call void asm "vfmsubaddpd $2, $1, $0, $0 \0A\09 vfmsubaddpd $3, $1, $0, $0 \0A\09 vfmsubaddpd $1, $3, $0, $0", "x,x,x,m"(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfmsubaddpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {			define void @test_vfmsubaddpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfmsubaddpd_256:			; GENERIC-LABEL: test_vfmsubaddpd_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmsubaddpd %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]			; GENERIC-NEXT: vfmsubaddpd %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfmsubaddpd (%rdi), %ymm1, %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmsubaddpd (%rdi), %ymm1, %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfmsubaddpd %ymm1, (%rdi), %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmsubaddpd %ymm1, (%rdi), %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfmsubaddpd_256:			; BDVER-LABEL: test_vfmsubaddpd_256:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfmsubaddpd %ymm2, %ymm1, %ymm0, %ymm0			; BDVER-NEXT: vfmsubaddpd %ymm2, %ymm1, %ymm0, %ymm0
	; BDVER-NEXT: vfmsubaddpd (%rdi), %ymm1, %ymm0, %ymm0			; BDVER-NEXT: vfmsubaddpd (%rdi), %ymm1, %ymm0, %ymm0
	; BDVER-NEXT: vfmsubaddpd %ymm1, (%rdi), %ymm0, %ymm0			; BDVER-NEXT: vfmsubaddpd %ymm1, (%rdi), %ymm0, %ymm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: vzeroupper			; BDVER-NEXT: vzeroupper
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfmsubaddpd $2, $1, $0, $0 \0A\09 vfmsubaddpd $3, $1, $0, $0 \0A\09 vfmsubaddpd $1, $3, $0, $0", "x,x,x,m"(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> %a3) nounwind			tail call void asm "vfmsubaddpd $2, $1, $0, $0 \0A\09 vfmsubaddpd $3, $1, $0, $0 \0A\09 vfmsubaddpd $1, $3, $0, $0", "x,x,x,m"(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfmsubaddps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {			define void @test_vfmsubaddps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfmsubaddps_128:			; GENERIC-LABEL: test_vfmsubaddps_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmsubaddps %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; GENERIC-NEXT: vfmsubaddps %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfmsubaddps (%rdi), %xmm1, %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmsubaddps (%rdi), %xmm1, %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfmsubaddps %xmm1, (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmsubaddps %xmm1, (%rdi), %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfmsubaddps_128:			; BDVER-LABEL: test_vfmsubaddps_128:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfmsubaddps %xmm2, %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmsubaddps %xmm2, %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmsubaddps (%rdi), %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmsubaddps (%rdi), %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmsubaddps %xmm1, (%rdi), %xmm0, %xmm0			; BDVER-NEXT: vfmsubaddps %xmm1, (%rdi), %xmm0, %xmm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfmsubaddps $2, $1, $0, $0 \0A\09 vfmsubaddps $3, $1, $0, $0 \0A\09 vfmsubaddps $1, $3, $0, $0", "x,x,x,m"(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> %a3) nounwind			tail call void asm "vfmsubaddps $2, $1, $0, $0 \0A\09 vfmsubaddps $3, $1, $0, $0 \0A\09 vfmsubaddps $1, $3, $0, $0", "x,x,x,m"(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfmsubaddps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {			define void @test_vfmsubaddps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfmsubaddps_256:			; GENERIC-LABEL: test_vfmsubaddps_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmsubaddps %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]			; GENERIC-NEXT: vfmsubaddps %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfmsubaddps (%rdi), %ymm1, %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmsubaddps (%rdi), %ymm1, %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfmsubaddps %ymm1, (%rdi), %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmsubaddps %ymm1, (%rdi), %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfmsubaddps_256:			; BDVER-LABEL: test_vfmsubaddps_256:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfmsubaddps %ymm2, %ymm1, %ymm0, %ymm0			; BDVER-NEXT: vfmsubaddps %ymm2, %ymm1, %ymm0, %ymm0
	Show All 10 Lines
	; VFMSUB			; VFMSUB
	;			;

	define void @test_vfmsubpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {			define void @test_vfmsubpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfmsubpd_128:			; GENERIC-LABEL: test_vfmsubpd_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmsubpd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; GENERIC-NEXT: vfmsubpd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfmsubpd (%rdi), %xmm1, %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmsubpd (%rdi), %xmm1, %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfmsubpd %xmm1, (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmsubpd %xmm1, (%rdi), %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfmsubpd_128:			; BDVER-LABEL: test_vfmsubpd_128:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfmsubpd %xmm2, %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmsubpd %xmm2, %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmsubpd (%rdi), %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmsubpd (%rdi), %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmsubpd %xmm1, (%rdi), %xmm0, %xmm0			; BDVER-NEXT: vfmsubpd %xmm1, (%rdi), %xmm0, %xmm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfmsubpd $2, $1, $0, $0 \0A\09 vfmsubpd $3, $1, $0, $0 \0A\09 vfmsubpd $1, $3, $0, $0", "x,x,x,m"(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> %a3) nounwind			tail call void asm "vfmsubpd $2, $1, $0, $0 \0A\09 vfmsubpd $3, $1, $0, $0 \0A\09 vfmsubpd $1, $3, $0, $0", "x,x,x,m"(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfmsubpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {			define void @test_vfmsubpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfmsubpd_256:			; GENERIC-LABEL: test_vfmsubpd_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmsubpd %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]			; GENERIC-NEXT: vfmsubpd %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfmsubpd (%rdi), %ymm1, %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmsubpd (%rdi), %ymm1, %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfmsubpd %ymm1, (%rdi), %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmsubpd %ymm1, (%rdi), %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfmsubpd_256:			; BDVER-LABEL: test_vfmsubpd_256:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfmsubpd %ymm2, %ymm1, %ymm0, %ymm0			; BDVER-NEXT: vfmsubpd %ymm2, %ymm1, %ymm0, %ymm0
	; BDVER-NEXT: vfmsubpd (%rdi), %ymm1, %ymm0, %ymm0			; BDVER-NEXT: vfmsubpd (%rdi), %ymm1, %ymm0, %ymm0
	; BDVER-NEXT: vfmsubpd %ymm1, (%rdi), %ymm0, %ymm0			; BDVER-NEXT: vfmsubpd %ymm1, (%rdi), %ymm0, %ymm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: vzeroupper			; BDVER-NEXT: vzeroupper
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfmsubpd $2, $1, $0, $0 \0A\09 vfmsubpd $3, $1, $0, $0 \0A\09 vfmsubpd $1, $3, $0, $0", "x,x,x,m"(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> %a3) nounwind			tail call void asm "vfmsubpd $2, $1, $0, $0 \0A\09 vfmsubpd $3, $1, $0, $0 \0A\09 vfmsubpd $1, $3, $0, $0", "x,x,x,m"(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfmsubps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {			define void @test_vfmsubps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfmsubps_128:			; GENERIC-LABEL: test_vfmsubps_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmsubps %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; GENERIC-NEXT: vfmsubps %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfmsubps (%rdi), %xmm1, %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmsubps (%rdi), %xmm1, %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfmsubps %xmm1, (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmsubps %xmm1, (%rdi), %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfmsubps_128:			; BDVER-LABEL: test_vfmsubps_128:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfmsubps %xmm2, %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmsubps %xmm2, %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmsubps (%rdi), %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmsubps (%rdi), %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmsubps %xmm1, (%rdi), %xmm0, %xmm0			; BDVER-NEXT: vfmsubps %xmm1, (%rdi), %xmm0, %xmm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfmsubps $2, $1, $0, $0 \0A\09 vfmsubps $3, $1, $0, $0 \0A\09 vfmsubps $1, $3, $0, $0", "x,x,x,m"(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> %a3) nounwind			tail call void asm "vfmsubps $2, $1, $0, $0 \0A\09 vfmsubps $3, $1, $0, $0 \0A\09 vfmsubps $1, $3, $0, $0", "x,x,x,m"(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfmsubps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {			define void @test_vfmsubps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfmsubps_256:			; GENERIC-LABEL: test_vfmsubps_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmsubps %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]			; GENERIC-NEXT: vfmsubps %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfmsubps (%rdi), %ymm1, %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmsubps (%rdi), %ymm1, %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfmsubps %ymm1, (%rdi), %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmsubps %ymm1, (%rdi), %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfmsubps_256:			; BDVER-LABEL: test_vfmsubps_256:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfmsubps %ymm2, %ymm1, %ymm0, %ymm0			; BDVER-NEXT: vfmsubps %ymm2, %ymm1, %ymm0, %ymm0
	; BDVER-NEXT: vfmsubps (%rdi), %ymm1, %ymm0, %ymm0			; BDVER-NEXT: vfmsubps (%rdi), %ymm1, %ymm0, %ymm0
	; BDVER-NEXT: vfmsubps %ymm1, (%rdi), %ymm0, %ymm0			; BDVER-NEXT: vfmsubps %ymm1, (%rdi), %ymm0, %ymm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: vzeroupper			; BDVER-NEXT: vzeroupper
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfmsubps $2, $1, $0, $0 \0A\09 vfmsubps $3, $1, $0, $0 \0A\09 vfmsubps $1, $3, $0, $0", "x,x,x,m"(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> %a3) nounwind			tail call void asm "vfmsubps $2, $1, $0, $0 \0A\09 vfmsubps $3, $1, $0, $0 \0A\09 vfmsubps $1, $3, $0, $0", "x,x,x,m"(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfmsubsd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {			define void @test_vfmsubsd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfmsubsd_128:			; GENERIC-LABEL: test_vfmsubsd_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmsubsd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; GENERIC-NEXT: vfmsubsd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfmsubsd (%rdi), %xmm1, %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmsubsd (%rdi), %xmm1, %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfmsubsd %xmm1, (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmsubsd %xmm1, (%rdi), %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfmsubsd_128:			; BDVER-LABEL: test_vfmsubsd_128:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfmsubsd %xmm2, %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmsubsd %xmm2, %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmsubsd (%rdi), %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmsubsd (%rdi), %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmsubsd %xmm1, (%rdi), %xmm0, %xmm0			; BDVER-NEXT: vfmsubsd %xmm1, (%rdi), %xmm0, %xmm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfmsubsd $2, $1, $0, $0 \0A\09 vfmsubsd $3, $1, $0, $0 \0A\09 vfmsubsd $1, $3, $0, $0", "x,x,x,m"(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> %a3) nounwind			tail call void asm "vfmsubsd $2, $1, $0, $0 \0A\09 vfmsubsd $3, $1, $0, $0 \0A\09 vfmsubsd $1, $3, $0, $0", "x,x,x,m"(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfmsubss_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {			define void @test_vfmsubss_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfmsubss_128:			; GENERIC-LABEL: test_vfmsubss_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfmsubss %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; GENERIC-NEXT: vfmsubss %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfmsubss (%rdi), %xmm1, %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmsubss (%rdi), %xmm1, %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfmsubss %xmm1, (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfmsubss %xmm1, (%rdi), %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfmsubss_128:			; BDVER-LABEL: test_vfmsubss_128:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfmsubss %xmm2, %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmsubss %xmm2, %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmsubss (%rdi), %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfmsubss (%rdi), %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfmsubss %xmm1, (%rdi), %xmm0, %xmm0			; BDVER-NEXT: vfmsubss %xmm1, (%rdi), %xmm0, %xmm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfmsubss $2, $1, $0, $0 \0A\09 vfmsubss $3, $1, $0, $0 \0A\09 vfmsubss $1, $3, $0, $0", "x,x,x,m"(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> %a3) nounwind			tail call void asm "vfmsubss $2, $1, $0, $0 \0A\09 vfmsubss $3, $1, $0, $0 \0A\09 vfmsubss $1, $3, $0, $0", "x,x,x,m"(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> %a3) nounwind
	ret void			ret void
	}			}

	;			;
	; VFNMADD			; VFNMADD
	;			;

	define void @test_vfnmaddpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {			define void @test_vfnmaddpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmaddpd_128:			; GENERIC-LABEL: test_vfnmaddpd_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmaddpd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; GENERIC-NEXT: vfnmaddpd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfnmaddpd (%rdi), %xmm1, %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmaddpd (%rdi), %xmm1, %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfnmaddpd %xmm1, (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmaddpd %xmm1, (%rdi), %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfnmaddpd_128:			; BDVER-LABEL: test_vfnmaddpd_128:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfnmaddpd %xmm2, %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfnmaddpd %xmm2, %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfnmaddpd (%rdi), %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfnmaddpd (%rdi), %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfnmaddpd %xmm1, (%rdi), %xmm0, %xmm0			; BDVER-NEXT: vfnmaddpd %xmm1, (%rdi), %xmm0, %xmm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfnmaddpd $2, $1, $0, $0 \0A\09 vfnmaddpd $3, $1, $0, $0 \0A\09 vfnmaddpd $1, $3, $0, $0", "x,x,x,m"(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> %a3) nounwind			tail call void asm "vfnmaddpd $2, $1, $0, $0 \0A\09 vfnmaddpd $3, $1, $0, $0 \0A\09 vfnmaddpd $1, $3, $0, $0", "x,x,x,m"(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfnmaddpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {			define void @test_vfnmaddpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmaddpd_256:			; GENERIC-LABEL: test_vfnmaddpd_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmaddpd %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]			; GENERIC-NEXT: vfnmaddpd %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfnmaddpd (%rdi), %ymm1, %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmaddpd (%rdi), %ymm1, %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfnmaddpd %ymm1, (%rdi), %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmaddpd %ymm1, (%rdi), %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfnmaddpd_256:			; BDVER-LABEL: test_vfnmaddpd_256:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfnmaddpd %ymm2, %ymm1, %ymm0, %ymm0			; BDVER-NEXT: vfnmaddpd %ymm2, %ymm1, %ymm0, %ymm0
	; BDVER-NEXT: vfnmaddpd (%rdi), %ymm1, %ymm0, %ymm0			; BDVER-NEXT: vfnmaddpd (%rdi), %ymm1, %ymm0, %ymm0
	; BDVER-NEXT: vfnmaddpd %ymm1, (%rdi), %ymm0, %ymm0			; BDVER-NEXT: vfnmaddpd %ymm1, (%rdi), %ymm0, %ymm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: vzeroupper			; BDVER-NEXT: vzeroupper
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfnmaddpd $2, $1, $0, $0 \0A\09 vfnmaddpd $3, $1, $0, $0 \0A\09 vfnmaddpd $1, $3, $0, $0", "x,x,x,m"(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> %a3) nounwind			tail call void asm "vfnmaddpd $2, $1, $0, $0 \0A\09 vfnmaddpd $3, $1, $0, $0 \0A\09 vfnmaddpd $1, $3, $0, $0", "x,x,x,m"(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfnmaddps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {			define void @test_vfnmaddps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmaddps_128:			; GENERIC-LABEL: test_vfnmaddps_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmaddps %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; GENERIC-NEXT: vfnmaddps %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfnmaddps (%rdi), %xmm1, %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmaddps (%rdi), %xmm1, %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfnmaddps %xmm1, (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmaddps %xmm1, (%rdi), %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfnmaddps_128:			; BDVER-LABEL: test_vfnmaddps_128:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfnmaddps %xmm2, %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfnmaddps %xmm2, %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfnmaddps (%rdi), %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfnmaddps (%rdi), %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfnmaddps %xmm1, (%rdi), %xmm0, %xmm0			; BDVER-NEXT: vfnmaddps %xmm1, (%rdi), %xmm0, %xmm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfnmaddps $2, $1, $0, $0 \0A\09 vfnmaddps $3, $1, $0, $0 \0A\09 vfnmaddps $1, $3, $0, $0", "x,x,x,m"(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> %a3) nounwind			tail call void asm "vfnmaddps $2, $1, $0, $0 \0A\09 vfnmaddps $3, $1, $0, $0 \0A\09 vfnmaddps $1, $3, $0, $0", "x,x,x,m"(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfnmaddps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {			define void @test_vfnmaddps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmaddps_256:			; GENERIC-LABEL: test_vfnmaddps_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmaddps %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]			; GENERIC-NEXT: vfnmaddps %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfnmaddps (%rdi), %ymm1, %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmaddps (%rdi), %ymm1, %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfnmaddps %ymm1, (%rdi), %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmaddps %ymm1, (%rdi), %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfnmaddps_256:			; BDVER-LABEL: test_vfnmaddps_256:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfnmaddps %ymm2, %ymm1, %ymm0, %ymm0			; BDVER-NEXT: vfnmaddps %ymm2, %ymm1, %ymm0, %ymm0
	; BDVER-NEXT: vfnmaddps (%rdi), %ymm1, %ymm0, %ymm0			; BDVER-NEXT: vfnmaddps (%rdi), %ymm1, %ymm0, %ymm0
	; BDVER-NEXT: vfnmaddps %ymm1, (%rdi), %ymm0, %ymm0			; BDVER-NEXT: vfnmaddps %ymm1, (%rdi), %ymm0, %ymm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: vzeroupper			; BDVER-NEXT: vzeroupper
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfnmaddps $2, $1, $0, $0 \0A\09 vfnmaddps $3, $1, $0, $0 \0A\09 vfnmaddps $1, $3, $0, $0", "x,x,x,m"(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> %a3) nounwind			tail call void asm "vfnmaddps $2, $1, $0, $0 \0A\09 vfnmaddps $3, $1, $0, $0 \0A\09 vfnmaddps $1, $3, $0, $0", "x,x,x,m"(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfnmaddsd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {			define void @test_vfnmaddsd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmaddsd_128:			; GENERIC-LABEL: test_vfnmaddsd_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmaddsd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; GENERIC-NEXT: vfnmaddsd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfnmaddsd (%rdi), %xmm1, %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmaddsd (%rdi), %xmm1, %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfnmaddsd %xmm1, (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmaddsd %xmm1, (%rdi), %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfnmaddsd_128:			; BDVER-LABEL: test_vfnmaddsd_128:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfnmaddsd %xmm2, %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfnmaddsd %xmm2, %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfnmaddsd (%rdi), %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfnmaddsd (%rdi), %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfnmaddsd %xmm1, (%rdi), %xmm0, %xmm0			; BDVER-NEXT: vfnmaddsd %xmm1, (%rdi), %xmm0, %xmm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfnmaddsd $2, $1, $0, $0 \0A\09 vfnmaddsd $3, $1, $0, $0 \0A\09 vfnmaddsd $1, $3, $0, $0", "x,x,x,m"(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> %a3) nounwind			tail call void asm "vfnmaddsd $2, $1, $0, $0 \0A\09 vfnmaddsd $3, $1, $0, $0 \0A\09 vfnmaddsd $1, $3, $0, $0", "x,x,x,m"(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfnmaddss_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {			define void @test_vfnmaddss_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmaddss_128:			; GENERIC-LABEL: test_vfnmaddss_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmaddss %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; GENERIC-NEXT: vfnmaddss %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfnmaddss (%rdi), %xmm1, %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmaddss (%rdi), %xmm1, %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfnmaddss %xmm1, (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmaddss %xmm1, (%rdi), %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfnmaddss_128:			; BDVER-LABEL: test_vfnmaddss_128:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfnmaddss %xmm2, %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfnmaddss %xmm2, %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfnmaddss (%rdi), %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfnmaddss (%rdi), %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfnmaddss %xmm1, (%rdi), %xmm0, %xmm0			; BDVER-NEXT: vfnmaddss %xmm1, (%rdi), %xmm0, %xmm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfnmaddss $2, $1, $0, $0 \0A\09 vfnmaddss $3, $1, $0, $0 \0A\09 vfnmaddss $1, $3, $0, $0", "x,x,x,m"(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> %a3) nounwind			tail call void asm "vfnmaddss $2, $1, $0, $0 \0A\09 vfnmaddss $3, $1, $0, $0 \0A\09 vfnmaddss $1, $3, $0, $0", "x,x,x,m"(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> %a3) nounwind
	ret void			ret void
	}			}

	;			;
	; VFNMSUB			; VFNMSUB
	;			;

	define void @test_vfnmsubpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {			define void @test_vfnmsubpd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmsubpd_128:			; GENERIC-LABEL: test_vfnmsubpd_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmsubpd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; GENERIC-NEXT: vfnmsubpd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfnmsubpd (%rdi), %xmm1, %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmsubpd (%rdi), %xmm1, %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfnmsubpd %xmm1, (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmsubpd %xmm1, (%rdi), %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfnmsubpd_128:			; BDVER-LABEL: test_vfnmsubpd_128:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfnmsubpd %xmm2, %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfnmsubpd %xmm2, %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfnmsubpd (%rdi), %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfnmsubpd (%rdi), %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfnmsubpd %xmm1, (%rdi), %xmm0, %xmm0			; BDVER-NEXT: vfnmsubpd %xmm1, (%rdi), %xmm0, %xmm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfnmsubpd $2, $1, $0, $0 \0A\09 vfnmsubpd $3, $1, $0, $0 \0A\09 vfnmsubpd $1, $3, $0, $0", "x,x,x,m"(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> %a3) nounwind			tail call void asm "vfnmsubpd $2, $1, $0, $0 \0A\09 vfnmsubpd $3, $1, $0, $0 \0A\09 vfnmsubpd $1, $3, $0, $0", "x,x,x,m"(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfnmsubpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {			define void @test_vfnmsubpd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmsubpd_256:			; GENERIC-LABEL: test_vfnmsubpd_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmsubpd %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]			; GENERIC-NEXT: vfnmsubpd %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfnmsubpd (%rdi), %ymm1, %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmsubpd (%rdi), %ymm1, %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfnmsubpd %ymm1, (%rdi), %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmsubpd %ymm1, (%rdi), %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfnmsubpd_256:			; BDVER-LABEL: test_vfnmsubpd_256:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfnmsubpd %ymm2, %ymm1, %ymm0, %ymm0			; BDVER-NEXT: vfnmsubpd %ymm2, %ymm1, %ymm0, %ymm0
	; BDVER-NEXT: vfnmsubpd (%rdi), %ymm1, %ymm0, %ymm0			; BDVER-NEXT: vfnmsubpd (%rdi), %ymm1, %ymm0, %ymm0
	; BDVER-NEXT: vfnmsubpd %ymm1, (%rdi), %ymm0, %ymm0			; BDVER-NEXT: vfnmsubpd %ymm1, (%rdi), %ymm0, %ymm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: vzeroupper			; BDVER-NEXT: vzeroupper
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfnmsubpd $2, $1, $0, $0 \0A\09 vfnmsubpd $3, $1, $0, $0 \0A\09 vfnmsubpd $1, $3, $0, $0", "x,x,x,m"(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> %a3) nounwind			tail call void asm "vfnmsubpd $2, $1, $0, $0 \0A\09 vfnmsubpd $3, $1, $0, $0 \0A\09 vfnmsubpd $1, $3, $0, $0", "x,x,x,m"(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfnmsubps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {			define void @test_vfnmsubps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmsubps_128:			; GENERIC-LABEL: test_vfnmsubps_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmsubps %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; GENERIC-NEXT: vfnmsubps %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfnmsubps (%rdi), %xmm1, %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmsubps (%rdi), %xmm1, %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfnmsubps %xmm1, (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmsubps %xmm1, (%rdi), %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfnmsubps_128:			; BDVER-LABEL: test_vfnmsubps_128:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfnmsubps %xmm2, %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfnmsubps %xmm2, %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfnmsubps (%rdi), %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfnmsubps (%rdi), %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfnmsubps %xmm1, (%rdi), %xmm0, %xmm0			; BDVER-NEXT: vfnmsubps %xmm1, (%rdi), %xmm0, %xmm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfnmsubps $2, $1, $0, $0 \0A\09 vfnmsubps $3, $1, $0, $0 \0A\09 vfnmsubps $1, $3, $0, $0", "x,x,x,m"(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> %a3) nounwind			tail call void asm "vfnmsubps $2, $1, $0, $0 \0A\09 vfnmsubps $3, $1, $0, $0 \0A\09 vfnmsubps $1, $3, $0, $0", "x,x,x,m"(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfnmsubps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {			define void @test_vfnmsubps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmsubps_256:			; GENERIC-LABEL: test_vfnmsubps_256:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmsubps %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]			; GENERIC-NEXT: vfnmsubps %ymm2, %ymm1, %ymm0, %ymm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfnmsubps (%rdi), %ymm1, %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmsubps (%rdi), %ymm1, %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfnmsubps %ymm1, (%rdi), %ymm0, %ymm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmsubps %ymm1, (%rdi), %ymm0, %ymm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: vzeroupper # sched: [100:0.33]			; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfnmsubps_256:			; BDVER-LABEL: test_vfnmsubps_256:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfnmsubps %ymm2, %ymm1, %ymm0, %ymm0			; BDVER-NEXT: vfnmsubps %ymm2, %ymm1, %ymm0, %ymm0
	; BDVER-NEXT: vfnmsubps (%rdi), %ymm1, %ymm0, %ymm0			; BDVER-NEXT: vfnmsubps (%rdi), %ymm1, %ymm0, %ymm0
	; BDVER-NEXT: vfnmsubps %ymm1, (%rdi), %ymm0, %ymm0			; BDVER-NEXT: vfnmsubps %ymm1, (%rdi), %ymm0, %ymm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: vzeroupper			; BDVER-NEXT: vzeroupper
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfnmsubps $2, $1, $0, $0 \0A\09 vfnmsubps $3, $1, $0, $0 \0A\09 vfnmsubps $1, $3, $0, $0", "x,x,x,m"(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> %a3) nounwind			tail call void asm "vfnmsubps $2, $1, $0, $0 \0A\09 vfnmsubps $3, $1, $0, $0 \0A\09 vfnmsubps $1, $3, $0, $0", "x,x,x,m"(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfnmsubsd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {			define void @test_vfnmsubsd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmsubsd_128:			; GENERIC-LABEL: test_vfnmsubsd_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmsubsd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; GENERIC-NEXT: vfnmsubsd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfnmsubsd (%rdi), %xmm1, %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmsubsd (%rdi), %xmm1, %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfnmsubsd %xmm1, (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmsubsd %xmm1, (%rdi), %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfnmsubsd_128:			; BDVER-LABEL: test_vfnmsubsd_128:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfnmsubsd %xmm2, %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfnmsubsd %xmm2, %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfnmsubsd (%rdi), %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfnmsubsd (%rdi), %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfnmsubsd %xmm1, (%rdi), %xmm0, %xmm0			; BDVER-NEXT: vfnmsubsd %xmm1, (%rdi), %xmm0, %xmm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfnmsubsd $2, $1, $0, $0 \0A\09 vfnmsubsd $3, $1, $0, $0 \0A\09 vfnmsubsd $1, $3, $0, $0", "x,x,x,m"(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> %a3) nounwind			tail call void asm "vfnmsubsd $2, $1, $0, $0 \0A\09 vfnmsubsd $3, $1, $0, $0 \0A\09 vfnmsubsd $1, $3, $0, $0", "x,x,x,m"(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> %a3) nounwind
	ret void			ret void
	}			}

	define void @test_vfnmsubss_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {			define void @test_vfnmsubss_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) optsize {
	; GENERIC-LABEL: test_vfnmsubss_128:			; GENERIC-LABEL: test_vfnmsubss_128:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: #APP			; GENERIC-NEXT: #APP
	; GENERIC-NEXT: vfnmsubss %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]			; GENERIC-NEXT: vfnmsubss %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:0.50]
	; GENERIC-NEXT: vfnmsubss (%rdi), %xmm1, %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmsubss (%rdi), %xmm1, %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: vfnmsubss %xmm1, (%rdi), %xmm0, %xmm0 # sched: [9:0.50]			; GENERIC-NEXT: vfnmsubss %xmm1, (%rdi), %xmm0, %xmm0 # sched: [10:0.50]
	; GENERIC-NEXT: #NO_APP			; GENERIC-NEXT: #NO_APP
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_vfnmsubss_128:			; BDVER-LABEL: test_vfnmsubss_128:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: #APP			; BDVER-NEXT: #APP
	; BDVER-NEXT: vfnmsubss %xmm2, %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfnmsubss %xmm2, %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfnmsubss (%rdi), %xmm1, %xmm0, %xmm0			; BDVER-NEXT: vfnmsubss (%rdi), %xmm1, %xmm0, %xmm0
	; BDVER-NEXT: vfnmsubss %xmm1, (%rdi), %xmm0, %xmm0			; BDVER-NEXT: vfnmsubss %xmm1, (%rdi), %xmm0, %xmm0
	; BDVER-NEXT: #NO_APP			; BDVER-NEXT: #NO_APP
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	tail call void asm "vfnmsubss $2, $1, $0, $0 \0A\09 vfnmsubss $3, $1, $0, $0 \0A\09 vfnmsubss $1, $3, $0, $0", "x,x,x,m"(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> %a3) nounwind			tail call void asm "vfnmsubss $2, $1, $0, $0 \0A\09 vfnmsubss $3, $1, $0, $0 \0A\09 vfnmsubss $1, $3, $0, $0", "x,x,x,m"(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> %a3) nounwind
	ret void			ret void
	}			}

llvm/trunk/test/CodeGen/X86/mmx-schedule.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 631 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret void		ret void
}		}
declare void @llvm.x86.mmx.maskmovq(x86_mmx, x86_mmx, i8*) nounwind		declare void @llvm.x86.mmx.maskmovq(x86_mmx, x86_mmx, i8*) nounwind

define i32 @test_movd(x86_mmx %a0, i32 %a1, i32 *%a2) {		define i32 @test_movd(x86_mmx %a0, i32 %a1, i32 *%a2) {
; GENERIC-LABEL: test_movd:		; GENERIC-LABEL: test_movd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: movd %edi, %mm1 # sched: [1:0.33]		; GENERIC-NEXT: movd %edi, %mm1 # sched: [1:0.33]
; GENERIC-NEXT: movd (%rsi), %mm2 # sched: [4:0.50]		; GENERIC-NEXT: movd (%rsi), %mm2 # sched: [5:0.50]
; GENERIC-NEXT: paddd %mm1, %mm2 # sched: [3:1.00]		; GENERIC-NEXT: paddd %mm1, %mm2 # sched: [3:1.00]
; GENERIC-NEXT: paddd %mm2, %mm0 # sched: [3:1.00]		; GENERIC-NEXT: paddd %mm2, %mm0 # sched: [3:1.00]
; GENERIC-NEXT: movd %mm2, %ecx # sched: [1:0.33]		; GENERIC-NEXT: movd %mm2, %ecx # sched: [1:0.33]
; GENERIC-NEXT: movd %mm0, %eax # sched: [1:0.33]		; GENERIC-NEXT: movd %mm0, %eax # sched: [1:0.33]
; GENERIC-NEXT: movl %ecx, (%rsi) # sched: [1:1.00]		; GENERIC-NEXT: movl %ecx, (%rsi) # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_movd:		; ATOM-LABEL: test_movd:
Show All 16 Lines
; SLM-NEXT: movd %mm2, %ecx # sched: [1:0.50]		; SLM-NEXT: movd %mm2, %ecx # sched: [1:0.50]
; SLM-NEXT: movd %mm0, %eax # sched: [1:0.50]		; SLM-NEXT: movd %mm0, %eax # sched: [1:0.50]
; SLM-NEXT: movl %ecx, (%rsi) # sched: [1:1.00]		; SLM-NEXT: movl %ecx, (%rsi) # sched: [1:1.00]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_movd:		; SANDY-LABEL: test_movd:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: movd %edi, %mm1 # sched: [1:0.33]		; SANDY-NEXT: movd %edi, %mm1 # sched: [1:0.33]
; SANDY-NEXT: movd (%rsi), %mm2 # sched: [4:0.50]		; SANDY-NEXT: movd (%rsi), %mm2 # sched: [5:0.50]
; SANDY-NEXT: paddd %mm1, %mm2 # sched: [3:1.00]		; SANDY-NEXT: paddd %mm1, %mm2 # sched: [3:1.00]
; SANDY-NEXT: paddd %mm2, %mm0 # sched: [3:1.00]		; SANDY-NEXT: paddd %mm2, %mm0 # sched: [3:1.00]
; SANDY-NEXT: movd %mm2, %ecx # sched: [1:0.33]		; SANDY-NEXT: movd %mm2, %ecx # sched: [1:0.33]
; SANDY-NEXT: movd %mm0, %eax # sched: [1:0.33]		; SANDY-NEXT: movd %mm0, %eax # sched: [1:0.33]
; SANDY-NEXT: movl %ecx, (%rsi) # sched: [1:1.00]		; SANDY-NEXT: movl %ecx, (%rsi) # sched: [1:1.00]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_movd:		; HASWELL-LABEL: test_movd:
▲ Show 20 Lines • Show All 206 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
call void @llvm.x86.mmx.movnt.dq(x86_mmx* %a0, x86_mmx %a1)		call void @llvm.x86.mmx.movnt.dq(x86_mmx* %a0, x86_mmx %a1)
ret void		ret void
}		}
declare void @llvm.x86.mmx.movnt.dq(x86_mmx*, x86_mmx) nounwind		declare void @llvm.x86.mmx.movnt.dq(x86_mmx*, x86_mmx) nounwind

define void @test_movq(i64 *%a0) {		define void @test_movq(i64 *%a0) {
; GENERIC-LABEL: test_movq:		; GENERIC-LABEL: test_movq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: movq (%rdi), %mm0 # sched: [4:0.50]		; GENERIC-NEXT: movq (%rdi), %mm0 # sched: [5:0.50]
; GENERIC-NEXT: paddd %mm0, %mm0 # sched: [3:1.00]		; GENERIC-NEXT: paddd %mm0, %mm0 # sched: [3:1.00]
; GENERIC-NEXT: movq %mm0, (%rdi) # sched: [1:1.00]		; GENERIC-NEXT: movq %mm0, (%rdi) # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_movq:		; ATOM-LABEL: test_movq:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: movq (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: movq (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: paddd %mm0, %mm0 # sched: [1:0.50]		; ATOM-NEXT: paddd %mm0, %mm0 # sched: [1:0.50]
; ATOM-NEXT: movq %mm0, (%rdi) # sched: [1:1.00]		; ATOM-NEXT: movq %mm0, (%rdi) # sched: [1:1.00]
; ATOM-NEXT: nop # sched: [1:0.50]		; ATOM-NEXT: nop # sched: [1:0.50]
; ATOM-NEXT: nop # sched: [1:0.50]		; ATOM-NEXT: nop # sched: [1:0.50]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_movq:		; SLM-LABEL: test_movq:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: movq (%rdi), %mm0 # sched: [3:1.00]		; SLM-NEXT: movq (%rdi), %mm0 # sched: [3:1.00]
; SLM-NEXT: paddd %mm0, %mm0 # sched: [1:0.50]		; SLM-NEXT: paddd %mm0, %mm0 # sched: [1:0.50]
; SLM-NEXT: movq %mm0, (%rdi) # sched: [1:1.00]		; SLM-NEXT: movq %mm0, (%rdi) # sched: [1:1.00]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_movq:		; SANDY-LABEL: test_movq:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: movq (%rdi), %mm0 # sched: [4:0.50]		; SANDY-NEXT: movq (%rdi), %mm0 # sched: [5:0.50]
; SANDY-NEXT: paddd %mm0, %mm0 # sched: [3:1.00]		; SANDY-NEXT: paddd %mm0, %mm0 # sched: [3:1.00]
; SANDY-NEXT: movq %mm0, (%rdi) # sched: [1:1.00]		; SANDY-NEXT: movq %mm0, (%rdi) # sched: [1:1.00]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_movq:		; HASWELL-LABEL: test_movq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: movq (%rdi), %mm0 # sched: [5:0.50]		; HASWELL-NEXT: movq (%rdi), %mm0 # sched: [5:0.50]
; HASWELL-NEXT: paddd %mm0, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: paddd %mm0, %mm0 # sched: [1:0.50]
▲ Show 20 Lines • Show All 330 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.ssse3.pabs.w(x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.ssse3.pabs.w(x86_mmx) nounwind readnone

define i64 @test_packssdw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_packssdw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_packssdw:		; GENERIC-LABEL: test_packssdw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: packssdw %mm1, %mm0 # sched: [1:1.00]		; GENERIC-NEXT: packssdw %mm1, %mm0 # sched: [1:1.00]
; GENERIC-NEXT: packssdw (%rdi), %mm0 # sched: [5:1.00]		; GENERIC-NEXT: packssdw (%rdi), %mm0 # sched: [6:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_packssdw:		; ATOM-LABEL: test_packssdw:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: packssdw %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: packssdw %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: packssdw (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: packssdw (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_packssdw:		; SLM-LABEL: test_packssdw:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: packssdw %mm1, %mm0 # sched: [1:1.00]		; SLM-NEXT: packssdw %mm1, %mm0 # sched: [1:1.00]
; SLM-NEXT: packssdw (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: packssdw (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_packssdw:		; SANDY-LABEL: test_packssdw:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: packssdw %mm1, %mm0 # sched: [1:1.00]		; SANDY-NEXT: packssdw %mm1, %mm0 # sched: [1:1.00]
; SANDY-NEXT: packssdw (%rdi), %mm0 # sched: [5:1.00]		; SANDY-NEXT: packssdw (%rdi), %mm0 # sched: [6:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_packssdw:		; HASWELL-LABEL: test_packssdw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: packssdw %mm1, %mm0 # sched: [3:2.00]		; HASWELL-NEXT: packssdw %mm1, %mm0 # sched: [3:2.00]
; HASWELL-NEXT: packssdw (%rdi), %mm0 # sched: [7:2.00]		; HASWELL-NEXT: packssdw (%rdi), %mm0 # sched: [7:2.00]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.packssdw(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.packssdw(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_packsswb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_packsswb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_packsswb:		; GENERIC-LABEL: test_packsswb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: packsswb %mm1, %mm0 # sched: [1:1.00]		; GENERIC-NEXT: packsswb %mm1, %mm0 # sched: [1:1.00]
; GENERIC-NEXT: packsswb (%rdi), %mm0 # sched: [5:1.00]		; GENERIC-NEXT: packsswb (%rdi), %mm0 # sched: [6:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_packsswb:		; ATOM-LABEL: test_packsswb:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: packsswb %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: packsswb %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: packsswb (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: packsswb (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_packsswb:		; SLM-LABEL: test_packsswb:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: packsswb %mm1, %mm0 # sched: [1:1.00]		; SLM-NEXT: packsswb %mm1, %mm0 # sched: [1:1.00]
; SLM-NEXT: packsswb (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: packsswb (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_packsswb:		; SANDY-LABEL: test_packsswb:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: packsswb %mm1, %mm0 # sched: [1:1.00]		; SANDY-NEXT: packsswb %mm1, %mm0 # sched: [1:1.00]
; SANDY-NEXT: packsswb (%rdi), %mm0 # sched: [5:1.00]		; SANDY-NEXT: packsswb (%rdi), %mm0 # sched: [6:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_packsswb:		; HASWELL-LABEL: test_packsswb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: packsswb %mm1, %mm0 # sched: [3:2.00]		; HASWELL-NEXT: packsswb %mm1, %mm0 # sched: [3:2.00]
; HASWELL-NEXT: packsswb (%rdi), %mm0 # sched: [7:2.00]		; HASWELL-NEXT: packsswb (%rdi), %mm0 # sched: [7:2.00]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.packsswb(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.packsswb(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_packuswb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_packuswb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_packuswb:		; GENERIC-LABEL: test_packuswb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: packuswb %mm1, %mm0 # sched: [1:1.00]		; GENERIC-NEXT: packuswb %mm1, %mm0 # sched: [1:1.00]
; GENERIC-NEXT: packuswb (%rdi), %mm0 # sched: [5:1.00]		; GENERIC-NEXT: packuswb (%rdi), %mm0 # sched: [6:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_packuswb:		; ATOM-LABEL: test_packuswb:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: packuswb %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: packuswb %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: packuswb (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: packuswb (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_packuswb:		; SLM-LABEL: test_packuswb:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: packuswb %mm1, %mm0 # sched: [1:1.00]		; SLM-NEXT: packuswb %mm1, %mm0 # sched: [1:1.00]
; SLM-NEXT: packuswb (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: packuswb (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_packuswb:		; SANDY-LABEL: test_packuswb:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: packuswb %mm1, %mm0 # sched: [1:1.00]		; SANDY-NEXT: packuswb %mm1, %mm0 # sched: [1:1.00]
; SANDY-NEXT: packuswb (%rdi), %mm0 # sched: [5:1.00]		; SANDY-NEXT: packuswb (%rdi), %mm0 # sched: [6:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_packuswb:		; HASWELL-LABEL: test_packuswb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: packuswb %mm1, %mm0 # sched: [3:2.00]		; HASWELL-NEXT: packuswb %mm1, %mm0 # sched: [3:2.00]
; HASWELL-NEXT: packuswb (%rdi), %mm0 # sched: [7:2.00]		; HASWELL-NEXT: packuswb (%rdi), %mm0 # sched: [7:2.00]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.packuswb(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.packuswb(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_paddb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_paddb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_paddb:		; GENERIC-LABEL: test_paddb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: paddb %mm1, %mm0 # sched: [3:1.00]		; GENERIC-NEXT: paddb %mm1, %mm0 # sched: [3:1.00]
; GENERIC-NEXT: paddb (%rdi), %mm0 # sched: [7:1.00]		; GENERIC-NEXT: paddb (%rdi), %mm0 # sched: [8:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_paddb:		; ATOM-LABEL: test_paddb:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: paddb %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: paddb %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: paddb (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: paddb (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_paddb:		; SLM-LABEL: test_paddb:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: paddb %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: paddb %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: paddb (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: paddb (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_paddb:		; SANDY-LABEL: test_paddb:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: paddb %mm1, %mm0 # sched: [3:1.00]		; SANDY-NEXT: paddb %mm1, %mm0 # sched: [3:1.00]
; SANDY-NEXT: paddb (%rdi), %mm0 # sched: [7:1.00]		; SANDY-NEXT: paddb (%rdi), %mm0 # sched: [8:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_paddb:		; HASWELL-LABEL: test_paddb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: paddb %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: paddb %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: paddb (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: paddb (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.padd.b(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.padd.b(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_paddd(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_paddd(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_paddd:		; GENERIC-LABEL: test_paddd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: paddd %mm1, %mm0 # sched: [3:1.00]		; GENERIC-NEXT: paddd %mm1, %mm0 # sched: [3:1.00]
; GENERIC-NEXT: paddd (%rdi), %mm0 # sched: [7:1.00]		; GENERIC-NEXT: paddd (%rdi), %mm0 # sched: [8:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_paddd:		; ATOM-LABEL: test_paddd:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: paddd %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: paddd %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: paddd (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: paddd (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_paddd:		; SLM-LABEL: test_paddd:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: paddd %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: paddd %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: paddd (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: paddd (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_paddd:		; SANDY-LABEL: test_paddd:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: paddd %mm1, %mm0 # sched: [3:1.00]		; SANDY-NEXT: paddd %mm1, %mm0 # sched: [3:1.00]
; SANDY-NEXT: paddd (%rdi), %mm0 # sched: [7:1.00]		; SANDY-NEXT: paddd (%rdi), %mm0 # sched: [8:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_paddd:		; HASWELL-LABEL: test_paddd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: paddd %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: paddd %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: paddd (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: paddd (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
▲ Show 20 Lines • Show All 118 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.padd.q(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.padd.q(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_paddsb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_paddsb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_paddsb:		; GENERIC-LABEL: test_paddsb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: paddsb %mm1, %mm0 # sched: [3:1.00]		; GENERIC-NEXT: paddsb %mm1, %mm0 # sched: [3:1.00]
; GENERIC-NEXT: paddsb (%rdi), %mm0 # sched: [7:1.00]		; GENERIC-NEXT: paddsb (%rdi), %mm0 # sched: [8:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_paddsb:		; ATOM-LABEL: test_paddsb:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: paddsb %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: paddsb %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: paddsb (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: paddsb (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_paddsb:		; SLM-LABEL: test_paddsb:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: paddsb %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: paddsb %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: paddsb (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: paddsb (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_paddsb:		; SANDY-LABEL: test_paddsb:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: paddsb %mm1, %mm0 # sched: [3:1.00]		; SANDY-NEXT: paddsb %mm1, %mm0 # sched: [3:1.00]
; SANDY-NEXT: paddsb (%rdi), %mm0 # sched: [7:1.00]		; SANDY-NEXT: paddsb (%rdi), %mm0 # sched: [8:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_paddsb:		; HASWELL-LABEL: test_paddsb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: paddsb %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: paddsb %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: paddsb (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: paddsb (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.padds.b(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.padds.b(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_paddsw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_paddsw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_paddsw:		; GENERIC-LABEL: test_paddsw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: paddsw %mm1, %mm0 # sched: [3:1.00]		; GENERIC-NEXT: paddsw %mm1, %mm0 # sched: [3:1.00]
; GENERIC-NEXT: paddsw (%rdi), %mm0 # sched: [7:1.00]		; GENERIC-NEXT: paddsw (%rdi), %mm0 # sched: [8:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_paddsw:		; ATOM-LABEL: test_paddsw:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: paddsw %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: paddsw %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: paddsw (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: paddsw (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_paddsw:		; SLM-LABEL: test_paddsw:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: paddsw %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: paddsw %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: paddsw (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: paddsw (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_paddsw:		; SANDY-LABEL: test_paddsw:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: paddsw %mm1, %mm0 # sched: [3:1.00]		; SANDY-NEXT: paddsw %mm1, %mm0 # sched: [3:1.00]
; SANDY-NEXT: paddsw (%rdi), %mm0 # sched: [7:1.00]		; SANDY-NEXT: paddsw (%rdi), %mm0 # sched: [8:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_paddsw:		; HASWELL-LABEL: test_paddsw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: paddsw %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: paddsw %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: paddsw (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: paddsw (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.padds.w(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.padds.w(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_paddusb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_paddusb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_paddusb:		; GENERIC-LABEL: test_paddusb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: paddusb %mm1, %mm0 # sched: [3:1.00]		; GENERIC-NEXT: paddusb %mm1, %mm0 # sched: [3:1.00]
; GENERIC-NEXT: paddusb (%rdi), %mm0 # sched: [7:1.00]		; GENERIC-NEXT: paddusb (%rdi), %mm0 # sched: [8:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_paddusb:		; ATOM-LABEL: test_paddusb:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: paddusb %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: paddusb %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: paddusb (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: paddusb (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_paddusb:		; SLM-LABEL: test_paddusb:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: paddusb %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: paddusb %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: paddusb (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: paddusb (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_paddusb:		; SANDY-LABEL: test_paddusb:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: paddusb %mm1, %mm0 # sched: [3:1.00]		; SANDY-NEXT: paddusb %mm1, %mm0 # sched: [3:1.00]
; SANDY-NEXT: paddusb (%rdi), %mm0 # sched: [7:1.00]		; SANDY-NEXT: paddusb (%rdi), %mm0 # sched: [8:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_paddusb:		; HASWELL-LABEL: test_paddusb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: paddusb %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: paddusb %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: paddusb (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: paddusb (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.paddus.b(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.paddus.b(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_paddusw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_paddusw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_paddusw:		; GENERIC-LABEL: test_paddusw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: paddusw %mm1, %mm0 # sched: [3:1.00]		; GENERIC-NEXT: paddusw %mm1, %mm0 # sched: [3:1.00]
; GENERIC-NEXT: paddusw (%rdi), %mm0 # sched: [7:1.00]		; GENERIC-NEXT: paddusw (%rdi), %mm0 # sched: [8:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_paddusw:		; ATOM-LABEL: test_paddusw:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: paddusw %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: paddusw %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: paddusw (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: paddusw (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_paddusw:		; SLM-LABEL: test_paddusw:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: paddusw %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: paddusw %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: paddusw (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: paddusw (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_paddusw:		; SANDY-LABEL: test_paddusw:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: paddusw %mm1, %mm0 # sched: [3:1.00]		; SANDY-NEXT: paddusw %mm1, %mm0 # sched: [3:1.00]
; SANDY-NEXT: paddusw (%rdi), %mm0 # sched: [7:1.00]		; SANDY-NEXT: paddusw (%rdi), %mm0 # sched: [8:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_paddusw:		; HASWELL-LABEL: test_paddusw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: paddusw %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: paddusw %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: paddusw (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: paddusw (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.paddus.w(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.paddus.w(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_paddw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_paddw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_paddw:		; GENERIC-LABEL: test_paddw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: paddw %mm1, %mm0 # sched: [3:1.00]		; GENERIC-NEXT: paddw %mm1, %mm0 # sched: [3:1.00]
; GENERIC-NEXT: paddw (%rdi), %mm0 # sched: [7:1.00]		; GENERIC-NEXT: paddw (%rdi), %mm0 # sched: [8:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_paddw:		; ATOM-LABEL: test_paddw:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: paddw %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: paddw %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: paddw (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: paddw (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_paddw:		; SLM-LABEL: test_paddw:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: paddw %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: paddw %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: paddw (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: paddw (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_paddw:		; SANDY-LABEL: test_paddw:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: paddw %mm1, %mm0 # sched: [3:1.00]		; SANDY-NEXT: paddw %mm1, %mm0 # sched: [3:1.00]
; SANDY-NEXT: paddw (%rdi), %mm0 # sched: [7:1.00]		; SANDY-NEXT: paddw (%rdi), %mm0 # sched: [8:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_paddw:		; HASWELL-LABEL: test_paddw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: paddw %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: paddw %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: paddw (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: paddw (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
▲ Show 20 Lines • Show All 118 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.palignr.b(x86_mmx, x86_mmx, i8) nounwind readnone		declare x86_mmx @llvm.x86.mmx.palignr.b(x86_mmx, x86_mmx, i8) nounwind readnone

define i64 @test_pand(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pand(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_pand:		; GENERIC-LABEL: test_pand:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: pand %mm1, %mm0 # sched: [1:1.00]		; GENERIC-NEXT: pand %mm1, %mm0 # sched: [1:1.00]
; GENERIC-NEXT: pand (%rdi), %mm0 # sched: [5:1.00]		; GENERIC-NEXT: pand (%rdi), %mm0 # sched: [6:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_pand:		; ATOM-LABEL: test_pand:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: pand %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: pand %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: pand (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: pand (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_pand:		; SLM-LABEL: test_pand:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: pand %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: pand %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: pand (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: pand (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_pand:		; SANDY-LABEL: test_pand:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: pand %mm1, %mm0 # sched: [1:1.00]		; SANDY-NEXT: pand %mm1, %mm0 # sched: [1:1.00]
; SANDY-NEXT: pand (%rdi), %mm0 # sched: [5:1.00]		; SANDY-NEXT: pand (%rdi), %mm0 # sched: [6:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pand:		; HASWELL-LABEL: test_pand:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: pand %mm1, %mm0 # sched: [1:0.33]		; HASWELL-NEXT: pand %mm1, %mm0 # sched: [1:0.33]
; HASWELL-NEXT: pand (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: pand (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.pand(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.pand(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pandn(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pandn(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_pandn:		; GENERIC-LABEL: test_pandn:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: pandn %mm1, %mm0 # sched: [1:1.00]		; GENERIC-NEXT: pandn %mm1, %mm0 # sched: [1:1.00]
; GENERIC-NEXT: pandn (%rdi), %mm0 # sched: [5:1.00]		; GENERIC-NEXT: pandn (%rdi), %mm0 # sched: [6:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_pandn:		; ATOM-LABEL: test_pandn:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: pandn %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: pandn %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: pandn (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: pandn (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_pandn:		; SLM-LABEL: test_pandn:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: pandn %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: pandn %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: pandn (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: pandn (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_pandn:		; SANDY-LABEL: test_pandn:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: pandn %mm1, %mm0 # sched: [1:1.00]		; SANDY-NEXT: pandn %mm1, %mm0 # sched: [1:1.00]
; SANDY-NEXT: pandn (%rdi), %mm0 # sched: [5:1.00]		; SANDY-NEXT: pandn (%rdi), %mm0 # sched: [6:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pandn:		; HASWELL-LABEL: test_pandn:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: pandn %mm1, %mm0 # sched: [1:0.33]		; HASWELL-NEXT: pandn %mm1, %mm0 # sched: [1:0.33]
; HASWELL-NEXT: pandn (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: pandn (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.pandn(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.pandn(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pavgb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pavgb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_pavgb:		; GENERIC-LABEL: test_pavgb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: pavgb %mm1, %mm0 # sched: [5:1.00]		; GENERIC-NEXT: pavgb %mm1, %mm0 # sched: [5:1.00]
; GENERIC-NEXT: pavgb (%rdi), %mm0 # sched: [9:1.00]		; GENERIC-NEXT: pavgb (%rdi), %mm0 # sched: [10:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_pavgb:		; ATOM-LABEL: test_pavgb:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: pavgb %mm1, %mm0 # sched: [1:1.00]		; ATOM-NEXT: pavgb %mm1, %mm0 # sched: [1:1.00]
; ATOM-NEXT: pavgb (%rdi), %mm0 # sched: [1:0.50]		; ATOM-NEXT: pavgb (%rdi), %mm0 # sched: [1:0.50]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_pavgb:		; SLM-LABEL: test_pavgb:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: pavgb %mm1, %mm0 # sched: [4:1.00]		; SLM-NEXT: pavgb %mm1, %mm0 # sched: [4:1.00]
; SLM-NEXT: pavgb (%rdi), %mm0 # sched: [7:1.00]		; SLM-NEXT: pavgb (%rdi), %mm0 # sched: [7:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_pavgb:		; SANDY-LABEL: test_pavgb:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: pavgb %mm1, %mm0 # sched: [5:1.00]		; SANDY-NEXT: pavgb %mm1, %mm0 # sched: [5:1.00]
; SANDY-NEXT: pavgb (%rdi), %mm0 # sched: [9:1.00]		; SANDY-NEXT: pavgb (%rdi), %mm0 # sched: [10:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pavgb:		; HASWELL-LABEL: test_pavgb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: pavgb %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: pavgb %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: pavgb (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: pavgb (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.pavg.b(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.pavg.b(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pavgw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pavgw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_pavgw:		; GENERIC-LABEL: test_pavgw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: pavgw %mm1, %mm0 # sched: [5:1.00]		; GENERIC-NEXT: pavgw %mm1, %mm0 # sched: [5:1.00]
; GENERIC-NEXT: pavgw (%rdi), %mm0 # sched: [9:1.00]		; GENERIC-NEXT: pavgw (%rdi), %mm0 # sched: [10:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_pavgw:		; ATOM-LABEL: test_pavgw:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: pavgw %mm1, %mm0 # sched: [1:1.00]		; ATOM-NEXT: pavgw %mm1, %mm0 # sched: [1:1.00]
; ATOM-NEXT: pavgw (%rdi), %mm0 # sched: [1:0.50]		; ATOM-NEXT: pavgw (%rdi), %mm0 # sched: [1:0.50]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_pavgw:		; SLM-LABEL: test_pavgw:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: pavgw %mm1, %mm0 # sched: [4:1.00]		; SLM-NEXT: pavgw %mm1, %mm0 # sched: [4:1.00]
; SLM-NEXT: pavgw (%rdi), %mm0 # sched: [7:1.00]		; SLM-NEXT: pavgw (%rdi), %mm0 # sched: [7:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_pavgw:		; SANDY-LABEL: test_pavgw:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: pavgw %mm1, %mm0 # sched: [5:1.00]		; SANDY-NEXT: pavgw %mm1, %mm0 # sched: [5:1.00]
; SANDY-NEXT: pavgw (%rdi), %mm0 # sched: [9:1.00]		; SANDY-NEXT: pavgw (%rdi), %mm0 # sched: [10:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pavgw:		; HASWELL-LABEL: test_pavgw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: pavgw %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: pavgw %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: pavgw (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: pavgw (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.pavg.w(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.pavg.w(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pcmpeqb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pcmpeqb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_pcmpeqb:		; GENERIC-LABEL: test_pcmpeqb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: pcmpeqb %mm1, %mm0 # sched: [3:1.00]		; GENERIC-NEXT: pcmpeqb %mm1, %mm0 # sched: [3:1.00]
; GENERIC-NEXT: pcmpeqb (%rdi), %mm0 # sched: [7:1.00]		; GENERIC-NEXT: pcmpeqb (%rdi), %mm0 # sched: [8:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_pcmpeqb:		; ATOM-LABEL: test_pcmpeqb:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: pcmpeqb %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: pcmpeqb %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: pcmpeqb (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: pcmpeqb (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_pcmpeqb:		; SLM-LABEL: test_pcmpeqb:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: pcmpeqb %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: pcmpeqb %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: pcmpeqb (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: pcmpeqb (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_pcmpeqb:		; SANDY-LABEL: test_pcmpeqb:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: pcmpeqb %mm1, %mm0 # sched: [3:1.00]		; SANDY-NEXT: pcmpeqb %mm1, %mm0 # sched: [3:1.00]
; SANDY-NEXT: pcmpeqb (%rdi), %mm0 # sched: [7:1.00]		; SANDY-NEXT: pcmpeqb (%rdi), %mm0 # sched: [8:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pcmpeqb:		; HASWELL-LABEL: test_pcmpeqb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: pcmpeqb %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: pcmpeqb %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: pcmpeqb (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: pcmpeqb (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.pcmpeq.b(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.pcmpeq.b(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pcmpeqd(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pcmpeqd(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_pcmpeqd:		; GENERIC-LABEL: test_pcmpeqd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: pcmpeqd %mm1, %mm0 # sched: [3:1.00]		; GENERIC-NEXT: pcmpeqd %mm1, %mm0 # sched: [3:1.00]
; GENERIC-NEXT: pcmpeqd (%rdi), %mm0 # sched: [7:1.00]		; GENERIC-NEXT: pcmpeqd (%rdi), %mm0 # sched: [8:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_pcmpeqd:		; ATOM-LABEL: test_pcmpeqd:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: pcmpeqd %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: pcmpeqd %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: pcmpeqd (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: pcmpeqd (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_pcmpeqd:		; SLM-LABEL: test_pcmpeqd:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: pcmpeqd %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: pcmpeqd %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: pcmpeqd (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: pcmpeqd (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_pcmpeqd:		; SANDY-LABEL: test_pcmpeqd:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: pcmpeqd %mm1, %mm0 # sched: [3:1.00]		; SANDY-NEXT: pcmpeqd %mm1, %mm0 # sched: [3:1.00]
; SANDY-NEXT: pcmpeqd (%rdi), %mm0 # sched: [7:1.00]		; SANDY-NEXT: pcmpeqd (%rdi), %mm0 # sched: [8:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pcmpeqd:		; HASWELL-LABEL: test_pcmpeqd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: pcmpeqd %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: pcmpeqd %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: pcmpeqd (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: pcmpeqd (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.pcmpeq.d(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.pcmpeq.d(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pcmpeqw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pcmpeqw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_pcmpeqw:		; GENERIC-LABEL: test_pcmpeqw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: pcmpeqw %mm1, %mm0 # sched: [3:1.00]		; GENERIC-NEXT: pcmpeqw %mm1, %mm0 # sched: [3:1.00]
; GENERIC-NEXT: pcmpeqw (%rdi), %mm0 # sched: [7:1.00]		; GENERIC-NEXT: pcmpeqw (%rdi), %mm0 # sched: [8:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_pcmpeqw:		; ATOM-LABEL: test_pcmpeqw:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: pcmpeqw %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: pcmpeqw %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: pcmpeqw (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: pcmpeqw (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_pcmpeqw:		; SLM-LABEL: test_pcmpeqw:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: pcmpeqw %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: pcmpeqw %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: pcmpeqw (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: pcmpeqw (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_pcmpeqw:		; SANDY-LABEL: test_pcmpeqw:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: pcmpeqw %mm1, %mm0 # sched: [3:1.00]		; SANDY-NEXT: pcmpeqw %mm1, %mm0 # sched: [3:1.00]
; SANDY-NEXT: pcmpeqw (%rdi), %mm0 # sched: [7:1.00]		; SANDY-NEXT: pcmpeqw (%rdi), %mm0 # sched: [8:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pcmpeqw:		; HASWELL-LABEL: test_pcmpeqw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: pcmpeqw %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: pcmpeqw %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: pcmpeqw (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: pcmpeqw (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.pcmpeq.w(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.pcmpeq.w(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pcmpgtb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pcmpgtb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_pcmpgtb:		; GENERIC-LABEL: test_pcmpgtb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: pcmpgtb %mm1, %mm0 # sched: [3:1.00]		; GENERIC-NEXT: pcmpgtb %mm1, %mm0 # sched: [3:1.00]
; GENERIC-NEXT: pcmpgtb (%rdi), %mm0 # sched: [7:1.00]		; GENERIC-NEXT: pcmpgtb (%rdi), %mm0 # sched: [8:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_pcmpgtb:		; ATOM-LABEL: test_pcmpgtb:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: pcmpgtb %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: pcmpgtb %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: pcmpgtb (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: pcmpgtb (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_pcmpgtb:		; SLM-LABEL: test_pcmpgtb:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: pcmpgtb %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: pcmpgtb %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: pcmpgtb (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: pcmpgtb (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_pcmpgtb:		; SANDY-LABEL: test_pcmpgtb:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: pcmpgtb %mm1, %mm0 # sched: [3:1.00]		; SANDY-NEXT: pcmpgtb %mm1, %mm0 # sched: [3:1.00]
; SANDY-NEXT: pcmpgtb (%rdi), %mm0 # sched: [7:1.00]		; SANDY-NEXT: pcmpgtb (%rdi), %mm0 # sched: [8:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pcmpgtb:		; HASWELL-LABEL: test_pcmpgtb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: pcmpgtb %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: pcmpgtb %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: pcmpgtb (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: pcmpgtb (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.pcmpgt.b(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.pcmpgt.b(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pcmpgtd(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pcmpgtd(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_pcmpgtd:		; GENERIC-LABEL: test_pcmpgtd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: pcmpgtd %mm1, %mm0 # sched: [3:1.00]		; GENERIC-NEXT: pcmpgtd %mm1, %mm0 # sched: [3:1.00]
; GENERIC-NEXT: pcmpgtd (%rdi), %mm0 # sched: [7:1.00]		; GENERIC-NEXT: pcmpgtd (%rdi), %mm0 # sched: [8:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_pcmpgtd:		; ATOM-LABEL: test_pcmpgtd:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: pcmpgtd %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: pcmpgtd %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: pcmpgtd (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: pcmpgtd (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_pcmpgtd:		; SLM-LABEL: test_pcmpgtd:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: pcmpgtd %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: pcmpgtd %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: pcmpgtd (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: pcmpgtd (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_pcmpgtd:		; SANDY-LABEL: test_pcmpgtd:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: pcmpgtd %mm1, %mm0 # sched: [3:1.00]		; SANDY-NEXT: pcmpgtd %mm1, %mm0 # sched: [3:1.00]
; SANDY-NEXT: pcmpgtd (%rdi), %mm0 # sched: [7:1.00]		; SANDY-NEXT: pcmpgtd (%rdi), %mm0 # sched: [8:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pcmpgtd:		; HASWELL-LABEL: test_pcmpgtd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: pcmpgtd %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: pcmpgtd %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: pcmpgtd (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: pcmpgtd (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.pcmpgt.d(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.pcmpgt.d(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pcmpgtw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pcmpgtw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_pcmpgtw:		; GENERIC-LABEL: test_pcmpgtw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: pcmpgtw %mm1, %mm0 # sched: [3:1.00]		; GENERIC-NEXT: pcmpgtw %mm1, %mm0 # sched: [3:1.00]
; GENERIC-NEXT: pcmpgtw (%rdi), %mm0 # sched: [7:1.00]		; GENERIC-NEXT: pcmpgtw (%rdi), %mm0 # sched: [8:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_pcmpgtw:		; ATOM-LABEL: test_pcmpgtw:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: pcmpgtw %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: pcmpgtw %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: pcmpgtw (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: pcmpgtw (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_pcmpgtw:		; SLM-LABEL: test_pcmpgtw:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: pcmpgtw %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: pcmpgtw %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: pcmpgtw (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: pcmpgtw (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_pcmpgtw:		; SANDY-LABEL: test_pcmpgtw:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: pcmpgtw %mm1, %mm0 # sched: [3:1.00]		; SANDY-NEXT: pcmpgtw %mm1, %mm0 # sched: [3:1.00]
; SANDY-NEXT: pcmpgtw (%rdi), %mm0 # sched: [7:1.00]		; SANDY-NEXT: pcmpgtw (%rdi), %mm0 # sched: [8:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pcmpgtw:		; HASWELL-LABEL: test_pcmpgtw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: pcmpgtw %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: pcmpgtw %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: pcmpgtw (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: pcmpgtw (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
▲ Show 20 Lines • Show All 808 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.ssse3.pmadd.ub.sw(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.ssse3.pmadd.ub.sw(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pmaxsw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pmaxsw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_pmaxsw:		; GENERIC-LABEL: test_pmaxsw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: pmaxsw %mm1, %mm0 # sched: [5:1.00]		; GENERIC-NEXT: pmaxsw %mm1, %mm0 # sched: [5:1.00]
; GENERIC-NEXT: pmaxsw (%rdi), %mm0 # sched: [9:1.00]		; GENERIC-NEXT: pmaxsw (%rdi), %mm0 # sched: [10:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_pmaxsw:		; ATOM-LABEL: test_pmaxsw:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: pmaxsw %mm1, %mm0 # sched: [1:1.00]		; ATOM-NEXT: pmaxsw %mm1, %mm0 # sched: [1:1.00]
; ATOM-NEXT: pmaxsw (%rdi), %mm0 # sched: [1:0.50]		; ATOM-NEXT: pmaxsw (%rdi), %mm0 # sched: [1:0.50]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_pmaxsw:		; SLM-LABEL: test_pmaxsw:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: pmaxsw %mm1, %mm0 # sched: [4:1.00]		; SLM-NEXT: pmaxsw %mm1, %mm0 # sched: [4:1.00]
; SLM-NEXT: pmaxsw (%rdi), %mm0 # sched: [7:1.00]		; SLM-NEXT: pmaxsw (%rdi), %mm0 # sched: [7:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_pmaxsw:		; SANDY-LABEL: test_pmaxsw:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: pmaxsw %mm1, %mm0 # sched: [5:1.00]		; SANDY-NEXT: pmaxsw %mm1, %mm0 # sched: [5:1.00]
; SANDY-NEXT: pmaxsw (%rdi), %mm0 # sched: [9:1.00]		; SANDY-NEXT: pmaxsw (%rdi), %mm0 # sched: [10:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmaxsw:		; HASWELL-LABEL: test_pmaxsw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: pmaxsw %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: pmaxsw %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: pmaxsw (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: pmaxsw (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.pmaxs.w(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.pmaxs.w(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pmaxub(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pmaxub(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_pmaxub:		; GENERIC-LABEL: test_pmaxub:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: pmaxub %mm1, %mm0 # sched: [5:1.00]		; GENERIC-NEXT: pmaxub %mm1, %mm0 # sched: [5:1.00]
; GENERIC-NEXT: pmaxub (%rdi), %mm0 # sched: [9:1.00]		; GENERIC-NEXT: pmaxub (%rdi), %mm0 # sched: [10:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_pmaxub:		; ATOM-LABEL: test_pmaxub:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: pmaxub %mm1, %mm0 # sched: [1:1.00]		; ATOM-NEXT: pmaxub %mm1, %mm0 # sched: [1:1.00]
; ATOM-NEXT: pmaxub (%rdi), %mm0 # sched: [1:0.50]		; ATOM-NEXT: pmaxub (%rdi), %mm0 # sched: [1:0.50]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_pmaxub:		; SLM-LABEL: test_pmaxub:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: pmaxub %mm1, %mm0 # sched: [4:1.00]		; SLM-NEXT: pmaxub %mm1, %mm0 # sched: [4:1.00]
; SLM-NEXT: pmaxub (%rdi), %mm0 # sched: [7:1.00]		; SLM-NEXT: pmaxub (%rdi), %mm0 # sched: [7:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_pmaxub:		; SANDY-LABEL: test_pmaxub:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: pmaxub %mm1, %mm0 # sched: [5:1.00]		; SANDY-NEXT: pmaxub %mm1, %mm0 # sched: [5:1.00]
; SANDY-NEXT: pmaxub (%rdi), %mm0 # sched: [9:1.00]		; SANDY-NEXT: pmaxub (%rdi), %mm0 # sched: [10:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pmaxub:		; HASWELL-LABEL: test_pmaxub:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: pmaxub %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: pmaxub %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: pmaxub (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: pmaxub (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.pmaxu.b(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.pmaxu.b(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pminsw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pminsw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_pminsw:		; GENERIC-LABEL: test_pminsw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: pminsw %mm1, %mm0 # sched: [5:1.00]		; GENERIC-NEXT: pminsw %mm1, %mm0 # sched: [5:1.00]
; GENERIC-NEXT: pminsw (%rdi), %mm0 # sched: [9:1.00]		; GENERIC-NEXT: pminsw (%rdi), %mm0 # sched: [10:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_pminsw:		; ATOM-LABEL: test_pminsw:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: pminsw %mm1, %mm0 # sched: [1:1.00]		; ATOM-NEXT: pminsw %mm1, %mm0 # sched: [1:1.00]
; ATOM-NEXT: pminsw (%rdi), %mm0 # sched: [1:0.50]		; ATOM-NEXT: pminsw (%rdi), %mm0 # sched: [1:0.50]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_pminsw:		; SLM-LABEL: test_pminsw:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: pminsw %mm1, %mm0 # sched: [4:1.00]		; SLM-NEXT: pminsw %mm1, %mm0 # sched: [4:1.00]
; SLM-NEXT: pminsw (%rdi), %mm0 # sched: [7:1.00]		; SLM-NEXT: pminsw (%rdi), %mm0 # sched: [7:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_pminsw:		; SANDY-LABEL: test_pminsw:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: pminsw %mm1, %mm0 # sched: [5:1.00]		; SANDY-NEXT: pminsw %mm1, %mm0 # sched: [5:1.00]
; SANDY-NEXT: pminsw (%rdi), %mm0 # sched: [9:1.00]		; SANDY-NEXT: pminsw (%rdi), %mm0 # sched: [10:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pminsw:		; HASWELL-LABEL: test_pminsw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: pminsw %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: pminsw %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: pminsw (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: pminsw (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.pmins.w(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.pmins.w(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pminub(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pminub(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_pminub:		; GENERIC-LABEL: test_pminub:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: pminub %mm1, %mm0 # sched: [5:1.00]		; GENERIC-NEXT: pminub %mm1, %mm0 # sched: [5:1.00]
; GENERIC-NEXT: pminub (%rdi), %mm0 # sched: [9:1.00]		; GENERIC-NEXT: pminub (%rdi), %mm0 # sched: [10:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_pminub:		; ATOM-LABEL: test_pminub:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: pminub %mm1, %mm0 # sched: [1:1.00]		; ATOM-NEXT: pminub %mm1, %mm0 # sched: [1:1.00]
; ATOM-NEXT: pminub (%rdi), %mm0 # sched: [1:0.50]		; ATOM-NEXT: pminub (%rdi), %mm0 # sched: [1:0.50]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_pminub:		; SLM-LABEL: test_pminub:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: pminub %mm1, %mm0 # sched: [4:1.00]		; SLM-NEXT: pminub %mm1, %mm0 # sched: [4:1.00]
; SLM-NEXT: pminub (%rdi), %mm0 # sched: [7:1.00]		; SLM-NEXT: pminub (%rdi), %mm0 # sched: [7:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_pminub:		; SANDY-LABEL: test_pminub:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: pminub %mm1, %mm0 # sched: [5:1.00]		; SANDY-NEXT: pminub %mm1, %mm0 # sched: [5:1.00]
; SANDY-NEXT: pminub (%rdi), %mm0 # sched: [9:1.00]		; SANDY-NEXT: pminub (%rdi), %mm0 # sched: [10:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pminub:		; HASWELL-LABEL: test_pminub:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: pminub %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: pminub %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: pminub (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: pminub (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
▲ Show 20 Lines • Show All 485 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.pmulu.dq(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.pmulu.dq(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_por(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_por(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_por:		; GENERIC-LABEL: test_por:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: por %mm1, %mm0 # sched: [1:1.00]		; GENERIC-NEXT: por %mm1, %mm0 # sched: [1:1.00]
; GENERIC-NEXT: por (%rdi), %mm0 # sched: [5:1.00]		; GENERIC-NEXT: por (%rdi), %mm0 # sched: [6:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_por:		; ATOM-LABEL: test_por:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: por %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: por %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: por (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: por (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_por:		; SLM-LABEL: test_por:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: por %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: por %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: por (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: por (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_por:		; SANDY-LABEL: test_por:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: por %mm1, %mm0 # sched: [1:1.00]		; SANDY-NEXT: por %mm1, %mm0 # sched: [1:1.00]
; SANDY-NEXT: por (%rdi), %mm0 # sched: [5:1.00]		; SANDY-NEXT: por (%rdi), %mm0 # sched: [6:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_por:		; HASWELL-LABEL: test_por:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: por %mm1, %mm0 # sched: [1:0.33]		; HASWELL-NEXT: por %mm1, %mm0 # sched: [1:0.33]
; HASWELL-NEXT: por (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: por (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
▲ Show 20 Lines • Show All 195 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%4 = bitcast x86_mmx %3 to i64		%4 = bitcast x86_mmx %3 to i64
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.ssse3.pshuf.b(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.ssse3.pshuf.b(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pshufw(x86_mmx *%a0) optsize {		define i64 @test_pshufw(x86_mmx *%a0) optsize {
; GENERIC-LABEL: test_pshufw:		; GENERIC-LABEL: test_pshufw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: pshufw $0, (%rdi), %mm0 # mm0 = mem[0,0,0,0] sched: [5:1.00]		; GENERIC-NEXT: pshufw $0, (%rdi), %mm0 # mm0 = mem[0,0,0,0] sched: [6:1.00]
; GENERIC-NEXT: pshufw $0, %mm0, %mm0 # mm0 = mm0[0,0,0,0] sched: [1:1.00]		; GENERIC-NEXT: pshufw $0, %mm0, %mm0 # mm0 = mm0[0,0,0,0] sched: [1:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_pshufw:		; ATOM-LABEL: test_pshufw:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: pshufw $0, (%rdi), %mm0 # mm0 = mem[0,0,0,0] sched: [1:1.00]		; ATOM-NEXT: pshufw $0, (%rdi), %mm0 # mm0 = mem[0,0,0,0] sched: [1:1.00]
; ATOM-NEXT: pshufw $0, %mm0, %mm0 # mm0 = mm0[0,0,0,0] sched: [1:1.00]		; ATOM-NEXT: pshufw $0, %mm0, %mm0 # mm0 = mm0[0,0,0,0] sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_pshufw:		; SLM-LABEL: test_pshufw:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: pshufw $0, (%rdi), %mm0 # mm0 = mem[0,0,0,0] sched: [4:1.00]		; SLM-NEXT: pshufw $0, (%rdi), %mm0 # mm0 = mem[0,0,0,0] sched: [4:1.00]
; SLM-NEXT: pshufw $0, %mm0, %mm0 # mm0 = mm0[0,0,0,0] sched: [1:1.00]		; SLM-NEXT: pshufw $0, %mm0, %mm0 # mm0 = mm0[0,0,0,0] sched: [1:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_pshufw:		; SANDY-LABEL: test_pshufw:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: pshufw $0, (%rdi), %mm0 # mm0 = mem[0,0,0,0] sched: [5:1.00]		; SANDY-NEXT: pshufw $0, (%rdi), %mm0 # mm0 = mem[0,0,0,0] sched: [6:1.00]
; SANDY-NEXT: pshufw $0, %mm0, %mm0 # mm0 = mm0[0,0,0,0] sched: [1:1.00]		; SANDY-NEXT: pshufw $0, %mm0, %mm0 # mm0 = mm0[0,0,0,0] sched: [1:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pshufw:		; HASWELL-LABEL: test_pshufw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: pshufw $0, (%rdi), %mm0 # mm0 = mem[0,0,0,0] sched: [6:1.00]		; HASWELL-NEXT: pshufw $0, (%rdi), %mm0 # mm0 = mem[0,0,0,0] sched: [6:1.00]
; HASWELL-NEXT: pshufw $0, %mm0, %mm0 # mm0 = mm0[0,0,0,0] sched: [1:1.00]		; HASWELL-NEXT: pshufw $0, %mm0, %mm0 # mm0 = mm0[0,0,0,0] sched: [1:1.00]
▲ Show 20 Lines • Show All 275 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.ssse3.psign.w(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.ssse3.psign.w(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pslld(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pslld(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_pslld:		; GENERIC-LABEL: test_pslld:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: pslld %mm1, %mm0 # sched: [1:1.00]		; GENERIC-NEXT: pslld %mm1, %mm0 # sched: [1:1.00]
; GENERIC-NEXT: pslld (%rdi), %mm0 # sched: [5:1.00]		; GENERIC-NEXT: pslld (%rdi), %mm0 # sched: [6:1.00]
; GENERIC-NEXT: pslld $7, %mm0 # sched: [1:1.00]		; GENERIC-NEXT: pslld $7, %mm0 # sched: [1:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_pslld:		; ATOM-LABEL: test_pslld:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: pslld %mm1, %mm0 # sched: [2:1.00]		; ATOM-NEXT: pslld %mm1, %mm0 # sched: [2:1.00]
; ATOM-NEXT: pslld (%rdi), %mm0 # sched: [3:1.50]		; ATOM-NEXT: pslld (%rdi), %mm0 # sched: [3:1.50]
; ATOM-NEXT: pslld $7, %mm0 # sched: [1:0.50]		; ATOM-NEXT: pslld $7, %mm0 # sched: [1:0.50]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_pslld:		; SLM-LABEL: test_pslld:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: pslld %mm1, %mm0 # sched: [1:1.00]		; SLM-NEXT: pslld %mm1, %mm0 # sched: [1:1.00]
; SLM-NEXT: pslld (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: pslld (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: pslld $7, %mm0 # sched: [1:1.00]		; SLM-NEXT: pslld $7, %mm0 # sched: [1:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_pslld:		; SANDY-LABEL: test_pslld:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: pslld %mm1, %mm0 # sched: [1:1.00]		; SANDY-NEXT: pslld %mm1, %mm0 # sched: [1:1.00]
; SANDY-NEXT: pslld (%rdi), %mm0 # sched: [5:1.00]		; SANDY-NEXT: pslld (%rdi), %mm0 # sched: [6:1.00]
; SANDY-NEXT: pslld $7, %mm0 # sched: [1:1.00]		; SANDY-NEXT: pslld $7, %mm0 # sched: [1:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pslld:		; HASWELL-LABEL: test_pslld:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: pslld %mm1, %mm0 # sched: [1:1.00]		; HASWELL-NEXT: pslld %mm1, %mm0 # sched: [1:1.00]
; HASWELL-NEXT: pslld (%rdi), %mm0 # sched: [6:1.00]		; HASWELL-NEXT: pslld (%rdi), %mm0 # sched: [6:1.00]
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
}		}
declare x86_mmx @llvm.x86.mmx.psll.d(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.psll.d(x86_mmx, x86_mmx) nounwind readnone
declare x86_mmx @llvm.x86.mmx.pslli.d(x86_mmx, i32) nounwind readnone		declare x86_mmx @llvm.x86.mmx.pslli.d(x86_mmx, i32) nounwind readnone

define i64 @test_psllq(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_psllq(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_psllq:		; GENERIC-LABEL: test_psllq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: psllq %mm1, %mm0 # sched: [1:1.00]		; GENERIC-NEXT: psllq %mm1, %mm0 # sched: [1:1.00]
; GENERIC-NEXT: psllq (%rdi), %mm0 # sched: [5:1.00]		; GENERIC-NEXT: psllq (%rdi), %mm0 # sched: [6:1.00]
; GENERIC-NEXT: psllq $7, %mm0 # sched: [1:1.00]		; GENERIC-NEXT: psllq $7, %mm0 # sched: [1:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_psllq:		; ATOM-LABEL: test_psllq:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: psllq %mm1, %mm0 # sched: [2:1.00]		; ATOM-NEXT: psllq %mm1, %mm0 # sched: [2:1.00]
; ATOM-NEXT: psllq (%rdi), %mm0 # sched: [3:1.50]		; ATOM-NEXT: psllq (%rdi), %mm0 # sched: [3:1.50]
; ATOM-NEXT: psllq $7, %mm0 # sched: [1:0.50]		; ATOM-NEXT: psllq $7, %mm0 # sched: [1:0.50]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_psllq:		; SLM-LABEL: test_psllq:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: psllq %mm1, %mm0 # sched: [1:1.00]		; SLM-NEXT: psllq %mm1, %mm0 # sched: [1:1.00]
; SLM-NEXT: psllq (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: psllq (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: psllq $7, %mm0 # sched: [1:1.00]		; SLM-NEXT: psllq $7, %mm0 # sched: [1:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_psllq:		; SANDY-LABEL: test_psllq:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: psllq %mm1, %mm0 # sched: [1:1.00]		; SANDY-NEXT: psllq %mm1, %mm0 # sched: [1:1.00]
; SANDY-NEXT: psllq (%rdi), %mm0 # sched: [5:1.00]		; SANDY-NEXT: psllq (%rdi), %mm0 # sched: [6:1.00]
; SANDY-NEXT: psllq $7, %mm0 # sched: [1:1.00]		; SANDY-NEXT: psllq $7, %mm0 # sched: [1:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psllq:		; HASWELL-LABEL: test_psllq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: psllq %mm1, %mm0 # sched: [1:1.00]		; HASWELL-NEXT: psllq %mm1, %mm0 # sched: [1:1.00]
; HASWELL-NEXT: psllq (%rdi), %mm0 # sched: [6:1.00]		; HASWELL-NEXT: psllq (%rdi), %mm0 # sched: [6:1.00]
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
}		}
declare x86_mmx @llvm.x86.mmx.psll.q(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.psll.q(x86_mmx, x86_mmx) nounwind readnone
declare x86_mmx @llvm.x86.mmx.pslli.q(x86_mmx, i32) nounwind readnone		declare x86_mmx @llvm.x86.mmx.pslli.q(x86_mmx, i32) nounwind readnone

define i64 @test_psllw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_psllw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_psllw:		; GENERIC-LABEL: test_psllw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: psllw %mm1, %mm0 # sched: [1:1.00]		; GENERIC-NEXT: psllw %mm1, %mm0 # sched: [1:1.00]
; GENERIC-NEXT: psllw (%rdi), %mm0 # sched: [5:1.00]		; GENERIC-NEXT: psllw (%rdi), %mm0 # sched: [6:1.00]
; GENERIC-NEXT: psllw $7, %mm0 # sched: [1:1.00]		; GENERIC-NEXT: psllw $7, %mm0 # sched: [1:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_psllw:		; ATOM-LABEL: test_psllw:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: psllw %mm1, %mm0 # sched: [2:1.00]		; ATOM-NEXT: psllw %mm1, %mm0 # sched: [2:1.00]
; ATOM-NEXT: psllw (%rdi), %mm0 # sched: [3:1.50]		; ATOM-NEXT: psllw (%rdi), %mm0 # sched: [3:1.50]
; ATOM-NEXT: psllw $7, %mm0 # sched: [1:0.50]		; ATOM-NEXT: psllw $7, %mm0 # sched: [1:0.50]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_psllw:		; SLM-LABEL: test_psllw:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: psllw %mm1, %mm0 # sched: [1:1.00]		; SLM-NEXT: psllw %mm1, %mm0 # sched: [1:1.00]
; SLM-NEXT: psllw (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: psllw (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: psllw $7, %mm0 # sched: [1:1.00]		; SLM-NEXT: psllw $7, %mm0 # sched: [1:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_psllw:		; SANDY-LABEL: test_psllw:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: psllw %mm1, %mm0 # sched: [1:1.00]		; SANDY-NEXT: psllw %mm1, %mm0 # sched: [1:1.00]
; SANDY-NEXT: psllw (%rdi), %mm0 # sched: [5:1.00]		; SANDY-NEXT: psllw (%rdi), %mm0 # sched: [6:1.00]
; SANDY-NEXT: psllw $7, %mm0 # sched: [1:1.00]		; SANDY-NEXT: psllw $7, %mm0 # sched: [1:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psllw:		; HASWELL-LABEL: test_psllw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: psllw %mm1, %mm0 # sched: [1:1.00]		; HASWELL-NEXT: psllw %mm1, %mm0 # sched: [1:1.00]
; HASWELL-NEXT: psllw (%rdi), %mm0 # sched: [6:1.00]		; HASWELL-NEXT: psllw (%rdi), %mm0 # sched: [6:1.00]
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
}		}
declare x86_mmx @llvm.x86.mmx.psll.w(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.psll.w(x86_mmx, x86_mmx) nounwind readnone
declare x86_mmx @llvm.x86.mmx.pslli.w(x86_mmx, i32) nounwind readnone		declare x86_mmx @llvm.x86.mmx.pslli.w(x86_mmx, i32) nounwind readnone

define i64 @test_psrad(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_psrad(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_psrad:		; GENERIC-LABEL: test_psrad:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: psrad %mm1, %mm0 # sched: [1:1.00]		; GENERIC-NEXT: psrad %mm1, %mm0 # sched: [1:1.00]
; GENERIC-NEXT: psrad (%rdi), %mm0 # sched: [5:1.00]		; GENERIC-NEXT: psrad (%rdi), %mm0 # sched: [6:1.00]
; GENERIC-NEXT: psrad $7, %mm0 # sched: [1:1.00]		; GENERIC-NEXT: psrad $7, %mm0 # sched: [1:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_psrad:		; ATOM-LABEL: test_psrad:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: psrad %mm1, %mm0 # sched: [2:1.00]		; ATOM-NEXT: psrad %mm1, %mm0 # sched: [2:1.00]
; ATOM-NEXT: psrad (%rdi), %mm0 # sched: [3:1.50]		; ATOM-NEXT: psrad (%rdi), %mm0 # sched: [3:1.50]
; ATOM-NEXT: psrad $7, %mm0 # sched: [1:0.50]		; ATOM-NEXT: psrad $7, %mm0 # sched: [1:0.50]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_psrad:		; SLM-LABEL: test_psrad:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: psrad %mm1, %mm0 # sched: [1:1.00]		; SLM-NEXT: psrad %mm1, %mm0 # sched: [1:1.00]
; SLM-NEXT: psrad (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: psrad (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: psrad $7, %mm0 # sched: [1:1.00]		; SLM-NEXT: psrad $7, %mm0 # sched: [1:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_psrad:		; SANDY-LABEL: test_psrad:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: psrad %mm1, %mm0 # sched: [1:1.00]		; SANDY-NEXT: psrad %mm1, %mm0 # sched: [1:1.00]
; SANDY-NEXT: psrad (%rdi), %mm0 # sched: [5:1.00]		; SANDY-NEXT: psrad (%rdi), %mm0 # sched: [6:1.00]
; SANDY-NEXT: psrad $7, %mm0 # sched: [1:1.00]		; SANDY-NEXT: psrad $7, %mm0 # sched: [1:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psrad:		; HASWELL-LABEL: test_psrad:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: psrad %mm1, %mm0 # sched: [1:1.00]		; HASWELL-NEXT: psrad %mm1, %mm0 # sched: [1:1.00]
; HASWELL-NEXT: psrad (%rdi), %mm0 # sched: [6:1.00]		; HASWELL-NEXT: psrad (%rdi), %mm0 # sched: [6:1.00]
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
}		}
declare x86_mmx @llvm.x86.mmx.psra.d(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.psra.d(x86_mmx, x86_mmx) nounwind readnone
declare x86_mmx @llvm.x86.mmx.psrai.d(x86_mmx, i32) nounwind readnone		declare x86_mmx @llvm.x86.mmx.psrai.d(x86_mmx, i32) nounwind readnone

define i64 @test_psraw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_psraw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_psraw:		; GENERIC-LABEL: test_psraw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: psraw %mm1, %mm0 # sched: [1:1.00]		; GENERIC-NEXT: psraw %mm1, %mm0 # sched: [1:1.00]
; GENERIC-NEXT: psraw (%rdi), %mm0 # sched: [5:1.00]		; GENERIC-NEXT: psraw (%rdi), %mm0 # sched: [6:1.00]
; GENERIC-NEXT: psraw $7, %mm0 # sched: [1:1.00]		; GENERIC-NEXT: psraw $7, %mm0 # sched: [1:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_psraw:		; ATOM-LABEL: test_psraw:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: psraw %mm1, %mm0 # sched: [2:1.00]		; ATOM-NEXT: psraw %mm1, %mm0 # sched: [2:1.00]
; ATOM-NEXT: psraw (%rdi), %mm0 # sched: [3:1.50]		; ATOM-NEXT: psraw (%rdi), %mm0 # sched: [3:1.50]
; ATOM-NEXT: psraw $7, %mm0 # sched: [1:0.50]		; ATOM-NEXT: psraw $7, %mm0 # sched: [1:0.50]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_psraw:		; SLM-LABEL: test_psraw:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: psraw %mm1, %mm0 # sched: [1:1.00]		; SLM-NEXT: psraw %mm1, %mm0 # sched: [1:1.00]
; SLM-NEXT: psraw (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: psraw (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: psraw $7, %mm0 # sched: [1:1.00]		; SLM-NEXT: psraw $7, %mm0 # sched: [1:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_psraw:		; SANDY-LABEL: test_psraw:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: psraw %mm1, %mm0 # sched: [1:1.00]		; SANDY-NEXT: psraw %mm1, %mm0 # sched: [1:1.00]
; SANDY-NEXT: psraw (%rdi), %mm0 # sched: [5:1.00]		; SANDY-NEXT: psraw (%rdi), %mm0 # sched: [6:1.00]
; SANDY-NEXT: psraw $7, %mm0 # sched: [1:1.00]		; SANDY-NEXT: psraw $7, %mm0 # sched: [1:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psraw:		; HASWELL-LABEL: test_psraw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: psraw %mm1, %mm0 # sched: [1:1.00]		; HASWELL-NEXT: psraw %mm1, %mm0 # sched: [1:1.00]
; HASWELL-NEXT: psraw (%rdi), %mm0 # sched: [6:1.00]		; HASWELL-NEXT: psraw (%rdi), %mm0 # sched: [6:1.00]
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
}		}
declare x86_mmx @llvm.x86.mmx.psra.w(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.psra.w(x86_mmx, x86_mmx) nounwind readnone
declare x86_mmx @llvm.x86.mmx.psrai.w(x86_mmx, i32) nounwind readnone		declare x86_mmx @llvm.x86.mmx.psrai.w(x86_mmx, i32) nounwind readnone

define i64 @test_psrld(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_psrld(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_psrld:		; GENERIC-LABEL: test_psrld:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: psrld %mm1, %mm0 # sched: [1:1.00]		; GENERIC-NEXT: psrld %mm1, %mm0 # sched: [1:1.00]
; GENERIC-NEXT: psrld (%rdi), %mm0 # sched: [5:1.00]		; GENERIC-NEXT: psrld (%rdi), %mm0 # sched: [6:1.00]
; GENERIC-NEXT: psrld $7, %mm0 # sched: [1:1.00]		; GENERIC-NEXT: psrld $7, %mm0 # sched: [1:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_psrld:		; ATOM-LABEL: test_psrld:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: psrld %mm1, %mm0 # sched: [2:1.00]		; ATOM-NEXT: psrld %mm1, %mm0 # sched: [2:1.00]
; ATOM-NEXT: psrld (%rdi), %mm0 # sched: [3:1.50]		; ATOM-NEXT: psrld (%rdi), %mm0 # sched: [3:1.50]
; ATOM-NEXT: psrld $7, %mm0 # sched: [1:0.50]		; ATOM-NEXT: psrld $7, %mm0 # sched: [1:0.50]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_psrld:		; SLM-LABEL: test_psrld:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: psrld %mm1, %mm0 # sched: [1:1.00]		; SLM-NEXT: psrld %mm1, %mm0 # sched: [1:1.00]
; SLM-NEXT: psrld (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: psrld (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: psrld $7, %mm0 # sched: [1:1.00]		; SLM-NEXT: psrld $7, %mm0 # sched: [1:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_psrld:		; SANDY-LABEL: test_psrld:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: psrld %mm1, %mm0 # sched: [1:1.00]		; SANDY-NEXT: psrld %mm1, %mm0 # sched: [1:1.00]
; SANDY-NEXT: psrld (%rdi), %mm0 # sched: [5:1.00]		; SANDY-NEXT: psrld (%rdi), %mm0 # sched: [6:1.00]
; SANDY-NEXT: psrld $7, %mm0 # sched: [1:1.00]		; SANDY-NEXT: psrld $7, %mm0 # sched: [1:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psrld:		; HASWELL-LABEL: test_psrld:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: psrld %mm1, %mm0 # sched: [1:1.00]		; HASWELL-NEXT: psrld %mm1, %mm0 # sched: [1:1.00]
; HASWELL-NEXT: psrld (%rdi), %mm0 # sched: [6:1.00]		; HASWELL-NEXT: psrld (%rdi), %mm0 # sched: [6:1.00]
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
}		}
declare x86_mmx @llvm.x86.mmx.psrl.d(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.psrl.d(x86_mmx, x86_mmx) nounwind readnone
declare x86_mmx @llvm.x86.mmx.psrli.d(x86_mmx, i32) nounwind readnone		declare x86_mmx @llvm.x86.mmx.psrli.d(x86_mmx, i32) nounwind readnone

define i64 @test_psrlq(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_psrlq(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_psrlq:		; GENERIC-LABEL: test_psrlq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: psrlq %mm1, %mm0 # sched: [1:1.00]		; GENERIC-NEXT: psrlq %mm1, %mm0 # sched: [1:1.00]
; GENERIC-NEXT: psrlq (%rdi), %mm0 # sched: [5:1.00]		; GENERIC-NEXT: psrlq (%rdi), %mm0 # sched: [6:1.00]
; GENERIC-NEXT: psrlq $7, %mm0 # sched: [1:1.00]		; GENERIC-NEXT: psrlq $7, %mm0 # sched: [1:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_psrlq:		; ATOM-LABEL: test_psrlq:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: psrlq %mm1, %mm0 # sched: [2:1.00]		; ATOM-NEXT: psrlq %mm1, %mm0 # sched: [2:1.00]
; ATOM-NEXT: psrlq (%rdi), %mm0 # sched: [3:1.50]		; ATOM-NEXT: psrlq (%rdi), %mm0 # sched: [3:1.50]
; ATOM-NEXT: psrlq $7, %mm0 # sched: [1:0.50]		; ATOM-NEXT: psrlq $7, %mm0 # sched: [1:0.50]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_psrlq:		; SLM-LABEL: test_psrlq:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: psrlq %mm1, %mm0 # sched: [1:1.00]		; SLM-NEXT: psrlq %mm1, %mm0 # sched: [1:1.00]
; SLM-NEXT: psrlq (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: psrlq (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: psrlq $7, %mm0 # sched: [1:1.00]		; SLM-NEXT: psrlq $7, %mm0 # sched: [1:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_psrlq:		; SANDY-LABEL: test_psrlq:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: psrlq %mm1, %mm0 # sched: [1:1.00]		; SANDY-NEXT: psrlq %mm1, %mm0 # sched: [1:1.00]
; SANDY-NEXT: psrlq (%rdi), %mm0 # sched: [5:1.00]		; SANDY-NEXT: psrlq (%rdi), %mm0 # sched: [6:1.00]
; SANDY-NEXT: psrlq $7, %mm0 # sched: [1:1.00]		; SANDY-NEXT: psrlq $7, %mm0 # sched: [1:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psrlq:		; HASWELL-LABEL: test_psrlq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: psrlq %mm1, %mm0 # sched: [1:1.00]		; HASWELL-NEXT: psrlq %mm1, %mm0 # sched: [1:1.00]
; HASWELL-NEXT: psrlq (%rdi), %mm0 # sched: [6:1.00]		; HASWELL-NEXT: psrlq (%rdi), %mm0 # sched: [6:1.00]
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
}		}
declare x86_mmx @llvm.x86.mmx.psrl.q(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.psrl.q(x86_mmx, x86_mmx) nounwind readnone
declare x86_mmx @llvm.x86.mmx.psrli.q(x86_mmx, i32) nounwind readnone		declare x86_mmx @llvm.x86.mmx.psrli.q(x86_mmx, i32) nounwind readnone

define i64 @test_psrlw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_psrlw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_psrlw:		; GENERIC-LABEL: test_psrlw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: psrlw %mm1, %mm0 # sched: [1:1.00]		; GENERIC-NEXT: psrlw %mm1, %mm0 # sched: [1:1.00]
; GENERIC-NEXT: psrlw (%rdi), %mm0 # sched: [5:1.00]		; GENERIC-NEXT: psrlw (%rdi), %mm0 # sched: [6:1.00]
; GENERIC-NEXT: psrlw $7, %mm0 # sched: [1:1.00]		; GENERIC-NEXT: psrlw $7, %mm0 # sched: [1:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_psrlw:		; ATOM-LABEL: test_psrlw:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: psrlw %mm1, %mm0 # sched: [2:1.00]		; ATOM-NEXT: psrlw %mm1, %mm0 # sched: [2:1.00]
; ATOM-NEXT: psrlw (%rdi), %mm0 # sched: [3:1.50]		; ATOM-NEXT: psrlw (%rdi), %mm0 # sched: [3:1.50]
; ATOM-NEXT: psrlw $7, %mm0 # sched: [1:0.50]		; ATOM-NEXT: psrlw $7, %mm0 # sched: [1:0.50]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_psrlw:		; SLM-LABEL: test_psrlw:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: psrlw %mm1, %mm0 # sched: [1:1.00]		; SLM-NEXT: psrlw %mm1, %mm0 # sched: [1:1.00]
; SLM-NEXT: psrlw (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: psrlw (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: psrlw $7, %mm0 # sched: [1:1.00]		; SLM-NEXT: psrlw $7, %mm0 # sched: [1:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_psrlw:		; SANDY-LABEL: test_psrlw:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: psrlw %mm1, %mm0 # sched: [1:1.00]		; SANDY-NEXT: psrlw %mm1, %mm0 # sched: [1:1.00]
; SANDY-NEXT: psrlw (%rdi), %mm0 # sched: [5:1.00]		; SANDY-NEXT: psrlw (%rdi), %mm0 # sched: [6:1.00]
; SANDY-NEXT: psrlw $7, %mm0 # sched: [1:1.00]		; SANDY-NEXT: psrlw $7, %mm0 # sched: [1:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psrlw:		; HASWELL-LABEL: test_psrlw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: psrlw %mm1, %mm0 # sched: [1:1.00]		; HASWELL-NEXT: psrlw %mm1, %mm0 # sched: [1:1.00]
; HASWELL-NEXT: psrlw (%rdi), %mm0 # sched: [6:1.00]		; HASWELL-NEXT: psrlw (%rdi), %mm0 # sched: [6:1.00]
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
}		}
declare x86_mmx @llvm.x86.mmx.psrl.w(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.psrl.w(x86_mmx, x86_mmx) nounwind readnone
declare x86_mmx @llvm.x86.mmx.psrli.w(x86_mmx, i32) nounwind readnone		declare x86_mmx @llvm.x86.mmx.psrli.w(x86_mmx, i32) nounwind readnone

define i64 @test_psubb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_psubb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_psubb:		; GENERIC-LABEL: test_psubb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: psubb %mm1, %mm0 # sched: [3:1.00]		; GENERIC-NEXT: psubb %mm1, %mm0 # sched: [3:1.00]
; GENERIC-NEXT: psubb (%rdi), %mm0 # sched: [7:1.00]		; GENERIC-NEXT: psubb (%rdi), %mm0 # sched: [8:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_psubb:		; ATOM-LABEL: test_psubb:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: psubb %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: psubb %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: psubb (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: psubb (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_psubb:		; SLM-LABEL: test_psubb:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: psubb %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: psubb %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: psubb (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: psubb (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_psubb:		; SANDY-LABEL: test_psubb:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: psubb %mm1, %mm0 # sched: [3:1.00]		; SANDY-NEXT: psubb %mm1, %mm0 # sched: [3:1.00]
; SANDY-NEXT: psubb (%rdi), %mm0 # sched: [7:1.00]		; SANDY-NEXT: psubb (%rdi), %mm0 # sched: [8:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psubb:		; HASWELL-LABEL: test_psubb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: psubb %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: psubb %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: psubb (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: psubb (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.psub.b(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.psub.b(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_psubd(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_psubd(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_psubd:		; GENERIC-LABEL: test_psubd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: psubd %mm1, %mm0 # sched: [3:1.00]		; GENERIC-NEXT: psubd %mm1, %mm0 # sched: [3:1.00]
; GENERIC-NEXT: psubd (%rdi), %mm0 # sched: [7:1.00]		; GENERIC-NEXT: psubd (%rdi), %mm0 # sched: [8:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_psubd:		; ATOM-LABEL: test_psubd:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: psubd %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: psubd %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: psubd (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: psubd (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_psubd:		; SLM-LABEL: test_psubd:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: psubd %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: psubd %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: psubd (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: psubd (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_psubd:		; SANDY-LABEL: test_psubd:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: psubd %mm1, %mm0 # sched: [3:1.00]		; SANDY-NEXT: psubd %mm1, %mm0 # sched: [3:1.00]
; SANDY-NEXT: psubd (%rdi), %mm0 # sched: [7:1.00]		; SANDY-NEXT: psubd (%rdi), %mm0 # sched: [8:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psubd:		; HASWELL-LABEL: test_psubd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: psubd %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: psubd %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: psubd (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: psubd (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.psub.d(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.psub.d(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_psubq(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_psubq(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_psubq:		; GENERIC-LABEL: test_psubq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: psubq %mm1, %mm0 # sched: [3:1.00]		; GENERIC-NEXT: psubq %mm1, %mm0 # sched: [3:1.00]
; GENERIC-NEXT: psubq (%rdi), %mm0 # sched: [7:1.00]		; GENERIC-NEXT: psubq (%rdi), %mm0 # sched: [8:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_psubq:		; ATOM-LABEL: test_psubq:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: psubq %mm1, %mm0 # sched: [2:1.00]		; ATOM-NEXT: psubq %mm1, %mm0 # sched: [2:1.00]
; ATOM-NEXT: psubq (%rdi), %mm0 # sched: [3:1.50]		; ATOM-NEXT: psubq (%rdi), %mm0 # sched: [3:1.50]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_psubq:		; SLM-LABEL: test_psubq:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: psubq %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: psubq %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: psubq (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: psubq (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_psubq:		; SANDY-LABEL: test_psubq:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: psubq %mm1, %mm0 # sched: [3:1.00]		; SANDY-NEXT: psubq %mm1, %mm0 # sched: [3:1.00]
; SANDY-NEXT: psubq (%rdi), %mm0 # sched: [7:1.00]		; SANDY-NEXT: psubq (%rdi), %mm0 # sched: [8:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psubq:		; HASWELL-LABEL: test_psubq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: psubq %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: psubq %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: psubq (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: psubq (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.psub.q(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.psub.q(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_psubsb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_psubsb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_psubsb:		; GENERIC-LABEL: test_psubsb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: psubsb %mm1, %mm0 # sched: [3:1.00]		; GENERIC-NEXT: psubsb %mm1, %mm0 # sched: [3:1.00]
; GENERIC-NEXT: psubsb (%rdi), %mm0 # sched: [7:1.00]		; GENERIC-NEXT: psubsb (%rdi), %mm0 # sched: [8:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_psubsb:		; ATOM-LABEL: test_psubsb:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: psubsb %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: psubsb %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: psubsb (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: psubsb (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_psubsb:		; SLM-LABEL: test_psubsb:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: psubsb %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: psubsb %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: psubsb (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: psubsb (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_psubsb:		; SANDY-LABEL: test_psubsb:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: psubsb %mm1, %mm0 # sched: [3:1.00]		; SANDY-NEXT: psubsb %mm1, %mm0 # sched: [3:1.00]
; SANDY-NEXT: psubsb (%rdi), %mm0 # sched: [7:1.00]		; SANDY-NEXT: psubsb (%rdi), %mm0 # sched: [8:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psubsb:		; HASWELL-LABEL: test_psubsb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: psubsb %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: psubsb %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: psubsb (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: psubsb (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.psubs.b(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.psubs.b(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_psubsw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_psubsw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_psubsw:		; GENERIC-LABEL: test_psubsw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: psubsw %mm1, %mm0 # sched: [3:1.00]		; GENERIC-NEXT: psubsw %mm1, %mm0 # sched: [3:1.00]
; GENERIC-NEXT: psubsw (%rdi), %mm0 # sched: [7:1.00]		; GENERIC-NEXT: psubsw (%rdi), %mm0 # sched: [8:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_psubsw:		; ATOM-LABEL: test_psubsw:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: psubsw %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: psubsw %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: psubsw (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: psubsw (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_psubsw:		; SLM-LABEL: test_psubsw:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: psubsw %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: psubsw %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: psubsw (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: psubsw (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_psubsw:		; SANDY-LABEL: test_psubsw:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: psubsw %mm1, %mm0 # sched: [3:1.00]		; SANDY-NEXT: psubsw %mm1, %mm0 # sched: [3:1.00]
; SANDY-NEXT: psubsw (%rdi), %mm0 # sched: [7:1.00]		; SANDY-NEXT: psubsw (%rdi), %mm0 # sched: [8:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psubsw:		; HASWELL-LABEL: test_psubsw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: psubsw %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: psubsw %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: psubsw (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: psubsw (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.psubs.w(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.psubs.w(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_psubusb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_psubusb(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_psubusb:		; GENERIC-LABEL: test_psubusb:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: psubusb %mm1, %mm0 # sched: [3:1.00]		; GENERIC-NEXT: psubusb %mm1, %mm0 # sched: [3:1.00]
; GENERIC-NEXT: psubusb (%rdi), %mm0 # sched: [7:1.00]		; GENERIC-NEXT: psubusb (%rdi), %mm0 # sched: [8:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_psubusb:		; ATOM-LABEL: test_psubusb:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: psubusb %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: psubusb %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: psubusb (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: psubusb (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_psubusb:		; SLM-LABEL: test_psubusb:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: psubusb %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: psubusb %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: psubusb (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: psubusb (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_psubusb:		; SANDY-LABEL: test_psubusb:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: psubusb %mm1, %mm0 # sched: [3:1.00]		; SANDY-NEXT: psubusb %mm1, %mm0 # sched: [3:1.00]
; SANDY-NEXT: psubusb (%rdi), %mm0 # sched: [7:1.00]		; SANDY-NEXT: psubusb (%rdi), %mm0 # sched: [8:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psubusb:		; HASWELL-LABEL: test_psubusb:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: psubusb %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: psubusb %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: psubusb (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: psubusb (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.psubus.b(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.psubus.b(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_psubusw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_psubusw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_psubusw:		; GENERIC-LABEL: test_psubusw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: psubusw %mm1, %mm0 # sched: [3:1.00]		; GENERIC-NEXT: psubusw %mm1, %mm0 # sched: [3:1.00]
; GENERIC-NEXT: psubusw (%rdi), %mm0 # sched: [7:1.00]		; GENERIC-NEXT: psubusw (%rdi), %mm0 # sched: [8:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_psubusw:		; ATOM-LABEL: test_psubusw:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: psubusw %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: psubusw %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: psubusw (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: psubusw (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_psubusw:		; SLM-LABEL: test_psubusw:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: psubusw %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: psubusw %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: psubusw (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: psubusw (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_psubusw:		; SANDY-LABEL: test_psubusw:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: psubusw %mm1, %mm0 # sched: [3:1.00]		; SANDY-NEXT: psubusw %mm1, %mm0 # sched: [3:1.00]
; SANDY-NEXT: psubusw (%rdi), %mm0 # sched: [7:1.00]		; SANDY-NEXT: psubusw (%rdi), %mm0 # sched: [8:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psubusw:		; HASWELL-LABEL: test_psubusw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: psubusw %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: psubusw %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: psubusw (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: psubusw (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.psubus.w(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.psubus.w(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_psubw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_psubw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_psubw:		; GENERIC-LABEL: test_psubw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: psubw %mm1, %mm0 # sched: [3:1.00]		; GENERIC-NEXT: psubw %mm1, %mm0 # sched: [3:1.00]
; GENERIC-NEXT: psubw (%rdi), %mm0 # sched: [7:1.00]		; GENERIC-NEXT: psubw (%rdi), %mm0 # sched: [8:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_psubw:		; ATOM-LABEL: test_psubw:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: psubw %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: psubw %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: psubw (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: psubw (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_psubw:		; SLM-LABEL: test_psubw:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: psubw %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: psubw %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: psubw (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: psubw (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_psubw:		; SANDY-LABEL: test_psubw:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: psubw %mm1, %mm0 # sched: [3:1.00]		; SANDY-NEXT: psubw %mm1, %mm0 # sched: [3:1.00]
; SANDY-NEXT: psubw (%rdi), %mm0 # sched: [7:1.00]		; SANDY-NEXT: psubw (%rdi), %mm0 # sched: [8:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_psubw:		; HASWELL-LABEL: test_psubw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: psubw %mm1, %mm0 # sched: [1:0.50]		; HASWELL-NEXT: psubw %mm1, %mm0 # sched: [1:0.50]
; HASWELL-NEXT: psubw (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: psubw (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.psub.w(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.psub.w(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_punpckhbw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_punpckhbw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_punpckhbw:		; GENERIC-LABEL: test_punpckhbw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: punpckhbw %mm1, %mm0 # mm0 = mm0[4],mm1[4],mm0[5],mm1[5],mm0[6],mm1[6],mm0[7],mm1[7] sched: [1:1.00]		; GENERIC-NEXT: punpckhbw %mm1, %mm0 # mm0 = mm0[4],mm1[4],mm0[5],mm1[5],mm0[6],mm1[6],mm0[7],mm1[7] sched: [1:1.00]
; GENERIC-NEXT: punpckhbw (%rdi), %mm0 # mm0 = mm0[4],mem[4],mm0[5],mem[5],mm0[6],mem[6],mm0[7],mem[7] sched: [5:1.00]		; GENERIC-NEXT: punpckhbw (%rdi), %mm0 # mm0 = mm0[4],mem[4],mm0[5],mem[5],mm0[6],mem[6],mm0[7],mem[7] sched: [6:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_punpckhbw:		; ATOM-LABEL: test_punpckhbw:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: punpckhbw %mm1, %mm0 # mm0 = mm0[4],mm1[4],mm0[5],mm1[5],mm0[6],mm1[6],mm0[7],mm1[7] sched: [1:0.50]		; ATOM-NEXT: punpckhbw %mm1, %mm0 # mm0 = mm0[4],mm1[4],mm0[5],mm1[5],mm0[6],mm1[6],mm0[7],mm1[7] sched: [1:0.50]
; ATOM-NEXT: punpckhbw (%rdi), %mm0 # mm0 = mm0[4],mem[4],mm0[5],mem[5],mm0[6],mem[6],mm0[7],mem[7] sched: [1:1.00]		; ATOM-NEXT: punpckhbw (%rdi), %mm0 # mm0 = mm0[4],mem[4],mm0[5],mem[5],mm0[6],mem[6],mm0[7],mem[7] sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_punpckhbw:		; SLM-LABEL: test_punpckhbw:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: punpckhbw %mm1, %mm0 # mm0 = mm0[4],mm1[4],mm0[5],mm1[5],mm0[6],mm1[6],mm0[7],mm1[7] sched: [1:1.00]		; SLM-NEXT: punpckhbw %mm1, %mm0 # mm0 = mm0[4],mm1[4],mm0[5],mm1[5],mm0[6],mm1[6],mm0[7],mm1[7] sched: [1:1.00]
; SLM-NEXT: punpckhbw (%rdi), %mm0 # mm0 = mm0[4],mem[4],mm0[5],mem[5],mm0[6],mem[6],mm0[7],mem[7] sched: [4:1.00]		; SLM-NEXT: punpckhbw (%rdi), %mm0 # mm0 = mm0[4],mem[4],mm0[5],mem[5],mm0[6],mem[6],mm0[7],mem[7] sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_punpckhbw:		; SANDY-LABEL: test_punpckhbw:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: punpckhbw %mm1, %mm0 # mm0 = mm0[4],mm1[4],mm0[5],mm1[5],mm0[6],mm1[6],mm0[7],mm1[7] sched: [1:1.00]		; SANDY-NEXT: punpckhbw %mm1, %mm0 # mm0 = mm0[4],mm1[4],mm0[5],mm1[5],mm0[6],mm1[6],mm0[7],mm1[7] sched: [1:1.00]
; SANDY-NEXT: punpckhbw (%rdi), %mm0 # mm0 = mm0[4],mem[4],mm0[5],mem[5],mm0[6],mem[6],mm0[7],mem[7] sched: [5:1.00]		; SANDY-NEXT: punpckhbw (%rdi), %mm0 # mm0 = mm0[4],mem[4],mm0[5],mem[5],mm0[6],mem[6],mm0[7],mem[7] sched: [6:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_punpckhbw:		; HASWELL-LABEL: test_punpckhbw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: punpckhbw %mm1, %mm0 # mm0 = mm0[4],mm1[4],mm0[5],mm1[5],mm0[6],mm1[6],mm0[7],mm1[7] sched: [1:1.00]		; HASWELL-NEXT: punpckhbw %mm1, %mm0 # mm0 = mm0[4],mm1[4],mm0[5],mm1[5],mm0[6],mm1[6],mm0[7],mm1[7] sched: [1:1.00]
; HASWELL-NEXT: punpckhbw (%rdi), %mm0 # mm0 = mm0[4],mem[4],mm0[5],mem[5],mm0[6],mem[6],mm0[7],mem[7] sched: [6:1.00]		; HASWELL-NEXT: punpckhbw (%rdi), %mm0 # mm0 = mm0[4],mem[4],mm0[5],mem[5],mm0[6],mem[6],mm0[7],mem[7] sched: [6:1.00]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.punpckhbw(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.punpckhbw(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_punpckhdq(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_punpckhdq(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_punpckhdq:		; GENERIC-LABEL: test_punpckhdq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: punpckhdq %mm1, %mm0 # mm0 = mm0[1],mm1[1] sched: [1:1.00]		; GENERIC-NEXT: punpckhdq %mm1, %mm0 # mm0 = mm0[1],mm1[1] sched: [1:1.00]
; GENERIC-NEXT: punpckhdq (%rdi), %mm0 # mm0 = mm0[1],mem[1] sched: [5:1.00]		; GENERIC-NEXT: punpckhdq (%rdi), %mm0 # mm0 = mm0[1],mem[1] sched: [6:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_punpckhdq:		; ATOM-LABEL: test_punpckhdq:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: punpckhdq %mm1, %mm0 # mm0 = mm0[1],mm1[1] sched: [1:0.50]		; ATOM-NEXT: punpckhdq %mm1, %mm0 # mm0 = mm0[1],mm1[1] sched: [1:0.50]
; ATOM-NEXT: punpckhdq (%rdi), %mm0 # mm0 = mm0[1],mem[1] sched: [1:1.00]		; ATOM-NEXT: punpckhdq (%rdi), %mm0 # mm0 = mm0[1],mem[1] sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_punpckhdq:		; SLM-LABEL: test_punpckhdq:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: punpckhdq %mm1, %mm0 # mm0 = mm0[1],mm1[1] sched: [1:1.00]		; SLM-NEXT: punpckhdq %mm1, %mm0 # mm0 = mm0[1],mm1[1] sched: [1:1.00]
; SLM-NEXT: punpckhdq (%rdi), %mm0 # mm0 = mm0[1],mem[1] sched: [4:1.00]		; SLM-NEXT: punpckhdq (%rdi), %mm0 # mm0 = mm0[1],mem[1] sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_punpckhdq:		; SANDY-LABEL: test_punpckhdq:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: punpckhdq %mm1, %mm0 # mm0 = mm0[1],mm1[1] sched: [1:1.00]		; SANDY-NEXT: punpckhdq %mm1, %mm0 # mm0 = mm0[1],mm1[1] sched: [1:1.00]
; SANDY-NEXT: punpckhdq (%rdi), %mm0 # mm0 = mm0[1],mem[1] sched: [5:1.00]		; SANDY-NEXT: punpckhdq (%rdi), %mm0 # mm0 = mm0[1],mem[1] sched: [6:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_punpckhdq:		; HASWELL-LABEL: test_punpckhdq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: punpckhdq %mm1, %mm0 # mm0 = mm0[1],mm1[1] sched: [1:1.00]		; HASWELL-NEXT: punpckhdq %mm1, %mm0 # mm0 = mm0[1],mm1[1] sched: [1:1.00]
; HASWELL-NEXT: punpckhdq (%rdi), %mm0 # mm0 = mm0[1],mem[1] sched: [6:1.00]		; HASWELL-NEXT: punpckhdq (%rdi), %mm0 # mm0 = mm0[1],mem[1] sched: [6:1.00]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.punpckhdq(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.punpckhdq(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_punpckhwd(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_punpckhwd(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_punpckhwd:		; GENERIC-LABEL: test_punpckhwd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: punpckhwd %mm1, %mm0 # mm0 = mm0[2],mm1[2],mm0[3],mm1[3] sched: [1:1.00]		; GENERIC-NEXT: punpckhwd %mm1, %mm0 # mm0 = mm0[2],mm1[2],mm0[3],mm1[3] sched: [1:1.00]
; GENERIC-NEXT: punpckhwd (%rdi), %mm0 # mm0 = mm0[2],mem[2],mm0[3],mem[3] sched: [5:1.00]		; GENERIC-NEXT: punpckhwd (%rdi), %mm0 # mm0 = mm0[2],mem[2],mm0[3],mem[3] sched: [6:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_punpckhwd:		; ATOM-LABEL: test_punpckhwd:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: punpckhwd %mm1, %mm0 # mm0 = mm0[2],mm1[2],mm0[3],mm1[3] sched: [1:0.50]		; ATOM-NEXT: punpckhwd %mm1, %mm0 # mm0 = mm0[2],mm1[2],mm0[3],mm1[3] sched: [1:0.50]
; ATOM-NEXT: punpckhwd (%rdi), %mm0 # mm0 = mm0[2],mem[2],mm0[3],mem[3] sched: [1:1.00]		; ATOM-NEXT: punpckhwd (%rdi), %mm0 # mm0 = mm0[2],mem[2],mm0[3],mem[3] sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_punpckhwd:		; SLM-LABEL: test_punpckhwd:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: punpckhwd %mm1, %mm0 # mm0 = mm0[2],mm1[2],mm0[3],mm1[3] sched: [1:1.00]		; SLM-NEXT: punpckhwd %mm1, %mm0 # mm0 = mm0[2],mm1[2],mm0[3],mm1[3] sched: [1:1.00]
; SLM-NEXT: punpckhwd (%rdi), %mm0 # mm0 = mm0[2],mem[2],mm0[3],mem[3] sched: [4:1.00]		; SLM-NEXT: punpckhwd (%rdi), %mm0 # mm0 = mm0[2],mem[2],mm0[3],mem[3] sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_punpckhwd:		; SANDY-LABEL: test_punpckhwd:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: punpckhwd %mm1, %mm0 # mm0 = mm0[2],mm1[2],mm0[3],mm1[3] sched: [1:1.00]		; SANDY-NEXT: punpckhwd %mm1, %mm0 # mm0 = mm0[2],mm1[2],mm0[3],mm1[3] sched: [1:1.00]
; SANDY-NEXT: punpckhwd (%rdi), %mm0 # mm0 = mm0[2],mem[2],mm0[3],mem[3] sched: [5:1.00]		; SANDY-NEXT: punpckhwd (%rdi), %mm0 # mm0 = mm0[2],mem[2],mm0[3],mem[3] sched: [6:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_punpckhwd:		; HASWELL-LABEL: test_punpckhwd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: punpckhwd %mm1, %mm0 # mm0 = mm0[2],mm1[2],mm0[3],mm1[3] sched: [1:1.00]		; HASWELL-NEXT: punpckhwd %mm1, %mm0 # mm0 = mm0[2],mm1[2],mm0[3],mm1[3] sched: [1:1.00]
; HASWELL-NEXT: punpckhwd (%rdi), %mm0 # mm0 = mm0[2],mem[2],mm0[3],mem[3] sched: [6:1.00]		; HASWELL-NEXT: punpckhwd (%rdi), %mm0 # mm0 = mm0[2],mem[2],mm0[3],mem[3] sched: [6:1.00]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.punpckhwd(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.punpckhwd(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_punpcklbw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_punpcklbw(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_punpcklbw:		; GENERIC-LABEL: test_punpcklbw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: punpcklbw %mm1, %mm0 # mm0 = mm0[0],mm1[0],mm0[1],mm1[1],mm0[2],mm1[2],mm0[3],mm1[3] sched: [1:1.00]		; GENERIC-NEXT: punpcklbw %mm1, %mm0 # mm0 = mm0[0],mm1[0],mm0[1],mm1[1],mm0[2],mm1[2],mm0[3],mm1[3] sched: [1:1.00]
; GENERIC-NEXT: punpcklbw (%rdi), %mm0 # mm0 = mm0[0],mem[0],mm0[1],mem[1],mm0[2],mem[2],mm0[3],mem[3] sched: [5:1.00]		; GENERIC-NEXT: punpcklbw (%rdi), %mm0 # mm0 = mm0[0],mem[0],mm0[1],mem[1],mm0[2],mem[2],mm0[3],mem[3] sched: [6:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_punpcklbw:		; ATOM-LABEL: test_punpcklbw:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: punpcklbw %mm1, %mm0 # mm0 = mm0[0],mm1[0],mm0[1],mm1[1],mm0[2],mm1[2],mm0[3],mm1[3] sched: [1:1.00]		; ATOM-NEXT: punpcklbw %mm1, %mm0 # mm0 = mm0[0],mm1[0],mm0[1],mm1[1],mm0[2],mm1[2],mm0[3],mm1[3] sched: [1:1.00]
; ATOM-NEXT: punpcklbw (%rdi), %mm0 # mm0 = mm0[0],mem[0],mm0[1],mem[1],mm0[2],mem[2],mm0[3],mem[3] sched: [1:1.00]		; ATOM-NEXT: punpcklbw (%rdi), %mm0 # mm0 = mm0[0],mem[0],mm0[1],mem[1],mm0[2],mem[2],mm0[3],mem[3] sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_punpcklbw:		; SLM-LABEL: test_punpcklbw:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: punpcklbw %mm1, %mm0 # mm0 = mm0[0],mm1[0],mm0[1],mm1[1],mm0[2],mm1[2],mm0[3],mm1[3] sched: [1:1.00]		; SLM-NEXT: punpcklbw %mm1, %mm0 # mm0 = mm0[0],mm1[0],mm0[1],mm1[1],mm0[2],mm1[2],mm0[3],mm1[3] sched: [1:1.00]
; SLM-NEXT: punpcklbw (%rdi), %mm0 # mm0 = mm0[0],mem[0],mm0[1],mem[1],mm0[2],mem[2],mm0[3],mem[3] sched: [4:1.00]		; SLM-NEXT: punpcklbw (%rdi), %mm0 # mm0 = mm0[0],mem[0],mm0[1],mem[1],mm0[2],mem[2],mm0[3],mem[3] sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_punpcklbw:		; SANDY-LABEL: test_punpcklbw:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: punpcklbw %mm1, %mm0 # mm0 = mm0[0],mm1[0],mm0[1],mm1[1],mm0[2],mm1[2],mm0[3],mm1[3] sched: [1:1.00]		; SANDY-NEXT: punpcklbw %mm1, %mm0 # mm0 = mm0[0],mm1[0],mm0[1],mm1[1],mm0[2],mm1[2],mm0[3],mm1[3] sched: [1:1.00]
; SANDY-NEXT: punpcklbw (%rdi), %mm0 # mm0 = mm0[0],mem[0],mm0[1],mem[1],mm0[2],mem[2],mm0[3],mem[3] sched: [5:1.00]		; SANDY-NEXT: punpcklbw (%rdi), %mm0 # mm0 = mm0[0],mem[0],mm0[1],mem[1],mm0[2],mem[2],mm0[3],mem[3] sched: [6:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_punpcklbw:		; HASWELL-LABEL: test_punpcklbw:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: punpcklbw %mm1, %mm0 # mm0 = mm0[0],mm1[0],mm0[1],mm1[1],mm0[2],mm1[2],mm0[3],mm1[3] sched: [1:1.00]		; HASWELL-NEXT: punpcklbw %mm1, %mm0 # mm0 = mm0[0],mm1[0],mm0[1],mm1[1],mm0[2],mm1[2],mm0[3],mm1[3] sched: [1:1.00]
; HASWELL-NEXT: punpcklbw (%rdi), %mm0 # mm0 = mm0[0],mem[0],mm0[1],mem[1],mm0[2],mem[2],mm0[3],mem[3] sched: [6:1.00]		; HASWELL-NEXT: punpcklbw (%rdi), %mm0 # mm0 = mm0[0],mem[0],mm0[1],mem[1],mm0[2],mem[2],mm0[3],mem[3] sched: [6:1.00]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.punpcklbw(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.punpcklbw(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_punpckldq(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_punpckldq(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_punpckldq:		; GENERIC-LABEL: test_punpckldq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: punpckldq %mm1, %mm0 # mm0 = mm0[0],mm1[0] sched: [1:1.00]		; GENERIC-NEXT: punpckldq %mm1, %mm0 # mm0 = mm0[0],mm1[0] sched: [1:1.00]
; GENERIC-NEXT: punpckldq (%rdi), %mm0 # mm0 = mm0[0],mem[0] sched: [5:1.00]		; GENERIC-NEXT: punpckldq (%rdi), %mm0 # mm0 = mm0[0],mem[0] sched: [6:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_punpckldq:		; ATOM-LABEL: test_punpckldq:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: punpckldq %mm1, %mm0 # mm0 = mm0[0],mm1[0] sched: [1:1.00]		; ATOM-NEXT: punpckldq %mm1, %mm0 # mm0 = mm0[0],mm1[0] sched: [1:1.00]
; ATOM-NEXT: punpckldq (%rdi), %mm0 # mm0 = mm0[0],mem[0] sched: [1:1.00]		; ATOM-NEXT: punpckldq (%rdi), %mm0 # mm0 = mm0[0],mem[0] sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_punpckldq:		; SLM-LABEL: test_punpckldq:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: punpckldq %mm1, %mm0 # mm0 = mm0[0],mm1[0] sched: [1:1.00]		; SLM-NEXT: punpckldq %mm1, %mm0 # mm0 = mm0[0],mm1[0] sched: [1:1.00]
; SLM-NEXT: punpckldq (%rdi), %mm0 # mm0 = mm0[0],mem[0] sched: [4:1.00]		; SLM-NEXT: punpckldq (%rdi), %mm0 # mm0 = mm0[0],mem[0] sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_punpckldq:		; SANDY-LABEL: test_punpckldq:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: punpckldq %mm1, %mm0 # mm0 = mm0[0],mm1[0] sched: [1:1.00]		; SANDY-NEXT: punpckldq %mm1, %mm0 # mm0 = mm0[0],mm1[0] sched: [1:1.00]
; SANDY-NEXT: punpckldq (%rdi), %mm0 # mm0 = mm0[0],mem[0] sched: [5:1.00]		; SANDY-NEXT: punpckldq (%rdi), %mm0 # mm0 = mm0[0],mem[0] sched: [6:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_punpckldq:		; HASWELL-LABEL: test_punpckldq:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: punpckldq %mm1, %mm0 # mm0 = mm0[0],mm1[0] sched: [1:1.00]		; HASWELL-NEXT: punpckldq %mm1, %mm0 # mm0 = mm0[0],mm1[0] sched: [1:1.00]
; HASWELL-NEXT: punpckldq (%rdi), %mm0 # mm0 = mm0[0],mem[0] sched: [6:1.00]		; HASWELL-NEXT: punpckldq (%rdi), %mm0 # mm0 = mm0[0],mem[0] sched: [6:1.00]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.punpckldq(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.punpckldq(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_punpcklwd(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_punpcklwd(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_punpcklwd:		; GENERIC-LABEL: test_punpcklwd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: punpcklwd %mm1, %mm0 # mm0 = mm0[0],mm1[0],mm0[1],mm1[1] sched: [1:1.00]		; GENERIC-NEXT: punpcklwd %mm1, %mm0 # mm0 = mm0[0],mm1[0],mm0[1],mm1[1] sched: [1:1.00]
; GENERIC-NEXT: punpcklwd (%rdi), %mm0 # mm0 = mm0[0],mem[0],mm0[1],mem[1] sched: [5:1.00]		; GENERIC-NEXT: punpcklwd (%rdi), %mm0 # mm0 = mm0[0],mem[0],mm0[1],mem[1] sched: [6:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_punpcklwd:		; ATOM-LABEL: test_punpcklwd:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: punpcklwd %mm1, %mm0 # mm0 = mm0[0],mm1[0],mm0[1],mm1[1] sched: [1:1.00]		; ATOM-NEXT: punpcklwd %mm1, %mm0 # mm0 = mm0[0],mm1[0],mm0[1],mm1[1] sched: [1:1.00]
; ATOM-NEXT: punpcklwd (%rdi), %mm0 # mm0 = mm0[0],mem[0],mm0[1],mem[1] sched: [1:1.00]		; ATOM-NEXT: punpcklwd (%rdi), %mm0 # mm0 = mm0[0],mem[0],mm0[1],mem[1] sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_punpcklwd:		; SLM-LABEL: test_punpcklwd:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: punpcklwd %mm1, %mm0 # mm0 = mm0[0],mm1[0],mm0[1],mm1[1] sched: [1:1.00]		; SLM-NEXT: punpcklwd %mm1, %mm0 # mm0 = mm0[0],mm1[0],mm0[1],mm1[1] sched: [1:1.00]
; SLM-NEXT: punpcklwd (%rdi), %mm0 # mm0 = mm0[0],mem[0],mm0[1],mem[1] sched: [4:1.00]		; SLM-NEXT: punpcklwd (%rdi), %mm0 # mm0 = mm0[0],mem[0],mm0[1],mem[1] sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_punpcklwd:		; SANDY-LABEL: test_punpcklwd:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: punpcklwd %mm1, %mm0 # mm0 = mm0[0],mm1[0],mm0[1],mm1[1] sched: [1:1.00]		; SANDY-NEXT: punpcklwd %mm1, %mm0 # mm0 = mm0[0],mm1[0],mm0[1],mm1[1] sched: [1:1.00]
; SANDY-NEXT: punpcklwd (%rdi), %mm0 # mm0 = mm0[0],mem[0],mm0[1],mem[1] sched: [5:1.00]		; SANDY-NEXT: punpcklwd (%rdi), %mm0 # mm0 = mm0[0],mem[0],mm0[1],mem[1] sched: [6:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_punpcklwd:		; HASWELL-LABEL: test_punpcklwd:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: punpcklwd %mm1, %mm0 # mm0 = mm0[0],mm1[0],mm0[1],mm1[1] sched: [1:1.00]		; HASWELL-NEXT: punpcklwd %mm1, %mm0 # mm0 = mm0[0],mm1[0],mm0[1],mm1[1] sched: [1:1.00]
; HASWELL-NEXT: punpcklwd (%rdi), %mm0 # mm0 = mm0[0],mem[0],mm0[1],mem[1] sched: [6:1.00]		; HASWELL-NEXT: punpcklwd (%rdi), %mm0 # mm0 = mm0[0],mem[0],mm0[1],mem[1] sched: [6:1.00]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
Show All 40 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret i64 %4		ret i64 %4
}		}
declare x86_mmx @llvm.x86.mmx.punpcklwd(x86_mmx, x86_mmx) nounwind readnone		declare x86_mmx @llvm.x86.mmx.punpcklwd(x86_mmx, x86_mmx) nounwind readnone

define i64 @test_pxor(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {		define i64 @test_pxor(x86_mmx %a0, x86_mmx %a1, x86_mmx* %a2) optsize {
; GENERIC-LABEL: test_pxor:		; GENERIC-LABEL: test_pxor:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: pxor %mm1, %mm0 # sched: [1:1.00]		; GENERIC-NEXT: pxor %mm1, %mm0 # sched: [1:1.00]
; GENERIC-NEXT: pxor (%rdi), %mm0 # sched: [5:1.00]		; GENERIC-NEXT: pxor (%rdi), %mm0 # sched: [6:1.00]
; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]		; GENERIC-NEXT: movq %mm0, %rax # sched: [1:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_pxor:		; ATOM-LABEL: test_pxor:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: pxor %mm1, %mm0 # sched: [1:0.50]		; ATOM-NEXT: pxor %mm1, %mm0 # sched: [1:0.50]
; ATOM-NEXT: pxor (%rdi), %mm0 # sched: [1:1.00]		; ATOM-NEXT: pxor (%rdi), %mm0 # sched: [1:1.00]
; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]		; ATOM-NEXT: movq %mm0, %rax # sched: [3:3.00]
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_pxor:		; SLM-LABEL: test_pxor:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: pxor %mm1, %mm0 # sched: [1:0.50]		; SLM-NEXT: pxor %mm1, %mm0 # sched: [1:0.50]
; SLM-NEXT: pxor (%rdi), %mm0 # sched: [4:1.00]		; SLM-NEXT: pxor (%rdi), %mm0 # sched: [4:1.00]
; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]		; SLM-NEXT: movq %mm0, %rax # sched: [1:0.50]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_pxor:		; SANDY-LABEL: test_pxor:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: pxor %mm1, %mm0 # sched: [1:1.00]		; SANDY-NEXT: pxor %mm1, %mm0 # sched: [1:1.00]
; SANDY-NEXT: pxor (%rdi), %mm0 # sched: [5:1.00]		; SANDY-NEXT: pxor (%rdi), %mm0 # sched: [6:1.00]
; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]		; SANDY-NEXT: movq %mm0, %rax # sched: [1:0.33]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_pxor:		; HASWELL-LABEL: test_pxor:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: pxor %mm1, %mm0 # sched: [1:0.33]		; HASWELL-NEXT: pxor %mm1, %mm0 # sched: [1:0.33]
; HASWELL-NEXT: pxor (%rdi), %mm0 # sched: [6:0.50]		; HASWELL-NEXT: pxor (%rdi), %mm0 # sched: [6:0.50]
; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]		; HASWELL-NEXT: movq %mm0, %rax # sched: [1:1.00]
▲ Show 20 Lines • Show All 43 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/movbe-schedule.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=x86-64 -mattr=+movbe \| FileCheck %s --check-prefix=CHECK --check-prefix=GENERIC		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=x86-64 -mattr=+movbe \| FileCheck %s --check-prefix=CHECK --check-prefix=GENERIC
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=atom \| FileCheck %s --check-prefix=CHECK --check-prefix=ATOM		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=atom \| FileCheck %s --check-prefix=CHECK --check-prefix=ATOM
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=slm \| FileCheck %s --check-prefix=CHECK --check-prefix=SLM		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=slm \| FileCheck %s --check-prefix=CHECK --check-prefix=SLM
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=haswell \| FileCheck %s --check-prefix=CHECK --check-prefix=HASWELL		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=haswell \| FileCheck %s --check-prefix=CHECK --check-prefix=HASWELL
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=broadwell \| FileCheck %s --check-prefix=CHECK --check-prefix=BROADWELL		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=broadwell \| FileCheck %s --check-prefix=CHECK --check-prefix=BROADWELL
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=skylake \| FileCheck %s --check-prefix=CHECK --check-prefix=SKYLAKE		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=skylake \| FileCheck %s --check-prefix=CHECK --check-prefix=SKYLAKE
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=knl \| FileCheck %s --check-prefix=CHECK --check-prefix=HASWELL		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=knl \| FileCheck %s --check-prefix=CHECK --check-prefix=HASWELL
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=btver2 \| FileCheck %s --check-prefix=CHECK --check-prefix=BTVER2		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=btver2 \| FileCheck %s --check-prefix=CHECK --check-prefix=BTVER2
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=znver1 \| FileCheck %s --check-prefix=CHECK --check-prefix=ZNVER1		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=znver1 \| FileCheck %s --check-prefix=CHECK --check-prefix=ZNVER1

define i16 @test_movbe_i16(i16 %a0, i16 %a1, i16 %a2) {		define i16 @test_movbe_i16(i16 %a0, i16 %a1, i16 %a2) {
; GENERIC-LABEL: test_movbe_i16:		; GENERIC-LABEL: test_movbe_i16:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: movbew (%rdi), %ax # sched: [5:0.50]		; GENERIC-NEXT: movbew (%rdi), %ax # sched: [6:0.50]
; GENERIC-NEXT: movbew %si, (%rdx) # sched: [1:1.00]		; GENERIC-NEXT: movbew %si, (%rdx) # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_movbe_i16:		; ATOM-LABEL: test_movbe_i16:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: movbew (%rdi), %ax # sched: [1:1.00]		; ATOM-NEXT: movbew (%rdi), %ax # sched: [1:1.00]
; ATOM-NEXT: movbew %si, (%rdx) # sched: [1:1.00]		; ATOM-NEXT: movbew %si, (%rdx) # sched: [1:1.00]
; ATOM-NEXT: nop # sched: [1:0.50]		; ATOM-NEXT: nop # sched: [1:0.50]
▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
store i16 %3, i16* %a2, align 2		store i16 %3, i16* %a2, align 2
ret i16 %2		ret i16 %2
}		}
declare i16 @llvm.bswap.i16(i16)		declare i16 @llvm.bswap.i16(i16)

define i32 @test_movbe_i32(i32 %a0, i32 %a1, i32 %a2) {		define i32 @test_movbe_i32(i32 %a0, i32 %a1, i32 %a2) {
; GENERIC-LABEL: test_movbe_i32:		; GENERIC-LABEL: test_movbe_i32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: movbel (%rdi), %eax # sched: [5:0.50]		; GENERIC-NEXT: movbel (%rdi), %eax # sched: [6:0.50]
; GENERIC-NEXT: movbel %esi, (%rdx) # sched: [1:1.00]		; GENERIC-NEXT: movbel %esi, (%rdx) # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_movbe_i32:		; ATOM-LABEL: test_movbe_i32:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: movbel (%rdi), %eax # sched: [1:1.00]		; ATOM-NEXT: movbel (%rdi), %eax # sched: [1:1.00]
; ATOM-NEXT: movbel %esi, (%rdx) # sched: [1:1.00]		; ATOM-NEXT: movbel %esi, (%rdx) # sched: [1:1.00]
; ATOM-NEXT: nop # sched: [1:0.50]		; ATOM-NEXT: nop # sched: [1:0.50]
▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
store i32 %3, i32* %a2, align 2		store i32 %3, i32* %a2, align 2
ret i32 %2		ret i32 %2
}		}
declare i32 @llvm.bswap.i32(i32)		declare i32 @llvm.bswap.i32(i32)

define i64 @test_movbe_i64(i64 %a0, i64 %a1, i64 %a2) {		define i64 @test_movbe_i64(i64 %a0, i64 %a1, i64 %a2) {
; GENERIC-LABEL: test_movbe_i64:		; GENERIC-LABEL: test_movbe_i64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: movbeq (%rdi), %rax # sched: [5:0.50]		; GENERIC-NEXT: movbeq (%rdi), %rax # sched: [6:0.50]
; GENERIC-NEXT: movbeq %rsi, (%rdx) # sched: [1:1.00]		; GENERIC-NEXT: movbeq %rsi, (%rdx) # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_movbe_i64:		; ATOM-LABEL: test_movbe_i64:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: movbeq (%rdi), %rax # sched: [1:1.00]		; ATOM-NEXT: movbeq (%rdi), %rax # sched: [1:1.00]
; ATOM-NEXT: movbeq %rsi, (%rdx) # sched: [1:1.00]		; ATOM-NEXT: movbeq %rsi, (%rdx) # sched: [1:1.00]
; ATOM-NEXT: nop # sched: [1:0.50]		; ATOM-NEXT: nop # sched: [1:0.50]
▲ Show 20 Lines • Show All 47 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/schedule-x86_32.ll

	Show All 36 Lines
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_aaa:			; SANDY-LABEL: test_aaa:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: movb {{[0-9]+}}(%esp), %al # sched: [5:0.50]			; SANDY-NEXT: movb {{[0-9]+}}(%esp), %al # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: aaa # sched: [100:0.33]			; SANDY-NEXT: aaa # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_aaa:			; HASWELL-LABEL: test_aaa:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movb {{[0-9]+}}(%esp), %al # sched: [5:0.50]			; HASWELL-NEXT: movb {{[0-9]+}}(%esp), %al # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: aaa # sched: [100:0.25]			; HASWELL-NEXT: aaa # sched: [100:0.25]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_aad:			; SANDY-LABEL: test_aad:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: movzwl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movzwl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: aad # sched: [100:0.33]			; SANDY-NEXT: aad # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_aad:			; HASWELL-LABEL: test_aad:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movzwl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movzwl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: aad # sched: [100:0.25]			; HASWELL-NEXT: aad # sched: [100:0.25]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_aam:			; SANDY-LABEL: test_aam:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: movb {{[0-9]+}}(%esp), %al # sched: [5:0.50]			; SANDY-NEXT: movb {{[0-9]+}}(%esp), %al # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: aam # sched: [100:0.33]			; SANDY-NEXT: aam # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_aam:			; HASWELL-LABEL: test_aam:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movb {{[0-9]+}}(%esp), %al # sched: [5:0.50]			; HASWELL-NEXT: movb {{[0-9]+}}(%esp), %al # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: aam # sched: [100:0.25]			; HASWELL-NEXT: aam # sched: [100:0.25]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_aas:			; SANDY-LABEL: test_aas:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: movb {{[0-9]+}}(%esp), %al # sched: [5:0.50]			; SANDY-NEXT: movb {{[0-9]+}}(%esp), %al # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: aas # sched: [100:0.33]			; SANDY-NEXT: aas # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_aas:			; HASWELL-LABEL: test_aas:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movb {{[0-9]+}}(%esp), %al # sched: [5:0.50]			; HASWELL-NEXT: movb {{[0-9]+}}(%esp), %al # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: aas # sched: [100:0.25]			; HASWELL-NEXT: aas # sched: [100:0.25]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
	;			;
	; SANDY-LABEL: test_arpl:			; SANDY-LABEL: test_arpl:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: movzwl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movzwl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: arpl %ax, (%ecx) # sched: [100:0.33]			; SANDY-NEXT: arpl %ax, (%ecx) # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_arpl:			; HASWELL-LABEL: test_arpl:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movzwl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movzwl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: arpl %ax, (%ecx) # sched: [100:0.25]			; HASWELL-NEXT: arpl %ax, (%ecx) # sched: [100:0.25]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	▲ Show 20 Lines • Show All 105 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %edx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %edx # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %esi # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %esi # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: bound %ax, (%esi) # sched: [100:0.33]			; SANDY-NEXT: bound %ax, (%esi) # sched: [100:0.33]
	; SANDY-NEXT: bound %ecx, (%edx) # sched: [100:0.33]			; SANDY-NEXT: bound %ecx, (%edx) # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: popl %esi # sched: [6:0.50]			; SANDY-NEXT: popl %esi # sched: [6:0.50]
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_bound:			; HASWELL-LABEL: test_bound:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: pushl %esi # sched: [2:1.00]			; HASWELL-NEXT: pushl %esi # sched: [2:1.00]
	; HASWELL-NEXT: .cfi_def_cfa_offset 8			; HASWELL-NEXT: .cfi_def_cfa_offset 8
	; HASWELL-NEXT: .cfi_offset %esi, -8			; HASWELL-NEXT: .cfi_offset %esi, -8
	; HASWELL-NEXT: movzwl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movzwl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	▲ Show 20 Lines • Show All 115 Lines • ▼ Show 20 Lines
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_daa:			; SANDY-LABEL: test_daa:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: movb {{[0-9]+}}(%esp), %al # sched: [5:0.50]			; SANDY-NEXT: movb {{[0-9]+}}(%esp), %al # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: daa # sched: [100:0.33]			; SANDY-NEXT: daa # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_daa:			; HASWELL-LABEL: test_daa:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movb {{[0-9]+}}(%esp), %al # sched: [5:0.50]			; HASWELL-NEXT: movb {{[0-9]+}}(%esp), %al # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: daa # sched: [100:0.25]			; HASWELL-NEXT: daa # sched: [100:0.25]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	▲ Show 20 Lines • Show All 67 Lines • ▼ Show 20 Lines
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_das:			; SANDY-LABEL: test_das:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: movb {{[0-9]+}}(%esp), %al # sched: [5:0.50]			; SANDY-NEXT: movb {{[0-9]+}}(%esp), %al # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: das # sched: [100:0.33]			; SANDY-NEXT: das # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_das:			; HASWELL-LABEL: test_das:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movb {{[0-9]+}}(%esp), %al # sched: [5:0.50]			; HASWELL-NEXT: movb {{[0-9]+}}(%esp), %al # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: das # sched: [100:0.25]			; HASWELL-NEXT: das # sched: [100:0.25]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	▲ Show 20 Lines • Show All 75 Lines • ▼ Show 20 Lines
	; SANDY-LABEL: test_dec16:			; SANDY-LABEL: test_dec16:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: movzwl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movzwl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: decw %ax # sched: [1:0.33]			; SANDY-NEXT: decw %ax # sched: [1:0.33]
	; SANDY-NEXT: decw (%ecx) # sched: [7:1.00]			; SANDY-NEXT: decw (%ecx) # sched: [7:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_dec16:			; HASWELL-LABEL: test_dec16:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movzwl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movzwl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: decw %ax # sched: [1:0.25]			; HASWELL-NEXT: decw %ax # sched: [1:0.25]
	; HASWELL-NEXT: decw (%ecx) # sched: [7:1.00]			; HASWELL-NEXT: decw (%ecx) # sched: [7:1.00]
	▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines
	; SANDY-LABEL: test_dec32:			; SANDY-LABEL: test_dec32:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: decl %eax # sched: [1:0.33]			; SANDY-NEXT: decl %eax # sched: [1:0.33]
	; SANDY-NEXT: decl (%ecx) # sched: [7:1.00]			; SANDY-NEXT: decl (%ecx) # sched: [7:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_dec32:			; HASWELL-LABEL: test_dec32:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: decl %eax # sched: [1:0.25]			; HASWELL-NEXT: decl %eax # sched: [1:0.25]
	; HASWELL-NEXT: decl (%ecx) # sched: [7:1.00]			; HASWELL-NEXT: decl (%ecx) # sched: [7:1.00]
	▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
	; SANDY-LABEL: test_inc16:			; SANDY-LABEL: test_inc16:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: movzwl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movzwl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: incw %ax # sched: [1:0.33]			; SANDY-NEXT: incw %ax # sched: [1:0.33]
	; SANDY-NEXT: incw (%ecx) # sched: [7:1.00]			; SANDY-NEXT: incw (%ecx) # sched: [7:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_inc16:			; HASWELL-LABEL: test_inc16:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movzwl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movzwl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: incw %ax # sched: [1:0.25]			; HASWELL-NEXT: incw %ax # sched: [1:0.25]
	; HASWELL-NEXT: incw (%ecx) # sched: [7:1.00]			; HASWELL-NEXT: incw (%ecx) # sched: [7:1.00]
	▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines
	; SANDY-LABEL: test_inc32:			; SANDY-LABEL: test_inc32:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: incl %eax # sched: [1:0.33]			; SANDY-NEXT: incl %eax # sched: [1:0.33]
	; SANDY-NEXT: incl (%ecx) # sched: [7:1.00]			; SANDY-NEXT: incl (%ecx) # sched: [7:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_inc32:			; HASWELL-LABEL: test_inc32:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: incl %eax # sched: [1:0.25]			; HASWELL-NEXT: incl %eax # sched: [1:0.25]
	; HASWELL-NEXT: incl (%ecx) # sched: [7:1.00]			; HASWELL-NEXT: incl (%ecx) # sched: [7:1.00]
	▲ Show 20 Lines • Show All 75 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_into:			; SANDY-LABEL: test_into:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: into # sched: [100:0.33]			; SANDY-NEXT: into # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_into:			; HASWELL-LABEL: test_into:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: into # sched: [1:?]			; HASWELL-NEXT: into # sched: [1:?]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 65 Lines • ▼ Show 20 Lines
	;			;
	; SANDY-LABEL: test_jcxz_jecxz:			; SANDY-LABEL: test_jcxz_jecxz:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: JXTGT:			; SANDY-NEXT: JXTGT:
	; SANDY-NEXT: jcxz JXTGT # sched: [2:1.00]			; SANDY-NEXT: jcxz JXTGT # sched: [2:1.00]
	; SANDY-NEXT: jecxz JXTGT # sched: [2:1.00]			; SANDY-NEXT: jecxz JXTGT # sched: [2:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_jcxz_jecxz:			; HASWELL-LABEL: test_jcxz_jecxz:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: JXTGT:			; HASWELL-NEXT: JXTGT:
	; HASWELL-NEXT: jcxz JXTGT # sched: [2:0.50]			; HASWELL-NEXT: jcxz JXTGT # sched: [2:0.50]
	; HASWELL-NEXT: jecxz JXTGT # sched: [2:0.50]			; HASWELL-NEXT: jecxz JXTGT # sched: [2:0.50]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_leave:			; SANDY-LABEL: test_leave:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: leave # sched: [7:0.67]			; SANDY-NEXT: leave # sched: [7:0.67]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_leave:			; HASWELL-LABEL: test_leave:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: leave # sched: [7:0.50]			; HASWELL-NEXT: leave # sched: [7:0.50]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 97 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: popl %gs # sched: [100:0.33]			; SANDY-NEXT: popl %gs # sched: [100:0.33]
	; SANDY-NEXT: pushl %cs # sched: [100:0.33]			; SANDY-NEXT: pushl %cs # sched: [100:0.33]
	; SANDY-NEXT: pushl %ds # sched: [100:0.33]			; SANDY-NEXT: pushl %ds # sched: [100:0.33]
	; SANDY-NEXT: pushl %es # sched: [100:0.33]			; SANDY-NEXT: pushl %es # sched: [100:0.33]
	; SANDY-NEXT: pushl %ss # sched: [100:0.33]			; SANDY-NEXT: pushl %ss # sched: [100:0.33]
	; SANDY-NEXT: pushl %fs # sched: [100:0.33]			; SANDY-NEXT: pushl %fs # sched: [100:0.33]
	; SANDY-NEXT: pushl %gs # sched: [100:0.33]			; SANDY-NEXT: pushl %gs # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_pop_push:			; HASWELL-LABEL: test_pop_push:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: popl %ds # sched: [100:0.25]			; HASWELL-NEXT: popl %ds # sched: [100:0.25]
	; HASWELL-NEXT: popl %es # sched: [100:0.25]			; HASWELL-NEXT: popl %es # sched: [100:0.25]
	; HASWELL-NEXT: popl %ss # sched: [100:0.25]			; HASWELL-NEXT: popl %ss # sched: [100:0.25]
	; HASWELL-NEXT: popl %fs # sched: [100:0.25]			; HASWELL-NEXT: popl %fs # sched: [100:0.25]
	▲ Show 20 Lines • Show All 147 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: popw %ax # sched: [6:0.50]			; SANDY-NEXT: popw %ax # sched: [6:0.50]
	; SANDY-NEXT: popw (%ecx) # sched: [6:0.50]			; SANDY-NEXT: popw (%ecx) # sched: [6:0.50]
	; SANDY-NEXT: pushw %ax # sched: [5:1.00]			; SANDY-NEXT: pushw %ax # sched: [5:1.00]
	; SANDY-NEXT: pushw (%ecx) # sched: [5:1.00]			; SANDY-NEXT: pushw (%ecx) # sched: [5:1.00]
	; SANDY-NEXT: pushw $4095 # imm = 0xFFF			; SANDY-NEXT: pushw $4095 # imm = 0xFFF
	; SANDY-NEXT: # sched: [1:1.00]			; SANDY-NEXT: # sched: [1:1.00]
	; SANDY-NEXT: pushw $7 # sched: [1:1.00]			; SANDY-NEXT: pushw $7 # sched: [1:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_pop_push_16:			; HASWELL-LABEL: test_pop_push_16:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movzwl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movzwl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: popw %ax # sched: [6:0.50]			; HASWELL-NEXT: popw %ax # sched: [6:0.50]
	; HASWELL-NEXT: popw (%ecx) # sched: [7:1.00]			; HASWELL-NEXT: popw (%ecx) # sched: [7:1.00]
	▲ Show 20 Lines • Show All 135 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: popl %eax # sched: [6:0.50]			; SANDY-NEXT: popl %eax # sched: [6:0.50]
	; SANDY-NEXT: popl (%ecx) # sched: [6:0.50]			; SANDY-NEXT: popl (%ecx) # sched: [6:0.50]
	; SANDY-NEXT: pushl %eax # sched: [5:1.00]			; SANDY-NEXT: pushl %eax # sched: [5:1.00]
	; SANDY-NEXT: pushl (%ecx) # sched: [5:1.00]			; SANDY-NEXT: pushl (%ecx) # sched: [5:1.00]
	; SANDY-NEXT: pushl $4095 # imm = 0xFFF			; SANDY-NEXT: pushl $4095 # imm = 0xFFF
	; SANDY-NEXT: # sched: [1:1.00]			; SANDY-NEXT: # sched: [1:1.00]
	; SANDY-NEXT: pushl $7 # sched: [1:1.00]			; SANDY-NEXT: pushl $7 # sched: [1:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_pop_push_32:			; HASWELL-LABEL: test_pop_push_32:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: popl %eax # sched: [6:0.50]			; HASWELL-NEXT: popl %eax # sched: [6:0.50]
	; HASWELL-NEXT: popl (%ecx) # sched: [7:1.00]			; HASWELL-NEXT: popl (%ecx) # sched: [7:1.00]
	▲ Show 20 Lines • Show All 112 Lines • ▼ Show 20 Lines
	; SLM-NEXT: pushal # sched: [1:1.00]			; SLM-NEXT: pushal # sched: [1:1.00]
	; SLM-NEXT: pushfl # sched: [1:1.00]			; SLM-NEXT: pushfl # sched: [1:1.00]
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_popa_popf_pusha_pushf:			; SANDY-LABEL: test_popa_popf_pusha_pushf:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: popal # sched: [4:0.50]			; SANDY-NEXT: popal # sched: [5:0.50]
	; SANDY-NEXT: popfl # sched: [4:0.50]			; SANDY-NEXT: popfl # sched: [5:0.50]
	; SANDY-NEXT: pushal # sched: [1:1.00]			; SANDY-NEXT: pushal # sched: [1:1.00]
	; SANDY-NEXT: pushfl # sched: [1:1.00]			; SANDY-NEXT: pushfl # sched: [1:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_popa_popf_pusha_pushf:			; HASWELL-LABEL: test_popa_popf_pusha_pushf:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: popal # sched: [1:?]			; HASWELL-NEXT: popal # sched: [1:?]
	; HASWELL-NEXT: popfl # sched: [5:0.50]			; HASWELL-NEXT: popfl # sched: [5:0.50]
	; HASWELL-NEXT: pushal # sched: [1:?]			; HASWELL-NEXT: pushal # sched: [1:?]
	; HASWELL-NEXT: pushfl # sched: [1:1.00]			; HASWELL-NEXT: pushfl # sched: [1:1.00]
	▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines
	; SLM-NEXT: lretl $4095 # imm = 0xFFF			; SLM-NEXT: lretl $4095 # imm = 0xFFF
	; SLM-NEXT: # sched: [4:1.00]			; SLM-NEXT: # sched: [4:1.00]
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_ret:			; SANDY-LABEL: test_ret:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	; SANDY-NEXT: retl $4095 # imm = 0xFFF			; SANDY-NEXT: retl $4095 # imm = 0xFFF
	; SANDY-NEXT: # sched: [5:1.00]			; SANDY-NEXT: # sched: [6:1.00]
	; SANDY-NEXT: lretl # sched: [5:1.00]			; SANDY-NEXT: lretl # sched: [6:1.00]
	; SANDY-NEXT: lretl $4095 # imm = 0xFFF			; SANDY-NEXT: lretl $4095 # imm = 0xFFF
	; SANDY-NEXT: # sched: [5:1.00]			; SANDY-NEXT: # sched: [6:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_ret:			; HASWELL-LABEL: test_ret:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	; HASWELL-NEXT: retl $4095 # imm = 0xFFF			; HASWELL-NEXT: retl $4095 # imm = 0xFFF
	; HASWELL-NEXT: # sched: [1:2.00]			; HASWELL-NEXT: # sched: [1:2.00]
	; HASWELL-NEXT: lretl # sched: [6:0.50]			; HASWELL-NEXT: lretl # sched: [6:0.50]
	▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_salc:			; SANDY-LABEL: test_salc:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: salc # sched: [1:0.33]			; SANDY-NEXT: salc # sched: [1:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_salc:			; HASWELL-LABEL: test_salc:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: salc # sched: [1:0.25]			; HASWELL-NEXT: salc # sched: [1:0.25]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 75 Lines • ▼ Show 20 Lines
	; SANDY-LABEL: test_xchg_32:			; SANDY-LABEL: test_xchg_32:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %edx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %edx # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: xchgl %eax, %eax # sched: [1:0.33]			; SANDY-NEXT: xchgl %eax, %eax # sched: [1:0.33]
	; SANDY-NEXT: xchgl %ecx, %eax # sched: [1:0.33]			; SANDY-NEXT: xchgl %ecx, %eax # sched: [1:0.33]
	; SANDY-NEXT: xchgl %eax, (%edx) # sched: [5:1.00]			; SANDY-NEXT: xchgl %eax, (%edx) # sched: [6:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_xchg_32:			; HASWELL-LABEL: test_xchg_32:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %edx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %edx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: xchgl %eax, %eax # sched: [1:0.25]			; HASWELL-NEXT: xchgl %eax, %eax # sched: [1:0.25]
	▲ Show 20 Lines • Show All 67 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/schedule-x86_64.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 4,632 Lines • ▼ Show 20 Lines
; ZNVER1-NEXT: retq # sched: [1:0.50]		; ZNVER1-NEXT: retq # sched: [1:0.50]
tail call void asm "cmpxchgq $0, $1 \0a\09 cmpxchgq $0, $2", "r,r,m"(i64 %a0, i64 %a1, i64 %a2) nounwind		tail call void asm "cmpxchgq $0, $1 \0a\09 cmpxchgq $0, $2", "r,r,m"(i64 %a0, i64 %a1, i64 %a2) nounwind
ret void		ret void
}		}
define void @test_cmpxchg8b_cmpxchg16b(i8 *%a0) optsize {		define void @test_cmpxchg8b_cmpxchg16b(i8 *%a0) optsize {
; GENERIC-LABEL: test_cmpxchg8b_cmpxchg16b:		; GENERIC-LABEL: test_cmpxchg8b_cmpxchg16b:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: cmpxchg8b (%rdi) # sched: [5:1.00]		; GENERIC-NEXT: cmpxchg8b (%rdi) # sched: [6:1.00]
; GENERIC-NEXT: cmpxchg16b (%rdi) # sched: [5:1.00]		; GENERIC-NEXT: cmpxchg16b (%rdi) # sched: [6:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_cmpxchg8b_cmpxchg16b:		; ATOM-LABEL: test_cmpxchg8b_cmpxchg16b:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: #APP		; ATOM-NEXT: #APP
; ATOM-NEXT: cmpxchg8b (%rdi) # sched: [18:9.00]		; ATOM-NEXT: cmpxchg8b (%rdi) # sched: [18:9.00]
; ATOM-NEXT: cmpxchg16b (%rdi) # sched: [22:11.00]		; ATOM-NEXT: cmpxchg16b (%rdi) # sched: [22:11.00]
; ATOM-NEXT: #NO_APP		; ATOM-NEXT: #NO_APP
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_cmpxchg8b_cmpxchg16b:		; SLM-LABEL: test_cmpxchg8b_cmpxchg16b:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: #APP		; SLM-NEXT: #APP
; SLM-NEXT: cmpxchg8b (%rdi) # sched: [4:2.00]		; SLM-NEXT: cmpxchg8b (%rdi) # sched: [4:2.00]
; SLM-NEXT: cmpxchg16b (%rdi) # sched: [4:2.00]		; SLM-NEXT: cmpxchg16b (%rdi) # sched: [4:2.00]
; SLM-NEXT: #NO_APP		; SLM-NEXT: #NO_APP
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_cmpxchg8b_cmpxchg16b:		; SANDY-LABEL: test_cmpxchg8b_cmpxchg16b:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: #APP		; SANDY-NEXT: #APP
; SANDY-NEXT: cmpxchg8b (%rdi) # sched: [5:1.00]		; SANDY-NEXT: cmpxchg8b (%rdi) # sched: [6:1.00]
; SANDY-NEXT: cmpxchg16b (%rdi) # sched: [5:1.00]		; SANDY-NEXT: cmpxchg16b (%rdi) # sched: [6:1.00]
; SANDY-NEXT: #NO_APP		; SANDY-NEXT: #NO_APP
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_cmpxchg8b_cmpxchg16b:		; HASWELL-LABEL: test_cmpxchg8b_cmpxchg16b:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: #APP		; HASWELL-NEXT: #APP
; HASWELL-NEXT: cmpxchg8b (%rdi) # sched: [17:2.75]		; HASWELL-NEXT: cmpxchg8b (%rdi) # sched: [17:2.75]
; HASWELL-NEXT: cmpxchg16b (%rdi) # sched: [22:4.00]		; HASWELL-NEXT: cmpxchg16b (%rdi) # sched: [22:4.00]
▲ Show 20 Lines • Show All 452 Lines • ▼ Show 20 Lines

define void @test_div(i8 %a0, i16 %a1, i32 %a2, i64 %a3, i8 %p0, i16 %p1, i32 %p2, i64 %p3) optsize {		define void @test_div(i8 %a0, i16 %a1, i32 %a2, i64 %a3, i8 %p0, i16 %p1, i32 %p2, i64 %p3) optsize {
; GENERIC-LABEL: test_div:		; GENERIC-LABEL: test_div:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: movq {{[0-9]+}}(%rsp), %r10 # sched: [5:0.50]		; GENERIC-NEXT: movq {{[0-9]+}}(%rsp), %r10 # sched: [5:0.50]
; GENERIC-NEXT: movq {{[0-9]+}}(%rsp), %rax # sched: [5:0.50]		; GENERIC-NEXT: movq {{[0-9]+}}(%rsp), %rax # sched: [5:0.50]
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: divb %dil # sched: [25:10.00]		; GENERIC-NEXT: divb %dil # sched: [25:10.00]
; GENERIC-NEXT: divb (%r8) # sched: [29:10.00]		; GENERIC-NEXT: divb (%r8) # sched: [30:10.00]
; GENERIC-NEXT: divw %si # sched: [25:10.00]		; GENERIC-NEXT: divw %si # sched: [25:10.00]
; GENERIC-NEXT: divw (%r9) # sched: [29:10.00]		; GENERIC-NEXT: divw (%r9) # sched: [30:10.00]
; GENERIC-NEXT: divl %edx # sched: [25:10.00]		; GENERIC-NEXT: divl %edx # sched: [25:10.00]
; GENERIC-NEXT: divl (%rax) # sched: [29:10.00]		; GENERIC-NEXT: divl (%rax) # sched: [30:10.00]
; GENERIC-NEXT: divq %rcx # sched: [25:10.00]		; GENERIC-NEXT: divq %rcx # sched: [25:10.00]
; GENERIC-NEXT: divq (%r10) # sched: [29:10.00]		; GENERIC-NEXT: divq (%r10) # sched: [30:10.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_div:		; ATOM-LABEL: test_div:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: movq {{[0-9]+}}(%rsp), %r10 # sched: [1:1.00]		; ATOM-NEXT: movq {{[0-9]+}}(%rsp), %r10 # sched: [1:1.00]
; ATOM-NEXT: movq {{[0-9]+}}(%rsp), %rax # sched: [1:1.00]		; ATOM-NEXT: movq {{[0-9]+}}(%rsp), %rax # sched: [1:1.00]
; ATOM-NEXT: #APP		; ATOM-NEXT: #APP
Show All 25 Lines
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_div:		; SANDY-LABEL: test_div:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: movq {{[0-9]+}}(%rsp), %r10 # sched: [5:0.50]		; SANDY-NEXT: movq {{[0-9]+}}(%rsp), %r10 # sched: [5:0.50]
; SANDY-NEXT: movq {{[0-9]+}}(%rsp), %rax # sched: [5:0.50]		; SANDY-NEXT: movq {{[0-9]+}}(%rsp), %rax # sched: [5:0.50]
; SANDY-NEXT: #APP		; SANDY-NEXT: #APP
; SANDY-NEXT: divb %dil # sched: [25:10.00]		; SANDY-NEXT: divb %dil # sched: [25:10.00]
; SANDY-NEXT: divb (%r8) # sched: [29:10.00]		; SANDY-NEXT: divb (%r8) # sched: [30:10.00]
; SANDY-NEXT: divw %si # sched: [25:10.00]		; SANDY-NEXT: divw %si # sched: [25:10.00]
; SANDY-NEXT: divw (%r9) # sched: [29:10.00]		; SANDY-NEXT: divw (%r9) # sched: [30:10.00]
; SANDY-NEXT: divl %edx # sched: [25:10.00]		; SANDY-NEXT: divl %edx # sched: [25:10.00]
; SANDY-NEXT: divl (%rax) # sched: [29:10.00]		; SANDY-NEXT: divl (%rax) # sched: [30:10.00]
; SANDY-NEXT: divq %rcx # sched: [25:10.00]		; SANDY-NEXT: divq %rcx # sched: [25:10.00]
; SANDY-NEXT: divq (%r10) # sched: [29:10.00]		; SANDY-NEXT: divq (%r10) # sched: [30:10.00]
; SANDY-NEXT: #NO_APP		; SANDY-NEXT: #NO_APP
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_div:		; HASWELL-LABEL: test_div:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: movq {{[0-9]+}}(%rsp), %r10 # sched: [5:0.50]		; HASWELL-NEXT: movq {{[0-9]+}}(%rsp), %r10 # sched: [5:0.50]
; HASWELL-NEXT: movq {{[0-9]+}}(%rsp), %rax # sched: [5:0.50]		; HASWELL-NEXT: movq {{[0-9]+}}(%rsp), %rax # sched: [5:0.50]
; HASWELL-NEXT: #APP		; HASWELL-NEXT: #APP
▲ Show 20 Lines • Show All 177 Lines • ▼ Show 20 Lines

define void @test_idiv(i8 %a0, i16 %a1, i32 %a2, i64 %a3, i8 %p0, i16 %p1, i32 %p2, i64 %p3) optsize {		define void @test_idiv(i8 %a0, i16 %a1, i32 %a2, i64 %a3, i8 %p0, i16 %p1, i32 %p2, i64 %p3) optsize {
; GENERIC-LABEL: test_idiv:		; GENERIC-LABEL: test_idiv:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: movq {{[0-9]+}}(%rsp), %r10 # sched: [5:0.50]		; GENERIC-NEXT: movq {{[0-9]+}}(%rsp), %r10 # sched: [5:0.50]
; GENERIC-NEXT: movq {{[0-9]+}}(%rsp), %rax # sched: [5:0.50]		; GENERIC-NEXT: movq {{[0-9]+}}(%rsp), %rax # sched: [5:0.50]
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: idivb %dil # sched: [25:10.00]		; GENERIC-NEXT: idivb %dil # sched: [25:10.00]
; GENERIC-NEXT: idivb (%r8) # sched: [29:10.00]		; GENERIC-NEXT: idivb (%r8) # sched: [30:10.00]
; GENERIC-NEXT: idivw %si # sched: [25:10.00]		; GENERIC-NEXT: idivw %si # sched: [25:10.00]
; GENERIC-NEXT: idivw (%r9) # sched: [29:10.00]		; GENERIC-NEXT: idivw (%r9) # sched: [30:10.00]
; GENERIC-NEXT: idivl %edx # sched: [25:10.00]		; GENERIC-NEXT: idivl %edx # sched: [25:10.00]
; GENERIC-NEXT: idivl (%rax) # sched: [29:10.00]		; GENERIC-NEXT: idivl (%rax) # sched: [30:10.00]
; GENERIC-NEXT: idivq %rcx # sched: [25:10.00]		; GENERIC-NEXT: idivq %rcx # sched: [25:10.00]
; GENERIC-NEXT: idivq (%r10) # sched: [29:10.00]		; GENERIC-NEXT: idivq (%r10) # sched: [30:10.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_idiv:		; ATOM-LABEL: test_idiv:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: movq {{[0-9]+}}(%rsp), %r10 # sched: [1:1.00]		; ATOM-NEXT: movq {{[0-9]+}}(%rsp), %r10 # sched: [1:1.00]
; ATOM-NEXT: movq {{[0-9]+}}(%rsp), %rax # sched: [1:1.00]		; ATOM-NEXT: movq {{[0-9]+}}(%rsp), %rax # sched: [1:1.00]
; ATOM-NEXT: #APP		; ATOM-NEXT: #APP
Show All 25 Lines
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_idiv:		; SANDY-LABEL: test_idiv:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: movq {{[0-9]+}}(%rsp), %r10 # sched: [5:0.50]		; SANDY-NEXT: movq {{[0-9]+}}(%rsp), %r10 # sched: [5:0.50]
; SANDY-NEXT: movq {{[0-9]+}}(%rsp), %rax # sched: [5:0.50]		; SANDY-NEXT: movq {{[0-9]+}}(%rsp), %rax # sched: [5:0.50]
; SANDY-NEXT: #APP		; SANDY-NEXT: #APP
; SANDY-NEXT: idivb %dil # sched: [25:10.00]		; SANDY-NEXT: idivb %dil # sched: [25:10.00]
; SANDY-NEXT: idivb (%r8) # sched: [29:10.00]		; SANDY-NEXT: idivb (%r8) # sched: [30:10.00]
; SANDY-NEXT: idivw %si # sched: [25:10.00]		; SANDY-NEXT: idivw %si # sched: [25:10.00]
; SANDY-NEXT: idivw (%r9) # sched: [29:10.00]		; SANDY-NEXT: idivw (%r9) # sched: [30:10.00]
; SANDY-NEXT: idivl %edx # sched: [25:10.00]		; SANDY-NEXT: idivl %edx # sched: [25:10.00]
; SANDY-NEXT: idivl (%rax) # sched: [29:10.00]		; SANDY-NEXT: idivl (%rax) # sched: [30:10.00]
; SANDY-NEXT: idivq %rcx # sched: [25:10.00]		; SANDY-NEXT: idivq %rcx # sched: [25:10.00]
; SANDY-NEXT: idivq (%r10) # sched: [29:10.00]		; SANDY-NEXT: idivq (%r10) # sched: [30:10.00]
; SANDY-NEXT: #NO_APP		; SANDY-NEXT: #NO_APP
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_idiv:		; HASWELL-LABEL: test_idiv:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: movq {{[0-9]+}}(%rsp), %r10 # sched: [5:0.50]		; HASWELL-NEXT: movq {{[0-9]+}}(%rsp), %r10 # sched: [5:0.50]
; HASWELL-NEXT: movq {{[0-9]+}}(%rsp), %rax # sched: [5:0.50]		; HASWELL-NEXT: movq {{[0-9]+}}(%rsp), %rax # sched: [5:0.50]
; HASWELL-NEXT: #APP		; HASWELL-NEXT: #APP
▲ Show 20 Lines • Show All 91 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret void		ret void
}		}

define void @test_imul_8(i8 %a0, i8* %a1) optsize {		define void @test_imul_8(i8 %a0, i8* %a1) optsize {
; GENERIC-LABEL: test_imul_8:		; GENERIC-LABEL: test_imul_8:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: imulb %dil # sched: [3:1.00]		; GENERIC-NEXT: imulb %dil # sched: [3:1.00]
; GENERIC-NEXT: imulb (%rsi) # sched: [7:1.00]		; GENERIC-NEXT: imulb (%rsi) # sched: [8:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_imul_8:		; ATOM-LABEL: test_imul_8:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: #APP		; ATOM-NEXT: #APP
; ATOM-NEXT: imulb %dil # sched: [7:3.50]		; ATOM-NEXT: imulb %dil # sched: [7:3.50]
; ATOM-NEXT: imulb (%rsi) # sched: [7:3.50]		; ATOM-NEXT: imulb (%rsi) # sched: [7:3.50]
; ATOM-NEXT: #NO_APP		; ATOM-NEXT: #NO_APP
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_imul_8:		; SLM-LABEL: test_imul_8:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: #APP		; SLM-NEXT: #APP
; SLM-NEXT: imulb %dil # sched: [3:1.00]		; SLM-NEXT: imulb %dil # sched: [3:1.00]
; SLM-NEXT: imulb (%rsi) # sched: [6:1.00]		; SLM-NEXT: imulb (%rsi) # sched: [6:1.00]
; SLM-NEXT: #NO_APP		; SLM-NEXT: #NO_APP
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_imul_8:		; SANDY-LABEL: test_imul_8:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: #APP		; SANDY-NEXT: #APP
; SANDY-NEXT: imulb %dil # sched: [3:1.00]		; SANDY-NEXT: imulb %dil # sched: [3:1.00]
; SANDY-NEXT: imulb (%rsi) # sched: [7:1.00]		; SANDY-NEXT: imulb (%rsi) # sched: [8:1.00]
; SANDY-NEXT: #NO_APP		; SANDY-NEXT: #NO_APP
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_imul_8:		; HASWELL-LABEL: test_imul_8:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: #APP		; HASWELL-NEXT: #APP
; HASWELL-NEXT: imulb %dil # sched: [3:1.00]		; HASWELL-NEXT: imulb %dil # sched: [3:1.00]
; HASWELL-NEXT: imulb (%rsi) # sched: [8:1.00]		; HASWELL-NEXT: imulb (%rsi) # sched: [8:1.00]
▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
tail call void asm "imulb $0 \0A\09 imulb $1", "r,m"(i8 %a0, i8 %a1) nounwind		tail call void asm "imulb $0 \0A\09 imulb $1", "r,m"(i8 %a0, i8 %a1) nounwind
ret void		ret void
}		}
define void @test_imul_16(i16 %a0, i16* %a1) optsize {		define void @test_imul_16(i16 %a0, i16* %a1) optsize {
; GENERIC-LABEL: test_imul_16:		; GENERIC-LABEL: test_imul_16:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: imulw %di # sched: [3:1.00]		; GENERIC-NEXT: imulw %di # sched: [3:1.00]
; GENERIC-NEXT: imulw (%rsi) # sched: [7:1.00]		; GENERIC-NEXT: imulw (%rsi) # sched: [8:1.00]
; GENERIC-NEXT: imulw %di, %di # sched: [3:1.00]		; GENERIC-NEXT: imulw %di, %di # sched: [3:1.00]
; GENERIC-NEXT: imulw (%rsi), %di # sched: [7:1.00]		; GENERIC-NEXT: imulw (%rsi), %di # sched: [8:1.00]
; GENERIC-NEXT: imulw $511, %di, %di # imm = 0x1FF		; GENERIC-NEXT: imulw $511, %di, %di # imm = 0x1FF
; GENERIC-NEXT: # sched: [3:1.00]		; GENERIC-NEXT: # sched: [3:1.00]
; GENERIC-NEXT: imulw $511, (%rsi), %di # imm = 0x1FF		; GENERIC-NEXT: imulw $511, (%rsi), %di # imm = 0x1FF
; GENERIC-NEXT: # sched: [7:1.00]		; GENERIC-NEXT: # sched: [8:1.00]
; GENERIC-NEXT: imulw $7, %di, %di # sched: [3:1.00]		; GENERIC-NEXT: imulw $7, %di, %di # sched: [3:1.00]
; GENERIC-NEXT: imulw $7, (%rsi), %di # sched: [7:1.00]		; GENERIC-NEXT: imulw $7, (%rsi), %di # sched: [8:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_imul_16:		; ATOM-LABEL: test_imul_16:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: #APP		; ATOM-NEXT: #APP
; ATOM-NEXT: imulw %di # sched: [7:3.50]		; ATOM-NEXT: imulw %di # sched: [7:3.50]
; ATOM-NEXT: imulw (%rsi) # sched: [8:4.00]		; ATOM-NEXT: imulw (%rsi) # sched: [8:4.00]
Show All 23 Lines
; SLM-NEXT: imulw $7, (%rsi), %di # sched: [6:1.00]		; SLM-NEXT: imulw $7, (%rsi), %di # sched: [6:1.00]
; SLM-NEXT: #NO_APP		; SLM-NEXT: #NO_APP
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_imul_16:		; SANDY-LABEL: test_imul_16:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: #APP		; SANDY-NEXT: #APP
; SANDY-NEXT: imulw %di # sched: [3:1.00]		; SANDY-NEXT: imulw %di # sched: [3:1.00]
; SANDY-NEXT: imulw (%rsi) # sched: [7:1.00]		; SANDY-NEXT: imulw (%rsi) # sched: [8:1.00]
; SANDY-NEXT: imulw %di, %di # sched: [3:1.00]		; SANDY-NEXT: imulw %di, %di # sched: [3:1.00]
; SANDY-NEXT: imulw (%rsi), %di # sched: [7:1.00]		; SANDY-NEXT: imulw (%rsi), %di # sched: [8:1.00]
; SANDY-NEXT: imulw $511, %di, %di # imm = 0x1FF		; SANDY-NEXT: imulw $511, %di, %di # imm = 0x1FF
; SANDY-NEXT: # sched: [3:1.00]		; SANDY-NEXT: # sched: [3:1.00]
; SANDY-NEXT: imulw $511, (%rsi), %di # imm = 0x1FF		; SANDY-NEXT: imulw $511, (%rsi), %di # imm = 0x1FF
; SANDY-NEXT: # sched: [7:1.00]		; SANDY-NEXT: # sched: [8:1.00]
; SANDY-NEXT: imulw $7, %di, %di # sched: [3:1.00]		; SANDY-NEXT: imulw $7, %di, %di # sched: [3:1.00]
; SANDY-NEXT: imulw $7, (%rsi), %di # sched: [7:1.00]		; SANDY-NEXT: imulw $7, (%rsi), %di # sched: [8:1.00]
; SANDY-NEXT: #NO_APP		; SANDY-NEXT: #NO_APP
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_imul_16:		; HASWELL-LABEL: test_imul_16:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: #APP		; HASWELL-NEXT: #APP
; HASWELL-NEXT: imulw %di # sched: [4:1.00]		; HASWELL-NEXT: imulw %di # sched: [4:1.00]
; HASWELL-NEXT: imulw (%rsi) # sched: [8:1.00]		; HASWELL-NEXT: imulw (%rsi) # sched: [8:1.00]
▲ Show 20 Lines • Show All 90 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
tail call void asm "imulw $0 \0A\09 imulw $1 \0A\09 imulw $0, $0 \0A\09 imulw $1, $0 \0A\09 imulw $2, $0, $0 \0A\09 imulw $2, $1, $0 \0A\09 imulw $3, $0, $0 \0A\09 imulw $3, $1, $0", "r,m,i,i"(i16 %a0, i16 %a1, i16 511, i8 7) nounwind		tail call void asm "imulw $0 \0A\09 imulw $1 \0A\09 imulw $0, $0 \0A\09 imulw $1, $0 \0A\09 imulw $2, $0, $0 \0A\09 imulw $2, $1, $0 \0A\09 imulw $3, $0, $0 \0A\09 imulw $3, $1, $0", "r,m,i,i"(i16 %a0, i16 %a1, i16 511, i8 7) nounwind
ret void		ret void
}		}
define void @test_imul_32(i32 %a0, i32* %a1) optsize {		define void @test_imul_32(i32 %a0, i32* %a1) optsize {
; GENERIC-LABEL: test_imul_32:		; GENERIC-LABEL: test_imul_32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: imull %edi # sched: [3:1.00]		; GENERIC-NEXT: imull %edi # sched: [3:1.00]
; GENERIC-NEXT: imull (%rsi) # sched: [7:1.00]		; GENERIC-NEXT: imull (%rsi) # sched: [8:1.00]
; GENERIC-NEXT: imull %edi, %edi # sched: [3:1.00]		; GENERIC-NEXT: imull %edi, %edi # sched: [3:1.00]
; GENERIC-NEXT: imull (%rsi), %edi # sched: [7:1.00]		; GENERIC-NEXT: imull (%rsi), %edi # sched: [8:1.00]
; GENERIC-NEXT: imull $665536, %edi, %edi # imm = 0xA27C0		; GENERIC-NEXT: imull $665536, %edi, %edi # imm = 0xA27C0
; GENERIC-NEXT: # sched: [3:1.00]		; GENERIC-NEXT: # sched: [3:1.00]
; GENERIC-NEXT: imull $665536, (%rsi), %edi # imm = 0xA27C0		; GENERIC-NEXT: imull $665536, (%rsi), %edi # imm = 0xA27C0
; GENERIC-NEXT: # sched: [7:1.00]		; GENERIC-NEXT: # sched: [8:1.00]
; GENERIC-NEXT: imull $7, %edi, %edi # sched: [3:1.00]		; GENERIC-NEXT: imull $7, %edi, %edi # sched: [3:1.00]
; GENERIC-NEXT: imull $7, (%rsi), %edi # sched: [7:1.00]		; GENERIC-NEXT: imull $7, (%rsi), %edi # sched: [8:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_imul_32:		; ATOM-LABEL: test_imul_32:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: #APP		; ATOM-NEXT: #APP
; ATOM-NEXT: imull %edi # sched: [6:3.00]		; ATOM-NEXT: imull %edi # sched: [6:3.00]
; ATOM-NEXT: imull (%rsi) # sched: [7:3.50]		; ATOM-NEXT: imull (%rsi) # sched: [7:3.50]
Show All 23 Lines
; SLM-NEXT: imull $7, (%rsi), %edi # sched: [6:1.00]		; SLM-NEXT: imull $7, (%rsi), %edi # sched: [6:1.00]
; SLM-NEXT: #NO_APP		; SLM-NEXT: #NO_APP
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_imul_32:		; SANDY-LABEL: test_imul_32:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: #APP		; SANDY-NEXT: #APP
; SANDY-NEXT: imull %edi # sched: [3:1.00]		; SANDY-NEXT: imull %edi # sched: [3:1.00]
; SANDY-NEXT: imull (%rsi) # sched: [7:1.00]		; SANDY-NEXT: imull (%rsi) # sched: [8:1.00]
; SANDY-NEXT: imull %edi, %edi # sched: [3:1.00]		; SANDY-NEXT: imull %edi, %edi # sched: [3:1.00]
; SANDY-NEXT: imull (%rsi), %edi # sched: [7:1.00]		; SANDY-NEXT: imull (%rsi), %edi # sched: [8:1.00]
; SANDY-NEXT: imull $665536, %edi, %edi # imm = 0xA27C0		; SANDY-NEXT: imull $665536, %edi, %edi # imm = 0xA27C0
; SANDY-NEXT: # sched: [3:1.00]		; SANDY-NEXT: # sched: [3:1.00]
; SANDY-NEXT: imull $665536, (%rsi), %edi # imm = 0xA27C0		; SANDY-NEXT: imull $665536, (%rsi), %edi # imm = 0xA27C0
; SANDY-NEXT: # sched: [7:1.00]		; SANDY-NEXT: # sched: [8:1.00]
; SANDY-NEXT: imull $7, %edi, %edi # sched: [3:1.00]		; SANDY-NEXT: imull $7, %edi, %edi # sched: [3:1.00]
; SANDY-NEXT: imull $7, (%rsi), %edi # sched: [7:1.00]		; SANDY-NEXT: imull $7, (%rsi), %edi # sched: [8:1.00]
; SANDY-NEXT: #NO_APP		; SANDY-NEXT: #NO_APP
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_imul_32:		; HASWELL-LABEL: test_imul_32:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: #APP		; HASWELL-NEXT: #APP
; HASWELL-NEXT: imull %edi # sched: [4:1.00]		; HASWELL-NEXT: imull %edi # sched: [4:1.00]
; HASWELL-NEXT: imull (%rsi) # sched: [9:1.00]		; HASWELL-NEXT: imull (%rsi) # sched: [9:1.00]
▲ Show 20 Lines • Show All 90 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
tail call void asm "imull $0 \0A\09 imull $1 \0A\09 imull $0, $0 \0A\09 imull $1, $0 \0A\09 imull $2, $0, $0 \0A\09 imull $2, $1, $0 \0A\09 imull $3, $0, $0 \0A\09 imull $3, $1, $0", "r,m,i,i"(i32 %a0, i32 %a1, i32 665536, i8 7) nounwind		tail call void asm "imull $0 \0A\09 imull $1 \0A\09 imull $0, $0 \0A\09 imull $1, $0 \0A\09 imull $2, $0, $0 \0A\09 imull $2, $1, $0 \0A\09 imull $3, $0, $0 \0A\09 imull $3, $1, $0", "r,m,i,i"(i32 %a0, i32 %a1, i32 665536, i8 7) nounwind
ret void		ret void
}		}
define void @test_imul_64(i64 %a0, i64* %a1) optsize {		define void @test_imul_64(i64 %a0, i64* %a1) optsize {
; GENERIC-LABEL: test_imul_64:		; GENERIC-LABEL: test_imul_64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: imulq %rdi # sched: [3:1.00]		; GENERIC-NEXT: imulq %rdi # sched: [3:1.00]
; GENERIC-NEXT: imulq (%rsi) # sched: [7:1.00]		; GENERIC-NEXT: imulq (%rsi) # sched: [8:1.00]
; GENERIC-NEXT: imulq %rdi, %rdi # sched: [3:1.00]		; GENERIC-NEXT: imulq %rdi, %rdi # sched: [3:1.00]
; GENERIC-NEXT: imulq (%rsi), %rdi # sched: [7:1.00]		; GENERIC-NEXT: imulq (%rsi), %rdi # sched: [8:1.00]
; GENERIC-NEXT: imulq $665536, %rdi, %rdi # imm = 0xA27C0		; GENERIC-NEXT: imulq $665536, %rdi, %rdi # imm = 0xA27C0
; GENERIC-NEXT: # sched: [3:1.00]		; GENERIC-NEXT: # sched: [3:1.00]
; GENERIC-NEXT: imulq $665536, (%rsi), %rdi # imm = 0xA27C0		; GENERIC-NEXT: imulq $665536, (%rsi), %rdi # imm = 0xA27C0
; GENERIC-NEXT: # sched: [7:1.00]		; GENERIC-NEXT: # sched: [8:1.00]
; GENERIC-NEXT: imulq $7, %rdi, %rdi # sched: [3:1.00]		; GENERIC-NEXT: imulq $7, %rdi, %rdi # sched: [3:1.00]
; GENERIC-NEXT: imulq $7, (%rsi), %rdi # sched: [7:1.00]		; GENERIC-NEXT: imulq $7, (%rsi), %rdi # sched: [8:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_imul_64:		; ATOM-LABEL: test_imul_64:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: #APP		; ATOM-NEXT: #APP
; ATOM-NEXT: imulq %rdi # sched: [12:6.00]		; ATOM-NEXT: imulq %rdi # sched: [12:6.00]
; ATOM-NEXT: imulq (%rsi) # sched: [12:6.00]		; ATOM-NEXT: imulq (%rsi) # sched: [12:6.00]
Show All 23 Lines
; SLM-NEXT: imulq $7, (%rsi), %rdi # sched: [6:1.00]		; SLM-NEXT: imulq $7, (%rsi), %rdi # sched: [6:1.00]
; SLM-NEXT: #NO_APP		; SLM-NEXT: #NO_APP
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_imul_64:		; SANDY-LABEL: test_imul_64:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: #APP		; SANDY-NEXT: #APP
; SANDY-NEXT: imulq %rdi # sched: [3:1.00]		; SANDY-NEXT: imulq %rdi # sched: [3:1.00]
; SANDY-NEXT: imulq (%rsi) # sched: [7:1.00]		; SANDY-NEXT: imulq (%rsi) # sched: [8:1.00]
; SANDY-NEXT: imulq %rdi, %rdi # sched: [3:1.00]		; SANDY-NEXT: imulq %rdi, %rdi # sched: [3:1.00]
; SANDY-NEXT: imulq (%rsi), %rdi # sched: [7:1.00]		; SANDY-NEXT: imulq (%rsi), %rdi # sched: [8:1.00]
; SANDY-NEXT: imulq $665536, %rdi, %rdi # imm = 0xA27C0		; SANDY-NEXT: imulq $665536, %rdi, %rdi # imm = 0xA27C0
; SANDY-NEXT: # sched: [3:1.00]		; SANDY-NEXT: # sched: [3:1.00]
; SANDY-NEXT: imulq $665536, (%rsi), %rdi # imm = 0xA27C0		; SANDY-NEXT: imulq $665536, (%rsi), %rdi # imm = 0xA27C0
; SANDY-NEXT: # sched: [7:1.00]		; SANDY-NEXT: # sched: [8:1.00]
; SANDY-NEXT: imulq $7, %rdi, %rdi # sched: [3:1.00]		; SANDY-NEXT: imulq $7, %rdi, %rdi # sched: [3:1.00]
; SANDY-NEXT: imulq $7, (%rsi), %rdi # sched: [7:1.00]		; SANDY-NEXT: imulq $7, (%rsi), %rdi # sched: [8:1.00]
; SANDY-NEXT: #NO_APP		; SANDY-NEXT: #NO_APP
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_imul_64:		; HASWELL-LABEL: test_imul_64:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: #APP		; HASWELL-NEXT: #APP
; HASWELL-NEXT: imulq %rdi # sched: [4:1.00]		; HASWELL-NEXT: imulq %rdi # sched: [4:1.00]
; HASWELL-NEXT: imulq (%rsi) # sched: [9:1.00]		; HASWELL-NEXT: imulq (%rsi) # sched: [9:1.00]
▲ Show 20 Lines • Show All 3,864 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
%1 = call i64 asm sideeffect "popq $0 \0A\09 popq $2 \0A\09 pushq $1 \0A\09 pushq $2 \0A\09 pushq $3 \0A\09 pushq $4", "=r,r,m,i,i"(i64 %a0, i64 %a1, i64 4095, i8 7)		%1 = call i64 asm sideeffect "popq $0 \0A\09 popq $2 \0A\09 pushq $1 \0A\09 pushq $2 \0A\09 pushq $3 \0A\09 pushq $4", "=r,r,m,i,i"(i64 %a0, i64 %a1, i64 4095, i8 7)
ret i64 %1		ret i64 %1
}		}

define void @test_popf_pushf() optsize {		define void @test_popf_pushf() optsize {
; GENERIC-LABEL: test_popf_pushf:		; GENERIC-LABEL: test_popf_pushf:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: popfq # sched: [4:0.50]		; GENERIC-NEXT: popfq # sched: [5:0.50]
; GENERIC-NEXT: pushfq # sched: [5:1.00]		; GENERIC-NEXT: pushfq # sched: [5:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_popf_pushf:		; ATOM-LABEL: test_popf_pushf:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: #APP		; ATOM-NEXT: #APP
; ATOM-NEXT: popfq # sched: [26:13.00]		; ATOM-NEXT: popfq # sched: [26:13.00]
; ATOM-NEXT: pushfq # sched: [9:4.50]		; ATOM-NEXT: pushfq # sched: [9:4.50]
; ATOM-NEXT: #NO_APP		; ATOM-NEXT: #NO_APP
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_popf_pushf:		; SLM-LABEL: test_popf_pushf:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: #APP		; SLM-NEXT: #APP
; SLM-NEXT: popfq # sched: [3:1.00]		; SLM-NEXT: popfq # sched: [3:1.00]
; SLM-NEXT: pushfq # sched: [1:1.00]		; SLM-NEXT: pushfq # sched: [1:1.00]
; SLM-NEXT: #NO_APP		; SLM-NEXT: #NO_APP
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_popf_pushf:		; SANDY-LABEL: test_popf_pushf:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: #APP		; SANDY-NEXT: #APP
; SANDY-NEXT: popfq # sched: [4:0.50]		; SANDY-NEXT: popfq # sched: [5:0.50]
; SANDY-NEXT: pushfq # sched: [5:1.00]		; SANDY-NEXT: pushfq # sched: [5:1.00]
; SANDY-NEXT: #NO_APP		; SANDY-NEXT: #NO_APP
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_popf_pushf:		; HASWELL-LABEL: test_popf_pushf:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: #APP		; HASWELL-NEXT: #APP
; HASWELL-NEXT: popfq # sched: [5:0.50]		; HASWELL-NEXT: popfq # sched: [5:0.50]
▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
}		}

define void @test_rcl_rcr_8(i8 %a0, i8 %a1, i8 *%a2) optsize {		define void @test_rcl_rcr_8(i8 %a0, i8 %a1, i8 *%a2) optsize {
; GENERIC-LABEL: test_rcl_rcr_8:		; GENERIC-LABEL: test_rcl_rcr_8:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: rclb %dil # sched: [1:0.50]		; GENERIC-NEXT: rclb %dil # sched: [1:0.50]
; GENERIC-NEXT: rcrb %dil # sched: [1:0.50]		; GENERIC-NEXT: rcrb %dil # sched: [1:0.50]
; GENERIC-NEXT: rclb (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rclb (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: rcrb (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rcrb (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: rclb $7, %dil # sched: [1:0.50]		; GENERIC-NEXT: rclb $7, %dil # sched: [1:0.50]
; GENERIC-NEXT: rcrb $7, %dil # sched: [1:0.50]		; GENERIC-NEXT: rcrb $7, %dil # sched: [1:0.50]
; GENERIC-NEXT: rclb $7, (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rclb $7, (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: rcrb $7, (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rcrb $7, (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: rclb %cl, %dil # sched: [1:0.50]		; GENERIC-NEXT: rclb %cl, %dil # sched: [1:0.50]
; GENERIC-NEXT: rcrb %cl, %dil # sched: [1:0.50]		; GENERIC-NEXT: rcrb %cl, %dil # sched: [1:0.50]
; GENERIC-NEXT: rclb %cl, (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rclb %cl, (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: rcrb %cl, (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rcrb %cl, (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_rcl_rcr_8:		; ATOM-LABEL: test_rcl_rcr_8:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: #APP		; ATOM-NEXT: #APP
; ATOM-NEXT: rclb %dil # sched: [1:1.00]		; ATOM-NEXT: rclb %dil # sched: [1:1.00]
; ATOM-NEXT: rcrb %dil # sched: [1:1.00]		; ATOM-NEXT: rcrb %dil # sched: [1:1.00]
Show All 28 Lines
; SLM-NEXT: #NO_APP		; SLM-NEXT: #NO_APP
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_rcl_rcr_8:		; SANDY-LABEL: test_rcl_rcr_8:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: #APP		; SANDY-NEXT: #APP
; SANDY-NEXT: rclb %dil # sched: [1:0.50]		; SANDY-NEXT: rclb %dil # sched: [1:0.50]
; SANDY-NEXT: rcrb %dil # sched: [1:0.50]		; SANDY-NEXT: rcrb %dil # sched: [1:0.50]
; SANDY-NEXT: rclb (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rclb (%rdx) # sched: [6:1.00]
; SANDY-NEXT: rcrb (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rcrb (%rdx) # sched: [6:1.00]
; SANDY-NEXT: rclb $7, %dil # sched: [1:0.50]		; SANDY-NEXT: rclb $7, %dil # sched: [1:0.50]
; SANDY-NEXT: rcrb $7, %dil # sched: [1:0.50]		; SANDY-NEXT: rcrb $7, %dil # sched: [1:0.50]
; SANDY-NEXT: rclb $7, (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rclb $7, (%rdx) # sched: [6:1.00]
; SANDY-NEXT: rcrb $7, (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rcrb $7, (%rdx) # sched: [6:1.00]
; SANDY-NEXT: rclb %cl, %dil # sched: [1:0.50]		; SANDY-NEXT: rclb %cl, %dil # sched: [1:0.50]
; SANDY-NEXT: rcrb %cl, %dil # sched: [1:0.50]		; SANDY-NEXT: rcrb %cl, %dil # sched: [1:0.50]
; SANDY-NEXT: rclb %cl, (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rclb %cl, (%rdx) # sched: [6:1.00]
; SANDY-NEXT: rcrb %cl, (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rcrb %cl, (%rdx) # sched: [6:1.00]
; SANDY-NEXT: #NO_APP		; SANDY-NEXT: #NO_APP
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_rcl_rcr_8:		; HASWELL-LABEL: test_rcl_rcr_8:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: #APP		; HASWELL-NEXT: #APP
; HASWELL-NEXT: rclb %dil # sched: [3:0.75]		; HASWELL-NEXT: rclb %dil # sched: [3:0.75]
; HASWELL-NEXT: rcrb %dil # sched: [3:0.75]		; HASWELL-NEXT: rcrb %dil # sched: [3:0.75]
▲ Show 20 Lines • Show All 103 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret void		ret void
}		}
define void @test_rcl_rcr_16(i16 %a0, i16 %a1, i16 *%a2) optsize {		define void @test_rcl_rcr_16(i16 %a0, i16 %a1, i16 *%a2) optsize {
; GENERIC-LABEL: test_rcl_rcr_16:		; GENERIC-LABEL: test_rcl_rcr_16:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: rclw %di # sched: [1:0.50]		; GENERIC-NEXT: rclw %di # sched: [1:0.50]
; GENERIC-NEXT: rcrw %di # sched: [1:0.50]		; GENERIC-NEXT: rcrw %di # sched: [1:0.50]
; GENERIC-NEXT: rclw (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rclw (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: rcrw (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rcrw (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: rclw $7, %di # sched: [1:0.50]		; GENERIC-NEXT: rclw $7, %di # sched: [1:0.50]
; GENERIC-NEXT: rcrw $7, %di # sched: [1:0.50]		; GENERIC-NEXT: rcrw $7, %di # sched: [1:0.50]
; GENERIC-NEXT: rclw $7, (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rclw $7, (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: rcrw $7, (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rcrw $7, (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: rclw %cl, %di # sched: [1:0.50]		; GENERIC-NEXT: rclw %cl, %di # sched: [1:0.50]
; GENERIC-NEXT: rcrw %cl, %di # sched: [1:0.50]		; GENERIC-NEXT: rcrw %cl, %di # sched: [1:0.50]
; GENERIC-NEXT: rclw %cl, (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rclw %cl, (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: rcrw %cl, (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rcrw %cl, (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_rcl_rcr_16:		; ATOM-LABEL: test_rcl_rcr_16:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: #APP		; ATOM-NEXT: #APP
; ATOM-NEXT: rclw %di # sched: [1:1.00]		; ATOM-NEXT: rclw %di # sched: [1:1.00]
; ATOM-NEXT: rcrw %di # sched: [1:1.00]		; ATOM-NEXT: rcrw %di # sched: [1:1.00]
Show All 28 Lines
; SLM-NEXT: #NO_APP		; SLM-NEXT: #NO_APP
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_rcl_rcr_16:		; SANDY-LABEL: test_rcl_rcr_16:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: #APP		; SANDY-NEXT: #APP
; SANDY-NEXT: rclw %di # sched: [1:0.50]		; SANDY-NEXT: rclw %di # sched: [1:0.50]
; SANDY-NEXT: rcrw %di # sched: [1:0.50]		; SANDY-NEXT: rcrw %di # sched: [1:0.50]
; SANDY-NEXT: rclw (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rclw (%rdx) # sched: [6:1.00]
; SANDY-NEXT: rcrw (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rcrw (%rdx) # sched: [6:1.00]
; SANDY-NEXT: rclw $7, %di # sched: [1:0.50]		; SANDY-NEXT: rclw $7, %di # sched: [1:0.50]
; SANDY-NEXT: rcrw $7, %di # sched: [1:0.50]		; SANDY-NEXT: rcrw $7, %di # sched: [1:0.50]
; SANDY-NEXT: rclw $7, (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rclw $7, (%rdx) # sched: [6:1.00]
; SANDY-NEXT: rcrw $7, (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rcrw $7, (%rdx) # sched: [6:1.00]
; SANDY-NEXT: rclw %cl, %di # sched: [1:0.50]		; SANDY-NEXT: rclw %cl, %di # sched: [1:0.50]
; SANDY-NEXT: rcrw %cl, %di # sched: [1:0.50]		; SANDY-NEXT: rcrw %cl, %di # sched: [1:0.50]
; SANDY-NEXT: rclw %cl, (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rclw %cl, (%rdx) # sched: [6:1.00]
; SANDY-NEXT: rcrw %cl, (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rcrw %cl, (%rdx) # sched: [6:1.00]
; SANDY-NEXT: #NO_APP		; SANDY-NEXT: #NO_APP
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_rcl_rcr_16:		; HASWELL-LABEL: test_rcl_rcr_16:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: #APP		; HASWELL-NEXT: #APP
; HASWELL-NEXT: rclw %di # sched: [3:0.75]		; HASWELL-NEXT: rclw %di # sched: [3:0.75]
; HASWELL-NEXT: rcrw %di # sched: [3:0.75]		; HASWELL-NEXT: rcrw %di # sched: [3:0.75]
▲ Show 20 Lines • Show All 103 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret void		ret void
}		}
define void @test_rcl_rcr_32(i32 %a0, i32 %a1, i32 *%a2) optsize {		define void @test_rcl_rcr_32(i32 %a0, i32 %a1, i32 *%a2) optsize {
; GENERIC-LABEL: test_rcl_rcr_32:		; GENERIC-LABEL: test_rcl_rcr_32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: rcll %edi # sched: [1:0.50]		; GENERIC-NEXT: rcll %edi # sched: [1:0.50]
; GENERIC-NEXT: rcrl %edi # sched: [1:0.50]		; GENERIC-NEXT: rcrl %edi # sched: [1:0.50]
; GENERIC-NEXT: rcll (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rcll (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: rcrl (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rcrl (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: rcll $7, %edi # sched: [1:0.50]		; GENERIC-NEXT: rcll $7, %edi # sched: [1:0.50]
; GENERIC-NEXT: rcrl $7, %edi # sched: [1:0.50]		; GENERIC-NEXT: rcrl $7, %edi # sched: [1:0.50]
; GENERIC-NEXT: rcll $7, (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rcll $7, (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: rcrl $7, (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rcrl $7, (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: rcll %cl, %edi # sched: [1:0.50]		; GENERIC-NEXT: rcll %cl, %edi # sched: [1:0.50]
; GENERIC-NEXT: rcrl %cl, %edi # sched: [1:0.50]		; GENERIC-NEXT: rcrl %cl, %edi # sched: [1:0.50]
; GENERIC-NEXT: rcll %cl, (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rcll %cl, (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: rcrl %cl, (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rcrl %cl, (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_rcl_rcr_32:		; ATOM-LABEL: test_rcl_rcr_32:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: #APP		; ATOM-NEXT: #APP
; ATOM-NEXT: rcll %edi # sched: [1:1.00]		; ATOM-NEXT: rcll %edi # sched: [1:1.00]
; ATOM-NEXT: rcrl %edi # sched: [1:1.00]		; ATOM-NEXT: rcrl %edi # sched: [1:1.00]
Show All 28 Lines
; SLM-NEXT: #NO_APP		; SLM-NEXT: #NO_APP
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_rcl_rcr_32:		; SANDY-LABEL: test_rcl_rcr_32:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: #APP		; SANDY-NEXT: #APP
; SANDY-NEXT: rcll %edi # sched: [1:0.50]		; SANDY-NEXT: rcll %edi # sched: [1:0.50]
; SANDY-NEXT: rcrl %edi # sched: [1:0.50]		; SANDY-NEXT: rcrl %edi # sched: [1:0.50]
; SANDY-NEXT: rcll (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rcll (%rdx) # sched: [6:1.00]
; SANDY-NEXT: rcrl (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rcrl (%rdx) # sched: [6:1.00]
; SANDY-NEXT: rcll $7, %edi # sched: [1:0.50]		; SANDY-NEXT: rcll $7, %edi # sched: [1:0.50]
; SANDY-NEXT: rcrl $7, %edi # sched: [1:0.50]		; SANDY-NEXT: rcrl $7, %edi # sched: [1:0.50]
; SANDY-NEXT: rcll $7, (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rcll $7, (%rdx) # sched: [6:1.00]
; SANDY-NEXT: rcrl $7, (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rcrl $7, (%rdx) # sched: [6:1.00]
; SANDY-NEXT: rcll %cl, %edi # sched: [1:0.50]		; SANDY-NEXT: rcll %cl, %edi # sched: [1:0.50]
; SANDY-NEXT: rcrl %cl, %edi # sched: [1:0.50]		; SANDY-NEXT: rcrl %cl, %edi # sched: [1:0.50]
; SANDY-NEXT: rcll %cl, (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rcll %cl, (%rdx) # sched: [6:1.00]
; SANDY-NEXT: rcrl %cl, (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rcrl %cl, (%rdx) # sched: [6:1.00]
; SANDY-NEXT: #NO_APP		; SANDY-NEXT: #NO_APP
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_rcl_rcr_32:		; HASWELL-LABEL: test_rcl_rcr_32:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: #APP		; HASWELL-NEXT: #APP
; HASWELL-NEXT: rcll %edi # sched: [3:0.75]		; HASWELL-NEXT: rcll %edi # sched: [3:0.75]
; HASWELL-NEXT: rcrl %edi # sched: [3:0.75]		; HASWELL-NEXT: rcrl %edi # sched: [3:0.75]
▲ Show 20 Lines • Show All 103 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret void		ret void
}		}
define void @test_rcl_rcr_64(i64 %a0, i64 %a1, i64 *%a2) optsize {		define void @test_rcl_rcr_64(i64 %a0, i64 %a1, i64 *%a2) optsize {
; GENERIC-LABEL: test_rcl_rcr_64:		; GENERIC-LABEL: test_rcl_rcr_64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: rclq %rdi # sched: [1:0.50]		; GENERIC-NEXT: rclq %rdi # sched: [1:0.50]
; GENERIC-NEXT: rcrq %rdi # sched: [1:0.50]		; GENERIC-NEXT: rcrq %rdi # sched: [1:0.50]
; GENERIC-NEXT: rclq (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rclq (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: rcrq (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rcrq (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: rclq $7, %rdi # sched: [1:0.50]		; GENERIC-NEXT: rclq $7, %rdi # sched: [1:0.50]
; GENERIC-NEXT: rcrq $7, %rdi # sched: [1:0.50]		; GENERIC-NEXT: rcrq $7, %rdi # sched: [1:0.50]
; GENERIC-NEXT: rclq $7, (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rclq $7, (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: rcrq $7, (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rcrq $7, (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: rclq %cl, %rdi # sched: [1:0.50]		; GENERIC-NEXT: rclq %cl, %rdi # sched: [1:0.50]
; GENERIC-NEXT: rcrq %cl, %rdi # sched: [1:0.50]		; GENERIC-NEXT: rcrq %cl, %rdi # sched: [1:0.50]
; GENERIC-NEXT: rclq %cl, (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rclq %cl, (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: rcrq %cl, (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: rcrq %cl, (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_rcl_rcr_64:		; ATOM-LABEL: test_rcl_rcr_64:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: #APP		; ATOM-NEXT: #APP
; ATOM-NEXT: rclq %rdi # sched: [1:1.00]		; ATOM-NEXT: rclq %rdi # sched: [1:1.00]
; ATOM-NEXT: rcrq %rdi # sched: [1:1.00]		; ATOM-NEXT: rcrq %rdi # sched: [1:1.00]
Show All 28 Lines
; SLM-NEXT: #NO_APP		; SLM-NEXT: #NO_APP
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_rcl_rcr_64:		; SANDY-LABEL: test_rcl_rcr_64:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: #APP		; SANDY-NEXT: #APP
; SANDY-NEXT: rclq %rdi # sched: [1:0.50]		; SANDY-NEXT: rclq %rdi # sched: [1:0.50]
; SANDY-NEXT: rcrq %rdi # sched: [1:0.50]		; SANDY-NEXT: rcrq %rdi # sched: [1:0.50]
; SANDY-NEXT: rclq (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rclq (%rdx) # sched: [6:1.00]
; SANDY-NEXT: rcrq (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rcrq (%rdx) # sched: [6:1.00]
; SANDY-NEXT: rclq $7, %rdi # sched: [1:0.50]		; SANDY-NEXT: rclq $7, %rdi # sched: [1:0.50]
; SANDY-NEXT: rcrq $7, %rdi # sched: [1:0.50]		; SANDY-NEXT: rcrq $7, %rdi # sched: [1:0.50]
; SANDY-NEXT: rclq $7, (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rclq $7, (%rdx) # sched: [6:1.00]
; SANDY-NEXT: rcrq $7, (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rcrq $7, (%rdx) # sched: [6:1.00]
; SANDY-NEXT: rclq %cl, %rdi # sched: [1:0.50]		; SANDY-NEXT: rclq %cl, %rdi # sched: [1:0.50]
; SANDY-NEXT: rcrq %cl, %rdi # sched: [1:0.50]		; SANDY-NEXT: rcrq %cl, %rdi # sched: [1:0.50]
; SANDY-NEXT: rclq %cl, (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rclq %cl, (%rdx) # sched: [6:1.00]
; SANDY-NEXT: rcrq %cl, (%rdx) # sched: [5:1.00]		; SANDY-NEXT: rcrq %cl, (%rdx) # sched: [6:1.00]
; SANDY-NEXT: #NO_APP		; SANDY-NEXT: #NO_APP
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_rcl_rcr_64:		; HASWELL-LABEL: test_rcl_rcr_64:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: #APP		; HASWELL-NEXT: #APP
; HASWELL-NEXT: rclq %rdi # sched: [3:0.75]		; HASWELL-NEXT: rclq %rdi # sched: [3:0.75]
; HASWELL-NEXT: rcrq %rdi # sched: [3:0.75]		; HASWELL-NEXT: rcrq %rdi # sched: [3:0.75]
▲ Show 20 Lines • Show All 346 Lines • ▼ Show 20 Lines
}		}

define void @test_ret() optsize {		define void @test_ret() optsize {
; GENERIC-LABEL: test_ret:		; GENERIC-LABEL: test_ret:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
; GENERIC-NEXT: retq $4095 # imm = 0xFFF		; GENERIC-NEXT: retq $4095 # imm = 0xFFF
; GENERIC-NEXT: # sched: [5:1.00]		; GENERIC-NEXT: # sched: [6:1.00]
; GENERIC-NEXT: lretl # sched: [5:1.00]		; GENERIC-NEXT: lretl # sched: [6:1.00]
; GENERIC-NEXT: lretl $4095 # imm = 0xFFF		; GENERIC-NEXT: lretl $4095 # imm = 0xFFF
; GENERIC-NEXT: # sched: [5:1.00]		; GENERIC-NEXT: # sched: [6:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_ret:		; ATOM-LABEL: test_ret:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: #APP		; ATOM-NEXT: #APP
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
; ATOM-NEXT: retq $4095 # imm = 0xFFF		; ATOM-NEXT: retq $4095 # imm = 0xFFF
Show All 16 Lines
; SLM-NEXT: #NO_APP		; SLM-NEXT: #NO_APP
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_ret:		; SANDY-LABEL: test_ret:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: #APP		; SANDY-NEXT: #APP
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
; SANDY-NEXT: retq $4095 # imm = 0xFFF		; SANDY-NEXT: retq $4095 # imm = 0xFFF
; SANDY-NEXT: # sched: [5:1.00]		; SANDY-NEXT: # sched: [6:1.00]
; SANDY-NEXT: lretl # sched: [5:1.00]		; SANDY-NEXT: lretl # sched: [6:1.00]
; SANDY-NEXT: lretl $4095 # imm = 0xFFF		; SANDY-NEXT: lretl $4095 # imm = 0xFFF
; SANDY-NEXT: # sched: [5:1.00]		; SANDY-NEXT: # sched: [6:1.00]
; SANDY-NEXT: #NO_APP		; SANDY-NEXT: #NO_APP
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_ret:		; HASWELL-LABEL: test_ret:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: #APP		; HASWELL-NEXT: #APP
; HASWELL-NEXT: retq # sched: [7:1.00]		; HASWELL-NEXT: retq # sched: [7:1.00]
; HASWELL-NEXT: retq $4095 # imm = 0xFFF		; HASWELL-NEXT: retq $4095 # imm = 0xFFF
▲ Show 20 Lines • Show All 5,116 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret void		ret void
}		}

define void @test_xchg_8(i8 %a0, i8 %a1, i8 *%a2) optsize {		define void @test_xchg_8(i8 %a0, i8 %a1, i8 *%a2) optsize {
; GENERIC-LABEL: test_xchg_8:		; GENERIC-LABEL: test_xchg_8:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: xchgb %sil, %dil # sched: [1:0.33]		; GENERIC-NEXT: xchgb %sil, %dil # sched: [1:0.33]
; GENERIC-NEXT: xchgb %dil, (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: xchgb %dil, (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_xchg_8:		; ATOM-LABEL: test_xchg_8:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: #APP		; ATOM-NEXT: #APP
; ATOM-NEXT: xchgb %sil, %dil # sched: [2:1.00]		; ATOM-NEXT: xchgb %sil, %dil # sched: [2:1.00]
; ATOM-NEXT: xchgb %dil, (%rdx) # sched: [3:1.50]		; ATOM-NEXT: xchgb %dil, (%rdx) # sched: [3:1.50]
; ATOM-NEXT: #NO_APP		; ATOM-NEXT: #NO_APP
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_xchg_8:		; SLM-LABEL: test_xchg_8:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: #APP		; SLM-NEXT: #APP
; SLM-NEXT: xchgb %sil, %dil # sched: [1:0.50]		; SLM-NEXT: xchgb %sil, %dil # sched: [1:0.50]
; SLM-NEXT: xchgb %dil, (%rdx) # sched: [4:2.00]		; SLM-NEXT: xchgb %dil, (%rdx) # sched: [4:2.00]
; SLM-NEXT: #NO_APP		; SLM-NEXT: #NO_APP
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_xchg_8:		; SANDY-LABEL: test_xchg_8:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: #APP		; SANDY-NEXT: #APP
; SANDY-NEXT: xchgb %sil, %dil # sched: [1:0.33]		; SANDY-NEXT: xchgb %sil, %dil # sched: [1:0.33]
; SANDY-NEXT: xchgb %dil, (%rdx) # sched: [5:1.00]		; SANDY-NEXT: xchgb %dil, (%rdx) # sched: [6:1.00]
; SANDY-NEXT: #NO_APP		; SANDY-NEXT: #NO_APP
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_xchg_8:		; HASWELL-LABEL: test_xchg_8:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: #APP		; HASWELL-NEXT: #APP
; HASWELL-NEXT: xchgb %sil, %dil # sched: [3:0.75]		; HASWELL-NEXT: xchgb %sil, %dil # sched: [3:0.75]
; HASWELL-NEXT: xchgb %dil, (%rdx) # sched: [9:1.00]		; HASWELL-NEXT: xchgb %dil, (%rdx) # sched: [9:1.00]
▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret void		ret void
}		}
define void @test_xchg_16(i16 %a0, i16 %a1, i16 *%a2) optsize {		define void @test_xchg_16(i16 %a0, i16 %a1, i16 *%a2) optsize {
; GENERIC-LABEL: test_xchg_16:		; GENERIC-LABEL: test_xchg_16:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: xchgw %di, %ax # sched: [1:0.33]		; GENERIC-NEXT: xchgw %di, %ax # sched: [1:0.33]
; GENERIC-NEXT: xchgw %si, %di # sched: [1:0.33]		; GENERIC-NEXT: xchgw %si, %di # sched: [1:0.33]
; GENERIC-NEXT: xchgw %di, (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: xchgw %di, (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_xchg_16:		; ATOM-LABEL: test_xchg_16:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: #APP		; ATOM-NEXT: #APP
; ATOM-NEXT: xchgw %di, %ax # sched: [2:1.00]		; ATOM-NEXT: xchgw %di, %ax # sched: [2:1.00]
; ATOM-NEXT: xchgw %si, %di # sched: [2:1.00]		; ATOM-NEXT: xchgw %si, %di # sched: [2:1.00]
Show All 10 Lines
; SLM-NEXT: #NO_APP		; SLM-NEXT: #NO_APP
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_xchg_16:		; SANDY-LABEL: test_xchg_16:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: #APP		; SANDY-NEXT: #APP
; SANDY-NEXT: xchgw %di, %ax # sched: [1:0.33]		; SANDY-NEXT: xchgw %di, %ax # sched: [1:0.33]
; SANDY-NEXT: xchgw %si, %di # sched: [1:0.33]		; SANDY-NEXT: xchgw %si, %di # sched: [1:0.33]
; SANDY-NEXT: xchgw %di, (%rdx) # sched: [5:1.00]		; SANDY-NEXT: xchgw %di, (%rdx) # sched: [6:1.00]
; SANDY-NEXT: #NO_APP		; SANDY-NEXT: #NO_APP
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_xchg_16:		; HASWELL-LABEL: test_xchg_16:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: #APP		; HASWELL-NEXT: #APP
; HASWELL-NEXT: xchgw %di, %ax # sched: [1:0.25]		; HASWELL-NEXT: xchgw %di, %ax # sched: [1:0.25]
; HASWELL-NEXT: xchgw %si, %di # sched: [1:0.25]		; HASWELL-NEXT: xchgw %si, %di # sched: [1:0.25]
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret void		ret void
}		}
define void @test_xchg_32(i32 %a0, i32 %a1, i32 *%a2) optsize {		define void @test_xchg_32(i32 %a0, i32 %a1, i32 *%a2) optsize {
; GENERIC-LABEL: test_xchg_32:		; GENERIC-LABEL: test_xchg_32:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: xchgl %edi, %eax # sched: [1:0.33]		; GENERIC-NEXT: xchgl %edi, %eax # sched: [1:0.33]
; GENERIC-NEXT: xchgl %esi, %edi # sched: [1:0.33]		; GENERIC-NEXT: xchgl %esi, %edi # sched: [1:0.33]
; GENERIC-NEXT: xchgl %edi, (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: xchgl %edi, (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_xchg_32:		; ATOM-LABEL: test_xchg_32:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: #APP		; ATOM-NEXT: #APP
; ATOM-NEXT: xchgl %edi, %eax # sched: [2:1.00]		; ATOM-NEXT: xchgl %edi, %eax # sched: [2:1.00]
; ATOM-NEXT: xchgl %esi, %edi # sched: [2:1.00]		; ATOM-NEXT: xchgl %esi, %edi # sched: [2:1.00]
Show All 10 Lines
; SLM-NEXT: #NO_APP		; SLM-NEXT: #NO_APP
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_xchg_32:		; SANDY-LABEL: test_xchg_32:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: #APP		; SANDY-NEXT: #APP
; SANDY-NEXT: xchgl %edi, %eax # sched: [1:0.33]		; SANDY-NEXT: xchgl %edi, %eax # sched: [1:0.33]
; SANDY-NEXT: xchgl %esi, %edi # sched: [1:0.33]		; SANDY-NEXT: xchgl %esi, %edi # sched: [1:0.33]
; SANDY-NEXT: xchgl %edi, (%rdx) # sched: [5:1.00]		; SANDY-NEXT: xchgl %edi, (%rdx) # sched: [6:1.00]
; SANDY-NEXT: #NO_APP		; SANDY-NEXT: #NO_APP
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_xchg_32:		; HASWELL-LABEL: test_xchg_32:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: #APP		; HASWELL-NEXT: #APP
; HASWELL-NEXT: xchgl %edi, %eax # sched: [1:0.25]		; HASWELL-NEXT: xchgl %edi, %eax # sched: [1:0.25]
; HASWELL-NEXT: xchgl %esi, %edi # sched: [1:0.25]		; HASWELL-NEXT: xchgl %esi, %edi # sched: [1:0.25]
▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret void		ret void
}		}
define void @test_xchg_64(i64 %a0, i64 %a1, i64 *%a2) optsize {		define void @test_xchg_64(i64 %a0, i64 %a1, i64 *%a2) optsize {
; GENERIC-LABEL: test_xchg_64:		; GENERIC-LABEL: test_xchg_64:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: xchgq %rdi, %rax # sched: [1:0.33]		; GENERIC-NEXT: xchgq %rdi, %rax # sched: [1:0.33]
; GENERIC-NEXT: xchgq %rsi, %rdi # sched: [1:0.33]		; GENERIC-NEXT: xchgq %rsi, %rdi # sched: [1:0.33]
; GENERIC-NEXT: xchgq %rdi, (%rdx) # sched: [5:1.00]		; GENERIC-NEXT: xchgq %rdi, (%rdx) # sched: [6:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_xchg_64:		; ATOM-LABEL: test_xchg_64:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: #APP		; ATOM-NEXT: #APP
; ATOM-NEXT: xchgq %rdi, %rax # sched: [2:1.00]		; ATOM-NEXT: xchgq %rdi, %rax # sched: [2:1.00]
; ATOM-NEXT: xchgq %rsi, %rdi # sched: [2:1.00]		; ATOM-NEXT: xchgq %rsi, %rdi # sched: [2:1.00]
Show All 10 Lines
; SLM-NEXT: #NO_APP		; SLM-NEXT: #NO_APP
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_xchg_64:		; SANDY-LABEL: test_xchg_64:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: #APP		; SANDY-NEXT: #APP
; SANDY-NEXT: xchgq %rdi, %rax # sched: [1:0.33]		; SANDY-NEXT: xchgq %rdi, %rax # sched: [1:0.33]
; SANDY-NEXT: xchgq %rsi, %rdi # sched: [1:0.33]		; SANDY-NEXT: xchgq %rsi, %rdi # sched: [1:0.33]
; SANDY-NEXT: xchgq %rdi, (%rdx) # sched: [5:1.00]		; SANDY-NEXT: xchgq %rdi, (%rdx) # sched: [6:1.00]
; SANDY-NEXT: #NO_APP		; SANDY-NEXT: #NO_APP
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_xchg_64:		; HASWELL-LABEL: test_xchg_64:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: #APP		; HASWELL-NEXT: #APP
; HASWELL-NEXT: xchgq %rdi, %rax # sched: [1:0.25]		; HASWELL-NEXT: xchgq %rdi, %rax # sched: [1:0.25]
; HASWELL-NEXT: xchgq %rsi, %rdi # sched: [1:0.25]		; HASWELL-NEXT: xchgq %rsi, %rdi # sched: [1:0.25]
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
tail call void asm "xchg %RAX, $0 \0A\09 xchg $1, $0 \0A\09 xchg $2, $0", "r,r,m"(i64 %a0, i64 %a1, i64 %a2) nounwind		tail call void asm "xchg %RAX, $0 \0A\09 xchg $1, $0 \0A\09 xchg $2, $0", "r,r,m"(i64 %a0, i64 %a1, i64 %a2) nounwind
ret void		ret void
}		}

define void @test_xlat() optsize {		define void @test_xlat() optsize {
; GENERIC-LABEL: test_xlat:		; GENERIC-LABEL: test_xlat:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: xlatb # sched: [4:0.50]		; GENERIC-NEXT: xlatb # sched: [5:0.50]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; ATOM-LABEL: test_xlat:		; ATOM-LABEL: test_xlat:
; ATOM: # %bb.0:		; ATOM: # %bb.0:
; ATOM-NEXT: #APP		; ATOM-NEXT: #APP
; ATOM-NEXT: xlatb # sched: [6:3.00]		; ATOM-NEXT: xlatb # sched: [6:3.00]
; ATOM-NEXT: #NO_APP		; ATOM-NEXT: #NO_APP
; ATOM-NEXT: retq # sched: [79:39.50]		; ATOM-NEXT: retq # sched: [79:39.50]
;		;
; SLM-LABEL: test_xlat:		; SLM-LABEL: test_xlat:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: #APP		; SLM-NEXT: #APP
; SLM-NEXT: xlatb # sched: [3:1.00]		; SLM-NEXT: xlatb # sched: [3:1.00]
; SLM-NEXT: #NO_APP		; SLM-NEXT: #NO_APP
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-LABEL: test_xlat:		; SANDY-LABEL: test_xlat:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: #APP		; SANDY-NEXT: #APP
; SANDY-NEXT: xlatb # sched: [4:0.50]		; SANDY-NEXT: xlatb # sched: [5:0.50]
; SANDY-NEXT: #NO_APP		; SANDY-NEXT: #NO_APP
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-LABEL: test_xlat:		; HASWELL-LABEL: test_xlat:
; HASWELL: # %bb.0:		; HASWELL: # %bb.0:
; HASWELL-NEXT: #APP		; HASWELL-NEXT: #APP
; HASWELL-NEXT: xlatb # sched: [7:?]		; HASWELL-NEXT: xlatb # sched: [7:?]
; HASWELL-NEXT: #NO_APP		; HASWELL-NEXT: #NO_APP
▲ Show 20 Lines • Show All 682 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/sha-schedule.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=x86-64 -mattr=+sha \| FileCheck %s --check-prefix=CHECK --check-prefix=GENERIC		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=x86-64 -mattr=+sha \| FileCheck %s --check-prefix=CHECK --check-prefix=GENERIC
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=goldmont \| FileCheck %s --check-prefix=CHECK --check-prefix=GOLDMONT		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=goldmont \| FileCheck %s --check-prefix=CHECK --check-prefix=GOLDMONT
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=cannonlake \| FileCheck %s --check-prefix=CHECK --check-prefix=CANNONLAKE		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=cannonlake \| FileCheck %s --check-prefix=CHECK --check-prefix=CANNONLAKE
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=znver1 \| FileCheck %s --check-prefix=CHECK --check-prefix=ZNVER1		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=znver1 \| FileCheck %s --check-prefix=CHECK --check-prefix=ZNVER1

;		;
; SHA1		; SHA1
;		;

define <4 x i32> @test_sha1msg1(<4 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {		define <4 x i32> @test_sha1msg1(<4 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {
; GENERIC-LABEL: test_sha1msg1:		; GENERIC-LABEL: test_sha1msg1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: sha1msg1 %xmm1, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: sha1msg1 %xmm1, %xmm0 # sched: [5:1.00]
; GENERIC-NEXT: sha1msg1 (%rdi), %xmm0 # sched: [9:1.00]		; GENERIC-NEXT: sha1msg1 (%rdi), %xmm0 # sched: [10:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; GOLDMONT-LABEL: test_sha1msg1:		; GOLDMONT-LABEL: test_sha1msg1:
; GOLDMONT: # %bb.0:		; GOLDMONT: # %bb.0:
; GOLDMONT-NEXT: sha1msg1 %xmm1, %xmm0 # sched: [4:1.00]		; GOLDMONT-NEXT: sha1msg1 %xmm1, %xmm0 # sched: [4:1.00]
; GOLDMONT-NEXT: sha1msg1 (%rdi), %xmm0 # sched: [7:1.00]		; GOLDMONT-NEXT: sha1msg1 (%rdi), %xmm0 # sched: [7:1.00]
; GOLDMONT-NEXT: retq # sched: [4:1.00]		; GOLDMONT-NEXT: retq # sched: [4:1.00]
;		;
Show All 14 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <4 x i32> %3		ret <4 x i32> %3
}		}
declare <4 x i32> @llvm.x86.sha1msg1(<4 x i32>, <4 x i32>)		declare <4 x i32> @llvm.x86.sha1msg1(<4 x i32>, <4 x i32>)

define <4 x i32> @test_sha1msg2(<4 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {		define <4 x i32> @test_sha1msg2(<4 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {
; GENERIC-LABEL: test_sha1msg2:		; GENERIC-LABEL: test_sha1msg2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: sha1msg2 %xmm1, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: sha1msg2 %xmm1, %xmm0 # sched: [5:1.00]
; GENERIC-NEXT: sha1msg2 (%rdi), %xmm0 # sched: [9:1.00]		; GENERIC-NEXT: sha1msg2 (%rdi), %xmm0 # sched: [10:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; GOLDMONT-LABEL: test_sha1msg2:		; GOLDMONT-LABEL: test_sha1msg2:
; GOLDMONT: # %bb.0:		; GOLDMONT: # %bb.0:
; GOLDMONT-NEXT: sha1msg2 %xmm1, %xmm0 # sched: [4:1.00]		; GOLDMONT-NEXT: sha1msg2 %xmm1, %xmm0 # sched: [4:1.00]
; GOLDMONT-NEXT: sha1msg2 (%rdi), %xmm0 # sched: [7:1.00]		; GOLDMONT-NEXT: sha1msg2 (%rdi), %xmm0 # sched: [7:1.00]
; GOLDMONT-NEXT: retq # sched: [4:1.00]		; GOLDMONT-NEXT: retq # sched: [4:1.00]
;		;
Show All 14 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <4 x i32> %3		ret <4 x i32> %3
}		}
declare <4 x i32> @llvm.x86.sha1msg2(<4 x i32>, <4 x i32>)		declare <4 x i32> @llvm.x86.sha1msg2(<4 x i32>, <4 x i32>)

define <4 x i32> @test_sha1nexte(<4 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {		define <4 x i32> @test_sha1nexte(<4 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {
; GENERIC-LABEL: test_sha1nexte:		; GENERIC-LABEL: test_sha1nexte:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: sha1nexte %xmm1, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: sha1nexte %xmm1, %xmm0 # sched: [5:1.00]
; GENERIC-NEXT: sha1nexte (%rdi), %xmm0 # sched: [9:1.00]		; GENERIC-NEXT: sha1nexte (%rdi), %xmm0 # sched: [10:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; GOLDMONT-LABEL: test_sha1nexte:		; GOLDMONT-LABEL: test_sha1nexte:
; GOLDMONT: # %bb.0:		; GOLDMONT: # %bb.0:
; GOLDMONT-NEXT: sha1nexte %xmm1, %xmm0 # sched: [4:1.00]		; GOLDMONT-NEXT: sha1nexte %xmm1, %xmm0 # sched: [4:1.00]
; GOLDMONT-NEXT: sha1nexte (%rdi), %xmm0 # sched: [7:1.00]		; GOLDMONT-NEXT: sha1nexte (%rdi), %xmm0 # sched: [7:1.00]
; GOLDMONT-NEXT: retq # sched: [4:1.00]		; GOLDMONT-NEXT: retq # sched: [4:1.00]
;		;
Show All 14 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <4 x i32> %3		ret <4 x i32> %3
}		}
declare <4 x i32> @llvm.x86.sha1nexte(<4 x i32>, <4 x i32>)		declare <4 x i32> @llvm.x86.sha1nexte(<4 x i32>, <4 x i32>)

define <4 x i32> @test_sha1rnds4(<4 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {		define <4 x i32> @test_sha1rnds4(<4 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {
; GENERIC-LABEL: test_sha1rnds4:		; GENERIC-LABEL: test_sha1rnds4:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: sha1rnds4 $3, %xmm1, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: sha1rnds4 $3, %xmm1, %xmm0 # sched: [5:1.00]
; GENERIC-NEXT: sha1rnds4 $3, (%rdi), %xmm0 # sched: [9:1.00]		; GENERIC-NEXT: sha1rnds4 $3, (%rdi), %xmm0 # sched: [10:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; GOLDMONT-LABEL: test_sha1rnds4:		; GOLDMONT-LABEL: test_sha1rnds4:
; GOLDMONT: # %bb.0:		; GOLDMONT: # %bb.0:
; GOLDMONT-NEXT: sha1rnds4 $3, %xmm1, %xmm0 # sched: [4:1.00]		; GOLDMONT-NEXT: sha1rnds4 $3, %xmm1, %xmm0 # sched: [4:1.00]
; GOLDMONT-NEXT: sha1rnds4 $3, (%rdi), %xmm0 # sched: [7:1.00]		; GOLDMONT-NEXT: sha1rnds4 $3, (%rdi), %xmm0 # sched: [7:1.00]
; GOLDMONT-NEXT: retq # sched: [4:1.00]		; GOLDMONT-NEXT: retq # sched: [4:1.00]
;		;
Show All 18 Lines
;		;
; SHA256		; SHA256
;		;

define <4 x i32> @test_sha256msg1(<4 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {		define <4 x i32> @test_sha256msg1(<4 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {
; GENERIC-LABEL: test_sha256msg1:		; GENERIC-LABEL: test_sha256msg1:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: sha256msg1 %xmm1, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: sha256msg1 %xmm1, %xmm0 # sched: [5:1.00]
; GENERIC-NEXT: sha256msg1 (%rdi), %xmm0 # sched: [9:1.00]		; GENERIC-NEXT: sha256msg1 (%rdi), %xmm0 # sched: [10:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; GOLDMONT-LABEL: test_sha256msg1:		; GOLDMONT-LABEL: test_sha256msg1:
; GOLDMONT: # %bb.0:		; GOLDMONT: # %bb.0:
; GOLDMONT-NEXT: sha256msg1 %xmm1, %xmm0 # sched: [4:1.00]		; GOLDMONT-NEXT: sha256msg1 %xmm1, %xmm0 # sched: [4:1.00]
; GOLDMONT-NEXT: sha256msg1 (%rdi), %xmm0 # sched: [7:1.00]		; GOLDMONT-NEXT: sha256msg1 (%rdi), %xmm0 # sched: [7:1.00]
; GOLDMONT-NEXT: retq # sched: [4:1.00]		; GOLDMONT-NEXT: retq # sched: [4:1.00]
;		;
Show All 14 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <4 x i32> %3		ret <4 x i32> %3
}		}
declare <4 x i32> @llvm.x86.sha256msg1(<4 x i32>, <4 x i32>)		declare <4 x i32> @llvm.x86.sha256msg1(<4 x i32>, <4 x i32>)

define <4 x i32> @test_sha256msg2(<4 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {		define <4 x i32> @test_sha256msg2(<4 x i32> %a0, <4 x i32> %a1, <4 x i32> *%a2) {
; GENERIC-LABEL: test_sha256msg2:		; GENERIC-LABEL: test_sha256msg2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: sha256msg2 %xmm1, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: sha256msg2 %xmm1, %xmm0 # sched: [5:1.00]
; GENERIC-NEXT: sha256msg2 (%rdi), %xmm0 # sched: [9:1.00]		; GENERIC-NEXT: sha256msg2 (%rdi), %xmm0 # sched: [10:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; GOLDMONT-LABEL: test_sha256msg2:		; GOLDMONT-LABEL: test_sha256msg2:
; GOLDMONT: # %bb.0:		; GOLDMONT: # %bb.0:
; GOLDMONT-NEXT: sha256msg2 %xmm1, %xmm0 # sched: [4:1.00]		; GOLDMONT-NEXT: sha256msg2 %xmm1, %xmm0 # sched: [4:1.00]
; GOLDMONT-NEXT: sha256msg2 (%rdi), %xmm0 # sched: [7:1.00]		; GOLDMONT-NEXT: sha256msg2 (%rdi), %xmm0 # sched: [7:1.00]
; GOLDMONT-NEXT: retq # sched: [4:1.00]		; GOLDMONT-NEXT: retq # sched: [4:1.00]
;		;
Show All 16 Lines
declare <4 x i32> @llvm.x86.sha256msg2(<4 x i32>, <4 x i32>)		declare <4 x i32> @llvm.x86.sha256msg2(<4 x i32>, <4 x i32>)

define <4 x i32> @test_sha256rnds2(<4 x i32> %a0, <4 x i32> %a1, <4 x i32> %a2, <4 x i32> *%a3) {		define <4 x i32> @test_sha256rnds2(<4 x i32> %a0, <4 x i32> %a1, <4 x i32> %a2, <4 x i32> *%a3) {
; GENERIC-LABEL: test_sha256rnds2:		; GENERIC-LABEL: test_sha256rnds2:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: movaps %xmm0, %xmm3 # sched: [1:1.00]		; GENERIC-NEXT: movaps %xmm0, %xmm3 # sched: [1:1.00]
; GENERIC-NEXT: movaps %xmm2, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: movaps %xmm2, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: sha256rnds2 %xmm0, %xmm1, %xmm3 # sched: [5:1.00]		; GENERIC-NEXT: sha256rnds2 %xmm0, %xmm1, %xmm3 # sched: [5:1.00]
; GENERIC-NEXT: sha256rnds2 %xmm0, (%rdi), %xmm3 # sched: [9:1.00]		; GENERIC-NEXT: sha256rnds2 %xmm0, (%rdi), %xmm3 # sched: [10:1.00]
; GENERIC-NEXT: movaps %xmm3, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: movaps %xmm3, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; GOLDMONT-LABEL: test_sha256rnds2:		; GOLDMONT-LABEL: test_sha256rnds2:
; GOLDMONT: # %bb.0:		; GOLDMONT: # %bb.0:
; GOLDMONT-NEXT: movaps %xmm0, %xmm3 # sched: [1:0.50]		; GOLDMONT-NEXT: movaps %xmm0, %xmm3 # sched: [1:0.50]
; GOLDMONT-NEXT: movaps %xmm2, %xmm0 # sched: [1:0.50]		; GOLDMONT-NEXT: movaps %xmm2, %xmm0 # sched: [1:0.50]
; GOLDMONT-NEXT: sha256rnds2 %xmm0, %xmm1, %xmm3 # sched: [4:1.00]		; GOLDMONT-NEXT: sha256rnds2 %xmm0, %xmm1, %xmm3 # sched: [4:1.00]
Show All 27 Lines

llvm/trunk/test/CodeGen/X86/sse41-schedule.ll

Show First 20 Lines • Show All 617 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
ret <2 x double> %3		ret <2 x double> %3
}		}
declare <2 x double> @llvm.x86.sse41.dppd(<2 x double>, <2 x double>, i8) nounwind readnone		declare <2 x double> @llvm.x86.sse41.dppd(<2 x double>, <2 x double>, i8) nounwind readnone

define <4 x float> @test_dpps(<4 x float> %a0, <4 x float> %a1, <4 x float> *%a2) {		define <4 x float> @test_dpps(<4 x float> %a0, <4 x float> %a1, <4 x float> *%a2) {
; GENERIC-LABEL: test_dpps:		; GENERIC-LABEL: test_dpps:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: dpps $7, %xmm1, %xmm0 # sched: [12:2.00]		; GENERIC-NEXT: dpps $7, %xmm1, %xmm0 # sched: [12:2.00]
; GENERIC-NEXT: dpps $7, (%rdi), %xmm0 # sched: [7:1.00]		; GENERIC-NEXT: dpps $7, (%rdi), %xmm0 # sched: [8:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SLM-LABEL: test_dpps:		; SLM-LABEL: test_dpps:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: dpps $7, %xmm1, %xmm0 # sched: [3:1.00]		; SLM-NEXT: dpps $7, %xmm1, %xmm0 # sched: [3:1.00]
; SLM-NEXT: dpps $7, (%rdi), %xmm0 # sched: [6:1.00]		; SLM-NEXT: dpps $7, (%rdi), %xmm0 # sched: [6:1.00]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-SSE-LABEL: test_dpps:		; SANDY-SSE-LABEL: test_dpps:
; SANDY-SSE: # %bb.0:		; SANDY-SSE: # %bb.0:
; SANDY-SSE-NEXT: dpps $7, %xmm1, %xmm0 # sched: [12:2.00]		; SANDY-SSE-NEXT: dpps $7, %xmm1, %xmm0 # sched: [12:2.00]
; SANDY-SSE-NEXT: dpps $7, (%rdi), %xmm0 # sched: [7:1.00]		; SANDY-SSE-NEXT: dpps $7, (%rdi), %xmm0 # sched: [8:1.00]
; SANDY-SSE-NEXT: retq # sched: [1:1.00]		; SANDY-SSE-NEXT: retq # sched: [1:1.00]
;		;
; SANDY-LABEL: test_dpps:		; SANDY-LABEL: test_dpps:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: vdpps $7, %xmm1, %xmm0, %xmm0 # sched: [12:2.00]		; SANDY-NEXT: vdpps $7, %xmm1, %xmm0, %xmm0 # sched: [12:2.00]
; SANDY-NEXT: vdpps $7, (%rdi), %xmm0, %xmm0 # sched: [7:1.00]		; SANDY-NEXT: vdpps $7, (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
; HASWELL-SSE-LABEL: test_dpps:		; HASWELL-SSE-LABEL: test_dpps:
; HASWELL-SSE: # %bb.0:		; HASWELL-SSE: # %bb.0:
; HASWELL-SSE-NEXT: dpps $7, %xmm1, %xmm0 # sched: [14:2.00]		; HASWELL-SSE-NEXT: dpps $7, %xmm1, %xmm0 # sched: [14:2.00]
; HASWELL-SSE-NEXT: dpps $7, (%rdi), %xmm0 # sched: [20:2.00]		; HASWELL-SSE-NEXT: dpps $7, (%rdi), %xmm0 # sched: [20:2.00]
; HASWELL-SSE-NEXT: retq # sched: [7:1.00]		; HASWELL-SSE-NEXT: retq # sched: [7:1.00]
;		;
▲ Show 20 Lines • Show All 1,245 Lines • ▼ Show 20 Lines	; ZNVER1-NEXT: retq # sched: [1:0.50]
store i64 %2, i64 *%a2		store i64 %2, i64 *%a2
ret i64 %1		ret i64 %1
}		}

define i32 @test_pextrw(<8 x i16> %a0, i16 *%a1) {		define i32 @test_pextrw(<8 x i16> %a0, i16 *%a1) {
; GENERIC-LABEL: test_pextrw:		; GENERIC-LABEL: test_pextrw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: pextrw $3, %xmm0, %eax # sched: [3:1.00]		; GENERIC-NEXT: pextrw $3, %xmm0, %eax # sched: [3:1.00]
; GENERIC-NEXT: pextrw $1, %xmm0, (%rdi) # sched: [5:1.00]		; GENERIC-NEXT: pextrw $1, %xmm0, (%rdi) # sched: [6:1.00]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; SLM-LABEL: test_pextrw:		; SLM-LABEL: test_pextrw:
; SLM: # %bb.0:		; SLM: # %bb.0:
; SLM-NEXT: pextrw $3, %xmm0, %eax # sched: [1:1.00]		; SLM-NEXT: pextrw $3, %xmm0, %eax # sched: [1:1.00]
; SLM-NEXT: pextrw $1, %xmm0, (%rdi) # sched: [4:2.00]		; SLM-NEXT: pextrw $1, %xmm0, (%rdi) # sched: [4:2.00]
; SLM-NEXT: retq # sched: [4:1.00]		; SLM-NEXT: retq # sched: [4:1.00]
;		;
; SANDY-SSE-LABEL: test_pextrw:		; SANDY-SSE-LABEL: test_pextrw:
; SANDY-SSE: # %bb.0:		; SANDY-SSE: # %bb.0:
; SANDY-SSE-NEXT: pextrw $3, %xmm0, %eax # sched: [3:1.00]		; SANDY-SSE-NEXT: pextrw $3, %xmm0, %eax # sched: [3:1.00]
; SANDY-SSE-NEXT: pextrw $1, %xmm0, (%rdi) # sched: [5:1.00]		; SANDY-SSE-NEXT: pextrw $1, %xmm0, (%rdi) # sched: [6:1.00]
; SANDY-SSE-NEXT: retq # sched: [1:1.00]		; SANDY-SSE-NEXT: retq # sched: [1:1.00]
;		;
; SANDY-LABEL: test_pextrw:		; SANDY-LABEL: test_pextrw:
; SANDY: # %bb.0:		; SANDY: # %bb.0:
; SANDY-NEXT: vpextrw $3, %xmm0, %eax # sched: [3:1.00]		; SANDY-NEXT: vpextrw $3, %xmm0, %eax # sched: [3:1.00]
; SANDY-NEXT: vpextrw $1, %xmm0, (%rdi) # sched: [5:1.00]		; SANDY-NEXT: vpextrw $1, %xmm0, (%rdi) # sched: [5:1.00]
; SANDY-NEXT: retq # sched: [1:1.00]		; SANDY-NEXT: retq # sched: [1:1.00]
;		;
▲ Show 20 Lines • Show All 3,655 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/tbm-schedule.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=x86-64 -mattr=+tbm \| FileCheck %s --check-prefix=GENERIC			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=x86-64 -mattr=+tbm \| FileCheck %s --check-prefix=GENERIC
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=bdver2 \| FileCheck %s --check-prefix=BDVER --check-prefix=BDVER2			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=bdver2 \| FileCheck %s --check-prefix=BDVER --check-prefix=BDVER2
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=bdver3 \| FileCheck %s --check-prefix=BDVER --check-prefix=BDVER3			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=bdver3 \| FileCheck %s --check-prefix=BDVER --check-prefix=BDVER3
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=bdver4 \| FileCheck %s --check-prefix=BDVER --check-prefix=BDVER4			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=bdver4 \| FileCheck %s --check-prefix=BDVER --check-prefix=BDVER4

	define i32 @test_x86_tbm_bextri_u32(i32 %a0, i32* nocapture %p1) nounwind {			define i32 @test_x86_tbm_bextri_u32(i32 %a0, i32* nocapture %p1) nounwind {
	; GENERIC-LABEL: test_x86_tbm_bextri_u32:			; GENERIC-LABEL: test_x86_tbm_bextri_u32:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: bextrl $3076, %edi, %ecx # imm = 0xC04			; GENERIC-NEXT: bextrl $3076, %edi, %ecx # imm = 0xC04
	; GENERIC-NEXT: # sched: [1:0.33]			; GENERIC-NEXT: # sched: [1:0.33]
	; GENERIC-NEXT: bextrl $3076, (%rsi), %eax # imm = 0xC04			; GENERIC-NEXT: bextrl $3076, (%rsi), %eax # imm = 0xC04
	; GENERIC-NEXT: # sched: [5:0.50]			; GENERIC-NEXT: # sched: [6:0.50]
	; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]			; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_x86_tbm_bextri_u32:			; BDVER-LABEL: test_x86_tbm_bextri_u32:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: bextrl $3076, %edi, %ecx # imm = 0xC04			; BDVER-NEXT: bextrl $3076, %edi, %ecx # imm = 0xC04
	; BDVER-NEXT: bextrl $3076, (%rsi), %eax # imm = 0xC04			; BDVER-NEXT: bextrl $3076, (%rsi), %eax # imm = 0xC04
	; BDVER-NEXT: addl %ecx, %eax			; BDVER-NEXT: addl %ecx, %eax
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	%a1 = load i32, i32* %p1			%a1 = load i32, i32* %p1
	%r0 = lshr i32 %a0, 4			%r0 = lshr i32 %a0, 4
	%m0 = lshr i32 %a1, 4			%m0 = lshr i32 %a1, 4
	%r1 = and i32 %r0, 4095			%r1 = and i32 %r0, 4095
	%m1 = and i32 %m0, 4095			%m1 = and i32 %m0, 4095
	%res = add i32 %r1, %m1			%res = add i32 %r1, %m1
	ret i32 %res			ret i32 %res
	}			}

	define i64 @test_x86_tbm_bextri_u64(i64 %a0, i64* nocapture %p1) nounwind {			define i64 @test_x86_tbm_bextri_u64(i64 %a0, i64* nocapture %p1) nounwind {
	; GENERIC-LABEL: test_x86_tbm_bextri_u64:			; GENERIC-LABEL: test_x86_tbm_bextri_u64:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: bextrl $3076, %edi, %ecx # imm = 0xC04			; GENERIC-NEXT: bextrl $3076, %edi, %ecx # imm = 0xC04
	; GENERIC-NEXT: # sched: [1:0.33]			; GENERIC-NEXT: # sched: [1:0.33]
	; GENERIC-NEXT: bextrl $3076, (%rsi), %eax # imm = 0xC04			; GENERIC-NEXT: bextrl $3076, (%rsi), %eax # imm = 0xC04
	; GENERIC-NEXT: # sched: [5:0.50]			; GENERIC-NEXT: # sched: [6:0.50]
	; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]			; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_x86_tbm_bextri_u64:			; BDVER-LABEL: test_x86_tbm_bextri_u64:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: bextrl $3076, %edi, %ecx # imm = 0xC04			; BDVER-NEXT: bextrl $3076, %edi, %ecx # imm = 0xC04
	; BDVER-NEXT: bextrl $3076, (%rsi), %eax # imm = 0xC04			; BDVER-NEXT: bextrl $3076, (%rsi), %eax # imm = 0xC04
	; BDVER-NEXT: addq %rcx, %rax			; BDVER-NEXT: addq %rcx, %rax
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	%a1 = load i64, i64* %p1			%a1 = load i64, i64* %p1
	%r0 = lshr i64 %a0, 4			%r0 = lshr i64 %a0, 4
	%m0 = lshr i64 %a1, 4			%m0 = lshr i64 %a1, 4
	%r1 = and i64 %r0, 4095			%r1 = and i64 %r0, 4095
	%m1 = and i64 %m0, 4095			%m1 = and i64 %m0, 4095
	%res = add i64 %r1, %m1			%res = add i64 %r1, %m1
	ret i64 %res			ret i64 %res
	}			}

	define i32 @test_x86_tbm_blcfill_u32(i32 %a0, i32* nocapture %p1) nounwind {			define i32 @test_x86_tbm_blcfill_u32(i32 %a0, i32* nocapture %p1) nounwind {
	; GENERIC-LABEL: test_x86_tbm_blcfill_u32:			; GENERIC-LABEL: test_x86_tbm_blcfill_u32:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: blcfilll %edi, %ecx # sched: [1:0.33]			; GENERIC-NEXT: blcfilll %edi, %ecx # sched: [1:0.33]
	; GENERIC-NEXT: blcfilll (%rsi), %eax # sched: [5:0.50]			; GENERIC-NEXT: blcfilll (%rsi), %eax # sched: [6:0.50]
	; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]			; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_x86_tbm_blcfill_u32:			; BDVER-LABEL: test_x86_tbm_blcfill_u32:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: blcfilll %edi, %ecx			; BDVER-NEXT: blcfilll %edi, %ecx
	; BDVER-NEXT: blcfilll (%rsi), %eax			; BDVER-NEXT: blcfilll (%rsi), %eax
	; BDVER-NEXT: addl %ecx, %eax			; BDVER-NEXT: addl %ecx, %eax
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	%a1 = load i32, i32* %p1			%a1 = load i32, i32* %p1
	%r0 = add i32 %a0, 1			%r0 = add i32 %a0, 1
	%m0 = add i32 %a1, 1			%m0 = add i32 %a1, 1
	%r1 = and i32 %r0, %a0			%r1 = and i32 %r0, %a0
	%m1 = and i32 %m0, %a1			%m1 = and i32 %m0, %a1
	%res = add i32 %r1, %m1			%res = add i32 %r1, %m1
	ret i32 %res			ret i32 %res
	}			}

	define i64 @test_x86_tbm_blcfill_u64(i64 %a0, i64* nocapture %p1) nounwind {			define i64 @test_x86_tbm_blcfill_u64(i64 %a0, i64* nocapture %p1) nounwind {
	; GENERIC-LABEL: test_x86_tbm_blcfill_u64:			; GENERIC-LABEL: test_x86_tbm_blcfill_u64:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: blcfillq %rdi, %rcx # sched: [1:0.33]			; GENERIC-NEXT: blcfillq %rdi, %rcx # sched: [1:0.33]
	; GENERIC-NEXT: blcfillq (%rsi), %rax # sched: [5:0.50]			; GENERIC-NEXT: blcfillq (%rsi), %rax # sched: [6:0.50]
	; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]			; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_x86_tbm_blcfill_u64:			; BDVER-LABEL: test_x86_tbm_blcfill_u64:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: blcfillq %rdi, %rcx			; BDVER-NEXT: blcfillq %rdi, %rcx
	; BDVER-NEXT: blcfillq (%rsi), %rax			; BDVER-NEXT: blcfillq (%rsi), %rax
	; BDVER-NEXT: addq %rcx, %rax			; BDVER-NEXT: addq %rcx, %rax
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	%a1 = load i64, i64* %p1			%a1 = load i64, i64* %p1
	%r0 = add i64 %a0, 1			%r0 = add i64 %a0, 1
	%m0 = add i64 %a1, 1			%m0 = add i64 %a1, 1
	%r1 = and i64 %r0, %a0			%r1 = and i64 %r0, %a0
	%m1 = and i64 %m0, %a1			%m1 = and i64 %m0, %a1
	%res = add i64 %r1, %m1			%res = add i64 %r1, %m1
	ret i64 %res			ret i64 %res
	}			}

	define i32 @test_x86_tbm_blci_u32(i32 %a0, i32* nocapture %p1) nounwind {			define i32 @test_x86_tbm_blci_u32(i32 %a0, i32* nocapture %p1) nounwind {
	; GENERIC-LABEL: test_x86_tbm_blci_u32:			; GENERIC-LABEL: test_x86_tbm_blci_u32:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: blcil %edi, %ecx # sched: [1:0.33]			; GENERIC-NEXT: blcil %edi, %ecx # sched: [1:0.33]
	; GENERIC-NEXT: blcil (%rsi), %eax # sched: [5:0.50]			; GENERIC-NEXT: blcil (%rsi), %eax # sched: [6:0.50]
	; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]			; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_x86_tbm_blci_u32:			; BDVER-LABEL: test_x86_tbm_blci_u32:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: blcil %edi, %ecx			; BDVER-NEXT: blcil %edi, %ecx
	; BDVER-NEXT: blcil (%rsi), %eax			; BDVER-NEXT: blcil (%rsi), %eax
	; BDVER-NEXT: addl %ecx, %eax			; BDVER-NEXT: addl %ecx, %eax
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	%a1 = load i32, i32* %p1			%a1 = load i32, i32* %p1
	%r0 = add i32 1, %a0			%r0 = add i32 1, %a0
	%m0 = add i32 1, %a1			%m0 = add i32 1, %a1
	%r1 = xor i32 %r0, -1			%r1 = xor i32 %r0, -1
	%m1 = xor i32 %m0, -1			%m1 = xor i32 %m0, -1
	%r2 = or i32 %r1, %a0			%r2 = or i32 %r1, %a0
	%m2 = or i32 %m1, %a1			%m2 = or i32 %m1, %a1
	%res = add i32 %r2, %m2			%res = add i32 %r2, %m2
	ret i32 %res			ret i32 %res
	}			}

	define i64 @test_x86_tbm_blci_u64(i64 %a0, i64* nocapture %p1) nounwind {			define i64 @test_x86_tbm_blci_u64(i64 %a0, i64* nocapture %p1) nounwind {
	; GENERIC-LABEL: test_x86_tbm_blci_u64:			; GENERIC-LABEL: test_x86_tbm_blci_u64:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: blciq %rdi, %rcx # sched: [1:0.33]			; GENERIC-NEXT: blciq %rdi, %rcx # sched: [1:0.33]
	; GENERIC-NEXT: blciq (%rsi), %rax # sched: [5:0.50]			; GENERIC-NEXT: blciq (%rsi), %rax # sched: [6:0.50]
	; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]			; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_x86_tbm_blci_u64:			; BDVER-LABEL: test_x86_tbm_blci_u64:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: blciq %rdi, %rcx			; BDVER-NEXT: blciq %rdi, %rcx
	; BDVER-NEXT: blciq (%rsi), %rax			; BDVER-NEXT: blciq (%rsi), %rax
	; BDVER-NEXT: addq %rcx, %rax			; BDVER-NEXT: addq %rcx, %rax
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	%a1 = load i64, i64* %p1			%a1 = load i64, i64* %p1
	%r0 = add i64 1, %a0			%r0 = add i64 1, %a0
	%m0 = add i64 1, %a1			%m0 = add i64 1, %a1
	%r1 = xor i64 %r0, -1			%r1 = xor i64 %r0, -1
	%m1 = xor i64 %m0, -1			%m1 = xor i64 %m0, -1
	%r2 = or i64 %r1, %a0			%r2 = or i64 %r1, %a0
	%m2 = or i64 %m1, %a1			%m2 = or i64 %m1, %a1
	%res = add i64 %r2, %m2			%res = add i64 %r2, %m2
	ret i64 %res			ret i64 %res
	}			}

	define i32 @test_x86_tbm_blcic_u32(i32 %a0, i32* nocapture %p1) nounwind {			define i32 @test_x86_tbm_blcic_u32(i32 %a0, i32* nocapture %p1) nounwind {
	; GENERIC-LABEL: test_x86_tbm_blcic_u32:			; GENERIC-LABEL: test_x86_tbm_blcic_u32:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: blcicl %edi, %ecx # sched: [1:0.33]			; GENERIC-NEXT: blcicl %edi, %ecx # sched: [1:0.33]
	; GENERIC-NEXT: blcicl (%rsi), %eax # sched: [5:0.50]			; GENERIC-NEXT: blcicl (%rsi), %eax # sched: [6:0.50]
	; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]			; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_x86_tbm_blcic_u32:			; BDVER-LABEL: test_x86_tbm_blcic_u32:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: blcicl %edi, %ecx			; BDVER-NEXT: blcicl %edi, %ecx
	; BDVER-NEXT: blcicl (%rsi), %eax			; BDVER-NEXT: blcicl (%rsi), %eax
	; BDVER-NEXT: addl %ecx, %eax			; BDVER-NEXT: addl %ecx, %eax
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	%a1 = load i32, i32* %p1			%a1 = load i32, i32* %p1
	%r0 = xor i32 %a0, -1			%r0 = xor i32 %a0, -1
	%m0 = xor i32 %a1, -1			%m0 = xor i32 %a1, -1
	%r1 = add i32 %a0, 1			%r1 = add i32 %a0, 1
	%m1 = add i32 %a1, 1			%m1 = add i32 %a1, 1
	%r2 = and i32 %r1, %r0			%r2 = and i32 %r1, %r0
	%m2 = and i32 %m1, %m0			%m2 = and i32 %m1, %m0
	%res = add i32 %r2, %m2			%res = add i32 %r2, %m2
	ret i32 %res			ret i32 %res
	}			}

	define i64 @test_x86_tbm_blcic_u64(i64 %a0, i64* nocapture %p1) nounwind {			define i64 @test_x86_tbm_blcic_u64(i64 %a0, i64* nocapture %p1) nounwind {
	; GENERIC-LABEL: test_x86_tbm_blcic_u64:			; GENERIC-LABEL: test_x86_tbm_blcic_u64:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: blcicq %rdi, %rcx # sched: [1:0.33]			; GENERIC-NEXT: blcicq %rdi, %rcx # sched: [1:0.33]
	; GENERIC-NEXT: blcicq (%rsi), %rax # sched: [5:0.50]			; GENERIC-NEXT: blcicq (%rsi), %rax # sched: [6:0.50]
	; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]			; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_x86_tbm_blcic_u64:			; BDVER-LABEL: test_x86_tbm_blcic_u64:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: blcicq %rdi, %rcx			; BDVER-NEXT: blcicq %rdi, %rcx
	; BDVER-NEXT: blcicq (%rsi), %rax			; BDVER-NEXT: blcicq (%rsi), %rax
	; BDVER-NEXT: addq %rcx, %rax			; BDVER-NEXT: addq %rcx, %rax
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	%a1 = load i64, i64* %p1			%a1 = load i64, i64* %p1
	%r0 = xor i64 %a0, -1			%r0 = xor i64 %a0, -1
	%m0 = xor i64 %a1, -1			%m0 = xor i64 %a1, -1
	%r1 = add i64 %a0, 1			%r1 = add i64 %a0, 1
	%m1 = add i64 %a1, 1			%m1 = add i64 %a1, 1
	%r2 = and i64 %r1, %r0			%r2 = and i64 %r1, %r0
	%m2 = and i64 %m1, %m0			%m2 = and i64 %m1, %m0
	%res = add i64 %r2, %m2			%res = add i64 %r2, %m2
	ret i64 %res			ret i64 %res
	}			}

	define i32 @test_x86_tbm_blcmsk_u32(i32 %a0, i32* nocapture %p1) nounwind {			define i32 @test_x86_tbm_blcmsk_u32(i32 %a0, i32* nocapture %p1) nounwind {
	; GENERIC-LABEL: test_x86_tbm_blcmsk_u32:			; GENERIC-LABEL: test_x86_tbm_blcmsk_u32:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: blcmskl %edi, %ecx # sched: [1:0.33]			; GENERIC-NEXT: blcmskl %edi, %ecx # sched: [1:0.33]
	; GENERIC-NEXT: blcmskl (%rsi), %eax # sched: [5:0.50]			; GENERIC-NEXT: blcmskl (%rsi), %eax # sched: [6:0.50]
	; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]			; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_x86_tbm_blcmsk_u32:			; BDVER-LABEL: test_x86_tbm_blcmsk_u32:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: blcmskl %edi, %ecx			; BDVER-NEXT: blcmskl %edi, %ecx
	; BDVER-NEXT: blcmskl (%rsi), %eax			; BDVER-NEXT: blcmskl (%rsi), %eax
	; BDVER-NEXT: addl %ecx, %eax			; BDVER-NEXT: addl %ecx, %eax
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	%a1 = load i32, i32* %p1			%a1 = load i32, i32* %p1
	%r0 = add i32 %a0, 1			%r0 = add i32 %a0, 1
	%m0 = add i32 %a1, 1			%m0 = add i32 %a1, 1
	%r1 = xor i32 %r0, %a0			%r1 = xor i32 %r0, %a0
	%m1 = xor i32 %m0, %a1			%m1 = xor i32 %m0, %a1
	%res = add i32 %r1, %m1			%res = add i32 %r1, %m1
	ret i32 %res			ret i32 %res
	}			}

	define i64 @test_x86_tbm_blcmsk_u64(i64 %a0, i64* nocapture %p1) nounwind {			define i64 @test_x86_tbm_blcmsk_u64(i64 %a0, i64* nocapture %p1) nounwind {
	; GENERIC-LABEL: test_x86_tbm_blcmsk_u64:			; GENERIC-LABEL: test_x86_tbm_blcmsk_u64:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: blcmskq %rdi, %rcx # sched: [1:0.33]			; GENERIC-NEXT: blcmskq %rdi, %rcx # sched: [1:0.33]
	; GENERIC-NEXT: blcmskq (%rsi), %rax # sched: [5:0.50]			; GENERIC-NEXT: blcmskq (%rsi), %rax # sched: [6:0.50]
	; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]			; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_x86_tbm_blcmsk_u64:			; BDVER-LABEL: test_x86_tbm_blcmsk_u64:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: blcmskq %rdi, %rcx			; BDVER-NEXT: blcmskq %rdi, %rcx
	; BDVER-NEXT: blcmskq (%rsi), %rax			; BDVER-NEXT: blcmskq (%rsi), %rax
	; BDVER-NEXT: addq %rcx, %rax			; BDVER-NEXT: addq %rcx, %rax
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	%a1 = load i64, i64* %p1			%a1 = load i64, i64* %p1
	%r0 = add i64 %a0, 1			%r0 = add i64 %a0, 1
	%m0 = add i64 %a1, 1			%m0 = add i64 %a1, 1
	%r1 = xor i64 %r0, %a0			%r1 = xor i64 %r0, %a0
	%m1 = xor i64 %m0, %a1			%m1 = xor i64 %m0, %a1
	%res = add i64 %r1, %m1			%res = add i64 %r1, %m1
	ret i64 %res			ret i64 %res
	}			}

	define i32 @test_x86_tbm_blcs_u32(i32 %a0, i32* nocapture %p1) nounwind {			define i32 @test_x86_tbm_blcs_u32(i32 %a0, i32* nocapture %p1) nounwind {
	; GENERIC-LABEL: test_x86_tbm_blcs_u32:			; GENERIC-LABEL: test_x86_tbm_blcs_u32:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: blcsl %edi, %ecx # sched: [1:0.33]			; GENERIC-NEXT: blcsl %edi, %ecx # sched: [1:0.33]
	; GENERIC-NEXT: blcsl (%rsi), %eax # sched: [5:0.50]			; GENERIC-NEXT: blcsl (%rsi), %eax # sched: [6:0.50]
	; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]			; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_x86_tbm_blcs_u32:			; BDVER-LABEL: test_x86_tbm_blcs_u32:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: blcsl %edi, %ecx			; BDVER-NEXT: blcsl %edi, %ecx
	; BDVER-NEXT: blcsl (%rsi), %eax			; BDVER-NEXT: blcsl (%rsi), %eax
	; BDVER-NEXT: addl %ecx, %eax			; BDVER-NEXT: addl %ecx, %eax
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	%a1 = load i32, i32* %p1			%a1 = load i32, i32* %p1
	%r0 = add i32 %a0, 1			%r0 = add i32 %a0, 1
	%m0 = add i32 %a1, 1			%m0 = add i32 %a1, 1
	%r1 = or i32 %r0, %a0			%r1 = or i32 %r0, %a0
	%m1 = or i32 %m0, %a1			%m1 = or i32 %m0, %a1
	%res = add i32 %r1, %m1			%res = add i32 %r1, %m1
	ret i32 %res			ret i32 %res
	}			}

	define i64 @test_x86_tbm_blcs_u64(i64 %a0, i64* nocapture %p1) nounwind {			define i64 @test_x86_tbm_blcs_u64(i64 %a0, i64* nocapture %p1) nounwind {
	; GENERIC-LABEL: test_x86_tbm_blcs_u64:			; GENERIC-LABEL: test_x86_tbm_blcs_u64:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: blcsq %rdi, %rcx # sched: [1:0.33]			; GENERIC-NEXT: blcsq %rdi, %rcx # sched: [1:0.33]
	; GENERIC-NEXT: blcsq (%rsi), %rax # sched: [5:0.50]			; GENERIC-NEXT: blcsq (%rsi), %rax # sched: [6:0.50]
	; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]			; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_x86_tbm_blcs_u64:			; BDVER-LABEL: test_x86_tbm_blcs_u64:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: blcsq %rdi, %rcx			; BDVER-NEXT: blcsq %rdi, %rcx
	; BDVER-NEXT: blcsq (%rsi), %rax			; BDVER-NEXT: blcsq (%rsi), %rax
	; BDVER-NEXT: addq %rcx, %rax			; BDVER-NEXT: addq %rcx, %rax
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	%a1 = load i64, i64* %p1			%a1 = load i64, i64* %p1
	%r0 = add i64 %a0, 1			%r0 = add i64 %a0, 1
	%m0 = add i64 %a1, 1			%m0 = add i64 %a1, 1
	%r1 = or i64 %r0, %a0			%r1 = or i64 %r0, %a0
	%m1 = or i64 %m0, %a1			%m1 = or i64 %m0, %a1
	%res = add i64 %r1, %m1			%res = add i64 %r1, %m1
	ret i64 %res			ret i64 %res
	}			}

	define i32 @test_x86_tbm_blsfill_u32(i32 %a0, i32* nocapture %p1) nounwind {			define i32 @test_x86_tbm_blsfill_u32(i32 %a0, i32* nocapture %p1) nounwind {
	; GENERIC-LABEL: test_x86_tbm_blsfill_u32:			; GENERIC-LABEL: test_x86_tbm_blsfill_u32:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: blsfilll %edi, %ecx # sched: [1:0.33]			; GENERIC-NEXT: blsfilll %edi, %ecx # sched: [1:0.33]
	; GENERIC-NEXT: blsfilll (%rsi), %eax # sched: [5:0.50]			; GENERIC-NEXT: blsfilll (%rsi), %eax # sched: [6:0.50]
	; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]			; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_x86_tbm_blsfill_u32:			; BDVER-LABEL: test_x86_tbm_blsfill_u32:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: blsfilll %edi, %ecx			; BDVER-NEXT: blsfilll %edi, %ecx
	; BDVER-NEXT: blsfilll (%rsi), %eax			; BDVER-NEXT: blsfilll (%rsi), %eax
	; BDVER-NEXT: addl %ecx, %eax			; BDVER-NEXT: addl %ecx, %eax
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	%a1 = load i32, i32* %p1			%a1 = load i32, i32* %p1
	%r0 = add i32 %a0, -1			%r0 = add i32 %a0, -1
	%m0 = add i32 %a1, -1			%m0 = add i32 %a1, -1
	%r1 = or i32 %r0, %a0			%r1 = or i32 %r0, %a0
	%m1 = or i32 %m0, %a1			%m1 = or i32 %m0, %a1
	%res = add i32 %r1, %m1			%res = add i32 %r1, %m1
	ret i32 %res			ret i32 %res
	}			}

	define i64 @test_x86_tbm_blsfill_u64(i64 %a0, i64* nocapture %p1) nounwind {			define i64 @test_x86_tbm_blsfill_u64(i64 %a0, i64* nocapture %p1) nounwind {
	; GENERIC-LABEL: test_x86_tbm_blsfill_u64:			; GENERIC-LABEL: test_x86_tbm_blsfill_u64:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: blsfillq %rdi, %rcx # sched: [1:0.33]			; GENERIC-NEXT: blsfillq %rdi, %rcx # sched: [1:0.33]
	; GENERIC-NEXT: blsfillq (%rsi), %rax # sched: [5:0.50]			; GENERIC-NEXT: blsfillq (%rsi), %rax # sched: [6:0.50]
	; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]			; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_x86_tbm_blsfill_u64:			; BDVER-LABEL: test_x86_tbm_blsfill_u64:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: blsfillq %rdi, %rcx			; BDVER-NEXT: blsfillq %rdi, %rcx
	; BDVER-NEXT: blsfillq (%rsi), %rax			; BDVER-NEXT: blsfillq (%rsi), %rax
	; BDVER-NEXT: addq %rcx, %rax			; BDVER-NEXT: addq %rcx, %rax
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	%a1 = load i64, i64* %p1			%a1 = load i64, i64* %p1
	%r0 = add i64 %a0, -1			%r0 = add i64 %a0, -1
	%m0 = add i64 %a1, -1			%m0 = add i64 %a1, -1
	%r1 = or i64 %r0, %a0			%r1 = or i64 %r0, %a0
	%m1 = or i64 %m0, %a1			%m1 = or i64 %m0, %a1
	%res = add i64 %r1, %m1			%res = add i64 %r1, %m1
	ret i64 %res			ret i64 %res
	}			}

	define i32 @test_x86_tbm_blsic_u32(i32 %a0, i32* nocapture %p1) nounwind {			define i32 @test_x86_tbm_blsic_u32(i32 %a0, i32* nocapture %p1) nounwind {
	; GENERIC-LABEL: test_x86_tbm_blsic_u32:			; GENERIC-LABEL: test_x86_tbm_blsic_u32:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: blsicl %edi, %ecx # sched: [1:0.33]			; GENERIC-NEXT: blsicl %edi, %ecx # sched: [1:0.33]
	; GENERIC-NEXT: blsicl (%rsi), %eax # sched: [5:0.50]			; GENERIC-NEXT: blsicl (%rsi), %eax # sched: [6:0.50]
	; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]			; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_x86_tbm_blsic_u32:			; BDVER-LABEL: test_x86_tbm_blsic_u32:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: blsicl %edi, %ecx			; BDVER-NEXT: blsicl %edi, %ecx
	; BDVER-NEXT: blsicl (%rsi), %eax			; BDVER-NEXT: blsicl (%rsi), %eax
	; BDVER-NEXT: addl %ecx, %eax			; BDVER-NEXT: addl %ecx, %eax
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	%a1 = load i32, i32* %p1			%a1 = load i32, i32* %p1
	%r0 = xor i32 %a0, -1			%r0 = xor i32 %a0, -1
	%m0 = xor i32 %a1, -1			%m0 = xor i32 %a1, -1
	%r1 = add i32 %a0, -1			%r1 = add i32 %a0, -1
	%m1 = add i32 %a1, -1			%m1 = add i32 %a1, -1
	%r2 = or i32 %r0, %r1			%r2 = or i32 %r0, %r1
	%m2 = or i32 %m0, %m1			%m2 = or i32 %m0, %m1
	%res = add i32 %r2, %m2			%res = add i32 %r2, %m2
	ret i32 %res			ret i32 %res
	}			}

	define i64 @test_x86_tbm_blsic_u64(i64 %a0, i64* nocapture %p1) nounwind {			define i64 @test_x86_tbm_blsic_u64(i64 %a0, i64* nocapture %p1) nounwind {
	; GENERIC-LABEL: test_x86_tbm_blsic_u64:			; GENERIC-LABEL: test_x86_tbm_blsic_u64:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: blsicq %rdi, %rcx # sched: [1:0.33]			; GENERIC-NEXT: blsicq %rdi, %rcx # sched: [1:0.33]
	; GENERIC-NEXT: blsicq (%rsi), %rax # sched: [5:0.50]			; GENERIC-NEXT: blsicq (%rsi), %rax # sched: [6:0.50]
	; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]			; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_x86_tbm_blsic_u64:			; BDVER-LABEL: test_x86_tbm_blsic_u64:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: blsicq %rdi, %rcx			; BDVER-NEXT: blsicq %rdi, %rcx
	; BDVER-NEXT: blsicq (%rsi), %rax			; BDVER-NEXT: blsicq (%rsi), %rax
	; BDVER-NEXT: addq %rcx, %rax			; BDVER-NEXT: addq %rcx, %rax
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	%a1 = load i64, i64* %p1			%a1 = load i64, i64* %p1
	%r0 = xor i64 %a0, -1			%r0 = xor i64 %a0, -1
	%m0 = xor i64 %a1, -1			%m0 = xor i64 %a1, -1
	%r1 = add i64 %a0, -1			%r1 = add i64 %a0, -1
	%m1 = add i64 %a1, -1			%m1 = add i64 %a1, -1
	%r2 = or i64 %r0, %r1			%r2 = or i64 %r0, %r1
	%m2 = or i64 %m0, %m1			%m2 = or i64 %m0, %m1
	%res = add i64 %r2, %m2			%res = add i64 %r2, %m2
	ret i64 %res			ret i64 %res
	}			}

	define i32 @test_x86_tbm_t1mskc_u32(i32 %a0, i32* nocapture %p1) nounwind {			define i32 @test_x86_tbm_t1mskc_u32(i32 %a0, i32* nocapture %p1) nounwind {
	; GENERIC-LABEL: test_x86_tbm_t1mskc_u32:			; GENERIC-LABEL: test_x86_tbm_t1mskc_u32:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: t1mskcl %edi, %ecx # sched: [1:0.33]			; GENERIC-NEXT: t1mskcl %edi, %ecx # sched: [1:0.33]
	; GENERIC-NEXT: t1mskcl (%rsi), %eax # sched: [5:0.50]			; GENERIC-NEXT: t1mskcl (%rsi), %eax # sched: [6:0.50]
	; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]			; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_x86_tbm_t1mskc_u32:			; BDVER-LABEL: test_x86_tbm_t1mskc_u32:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: t1mskcl %edi, %ecx			; BDVER-NEXT: t1mskcl %edi, %ecx
	; BDVER-NEXT: t1mskcl (%rsi), %eax			; BDVER-NEXT: t1mskcl (%rsi), %eax
	; BDVER-NEXT: addl %ecx, %eax			; BDVER-NEXT: addl %ecx, %eax
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	%a1 = load i32, i32* %p1			%a1 = load i32, i32* %p1
	%r0 = xor i32 %a0, -1			%r0 = xor i32 %a0, -1
	%m0 = xor i32 %a1, -1			%m0 = xor i32 %a1, -1
	%r1 = add i32 %a0, 1			%r1 = add i32 %a0, 1
	%m1 = add i32 %a1, 1			%m1 = add i32 %a1, 1
	%r2 = or i32 %r0, %r1			%r2 = or i32 %r0, %r1
	%m2 = or i32 %m0, %m1			%m2 = or i32 %m0, %m1
	%res = add i32 %r2, %m2			%res = add i32 %r2, %m2
	ret i32 %res			ret i32 %res
	}			}

	define i64 @test_x86_tbm_t1mskc_u64(i64 %a0, i64* nocapture %p1) nounwind {			define i64 @test_x86_tbm_t1mskc_u64(i64 %a0, i64* nocapture %p1) nounwind {
	; GENERIC-LABEL: test_x86_tbm_t1mskc_u64:			; GENERIC-LABEL: test_x86_tbm_t1mskc_u64:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: t1mskcq %rdi, %rcx # sched: [1:0.33]			; GENERIC-NEXT: t1mskcq %rdi, %rcx # sched: [1:0.33]
	; GENERIC-NEXT: t1mskcq (%rsi), %rax # sched: [5:0.50]			; GENERIC-NEXT: t1mskcq (%rsi), %rax # sched: [6:0.50]
	; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]			; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_x86_tbm_t1mskc_u64:			; BDVER-LABEL: test_x86_tbm_t1mskc_u64:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: t1mskcq %rdi, %rcx			; BDVER-NEXT: t1mskcq %rdi, %rcx
	; BDVER-NEXT: t1mskcq (%rsi), %rax			; BDVER-NEXT: t1mskcq (%rsi), %rax
	; BDVER-NEXT: addq %rcx, %rax			; BDVER-NEXT: addq %rcx, %rax
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	%a1 = load i64, i64* %p1			%a1 = load i64, i64* %p1
	%r0 = xor i64 %a0, -1			%r0 = xor i64 %a0, -1
	%m0 = xor i64 %a1, -1			%m0 = xor i64 %a1, -1
	%r1 = add i64 %a0, 1			%r1 = add i64 %a0, 1
	%m1 = add i64 %a1, 1			%m1 = add i64 %a1, 1
	%r2 = or i64 %r0, %r1			%r2 = or i64 %r0, %r1
	%m2 = or i64 %m0, %m1			%m2 = or i64 %m0, %m1
	%res = add i64 %r2, %m2			%res = add i64 %r2, %m2
	ret i64 %res			ret i64 %res
	}			}

	define i32 @test_x86_tbm_tzmsk_u32(i32 %a0, i32* nocapture %p1) nounwind {			define i32 @test_x86_tbm_tzmsk_u32(i32 %a0, i32* nocapture %p1) nounwind {
	; GENERIC-LABEL: test_x86_tbm_tzmsk_u32:			; GENERIC-LABEL: test_x86_tbm_tzmsk_u32:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: tzmskl %edi, %ecx # sched: [1:0.33]			; GENERIC-NEXT: tzmskl %edi, %ecx # sched: [1:0.33]
	; GENERIC-NEXT: tzmskl (%rsi), %eax # sched: [5:0.50]			; GENERIC-NEXT: tzmskl (%rsi), %eax # sched: [6:0.50]
	; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]			; GENERIC-NEXT: addl %ecx, %eax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_x86_tbm_tzmsk_u32:			; BDVER-LABEL: test_x86_tbm_tzmsk_u32:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: tzmskl %edi, %ecx			; BDVER-NEXT: tzmskl %edi, %ecx
	; BDVER-NEXT: tzmskl (%rsi), %eax			; BDVER-NEXT: tzmskl (%rsi), %eax
	; BDVER-NEXT: addl %ecx, %eax			; BDVER-NEXT: addl %ecx, %eax
	; BDVER-NEXT: retq			; BDVER-NEXT: retq
	%a1 = load i32, i32* %p1			%a1 = load i32, i32* %p1
	%r0 = xor i32 %a0, -1			%r0 = xor i32 %a0, -1
	%m0 = xor i32 %a1, -1			%m0 = xor i32 %a1, -1
	%r1 = add i32 %a0, -1			%r1 = add i32 %a0, -1
	%m1 = add i32 %a1, -1			%m1 = add i32 %a1, -1
	%r2 = and i32 %r0, %r1			%r2 = and i32 %r0, %r1
	%m2 = and i32 %m0, %m1			%m2 = and i32 %m0, %m1
	%res = add i32 %r2, %m2			%res = add i32 %r2, %m2
	ret i32 %res			ret i32 %res
	}			}

	define i64 @test_x86_tbm_tzmsk_u64(i64 %a0, i64* nocapture %p1) nounwind {			define i64 @test_x86_tbm_tzmsk_u64(i64 %a0, i64* nocapture %p1) nounwind {
	; GENERIC-LABEL: test_x86_tbm_tzmsk_u64:			; GENERIC-LABEL: test_x86_tbm_tzmsk_u64:
	; GENERIC: # %bb.0:			; GENERIC: # %bb.0:
	; GENERIC-NEXT: tzmskq %rdi, %rcx # sched: [1:0.33]			; GENERIC-NEXT: tzmskq %rdi, %rcx # sched: [1:0.33]
	; GENERIC-NEXT: tzmskq (%rsi), %rax # sched: [5:0.50]			; GENERIC-NEXT: tzmskq (%rsi), %rax # sched: [6:0.50]
	; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]			; GENERIC-NEXT: addq %rcx, %rax # sched: [1:0.33]
	; GENERIC-NEXT: retq # sched: [1:1.00]			; GENERIC-NEXT: retq # sched: [1:1.00]
	;			;
	; BDVER-LABEL: test_x86_tbm_tzmsk_u64:			; BDVER-LABEL: test_x86_tbm_tzmsk_u64:
	; BDVER: # %bb.0:			; BDVER: # %bb.0:
	; BDVER-NEXT: tzmskq %rdi, %rcx			; BDVER-NEXT: tzmskq %rdi, %rcx
	; BDVER-NEXT: tzmskq (%rsi), %rax			; BDVER-NEXT: tzmskq (%rsi), %rax
	; BDVER-NEXT: addq %rcx, %rax			; BDVER-NEXT: addq %rcx, %rax
	Show All 11 Lines

llvm/trunk/test/CodeGen/X86/x87-schedule.ll

	Show All 32 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_f2xm1:			; SANDY-LABEL: test_f2xm1:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: f2xm1 # sched: [100:0.33]			; SANDY-NEXT: f2xm1 # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_f2xm1:			; HASWELL-LABEL: test_f2xm1:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: f2xm1 # sched: [100:0.25]			; HASWELL-NEXT: f2xm1 # sched: [100:0.25]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fabs:			; SANDY-LABEL: test_fabs:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fabs # sched: [1:1.00]			; SANDY-NEXT: fabs # sched: [1:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fabs:			; HASWELL-LABEL: test_fabs:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fabs # sched: [1:1.00]			; HASWELL-NEXT: fabs # sched: [1:1.00]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fadd %st(0), %st(1) # sched: [3:1.00]			; SANDY-NEXT: fadd %st(0), %st(1) # sched: [3:1.00]
	; SANDY-NEXT: fadd %st(2) # sched: [3:1.00]			; SANDY-NEXT: fadd %st(2) # sched: [3:1.00]
	; SANDY-NEXT: fadds (%ecx) # sched: [10:1.00]			; SANDY-NEXT: fadds (%ecx) # sched: [10:1.00]
	; SANDY-NEXT: faddl (%eax) # sched: [10:1.00]			; SANDY-NEXT: faddl (%eax) # sched: [10:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fadd:			; HASWELL-LABEL: test_fadd:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fadd %st(0), %st(1) # sched: [3:1.00]			; HASWELL-NEXT: fadd %st(0), %st(1) # sched: [3:1.00]
	; HASWELL-NEXT: fadd %st(2) # sched: [3:1.00]			; HASWELL-NEXT: fadd %st(2) # sched: [3:1.00]
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: faddp %st(1) # sched: [3:1.00]			; SANDY-NEXT: faddp %st(1) # sched: [3:1.00]
	; SANDY-NEXT: faddp %st(2) # sched: [3:1.00]			; SANDY-NEXT: faddp %st(2) # sched: [3:1.00]
	; SANDY-NEXT: fiadds (%ecx) # sched: [13:2.00]			; SANDY-NEXT: fiadds (%ecx) # sched: [13:2.00]
	; SANDY-NEXT: fiaddl (%eax) # sched: [13:2.00]			; SANDY-NEXT: fiaddl (%eax) # sched: [13:2.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_faddp_fiadd:			; HASWELL-LABEL: test_faddp_fiadd:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: faddp %st(1) # sched: [3:1.00]			; HASWELL-NEXT: faddp %st(1) # sched: [3:1.00]
	; HASWELL-NEXT: faddp %st(2) # sched: [3:1.00]			; HASWELL-NEXT: faddp %st(2) # sched: [3:1.00]
	▲ Show 20 Lines • Show All 95 Lines • ▼ Show 20 Lines
	;			;
	; SANDY-LABEL: test_fbld_fbstp:			; SANDY-LABEL: test_fbld_fbstp:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fbld (%eax) # sched: [100:0.33]			; SANDY-NEXT: fbld (%eax) # sched: [100:0.33]
	; SANDY-NEXT: fbstp (%eax) # sched: [100:0.33]			; SANDY-NEXT: fbstp (%eax) # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fbld_fbstp:			; HASWELL-LABEL: test_fbld_fbstp:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fbld (%eax) # sched: [47:?]			; HASWELL-NEXT: fbld (%eax) # sched: [47:?]
	; HASWELL-NEXT: fbstp (%eax) # sched: [1:1.00]			; HASWELL-NEXT: fbstp (%eax) # sched: [1:1.00]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fchs:			; SANDY-LABEL: test_fchs:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fchs # sched: [1:1.00]			; SANDY-NEXT: fchs # sched: [1:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fchs:			; HASWELL-LABEL: test_fchs:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fchs # sched: [1:1.00]			; HASWELL-NEXT: fchs # sched: [1:1.00]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fclex:			; SANDY-LABEL: test_fclex:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: wait # sched: [100:0.33]			; SANDY-NEXT: wait # sched: [100:0.33]
	; SANDY-NEXT: fnclex # sched: [100:0.33]			; SANDY-NEXT: fnclex # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fclex:			; HASWELL-LABEL: test_fclex:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: wait # sched: [2:0.50]			; HASWELL-NEXT: wait # sched: [2:0.50]
	; HASWELL-NEXT: fnclex # sched: [4:1.00]			; HASWELL-NEXT: fnclex # sched: [4:1.00]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fnclex:			; SANDY-LABEL: test_fnclex:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fnclex # sched: [100:0.33]			; SANDY-NEXT: fnclex # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fnclex:			; HASWELL-LABEL: test_fnclex:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fnclex # sched: [4:1.00]			; HASWELL-NEXT: fnclex # sched: [4:1.00]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 85 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: fcmovbe %st(1), %st(0) # sched: [3:2.00]			; SANDY-NEXT: fcmovbe %st(1), %st(0) # sched: [3:2.00]
	; SANDY-NEXT: fcmove %st(1), %st(0) # sched: [3:2.00]			; SANDY-NEXT: fcmove %st(1), %st(0) # sched: [3:2.00]
	; SANDY-NEXT: fcmovnb %st(1), %st(0) # sched: [3:2.00]			; SANDY-NEXT: fcmovnb %st(1), %st(0) # sched: [3:2.00]
	; SANDY-NEXT: fcmovnbe %st(1), %st(0) # sched: [3:2.00]			; SANDY-NEXT: fcmovnbe %st(1), %st(0) # sched: [3:2.00]
	; SANDY-NEXT: fcmovne %st(1), %st(0) # sched: [3:2.00]			; SANDY-NEXT: fcmovne %st(1), %st(0) # sched: [3:2.00]
	; SANDY-NEXT: fcmovnu %st(1), %st(0) # sched: [3:2.00]			; SANDY-NEXT: fcmovnu %st(1), %st(0) # sched: [3:2.00]
	; SANDY-NEXT: fcmovu %st(1), %st(0) # sched: [3:2.00]			; SANDY-NEXT: fcmovu %st(1), %st(0) # sched: [3:2.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fcmov:			; HASWELL-LABEL: test_fcmov:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fcmovb %st(1), %st(0) # sched: [3:1.00]			; HASWELL-NEXT: fcmovb %st(1), %st(0) # sched: [3:1.00]
	; HASWELL-NEXT: fcmovbe %st(1), %st(0) # sched: [3:1.00]			; HASWELL-NEXT: fcmovbe %st(1), %st(0) # sched: [3:1.00]
	; HASWELL-NEXT: fcmove %st(1), %st(0) # sched: [3:1.00]			; HASWELL-NEXT: fcmove %st(1), %st(0) # sched: [3:1.00]
	; HASWELL-NEXT: fcmovnb %st(1), %st(0) # sched: [3:1.00]			; HASWELL-NEXT: fcmovnb %st(1), %st(0) # sched: [3:1.00]
	▲ Show 20 Lines • Show All 119 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fcom %st(1) # sched: [1:1.00]			; SANDY-NEXT: fcom %st(1) # sched: [1:1.00]
	; SANDY-NEXT: fcom %st(3) # sched: [1:1.00]			; SANDY-NEXT: fcom %st(3) # sched: [1:1.00]
	; SANDY-NEXT: fcoms (%ecx) # sched: [8:1.00]			; SANDY-NEXT: fcoms (%ecx) # sched: [8:1.00]
	; SANDY-NEXT: fcoml (%eax) # sched: [8:1.00]			; SANDY-NEXT: fcoml (%eax) # sched: [8:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fcom:			; HASWELL-LABEL: test_fcom:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fcom %st(1) # sched: [1:1.00]			; HASWELL-NEXT: fcom %st(1) # sched: [1:1.00]
	; HASWELL-NEXT: fcom %st(3) # sched: [1:1.00]			; HASWELL-NEXT: fcom %st(3) # sched: [1:1.00]
	▲ Show 20 Lines • Show All 111 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fcomp %st(1) # sched: [1:1.00]			; SANDY-NEXT: fcomp %st(1) # sched: [1:1.00]
	; SANDY-NEXT: fcomp %st(3) # sched: [1:1.00]			; SANDY-NEXT: fcomp %st(3) # sched: [1:1.00]
	; SANDY-NEXT: fcomps (%ecx) # sched: [8:1.00]			; SANDY-NEXT: fcomps (%ecx) # sched: [8:1.00]
	; SANDY-NEXT: fcompl (%eax) # sched: [8:1.00]			; SANDY-NEXT: fcompl (%eax) # sched: [8:1.00]
	; SANDY-NEXT: fcompp # sched: [100:0.33]			; SANDY-NEXT: fcompp # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fcomp_fcompp:			; HASWELL-LABEL: test_fcomp_fcompp:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fcomp %st(1) # sched: [1:1.00]			; HASWELL-NEXT: fcomp %st(1) # sched: [1:1.00]
	; HASWELL-NEXT: fcomp %st(3) # sched: [1:1.00]			; HASWELL-NEXT: fcomp %st(3) # sched: [1:1.00]
	▲ Show 20 Lines • Show All 97 Lines • ▼ Show 20 Lines
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fcomi_fcomip:			; SANDY-LABEL: test_fcomi_fcomip:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fcomi %st(3) # sched: [3:1.00]			; SANDY-NEXT: fcomi %st(3) # sched: [3:1.00]
	; SANDY-NEXT: fcompi %st(3) # sched: [3:1.00]			; SANDY-NEXT: fcompi %st(3) # sched: [3:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fcomi_fcomip:			; HASWELL-LABEL: test_fcomi_fcomip:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fcomi %st(3) # sched: [1:0.50]			; HASWELL-NEXT: fcomi %st(3) # sched: [1:0.50]
	; HASWELL-NEXT: fcompi %st(3) # sched: [1:0.50]			; HASWELL-NEXT: fcompi %st(3) # sched: [1:0.50]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fcos:			; SANDY-LABEL: test_fcos:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fcos # sched: [100:0.33]			; SANDY-NEXT: fcos # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fcos:			; HASWELL-LABEL: test_fcos:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fcos # sched: [100:0.25]			; HASWELL-NEXT: fcos # sched: [100:0.25]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fdecstp:			; SANDY-LABEL: test_fdecstp:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fdecstp # sched: [1:1.00]			; SANDY-NEXT: fdecstp # sched: [1:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fdecstp:			; HASWELL-LABEL: test_fdecstp:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fdecstp # sched: [2:1.00]			; HASWELL-NEXT: fdecstp # sched: [2:1.00]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fdiv %st(0), %st(1) # sched: [24:1.00]			; SANDY-NEXT: fdiv %st(0), %st(1) # sched: [24:1.00]
	; SANDY-NEXT: fdiv %st(2) # sched: [24:1.00]			; SANDY-NEXT: fdiv %st(2) # sched: [24:1.00]
	; SANDY-NEXT: fdivs (%ecx) # sched: [31:1.00]			; SANDY-NEXT: fdivs (%ecx) # sched: [31:1.00]
	; SANDY-NEXT: fdivl (%eax) # sched: [31:1.00]			; SANDY-NEXT: fdivl (%eax) # sched: [31:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fdiv:			; HASWELL-LABEL: test_fdiv:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fdiv %st(0), %st(1) # sched: [24:1.00]			; HASWELL-NEXT: fdiv %st(0), %st(1) # sched: [24:1.00]
	; HASWELL-NEXT: fdiv %st(2) # sched: [20:1.00]			; HASWELL-NEXT: fdiv %st(2) # sched: [20:1.00]
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fdivp %st(1) # sched: [24:1.00]			; SANDY-NEXT: fdivp %st(1) # sched: [24:1.00]
	; SANDY-NEXT: fdivp %st(2) # sched: [24:1.00]			; SANDY-NEXT: fdivp %st(2) # sched: [24:1.00]
	; SANDY-NEXT: fidivs (%ecx) # sched: [34:1.00]			; SANDY-NEXT: fidivs (%ecx) # sched: [34:1.00]
	; SANDY-NEXT: fidivl (%eax) # sched: [34:1.00]			; SANDY-NEXT: fidivl (%eax) # sched: [34:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fdivp_fidiv:			; HASWELL-LABEL: test_fdivp_fidiv:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fdivp %st(1) # sched: [24:1.00]			; HASWELL-NEXT: fdivp %st(1) # sched: [24:1.00]
	; HASWELL-NEXT: fdivp %st(2) # sched: [24:1.00]			; HASWELL-NEXT: fdivp %st(2) # sched: [24:1.00]
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fdivr %st(0), %st(1) # sched: [24:1.00]			; SANDY-NEXT: fdivr %st(0), %st(1) # sched: [24:1.00]
	; SANDY-NEXT: fdivr %st(2) # sched: [24:1.00]			; SANDY-NEXT: fdivr %st(2) # sched: [24:1.00]
	; SANDY-NEXT: fdivrs (%ecx) # sched: [31:1.00]			; SANDY-NEXT: fdivrs (%ecx) # sched: [31:1.00]
	; SANDY-NEXT: fdivrl (%eax) # sched: [31:1.00]			; SANDY-NEXT: fdivrl (%eax) # sched: [31:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fdivr:			; HASWELL-LABEL: test_fdivr:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fdivr %st(0), %st(1) # sched: [20:1.00]			; HASWELL-NEXT: fdivr %st(0), %st(1) # sched: [20:1.00]
	; HASWELL-NEXT: fdivr %st(2) # sched: [24:1.00]			; HASWELL-NEXT: fdivr %st(2) # sched: [24:1.00]
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fdivrp %st(1) # sched: [24:1.00]			; SANDY-NEXT: fdivrp %st(1) # sched: [24:1.00]
	; SANDY-NEXT: fdivrp %st(2) # sched: [24:1.00]			; SANDY-NEXT: fdivrp %st(2) # sched: [24:1.00]
	; SANDY-NEXT: fidivrs (%ecx) # sched: [34:1.00]			; SANDY-NEXT: fidivrs (%ecx) # sched: [34:1.00]
	; SANDY-NEXT: fidivrl (%eax) # sched: [34:1.00]			; SANDY-NEXT: fidivrl (%eax) # sched: [34:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fdivrp_fidivr:			; HASWELL-LABEL: test_fdivrp_fidivr:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fdivrp %st(1) # sched: [20:1.00]			; HASWELL-NEXT: fdivrp %st(1) # sched: [20:1.00]
	; HASWELL-NEXT: fdivrp %st(2) # sched: [20:1.00]			; HASWELL-NEXT: fdivrp %st(2) # sched: [20:1.00]
	▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_ffree:			; SANDY-LABEL: test_ffree:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: ffree %st(0) # sched: [1:1.00]			; SANDY-NEXT: ffree %st(0) # sched: [1:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_ffree:			; HASWELL-LABEL: test_ffree:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: ffree %st(0) # sched: [1:0.50]			; HASWELL-NEXT: ffree %st(0) # sched: [1:0.50]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 77 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: ficoms (%ecx) # sched: [11:2.00]			; SANDY-NEXT: ficoms (%ecx) # sched: [11:2.00]
	; SANDY-NEXT: ficoml (%eax) # sched: [11:2.00]			; SANDY-NEXT: ficoml (%eax) # sched: [11:2.00]
	; SANDY-NEXT: ficomps (%ecx) # sched: [11:2.00]			; SANDY-NEXT: ficomps (%ecx) # sched: [11:2.00]
	; SANDY-NEXT: ficompl (%eax) # sched: [11:2.00]			; SANDY-NEXT: ficompl (%eax) # sched: [11:2.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_ficom:			; HASWELL-LABEL: test_ficom:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: ficoms (%ecx) # sched: [11:2.00]			; HASWELL-NEXT: ficoms (%ecx) # sched: [11:2.00]
	; HASWELL-NEXT: ficoml (%eax) # sched: [11:2.00]			; HASWELL-NEXT: ficoml (%eax) # sched: [11:2.00]
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %edx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %edx # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: filds (%edx) # sched: [10:1.00]			; SANDY-NEXT: filds (%edx) # sched: [10:1.00]
	; SANDY-NEXT: fildl (%ecx) # sched: [10:1.00]			; SANDY-NEXT: fildl (%ecx) # sched: [10:1.00]
	; SANDY-NEXT: fildll (%eax) # sched: [10:1.00]			; SANDY-NEXT: fildll (%eax) # sched: [10:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fild:			; HASWELL-LABEL: test_fild:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %edx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %edx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: filds (%edx) # sched: [10:1.00]			; HASWELL-NEXT: filds (%edx) # sched: [10:1.00]
	▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fincstp:			; SANDY-LABEL: test_fincstp:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fincstp # sched: [1:1.00]			; SANDY-NEXT: fincstp # sched: [1:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fincstp:			; HASWELL-LABEL: test_fincstp:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fincstp # sched: [1:0.50]			; HASWELL-NEXT: fincstp # sched: [1:0.50]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_finit:			; SANDY-LABEL: test_finit:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: wait # sched: [100:0.33]			; SANDY-NEXT: wait # sched: [100:0.33]
	; SANDY-NEXT: fninit # sched: [5:1.33]			; SANDY-NEXT: fninit # sched: [5:1.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_finit:			; HASWELL-LABEL: test_finit:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: wait # sched: [2:0.50]			; HASWELL-NEXT: wait # sched: [2:0.50]
	; HASWELL-NEXT: fninit # sched: [75:6.00]			; HASWELL-NEXT: fninit # sched: [75:6.00]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fninit:			; SANDY-LABEL: test_fninit:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fninit # sched: [5:1.33]			; SANDY-NEXT: fninit # sched: [5:1.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fninit:			; HASWELL-LABEL: test_fninit:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fninit # sched: [75:6.00]			; HASWELL-NEXT: fninit # sched: [75:6.00]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 97 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: fistl (%ecx) # sched: [9:1.00]			; SANDY-NEXT: fistl (%ecx) # sched: [9:1.00]
	; SANDY-NEXT: fistps (%edx) # sched: [9:1.00]			; SANDY-NEXT: fistps (%edx) # sched: [9:1.00]
	; SANDY-NEXT: fistpl (%ecx) # sched: [9:1.00]			; SANDY-NEXT: fistpl (%ecx) # sched: [9:1.00]
	; SANDY-NEXT: fistpll (%eax) # sched: [9:1.00]			; SANDY-NEXT: fistpll (%eax) # sched: [9:1.00]
	; SANDY-NEXT: fisttps (%edx) # sched: [5:1.00]			; SANDY-NEXT: fisttps (%edx) # sched: [5:1.00]
	; SANDY-NEXT: fisttpl (%ecx) # sched: [5:1.00]			; SANDY-NEXT: fisttpl (%ecx) # sched: [5:1.00]
	; SANDY-NEXT: fisttpll (%eax) # sched: [5:1.00]			; SANDY-NEXT: fisttpll (%eax) # sched: [5:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fist_fistp_fisttp:			; HASWELL-LABEL: test_fist_fistp_fisttp:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %edx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %edx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fists (%edx) # sched: [4:1.00]			; HASWELL-NEXT: fists (%edx) # sched: [4:1.00]
	▲ Show 20 Lines • Show All 141 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %edx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %edx # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fld %st(0) # sched: [1:1.00]			; SANDY-NEXT: fld %st(0) # sched: [1:1.00]
	; SANDY-NEXT: flds (%edx) # sched: [9:1.00]			; SANDY-NEXT: flds (%edx) # sched: [9:1.00]
	; SANDY-NEXT: fldl (%ecx) # sched: [9:1.00]			; SANDY-NEXT: fldl (%ecx) # sched: [9:1.00]
	; SANDY-NEXT: fldt (%eax) # sched: [9:1.00]			; SANDY-NEXT: fldt (%eax) # sched: [9:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fld:			; HASWELL-LABEL: test_fld:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %edx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %edx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fld %st(0) # sched: [1:0.50]			; HASWELL-NEXT: fld %st(0) # sched: [1:0.50]
	▲ Show 20 Lines • Show All 101 Lines • ▼ Show 20 Lines
	;			;
	; SANDY-LABEL: test_fldcw_fldenv:			; SANDY-LABEL: test_fldcw_fldenv:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fldcw (%eax) # sched: [8:2.00]			; SANDY-NEXT: fldcw (%eax) # sched: [8:2.00]
	; SANDY-NEXT: fldenv (%eax) # sched: [100:0.33]			; SANDY-NEXT: fldenv (%eax) # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fldcw_fldenv:			; HASWELL-LABEL: test_fldcw_fldenv:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fldcw (%eax) # sched: [7:1.00]			; HASWELL-NEXT: fldcw (%eax) # sched: [7:1.00]
	; HASWELL-NEXT: fldenv (%eax) # sched: [61:14.00]			; HASWELL-NEXT: fldenv (%eax) # sched: [61:14.00]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	▲ Show 20 Lines • Show All 89 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fld1 # sched: [1:?]			; SANDY-NEXT: fld1 # sched: [1:?]
	; SANDY-NEXT: fldl2e # sched: [100:0.33]			; SANDY-NEXT: fldl2e # sched: [100:0.33]
	; SANDY-NEXT: fldl2t # sched: [100:0.33]			; SANDY-NEXT: fldl2t # sched: [100:0.33]
	; SANDY-NEXT: fldln2 # sched: [100:0.33]			; SANDY-NEXT: fldln2 # sched: [100:0.33]
	; SANDY-NEXT: fldpi # sched: [100:0.33]			; SANDY-NEXT: fldpi # sched: [100:0.33]
	; SANDY-NEXT: fldz # sched: [1:?]			; SANDY-NEXT: fldz # sched: [1:?]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fld1_fldl2e_fldl2t_fldlg2_fldln2_fldpi_fldz:			; HASWELL-LABEL: test_fld1_fldl2e_fldl2t_fldlg2_fldln2_fldpi_fldz:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fld1 # sched: [1:?]			; HASWELL-NEXT: fld1 # sched: [1:?]
	; HASWELL-NEXT: fldl2e # sched: [1:0.50]			; HASWELL-NEXT: fldl2e # sched: [1:0.50]
	; HASWELL-NEXT: fldl2t # sched: [1:0.50]			; HASWELL-NEXT: fldl2t # sched: [1:0.50]
	; HASWELL-NEXT: fldln2 # sched: [1:0.50]			; HASWELL-NEXT: fldln2 # sched: [1:0.50]
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fmul %st(0), %st(1) # sched: [5:1.00]			; SANDY-NEXT: fmul %st(0), %st(1) # sched: [5:1.00]
	; SANDY-NEXT: fmul %st(2) # sched: [5:1.00]			; SANDY-NEXT: fmul %st(2) # sched: [5:1.00]
	; SANDY-NEXT: fmuls (%ecx) # sched: [12:1.00]			; SANDY-NEXT: fmuls (%ecx) # sched: [12:1.00]
	; SANDY-NEXT: fmull (%eax) # sched: [12:1.00]			; SANDY-NEXT: fmull (%eax) # sched: [12:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fmul:			; HASWELL-LABEL: test_fmul:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fmul %st(0), %st(1) # sched: [5:1.00]			; HASWELL-NEXT: fmul %st(0), %st(1) # sched: [5:1.00]
	; HASWELL-NEXT: fmul %st(2) # sched: [5:1.00]			; HASWELL-NEXT: fmul %st(2) # sched: [5:1.00]
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fmulp %st(1) # sched: [5:1.00]			; SANDY-NEXT: fmulp %st(1) # sched: [5:1.00]
	; SANDY-NEXT: fmulp %st(2) # sched: [5:1.00]			; SANDY-NEXT: fmulp %st(2) # sched: [5:1.00]
	; SANDY-NEXT: fimuls (%ecx) # sched: [15:1.00]			; SANDY-NEXT: fimuls (%ecx) # sched: [15:1.00]
	; SANDY-NEXT: fimull (%eax) # sched: [15:1.00]			; SANDY-NEXT: fimull (%eax) # sched: [15:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fmulp_fimul:			; HASWELL-LABEL: test_fmulp_fimul:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fmulp %st(1) # sched: [5:1.00]			; HASWELL-NEXT: fmulp %st(1) # sched: [5:1.00]
	; HASWELL-NEXT: fmulp %st(2) # sched: [5:1.00]			; HASWELL-NEXT: fmulp %st(2) # sched: [5:1.00]
	▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fnop:			; SANDY-LABEL: test_fnop:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fnop # sched: [1:1.00]			; SANDY-NEXT: fnop # sched: [1:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fnop:			; HASWELL-LABEL: test_fnop:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fnop # sched: [1:0.50]			; HASWELL-NEXT: fnop # sched: [1:0.50]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fpatan:			; SANDY-LABEL: test_fpatan:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fpatan # sched: [100:0.33]			; SANDY-NEXT: fpatan # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fpatan:			; HASWELL-LABEL: test_fpatan:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fpatan # sched: [100:0.25]			; HASWELL-NEXT: fpatan # sched: [100:0.25]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fprem_fprem1:			; SANDY-LABEL: test_fprem_fprem1:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fprem # sched: [100:0.33]			; SANDY-NEXT: fprem # sched: [100:0.33]
	; SANDY-NEXT: fprem1 # sched: [100:0.33]			; SANDY-NEXT: fprem1 # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fprem_fprem1:			; HASWELL-LABEL: test_fprem_fprem1:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fprem # sched: [19:?]			; HASWELL-NEXT: fprem # sched: [19:?]
	; HASWELL-NEXT: fprem1 # sched: [27:?]			; HASWELL-NEXT: fprem1 # sched: [27:?]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fptan:			; SANDY-LABEL: test_fptan:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fptan # sched: [100:0.33]			; SANDY-NEXT: fptan # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fptan:			; HASWELL-LABEL: test_fptan:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fptan # sched: [100:0.25]			; HASWELL-NEXT: fptan # sched: [100:0.25]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_frndint:			; SANDY-LABEL: test_frndint:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: frndint # sched: [100:0.33]			; SANDY-NEXT: frndint # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_frndint:			; HASWELL-LABEL: test_frndint:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: frndint # sched: [11:?]			; HASWELL-NEXT: frndint # sched: [11:?]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_frstor:			; SANDY-LABEL: test_frstor:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: frstor (%eax) # sched: [100:0.33]			; SANDY-NEXT: frstor (%eax) # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_frstor:			; HASWELL-LABEL: test_frstor:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: frstor (%eax) # sched: [1:?]			; HASWELL-NEXT: frstor (%eax) # sched: [1:?]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
	;			;
	; SANDY-LABEL: test_fsave:			; SANDY-LABEL: test_fsave:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: wait # sched: [100:0.33]			; SANDY-NEXT: wait # sched: [100:0.33]
	; SANDY-NEXT: fnsave (%eax) # sched: [100:0.33]			; SANDY-NEXT: fnsave (%eax) # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fsave:			; HASWELL-LABEL: test_fsave:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: wait # sched: [2:0.50]			; HASWELL-NEXT: wait # sched: [2:0.50]
	; HASWELL-NEXT: fnsave (%eax) # sched: [1:?]			; HASWELL-NEXT: fnsave (%eax) # sched: [1:?]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	▲ Show 20 Lines • Show All 73 Lines • ▼ Show 20 Lines
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fnsave:			; SANDY-LABEL: test_fnsave:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fnsave (%eax) # sched: [100:0.33]			; SANDY-NEXT: fnsave (%eax) # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fnsave:			; HASWELL-LABEL: test_fnsave:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fnsave (%eax) # sched: [1:?]			; HASWELL-NEXT: fnsave (%eax) # sched: [1:?]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fscale:			; SANDY-LABEL: test_fscale:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fscale # sched: [100:0.33]			; SANDY-NEXT: fscale # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fscale:			; HASWELL-LABEL: test_fscale:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fscale # sched: [75:?]			; HASWELL-NEXT: fscale # sched: [75:?]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fsin:			; SANDY-LABEL: test_fsin:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fsin # sched: [100:0.33]			; SANDY-NEXT: fsin # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fsin:			; HASWELL-LABEL: test_fsin:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fsin # sched: [100:0.25]			; HASWELL-NEXT: fsin # sched: [100:0.25]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fsincos:			; SANDY-LABEL: test_fsincos:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fsincos # sched: [100:0.33]			; SANDY-NEXT: fsincos # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fsincos:			; HASWELL-LABEL: test_fsincos:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fsincos # sched: [100:0.25]			; HASWELL-NEXT: fsincos # sched: [100:0.25]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fsqrt:			; SANDY-LABEL: test_fsqrt:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fsqrt # sched: [14:1.00]			; SANDY-NEXT: fsqrt # sched: [14:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fsqrt:			; HASWELL-LABEL: test_fsqrt:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fsqrt # sched: [15:1.00]			; HASWELL-NEXT: fsqrt # sched: [15:1.00]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 93 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: fst %st(0) # sched: [1:1.00]			; SANDY-NEXT: fst %st(0) # sched: [1:1.00]
	; SANDY-NEXT: fsts (%edx) # sched: [6:1.00]			; SANDY-NEXT: fsts (%edx) # sched: [6:1.00]
	; SANDY-NEXT: fstl (%ecx) # sched: [6:1.00]			; SANDY-NEXT: fstl (%ecx) # sched: [6:1.00]
	; SANDY-NEXT: fstp %st(0) # sched: [1:1.00]			; SANDY-NEXT: fstp %st(0) # sched: [1:1.00]
	; SANDY-NEXT: fstpl (%edx) # sched: [6:1.00]			; SANDY-NEXT: fstpl (%edx) # sched: [6:1.00]
	; SANDY-NEXT: fstpl (%ecx) # sched: [6:1.00]			; SANDY-NEXT: fstpl (%ecx) # sched: [6:1.00]
	; SANDY-NEXT: fstpt (%eax) # sched: [6:1.00]			; SANDY-NEXT: fstpt (%eax) # sched: [6:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fst_fstp:			; HASWELL-LABEL: test_fst_fstp:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %edx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %edx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fst %st(0) # sched: [1:0.50]			; HASWELL-NEXT: fst %st(0) # sched: [1:0.50]
	▲ Show 20 Lines • Show All 135 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: wait # sched: [100:0.33]			; SANDY-NEXT: wait # sched: [100:0.33]
	; SANDY-NEXT: fnstcw (%eax) # sched: [7:1.00]			; SANDY-NEXT: fnstcw (%eax) # sched: [7:1.00]
	; SANDY-NEXT: wait # sched: [100:0.33]			; SANDY-NEXT: wait # sched: [100:0.33]
	; SANDY-NEXT: fnstenv (%eax) # sched: [100:0.33]			; SANDY-NEXT: fnstenv (%eax) # sched: [100:0.33]
	; SANDY-NEXT: wait # sched: [100:0.33]			; SANDY-NEXT: wait # sched: [100:0.33]
	; SANDY-NEXT: fnstsw (%eax) # sched: [7:1.00]			; SANDY-NEXT: fnstsw (%eax) # sched: [7:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fstcw_fstenv_fstsw:			; HASWELL-LABEL: test_fstcw_fstenv_fstsw:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: wait # sched: [2:0.50]			; HASWELL-NEXT: wait # sched: [2:0.50]
	; HASWELL-NEXT: fnstcw (%eax) # sched: [2:1.00]			; HASWELL-NEXT: fnstcw (%eax) # sched: [2:1.00]
	; HASWELL-NEXT: wait # sched: [2:0.50]			; HASWELL-NEXT: wait # sched: [2:0.50]
	▲ Show 20 Lines • Show All 105 Lines • ▼ Show 20 Lines
	; SANDY-LABEL: test_fnstcw_fnstenv_fnstsw:			; SANDY-LABEL: test_fnstcw_fnstenv_fnstsw:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fnstcw (%eax) # sched: [7:1.00]			; SANDY-NEXT: fnstcw (%eax) # sched: [7:1.00]
	; SANDY-NEXT: fnstenv (%eax) # sched: [100:0.33]			; SANDY-NEXT: fnstenv (%eax) # sched: [100:0.33]
	; SANDY-NEXT: fnstsw (%eax) # sched: [7:1.00]			; SANDY-NEXT: fnstsw (%eax) # sched: [7:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fnstcw_fnstenv_fnstsw:			; HASWELL-LABEL: test_fnstcw_fnstenv_fnstsw:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fnstcw (%eax) # sched: [2:1.00]			; HASWELL-NEXT: fnstcw (%eax) # sched: [2:1.00]
	; HASWELL-NEXT: fnstenv (%eax) # sched: [115:19.50]			; HASWELL-NEXT: fnstenv (%eax) # sched: [115:19.50]
	; HASWELL-NEXT: fnstsw (%eax) # sched: [4:1.00]			; HASWELL-NEXT: fnstsw (%eax) # sched: [4:1.00]
	▲ Show 20 Lines • Show All 95 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fsub %st(0), %st(1) # sched: [3:1.00]			; SANDY-NEXT: fsub %st(0), %st(1) # sched: [3:1.00]
	; SANDY-NEXT: fsub %st(2) # sched: [3:1.00]			; SANDY-NEXT: fsub %st(2) # sched: [3:1.00]
	; SANDY-NEXT: fsubs (%ecx) # sched: [10:1.00]			; SANDY-NEXT: fsubs (%ecx) # sched: [10:1.00]
	; SANDY-NEXT: fsubl (%eax) # sched: [10:1.00]			; SANDY-NEXT: fsubl (%eax) # sched: [10:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fsub:			; HASWELL-LABEL: test_fsub:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fsub %st(0), %st(1) # sched: [3:1.00]			; HASWELL-NEXT: fsub %st(0), %st(1) # sched: [3:1.00]
	; HASWELL-NEXT: fsub %st(2) # sched: [3:1.00]			; HASWELL-NEXT: fsub %st(2) # sched: [3:1.00]
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fsubp %st(1) # sched: [3:1.00]			; SANDY-NEXT: fsubp %st(1) # sched: [3:1.00]
	; SANDY-NEXT: fsubp %st(2) # sched: [3:1.00]			; SANDY-NEXT: fsubp %st(2) # sched: [3:1.00]
	; SANDY-NEXT: fisubs (%ecx) # sched: [13:2.00]			; SANDY-NEXT: fisubs (%ecx) # sched: [13:2.00]
	; SANDY-NEXT: fisubl (%eax) # sched: [13:2.00]			; SANDY-NEXT: fisubl (%eax) # sched: [13:2.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fsubp_fisub:			; HASWELL-LABEL: test_fsubp_fisub:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fsubp %st(1) # sched: [3:1.00]			; HASWELL-NEXT: fsubp %st(1) # sched: [3:1.00]
	; HASWELL-NEXT: fsubp %st(2) # sched: [3:1.00]			; HASWELL-NEXT: fsubp %st(2) # sched: [3:1.00]
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fsubr %st(0), %st(1) # sched: [3:1.00]			; SANDY-NEXT: fsubr %st(0), %st(1) # sched: [3:1.00]
	; SANDY-NEXT: fsubr %st(2) # sched: [3:1.00]			; SANDY-NEXT: fsubr %st(2) # sched: [3:1.00]
	; SANDY-NEXT: fsubrs (%ecx) # sched: [10:1.00]			; SANDY-NEXT: fsubrs (%ecx) # sched: [10:1.00]
	; SANDY-NEXT: fsubrl (%eax) # sched: [10:1.00]			; SANDY-NEXT: fsubrl (%eax) # sched: [10:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fsubr:			; HASWELL-LABEL: test_fsubr:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fsubr %st(0), %st(1) # sched: [3:1.00]			; HASWELL-NEXT: fsubr %st(0), %st(1) # sched: [3:1.00]
	; HASWELL-NEXT: fsubr %st(2) # sched: [3:1.00]			; HASWELL-NEXT: fsubr %st(2) # sched: [3:1.00]
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fsubrp %st(1) # sched: [3:1.00]			; SANDY-NEXT: fsubrp %st(1) # sched: [3:1.00]
	; SANDY-NEXT: fsubrp %st(2) # sched: [3:1.00]			; SANDY-NEXT: fsubrp %st(2) # sched: [3:1.00]
	; SANDY-NEXT: fisubrs (%ecx) # sched: [13:2.00]			; SANDY-NEXT: fisubrs (%ecx) # sched: [13:2.00]
	; SANDY-NEXT: fisubrl (%eax) # sched: [13:2.00]			; SANDY-NEXT: fisubrl (%eax) # sched: [13:2.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fsubrp_fisubr:			; HASWELL-LABEL: test_fsubrp_fisubr:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %ecx # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fsubrp %st(1) # sched: [3:1.00]			; HASWELL-NEXT: fsubrp %st(1) # sched: [3:1.00]
	; HASWELL-NEXT: fsubrp %st(2) # sched: [3:1.00]			; HASWELL-NEXT: fsubrp %st(2) # sched: [3:1.00]
	▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_ftst:			; SANDY-LABEL: test_ftst:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: ftst # sched: [3:1.00]			; SANDY-NEXT: ftst # sched: [3:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_ftst:			; HASWELL-LABEL: test_ftst:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: ftst # sched: [1:1.00]			; HASWELL-NEXT: ftst # sched: [1:1.00]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 73 Lines • ▼ Show 20 Lines
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fucom %st(1) # sched: [1:1.00]			; SANDY-NEXT: fucom %st(1) # sched: [1:1.00]
	; SANDY-NEXT: fucom %st(3) # sched: [1:1.00]			; SANDY-NEXT: fucom %st(3) # sched: [1:1.00]
	; SANDY-NEXT: fucomp %st(1) # sched: [1:1.00]			; SANDY-NEXT: fucomp %st(1) # sched: [1:1.00]
	; SANDY-NEXT: fucomp %st(3) # sched: [1:1.00]			; SANDY-NEXT: fucomp %st(3) # sched: [1:1.00]
	; SANDY-NEXT: fucompp # sched: [3:1.00]			; SANDY-NEXT: fucompp # sched: [3:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fucom_fucomp_fucompp:			; HASWELL-LABEL: test_fucom_fucomp_fucompp:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fucom %st(1) # sched: [1:1.00]			; HASWELL-NEXT: fucom %st(1) # sched: [1:1.00]
	; HASWELL-NEXT: fucom %st(3) # sched: [1:1.00]			; HASWELL-NEXT: fucom %st(3) # sched: [1:1.00]
	; HASWELL-NEXT: fucomp %st(1) # sched: [1:1.00]			; HASWELL-NEXT: fucomp %st(1) # sched: [1:1.00]
	; HASWELL-NEXT: fucomp %st(3) # sched: [1:1.00]			; HASWELL-NEXT: fucomp %st(3) # sched: [1:1.00]
	▲ Show 20 Lines • Show All 85 Lines • ▼ Show 20 Lines
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fucomi_fucomip:			; SANDY-LABEL: test_fucomi_fucomip:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fucomi %st(3) # sched: [3:1.00]			; SANDY-NEXT: fucomi %st(3) # sched: [3:1.00]
	; SANDY-NEXT: fucompi %st(3) # sched: [3:1.00]			; SANDY-NEXT: fucompi %st(3) # sched: [3:1.00]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fucomi_fucomip:			; HASWELL-LABEL: test_fucomi_fucomip:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fucomi %st(3) # sched: [1:0.50]			; HASWELL-NEXT: fucomi %st(3) # sched: [1:0.50]
	; HASWELL-NEXT: fucompi %st(3) # sched: [1:0.50]			; HASWELL-NEXT: fucompi %st(3) # sched: [1:0.50]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	▲ Show 20 Lines • Show All 63 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fwait:			; SANDY-LABEL: test_fwait:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: wait # sched: [100:0.33]			; SANDY-NEXT: wait # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fwait:			; HASWELL-LABEL: test_fwait:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: wait # sched: [2:0.50]			; HASWELL-NEXT: wait # sched: [2:0.50]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fxam:			; SANDY-LABEL: test_fxam:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fxam # sched: [100:0.33]			; SANDY-NEXT: fxam # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fxam:			; HASWELL-LABEL: test_fxam:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fxam # sched: [1:2.00]			; HASWELL-NEXT: fxam # sched: [1:2.00]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fxch:			; SANDY-LABEL: test_fxch:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fxch %st(1) # sched: [1:0.33]			; SANDY-NEXT: fxch %st(1) # sched: [1:0.33]
	; SANDY-NEXT: fxch %st(3) # sched: [1:0.33]			; SANDY-NEXT: fxch %st(3) # sched: [1:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fxch:			; HASWELL-LABEL: test_fxch:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fxch %st(1) # sched: [17:4.00]			; HASWELL-NEXT: fxch %st(1) # sched: [17:4.00]
	; HASWELL-NEXT: fxch %st(3) # sched: [17:4.00]			; HASWELL-NEXT: fxch %st(3) # sched: [17:4.00]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	▲ Show 20 Lines • Show All 71 Lines • ▼ Show 20 Lines
	;			;
	; SANDY-LABEL: test_fxrstor_fxsave:			; SANDY-LABEL: test_fxrstor_fxsave:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; SANDY-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fxrstor (%eax) # sched: [5:2.00]			; SANDY-NEXT: fxrstor (%eax) # sched: [5:2.00]
	; SANDY-NEXT: fxsave (%eax) # sched: [100:0.33]			; SANDY-NEXT: fxsave (%eax) # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fxrstor_fxsave:			; HASWELL-LABEL: test_fxrstor_fxsave:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]			; HASWELL-NEXT: movl {{[0-9]+}}(%esp), %eax # sched: [5:0.50]
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fxrstor (%eax) # sched: [64:16.50]			; HASWELL-NEXT: fxrstor (%eax) # sched: [64:16.50]
	; HASWELL-NEXT: fxsave (%eax) # sched: [100:0.25]			; HASWELL-NEXT: fxsave (%eax) # sched: [100:0.25]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fxtract:			; SANDY-LABEL: test_fxtract:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fxtract # sched: [100:0.33]			; SANDY-NEXT: fxtract # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fxtract:			; HASWELL-LABEL: test_fxtract:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fxtract # sched: [15:?]			; HASWELL-NEXT: fxtract # sched: [15:?]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fyl2x:			; SANDY-LABEL: test_fyl2x:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fyl2x # sched: [100:0.33]			; SANDY-NEXT: fyl2x # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fyl2x:			; HASWELL-LABEL: test_fyl2x:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fyl2x # sched: [100:0.25]			; HASWELL-NEXT: fyl2x # sched: [100:0.25]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines
	; SLM-NEXT: #NO_APP			; SLM-NEXT: #NO_APP
	; SLM-NEXT: retl # sched: [4:1.00]			; SLM-NEXT: retl # sched: [4:1.00]
	;			;
	; SANDY-LABEL: test_fyl2xp1:			; SANDY-LABEL: test_fyl2xp1:
	; SANDY: # %bb.0:			; SANDY: # %bb.0:
	; SANDY-NEXT: #APP			; SANDY-NEXT: #APP
	; SANDY-NEXT: fyl2xp1 # sched: [100:0.33]			; SANDY-NEXT: fyl2xp1 # sched: [100:0.33]
	; SANDY-NEXT: #NO_APP			; SANDY-NEXT: #NO_APP
	; SANDY-NEXT: retl # sched: [5:1.00]			; SANDY-NEXT: retl # sched: [6:1.00]
	;			;
	; HASWELL-LABEL: test_fyl2xp1:			; HASWELL-LABEL: test_fyl2xp1:
	; HASWELL: # %bb.0:			; HASWELL: # %bb.0:
	; HASWELL-NEXT: #APP			; HASWELL-NEXT: #APP
	; HASWELL-NEXT: fyl2xp1 # sched: [100:0.25]			; HASWELL-NEXT: fyl2xp1 # sched: [100:0.25]
	; HASWELL-NEXT: #NO_APP			; HASWELL-NEXT: #NO_APP
	; HASWELL-NEXT: retl # sched: [7:1.00]			; HASWELL-NEXT: retl # sched: [7:1.00]
	;			;
	Show All 37 Lines

llvm/trunk/test/CodeGen/X86/xop-schedule.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=x86-64 -mattr=+xop \| FileCheck %s --check-prefix=GENERIC		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=x86-64 -mattr=+xop \| FileCheck %s --check-prefix=GENERIC
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=bdver1 \| FileCheck %s --check-prefix=BDVER --check-prefix=BDVER1		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=bdver1 \| FileCheck %s --check-prefix=BDVER --check-prefix=BDVER1
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=bdver2 \| FileCheck %s --check-prefix=BDVER --check-prefix=BDVER2		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=bdver2 \| FileCheck %s --check-prefix=BDVER --check-prefix=BDVER2
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=bdver3 \| FileCheck %s --check-prefix=BDVER --check-prefix=BDVER3		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=bdver3 \| FileCheck %s --check-prefix=BDVER --check-prefix=BDVER3
; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=bdver4 \| FileCheck %s --check-prefix=BDVER --check-prefix=BDVER4		; RUN: llc < %s -mtriple=x86_64-unknown-unknown -print-schedule -mcpu=bdver4 \| FileCheck %s --check-prefix=BDVER --check-prefix=BDVER4

define void @test_vfrczpd(<2 x double> %a0, <4 x double> %a1, <2 x double> %a2, <4 x double> %a3) {		define void @test_vfrczpd(<2 x double> %a0, <4 x double> %a1, <2 x double> %a2, <4 x double> %a3) {
; GENERIC-LABEL: test_vfrczpd:		; GENERIC-LABEL: test_vfrczpd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vfrczpd %xmm0, %xmm0 # sched: [3:1.00]		; GENERIC-NEXT: vfrczpd %xmm0, %xmm0 # sched: [3:1.00]
; GENERIC-NEXT: vfrczpd %ymm1, %ymm1 # sched: [3:1.00]		; GENERIC-NEXT: vfrczpd %ymm1, %ymm1 # sched: [3:1.00]
; GENERIC-NEXT: vfrczpd (%rdi), %xmm0 # sched: [7:1.00]		; GENERIC-NEXT: vfrczpd (%rdi), %xmm0 # sched: [8:1.00]
; GENERIC-NEXT: vfrczpd (%rsi), %ymm1 # sched: [7:1.00]		; GENERIC-NEXT: vfrczpd (%rsi), %ymm1 # sched: [8:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: vzeroupper # sched: [100:0.33]		; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vfrczpd:		; BDVER-LABEL: test_vfrczpd:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vfrczpd %xmm0, %xmm0		; BDVER-NEXT: vfrczpd %xmm0, %xmm0
; BDVER-NEXT: vfrczpd %ymm1, %ymm1		; BDVER-NEXT: vfrczpd %ymm1, %ymm1
; BDVER-NEXT: vfrczpd (%rdi), %xmm0		; BDVER-NEXT: vfrczpd (%rdi), %xmm0
; BDVER-NEXT: vfrczpd (%rsi), %ymm1		; BDVER-NEXT: vfrczpd (%rsi), %ymm1
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: vzeroupper		; BDVER-NEXT: vzeroupper
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vfrczpd $0, $0 \0a\09 vfrczpd $1, $1 \0a\09 vfrczpd $2, $0 \0a\09 vfrczpd $3, $1", "x,x,m,m"(<2 x double> %a0, <4 x double> %a1, <2 x double> %a2, <4 x double> %a3)		call void asm sideeffect "vfrczpd $0, $0 \0a\09 vfrczpd $1, $1 \0a\09 vfrczpd $2, $0 \0a\09 vfrczpd $3, $1", "x,x,m,m"(<2 x double> %a0, <4 x double> %a1, <2 x double> %a2, <4 x double> %a3)
ret void		ret void
}		}

define void @test_vfrczps(<4 x float> %a0, <4 x double> %a1, <4 x float> %a2, <4 x double> %a3) {		define void @test_vfrczps(<4 x float> %a0, <4 x double> %a1, <4 x float> %a2, <4 x double> %a3) {
; GENERIC-LABEL: test_vfrczps:		; GENERIC-LABEL: test_vfrczps:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vfrczps %xmm0, %xmm0 # sched: [3:1.00]		; GENERIC-NEXT: vfrczps %xmm0, %xmm0 # sched: [3:1.00]
; GENERIC-NEXT: vfrczps %ymm1, %ymm1 # sched: [3:1.00]		; GENERIC-NEXT: vfrczps %ymm1, %ymm1 # sched: [3:1.00]
; GENERIC-NEXT: vfrczps (%rdi), %xmm0 # sched: [7:1.00]		; GENERIC-NEXT: vfrczps (%rdi), %xmm0 # sched: [8:1.00]
; GENERIC-NEXT: vfrczps (%rsi), %ymm1 # sched: [7:1.00]		; GENERIC-NEXT: vfrczps (%rsi), %ymm1 # sched: [8:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: vzeroupper # sched: [100:0.33]		; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vfrczps:		; BDVER-LABEL: test_vfrczps:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vfrczps %xmm0, %xmm0		; BDVER-NEXT: vfrczps %xmm0, %xmm0
; BDVER-NEXT: vfrczps %ymm1, %ymm1		; BDVER-NEXT: vfrczps %ymm1, %ymm1
; BDVER-NEXT: vfrczps (%rdi), %xmm0		; BDVER-NEXT: vfrczps (%rdi), %xmm0
; BDVER-NEXT: vfrczps (%rsi), %ymm1		; BDVER-NEXT: vfrczps (%rsi), %ymm1
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: vzeroupper		; BDVER-NEXT: vzeroupper
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vfrczps $0, $0 \0a\09 vfrczps $1, $1 \0a\09 vfrczps $2, $0 \0a\09 vfrczps $3, $1", "x,x,m,m"(<4 x float> %a0, <4 x double> %a1, <4 x float> %a2, <4 x double> %a3)		call void asm sideeffect "vfrczps $0, $0 \0a\09 vfrczps $1, $1 \0a\09 vfrczps $2, $0 \0a\09 vfrczps $3, $1", "x,x,m,m"(<4 x float> %a0, <4 x double> %a1, <4 x float> %a2, <4 x double> %a3)
ret void		ret void
}		}

define void @test_vfrczsd(<2 x double> %a0, <2 x double> *%a1) {		define void @test_vfrczsd(<2 x double> %a0, <2 x double> *%a1) {
; GENERIC-LABEL: test_vfrczsd:		; GENERIC-LABEL: test_vfrczsd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vfrczsd %xmm0, %xmm0 # sched: [3:1.00]		; GENERIC-NEXT: vfrczsd %xmm0, %xmm0 # sched: [3:1.00]
; GENERIC-NEXT: vfrczsd (%rdi), %xmm0 # sched: [7:1.00]		; GENERIC-NEXT: vfrczsd (%rdi), %xmm0 # sched: [8:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vfrczsd:		; BDVER-LABEL: test_vfrczsd:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vfrczsd %xmm0, %xmm0		; BDVER-NEXT: vfrczsd %xmm0, %xmm0
; BDVER-NEXT: vfrczsd (%rdi), %xmm0		; BDVER-NEXT: vfrczsd (%rdi), %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vfrczsd $0, $0 \0a\09 vfrczsd $1, $0", "x,m"(<2 x double> %a0, <2 x double> %a1)		call void asm sideeffect "vfrczsd $0, $0 \0a\09 vfrczsd $1, $0", "x,m"(<2 x double> %a0, <2 x double> %a1)
ret void		ret void
}		}

define void @test_vfrczss(<4 x float> %a0, <4 x double> *%a1) {		define void @test_vfrczss(<4 x float> %a0, <4 x double> *%a1) {
; GENERIC-LABEL: test_vfrczss:		; GENERIC-LABEL: test_vfrczss:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vfrczss %xmm0, %xmm0 # sched: [3:1.00]		; GENERIC-NEXT: vfrczss %xmm0, %xmm0 # sched: [3:1.00]
; GENERIC-NEXT: vfrczss (%rdi), %xmm0 # sched: [7:1.00]		; GENERIC-NEXT: vfrczss (%rdi), %xmm0 # sched: [8:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vfrczss:		; BDVER-LABEL: test_vfrczss:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vfrczss %xmm0, %xmm0		; BDVER-NEXT: vfrczss %xmm0, %xmm0
; BDVER-NEXT: vfrczss (%rdi), %xmm0		; BDVER-NEXT: vfrczss (%rdi), %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vfrczss $0, $0 \0a\09 vfrczss $1, $0", "x,m"(<4 x float> %a0, <4 x double> %a1)		call void asm sideeffect "vfrczss $0, $0 \0a\09 vfrczss $1, $0", "x,m"(<4 x float> %a0, <4 x double> %a1)
ret void		ret void
}		}

define void @test_vpcmov_128(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {		define void @test_vpcmov_128(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {
; GENERIC-LABEL: test_vpcmov_128:		; GENERIC-LABEL: test_vpcmov_128:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vpcmov %xmm2, %xmm1, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpcmov %xmm2, %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpcmov (%rdi), %xmm1, %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpcmov (%rdi), %xmm1, %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vpcmov %xmm2, (%rdi), %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpcmov %xmm2, (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vpcmov_128:		; BDVER-LABEL: test_vpcmov_128:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vpcmov %xmm2, %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpcmov %xmm2, %xmm1, %xmm0, %xmm0
; BDVER-NEXT: vpcmov (%rdi), %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpcmov (%rdi), %xmm1, %xmm0, %xmm0
; BDVER-NEXT: vpcmov %xmm2, (%rdi), %xmm0, %xmm0		; BDVER-NEXT: vpcmov %xmm2, (%rdi), %xmm0, %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vpcmov $2, $1, $0, $0 \0a\09 vpcmov $3, $1, $0, $0 \0a\09 vpcmov $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)		call void asm sideeffect "vpcmov $2, $1, $0, $0 \0a\09 vpcmov $3, $1, $0, $0 \0a\09 vpcmov $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)
ret void		ret void
}		}

define void @test_vpcmov_256(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> %a2, <4 x i64> *%a3) {		define void @test_vpcmov_256(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> %a2, <4 x i64> *%a3) {
; GENERIC-LABEL: test_vpcmov_256:		; GENERIC-LABEL: test_vpcmov_256:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vpcmov %ymm2, %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpcmov %ymm2, %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpcmov (%rdi), %ymm1, %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpcmov (%rdi), %ymm1, %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: vpcmov %ymm2, (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpcmov %ymm2, (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: vzeroupper # sched: [100:0.33]		; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vpcmov_256:		; BDVER-LABEL: test_vpcmov_256:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vpcmov %ymm2, %ymm1, %ymm0, %ymm0		; BDVER-NEXT: vpcmov %ymm2, %ymm1, %ymm0, %ymm0
Show All 9 Lines
define void @test_vpcom(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> *%a2) {		define void @test_vpcom(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> *%a2) {
; GENERIC-LABEL: test_vpcom:		; GENERIC-LABEL: test_vpcom:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vpcomb $3, %xmm1, %xmm0, %xmm0 # sched: [3:1.00]		; GENERIC-NEXT: vpcomb $3, %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
; GENERIC-NEXT: vpcomd $3, %xmm1, %xmm0, %xmm0 # sched: [3:1.00]		; GENERIC-NEXT: vpcomd $3, %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
; GENERIC-NEXT: vpcomq $3, %xmm1, %xmm0, %xmm0 # sched: [3:1.00]		; GENERIC-NEXT: vpcomq $3, %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
; GENERIC-NEXT: vpcomw $3, %xmm1, %xmm0, %xmm0 # sched: [3:1.00]		; GENERIC-NEXT: vpcomw $3, %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
; GENERIC-NEXT: vpcomb $3, (%rdi), %xmm0, %xmm0 # sched: [7:1.00]		; GENERIC-NEXT: vpcomb $3, (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
; GENERIC-NEXT: vpcomd $3, (%rdi), %xmm0, %xmm0 # sched: [7:1.00]		; GENERIC-NEXT: vpcomd $3, (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
; GENERIC-NEXT: vpcomq $3, (%rdi), %xmm0, %xmm0 # sched: [7:1.00]		; GENERIC-NEXT: vpcomq $3, (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
; GENERIC-NEXT: vpcomw $3, (%rdi), %xmm0, %xmm0 # sched: [7:1.00]		; GENERIC-NEXT: vpcomw $3, (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vpcom:		; BDVER-LABEL: test_vpcom:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vpcomb $3, %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpcomb $3, %xmm1, %xmm0, %xmm0
; BDVER-NEXT: vpcomd $3, %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpcomd $3, %xmm1, %xmm0, %xmm0
Show All 12 Lines
define void @test_vpcomu(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> *%a2) {		define void @test_vpcomu(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> *%a2) {
; GENERIC-LABEL: test_vpcomu:		; GENERIC-LABEL: test_vpcomu:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vpcomub $3, %xmm1, %xmm0, %xmm0 # sched: [3:1.00]		; GENERIC-NEXT: vpcomub $3, %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
; GENERIC-NEXT: vpcomud $3, %xmm1, %xmm0, %xmm0 # sched: [3:1.00]		; GENERIC-NEXT: vpcomud $3, %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
; GENERIC-NEXT: vpcomuq $3, %xmm1, %xmm0, %xmm0 # sched: [3:1.00]		; GENERIC-NEXT: vpcomuq $3, %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
; GENERIC-NEXT: vpcomuw $3, %xmm1, %xmm0, %xmm0 # sched: [3:1.00]		; GENERIC-NEXT: vpcomuw $3, %xmm1, %xmm0, %xmm0 # sched: [3:1.00]
; GENERIC-NEXT: vpcomub $3, (%rdi), %xmm0, %xmm0 # sched: [7:1.00]		; GENERIC-NEXT: vpcomub $3, (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
; GENERIC-NEXT: vpcomud $3, (%rdi), %xmm0, %xmm0 # sched: [7:1.00]		; GENERIC-NEXT: vpcomud $3, (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
; GENERIC-NEXT: vpcomuq $3, (%rdi), %xmm0, %xmm0 # sched: [7:1.00]		; GENERIC-NEXT: vpcomuq $3, (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
; GENERIC-NEXT: vpcomuw $3, (%rdi), %xmm0, %xmm0 # sched: [7:1.00]		; GENERIC-NEXT: vpcomuw $3, (%rdi), %xmm0, %xmm0 # sched: [8:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vpcomu:		; BDVER-LABEL: test_vpcomu:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vpcomub $3, %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpcomub $3, %xmm1, %xmm0, %xmm0
; BDVER-NEXT: vpcomud $3, %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpcomud $3, %xmm1, %xmm0, %xmm0
Show All 9 Lines	; BDVER-NEXT: retq
ret void		ret void
}		}

define void @test_vpermil2pd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) {		define void @test_vpermil2pd_128(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> *%a3) {
; GENERIC-LABEL: test_vpermil2pd_128:		; GENERIC-LABEL: test_vpermil2pd_128:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vpermil2pd $3, %xmm2, %xmm1, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpermil2pd $3, %xmm2, %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpermil2pd $3, %xmm2, (%rdi), %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermil2pd $3, %xmm2, (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vpermil2pd $3, (%rdi), %xmm1, %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermil2pd $3, (%rdi), %xmm1, %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vpermil2pd_128:		; BDVER-LABEL: test_vpermil2pd_128:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vpermil2pd $3, %xmm2, %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpermil2pd $3, %xmm2, %xmm1, %xmm0, %xmm0
; BDVER-NEXT: vpermil2pd $3, %xmm2, (%rdi), %xmm0, %xmm0		; BDVER-NEXT: vpermil2pd $3, %xmm2, (%rdi), %xmm0, %xmm0
; BDVER-NEXT: vpermil2pd $3, (%rdi), %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpermil2pd $3, (%rdi), %xmm1, %xmm0, %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vpermil2pd $4, $2, $1, $0, $0 \0a\09 vpermil2pd $4, $2, $3, $0, $0 \0a\09 vpermil2pd $4, $3, $1, $0, $0", "x,x,x,m,i"(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> %a3, i8 3)		call void asm sideeffect "vpermil2pd $4, $2, $1, $0, $0 \0a\09 vpermil2pd $4, $2, $3, $0, $0 \0a\09 vpermil2pd $4, $3, $1, $0, $0", "x,x,x,m,i"(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2, <2 x double> %a3, i8 3)
ret void		ret void
}		}

define void @test_vpermil2pd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) {		define void @test_vpermil2pd_256(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> *%a3) {
; GENERIC-LABEL: test_vpermil2pd_256:		; GENERIC-LABEL: test_vpermil2pd_256:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vpermil2pd $3, %ymm2, %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpermil2pd $3, %ymm2, %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpermil2pd $3, %ymm2, (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermil2pd $3, %ymm2, (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: vpermil2pd $3, (%rdi), %ymm1, %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermil2pd $3, (%rdi), %ymm1, %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: vzeroupper # sched: [100:0.33]		; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vpermil2pd_256:		; BDVER-LABEL: test_vpermil2pd_256:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vpermil2pd $3, %ymm2, %ymm1, %ymm0, %ymm0		; BDVER-NEXT: vpermil2pd $3, %ymm2, %ymm1, %ymm0, %ymm0
; BDVER-NEXT: vpermil2pd $3, %ymm2, (%rdi), %ymm0, %ymm0		; BDVER-NEXT: vpermil2pd $3, %ymm2, (%rdi), %ymm0, %ymm0
; BDVER-NEXT: vpermil2pd $3, (%rdi), %ymm1, %ymm0, %ymm0		; BDVER-NEXT: vpermil2pd $3, (%rdi), %ymm1, %ymm0, %ymm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: vzeroupper		; BDVER-NEXT: vzeroupper
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vpermil2pd $4, $2, $1, $0, $0 \0a\09 vpermil2pd $4, $2, $3, $0, $0 \0a\09 vpermil2pd $4, $3, $1, $0, $0", "x,x,x,m,i"(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> %a3, i8 3)		call void asm sideeffect "vpermil2pd $4, $2, $1, $0, $0 \0a\09 vpermil2pd $4, $2, $3, $0, $0 \0a\09 vpermil2pd $4, $3, $1, $0, $0", "x,x,x,m,i"(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2, <4 x double> %a3, i8 3)
ret void		ret void
}		}

define void @test_vpermil2ps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) {		define void @test_vpermil2ps_128(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> *%a3) {
; GENERIC-LABEL: test_vpermil2ps_128:		; GENERIC-LABEL: test_vpermil2ps_128:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vpermil2ps $3, %xmm2, %xmm1, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpermil2ps $3, %xmm2, %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpermil2ps $3, %xmm2, (%rdi), %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermil2ps $3, %xmm2, (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vpermil2ps $3, (%rdi), %xmm1, %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermil2ps $3, (%rdi), %xmm1, %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vpermil2ps_128:		; BDVER-LABEL: test_vpermil2ps_128:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vpermil2ps $3, %xmm2, %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpermil2ps $3, %xmm2, %xmm1, %xmm0, %xmm0
; BDVER-NEXT: vpermil2ps $3, %xmm2, (%rdi), %xmm0, %xmm0		; BDVER-NEXT: vpermil2ps $3, %xmm2, (%rdi), %xmm0, %xmm0
; BDVER-NEXT: vpermil2ps $3, (%rdi), %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpermil2ps $3, (%rdi), %xmm1, %xmm0, %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vpermil2ps $4, $2, $1, $0, $0 \0a\09 vpermil2ps $4, $2, $3, $0, $0 \0a\09 vpermil2ps $4, $3, $1, $0, $0", "x,x,x,m,i"(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> %a3, i8 3)		call void asm sideeffect "vpermil2ps $4, $2, $1, $0, $0 \0a\09 vpermil2ps $4, $2, $3, $0, $0 \0a\09 vpermil2ps $4, $3, $1, $0, $0", "x,x,x,m,i"(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2, <4 x float> %a3, i8 3)
ret void		ret void
}		}

define void @test_vpermil2ps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) {		define void @test_vpermil2ps_256(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> *%a3) {
; GENERIC-LABEL: test_vpermil2ps_256:		; GENERIC-LABEL: test_vpermil2ps_256:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vpermil2ps $3, %ymm2, %ymm1, %ymm0, %ymm0 # sched: [1:1.00]		; GENERIC-NEXT: vpermil2ps $3, %ymm2, %ymm1, %ymm0, %ymm0 # sched: [1:1.00]
; GENERIC-NEXT: vpermil2ps $3, %ymm2, (%rdi), %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermil2ps $3, %ymm2, (%rdi), %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: vpermil2ps $3, (%rdi), %ymm1, %ymm0, %ymm0 # sched: [5:1.00]		; GENERIC-NEXT: vpermil2ps $3, (%rdi), %ymm1, %ymm0, %ymm0 # sched: [6:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: vzeroupper # sched: [100:0.33]		; GENERIC-NEXT: vzeroupper # sched: [100:0.33]
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vpermil2ps_256:		; BDVER-LABEL: test_vpermil2ps_256:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vpermil2ps $3, %ymm2, %ymm1, %ymm0, %ymm0		; BDVER-NEXT: vpermil2ps $3, %ymm2, %ymm1, %ymm0, %ymm0
; BDVER-NEXT: vpermil2ps $3, %ymm2, (%rdi), %ymm0, %ymm0		; BDVER-NEXT: vpermil2ps $3, %ymm2, (%rdi), %ymm0, %ymm0
; BDVER-NEXT: vpermil2ps $3, (%rdi), %ymm1, %ymm0, %ymm0		; BDVER-NEXT: vpermil2ps $3, (%rdi), %ymm1, %ymm0, %ymm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: vzeroupper		; BDVER-NEXT: vzeroupper
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vpermil2ps $4, $2, $1, $0, $0 \0a\09 vpermil2ps $4, $2, $3, $0, $0 \0a\09 vpermil2ps $4, $3, $1, $0, $0", "x,x,x,m,i"(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> %a3, i8 3)		call void asm sideeffect "vpermil2ps $4, $2, $1, $0, $0 \0a\09 vpermil2ps $4, $2, $3, $0, $0 \0a\09 vpermil2ps $4, $3, $1, $0, $0", "x,x,x,m,i"(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2, <8 x float> %a3, i8 3)
ret void		ret void
}		}

define void @test_vphaddbd(<2 x i64> %a0, <2 x i64> *%a1) {		define void @test_vphaddbd(<2 x i64> %a0, <2 x i64> *%a1) {
; GENERIC-LABEL: test_vphaddbd:		; GENERIC-LABEL: test_vphaddbd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vphaddbd %xmm0, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vphaddbd %xmm0, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: vphaddbd (%rdi), %xmm0 # sched: [5:0.50]		; GENERIC-NEXT: vphaddbd (%rdi), %xmm0 # sched: [6:0.50]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vphaddbd:		; BDVER-LABEL: test_vphaddbd:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vphaddbd %xmm0, %xmm0		; BDVER-NEXT: vphaddbd %xmm0, %xmm0
; BDVER-NEXT: vphaddbd (%rdi), %xmm0		; BDVER-NEXT: vphaddbd (%rdi), %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vphaddbd $0, $0 \0a\09 vphaddbd $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)		call void asm sideeffect "vphaddbd $0, $0 \0a\09 vphaddbd $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)
ret void		ret void
}		}

define void @test_vphaddbq(<2 x i64> %a0, <2 x i64> *%a1) {		define void @test_vphaddbq(<2 x i64> %a0, <2 x i64> *%a1) {
; GENERIC-LABEL: test_vphaddbq:		; GENERIC-LABEL: test_vphaddbq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vphaddbq %xmm0, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vphaddbq %xmm0, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: vphaddbq (%rdi), %xmm0 # sched: [5:0.50]		; GENERIC-NEXT: vphaddbq (%rdi), %xmm0 # sched: [6:0.50]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vphaddbq:		; BDVER-LABEL: test_vphaddbq:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vphaddbq %xmm0, %xmm0		; BDVER-NEXT: vphaddbq %xmm0, %xmm0
; BDVER-NEXT: vphaddbq (%rdi), %xmm0		; BDVER-NEXT: vphaddbq (%rdi), %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vphaddbq $0, $0 \0a\09 vphaddbq $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)		call void asm sideeffect "vphaddbq $0, $0 \0a\09 vphaddbq $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)
ret void		ret void
}		}

define void @test_vphaddbw(<2 x i64> %a0, <2 x i64> *%a1) {		define void @test_vphaddbw(<2 x i64> %a0, <2 x i64> *%a1) {
; GENERIC-LABEL: test_vphaddbw:		; GENERIC-LABEL: test_vphaddbw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vphaddbw %xmm0, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vphaddbw %xmm0, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: vphaddbw (%rdi), %xmm0 # sched: [5:0.50]		; GENERIC-NEXT: vphaddbw (%rdi), %xmm0 # sched: [6:0.50]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vphaddbw:		; BDVER-LABEL: test_vphaddbw:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vphaddbw %xmm0, %xmm0		; BDVER-NEXT: vphaddbw %xmm0, %xmm0
; BDVER-NEXT: vphaddbw (%rdi), %xmm0		; BDVER-NEXT: vphaddbw (%rdi), %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vphaddbw $0, $0 \0a\09 vphaddbw $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)		call void asm sideeffect "vphaddbw $0, $0 \0a\09 vphaddbw $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)
ret void		ret void
}		}

define void @test_vphadddq(<2 x i64> %a0, <2 x i64> *%a1) {		define void @test_vphadddq(<2 x i64> %a0, <2 x i64> *%a1) {
; GENERIC-LABEL: test_vphadddq:		; GENERIC-LABEL: test_vphadddq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vphadddq %xmm0, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vphadddq %xmm0, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: vphadddq (%rdi), %xmm0 # sched: [5:0.50]		; GENERIC-NEXT: vphadddq (%rdi), %xmm0 # sched: [6:0.50]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vphadddq:		; BDVER-LABEL: test_vphadddq:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vphadddq %xmm0, %xmm0		; BDVER-NEXT: vphadddq %xmm0, %xmm0
; BDVER-NEXT: vphadddq (%rdi), %xmm0		; BDVER-NEXT: vphadddq (%rdi), %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vphadddq $0, $0 \0a\09 vphadddq $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)		call void asm sideeffect "vphadddq $0, $0 \0a\09 vphadddq $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)
ret void		ret void
}		}

define void @test_vphaddubd(<2 x i64> %a0, <2 x i64> *%a1) {		define void @test_vphaddubd(<2 x i64> %a0, <2 x i64> *%a1) {
; GENERIC-LABEL: test_vphaddubd:		; GENERIC-LABEL: test_vphaddubd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vphaddubd %xmm0, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vphaddubd %xmm0, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: vphaddubd (%rdi), %xmm0 # sched: [5:0.50]		; GENERIC-NEXT: vphaddubd (%rdi), %xmm0 # sched: [6:0.50]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vphaddubd:		; BDVER-LABEL: test_vphaddubd:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vphaddubd %xmm0, %xmm0		; BDVER-NEXT: vphaddubd %xmm0, %xmm0
; BDVER-NEXT: vphaddubd (%rdi), %xmm0		; BDVER-NEXT: vphaddubd (%rdi), %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vphaddubd $0, $0 \0a\09 vphaddubd $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)		call void asm sideeffect "vphaddubd $0, $0 \0a\09 vphaddubd $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)
ret void		ret void
}		}

define void @test_vphaddubq(<2 x i64> %a0, <2 x i64> *%a1) {		define void @test_vphaddubq(<2 x i64> %a0, <2 x i64> *%a1) {
; GENERIC-LABEL: test_vphaddubq:		; GENERIC-LABEL: test_vphaddubq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vphaddubq %xmm0, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vphaddubq %xmm0, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: vphaddubq (%rdi), %xmm0 # sched: [5:0.50]		; GENERIC-NEXT: vphaddubq (%rdi), %xmm0 # sched: [6:0.50]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vphaddubq:		; BDVER-LABEL: test_vphaddubq:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vphaddubq %xmm0, %xmm0		; BDVER-NEXT: vphaddubq %xmm0, %xmm0
; BDVER-NEXT: vphaddubq (%rdi), %xmm0		; BDVER-NEXT: vphaddubq (%rdi), %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vphaddubq $0, $0 \0a\09 vphaddubq $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)		call void asm sideeffect "vphaddubq $0, $0 \0a\09 vphaddubq $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)
ret void		ret void
}		}

define void @test_vphaddubw(<2 x i64> %a0, <2 x i64> *%a1) {		define void @test_vphaddubw(<2 x i64> %a0, <2 x i64> *%a1) {
; GENERIC-LABEL: test_vphaddubw:		; GENERIC-LABEL: test_vphaddubw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vphaddubw %xmm0, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vphaddubw %xmm0, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: vphaddubw (%rdi), %xmm0 # sched: [5:0.50]		; GENERIC-NEXT: vphaddubw (%rdi), %xmm0 # sched: [6:0.50]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vphaddubw:		; BDVER-LABEL: test_vphaddubw:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vphaddubw %xmm0, %xmm0		; BDVER-NEXT: vphaddubw %xmm0, %xmm0
; BDVER-NEXT: vphaddubw (%rdi), %xmm0		; BDVER-NEXT: vphaddubw (%rdi), %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vphaddubw $0, $0 \0a\09 vphaddubw $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)		call void asm sideeffect "vphaddubw $0, $0 \0a\09 vphaddubw $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)
ret void		ret void
}		}

define void @test_vphaddudq(<2 x i64> %a0, <2 x i64> *%a1) {		define void @test_vphaddudq(<2 x i64> %a0, <2 x i64> *%a1) {
; GENERIC-LABEL: test_vphaddudq:		; GENERIC-LABEL: test_vphaddudq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vphaddudq %xmm0, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vphaddudq %xmm0, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: vphaddudq (%rdi), %xmm0 # sched: [5:0.50]		; GENERIC-NEXT: vphaddudq (%rdi), %xmm0 # sched: [6:0.50]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vphaddudq:		; BDVER-LABEL: test_vphaddudq:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vphaddudq %xmm0, %xmm0		; BDVER-NEXT: vphaddudq %xmm0, %xmm0
; BDVER-NEXT: vphaddudq (%rdi), %xmm0		; BDVER-NEXT: vphaddudq (%rdi), %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vphaddudq $0, $0 \0a\09 vphaddudq $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)		call void asm sideeffect "vphaddudq $0, $0 \0a\09 vphaddudq $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)
ret void		ret void
}		}

define void @test_vphadduwd(<2 x i64> %a0, <2 x i64> *%a1) {		define void @test_vphadduwd(<2 x i64> %a0, <2 x i64> *%a1) {
; GENERIC-LABEL: test_vphadduwd:		; GENERIC-LABEL: test_vphadduwd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vphadduwd %xmm0, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vphadduwd %xmm0, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: vphadduwd (%rdi), %xmm0 # sched: [5:0.50]		; GENERIC-NEXT: vphadduwd (%rdi), %xmm0 # sched: [6:0.50]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vphadduwd:		; BDVER-LABEL: test_vphadduwd:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vphadduwd %xmm0, %xmm0		; BDVER-NEXT: vphadduwd %xmm0, %xmm0
; BDVER-NEXT: vphadduwd (%rdi), %xmm0		; BDVER-NEXT: vphadduwd (%rdi), %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vphadduwd $0, $0 \0a\09 vphadduwd $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)		call void asm sideeffect "vphadduwd $0, $0 \0a\09 vphadduwd $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)
ret void		ret void
}		}

define void @test_vphadduwq(<2 x i64> %a0, <2 x i64> *%a1) {		define void @test_vphadduwq(<2 x i64> %a0, <2 x i64> *%a1) {
; GENERIC-LABEL: test_vphadduwq:		; GENERIC-LABEL: test_vphadduwq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vphadduwq %xmm0, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vphadduwq %xmm0, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: vphadduwq (%rdi), %xmm0 # sched: [5:0.50]		; GENERIC-NEXT: vphadduwq (%rdi), %xmm0 # sched: [6:0.50]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vphadduwq:		; BDVER-LABEL: test_vphadduwq:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vphadduwq %xmm0, %xmm0		; BDVER-NEXT: vphadduwq %xmm0, %xmm0
; BDVER-NEXT: vphadduwq (%rdi), %xmm0		; BDVER-NEXT: vphadduwq (%rdi), %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vphadduwq $0, $0 \0a\09 vphadduwq $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)		call void asm sideeffect "vphadduwq $0, $0 \0a\09 vphadduwq $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)
ret void		ret void
}		}

define void @test_vphaddwd(<2 x i64> %a0, <2 x i64> *%a1) {		define void @test_vphaddwd(<2 x i64> %a0, <2 x i64> *%a1) {
; GENERIC-LABEL: test_vphaddwd:		; GENERIC-LABEL: test_vphaddwd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vphaddwd %xmm0, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vphaddwd %xmm0, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: vphaddwd (%rdi), %xmm0 # sched: [5:0.50]		; GENERIC-NEXT: vphaddwd (%rdi), %xmm0 # sched: [6:0.50]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vphaddwd:		; BDVER-LABEL: test_vphaddwd:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vphaddwd %xmm0, %xmm0		; BDVER-NEXT: vphaddwd %xmm0, %xmm0
; BDVER-NEXT: vphaddwd (%rdi), %xmm0		; BDVER-NEXT: vphaddwd (%rdi), %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vphaddwd $0, $0 \0a\09 vphaddwd $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)		call void asm sideeffect "vphaddwd $0, $0 \0a\09 vphaddwd $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)
ret void		ret void
}		}

define void @test_vphaddwq(<2 x i64> %a0, <2 x i64> *%a1) {		define void @test_vphaddwq(<2 x i64> %a0, <2 x i64> *%a1) {
; GENERIC-LABEL: test_vphaddwq:		; GENERIC-LABEL: test_vphaddwq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vphaddwq %xmm0, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vphaddwq %xmm0, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: vphaddwq (%rdi), %xmm0 # sched: [5:0.50]		; GENERIC-NEXT: vphaddwq (%rdi), %xmm0 # sched: [6:0.50]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vphaddwq:		; BDVER-LABEL: test_vphaddwq:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vphaddwq %xmm0, %xmm0		; BDVER-NEXT: vphaddwq %xmm0, %xmm0
; BDVER-NEXT: vphaddwq (%rdi), %xmm0		; BDVER-NEXT: vphaddwq (%rdi), %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vphaddwq $0, $0 \0a\09 vphaddwq $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)		call void asm sideeffect "vphaddwq $0, $0 \0a\09 vphaddwq $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)
ret void		ret void
}		}

define void @test_vphsubbw(<2 x i64> %a0, <2 x i64> *%a1) {		define void @test_vphsubbw(<2 x i64> %a0, <2 x i64> *%a1) {
; GENERIC-LABEL: test_vphsubbw:		; GENERIC-LABEL: test_vphsubbw:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vphsubbw %xmm0, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vphsubbw %xmm0, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: vphsubbw (%rdi), %xmm0 # sched: [5:0.50]		; GENERIC-NEXT: vphsubbw (%rdi), %xmm0 # sched: [6:0.50]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vphsubbw:		; BDVER-LABEL: test_vphsubbw:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vphsubbw %xmm0, %xmm0		; BDVER-NEXT: vphsubbw %xmm0, %xmm0
; BDVER-NEXT: vphsubbw (%rdi), %xmm0		; BDVER-NEXT: vphsubbw (%rdi), %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vphsubbw $0, $0 \0a\09 vphsubbw $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)		call void asm sideeffect "vphsubbw $0, $0 \0a\09 vphsubbw $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)
ret void		ret void
}		}

define void @test_vphsubdq(<2 x i64> %a0, <2 x i64> *%a1) {		define void @test_vphsubdq(<2 x i64> %a0, <2 x i64> *%a1) {
; GENERIC-LABEL: test_vphsubdq:		; GENERIC-LABEL: test_vphsubdq:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vphsubdq %xmm0, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vphsubdq %xmm0, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: vphsubdq (%rdi), %xmm0 # sched: [5:0.50]		; GENERIC-NEXT: vphsubdq (%rdi), %xmm0 # sched: [6:0.50]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vphsubdq:		; BDVER-LABEL: test_vphsubdq:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vphsubdq %xmm0, %xmm0		; BDVER-NEXT: vphsubdq %xmm0, %xmm0
; BDVER-NEXT: vphsubdq (%rdi), %xmm0		; BDVER-NEXT: vphsubdq (%rdi), %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vphsubdq $0, $0 \0a\09 vphsubdq $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)		call void asm sideeffect "vphsubdq $0, $0 \0a\09 vphsubdq $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)
ret void		ret void
}		}

define void @test_vphsubwd(<2 x i64> %a0, <2 x i64> *%a1) {		define void @test_vphsubwd(<2 x i64> %a0, <2 x i64> *%a1) {
; GENERIC-LABEL: test_vphsubwd:		; GENERIC-LABEL: test_vphsubwd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vphsubwd %xmm0, %xmm0 # sched: [1:0.50]		; GENERIC-NEXT: vphsubwd %xmm0, %xmm0 # sched: [1:0.50]
; GENERIC-NEXT: vphsubwd (%rdi), %xmm0 # sched: [5:0.50]		; GENERIC-NEXT: vphsubwd (%rdi), %xmm0 # sched: [6:0.50]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vphsubwd:		; BDVER-LABEL: test_vphsubwd:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vphsubwd %xmm0, %xmm0		; BDVER-NEXT: vphsubwd %xmm0, %xmm0
; BDVER-NEXT: vphsubwd (%rdi), %xmm0		; BDVER-NEXT: vphsubwd (%rdi), %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vphsubwd $0, $0 \0a\09 vphsubwd $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)		call void asm sideeffect "vphsubwd $0, $0 \0a\09 vphsubwd $1, $0", "x,m"(<2 x i64> %a0, <2 x i64> %a1)
ret void		ret void
}		}

define void @test_vpmacsdd(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {		define void @test_vpmacsdd(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {
; GENERIC-LABEL: test_vpmacsdd:		; GENERIC-LABEL: test_vpmacsdd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vpmacsdd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmacsdd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
; GENERIC-NEXT: vpmacsdd %xmm2, (%rdi), %xmm0, %xmm0 # sched: [9:1.00]		; GENERIC-NEXT: vpmacsdd %xmm2, (%rdi), %xmm0, %xmm0 # sched: [10:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vpmacsdd:		; BDVER-LABEL: test_vpmacsdd:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vpmacsdd %xmm2, %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpmacsdd %xmm2, %xmm1, %xmm0, %xmm0
; BDVER-NEXT: vpmacsdd %xmm2, (%rdi), %xmm0, %xmm0		; BDVER-NEXT: vpmacsdd %xmm2, (%rdi), %xmm0, %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vpmacsdd $2, $1, $0, $0 \0a\09 vpmacsdd $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)		call void asm sideeffect "vpmacsdd $2, $1, $0, $0 \0a\09 vpmacsdd $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)
ret void		ret void
}		}

define void @test_vpmacsdqh(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {		define void @test_vpmacsdqh(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {
; GENERIC-LABEL: test_vpmacsdqh:		; GENERIC-LABEL: test_vpmacsdqh:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vpmacsdqh %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmacsdqh %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
; GENERIC-NEXT: vpmacsdqh %xmm2, (%rdi), %xmm0, %xmm0 # sched: [9:1.00]		; GENERIC-NEXT: vpmacsdqh %xmm2, (%rdi), %xmm0, %xmm0 # sched: [10:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vpmacsdqh:		; BDVER-LABEL: test_vpmacsdqh:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vpmacsdqh %xmm2, %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpmacsdqh %xmm2, %xmm1, %xmm0, %xmm0
; BDVER-NEXT: vpmacsdqh %xmm2, (%rdi), %xmm0, %xmm0		; BDVER-NEXT: vpmacsdqh %xmm2, (%rdi), %xmm0, %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vpmacsdqh $2, $1, $0, $0 \0a\09 vpmacsdqh $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)		call void asm sideeffect "vpmacsdqh $2, $1, $0, $0 \0a\09 vpmacsdqh $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)
ret void		ret void
}		}

define void @test_vpmacsdql(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {		define void @test_vpmacsdql(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {
; GENERIC-LABEL: test_vpmacsdql:		; GENERIC-LABEL: test_vpmacsdql:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vpmacsdql %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmacsdql %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
; GENERIC-NEXT: vpmacsdql %xmm2, (%rdi), %xmm0, %xmm0 # sched: [9:1.00]		; GENERIC-NEXT: vpmacsdql %xmm2, (%rdi), %xmm0, %xmm0 # sched: [10:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vpmacsdql:		; BDVER-LABEL: test_vpmacsdql:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vpmacsdql %xmm2, %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpmacsdql %xmm2, %xmm1, %xmm0, %xmm0
; BDVER-NEXT: vpmacsdql %xmm2, (%rdi), %xmm0, %xmm0		; BDVER-NEXT: vpmacsdql %xmm2, (%rdi), %xmm0, %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vpmacsdql $2, $1, $0, $0 \0a\09 vpmacsdql $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)		call void asm sideeffect "vpmacsdql $2, $1, $0, $0 \0a\09 vpmacsdql $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)
ret void		ret void
}		}

define void @test_vpmacssdd(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {		define void @test_vpmacssdd(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {
; GENERIC-LABEL: test_vpmacssdd:		; GENERIC-LABEL: test_vpmacssdd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vpmacssdd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmacssdd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
; GENERIC-NEXT: vpmacssdd %xmm2, (%rdi), %xmm0, %xmm0 # sched: [9:1.00]		; GENERIC-NEXT: vpmacssdd %xmm2, (%rdi), %xmm0, %xmm0 # sched: [10:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vpmacssdd:		; BDVER-LABEL: test_vpmacssdd:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vpmacssdd %xmm2, %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpmacssdd %xmm2, %xmm1, %xmm0, %xmm0
; BDVER-NEXT: vpmacssdd %xmm2, (%rdi), %xmm0, %xmm0		; BDVER-NEXT: vpmacssdd %xmm2, (%rdi), %xmm0, %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vpmacssdd $2, $1, $0, $0 \0a\09 vpmacssdd $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)		call void asm sideeffect "vpmacssdd $2, $1, $0, $0 \0a\09 vpmacssdd $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)
ret void		ret void
}		}

define void @test_vpmacssdqh(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {		define void @test_vpmacssdqh(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {
; GENERIC-LABEL: test_vpmacssdqh:		; GENERIC-LABEL: test_vpmacssdqh:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vpmacssdqh %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmacssdqh %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
; GENERIC-NEXT: vpmacssdqh %xmm2, (%rdi), %xmm0, %xmm0 # sched: [9:1.00]		; GENERIC-NEXT: vpmacssdqh %xmm2, (%rdi), %xmm0, %xmm0 # sched: [10:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vpmacssdqh:		; BDVER-LABEL: test_vpmacssdqh:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vpmacssdqh %xmm2, %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpmacssdqh %xmm2, %xmm1, %xmm0, %xmm0
; BDVER-NEXT: vpmacssdqh %xmm2, (%rdi), %xmm0, %xmm0		; BDVER-NEXT: vpmacssdqh %xmm2, (%rdi), %xmm0, %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vpmacssdqh $2, $1, $0, $0 \0a\09 vpmacssdqh $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)		call void asm sideeffect "vpmacssdqh $2, $1, $0, $0 \0a\09 vpmacssdqh $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)
ret void		ret void
}		}

define void @test_vpmacssdql(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {		define void @test_vpmacssdql(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {
; GENERIC-LABEL: test_vpmacssdql:		; GENERIC-LABEL: test_vpmacssdql:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vpmacssdql %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmacssdql %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
; GENERIC-NEXT: vpmacssdql %xmm2, (%rdi), %xmm0, %xmm0 # sched: [9:1.00]		; GENERIC-NEXT: vpmacssdql %xmm2, (%rdi), %xmm0, %xmm0 # sched: [10:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vpmacssdql:		; BDVER-LABEL: test_vpmacssdql:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vpmacssdql %xmm2, %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpmacssdql %xmm2, %xmm1, %xmm0, %xmm0
; BDVER-NEXT: vpmacssdql %xmm2, (%rdi), %xmm0, %xmm0		; BDVER-NEXT: vpmacssdql %xmm2, (%rdi), %xmm0, %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vpmacssdql $2, $1, $0, $0 \0a\09 vpmacssdql $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)		call void asm sideeffect "vpmacssdql $2, $1, $0, $0 \0a\09 vpmacssdql $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)
ret void		ret void
}		}

define void @test_vpmacsswd(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {		define void @test_vpmacsswd(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {
; GENERIC-LABEL: test_vpmacsswd:		; GENERIC-LABEL: test_vpmacsswd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vpmacsswd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmacsswd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
; GENERIC-NEXT: vpmacsswd %xmm2, (%rdi), %xmm0, %xmm0 # sched: [9:1.00]		; GENERIC-NEXT: vpmacsswd %xmm2, (%rdi), %xmm0, %xmm0 # sched: [10:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vpmacsswd:		; BDVER-LABEL: test_vpmacsswd:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vpmacsswd %xmm2, %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpmacsswd %xmm2, %xmm1, %xmm0, %xmm0
; BDVER-NEXT: vpmacsswd %xmm2, (%rdi), %xmm0, %xmm0		; BDVER-NEXT: vpmacsswd %xmm2, (%rdi), %xmm0, %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vpmacsswd $2, $1, $0, $0 \0a\09 vpmacsswd $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)		call void asm sideeffect "vpmacsswd $2, $1, $0, $0 \0a\09 vpmacsswd $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)
ret void		ret void
}		}

define void @test_vpmacssww(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {		define void @test_vpmacssww(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {
; GENERIC-LABEL: test_vpmacssww:		; GENERIC-LABEL: test_vpmacssww:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vpmacssww %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmacssww %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
; GENERIC-NEXT: vpmacssww %xmm2, (%rdi), %xmm0, %xmm0 # sched: [9:1.00]		; GENERIC-NEXT: vpmacssww %xmm2, (%rdi), %xmm0, %xmm0 # sched: [10:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vpmacssww:		; BDVER-LABEL: test_vpmacssww:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vpmacssww %xmm2, %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpmacssww %xmm2, %xmm1, %xmm0, %xmm0
; BDVER-NEXT: vpmacssww %xmm2, (%rdi), %xmm0, %xmm0		; BDVER-NEXT: vpmacssww %xmm2, (%rdi), %xmm0, %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vpmacssww $2, $1, $0, $0 \0a\09 vpmacssww $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)		call void asm sideeffect "vpmacssww $2, $1, $0, $0 \0a\09 vpmacssww $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)
ret void		ret void
}		}

define void @test_vpmacswd(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {		define void @test_vpmacswd(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {
; GENERIC-LABEL: test_vpmacswd:		; GENERIC-LABEL: test_vpmacswd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vpmacswd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmacswd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
; GENERIC-NEXT: vpmacswd %xmm2, (%rdi), %xmm0, %xmm0 # sched: [9:1.00]		; GENERIC-NEXT: vpmacswd %xmm2, (%rdi), %xmm0, %xmm0 # sched: [10:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vpmacswd:		; BDVER-LABEL: test_vpmacswd:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vpmacswd %xmm2, %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpmacswd %xmm2, %xmm1, %xmm0, %xmm0
; BDVER-NEXT: vpmacswd %xmm2, (%rdi), %xmm0, %xmm0		; BDVER-NEXT: vpmacswd %xmm2, (%rdi), %xmm0, %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vpmacswd $2, $1, $0, $0 \0a\09 vpmacswd $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)		call void asm sideeffect "vpmacswd $2, $1, $0, $0 \0a\09 vpmacswd $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)
ret void		ret void
}		}

define void @test_vpmacsww(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {		define void @test_vpmacsww(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {
; GENERIC-LABEL: test_vpmacsww:		; GENERIC-LABEL: test_vpmacsww:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vpmacsww %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmacsww %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
; GENERIC-NEXT: vpmacsww %xmm2, (%rdi), %xmm0, %xmm0 # sched: [9:1.00]		; GENERIC-NEXT: vpmacsww %xmm2, (%rdi), %xmm0, %xmm0 # sched: [10:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vpmacsww:		; BDVER-LABEL: test_vpmacsww:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vpmacsww %xmm2, %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpmacsww %xmm2, %xmm1, %xmm0, %xmm0
; BDVER-NEXT: vpmacsww %xmm2, (%rdi), %xmm0, %xmm0		; BDVER-NEXT: vpmacsww %xmm2, (%rdi), %xmm0, %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vpmacsww $2, $1, $0, $0 \0a\09 vpmacsww $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)		call void asm sideeffect "vpmacsww $2, $1, $0, $0 \0a\09 vpmacsww $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)
ret void		ret void
}		}

define void @test_vpmadcsswd(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {		define void @test_vpmadcsswd(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {
; GENERIC-LABEL: test_vpmadcsswd:		; GENERIC-LABEL: test_vpmadcsswd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vpmadcsswd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmadcsswd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
; GENERIC-NEXT: vpmadcsswd %xmm2, (%rdi), %xmm0, %xmm0 # sched: [9:1.00]		; GENERIC-NEXT: vpmadcsswd %xmm2, (%rdi), %xmm0, %xmm0 # sched: [10:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vpmadcsswd:		; BDVER-LABEL: test_vpmadcsswd:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vpmadcsswd %xmm2, %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpmadcsswd %xmm2, %xmm1, %xmm0, %xmm0
; BDVER-NEXT: vpmadcsswd %xmm2, (%rdi), %xmm0, %xmm0		; BDVER-NEXT: vpmadcsswd %xmm2, (%rdi), %xmm0, %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vpmadcsswd $2, $1, $0, $0 \0a\09 vpmadcsswd $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)		call void asm sideeffect "vpmadcsswd $2, $1, $0, $0 \0a\09 vpmadcsswd $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)
ret void		ret void
}		}

define void @test_vpmadcswd(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {		define void @test_vpmadcswd(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {
; GENERIC-LABEL: test_vpmadcswd:		; GENERIC-LABEL: test_vpmadcswd:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vpmadcswd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpmadcswd %xmm2, %xmm1, %xmm0, %xmm0 # sched: [5:1.00]
; GENERIC-NEXT: vpmadcswd %xmm2, (%rdi), %xmm0, %xmm0 # sched: [9:1.00]		; GENERIC-NEXT: vpmadcswd %xmm2, (%rdi), %xmm0, %xmm0 # sched: [10:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vpmadcswd:		; BDVER-LABEL: test_vpmadcswd:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vpmadcswd %xmm2, %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpmadcswd %xmm2, %xmm1, %xmm0, %xmm0
; BDVER-NEXT: vpmadcswd %xmm2, (%rdi), %xmm0, %xmm0		; BDVER-NEXT: vpmadcswd %xmm2, (%rdi), %xmm0, %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vpmadcswd $2, $1, $0, $0 \0a\09 vpmadcswd $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)		call void asm sideeffect "vpmadcswd $2, $1, $0, $0 \0a\09 vpmadcswd $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)
ret void		ret void
}		}

define void @test_vpperm(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {		define void @test_vpperm(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> *%a3) {
; GENERIC-LABEL: test_vpperm:		; GENERIC-LABEL: test_vpperm:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vpperm %xmm2, %xmm1, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpperm %xmm2, %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpperm (%rdi), %xmm1, %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpperm (%rdi), %xmm1, %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vpperm %xmm2, (%rdi), %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpperm %xmm2, (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vpperm:		; BDVER-LABEL: test_vpperm:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vpperm %xmm2, %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpperm %xmm2, %xmm1, %xmm0, %xmm0
; BDVER-NEXT: vpperm (%rdi), %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpperm (%rdi), %xmm1, %xmm0, %xmm0
; BDVER-NEXT: vpperm %xmm2, (%rdi), %xmm0, %xmm0		; BDVER-NEXT: vpperm %xmm2, (%rdi), %xmm0, %xmm0
; BDVER-NEXT: #NO_APP		; BDVER-NEXT: #NO_APP
; BDVER-NEXT: retq		; BDVER-NEXT: retq
call void asm sideeffect "vpperm $2, $1, $0, $0 \0A\09 vpperm $3, $1, $0, $0 \0A\09 vpperm $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)		call void asm sideeffect "vpperm $2, $1, $0, $0 \0A\09 vpperm $3, $1, $0, $0 \0A\09 vpperm $2, $3, $0, $0", "x,x,x,m"(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2, <2 x i64> %a3)
ret void		ret void
}		}

define void @test_vprot(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> *%a2) {		define void @test_vprot(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> *%a2) {
; GENERIC-LABEL: test_vprot:		; GENERIC-LABEL: test_vprot:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vprotb %xmm1, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vprotb %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vprotd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vprotd %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vprotq %xmm1, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vprotq %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vprotw %xmm1, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vprotw %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vprotb (%rdi), %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vprotb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vprotd (%rdi), %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vprotd (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vprotq (%rdi), %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vprotq (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vprotw (%rdi), %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vprotw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vprotb %xmm0, (%rdi), %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vprotb %xmm0, (%rdi), %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vprotd %xmm0, (%rdi), %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vprotd %xmm0, (%rdi), %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vprotq %xmm0, (%rdi), %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vprotq %xmm0, (%rdi), %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vprotw %xmm0, (%rdi), %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vprotw %xmm0, (%rdi), %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vprotb $7, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vprotb $7, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vprotd $7, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vprotd $7, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vprotq $7, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vprotq $7, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vprotw $7, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vprotw $7, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vprotb $7, (%rdi), %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vprotb $7, (%rdi), %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vprotd $7, (%rdi), %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vprotd $7, (%rdi), %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vprotq $7, (%rdi), %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vprotq $7, (%rdi), %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vprotw $7, (%rdi), %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vprotw $7, (%rdi), %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vprot:		; BDVER-LABEL: test_vprot:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vprotb %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vprotb %xmm1, %xmm0, %xmm0
; BDVER-NEXT: vprotd %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vprotd %xmm1, %xmm0, %xmm0
Show All 24 Lines
define void @test_vpsha(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> *%a2) {		define void @test_vpsha(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> *%a2) {
; GENERIC-LABEL: test_vpsha:		; GENERIC-LABEL: test_vpsha:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vpshab %xmm1, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpshab %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpshad %xmm1, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpshad %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpshaq %xmm1, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpshaq %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpshaw %xmm1, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpshaw %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpshab (%rdi), %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpshab (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vpshad (%rdi), %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpshad (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vpshaq (%rdi), %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpshaq (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vpshaw (%rdi), %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpshaw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vpshab %xmm0, (%rdi), %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpshab %xmm0, (%rdi), %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vpshad %xmm0, (%rdi), %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpshad %xmm0, (%rdi), %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vpshaq %xmm0, (%rdi), %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpshaq %xmm0, (%rdi), %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vpshaw %xmm0, (%rdi), %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpshaw %xmm0, (%rdi), %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vpsha:		; BDVER-LABEL: test_vpsha:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vpshab %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpshab %xmm1, %xmm0, %xmm0
; BDVER-NEXT: vpshad %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpshad %xmm1, %xmm0, %xmm0
Show All 16 Lines
define void @test_vpshl(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> *%a2) {		define void @test_vpshl(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> *%a2) {
; GENERIC-LABEL: test_vpshl:		; GENERIC-LABEL: test_vpshl:
; GENERIC: # %bb.0:		; GENERIC: # %bb.0:
; GENERIC-NEXT: #APP		; GENERIC-NEXT: #APP
; GENERIC-NEXT: vpshlb %xmm1, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpshlb %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpshld %xmm1, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpshld %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpshlq %xmm1, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpshlq %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpshlw %xmm1, %xmm0, %xmm0 # sched: [1:1.00]		; GENERIC-NEXT: vpshlw %xmm1, %xmm0, %xmm0 # sched: [1:1.00]
; GENERIC-NEXT: vpshlb (%rdi), %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpshlb (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vpshld (%rdi), %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpshld (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vpshlq (%rdi), %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpshlq (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vpshlw (%rdi), %xmm0, %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpshlw (%rdi), %xmm0, %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vpshlb %xmm0, (%rdi), %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpshlb %xmm0, (%rdi), %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vpshld %xmm0, (%rdi), %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpshld %xmm0, (%rdi), %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vpshlq %xmm0, (%rdi), %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpshlq %xmm0, (%rdi), %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: vpshlw %xmm0, (%rdi), %xmm0 # sched: [5:1.00]		; GENERIC-NEXT: vpshlw %xmm0, (%rdi), %xmm0 # sched: [6:1.00]
; GENERIC-NEXT: #NO_APP		; GENERIC-NEXT: #NO_APP
; GENERIC-NEXT: retq # sched: [1:1.00]		; GENERIC-NEXT: retq # sched: [1:1.00]
;		;
; BDVER-LABEL: test_vpshl:		; BDVER-LABEL: test_vpshl:
; BDVER: # %bb.0:		; BDVER: # %bb.0:
; BDVER-NEXT: #APP		; BDVER-NEXT: #APP
; BDVER-NEXT: vpshlb %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpshlb %xmm1, %xmm0, %xmm0
; BDVER-NEXT: vpshld %xmm1, %xmm0, %xmm0		; BDVER-NEXT: vpshld %xmm1, %xmm0, %xmm0
Show All 15 Lines