This is an archive of the discontinued LLVM Phabricator instance.

[DAGCombiner] allow hoisting vector bitwise logic ahead of truncates
ClosedPublic

Authored by spatel on Dec 7 2018, 11:28 AM.

Download Raw Diff

Details

Reviewers

kparzysz
craig.topper
RKSimon

Commits

rGf24900b93483: [DAGCombiner] allow hoisting vector bitwise logic ahead of truncates
rL349303: [DAGCombiner] allow hoisting vector bitwise logic ahead of truncates

Summary

The transform performs a bitwise logic op in a wider type followed by truncate when both inputs are truncated from the same source type:
logic_op (truncate x), (truncate y) --> truncate (logic_op x, y)

There are a bunch of other checks that should prevent doing this when it might be harmful.

We already do this for scalars. The vector limitation was shared with a check for the case when the operands are extended. I'm not sure if that limit is needed either, but that would be a separate patch.

Diff Detail

Event Timeline

spatel created this revision.Dec 7 2018, 11:28 AM

Herald added subscribers: kristof.beyls, javed.absar, mcrosier. · View Herald TranscriptDec 7 2018, 11:28 AM

There's been some churn on many of these test files recently - rebase?

RKSimon added inline comments.Dec 13 2018, 1:58 PM

test/CodeGen/ARM/setcc-logic.ll
33	Is this a NFC regeneration change?

We already do this for scalars.

Hm, are you sure?
I think i saw the opposite happen.
https://bugs.llvm.org/show_bug.cgi?id=36419#c4

In D55448#1330392, @lebedev.ri wrote:

We already do this for scalars.

Hm, are you sure?
I think i saw the opposite happen.
https://bugs.llvm.org/show_bug.cgi?id=36419#c4

Well, it's SDAG, so anything can happen. :)
My comment was specifically referring to the check that I'm hoping to change in this patch - it has a scalar-only restriction currently, and I think as the diffs here show, it's unnecessary.

test/CodeGen/ARM/setcc-logic.ll
33	Yes, that's only adding the "-NEXT"; I can update it separately.

Patch updated:
No code changes, but rebased to remove cosmetic diffs in ARM test and updated codegen for x86 vector rotates.

LGTM

This revision is now accepted and ready to land.Dec 14 2018, 11:10 AM

The Hexagon tests were meant to check operations on vector predicate registers, so for them to work the inputs need to be vectors of i1 with the lengths that correspond to the lengths of vectors of 8+ bit integers. The only way to generate such values is do either a compare or a truncate. Since compare instructions can be fused with logical operations, this leaves truncate as the only option. With the changes from this patch, truncate is also eliminated, so it appears that these instructions cannot be emitted anymore (from a non-intrinsic code). With this in mind, I am ok with these changes.

Closed by commit rL349303: [DAGCombiner] allow hoisting vector bitwise logic ahead of truncates (authored by spatel). · Explain WhyDec 16 2018, 7:00 AM

This revision was automatically updated to reflect the committed changes.

spatel mentioned this in D55744: [InstCombine] don't widen an arbitrary sequence of vector ops (PR40032).Dec 16 2018, 9:07 AM

spatel mentioned this in rL349389: [InstCombine] don't widen an arbitrary sequence of vector ops (PR40032).Dec 17 2018, 12:31 PM

Revision Contents

Path

Size

lib/

CodeGen/

SelectionDAG/

DAGCombiner.cpp

7 lines

test/

CodeGen/

ARM/

setcc-logic.ll

3 lines

Hexagon/

autohvx/

bitwise-pred-128b.ll

18 lines

bitwise-pred-64b.ll

18 lines

X86/

avx512-select.ll

24 lines

bitcast-and-setcc-128.ll

19 lines

bitcast-and-setcc-256.ll

109 lines

bitcast-and-setcc-512.ll

52 lines

44 lines

28 lines

24 lines

12 lines

Diff 178232

lib/CodeGen/SelectionDAG/DAGCombiner.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 3,749 Lines • ▼ Show 20 Lines	SDValue DAGCombiner::hoistLogicOpWithSameOpcodeHands(SDNode *N) {
}		}

// logic_op (truncate x), (truncate y) --> truncate (logic_op x, y)		// logic_op (truncate x), (truncate y) --> truncate (logic_op x, y)
if (HandOpcode == ISD::TRUNCATE) {		if (HandOpcode == ISD::TRUNCATE) {
// If both operands have other uses, this transform would create extra		// If both operands have other uses, this transform would create extra
// instructions without eliminating anything.		// instructions without eliminating anything.
if (!N0.hasOneUse() && !N1.hasOneUse())		if (!N0.hasOneUse() && !N1.hasOneUse())
return SDValue();		return SDValue();
// We need matching integer source types.		// We need matching source types.
// Do not hoist logic op inside of a vector extend, since it may combine		if (XVT != Y.getValueType())
// into a vsetcc.
// TODO: Should the vector check apply to truncate though?
if (VT.isVector() \|\| XVT != Y.getValueType())
return SDValue();		return SDValue();
// Don't create an illegal op during or after legalization.		// Don't create an illegal op during or after legalization.
if (LegalOperations && !TLI.isOperationLegal(LogicOpcode, XVT))		if (LegalOperations && !TLI.isOperationLegal(LogicOpcode, XVT))
return SDValue();		return SDValue();
// Be extra careful sinking truncate. If it's free, there's no benefit in		// Be extra careful sinking truncate. If it's free, there's no benefit in
// widening a binop. Also, don't create a logic op on an illegal type.		// widening a binop. Also, don't create a logic op on an illegal type.
if (TLI.isZExtFree(VT, XVT) && TLI.isTruncateFree(XVT, VT))		if (TLI.isZExtFree(VT, XVT) && TLI.isTruncateFree(XVT, VT))
return SDValue();		return SDValue();
▲ Show 20 Lines • Show All 15,392 Lines • Show Last 20 Lines

test/CodeGen/ARM/setcc-logic.ll

	Show All 24 Lines
	; CHECK: orr r0, r0, r2			; CHECK: orr r0, r0, r2
	; CHECK: clz r0, r0			; CHECK: clz r0, r0
	; CHECK: lsr r0, r0, #5			; CHECK: lsr r0, r0, #5
	; CHECK: bx lr			; CHECK: bx lr
	%cmp1 = icmp eq i32 %a, %b			%cmp1 = icmp eq i32 %a, %b
	%cmp2 = icmp eq i32 %c, %d			%cmp2 = icmp eq i32 %c, %d
	%and = and i1 %cmp1, %cmp2			%and = and i1 %cmp1, %cmp2
	ret i1 %and			ret i1 %and
	}			}
				RKSimonUnsubmitted Done Reply Inline Actions Is this a NFC regeneration change? RKSimon: Is this a NFC regeneration change?
				spatelAuthorUnsubmitted Done Reply Inline Actions Yes, that's only adding the "-NEXT"; I can update it separately. spatel: Yes, that's only adding the "-NEXT"; I can update it separately.

	define zeroext i1 @or_ne(i32 %a, i32 %b, i32 %c, i32 %d) nounwind {			define zeroext i1 @or_ne(i32 %a, i32 %b, i32 %c, i32 %d) nounwind {
	; CHECK-LABEL: or_ne:			; CHECK-LABEL: or_ne:
	; CHECK: @ %bb.0:			; CHECK: @ %bb.0:
	; CHECK-NEXT: eor r2, r2, r3			; CHECK-NEXT: eor r2, r2, r3
	; CHECK-NEXT: eor r0, r0, r1			; CHECK-NEXT: eor r0, r0, r1
	; CHECK-NEXT: orrs r0, r0, r2			; CHECK-NEXT: orrs r0, r0, r2
	; CHECK-NEXT: movwne r0, #1			; CHECK-NEXT: movwne r0, #1
	Show All 14 Lines
	; CHECK-NEXT: add lr, sp, #8			; CHECK-NEXT: add lr, sp, #8
	; CHECK-NEXT: vmov d18, r0, r1			; CHECK-NEXT: vmov d18, r0, r1
	; CHECK-NEXT: vld1.64 {d16, d17}, [lr]			; CHECK-NEXT: vld1.64 {d16, d17}, [lr]
	; CHECK-NEXT: add r0, sp, #24			; CHECK-NEXT: add r0, sp, #24
	; CHECK-NEXT: vld1.64 {d20, d21}, [r12]			; CHECK-NEXT: vld1.64 {d20, d21}, [r12]
	; CHECK-NEXT: vceq.i32 q8, q9, q8			; CHECK-NEXT: vceq.i32 q8, q9, q8
	; CHECK-NEXT: vld1.64 {d22, d23}, [r0]			; CHECK-NEXT: vld1.64 {d22, d23}, [r0]
	; CHECK-NEXT: vceq.i32 q9, q11, q10			; CHECK-NEXT: vceq.i32 q9, q11, q10
				; CHECK-NEXT: vand q8, q8, q9
	; CHECK-NEXT: vmovn.i32 d16, q8			; CHECK-NEXT: vmovn.i32 d16, q8
	; CHECK-NEXT: vmovn.i32 d17, q9
	; CHECK-NEXT: vand d16, d16, d17
	; CHECK-NEXT: vmov r0, r1, d16			; CHECK-NEXT: vmov r0, r1, d16
	; CHECK-NEXT: pop {r11, pc}			; CHECK-NEXT: pop {r11, pc}
	%cmp1 = icmp eq <4 x i32> %a, %b			%cmp1 = icmp eq <4 x i32> %a, %b
	%cmp2 = icmp eq <4 x i32> %c, %d			%cmp2 = icmp eq <4 x i32> %c, %d
	%and = and <4 x i1> %cmp1, %cmp2			%and = and <4 x i1> %cmp1, %cmp2
	ret <4 x i1> %and			ret <4 x i1> %and
	}			}

test/CodeGen/Hexagon/autohvx/bitwise-pred-128b.ll

	; RUN: llc -march=hexagon < %s \| FileCheck %s			; RUN: llc -march=hexagon < %s \| FileCheck %s

	; CHECK-LABEL: t00			; CHECK-LABEL: t00
	; CHECK: and(q{{[0-3]}},q{{[0-3]}})			; CHECK: vand(v{{[0-9:]+}},v{{[0-9:]+}})
	define <128 x i8> @t00(<128 x i8> %a0, <128 x i8> %a1) #0 {			define <128 x i8> @t00(<128 x i8> %a0, <128 x i8> %a1) #0 {
	%q0 = trunc <128 x i8> %a0 to <128 x i1>			%q0 = trunc <128 x i8> %a0 to <128 x i1>
	%q1 = trunc <128 x i8> %a1 to <128 x i1>			%q1 = trunc <128 x i8> %a1 to <128 x i1>
	%q2 = and <128 x i1> %q0, %q1			%q2 = and <128 x i1> %q0, %q1
	%v0 = zext <128 x i1> %q2 to <128 x i8>			%v0 = zext <128 x i1> %q2 to <128 x i8>
	ret <128 x i8> %v0			ret <128 x i8> %v0
	}			}

	declare <1024 x i1> @llvm.hexagon.vandvrt.128B(<128 x i8>, i32)			declare <1024 x i1> @llvm.hexagon.vandvrt.128B(<128 x i8>, i32)

	; CHECK-LABEL: t01			; CHECK-LABEL: t01
	; CHECK: or(q{{[0-3]}},q{{[0-3]}})			; CHECK: vor(v{{[0-9:]+}},v{{[0-9:]+}})
	define <128 x i8> @t01(<128 x i8> %a0, <128 x i8> %a1) #0 {			define <128 x i8> @t01(<128 x i8> %a0, <128 x i8> %a1) #0 {
	%q0 = trunc <128 x i8> %a0 to <128 x i1>			%q0 = trunc <128 x i8> %a0 to <128 x i1>
	%q1 = trunc <128 x i8> %a1 to <128 x i1>			%q1 = trunc <128 x i8> %a1 to <128 x i1>
	%q2 = or <128 x i1> %q0, %q1			%q2 = or <128 x i1> %q0, %q1
	%v0 = zext <128 x i1> %q2 to <128 x i8>			%v0 = zext <128 x i1> %q2 to <128 x i8>
	ret <128 x i8> %v0			ret <128 x i8> %v0
	}			}

	; CHECK-LABEL: t02			; CHECK-LABEL: t02
	; CHECK: xor(q{{[0-3]}},q{{[0-3]}})			; CHECK: vxor(v{{[0-9:]+}},v{{[0-9:]+}})
	define <128 x i8> @t02(<128 x i8> %a0, <128 x i8> %a1) #0 {			define <128 x i8> @t02(<128 x i8> %a0, <128 x i8> %a1) #0 {
	%q0 = trunc <128 x i8> %a0 to <128 x i1>			%q0 = trunc <128 x i8> %a0 to <128 x i1>
	%q1 = trunc <128 x i8> %a1 to <128 x i1>			%q1 = trunc <128 x i8> %a1 to <128 x i1>
	%q2 = xor <128 x i1> %q0, %q1			%q2 = xor <128 x i1> %q0, %q1
	%v0 = zext <128 x i1> %q2 to <128 x i8>			%v0 = zext <128 x i1> %q2 to <128 x i8>
	ret <128 x i8> %v0			ret <128 x i8> %v0
	}			}

	; CHECK-LABEL: t10			; CHECK-LABEL: t10
	; CHECK: and(q{{[0-3]}},q{{[0-3]}})			; CHECK: vand(v{{[0-9:]+}},v{{[0-9:]+}})
	define <64 x i16> @t10(<64 x i16> %a0, <64 x i16> %a1) #0 {			define <64 x i16> @t10(<64 x i16> %a0, <64 x i16> %a1) #0 {
	%q0 = trunc <64 x i16> %a0 to <64 x i1>			%q0 = trunc <64 x i16> %a0 to <64 x i1>
	%q1 = trunc <64 x i16> %a1 to <64 x i1>			%q1 = trunc <64 x i16> %a1 to <64 x i1>
	%q2 = and <64 x i1> %q0, %q1			%q2 = and <64 x i1> %q0, %q1
	%v0 = zext <64 x i1> %q2 to <64 x i16>			%v0 = zext <64 x i1> %q2 to <64 x i16>
	ret <64 x i16> %v0			ret <64 x i16> %v0
	}			}

	; CHECK-LABEL: t11			; CHECK-LABEL: t11
	; CHECK: or(q{{[0-3]}},q{{[0-3]}})			; CHECK: vor(v{{[0-9:]+}},v{{[0-9:]+}})
	define <64 x i16> @t11(<64 x i16> %a0, <64 x i16> %a1) #0 {			define <64 x i16> @t11(<64 x i16> %a0, <64 x i16> %a1) #0 {
	%q0 = trunc <64 x i16> %a0 to <64 x i1>			%q0 = trunc <64 x i16> %a0 to <64 x i1>
	%q1 = trunc <64 x i16> %a1 to <64 x i1>			%q1 = trunc <64 x i16> %a1 to <64 x i1>
	%q2 = or <64 x i1> %q0, %q1			%q2 = or <64 x i1> %q0, %q1
	%v0 = zext <64 x i1> %q2 to <64 x i16>			%v0 = zext <64 x i1> %q2 to <64 x i16>
	ret <64 x i16> %v0			ret <64 x i16> %v0
	}			}

	; CHECK-LABEL: t12			; CHECK-LABEL: t12
	; CHECK: xor(q{{[0-3]}},q{{[0-3]}})			; CHECK: vxor(v{{[0-9:]+}},v{{[0-9:]+}})
	define <64 x i16> @t12(<64 x i16> %a0, <64 x i16> %a1) #0 {			define <64 x i16> @t12(<64 x i16> %a0, <64 x i16> %a1) #0 {
	%q0 = trunc <64 x i16> %a0 to <64 x i1>			%q0 = trunc <64 x i16> %a0 to <64 x i1>
	%q1 = trunc <64 x i16> %a1 to <64 x i1>			%q1 = trunc <64 x i16> %a1 to <64 x i1>
	%q2 = xor <64 x i1> %q0, %q1			%q2 = xor <64 x i1> %q0, %q1
	%v0 = zext <64 x i1> %q2 to <64 x i16>			%v0 = zext <64 x i1> %q2 to <64 x i16>
	ret <64 x i16> %v0			ret <64 x i16> %v0
	}			}

	; CHECK-LABEL: t20			; CHECK-LABEL: t20
	; CHECK: and(q{{[0-3]}},q{{[0-3]}})			; CHECK: vand(v{{[0-9:]+}},v{{[0-9:]+}})
	define <32 x i32> @t20(<32 x i32> %a0, <32 x i32> %a1) #0 {			define <32 x i32> @t20(<32 x i32> %a0, <32 x i32> %a1) #0 {
	%q0 = trunc <32 x i32> %a0 to <32 x i1>			%q0 = trunc <32 x i32> %a0 to <32 x i1>
	%q1 = trunc <32 x i32> %a1 to <32 x i1>			%q1 = trunc <32 x i32> %a1 to <32 x i1>
	%q2 = and <32 x i1> %q0, %q1			%q2 = and <32 x i1> %q0, %q1
	%v0 = zext <32 x i1> %q2 to <32 x i32>			%v0 = zext <32 x i1> %q2 to <32 x i32>
	ret <32 x i32> %v0			ret <32 x i32> %v0
	}			}

	; CHECK-LABEL: t21			; CHECK-LABEL: t21
	; CHECK: or(q{{[0-3]}},q{{[0-3]}})			; CHECK: vor(v{{[0-9:]+}},v{{[0-9:]+}})
	define <32 x i32> @t21(<32 x i32> %a0, <32 x i32> %a1) #0 {			define <32 x i32> @t21(<32 x i32> %a0, <32 x i32> %a1) #0 {
	%q0 = trunc <32 x i32> %a0 to <32 x i1>			%q0 = trunc <32 x i32> %a0 to <32 x i1>
	%q1 = trunc <32 x i32> %a1 to <32 x i1>			%q1 = trunc <32 x i32> %a1 to <32 x i1>
	%q2 = or <32 x i1> %q0, %q1			%q2 = or <32 x i1> %q0, %q1
	%v0 = zext <32 x i1> %q2 to <32 x i32>			%v0 = zext <32 x i1> %q2 to <32 x i32>
	ret <32 x i32> %v0			ret <32 x i32> %v0
	}			}

	; CHECK-LABEL: t22			; CHECK-LABEL: t22
	; CHECK: xor(q{{[0-3]}},q{{[0-3]}})			; CHECK: vxor(v{{[0-9:]+}},v{{[0-9:]+}})
	define <32 x i32> @t22(<32 x i32> %a0, <32 x i32> %a1) #0 {			define <32 x i32> @t22(<32 x i32> %a0, <32 x i32> %a1) #0 {
	%q0 = trunc <32 x i32> %a0 to <32 x i1>			%q0 = trunc <32 x i32> %a0 to <32 x i1>
	%q1 = trunc <32 x i32> %a1 to <32 x i1>			%q1 = trunc <32 x i32> %a1 to <32 x i1>
	%q2 = xor <32 x i1> %q0, %q1			%q2 = xor <32 x i1> %q0, %q1
	%v0 = zext <32 x i1> %q2 to <32 x i32>			%v0 = zext <32 x i1> %q2 to <32 x i32>
	ret <32 x i32> %v0			ret <32 x i32> %v0
	}			}

	attributes #0 = { nounwind readnone "target-cpu"="hexagonv60" "target-features"="+hvx,+hvx-length128b" }			attributes #0 = { nounwind readnone "target-cpu"="hexagonv60" "target-features"="+hvx,+hvx-length128b" }

test/CodeGen/Hexagon/autohvx/bitwise-pred-64b.ll

	; RUN: llc -march=hexagon < %s \| FileCheck %s			; RUN: llc -march=hexagon < %s \| FileCheck %s

	; CHECK-LABEL: t00			; CHECK-LABEL: t00
	; CHECK: and(q{{[0-3]}},q{{[0-3]}})			; CHECK: vand(v{{[0-9:]+}},v{{[0-9:]+}})
	define <64 x i8> @t00(<64 x i8> %a0, <64 x i8> %a1) #0 {			define <64 x i8> @t00(<64 x i8> %a0, <64 x i8> %a1) #0 {
	%q0 = trunc <64 x i8> %a0 to <64 x i1>			%q0 = trunc <64 x i8> %a0 to <64 x i1>
	%q1 = trunc <64 x i8> %a1 to <64 x i1>			%q1 = trunc <64 x i8> %a1 to <64 x i1>
	%q2 = and <64 x i1> %q0, %q1			%q2 = and <64 x i1> %q0, %q1
	%v0 = zext <64 x i1> %q2 to <64 x i8>			%v0 = zext <64 x i1> %q2 to <64 x i8>
	ret <64 x i8> %v0			ret <64 x i8> %v0
	}			}

	; CHECK-LABEL: t01			; CHECK-LABEL: t01
	; CHECK: or(q{{[0-3]}},q{{[0-3]}})			; CHECK: vor(v{{[0-9:]+}},v{{[0-9:]+}})
	define <64 x i8> @t01(<64 x i8> %a0, <64 x i8> %a1) #0 {			define <64 x i8> @t01(<64 x i8> %a0, <64 x i8> %a1) #0 {
	%q0 = trunc <64 x i8> %a0 to <64 x i1>			%q0 = trunc <64 x i8> %a0 to <64 x i1>
	%q1 = trunc <64 x i8> %a1 to <64 x i1>			%q1 = trunc <64 x i8> %a1 to <64 x i1>
	%q2 = or <64 x i1> %q0, %q1			%q2 = or <64 x i1> %q0, %q1
	%v0 = zext <64 x i1> %q2 to <64 x i8>			%v0 = zext <64 x i1> %q2 to <64 x i8>
	ret <64 x i8> %v0			ret <64 x i8> %v0
	}			}

	; CHECK-LABEL: t02			; CHECK-LABEL: t02
	; CHECK: xor(q{{[0-3]}},q{{[0-3]}})			; CHECK: vxor(v{{[0-9:]+}},v{{[0-9:]+}})
	define <64 x i8> @t02(<64 x i8> %a0, <64 x i8> %a1) #0 {			define <64 x i8> @t02(<64 x i8> %a0, <64 x i8> %a1) #0 {
	%q0 = trunc <64 x i8> %a0 to <64 x i1>			%q0 = trunc <64 x i8> %a0 to <64 x i1>
	%q1 = trunc <64 x i8> %a1 to <64 x i1>			%q1 = trunc <64 x i8> %a1 to <64 x i1>
	%q2 = xor <64 x i1> %q0, %q1			%q2 = xor <64 x i1> %q0, %q1
	%v0 = zext <64 x i1> %q2 to <64 x i8>			%v0 = zext <64 x i1> %q2 to <64 x i8>
	ret <64 x i8> %v0			ret <64 x i8> %v0
	}			}

	; CHECK-LABEL: t10			; CHECK-LABEL: t10
	; CHECK: and(q{{[0-3]}},q{{[0-3]}})			; CHECK: vand(v{{[0-9:]+}},v{{[0-9:]+}})
	define <32 x i16> @t10(<32 x i16> %a0, <32 x i16> %a1) #0 {			define <32 x i16> @t10(<32 x i16> %a0, <32 x i16> %a1) #0 {
	%q0 = trunc <32 x i16> %a0 to <32 x i1>			%q0 = trunc <32 x i16> %a0 to <32 x i1>
	%q1 = trunc <32 x i16> %a1 to <32 x i1>			%q1 = trunc <32 x i16> %a1 to <32 x i1>
	%q2 = and <32 x i1> %q0, %q1			%q2 = and <32 x i1> %q0, %q1
	%v0 = zext <32 x i1> %q2 to <32 x i16>			%v0 = zext <32 x i1> %q2 to <32 x i16>
	ret <32 x i16> %v0			ret <32 x i16> %v0
	}			}

	; CHECK-LABEL: t11			; CHECK-LABEL: t11
	; CHECK: or(q{{[0-3]}},q{{[0-3]}})			; CHECK: vor(v{{[0-9:]+}},v{{[0-9:]+}})
	define <32 x i16> @t11(<32 x i16> %a0, <32 x i16> %a1) #0 {			define <32 x i16> @t11(<32 x i16> %a0, <32 x i16> %a1) #0 {
	%q0 = trunc <32 x i16> %a0 to <32 x i1>			%q0 = trunc <32 x i16> %a0 to <32 x i1>
	%q1 = trunc <32 x i16> %a1 to <32 x i1>			%q1 = trunc <32 x i16> %a1 to <32 x i1>
	%q2 = or <32 x i1> %q0, %q1			%q2 = or <32 x i1> %q0, %q1
	%v0 = zext <32 x i1> %q2 to <32 x i16>			%v0 = zext <32 x i1> %q2 to <32 x i16>
	ret <32 x i16> %v0			ret <32 x i16> %v0
	}			}

	; CHECK-LABEL: t12			; CHECK-LABEL: t12
	; CHECK: xor(q{{[0-3]}},q{{[0-3]}})			; CHECK: vxor(v{{[0-9:]+}},v{{[0-9:]+}})
	define <32 x i16> @t12(<32 x i16> %a0, <32 x i16> %a1) #0 {			define <32 x i16> @t12(<32 x i16> %a0, <32 x i16> %a1) #0 {
	%q0 = trunc <32 x i16> %a0 to <32 x i1>			%q0 = trunc <32 x i16> %a0 to <32 x i1>
	%q1 = trunc <32 x i16> %a1 to <32 x i1>			%q1 = trunc <32 x i16> %a1 to <32 x i1>
	%q2 = xor <32 x i1> %q0, %q1			%q2 = xor <32 x i1> %q0, %q1
	%v0 = zext <32 x i1> %q2 to <32 x i16>			%v0 = zext <32 x i1> %q2 to <32 x i16>
	ret <32 x i16> %v0			ret <32 x i16> %v0
	}			}

	; CHECK-LABEL: t20			; CHECK-LABEL: t20
	; CHECK: and(q{{[0-3]}},q{{[0-3]}})			; CHECK: vand(v{{[0-9:]+}},v{{[0-9:]+}})
	define <16 x i32> @t20(<16 x i32> %a0, <16 x i32> %a1) #0 {			define <16 x i32> @t20(<16 x i32> %a0, <16 x i32> %a1) #0 {
	%q0 = trunc <16 x i32> %a0 to <16 x i1>			%q0 = trunc <16 x i32> %a0 to <16 x i1>
	%q1 = trunc <16 x i32> %a1 to <16 x i1>			%q1 = trunc <16 x i32> %a1 to <16 x i1>
	%q2 = and <16 x i1> %q0, %q1			%q2 = and <16 x i1> %q0, %q1
	%v0 = zext <16 x i1> %q2 to <16 x i32>			%v0 = zext <16 x i1> %q2 to <16 x i32>
	ret <16 x i32> %v0			ret <16 x i32> %v0
	}			}

	; CHECK-LABEL: t21			; CHECK-LABEL: t21
	; CHECK: or(q{{[0-3]}},q{{[0-3]}})			; CHECK: vor(v{{[0-9:]+}},v{{[0-9:]+}})
	define <16 x i32> @t21(<16 x i32> %a0, <16 x i32> %a1) #0 {			define <16 x i32> @t21(<16 x i32> %a0, <16 x i32> %a1) #0 {
	%q0 = trunc <16 x i32> %a0 to <16 x i1>			%q0 = trunc <16 x i32> %a0 to <16 x i1>
	%q1 = trunc <16 x i32> %a1 to <16 x i1>			%q1 = trunc <16 x i32> %a1 to <16 x i1>
	%q2 = or <16 x i1> %q0, %q1			%q2 = or <16 x i1> %q0, %q1
	%v0 = zext <16 x i1> %q2 to <16 x i32>			%v0 = zext <16 x i1> %q2 to <16 x i32>
	ret <16 x i32> %v0			ret <16 x i32> %v0
	}			}

	; CHECK-LABEL: t22			; CHECK-LABEL: t22
	; CHECK: xor(q{{[0-3]}},q{{[0-3]}})			; CHECK: vxor(v{{[0-9:]+}},v{{[0-9:]+}})
	define <16 x i32> @t22(<16 x i32> %a0, <16 x i32> %a1) #0 {			define <16 x i32> @t22(<16 x i32> %a0, <16 x i32> %a1) #0 {
	%q0 = trunc <16 x i32> %a0 to <16 x i1>			%q0 = trunc <16 x i32> %a0 to <16 x i1>
	%q1 = trunc <16 x i32> %a1 to <16 x i1>			%q1 = trunc <16 x i32> %a1 to <16 x i1>
	%q2 = xor <16 x i1> %q0, %q1			%q2 = xor <16 x i1> %q0, %q1
	%v0 = zext <16 x i1> %q2 to <16 x i32>			%v0 = zext <16 x i1> %q2 to <16 x i32>
	ret <16 x i32> %v0			ret <16 x i32> %v0
	}			}

	attributes #0 = { nounwind readnone "target-cpu"="hexagonv60" "target-features"="+hvx,+hvx-length64b" }			attributes #0 = { nounwind readnone "target-cpu"="hexagonv60" "target-features"="+hvx,+hvx-length64b" }

test/CodeGen/X86/avx512-select.ll

	Show First 20 Lines • Show All 312 Lines • ▼ Show 20 Lines
	; X64-NEXT: retq			; X64-NEXT: retq
	%cond = select i1 %c, float %a, float %b			%cond = select i1 %c, float %a, float %b
	ret float %cond			ret float %cond
	}			}

	define <16 x i16> @pr31515(<16 x i1> %a, <16 x i1> %b, <16 x i16> %c) nounwind {			define <16 x i16> @pr31515(<16 x i1> %a, <16 x i1> %b, <16 x i16> %c) nounwind {
	; X86-LABEL: pr31515:			; X86-LABEL: pr31515:
	; X86: # %bb.0:			; X86: # %bb.0:
	; X86-NEXT: vpmovzxbd {{.*#+}} zmm1 = xmm1[0],zero,zero,zero,xmm1[1],zero,zero,zero,xmm1[2],zero,zero,zero,xmm1[3],zero,zero,zero,xmm1[4],zero,zero,zero,xmm1[5],zero,zero,zero,xmm1[6],zero,zero,zero,xmm1[7],zero,zero,zero,xmm1[8],zero,zero,zero,xmm1[9],zero,zero,zero,xmm1[10],zero,zero,zero,xmm1[11],zero,zero,zero,xmm1[12],zero,zero,zero,xmm1[13],zero,zero,zero,xmm1[14],zero,zero,zero,xmm1[15],zero,zero,zero			; X86-NEXT: vpand %xmm1, %xmm0, %xmm0
	; X86-NEXT: vpslld $31, %zmm1, %zmm1			; X86-NEXT: vpmovzxbw {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero,xmm0[8],zero,xmm0[9],zero,xmm0[10],zero,xmm0[11],zero,xmm0[12],zero,xmm0[13],zero,xmm0[14],zero,xmm0[15],zero
	; X86-NEXT: vpmovzxbd {{.*#+}} zmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero,xmm0[2],zero,zero,zero,xmm0[3],zero,zero,zero,xmm0[4],zero,zero,zero,xmm0[5],zero,zero,zero,xmm0[6],zero,zero,zero,xmm0[7],zero,zero,zero,xmm0[8],zero,zero,zero,xmm0[9],zero,zero,zero,xmm0[10],zero,zero,zero,xmm0[11],zero,zero,zero,xmm0[12],zero,zero,zero,xmm0[13],zero,zero,zero,xmm0[14],zero,zero,zero,xmm0[15],zero,zero,zero			; X86-NEXT: vpsllw $15, %ymm0, %ymm0
	; X86-NEXT: vpslld $31, %zmm0, %zmm0			; X86-NEXT: vpsraw $15, %ymm0, %ymm0
	; X86-NEXT: vptestmd %zmm0, %zmm0, %k1
	; X86-NEXT: vptestmd %zmm1, %zmm1, %k1 {%k1}
	; X86-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; X86-NEXT: vpmovdw %zmm0, %ymm0
	; X86-NEXT: vpandn %ymm2, %ymm0, %ymm0			; X86-NEXT: vpandn %ymm2, %ymm0, %ymm0
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: pr31515:			; X64-LABEL: pr31515:
	; X64: # %bb.0:			; X64: # %bb.0:
	; X64-NEXT: vpmovzxbd {{.*#+}} zmm1 = xmm1[0],zero,zero,zero,xmm1[1],zero,zero,zero,xmm1[2],zero,zero,zero,xmm1[3],zero,zero,zero,xmm1[4],zero,zero,zero,xmm1[5],zero,zero,zero,xmm1[6],zero,zero,zero,xmm1[7],zero,zero,zero,xmm1[8],zero,zero,zero,xmm1[9],zero,zero,zero,xmm1[10],zero,zero,zero,xmm1[11],zero,zero,zero,xmm1[12],zero,zero,zero,xmm1[13],zero,zero,zero,xmm1[14],zero,zero,zero,xmm1[15],zero,zero,zero			; X64-NEXT: vpand %xmm1, %xmm0, %xmm0
	; X64-NEXT: vpslld $31, %zmm1, %zmm1			; X64-NEXT: vpmovzxbw {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero,xmm0[8],zero,xmm0[9],zero,xmm0[10],zero,xmm0[11],zero,xmm0[12],zero,xmm0[13],zero,xmm0[14],zero,xmm0[15],zero
	; X64-NEXT: vpmovzxbd {{.*#+}} zmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero,xmm0[2],zero,zero,zero,xmm0[3],zero,zero,zero,xmm0[4],zero,zero,zero,xmm0[5],zero,zero,zero,xmm0[6],zero,zero,zero,xmm0[7],zero,zero,zero,xmm0[8],zero,zero,zero,xmm0[9],zero,zero,zero,xmm0[10],zero,zero,zero,xmm0[11],zero,zero,zero,xmm0[12],zero,zero,zero,xmm0[13],zero,zero,zero,xmm0[14],zero,zero,zero,xmm0[15],zero,zero,zero			; X64-NEXT: vpsllw $15, %ymm0, %ymm0
	; X64-NEXT: vpslld $31, %zmm0, %zmm0			; X64-NEXT: vpsraw $15, %ymm0, %ymm0
	; X64-NEXT: vptestmd %zmm0, %zmm0, %k1
	; X64-NEXT: vptestmd %zmm1, %zmm1, %k1 {%k1}
	; X64-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0 {%k1} {z}
	; X64-NEXT: vpmovdw %zmm0, %ymm0
	; X64-NEXT: vpandn %ymm2, %ymm0, %ymm0			; X64-NEXT: vpandn %ymm2, %ymm0, %ymm0
	; X64-NEXT: retq			; X64-NEXT: retq
	%mask = and <16 x i1> %a, %b			%mask = and <16 x i1> %a, %b
	%res = select <16 x i1> %mask, <16 x i16> zeroinitializer, <16 x i16> %c			%res = select <16 x i1> %mask, <16 x i16> zeroinitializer, <16 x i16> %c
	ret <16 x i16> %res			ret <16 x i16> %res
	}			}

test/CodeGen/X86/bitcast-and-setcc-128.ll

	Show All 24 Lines
	; AVX12-NEXT: vpacksswb %xmm0, %xmm0, %xmm0			; AVX12-NEXT: vpacksswb %xmm0, %xmm0, %xmm0
	; AVX12-NEXT: vpmovmskb %xmm0, %eax			; AVX12-NEXT: vpmovmskb %xmm0, %eax
	; AVX12-NEXT: # kill: def $al killed $al killed $eax			; AVX12-NEXT: # kill: def $al killed $al killed $eax
	; AVX12-NEXT: retq			; AVX12-NEXT: retq
	;			;
	; AVX512F-LABEL: v8i16:			; AVX512F-LABEL: v8i16:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm0			; AVX512F-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm0
				; AVX512F-NEXT: vpcmpgtw %xmm3, %xmm2, %xmm1
				; AVX512F-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX512F-NEXT: vpmovsxwd %xmm0, %ymm0			; AVX512F-NEXT: vpmovsxwd %xmm0, %ymm0
	; AVX512F-NEXT: vptestmd %ymm0, %ymm0, %k1			; AVX512F-NEXT: vptestmd %ymm0, %ymm0, %k0
	; AVX512F-NEXT: vpcmpgtw %xmm3, %xmm2, %xmm0
	; AVX512F-NEXT: vpmovsxwd %xmm0, %ymm0
	; AVX512F-NEXT: vptestmd %ymm0, %ymm0, %k0 {%k1}
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: # kill: def $al killed $al killed $eax			; AVX512F-NEXT: # kill: def $al killed $al killed $eax
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512BW-LABEL: v8i16:			; AVX512BW-LABEL: v8i16:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vpcmpgtw %xmm1, %xmm0, %k1			; AVX512BW-NEXT: vpcmpgtw %xmm1, %xmm0, %k1
	▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines
	; AVX12-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX12-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX12-NEXT: vpmovmskb %xmm0, %eax			; AVX12-NEXT: vpmovmskb %xmm0, %eax
	; AVX12-NEXT: # kill: def $ax killed $ax killed $eax			; AVX12-NEXT: # kill: def $ax killed $ax killed $eax
	; AVX12-NEXT: retq			; AVX12-NEXT: retq
	;			;
	; AVX512F-LABEL: v16i8:			; AVX512F-LABEL: v16i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpcmpgtb %xmm1, %xmm0, %xmm0			; AVX512F-NEXT: vpcmpgtb %xmm1, %xmm0, %xmm0
				; AVX512F-NEXT: vpcmpgtb %xmm3, %xmm2, %xmm1
				; AVX512F-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX512F-NEXT: vpmovsxbd %xmm0, %zmm0			; AVX512F-NEXT: vpmovsxbd %xmm0, %zmm0
	; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k1			; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k0
	; AVX512F-NEXT: vpcmpgtb %xmm3, %xmm2, %xmm0
	; AVX512F-NEXT: vpmovsxbd %xmm0, %zmm0
	; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: # kill: def $ax killed $ax killed $eax			; AVX512F-NEXT: # kill: def $ax killed $ax killed $eax
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512BW-LABEL: v16i8:			; AVX512BW-LABEL: v16i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vpcmpgtb %xmm1, %xmm0, %k1			; AVX512BW-NEXT: vpcmpgtb %xmm1, %xmm0, %k1
	▲ Show 20 Lines • Show All 734 Lines • ▼ Show 20 Lines
	; AVX512F-NEXT: vpsllw $8, %xmm2, %xmm2			; AVX512F-NEXT: vpsllw $8, %xmm2, %xmm2
	; AVX512F-NEXT: vpsraw $8, %xmm2, %xmm2			; AVX512F-NEXT: vpsraw $8, %xmm2, %xmm2
	; AVX512F-NEXT: vpcmpgtw %xmm3, %xmm2, %xmm2			; AVX512F-NEXT: vpcmpgtw %xmm3, %xmm2, %xmm2
	; AVX512F-NEXT: vpsllw $8, %xmm1, %xmm1			; AVX512F-NEXT: vpsllw $8, %xmm1, %xmm1
	; AVX512F-NEXT: vpsraw $8, %xmm1, %xmm1			; AVX512F-NEXT: vpsraw $8, %xmm1, %xmm1
	; AVX512F-NEXT: vpsllw $8, %xmm0, %xmm0			; AVX512F-NEXT: vpsllw $8, %xmm0, %xmm0
	; AVX512F-NEXT: vpsraw $8, %xmm0, %xmm0			; AVX512F-NEXT: vpsraw $8, %xmm0, %xmm0
	; AVX512F-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm0			; AVX512F-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm0
				; AVX512F-NEXT: vpand %xmm2, %xmm0, %xmm0
	; AVX512F-NEXT: vpmovsxwd %xmm0, %ymm0			; AVX512F-NEXT: vpmovsxwd %xmm0, %ymm0
	; AVX512F-NEXT: vptestmd %ymm0, %ymm0, %k1			; AVX512F-NEXT: vptestmd %ymm0, %ymm0, %k0
	; AVX512F-NEXT: vpmovsxwd %xmm2, %ymm0
	; AVX512F-NEXT: vptestmd %ymm0, %ymm0, %k0 {%k1}
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: # kill: def $al killed $al killed $eax			; AVX512F-NEXT: # kill: def $al killed $al killed $eax
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512BW-LABEL: v8i8:			; AVX512BW-LABEL: v8i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vpsllw $8, %xmm3, %xmm3			; AVX512BW-NEXT: vpsllw $8, %xmm3, %xmm3
	Show All 18 Lines

test/CodeGen/X86/bitcast-and-setcc-256.ll

	Show First 20 Lines • Show All 53 Lines • ▼ Show 20 Lines
	; SSE2-SSSE3-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm1[0,2]			; SSE2-SSSE3-NEXT: shufps {{.*#+}} xmm2 = xmm2[0,2],xmm1[0,2]
	; SSE2-SSSE3-NEXT: andps %xmm0, %xmm2			; SSE2-SSSE3-NEXT: andps %xmm0, %xmm2
	; SSE2-SSSE3-NEXT: movmskps %xmm2, %eax			; SSE2-SSSE3-NEXT: movmskps %xmm2, %eax
	; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax			; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax
	; SSE2-SSSE3-NEXT: retq			; SSE2-SSSE3-NEXT: retq
	;			;
	; AVX1-LABEL: v4i64:			; AVX1-LABEL: v4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm1
	; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpackssdw %xmm4, %xmm0, %xmm0			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm1			; AVX1-NEXT: vpand %xmm1, %xmm4, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm3
	; AVX1-NEXT: vpcmpgtq %xmm1, %xmm4, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm2
	; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpackssdw %xmm1, %xmm2, %xmm1			; AVX1-NEXT: vpand %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackssdw %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vmovmskps %xmm0, %eax			; AVX1-NEXT: vmovmskps %xmm0, %eax
	; AVX1-NEXT: # kill: def $al killed $al killed $eax			; AVX1-NEXT: # kill: def $al killed $al killed $eax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: v4i64:			; AVX2-LABEL: v4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0
				; AVX2-NEXT: vpcmpgtq %ymm3, %ymm2, %ymm1
				; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtq %ymm3, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm2
	; AVX2-NEXT: vpackssdw %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vmovmskps %xmm0, %eax			; AVX2-NEXT: vmovmskps %xmm0, %eax
	; AVX2-NEXT: # kill: def $al killed $al killed $eax			; AVX2-NEXT: # kill: def $al killed $al killed $eax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: v4i64:			; AVX512F-LABEL: v4i64:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpcmpgtq %ymm1, %ymm0, %k1			; AVX512F-NEXT: vpcmpgtq %ymm1, %ymm0, %k1
	Show All 30 Lines
	; SSE2-SSSE3-NEXT: andps %xmm2, %xmm6			; SSE2-SSSE3-NEXT: andps %xmm2, %xmm6
	; SSE2-SSSE3-NEXT: movmskps %xmm6, %eax			; SSE2-SSSE3-NEXT: movmskps %xmm6, %eax
	; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax			; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax
	; SSE2-SSSE3-NEXT: retq			; SSE2-SSSE3-NEXT: retq
	;			;
	; AVX12-LABEL: v4f64:			; AVX12-LABEL: v4f64:
	; AVX12: # %bb.0:			; AVX12: # %bb.0:
	; AVX12-NEXT: vcmpltpd %ymm0, %ymm1, %ymm0			; AVX12-NEXT: vcmpltpd %ymm0, %ymm1, %ymm0
				; AVX12-NEXT: vcmpltpd %ymm2, %ymm3, %ymm1
				; AVX12-NEXT: vandpd %ymm1, %ymm0, %ymm0
	; AVX12-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX12-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX12-NEXT: vpackssdw %xmm1, %xmm0, %xmm0			; AVX12-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
	; AVX12-NEXT: vcmpltpd %ymm2, %ymm3, %ymm1
	; AVX12-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX12-NEXT: vpackssdw %xmm2, %xmm1, %xmm1
	; AVX12-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX12-NEXT: vmovmskps %xmm0, %eax			; AVX12-NEXT: vmovmskps %xmm0, %eax
	; AVX12-NEXT: # kill: def $al killed $al killed $eax			; AVX12-NEXT: # kill: def $al killed $al killed $eax
	; AVX12-NEXT: vzeroupper			; AVX12-NEXT: vzeroupper
	; AVX12-NEXT: retq			; AVX12-NEXT: retq
	;			;
	; AVX512F-LABEL: v4f64:			; AVX512F-LABEL: v4f64:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vcmpltpd %ymm0, %ymm1, %k1			; AVX512F-NEXT: vcmpltpd %ymm0, %ymm1, %k1
	Show All 29 Lines
	; SSE2-SSSE3-NEXT: packsswb %xmm5, %xmm4			; SSE2-SSSE3-NEXT: packsswb %xmm5, %xmm4
	; SSE2-SSSE3-NEXT: pand %xmm0, %xmm4			; SSE2-SSSE3-NEXT: pand %xmm0, %xmm4
	; SSE2-SSSE3-NEXT: pmovmskb %xmm4, %eax			; SSE2-SSSE3-NEXT: pmovmskb %xmm4, %eax
	; SSE2-SSSE3-NEXT: # kill: def $ax killed $ax killed $eax			; SSE2-SSSE3-NEXT: # kill: def $ax killed $ax killed $eax
	; SSE2-SSSE3-NEXT: retq			; SSE2-SSSE3-NEXT: retq
	;			;
	; AVX1-LABEL: v16i16:			; AVX1-LABEL: v16i16:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4			; AVX1-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm1
	; AVX1-NEXT: vpcmpgtw %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpcmpgtw %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpacksswb %xmm4, %xmm0, %xmm0			; AVX1-NEXT: vpcmpgtw %xmm3, %xmm2, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm1			; AVX1-NEXT: vpand %xmm1, %xmm4, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm3
	; AVX1-NEXT: vpcmpgtw %xmm1, %xmm4, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm2
	; AVX1-NEXT: vpcmpgtw %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpcmpgtw %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpacksswb %xmm1, %xmm2, %xmm1			; AVX1-NEXT: vpand %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpacksswb %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vpmovmskb %xmm0, %eax			; AVX1-NEXT: vpmovmskb %xmm0, %eax
	; AVX1-NEXT: # kill: def $ax killed $ax killed $eax			; AVX1-NEXT: # kill: def $ax killed $ax killed $eax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: v16i16:			; AVX2-LABEL: v16i16:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0
				; AVX2-NEXT: vpcmpgtw %ymm3, %ymm2, %ymm1
				; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpacksswb %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtw %ymm3, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm2
	; AVX2-NEXT: vpacksswb %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %eax			; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: # kill: def $ax killed $ax killed $eax			; AVX2-NEXT: # kill: def $ax killed $ax killed $eax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: v16i16:			; AVX512F-LABEL: v16i16:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0			; AVX512F-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0
				; AVX512F-NEXT: vpcmpgtw %ymm3, %ymm2, %ymm1
				; AVX512F-NEXT: vpand %ymm1, %ymm0, %ymm0
	; AVX512F-NEXT: vpmovsxwd %ymm0, %zmm0			; AVX512F-NEXT: vpmovsxwd %ymm0, %zmm0
	; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k1			; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k0
	; AVX512F-NEXT: vpcmpgtw %ymm3, %ymm2, %ymm0
	; AVX512F-NEXT: vpmovsxwd %ymm0, %zmm0
	; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: # kill: def $ax killed $ax killed $eax			; AVX512F-NEXT: # kill: def $ax killed $ax killed $eax
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512BW-LABEL: v16i16:			; AVX512BW-LABEL: v16i16:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vpcmpgtw %ymm1, %ymm0, %k1			; AVX512BW-NEXT: vpcmpgtw %ymm1, %ymm0, %k1
	Show All 21 Lines
	; SSE2-SSSE3-NEXT: pand %xmm0, %xmm4			; SSE2-SSSE3-NEXT: pand %xmm0, %xmm4
	; SSE2-SSSE3-NEXT: packsswb %xmm0, %xmm4			; SSE2-SSSE3-NEXT: packsswb %xmm0, %xmm4
	; SSE2-SSSE3-NEXT: pmovmskb %xmm4, %eax			; SSE2-SSSE3-NEXT: pmovmskb %xmm4, %eax
	; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax			; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax
	; SSE2-SSSE3-NEXT: retq			; SSE2-SSSE3-NEXT: retq
	;			;
	; AVX1-LABEL: v8i32:			; AVX1-LABEL: v8i32:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4			; AVX1-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm4
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm1
	; AVX1-NEXT: vpcmpgtd %xmm4, %xmm5, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpcmpgtd %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpackssdw %xmm4, %xmm0, %xmm0			; AVX1-NEXT: vpcmpgtd %xmm3, %xmm2, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm1			; AVX1-NEXT: vpand %xmm1, %xmm4, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm3
	; AVX1-NEXT: vpcmpgtd %xmm1, %xmm4, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm2
	; AVX1-NEXT: vpcmpgtd %xmm3, %xmm2, %xmm2			; AVX1-NEXT: vpcmpgtd %xmm3, %xmm2, %xmm2
	; AVX1-NEXT: vpackssdw %xmm1, %xmm2, %xmm1			; AVX1-NEXT: vpand %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpand %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpackssdw %xmm0, %xmm1, %xmm0
	; AVX1-NEXT: vpacksswb %xmm0, %xmm0, %xmm0			; AVX1-NEXT: vpacksswb %xmm0, %xmm0, %xmm0
	; AVX1-NEXT: vpmovmskb %xmm0, %eax			; AVX1-NEXT: vpmovmskb %xmm0, %eax
	; AVX1-NEXT: # kill: def $al killed $al killed $eax			; AVX1-NEXT: # kill: def $al killed $al killed $eax
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: v8i32:			; AVX2-LABEL: v8i32:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpcmpgtd %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpcmpgtd %ymm1, %ymm0, %ymm0
				; AVX2-NEXT: vpcmpgtd %ymm3, %ymm2, %ymm1
				; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm0			; AVX2-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpcmpgtd %ymm3, %ymm2, %ymm1
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm2
	; AVX2-NEXT: vpackssdw %xmm2, %xmm1, %xmm1
	; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX2-NEXT: vpacksswb %xmm0, %xmm0, %xmm0			; AVX2-NEXT: vpacksswb %xmm0, %xmm0, %xmm0
	; AVX2-NEXT: vpmovmskb %xmm0, %eax			; AVX2-NEXT: vpmovmskb %xmm0, %eax
	; AVX2-NEXT: # kill: def $al killed $al killed $eax			; AVX2-NEXT: # kill: def $al killed $al killed $eax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: v8i32:			; AVX512F-LABEL: v8i32:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	Show All 32 Lines
	; SSE2-SSSE3-NEXT: packsswb %xmm0, %xmm6			; SSE2-SSSE3-NEXT: packsswb %xmm0, %xmm6
	; SSE2-SSSE3-NEXT: pmovmskb %xmm6, %eax			; SSE2-SSSE3-NEXT: pmovmskb %xmm6, %eax
	; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax			; SSE2-SSSE3-NEXT: # kill: def $al killed $al killed $eax
	; SSE2-SSSE3-NEXT: retq			; SSE2-SSSE3-NEXT: retq
	;			;
	; AVX12-LABEL: v8f32:			; AVX12-LABEL: v8f32:
	; AVX12: # %bb.0:			; AVX12: # %bb.0:
	; AVX12-NEXT: vcmpltps %ymm0, %ymm1, %ymm0			; AVX12-NEXT: vcmpltps %ymm0, %ymm1, %ymm0
				; AVX12-NEXT: vcmpltps %ymm2, %ymm3, %ymm1
				; AVX12-NEXT: vandps %ymm1, %ymm0, %ymm0
	; AVX12-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX12-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX12-NEXT: vpackssdw %xmm1, %xmm0, %xmm0			; AVX12-NEXT: vpackssdw %xmm1, %xmm0, %xmm0
	; AVX12-NEXT: vcmpltps %ymm2, %ymm3, %ymm1
	; AVX12-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX12-NEXT: vpackssdw %xmm2, %xmm1, %xmm1
	; AVX12-NEXT: vpand %xmm1, %xmm0, %xmm0
	; AVX12-NEXT: vpacksswb %xmm0, %xmm0, %xmm0			; AVX12-NEXT: vpacksswb %xmm0, %xmm0, %xmm0
	; AVX12-NEXT: vpmovmskb %xmm0, %eax			; AVX12-NEXT: vpmovmskb %xmm0, %eax
	; AVX12-NEXT: # kill: def $al killed $al killed $eax			; AVX12-NEXT: # kill: def $al killed $al killed $eax
	; AVX12-NEXT: vzeroupper			; AVX12-NEXT: vzeroupper
	; AVX12-NEXT: retq			; AVX12-NEXT: retq
	;			;
	; AVX512F-LABEL: v8f32:			; AVX512F-LABEL: v8f32:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	▲ Show 20 Lines • Show All 60 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpmovmskb %ymm0, %eax			; AVX2-NEXT: vpmovmskb %ymm0, %eax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: v32i8:			; AVX512F-LABEL: v32i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpcmpgtb %ymm1, %ymm0, %ymm0			; AVX512F-NEXT: vpcmpgtb %ymm1, %ymm0, %ymm0
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpcmpgtb %ymm3, %ymm2, %ymm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpand %ymm1, %ymm0, %ymm0
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k1			; AVX512F-NEXT: vpmovsxbd %xmm0, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm0, %zmm0			; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0
	; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k2
	; AVX512F-NEXT: vpcmpgtb %ymm3, %ymm2, %ymm0
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vpmovsxbd %xmm0, %zmm0
	; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k2}
	; AVX512F-NEXT: kmovw %k0, %ecx			; AVX512F-NEXT: kmovw %k0, %ecx
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0 {%k1}			; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm0
				; AVX512F-NEXT: vpmovsxbd %xmm0, %zmm0
				; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: shll $16, %eax			; AVX512F-NEXT: shll $16, %eax
	; AVX512F-NEXT: orl %ecx, %eax			; AVX512F-NEXT: orl %ecx, %eax
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512BW-LABEL: v32i8:			; AVX512BW-LABEL: v32i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	Show All 11 Lines

test/CodeGen/X86/bitcast-and-setcc-512.ll

	Show First 20 Lines • Show All 298 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpand %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpmovmskb %ymm0, %eax			; AVX2-NEXT: vpmovmskb %ymm0, %eax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: v32i16:			; AVX512F-LABEL: v32i16:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpcmpgtw %ymm3, %ymm1, %ymm1			; AVX512F-NEXT: vpcmpgtw %ymm3, %ymm1, %ymm1
	; AVX512F-NEXT: vpmovsxwd %ymm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k1
	; AVX512F-NEXT: vpcmpgtw %ymm2, %ymm0, %ymm0			; AVX512F-NEXT: vpcmpgtw %ymm2, %ymm0, %ymm0
				; AVX512F-NEXT: vpcmpgtw %ymm7, %ymm5, %ymm2
				; AVX512F-NEXT: vpand %ymm2, %ymm1, %ymm1
				; AVX512F-NEXT: vpcmpgtw %ymm6, %ymm4, %ymm2
				; AVX512F-NEXT: vpand %ymm2, %ymm0, %ymm0
	; AVX512F-NEXT: vpmovsxwd %ymm0, %zmm0			; AVX512F-NEXT: vpmovsxwd %ymm0, %zmm0
	; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k2			; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k0
	; AVX512F-NEXT: vpcmpgtw %ymm7, %ymm5, %ymm0
	; AVX512F-NEXT: vpmovsxwd %ymm0, %zmm0
	; AVX512F-NEXT: vpcmpgtw %ymm6, %ymm4, %ymm1
	; AVX512F-NEXT: vpmovsxwd %ymm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0 {%k2}
	; AVX512F-NEXT: kmovw %k0, %ecx			; AVX512F-NEXT: kmovw %k0, %ecx
	; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k1}			; AVX512F-NEXT: vpmovsxwd %ymm1, %zmm0
				; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: shll $16, %eax			; AVX512F-NEXT: shll $16, %eax
	; AVX512F-NEXT: orl %ecx, %eax			; AVX512F-NEXT: orl %ecx, %eax
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512BW-LABEL: v32i16:			; AVX512BW-LABEL: v32i16:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	▲ Show 20 Lines • Show All 283 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: orq %rcx, %rax			; AVX2-NEXT: orq %rcx, %rax
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: v64i8:			; AVX512F-LABEL: v64i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpcmpgtb %ymm3, %ymm1, %ymm1			; AVX512F-NEXT: vpcmpgtb %ymm3, %ymm1, %ymm1
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm3			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm3
	; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k1
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k2
	; AVX512F-NEXT: vpcmpgtb %ymm2, %ymm0, %ymm0			; AVX512F-NEXT: vpcmpgtb %ymm2, %ymm0, %ymm0
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm2
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpcmpgtb %ymm7, %ymm5, %ymm5
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k3			; AVX512F-NEXT: vextracti128 $1, %ymm5, %xmm7
	; AVX512F-NEXT: vpmovsxbd %xmm0, %zmm0			; AVX512F-NEXT: vpand %xmm7, %xmm3, %xmm3
	; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k4			; AVX512F-NEXT: vpcmpgtb %ymm6, %ymm4, %ymm4
	; AVX512F-NEXT: vpcmpgtb %ymm7, %ymm5, %ymm0			; AVX512F-NEXT: vextracti128 $1, %ymm4, %xmm6
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm1			; AVX512F-NEXT: vpand %xmm6, %xmm2, %xmm2
	; AVX512F-NEXT: vpmovsxbd %xmm1, %zmm1			; AVX512F-NEXT: vpand %xmm4, %xmm0, %xmm0
	; AVX512F-NEXT: vpmovsxbd %xmm0, %zmm0			; AVX512F-NEXT: vpmovsxbd %xmm0, %zmm0
	; AVX512F-NEXT: vpcmpgtb %ymm6, %ymm4, %ymm2			; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k0
	; AVX512F-NEXT: vextracti128 $1, %ymm2, %xmm3
	; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm3
	; AVX512F-NEXT: vpmovsxbd %xmm2, %zmm2
	; AVX512F-NEXT: vptestmd %zmm2, %zmm2, %k0 {%k4}
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: vptestmd %zmm3, %zmm3, %k0 {%k3}			; AVX512F-NEXT: vpmovsxbd %xmm2, %zmm0
				; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k0
	; AVX512F-NEXT: kmovw %k0, %ecx			; AVX512F-NEXT: kmovw %k0, %ecx
	; AVX512F-NEXT: shll $16, %ecx			; AVX512F-NEXT: shll $16, %ecx
	; AVX512F-NEXT: orl %eax, %ecx			; AVX512F-NEXT: orl %eax, %ecx
	; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k0 {%k2}			; AVX512F-NEXT: vpand %xmm5, %xmm1, %xmm0
				; AVX512F-NEXT: vpmovsxbd %xmm0, %zmm0
				; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k0
	; AVX512F-NEXT: kmovw %k0, %edx			; AVX512F-NEXT: kmovw %k0, %edx
	; AVX512F-NEXT: vptestmd %zmm1, %zmm1, %k0 {%k1}			; AVX512F-NEXT: vpmovsxbd %xmm3, %zmm0
				; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k0
	; AVX512F-NEXT: kmovw %k0, %eax			; AVX512F-NEXT: kmovw %k0, %eax
	; AVX512F-NEXT: shll $16, %eax			; AVX512F-NEXT: shll $16, %eax
	; AVX512F-NEXT: orl %edx, %eax			; AVX512F-NEXT: orl %edx, %eax
	; AVX512F-NEXT: shlq $32, %rax			; AVX512F-NEXT: shlq $32, %rax
	; AVX512F-NEXT: orq %rcx, %rax			; AVX512F-NEXT: orq %rcx, %rax
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	Show All 13 Lines

test/CodeGen/X86/psubus.ll

	Show First 20 Lines • Show All 930 Lines • ▼ Show 20 Lines
	; AVX1-LABEL: test15:			; AVX1-LABEL: test15:
	; AVX1: # %bb.0: # %vector.ph			; AVX1: # %bb.0: # %vector.ph
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpunpckhwd {{.*#+}} xmm2 = xmm0[4],xmm2[4],xmm0[5],xmm2[5],xmm0[6],xmm2[6],xmm0[7],xmm2[7]			; AVX1-NEXT: vpunpckhwd {{.*#+}} xmm2 = xmm0[4],xmm2[4],xmm0[5],xmm2[5],xmm0[6],xmm2[6],xmm0[7],xmm2[7]
	; AVX1-NEXT: vpmovzxwd {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero			; AVX1-NEXT: vpmovzxwd {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; AVX1-NEXT: vpminud %xmm3, %xmm2, %xmm4			; AVX1-NEXT: vpminud %xmm3, %xmm2, %xmm4
	; AVX1-NEXT: vpcmpeqd %xmm4, %xmm2, %xmm4			; AVX1-NEXT: vpcmpeqd %xmm4, %xmm2, %xmm4
	; AVX1-NEXT: vpcmpeqd %xmm5, %xmm5, %xmm5			; AVX1-NEXT: vpminud %xmm1, %xmm0, %xmm5
	; AVX1-NEXT: vpxor %xmm5, %xmm4, %xmm4			; AVX1-NEXT: vpcmpeqd %xmm5, %xmm0, %xmm5
	; AVX1-NEXT: vpminud %xmm1, %xmm0, %xmm6
	; AVX1-NEXT: vpcmpeqd %xmm6, %xmm0, %xmm6
	; AVX1-NEXT: vpxor %xmm5, %xmm6, %xmm5
	; AVX1-NEXT: vpackssdw %xmm4, %xmm5, %xmm4
	; AVX1-NEXT: vpsubd %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpsubd %xmm1, %xmm0, %xmm0
				; AVX1-NEXT: vpandn %xmm0, %xmm5, %xmm0
	; AVX1-NEXT: vpsubd %xmm3, %xmm2, %xmm1			; AVX1-NEXT: vpsubd %xmm3, %xmm2, %xmm1
				; AVX1-NEXT: vpandn %xmm1, %xmm4, %xmm1
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15]
	; AVX1-NEXT: vpshufb %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpshufb %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpshufb %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpshufb %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]			; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
	; AVX1-NEXT: vpand %xmm0, %xmm4, %xmm0
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test15:			; AVX2-LABEL: test15:
	; AVX2: # %bb.0: # %vector.ph			; AVX2: # %bb.0: # %vector.ph
	; AVX2-NEXT: vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero			; AVX2-NEXT: vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero
	; AVX2-NEXT: vpminud %ymm1, %ymm0, %ymm2			; AVX2-NEXT: vpminud %ymm1, %ymm0, %ymm2
	; AVX2-NEXT: vpcmpeqd %ymm2, %ymm0, %ymm2			; AVX2-NEXT: vpcmpeqd %ymm2, %ymm0, %ymm2
	; AVX2-NEXT: vpcmpeqd %ymm3, %ymm3, %ymm3
	; AVX2-NEXT: vpxor %ymm3, %ymm2, %ymm2
	; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm3
	; AVX2-NEXT: vpackssdw %xmm3, %xmm2, %xmm2
	; AVX2-NEXT: vpsubd %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpsubd %ymm1, %ymm0, %ymm0
				; AVX2-NEXT: vpandn %ymm0, %ymm2, %ymm0
	; AVX2-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15,16,17,20,21,24,25,28,29,24,25,28,29,28,29,30,31]			; AVX2-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15,16,17,20,21,24,25,28,29,24,25,28,29,28,29,30,31]
	; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,2,3]			; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,2,3]
	; AVX2-NEXT: vpand %xmm0, %xmm2, %xmm0			; AVX2-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test15:			; AVX512-LABEL: test15:
	; AVX512: # %bb.0: # %vector.ph			; AVX512: # %bb.0: # %vector.ph
	; AVX512-NEXT: vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero			; AVX512-NEXT: vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero
	; AVX512-NEXT: vpcmpnleud %ymm1, %ymm0, %k1			; AVX512-NEXT: vpcmpnleud %ymm1, %ymm0, %k1
	; AVX512-NEXT: vpsubd %ymm1, %ymm0, %ymm0			; AVX512-NEXT: vpsubd %ymm1, %ymm0, %ymm0
	▲ Show 20 Lines • Show All 86 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pand %xmm4, %xmm0			; SSE41-NEXT: pand %xmm4, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: test16:			; AVX1-LABEL: test16:
	; AVX1: # %bb.0: # %vector.ph			; AVX1: # %bb.0: # %vector.ph
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpunpckhwd {{.*#+}} xmm2 = xmm0[4],xmm2[4],xmm0[5],xmm2[5],xmm0[6],xmm2[6],xmm0[7],xmm2[7]			; AVX1-NEXT: vpunpckhwd {{.*#+}} xmm2 = xmm0[4],xmm2[4],xmm0[5],xmm2[5],xmm0[6],xmm2[6],xmm0[7],xmm2[7]
	; AVX1-NEXT: vpmovzxwd {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero			; AVX1-NEXT: vpmovzxwd {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vpmaxud %xmm0, %xmm1, %xmm3
	; AVX1-NEXT: vpmaxud %xmm2, %xmm3, %xmm4			; AVX1-NEXT: vpcmpeqd %xmm3, %xmm1, %xmm3
	; AVX1-NEXT: vpcmpeqd %xmm4, %xmm3, %xmm4			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm4
	; AVX1-NEXT: vpcmpeqd %xmm5, %xmm5, %xmm5			; AVX1-NEXT: vpmaxud %xmm2, %xmm4, %xmm5
	; AVX1-NEXT: vpxor %xmm5, %xmm4, %xmm4			; AVX1-NEXT: vpcmpeqd %xmm5, %xmm4, %xmm5
	; AVX1-NEXT: vpmaxud %xmm0, %xmm1, %xmm6
	; AVX1-NEXT: vpcmpeqd %xmm6, %xmm1, %xmm6
	; AVX1-NEXT: vpxor %xmm5, %xmm6, %xmm5
	; AVX1-NEXT: vpackssdw %xmm4, %xmm5, %xmm4
	; AVX1-NEXT: vpsubd %xmm1, %xmm0, %xmm0			; AVX1-NEXT: vpsubd %xmm1, %xmm0, %xmm0
	; AVX1-NEXT: vpsubd %xmm3, %xmm2, %xmm1			; AVX1-NEXT: vpandn %xmm0, %xmm3, %xmm0
				; AVX1-NEXT: vpsubd %xmm4, %xmm2, %xmm1
				; AVX1-NEXT: vpandn %xmm1, %xmm5, %xmm1
	; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15]			; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15]
	; AVX1-NEXT: vpshufb %xmm2, %xmm1, %xmm1			; AVX1-NEXT: vpshufb %xmm2, %xmm1, %xmm1
	; AVX1-NEXT: vpshufb %xmm2, %xmm0, %xmm0			; AVX1-NEXT: vpshufb %xmm2, %xmm0, %xmm0
	; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]			; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
	; AVX1-NEXT: vpand %xmm0, %xmm4, %xmm0
	; AVX1-NEXT: vzeroupper			; AVX1-NEXT: vzeroupper
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test16:			; AVX2-LABEL: test16:
	; AVX2: # %bb.0: # %vector.ph			; AVX2: # %bb.0: # %vector.ph
	; AVX2-NEXT: vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero			; AVX2-NEXT: vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero
	; AVX2-NEXT: vpmaxud %ymm0, %ymm1, %ymm2			; AVX2-NEXT: vpmaxud %ymm0, %ymm1, %ymm2
	; AVX2-NEXT: vpcmpeqd %ymm2, %ymm1, %ymm2			; AVX2-NEXT: vpcmpeqd %ymm2, %ymm1, %ymm2
	; AVX2-NEXT: vpcmpeqd %ymm3, %ymm3, %ymm3
	; AVX2-NEXT: vpxor %ymm3, %ymm2, %ymm2
	; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm3
	; AVX2-NEXT: vpackssdw %xmm3, %xmm2, %xmm2
	; AVX2-NEXT: vpsubd %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpsubd %ymm1, %ymm0, %ymm0
				; AVX2-NEXT: vpandn %ymm0, %ymm2, %ymm0
	; AVX2-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15,16,17,20,21,24,25,28,29,24,25,28,29,28,29,30,31]			; AVX2-NEXT: vpshufb {{.*#+}} ymm0 = ymm0[0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15,16,17,20,21,24,25,28,29,24,25,28,29,28,29,30,31]
	; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,2,3]			; AVX2-NEXT: vpermq {{.*#+}} ymm0 = ymm0[0,2,2,3]
	; AVX2-NEXT: vpand %xmm0, %xmm2, %xmm0			; AVX2-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0
	; AVX2-NEXT: vzeroupper			; AVX2-NEXT: vzeroupper
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: test16:			; AVX512-LABEL: test16:
	; AVX512: # %bb.0: # %vector.ph			; AVX512: # %bb.0: # %vector.ph
	; AVX512-NEXT: vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero			; AVX512-NEXT: vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero
	; AVX512-NEXT: vpcmpltud %ymm0, %ymm1, %k1			; AVX512-NEXT: vpcmpltud %ymm0, %ymm1, %k1
	; AVX512-NEXT: vpsubd %ymm1, %ymm0, %ymm0			; AVX512-NEXT: vpsubd %ymm1, %ymm0, %ymm0
	▲ Show 20 Lines • Show All 1,320 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-rotate-128.ll

	Show First 20 Lines • Show All 342 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: var_rotate_v8i16:			; AVX512F-LABEL: var_rotate_v8i16:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero			; AVX512F-NEXT: vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero
	; AVX512F-NEXT: vpand {{.*}}(%rip), %xmm1, %xmm1			; AVX512F-NEXT: vpand {{.*}}(%rip), %xmm1, %xmm1
	; AVX512F-NEXT: vpmovzxwd {{.*#+}} ymm2 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1[5],zero,xmm1[6],zero,xmm1[7],zero			; AVX512F-NEXT: vpmovzxwd {{.*#+}} ymm2 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1[5],zero,xmm1[6],zero,xmm1[7],zero
	; AVX512F-NEXT: vpsllvd %ymm2, %ymm0, %ymm2			; AVX512F-NEXT: vpsllvd %ymm2, %ymm0, %ymm2
	; AVX512F-NEXT: vpmovdw %zmm2, %ymm2
	; AVX512F-NEXT: vmovdqa {{.*#+}} xmm3 = [16,16,16,16,16,16,16,16]			; AVX512F-NEXT: vmovdqa {{.*#+}} xmm3 = [16,16,16,16,16,16,16,16]
	; AVX512F-NEXT: vpsubw %xmm1, %xmm3, %xmm1			; AVX512F-NEXT: vpsubw %xmm1, %xmm3, %xmm1
	; AVX512F-NEXT: vpmovzxwd {{.*#+}} ymm1 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1[5],zero,xmm1[6],zero,xmm1[7],zero			; AVX512F-NEXT: vpmovzxwd {{.*#+}} ymm1 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1[5],zero,xmm1[6],zero,xmm1[7],zero
	; AVX512F-NEXT: vpsrlvd %ymm1, %ymm0, %ymm0			; AVX512F-NEXT: vpsrlvd %ymm1, %ymm0, %ymm0
				; AVX512F-NEXT: vpor %ymm0, %ymm2, %ymm0
	; AVX512F-NEXT: vpmovdw %zmm0, %ymm0			; AVX512F-NEXT: vpmovdw %zmm0, %ymm0
	; AVX512F-NEXT: vpor %xmm0, %xmm2, %xmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0
	; AVX512F-NEXT: vzeroupper			; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: var_rotate_v8i16:			; AVX512VL-LABEL: var_rotate_v8i16:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero			; AVX512VL-NEXT: vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero
	; AVX512VL-NEXT: vpand {{.*}}(%rip), %xmm1, %xmm1			; AVX512VL-NEXT: vpand {{.*}}(%rip), %xmm1, %xmm1
	; AVX512VL-NEXT: vpmovzxwd {{.*#+}} ymm2 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1[5],zero,xmm1[6],zero,xmm1[7],zero			; AVX512VL-NEXT: vpmovzxwd {{.*#+}} ymm2 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1[5],zero,xmm1[6],zero,xmm1[7],zero
	; AVX512VL-NEXT: vpsllvd %ymm2, %ymm0, %ymm2			; AVX512VL-NEXT: vpsllvd %ymm2, %ymm0, %ymm2
	; AVX512VL-NEXT: vpmovdw %ymm2, %xmm2
	; AVX512VL-NEXT: vmovdqa {{.*#+}} xmm3 = [16,16,16,16,16,16,16,16]			; AVX512VL-NEXT: vmovdqa {{.*#+}} xmm3 = [16,16,16,16,16,16,16,16]
	; AVX512VL-NEXT: vpsubw %xmm1, %xmm3, %xmm1			; AVX512VL-NEXT: vpsubw %xmm1, %xmm3, %xmm1
	; AVX512VL-NEXT: vpmovzxwd {{.*#+}} ymm1 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1[5],zero,xmm1[6],zero,xmm1[7],zero			; AVX512VL-NEXT: vpmovzxwd {{.*#+}} ymm1 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1[5],zero,xmm1[6],zero,xmm1[7],zero
	; AVX512VL-NEXT: vpsrlvd %ymm1, %ymm0, %ymm0			; AVX512VL-NEXT: vpsrlvd %ymm1, %ymm0, %ymm0
				; AVX512VL-NEXT: vpor %ymm0, %ymm2, %ymm0
	; AVX512VL-NEXT: vpmovdw %ymm0, %xmm0			; AVX512VL-NEXT: vpmovdw %ymm0, %xmm0
	; AVX512VL-NEXT: vpor %xmm0, %xmm2, %xmm0
	; AVX512VL-NEXT: vzeroupper			; AVX512VL-NEXT: vzeroupper
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	;			;
	; AVX512BW-LABEL: var_rotate_v8i16:			; AVX512BW-LABEL: var_rotate_v8i16:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0			; AVX512BW-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512BW-NEXT: vpand {{.*}}(%rip), %xmm1, %xmm1			; AVX512BW-NEXT: vpand {{.*}}(%rip), %xmm1, %xmm1
	; AVX512BW-NEXT: vpsllvw %zmm1, %zmm0, %zmm2			; AVX512BW-NEXT: vpsllvw %zmm1, %zmm0, %zmm2
	▲ Show 20 Lines • Show All 205 Lines • ▼ Show 20 Lines
	;			;
	; AVX512BW-LABEL: var_rotate_v16i8:			; AVX512BW-LABEL: var_rotate_v16i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vmovdqa {{.*#+}} xmm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]			; AVX512BW-NEXT: vmovdqa {{.*#+}} xmm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]
	; AVX512BW-NEXT: vpsubb %xmm1, %xmm2, %xmm2			; AVX512BW-NEXT: vpsubb %xmm1, %xmm2, %xmm2
	; AVX512BW-NEXT: vpmovzxbw {{.*#+}} ymm1 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1[5],zero,xmm1[6],zero,xmm1[7],zero,xmm1[8],zero,xmm1[9],zero,xmm1[10],zero,xmm1[11],zero,xmm1[12],zero,xmm1[13],zero,xmm1[14],zero,xmm1[15],zero			; AVX512BW-NEXT: vpmovzxbw {{.*#+}} ymm1 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1[5],zero,xmm1[6],zero,xmm1[7],zero,xmm1[8],zero,xmm1[9],zero,xmm1[10],zero,xmm1[11],zero,xmm1[12],zero,xmm1[13],zero,xmm1[14],zero,xmm1[15],zero
	; AVX512BW-NEXT: vpmovzxbw {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero,xmm0[8],zero,xmm0[9],zero,xmm0[10],zero,xmm0[11],zero,xmm0[12],zero,xmm0[13],zero,xmm0[14],zero,xmm0[15],zero			; AVX512BW-NEXT: vpmovzxbw {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero,xmm0[8],zero,xmm0[9],zero,xmm0[10],zero,xmm0[11],zero,xmm0[12],zero,xmm0[13],zero,xmm0[14],zero,xmm0[15],zero
	; AVX512BW-NEXT: vpsllvw %zmm1, %zmm0, %zmm1			; AVX512BW-NEXT: vpsllvw %zmm1, %zmm0, %zmm1
	; AVX512BW-NEXT: vpmovwb %zmm1, %ymm1
	; AVX512BW-NEXT: vpmovzxbw {{.*#+}} ymm2 = xmm2[0],zero,xmm2[1],zero,xmm2[2],zero,xmm2[3],zero,xmm2[4],zero,xmm2[5],zero,xmm2[6],zero,xmm2[7],zero,xmm2[8],zero,xmm2[9],zero,xmm2[10],zero,xmm2[11],zero,xmm2[12],zero,xmm2[13],zero,xmm2[14],zero,xmm2[15],zero			; AVX512BW-NEXT: vpmovzxbw {{.*#+}} ymm2 = xmm2[0],zero,xmm2[1],zero,xmm2[2],zero,xmm2[3],zero,xmm2[4],zero,xmm2[5],zero,xmm2[6],zero,xmm2[7],zero,xmm2[8],zero,xmm2[9],zero,xmm2[10],zero,xmm2[11],zero,xmm2[12],zero,xmm2[13],zero,xmm2[14],zero,xmm2[15],zero
	; AVX512BW-NEXT: vpsrlvw %zmm2, %zmm0, %zmm0			; AVX512BW-NEXT: vpsrlvw %zmm2, %zmm0, %zmm0
				; AVX512BW-NEXT: vpor %ymm0, %ymm1, %ymm0
	; AVX512BW-NEXT: vpmovwb %zmm0, %ymm0			; AVX512BW-NEXT: vpmovwb %zmm0, %ymm0
	; AVX512BW-NEXT: vpor %xmm0, %xmm1, %xmm0			; AVX512BW-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0
	; AVX512BW-NEXT: vzeroupper			; AVX512BW-NEXT: vzeroupper
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512VLBW-LABEL: var_rotate_v16i8:			; AVX512VLBW-LABEL: var_rotate_v16i8:
	; AVX512VLBW: # %bb.0:			; AVX512VLBW: # %bb.0:
	; AVX512VLBW-NEXT: vmovdqa {{.*#+}} xmm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]			; AVX512VLBW-NEXT: vmovdqa {{.*#+}} xmm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]
	; AVX512VLBW-NEXT: vpsubb %xmm1, %xmm2, %xmm2			; AVX512VLBW-NEXT: vpsubb %xmm1, %xmm2, %xmm2
	; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} ymm1 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1[5],zero,xmm1[6],zero,xmm1[7],zero,xmm1[8],zero,xmm1[9],zero,xmm1[10],zero,xmm1[11],zero,xmm1[12],zero,xmm1[13],zero,xmm1[14],zero,xmm1[15],zero			; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} ymm1 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1[5],zero,xmm1[6],zero,xmm1[7],zero,xmm1[8],zero,xmm1[9],zero,xmm1[10],zero,xmm1[11],zero,xmm1[12],zero,xmm1[13],zero,xmm1[14],zero,xmm1[15],zero
	; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero,xmm0[8],zero,xmm0[9],zero,xmm0[10],zero,xmm0[11],zero,xmm0[12],zero,xmm0[13],zero,xmm0[14],zero,xmm0[15],zero			; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero,xmm0[8],zero,xmm0[9],zero,xmm0[10],zero,xmm0[11],zero,xmm0[12],zero,xmm0[13],zero,xmm0[14],zero,xmm0[15],zero
	; AVX512VLBW-NEXT: vpsllvw %ymm1, %ymm0, %ymm1			; AVX512VLBW-NEXT: vpsllvw %ymm1, %ymm0, %ymm1
	; AVX512VLBW-NEXT: vpmovwb %ymm1, %xmm1
	; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} ymm2 = xmm2[0],zero,xmm2[1],zero,xmm2[2],zero,xmm2[3],zero,xmm2[4],zero,xmm2[5],zero,xmm2[6],zero,xmm2[7],zero,xmm2[8],zero,xmm2[9],zero,xmm2[10],zero,xmm2[11],zero,xmm2[12],zero,xmm2[13],zero,xmm2[14],zero,xmm2[15],zero			; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} ymm2 = xmm2[0],zero,xmm2[1],zero,xmm2[2],zero,xmm2[3],zero,xmm2[4],zero,xmm2[5],zero,xmm2[6],zero,xmm2[7],zero,xmm2[8],zero,xmm2[9],zero,xmm2[10],zero,xmm2[11],zero,xmm2[12],zero,xmm2[13],zero,xmm2[14],zero,xmm2[15],zero
	; AVX512VLBW-NEXT: vpsrlvw %ymm2, %ymm0, %ymm0			; AVX512VLBW-NEXT: vpsrlvw %ymm2, %ymm0, %ymm0
				; AVX512VLBW-NEXT: vpor %ymm0, %ymm1, %ymm0
	; AVX512VLBW-NEXT: vpmovwb %ymm0, %xmm0			; AVX512VLBW-NEXT: vpmovwb %ymm0, %xmm0
	; AVX512VLBW-NEXT: vpor %xmm0, %xmm1, %xmm0
	; AVX512VLBW-NEXT: vzeroupper			; AVX512VLBW-NEXT: vzeroupper
	; AVX512VLBW-NEXT: retq			; AVX512VLBW-NEXT: retq
	;			;
	; XOP-LABEL: var_rotate_v16i8:			; XOP-LABEL: var_rotate_v16i8:
	; XOP: # %bb.0:			; XOP: # %bb.0:
	; XOP-NEXT: vprotb %xmm1, %xmm0, %xmm0			; XOP-NEXT: vprotb %xmm1, %xmm0, %xmm0
	; XOP-NEXT: retq			; XOP-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 556 Lines • ▼ Show 20 Lines
	; AVX512BW-LABEL: splatvar_rotate_v16i8:			; AVX512BW-LABEL: splatvar_rotate_v16i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vpbroadcastb %xmm1, %xmm1			; AVX512BW-NEXT: vpbroadcastb %xmm1, %xmm1
	; AVX512BW-NEXT: vmovdqa {{.*#+}} xmm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]			; AVX512BW-NEXT: vmovdqa {{.*#+}} xmm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]
	; AVX512BW-NEXT: vpsubb %xmm1, %xmm2, %xmm2			; AVX512BW-NEXT: vpsubb %xmm1, %xmm2, %xmm2
	; AVX512BW-NEXT: vpmovzxbw {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero,xmm0[8],zero,xmm0[9],zero,xmm0[10],zero,xmm0[11],zero,xmm0[12],zero,xmm0[13],zero,xmm0[14],zero,xmm0[15],zero			; AVX512BW-NEXT: vpmovzxbw {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero,xmm0[8],zero,xmm0[9],zero,xmm0[10],zero,xmm0[11],zero,xmm0[12],zero,xmm0[13],zero,xmm0[14],zero,xmm0[15],zero
	; AVX512BW-NEXT: vpmovzxbw {{.*#+}} ymm1 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1[5],zero,xmm1[6],zero,xmm1[7],zero,xmm1[8],zero,xmm1[9],zero,xmm1[10],zero,xmm1[11],zero,xmm1[12],zero,xmm1[13],zero,xmm1[14],zero,xmm1[15],zero			; AVX512BW-NEXT: vpmovzxbw {{.*#+}} ymm1 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1[5],zero,xmm1[6],zero,xmm1[7],zero,xmm1[8],zero,xmm1[9],zero,xmm1[10],zero,xmm1[11],zero,xmm1[12],zero,xmm1[13],zero,xmm1[14],zero,xmm1[15],zero
	; AVX512BW-NEXT: vpsllvw %zmm1, %zmm0, %zmm1			; AVX512BW-NEXT: vpsllvw %zmm1, %zmm0, %zmm1
	; AVX512BW-NEXT: vpmovwb %zmm1, %ymm1
	; AVX512BW-NEXT: vpmovzxbw {{.*#+}} ymm2 = xmm2[0],zero,xmm2[1],zero,xmm2[2],zero,xmm2[3],zero,xmm2[4],zero,xmm2[5],zero,xmm2[6],zero,xmm2[7],zero,xmm2[8],zero,xmm2[9],zero,xmm2[10],zero,xmm2[11],zero,xmm2[12],zero,xmm2[13],zero,xmm2[14],zero,xmm2[15],zero			; AVX512BW-NEXT: vpmovzxbw {{.*#+}} ymm2 = xmm2[0],zero,xmm2[1],zero,xmm2[2],zero,xmm2[3],zero,xmm2[4],zero,xmm2[5],zero,xmm2[6],zero,xmm2[7],zero,xmm2[8],zero,xmm2[9],zero,xmm2[10],zero,xmm2[11],zero,xmm2[12],zero,xmm2[13],zero,xmm2[14],zero,xmm2[15],zero
	; AVX512BW-NEXT: vpsrlvw %zmm2, %zmm0, %zmm0			; AVX512BW-NEXT: vpsrlvw %zmm2, %zmm0, %zmm0
				; AVX512BW-NEXT: vpor %ymm0, %ymm1, %ymm0
	; AVX512BW-NEXT: vpmovwb %zmm0, %ymm0			; AVX512BW-NEXT: vpmovwb %zmm0, %ymm0
	; AVX512BW-NEXT: vpor %xmm0, %xmm1, %xmm0			; AVX512BW-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0
	; AVX512BW-NEXT: vzeroupper			; AVX512BW-NEXT: vzeroupper
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512VLBW-LABEL: splatvar_rotate_v16i8:			; AVX512VLBW-LABEL: splatvar_rotate_v16i8:
	; AVX512VLBW: # %bb.0:			; AVX512VLBW: # %bb.0:
	; AVX512VLBW-NEXT: vpbroadcastb %xmm1, %xmm1			; AVX512VLBW-NEXT: vpbroadcastb %xmm1, %xmm1
	; AVX512VLBW-NEXT: vmovdqa {{.*#+}} xmm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]			; AVX512VLBW-NEXT: vmovdqa {{.*#+}} xmm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]
	; AVX512VLBW-NEXT: vpsubb %xmm1, %xmm2, %xmm2			; AVX512VLBW-NEXT: vpsubb %xmm1, %xmm2, %xmm2
	; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero,xmm0[8],zero,xmm0[9],zero,xmm0[10],zero,xmm0[11],zero,xmm0[12],zero,xmm0[13],zero,xmm0[14],zero,xmm0[15],zero			; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero,xmm0[8],zero,xmm0[9],zero,xmm0[10],zero,xmm0[11],zero,xmm0[12],zero,xmm0[13],zero,xmm0[14],zero,xmm0[15],zero
	; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} ymm1 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1[5],zero,xmm1[6],zero,xmm1[7],zero,xmm1[8],zero,xmm1[9],zero,xmm1[10],zero,xmm1[11],zero,xmm1[12],zero,xmm1[13],zero,xmm1[14],zero,xmm1[15],zero			; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} ymm1 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1[5],zero,xmm1[6],zero,xmm1[7],zero,xmm1[8],zero,xmm1[9],zero,xmm1[10],zero,xmm1[11],zero,xmm1[12],zero,xmm1[13],zero,xmm1[14],zero,xmm1[15],zero
	; AVX512VLBW-NEXT: vpsllvw %ymm1, %ymm0, %ymm1			; AVX512VLBW-NEXT: vpsllvw %ymm1, %ymm0, %ymm1
	; AVX512VLBW-NEXT: vpmovwb %ymm1, %xmm1
	; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} ymm2 = xmm2[0],zero,xmm2[1],zero,xmm2[2],zero,xmm2[3],zero,xmm2[4],zero,xmm2[5],zero,xmm2[6],zero,xmm2[7],zero,xmm2[8],zero,xmm2[9],zero,xmm2[10],zero,xmm2[11],zero,xmm2[12],zero,xmm2[13],zero,xmm2[14],zero,xmm2[15],zero			; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} ymm2 = xmm2[0],zero,xmm2[1],zero,xmm2[2],zero,xmm2[3],zero,xmm2[4],zero,xmm2[5],zero,xmm2[6],zero,xmm2[7],zero,xmm2[8],zero,xmm2[9],zero,xmm2[10],zero,xmm2[11],zero,xmm2[12],zero,xmm2[13],zero,xmm2[14],zero,xmm2[15],zero
	; AVX512VLBW-NEXT: vpsrlvw %ymm2, %ymm0, %ymm0			; AVX512VLBW-NEXT: vpsrlvw %ymm2, %ymm0, %ymm0
				; AVX512VLBW-NEXT: vpor %ymm0, %ymm1, %ymm0
	; AVX512VLBW-NEXT: vpmovwb %ymm0, %xmm0			; AVX512VLBW-NEXT: vpmovwb %ymm0, %xmm0
	; AVX512VLBW-NEXT: vpor %xmm0, %xmm1, %xmm0
	; AVX512VLBW-NEXT: vzeroupper			; AVX512VLBW-NEXT: vzeroupper
	; AVX512VLBW-NEXT: retq			; AVX512VLBW-NEXT: retq
	;			;
	; XOPAVX1-LABEL: splatvar_rotate_v16i8:			; XOPAVX1-LABEL: splatvar_rotate_v16i8:
	; XOPAVX1: # %bb.0:			; XOPAVX1: # %bb.0:
	; XOPAVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; XOPAVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; XOPAVX1-NEXT: vpshufb %xmm2, %xmm1, %xmm1			; XOPAVX1-NEXT: vpshufb %xmm2, %xmm1, %xmm1
	; XOPAVX1-NEXT: vprotb %xmm1, %xmm0, %xmm0			; XOPAVX1-NEXT: vprotb %xmm1, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 485 Lines • ▼ Show 20 Lines
	; AVX512VL-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0			; AVX512VL-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	;			;
	; AVX512BW-LABEL: constant_rotate_v16i8:			; AVX512BW-LABEL: constant_rotate_v16i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vmovdqa {{.*#+}} ymm1 = [0,1,2,3,4,5,6,7,8,7,6,5,4,3,2,1]			; AVX512BW-NEXT: vmovdqa {{.*#+}} ymm1 = [0,1,2,3,4,5,6,7,8,7,6,5,4,3,2,1]
	; AVX512BW-NEXT: vpmovzxbw {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero,xmm0[8],zero,xmm0[9],zero,xmm0[10],zero,xmm0[11],zero,xmm0[12],zero,xmm0[13],zero,xmm0[14],zero,xmm0[15],zero			; AVX512BW-NEXT: vpmovzxbw {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero,xmm0[8],zero,xmm0[9],zero,xmm0[10],zero,xmm0[11],zero,xmm0[12],zero,xmm0[13],zero,xmm0[14],zero,xmm0[15],zero
	; AVX512BW-NEXT: vpsllvw %zmm1, %zmm0, %zmm1			; AVX512BW-NEXT: vpsllvw %zmm1, %zmm0, %zmm1
	; AVX512BW-NEXT: vpmovwb %zmm1, %ymm1
	; AVX512BW-NEXT: vmovdqa {{.*#+}} ymm2 = [8,7,6,5,4,3,2,1,0,1,2,3,4,5,6,7]			; AVX512BW-NEXT: vmovdqa {{.*#+}} ymm2 = [8,7,6,5,4,3,2,1,0,1,2,3,4,5,6,7]
	; AVX512BW-NEXT: vpsrlvw %zmm2, %zmm0, %zmm0			; AVX512BW-NEXT: vpsrlvw %zmm2, %zmm0, %zmm0
				; AVX512BW-NEXT: vpor %ymm0, %ymm1, %ymm0
	; AVX512BW-NEXT: vpmovwb %zmm0, %ymm0			; AVX512BW-NEXT: vpmovwb %zmm0, %ymm0
	; AVX512BW-NEXT: vpor %xmm0, %xmm1, %xmm0			; AVX512BW-NEXT: # kill: def $xmm0 killed $xmm0 killed $ymm0
	; AVX512BW-NEXT: vzeroupper			; AVX512BW-NEXT: vzeroupper
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512VLBW-LABEL: constant_rotate_v16i8:			; AVX512VLBW-LABEL: constant_rotate_v16i8:
	; AVX512VLBW: # %bb.0:			; AVX512VLBW: # %bb.0:
	; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero,xmm0[8],zero,xmm0[9],zero,xmm0[10],zero,xmm0[11],zero,xmm0[12],zero,xmm0[13],zero,xmm0[14],zero,xmm0[15],zero			; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0[5],zero,xmm0[6],zero,xmm0[7],zero,xmm0[8],zero,xmm0[9],zero,xmm0[10],zero,xmm0[11],zero,xmm0[12],zero,xmm0[13],zero,xmm0[14],zero,xmm0[15],zero
	; AVX512VLBW-NEXT: vpsllvw {{.*}}(%rip), %ymm0, %ymm1			; AVX512VLBW-NEXT: vpsllvw {{.*}}(%rip), %ymm0, %ymm1
	; AVX512VLBW-NEXT: vpmovwb %ymm1, %xmm1
	; AVX512VLBW-NEXT: vpsrlvw {{.*}}(%rip), %ymm0, %ymm0			; AVX512VLBW-NEXT: vpsrlvw {{.*}}(%rip), %ymm0, %ymm0
				; AVX512VLBW-NEXT: vpor %ymm0, %ymm1, %ymm0
	; AVX512VLBW-NEXT: vpmovwb %ymm0, %xmm0			; AVX512VLBW-NEXT: vpmovwb %ymm0, %xmm0
	; AVX512VLBW-NEXT: vpor %xmm0, %xmm1, %xmm0
	; AVX512VLBW-NEXT: vzeroupper			; AVX512VLBW-NEXT: vzeroupper
	; AVX512VLBW-NEXT: retq			; AVX512VLBW-NEXT: retq
	;			;
	; XOP-LABEL: constant_rotate_v16i8:			; XOP-LABEL: constant_rotate_v16i8:
	; XOP: # %bb.0:			; XOP: # %bb.0:
	; XOP-NEXT: vprotb {{.*}}(%rip), %xmm0, %xmm0			; XOP-NEXT: vprotb {{.*}}(%rip), %xmm0, %xmm0
	; XOP-NEXT: retq			; XOP-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 552 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-rotate-256.ll

	Show First 20 Lines • Show All 259 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: var_rotate_v16i16:			; AVX512F-LABEL: var_rotate_v16i16:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpmovzxwd {{.*#+}} zmm0 = ymm0[0],zero,ymm0[1],zero,ymm0[2],zero,ymm0[3],zero,ymm0[4],zero,ymm0[5],zero,ymm0[6],zero,ymm0[7],zero,ymm0[8],zero,ymm0[9],zero,ymm0[10],zero,ymm0[11],zero,ymm0[12],zero,ymm0[13],zero,ymm0[14],zero,ymm0[15],zero			; AVX512F-NEXT: vpmovzxwd {{.*#+}} zmm0 = ymm0[0],zero,ymm0[1],zero,ymm0[2],zero,ymm0[3],zero,ymm0[4],zero,ymm0[5],zero,ymm0[6],zero,ymm0[7],zero,ymm0[8],zero,ymm0[9],zero,ymm0[10],zero,ymm0[11],zero,ymm0[12],zero,ymm0[13],zero,ymm0[14],zero,ymm0[15],zero
	; AVX512F-NEXT: vpand {{.*}}(%rip), %ymm1, %ymm1			; AVX512F-NEXT: vpand {{.*}}(%rip), %ymm1, %ymm1
	; AVX512F-NEXT: vpmovzxwd {{.*#+}} zmm2 = ymm1[0],zero,ymm1[1],zero,ymm1[2],zero,ymm1[3],zero,ymm1[4],zero,ymm1[5],zero,ymm1[6],zero,ymm1[7],zero,ymm1[8],zero,ymm1[9],zero,ymm1[10],zero,ymm1[11],zero,ymm1[12],zero,ymm1[13],zero,ymm1[14],zero,ymm1[15],zero			; AVX512F-NEXT: vpmovzxwd {{.*#+}} zmm2 = ymm1[0],zero,ymm1[1],zero,ymm1[2],zero,ymm1[3],zero,ymm1[4],zero,ymm1[5],zero,ymm1[6],zero,ymm1[7],zero,ymm1[8],zero,ymm1[9],zero,ymm1[10],zero,ymm1[11],zero,ymm1[12],zero,ymm1[13],zero,ymm1[14],zero,ymm1[15],zero
	; AVX512F-NEXT: vpsllvd %zmm2, %zmm0, %zmm2			; AVX512F-NEXT: vpsllvd %zmm2, %zmm0, %zmm2
	; AVX512F-NEXT: vpmovdw %zmm2, %ymm2
	; AVX512F-NEXT: vmovdqa {{.*#+}} ymm3 = [16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16]			; AVX512F-NEXT: vmovdqa {{.*#+}} ymm3 = [16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16]
	; AVX512F-NEXT: vpsubw %ymm1, %ymm3, %ymm1			; AVX512F-NEXT: vpsubw %ymm1, %ymm3, %ymm1
	; AVX512F-NEXT: vpmovzxwd {{.*#+}} zmm1 = ymm1[0],zero,ymm1[1],zero,ymm1[2],zero,ymm1[3],zero,ymm1[4],zero,ymm1[5],zero,ymm1[6],zero,ymm1[7],zero,ymm1[8],zero,ymm1[9],zero,ymm1[10],zero,ymm1[11],zero,ymm1[12],zero,ymm1[13],zero,ymm1[14],zero,ymm1[15],zero			; AVX512F-NEXT: vpmovzxwd {{.*#+}} zmm1 = ymm1[0],zero,ymm1[1],zero,ymm1[2],zero,ymm1[3],zero,ymm1[4],zero,ymm1[5],zero,ymm1[6],zero,ymm1[7],zero,ymm1[8],zero,ymm1[9],zero,ymm1[10],zero,ymm1[11],zero,ymm1[12],zero,ymm1[13],zero,ymm1[14],zero,ymm1[15],zero
	; AVX512F-NEXT: vpsrlvd %zmm1, %zmm0, %zmm0			; AVX512F-NEXT: vpsrlvd %zmm1, %zmm0, %zmm0
				; AVX512F-NEXT: vpord %zmm0, %zmm2, %zmm0
	; AVX512F-NEXT: vpmovdw %zmm0, %ymm0			; AVX512F-NEXT: vpmovdw %zmm0, %ymm0
	; AVX512F-NEXT: vpor %ymm0, %ymm2, %ymm0
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: var_rotate_v16i16:			; AVX512VL-LABEL: var_rotate_v16i16:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vpmovzxwd {{.*#+}} zmm0 = ymm0[0],zero,ymm0[1],zero,ymm0[2],zero,ymm0[3],zero,ymm0[4],zero,ymm0[5],zero,ymm0[6],zero,ymm0[7],zero,ymm0[8],zero,ymm0[9],zero,ymm0[10],zero,ymm0[11],zero,ymm0[12],zero,ymm0[13],zero,ymm0[14],zero,ymm0[15],zero			; AVX512VL-NEXT: vpmovzxwd {{.*#+}} zmm0 = ymm0[0],zero,ymm0[1],zero,ymm0[2],zero,ymm0[3],zero,ymm0[4],zero,ymm0[5],zero,ymm0[6],zero,ymm0[7],zero,ymm0[8],zero,ymm0[9],zero,ymm0[10],zero,ymm0[11],zero,ymm0[12],zero,ymm0[13],zero,ymm0[14],zero,ymm0[15],zero
	; AVX512VL-NEXT: vpand {{.*}}(%rip), %ymm1, %ymm1			; AVX512VL-NEXT: vpand {{.*}}(%rip), %ymm1, %ymm1
	; AVX512VL-NEXT: vpmovzxwd {{.*#+}} zmm2 = ymm1[0],zero,ymm1[1],zero,ymm1[2],zero,ymm1[3],zero,ymm1[4],zero,ymm1[5],zero,ymm1[6],zero,ymm1[7],zero,ymm1[8],zero,ymm1[9],zero,ymm1[10],zero,ymm1[11],zero,ymm1[12],zero,ymm1[13],zero,ymm1[14],zero,ymm1[15],zero			; AVX512VL-NEXT: vpmovzxwd {{.*#+}} zmm2 = ymm1[0],zero,ymm1[1],zero,ymm1[2],zero,ymm1[3],zero,ymm1[4],zero,ymm1[5],zero,ymm1[6],zero,ymm1[7],zero,ymm1[8],zero,ymm1[9],zero,ymm1[10],zero,ymm1[11],zero,ymm1[12],zero,ymm1[13],zero,ymm1[14],zero,ymm1[15],zero
	; AVX512VL-NEXT: vpsllvd %zmm2, %zmm0, %zmm2			; AVX512VL-NEXT: vpsllvd %zmm2, %zmm0, %zmm2
	; AVX512VL-NEXT: vpmovdw %zmm2, %ymm2
	; AVX512VL-NEXT: vmovdqa {{.*#+}} ymm3 = [16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16]			; AVX512VL-NEXT: vmovdqa {{.*#+}} ymm3 = [16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16]
	; AVX512VL-NEXT: vpsubw %ymm1, %ymm3, %ymm1			; AVX512VL-NEXT: vpsubw %ymm1, %ymm3, %ymm1
	; AVX512VL-NEXT: vpmovzxwd {{.*#+}} zmm1 = ymm1[0],zero,ymm1[1],zero,ymm1[2],zero,ymm1[3],zero,ymm1[4],zero,ymm1[5],zero,ymm1[6],zero,ymm1[7],zero,ymm1[8],zero,ymm1[9],zero,ymm1[10],zero,ymm1[11],zero,ymm1[12],zero,ymm1[13],zero,ymm1[14],zero,ymm1[15],zero			; AVX512VL-NEXT: vpmovzxwd {{.*#+}} zmm1 = ymm1[0],zero,ymm1[1],zero,ymm1[2],zero,ymm1[3],zero,ymm1[4],zero,ymm1[5],zero,ymm1[6],zero,ymm1[7],zero,ymm1[8],zero,ymm1[9],zero,ymm1[10],zero,ymm1[11],zero,ymm1[12],zero,ymm1[13],zero,ymm1[14],zero,ymm1[15],zero
	; AVX512VL-NEXT: vpsrlvd %zmm1, %zmm0, %zmm0			; AVX512VL-NEXT: vpsrlvd %zmm1, %zmm0, %zmm0
				; AVX512VL-NEXT: vpord %zmm0, %zmm2, %zmm0
	; AVX512VL-NEXT: vpmovdw %zmm0, %ymm0			; AVX512VL-NEXT: vpmovdw %zmm0, %ymm0
	; AVX512VL-NEXT: vpor %ymm0, %ymm2, %ymm0
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	;			;
	; AVX512BW-LABEL: var_rotate_v16i16:			; AVX512BW-LABEL: var_rotate_v16i16:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0			; AVX512BW-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0
	; AVX512BW-NEXT: vpand {{.*}}(%rip), %ymm1, %ymm1			; AVX512BW-NEXT: vpand {{.*}}(%rip), %ymm1, %ymm1
	; AVX512BW-NEXT: vpsllvw %zmm1, %zmm0, %zmm2			; AVX512BW-NEXT: vpsllvw %zmm1, %zmm0, %zmm2
	; AVX512BW-NEXT: vmovdqa {{.*#+}} ymm3 = [16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16]			; AVX512BW-NEXT: vmovdqa {{.*#+}} ymm3 = [16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16]
	▲ Show 20 Lines • Show All 163 Lines • ▼ Show 20 Lines
	;			;
	; AVX512BW-LABEL: var_rotate_v32i8:			; AVX512BW-LABEL: var_rotate_v32i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vmovdqa {{.*#+}} ymm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]			; AVX512BW-NEXT: vmovdqa {{.*#+}} ymm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]
	; AVX512BW-NEXT: vpsubb %ymm1, %ymm2, %ymm2			; AVX512BW-NEXT: vpsubb %ymm1, %ymm2, %ymm2
	; AVX512BW-NEXT: vpmovzxbw {{.*#+}} zmm1 = ymm1[0],zero,ymm1[1],zero,ymm1[2],zero,ymm1[3],zero,ymm1[4],zero,ymm1[5],zero,ymm1[6],zero,ymm1[7],zero,ymm1[8],zero,ymm1[9],zero,ymm1[10],zero,ymm1[11],zero,ymm1[12],zero,ymm1[13],zero,ymm1[14],zero,ymm1[15],zero,ymm1[16],zero,ymm1[17],zero,ymm1[18],zero,ymm1[19],zero,ymm1[20],zero,ymm1[21],zero,ymm1[22],zero,ymm1[23],zero,ymm1[24],zero,ymm1[25],zero,ymm1[26],zero,ymm1[27],zero,ymm1[28],zero,ymm1[29],zero,ymm1[30],zero,ymm1[31],zero			; AVX512BW-NEXT: vpmovzxbw {{.*#+}} zmm1 = ymm1[0],zero,ymm1[1],zero,ymm1[2],zero,ymm1[3],zero,ymm1[4],zero,ymm1[5],zero,ymm1[6],zero,ymm1[7],zero,ymm1[8],zero,ymm1[9],zero,ymm1[10],zero,ymm1[11],zero,ymm1[12],zero,ymm1[13],zero,ymm1[14],zero,ymm1[15],zero,ymm1[16],zero,ymm1[17],zero,ymm1[18],zero,ymm1[19],zero,ymm1[20],zero,ymm1[21],zero,ymm1[22],zero,ymm1[23],zero,ymm1[24],zero,ymm1[25],zero,ymm1[26],zero,ymm1[27],zero,ymm1[28],zero,ymm1[29],zero,ymm1[30],zero,ymm1[31],zero
	; AVX512BW-NEXT: vpmovzxbw {{.*#+}} zmm0 = ymm0[0],zero,ymm0[1],zero,ymm0[2],zero,ymm0[3],zero,ymm0[4],zero,ymm0[5],zero,ymm0[6],zero,ymm0[7],zero,ymm0[8],zero,ymm0[9],zero,ymm0[10],zero,ymm0[11],zero,ymm0[12],zero,ymm0[13],zero,ymm0[14],zero,ymm0[15],zero,ymm0[16],zero,ymm0[17],zero,ymm0[18],zero,ymm0[19],zero,ymm0[20],zero,ymm0[21],zero,ymm0[22],zero,ymm0[23],zero,ymm0[24],zero,ymm0[25],zero,ymm0[26],zero,ymm0[27],zero,ymm0[28],zero,ymm0[29],zero,ymm0[30],zero,ymm0[31],zero			; AVX512BW-NEXT: vpmovzxbw {{.*#+}} zmm0 = ymm0[0],zero,ymm0[1],zero,ymm0[2],zero,ymm0[3],zero,ymm0[4],zero,ymm0[5],zero,ymm0[6],zero,ymm0[7],zero,ymm0[8],zero,ymm0[9],zero,ymm0[10],zero,ymm0[11],zero,ymm0[12],zero,ymm0[13],zero,ymm0[14],zero,ymm0[15],zero,ymm0[16],zero,ymm0[17],zero,ymm0[18],zero,ymm0[19],zero,ymm0[20],zero,ymm0[21],zero,ymm0[22],zero,ymm0[23],zero,ymm0[24],zero,ymm0[25],zero,ymm0[26],zero,ymm0[27],zero,ymm0[28],zero,ymm0[29],zero,ymm0[30],zero,ymm0[31],zero
	; AVX512BW-NEXT: vpsllvw %zmm1, %zmm0, %zmm1			; AVX512BW-NEXT: vpsllvw %zmm1, %zmm0, %zmm1
	; AVX512BW-NEXT: vpmovwb %zmm1, %ymm1
	; AVX512BW-NEXT: vpmovzxbw {{.*#+}} zmm2 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero,ymm2[16],zero,ymm2[17],zero,ymm2[18],zero,ymm2[19],zero,ymm2[20],zero,ymm2[21],zero,ymm2[22],zero,ymm2[23],zero,ymm2[24],zero,ymm2[25],zero,ymm2[26],zero,ymm2[27],zero,ymm2[28],zero,ymm2[29],zero,ymm2[30],zero,ymm2[31],zero			; AVX512BW-NEXT: vpmovzxbw {{.*#+}} zmm2 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero,ymm2[16],zero,ymm2[17],zero,ymm2[18],zero,ymm2[19],zero,ymm2[20],zero,ymm2[21],zero,ymm2[22],zero,ymm2[23],zero,ymm2[24],zero,ymm2[25],zero,ymm2[26],zero,ymm2[27],zero,ymm2[28],zero,ymm2[29],zero,ymm2[30],zero,ymm2[31],zero
	; AVX512BW-NEXT: vpsrlvw %zmm2, %zmm0, %zmm0			; AVX512BW-NEXT: vpsrlvw %zmm2, %zmm0, %zmm0
				; AVX512BW-NEXT: vporq %zmm0, %zmm1, %zmm0
	; AVX512BW-NEXT: vpmovwb %zmm0, %ymm0			; AVX512BW-NEXT: vpmovwb %zmm0, %ymm0
	; AVX512BW-NEXT: vpor %ymm0, %ymm1, %ymm0
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512VLBW-LABEL: var_rotate_v32i8:			; AVX512VLBW-LABEL: var_rotate_v32i8:
	; AVX512VLBW: # %bb.0:			; AVX512VLBW: # %bb.0:
	; AVX512VLBW-NEXT: vmovdqa {{.*#+}} ymm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]			; AVX512VLBW-NEXT: vmovdqa {{.*#+}} ymm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]
	; AVX512VLBW-NEXT: vpsubb %ymm1, %ymm2, %ymm2			; AVX512VLBW-NEXT: vpsubb %ymm1, %ymm2, %ymm2
	; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} zmm1 = ymm1[0],zero,ymm1[1],zero,ymm1[2],zero,ymm1[3],zero,ymm1[4],zero,ymm1[5],zero,ymm1[6],zero,ymm1[7],zero,ymm1[8],zero,ymm1[9],zero,ymm1[10],zero,ymm1[11],zero,ymm1[12],zero,ymm1[13],zero,ymm1[14],zero,ymm1[15],zero,ymm1[16],zero,ymm1[17],zero,ymm1[18],zero,ymm1[19],zero,ymm1[20],zero,ymm1[21],zero,ymm1[22],zero,ymm1[23],zero,ymm1[24],zero,ymm1[25],zero,ymm1[26],zero,ymm1[27],zero,ymm1[28],zero,ymm1[29],zero,ymm1[30],zero,ymm1[31],zero			; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} zmm1 = ymm1[0],zero,ymm1[1],zero,ymm1[2],zero,ymm1[3],zero,ymm1[4],zero,ymm1[5],zero,ymm1[6],zero,ymm1[7],zero,ymm1[8],zero,ymm1[9],zero,ymm1[10],zero,ymm1[11],zero,ymm1[12],zero,ymm1[13],zero,ymm1[14],zero,ymm1[15],zero,ymm1[16],zero,ymm1[17],zero,ymm1[18],zero,ymm1[19],zero,ymm1[20],zero,ymm1[21],zero,ymm1[22],zero,ymm1[23],zero,ymm1[24],zero,ymm1[25],zero,ymm1[26],zero,ymm1[27],zero,ymm1[28],zero,ymm1[29],zero,ymm1[30],zero,ymm1[31],zero
	; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} zmm0 = ymm0[0],zero,ymm0[1],zero,ymm0[2],zero,ymm0[3],zero,ymm0[4],zero,ymm0[5],zero,ymm0[6],zero,ymm0[7],zero,ymm0[8],zero,ymm0[9],zero,ymm0[10],zero,ymm0[11],zero,ymm0[12],zero,ymm0[13],zero,ymm0[14],zero,ymm0[15],zero,ymm0[16],zero,ymm0[17],zero,ymm0[18],zero,ymm0[19],zero,ymm0[20],zero,ymm0[21],zero,ymm0[22],zero,ymm0[23],zero,ymm0[24],zero,ymm0[25],zero,ymm0[26],zero,ymm0[27],zero,ymm0[28],zero,ymm0[29],zero,ymm0[30],zero,ymm0[31],zero			; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} zmm0 = ymm0[0],zero,ymm0[1],zero,ymm0[2],zero,ymm0[3],zero,ymm0[4],zero,ymm0[5],zero,ymm0[6],zero,ymm0[7],zero,ymm0[8],zero,ymm0[9],zero,ymm0[10],zero,ymm0[11],zero,ymm0[12],zero,ymm0[13],zero,ymm0[14],zero,ymm0[15],zero,ymm0[16],zero,ymm0[17],zero,ymm0[18],zero,ymm0[19],zero,ymm0[20],zero,ymm0[21],zero,ymm0[22],zero,ymm0[23],zero,ymm0[24],zero,ymm0[25],zero,ymm0[26],zero,ymm0[27],zero,ymm0[28],zero,ymm0[29],zero,ymm0[30],zero,ymm0[31],zero
	; AVX512VLBW-NEXT: vpsllvw %zmm1, %zmm0, %zmm1			; AVX512VLBW-NEXT: vpsllvw %zmm1, %zmm0, %zmm1
	; AVX512VLBW-NEXT: vpmovwb %zmm1, %ymm1
	; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} zmm2 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero,ymm2[16],zero,ymm2[17],zero,ymm2[18],zero,ymm2[19],zero,ymm2[20],zero,ymm2[21],zero,ymm2[22],zero,ymm2[23],zero,ymm2[24],zero,ymm2[25],zero,ymm2[26],zero,ymm2[27],zero,ymm2[28],zero,ymm2[29],zero,ymm2[30],zero,ymm2[31],zero			; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} zmm2 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero,ymm2[16],zero,ymm2[17],zero,ymm2[18],zero,ymm2[19],zero,ymm2[20],zero,ymm2[21],zero,ymm2[22],zero,ymm2[23],zero,ymm2[24],zero,ymm2[25],zero,ymm2[26],zero,ymm2[27],zero,ymm2[28],zero,ymm2[29],zero,ymm2[30],zero,ymm2[31],zero
	; AVX512VLBW-NEXT: vpsrlvw %zmm2, %zmm0, %zmm0			; AVX512VLBW-NEXT: vpsrlvw %zmm2, %zmm0, %zmm0
				; AVX512VLBW-NEXT: vporq %zmm0, %zmm1, %zmm0
	; AVX512VLBW-NEXT: vpmovwb %zmm0, %ymm0			; AVX512VLBW-NEXT: vpmovwb %zmm0, %ymm0
	; AVX512VLBW-NEXT: vpor %ymm0, %ymm1, %ymm0
	; AVX512VLBW-NEXT: retq			; AVX512VLBW-NEXT: retq
	;			;
	; XOPAVX1-LABEL: var_rotate_v32i8:			; XOPAVX1-LABEL: var_rotate_v32i8:
	; XOPAVX1: # %bb.0:			; XOPAVX1: # %bb.0:
	; XOPAVX1-NEXT: vextractf128 $1, %ymm1, %xmm2			; XOPAVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm3			; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
	; XOPAVX1-NEXT: vprotb %xmm2, %xmm3, %xmm2			; XOPAVX1-NEXT: vprotb %xmm2, %xmm3, %xmm2
	; XOPAVX1-NEXT: vprotb %xmm1, %xmm0, %xmm0			; XOPAVX1-NEXT: vprotb %xmm1, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 387 Lines • ▼ Show 20 Lines
	; AVX512BW-LABEL: splatvar_rotate_v32i8:			; AVX512BW-LABEL: splatvar_rotate_v32i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vpbroadcastb %xmm1, %ymm1			; AVX512BW-NEXT: vpbroadcastb %xmm1, %ymm1
	; AVX512BW-NEXT: vmovdqa {{.*#+}} ymm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]			; AVX512BW-NEXT: vmovdqa {{.*#+}} ymm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]
	; AVX512BW-NEXT: vpsubb %ymm1, %ymm2, %ymm2			; AVX512BW-NEXT: vpsubb %ymm1, %ymm2, %ymm2
	; AVX512BW-NEXT: vpmovzxbw {{.*#+}} zmm0 = ymm0[0],zero,ymm0[1],zero,ymm0[2],zero,ymm0[3],zero,ymm0[4],zero,ymm0[5],zero,ymm0[6],zero,ymm0[7],zero,ymm0[8],zero,ymm0[9],zero,ymm0[10],zero,ymm0[11],zero,ymm0[12],zero,ymm0[13],zero,ymm0[14],zero,ymm0[15],zero,ymm0[16],zero,ymm0[17],zero,ymm0[18],zero,ymm0[19],zero,ymm0[20],zero,ymm0[21],zero,ymm0[22],zero,ymm0[23],zero,ymm0[24],zero,ymm0[25],zero,ymm0[26],zero,ymm0[27],zero,ymm0[28],zero,ymm0[29],zero,ymm0[30],zero,ymm0[31],zero			; AVX512BW-NEXT: vpmovzxbw {{.*#+}} zmm0 = ymm0[0],zero,ymm0[1],zero,ymm0[2],zero,ymm0[3],zero,ymm0[4],zero,ymm0[5],zero,ymm0[6],zero,ymm0[7],zero,ymm0[8],zero,ymm0[9],zero,ymm0[10],zero,ymm0[11],zero,ymm0[12],zero,ymm0[13],zero,ymm0[14],zero,ymm0[15],zero,ymm0[16],zero,ymm0[17],zero,ymm0[18],zero,ymm0[19],zero,ymm0[20],zero,ymm0[21],zero,ymm0[22],zero,ymm0[23],zero,ymm0[24],zero,ymm0[25],zero,ymm0[26],zero,ymm0[27],zero,ymm0[28],zero,ymm0[29],zero,ymm0[30],zero,ymm0[31],zero
	; AVX512BW-NEXT: vpmovzxbw {{.*#+}} zmm1 = ymm1[0],zero,ymm1[1],zero,ymm1[2],zero,ymm1[3],zero,ymm1[4],zero,ymm1[5],zero,ymm1[6],zero,ymm1[7],zero,ymm1[8],zero,ymm1[9],zero,ymm1[10],zero,ymm1[11],zero,ymm1[12],zero,ymm1[13],zero,ymm1[14],zero,ymm1[15],zero,ymm1[16],zero,ymm1[17],zero,ymm1[18],zero,ymm1[19],zero,ymm1[20],zero,ymm1[21],zero,ymm1[22],zero,ymm1[23],zero,ymm1[24],zero,ymm1[25],zero,ymm1[26],zero,ymm1[27],zero,ymm1[28],zero,ymm1[29],zero,ymm1[30],zero,ymm1[31],zero			; AVX512BW-NEXT: vpmovzxbw {{.*#+}} zmm1 = ymm1[0],zero,ymm1[1],zero,ymm1[2],zero,ymm1[3],zero,ymm1[4],zero,ymm1[5],zero,ymm1[6],zero,ymm1[7],zero,ymm1[8],zero,ymm1[9],zero,ymm1[10],zero,ymm1[11],zero,ymm1[12],zero,ymm1[13],zero,ymm1[14],zero,ymm1[15],zero,ymm1[16],zero,ymm1[17],zero,ymm1[18],zero,ymm1[19],zero,ymm1[20],zero,ymm1[21],zero,ymm1[22],zero,ymm1[23],zero,ymm1[24],zero,ymm1[25],zero,ymm1[26],zero,ymm1[27],zero,ymm1[28],zero,ymm1[29],zero,ymm1[30],zero,ymm1[31],zero
	; AVX512BW-NEXT: vpsllvw %zmm1, %zmm0, %zmm1			; AVX512BW-NEXT: vpsllvw %zmm1, %zmm0, %zmm1
	; AVX512BW-NEXT: vpmovwb %zmm1, %ymm1
	; AVX512BW-NEXT: vpmovzxbw {{.*#+}} zmm2 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero,ymm2[16],zero,ymm2[17],zero,ymm2[18],zero,ymm2[19],zero,ymm2[20],zero,ymm2[21],zero,ymm2[22],zero,ymm2[23],zero,ymm2[24],zero,ymm2[25],zero,ymm2[26],zero,ymm2[27],zero,ymm2[28],zero,ymm2[29],zero,ymm2[30],zero,ymm2[31],zero			; AVX512BW-NEXT: vpmovzxbw {{.*#+}} zmm2 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero,ymm2[16],zero,ymm2[17],zero,ymm2[18],zero,ymm2[19],zero,ymm2[20],zero,ymm2[21],zero,ymm2[22],zero,ymm2[23],zero,ymm2[24],zero,ymm2[25],zero,ymm2[26],zero,ymm2[27],zero,ymm2[28],zero,ymm2[29],zero,ymm2[30],zero,ymm2[31],zero
	; AVX512BW-NEXT: vpsrlvw %zmm2, %zmm0, %zmm0			; AVX512BW-NEXT: vpsrlvw %zmm2, %zmm0, %zmm0
				; AVX512BW-NEXT: vporq %zmm0, %zmm1, %zmm0
	; AVX512BW-NEXT: vpmovwb %zmm0, %ymm0			; AVX512BW-NEXT: vpmovwb %zmm0, %ymm0
	; AVX512BW-NEXT: vpor %ymm0, %ymm1, %ymm0
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512VLBW-LABEL: splatvar_rotate_v32i8:			; AVX512VLBW-LABEL: splatvar_rotate_v32i8:
	; AVX512VLBW: # %bb.0:			; AVX512VLBW: # %bb.0:
	; AVX512VLBW-NEXT: vpbroadcastb %xmm1, %ymm1			; AVX512VLBW-NEXT: vpbroadcastb %xmm1, %ymm1
	; AVX512VLBW-NEXT: vmovdqa {{.*#+}} ymm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]			; AVX512VLBW-NEXT: vmovdqa {{.*#+}} ymm2 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]
	; AVX512VLBW-NEXT: vpsubb %ymm1, %ymm2, %ymm2			; AVX512VLBW-NEXT: vpsubb %ymm1, %ymm2, %ymm2
	; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} zmm0 = ymm0[0],zero,ymm0[1],zero,ymm0[2],zero,ymm0[3],zero,ymm0[4],zero,ymm0[5],zero,ymm0[6],zero,ymm0[7],zero,ymm0[8],zero,ymm0[9],zero,ymm0[10],zero,ymm0[11],zero,ymm0[12],zero,ymm0[13],zero,ymm0[14],zero,ymm0[15],zero,ymm0[16],zero,ymm0[17],zero,ymm0[18],zero,ymm0[19],zero,ymm0[20],zero,ymm0[21],zero,ymm0[22],zero,ymm0[23],zero,ymm0[24],zero,ymm0[25],zero,ymm0[26],zero,ymm0[27],zero,ymm0[28],zero,ymm0[29],zero,ymm0[30],zero,ymm0[31],zero			; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} zmm0 = ymm0[0],zero,ymm0[1],zero,ymm0[2],zero,ymm0[3],zero,ymm0[4],zero,ymm0[5],zero,ymm0[6],zero,ymm0[7],zero,ymm0[8],zero,ymm0[9],zero,ymm0[10],zero,ymm0[11],zero,ymm0[12],zero,ymm0[13],zero,ymm0[14],zero,ymm0[15],zero,ymm0[16],zero,ymm0[17],zero,ymm0[18],zero,ymm0[19],zero,ymm0[20],zero,ymm0[21],zero,ymm0[22],zero,ymm0[23],zero,ymm0[24],zero,ymm0[25],zero,ymm0[26],zero,ymm0[27],zero,ymm0[28],zero,ymm0[29],zero,ymm0[30],zero,ymm0[31],zero
	; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} zmm1 = ymm1[0],zero,ymm1[1],zero,ymm1[2],zero,ymm1[3],zero,ymm1[4],zero,ymm1[5],zero,ymm1[6],zero,ymm1[7],zero,ymm1[8],zero,ymm1[9],zero,ymm1[10],zero,ymm1[11],zero,ymm1[12],zero,ymm1[13],zero,ymm1[14],zero,ymm1[15],zero,ymm1[16],zero,ymm1[17],zero,ymm1[18],zero,ymm1[19],zero,ymm1[20],zero,ymm1[21],zero,ymm1[22],zero,ymm1[23],zero,ymm1[24],zero,ymm1[25],zero,ymm1[26],zero,ymm1[27],zero,ymm1[28],zero,ymm1[29],zero,ymm1[30],zero,ymm1[31],zero			; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} zmm1 = ymm1[0],zero,ymm1[1],zero,ymm1[2],zero,ymm1[3],zero,ymm1[4],zero,ymm1[5],zero,ymm1[6],zero,ymm1[7],zero,ymm1[8],zero,ymm1[9],zero,ymm1[10],zero,ymm1[11],zero,ymm1[12],zero,ymm1[13],zero,ymm1[14],zero,ymm1[15],zero,ymm1[16],zero,ymm1[17],zero,ymm1[18],zero,ymm1[19],zero,ymm1[20],zero,ymm1[21],zero,ymm1[22],zero,ymm1[23],zero,ymm1[24],zero,ymm1[25],zero,ymm1[26],zero,ymm1[27],zero,ymm1[28],zero,ymm1[29],zero,ymm1[30],zero,ymm1[31],zero
	; AVX512VLBW-NEXT: vpsllvw %zmm1, %zmm0, %zmm1			; AVX512VLBW-NEXT: vpsllvw %zmm1, %zmm0, %zmm1
	; AVX512VLBW-NEXT: vpmovwb %zmm1, %ymm1
	; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} zmm2 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero,ymm2[16],zero,ymm2[17],zero,ymm2[18],zero,ymm2[19],zero,ymm2[20],zero,ymm2[21],zero,ymm2[22],zero,ymm2[23],zero,ymm2[24],zero,ymm2[25],zero,ymm2[26],zero,ymm2[27],zero,ymm2[28],zero,ymm2[29],zero,ymm2[30],zero,ymm2[31],zero			; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} zmm2 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero,ymm2[16],zero,ymm2[17],zero,ymm2[18],zero,ymm2[19],zero,ymm2[20],zero,ymm2[21],zero,ymm2[22],zero,ymm2[23],zero,ymm2[24],zero,ymm2[25],zero,ymm2[26],zero,ymm2[27],zero,ymm2[28],zero,ymm2[29],zero,ymm2[30],zero,ymm2[31],zero
	; AVX512VLBW-NEXT: vpsrlvw %zmm2, %zmm0, %zmm0			; AVX512VLBW-NEXT: vpsrlvw %zmm2, %zmm0, %zmm0
				; AVX512VLBW-NEXT: vporq %zmm0, %zmm1, %zmm0
	; AVX512VLBW-NEXT: vpmovwb %zmm0, %ymm0			; AVX512VLBW-NEXT: vpmovwb %zmm0, %ymm0
	; AVX512VLBW-NEXT: vpor %ymm0, %ymm1, %ymm0
	; AVX512VLBW-NEXT: retq			; AVX512VLBW-NEXT: retq
	;			;
	; XOPAVX1-LABEL: splatvar_rotate_v32i8:			; XOPAVX1-LABEL: splatvar_rotate_v32i8:
	; XOPAVX1: # %bb.0:			; XOPAVX1: # %bb.0:
	; XOPAVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; XOPAVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; XOPAVX1-NEXT: vpshufb %xmm2, %xmm1, %xmm1			; XOPAVX1-NEXT: vpshufb %xmm2, %xmm1, %xmm1
	; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
	; XOPAVX1-NEXT: vprotb %xmm1, %xmm2, %xmm2			; XOPAVX1-NEXT: vprotb %xmm1, %xmm2, %xmm2
	▲ Show 20 Lines • Show All 375 Lines • ▼ Show 20 Lines
	; AVX512VL-NEXT: vpaddb %ymm2, %ymm2, %ymm2			; AVX512VL-NEXT: vpaddb %ymm2, %ymm2, %ymm2
	; AVX512VL-NEXT: vpblendvb %ymm2, %ymm1, %ymm0, %ymm0			; AVX512VL-NEXT: vpblendvb %ymm2, %ymm1, %ymm0, %ymm0
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	;			;
	; AVX512BW-LABEL: constant_rotate_v32i8:			; AVX512BW-LABEL: constant_rotate_v32i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vpmovzxbw {{.*#+}} zmm0 = ymm0[0],zero,ymm0[1],zero,ymm0[2],zero,ymm0[3],zero,ymm0[4],zero,ymm0[5],zero,ymm0[6],zero,ymm0[7],zero,ymm0[8],zero,ymm0[9],zero,ymm0[10],zero,ymm0[11],zero,ymm0[12],zero,ymm0[13],zero,ymm0[14],zero,ymm0[15],zero,ymm0[16],zero,ymm0[17],zero,ymm0[18],zero,ymm0[19],zero,ymm0[20],zero,ymm0[21],zero,ymm0[22],zero,ymm0[23],zero,ymm0[24],zero,ymm0[25],zero,ymm0[26],zero,ymm0[27],zero,ymm0[28],zero,ymm0[29],zero,ymm0[30],zero,ymm0[31],zero			; AVX512BW-NEXT: vpmovzxbw {{.*#+}} zmm0 = ymm0[0],zero,ymm0[1],zero,ymm0[2],zero,ymm0[3],zero,ymm0[4],zero,ymm0[5],zero,ymm0[6],zero,ymm0[7],zero,ymm0[8],zero,ymm0[9],zero,ymm0[10],zero,ymm0[11],zero,ymm0[12],zero,ymm0[13],zero,ymm0[14],zero,ymm0[15],zero,ymm0[16],zero,ymm0[17],zero,ymm0[18],zero,ymm0[19],zero,ymm0[20],zero,ymm0[21],zero,ymm0[22],zero,ymm0[23],zero,ymm0[24],zero,ymm0[25],zero,ymm0[26],zero,ymm0[27],zero,ymm0[28],zero,ymm0[29],zero,ymm0[30],zero,ymm0[31],zero
	; AVX512BW-NEXT: vpsllvw {{.*}}(%rip), %zmm0, %zmm1			; AVX512BW-NEXT: vpsllvw {{.*}}(%rip), %zmm0, %zmm1
	; AVX512BW-NEXT: vpmovwb %zmm1, %ymm1
	; AVX512BW-NEXT: vpsrlvw {{.*}}(%rip), %zmm0, %zmm0			; AVX512BW-NEXT: vpsrlvw {{.*}}(%rip), %zmm0, %zmm0
				; AVX512BW-NEXT: vporq %zmm0, %zmm1, %zmm0
	; AVX512BW-NEXT: vpmovwb %zmm0, %ymm0			; AVX512BW-NEXT: vpmovwb %zmm0, %ymm0
	; AVX512BW-NEXT: vpor %ymm0, %ymm1, %ymm0
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512VLBW-LABEL: constant_rotate_v32i8:			; AVX512VLBW-LABEL: constant_rotate_v32i8:
	; AVX512VLBW: # %bb.0:			; AVX512VLBW: # %bb.0:
	; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} zmm0 = ymm0[0],zero,ymm0[1],zero,ymm0[2],zero,ymm0[3],zero,ymm0[4],zero,ymm0[5],zero,ymm0[6],zero,ymm0[7],zero,ymm0[8],zero,ymm0[9],zero,ymm0[10],zero,ymm0[11],zero,ymm0[12],zero,ymm0[13],zero,ymm0[14],zero,ymm0[15],zero,ymm0[16],zero,ymm0[17],zero,ymm0[18],zero,ymm0[19],zero,ymm0[20],zero,ymm0[21],zero,ymm0[22],zero,ymm0[23],zero,ymm0[24],zero,ymm0[25],zero,ymm0[26],zero,ymm0[27],zero,ymm0[28],zero,ymm0[29],zero,ymm0[30],zero,ymm0[31],zero			; AVX512VLBW-NEXT: vpmovzxbw {{.*#+}} zmm0 = ymm0[0],zero,ymm0[1],zero,ymm0[2],zero,ymm0[3],zero,ymm0[4],zero,ymm0[5],zero,ymm0[6],zero,ymm0[7],zero,ymm0[8],zero,ymm0[9],zero,ymm0[10],zero,ymm0[11],zero,ymm0[12],zero,ymm0[13],zero,ymm0[14],zero,ymm0[15],zero,ymm0[16],zero,ymm0[17],zero,ymm0[18],zero,ymm0[19],zero,ymm0[20],zero,ymm0[21],zero,ymm0[22],zero,ymm0[23],zero,ymm0[24],zero,ymm0[25],zero,ymm0[26],zero,ymm0[27],zero,ymm0[28],zero,ymm0[29],zero,ymm0[30],zero,ymm0[31],zero
	; AVX512VLBW-NEXT: vpsllvw {{.*}}(%rip), %zmm0, %zmm1			; AVX512VLBW-NEXT: vpsllvw {{.*}}(%rip), %zmm0, %zmm1
	; AVX512VLBW-NEXT: vpmovwb %zmm1, %ymm1
	; AVX512VLBW-NEXT: vpsrlvw {{.*}}(%rip), %zmm0, %zmm0			; AVX512VLBW-NEXT: vpsrlvw {{.*}}(%rip), %zmm0, %zmm0
				; AVX512VLBW-NEXT: vporq %zmm0, %zmm1, %zmm0
	; AVX512VLBW-NEXT: vpmovwb %zmm0, %ymm0			; AVX512VLBW-NEXT: vpmovwb %zmm0, %ymm0
	; AVX512VLBW-NEXT: vpor %ymm0, %ymm1, %ymm0
	; AVX512VLBW-NEXT: retq			; AVX512VLBW-NEXT: retq
	;			;
	; XOPAVX1-LABEL: constant_rotate_v32i8:			; XOPAVX1-LABEL: constant_rotate_v32i8:
	; XOPAVX1: # %bb.0:			; XOPAVX1: # %bb.0:
	; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; XOPAVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [0,1,2,3,4,5,6,7,8,7,6,5,4,3,2,1]			; XOPAVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [0,1,2,3,4,5,6,7,8,7,6,5,4,3,2,1]
	; XOPAVX1-NEXT: vprotb %xmm2, %xmm1, %xmm1			; XOPAVX1-NEXT: vprotb %xmm2, %xmm1, %xmm1
	; XOPAVX1-NEXT: vprotb %xmm2, %xmm0, %xmm0			; XOPAVX1-NEXT: vprotb %xmm2, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 575 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-rotate-512.ll

	Show All 34 Lines
	define <32 x i16> @var_rotate_v32i16(<32 x i16> %a, <32 x i16> %b) nounwind {			define <32 x i16> @var_rotate_v32i16(<32 x i16> %a, <32 x i16> %b) nounwind {
	; AVX512F-LABEL: var_rotate_v32i16:			; AVX512F-LABEL: var_rotate_v32i16:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vmovdqa {{.*#+}} ymm4 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]			; AVX512F-NEXT: vmovdqa {{.*#+}} ymm4 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	; AVX512F-NEXT: vpand %ymm4, %ymm2, %ymm2			; AVX512F-NEXT: vpand %ymm4, %ymm2, %ymm2
	; AVX512F-NEXT: vpmovzxwd {{.*#+}} zmm5 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero			; AVX512F-NEXT: vpmovzxwd {{.*#+}} zmm5 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero
	; AVX512F-NEXT: vpmovzxwd {{.*#+}} zmm0 = ymm0[0],zero,ymm0[1],zero,ymm0[2],zero,ymm0[3],zero,ymm0[4],zero,ymm0[5],zero,ymm0[6],zero,ymm0[7],zero,ymm0[8],zero,ymm0[9],zero,ymm0[10],zero,ymm0[11],zero,ymm0[12],zero,ymm0[13],zero,ymm0[14],zero,ymm0[15],zero			; AVX512F-NEXT: vpmovzxwd {{.*#+}} zmm0 = ymm0[0],zero,ymm0[1],zero,ymm0[2],zero,ymm0[3],zero,ymm0[4],zero,ymm0[5],zero,ymm0[6],zero,ymm0[7],zero,ymm0[8],zero,ymm0[9],zero,ymm0[10],zero,ymm0[11],zero,ymm0[12],zero,ymm0[13],zero,ymm0[14],zero,ymm0[15],zero
	; AVX512F-NEXT: vpsllvd %zmm5, %zmm0, %zmm5			; AVX512F-NEXT: vpsllvd %zmm5, %zmm0, %zmm5
	; AVX512F-NEXT: vpmovdw %zmm5, %ymm5
	; AVX512F-NEXT: vmovdqa {{.*#+}} ymm6 = [16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16]			; AVX512F-NEXT: vmovdqa {{.*#+}} ymm6 = [16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16]
	; AVX512F-NEXT: vpsubw %ymm2, %ymm6, %ymm2			; AVX512F-NEXT: vpsubw %ymm2, %ymm6, %ymm2
	; AVX512F-NEXT: vpmovzxwd {{.*#+}} zmm2 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero			; AVX512F-NEXT: vpmovzxwd {{.*#+}} zmm2 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero
	; AVX512F-NEXT: vpsrlvd %zmm2, %zmm0, %zmm0			; AVX512F-NEXT: vpsrlvd %zmm2, %zmm0, %zmm0
				; AVX512F-NEXT: vpord %zmm0, %zmm5, %zmm0
	; AVX512F-NEXT: vpmovdw %zmm0, %ymm0			; AVX512F-NEXT: vpmovdw %zmm0, %ymm0
	; AVX512F-NEXT: vpor %ymm0, %ymm5, %ymm0
	; AVX512F-NEXT: vpand %ymm4, %ymm3, %ymm2			; AVX512F-NEXT: vpand %ymm4, %ymm3, %ymm2
	; AVX512F-NEXT: vpmovzxwd {{.*#+}} zmm3 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero			; AVX512F-NEXT: vpmovzxwd {{.*#+}} zmm3 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero
	; AVX512F-NEXT: vpmovzxwd {{.*#+}} zmm1 = ymm1[0],zero,ymm1[1],zero,ymm1[2],zero,ymm1[3],zero,ymm1[4],zero,ymm1[5],zero,ymm1[6],zero,ymm1[7],zero,ymm1[8],zero,ymm1[9],zero,ymm1[10],zero,ymm1[11],zero,ymm1[12],zero,ymm1[13],zero,ymm1[14],zero,ymm1[15],zero			; AVX512F-NEXT: vpmovzxwd {{.*#+}} zmm1 = ymm1[0],zero,ymm1[1],zero,ymm1[2],zero,ymm1[3],zero,ymm1[4],zero,ymm1[5],zero,ymm1[6],zero,ymm1[7],zero,ymm1[8],zero,ymm1[9],zero,ymm1[10],zero,ymm1[11],zero,ymm1[12],zero,ymm1[13],zero,ymm1[14],zero,ymm1[15],zero
	; AVX512F-NEXT: vpsllvd %zmm3, %zmm1, %zmm3			; AVX512F-NEXT: vpsllvd %zmm3, %zmm1, %zmm3
	; AVX512F-NEXT: vpmovdw %zmm3, %ymm3
	; AVX512F-NEXT: vpsubw %ymm2, %ymm6, %ymm2			; AVX512F-NEXT: vpsubw %ymm2, %ymm6, %ymm2
	; AVX512F-NEXT: vpmovzxwd {{.*#+}} zmm2 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero			; AVX512F-NEXT: vpmovzxwd {{.*#+}} zmm2 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero
	; AVX512F-NEXT: vpsrlvd %zmm2, %zmm1, %zmm1			; AVX512F-NEXT: vpsrlvd %zmm2, %zmm1, %zmm1
				; AVX512F-NEXT: vpord %zmm1, %zmm3, %zmm1
	; AVX512F-NEXT: vpmovdw %zmm1, %ymm1			; AVX512F-NEXT: vpmovdw %zmm1, %ymm1
	; AVX512F-NEXT: vpor %ymm1, %ymm3, %ymm1
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: var_rotate_v32i16:			; AVX512VL-LABEL: var_rotate_v32i16:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vmovdqa {{.*#+}} ymm4 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]			; AVX512VL-NEXT: vmovdqa {{.*#+}} ymm4 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	; AVX512VL-NEXT: vpand %ymm4, %ymm2, %ymm2			; AVX512VL-NEXT: vpand %ymm4, %ymm2, %ymm2
	; AVX512VL-NEXT: vpmovzxwd {{.*#+}} zmm5 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero			; AVX512VL-NEXT: vpmovzxwd {{.*#+}} zmm5 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero
	; AVX512VL-NEXT: vpmovzxwd {{.*#+}} zmm0 = ymm0[0],zero,ymm0[1],zero,ymm0[2],zero,ymm0[3],zero,ymm0[4],zero,ymm0[5],zero,ymm0[6],zero,ymm0[7],zero,ymm0[8],zero,ymm0[9],zero,ymm0[10],zero,ymm0[11],zero,ymm0[12],zero,ymm0[13],zero,ymm0[14],zero,ymm0[15],zero			; AVX512VL-NEXT: vpmovzxwd {{.*#+}} zmm0 = ymm0[0],zero,ymm0[1],zero,ymm0[2],zero,ymm0[3],zero,ymm0[4],zero,ymm0[5],zero,ymm0[6],zero,ymm0[7],zero,ymm0[8],zero,ymm0[9],zero,ymm0[10],zero,ymm0[11],zero,ymm0[12],zero,ymm0[13],zero,ymm0[14],zero,ymm0[15],zero
	; AVX512VL-NEXT: vpsllvd %zmm5, %zmm0, %zmm5			; AVX512VL-NEXT: vpsllvd %zmm5, %zmm0, %zmm5
	; AVX512VL-NEXT: vpmovdw %zmm5, %ymm5
	; AVX512VL-NEXT: vmovdqa {{.*#+}} ymm6 = [16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16]			; AVX512VL-NEXT: vmovdqa {{.*#+}} ymm6 = [16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16]
	; AVX512VL-NEXT: vpsubw %ymm2, %ymm6, %ymm2			; AVX512VL-NEXT: vpsubw %ymm2, %ymm6, %ymm2
	; AVX512VL-NEXT: vpmovzxwd {{.*#+}} zmm2 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero			; AVX512VL-NEXT: vpmovzxwd {{.*#+}} zmm2 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero
	; AVX512VL-NEXT: vpsrlvd %zmm2, %zmm0, %zmm0			; AVX512VL-NEXT: vpsrlvd %zmm2, %zmm0, %zmm0
				; AVX512VL-NEXT: vpord %zmm0, %zmm5, %zmm0
	; AVX512VL-NEXT: vpmovdw %zmm0, %ymm0			; AVX512VL-NEXT: vpmovdw %zmm0, %ymm0
	; AVX512VL-NEXT: vpor %ymm0, %ymm5, %ymm0
	; AVX512VL-NEXT: vpand %ymm4, %ymm3, %ymm2			; AVX512VL-NEXT: vpand %ymm4, %ymm3, %ymm2
	; AVX512VL-NEXT: vpmovzxwd {{.*#+}} zmm3 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero			; AVX512VL-NEXT: vpmovzxwd {{.*#+}} zmm3 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero
	; AVX512VL-NEXT: vpmovzxwd {{.*#+}} zmm1 = ymm1[0],zero,ymm1[1],zero,ymm1[2],zero,ymm1[3],zero,ymm1[4],zero,ymm1[5],zero,ymm1[6],zero,ymm1[7],zero,ymm1[8],zero,ymm1[9],zero,ymm1[10],zero,ymm1[11],zero,ymm1[12],zero,ymm1[13],zero,ymm1[14],zero,ymm1[15],zero			; AVX512VL-NEXT: vpmovzxwd {{.*#+}} zmm1 = ymm1[0],zero,ymm1[1],zero,ymm1[2],zero,ymm1[3],zero,ymm1[4],zero,ymm1[5],zero,ymm1[6],zero,ymm1[7],zero,ymm1[8],zero,ymm1[9],zero,ymm1[10],zero,ymm1[11],zero,ymm1[12],zero,ymm1[13],zero,ymm1[14],zero,ymm1[15],zero
	; AVX512VL-NEXT: vpsllvd %zmm3, %zmm1, %zmm3			; AVX512VL-NEXT: vpsllvd %zmm3, %zmm1, %zmm3
	; AVX512VL-NEXT: vpmovdw %zmm3, %ymm3
	; AVX512VL-NEXT: vpsubw %ymm2, %ymm6, %ymm2			; AVX512VL-NEXT: vpsubw %ymm2, %ymm6, %ymm2
	; AVX512VL-NEXT: vpmovzxwd {{.*#+}} zmm2 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero			; AVX512VL-NEXT: vpmovzxwd {{.*#+}} zmm2 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero
	; AVX512VL-NEXT: vpsrlvd %zmm2, %zmm1, %zmm1			; AVX512VL-NEXT: vpsrlvd %zmm2, %zmm1, %zmm1
				; AVX512VL-NEXT: vpord %zmm1, %zmm3, %zmm1
	; AVX512VL-NEXT: vpmovdw %zmm1, %ymm1			; AVX512VL-NEXT: vpmovdw %zmm1, %ymm1
	; AVX512VL-NEXT: vpor %ymm1, %ymm3, %ymm1
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	;			;
	; AVX512BW-LABEL: var_rotate_v32i16:			; AVX512BW-LABEL: var_rotate_v32i16:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm2 = [16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16]			; AVX512BW-NEXT: vmovdqa64 {{.*#+}} zmm2 = [16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16,16]
	; AVX512BW-NEXT: vpsubw %zmm1, %zmm2, %zmm2			; AVX512BW-NEXT: vpsubw %zmm1, %zmm2, %zmm2
	; AVX512BW-NEXT: vpsllvw %zmm1, %zmm0, %zmm1			; AVX512BW-NEXT: vpsllvw %zmm1, %zmm0, %zmm1
	; AVX512BW-NEXT: vpsrlvw %zmm2, %zmm0, %zmm0			; AVX512BW-NEXT: vpsrlvw %zmm2, %zmm0, %zmm0
	▲ Show 20 Lines • Show All 918 Lines • Show Last 20 Lines