This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Target/X86/
-
Target/
-
X86/
3
X86ISelLowering.cpp
-
test/CodeGen/X86/
-
CodeGen/
-
X86/
3
combine-bitselect.ll
-
vector-fshl-128.ll
-
vector-fshl-256.ll
-
vector-fshl-rot-128.ll
-
vector-fshl-rot-256.ll
-
vector-fshr-128.ll
-
vector-fshr-256.ll
-
vector-fshr-rot-128.ll
-
vector-fshr-rot-256.ll
-
vector-rotate-128.ll
-
vector-rotate-256.ll

Differential D113827

[X86] Widen 128/256-bit VPTERNLOG patterns to 512-bit on non-VLX targets
ClosedPublic

Authored by RKSimon on Nov 13 2021, 8:18 AM.

Download Raw Diff

Details

Reviewers

pengfei
craig.topper

Commits

rGf4143ffed76e: [X86] Widen 128/256-bit VPTERNLOG patterns to 512-bit on non-VLX targets

Summary

Similar to what we've done for other ops, this patch widens VPTERNLOG to a 512-bit op for non-VLX targets.

Fixes regressions in D113192

Diff Detail

Repository: rG LLVM Github Monorepo

Event Timeline

RKSimon created this revision.Nov 13 2021, 8:18 AM

Herald added a subscriber: hiraditya. · View Herald TranscriptNov 13 2021, 8:18 AM

RKSimon requested review of this revision.Nov 13 2021, 8:18 AM

Herald added a project: Restricted Project. · View Herald TranscriptNov 13 2021, 8:18 AM

RKSimon mentioned this in D113192: [DAG] MatchRotate - support rotate-by-constant of illegal types.Nov 13 2021, 8:50 AM

Harbormaster completed remote builds in B134085: Diff 387026.Nov 13 2021, 9:42 AM

Enable use of 128/256-bit VPTERNLOG on non-VLX targets

I think the title is misleading. We widen to 512-bit VPTERNLOG rather than use 128/256-bit. Besides, should be better to mention the broadcastable work there?

llvm/lib/Target/X86/X86ISelLowering.cpp
46266–46269	Why do we need to do it? Do we have new `VT` type other than `i32/i64` now? Or the previous code can handle them already?

RKSimon retitled this revision from [X86] Enable use of 128/256-bit VPTERNLOG on non-VLX targets to [X86] Widen 128/256-bit VPTERNLOG patterns to 512-bit on non-VLX targets.Nov 14 2021, 2:38 AM

RKSimon added inline comments.Nov 14 2021, 2:46 AM

llvm/lib/Target/X86/X86ISelLowering.cpp
46266–46269	This is to ensure we are using types that getAVX512Node can recognise as potential broadcasts. We currently generate VPTERNLOG nodes with any integer type (not just vXi32/i64) and isel handles it later on, Would it make sense to remove the new broadcast code from getAVX512Node for this patch and I propose it as a separate patch? It'd mean that we end up with unfolded 128/256-bit loads for the widened cases in this patch, but wouldn't be an actual regression.

pengfei added inline comments.Nov 14 2021, 4:16 AM

llvm/lib/Target/X86/X86ISelLowering.cpp
46266–46269	Yeah, makes sense.

Remove the broadcast handling from getAVX512Node

pengfei added inline comments.Nov 14 2021, 4:48 AM

llvm/test/CodeGen/X86/combine-bitselect.ll
35–41	I wonder if the left side code wins sometime, e.g. optsize?

RKSimon added inline comments.Nov 14 2021, 4:55 AM

llvm/test/CodeGen/X86/combine-bitselect.ll
35–41	We've replaced 2 x 128-bit (folded) loads with 1 x 128-bit (unfolded) load. The issue I was most concerned with is increased register pressure - this is what the broadcast code helps with, but even that is of low concern.

LGTM.

llvm/test/CodeGen/X86/combine-bitselect.ll
35–41	Agreed. Thanks Simon.

This revision is now accepted and ready to land.Nov 14 2021, 4:59 AM

Harbormaster completed remote builds in B134119: Diff 387066.Nov 14 2021, 5:17 AM

Closed by commit rGf4143ffed76e: [X86] Widen 128/256-bit VPTERNLOG patterns to 512-bit on non-VLX targets (authored by RKSimon). · Explain WhyNov 14 2021, 5:41 AM

This revision was automatically updated to reflect the committed changes.

RKSimon added a commit: rGf4143ffed76e: [X86] Widen 128/256-bit VPTERNLOG patterns to 512-bit on non-VLX targets.

Revision Contents

Path

Size

llvm/

lib/

Target/

X86/

X86ISelLowering.cpp

6 lines

test/

CodeGen/

X86/

combine-bitselect.ll

76 lines

vector-fshl-128.ll

21 lines

vector-fshl-256.ll

18 lines

vector-fshl-rot-128.ll

27 lines

vector-fshl-rot-256.ll

42 lines

vector-fshr-128.ll

21 lines

vector-fshr-256.ll

18 lines

vector-fshr-rot-128.ll

27 lines

vector-fshr-rot-256.ll

46 lines

vector-rotate-128.ll

21 lines

vector-rotate-256.ll

45 lines

Diff 387069

llvm/lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 5,359 Lines • ▼ Show 20 Lines	static bool hasFPCMov(unsigned X86CC) {
case X86::COND_AE:		case X86::COND_AE:
case X86::COND_NE:		case X86::COND_NE:
case X86::COND_NP:		case X86::COND_NP:
return true;		return true;
}		}
}		}

static bool useVPTERNLOG(const X86Subtarget &Subtarget, MVT VT) {		static bool useVPTERNLOG(const X86Subtarget &Subtarget, MVT VT) {
return Subtarget.hasVLX() \|\| (Subtarget.hasAVX512() && VT.is512BitVector());		return Subtarget.hasVLX() \|\| Subtarget.canExtendTo512DQ() \|\|
		VT.is512BitVector();
}		}

bool X86TargetLowering::getTgtMemIntrinsic(IntrinsicInfo &Info,		bool X86TargetLowering::getTgtMemIntrinsic(IntrinsicInfo &Info,
const CallInst &I,		const CallInst &I,
MachineFunction &MF,		MachineFunction &MF,
unsigned Intrinsic) const {		unsigned Intrinsic) const {
Info.flags = MachineMemOperand::MONone;		Info.flags = MachineMemOperand::MONone;
Info.offset = 0;		Info.offset = 0;
▲ Show 20 Lines • Show All 40,848 Lines • ▼ Show 20 Lines	static SDValue canonicalizeBitSelect(SDNode *N, SelectionDAG &DAG,
SDLoc DL(N);		SDLoc DL(N);

if (useVPTERNLOG(Subtarget, VT)) {		if (useVPTERNLOG(Subtarget, VT)) {
// Emit a VPTERNLOG node directly - 0xCA is the imm code for A?B:C.		// Emit a VPTERNLOG node directly - 0xCA is the imm code for A?B:C.
SDValue A = DAG.getBitcast(VT, N0.getOperand(1));		SDValue A = DAG.getBitcast(VT, N0.getOperand(1));
SDValue B = DAG.getBitcast(VT, N0.getOperand(0));		SDValue B = DAG.getBitcast(VT, N0.getOperand(0));
SDValue C = DAG.getBitcast(VT, N1.getOperand(0));		SDValue C = DAG.getBitcast(VT, N1.getOperand(0));
SDValue Imm = DAG.getTargetConstant(0xCA, DL, MVT::i8);		SDValue Imm = DAG.getTargetConstant(0xCA, DL, MVT::i8);
return DAG.getNode(X86ISD::VPTERNLOG, DL, VT, A, B, C, Imm);		return getAVX512Node(X86ISD::VPTERNLOG, DL, VT, {A, B, C, Imm}, DAG,
		Subtarget);
}		}

SDValue X = N->getOperand(0);		SDValue X = N->getOperand(0);
SDValue Y =		SDValue Y =
DAG.getNode(X86ISD::ANDNP, DL, VT, DAG.getBitcast(VT, N0.getOperand(1)),		DAG.getNode(X86ISD::ANDNP, DL, VT, DAG.getBitcast(VT, N0.getOperand(1)),
DAG.getBitcast(VT, N1.getOperand(0)));		DAG.getBitcast(VT, N1.getOperand(0)));
return DAG.getNode(ISD::OR, DL, VT, X, Y);		return DAG.getNode(ISD::OR, DL, VT, X, Y);
}		}
Show All 14 Lines	static bool matchLogicBlend(SDNode *N, SDValue &X, SDValue &Y, SDValue &Mask) {
if (N0.getOpcode() != ISD::AND \|\| N1.getOpcode() != X86ISD::ANDNP)		if (N0.getOpcode() != ISD::AND \|\| N1.getOpcode() != X86ISD::ANDNP)
return false;		return false;

Mask = N1.getOperand(0);		Mask = N1.getOperand(0);
X = N1.getOperand(1);		X = N1.getOperand(1);

// Check to see if the mask appeared in both the AND and ANDNP.		// Check to see if the mask appeared in both the AND and ANDNP.
if (N0.getOperand(0) == Mask)		if (N0.getOperand(0) == Mask)
Y = N0.getOperand(1);		Y = N0.getOperand(1);
else if (N0.getOperand(1) == Mask)		else if (N0.getOperand(1) == Mask)
Y = N0.getOperand(0);		Y = N0.getOperand(0);
else		else
		pengfeiUnsubmitted Not Done Reply Inline Actions Why do we need to do it? Do we have new `VT` type other than `i32/i64` now? Or the previous code can handle them already? pengfei: Why do we need to do it? Do we have new `VT` type other than `i32/i64` now? Or the previous…
		RKSimonAuthorUnsubmitted Not Done Reply Inline Actions This is to ensure we are using types that getAVX512Node can recognise as potential broadcasts. We currently generate VPTERNLOG nodes with any integer type (not just vXi32/i64) and isel handles it later on, Would it make sense to remove the new broadcast code from getAVX512Node for this patch and I propose it as a separate patch? It'd mean that we end up with unfolded 128/256-bit loads for the widened cases in this patch, but wouldn't be an actual regression. RKSimon: This is to ensure we are using types that getAVX512Node can recognise as potential broadcasts.
		pengfeiUnsubmitted Not Done Reply Inline Actions Yeah, makes sense. pengfei: Yeah, makes sense.
return false;		return false;

// TODO: Attempt to match against AND(XOR(-1,M),Y) as well, waiting for		// TODO: Attempt to match against AND(XOR(-1,M),Y) as well, waiting for
// ANDNP combine allows other combines to happen that prevent matching.		// ANDNP combine allows other combines to happen that prevent matching.
return true;		return true;
}		}

// Try to fold:		// Try to fold:
▲ Show 20 Lines • Show All 8,020 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/combine-bitselect.ll

	Show All 26 Lines
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: vorps %xmm0, %xmm1, %xmm0			; AVX-NEXT: vorps %xmm0, %xmm1, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; AVX512F-LABEL: bitselect_v2i64_rr:			; AVX512F-LABEL: bitselect_v2i64_rr:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512F-NEXT: # kill: def $xmm1 killed $xmm1 def $zmm1
	; AVX512F-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vorps %xmm0, %xmm1, %xmm0			; AVX512F-NEXT: vmovdqa {{.*#+}} xmm2 = [18446744069414584319,18446744060824649725]
				; AVX512F-NEXT: vpternlogq $216, %zmm2, %zmm1, %zmm0
				; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
				; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
				pengfeiUnsubmitted Not Done Reply Inline Actions I wonder if the left side code wins sometime, e.g. optsize? pengfei: I wonder if the left side code wins sometime, e.g. optsize?
				RKSimonAuthorUnsubmitted Not Done Reply Inline Actions We've replaced 2 x 128-bit (folded) loads with 1 x 128-bit (unfolded) load. The issue I was most concerned with is increased register pressure - this is what the broadcast code helps with, but even that is of low concern. RKSimon: We've replaced 2 x 128-bit (folded) loads with 1 x 128-bit (unfolded) load. The issue I was…
				pengfeiUnsubmitted Not Done Reply Inline Actions Agreed. Thanks Simon. pengfei: Agreed. Thanks Simon.
	;			;
	; AVX512VL-LABEL: bitselect_v2i64_rr:			; AVX512VL-LABEL: bitselect_v2i64_rr:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0			; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	%3 = and <2 x i64> %0, <i64 4294967296, i64 12884901890>			%3 = and <2 x i64> %0, <i64 4294967296, i64 12884901890>
	%4 = and <2 x i64> %1, <i64 -4294967297, i64 -12884901891>			%4 = and <2 x i64> %1, <i64 -4294967297, i64 -12884901891>
	%5 = or <2 x i64> %4, %3			%5 = or <2 x i64> %4, %3
	Show All 20 Lines
	; AVX-NEXT: vmovaps (%rdi), %xmm1			; AVX-NEXT: vmovaps (%rdi), %xmm1
	; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: vorps %xmm0, %xmm1, %xmm0			; AVX-NEXT: vorps %xmm0, %xmm1, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; AVX512F-LABEL: bitselect_v2i64_rm:			; AVX512F-LABEL: bitselect_v2i64_rm:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vmovaps (%rdi), %xmm1			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512F-NEXT: vmovdqa (%rdi), %xmm1
	; AVX512F-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX512F-NEXT: vmovdqa {{.*#+}} xmm2 = [18446744065119617022,18446744073709551612]
	; AVX512F-NEXT: vorps %xmm0, %xmm1, %xmm0			; AVX512F-NEXT: vpternlogq $184, %zmm1, %zmm2, %zmm0
				; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
				; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: bitselect_v2i64_rm:			; AVX512VL-LABEL: bitselect_v2i64_rm:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vmovdqa (%rdi), %xmm1			; AVX512VL-NEXT: vmovdqa (%rdi), %xmm1
	; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0			; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	%3 = load <2 x i64>, <2 x i64>* %1			%3 = load <2 x i64>, <2 x i64>* %1
	Show All 23 Lines
	; AVX-NEXT: vmovaps (%rdi), %xmm1			; AVX-NEXT: vmovaps (%rdi), %xmm1
	; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX-NEXT: vorps %xmm0, %xmm1, %xmm0			; AVX-NEXT: vorps %xmm0, %xmm1, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; AVX512F-LABEL: bitselect_v2i64_mr:			; AVX512F-LABEL: bitselect_v2i64_mr:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vmovaps (%rdi), %xmm1			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 def $zmm0
	; AVX512F-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX512F-NEXT: vmovdqa (%rdi), %xmm1
	; AVX512F-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512F-NEXT: vmovdqa {{.*#+}} xmm2 = [12884901890,4294967296]
	; AVX512F-NEXT: vorps %xmm0, %xmm1, %xmm0			; AVX512F-NEXT: vpternlogq $184, %zmm1, %zmm2, %zmm0
				; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
				; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: bitselect_v2i64_mr:			; AVX512VL-LABEL: bitselect_v2i64_mr:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vmovdqa (%rdi), %xmm1			; AVX512VL-NEXT: vmovdqa (%rdi), %xmm1
	; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0			; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	%3 = load <2 x i64>, <2 x i64>* %0			%3 = load <2 x i64>, <2 x i64>* %0
	Show All 26 Lines
	; AVX-NEXT: vmovaps (%rsi), %xmm1			; AVX-NEXT: vmovaps (%rsi), %xmm1
	; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: vorps %xmm0, %xmm1, %xmm0			; AVX-NEXT: vorps %xmm0, %xmm1, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; AVX512F-LABEL: bitselect_v2i64_mm:			; AVX512F-LABEL: bitselect_v2i64_mm:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vmovaps (%rdi), %xmm0			; AVX512F-NEXT: vmovdqa (%rdi), %xmm1
	; AVX512F-NEXT: vmovaps (%rsi), %xmm1			; AVX512F-NEXT: vmovdqa (%rsi), %xmm0
	; AVX512F-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512F-NEXT: vmovdqa {{.*#+}} xmm2 = [18446744073709551612,18446744065119617022]
	; AVX512F-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX512F-NEXT: vpternlogq $226, %zmm1, %zmm2, %zmm0
	; AVX512F-NEXT: vorps %xmm0, %xmm1, %xmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
				; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: bitselect_v2i64_mm:			; AVX512VL-LABEL: bitselect_v2i64_mm:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vmovdqa (%rsi), %xmm1			; AVX512VL-NEXT: vmovdqa (%rsi), %xmm1
	; AVX512VL-NEXT: vmovdqa {{.*#+}} xmm0 = [18446744073709551612,18446744065119617022]			; AVX512VL-NEXT: vmovdqa {{.*#+}} xmm0 = [18446744073709551612,18446744065119617022]
	; AVX512VL-NEXT: vpternlogq $202, (%rdi), %xmm1, %xmm0			; AVX512VL-NEXT: vpternlogq $202, (%rdi), %xmm1, %xmm0
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	▲ Show 20 Lines • Show All 135 Lines • ▼ Show 20 Lines
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0
	; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1			; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1
	; AVX-NEXT: vorps %ymm0, %ymm1, %ymm0			; AVX-NEXT: vorps %ymm0, %ymm1, %ymm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; AVX512F-LABEL: bitselect_v4i64_rr:			; AVX512F-LABEL: bitselect_v4i64_rr:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX512F-NEXT: # kill: def $ymm1 killed $ymm1 def $zmm1
	; AVX512F-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1			; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0
	; AVX512F-NEXT: vorps %ymm0, %ymm1, %ymm0			; AVX512F-NEXT: vmovdqa {{.*#+}} ymm2 = [18446744069414584319,18446744060824649725,18446744060824649725,18446744060824649725]
				; AVX512F-NEXT: vpternlogq $216, %zmm2, %zmm1, %zmm0
				; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: bitselect_v4i64_rr:			; AVX512VL-LABEL: bitselect_v4i64_rr:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0			; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	%3 = and <4 x i64> %0, <i64 4294967296, i64 12884901890, i64 12884901890, i64 12884901890>			%3 = and <4 x i64> %0, <i64 4294967296, i64 12884901890, i64 12884901890, i64 12884901890>
	%4 = and <4 x i64> %1, <i64 -4294967297, i64 -12884901891, i64 -12884901891, i64 -12884901891>			%4 = and <4 x i64> %1, <i64 -4294967297, i64 -12884901891, i64 -12884901891, i64 -12884901891>
	Show All 29 Lines
	; AVX-NEXT: vmovaps (%rdi), %ymm1			; AVX-NEXT: vmovaps (%rdi), %ymm1
	; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0
	; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1			; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1
	; AVX-NEXT: vorps %ymm0, %ymm1, %ymm0			; AVX-NEXT: vorps %ymm0, %ymm1, %ymm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; AVX512F-LABEL: bitselect_v4i64_rm:			; AVX512F-LABEL: bitselect_v4i64_rm:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vmovaps (%rdi), %ymm1			; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0
	; AVX512F-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX512F-NEXT: vmovdqa (%rdi), %ymm1
	; AVX512F-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1			; AVX512F-NEXT: vmovdqa {{.*#+}} ymm2 = [18446744065119617022,18446744073709551612,18446744065119617022,18446744073709551612]
	; AVX512F-NEXT: vorps %ymm0, %ymm1, %ymm0			; AVX512F-NEXT: vpternlogq $184, %zmm1, %zmm2, %zmm0
				; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: bitselect_v4i64_rm:			; AVX512VL-LABEL: bitselect_v4i64_rm:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vmovdqa (%rdi), %ymm1			; AVX512VL-NEXT: vmovdqa (%rdi), %ymm1
	; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0			; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	%3 = load <4 x i64>, <4 x i64>* %1			%3 = load <4 x i64>, <4 x i64>* %1
	Show All 31 Lines
	; AVX-NEXT: vmovaps (%rdi), %ymm1			; AVX-NEXT: vmovaps (%rdi), %ymm1
	; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1			; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1
	; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0
	; AVX-NEXT: vorps %ymm0, %ymm1, %ymm0			; AVX-NEXT: vorps %ymm0, %ymm1, %ymm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; AVX512F-LABEL: bitselect_v4i64_mr:			; AVX512F-LABEL: bitselect_v4i64_mr:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vmovaps (%rdi), %ymm1			; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 def $zmm0
	; AVX512F-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1			; AVX512F-NEXT: vmovdqa (%rdi), %ymm1
	; AVX512F-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX512F-NEXT: vmovdqa {{.*#+}} ymm2 = [12884901890,4294967296,12884901890,4294967296]
	; AVX512F-NEXT: vorps %ymm0, %ymm1, %ymm0			; AVX512F-NEXT: vpternlogq $184, %zmm1, %zmm2, %zmm0
				; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: bitselect_v4i64_mr:			; AVX512VL-LABEL: bitselect_v4i64_mr:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vmovdqa (%rdi), %ymm1			; AVX512VL-NEXT: vmovdqa (%rdi), %ymm1
	; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0			; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	%3 = load <4 x i64>, <4 x i64>* %0			%3 = load <4 x i64>, <4 x i64>* %0
	Show All 31 Lines
	; AVX-NEXT: vmovaps (%rsi), %ymm1			; AVX-NEXT: vmovaps (%rsi), %ymm1
	; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0
	; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1			; AVX-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1
	; AVX-NEXT: vorps %ymm0, %ymm1, %ymm0			; AVX-NEXT: vorps %ymm0, %ymm1, %ymm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; AVX512F-LABEL: bitselect_v4i64_mm:			; AVX512F-LABEL: bitselect_v4i64_mm:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vmovaps (%rdi), %ymm0			; AVX512F-NEXT: vmovdqa (%rdi), %ymm1
	; AVX512F-NEXT: vmovaps (%rsi), %ymm1			; AVX512F-NEXT: vmovdqa (%rsi), %ymm0
	; AVX512F-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX512F-NEXT: vmovdqa {{.*#+}} ymm2 = [18446744073709551612,18446744065119617022,18446744073709551612,18446744065119617022]
	; AVX512F-NEXT: vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1			; AVX512F-NEXT: vpternlogq $226, %zmm1, %zmm2, %zmm0
	; AVX512F-NEXT: vorps %ymm0, %ymm1, %ymm0			; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: bitselect_v4i64_mm:			; AVX512VL-LABEL: bitselect_v4i64_mm:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vmovdqa (%rsi), %ymm1			; AVX512VL-NEXT: vmovdqa (%rsi), %ymm1
	; AVX512VL-NEXT: vmovdqa {{.*#+}} ymm0 = [18446744073709551612,18446744065119617022,18446744073709551612,18446744065119617022]			; AVX512VL-NEXT: vmovdqa {{.*#+}} ymm0 = [18446744073709551612,18446744065119617022,18446744073709551612,18446744065119617022]
	; AVX512VL-NEXT: vpternlogq $202, (%rdi), %ymm1, %ymm0			; AVX512VL-NEXT: vpternlogq $202, (%rdi), %ymm1, %ymm0
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	▲ Show 20 Lines • Show All 570 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-fshl-128.ll

	Show First 20 Lines • Show All 2,853 Lines • ▼ Show 20 Lines
	; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: vpsllw $4, %xmm0, %xmm0			; AVX-NEXT: vpsllw $4, %xmm0, %xmm0
	; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; AVX512F-LABEL: splatconstant_funnnel_v16i8:			; AVX512F-LABEL: splatconstant_funnnel_v16i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
				; AVX512F-NEXT: vmovdqa {{.*#+}} xmm2 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512F-NEXT: vpsrlw $4, %xmm1, %xmm1			; AVX512F-NEXT: vpsrlw $4, %xmm1, %xmm1
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX512F-NEXT: vpsllw $4, %xmm0, %xmm0			; AVX512F-NEXT: vpsllw $4, %xmm0, %xmm0
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512F-NEXT: vpternlogq $226, %zmm1, %zmm2, %zmm0
	; AVX512F-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
				; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: splatconstant_funnnel_v16i8:			; AVX512VL-LABEL: splatconstant_funnnel_v16i8:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vpsllw $4, %xmm0, %xmm2			; AVX512VL-NEXT: vpsllw $4, %xmm0, %xmm2
	; AVX512VL-NEXT: vpsrlw $4, %xmm1, %xmm0			; AVX512VL-NEXT: vpsrlw $4, %xmm1, %xmm0
	; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm0			; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm0
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	;			;
	; AVX512BW-LABEL: splatconstant_funnnel_v16i8:			; AVX512BW-LABEL: splatconstant_funnnel_v16i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
				; AVX512BW-NEXT: vmovdqa {{.*#+}} xmm2 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512BW-NEXT: vpsrlw $4, %xmm1, %xmm1			; AVX512BW-NEXT: vpsrlw $4, %xmm1, %xmm1
	; AVX512BW-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX512BW-NEXT: vpsllw $4, %xmm0, %xmm0			; AVX512BW-NEXT: vpsllw $4, %xmm0, %xmm0
	; AVX512BW-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512BW-NEXT: vpternlogq $226, %zmm1, %zmm2, %zmm0
	; AVX512BW-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX512BW-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
				; AVX512BW-NEXT: vzeroupper
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512VBMI2-LABEL: splatconstant_funnnel_v16i8:			; AVX512VBMI2-LABEL: splatconstant_funnnel_v16i8:
	; AVX512VBMI2: # %bb.0:			; AVX512VBMI2: # %bb.0:
				; AVX512VBMI2-NEXT: vmovdqa {{.*#+}} xmm2 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512VBMI2-NEXT: vpsrlw $4, %xmm1, %xmm1			; AVX512VBMI2-NEXT: vpsrlw $4, %xmm1, %xmm1
	; AVX512VBMI2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX512VBMI2-NEXT: vpsllw $4, %xmm0, %xmm0			; AVX512VBMI2-NEXT: vpsllw $4, %xmm0, %xmm0
	; AVX512VBMI2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VBMI2-NEXT: vpternlogq $226, %zmm1, %zmm2, %zmm0
	; AVX512VBMI2-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX512VBMI2-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
				; AVX512VBMI2-NEXT: vzeroupper
	; AVX512VBMI2-NEXT: retq			; AVX512VBMI2-NEXT: retq
	;			;
	; AVX512VLBW-LABEL: splatconstant_funnnel_v16i8:			; AVX512VLBW-LABEL: splatconstant_funnnel_v16i8:
	; AVX512VLBW: # %bb.0:			; AVX512VLBW: # %bb.0:
	; AVX512VLBW-NEXT: vpsllw $4, %xmm0, %xmm2			; AVX512VLBW-NEXT: vpsllw $4, %xmm0, %xmm2
	; AVX512VLBW-NEXT: vpsrlw $4, %xmm1, %xmm0			; AVX512VLBW-NEXT: vpsrlw $4, %xmm1, %xmm0
	; AVX512VLBW-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm0			; AVX512VLBW-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm0
	; AVX512VLBW-NEXT: retq			; AVX512VLBW-NEXT: retq
	Show All 26 Lines

llvm/test/CodeGen/X86/vector-fshl-256.ll

	Show First 20 Lines • Show All 2,515 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1			; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1
	; AVX2-NEXT: vpsllw $4, %ymm0, %ymm0			; AVX2-NEXT: vpsllw $4, %ymm0, %ymm0
	; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: splatconstant_funnnel_v32i8:			; AVX512F-LABEL: splatconstant_funnnel_v32i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
				; AVX512F-NEXT: vmovdqa {{.*#+}} ymm2 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512F-NEXT: vpsrlw $4, %ymm1, %ymm1			; AVX512F-NEXT: vpsrlw $4, %ymm1, %ymm1
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1
	; AVX512F-NEXT: vpsllw $4, %ymm0, %ymm0			; AVX512F-NEXT: vpsllw $4, %ymm0, %ymm0
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX512F-NEXT: vpternlogq $226, %zmm1, %zmm2, %zmm0
	; AVX512F-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: splatconstant_funnnel_v32i8:			; AVX512VL-LABEL: splatconstant_funnnel_v32i8:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vpsllw $4, %ymm0, %ymm2			; AVX512VL-NEXT: vpsllw $4, %ymm0, %ymm2
	; AVX512VL-NEXT: vpsrlw $4, %ymm1, %ymm0			; AVX512VL-NEXT: vpsrlw $4, %ymm1, %ymm0
	; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm2, %ymm0			; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm2, %ymm0
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	;			;
	; AVX512BW-LABEL: splatconstant_funnnel_v32i8:			; AVX512BW-LABEL: splatconstant_funnnel_v32i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
				; AVX512BW-NEXT: vmovdqa {{.*#+}} ymm2 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512BW-NEXT: vpsrlw $4, %ymm1, %ymm1			; AVX512BW-NEXT: vpsrlw $4, %ymm1, %ymm1
	; AVX512BW-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1
	; AVX512BW-NEXT: vpsllw $4, %ymm0, %ymm0			; AVX512BW-NEXT: vpsllw $4, %ymm0, %ymm0
	; AVX512BW-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX512BW-NEXT: vpternlogq $226, %zmm1, %zmm2, %zmm0
	; AVX512BW-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX512BW-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512VBMI2-LABEL: splatconstant_funnnel_v32i8:			; AVX512VBMI2-LABEL: splatconstant_funnnel_v32i8:
	; AVX512VBMI2: # %bb.0:			; AVX512VBMI2: # %bb.0:
				; AVX512VBMI2-NEXT: vmovdqa {{.*#+}} ymm2 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512VBMI2-NEXT: vpsrlw $4, %ymm1, %ymm1			; AVX512VBMI2-NEXT: vpsrlw $4, %ymm1, %ymm1
	; AVX512VBMI2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1
	; AVX512VBMI2-NEXT: vpsllw $4, %ymm0, %ymm0			; AVX512VBMI2-NEXT: vpsllw $4, %ymm0, %ymm0
	; AVX512VBMI2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX512VBMI2-NEXT: vpternlogq $226, %zmm1, %zmm2, %zmm0
	; AVX512VBMI2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX512VBMI2-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0
	; AVX512VBMI2-NEXT: retq			; AVX512VBMI2-NEXT: retq
	;			;
	; AVX512VLBW-LABEL: splatconstant_funnnel_v32i8:			; AVX512VLBW-LABEL: splatconstant_funnnel_v32i8:
	; AVX512VLBW: # %bb.0:			; AVX512VLBW: # %bb.0:
	; AVX512VLBW-NEXT: vpsllw $4, %ymm0, %ymm2			; AVX512VLBW-NEXT: vpsllw $4, %ymm0, %ymm2
	; AVX512VLBW-NEXT: vpsrlw $4, %ymm1, %ymm0			; AVX512VLBW-NEXT: vpsrlw $4, %ymm1, %ymm0
	; AVX512VLBW-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm2, %ymm0			; AVX512VLBW-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm2, %ymm0
	; AVX512VLBW-NEXT: retq			; AVX512VLBW-NEXT: retq
	Show All 32 Lines

llvm/test/CodeGen/X86/vector-fshl-rot-128.ll

	Show First 20 Lines • Show All 2,084 Lines • ▼ Show 20 Lines
	; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: vpsllw $4, %xmm0, %xmm0			; AVX-NEXT: vpsllw $4, %xmm0, %xmm0
	; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; AVX512F-LABEL: splatconstant_funnnel_v16i8:			; AVX512F-LABEL: splatconstant_funnnel_v16i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpsrlw $4, %xmm0, %xmm1			; AVX512F-NEXT: vmovdqa {{.*#+}} xmm1 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX512F-NEXT: vpsrlw $4, %xmm0, %xmm2
	; AVX512F-NEXT: vpsllw $4, %xmm0, %xmm0			; AVX512F-NEXT: vpsllw $4, %xmm0, %xmm0
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512F-NEXT: vpternlogq $226, %zmm2, %zmm1, %zmm0
	; AVX512F-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
				; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: splatconstant_funnnel_v16i8:			; AVX512VL-LABEL: splatconstant_funnnel_v16i8:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vpsllw $4, %xmm0, %xmm1			; AVX512VL-NEXT: vpsllw $4, %xmm0, %xmm1
	; AVX512VL-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX512VL-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0			; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	;			;
	; AVX512BW-LABEL: splatconstant_funnnel_v16i8:			; AVX512BW-LABEL: splatconstant_funnnel_v16i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vpsrlw $4, %xmm0, %xmm1			; AVX512BW-NEXT: vmovdqa {{.*#+}} xmm1 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512BW-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX512BW-NEXT: vpsrlw $4, %xmm0, %xmm2
	; AVX512BW-NEXT: vpsllw $4, %xmm0, %xmm0			; AVX512BW-NEXT: vpsllw $4, %xmm0, %xmm0
	; AVX512BW-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512BW-NEXT: vpternlogq $226, %zmm2, %zmm1, %zmm0
	; AVX512BW-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX512BW-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
				; AVX512BW-NEXT: vzeroupper
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512VLBW-LABEL: splatconstant_funnnel_v16i8:			; AVX512VLBW-LABEL: splatconstant_funnnel_v16i8:
	; AVX512VLBW: # %bb.0:			; AVX512VLBW: # %bb.0:
	; AVX512VLBW-NEXT: vpsllw $4, %xmm0, %xmm1			; AVX512VLBW-NEXT: vpsllw $4, %xmm0, %xmm1
	; AVX512VLBW-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX512VLBW-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX512VLBW-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0			; AVX512VLBW-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0
	; AVX512VLBW-NEXT: retq			; AVX512VLBW-NEXT: retq
	;			;
	; AVX512VBMI2-LABEL: splatconstant_funnnel_v16i8:			; AVX512VBMI2-LABEL: splatconstant_funnnel_v16i8:
	; AVX512VBMI2: # %bb.0:			; AVX512VBMI2: # %bb.0:
	; AVX512VBMI2-NEXT: vpsrlw $4, %xmm0, %xmm1			; AVX512VBMI2-NEXT: vmovdqa {{.*#+}} xmm1 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512VBMI2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX512VBMI2-NEXT: vpsrlw $4, %xmm0, %xmm2
	; AVX512VBMI2-NEXT: vpsllw $4, %xmm0, %xmm0			; AVX512VBMI2-NEXT: vpsllw $4, %xmm0, %xmm0
	; AVX512VBMI2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VBMI2-NEXT: vpternlogq $226, %zmm2, %zmm1, %zmm0
	; AVX512VBMI2-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX512VBMI2-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
				; AVX512VBMI2-NEXT: vzeroupper
	; AVX512VBMI2-NEXT: retq			; AVX512VBMI2-NEXT: retq
	;			;
	; AVX512VLVBMI2-LABEL: splatconstant_funnnel_v16i8:			; AVX512VLVBMI2-LABEL: splatconstant_funnnel_v16i8:
	; AVX512VLVBMI2: # %bb.0:			; AVX512VLVBMI2: # %bb.0:
	; AVX512VLVBMI2-NEXT: vpsllw $4, %xmm0, %xmm1			; AVX512VLVBMI2-NEXT: vpsllw $4, %xmm0, %xmm1
	; AVX512VLVBMI2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX512VLVBMI2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX512VLVBMI2-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0			; AVX512VLVBMI2-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0
	; AVX512VLVBMI2-NEXT: retq			; AVX512VLVBMI2-NEXT: retq
	Show All 18 Lines

llvm/test/CodeGen/X86/vector-fshl-rot-256.ll

	Show First 20 Lines • Show All 447 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpaddb %ymm0, %ymm0, %ymm3			; AVX2-NEXT: vpaddb %ymm0, %ymm0, %ymm3
	; AVX2-NEXT: vpor %ymm2, %ymm3, %ymm2			; AVX2-NEXT: vpor %ymm2, %ymm3, %ymm2
	; AVX2-NEXT: vpaddb %ymm1, %ymm1, %ymm1			; AVX2-NEXT: vpaddb %ymm1, %ymm1, %ymm1
	; AVX2-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0			; AVX2-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: var_funnnel_v32i8:			; AVX512F-LABEL: var_funnnel_v32i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpsrlw $4, %ymm0, %ymm2			; AVX512F-NEXT: vmovdqa {{.*#+}} ymm2 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm2, %ymm2			; AVX512F-NEXT: vpsrlw $4, %ymm0, %ymm3
	; AVX512F-NEXT: vpsllw $4, %ymm0, %ymm3			; AVX512F-NEXT: vpsllw $4, %ymm0, %ymm4
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm3, %ymm3			; AVX512F-NEXT: vpternlogq $226, %zmm3, %zmm2, %zmm4
	; AVX512F-NEXT: vpor %ymm2, %ymm3, %ymm2
	; AVX512F-NEXT: vpsllw $5, %ymm1, %ymm1			; AVX512F-NEXT: vpsllw $5, %ymm1, %ymm1
	; AVX512F-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0			; AVX512F-NEXT: vpblendvb %ymm1, %ymm4, %ymm0, %ymm0
	; AVX512F-NEXT: vpsrlw $6, %ymm0, %ymm2			; AVX512F-NEXT: vpsrlw $6, %ymm0, %ymm2
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm2, %ymm2
	; AVX512F-NEXT: vpsllw $2, %ymm0, %ymm3			; AVX512F-NEXT: vpsllw $2, %ymm0, %ymm3
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm3, %ymm3			; AVX512F-NEXT: vmovdqa {{.*#+}} ymm4 = [252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252]
	; AVX512F-NEXT: vpor %ymm2, %ymm3, %ymm2			; AVX512F-NEXT: vpternlogq $202, %zmm2, %zmm3, %zmm4
	; AVX512F-NEXT: vpaddb %ymm1, %ymm1, %ymm1			; AVX512F-NEXT: vpaddb %ymm1, %ymm1, %ymm1
	; AVX512F-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0			; AVX512F-NEXT: vpblendvb %ymm1, %ymm4, %ymm0, %ymm0
	; AVX512F-NEXT: vpsrlw $7, %ymm0, %ymm2			; AVX512F-NEXT: vpsrlw $7, %ymm0, %ymm2
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm2, %ymm2			; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm2, %ymm2
	; AVX512F-NEXT: vpaddb %ymm0, %ymm0, %ymm3			; AVX512F-NEXT: vpaddb %ymm0, %ymm0, %ymm3
	; AVX512F-NEXT: vpor %ymm2, %ymm3, %ymm2			; AVX512F-NEXT: vpor %ymm2, %ymm3, %ymm2
	; AVX512F-NEXT: vpaddb %ymm1, %ymm1, %ymm1			; AVX512F-NEXT: vpaddb %ymm1, %ymm1, %ymm1
	; AVX512F-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0			; AVX512F-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 1,273 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1			; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1
	; AVX2-NEXT: vpsllw $4, %ymm0, %ymm0			; AVX2-NEXT: vpsllw $4, %ymm0, %ymm0
	; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: splatconstant_funnnel_v32i8:			; AVX512F-LABEL: splatconstant_funnnel_v32i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpsrlw $4, %ymm0, %ymm1			; AVX512F-NEXT: vmovdqa {{.*#+}} ymm1 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1			; AVX512F-NEXT: vpsrlw $4, %ymm0, %ymm2
	; AVX512F-NEXT: vpsllw $4, %ymm0, %ymm0			; AVX512F-NEXT: vpsllw $4, %ymm0, %ymm0
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX512F-NEXT: vpternlogq $226, %zmm2, %zmm1, %zmm0
	; AVX512F-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: splatconstant_funnnel_v32i8:			; AVX512VL-LABEL: splatconstant_funnnel_v32i8:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vpsllw $4, %ymm0, %ymm1			; AVX512VL-NEXT: vpsllw $4, %ymm0, %ymm1
	; AVX512VL-NEXT: vpsrlw $4, %ymm0, %ymm0			; AVX512VL-NEXT: vpsrlw $4, %ymm0, %ymm0
	; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0			; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	;			;
	; AVX512BW-LABEL: splatconstant_funnnel_v32i8:			; AVX512BW-LABEL: splatconstant_funnnel_v32i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vpsrlw $4, %ymm0, %ymm1			; AVX512BW-NEXT: vmovdqa {{.*#+}} ymm1 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512BW-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1			; AVX512BW-NEXT: vpsrlw $4, %ymm0, %ymm2
	; AVX512BW-NEXT: vpsllw $4, %ymm0, %ymm0			; AVX512BW-NEXT: vpsllw $4, %ymm0, %ymm0
	; AVX512BW-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX512BW-NEXT: vpternlogq $226, %zmm2, %zmm1, %zmm0
	; AVX512BW-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX512BW-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512VLBW-LABEL: splatconstant_funnnel_v32i8:			; AVX512VLBW-LABEL: splatconstant_funnnel_v32i8:
	; AVX512VLBW: # %bb.0:			; AVX512VLBW: # %bb.0:
	; AVX512VLBW-NEXT: vpsllw $4, %ymm0, %ymm1			; AVX512VLBW-NEXT: vpsllw $4, %ymm0, %ymm1
	; AVX512VLBW-NEXT: vpsrlw $4, %ymm0, %ymm0			; AVX512VLBW-NEXT: vpsrlw $4, %ymm0, %ymm0
	; AVX512VLBW-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0			; AVX512VLBW-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0
	; AVX512VLBW-NEXT: retq			; AVX512VLBW-NEXT: retq
	;			;
	; AVX512VBMI2-LABEL: splatconstant_funnnel_v32i8:			; AVX512VBMI2-LABEL: splatconstant_funnnel_v32i8:
	; AVX512VBMI2: # %bb.0:			; AVX512VBMI2: # %bb.0:
	; AVX512VBMI2-NEXT: vpsrlw $4, %ymm0, %ymm1			; AVX512VBMI2-NEXT: vmovdqa {{.*#+}} ymm1 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512VBMI2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1			; AVX512VBMI2-NEXT: vpsrlw $4, %ymm0, %ymm2
	; AVX512VBMI2-NEXT: vpsllw $4, %ymm0, %ymm0			; AVX512VBMI2-NEXT: vpsllw $4, %ymm0, %ymm0
	; AVX512VBMI2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX512VBMI2-NEXT: vpternlogq $226, %zmm2, %zmm1, %zmm0
	; AVX512VBMI2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX512VBMI2-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0
	; AVX512VBMI2-NEXT: retq			; AVX512VBMI2-NEXT: retq
	;			;
	; AVX512VLVBMI2-LABEL: splatconstant_funnnel_v32i8:			; AVX512VLVBMI2-LABEL: splatconstant_funnnel_v32i8:
	; AVX512VLVBMI2: # %bb.0:			; AVX512VLVBMI2: # %bb.0:
	; AVX512VLVBMI2-NEXT: vpsllw $4, %ymm0, %ymm1			; AVX512VLVBMI2-NEXT: vpsllw $4, %ymm0, %ymm1
	; AVX512VLVBMI2-NEXT: vpsrlw $4, %ymm0, %ymm0			; AVX512VLVBMI2-NEXT: vpsrlw $4, %ymm0, %ymm0
	; AVX512VLVBMI2-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0			; AVX512VLVBMI2-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0
	; AVX512VLVBMI2-NEXT: retq			; AVX512VLVBMI2-NEXT: retq
	Show All 19 Lines

llvm/test/CodeGen/X86/vector-fshr-128.ll

	Show First 20 Lines • Show All 2,572 Lines • ▼ Show 20 Lines
	; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: vpsllw $4, %xmm0, %xmm0			; AVX-NEXT: vpsllw $4, %xmm0, %xmm0
	; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; AVX512F-LABEL: splatconstant_funnnel_v16i8:			; AVX512F-LABEL: splatconstant_funnnel_v16i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
				; AVX512F-NEXT: vmovdqa {{.*#+}} xmm2 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512F-NEXT: vpsrlw $4, %xmm1, %xmm1			; AVX512F-NEXT: vpsrlw $4, %xmm1, %xmm1
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX512F-NEXT: vpsllw $4, %xmm0, %xmm0			; AVX512F-NEXT: vpsllw $4, %xmm0, %xmm0
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512F-NEXT: vpternlogq $226, %zmm1, %zmm2, %zmm0
	; AVX512F-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
				; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: splatconstant_funnnel_v16i8:			; AVX512VL-LABEL: splatconstant_funnnel_v16i8:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vpsllw $4, %xmm0, %xmm2			; AVX512VL-NEXT: vpsllw $4, %xmm0, %xmm2
	; AVX512VL-NEXT: vpsrlw $4, %xmm1, %xmm0			; AVX512VL-NEXT: vpsrlw $4, %xmm1, %xmm0
	; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm0			; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm0
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	;			;
	; AVX512BW-LABEL: splatconstant_funnnel_v16i8:			; AVX512BW-LABEL: splatconstant_funnnel_v16i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
				; AVX512BW-NEXT: vmovdqa {{.*#+}} xmm2 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512BW-NEXT: vpsrlw $4, %xmm1, %xmm1			; AVX512BW-NEXT: vpsrlw $4, %xmm1, %xmm1
	; AVX512BW-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX512BW-NEXT: vpsllw $4, %xmm0, %xmm0			; AVX512BW-NEXT: vpsllw $4, %xmm0, %xmm0
	; AVX512BW-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512BW-NEXT: vpternlogq $226, %zmm1, %zmm2, %zmm0
	; AVX512BW-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX512BW-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
				; AVX512BW-NEXT: vzeroupper
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512VBMI2-LABEL: splatconstant_funnnel_v16i8:			; AVX512VBMI2-LABEL: splatconstant_funnnel_v16i8:
	; AVX512VBMI2: # %bb.0:			; AVX512VBMI2: # %bb.0:
				; AVX512VBMI2-NEXT: vmovdqa {{.*#+}} xmm2 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512VBMI2-NEXT: vpsrlw $4, %xmm1, %xmm1			; AVX512VBMI2-NEXT: vpsrlw $4, %xmm1, %xmm1
	; AVX512VBMI2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX512VBMI2-NEXT: vpsllw $4, %xmm0, %xmm0			; AVX512VBMI2-NEXT: vpsllw $4, %xmm0, %xmm0
	; AVX512VBMI2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VBMI2-NEXT: vpternlogq $226, %zmm1, %zmm2, %zmm0
	; AVX512VBMI2-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX512VBMI2-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
				; AVX512VBMI2-NEXT: vzeroupper
	; AVX512VBMI2-NEXT: retq			; AVX512VBMI2-NEXT: retq
	;			;
	; AVX512VLBW-LABEL: splatconstant_funnnel_v16i8:			; AVX512VLBW-LABEL: splatconstant_funnnel_v16i8:
	; AVX512VLBW: # %bb.0:			; AVX512VLBW: # %bb.0:
	; AVX512VLBW-NEXT: vpsllw $4, %xmm0, %xmm2			; AVX512VLBW-NEXT: vpsllw $4, %xmm0, %xmm2
	; AVX512VLBW-NEXT: vpsrlw $4, %xmm1, %xmm0			; AVX512VLBW-NEXT: vpsrlw $4, %xmm1, %xmm0
	; AVX512VLBW-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm0			; AVX512VLBW-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2, %xmm0
	; AVX512VLBW-NEXT: retq			; AVX512VLBW-NEXT: retq
	Show All 26 Lines

llvm/test/CodeGen/X86/vector-fshr-256.ll

	Show First 20 Lines • Show All 2,193 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1			; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1
	; AVX2-NEXT: vpsllw $4, %ymm0, %ymm0			; AVX2-NEXT: vpsllw $4, %ymm0, %ymm0
	; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: splatconstant_funnnel_v32i8:			; AVX512F-LABEL: splatconstant_funnnel_v32i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
				; AVX512F-NEXT: vmovdqa {{.*#+}} ymm2 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512F-NEXT: vpsrlw $4, %ymm1, %ymm1			; AVX512F-NEXT: vpsrlw $4, %ymm1, %ymm1
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1
	; AVX512F-NEXT: vpsllw $4, %ymm0, %ymm0			; AVX512F-NEXT: vpsllw $4, %ymm0, %ymm0
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX512F-NEXT: vpternlogq $226, %zmm1, %zmm2, %zmm0
	; AVX512F-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: splatconstant_funnnel_v32i8:			; AVX512VL-LABEL: splatconstant_funnnel_v32i8:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vpsllw $4, %ymm0, %ymm2			; AVX512VL-NEXT: vpsllw $4, %ymm0, %ymm2
	; AVX512VL-NEXT: vpsrlw $4, %ymm1, %ymm0			; AVX512VL-NEXT: vpsrlw $4, %ymm1, %ymm0
	; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm2, %ymm0			; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm2, %ymm0
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	;			;
	; AVX512BW-LABEL: splatconstant_funnnel_v32i8:			; AVX512BW-LABEL: splatconstant_funnnel_v32i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
				; AVX512BW-NEXT: vmovdqa {{.*#+}} ymm2 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512BW-NEXT: vpsrlw $4, %ymm1, %ymm1			; AVX512BW-NEXT: vpsrlw $4, %ymm1, %ymm1
	; AVX512BW-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1
	; AVX512BW-NEXT: vpsllw $4, %ymm0, %ymm0			; AVX512BW-NEXT: vpsllw $4, %ymm0, %ymm0
	; AVX512BW-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX512BW-NEXT: vpternlogq $226, %zmm1, %zmm2, %zmm0
	; AVX512BW-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX512BW-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512VBMI2-LABEL: splatconstant_funnnel_v32i8:			; AVX512VBMI2-LABEL: splatconstant_funnnel_v32i8:
	; AVX512VBMI2: # %bb.0:			; AVX512VBMI2: # %bb.0:
				; AVX512VBMI2-NEXT: vmovdqa {{.*#+}} ymm2 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512VBMI2-NEXT: vpsrlw $4, %ymm1, %ymm1			; AVX512VBMI2-NEXT: vpsrlw $4, %ymm1, %ymm1
	; AVX512VBMI2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1
	; AVX512VBMI2-NEXT: vpsllw $4, %ymm0, %ymm0			; AVX512VBMI2-NEXT: vpsllw $4, %ymm0, %ymm0
	; AVX512VBMI2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX512VBMI2-NEXT: vpternlogq $226, %zmm1, %zmm2, %zmm0
	; AVX512VBMI2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX512VBMI2-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0
	; AVX512VBMI2-NEXT: retq			; AVX512VBMI2-NEXT: retq
	;			;
	; AVX512VLBW-LABEL: splatconstant_funnnel_v32i8:			; AVX512VLBW-LABEL: splatconstant_funnnel_v32i8:
	; AVX512VLBW: # %bb.0:			; AVX512VLBW: # %bb.0:
	; AVX512VLBW-NEXT: vpsllw $4, %ymm0, %ymm2			; AVX512VLBW-NEXT: vpsllw $4, %ymm0, %ymm2
	; AVX512VLBW-NEXT: vpsrlw $4, %ymm1, %ymm0			; AVX512VLBW-NEXT: vpsrlw $4, %ymm1, %ymm0
	; AVX512VLBW-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm2, %ymm0			; AVX512VLBW-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm2, %ymm0
	; AVX512VLBW-NEXT: retq			; AVX512VLBW-NEXT: retq
	Show All 32 Lines

llvm/test/CodeGen/X86/vector-fshr-rot-128.ll

	Show First 20 Lines • Show All 2,172 Lines • ▼ Show 20 Lines
	; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1
	; AVX-NEXT: vpsllw $4, %xmm0, %xmm0			; AVX-NEXT: vpsllw $4, %xmm0, %xmm0
	; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; AVX512F-LABEL: splatconstant_funnnel_v16i8:			; AVX512F-LABEL: splatconstant_funnnel_v16i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpsllw $4, %xmm0, %xmm1			; AVX512F-NEXT: vmovdqa {{.*#+}} xmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX512F-NEXT: vpsllw $4, %xmm0, %xmm2
	; AVX512F-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX512F-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512F-NEXT: vpternlogq $226, %zmm2, %zmm1, %zmm0
	; AVX512F-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX512F-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
				; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: splatconstant_funnnel_v16i8:			; AVX512VL-LABEL: splatconstant_funnnel_v16i8:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vpsrlw $4, %xmm0, %xmm1			; AVX512VL-NEXT: vpsrlw $4, %xmm0, %xmm1
	; AVX512VL-NEXT: vpsllw $4, %xmm0, %xmm0			; AVX512VL-NEXT: vpsllw $4, %xmm0, %xmm0
	; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0			; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	;			;
	; AVX512BW-LABEL: splatconstant_funnnel_v16i8:			; AVX512BW-LABEL: splatconstant_funnnel_v16i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vpsllw $4, %xmm0, %xmm1			; AVX512BW-NEXT: vmovdqa {{.*#+}} xmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	; AVX512BW-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX512BW-NEXT: vpsllw $4, %xmm0, %xmm2
	; AVX512BW-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX512BW-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX512BW-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512BW-NEXT: vpternlogq $226, %zmm2, %zmm1, %zmm0
	; AVX512BW-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX512BW-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
				; AVX512BW-NEXT: vzeroupper
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512VLBW-LABEL: splatconstant_funnnel_v16i8:			; AVX512VLBW-LABEL: splatconstant_funnnel_v16i8:
	; AVX512VLBW: # %bb.0:			; AVX512VLBW: # %bb.0:
	; AVX512VLBW-NEXT: vpsrlw $4, %xmm0, %xmm1			; AVX512VLBW-NEXT: vpsrlw $4, %xmm0, %xmm1
	; AVX512VLBW-NEXT: vpsllw $4, %xmm0, %xmm0			; AVX512VLBW-NEXT: vpsllw $4, %xmm0, %xmm0
	; AVX512VLBW-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0			; AVX512VLBW-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0
	; AVX512VLBW-NEXT: retq			; AVX512VLBW-NEXT: retq
	;			;
	; AVX512VBMI2-LABEL: splatconstant_funnnel_v16i8:			; AVX512VBMI2-LABEL: splatconstant_funnnel_v16i8:
	; AVX512VBMI2: # %bb.0:			; AVX512VBMI2: # %bb.0:
	; AVX512VBMI2-NEXT: vpsllw $4, %xmm0, %xmm1			; AVX512VBMI2-NEXT: vmovdqa {{.*#+}} xmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	; AVX512VBMI2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX512VBMI2-NEXT: vpsllw $4, %xmm0, %xmm2
	; AVX512VBMI2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX512VBMI2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX512VBMI2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VBMI2-NEXT: vpternlogq $226, %zmm2, %zmm1, %zmm0
	; AVX512VBMI2-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX512VBMI2-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
				; AVX512VBMI2-NEXT: vzeroupper
	; AVX512VBMI2-NEXT: retq			; AVX512VBMI2-NEXT: retq
	;			;
	; AVX512VLVBMI2-LABEL: splatconstant_funnnel_v16i8:			; AVX512VLVBMI2-LABEL: splatconstant_funnnel_v16i8:
	; AVX512VLVBMI2: # %bb.0:			; AVX512VLVBMI2: # %bb.0:
	; AVX512VLVBMI2-NEXT: vpsrlw $4, %xmm0, %xmm1			; AVX512VLVBMI2-NEXT: vpsrlw $4, %xmm0, %xmm1
	; AVX512VLVBMI2-NEXT: vpsllw $4, %xmm0, %xmm0			; AVX512VLVBMI2-NEXT: vpsllw $4, %xmm0, %xmm0
	; AVX512VLVBMI2-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0			; AVX512VLVBMI2-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0
	; AVX512VLVBMI2-NEXT: retq			; AVX512VLVBMI2-NEXT: retq
	Show All 18 Lines

llvm/test/CodeGen/X86/vector-fshr-rot-256.ll

	Show First 20 Lines • Show All 484 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpaddb %ymm0, %ymm0, %ymm3			; AVX2-NEXT: vpaddb %ymm0, %ymm0, %ymm3
	; AVX2-NEXT: vpor %ymm2, %ymm3, %ymm2			; AVX2-NEXT: vpor %ymm2, %ymm3, %ymm2
	; AVX2-NEXT: vpaddb %ymm1, %ymm1, %ymm1			; AVX2-NEXT: vpaddb %ymm1, %ymm1, %ymm1
	; AVX2-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0			; AVX2-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: var_funnnel_v32i8:			; AVX512F-LABEL: var_funnnel_v32i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpsrlw $4, %ymm0, %ymm2			; AVX512F-NEXT: vmovdqa {{.*#+}} ymm2 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm2, %ymm2			; AVX512F-NEXT: vpsrlw $4, %ymm0, %ymm3
	; AVX512F-NEXT: vpsllw $4, %ymm0, %ymm3			; AVX512F-NEXT: vpsllw $4, %ymm0, %ymm4
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm3, %ymm3			; AVX512F-NEXT: vpternlogq $226, %zmm3, %zmm2, %zmm4
	; AVX512F-NEXT: vpor %ymm2, %ymm3, %ymm2			; AVX512F-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX512F-NEXT: vpxor %xmm3, %xmm3, %xmm3			; AVX512F-NEXT: vpsubb %ymm1, %ymm2, %ymm1
	; AVX512F-NEXT: vpsubb %ymm1, %ymm3, %ymm1
	; AVX512F-NEXT: vpsllw $5, %ymm1, %ymm1			; AVX512F-NEXT: vpsllw $5, %ymm1, %ymm1
	; AVX512F-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0			; AVX512F-NEXT: vpblendvb %ymm1, %ymm4, %ymm0, %ymm0
	; AVX512F-NEXT: vpsrlw $6, %ymm0, %ymm2			; AVX512F-NEXT: vpsrlw $6, %ymm0, %ymm2
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm2, %ymm2
	; AVX512F-NEXT: vpsllw $2, %ymm0, %ymm3			; AVX512F-NEXT: vpsllw $2, %ymm0, %ymm3
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm3, %ymm3			; AVX512F-NEXT: vmovdqa {{.*#+}} ymm4 = [252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252]
	; AVX512F-NEXT: vpor %ymm2, %ymm3, %ymm2			; AVX512F-NEXT: vpternlogq $202, %zmm2, %zmm3, %zmm4
	; AVX512F-NEXT: vpaddb %ymm1, %ymm1, %ymm1			; AVX512F-NEXT: vpaddb %ymm1, %ymm1, %ymm1
	; AVX512F-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0			; AVX512F-NEXT: vpblendvb %ymm1, %ymm4, %ymm0, %ymm0
	; AVX512F-NEXT: vpsrlw $7, %ymm0, %ymm2			; AVX512F-NEXT: vpsrlw $7, %ymm0, %ymm2
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm2, %ymm2			; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm2, %ymm2
	; AVX512F-NEXT: vpaddb %ymm0, %ymm0, %ymm3			; AVX512F-NEXT: vpaddb %ymm0, %ymm0, %ymm3
	; AVX512F-NEXT: vpor %ymm2, %ymm3, %ymm2			; AVX512F-NEXT: vpor %ymm2, %ymm3, %ymm2
	; AVX512F-NEXT: vpaddb %ymm1, %ymm1, %ymm1			; AVX512F-NEXT: vpaddb %ymm1, %ymm1, %ymm1
	; AVX512F-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0			; AVX512F-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 1,331 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1			; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1
	; AVX2-NEXT: vpsllw $4, %ymm0, %ymm0			; AVX2-NEXT: vpsllw $4, %ymm0, %ymm0
	; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: splatconstant_funnnel_v32i8:			; AVX512F-LABEL: splatconstant_funnnel_v32i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpsrlw $4, %ymm0, %ymm1			; AVX512F-NEXT: vmovdqa {{.*#+}} ymm1 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1			; AVX512F-NEXT: vpsrlw $4, %ymm0, %ymm2
	; AVX512F-NEXT: vpsllw $4, %ymm0, %ymm0			; AVX512F-NEXT: vpsllw $4, %ymm0, %ymm0
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX512F-NEXT: vpternlogq $226, %zmm2, %zmm1, %zmm0
	; AVX512F-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: splatconstant_funnnel_v32i8:			; AVX512VL-LABEL: splatconstant_funnnel_v32i8:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vpsllw $4, %ymm0, %ymm1			; AVX512VL-NEXT: vpsllw $4, %ymm0, %ymm1
	; AVX512VL-NEXT: vpsrlw $4, %ymm0, %ymm0			; AVX512VL-NEXT: vpsrlw $4, %ymm0, %ymm0
	; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0			; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	;			;
	; AVX512BW-LABEL: splatconstant_funnnel_v32i8:			; AVX512BW-LABEL: splatconstant_funnnel_v32i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vpsllw $4, %ymm0, %ymm1			; AVX512BW-NEXT: vmovdqa {{.*#+}} ymm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	; AVX512BW-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1			; AVX512BW-NEXT: vpsllw $4, %ymm0, %ymm2
	; AVX512BW-NEXT: vpsrlw $4, %ymm0, %ymm0			; AVX512BW-NEXT: vpsrlw $4, %ymm0, %ymm0
	; AVX512BW-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX512BW-NEXT: vpternlogq $226, %zmm2, %zmm1, %zmm0
	; AVX512BW-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX512BW-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512VLBW-LABEL: splatconstant_funnnel_v32i8:			; AVX512VLBW-LABEL: splatconstant_funnnel_v32i8:
	; AVX512VLBW: # %bb.0:			; AVX512VLBW: # %bb.0:
	; AVX512VLBW-NEXT: vpsrlw $4, %ymm0, %ymm1			; AVX512VLBW-NEXT: vpsrlw $4, %ymm0, %ymm1
	; AVX512VLBW-NEXT: vpsllw $4, %ymm0, %ymm0			; AVX512VLBW-NEXT: vpsllw $4, %ymm0, %ymm0
	; AVX512VLBW-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0			; AVX512VLBW-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0
	; AVX512VLBW-NEXT: retq			; AVX512VLBW-NEXT: retq
	;			;
	; AVX512VBMI2-LABEL: splatconstant_funnnel_v32i8:			; AVX512VBMI2-LABEL: splatconstant_funnnel_v32i8:
	; AVX512VBMI2: # %bb.0:			; AVX512VBMI2: # %bb.0:
	; AVX512VBMI2-NEXT: vpsllw $4, %ymm0, %ymm1			; AVX512VBMI2-NEXT: vmovdqa {{.*#+}} ymm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
	; AVX512VBMI2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1			; AVX512VBMI2-NEXT: vpsllw $4, %ymm0, %ymm2
	; AVX512VBMI2-NEXT: vpsrlw $4, %ymm0, %ymm0			; AVX512VBMI2-NEXT: vpsrlw $4, %ymm0, %ymm0
	; AVX512VBMI2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX512VBMI2-NEXT: vpternlogq $226, %zmm2, %zmm1, %zmm0
	; AVX512VBMI2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX512VBMI2-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0
	; AVX512VBMI2-NEXT: retq			; AVX512VBMI2-NEXT: retq
	;			;
	; AVX512VLVBMI2-LABEL: splatconstant_funnnel_v32i8:			; AVX512VLVBMI2-LABEL: splatconstant_funnnel_v32i8:
	; AVX512VLVBMI2: # %bb.0:			; AVX512VLVBMI2: # %bb.0:
	; AVX512VLVBMI2-NEXT: vpsrlw $4, %ymm0, %ymm1			; AVX512VLVBMI2-NEXT: vpsrlw $4, %ymm0, %ymm1
	; AVX512VLVBMI2-NEXT: vpsllw $4, %ymm0, %ymm0			; AVX512VLVBMI2-NEXT: vpsllw $4, %ymm0, %ymm0
	; AVX512VLVBMI2-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0			; AVX512VLVBMI2-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0
	; AVX512VLVBMI2-NEXT: retq			; AVX512VLVBMI2-NEXT: retq
	Show All 19 Lines

llvm/test/CodeGen/X86/vector-rotate-128.ll

	Show First 20 Lines • Show All 2,054 Lines • ▼ Show 20 Lines
	; AVX-NEXT: vpsllw $4, %xmm0, %xmm0			; AVX-NEXT: vpsllw $4, %xmm0, %xmm0
	; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
	; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0			; AVX-NEXT: vpor %xmm1, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; AVX512F-LABEL: splatconstant_rotate_v16i8:			; AVX512F-LABEL: splatconstant_rotate_v16i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpsllw $4, %xmm0, %xmm1			; AVX512F-NEXT: vpsllw $4, %xmm0, %xmm1
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX512F-NEXT: vmovdqa {{.*#+}} xmm2 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512F-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX512F-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512F-NEXT: vpternlogq $226, %zmm0, %zmm2, %zmm1
	; AVX512F-NEXT: vpor %xmm0, %xmm1, %xmm0			; AVX512F-NEXT: vmovdqa %xmm1, %xmm0
				; AVX512F-NEXT: vzeroupper
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: splatconstant_rotate_v16i8:			; AVX512VL-LABEL: splatconstant_rotate_v16i8:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vpsllw $4, %xmm0, %xmm1			; AVX512VL-NEXT: vpsllw $4, %xmm0, %xmm1
	; AVX512VL-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX512VL-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0			; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	;			;
	; AVX512BW-LABEL: splatconstant_rotate_v16i8:			; AVX512BW-LABEL: splatconstant_rotate_v16i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vpsllw $4, %xmm0, %xmm1			; AVX512BW-NEXT: vpsllw $4, %xmm0, %xmm1
	; AVX512BW-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX512BW-NEXT: vmovdqa {{.*#+}} xmm2 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512BW-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX512BW-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX512BW-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512BW-NEXT: vpternlogq $226, %zmm0, %zmm2, %zmm1
	; AVX512BW-NEXT: vpor %xmm0, %xmm1, %xmm0			; AVX512BW-NEXT: vmovdqa %xmm1, %xmm0
				; AVX512BW-NEXT: vzeroupper
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512VLBW-LABEL: splatconstant_rotate_v16i8:			; AVX512VLBW-LABEL: splatconstant_rotate_v16i8:
	; AVX512VLBW: # %bb.0:			; AVX512VLBW: # %bb.0:
	; AVX512VLBW-NEXT: vpsllw $4, %xmm0, %xmm1			; AVX512VLBW-NEXT: vpsllw $4, %xmm0, %xmm1
	; AVX512VLBW-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX512VLBW-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX512VLBW-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0			; AVX512VLBW-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0
	; AVX512VLBW-NEXT: retq			; AVX512VLBW-NEXT: retq
	;			;
	; AVX512VBMI2-LABEL: splatconstant_rotate_v16i8:			; AVX512VBMI2-LABEL: splatconstant_rotate_v16i8:
	; AVX512VBMI2: # %bb.0:			; AVX512VBMI2: # %bb.0:
	; AVX512VBMI2-NEXT: vpsllw $4, %xmm0, %xmm1			; AVX512VBMI2-NEXT: vpsllw $4, %xmm0, %xmm1
	; AVX512VBMI2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm1			; AVX512VBMI2-NEXT: vmovdqa {{.*#+}} xmm2 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512VBMI2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX512VBMI2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX512VBMI2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0			; AVX512VBMI2-NEXT: vpternlogq $226, %zmm0, %zmm2, %zmm1
	; AVX512VBMI2-NEXT: vpor %xmm0, %xmm1, %xmm0			; AVX512VBMI2-NEXT: vmovdqa %xmm1, %xmm0
				; AVX512VBMI2-NEXT: vzeroupper
	; AVX512VBMI2-NEXT: retq			; AVX512VBMI2-NEXT: retq
	;			;
	; AVX512VLVBMI2-LABEL: splatconstant_rotate_v16i8:			; AVX512VLVBMI2-LABEL: splatconstant_rotate_v16i8:
	; AVX512VLVBMI2: # %bb.0:			; AVX512VLVBMI2: # %bb.0:
	; AVX512VLVBMI2-NEXT: vpsllw $4, %xmm0, %xmm1			; AVX512VLVBMI2-NEXT: vpsllw $4, %xmm0, %xmm1
	; AVX512VLVBMI2-NEXT: vpsrlw $4, %xmm0, %xmm0			; AVX512VLVBMI2-NEXT: vpsrlw $4, %xmm0, %xmm0
	; AVX512VLVBMI2-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0			; AVX512VLVBMI2-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm1, %xmm0
	; AVX512VLVBMI2-NEXT: retq			; AVX512VLVBMI2-NEXT: retq
	▲ Show 20 Lines • Show All 504 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-rotate-256.ll

	Show First 20 Lines • Show All 443 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpaddb %ymm0, %ymm0, %ymm3			; AVX2-NEXT: vpaddb %ymm0, %ymm0, %ymm3
	; AVX2-NEXT: vpor %ymm2, %ymm3, %ymm2			; AVX2-NEXT: vpor %ymm2, %ymm3, %ymm2
	; AVX2-NEXT: vpaddb %ymm1, %ymm1, %ymm1			; AVX2-NEXT: vpaddb %ymm1, %ymm1, %ymm1
	; AVX2-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0			; AVX2-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: var_rotate_v32i8:			; AVX512F-LABEL: var_rotate_v32i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpsrlw $4, %ymm0, %ymm2			; AVX512F-NEXT: vmovdqa {{.*#+}} ymm2 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm2, %ymm2			; AVX512F-NEXT: vpsrlw $4, %ymm0, %ymm3
	; AVX512F-NEXT: vpsllw $4, %ymm0, %ymm3			; AVX512F-NEXT: vpsllw $4, %ymm0, %ymm4
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm3, %ymm3			; AVX512F-NEXT: vpternlogq $226, %zmm3, %zmm2, %zmm4
	; AVX512F-NEXT: vpor %ymm2, %ymm3, %ymm2
	; AVX512F-NEXT: vpsllw $5, %ymm1, %ymm1			; AVX512F-NEXT: vpsllw $5, %ymm1, %ymm1
	; AVX512F-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0			; AVX512F-NEXT: vpblendvb %ymm1, %ymm4, %ymm0, %ymm0
	; AVX512F-NEXT: vpsrlw $6, %ymm0, %ymm2			; AVX512F-NEXT: vpsrlw $6, %ymm0, %ymm2
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm2, %ymm2
	; AVX512F-NEXT: vpsllw $2, %ymm0, %ymm3			; AVX512F-NEXT: vpsllw $2, %ymm0, %ymm3
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm3, %ymm3			; AVX512F-NEXT: vmovdqa {{.*#+}} ymm4 = [252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252,252]
	; AVX512F-NEXT: vpor %ymm2, %ymm3, %ymm2			; AVX512F-NEXT: vpternlogq $202, %zmm2, %zmm3, %zmm4
	; AVX512F-NEXT: vpaddb %ymm1, %ymm1, %ymm1			; AVX512F-NEXT: vpaddb %ymm1, %ymm1, %ymm1
	; AVX512F-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0			; AVX512F-NEXT: vpblendvb %ymm1, %ymm4, %ymm0, %ymm0
	; AVX512F-NEXT: vpsrlw $7, %ymm0, %ymm2			; AVX512F-NEXT: vpsrlw $7, %ymm0, %ymm2
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm2, %ymm2			; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm2, %ymm2
	; AVX512F-NEXT: vpaddb %ymm0, %ymm0, %ymm3			; AVX512F-NEXT: vpaddb %ymm0, %ymm0, %ymm3
	; AVX512F-NEXT: vpor %ymm2, %ymm3, %ymm2			; AVX512F-NEXT: vpor %ymm2, %ymm3, %ymm2
	; AVX512F-NEXT: vpaddb %ymm1, %ymm1, %ymm1			; AVX512F-NEXT: vpaddb %ymm1, %ymm1, %ymm1
	; AVX512F-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0			; AVX512F-NEXT: vpblendvb %ymm1, %ymm2, %ymm0, %ymm0
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 1,266 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1			; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1
	; AVX2-NEXT: vpsllw $4, %ymm0, %ymm0			; AVX2-NEXT: vpsllw $4, %ymm0, %ymm0
	; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: splatconstant_rotate_v32i8:			; AVX512F-LABEL: splatconstant_rotate_v32i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpsrlw $4, %ymm0, %ymm1			; AVX512F-NEXT: vmovdqa {{.*#+}} ymm1 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1			; AVX512F-NEXT: vpsrlw $4, %ymm0, %ymm2
	; AVX512F-NEXT: vpsllw $4, %ymm0, %ymm0			; AVX512F-NEXT: vpsllw $4, %ymm0, %ymm0
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX512F-NEXT: vpternlogq $226, %zmm2, %zmm1, %zmm0
	; AVX512F-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX512F-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: splatconstant_rotate_v32i8:			; AVX512VL-LABEL: splatconstant_rotate_v32i8:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vpsllw $4, %ymm0, %ymm1			; AVX512VL-NEXT: vpsllw $4, %ymm0, %ymm1
	; AVX512VL-NEXT: vpsrlw $4, %ymm0, %ymm0			; AVX512VL-NEXT: vpsrlw $4, %ymm0, %ymm0
	; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0			; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0
	; AVX512VL-NEXT: retq			; AVX512VL-NEXT: retq
	;			;
	; AVX512BW-LABEL: splatconstant_rotate_v32i8:			; AVX512BW-LABEL: splatconstant_rotate_v32i8:
	; AVX512BW: # %bb.0:			; AVX512BW: # %bb.0:
	; AVX512BW-NEXT: vpsllw $4, %ymm0, %ymm1			; AVX512BW-NEXT: vpsllw $4, %ymm0, %ymm1
	; AVX512BW-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1			; AVX512BW-NEXT: vmovdqa {{.*#+}} ymm2 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512BW-NEXT: vpsrlw $4, %ymm0, %ymm0			; AVX512BW-NEXT: vpsrlw $4, %ymm0, %ymm0
	; AVX512BW-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX512BW-NEXT: vpternlogq $226, %zmm0, %zmm2, %zmm1
	; AVX512BW-NEXT: vpor %ymm0, %ymm1, %ymm0			; AVX512BW-NEXT: vmovdqa %ymm1, %ymm0
	; AVX512BW-NEXT: retq			; AVX512BW-NEXT: retq
	;			;
	; AVX512VLBW-LABEL: splatconstant_rotate_v32i8:			; AVX512VLBW-LABEL: splatconstant_rotate_v32i8:
	; AVX512VLBW: # %bb.0:			; AVX512VLBW: # %bb.0:
	; AVX512VLBW-NEXT: vpsllw $4, %ymm0, %ymm1			; AVX512VLBW-NEXT: vpsllw $4, %ymm0, %ymm1
	; AVX512VLBW-NEXT: vpsrlw $4, %ymm0, %ymm0			; AVX512VLBW-NEXT: vpsrlw $4, %ymm0, %ymm0
	; AVX512VLBW-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0			; AVX512VLBW-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0
	; AVX512VLBW-NEXT: retq			; AVX512VLBW-NEXT: retq
	;			;
	; AVX512VBMI2-LABEL: splatconstant_rotate_v32i8:			; AVX512VBMI2-LABEL: splatconstant_rotate_v32i8:
	; AVX512VBMI2: # %bb.0:			; AVX512VBMI2: # %bb.0:
	; AVX512VBMI2-NEXT: vpsllw $4, %ymm0, %ymm1			; AVX512VBMI2-NEXT: vpsllw $4, %ymm0, %ymm1
	; AVX512VBMI2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1			; AVX512VBMI2-NEXT: vmovdqa {{.*#+}} ymm2 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512VBMI2-NEXT: vpsrlw $4, %ymm0, %ymm0			; AVX512VBMI2-NEXT: vpsrlw $4, %ymm0, %ymm0
	; AVX512VBMI2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX512VBMI2-NEXT: vpternlogq $226, %zmm0, %zmm2, %zmm1
	; AVX512VBMI2-NEXT: vpor %ymm0, %ymm1, %ymm0			; AVX512VBMI2-NEXT: vmovdqa %ymm1, %ymm0
	; AVX512VBMI2-NEXT: retq			; AVX512VBMI2-NEXT: retq
	;			;
	; AVX512VLVBMI2-LABEL: splatconstant_rotate_v32i8:			; AVX512VLVBMI2-LABEL: splatconstant_rotate_v32i8:
	; AVX512VLVBMI2: # %bb.0:			; AVX512VLVBMI2: # %bb.0:
	; AVX512VLVBMI2-NEXT: vpsllw $4, %ymm0, %ymm1			; AVX512VLVBMI2-NEXT: vpsllw $4, %ymm0, %ymm1
	; AVX512VLVBMI2-NEXT: vpsrlw $4, %ymm0, %ymm0			; AVX512VLVBMI2-NEXT: vpsrlw $4, %ymm0, %ymm0
	; AVX512VLVBMI2-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0			; AVX512VLVBMI2-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0
	; AVX512VLVBMI2-NEXT: retq			; AVX512VLVBMI2-NEXT: retq
	▲ Show 20 Lines • Show All 305 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: vpsllw $4, %ymm0, %ymm0			; AVX2-NEXT: vpsllw $4, %ymm0, %ymm0
	; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0
	; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX2-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: splatconstant_rotate_mask_v32i8:			; AVX512F-LABEL: splatconstant_rotate_mask_v32i8:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vpsrlw $4, %ymm0, %ymm1			; AVX512F-NEXT: vmovdqa {{.*#+}} ymm1 = [240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240,240]
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1			; AVX512F-NEXT: vpsrlw $4, %ymm0, %ymm2
	; AVX512F-NEXT: vpsllw $4, %ymm0, %ymm0			; AVX512F-NEXT: vpsllw $4, %ymm0, %ymm0
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX512F-NEXT: vpternlogq $226, %zmm2, %zmm1, %zmm0
	; AVX512F-NEXT: vpor %ymm1, %ymm0, %ymm0
	; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0			; AVX512F-NEXT: vpand {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0
	; AVX512F-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512VL-LABEL: splatconstant_rotate_mask_v32i8:			; AVX512VL-LABEL: splatconstant_rotate_mask_v32i8:
	; AVX512VL: # %bb.0:			; AVX512VL: # %bb.0:
	; AVX512VL-NEXT: vpsllw $4, %ymm0, %ymm1			; AVX512VL-NEXT: vpsllw $4, %ymm0, %ymm1
	; AVX512VL-NEXT: vpsrlw $4, %ymm0, %ymm0			; AVX512VL-NEXT: vpsrlw $4, %ymm0, %ymm0
	; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0			; AVX512VL-NEXT: vpternlogq $216, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm0
	▲ Show 20 Lines • Show All 61 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Widen 128/256-bit VPTERNLOG patterns to 512-bit on non-VLX targetsClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 387069

llvm/lib/Target/X86/X86ISelLowering.cpp

llvm/test/CodeGen/X86/combine-bitselect.ll

llvm/test/CodeGen/X86/vector-fshl-128.ll

llvm/test/CodeGen/X86/vector-fshl-256.ll

llvm/test/CodeGen/X86/vector-fshl-rot-128.ll

llvm/test/CodeGen/X86/vector-fshl-rot-256.ll

llvm/test/CodeGen/X86/vector-fshr-128.ll

llvm/test/CodeGen/X86/vector-fshr-256.ll

llvm/test/CodeGen/X86/vector-fshr-rot-128.ll

llvm/test/CodeGen/X86/vector-fshr-rot-256.ll

llvm/test/CodeGen/X86/vector-rotate-128.ll

llvm/test/CodeGen/X86/vector-rotate-256.ll

[X86] Widen 128/256-bit VPTERNLOG patterns to 512-bit on non-VLX targets
ClosedPublic