This is an archive of the discontinued LLVM Phabricator instance.

[X86][SSE] Allow folding of store/zext with PEXTRW of 0'th element
ClosedPublic

Authored by RKSimon on Jul 19 2016, 6:13 AM.

Download Raw Diff

Details

Reviewers

spatel
qcolombet
ab
andreadb

Commits

rG88e0940d3bde: [X86][SSE] Allow folding of store/zext with PEXTRW of 0'th element
rL276289: [X86][SSE] Allow folding of store/zext with PEXTRW of 0'th element

Summary

Under normal circumstances we prefer the higher performance MOVD to extract the 0'th element of a v8i16 vector instead of PEXTRW.

But as detailed on PR27265, this prevents the SSE41 implementation of PEXTRW from folding the store of the 0'th element. Additionally it prevents us from making use of the fact that the (SSE2) reg-reg version of PEXTRW implicitly zero-extends the i16 element to the i32/i64 destination register.

This patch only preferentially lowers to MOVD if we will not be zero-extending the extracted i16, nor prevent a store from being folded (on SSSE41).

I can commit these separately but included them together for review.

Fix for PR27265.

Diff Detail

Repository: rL LLVM

Event Timeline

RKSimon updated this revision to Diff 64477.Jul 19 2016, 6:13 AM

RKSimon retitled this revision from to [X86][SSE] Allow folding of store/zext with PEXTRW of 0'th element.

RKSimon updated this object.

RKSimon added reviewers: qcolombet, ab, spatel, andreadb.

RKSimon set the repository for this revision to rL LLVM.

RKSimon added a subscriber: llvm-commits.

LGTM - one refactoring suggestion inline.

lib/Target/X86/X86ISelLowering.cpp
12531–12545	Can you pull this chunk (if bitsize == 16 {}) out as a helper function so we don't have 2 copies of it?

This revision is now accepted and ready to land.Jul 20 2016, 8:45 AM

RKSimon mentioned this in rL276285: [X86][SSE] Pull out duplicate EXTRW lowering code. NFCI..Jul 21 2016, 7:37 AM

Closed by commit rL276289: [X86][SSE] Allow folding of store/zext with PEXTRW of 0'th element (authored by RKSimon). · Explain WhyJul 21 2016, 8:01 AM

This revision was automatically updated to reflect the committed changes.

Revision Contents

Path

Size

lib/

Target/

X86/

	X86ISelLowering.cpp
	X86ISelLowering.cpp (revision 275972)

18 lines

test/

CodeGen/

X86/

	2011-12-8-bitcastintprom.ll
	2011-12-8-bitcastintprom.ll (revision 275972)

3 lines

	avx512-trunc.ll
	avx512-trunc.ll (revision 275972)

3 lines

	extract-store.ll
	extract-store.ll (revision 275972)

18 lines

	lower-vec-shift-2.ll
	lower-vec-shift-2.ll (revision 275972)

9 lines

	masked_memop.ll
	masked_memop.ll (revision 275972)

60 lines

	trunc-ext-ld-st.ll
	trunc-ext-ld-st.ll (revision 275972)

3 lines

	vector-shift-ashr-128.ll
	vector-shift-ashr-128.ll (revision 275972)

6 lines

	vector-shift-ashr-256.ll
	vector-shift-ashr-256.ll (revision 275972)

15 lines

	vector-shift-ashr-512.ll
	vector-shift-ashr-512.ll (revision 275972)

6 lines

	vector-shift-lshr-128.ll
	vector-shift-lshr-128.ll (revision 275972)

6 lines

	vector-shift-lshr-256.ll
	vector-shift-lshr-256.ll (revision 275972)

15 lines

	vector-shift-lshr-512.ll
	vector-shift-lshr-512.ll (revision 275972)

6 lines

	vector-shift-shl-128.ll
	vector-shift-shl-128.ll (revision 275972)

6 lines

	vector-shift-shl-256.ll
	vector-shift-shl-256.ll (revision 275972)

15 lines

	vector-shift-shl-512.ll
	vector-shift-shl-512.ll (revision 275972)

6 lines

	widen_conv-1.ll
	widen_conv-1.ll (revision 275972)

6 lines

	widen_load-2.ll
	widen_load-2.ll (revision 275972)

12 lines

Diff 64477

lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 3,773 Lines • ▼ Show 20 Lines
static bool MayFoldLoad(SDValue Op) {		static bool MayFoldLoad(SDValue Op) {
return Op.hasOneUse() && ISD::isNormalLoad(Op.getNode());		return Op.hasOneUse() && ISD::isNormalLoad(Op.getNode());
}		}

static bool MayFoldIntoStore(SDValue Op) {		static bool MayFoldIntoStore(SDValue Op) {
return Op.hasOneUse() && ISD::isNormalStore(*Op.getNode()->use_begin());		return Op.hasOneUse() && ISD::isNormalStore(*Op.getNode()->use_begin());
}		}

		static bool MayFoldIntoZeroExtend(SDValue Op) {
		if (Op.hasOneUse()) {
		unsigned Opcode = Op.getNode()->use_begin()->getOpcode();
		return (ISD::ZERO_EXTEND == Opcode);
		}
		return false;
		}

static bool isTargetShuffle(unsigned Opcode) {		static bool isTargetShuffle(unsigned Opcode) {
switch(Opcode) {		switch(Opcode) {
default: return false;		default: return false;
case X86ISD::BLENDI:		case X86ISD::BLENDI:
case X86ISD::PSHUFB:		case X86ISD::PSHUFB:
case X86ISD::PSHUFD:		case X86ISD::PSHUFD:
case X86ISD::PSHUFHW:		case X86ISD::PSHUFHW:
case X86ISD::PSHUFLW:		case X86ISD::PSHUFLW:
▲ Show 20 Lines • Show All 8,579 Lines • ▼ Show 20 Lines	if (VT.getSizeInBits() == 8) {
SDValue Extract = DAG.getNode(X86ISD::PEXTRB, dl, MVT::i32,		SDValue Extract = DAG.getNode(X86ISD::PEXTRB, dl, MVT::i32,
Op.getOperand(0), Op.getOperand(1));		Op.getOperand(0), Op.getOperand(1));
SDValue Assert = DAG.getNode(ISD::AssertZext, dl, MVT::i32, Extract,		SDValue Assert = DAG.getNode(ISD::AssertZext, dl, MVT::i32, Extract,
DAG.getValueType(VT));		DAG.getValueType(VT));
return DAG.getNode(ISD::TRUNCATE, dl, VT, Assert);		return DAG.getNode(ISD::TRUNCATE, dl, VT, Assert);
}		}

if (VT.getSizeInBits() == 16) {		if (VT.getSizeInBits() == 16) {
// If Idx is 0, it's cheaper to do a move instead of a pextrw.		// If Idx is 0, it's cheaper to do a move instead of a pextrw, unless we're
if (isNullConstant(Op.getOperand(1)))		// going to fold the store or zero extend the register.
		if (isNullConstant(Op.getOperand(1)) && !MayFoldIntoStore(Op) &&
		!MayFoldIntoZeroExtend(Op))
return DAG.getNode(		return DAG.getNode(
ISD::TRUNCATE, dl, MVT::i16,		ISD::TRUNCATE, dl, MVT::i16,
DAG.getNode(ISD::EXTRACT_VECTOR_ELT, dl, MVT::i32,		DAG.getNode(ISD::EXTRACT_VECTOR_ELT, dl, MVT::i32,
DAG.getBitcast(MVT::v4i32, Op.getOperand(0)),		DAG.getBitcast(MVT::v4i32, Op.getOperand(0)),
Op.getOperand(1)));		Op.getOperand(1)));
SDValue Extract = DAG.getNode(X86ISD::PEXTRW, dl, MVT::i32,		SDValue Extract = DAG.getNode(X86ISD::PEXTRW, dl, MVT::i32,
Op.getOperand(0), Op.getOperand(1));		Op.getOperand(0), Op.getOperand(1));
SDValue Assert = DAG.getNode(ISD::AssertZext, dl, MVT::i32, Extract,		SDValue Assert = DAG.getNode(ISD::AssertZext, dl, MVT::i32, Extract,
▲ Show 20 Lines • Show All 126 Lines • ▼ Show 20 Lines	X86TargetLowering::LowerEXTRACT_VECTOR_ELT(SDValue Op,
assert(VecVT.is128BitVector() && "Unexpected vector length");		assert(VecVT.is128BitVector() && "Unexpected vector length");

if (Subtarget.hasSSE41())		if (Subtarget.hasSSE41())
if (SDValue Res = LowerEXTRACT_VECTOR_ELT_SSE4(Op, DAG))		if (SDValue Res = LowerEXTRACT_VECTOR_ELT_SSE4(Op, DAG))
return Res;		return Res;

MVT VT = Op.getSimpleValueType();		MVT VT = Op.getSimpleValueType();
// TODO: handle v16i8.		// TODO: handle v16i8.
if (VT.getSizeInBits() == 16) {		if (VT.getSizeInBits() == 16) {
if (IdxVal == 0)		// If Idx is 0, it's cheaper to do a move instead of a pextrw, unless we're
		// going to zero extend the register.
		if (IdxVal == 0 && !MayFoldIntoZeroExtend(Op))
return DAG.getNode(ISD::TRUNCATE, dl, MVT::i16,		return DAG.getNode(ISD::TRUNCATE, dl, MVT::i16,
DAG.getNode(ISD::EXTRACT_VECTOR_ELT, dl, MVT::i32,		DAG.getNode(ISD::EXTRACT_VECTOR_ELT, dl, MVT::i32,
DAG.getBitcast(MVT::v4i32, Vec), Idx));		DAG.getBitcast(MVT::v4i32, Vec), Idx));

// Transform it so it match pextrw which produces a 32-bit result.		// Transform it so it match pextrw which produces a 32-bit result.
MVT EltVT = MVT::i32;		MVT EltVT = MVT::i32;
SDValue Extract = DAG.getNode(X86ISD::PEXTRW, dl, EltVT, Vec, Idx);		SDValue Extract = DAG.getNode(X86ISD::PEXTRW, dl, EltVT, Vec, Idx);
SDValue Assert = DAG.getNode(ISD::AssertZext, dl, EltVT, Extract,		SDValue Assert = DAG.getNode(ISD::AssertZext, dl, EltVT, Extract,
DAG.getValueType(VT));		DAG.getValueType(VT));
return DAG.getNode(ISD::TRUNCATE, dl, VT, Assert);		return DAG.getNode(ISD::TRUNCATE, dl, VT, Assert);
}		}
		spatelUnsubmitted Not Done Reply Inline Actions Can you pull this chunk (if bitsize == 16 {}) out as a helper function so we don't have 2 copies of it? spatel: Can you pull this chunk (if bitsize == 16 {}) out as a helper function so we don't have 2…

if (VT.getSizeInBits() == 32) {		if (VT.getSizeInBits() == 32) {
if (IdxVal == 0)		if (IdxVal == 0)
return Op;		return Op;

// SHUFPS the element to the lowest double word, then movss.		// SHUFPS the element to the lowest double word, then movss.
int Mask[4] = { static_cast<int>(IdxVal), -1, -1, -1 };		int Mask[4] = { static_cast<int>(IdxVal), -1, -1, -1 };
Vec = DAG.getVectorShuffle(VecVT, dl, Vec, DAG.getUNDEF(VecVT), Mask);		Vec = DAG.getVectorShuffle(VecVT, dl, Vec, DAG.getUNDEF(VecVT), Mask);
▲ Show 20 Lines • Show All 19,411 Lines • Show Last 20 Lines

test/CodeGen/X86/2011-12-8-bitcastintprom.ll

	Show All 13 Lines
	; SSE2-NEXT: movd %xmm0, %eax			; SSE2-NEXT: movd %xmm0, %eax
	; SSE2-NEXT: movw %ax, (%rdi)			; SSE2-NEXT: movw %ax, (%rdi)
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: prom_bug:			; SSE41-LABEL: prom_bug:
	; SSE41: ## BB#0:			; SSE41: ## BB#0:
	; SSE41-NEXT: pshufb {{.*#+}} xmm0 = xmm0[0,4,8,12,u,u,u,u,u,u,u,u,u,u,u,u]			; SSE41-NEXT: pshufb {{.*#+}} xmm0 = xmm0[0,4,8,12,u,u,u,u,u,u,u,u,u,u,u,u]
	; SSE41-NEXT: pmovzxwq {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero			; SSE41-NEXT: pmovzxwq {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero
	; SSE41-NEXT: movd %xmm0, %eax			; SSE41-NEXT: pextrw $0, %xmm0, (%rdi)
	; SSE41-NEXT: movw %ax, (%rdi)
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	%r = bitcast <4 x i8> %t to <2 x i16>			%r = bitcast <4 x i8> %t to <2 x i16>
	%o = extractelement <2 x i16> %r, i32 0			%o = extractelement <2 x i16> %r, i32 0
	store i16 %o, i16* %p			store i16 %o, i16* %p
	ret void			ret void
	}			}

test/CodeGen/X86/avx512-trunc.ll

Show First 20 Lines • Show All 90 Lines • ▼ Show 20 Lines	; ALL-NEXT: retq
%x = trunc <2 x i64> %i to <2 x i8>		%x = trunc <2 x i64> %i to <2 x i8>
ret <2 x i8> %x		ret <2 x i8> %x
}		}

define void @trunc_qb_128_mem(<2 x i64> %i, <2 x i8>* %res) #0 {		define void @trunc_qb_128_mem(<2 x i64> %i, <2 x i8>* %res) #0 {
; KNL-LABEL: trunc_qb_128_mem:		; KNL-LABEL: trunc_qb_128_mem:
; KNL: ## BB#0:		; KNL: ## BB#0:
; KNL-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]		; KNL-NEXT: vpshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
; KNL-NEXT: vmovd %xmm0, %eax		; KNL-NEXT: vpextrw $0, %xmm0, (%rdi)
; KNL-NEXT: movw %ax, (%rdi)
; KNL-NEXT: retq		; KNL-NEXT: retq
;		;
; SKX-LABEL: trunc_qb_128_mem:		; SKX-LABEL: trunc_qb_128_mem:
; SKX: ## BB#0:		; SKX: ## BB#0:
; SKX-NEXT: vpmovqb %xmm0, (%rdi)		; SKX-NEXT: vpmovqb %xmm0, (%rdi)
; SKX-NEXT: retq		; SKX-NEXT: retq
%x = trunc <2 x i64> %i to <2 x i8>		%x = trunc <2 x i64> %i to <2 x i8>
store <2 x i8> %x, <2 x i8>* %res		store <2 x i8> %x, <2 x i8>* %res
▲ Show 20 Lines • Show All 395 Lines • Show Last 20 Lines

test/CodeGen/X86/extract-store.ll

	Show First 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; AVX-NEXT: vpextrb $15, %xmm0, (%rdi)			; AVX-NEXT: vpextrb $15, %xmm0, (%rdi)
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%vecext = extractelement <16 x i8> %foo, i32 15			%vecext = extractelement <16 x i8> %foo, i32 15
	store i8 %vecext, i8* %dst, align 1			store i8 %vecext, i8* %dst, align 1
	ret void			ret void
	}			}

	define void @extract_i16_0(i16* nocapture %dst, <8 x i16> %foo) {			define void @extract_i16_0(i16* nocapture %dst, <8 x i16> %foo) {
	; SSE-LABEL: extract_i16_0:			; SSE2-LABEL: extract_i16_0:
	; SSE: # BB#0:			; SSE2: # BB#0:
	; SSE-NEXT: movd %xmm0, %eax			; SSE2-NEXT: movd %xmm0, %eax
	; SSE-NEXT: movw %ax, (%rdi)			; SSE2-NEXT: movw %ax, (%rdi)
	; SSE-NEXT: retq			; SSE2-NEXT: retq
				;
				; SSE41-LABEL: extract_i16_0:
				; SSE41: # BB#0:
				; SSE41-NEXT: pextrw $0, %xmm0, (%rdi)
				; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: extract_i16_0:			; AVX-LABEL: extract_i16_0:
	; AVX: # BB#0:			; AVX: # BB#0:
	; AVX-NEXT: vmovd %xmm0, %eax			; AVX-NEXT: vpextrw $0, %xmm0, (%rdi)
	; AVX-NEXT: movw %ax, (%rdi)
	; AVX-NEXT: retq			; AVX-NEXT: retq
	%vecext = extractelement <8 x i16> %foo, i32 0			%vecext = extractelement <8 x i16> %foo, i32 0
	store i16 %vecext, i16* %dst, align 1			store i16 %vecext, i16* %dst, align 1
	ret void			ret void
	}			}

	define void @extract_i16_7(i16* nocapture %dst, <8 x i16> %foo) {			define void @extract_i16_7(i16* nocapture %dst, <8 x i16> %foo) {
	; SSE2-LABEL: extract_i16_7:			; SSE2-LABEL: extract_i16_7:
	▲ Show 20 Lines • Show All 44 Lines • Show Last 20 Lines

test/CodeGen/X86/lower-vec-shift-2.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc -mtriple=x86_64-unknown-unknown -mattr=+sse2 < %s \| FileCheck %s --check-prefix=SSE2		; RUN: llc -mtriple=x86_64-unknown-unknown -mattr=+sse2 < %s \| FileCheck %s --check-prefix=SSE2
; RUN: llc -mtriple=x86_64-unknown-unknown -mattr=+avx < %s \| FileCheck %s --check-prefix=AVX		; RUN: llc -mtriple=x86_64-unknown-unknown -mattr=+avx < %s \| FileCheck %s --check-prefix=AVX

define <8 x i16> @test1(<8 x i16> %A, <8 x i16> %B) {		define <8 x i16> @test1(<8 x i16> %A, <8 x i16> %B) {
; SSE2-LABEL: test1:		; SSE2-LABEL: test1:
; SSE2: # BB#0: # %entry		; SSE2: # BB#0: # %entry
; SSE2-NEXT: movd %xmm1, %eax		; SSE2-NEXT: pextrw $0, %xmm1, %eax
; SSE2-NEXT: movzwl %ax, %eax
; SSE2-NEXT: movd %eax, %xmm1		; SSE2-NEXT: movd %eax, %xmm1
; SSE2-NEXT: psllw %xmm1, %xmm0		; SSE2-NEXT: psllw %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; AVX-LABEL: test1:		; AVX-LABEL: test1:
; AVX: # BB#0: # %entry		; AVX: # BB#0: # %entry
; AVX-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1,2,3,4,5,6,7]		; AVX-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1,2,3,4,5,6,7]
Show All 39 Lines	entry:
%vecinit2 = shufflevector <2 x i64> %B, <2 x i64> undef, <2 x i32> zeroinitializer		%vecinit2 = shufflevector <2 x i64> %B, <2 x i64> undef, <2 x i32> zeroinitializer
%shl = shl <2 x i64> %A, %vecinit2		%shl = shl <2 x i64> %A, %vecinit2
ret <2 x i64> %shl		ret <2 x i64> %shl
}		}

define <8 x i16> @test4(<8 x i16> %A, <8 x i16> %B) {		define <8 x i16> @test4(<8 x i16> %A, <8 x i16> %B) {
; SSE2-LABEL: test4:		; SSE2-LABEL: test4:
; SSE2: # BB#0: # %entry		; SSE2: # BB#0: # %entry
; SSE2-NEXT: movd %xmm1, %eax		; SSE2-NEXT: pextrw $0, %xmm1, %eax
; SSE2-NEXT: movzwl %ax, %eax
; SSE2-NEXT: movd %eax, %xmm1		; SSE2-NEXT: movd %eax, %xmm1
; SSE2-NEXT: psrlw %xmm1, %xmm0		; SSE2-NEXT: psrlw %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; AVX-LABEL: test4:		; AVX-LABEL: test4:
; AVX: # BB#0: # %entry		; AVX: # BB#0: # %entry
; AVX-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1,2,3,4,5,6,7]		; AVX-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1,2,3,4,5,6,7]
Show All 39 Lines	entry:
%vecinit2 = shufflevector <2 x i64> %B, <2 x i64> undef, <2 x i32> zeroinitializer		%vecinit2 = shufflevector <2 x i64> %B, <2 x i64> undef, <2 x i32> zeroinitializer
%shr = lshr <2 x i64> %A, %vecinit2		%shr = lshr <2 x i64> %A, %vecinit2
ret <2 x i64> %shr		ret <2 x i64> %shr
}		}

define <8 x i16> @test7(<8 x i16> %A, <8 x i16> %B) {		define <8 x i16> @test7(<8 x i16> %A, <8 x i16> %B) {
; SSE2-LABEL: test7:		; SSE2-LABEL: test7:
; SSE2: # BB#0: # %entry		; SSE2: # BB#0: # %entry
; SSE2-NEXT: movd %xmm1, %eax		; SSE2-NEXT: pextrw $0, %xmm1, %eax
; SSE2-NEXT: movzwl %ax, %eax
; SSE2-NEXT: movd %eax, %xmm1		; SSE2-NEXT: movd %eax, %xmm1
; SSE2-NEXT: psraw %xmm1, %xmm0		; SSE2-NEXT: psraw %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; AVX-LABEL: test7:		; AVX-LABEL: test7:
; AVX: # BB#0: # %entry		; AVX: # BB#0: # %entry
; AVX-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1,2,3,4,5,6,7]		; AVX-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1,2,3,4,5,6,7]
Show All 27 Lines

test/CodeGen/X86/masked_memop.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 9,224 Lines • ▼ Show 20 Lines

	define void @test_mask_store_8xi16(<8 x i1> %mask, <8 x i16>* %addr, <8 x i16> %val) {			define void @test_mask_store_8xi16(<8 x i1> %mask, <8 x i16>* %addr, <8 x i16> %val) {
	; AVX-LABEL: test_mask_store_8xi16:			; AVX-LABEL: test_mask_store_8xi16:
	; AVX: ## BB#0:			; AVX: ## BB#0:
	; AVX-NEXT: vpextrb $0, %xmm0, %eax			; AVX-NEXT: vpextrb $0, %xmm0, %eax
	; AVX-NEXT: testb $1, %al			; AVX-NEXT: testb $1, %al
	; AVX-NEXT: je LBB59_2			; AVX-NEXT: je LBB59_2
	; AVX-NEXT: ## BB#1: ## %cond.store			; AVX-NEXT: ## BB#1: ## %cond.store
	; AVX-NEXT: vmovd %xmm1, %eax			; AVX-NEXT: vpextrw $0, %xmm1, (%rdi)
	; AVX-NEXT: movw %ax, (%rdi)
	; AVX-NEXT: LBB59_2: ## %else			; AVX-NEXT: LBB59_2: ## %else
	; AVX-NEXT: vpextrb $2, %xmm0, %eax			; AVX-NEXT: vpextrb $2, %xmm0, %eax
	; AVX-NEXT: testb $1, %al			; AVX-NEXT: testb $1, %al
	; AVX-NEXT: je LBB59_4			; AVX-NEXT: je LBB59_4
	; AVX-NEXT: ## BB#3: ## %cond.store1			; AVX-NEXT: ## BB#3: ## %cond.store1
	; AVX-NEXT: vpextrw $1, %xmm1, 2(%rdi)			; AVX-NEXT: vpextrw $1, %xmm1, 2(%rdi)
	; AVX-NEXT: LBB59_4: ## %else2			; AVX-NEXT: LBB59_4: ## %else2
	; AVX-NEXT: vpextrb $4, %xmm0, %eax			; AVX-NEXT: vpextrb $4, %xmm0, %eax
	Show All 40 Lines
	; AVX512F-NEXT: vpsllq $63, %zmm0, %zmm0			; AVX512F-NEXT: vpsllq $63, %zmm0, %zmm0
	; AVX512F-NEXT: vptestmq %zmm0, %zmm0, %k0			; AVX512F-NEXT: vptestmq %zmm0, %zmm0, %k0
	; AVX512F-NEXT: kshiftlw $15, %k0, %k1			; AVX512F-NEXT: kshiftlw $15, %k0, %k1
	; AVX512F-NEXT: kshiftrw $15, %k1, %k1			; AVX512F-NEXT: kshiftrw $15, %k1, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb %al, %al			; AVX512F-NEXT: testb %al, %al
	; AVX512F-NEXT: je LBB59_2			; AVX512F-NEXT: je LBB59_2
	; AVX512F-NEXT: ## BB#1: ## %cond.store			; AVX512F-NEXT: ## BB#1: ## %cond.store
	; AVX512F-NEXT: vmovd %xmm1, %eax			; AVX512F-NEXT: vpextrw $0, %xmm1, (%rdi)
	; AVX512F-NEXT: movw %ax, (%rdi)
	; AVX512F-NEXT: LBB59_2: ## %else			; AVX512F-NEXT: LBB59_2: ## %else
	; AVX512F-NEXT: kshiftlw $14, %k0, %k1			; AVX512F-NEXT: kshiftlw $14, %k0, %k1
	; AVX512F-NEXT: kshiftrw $15, %k1, %k1			; AVX512F-NEXT: kshiftrw $15, %k1, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb %al, %al			; AVX512F-NEXT: testb %al, %al
	; AVX512F-NEXT: je LBB59_4			; AVX512F-NEXT: je LBB59_4
	; AVX512F-NEXT: ## BB#3: ## %cond.store1			; AVX512F-NEXT: ## BB#3: ## %cond.store1
	; AVX512F-NEXT: vpextrw $1, %xmm1, 2(%rdi)			; AVX512F-NEXT: vpextrw $1, %xmm1, 2(%rdi)
	▲ Show 20 Lines • Show All 61 Lines • ▼ Show 20 Lines

	define void @test_mask_store_16xi16(<16 x i1> %mask, <16 x i16>* %addr, <16 x i16> %val) {			define void @test_mask_store_16xi16(<16 x i1> %mask, <16 x i16>* %addr, <16 x i16> %val) {
	; AVX1-LABEL: test_mask_store_16xi16:			; AVX1-LABEL: test_mask_store_16xi16:
	; AVX1: ## BB#0:			; AVX1: ## BB#0:
	; AVX1-NEXT: vpextrb $0, %xmm0, %eax			; AVX1-NEXT: vpextrb $0, %xmm0, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB60_2			; AVX1-NEXT: je LBB60_2
	; AVX1-NEXT: ## BB#1: ## %cond.store			; AVX1-NEXT: ## BB#1: ## %cond.store
	; AVX1-NEXT: vmovd %xmm1, %eax			; AVX1-NEXT: vpextrw $0, %xmm1, (%rdi)
	; AVX1-NEXT: movw %ax, (%rdi)
	; AVX1-NEXT: LBB60_2: ## %else			; AVX1-NEXT: LBB60_2: ## %else
	; AVX1-NEXT: vpextrb $1, %xmm0, %eax			; AVX1-NEXT: vpextrb $1, %xmm0, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB60_4			; AVX1-NEXT: je LBB60_4
	; AVX1-NEXT: ## BB#3: ## %cond.store1			; AVX1-NEXT: ## BB#3: ## %cond.store1
	; AVX1-NEXT: vpextrw $1, %xmm1, 2(%rdi)			; AVX1-NEXT: vpextrw $1, %xmm1, 2(%rdi)
	; AVX1-NEXT: LBB60_4: ## %else2			; AVX1-NEXT: LBB60_4: ## %else2
	; AVX1-NEXT: vpextrb $2, %xmm0, %eax			; AVX1-NEXT: vpextrb $2, %xmm0, %eax
	Show All 32 Lines
	; AVX1-NEXT: ## BB#15: ## %cond.store13			; AVX1-NEXT: ## BB#15: ## %cond.store13
	; AVX1-NEXT: vpextrw $7, %xmm1, 14(%rdi)			; AVX1-NEXT: vpextrw $7, %xmm1, 14(%rdi)
	; AVX1-NEXT: LBB60_16: ## %else14			; AVX1-NEXT: LBB60_16: ## %else14
	; AVX1-NEXT: vpextrb $8, %xmm0, %eax			; AVX1-NEXT: vpextrb $8, %xmm0, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB60_18			; AVX1-NEXT: je LBB60_18
	; AVX1-NEXT: ## BB#17: ## %cond.store15			; AVX1-NEXT: ## BB#17: ## %cond.store15
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vmovd %xmm2, %eax			; AVX1-NEXT: vpextrw $0, %xmm2, 16(%rdi)
	; AVX1-NEXT: movw %ax, 16(%rdi)
	; AVX1-NEXT: LBB60_18: ## %else16			; AVX1-NEXT: LBB60_18: ## %else16
	; AVX1-NEXT: vpextrb $9, %xmm0, %eax			; AVX1-NEXT: vpextrb $9, %xmm0, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB60_20			; AVX1-NEXT: je LBB60_20
	; AVX1-NEXT: ## BB#19: ## %cond.store17			; AVX1-NEXT: ## BB#19: ## %cond.store17
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
	; AVX1-NEXT: vpextrw $1, %xmm2, 18(%rdi)			; AVX1-NEXT: vpextrw $1, %xmm2, 18(%rdi)
	; AVX1-NEXT: LBB60_20: ## %else18			; AVX1-NEXT: LBB60_20: ## %else18
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_mask_store_16xi16:			; AVX2-LABEL: test_mask_store_16xi16:
	; AVX2: ## BB#0:			; AVX2: ## BB#0:
	; AVX2-NEXT: vpextrb $0, %xmm0, %eax			; AVX2-NEXT: vpextrb $0, %xmm0, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB60_2			; AVX2-NEXT: je LBB60_2
	; AVX2-NEXT: ## BB#1: ## %cond.store			; AVX2-NEXT: ## BB#1: ## %cond.store
	; AVX2-NEXT: vmovd %xmm1, %eax			; AVX2-NEXT: vpextrw $0, %xmm1, (%rdi)
	; AVX2-NEXT: movw %ax, (%rdi)
	; AVX2-NEXT: LBB60_2: ## %else			; AVX2-NEXT: LBB60_2: ## %else
	; AVX2-NEXT: vpextrb $1, %xmm0, %eax			; AVX2-NEXT: vpextrb $1, %xmm0, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB60_4			; AVX2-NEXT: je LBB60_4
	; AVX2-NEXT: ## BB#3: ## %cond.store1			; AVX2-NEXT: ## BB#3: ## %cond.store1
	; AVX2-NEXT: vpextrw $1, %xmm1, 2(%rdi)			; AVX2-NEXT: vpextrw $1, %xmm1, 2(%rdi)
	; AVX2-NEXT: LBB60_4: ## %else2			; AVX2-NEXT: LBB60_4: ## %else2
	; AVX2-NEXT: vpextrb $2, %xmm0, %eax			; AVX2-NEXT: vpextrb $2, %xmm0, %eax
	Show All 32 Lines
	; AVX2-NEXT: ## BB#15: ## %cond.store13			; AVX2-NEXT: ## BB#15: ## %cond.store13
	; AVX2-NEXT: vpextrw $7, %xmm1, 14(%rdi)			; AVX2-NEXT: vpextrw $7, %xmm1, 14(%rdi)
	; AVX2-NEXT: LBB60_16: ## %else14			; AVX2-NEXT: LBB60_16: ## %else14
	; AVX2-NEXT: vpextrb $8, %xmm0, %eax			; AVX2-NEXT: vpextrb $8, %xmm0, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB60_18			; AVX2-NEXT: je LBB60_18
	; AVX2-NEXT: ## BB#17: ## %cond.store15			; AVX2-NEXT: ## BB#17: ## %cond.store15
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm2			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm2
	; AVX2-NEXT: vmovd %xmm2, %eax			; AVX2-NEXT: vpextrw $0, %xmm2, 16(%rdi)
	; AVX2-NEXT: movw %ax, 16(%rdi)
	; AVX2-NEXT: LBB60_18: ## %else16			; AVX2-NEXT: LBB60_18: ## %else16
	; AVX2-NEXT: vpextrb $9, %xmm0, %eax			; AVX2-NEXT: vpextrb $9, %xmm0, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB60_20			; AVX2-NEXT: je LBB60_20
	; AVX2-NEXT: ## BB#19: ## %cond.store17			; AVX2-NEXT: ## BB#19: ## %cond.store17
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm2			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm2
	; AVX2-NEXT: vpextrw $1, %xmm2, 18(%rdi)			; AVX2-NEXT: vpextrw $1, %xmm2, 18(%rdi)
	; AVX2-NEXT: LBB60_20: ## %else18			; AVX2-NEXT: LBB60_20: ## %else18
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	; AVX512F-NEXT: vpslld $31, %zmm0, %zmm0			; AVX512F-NEXT: vpslld $31, %zmm0, %zmm0
	; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k0			; AVX512F-NEXT: vptestmd %zmm0, %zmm0, %k0
	; AVX512F-NEXT: kshiftlw $15, %k0, %k1			; AVX512F-NEXT: kshiftlw $15, %k0, %k1
	; AVX512F-NEXT: kshiftrw $15, %k1, %k1			; AVX512F-NEXT: kshiftrw $15, %k1, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb %al, %al			; AVX512F-NEXT: testb %al, %al
	; AVX512F-NEXT: je LBB60_2			; AVX512F-NEXT: je LBB60_2
	; AVX512F-NEXT: ## BB#1: ## %cond.store			; AVX512F-NEXT: ## BB#1: ## %cond.store
	; AVX512F-NEXT: vmovd %xmm1, %eax			; AVX512F-NEXT: vpextrw $0, %xmm1, (%rdi)
	; AVX512F-NEXT: movw %ax, (%rdi)
	; AVX512F-NEXT: LBB60_2: ## %else			; AVX512F-NEXT: LBB60_2: ## %else
	; AVX512F-NEXT: kshiftlw $14, %k0, %k1			; AVX512F-NEXT: kshiftlw $14, %k0, %k1
	; AVX512F-NEXT: kshiftrw $15, %k1, %k1			; AVX512F-NEXT: kshiftrw $15, %k1, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb %al, %al			; AVX512F-NEXT: testb %al, %al
	; AVX512F-NEXT: je LBB60_4			; AVX512F-NEXT: je LBB60_4
	; AVX512F-NEXT: ## BB#3: ## %cond.store1			; AVX512F-NEXT: ## BB#3: ## %cond.store1
	; AVX512F-NEXT: vpextrw $1, %xmm1, 2(%rdi)			; AVX512F-NEXT: vpextrw $1, %xmm1, 2(%rdi)
	▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
	; AVX512F-NEXT: LBB60_16: ## %else14			; AVX512F-NEXT: LBB60_16: ## %else14
	; AVX512F-NEXT: kshiftlw $7, %k0, %k1			; AVX512F-NEXT: kshiftlw $7, %k0, %k1
	; AVX512F-NEXT: kshiftrw $15, %k1, %k1			; AVX512F-NEXT: kshiftrw $15, %k1, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb %al, %al			; AVX512F-NEXT: testb %al, %al
	; AVX512F-NEXT: je LBB60_18			; AVX512F-NEXT: je LBB60_18
	; AVX512F-NEXT: ## BB#17: ## %cond.store15			; AVX512F-NEXT: ## BB#17: ## %cond.store15
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm0			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm0
	; AVX512F-NEXT: vmovd %xmm0, %eax			; AVX512F-NEXT: vpextrw $0, %xmm0, 16(%rdi)
	; AVX512F-NEXT: movw %ax, 16(%rdi)
	; AVX512F-NEXT: LBB60_18: ## %else16			; AVX512F-NEXT: LBB60_18: ## %else16
	; AVX512F-NEXT: kshiftlw $6, %k0, %k1			; AVX512F-NEXT: kshiftlw $6, %k0, %k1
	; AVX512F-NEXT: kshiftrw $15, %k1, %k1			; AVX512F-NEXT: kshiftrw $15, %k1, %k1
	; AVX512F-NEXT: kmovw %k1, %eax			; AVX512F-NEXT: kmovw %k1, %eax
	; AVX512F-NEXT: testb %al, %al			; AVX512F-NEXT: testb %al, %al
	; AVX512F-NEXT: je LBB60_20			; AVX512F-NEXT: je LBB60_20
	; AVX512F-NEXT: ## BB#19: ## %cond.store17			; AVX512F-NEXT: ## BB#19: ## %cond.store17
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm0			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm0
	▲ Show 20 Lines • Show All 68 Lines • ▼ Show 20 Lines

	define void @test_mask_store_32xi16(<32 x i1> %mask, <32 x i16>* %addr, <32 x i16> %val) {			define void @test_mask_store_32xi16(<32 x i1> %mask, <32 x i16>* %addr, <32 x i16> %val) {
	; AVX1-LABEL: test_mask_store_32xi16:			; AVX1-LABEL: test_mask_store_32xi16:
	; AVX1: ## BB#0:			; AVX1: ## BB#0:
	; AVX1-NEXT: vpextrb $0, %xmm0, %eax			; AVX1-NEXT: vpextrb $0, %xmm0, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB61_2			; AVX1-NEXT: je LBB61_2
	; AVX1-NEXT: ## BB#1: ## %cond.store			; AVX1-NEXT: ## BB#1: ## %cond.store
	; AVX1-NEXT: vmovd %xmm1, %eax			; AVX1-NEXT: vpextrw $0, %xmm1, (%rdi)
	; AVX1-NEXT: movw %ax, (%rdi)
	; AVX1-NEXT: LBB61_2: ## %else			; AVX1-NEXT: LBB61_2: ## %else
	; AVX1-NEXT: vpextrb $1, %xmm0, %eax			; AVX1-NEXT: vpextrb $1, %xmm0, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB61_4			; AVX1-NEXT: je LBB61_4
	; AVX1-NEXT: ## BB#3: ## %cond.store1			; AVX1-NEXT: ## BB#3: ## %cond.store1
	; AVX1-NEXT: vpextrw $1, %xmm1, 2(%rdi)			; AVX1-NEXT: vpextrw $1, %xmm1, 2(%rdi)
	; AVX1-NEXT: LBB61_4: ## %else2			; AVX1-NEXT: LBB61_4: ## %else2
	; AVX1-NEXT: vpextrb $2, %xmm0, %eax			; AVX1-NEXT: vpextrb $2, %xmm0, %eax
	Show All 32 Lines
	; AVX1-NEXT: ## BB#15: ## %cond.store13			; AVX1-NEXT: ## BB#15: ## %cond.store13
	; AVX1-NEXT: vpextrw $7, %xmm1, 14(%rdi)			; AVX1-NEXT: vpextrw $7, %xmm1, 14(%rdi)
	; AVX1-NEXT: LBB61_16: ## %else14			; AVX1-NEXT: LBB61_16: ## %else14
	; AVX1-NEXT: vpextrb $8, %xmm0, %eax			; AVX1-NEXT: vpextrb $8, %xmm0, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB61_18			; AVX1-NEXT: je LBB61_18
	; AVX1-NEXT: ## BB#17: ## %cond.store15			; AVX1-NEXT: ## BB#17: ## %cond.store15
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; AVX1-NEXT: vmovd %xmm3, %eax			; AVX1-NEXT: vpextrw $0, %xmm3, 16(%rdi)
	; AVX1-NEXT: movw %ax, 16(%rdi)
	; AVX1-NEXT: LBB61_18: ## %else16			; AVX1-NEXT: LBB61_18: ## %else16
	; AVX1-NEXT: vpextrb $9, %xmm0, %eax			; AVX1-NEXT: vpextrb $9, %xmm0, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB61_20			; AVX1-NEXT: je LBB61_20
	; AVX1-NEXT: ## BB#19: ## %cond.store17			; AVX1-NEXT: ## BB#19: ## %cond.store17
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
	; AVX1-NEXT: vpextrw $1, %xmm3, 18(%rdi)			; AVX1-NEXT: vpextrw $1, %xmm3, 18(%rdi)
	; AVX1-NEXT: LBB61_20: ## %else18			; AVX1-NEXT: LBB61_20: ## %else18
	Show All 39 Lines
	; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm1
	; AVX1-NEXT: vpextrw $7, %xmm1, 30(%rdi)			; AVX1-NEXT: vpextrw $7, %xmm1, 30(%rdi)
	; AVX1-NEXT: LBB61_32: ## %else30			; AVX1-NEXT: LBB61_32: ## %else30
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: vpextrb $0, %xmm0, %eax			; AVX1-NEXT: vpextrb $0, %xmm0, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB61_34			; AVX1-NEXT: je LBB61_34
	; AVX1-NEXT: ## BB#33: ## %cond.store31			; AVX1-NEXT: ## BB#33: ## %cond.store31
	; AVX1-NEXT: vmovd %xmm2, %eax			; AVX1-NEXT: vpextrw $0, %xmm2, 32(%rdi)
	; AVX1-NEXT: movw %ax, 32(%rdi)
	; AVX1-NEXT: LBB61_34: ## %else32			; AVX1-NEXT: LBB61_34: ## %else32
	; AVX1-NEXT: vpextrb $1, %xmm0, %eax			; AVX1-NEXT: vpextrb $1, %xmm0, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB61_36			; AVX1-NEXT: je LBB61_36
	; AVX1-NEXT: ## BB#35: ## %cond.store33			; AVX1-NEXT: ## BB#35: ## %cond.store33
	; AVX1-NEXT: vpextrw $1, %xmm2, 34(%rdi)			; AVX1-NEXT: vpextrw $1, %xmm2, 34(%rdi)
	; AVX1-NEXT: LBB61_36: ## %else34			; AVX1-NEXT: LBB61_36: ## %else34
	; AVX1-NEXT: vpextrb $2, %xmm0, %eax			; AVX1-NEXT: vpextrb $2, %xmm0, %eax
	Show All 32 Lines
	; AVX1-NEXT: ## BB#47: ## %cond.store45			; AVX1-NEXT: ## BB#47: ## %cond.store45
	; AVX1-NEXT: vpextrw $7, %xmm2, 46(%rdi)			; AVX1-NEXT: vpextrw $7, %xmm2, 46(%rdi)
	; AVX1-NEXT: LBB61_48: ## %else46			; AVX1-NEXT: LBB61_48: ## %else46
	; AVX1-NEXT: vpextrb $8, %xmm0, %eax			; AVX1-NEXT: vpextrb $8, %xmm0, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB61_50			; AVX1-NEXT: je LBB61_50
	; AVX1-NEXT: ## BB#49: ## %cond.store47			; AVX1-NEXT: ## BB#49: ## %cond.store47
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm1
	; AVX1-NEXT: vmovd %xmm1, %eax			; AVX1-NEXT: vpextrw $0, %xmm1, 48(%rdi)
	; AVX1-NEXT: movw %ax, 48(%rdi)
	; AVX1-NEXT: LBB61_50: ## %else48			; AVX1-NEXT: LBB61_50: ## %else48
	; AVX1-NEXT: vpextrb $9, %xmm0, %eax			; AVX1-NEXT: vpextrb $9, %xmm0, %eax
	; AVX1-NEXT: testb $1, %al			; AVX1-NEXT: testb $1, %al
	; AVX1-NEXT: je LBB61_52			; AVX1-NEXT: je LBB61_52
	; AVX1-NEXT: ## BB#51: ## %cond.store49			; AVX1-NEXT: ## BB#51: ## %cond.store49
	; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm1
	; AVX1-NEXT: vpextrw $1, %xmm1, 50(%rdi)			; AVX1-NEXT: vpextrw $1, %xmm1, 50(%rdi)
	; AVX1-NEXT: LBB61_52: ## %else50			; AVX1-NEXT: LBB61_52: ## %else50
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_mask_store_32xi16:			; AVX2-LABEL: test_mask_store_32xi16:
	; AVX2: ## BB#0:			; AVX2: ## BB#0:
	; AVX2-NEXT: vpextrb $0, %xmm0, %eax			; AVX2-NEXT: vpextrb $0, %xmm0, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB61_2			; AVX2-NEXT: je LBB61_2
	; AVX2-NEXT: ## BB#1: ## %cond.store			; AVX2-NEXT: ## BB#1: ## %cond.store
	; AVX2-NEXT: vmovd %xmm1, %eax			; AVX2-NEXT: vpextrw $0, %xmm1, (%rdi)
	; AVX2-NEXT: movw %ax, (%rdi)
	; AVX2-NEXT: LBB61_2: ## %else			; AVX2-NEXT: LBB61_2: ## %else
	; AVX2-NEXT: vpextrb $1, %xmm0, %eax			; AVX2-NEXT: vpextrb $1, %xmm0, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB61_4			; AVX2-NEXT: je LBB61_4
	; AVX2-NEXT: ## BB#3: ## %cond.store1			; AVX2-NEXT: ## BB#3: ## %cond.store1
	; AVX2-NEXT: vpextrw $1, %xmm1, 2(%rdi)			; AVX2-NEXT: vpextrw $1, %xmm1, 2(%rdi)
	; AVX2-NEXT: LBB61_4: ## %else2			; AVX2-NEXT: LBB61_4: ## %else2
	; AVX2-NEXT: vpextrb $2, %xmm0, %eax			; AVX2-NEXT: vpextrb $2, %xmm0, %eax
	Show All 32 Lines
	; AVX2-NEXT: ## BB#15: ## %cond.store13			; AVX2-NEXT: ## BB#15: ## %cond.store13
	; AVX2-NEXT: vpextrw $7, %xmm1, 14(%rdi)			; AVX2-NEXT: vpextrw $7, %xmm1, 14(%rdi)
	; AVX2-NEXT: LBB61_16: ## %else14			; AVX2-NEXT: LBB61_16: ## %else14
	; AVX2-NEXT: vpextrb $8, %xmm0, %eax			; AVX2-NEXT: vpextrb $8, %xmm0, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB61_18			; AVX2-NEXT: je LBB61_18
	; AVX2-NEXT: ## BB#17: ## %cond.store15			; AVX2-NEXT: ## BB#17: ## %cond.store15
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm3			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm3
	; AVX2-NEXT: vmovd %xmm3, %eax			; AVX2-NEXT: vpextrw $0, %xmm3, 16(%rdi)
	; AVX2-NEXT: movw %ax, 16(%rdi)
	; AVX2-NEXT: LBB61_18: ## %else16			; AVX2-NEXT: LBB61_18: ## %else16
	; AVX2-NEXT: vpextrb $9, %xmm0, %eax			; AVX2-NEXT: vpextrb $9, %xmm0, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB61_20			; AVX2-NEXT: je LBB61_20
	; AVX2-NEXT: ## BB#19: ## %cond.store17			; AVX2-NEXT: ## BB#19: ## %cond.store17
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm3			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm3
	; AVX2-NEXT: vpextrw $1, %xmm3, 18(%rdi)			; AVX2-NEXT: vpextrw $1, %xmm3, 18(%rdi)
	; AVX2-NEXT: LBB61_20: ## %else18			; AVX2-NEXT: LBB61_20: ## %else18
	Show All 39 Lines
	; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX2-NEXT: vpextrw $7, %xmm1, 30(%rdi)			; AVX2-NEXT: vpextrw $7, %xmm1, 30(%rdi)
	; AVX2-NEXT: LBB61_32: ## %else30			; AVX2-NEXT: LBB61_32: ## %else30
	; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0			; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX2-NEXT: vpextrb $0, %xmm0, %eax			; AVX2-NEXT: vpextrb $0, %xmm0, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB61_34			; AVX2-NEXT: je LBB61_34
	; AVX2-NEXT: ## BB#33: ## %cond.store31			; AVX2-NEXT: ## BB#33: ## %cond.store31
	; AVX2-NEXT: vmovd %xmm2, %eax			; AVX2-NEXT: vpextrw $0, %xmm2, 32(%rdi)
	; AVX2-NEXT: movw %ax, 32(%rdi)
	; AVX2-NEXT: LBB61_34: ## %else32			; AVX2-NEXT: LBB61_34: ## %else32
	; AVX2-NEXT: vpextrb $1, %xmm0, %eax			; AVX2-NEXT: vpextrb $1, %xmm0, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB61_36			; AVX2-NEXT: je LBB61_36
	; AVX2-NEXT: ## BB#35: ## %cond.store33			; AVX2-NEXT: ## BB#35: ## %cond.store33
	; AVX2-NEXT: vpextrw $1, %xmm2, 34(%rdi)			; AVX2-NEXT: vpextrw $1, %xmm2, 34(%rdi)
	; AVX2-NEXT: LBB61_36: ## %else34			; AVX2-NEXT: LBB61_36: ## %else34
	; AVX2-NEXT: vpextrb $2, %xmm0, %eax			; AVX2-NEXT: vpextrb $2, %xmm0, %eax
	Show All 32 Lines
	; AVX2-NEXT: ## BB#47: ## %cond.store45			; AVX2-NEXT: ## BB#47: ## %cond.store45
	; AVX2-NEXT: vpextrw $7, %xmm2, 46(%rdi)			; AVX2-NEXT: vpextrw $7, %xmm2, 46(%rdi)
	; AVX2-NEXT: LBB61_48: ## %else46			; AVX2-NEXT: LBB61_48: ## %else46
	; AVX2-NEXT: vpextrb $8, %xmm0, %eax			; AVX2-NEXT: vpextrb $8, %xmm0, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB61_50			; AVX2-NEXT: je LBB61_50
	; AVX2-NEXT: ## BB#49: ## %cond.store47			; AVX2-NEXT: ## BB#49: ## %cond.store47
	; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm1
	; AVX2-NEXT: vmovd %xmm1, %eax			; AVX2-NEXT: vpextrw $0, %xmm1, 48(%rdi)
	; AVX2-NEXT: movw %ax, 48(%rdi)
	; AVX2-NEXT: LBB61_50: ## %else48			; AVX2-NEXT: LBB61_50: ## %else48
	; AVX2-NEXT: vpextrb $9, %xmm0, %eax			; AVX2-NEXT: vpextrb $9, %xmm0, %eax
	; AVX2-NEXT: testb $1, %al			; AVX2-NEXT: testb $1, %al
	; AVX2-NEXT: je LBB61_52			; AVX2-NEXT: je LBB61_52
	; AVX2-NEXT: ## BB#51: ## %cond.store49			; AVX2-NEXT: ## BB#51: ## %cond.store49
	; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm1			; AVX2-NEXT: vextracti128 $1, %ymm2, %xmm1
	; AVX2-NEXT: vpextrw $1, %xmm1, 50(%rdi)			; AVX2-NEXT: vpextrw $1, %xmm1, 50(%rdi)
	; AVX2-NEXT: LBB61_52: ## %else50			; AVX2-NEXT: LBB61_52: ## %else50
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512F-LABEL: test_mask_store_32xi16:			; AVX512F-LABEL: test_mask_store_32xi16:
	; AVX512F: ## BB#0:			; AVX512F: ## BB#0:
	; AVX512F-NEXT: vpextrb $0, %xmm0, %eax			; AVX512F-NEXT: vpextrb $0, %xmm0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je LBB61_2			; AVX512F-NEXT: je LBB61_2
	; AVX512F-NEXT: ## BB#1: ## %cond.store			; AVX512F-NEXT: ## BB#1: ## %cond.store
	; AVX512F-NEXT: vmovd %xmm1, %eax			; AVX512F-NEXT: vpextrw $0, %xmm1, (%rdi)
	; AVX512F-NEXT: movw %ax, (%rdi)
	; AVX512F-NEXT: LBB61_2: ## %else			; AVX512F-NEXT: LBB61_2: ## %else
	; AVX512F-NEXT: vpextrb $1, %xmm0, %eax			; AVX512F-NEXT: vpextrb $1, %xmm0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je LBB61_4			; AVX512F-NEXT: je LBB61_4
	; AVX512F-NEXT: ## BB#3: ## %cond.store1			; AVX512F-NEXT: ## BB#3: ## %cond.store1
	; AVX512F-NEXT: vpextrw $1, %xmm1, 2(%rdi)			; AVX512F-NEXT: vpextrw $1, %xmm1, 2(%rdi)
	; AVX512F-NEXT: LBB61_4: ## %else2			; AVX512F-NEXT: LBB61_4: ## %else2
	; AVX512F-NEXT: vpextrb $2, %xmm0, %eax			; AVX512F-NEXT: vpextrb $2, %xmm0, %eax
	Show All 32 Lines
	; AVX512F-NEXT: ## BB#15: ## %cond.store13			; AVX512F-NEXT: ## BB#15: ## %cond.store13
	; AVX512F-NEXT: vpextrw $7, %xmm1, 14(%rdi)			; AVX512F-NEXT: vpextrw $7, %xmm1, 14(%rdi)
	; AVX512F-NEXT: LBB61_16: ## %else14			; AVX512F-NEXT: LBB61_16: ## %else14
	; AVX512F-NEXT: vpextrb $8, %xmm0, %eax			; AVX512F-NEXT: vpextrb $8, %xmm0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je LBB61_18			; AVX512F-NEXT: je LBB61_18
	; AVX512F-NEXT: ## BB#17: ## %cond.store15			; AVX512F-NEXT: ## BB#17: ## %cond.store15
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm3			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm3
	; AVX512F-NEXT: vmovd %xmm3, %eax			; AVX512F-NEXT: vpextrw $0, %xmm3, 16(%rdi)
	; AVX512F-NEXT: movw %ax, 16(%rdi)
	; AVX512F-NEXT: LBB61_18: ## %else16			; AVX512F-NEXT: LBB61_18: ## %else16
	; AVX512F-NEXT: vpextrb $9, %xmm0, %eax			; AVX512F-NEXT: vpextrb $9, %xmm0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je LBB61_20			; AVX512F-NEXT: je LBB61_20
	; AVX512F-NEXT: ## BB#19: ## %cond.store17			; AVX512F-NEXT: ## BB#19: ## %cond.store17
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm3			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm3
	; AVX512F-NEXT: vpextrw $1, %xmm3, 18(%rdi)			; AVX512F-NEXT: vpextrw $1, %xmm3, 18(%rdi)
	; AVX512F-NEXT: LBB61_20: ## %else18			; AVX512F-NEXT: LBB61_20: ## %else18
	Show All 39 Lines
	; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm1, %xmm1
	; AVX512F-NEXT: vpextrw $7, %xmm1, 30(%rdi)			; AVX512F-NEXT: vpextrw $7, %xmm1, 30(%rdi)
	; AVX512F-NEXT: LBB61_32: ## %else30			; AVX512F-NEXT: LBB61_32: ## %else30
	; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm0			; AVX512F-NEXT: vextracti128 $1, %ymm0, %xmm0
	; AVX512F-NEXT: vpextrb $0, %xmm0, %eax			; AVX512F-NEXT: vpextrb $0, %xmm0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je LBB61_34			; AVX512F-NEXT: je LBB61_34
	; AVX512F-NEXT: ## BB#33: ## %cond.store31			; AVX512F-NEXT: ## BB#33: ## %cond.store31
	; AVX512F-NEXT: vmovd %xmm2, %eax			; AVX512F-NEXT: vpextrw $0, %xmm2, 32(%rdi)
	; AVX512F-NEXT: movw %ax, 32(%rdi)
	; AVX512F-NEXT: LBB61_34: ## %else32			; AVX512F-NEXT: LBB61_34: ## %else32
	; AVX512F-NEXT: vpextrb $1, %xmm0, %eax			; AVX512F-NEXT: vpextrb $1, %xmm0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je LBB61_36			; AVX512F-NEXT: je LBB61_36
	; AVX512F-NEXT: ## BB#35: ## %cond.store33			; AVX512F-NEXT: ## BB#35: ## %cond.store33
	; AVX512F-NEXT: vpextrw $1, %xmm2, 34(%rdi)			; AVX512F-NEXT: vpextrw $1, %xmm2, 34(%rdi)
	; AVX512F-NEXT: LBB61_36: ## %else34			; AVX512F-NEXT: LBB61_36: ## %else34
	; AVX512F-NEXT: vpextrb $2, %xmm0, %eax			; AVX512F-NEXT: vpextrb $2, %xmm0, %eax
	Show All 32 Lines
	; AVX512F-NEXT: ## BB#47: ## %cond.store45			; AVX512F-NEXT: ## BB#47: ## %cond.store45
	; AVX512F-NEXT: vpextrw $7, %xmm2, 46(%rdi)			; AVX512F-NEXT: vpextrw $7, %xmm2, 46(%rdi)
	; AVX512F-NEXT: LBB61_48: ## %else46			; AVX512F-NEXT: LBB61_48: ## %else46
	; AVX512F-NEXT: vpextrb $8, %xmm0, %eax			; AVX512F-NEXT: vpextrb $8, %xmm0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je LBB61_50			; AVX512F-NEXT: je LBB61_50
	; AVX512F-NEXT: ## BB#49: ## %cond.store47			; AVX512F-NEXT: ## BB#49: ## %cond.store47
	; AVX512F-NEXT: vextracti128 $1, %ymm2, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm2, %xmm1
	; AVX512F-NEXT: vmovd %xmm1, %eax			; AVX512F-NEXT: vpextrw $0, %xmm1, 48(%rdi)
	; AVX512F-NEXT: movw %ax, 48(%rdi)
	; AVX512F-NEXT: LBB61_50: ## %else48			; AVX512F-NEXT: LBB61_50: ## %else48
	; AVX512F-NEXT: vpextrb $9, %xmm0, %eax			; AVX512F-NEXT: vpextrb $9, %xmm0, %eax
	; AVX512F-NEXT: testb $1, %al			; AVX512F-NEXT: testb $1, %al
	; AVX512F-NEXT: je LBB61_52			; AVX512F-NEXT: je LBB61_52
	; AVX512F-NEXT: ## BB#51: ## %cond.store49			; AVX512F-NEXT: ## BB#51: ## %cond.store49
	; AVX512F-NEXT: vextracti128 $1, %ymm2, %xmm1			; AVX512F-NEXT: vextracti128 $1, %ymm2, %xmm1
	; AVX512F-NEXT: vpextrw $1, %xmm1, 50(%rdi)			; AVX512F-NEXT: vpextrw $1, %xmm1, 50(%rdi)
	; AVX512F-NEXT: LBB61_52: ## %else50			; AVX512F-NEXT: LBB61_52: ## %else50
	▲ Show 20 Lines • Show All 55 Lines • Show Last 20 Lines

test/CodeGen/X86/trunc-ext-ld-st.ll

	Show All 19 Lines
	; SSE2-NEXT: movw %ax, (%rdi)			; SSE2-NEXT: movw %ax, (%rdi)
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: load_2_i8:			; SSE41-LABEL: load_2_i8:
	; SSE41: # BB#0:			; SSE41: # BB#0:
	; SSE41-NEXT: pmovzxbq {{.*#+}} xmm0 = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero			; SSE41-NEXT: pmovzxbq {{.*#+}} xmm0 = mem[0],zero,zero,zero,zero,zero,zero,zero,mem[1],zero,zero,zero,zero,zero,zero,zero
	; SSE41-NEXT: paddq {{.*}}(%rip), %xmm0			; SSE41-NEXT: paddq {{.*}}(%rip), %xmm0
	; SSE41-NEXT: pshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]			; SSE41-NEXT: pshufb {{.*#+}} xmm0 = xmm0[0,8,u,u,u,u,u,u,u,u,u,u,u,u,u,u]
	; SSE41-NEXT: movd %xmm0, %eax			; SSE41-NEXT: pextrw $0, %xmm0, (%rdi)
	; SSE41-NEXT: movw %ax, (%rdi)
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	%T = load <2 x i8>, <2 x i8>* %A			%T = load <2 x i8>, <2 x i8>* %A
	%G = add <2 x i8> %T, <i8 9, i8 7>			%G = add <2 x i8> %T, <i8 9, i8 7>
	store <2 x i8> %G, <2 x i8>* %A			store <2 x i8> %G, <2 x i8>* %A
	ret void			ret void
	}			}

	; Read 32-bits			; Read 32-bits
	▲ Show 20 Lines • Show All 123 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-shift-ashr-128.ll

Show First 20 Lines • Show All 693 Lines • ▼ Show 20 Lines	; X32-SSE-NEXT: retl
%splat = shufflevector <4 x i32> %b, <4 x i32> undef, <4 x i32> zeroinitializer		%splat = shufflevector <4 x i32> %b, <4 x i32> undef, <4 x i32> zeroinitializer
%shift = ashr <4 x i32> %a, %splat		%shift = ashr <4 x i32> %a, %splat
ret <4 x i32> %shift		ret <4 x i32> %shift
}		}

define <8 x i16> @splatvar_shift_v8i16(<8 x i16> %a, <8 x i16> %b) nounwind {		define <8 x i16> @splatvar_shift_v8i16(<8 x i16> %a, <8 x i16> %b) nounwind {
; SSE2-LABEL: splatvar_shift_v8i16:		; SSE2-LABEL: splatvar_shift_v8i16:
; SSE2: # BB#0:		; SSE2: # BB#0:
; SSE2-NEXT: movd %xmm1, %eax		; SSE2-NEXT: pextrw $0, %xmm1, %eax
; SSE2-NEXT: movzwl %ax, %eax
; SSE2-NEXT: movd %eax, %xmm1		; SSE2-NEXT: movd %eax, %xmm1
; SSE2-NEXT: psraw %xmm1, %xmm0		; SSE2-NEXT: psraw %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: splatvar_shift_v8i16:		; SSE41-LABEL: splatvar_shift_v8i16:
; SSE41: # BB#0:		; SSE41: # BB#0:
; SSE41-NEXT: pxor %xmm2, %xmm2		; SSE41-NEXT: pxor %xmm2, %xmm2
; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3,4,5,6,7]		; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3,4,5,6,7]
Show All 18 Lines
; AVX512: ## BB#0:		; AVX512: ## BB#0:
; AVX512-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1,2,3,4,5,6,7]		; AVX512-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1,2,3,4,5,6,7]
; AVX512-NEXT: vpsraw %xmm1, %xmm0, %xmm0		; AVX512-NEXT: vpsraw %xmm1, %xmm0, %xmm0
; AVX512-NEXT: retq		; AVX512-NEXT: retq
;		;
; X32-SSE-LABEL: splatvar_shift_v8i16:		; X32-SSE-LABEL: splatvar_shift_v8i16:
; X32-SSE: # BB#0:		; X32-SSE: # BB#0:
; X32-SSE-NEXT: movd %xmm1, %eax		; X32-SSE-NEXT: pextrw $0, %xmm1, %eax
; X32-SSE-NEXT: movzwl %ax, %eax
; X32-SSE-NEXT: movd %eax, %xmm1		; X32-SSE-NEXT: movd %eax, %xmm1
; X32-SSE-NEXT: psraw %xmm1, %xmm0		; X32-SSE-NEXT: psraw %xmm1, %xmm0
; X32-SSE-NEXT: retl		; X32-SSE-NEXT: retl
%splat = shufflevector <8 x i16> %b, <8 x i16> undef, <8 x i32> zeroinitializer		%splat = shufflevector <8 x i16> %b, <8 x i16> undef, <8 x i32> zeroinitializer
%shift = ashr <8 x i16> %a, %splat		%shift = ashr <8 x i16> %a, %splat
ret <8 x i16> %shift		ret <8 x i16> %shift
}		}

▲ Show 20 Lines • Show All 908 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-shift-ashr-256.ll

Show First 20 Lines • Show All 467 Lines • ▼ Show 20 Lines	; AVX512-NEXT: retq
%shift = ashr <8 x i32> %a, %splat		%shift = ashr <8 x i32> %a, %splat
ret <8 x i32> %shift		ret <8 x i32> %shift
}		}

define <16 x i16> @splatvar_shift_v16i16(<16 x i16> %a, <16 x i16> %b) nounwind {		define <16 x i16> @splatvar_shift_v16i16(<16 x i16> %a, <16 x i16> %b) nounwind {
; AVX1-LABEL: splatvar_shift_v16i16:		; AVX1-LABEL: splatvar_shift_v16i16:
; AVX1: # BB#0:		; AVX1: # BB#0:
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-NEXT: vmovd %xmm1, %eax		; AVX1-NEXT: vpextrw $0, %xmm1, %eax
; AVX1-NEXT: movzwl %ax, %eax
; AVX1-NEXT: vmovd %eax, %xmm1		; AVX1-NEXT: vmovd %eax, %xmm1
; AVX1-NEXT: vpsraw %xmm1, %xmm2, %xmm2		; AVX1-NEXT: vpsraw %xmm1, %xmm2, %xmm2
; AVX1-NEXT: vpsraw %xmm1, %xmm0, %xmm0		; AVX1-NEXT: vpsraw %xmm1, %xmm0, %xmm0
; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0		; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: splatvar_shift_v16i16:		; AVX2-LABEL: splatvar_shift_v16i16:
; AVX2: # BB#0:		; AVX2: # BB#0:
; AVX2-NEXT: vmovd %xmm1, %eax		; AVX2-NEXT: vpextrw $0, %xmm1, %eax
; AVX2-NEXT: movzwl %ax, %eax
; AVX2-NEXT: vmovd %eax, %xmm1		; AVX2-NEXT: vmovd %eax, %xmm1
; AVX2-NEXT: vpsraw %xmm1, %ymm0, %ymm0		; AVX2-NEXT: vpsraw %xmm1, %ymm0, %ymm0
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; XOPAVX1-LABEL: splatvar_shift_v16i16:		; XOPAVX1-LABEL: splatvar_shift_v16i16:
; XOPAVX1: # BB#0:		; XOPAVX1: # BB#0:
; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm2		; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; XOPAVX1-NEXT: vmovd %xmm1, %eax		; XOPAVX1-NEXT: vpextrw $0, %xmm1, %eax
; XOPAVX1-NEXT: movzwl %ax, %eax
; XOPAVX1-NEXT: vmovd %eax, %xmm1		; XOPAVX1-NEXT: vmovd %eax, %xmm1
; XOPAVX1-NEXT: vpsraw %xmm1, %xmm2, %xmm2		; XOPAVX1-NEXT: vpsraw %xmm1, %xmm2, %xmm2
; XOPAVX1-NEXT: vpsraw %xmm1, %xmm0, %xmm0		; XOPAVX1-NEXT: vpsraw %xmm1, %xmm0, %xmm0
; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0		; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; XOPAVX1-NEXT: retq		; XOPAVX1-NEXT: retq
;		;
; XOPAVX2-LABEL: splatvar_shift_v16i16:		; XOPAVX2-LABEL: splatvar_shift_v16i16:
; XOPAVX2: # BB#0:		; XOPAVX2: # BB#0:
; XOPAVX2-NEXT: vmovd %xmm1, %eax		; XOPAVX2-NEXT: vpextrw $0, %xmm1, %eax
; XOPAVX2-NEXT: movzwl %ax, %eax
; XOPAVX2-NEXT: vmovd %eax, %xmm1		; XOPAVX2-NEXT: vmovd %eax, %xmm1
; XOPAVX2-NEXT: vpsraw %xmm1, %ymm0, %ymm0		; XOPAVX2-NEXT: vpsraw %xmm1, %ymm0, %ymm0
; XOPAVX2-NEXT: retq		; XOPAVX2-NEXT: retq
;		;
; AVX512-LABEL: splatvar_shift_v16i16:		; AVX512-LABEL: splatvar_shift_v16i16:
; AVX512: ## BB#0:		; AVX512: ## BB#0:
; AVX512-NEXT: vmovd %xmm1, %eax		; AVX512-NEXT: vpextrw $0, %xmm1, %eax
; AVX512-NEXT: movzwl %ax, %eax
; AVX512-NEXT: vmovd %eax, %xmm1		; AVX512-NEXT: vmovd %eax, %xmm1
; AVX512-NEXT: vpsraw %xmm1, %ymm0, %ymm0		; AVX512-NEXT: vpsraw %xmm1, %ymm0, %ymm0
; AVX512-NEXT: retq		; AVX512-NEXT: retq
%splat = shufflevector <16 x i16> %b, <16 x i16> undef, <16 x i32> zeroinitializer		%splat = shufflevector <16 x i16> %b, <16 x i16> undef, <16 x i32> zeroinitializer
%shift = ashr <16 x i16> %a, %splat		%shift = ashr <16 x i16> %a, %splat
ret <16 x i16> %shift		ret <16 x i16> %shift
}		}

▲ Show 20 Lines • Show All 618 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-shift-ashr-512.ll

Show First 20 Lines • Show All 134 Lines • ▼ Show 20 Lines	; ALL-NEXT: retq
%splat = shufflevector <16 x i32> %b, <16 x i32> undef, <16 x i32> zeroinitializer		%splat = shufflevector <16 x i32> %b, <16 x i32> undef, <16 x i32> zeroinitializer
%shift = ashr <16 x i32> %a, %splat		%shift = ashr <16 x i32> %a, %splat
ret <16 x i32> %shift		ret <16 x i32> %shift
}		}

define <32 x i16> @splatvar_shift_v32i16(<32 x i16> %a, <32 x i16> %b) nounwind {		define <32 x i16> @splatvar_shift_v32i16(<32 x i16> %a, <32 x i16> %b) nounwind {
; AVX512DQ-LABEL: splatvar_shift_v32i16:		; AVX512DQ-LABEL: splatvar_shift_v32i16:
; AVX512DQ: ## BB#0:		; AVX512DQ: ## BB#0:
; AVX512DQ-NEXT: vmovd %xmm2, %eax		; AVX512DQ-NEXT: vpextrw $0, %xmm2, %eax
; AVX512DQ-NEXT: movzwl %ax, %eax
; AVX512DQ-NEXT: vmovd %eax, %xmm2		; AVX512DQ-NEXT: vmovd %eax, %xmm2
; AVX512DQ-NEXT: vpsraw %xmm2, %ymm0, %ymm0		; AVX512DQ-NEXT: vpsraw %xmm2, %ymm0, %ymm0
; AVX512DQ-NEXT: vpsraw %xmm2, %ymm1, %ymm1		; AVX512DQ-NEXT: vpsraw %xmm2, %ymm1, %ymm1
; AVX512DQ-NEXT: retq		; AVX512DQ-NEXT: retq
;		;
; AVX512BW-LABEL: splatvar_shift_v32i16:		; AVX512BW-LABEL: splatvar_shift_v32i16:
; AVX512BW: ## BB#0:		; AVX512BW: ## BB#0:
; AVX512BW-NEXT: vmovd %xmm1, %eax		; AVX512BW-NEXT: vpextrw $0, %xmm1, %eax
; AVX512BW-NEXT: movzwl %ax, %eax
; AVX512BW-NEXT: vmovd %eax, %xmm1		; AVX512BW-NEXT: vmovd %eax, %xmm1
; AVX512BW-NEXT: vpsraw %xmm1, %zmm0, %zmm0		; AVX512BW-NEXT: vpsraw %xmm1, %zmm0, %zmm0
; AVX512BW-NEXT: retq		; AVX512BW-NEXT: retq
%splat = shufflevector <32 x i16> %b, <32 x i16> undef, <32 x i32> zeroinitializer		%splat = shufflevector <32 x i16> %b, <32 x i16> undef, <32 x i32> zeroinitializer
%shift = ashr <32 x i16> %a, %splat		%shift = ashr <32 x i16> %a, %splat
ret <32 x i16> %shift		ret <32 x i16> %shift
}		}

▲ Show 20 Lines • Show All 235 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-shift-lshr-128.ll

Show First 20 Lines • Show All 545 Lines • ▼ Show 20 Lines	; X32-SSE-NEXT: retl
%splat = shufflevector <4 x i32> %b, <4 x i32> undef, <4 x i32> zeroinitializer		%splat = shufflevector <4 x i32> %b, <4 x i32> undef, <4 x i32> zeroinitializer
%shift = lshr <4 x i32> %a, %splat		%shift = lshr <4 x i32> %a, %splat
ret <4 x i32> %shift		ret <4 x i32> %shift
}		}

define <8 x i16> @splatvar_shift_v8i16(<8 x i16> %a, <8 x i16> %b) nounwind {		define <8 x i16> @splatvar_shift_v8i16(<8 x i16> %a, <8 x i16> %b) nounwind {
; SSE2-LABEL: splatvar_shift_v8i16:		; SSE2-LABEL: splatvar_shift_v8i16:
; SSE2: # BB#0:		; SSE2: # BB#0:
; SSE2-NEXT: movd %xmm1, %eax		; SSE2-NEXT: pextrw $0, %xmm1, %eax
; SSE2-NEXT: movzwl %ax, %eax
; SSE2-NEXT: movd %eax, %xmm1		; SSE2-NEXT: movd %eax, %xmm1
; SSE2-NEXT: psrlw %xmm1, %xmm0		; SSE2-NEXT: psrlw %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: splatvar_shift_v8i16:		; SSE41-LABEL: splatvar_shift_v8i16:
; SSE41: # BB#0:		; SSE41: # BB#0:
; SSE41-NEXT: pxor %xmm2, %xmm2		; SSE41-NEXT: pxor %xmm2, %xmm2
; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3,4,5,6,7]		; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3,4,5,6,7]
Show All 18 Lines
; AVX512: ## BB#0:		; AVX512: ## BB#0:
; AVX512-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1,2,3,4,5,6,7]		; AVX512-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1,2,3,4,5,6,7]
; AVX512-NEXT: vpsrlw %xmm1, %xmm0, %xmm0		; AVX512-NEXT: vpsrlw %xmm1, %xmm0, %xmm0
; AVX512-NEXT: retq		; AVX512-NEXT: retq
;		;
; X32-SSE-LABEL: splatvar_shift_v8i16:		; X32-SSE-LABEL: splatvar_shift_v8i16:
; X32-SSE: # BB#0:		; X32-SSE: # BB#0:
; X32-SSE-NEXT: movd %xmm1, %eax		; X32-SSE-NEXT: pextrw $0, %xmm1, %eax
; X32-SSE-NEXT: movzwl %ax, %eax
; X32-SSE-NEXT: movd %eax, %xmm1		; X32-SSE-NEXT: movd %eax, %xmm1
; X32-SSE-NEXT: psrlw %xmm1, %xmm0		; X32-SSE-NEXT: psrlw %xmm1, %xmm0
; X32-SSE-NEXT: retl		; X32-SSE-NEXT: retl
%splat = shufflevector <8 x i16> %b, <8 x i16> undef, <8 x i32> zeroinitializer		%splat = shufflevector <8 x i16> %b, <8 x i16> undef, <8 x i32> zeroinitializer
%shift = lshr <8 x i16> %a, %splat		%shift = lshr <8 x i16> %a, %splat
ret <8 x i16> %shift		ret <8 x i16> %shift
}		}

▲ Show 20 Lines • Show All 654 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-shift-lshr-256.ll

Show First 20 Lines • Show All 378 Lines • ▼ Show 20 Lines	; AVX512-NEXT: retq
%shift = lshr <8 x i32> %a, %splat		%shift = lshr <8 x i32> %a, %splat
ret <8 x i32> %shift		ret <8 x i32> %shift
}		}

define <16 x i16> @splatvar_shift_v16i16(<16 x i16> %a, <16 x i16> %b) nounwind {		define <16 x i16> @splatvar_shift_v16i16(<16 x i16> %a, <16 x i16> %b) nounwind {
; AVX1-LABEL: splatvar_shift_v16i16:		; AVX1-LABEL: splatvar_shift_v16i16:
; AVX1: # BB#0:		; AVX1: # BB#0:
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-NEXT: vmovd %xmm1, %eax		; AVX1-NEXT: vpextrw $0, %xmm1, %eax
; AVX1-NEXT: movzwl %ax, %eax
; AVX1-NEXT: vmovd %eax, %xmm1		; AVX1-NEXT: vmovd %eax, %xmm1
; AVX1-NEXT: vpsrlw %xmm1, %xmm2, %xmm2		; AVX1-NEXT: vpsrlw %xmm1, %xmm2, %xmm2
; AVX1-NEXT: vpsrlw %xmm1, %xmm0, %xmm0		; AVX1-NEXT: vpsrlw %xmm1, %xmm0, %xmm0
; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0		; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: splatvar_shift_v16i16:		; AVX2-LABEL: splatvar_shift_v16i16:
; AVX2: # BB#0:		; AVX2: # BB#0:
; AVX2-NEXT: vmovd %xmm1, %eax		; AVX2-NEXT: vpextrw $0, %xmm1, %eax
; AVX2-NEXT: movzwl %ax, %eax
; AVX2-NEXT: vmovd %eax, %xmm1		; AVX2-NEXT: vmovd %eax, %xmm1
; AVX2-NEXT: vpsrlw %xmm1, %ymm0, %ymm0		; AVX2-NEXT: vpsrlw %xmm1, %ymm0, %ymm0
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; XOPAVX1-LABEL: splatvar_shift_v16i16:		; XOPAVX1-LABEL: splatvar_shift_v16i16:
; XOPAVX1: # BB#0:		; XOPAVX1: # BB#0:
; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm2		; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; XOPAVX1-NEXT: vmovd %xmm1, %eax		; XOPAVX1-NEXT: vpextrw $0, %xmm1, %eax
; XOPAVX1-NEXT: movzwl %ax, %eax
; XOPAVX1-NEXT: vmovd %eax, %xmm1		; XOPAVX1-NEXT: vmovd %eax, %xmm1
; XOPAVX1-NEXT: vpsrlw %xmm1, %xmm2, %xmm2		; XOPAVX1-NEXT: vpsrlw %xmm1, %xmm2, %xmm2
; XOPAVX1-NEXT: vpsrlw %xmm1, %xmm0, %xmm0		; XOPAVX1-NEXT: vpsrlw %xmm1, %xmm0, %xmm0
; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0		; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; XOPAVX1-NEXT: retq		; XOPAVX1-NEXT: retq
;		;
; XOPAVX2-LABEL: splatvar_shift_v16i16:		; XOPAVX2-LABEL: splatvar_shift_v16i16:
; XOPAVX2: # BB#0:		; XOPAVX2: # BB#0:
; XOPAVX2-NEXT: vmovd %xmm1, %eax		; XOPAVX2-NEXT: vpextrw $0, %xmm1, %eax
; XOPAVX2-NEXT: movzwl %ax, %eax
; XOPAVX2-NEXT: vmovd %eax, %xmm1		; XOPAVX2-NEXT: vmovd %eax, %xmm1
; XOPAVX2-NEXT: vpsrlw %xmm1, %ymm0, %ymm0		; XOPAVX2-NEXT: vpsrlw %xmm1, %ymm0, %ymm0
; XOPAVX2-NEXT: retq		; XOPAVX2-NEXT: retq
;		;
; AVX512-LABEL: splatvar_shift_v16i16:		; AVX512-LABEL: splatvar_shift_v16i16:
; AVX512: ## BB#0:		; AVX512: ## BB#0:
; AVX512-NEXT: vmovd %xmm1, %eax		; AVX512-NEXT: vpextrw $0, %xmm1, %eax
; AVX512-NEXT: movzwl %ax, %eax
; AVX512-NEXT: vmovd %eax, %xmm1		; AVX512-NEXT: vmovd %eax, %xmm1
; AVX512-NEXT: vpsrlw %xmm1, %ymm0, %ymm0		; AVX512-NEXT: vpsrlw %xmm1, %ymm0, %ymm0
; AVX512-NEXT: retq		; AVX512-NEXT: retq
%splat = shufflevector <16 x i16> %b, <16 x i16> undef, <16 x i32> zeroinitializer		%splat = shufflevector <16 x i16> %b, <16 x i16> undef, <16 x i32> zeroinitializer
%shift = lshr <16 x i16> %a, %splat		%shift = lshr <16 x i16> %a, %splat
ret <16 x i16> %shift		ret <16 x i16> %shift
}		}

▲ Show 20 Lines • Show All 494 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-shift-lshr-512.ll

Show First 20 Lines • Show All 115 Lines • ▼ Show 20 Lines	; ALL-NEXT: retq
%splat = shufflevector <16 x i32> %b, <16 x i32> undef, <16 x i32> zeroinitializer		%splat = shufflevector <16 x i32> %b, <16 x i32> undef, <16 x i32> zeroinitializer
%shift = lshr <16 x i32> %a, %splat		%shift = lshr <16 x i32> %a, %splat
ret <16 x i32> %shift		ret <16 x i32> %shift
}		}

define <32 x i16> @splatvar_shift_v32i16(<32 x i16> %a, <32 x i16> %b) nounwind {		define <32 x i16> @splatvar_shift_v32i16(<32 x i16> %a, <32 x i16> %b) nounwind {
; AVX512DQ-LABEL: splatvar_shift_v32i16:		; AVX512DQ-LABEL: splatvar_shift_v32i16:
; AVX512DQ: ## BB#0:		; AVX512DQ: ## BB#0:
; AVX512DQ-NEXT: vmovd %xmm2, %eax		; AVX512DQ-NEXT: vpextrw $0, %xmm2, %eax
; AVX512DQ-NEXT: movzwl %ax, %eax
; AVX512DQ-NEXT: vmovd %eax, %xmm2		; AVX512DQ-NEXT: vmovd %eax, %xmm2
; AVX512DQ-NEXT: vpsrlw %xmm2, %ymm0, %ymm0		; AVX512DQ-NEXT: vpsrlw %xmm2, %ymm0, %ymm0
; AVX512DQ-NEXT: vpsrlw %xmm2, %ymm1, %ymm1		; AVX512DQ-NEXT: vpsrlw %xmm2, %ymm1, %ymm1
; AVX512DQ-NEXT: retq		; AVX512DQ-NEXT: retq
;		;
; AVX512BW-LABEL: splatvar_shift_v32i16:		; AVX512BW-LABEL: splatvar_shift_v32i16:
; AVX512BW: ## BB#0:		; AVX512BW: ## BB#0:
; AVX512BW-NEXT: vmovd %xmm1, %eax		; AVX512BW-NEXT: vpextrw $0, %xmm1, %eax
; AVX512BW-NEXT: movzwl %ax, %eax
; AVX512BW-NEXT: vmovd %eax, %xmm1		; AVX512BW-NEXT: vmovd %eax, %xmm1
; AVX512BW-NEXT: vpsrlw %xmm1, %zmm0, %zmm0		; AVX512BW-NEXT: vpsrlw %xmm1, %zmm0, %zmm0
; AVX512BW-NEXT: retq		; AVX512BW-NEXT: retq
%splat = shufflevector <32 x i16> %b, <32 x i16> undef, <32 x i32> zeroinitializer		%splat = shufflevector <32 x i16> %b, <32 x i16> undef, <32 x i32> zeroinitializer
%shift = lshr <32 x i16> %a, %splat		%shift = lshr <32 x i16> %a, %splat
ret <32 x i16> %shift		ret <32 x i16> %shift
}		}

▲ Show 20 Lines • Show All 175 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-shift-shl-128.ll

Show First 20 Lines • Show All 493 Lines • ▼ Show 20 Lines	; X32-SSE-NEXT: retl
%splat = shufflevector <4 x i32> %b, <4 x i32> undef, <4 x i32> zeroinitializer		%splat = shufflevector <4 x i32> %b, <4 x i32> undef, <4 x i32> zeroinitializer
%shift = shl <4 x i32> %a, %splat		%shift = shl <4 x i32> %a, %splat
ret <4 x i32> %shift		ret <4 x i32> %shift
}		}

define <8 x i16> @splatvar_shift_v8i16(<8 x i16> %a, <8 x i16> %b) nounwind {		define <8 x i16> @splatvar_shift_v8i16(<8 x i16> %a, <8 x i16> %b) nounwind {
; SSE2-LABEL: splatvar_shift_v8i16:		; SSE2-LABEL: splatvar_shift_v8i16:
; SSE2: # BB#0:		; SSE2: # BB#0:
; SSE2-NEXT: movd %xmm1, %eax		; SSE2-NEXT: pextrw $0, %xmm1, %eax
; SSE2-NEXT: movzwl %ax, %eax
; SSE2-NEXT: movd %eax, %xmm1		; SSE2-NEXT: movd %eax, %xmm1
; SSE2-NEXT: psllw %xmm1, %xmm0		; SSE2-NEXT: psllw %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: splatvar_shift_v8i16:		; SSE41-LABEL: splatvar_shift_v8i16:
; SSE41: # BB#0:		; SSE41: # BB#0:
; SSE41-NEXT: pxor %xmm2, %xmm2		; SSE41-NEXT: pxor %xmm2, %xmm2
; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3,4,5,6,7]		; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3,4,5,6,7]
Show All 18 Lines
; AVX512: ## BB#0:		; AVX512: ## BB#0:
; AVX512-NEXT: vpxor %xmm2, %xmm2, %xmm2		; AVX512-NEXT: vpxor %xmm2, %xmm2, %xmm2
; AVX512-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1,2,3,4,5,6,7]		; AVX512-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1,2,3,4,5,6,7]
; AVX512-NEXT: vpsllw %xmm1, %xmm0, %xmm0		; AVX512-NEXT: vpsllw %xmm1, %xmm0, %xmm0
; AVX512-NEXT: retq		; AVX512-NEXT: retq
;		;
; X32-SSE-LABEL: splatvar_shift_v8i16:		; X32-SSE-LABEL: splatvar_shift_v8i16:
; X32-SSE: # BB#0:		; X32-SSE: # BB#0:
; X32-SSE-NEXT: movd %xmm1, %eax		; X32-SSE-NEXT: pextrw $0, %xmm1, %eax
; X32-SSE-NEXT: movzwl %ax, %eax
; X32-SSE-NEXT: movd %eax, %xmm1		; X32-SSE-NEXT: movd %eax, %xmm1
; X32-SSE-NEXT: psllw %xmm1, %xmm0		; X32-SSE-NEXT: psllw %xmm1, %xmm0
; X32-SSE-NEXT: retl		; X32-SSE-NEXT: retl
%splat = shufflevector <8 x i16> %b, <8 x i16> undef, <8 x i32> zeroinitializer		%splat = shufflevector <8 x i16> %b, <8 x i16> undef, <8 x i32> zeroinitializer
%shift = shl <8 x i16> %a, %splat		%shift = shl <8 x i16> %a, %splat
ret <8 x i16> %shift		ret <8 x i16> %shift
}		}

▲ Show 20 Lines • Show All 557 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-shift-shl-256.ll

Show First 20 Lines • Show All 342 Lines • ▼ Show 20 Lines	; AVX512-NEXT: retq
%shift = shl <8 x i32> %a, %splat		%shift = shl <8 x i32> %a, %splat
ret <8 x i32> %shift		ret <8 x i32> %shift
}		}

define <16 x i16> @splatvar_shift_v16i16(<16 x i16> %a, <16 x i16> %b) nounwind {		define <16 x i16> @splatvar_shift_v16i16(<16 x i16> %a, <16 x i16> %b) nounwind {
; AVX1-LABEL: splatvar_shift_v16i16:		; AVX1-LABEL: splatvar_shift_v16i16:
; AVX1: # BB#0:		; AVX1: # BB#0:
; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2		; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; AVX1-NEXT: vmovd %xmm1, %eax		; AVX1-NEXT: vpextrw $0, %xmm1, %eax
; AVX1-NEXT: movzwl %ax, %eax
; AVX1-NEXT: vmovd %eax, %xmm1		; AVX1-NEXT: vmovd %eax, %xmm1
; AVX1-NEXT: vpsllw %xmm1, %xmm2, %xmm2		; AVX1-NEXT: vpsllw %xmm1, %xmm2, %xmm2
; AVX1-NEXT: vpsllw %xmm1, %xmm0, %xmm0		; AVX1-NEXT: vpsllw %xmm1, %xmm0, %xmm0
; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0		; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX2-LABEL: splatvar_shift_v16i16:		; AVX2-LABEL: splatvar_shift_v16i16:
; AVX2: # BB#0:		; AVX2: # BB#0:
; AVX2-NEXT: vmovd %xmm1, %eax		; AVX2-NEXT: vpextrw $0, %xmm1, %eax
; AVX2-NEXT: movzwl %ax, %eax
; AVX2-NEXT: vmovd %eax, %xmm1		; AVX2-NEXT: vmovd %eax, %xmm1
; AVX2-NEXT: vpsllw %xmm1, %ymm0, %ymm0		; AVX2-NEXT: vpsllw %xmm1, %ymm0, %ymm0
; AVX2-NEXT: retq		; AVX2-NEXT: retq
;		;
; XOPAVX1-LABEL: splatvar_shift_v16i16:		; XOPAVX1-LABEL: splatvar_shift_v16i16:
; XOPAVX1: # BB#0:		; XOPAVX1: # BB#0:
; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm2		; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
; XOPAVX1-NEXT: vmovd %xmm1, %eax		; XOPAVX1-NEXT: vpextrw $0, %xmm1, %eax
; XOPAVX1-NEXT: movzwl %ax, %eax
; XOPAVX1-NEXT: vmovd %eax, %xmm1		; XOPAVX1-NEXT: vmovd %eax, %xmm1
; XOPAVX1-NEXT: vpsllw %xmm1, %xmm2, %xmm2		; XOPAVX1-NEXT: vpsllw %xmm1, %xmm2, %xmm2
; XOPAVX1-NEXT: vpsllw %xmm1, %xmm0, %xmm0		; XOPAVX1-NEXT: vpsllw %xmm1, %xmm0, %xmm0
; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0		; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
; XOPAVX1-NEXT: retq		; XOPAVX1-NEXT: retq
;		;
; XOPAVX2-LABEL: splatvar_shift_v16i16:		; XOPAVX2-LABEL: splatvar_shift_v16i16:
; XOPAVX2: # BB#0:		; XOPAVX2: # BB#0:
; XOPAVX2-NEXT: vmovd %xmm1, %eax		; XOPAVX2-NEXT: vpextrw $0, %xmm1, %eax
; XOPAVX2-NEXT: movzwl %ax, %eax
; XOPAVX2-NEXT: vmovd %eax, %xmm1		; XOPAVX2-NEXT: vmovd %eax, %xmm1
; XOPAVX2-NEXT: vpsllw %xmm1, %ymm0, %ymm0		; XOPAVX2-NEXT: vpsllw %xmm1, %ymm0, %ymm0
; XOPAVX2-NEXT: retq		; XOPAVX2-NEXT: retq
;		;
; AVX512-LABEL: splatvar_shift_v16i16:		; AVX512-LABEL: splatvar_shift_v16i16:
; AVX512: ## BB#0:		; AVX512: ## BB#0:
; AVX512-NEXT: vmovd %xmm1, %eax		; AVX512-NEXT: vpextrw $0, %xmm1, %eax
; AVX512-NEXT: movzwl %ax, %eax
; AVX512-NEXT: vmovd %eax, %xmm1		; AVX512-NEXT: vmovd %eax, %xmm1
; AVX512-NEXT: vpsllw %xmm1, %ymm0, %ymm0		; AVX512-NEXT: vpsllw %xmm1, %ymm0, %ymm0
; AVX512-NEXT: retq		; AVX512-NEXT: retq
%splat = shufflevector <16 x i16> %b, <16 x i16> undef, <16 x i32> zeroinitializer		%splat = shufflevector <16 x i16> %b, <16 x i16> undef, <16 x i32> zeroinitializer
%shift = shl <16 x i16> %a, %splat		%shift = shl <16 x i16> %a, %splat
ret <16 x i16> %shift		ret <16 x i16> %shift
}		}

▲ Show 20 Lines • Show All 434 Lines • Show Last 20 Lines

test/CodeGen/X86/vector-shift-shl-512.ll

Show First 20 Lines • Show All 111 Lines • ▼ Show 20 Lines	; ALL-NEXT: retq
%splat = shufflevector <16 x i32> %b, <16 x i32> undef, <16 x i32> zeroinitializer		%splat = shufflevector <16 x i32> %b, <16 x i32> undef, <16 x i32> zeroinitializer
%shift = shl <16 x i32> %a, %splat		%shift = shl <16 x i32> %a, %splat
ret <16 x i32> %shift		ret <16 x i32> %shift
}		}

define <32 x i16> @splatvar_shift_v32i16(<32 x i16> %a, <32 x i16> %b) nounwind {		define <32 x i16> @splatvar_shift_v32i16(<32 x i16> %a, <32 x i16> %b) nounwind {
; AVX512DQ-LABEL: splatvar_shift_v32i16:		; AVX512DQ-LABEL: splatvar_shift_v32i16:
; AVX512DQ: ## BB#0:		; AVX512DQ: ## BB#0:
; AVX512DQ-NEXT: vmovd %xmm2, %eax		; AVX512DQ-NEXT: vpextrw $0, %xmm2, %eax
; AVX512DQ-NEXT: movzwl %ax, %eax
; AVX512DQ-NEXT: vmovd %eax, %xmm2		; AVX512DQ-NEXT: vmovd %eax, %xmm2
; AVX512DQ-NEXT: vpsllw %xmm2, %ymm0, %ymm0		; AVX512DQ-NEXT: vpsllw %xmm2, %ymm0, %ymm0
; AVX512DQ-NEXT: vpsllw %xmm2, %ymm1, %ymm1		; AVX512DQ-NEXT: vpsllw %xmm2, %ymm1, %ymm1
; AVX512DQ-NEXT: retq		; AVX512DQ-NEXT: retq
;		;
; AVX512BW-LABEL: splatvar_shift_v32i16:		; AVX512BW-LABEL: splatvar_shift_v32i16:
; AVX512BW: ## BB#0:		; AVX512BW: ## BB#0:
; AVX512BW-NEXT: vmovd %xmm1, %eax		; AVX512BW-NEXT: vpextrw $0, %xmm1, %eax
; AVX512BW-NEXT: movzwl %ax, %eax
; AVX512BW-NEXT: vmovd %eax, %xmm1		; AVX512BW-NEXT: vmovd %eax, %xmm1
; AVX512BW-NEXT: vpsllw %xmm1, %zmm0, %zmm0		; AVX512BW-NEXT: vpsllw %xmm1, %zmm0, %zmm0
; AVX512BW-NEXT: retq		; AVX512BW-NEXT: retq
%splat = shufflevector <32 x i16> %b, <32 x i16> undef, <32 x i32> zeroinitializer		%splat = shufflevector <32 x i16> %b, <32 x i16> undef, <32 x i32> zeroinitializer
%shift = shl <32 x i16> %a, %splat		%shift = shl <32 x i16> %a, %splat
ret <32 x i16> %shift		ret <32 x i16> %shift
}		}

▲ Show 20 Lines • Show All 155 Lines • Show Last 20 Lines

test/CodeGen/X86/widen_conv-1.ll

	Show All 33 Lines
	; X86-NEXT: pushl %eax			; X86-NEXT: pushl %eax
	; X86-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-NEXT: movl {{[0-9]+}}(%esp), %eax
	; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx			; X86-NEXT: movl {{[0-9]+}}(%esp), %ecx
	; X86-NEXT: movdqa (%ecx), %xmm0			; X86-NEXT: movdqa (%ecx), %xmm0
	; X86-NEXT: paddd {{\.LCPI.*}}, %xmm0			; X86-NEXT: paddd {{\.LCPI.*}}, %xmm0
	; X86-NEXT: pextrb $8, %xmm0, 2(%eax)			; X86-NEXT: pextrb $8, %xmm0, 2(%eax)
	; X86-NEXT: pshufb {{.*#+}} xmm0 = xmm0[0,4,8,12,u,u,u,u,u,u,u,u,u,u,u,u]			; X86-NEXT: pshufb {{.*#+}} xmm0 = xmm0[0,4,8,12,u,u,u,u,u,u,u,u,u,u,u,u]
	; X86-NEXT: pmovzxwq {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero			; X86-NEXT: pmovzxwq {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero
	; X86-NEXT: movd %xmm0, %ecx			; X86-NEXT: pextrw $0, %xmm0, (%eax)
	; X86-NEXT: movw %cx, (%eax)
	; X86-NEXT: popl %eax			; X86-NEXT: popl %eax
	; X86-NEXT: retl			; X86-NEXT: retl
	;			;
	; X64-LABEL: convert_v3i32_to_v3i8:			; X64-LABEL: convert_v3i32_to_v3i8:
	; X64: # BB#0: # %entry			; X64: # BB#0: # %entry
	; X64-NEXT: movdqa (%rsi), %xmm0			; X64-NEXT: movdqa (%rsi), %xmm0
	; X64-NEXT: paddd {{.*}}(%rip), %xmm0			; X64-NEXT: paddd {{.*}}(%rip), %xmm0
	; X64-NEXT: pextrb $8, %xmm0, 2(%rdi)			; X64-NEXT: pextrb $8, %xmm0, 2(%rdi)
	; X64-NEXT: pshufb {{.*#+}} xmm0 = xmm0[0,4,8,12,u,u,u,u,u,u,u,u,u,u,u,u]			; X64-NEXT: pshufb {{.*#+}} xmm0 = xmm0[0,4,8,12,u,u,u,u,u,u,u,u,u,u,u,u]
	; X64-NEXT: pmovzxwq {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero			; X64-NEXT: pmovzxwq {{.*#+}} xmm0 = xmm0[0],zero,zero,zero,xmm0[1],zero,zero,zero
	; X64-NEXT: movd %xmm0, %eax			; X64-NEXT: pextrw $0, %xmm0, (%rdi)
	; X64-NEXT: movw %ax, (%rdi)
	; X64-NEXT: retq			; X64-NEXT: retq
	entry:			entry:
	%load = load <3 x i32>, <3 x i32>* %src.addr			%load = load <3 x i32>, <3 x i32>* %src.addr
	%val = trunc <3 x i32> %load to <3 x i8>			%val = trunc <3 x i32> %load to <3 x i8>
	%add = add <3 x i8> %val, < i8 1, i8 1, i8 1 >			%add = add <3 x i8> %val, < i8 1, i8 1, i8 1 >
	store <3 x i8> %add, <3 x i8>* %dst.addr			store <3 x i8> %add, <3 x i8>* %dst.addr
	ret void			ret void
	}			}
	Show All 38 Lines

test/CodeGen/X86/widen_load-2.ll

	Show First 20 Lines • Show All 166 Lines • ▼ Show 20 Lines
	; CHECK-LABEL: add3i8:			; CHECK-LABEL: add3i8:
	; CHECK: # BB#0:			; CHECK: # BB#0:
	; CHECK-NEXT: pmovzxbd {{.*#+}} xmm0 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero			; CHECK-NEXT: pmovzxbd {{.*#+}} xmm0 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero
	; CHECK-NEXT: pmovzxbd {{.*#+}} xmm1 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero			; CHECK-NEXT: pmovzxbd {{.*#+}} xmm1 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero
	; CHECK-NEXT: paddd %xmm0, %xmm1			; CHECK-NEXT: paddd %xmm0, %xmm1
	; CHECK-NEXT: pextrb $8, %xmm1, 2(%rdi)			; CHECK-NEXT: pextrb $8, %xmm1, 2(%rdi)
	; CHECK-NEXT: pshufb {{.*#+}} xmm1 = xmm1[0,4,8,12,u,u,u,u,u,u,u,u,u,u,u,u]			; CHECK-NEXT: pshufb {{.*#+}} xmm1 = xmm1[0,4,8,12,u,u,u,u,u,u,u,u,u,u,u,u]
	; CHECK-NEXT: pmovzxwq {{.*#+}} xmm0 = xmm1[0],zero,zero,zero,xmm1[1],zero,zero,zero			; CHECK-NEXT: pmovzxwq {{.*#+}} xmm0 = xmm1[0],zero,zero,zero,xmm1[1],zero,zero,zero
	; CHECK-NEXT: movd %xmm0, %eax			; CHECK-NEXT: pextrw $0, %xmm0, (%rdi)
	; CHECK-NEXT: movw %ax, (%rdi)
	; CHECK-NEXT: movq %rdi, %rax			; CHECK-NEXT: movq %rdi, %rax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%a = load %i8vec3, %i8vec3* %ap, align 16			%a = load %i8vec3, %i8vec3* %ap, align 16
	%b = load %i8vec3, %i8vec3* %bp, align 16			%b = load %i8vec3, %i8vec3* %bp, align 16
	%x = add %i8vec3 %a, %b			%x = add %i8vec3 %a, %b
	store %i8vec3 %x, %i8vec3* %ret, align 16			store %i8vec3 %x, %i8vec3* %ret, align 16
	ret void			ret void
	}			}
	Show All 24 Lines
	%i8vec3pack = type { <3 x i8>, i8 }			%i8vec3pack = type { <3 x i8>, i8 }
	define void @rot(%i8vec3pack* nocapture sret %result, %i8vec3pack* %X, %i8vec3pack* %rot) nounwind {			define void @rot(%i8vec3pack* nocapture sret %result, %i8vec3pack* %X, %i8vec3pack* %rot) nounwind {
	; CHECK-LABEL: rot:			; CHECK-LABEL: rot:
	; CHECK: # BB#0: # %entry			; CHECK: # BB#0: # %entry
	; CHECK-NEXT: movdqa {{.*#+}} xmm0 = <0,4,8,128,u,u,u,u,u,u,u,u,u,u,u,u>			; CHECK-NEXT: movdqa {{.*#+}} xmm0 = <0,4,8,128,u,u,u,u,u,u,u,u,u,u,u,u>
	; CHECK-NEXT: movdqa {{.*#+}} xmm1 = <158,158,158,u>			; CHECK-NEXT: movdqa {{.*#+}} xmm1 = <158,158,158,u>
	; CHECK-NEXT: pshufb %xmm0, %xmm1			; CHECK-NEXT: pshufb %xmm0, %xmm1
	; CHECK-NEXT: pmovzxwq {{.*#+}} xmm1 = xmm1[0],zero,zero,zero,xmm1[1],zero,zero,zero			; CHECK-NEXT: pmovzxwq {{.*#+}} xmm1 = xmm1[0],zero,zero,zero,xmm1[1],zero,zero,zero
	; CHECK-NEXT: movd %xmm1, %eax			; CHECK-NEXT: pextrw $0, %xmm1, (%rsi)
	; CHECK-NEXT: movw %ax, (%rsi)
	; CHECK-NEXT: movb $-98, 2(%rsi)			; CHECK-NEXT: movb $-98, 2(%rsi)
	; CHECK-NEXT: movdqa {{.*#+}} xmm1 = <1,1,1,u>			; CHECK-NEXT: movdqa {{.*#+}} xmm1 = <1,1,1,u>
	; CHECK-NEXT: pshufb %xmm0, %xmm1			; CHECK-NEXT: pshufb %xmm0, %xmm1
	; CHECK-NEXT: pmovzxwq {{.*#+}} xmm0 = xmm1[0],zero,zero,zero,xmm1[1],zero,zero,zero			; CHECK-NEXT: pmovzxwq {{.*#+}} xmm0 = xmm1[0],zero,zero,zero,xmm1[1],zero,zero,zero
	; CHECK-NEXT: movd %xmm0, %eax			; CHECK-NEXT: pextrw $0, %xmm0, (%rdx)
	; CHECK-NEXT: movw %ax, (%rdx)
	; CHECK-NEXT: movb $1, 2(%rdx)			; CHECK-NEXT: movb $1, 2(%rdx)
	; CHECK-NEXT: pmovzxbd {{.*#+}} xmm0 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero			; CHECK-NEXT: pmovzxbd {{.*#+}} xmm0 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero
	; CHECK-NEXT: movdqa %xmm0, %xmm1			; CHECK-NEXT: movdqa %xmm0, %xmm1
	; CHECK-NEXT: psrld $1, %xmm1			; CHECK-NEXT: psrld $1, %xmm1
	; CHECK-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1,2,3,4,5],xmm0[6,7]			; CHECK-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1,2,3,4,5],xmm0[6,7]
	; CHECK-NEXT: pextrb $8, %xmm1, 2(%rdi)			; CHECK-NEXT: pextrb $8, %xmm1, 2(%rdi)
	; CHECK-NEXT: pshufb {{.*#+}} xmm1 = xmm1[0,4,8,12,u,u,u,u,u,u,u,u,u,u,u,u]			; CHECK-NEXT: pshufb {{.*#+}} xmm1 = xmm1[0,4,8,12,u,u,u,u,u,u,u,u,u,u,u,u]
	; CHECK-NEXT: pmovzxwq {{.*#+}} xmm0 = xmm1[0],zero,zero,zero,xmm1[1],zero,zero,zero			; CHECK-NEXT: pmovzxwq {{.*#+}} xmm0 = xmm1[0],zero,zero,zero,xmm1[1],zero,zero,zero
	; CHECK-NEXT: movd %xmm0, %eax			; CHECK-NEXT: pextrw $0, %xmm0, (%rdi)
	; CHECK-NEXT: movw %ax, (%rdi)
	; CHECK-NEXT: movq %rdi, %rax			; CHECK-NEXT: movq %rdi, %rax
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	entry:			entry:
	%storetmp = bitcast %i8vec3pack* %X to <3 x i8>*			%storetmp = bitcast %i8vec3pack* %X to <3 x i8>*
	store <3 x i8> <i8 -98, i8 -98, i8 -98>, <3 x i8>* %storetmp			store <3 x i8> <i8 -98, i8 -98, i8 -98>, <3 x i8>* %storetmp
	%storetmp1 = bitcast %i8vec3pack* %rot to <3 x i8>*			%storetmp1 = bitcast %i8vec3pack* %rot to <3 x i8>*
	store <3 x i8> <i8 1, i8 1, i8 1>, <3 x i8>* %storetmp1			store <3 x i8> <i8 1, i8 1, i8 1>, <3 x i8>* %storetmp1
	%tmp = load %i8vec3pack, %i8vec3pack* %X			%tmp = load %i8vec3pack, %i8vec3pack* %X
	Show All 9 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86][SSE] Allow folding of store/zext with PEXTRW of 0'th elementClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 64477

lib/Target/X86/X86ISelLowering.cpp

test/CodeGen/X86/2011-12-8-bitcastintprom.ll

test/CodeGen/X86/avx512-trunc.ll

test/CodeGen/X86/extract-store.ll

test/CodeGen/X86/lower-vec-shift-2.ll

test/CodeGen/X86/masked_memop.ll

test/CodeGen/X86/trunc-ext-ld-st.ll

test/CodeGen/X86/vector-shift-ashr-128.ll

test/CodeGen/X86/vector-shift-ashr-256.ll

test/CodeGen/X86/vector-shift-ashr-512.ll

test/CodeGen/X86/vector-shift-lshr-128.ll

test/CodeGen/X86/vector-shift-lshr-256.ll

test/CodeGen/X86/vector-shift-lshr-512.ll

test/CodeGen/X86/vector-shift-shl-128.ll

test/CodeGen/X86/vector-shift-shl-256.ll

test/CodeGen/X86/vector-shift-shl-512.ll

test/CodeGen/X86/widen_conv-1.ll

test/CodeGen/X86/widen_load-2.ll

[X86][SSE] Allow folding of store/zext with PEXTRW of 0'th element
ClosedPublic