This is an archive of the discontinued LLVM Phabricator instance.

[X86] Use (SUBREG_TO_REG (MOV32rm)) for extloadi64i8/extloadi64i16 when the load is 4 byte aligned or better and not volatile.
ClosedPublic

Authored by craig.topper on Apr 5 2019, 2:46 PM.

Download Raw Diff

Details

Reviewers

RKSimon
spatel

Commits

rG424417da79c6: [X86] Use (SUBREG_TO_REG (MOV32rm)) for extloadi64i8/extloadi64i16 when the…
rL357875: [X86] Use (SUBREG_TO_REG (MOV32rm)) for extloadi64i8/extloadi64i16 when the…

Summary

Previously we would use MOVZXrm8/MOVZXrm16, but those are longer encodings.

This is similar to what we do in the loadi32 predicate.

Diff Detail

Repository: rL LLVM

Event Timeline

craig.topper created this revision.Apr 5 2019, 2:46 PM

Herald added a project: Restricted Project. · View Herald TranscriptApr 5 2019, 2:46 PM

Herald added a subscriber: hiraditya. · View Herald Transcript

Harbormaster completed remote builds in B30124: Diff 193973.Apr 5 2019, 2:47 PM

LGTM - although I'm a little surprised that <4 x i1> has an alignment >= 4

llvm/test/CodeGen/X86/vector-sext-widen.ll
1494 ↗	(On Diff #193973)	I'm a little surprised that <4 x i1> is assumed to have a alignment >= 4

This revision is now accepted and ready to land.Apr 7 2019, 5:46 AM

Closed by commit rL357875: [X86] Use (SUBREG_TO_REG (MOV32rm)) for extloadi64i8/extloadi64i16 when the… (authored by ctopper). · Explain WhyApr 7 2019, 12:18 PM

This revision was automatically updated to reflect the committed changes.

craig.topper marked an inline comment as done.Apr 7 2019, 12:18 PM

craig.topper added inline comments.

llvm/test/CodeGen/X86/vector-sext-widen.ll
1494 ↗	(On Diff #193973)	It appears data layout takes element allocation size which I guess is rounded up to a byte, then multiplies by element count.

Revision Contents

Path

Size

llvm/

trunk/

lib/

Target/

X86/

X86InstrCompiler.td

6 lines

X86InstrInfo.td

14 lines

test/

CodeGen/

X86/

fp128-cast.ll

2 lines

vector-sext-widen.ll

14 lines

vector-sext.ll

14 lines

zext-logicop-shift-load.ll

6 lines

Diff 194070

llvm/trunk/lib/Target/X86/X86InstrCompiler.td

	Show First 20 Lines • Show All 1,273 Lines • ▼ Show 20 Lines
	def : Pat<(extloadi32i1 addr:$src), (MOVZX32rm8 addr:$src)>;			def : Pat<(extloadi32i1 addr:$src), (MOVZX32rm8 addr:$src)>;
	def : Pat<(extloadi16i8 addr:$src),			def : Pat<(extloadi16i8 addr:$src),
	(EXTRACT_SUBREG (MOVZX32rm8 addr:$src), sub_16bit)>;			(EXTRACT_SUBREG (MOVZX32rm8 addr:$src), sub_16bit)>;
	def : Pat<(extloadi32i8 addr:$src), (MOVZX32rm8 addr:$src)>;			def : Pat<(extloadi32i8 addr:$src), (MOVZX32rm8 addr:$src)>;
	def : Pat<(extloadi32i16 addr:$src), (MOVZX32rm16 addr:$src)>;			def : Pat<(extloadi32i16 addr:$src), (MOVZX32rm16 addr:$src)>;

	// For other extloads, use subregs, since the high contents of the register are			// For other extloads, use subregs, since the high contents of the register are
	// defined after an extload.			// defined after an extload.
				// NOTE: The extloadi64i32 pattern needs to be first as it will try to form
				// 32-bit loads for 4 byte aligned i8/i16 loads.
				def : Pat<(extloadi64i32 addr:$src),
				(SUBREG_TO_REG (i64 0), (MOV32rm addr:$src), sub_32bit)>;
	def : Pat<(extloadi64i1 addr:$src),			def : Pat<(extloadi64i1 addr:$src),
	(SUBREG_TO_REG (i64 0), (MOVZX32rm8 addr:$src), sub_32bit)>;			(SUBREG_TO_REG (i64 0), (MOVZX32rm8 addr:$src), sub_32bit)>;
	def : Pat<(extloadi64i8 addr:$src),			def : Pat<(extloadi64i8 addr:$src),
	(SUBREG_TO_REG (i64 0), (MOVZX32rm8 addr:$src), sub_32bit)>;			(SUBREG_TO_REG (i64 0), (MOVZX32rm8 addr:$src), sub_32bit)>;
	def : Pat<(extloadi64i16 addr:$src),			def : Pat<(extloadi64i16 addr:$src),
	(SUBREG_TO_REG (i64 0), (MOVZX32rm16 addr:$src), sub_32bit)>;			(SUBREG_TO_REG (i64 0), (MOVZX32rm16 addr:$src), sub_32bit)>;
	def : Pat<(extloadi64i32 addr:$src),
	(SUBREG_TO_REG (i64 0), (MOV32rm addr:$src), sub_32bit)>;

	// anyext. Define these to do an explicit zero-extend to			// anyext. Define these to do an explicit zero-extend to
	// avoid partial-register updates.			// avoid partial-register updates.
	def : Pat<(i16 (anyext GR8 :$src)), (EXTRACT_SUBREG			def : Pat<(i16 (anyext GR8 :$src)), (EXTRACT_SUBREG
	(MOVZX32rr8 GR8 :$src), sub_16bit)>;			(MOVZX32rr8 GR8 :$src), sub_16bit)>;
	def : Pat<(i32 (anyext GR8 :$src)), (MOVZX32rr8 GR8 :$src)>;			def : Pat<(i32 (anyext GR8 :$src)), (MOVZX32rr8 GR8 :$src)>;

	// Except for i16 -> i32 since isel expect i16 ops to be promoted to i32.			// Except for i16 -> i32 since isel expect i16 ops to be promoted to i32.
	▲ Show 20 Lines • Show All 855 Lines • Show Last 20 Lines

llvm/trunk/lib/Target/X86/X86InstrInfo.td

	Show First 20 Lines • Show All 1,115 Lines • ▼ Show 20 Lines
	def extloadi16i1 : PatFrag<(ops node:$ptr), (i16 (extloadi1 node:$ptr))>;			def extloadi16i1 : PatFrag<(ops node:$ptr), (i16 (extloadi1 node:$ptr))>;
	def extloadi32i1 : PatFrag<(ops node:$ptr), (i32 (extloadi1 node:$ptr))>;			def extloadi32i1 : PatFrag<(ops node:$ptr), (i32 (extloadi1 node:$ptr))>;
	def extloadi16i8 : PatFrag<(ops node:$ptr), (i16 (extloadi8 node:$ptr))>;			def extloadi16i8 : PatFrag<(ops node:$ptr), (i16 (extloadi8 node:$ptr))>;
	def extloadi32i8 : PatFrag<(ops node:$ptr), (i32 (extloadi8 node:$ptr))>;			def extloadi32i8 : PatFrag<(ops node:$ptr), (i32 (extloadi8 node:$ptr))>;
	def extloadi32i16 : PatFrag<(ops node:$ptr), (i32 (extloadi16 node:$ptr))>;			def extloadi32i16 : PatFrag<(ops node:$ptr), (i32 (extloadi16 node:$ptr))>;
	def extloadi64i1 : PatFrag<(ops node:$ptr), (i64 (extloadi1 node:$ptr))>;			def extloadi64i1 : PatFrag<(ops node:$ptr), (i64 (extloadi1 node:$ptr))>;
	def extloadi64i8 : PatFrag<(ops node:$ptr), (i64 (extloadi8 node:$ptr))>;			def extloadi64i8 : PatFrag<(ops node:$ptr), (i64 (extloadi8 node:$ptr))>;
	def extloadi64i16 : PatFrag<(ops node:$ptr), (i64 (extloadi16 node:$ptr))>;			def extloadi64i16 : PatFrag<(ops node:$ptr), (i64 (extloadi16 node:$ptr))>;
	def extloadi64i32 : PatFrag<(ops node:$ptr), (i64 (extloadi32 node:$ptr))>;
				// We can treat an i8/i16 extending load to i64 as a 32 bit load if its known
				// to be 4 byte aligned or better.
				def extloadi64i32 : PatFrag<(ops node:$ptr), (i64 (unindexedload node:$ptr)), [{
				LoadSDNode *LD = cast<LoadSDNode>(N);
				ISD::LoadExtType ExtType = LD->getExtensionType();
				if (ExtType != ISD::EXTLOAD)
				return false;
				if (LD->getMemoryVT() == MVT::i32)
				return true;

				return LD->getAlignment() >= 4 && !LD->isVolatile();
				}]>;


	// An 'and' node with a single use.			// An 'and' node with a single use.
	def and_su : PatFrag<(ops node:$lhs, node:$rhs), (and node:$lhs, node:$rhs), [{			def and_su : PatFrag<(ops node:$lhs, node:$rhs), (and node:$lhs, node:$rhs), [{
	return N->hasOneUse();			return N->hasOneUse();
	}]>;			}]>;
	// An 'srl' node with a single use.			// An 'srl' node with a single use.
	def srl_su : PatFrag<(ops node:$lhs, node:$rhs), (srl node:$lhs, node:$rhs), [{			def srl_su : PatFrag<(ops node:$lhs, node:$rhs), (srl node:$lhs, node:$rhs), [{
	▲ Show 20 Lines • Show All 2,345 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/fp128-cast.ll

	Show First 20 Lines • Show All 407 Lines • ▼ Show 20 Lines
	; X64-LABEL: TestFPTruncF128_F80:			; X64-LABEL: TestFPTruncF128_F80:
	; X64: # %bb.0: # %entry			; X64: # %bb.0: # %entry
	; X64-NEXT: subq $24, %rsp			; X64-NEXT: subq $24, %rsp
	; X64-NEXT: movaps {{.*}}(%rip), %xmm0			; X64-NEXT: movaps {{.*}}(%rip), %xmm0
	; X64-NEXT: callq __trunctfxf2			; X64-NEXT: callq __trunctfxf2
	; X64-NEXT: fstpt (%rsp)			; X64-NEXT: fstpt (%rsp)
	; X64-NEXT: movq (%rsp), %rax			; X64-NEXT: movq (%rsp), %rax
	; X64-NEXT: movq %rax, {{.*}}(%rip)			; X64-NEXT: movq %rax, {{.*}}(%rip)
	; X64-NEXT: movzwl {{[0-9]+}}(%rsp), %eax			; X64-NEXT: movl {{[0-9]+}}(%rsp), %eax
	; X64-NEXT: movw %ax, vf80+{{.*}}(%rip)			; X64-NEXT: movw %ax, vf80+{{.*}}(%rip)
	; X64-NEXT: addq $24, %rsp			; X64-NEXT: addq $24, %rsp
	; X64-NEXT: retq			; X64-NEXT: retq
	;			;
	; X64_NO_MMX-LABEL: TestFPTruncF128_F80:			; X64_NO_MMX-LABEL: TestFPTruncF128_F80:
	; X64_NO_MMX: # %bb.0: # %entry			; X64_NO_MMX: # %bb.0: # %entry
	; X64_NO_MMX-NEXT: pushq %rax			; X64_NO_MMX-NEXT: pushq %rax
	; X64_NO_MMX-NEXT: movq {{.*}}(%rip), %rdi			; X64_NO_MMX-NEXT: movq {{.*}}(%rip), %rdi
	▲ Show 20 Lines • Show All 580 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vector-sext-widen.ll

	Show First 20 Lines • Show All 1,488 Lines • ▼ Show 20 Lines
	%X = load <2 x i8>, <2 x i8>* %ptr			%X = load <2 x i8>, <2 x i8>* %ptr
	%Y = sext <2 x i8> %X to <2 x i64>			%Y = sext <2 x i8> %X to <2 x i64>
	ret <2 x i64> %Y			ret <2 x i64> %Y
	}			}

	define <4 x i32> @load_sext_4i1_to_4i32(<4 x i1> *%ptr) {			define <4 x i32> @load_sext_4i1_to_4i32(<4 x i1> *%ptr) {
	; SSE2-LABEL: load_sext_4i1_to_4i32:			; SSE2-LABEL: load_sext_4i1_to_4i32:
	; SSE2: # %bb.0: # %entry			; SSE2: # %bb.0: # %entry
	; SSE2-NEXT: movzbl (%rdi), %eax			; SSE2-NEXT: movl (%rdi), %eax
	; SSE2-NEXT: movq %rax, %rcx			; SSE2-NEXT: movq %rax, %rcx
	; SSE2-NEXT: shlq $60, %rcx			; SSE2-NEXT: shlq $60, %rcx
	; SSE2-NEXT: sarq $63, %rcx			; SSE2-NEXT: sarq $63, %rcx
	; SSE2-NEXT: movd %ecx, %xmm0			; SSE2-NEXT: movd %ecx, %xmm0
	; SSE2-NEXT: movq %rax, %rcx			; SSE2-NEXT: movq %rax, %rcx
	; SSE2-NEXT: shlq $61, %rcx			; SSE2-NEXT: shlq $61, %rcx
	; SSE2-NEXT: sarq $63, %rcx			; SSE2-NEXT: sarq $63, %rcx
	; SSE2-NEXT: movd %ecx, %xmm1			; SSE2-NEXT: movd %ecx, %xmm1
	; SSE2-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]			; SSE2-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
	; SSE2-NEXT: movq %rax, %rcx			; SSE2-NEXT: movq %rax, %rcx
	; SSE2-NEXT: shlq $62, %rcx			; SSE2-NEXT: shlq $62, %rcx
	; SSE2-NEXT: sarq $63, %rcx			; SSE2-NEXT: sarq $63, %rcx
	; SSE2-NEXT: movd %ecx, %xmm2			; SSE2-NEXT: movd %ecx, %xmm2
	; SSE2-NEXT: shlq $63, %rax			; SSE2-NEXT: shlq $63, %rax
	; SSE2-NEXT: sarq $63, %rax			; SSE2-NEXT: sarq $63, %rax
	; SSE2-NEXT: movd %eax, %xmm0			; SSE2-NEXT: movd %eax, %xmm0
	; SSE2-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]			; SSE2-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]
	; SSE2-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]			; SSE2-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSSE3-LABEL: load_sext_4i1_to_4i32:			; SSSE3-LABEL: load_sext_4i1_to_4i32:
	; SSSE3: # %bb.0: # %entry			; SSSE3: # %bb.0: # %entry
	; SSSE3-NEXT: movzbl (%rdi), %eax			; SSSE3-NEXT: movl (%rdi), %eax
	; SSSE3-NEXT: movq %rax, %rcx			; SSSE3-NEXT: movq %rax, %rcx
	; SSSE3-NEXT: shlq $60, %rcx			; SSSE3-NEXT: shlq $60, %rcx
	; SSSE3-NEXT: sarq $63, %rcx			; SSSE3-NEXT: sarq $63, %rcx
	; SSSE3-NEXT: movd %ecx, %xmm0			; SSSE3-NEXT: movd %ecx, %xmm0
	; SSSE3-NEXT: movq %rax, %rcx			; SSSE3-NEXT: movq %rax, %rcx
	; SSSE3-NEXT: shlq $61, %rcx			; SSSE3-NEXT: shlq $61, %rcx
	; SSSE3-NEXT: sarq $63, %rcx			; SSSE3-NEXT: sarq $63, %rcx
	; SSSE3-NEXT: movd %ecx, %xmm1			; SSSE3-NEXT: movd %ecx, %xmm1
	; SSSE3-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]			; SSSE3-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
	; SSSE3-NEXT: movq %rax, %rcx			; SSSE3-NEXT: movq %rax, %rcx
	; SSSE3-NEXT: shlq $62, %rcx			; SSSE3-NEXT: shlq $62, %rcx
	; SSSE3-NEXT: sarq $63, %rcx			; SSSE3-NEXT: sarq $63, %rcx
	; SSSE3-NEXT: movd %ecx, %xmm2			; SSSE3-NEXT: movd %ecx, %xmm2
	; SSSE3-NEXT: shlq $63, %rax			; SSSE3-NEXT: shlq $63, %rax
	; SSSE3-NEXT: sarq $63, %rax			; SSSE3-NEXT: sarq $63, %rax
	; SSSE3-NEXT: movd %eax, %xmm0			; SSSE3-NEXT: movd %eax, %xmm0
	; SSSE3-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]			; SSSE3-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]
	; SSSE3-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]			; SSSE3-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
	; SSSE3-NEXT: retq			; SSSE3-NEXT: retq
	;			;
	; SSE41-LABEL: load_sext_4i1_to_4i32:			; SSE41-LABEL: load_sext_4i1_to_4i32:
	; SSE41: # %bb.0: # %entry			; SSE41: # %bb.0: # %entry
	; SSE41-NEXT: movzbl (%rdi), %eax			; SSE41-NEXT: movl (%rdi), %eax
	; SSE41-NEXT: movq %rax, %rcx			; SSE41-NEXT: movq %rax, %rcx
	; SSE41-NEXT: shlq $62, %rcx			; SSE41-NEXT: shlq $62, %rcx
	; SSE41-NEXT: sarq $63, %rcx			; SSE41-NEXT: sarq $63, %rcx
	; SSE41-NEXT: movq %rax, %rdx			; SSE41-NEXT: movq %rax, %rdx
	; SSE41-NEXT: shlq $63, %rdx			; SSE41-NEXT: shlq $63, %rdx
	; SSE41-NEXT: sarq $63, %rdx			; SSE41-NEXT: sarq $63, %rdx
	; SSE41-NEXT: movd %edx, %xmm0			; SSE41-NEXT: movd %edx, %xmm0
	; SSE41-NEXT: pinsrd $1, %ecx, %xmm0			; SSE41-NEXT: pinsrd $1, %ecx, %xmm0
	; SSE41-NEXT: movq %rax, %rcx			; SSE41-NEXT: movq %rax, %rcx
	; SSE41-NEXT: shlq $61, %rcx			; SSE41-NEXT: shlq $61, %rcx
	; SSE41-NEXT: sarq $63, %rcx			; SSE41-NEXT: sarq $63, %rcx
	; SSE41-NEXT: pinsrd $2, %ecx, %xmm0			; SSE41-NEXT: pinsrd $2, %ecx, %xmm0
	; SSE41-NEXT: shlq $60, %rax			; SSE41-NEXT: shlq $60, %rax
	; SSE41-NEXT: sarq $63, %rax			; SSE41-NEXT: sarq $63, %rax
	; SSE41-NEXT: pinsrd $3, %eax, %xmm0			; SSE41-NEXT: pinsrd $3, %eax, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: load_sext_4i1_to_4i32:			; AVX1-LABEL: load_sext_4i1_to_4i32:
	; AVX1: # %bb.0: # %entry			; AVX1: # %bb.0: # %entry
	; AVX1-NEXT: movzbl (%rdi), %eax			; AVX1-NEXT: movl (%rdi), %eax
	; AVX1-NEXT: movq %rax, %rcx			; AVX1-NEXT: movq %rax, %rcx
	; AVX1-NEXT: shlq $62, %rcx			; AVX1-NEXT: shlq $62, %rcx
	; AVX1-NEXT: sarq $63, %rcx			; AVX1-NEXT: sarq $63, %rcx
	; AVX1-NEXT: movq %rax, %rdx			; AVX1-NEXT: movq %rax, %rdx
	; AVX1-NEXT: shlq $63, %rdx			; AVX1-NEXT: shlq $63, %rdx
	; AVX1-NEXT: sarq $63, %rdx			; AVX1-NEXT: sarq $63, %rdx
	; AVX1-NEXT: vmovd %edx, %xmm0			; AVX1-NEXT: vmovd %edx, %xmm0
	; AVX1-NEXT: vpinsrd $1, %ecx, %xmm0, %xmm0			; AVX1-NEXT: vpinsrd $1, %ecx, %xmm0, %xmm0
	; AVX1-NEXT: movq %rax, %rcx			; AVX1-NEXT: movq %rax, %rcx
	; AVX1-NEXT: shlq $61, %rcx			; AVX1-NEXT: shlq $61, %rcx
	; AVX1-NEXT: sarq $63, %rcx			; AVX1-NEXT: sarq $63, %rcx
	; AVX1-NEXT: vpinsrd $2, %ecx, %xmm0, %xmm0			; AVX1-NEXT: vpinsrd $2, %ecx, %xmm0, %xmm0
	; AVX1-NEXT: shlq $60, %rax			; AVX1-NEXT: shlq $60, %rax
	; AVX1-NEXT: sarq $63, %rax			; AVX1-NEXT: sarq $63, %rax
	; AVX1-NEXT: vpinsrd $3, %eax, %xmm0, %xmm0			; AVX1-NEXT: vpinsrd $3, %eax, %xmm0, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: load_sext_4i1_to_4i32:			; AVX2-LABEL: load_sext_4i1_to_4i32:
	; AVX2: # %bb.0: # %entry			; AVX2: # %bb.0: # %entry
	; AVX2-NEXT: movzbl (%rdi), %eax			; AVX2-NEXT: movl (%rdi), %eax
	; AVX2-NEXT: movq %rax, %rcx			; AVX2-NEXT: movq %rax, %rcx
	; AVX2-NEXT: shlq $62, %rcx			; AVX2-NEXT: shlq $62, %rcx
	; AVX2-NEXT: sarq $63, %rcx			; AVX2-NEXT: sarq $63, %rcx
	; AVX2-NEXT: movq %rax, %rdx			; AVX2-NEXT: movq %rax, %rdx
	; AVX2-NEXT: shlq $63, %rdx			; AVX2-NEXT: shlq $63, %rdx
	; AVX2-NEXT: sarq $63, %rdx			; AVX2-NEXT: sarq $63, %rdx
	; AVX2-NEXT: vmovd %edx, %xmm0			; AVX2-NEXT: vmovd %edx, %xmm0
	; AVX2-NEXT: vpinsrd $1, %ecx, %xmm0, %xmm0			; AVX2-NEXT: vpinsrd $1, %ecx, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 184 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[2,2,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[2,2,3,3]
	; SSE41-NEXT: psllq $63, %xmm1			; SSE41-NEXT: psllq $63, %xmm1
	; SSE41-NEXT: psrad $31, %xmm1			; SSE41-NEXT: psrad $31, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: load_sext_4i1_to_4i64:			; AVX1-LABEL: load_sext_4i1_to_4i64:
	; AVX1: # %bb.0: # %entry			; AVX1: # %bb.0: # %entry
	; AVX1-NEXT: movzbl (%rdi), %eax			; AVX1-NEXT: movl (%rdi), %eax
	; AVX1-NEXT: movq %rax, %rcx			; AVX1-NEXT: movq %rax, %rcx
	; AVX1-NEXT: shlq $62, %rcx			; AVX1-NEXT: shlq $62, %rcx
	; AVX1-NEXT: sarq $63, %rcx			; AVX1-NEXT: sarq $63, %rcx
	; AVX1-NEXT: movq %rax, %rdx			; AVX1-NEXT: movq %rax, %rdx
	; AVX1-NEXT: shlq $63, %rdx			; AVX1-NEXT: shlq $63, %rdx
	; AVX1-NEXT: sarq $63, %rdx			; AVX1-NEXT: sarq $63, %rdx
	; AVX1-NEXT: vmovd %edx, %xmm0			; AVX1-NEXT: vmovd %edx, %xmm0
	; AVX1-NEXT: vpinsrd $1, %ecx, %xmm0, %xmm0			; AVX1-NEXT: vpinsrd $1, %ecx, %xmm0, %xmm0
	; AVX1-NEXT: movq %rax, %rcx			; AVX1-NEXT: movq %rax, %rcx
	; AVX1-NEXT: shlq $61, %rcx			; AVX1-NEXT: shlq $61, %rcx
	; AVX1-NEXT: sarq $63, %rcx			; AVX1-NEXT: sarq $63, %rcx
	; AVX1-NEXT: vpinsrd $2, %ecx, %xmm0, %xmm0			; AVX1-NEXT: vpinsrd $2, %ecx, %xmm0, %xmm0
	; AVX1-NEXT: shlq $60, %rax			; AVX1-NEXT: shlq $60, %rax
	; AVX1-NEXT: sarq $63, %rax			; AVX1-NEXT: sarq $63, %rax
	; AVX1-NEXT: vpinsrd $3, %eax, %xmm0, %xmm0			; AVX1-NEXT: vpinsrd $3, %eax, %xmm0, %xmm0
	; AVX1-NEXT: vpmovsxdq %xmm0, %xmm1			; AVX1-NEXT: vpmovsxdq %xmm0, %xmm1
	; AVX1-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[2,3,0,1]			; AVX1-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[2,3,0,1]
	; AVX1-NEXT: vpmovsxdq %xmm0, %xmm0			; AVX1-NEXT: vpmovsxdq %xmm0, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: load_sext_4i1_to_4i64:			; AVX2-LABEL: load_sext_4i1_to_4i64:
	; AVX2: # %bb.0: # %entry			; AVX2: # %bb.0: # %entry
	; AVX2-NEXT: movzbl (%rdi), %eax			; AVX2-NEXT: movl (%rdi), %eax
	; AVX2-NEXT: movq %rax, %rcx			; AVX2-NEXT: movq %rax, %rcx
	; AVX2-NEXT: shlq $60, %rcx			; AVX2-NEXT: shlq $60, %rcx
	; AVX2-NEXT: sarq $63, %rcx			; AVX2-NEXT: sarq $63, %rcx
	; AVX2-NEXT: vmovq %rcx, %xmm0			; AVX2-NEXT: vmovq %rcx, %xmm0
	; AVX2-NEXT: movq %rax, %rcx			; AVX2-NEXT: movq %rax, %rcx
	; AVX2-NEXT: shlq $61, %rcx			; AVX2-NEXT: shlq $61, %rcx
	; AVX2-NEXT: sarq $63, %rcx			; AVX2-NEXT: sarq $63, %rcx
	; AVX2-NEXT: vmovq %rcx, %xmm1			; AVX2-NEXT: vmovq %rcx, %xmm1
	▲ Show 20 Lines • Show All 4,503 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vector-sext.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 1,488 Lines • ▼ Show 20 Lines
	%X = load <2 x i8>, <2 x i8>* %ptr			%X = load <2 x i8>, <2 x i8>* %ptr
	%Y = sext <2 x i8> %X to <2 x i64>			%Y = sext <2 x i8> %X to <2 x i64>
	ret <2 x i64> %Y			ret <2 x i64> %Y
	}			}

	define <4 x i32> @load_sext_4i1_to_4i32(<4 x i1> *%ptr) {			define <4 x i32> @load_sext_4i1_to_4i32(<4 x i1> *%ptr) {
	; SSE2-LABEL: load_sext_4i1_to_4i32:			; SSE2-LABEL: load_sext_4i1_to_4i32:
	; SSE2: # %bb.0: # %entry			; SSE2: # %bb.0: # %entry
	; SSE2-NEXT: movzbl (%rdi), %eax			; SSE2-NEXT: movl (%rdi), %eax
	; SSE2-NEXT: movq %rax, %rcx			; SSE2-NEXT: movq %rax, %rcx
	; SSE2-NEXT: shlq $60, %rcx			; SSE2-NEXT: shlq $60, %rcx
	; SSE2-NEXT: sarq $63, %rcx			; SSE2-NEXT: sarq $63, %rcx
	; SSE2-NEXT: movd %ecx, %xmm0			; SSE2-NEXT: movd %ecx, %xmm0
	; SSE2-NEXT: movq %rax, %rcx			; SSE2-NEXT: movq %rax, %rcx
	; SSE2-NEXT: shlq $61, %rcx			; SSE2-NEXT: shlq $61, %rcx
	; SSE2-NEXT: sarq $63, %rcx			; SSE2-NEXT: sarq $63, %rcx
	; SSE2-NEXT: movd %ecx, %xmm1			; SSE2-NEXT: movd %ecx, %xmm1
	; SSE2-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]			; SSE2-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
	; SSE2-NEXT: movq %rax, %rcx			; SSE2-NEXT: movq %rax, %rcx
	; SSE2-NEXT: shlq $62, %rcx			; SSE2-NEXT: shlq $62, %rcx
	; SSE2-NEXT: sarq $63, %rcx			; SSE2-NEXT: sarq $63, %rcx
	; SSE2-NEXT: movd %ecx, %xmm2			; SSE2-NEXT: movd %ecx, %xmm2
	; SSE2-NEXT: shlq $63, %rax			; SSE2-NEXT: shlq $63, %rax
	; SSE2-NEXT: sarq $63, %rax			; SSE2-NEXT: sarq $63, %rax
	; SSE2-NEXT: movd %eax, %xmm0			; SSE2-NEXT: movd %eax, %xmm0
	; SSE2-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]			; SSE2-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]
	; SSE2-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]			; SSE2-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSSE3-LABEL: load_sext_4i1_to_4i32:			; SSSE3-LABEL: load_sext_4i1_to_4i32:
	; SSSE3: # %bb.0: # %entry			; SSSE3: # %bb.0: # %entry
	; SSSE3-NEXT: movzbl (%rdi), %eax			; SSSE3-NEXT: movl (%rdi), %eax
	; SSSE3-NEXT: movq %rax, %rcx			; SSSE3-NEXT: movq %rax, %rcx
	; SSSE3-NEXT: shlq $60, %rcx			; SSSE3-NEXT: shlq $60, %rcx
	; SSSE3-NEXT: sarq $63, %rcx			; SSSE3-NEXT: sarq $63, %rcx
	; SSSE3-NEXT: movd %ecx, %xmm0			; SSSE3-NEXT: movd %ecx, %xmm0
	; SSSE3-NEXT: movq %rax, %rcx			; SSSE3-NEXT: movq %rax, %rcx
	; SSSE3-NEXT: shlq $61, %rcx			; SSSE3-NEXT: shlq $61, %rcx
	; SSSE3-NEXT: sarq $63, %rcx			; SSSE3-NEXT: sarq $63, %rcx
	; SSSE3-NEXT: movd %ecx, %xmm1			; SSSE3-NEXT: movd %ecx, %xmm1
	; SSSE3-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]			; SSSE3-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
	; SSSE3-NEXT: movq %rax, %rcx			; SSSE3-NEXT: movq %rax, %rcx
	; SSSE3-NEXT: shlq $62, %rcx			; SSSE3-NEXT: shlq $62, %rcx
	; SSSE3-NEXT: sarq $63, %rcx			; SSSE3-NEXT: sarq $63, %rcx
	; SSSE3-NEXT: movd %ecx, %xmm2			; SSSE3-NEXT: movd %ecx, %xmm2
	; SSSE3-NEXT: shlq $63, %rax			; SSSE3-NEXT: shlq $63, %rax
	; SSSE3-NEXT: sarq $63, %rax			; SSSE3-NEXT: sarq $63, %rax
	; SSSE3-NEXT: movd %eax, %xmm0			; SSSE3-NEXT: movd %eax, %xmm0
	; SSSE3-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]			; SSSE3-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]
	; SSSE3-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]			; SSSE3-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
	; SSSE3-NEXT: retq			; SSSE3-NEXT: retq
	;			;
	; SSE41-LABEL: load_sext_4i1_to_4i32:			; SSE41-LABEL: load_sext_4i1_to_4i32:
	; SSE41: # %bb.0: # %entry			; SSE41: # %bb.0: # %entry
	; SSE41-NEXT: movzbl (%rdi), %eax			; SSE41-NEXT: movl (%rdi), %eax
	; SSE41-NEXT: movq %rax, %rcx			; SSE41-NEXT: movq %rax, %rcx
	; SSE41-NEXT: shlq $62, %rcx			; SSE41-NEXT: shlq $62, %rcx
	; SSE41-NEXT: sarq $63, %rcx			; SSE41-NEXT: sarq $63, %rcx
	; SSE41-NEXT: movq %rax, %rdx			; SSE41-NEXT: movq %rax, %rdx
	; SSE41-NEXT: shlq $63, %rdx			; SSE41-NEXT: shlq $63, %rdx
	; SSE41-NEXT: sarq $63, %rdx			; SSE41-NEXT: sarq $63, %rdx
	; SSE41-NEXT: movd %edx, %xmm0			; SSE41-NEXT: movd %edx, %xmm0
	; SSE41-NEXT: pinsrd $1, %ecx, %xmm0			; SSE41-NEXT: pinsrd $1, %ecx, %xmm0
	; SSE41-NEXT: movq %rax, %rcx			; SSE41-NEXT: movq %rax, %rcx
	; SSE41-NEXT: shlq $61, %rcx			; SSE41-NEXT: shlq $61, %rcx
	; SSE41-NEXT: sarq $63, %rcx			; SSE41-NEXT: sarq $63, %rcx
	; SSE41-NEXT: pinsrd $2, %ecx, %xmm0			; SSE41-NEXT: pinsrd $2, %ecx, %xmm0
	; SSE41-NEXT: shlq $60, %rax			; SSE41-NEXT: shlq $60, %rax
	; SSE41-NEXT: sarq $63, %rax			; SSE41-NEXT: sarq $63, %rax
	; SSE41-NEXT: pinsrd $3, %eax, %xmm0			; SSE41-NEXT: pinsrd $3, %eax, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: load_sext_4i1_to_4i32:			; AVX1-LABEL: load_sext_4i1_to_4i32:
	; AVX1: # %bb.0: # %entry			; AVX1: # %bb.0: # %entry
	; AVX1-NEXT: movzbl (%rdi), %eax			; AVX1-NEXT: movl (%rdi), %eax
	; AVX1-NEXT: movq %rax, %rcx			; AVX1-NEXT: movq %rax, %rcx
	; AVX1-NEXT: shlq $62, %rcx			; AVX1-NEXT: shlq $62, %rcx
	; AVX1-NEXT: sarq $63, %rcx			; AVX1-NEXT: sarq $63, %rcx
	; AVX1-NEXT: movq %rax, %rdx			; AVX1-NEXT: movq %rax, %rdx
	; AVX1-NEXT: shlq $63, %rdx			; AVX1-NEXT: shlq $63, %rdx
	; AVX1-NEXT: sarq $63, %rdx			; AVX1-NEXT: sarq $63, %rdx
	; AVX1-NEXT: vmovd %edx, %xmm0			; AVX1-NEXT: vmovd %edx, %xmm0
	; AVX1-NEXT: vpinsrd $1, %ecx, %xmm0, %xmm0			; AVX1-NEXT: vpinsrd $1, %ecx, %xmm0, %xmm0
	; AVX1-NEXT: movq %rax, %rcx			; AVX1-NEXT: movq %rax, %rcx
	; AVX1-NEXT: shlq $61, %rcx			; AVX1-NEXT: shlq $61, %rcx
	; AVX1-NEXT: sarq $63, %rcx			; AVX1-NEXT: sarq $63, %rcx
	; AVX1-NEXT: vpinsrd $2, %ecx, %xmm0, %xmm0			; AVX1-NEXT: vpinsrd $2, %ecx, %xmm0, %xmm0
	; AVX1-NEXT: shlq $60, %rax			; AVX1-NEXT: shlq $60, %rax
	; AVX1-NEXT: sarq $63, %rax			; AVX1-NEXT: sarq $63, %rax
	; AVX1-NEXT: vpinsrd $3, %eax, %xmm0, %xmm0			; AVX1-NEXT: vpinsrd $3, %eax, %xmm0, %xmm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: load_sext_4i1_to_4i32:			; AVX2-LABEL: load_sext_4i1_to_4i32:
	; AVX2: # %bb.0: # %entry			; AVX2: # %bb.0: # %entry
	; AVX2-NEXT: movzbl (%rdi), %eax			; AVX2-NEXT: movl (%rdi), %eax
	; AVX2-NEXT: movq %rax, %rcx			; AVX2-NEXT: movq %rax, %rcx
	; AVX2-NEXT: shlq $62, %rcx			; AVX2-NEXT: shlq $62, %rcx
	; AVX2-NEXT: sarq $63, %rcx			; AVX2-NEXT: sarq $63, %rcx
	; AVX2-NEXT: movq %rax, %rdx			; AVX2-NEXT: movq %rax, %rdx
	; AVX2-NEXT: shlq $63, %rdx			; AVX2-NEXT: shlq $63, %rdx
	; AVX2-NEXT: sarq $63, %rdx			; AVX2-NEXT: sarq $63, %rdx
	; AVX2-NEXT: vmovd %edx, %xmm0			; AVX2-NEXT: vmovd %edx, %xmm0
	; AVX2-NEXT: vpinsrd $1, %ecx, %xmm0, %xmm0			; AVX2-NEXT: vpinsrd $1, %ecx, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 184 Lines • ▼ Show 20 Lines
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[2,2,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[2,2,3,3]
	; SSE41-NEXT: psllq $63, %xmm1			; SSE41-NEXT: psllq $63, %xmm1
	; SSE41-NEXT: psrad $31, %xmm1			; SSE41-NEXT: psrad $31, %xmm1
	; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX1-LABEL: load_sext_4i1_to_4i64:			; AVX1-LABEL: load_sext_4i1_to_4i64:
	; AVX1: # %bb.0: # %entry			; AVX1: # %bb.0: # %entry
	; AVX1-NEXT: movzbl (%rdi), %eax			; AVX1-NEXT: movl (%rdi), %eax
	; AVX1-NEXT: movq %rax, %rcx			; AVX1-NEXT: movq %rax, %rcx
	; AVX1-NEXT: shlq $62, %rcx			; AVX1-NEXT: shlq $62, %rcx
	; AVX1-NEXT: sarq $63, %rcx			; AVX1-NEXT: sarq $63, %rcx
	; AVX1-NEXT: movq %rax, %rdx			; AVX1-NEXT: movq %rax, %rdx
	; AVX1-NEXT: shlq $63, %rdx			; AVX1-NEXT: shlq $63, %rdx
	; AVX1-NEXT: sarq $63, %rdx			; AVX1-NEXT: sarq $63, %rdx
	; AVX1-NEXT: vmovd %edx, %xmm0			; AVX1-NEXT: vmovd %edx, %xmm0
	; AVX1-NEXT: vpinsrd $1, %ecx, %xmm0, %xmm0			; AVX1-NEXT: vpinsrd $1, %ecx, %xmm0, %xmm0
	; AVX1-NEXT: movq %rax, %rcx			; AVX1-NEXT: movq %rax, %rcx
	; AVX1-NEXT: shlq $61, %rcx			; AVX1-NEXT: shlq $61, %rcx
	; AVX1-NEXT: sarq $63, %rcx			; AVX1-NEXT: sarq $63, %rcx
	; AVX1-NEXT: vpinsrd $2, %ecx, %xmm0, %xmm0			; AVX1-NEXT: vpinsrd $2, %ecx, %xmm0, %xmm0
	; AVX1-NEXT: shlq $60, %rax			; AVX1-NEXT: shlq $60, %rax
	; AVX1-NEXT: sarq $63, %rax			; AVX1-NEXT: sarq $63, %rax
	; AVX1-NEXT: vpinsrd $3, %eax, %xmm0, %xmm0			; AVX1-NEXT: vpinsrd $3, %eax, %xmm0, %xmm0
	; AVX1-NEXT: vpmovsxdq %xmm0, %xmm1			; AVX1-NEXT: vpmovsxdq %xmm0, %xmm1
	; AVX1-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[2,3,0,1]			; AVX1-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[2,3,0,1]
	; AVX1-NEXT: vpmovsxdq %xmm0, %xmm0			; AVX1-NEXT: vpmovsxdq %xmm0, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: load_sext_4i1_to_4i64:			; AVX2-LABEL: load_sext_4i1_to_4i64:
	; AVX2: # %bb.0: # %entry			; AVX2: # %bb.0: # %entry
	; AVX2-NEXT: movzbl (%rdi), %eax			; AVX2-NEXT: movl (%rdi), %eax
	; AVX2-NEXT: movq %rax, %rcx			; AVX2-NEXT: movq %rax, %rcx
	; AVX2-NEXT: shlq $60, %rcx			; AVX2-NEXT: shlq $60, %rcx
	; AVX2-NEXT: sarq $63, %rcx			; AVX2-NEXT: sarq $63, %rcx
	; AVX2-NEXT: vmovq %rcx, %xmm0			; AVX2-NEXT: vmovq %rcx, %xmm0
	; AVX2-NEXT: movq %rax, %rcx			; AVX2-NEXT: movq %rax, %rcx
	; AVX2-NEXT: shlq $61, %rcx			; AVX2-NEXT: shlq $61, %rcx
	; AVX2-NEXT: sarq $63, %rcx			; AVX2-NEXT: sarq $63, %rcx
	; AVX2-NEXT: vmovq %rcx, %xmm1			; AVX2-NEXT: vmovq %rcx, %xmm1
	▲ Show 20 Lines • Show All 4,694 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/zext-logicop-shift-load.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc < %s -mtriple=x86_64-unknown-unknown \| FileCheck %s		; RUN: llc < %s -mtriple=x86_64-unknown-unknown \| FileCheck %s


define i64 @test1(i8* %data) {		define i64 @test1(i8* %data) {
; CHECK-LABEL: test1:		; CHECK-LABEL: test1:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: movzbl (%rdi), %eax		; CHECK-NEXT: movl (%rdi), %eax
; CHECK-NEXT: shlq $2, %rax		; CHECK-NEXT: shlq $2, %rax
; CHECK-NEXT: andl $60, %eax		; CHECK-NEXT: andl $60, %eax
; CHECK-NEXT: retq		; CHECK-NEXT: retq
entry:		entry:
%bf.load = load i8, i8* %data, align 4		%bf.load = load i8, i8* %data, align 4
%bf.clear = shl i8 %bf.load, 2		%bf.clear = shl i8 %bf.load, 2
%0 = and i8 %bf.clear, 60		%0 = and i8 %bf.clear, 60
%mul = zext i8 %0 to i64		%mul = zext i8 %0 to i64
ret i64 %mul		ret i64 %mul
}		}

define i8* @test2(i8* %data) {		define i8* @test2(i8* %data) {
; CHECK-LABEL: test2:		; CHECK-LABEL: test2:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: movzbl (%rdi), %eax		; CHECK-NEXT: movl (%rdi), %eax
; CHECK-NEXT: andl $15, %eax		; CHECK-NEXT: andl $15, %eax
; CHECK-NEXT: leaq (%rdi,%rax,4), %rax		; CHECK-NEXT: leaq (%rdi,%rax,4), %rax
; CHECK-NEXT: retq		; CHECK-NEXT: retq
entry:		entry:
%bf.load = load i8, i8* %data, align 4		%bf.load = load i8, i8* %data, align 4
%bf.clear = shl i8 %bf.load, 2		%bf.clear = shl i8 %bf.load, 2
%0 = and i8 %bf.clear, 60		%0 = and i8 %bf.clear, 60
%mul = zext i8 %0 to i64		%mul = zext i8 %0 to i64
Show All 16 Lines	entry:
%0 = xor i8 %bf.clear, 60		%0 = xor i8 %bf.clear, 60
%mul = zext i8 %0 to i64		%mul = zext i8 %0 to i64
ret i64 %mul		ret i64 %mul
}		}

define i64 @test4(i8* %data) {		define i64 @test4(i8* %data) {
; CHECK-LABEL: test4:		; CHECK-LABEL: test4:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: movzbl (%rdi), %eax		; CHECK-NEXT: movl (%rdi), %eax
; CHECK-NEXT: shrq $2, %rax		; CHECK-NEXT: shrq $2, %rax
; CHECK-NEXT: andl $60, %eax		; CHECK-NEXT: andl $60, %eax
; CHECK-NEXT: retq		; CHECK-NEXT: retq
entry:		entry:
%bf.load = load i8, i8* %data, align 4		%bf.load = load i8, i8* %data, align 4
%bf.clear = lshr i8 %bf.load, 2		%bf.clear = lshr i8 %bf.load, 2
%0 = and i8 %bf.clear, 60		%0 = and i8 %bf.clear, 60
%1 = zext i8 %0 to i64		%1 = zext i8 %0 to i64
▲ Show 20 Lines • Show All 51 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Use (SUBREG_TO_REG (MOV32rm)) for extloadi64i8/extloadi64i16 when the load is 4 byte aligned or better and not volatile.ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 194070

llvm/trunk/lib/Target/X86/X86InstrCompiler.td

llvm/trunk/lib/Target/X86/X86InstrInfo.td

llvm/trunk/test/CodeGen/X86/fp128-cast.ll

llvm/trunk/test/CodeGen/X86/vector-sext-widen.ll

llvm/trunk/test/CodeGen/X86/vector-sext.ll

llvm/trunk/test/CodeGen/X86/zext-logicop-shift-load.ll

[X86] Use (SUBREG_TO_REG (MOV32rm)) for extloadi64i8/extloadi64i16 when the load is 4 byte aligned or better and not volatile.
ClosedPublic