This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Target/X86/
-
Target/
-
X86/
3
X86ISelLowering.cpp
-
X86RegisterInfo.td
-
test/CodeGen/X86/
-
CodeGen/
-
X86/
-
atomic_mi.ll
-
avx512-regcall-Mask.ll
-
physreg-pairs-error.ll
2
physreg-pairs.ll
-
unfold-masked-merge-vector-variablemask.ll

Differential D51502

[X86] Fix register resizings for inline assembly register operands.
ClosedPublic

Authored by niravd on Aug 30 2018, 12:14 PM.

Download Raw Diff

Details

Reviewers

eli.friedman
craig.topper
nickdesaulniers

Commits

rG59ad1c845787: [X86] Fix register resizings for inline assembly register operands.
rL342175: [X86] Fix register resizings for inline assembly register operands.

Summary

In the case of a 64-bit value being assigned to a named 32-bit register in 32-bit mode, match GCC's translated assignment to register pairs.

Fixes PR38730.

Diff Detail

Repository

rL LLVM

Build Status

Buildable 22605
Build 22605: arc lint + arc unit

Event Timeline

niravd created this revision.Aug 30 2018, 12:14 PM

Harbormaster completed remote builds in B22110: Diff 163390.Aug 30 2018, 12:14 PM

Herald added a subscriber: hiraditya. · View Herald TranscriptAug 30 2018, 12:14 PM

efriedma added a subscriber: efriedma.Aug 30 2018, 12:24 PM

efriedma added inline comments.

llvm/test/CodeGen/X86/pr38730.ll
22 ↗	(On Diff #163390)	Shouldn't this be an error? I can't see how it's possible to put a 64-bit value into edx.

srhines added a subscriber: srhines.Aug 30 2018, 1:09 PM

srhines added inline comments.

llvm/test/CodeGen/X86/pr38730.ll
22 ↗	(On Diff #163390)	GCC issues a warning for this, but then uses two registers (one being the specified edx).

nickdesaulniers added inline comments.Aug 30 2018, 1:21 PM

llvm/test/CodeGen/X86/pr38730.ll
22 ↗	(On Diff #163390)	See also: https://lore.kernel.org/patchwork/patch/403136/

nickdesaulniers added a reviewer: nickdesaulniers.Aug 30 2018, 1:27 PM

nickdesaulniers added inline comments.

llvm/lib/Target/X86/X86ISelLowering.cpp
41122	trailing whitespace

I tested and can verify that this patch fixes the crash in the compiler. I think we chose a different second register in this case than GCC does; maybe that's ok?

If someone is doing this, and intentionally ignoring gcc's warning, I think we have to assume they're depending on gcc's register choices. So we should either reject or match gcc.

Testing this patch locally, I think the register choice is indeed important. Consider the following test case:

long long foo () {
    register long long x asm("edx");
    asm("call bar": "=r"(x));
    return x;
}

long long bar () {
    return 0x0011223344556677;
}

GCC produces the following disassembly:

00000000 <foo>:
   0:	e8 fc ff ff ff       	call   1 <foo+0x1>
   5:	89 d0                	mov    %edx,%eax
   7:	89 ca                	mov    %ecx,%edx
   9:	c3                   	ret    
   a:	8d b6 00 00 00 00    	lea    0x0(%esi),%esi

00000010 <bar>:
  10:	b8 77 66 55 44       	mov    $0x44556677,%eax
  15:	ba 33 22 11 00       	mov    $0x112233,%edx
  1a:	c3

Clang+this patch produces the following disassembly (with my annotations, read bar first, then foo):

00000000 <foo>:
   0:	56                   	push   %esi
   1:	e8 0a 00 00 00       	call   10 <bar>
  // are we clobbering one of the two return registers here?
   6:	89 d0                	mov    %edx,%eax
   8:	89 f2                	mov    %esi,%edx
   a:	5e                   	pop    %esi
   b:	c3                   	ret    
   c:	0f 1f 40 00          	nopl   0x0(%eax)

00000010 <bar>:
  // ok so 64b return values are passed in %eax, then %edx for -m32.
  10:	b8 77 66 55 44       	mov    $0x44556677,%eax
  15:	ba 33 22 11 00       	mov    $0x112233,%edx
  1a:	c3                   	ret

Match GCC's register assignment behavior. This causes some minor test case reordering from the introduced register classes. Interestingly unfold-masked-merge-vector-variablemask.ll has slightly fewer spills.

I'm working on a follow up patch to add warnings for these cases, but this should be okay to go in now.

The behavior of this version of this patch is not quite right just yet, in terms of matching GCC's curious behavior.

Consider my test case from the above comment again:

// cc -O3 -m32 -c -o edx.o
long long foo () {
    register long long x asm("edx");
    asm("call bar": "=r"(x));
    return x;
}

long long bar () {
    return 0x0011223344556677;
}

gcc produces the following disassembly:

; objdump -Dr edx.o
00000000 <foo>:
   0:   e8 fc ff ff ff          call   1 <foo+0x1>
                        1: R_386_PC32   bar
   5:   89 d0                   mov    %edx,%eax
   7:   89 ca                   mov    %ecx,%edx
   9:   c3                      ret

while Clang plus this version of this patch produces:

00000000 <foo>:
   0:   53                      push   %ebx
   1:   56                      push   %esi
   2:   e8 09 00 00 00          call   10 <bar>
   7:   89 d8                   mov    %ebx,%eax
   9:   89 f2                   mov    %esi,%edx
   b:   5e                      pop    %esi
   c:   5b                      pop    %ebx
   d:   c3                      ret

It seems for 32b x86, when returning 64b, the lower 32b is returned in %eax and the upper 32b in %edx, which both compilers get correct here. What differs is the source registers of the output argument to the inline asm block.

To see why this is critical, the crashing test case for the bugreport in 36378 is from the Linux kernel's __get_user_8 function, which is defined in arch/x86/lib/getuser.S. Specifically the comment:

Outputs: ...
%[r|e]dx contains zero-extended value
%ecx contains the high half for 32-bit __get_user_8

So in order to support this unspecified calling convention, it's critical that we read from %ecx for the upper 32b, and %edx for the lower 32b following the call. From GCC's disassembly, you can see this in the source of the movs (left operand) after the call.

Huh. It looks like I commited a partial patch change. The uploaded patch has only some of my change to remove the remove breaks from the switch. The EAX, EDX, and ECX cases should have also be returns (or at least have breaks). Corrected patch here.

There we go, clang now even produces one less relocation than gcc, but otherwise the same instructions, from my test case:

00000000 <foo>:
   0:   e8 0b 00 00 00          call   10 <bar>
   5:   89 d0                   mov    %edx,%eax
   7:   89 ca                   mov    %ecx,%edx
   9:   c3                      ret

The disassembly of individual translation units from the Linux kernel also looks correct, though clang has other issues compiling a working 32b x86 Linux kernel, so I can't test this completely. But based on the smaller cases, this code looks correct.

Thanks Nirav!

llvm/test/CodeGen/X86/physreg-pairs.ll
4	`GCC's` `values to`
6	I find this sentence slightly hard to follow. Would you mind rewording it to something along the lines of: To match GCC's behavior in assigning 64-bit values to a 32-bit register, we bind the pair (the given register, the following register) from the sequence EAX, EDX, ECX, EBX, ESI, EDI, EBP, ESP, to the value. There is no wrapping from the sequence, so this will fail given ESP.

This revision is now accepted and ready to land.Sep 13 2018, 12:43 PM

xbolva00 added a subscriber: xbolva00.Sep 13 2018, 12:50 PM

xbolva00 added inline comments.

llvm/lib/Target/X86/X86ISelLowering.cpp
41225	if (Size == 64

nickdesaulniers added inline comments.Sep 13 2018, 12:52 PM

llvm/lib/Target/X86/X86ISelLowering.cpp
41225	space between `//` and `Model`?

Closed by commit rL342175: [X86] Fix register resizings for inline assembly register operands. (authored by niravd). · Explain WhySep 13 2018, 1:35 PM

This revision was automatically updated to reflect the committed changes.

Isn't this fix about inline assembly? Why do we see all the scheduling/regalloc changes here?

Yes, this is a fix to match GCC's register assignment for a 64-bit in
32-bit mode to pairs of registers.

I haven't looked too deeply into the details, but register allocation order
is sensitive to the register classes (I think by way of register pressure)
which is why the additional register classes are able to change our
selection bias between 32-bit registers and 8-bits.

Revision Contents

Path

Size

llvm/

lib/

Target/

X86/

X86ISelLowering.cpp

35 lines

X86RegisterInfo.td

10 lines

test/

CodeGen/

X86/

atomic_mi.ll

2 lines

avx512-regcall-Mask.ll

160 lines

physreg-pairs-error.ll

12 lines

physreg-pairs.ll

164 lines

unfold-masked-merge-vector-variablemask.ll

256 lines

Diff 165332

llvm/lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 32,659 Lines • ▼ Show 20 Lines
	case 't':			case 't':
	case '2':			case '2':
	return getRegForInlineAsmConstraint(TRI, "Y", VT);			return getRegForInlineAsmConstraint(TRI, "Y", VT);
	case 'm':			case 'm':
	if (!Subtarget.hasMMX()) break;			if (!Subtarget.hasMMX()) break;
	return std::make_pair(0U, &X86::VR64RegClass);			return std::make_pair(0U, &X86::VR64RegClass);
	case 'z':			case 'z':
	case '0':			case '0':
	if (!Subtarget.hasSSE1()) break;			if (!Subtarget.hasSSE1()) break;
				nickdesaulniersUnsubmitted Not Done Reply Inline Actions trailing whitespace nickdesaulniers: trailing whitespace
	return std::make_pair(X86::XMM0, &X86::VR128RegClass);			return std::make_pair(X86::XMM0, &X86::VR128RegClass);
	case 'k':			case 'k':
	// This register class doesn't allocate k0 for masked vector operation.			// This register class doesn't allocate k0 for masked vector operation.
	if (Subtarget.hasAVX512()) { // Only supported in AVX512.			if (Subtarget.hasAVX512()) { // Only supported in AVX512.
	switch (VT.SimpleTy) {			switch (VT.SimpleTy) {
	default: break;			default: break;
	case MVT::i32:			case MVT::i32:
	return std::make_pair(0U, &X86::VK32WMRegClass);			return std::make_pair(0U, &X86::VK32WMRegClass);
	▲ Show 20 Lines • Show All 83 Lines • ▼ Show 20 Lines
	if (Size == 1) Size = 8;			if (Size == 1) Size = 8;
	unsigned DestReg = getX86SubSuperRegisterOrZero(Res.first, Size);			unsigned DestReg = getX86SubSuperRegisterOrZero(Res.first, Size);
	if (DestReg > 0) {			if (DestReg > 0) {
	bool is64Bit = Subtarget.is64Bit();			bool is64Bit = Subtarget.is64Bit();
	const TargetRegisterClass *RC =			const TargetRegisterClass *RC =
	Size == 8 ? (is64Bit ? &X86::GR8RegClass : &X86::GR8_NOREXRegClass)			Size == 8 ? (is64Bit ? &X86::GR8RegClass : &X86::GR8_NOREXRegClass)
	: Size == 16 ? (is64Bit ? &X86::GR16RegClass : &X86::GR16_NOREXRegClass)			: Size == 16 ? (is64Bit ? &X86::GR16RegClass : &X86::GR16_NOREXRegClass)
	: Size == 32 ? (is64Bit ? &X86::GR32RegClass : &X86::GR32_NOREXRegClass)			: Size == 32 ? (is64Bit ? &X86::GR32RegClass : &X86::GR32_NOREXRegClass)
	: &X86::GR64RegClass;			: Size == 64 ? (is64Bit ? &X86::GR64RegClass : nullptr)
	if (RC->contains(DestReg))			: nullptr;
	Res = std::make_pair(DestReg, RC);			if (Size==64 && !is64Bit) {
	} else {			//Model GCC's behavior here and select a fixed pair of 32-bit registers.
				xbolva00Unsubmitted Not Done Reply Inline Actions if (Size == 64 xbolva00: if (Size == 64
				nickdesaulniersUnsubmitted Not Done Reply Inline Actions space between `//` and `Model`? nickdesaulniers: space between `//` and `Model`?
	// No register found/type mismatch.			switch (Res.first) {
	Res.first = 0;			case X86::EAX:
	Res.second = nullptr;			return std::make_pair(X86::EAX, &X86::GR32_ADRegClass);
				case X86::EDX:
				return std::make_pair(X86::EDX, &X86::GR32_DCRegClass);
				case X86::ECX:
				return std::make_pair(X86::ECX, &X86::GR32_CBRegClass);
				case X86::EBX:
				return std::make_pair(X86::EBX, &X86::GR32_BSIRegClass);
				case X86::ESI:
				return std::make_pair(X86::ESI, &X86::GR32_SIDIRegClass);
				case X86::EDI:
				return std::make_pair(X86::EDI, &X86::GR32_DIBPRegClass);
				case X86::EBP:
				return std::make_pair(X86::EBP, &X86::GR32_BPSPRegClass);
				default:
				return std::make_pair(0, nullptr);
				}
				}
				if (RC && RC->contains(DestReg))
				return std::make_pair(DestReg, RC);
				return Res;
	}			}
				// No register found/type mismatch.
				return std::make_pair(0, nullptr);
	} else if (isFRClass(*Class)) {			} else if (isFRClass(*Class)) {
	// Handle references to XMM physical registers that got mapped into the			// Handle references to XMM physical registers that got mapped into the
	// wrong class. This can happen with constraints like {xmm0} where the			// wrong class. This can happen with constraints like {xmm0} where the
	// target independent register mapper will just pick the first match it can			// target independent register mapper will just pick the first match it can
	// find, ignoring the required type.			// find, ignoring the required type.

	// TODO: Handle f128 and i128 in FR128RegClass after it is tested well.			// TODO: Handle f128 and i128 in FR128RegClass after it is tested well.
	if (VT == MVT::f32 \|\| VT == MVT::i32)			if (VT == MVT::f32 \|\| VT == MVT::i32)
	▲ Show 20 Lines • Show All 132 Lines • Show Last 20 Lines

llvm/lib/Target/X86/X86RegisterInfo.td

	Show First 20 Lines • Show All 493 Lines • ▼ Show 20 Lines
	// on memory consumption.			// on memory consumption.
	def LOW32_ADDR_ACCESS_RBP : RegisterClass<"X86", [i32], 32,			def LOW32_ADDR_ACCESS_RBP : RegisterClass<"X86", [i32], 32,
	(add LOW32_ADDR_ACCESS, RBP)>;			(add LOW32_ADDR_ACCESS, RBP)>;

	// A class to support the 'A' assembler constraint: [ER]AX then [ER]DX.			// A class to support the 'A' assembler constraint: [ER]AX then [ER]DX.
	def GR32_AD : RegisterClass<"X86", [i32], 32, (add EAX, EDX)>;			def GR32_AD : RegisterClass<"X86", [i32], 32, (add EAX, EDX)>;
	def GR64_AD : RegisterClass<"X86", [i64], 64, (add RAX, RDX)>;			def GR64_AD : RegisterClass<"X86", [i64], 64, (add RAX, RDX)>;

				// Classes to support the 64-bit assembler constraint tied to a fixed
				// register in 32-bit mode. The second register is always the next in
				// the list. Wrap around causes an error.
				def GR32_DC : RegisterClass<"X86", [i32], 32, (add EDX, ECX)>;
				def GR32_CB : RegisterClass<"X86", [i32], 32, (add ECX, EBX)>;
				def GR32_BSI : RegisterClass<"X86", [i32], 32, (add EBX, ESI)>;
				def GR32_SIDI : RegisterClass<"X86", [i32], 32, (add ESI, EDI)>;
				def GR32_DIBP : RegisterClass<"X86", [i32], 32, (add EDI, EBP)>;
				def GR32_BPSP : RegisterClass<"X86", [i32], 32, (add EBP, ESP)>;

	// Scalar SSE2 floating point registers.			// Scalar SSE2 floating point registers.
	def FR32 : RegisterClass<"X86", [f32], 32, (sequence "XMM%u", 0, 15)>;			def FR32 : RegisterClass<"X86", [f32], 32, (sequence "XMM%u", 0, 15)>;

	def FR64 : RegisterClass<"X86", [f64], 64, (add FR32)>;			def FR64 : RegisterClass<"X86", [f64], 64, (add FR32)>;


	// FIXME: This sets up the floating point register files as though they are f64			// FIXME: This sets up the floating point register files as though they are f64
	// values, though they really are f80 values. This will cause us to spill			// values, though they really are f80 values. This will cause us to spill
	▲ Show 20 Lines • Show All 82 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/atomic_mi.ll

	Show First 20 Lines • Show All 2,239 Lines • ▼ Show 20 Lines
	; X32-NEXT: pushl %edi			; X32-NEXT: pushl %edi
	; X32-NEXT: pushl %esi			; X32-NEXT: pushl %esi
	; X32-NEXT: andl $-8, %esp			; X32-NEXT: andl $-8, %esp
	; X32-NEXT: subl $24, %esp			; X32-NEXT: subl $24, %esp
	; X32-NEXT: .cfi_offset %esi, -20			; X32-NEXT: .cfi_offset %esi, -20
	; X32-NEXT: .cfi_offset %edi, -16			; X32-NEXT: .cfi_offset %edi, -16
	; X32-NEXT: .cfi_offset %ebx, -12			; X32-NEXT: .cfi_offset %ebx, -12
	; X32-NEXT: movl 20(%ebp), %esi			; X32-NEXT: movl 20(%ebp), %esi
	; X32-NEXT: movl 8(%ebp), %edi
	; X32-NEXT: xorl %eax, %eax			; X32-NEXT: xorl %eax, %eax
	; X32-NEXT: xorl %edx, %edx			; X32-NEXT: xorl %edx, %edx
	; X32-NEXT: xorl %ecx, %ecx			; X32-NEXT: xorl %ecx, %ecx
	; X32-NEXT: xorl %ebx, %ebx			; X32-NEXT: xorl %ebx, %ebx
				; X32-NEXT: movl 8(%ebp), %edi
	; X32-NEXT: lock cmpxchg8b (%edi,%esi,8)			; X32-NEXT: lock cmpxchg8b (%edi,%esi,8)
	; X32-NEXT: movl %edx, {{[0-9]+}}(%esp)			; X32-NEXT: movl %edx, {{[0-9]+}}(%esp)
	; X32-NEXT: movl %eax, {{[0-9]+}}(%esp)			; X32-NEXT: movl %eax, {{[0-9]+}}(%esp)
	; X32-NEXT: fldl {{[0-9]+}}(%esp)			; X32-NEXT: fldl {{[0-9]+}}(%esp)
	; X32-NEXT: faddl 12(%ebp)			; X32-NEXT: faddl 12(%ebp)
	; X32-NEXT: fstpl (%esp)			; X32-NEXT: fstpl (%esp)
	; X32-NEXT: movl (%esp), %ebx			; X32-NEXT: movl (%esp), %ebx
	; X32-NEXT: movl {{[0-9]+}}(%esp), %ecx			; X32-NEXT: movl {{[0-9]+}}(%esp), %ecx
	Show All 25 Lines

llvm/test/CodeGen/X86/avx512-regcall-Mask.ll

	Show First 20 Lines • Show All 123 Lines • ▼ Show 20 Lines
	; WIN64-NEXT: pushq %r12			; WIN64-NEXT: pushq %r12
	; WIN64-NEXT: .seh_pushreg 12			; WIN64-NEXT: .seh_pushreg 12
	; WIN64-NEXT: pushq %rsi			; WIN64-NEXT: pushq %rsi
	; WIN64-NEXT: .seh_pushreg 6			; WIN64-NEXT: .seh_pushreg 6
	; WIN64-NEXT: pushq %rdi			; WIN64-NEXT: pushq %rdi
	; WIN64-NEXT: .seh_pushreg 7			; WIN64-NEXT: .seh_pushreg 7
	; WIN64-NEXT: subq $48, %rsp			; WIN64-NEXT: subq $48, %rsp
	; WIN64-NEXT: .seh_stackalloc 48			; WIN64-NEXT: .seh_stackalloc 48
	; WIN64-NEXT: vmovaps %xmm7, {{[0-9]+}}(%rsp) # 16-byte Spill			; WIN64-NEXT: vmovaps %xmm7, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; WIN64-NEXT: .seh_savexmm 7, 32			; WIN64-NEXT: .seh_savexmm 7, 32
	; WIN64-NEXT: vmovaps %xmm6, {{[0-9]+}}(%rsp) # 16-byte Spill			; WIN64-NEXT: vmovaps %xmm6, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; WIN64-NEXT: .seh_savexmm 6, 16			; WIN64-NEXT: .seh_savexmm 6, 16
	; WIN64-NEXT: .seh_endprologue			; WIN64-NEXT: .seh_endprologue
	; WIN64-NEXT: movabsq $4294967298, %rax # imm = 0x100000002			; WIN64-NEXT: movabsq $4294967298, %rax # imm = 0x100000002
	; WIN64-NEXT: movq %rax, (%rsp)			; WIN64-NEXT: movq %rax, (%rsp)
	; WIN64-NEXT: movq %rax, %rcx			; WIN64-NEXT: movq %rax, %rcx
	; WIN64-NEXT: movq %rax, %rdx			; WIN64-NEXT: movq %rax, %rdx
	; WIN64-NEXT: movq %rax, %rdi			; WIN64-NEXT: movq %rax, %rdi
	; WIN64-NEXT: movq %rax, %rsi
	; WIN64-NEXT: movq %rax, %r8			; WIN64-NEXT: movq %rax, %r8
	; WIN64-NEXT: movq %rax, %r9			; WIN64-NEXT: movq %rax, %r9
	; WIN64-NEXT: movq %rax, %r10			; WIN64-NEXT: movq %rax, %r10
	; WIN64-NEXT: movq %rax, %r11			; WIN64-NEXT: movq %rax, %r11
	; WIN64-NEXT: movq %rax, %r12			; WIN64-NEXT: movq %rax, %r12
	; WIN64-NEXT: movq %rax, %r14			; WIN64-NEXT: movq %rax, %r14
	; WIN64-NEXT: movq %rax, %r15			; WIN64-NEXT: movq %rax, %r15
				; WIN64-NEXT: movq %rax, %rsi
	; WIN64-NEXT: callq test_argv64i1			; WIN64-NEXT: callq test_argv64i1
	; WIN64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm6 # 16-byte Reload			; WIN64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm6 # 16-byte Reload
	; WIN64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm7 # 16-byte Reload			; WIN64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm7 # 16-byte Reload
	; WIN64-NEXT: addq $48, %rsp			; WIN64-NEXT: addq $48, %rsp
	; WIN64-NEXT: popq %rdi			; WIN64-NEXT: popq %rdi
	; WIN64-NEXT: popq %rsi			; WIN64-NEXT: popq %rsi
	; WIN64-NEXT: popq %r12			; WIN64-NEXT: popq %r12
	; WIN64-NEXT: popq %r14			; WIN64-NEXT: popq %r14
	; WIN64-NEXT: popq %r15			; WIN64-NEXT: popq %r15
	; WIN64-NEXT: retq			; WIN64-NEXT: retq
	; WIN64-NEXT: .seh_handlerdata			; WIN64-NEXT: .seh_handlerdata
	Show All 15 Lines
	; LINUXOSX64-NEXT: .cfi_offset %r12, -40			; LINUXOSX64-NEXT: .cfi_offset %r12, -40
	; LINUXOSX64-NEXT: .cfi_offset %r13, -32			; LINUXOSX64-NEXT: .cfi_offset %r13, -32
	; LINUXOSX64-NEXT: .cfi_offset %r14, -24			; LINUXOSX64-NEXT: .cfi_offset %r14, -24
	; LINUXOSX64-NEXT: .cfi_offset %r15, -16			; LINUXOSX64-NEXT: .cfi_offset %r15, -16
	; LINUXOSX64-NEXT: movabsq $4294967298, %rax # imm = 0x100000002			; LINUXOSX64-NEXT: movabsq $4294967298, %rax # imm = 0x100000002
	; LINUXOSX64-NEXT: movq %rax, %rcx			; LINUXOSX64-NEXT: movq %rax, %rcx
	; LINUXOSX64-NEXT: movq %rax, %rdx			; LINUXOSX64-NEXT: movq %rax, %rdx
	; LINUXOSX64-NEXT: movq %rax, %rdi			; LINUXOSX64-NEXT: movq %rax, %rdi
	; LINUXOSX64-NEXT: movq %rax, %rsi
	; LINUXOSX64-NEXT: movq %rax, %r8			; LINUXOSX64-NEXT: movq %rax, %r8
	; LINUXOSX64-NEXT: movq %rax, %r9			; LINUXOSX64-NEXT: movq %rax, %r9
	; LINUXOSX64-NEXT: movq %rax, %r12			; LINUXOSX64-NEXT: movq %rax, %r12
	; LINUXOSX64-NEXT: movq %rax, %r13			; LINUXOSX64-NEXT: movq %rax, %r13
	; LINUXOSX64-NEXT: movq %rax, %r14			; LINUXOSX64-NEXT: movq %rax, %r14
	; LINUXOSX64-NEXT: movq %rax, %r15			; LINUXOSX64-NEXT: movq %rax, %r15
				; LINUXOSX64-NEXT: movq %rax, %rsi
	; LINUXOSX64-NEXT: pushq %rax			; LINUXOSX64-NEXT: pushq %rax
	; LINUXOSX64-NEXT: .cfi_adjust_cfa_offset 8			; LINUXOSX64-NEXT: .cfi_adjust_cfa_offset 8
	; LINUXOSX64-NEXT: pushq %rax			; LINUXOSX64-NEXT: pushq %rax
	; LINUXOSX64-NEXT: .cfi_adjust_cfa_offset 8			; LINUXOSX64-NEXT: .cfi_adjust_cfa_offset 8
	; LINUXOSX64-NEXT: callq test_argv64i1			; LINUXOSX64-NEXT: callq test_argv64i1
	; LINUXOSX64-NEXT: addq $24, %rsp			; LINUXOSX64-NEXT: addq $24, %rsp
	; LINUXOSX64-NEXT: .cfi_adjust_cfa_offset -24			; LINUXOSX64-NEXT: .cfi_adjust_cfa_offset -24
	; LINUXOSX64-NEXT: popq %r12			; LINUXOSX64-NEXT: popq %r12
	▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
	; WIN64-LABEL: caller_retv64i1:			; WIN64-LABEL: caller_retv64i1:
	; WIN64: # %bb.0: # %entry			; WIN64: # %bb.0: # %entry
	; WIN64-NEXT: pushq %rsi			; WIN64-NEXT: pushq %rsi
	; WIN64-NEXT: .seh_pushreg 6			; WIN64-NEXT: .seh_pushreg 6
	; WIN64-NEXT: pushq %rdi			; WIN64-NEXT: pushq %rdi
	; WIN64-NEXT: .seh_pushreg 7			; WIN64-NEXT: .seh_pushreg 7
	; WIN64-NEXT: subq $40, %rsp			; WIN64-NEXT: subq $40, %rsp
	; WIN64-NEXT: .seh_stackalloc 40			; WIN64-NEXT: .seh_stackalloc 40
	; WIN64-NEXT: vmovaps %xmm7, {{[0-9]+}}(%rsp) # 16-byte Spill			; WIN64-NEXT: vmovaps %xmm7, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; WIN64-NEXT: .seh_savexmm 7, 16			; WIN64-NEXT: .seh_savexmm 7, 16
	; WIN64-NEXT: vmovaps %xmm6, (%rsp) # 16-byte Spill			; WIN64-NEXT: vmovaps %xmm6, (%rsp) # 16-byte Spill
	; WIN64-NEXT: .seh_savexmm 6, 0			; WIN64-NEXT: .seh_savexmm 6, 0
	; WIN64-NEXT: .seh_endprologue			; WIN64-NEXT: .seh_endprologue
	; WIN64-NEXT: callq test_retv64i1			; WIN64-NEXT: callq test_retv64i1
	; WIN64-NEXT: kmovq %rax, %k0			; WIN64-NEXT: kmovq %rax, %k0
	; WIN64-NEXT: vpmovm2b %k0, %zmm0			; WIN64-NEXT: vpmovm2b %k0, %zmm0
	; WIN64-NEXT: vmovaps (%rsp), %xmm6 # 16-byte Reload			; WIN64-NEXT: vmovaps (%rsp), %xmm6 # 16-byte Reload
	; WIN64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm7 # 16-byte Reload			; WIN64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm7 # 16-byte Reload
	; WIN64-NEXT: addq $40, %rsp			; WIN64-NEXT: addq $40, %rsp
	; WIN64-NEXT: popq %rdi			; WIN64-NEXT: popq %rdi
	; WIN64-NEXT: popq %rsi			; WIN64-NEXT: popq %rsi
	; WIN64-NEXT: retq			; WIN64-NEXT: retq
	; WIN64-NEXT: .seh_handlerdata			; WIN64-NEXT: .seh_handlerdata
	; WIN64-NEXT: .text			; WIN64-NEXT: .text
	; WIN64-NEXT: .seh_endproc			; WIN64-NEXT: .seh_endproc
	;			;
	Show All 14 Lines

	; Test regcall when receiving arguments of v32i1 type			; Test regcall when receiving arguments of v32i1 type
	declare i32 @test_argv32i1helper(<32 x i1> %x0, <32 x i1> %x1, <32 x i1> %x2)			declare i32 @test_argv32i1helper(<32 x i1> %x0, <32 x i1> %x1, <32 x i1> %x2)
	define x86_regcallcc i32 @test_argv32i1(<32 x i1> %x0, <32 x i1> %x1, <32 x i1> %x2) {			define x86_regcallcc i32 @test_argv32i1(<32 x i1> %x0, <32 x i1> %x1, <32 x i1> %x2) {
	; X32-LABEL: test_argv32i1:			; X32-LABEL: test_argv32i1:
	; X32: # %bb.0: # %entry			; X32: # %bb.0: # %entry
	; X32-NEXT: pushl %esp			; X32-NEXT: pushl %esp
	; X32-NEXT: subl $72, %esp			; X32-NEXT: subl $72, %esp
	; X32-NEXT: vmovups %xmm7, {{[0-9]+}}(%esp) # 16-byte Spill			; X32-NEXT: vmovups %xmm7, {{[-0-9]+}}(%e{{[sb]}}p) # 16-byte Spill
	; X32-NEXT: vmovups %xmm6, {{[0-9]+}}(%esp) # 16-byte Spill			; X32-NEXT: vmovups %xmm6, {{[-0-9]+}}(%e{{[sb]}}p) # 16-byte Spill
	; X32-NEXT: vmovups %xmm5, {{[0-9]+}}(%esp) # 16-byte Spill			; X32-NEXT: vmovups %xmm5, {{[-0-9]+}}(%e{{[sb]}}p) # 16-byte Spill
	; X32-NEXT: vmovups %xmm4, (%esp) # 16-byte Spill			; X32-NEXT: vmovups %xmm4, (%esp) # 16-byte Spill
	; X32-NEXT: kmovd %edx, %k0			; X32-NEXT: kmovd %edx, %k0
	; X32-NEXT: kmovd %ecx, %k1			; X32-NEXT: kmovd %ecx, %k1
	; X32-NEXT: kmovd %eax, %k2			; X32-NEXT: kmovd %eax, %k2
	; X32-NEXT: vpmovm2b %k2, %zmm0			; X32-NEXT: vpmovm2b %k2, %zmm0
	; X32-NEXT: vpmovm2b %k1, %zmm1			; X32-NEXT: vpmovm2b %k1, %zmm1
	; X32-NEXT: vpmovm2b %k0, %zmm2			; X32-NEXT: vpmovm2b %k0, %zmm2
	; X32-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0			; X32-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0
	; X32-NEXT: # kill: def $ymm1 killed $ymm1 killed $zmm1			; X32-NEXT: # kill: def $ymm1 killed $ymm1 killed $zmm1
	; X32-NEXT: # kill: def $ymm2 killed $ymm2 killed $zmm2			; X32-NEXT: # kill: def $ymm2 killed $ymm2 killed $zmm2
	; X32-NEXT: calll _test_argv32i1helper			; X32-NEXT: calll _test_argv32i1helper
	; X32-NEXT: vmovups (%esp), %xmm4 # 16-byte Reload			; X32-NEXT: vmovups (%esp), %xmm4 # 16-byte Reload
	; X32-NEXT: vmovups {{[0-9]+}}(%esp), %xmm5 # 16-byte Reload			; X32-NEXT: vmovups {{[-0-9]+}}(%e{{[sb]}}p), %xmm5 # 16-byte Reload
	; X32-NEXT: vmovups {{[0-9]+}}(%esp), %xmm6 # 16-byte Reload			; X32-NEXT: vmovups {{[-0-9]+}}(%e{{[sb]}}p), %xmm6 # 16-byte Reload
	; X32-NEXT: vmovups {{[0-9]+}}(%esp), %xmm7 # 16-byte Reload			; X32-NEXT: vmovups {{[-0-9]+}}(%e{{[sb]}}p), %xmm7 # 16-byte Reload
	; X32-NEXT: addl $72, %esp			; X32-NEXT: addl $72, %esp
	; X32-NEXT: popl %esp			; X32-NEXT: popl %esp
	; X32-NEXT: vzeroupper			; X32-NEXT: vzeroupper
	; X32-NEXT: retl			; X32-NEXT: retl
	;			;
	; WIN64-LABEL: test_argv32i1:			; WIN64-LABEL: test_argv32i1:
	; WIN64: # %bb.0: # %entry			; WIN64: # %bb.0: # %entry
	; WIN64-NEXT: pushq %r11			; WIN64-NEXT: pushq %r11
	Show All 26 Lines
	; WIN64-NEXT: .text			; WIN64-NEXT: .text
	; WIN64-NEXT: .seh_endproc			; WIN64-NEXT: .seh_endproc
	;			;
	; LINUXOSX64-LABEL: test_argv32i1:			; LINUXOSX64-LABEL: test_argv32i1:
	; LINUXOSX64: # %bb.0: # %entry			; LINUXOSX64: # %bb.0: # %entry
	; LINUXOSX64-NEXT: pushq %rsp			; LINUXOSX64-NEXT: pushq %rsp
	; LINUXOSX64-NEXT: .cfi_def_cfa_offset 16			; LINUXOSX64-NEXT: .cfi_def_cfa_offset 16
	; LINUXOSX64-NEXT: subq $128, %rsp			; LINUXOSX64-NEXT: subq $128, %rsp
	; LINUXOSX64-NEXT: vmovaps %xmm15, {{[0-9]+}}(%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm15, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; LINUXOSX64-NEXT: vmovaps %xmm14, {{[0-9]+}}(%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm14, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; LINUXOSX64-NEXT: vmovaps %xmm13, {{[0-9]+}}(%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm13, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; LINUXOSX64-NEXT: vmovaps %xmm12, {{[0-9]+}}(%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm12, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; LINUXOSX64-NEXT: vmovaps %xmm11, {{[0-9]+}}(%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm11, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; LINUXOSX64-NEXT: vmovaps %xmm10, {{[0-9]+}}(%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm10, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; LINUXOSX64-NEXT: vmovaps %xmm9, {{[0-9]+}}(%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm9, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; LINUXOSX64-NEXT: vmovaps %xmm8, (%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm8, (%rsp) # 16-byte Spill
	; LINUXOSX64-NEXT: .cfi_def_cfa_offset 144			; LINUXOSX64-NEXT: .cfi_def_cfa_offset 144
	; LINUXOSX64-NEXT: .cfi_offset %rsp, -16			; LINUXOSX64-NEXT: .cfi_offset %rsp, -16
	; LINUXOSX64-NEXT: .cfi_offset %xmm8, -144			; LINUXOSX64-NEXT: .cfi_offset %xmm8, -144
	; LINUXOSX64-NEXT: .cfi_offset %xmm9, -128			; LINUXOSX64-NEXT: .cfi_offset %xmm9, -128
	; LINUXOSX64-NEXT: .cfi_offset %xmm10, -112			; LINUXOSX64-NEXT: .cfi_offset %xmm10, -112
	; LINUXOSX64-NEXT: .cfi_offset %xmm11, -96			; LINUXOSX64-NEXT: .cfi_offset %xmm11, -96
	; LINUXOSX64-NEXT: .cfi_offset %xmm12, -80			; LINUXOSX64-NEXT: .cfi_offset %xmm12, -80
	; LINUXOSX64-NEXT: .cfi_offset %xmm13, -64			; LINUXOSX64-NEXT: .cfi_offset %xmm13, -64
	; LINUXOSX64-NEXT: .cfi_offset %xmm14, -48			; LINUXOSX64-NEXT: .cfi_offset %xmm14, -48
	; LINUXOSX64-NEXT: .cfi_offset %xmm15, -32			; LINUXOSX64-NEXT: .cfi_offset %xmm15, -32
	; LINUXOSX64-NEXT: kmovd %edx, %k0			; LINUXOSX64-NEXT: kmovd %edx, %k0
	; LINUXOSX64-NEXT: kmovd %ecx, %k1			; LINUXOSX64-NEXT: kmovd %ecx, %k1
	; LINUXOSX64-NEXT: kmovd %eax, %k2			; LINUXOSX64-NEXT: kmovd %eax, %k2
	; LINUXOSX64-NEXT: vpmovm2b %k2, %zmm0			; LINUXOSX64-NEXT: vpmovm2b %k2, %zmm0
	; LINUXOSX64-NEXT: vpmovm2b %k1, %zmm1			; LINUXOSX64-NEXT: vpmovm2b %k1, %zmm1
	; LINUXOSX64-NEXT: vpmovm2b %k0, %zmm2			; LINUXOSX64-NEXT: vpmovm2b %k0, %zmm2
	; LINUXOSX64-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0			; LINUXOSX64-NEXT: # kill: def $ymm0 killed $ymm0 killed $zmm0
	; LINUXOSX64-NEXT: # kill: def $ymm1 killed $ymm1 killed $zmm1			; LINUXOSX64-NEXT: # kill: def $ymm1 killed $ymm1 killed $zmm1
	; LINUXOSX64-NEXT: # kill: def $ymm2 killed $ymm2 killed $zmm2			; LINUXOSX64-NEXT: # kill: def $ymm2 killed $ymm2 killed $zmm2
	; LINUXOSX64-NEXT: callq test_argv32i1helper			; LINUXOSX64-NEXT: callq test_argv32i1helper
	; LINUXOSX64-NEXT: vmovaps (%rsp), %xmm8 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps (%rsp), %xmm8 # 16-byte Reload
	; LINUXOSX64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm9 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm9 # 16-byte Reload
	; LINUXOSX64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm10 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm10 # 16-byte Reload
	; LINUXOSX64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm11 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm11 # 16-byte Reload
	; LINUXOSX64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm12 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm12 # 16-byte Reload
	; LINUXOSX64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm13 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm13 # 16-byte Reload
	; LINUXOSX64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm14 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm14 # 16-byte Reload
	; LINUXOSX64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm15 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm15 # 16-byte Reload
	; LINUXOSX64-NEXT: addq $128, %rsp			; LINUXOSX64-NEXT: addq $128, %rsp
	; LINUXOSX64-NEXT: .cfi_def_cfa_offset 16			; LINUXOSX64-NEXT: .cfi_def_cfa_offset 16
	; LINUXOSX64-NEXT: popq %rsp			; LINUXOSX64-NEXT: popq %rsp
	; LINUXOSX64-NEXT: .cfi_def_cfa_offset 8			; LINUXOSX64-NEXT: .cfi_def_cfa_offset 8
	; LINUXOSX64-NEXT: vzeroupper			; LINUXOSX64-NEXT: vzeroupper
	; LINUXOSX64-NEXT: retq			; LINUXOSX64-NEXT: retq
	entry:			entry:
	%res = call i32 @test_argv32i1helper(<32 x i1> %x0, <32 x i1> %x1, <32 x i1> %x2)			%res = call i32 @test_argv32i1helper(<32 x i1> %x0, <32 x i1> %x1, <32 x i1> %x2)
	Show All 13 Lines
	; WIN64-LABEL: caller_argv32i1:			; WIN64-LABEL: caller_argv32i1:
	; WIN64: # %bb.0: # %entry			; WIN64: # %bb.0: # %entry
	; WIN64-NEXT: pushq %rsi			; WIN64-NEXT: pushq %rsi
	; WIN64-NEXT: .seh_pushreg 6			; WIN64-NEXT: .seh_pushreg 6
	; WIN64-NEXT: pushq %rdi			; WIN64-NEXT: pushq %rdi
	; WIN64-NEXT: .seh_pushreg 7			; WIN64-NEXT: .seh_pushreg 7
	; WIN64-NEXT: subq $40, %rsp			; WIN64-NEXT: subq $40, %rsp
	; WIN64-NEXT: .seh_stackalloc 40			; WIN64-NEXT: .seh_stackalloc 40
	; WIN64-NEXT: vmovaps %xmm7, {{[0-9]+}}(%rsp) # 16-byte Spill			; WIN64-NEXT: vmovaps %xmm7, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; WIN64-NEXT: .seh_savexmm 7, 16			; WIN64-NEXT: .seh_savexmm 7, 16
	; WIN64-NEXT: vmovaps %xmm6, (%rsp) # 16-byte Spill			; WIN64-NEXT: vmovaps %xmm6, (%rsp) # 16-byte Spill
	; WIN64-NEXT: .seh_savexmm 6, 0			; WIN64-NEXT: .seh_savexmm 6, 0
	; WIN64-NEXT: .seh_endprologue			; WIN64-NEXT: .seh_endprologue
	; WIN64-NEXT: movl $1, %eax			; WIN64-NEXT: movl $1, %eax
	; WIN64-NEXT: movl $1, %ecx			; WIN64-NEXT: movl $1, %ecx
	; WIN64-NEXT: movl $1, %edx			; WIN64-NEXT: movl $1, %edx
	; WIN64-NEXT: callq test_argv32i1			; WIN64-NEXT: callq test_argv32i1
	; WIN64-NEXT: vmovaps (%rsp), %xmm6 # 16-byte Reload			; WIN64-NEXT: vmovaps (%rsp), %xmm6 # 16-byte Reload
	; WIN64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm7 # 16-byte Reload			; WIN64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm7 # 16-byte Reload
	; WIN64-NEXT: addq $40, %rsp			; WIN64-NEXT: addq $40, %rsp
	; WIN64-NEXT: popq %rdi			; WIN64-NEXT: popq %rdi
	; WIN64-NEXT: popq %rsi			; WIN64-NEXT: popq %rsi
	; WIN64-NEXT: retq			; WIN64-NEXT: retq
	; WIN64-NEXT: .seh_handlerdata			; WIN64-NEXT: .seh_handlerdata
	; WIN64-NEXT: .text			; WIN64-NEXT: .text
	; WIN64-NEXT: .seh_endproc			; WIN64-NEXT: .seh_endproc
	;			;
	Show All 40 Lines
	; WIN64-LABEL: caller_retv32i1:			; WIN64-LABEL: caller_retv32i1:
	; WIN64: # %bb.0: # %entry			; WIN64: # %bb.0: # %entry
	; WIN64-NEXT: pushq %rsi			; WIN64-NEXT: pushq %rsi
	; WIN64-NEXT: .seh_pushreg 6			; WIN64-NEXT: .seh_pushreg 6
	; WIN64-NEXT: pushq %rdi			; WIN64-NEXT: pushq %rdi
	; WIN64-NEXT: .seh_pushreg 7			; WIN64-NEXT: .seh_pushreg 7
	; WIN64-NEXT: subq $40, %rsp			; WIN64-NEXT: subq $40, %rsp
	; WIN64-NEXT: .seh_stackalloc 40			; WIN64-NEXT: .seh_stackalloc 40
	; WIN64-NEXT: vmovaps %xmm7, {{[0-9]+}}(%rsp) # 16-byte Spill			; WIN64-NEXT: vmovaps %xmm7, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; WIN64-NEXT: .seh_savexmm 7, 16			; WIN64-NEXT: .seh_savexmm 7, 16
	; WIN64-NEXT: vmovaps %xmm6, (%rsp) # 16-byte Spill			; WIN64-NEXT: vmovaps %xmm6, (%rsp) # 16-byte Spill
	; WIN64-NEXT: .seh_savexmm 6, 0			; WIN64-NEXT: .seh_savexmm 6, 0
	; WIN64-NEXT: .seh_endprologue			; WIN64-NEXT: .seh_endprologue
	; WIN64-NEXT: callq test_retv32i1			; WIN64-NEXT: callq test_retv32i1
	; WIN64-NEXT: incl %eax			; WIN64-NEXT: incl %eax
	; WIN64-NEXT: vmovaps (%rsp), %xmm6 # 16-byte Reload			; WIN64-NEXT: vmovaps (%rsp), %xmm6 # 16-byte Reload
	; WIN64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm7 # 16-byte Reload			; WIN64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm7 # 16-byte Reload
	; WIN64-NEXT: addq $40, %rsp			; WIN64-NEXT: addq $40, %rsp
	; WIN64-NEXT: popq %rdi			; WIN64-NEXT: popq %rdi
	; WIN64-NEXT: popq %rsi			; WIN64-NEXT: popq %rsi
	; WIN64-NEXT: retq			; WIN64-NEXT: retq
	; WIN64-NEXT: .seh_handlerdata			; WIN64-NEXT: .seh_handlerdata
	; WIN64-NEXT: .text			; WIN64-NEXT: .text
	; WIN64-NEXT: .seh_endproc			; WIN64-NEXT: .seh_endproc
	;			;
	Show All 15 Lines

	; Test regcall when receiving arguments of v16i1 type			; Test regcall when receiving arguments of v16i1 type
	declare i16 @test_argv16i1helper(<16 x i1> %x0, <16 x i1> %x1, <16 x i1> %x2)			declare i16 @test_argv16i1helper(<16 x i1> %x0, <16 x i1> %x1, <16 x i1> %x2)
	define x86_regcallcc i16 @test_argv16i1(<16 x i1> %x0, <16 x i1> %x1, <16 x i1> %x2) {			define x86_regcallcc i16 @test_argv16i1(<16 x i1> %x0, <16 x i1> %x1, <16 x i1> %x2) {
	; X32-LABEL: test_argv16i1:			; X32-LABEL: test_argv16i1:
	; X32: # %bb.0:			; X32: # %bb.0:
	; X32-NEXT: pushl %esp			; X32-NEXT: pushl %esp
	; X32-NEXT: subl $72, %esp			; X32-NEXT: subl $72, %esp
	; X32-NEXT: vmovups %xmm7, {{[0-9]+}}(%esp) # 16-byte Spill			; X32-NEXT: vmovups %xmm7, {{[-0-9]+}}(%e{{[sb]}}p) # 16-byte Spill
	; X32-NEXT: vmovups %xmm6, {{[0-9]+}}(%esp) # 16-byte Spill			; X32-NEXT: vmovups %xmm6, {{[-0-9]+}}(%e{{[sb]}}p) # 16-byte Spill
	; X32-NEXT: vmovups %xmm5, {{[0-9]+}}(%esp) # 16-byte Spill			; X32-NEXT: vmovups %xmm5, {{[-0-9]+}}(%e{{[sb]}}p) # 16-byte Spill
	; X32-NEXT: vmovups %xmm4, (%esp) # 16-byte Spill			; X32-NEXT: vmovups %xmm4, (%esp) # 16-byte Spill
	; X32-NEXT: kmovd %edx, %k0			; X32-NEXT: kmovd %edx, %k0
	; X32-NEXT: kmovd %ecx, %k1			; X32-NEXT: kmovd %ecx, %k1
	; X32-NEXT: kmovd %eax, %k2			; X32-NEXT: kmovd %eax, %k2
	; X32-NEXT: vpmovm2b %k2, %zmm0			; X32-NEXT: vpmovm2b %k2, %zmm0
	; X32-NEXT: vpmovm2b %k1, %zmm1			; X32-NEXT: vpmovm2b %k1, %zmm1
	; X32-NEXT: vpmovm2b %k0, %zmm2			; X32-NEXT: vpmovm2b %k0, %zmm2
	; X32-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0			; X32-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
	; X32-NEXT: # kill: def $xmm1 killed $xmm1 killed $zmm1			; X32-NEXT: # kill: def $xmm1 killed $xmm1 killed $zmm1
	; X32-NEXT: # kill: def $xmm2 killed $xmm2 killed $zmm2			; X32-NEXT: # kill: def $xmm2 killed $xmm2 killed $zmm2
	; X32-NEXT: vzeroupper			; X32-NEXT: vzeroupper
	; X32-NEXT: calll _test_argv16i1helper			; X32-NEXT: calll _test_argv16i1helper
	; X32-NEXT: vmovups (%esp), %xmm4 # 16-byte Reload			; X32-NEXT: vmovups (%esp), %xmm4 # 16-byte Reload
	; X32-NEXT: vmovups {{[0-9]+}}(%esp), %xmm5 # 16-byte Reload			; X32-NEXT: vmovups {{[-0-9]+}}(%e{{[sb]}}p), %xmm5 # 16-byte Reload
	; X32-NEXT: vmovups {{[0-9]+}}(%esp), %xmm6 # 16-byte Reload			; X32-NEXT: vmovups {{[-0-9]+}}(%e{{[sb]}}p), %xmm6 # 16-byte Reload
	; X32-NEXT: vmovups {{[0-9]+}}(%esp), %xmm7 # 16-byte Reload			; X32-NEXT: vmovups {{[-0-9]+}}(%e{{[sb]}}p), %xmm7 # 16-byte Reload
	; X32-NEXT: addl $72, %esp			; X32-NEXT: addl $72, %esp
	; X32-NEXT: popl %esp			; X32-NEXT: popl %esp
	; X32-NEXT: retl			; X32-NEXT: retl
	;			;
	; WIN64-LABEL: test_argv16i1:			; WIN64-LABEL: test_argv16i1:
	; WIN64: # %bb.0:			; WIN64: # %bb.0:
	; WIN64-NEXT: pushq %r11			; WIN64-NEXT: pushq %r11
	; WIN64-NEXT: .seh_pushreg 11			; WIN64-NEXT: .seh_pushreg 11
	Show All 25 Lines
	; WIN64-NEXT: .text			; WIN64-NEXT: .text
	; WIN64-NEXT: .seh_endproc			; WIN64-NEXT: .seh_endproc
	;			;
	; LINUXOSX64-LABEL: test_argv16i1:			; LINUXOSX64-LABEL: test_argv16i1:
	; LINUXOSX64: # %bb.0:			; LINUXOSX64: # %bb.0:
	; LINUXOSX64-NEXT: pushq %rsp			; LINUXOSX64-NEXT: pushq %rsp
	; LINUXOSX64-NEXT: .cfi_def_cfa_offset 16			; LINUXOSX64-NEXT: .cfi_def_cfa_offset 16
	; LINUXOSX64-NEXT: subq $128, %rsp			; LINUXOSX64-NEXT: subq $128, %rsp
	; LINUXOSX64-NEXT: vmovaps %xmm15, {{[0-9]+}}(%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm15, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; LINUXOSX64-NEXT: vmovaps %xmm14, {{[0-9]+}}(%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm14, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; LINUXOSX64-NEXT: vmovaps %xmm13, {{[0-9]+}}(%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm13, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; LINUXOSX64-NEXT: vmovaps %xmm12, {{[0-9]+}}(%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm12, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; LINUXOSX64-NEXT: vmovaps %xmm11, {{[0-9]+}}(%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm11, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; LINUXOSX64-NEXT: vmovaps %xmm10, {{[0-9]+}}(%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm10, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; LINUXOSX64-NEXT: vmovaps %xmm9, {{[0-9]+}}(%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm9, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; LINUXOSX64-NEXT: vmovaps %xmm8, (%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm8, (%rsp) # 16-byte Spill
	; LINUXOSX64-NEXT: .cfi_def_cfa_offset 144			; LINUXOSX64-NEXT: .cfi_def_cfa_offset 144
	; LINUXOSX64-NEXT: .cfi_offset %rsp, -16			; LINUXOSX64-NEXT: .cfi_offset %rsp, -16
	; LINUXOSX64-NEXT: .cfi_offset %xmm8, -144			; LINUXOSX64-NEXT: .cfi_offset %xmm8, -144
	; LINUXOSX64-NEXT: .cfi_offset %xmm9, -128			; LINUXOSX64-NEXT: .cfi_offset %xmm9, -128
	; LINUXOSX64-NEXT: .cfi_offset %xmm10, -112			; LINUXOSX64-NEXT: .cfi_offset %xmm10, -112
	; LINUXOSX64-NEXT: .cfi_offset %xmm11, -96			; LINUXOSX64-NEXT: .cfi_offset %xmm11, -96
	; LINUXOSX64-NEXT: .cfi_offset %xmm12, -80			; LINUXOSX64-NEXT: .cfi_offset %xmm12, -80
	; LINUXOSX64-NEXT: .cfi_offset %xmm13, -64			; LINUXOSX64-NEXT: .cfi_offset %xmm13, -64
	; LINUXOSX64-NEXT: .cfi_offset %xmm14, -48			; LINUXOSX64-NEXT: .cfi_offset %xmm14, -48
	; LINUXOSX64-NEXT: .cfi_offset %xmm15, -32			; LINUXOSX64-NEXT: .cfi_offset %xmm15, -32
	; LINUXOSX64-NEXT: kmovd %edx, %k0			; LINUXOSX64-NEXT: kmovd %edx, %k0
	; LINUXOSX64-NEXT: kmovd %ecx, %k1			; LINUXOSX64-NEXT: kmovd %ecx, %k1
	; LINUXOSX64-NEXT: kmovd %eax, %k2			; LINUXOSX64-NEXT: kmovd %eax, %k2
	; LINUXOSX64-NEXT: vpmovm2b %k2, %zmm0			; LINUXOSX64-NEXT: vpmovm2b %k2, %zmm0
	; LINUXOSX64-NEXT: vpmovm2b %k1, %zmm1			; LINUXOSX64-NEXT: vpmovm2b %k1, %zmm1
	; LINUXOSX64-NEXT: vpmovm2b %k0, %zmm2			; LINUXOSX64-NEXT: vpmovm2b %k0, %zmm2
	; LINUXOSX64-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0			; LINUXOSX64-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
	; LINUXOSX64-NEXT: # kill: def $xmm1 killed $xmm1 killed $zmm1			; LINUXOSX64-NEXT: # kill: def $xmm1 killed $xmm1 killed $zmm1
	; LINUXOSX64-NEXT: # kill: def $xmm2 killed $xmm2 killed $zmm2			; LINUXOSX64-NEXT: # kill: def $xmm2 killed $xmm2 killed $zmm2
	; LINUXOSX64-NEXT: vzeroupper			; LINUXOSX64-NEXT: vzeroupper
	; LINUXOSX64-NEXT: callq test_argv16i1helper			; LINUXOSX64-NEXT: callq test_argv16i1helper
	; LINUXOSX64-NEXT: vmovaps (%rsp), %xmm8 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps (%rsp), %xmm8 # 16-byte Reload
	; LINUXOSX64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm9 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm9 # 16-byte Reload
	; LINUXOSX64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm10 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm10 # 16-byte Reload
	; LINUXOSX64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm11 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm11 # 16-byte Reload
	; LINUXOSX64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm12 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm12 # 16-byte Reload
	; LINUXOSX64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm13 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm13 # 16-byte Reload
	; LINUXOSX64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm14 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm14 # 16-byte Reload
	; LINUXOSX64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm15 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm15 # 16-byte Reload
	; LINUXOSX64-NEXT: addq $128, %rsp			; LINUXOSX64-NEXT: addq $128, %rsp
	; LINUXOSX64-NEXT: .cfi_def_cfa_offset 16			; LINUXOSX64-NEXT: .cfi_def_cfa_offset 16
	; LINUXOSX64-NEXT: popq %rsp			; LINUXOSX64-NEXT: popq %rsp
	; LINUXOSX64-NEXT: .cfi_def_cfa_offset 8			; LINUXOSX64-NEXT: .cfi_def_cfa_offset 8
	; LINUXOSX64-NEXT: retq			; LINUXOSX64-NEXT: retq
	%res = call i16 @test_argv16i1helper(<16 x i1> %x0, <16 x i1> %x1, <16 x i1> %x2)			%res = call i16 @test_argv16i1helper(<16 x i1> %x0, <16 x i1> %x1, <16 x i1> %x2)
	ret i16 %res			ret i16 %res
	}			}
	Show All 11 Lines
	; WIN64-LABEL: caller_argv16i1:			; WIN64-LABEL: caller_argv16i1:
	; WIN64: # %bb.0: # %entry			; WIN64: # %bb.0: # %entry
	; WIN64-NEXT: pushq %rsi			; WIN64-NEXT: pushq %rsi
	; WIN64-NEXT: .seh_pushreg 6			; WIN64-NEXT: .seh_pushreg 6
	; WIN64-NEXT: pushq %rdi			; WIN64-NEXT: pushq %rdi
	; WIN64-NEXT: .seh_pushreg 7			; WIN64-NEXT: .seh_pushreg 7
	; WIN64-NEXT: subq $40, %rsp			; WIN64-NEXT: subq $40, %rsp
	; WIN64-NEXT: .seh_stackalloc 40			; WIN64-NEXT: .seh_stackalloc 40
	; WIN64-NEXT: vmovaps %xmm7, {{[0-9]+}}(%rsp) # 16-byte Spill			; WIN64-NEXT: vmovaps %xmm7, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; WIN64-NEXT: .seh_savexmm 7, 16			; WIN64-NEXT: .seh_savexmm 7, 16
	; WIN64-NEXT: vmovaps %xmm6, (%rsp) # 16-byte Spill			; WIN64-NEXT: vmovaps %xmm6, (%rsp) # 16-byte Spill
	; WIN64-NEXT: .seh_savexmm 6, 0			; WIN64-NEXT: .seh_savexmm 6, 0
	; WIN64-NEXT: .seh_endprologue			; WIN64-NEXT: .seh_endprologue
	; WIN64-NEXT: movl $1, %eax			; WIN64-NEXT: movl $1, %eax
	; WIN64-NEXT: movl $1, %ecx			; WIN64-NEXT: movl $1, %ecx
	; WIN64-NEXT: movl $1, %edx			; WIN64-NEXT: movl $1, %edx
	; WIN64-NEXT: callq test_argv16i1			; WIN64-NEXT: callq test_argv16i1
	; WIN64-NEXT: vmovaps (%rsp), %xmm6 # 16-byte Reload			; WIN64-NEXT: vmovaps (%rsp), %xmm6 # 16-byte Reload
	; WIN64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm7 # 16-byte Reload			; WIN64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm7 # 16-byte Reload
	; WIN64-NEXT: addq $40, %rsp			; WIN64-NEXT: addq $40, %rsp
	; WIN64-NEXT: popq %rdi			; WIN64-NEXT: popq %rdi
	; WIN64-NEXT: popq %rsi			; WIN64-NEXT: popq %rsi
	; WIN64-NEXT: retq			; WIN64-NEXT: retq
	; WIN64-NEXT: .seh_handlerdata			; WIN64-NEXT: .seh_handlerdata
	; WIN64-NEXT: .text			; WIN64-NEXT: .text
	; WIN64-NEXT: .seh_endproc			; WIN64-NEXT: .seh_endproc
	;			;
	▲ Show 20 Lines • Show All 42 Lines • ▼ Show 20 Lines
	; WIN64-LABEL: caller_retv16i1:			; WIN64-LABEL: caller_retv16i1:
	; WIN64: # %bb.0: # %entry			; WIN64: # %bb.0: # %entry
	; WIN64-NEXT: pushq %rsi			; WIN64-NEXT: pushq %rsi
	; WIN64-NEXT: .seh_pushreg 6			; WIN64-NEXT: .seh_pushreg 6
	; WIN64-NEXT: pushq %rdi			; WIN64-NEXT: pushq %rdi
	; WIN64-NEXT: .seh_pushreg 7			; WIN64-NEXT: .seh_pushreg 7
	; WIN64-NEXT: subq $40, %rsp			; WIN64-NEXT: subq $40, %rsp
	; WIN64-NEXT: .seh_stackalloc 40			; WIN64-NEXT: .seh_stackalloc 40
	; WIN64-NEXT: vmovaps %xmm7, {{[0-9]+}}(%rsp) # 16-byte Spill			; WIN64-NEXT: vmovaps %xmm7, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; WIN64-NEXT: .seh_savexmm 7, 16			; WIN64-NEXT: .seh_savexmm 7, 16
	; WIN64-NEXT: vmovaps %xmm6, (%rsp) # 16-byte Spill			; WIN64-NEXT: vmovaps %xmm6, (%rsp) # 16-byte Spill
	; WIN64-NEXT: .seh_savexmm 6, 0			; WIN64-NEXT: .seh_savexmm 6, 0
	; WIN64-NEXT: .seh_endprologue			; WIN64-NEXT: .seh_endprologue
	; WIN64-NEXT: callq test_retv16i1			; WIN64-NEXT: callq test_retv16i1
	; WIN64-NEXT: # kill: def $ax killed $ax def $eax			; WIN64-NEXT: # kill: def $ax killed $ax def $eax
	; WIN64-NEXT: incl %eax			; WIN64-NEXT: incl %eax
	; WIN64-NEXT: # kill: def $ax killed $ax killed $eax			; WIN64-NEXT: # kill: def $ax killed $ax killed $eax
	; WIN64-NEXT: vmovaps (%rsp), %xmm6 # 16-byte Reload			; WIN64-NEXT: vmovaps (%rsp), %xmm6 # 16-byte Reload
	; WIN64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm7 # 16-byte Reload			; WIN64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm7 # 16-byte Reload
	; WIN64-NEXT: addq $40, %rsp			; WIN64-NEXT: addq $40, %rsp
	; WIN64-NEXT: popq %rdi			; WIN64-NEXT: popq %rdi
	; WIN64-NEXT: popq %rsi			; WIN64-NEXT: popq %rsi
	; WIN64-NEXT: retq			; WIN64-NEXT: retq
	; WIN64-NEXT: .seh_handlerdata			; WIN64-NEXT: .seh_handlerdata
	; WIN64-NEXT: .text			; WIN64-NEXT: .text
	; WIN64-NEXT: .seh_endproc			; WIN64-NEXT: .seh_endproc
	;			;
	Show All 17 Lines

	; Test regcall when receiving arguments of v8i1 type			; Test regcall when receiving arguments of v8i1 type
	declare i8 @test_argv8i1helper(<8 x i1> %x0, <8 x i1> %x1, <8 x i1> %x2)			declare i8 @test_argv8i1helper(<8 x i1> %x0, <8 x i1> %x1, <8 x i1> %x2)
	define x86_regcallcc i8 @test_argv8i1(<8 x i1> %x0, <8 x i1> %x1, <8 x i1> %x2) {			define x86_regcallcc i8 @test_argv8i1(<8 x i1> %x0, <8 x i1> %x1, <8 x i1> %x2) {
	; X32-LABEL: test_argv8i1:			; X32-LABEL: test_argv8i1:
	; X32: # %bb.0:			; X32: # %bb.0:
	; X32-NEXT: pushl %esp			; X32-NEXT: pushl %esp
	; X32-NEXT: subl $72, %esp			; X32-NEXT: subl $72, %esp
	; X32-NEXT: vmovups %xmm7, {{[0-9]+}}(%esp) # 16-byte Spill			; X32-NEXT: vmovups %xmm7, {{[-0-9]+}}(%e{{[sb]}}p) # 16-byte Spill
	; X32-NEXT: vmovups %xmm6, {{[0-9]+}}(%esp) # 16-byte Spill			; X32-NEXT: vmovups %xmm6, {{[-0-9]+}}(%e{{[sb]}}p) # 16-byte Spill
	; X32-NEXT: vmovups %xmm5, {{[0-9]+}}(%esp) # 16-byte Spill			; X32-NEXT: vmovups %xmm5, {{[-0-9]+}}(%e{{[sb]}}p) # 16-byte Spill
	; X32-NEXT: vmovups %xmm4, (%esp) # 16-byte Spill			; X32-NEXT: vmovups %xmm4, (%esp) # 16-byte Spill
	; X32-NEXT: kmovd %edx, %k0			; X32-NEXT: kmovd %edx, %k0
	; X32-NEXT: kmovd %ecx, %k1			; X32-NEXT: kmovd %ecx, %k1
	; X32-NEXT: kmovd %eax, %k2			; X32-NEXT: kmovd %eax, %k2
	; X32-NEXT: vpmovm2w %k2, %zmm0			; X32-NEXT: vpmovm2w %k2, %zmm0
	; X32-NEXT: vpmovm2w %k1, %zmm1			; X32-NEXT: vpmovm2w %k1, %zmm1
	; X32-NEXT: vpmovm2w %k0, %zmm2			; X32-NEXT: vpmovm2w %k0, %zmm2
	; X32-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0			; X32-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
	; X32-NEXT: # kill: def $xmm1 killed $xmm1 killed $zmm1			; X32-NEXT: # kill: def $xmm1 killed $xmm1 killed $zmm1
	; X32-NEXT: # kill: def $xmm2 killed $xmm2 killed $zmm2			; X32-NEXT: # kill: def $xmm2 killed $xmm2 killed $zmm2
	; X32-NEXT: vzeroupper			; X32-NEXT: vzeroupper
	; X32-NEXT: calll _test_argv8i1helper			; X32-NEXT: calll _test_argv8i1helper
	; X32-NEXT: vmovups (%esp), %xmm4 # 16-byte Reload			; X32-NEXT: vmovups (%esp), %xmm4 # 16-byte Reload
	; X32-NEXT: vmovups {{[0-9]+}}(%esp), %xmm5 # 16-byte Reload			; X32-NEXT: vmovups {{[-0-9]+}}(%e{{[sb]}}p), %xmm5 # 16-byte Reload
	; X32-NEXT: vmovups {{[0-9]+}}(%esp), %xmm6 # 16-byte Reload			; X32-NEXT: vmovups {{[-0-9]+}}(%e{{[sb]}}p), %xmm6 # 16-byte Reload
	; X32-NEXT: vmovups {{[0-9]+}}(%esp), %xmm7 # 16-byte Reload			; X32-NEXT: vmovups {{[-0-9]+}}(%e{{[sb]}}p), %xmm7 # 16-byte Reload
	; X32-NEXT: addl $72, %esp			; X32-NEXT: addl $72, %esp
	; X32-NEXT: popl %esp			; X32-NEXT: popl %esp
	; X32-NEXT: retl			; X32-NEXT: retl
	;			;
	; WIN64-LABEL: test_argv8i1:			; WIN64-LABEL: test_argv8i1:
	; WIN64: # %bb.0:			; WIN64: # %bb.0:
	; WIN64-NEXT: pushq %r11			; WIN64-NEXT: pushq %r11
	; WIN64-NEXT: .seh_pushreg 11			; WIN64-NEXT: .seh_pushreg 11
	Show All 25 Lines
	; WIN64-NEXT: .text			; WIN64-NEXT: .text
	; WIN64-NEXT: .seh_endproc			; WIN64-NEXT: .seh_endproc
	;			;
	; LINUXOSX64-LABEL: test_argv8i1:			; LINUXOSX64-LABEL: test_argv8i1:
	; LINUXOSX64: # %bb.0:			; LINUXOSX64: # %bb.0:
	; LINUXOSX64-NEXT: pushq %rsp			; LINUXOSX64-NEXT: pushq %rsp
	; LINUXOSX64-NEXT: .cfi_def_cfa_offset 16			; LINUXOSX64-NEXT: .cfi_def_cfa_offset 16
	; LINUXOSX64-NEXT: subq $128, %rsp			; LINUXOSX64-NEXT: subq $128, %rsp
	; LINUXOSX64-NEXT: vmovaps %xmm15, {{[0-9]+}}(%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm15, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; LINUXOSX64-NEXT: vmovaps %xmm14, {{[0-9]+}}(%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm14, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; LINUXOSX64-NEXT: vmovaps %xmm13, {{[0-9]+}}(%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm13, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; LINUXOSX64-NEXT: vmovaps %xmm12, {{[0-9]+}}(%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm12, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; LINUXOSX64-NEXT: vmovaps %xmm11, {{[0-9]+}}(%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm11, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; LINUXOSX64-NEXT: vmovaps %xmm10, {{[0-9]+}}(%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm10, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; LINUXOSX64-NEXT: vmovaps %xmm9, {{[0-9]+}}(%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm9, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; LINUXOSX64-NEXT: vmovaps %xmm8, (%rsp) # 16-byte Spill			; LINUXOSX64-NEXT: vmovaps %xmm8, (%rsp) # 16-byte Spill
	; LINUXOSX64-NEXT: .cfi_def_cfa_offset 144			; LINUXOSX64-NEXT: .cfi_def_cfa_offset 144
	; LINUXOSX64-NEXT: .cfi_offset %rsp, -16			; LINUXOSX64-NEXT: .cfi_offset %rsp, -16
	; LINUXOSX64-NEXT: .cfi_offset %xmm8, -144			; LINUXOSX64-NEXT: .cfi_offset %xmm8, -144
	; LINUXOSX64-NEXT: .cfi_offset %xmm9, -128			; LINUXOSX64-NEXT: .cfi_offset %xmm9, -128
	; LINUXOSX64-NEXT: .cfi_offset %xmm10, -112			; LINUXOSX64-NEXT: .cfi_offset %xmm10, -112
	; LINUXOSX64-NEXT: .cfi_offset %xmm11, -96			; LINUXOSX64-NEXT: .cfi_offset %xmm11, -96
	; LINUXOSX64-NEXT: .cfi_offset %xmm12, -80			; LINUXOSX64-NEXT: .cfi_offset %xmm12, -80
	; LINUXOSX64-NEXT: .cfi_offset %xmm13, -64			; LINUXOSX64-NEXT: .cfi_offset %xmm13, -64
	; LINUXOSX64-NEXT: .cfi_offset %xmm14, -48			; LINUXOSX64-NEXT: .cfi_offset %xmm14, -48
	; LINUXOSX64-NEXT: .cfi_offset %xmm15, -32			; LINUXOSX64-NEXT: .cfi_offset %xmm15, -32
	; LINUXOSX64-NEXT: kmovd %edx, %k0			; LINUXOSX64-NEXT: kmovd %edx, %k0
	; LINUXOSX64-NEXT: kmovd %ecx, %k1			; LINUXOSX64-NEXT: kmovd %ecx, %k1
	; LINUXOSX64-NEXT: kmovd %eax, %k2			; LINUXOSX64-NEXT: kmovd %eax, %k2
	; LINUXOSX64-NEXT: vpmovm2w %k2, %zmm0			; LINUXOSX64-NEXT: vpmovm2w %k2, %zmm0
	; LINUXOSX64-NEXT: vpmovm2w %k1, %zmm1			; LINUXOSX64-NEXT: vpmovm2w %k1, %zmm1
	; LINUXOSX64-NEXT: vpmovm2w %k0, %zmm2			; LINUXOSX64-NEXT: vpmovm2w %k0, %zmm2
	; LINUXOSX64-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0			; LINUXOSX64-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
	; LINUXOSX64-NEXT: # kill: def $xmm1 killed $xmm1 killed $zmm1			; LINUXOSX64-NEXT: # kill: def $xmm1 killed $xmm1 killed $zmm1
	; LINUXOSX64-NEXT: # kill: def $xmm2 killed $xmm2 killed $zmm2			; LINUXOSX64-NEXT: # kill: def $xmm2 killed $xmm2 killed $zmm2
	; LINUXOSX64-NEXT: vzeroupper			; LINUXOSX64-NEXT: vzeroupper
	; LINUXOSX64-NEXT: callq test_argv8i1helper			; LINUXOSX64-NEXT: callq test_argv8i1helper
	; LINUXOSX64-NEXT: vmovaps (%rsp), %xmm8 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps (%rsp), %xmm8 # 16-byte Reload
	; LINUXOSX64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm9 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm9 # 16-byte Reload
	; LINUXOSX64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm10 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm10 # 16-byte Reload
	; LINUXOSX64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm11 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm11 # 16-byte Reload
	; LINUXOSX64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm12 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm12 # 16-byte Reload
	; LINUXOSX64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm13 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm13 # 16-byte Reload
	; LINUXOSX64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm14 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm14 # 16-byte Reload
	; LINUXOSX64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm15 # 16-byte Reload			; LINUXOSX64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm15 # 16-byte Reload
	; LINUXOSX64-NEXT: addq $128, %rsp			; LINUXOSX64-NEXT: addq $128, %rsp
	; LINUXOSX64-NEXT: .cfi_def_cfa_offset 16			; LINUXOSX64-NEXT: .cfi_def_cfa_offset 16
	; LINUXOSX64-NEXT: popq %rsp			; LINUXOSX64-NEXT: popq %rsp
	; LINUXOSX64-NEXT: .cfi_def_cfa_offset 8			; LINUXOSX64-NEXT: .cfi_def_cfa_offset 8
	; LINUXOSX64-NEXT: retq			; LINUXOSX64-NEXT: retq
	%res = call i8 @test_argv8i1helper(<8 x i1> %x0, <8 x i1> %x1, <8 x i1> %x2)			%res = call i8 @test_argv8i1helper(<8 x i1> %x0, <8 x i1> %x1, <8 x i1> %x2)
	ret i8 %res			ret i8 %res
	}			}
	Show All 11 Lines
	; WIN64-LABEL: caller_argv8i1:			; WIN64-LABEL: caller_argv8i1:
	; WIN64: # %bb.0: # %entry			; WIN64: # %bb.0: # %entry
	; WIN64-NEXT: pushq %rsi			; WIN64-NEXT: pushq %rsi
	; WIN64-NEXT: .seh_pushreg 6			; WIN64-NEXT: .seh_pushreg 6
	; WIN64-NEXT: pushq %rdi			; WIN64-NEXT: pushq %rdi
	; WIN64-NEXT: .seh_pushreg 7			; WIN64-NEXT: .seh_pushreg 7
	; WIN64-NEXT: subq $40, %rsp			; WIN64-NEXT: subq $40, %rsp
	; WIN64-NEXT: .seh_stackalloc 40			; WIN64-NEXT: .seh_stackalloc 40
	; WIN64-NEXT: vmovaps %xmm7, {{[0-9]+}}(%rsp) # 16-byte Spill			; WIN64-NEXT: vmovaps %xmm7, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; WIN64-NEXT: .seh_savexmm 7, 16			; WIN64-NEXT: .seh_savexmm 7, 16
	; WIN64-NEXT: vmovaps %xmm6, (%rsp) # 16-byte Spill			; WIN64-NEXT: vmovaps %xmm6, (%rsp) # 16-byte Spill
	; WIN64-NEXT: .seh_savexmm 6, 0			; WIN64-NEXT: .seh_savexmm 6, 0
	; WIN64-NEXT: .seh_endprologue			; WIN64-NEXT: .seh_endprologue
	; WIN64-NEXT: movl $1, %eax			; WIN64-NEXT: movl $1, %eax
	; WIN64-NEXT: movl $1, %ecx			; WIN64-NEXT: movl $1, %ecx
	; WIN64-NEXT: movl $1, %edx			; WIN64-NEXT: movl $1, %edx
	; WIN64-NEXT: callq test_argv8i1			; WIN64-NEXT: callq test_argv8i1
	; WIN64-NEXT: vmovaps (%rsp), %xmm6 # 16-byte Reload			; WIN64-NEXT: vmovaps (%rsp), %xmm6 # 16-byte Reload
	; WIN64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm7 # 16-byte Reload			; WIN64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm7 # 16-byte Reload
	; WIN64-NEXT: addq $40, %rsp			; WIN64-NEXT: addq $40, %rsp
	; WIN64-NEXT: popq %rdi			; WIN64-NEXT: popq %rdi
	; WIN64-NEXT: popq %rsi			; WIN64-NEXT: popq %rsi
	; WIN64-NEXT: retq			; WIN64-NEXT: retq
	; WIN64-NEXT: .seh_handlerdata			; WIN64-NEXT: .seh_handlerdata
	; WIN64-NEXT: .text			; WIN64-NEXT: .text
	; WIN64-NEXT: .seh_endproc			; WIN64-NEXT: .seh_endproc
	;			;
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	; WIN64-LABEL: caller_retv8i1:			; WIN64-LABEL: caller_retv8i1:
	; WIN64: # %bb.0: # %entry			; WIN64: # %bb.0: # %entry
	; WIN64-NEXT: pushq %rsi			; WIN64-NEXT: pushq %rsi
	; WIN64-NEXT: .seh_pushreg 6			; WIN64-NEXT: .seh_pushreg 6
	; WIN64-NEXT: pushq %rdi			; WIN64-NEXT: pushq %rdi
	; WIN64-NEXT: .seh_pushreg 7			; WIN64-NEXT: .seh_pushreg 7
	; WIN64-NEXT: subq $40, %rsp			; WIN64-NEXT: subq $40, %rsp
	; WIN64-NEXT: .seh_stackalloc 40			; WIN64-NEXT: .seh_stackalloc 40
	; WIN64-NEXT: vmovaps %xmm7, {{[0-9]+}}(%rsp) # 16-byte Spill			; WIN64-NEXT: vmovaps %xmm7, {{[-0-9]+}}(%r{{[sb]}}p) # 16-byte Spill
	; WIN64-NEXT: .seh_savexmm 7, 16			; WIN64-NEXT: .seh_savexmm 7, 16
	; WIN64-NEXT: vmovaps %xmm6, (%rsp) # 16-byte Spill			; WIN64-NEXT: vmovaps %xmm6, (%rsp) # 16-byte Spill
	; WIN64-NEXT: .seh_savexmm 6, 0			; WIN64-NEXT: .seh_savexmm 6, 0
	; WIN64-NEXT: .seh_endprologue			; WIN64-NEXT: .seh_endprologue
	; WIN64-NEXT: callq test_retv8i1			; WIN64-NEXT: callq test_retv8i1
	; WIN64-NEXT: # kill: def $al killed $al def $eax			; WIN64-NEXT: # kill: def $al killed $al def $eax
	; WIN64-NEXT: kmovd %eax, %k0			; WIN64-NEXT: kmovd %eax, %k0
	; WIN64-NEXT: vpmovm2w %k0, %zmm0			; WIN64-NEXT: vpmovm2w %k0, %zmm0
	; WIN64-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0			; WIN64-NEXT: # kill: def $xmm0 killed $xmm0 killed $zmm0
	; WIN64-NEXT: vmovaps (%rsp), %xmm6 # 16-byte Reload			; WIN64-NEXT: vmovaps (%rsp), %xmm6 # 16-byte Reload
	; WIN64-NEXT: vmovaps {{[0-9]+}}(%rsp), %xmm7 # 16-byte Reload			; WIN64-NEXT: vmovaps {{[-0-9]+}}(%r{{[sb]}}p), %xmm7 # 16-byte Reload
	; WIN64-NEXT: addq $40, %rsp			; WIN64-NEXT: addq $40, %rsp
	; WIN64-NEXT: popq %rdi			; WIN64-NEXT: popq %rdi
	; WIN64-NEXT: popq %rsi			; WIN64-NEXT: popq %rsi
	; WIN64-NEXT: vzeroupper			; WIN64-NEXT: vzeroupper
	; WIN64-NEXT: retq			; WIN64-NEXT: retq
	; WIN64-NEXT: .seh_handlerdata			; WIN64-NEXT: .seh_handlerdata
	; WIN64-NEXT: .text			; WIN64-NEXT: .text
	; WIN64-NEXT: .seh_endproc			; WIN64-NEXT: .seh_endproc
	Show All 19 Lines

llvm/test/CodeGen/X86/physreg-pairs-error.ll

This file was added.

				; RUN: not llc -mtriple=i386-unknown-linux-gnu -o - %s 2>&1 \| FileCheck %s

				; CHECK: error: couldn't allocate input reg for constraint '{esp}'
				define dso_local i64 @test_esp(i64 %in) local_unnamed_addr nounwind {
				entry:
				%0 = tail call i64 asm sideeffect "mov $1, $0", "=r,{esp},~{dirflag},~{fpsr},~{flags}"(i64 81985529216486895)
				%conv = trunc i64 %0 to i32
				%add = add nsw i32 %conv, 3
				%conv1 = sext i32 %add to i64
				ret i64 %conv1
				}

llvm/test/CodeGen/X86/physreg-pairs.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc -mtriple=i386-unknown-linux-gnu -o - %s \| FileCheck %s

				; To match GCCs behavior in assigning 64-bit values ot a 32-bit
				nickdesaulniersUnsubmitted Not Done Reply Inline Actions `GCC's` `values to` nickdesaulniers: `GCC's` `values to`
				; register we bind to the value to the pair (the given register, the following
				; register) in the sequence. EAX, EDX, ECX, EBX, ESI, EDI, EBP, ESP. There
				nickdesaulniersUnsubmitted Not Done Reply Inline Actions I find this sentence slightly hard to follow. Would you mind rewording it to something along the lines of: To match GCC's behavior in assigning 64-bit values to a 32-bit register, we bind the pair (the given register, the following register) from the sequence EAX, EDX, ECX, EBX, ESI, EDI, EBP, ESP, to the value. There is no wrapping from the sequence, so this will fail given ESP. nickdesaulniers: I find this sentence slightly hard to follow. Would you mind rewording it to something along…
				; is no wrapping, so this will fail given ESP.

				define dso_local i64 @test_eax(i64 %in) local_unnamed_addr nounwind {
				; CHECK-LABEL: test_eax:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: movl $-1985229329, %eax # imm = 0x89ABCDEF
				; CHECK-NEXT: movl $19088743, %edx # imm = 0x1234567
				; CHECK-NEXT: #APP
				; CHECK-NEXT: movl %eax, %eax
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: addl $3, %eax
				; CHECK-NEXT: movl %eax, %edx
				; CHECK-NEXT: sarl $31, %edx
				; CHECK-NEXT: retl
				entry:
				%0 = tail call i64 asm sideeffect "mov $1, $0", "=r,{eax},~{dirflag},~{fpsr},~{flags}"(i64 81985529216486895)
				%conv = trunc i64 %0 to i32
				%add = add nsw i32 %conv, 3
				%conv1 = sext i32 %add to i64
				ret i64 %conv1
				}

				define dso_local i64 @test_edx(i64 %in) local_unnamed_addr nounwind {
				; CHECK-LABEL: test_edx:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: movl $-1985229329, %edx # imm = 0x89ABCDEF
				; CHECK-NEXT: movl $19088743, %ecx # imm = 0x1234567
				; CHECK-NEXT: #APP
				; CHECK-NEXT: movl %edx, %eax
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: addl $3, %eax
				; CHECK-NEXT: movl %eax, %edx
				; CHECK-NEXT: sarl $31, %edx
				; CHECK-NEXT: retl
				entry:
				%0 = tail call i64 asm sideeffect "mov $1, $0", "=r,{edx},~{dirflag},~{fpsr},~{flags}"(i64 81985529216486895)
				%conv = trunc i64 %0 to i32
				%add = add nsw i32 %conv, 3
				%conv1 = sext i32 %add to i64
				ret i64 %conv1
				}

				define dso_local i64 @test_ecx(i64 %in) local_unnamed_addr nounwind {
				; CHECK-LABEL: test_ecx:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: pushl %ebx
				; CHECK-NEXT: movl $-1985229329, %ecx # imm = 0x89ABCDEF
				; CHECK-NEXT: movl $19088743, %ebx # imm = 0x1234567
				; CHECK-NEXT: #APP
				; CHECK-NEXT: movl %ecx, %eax
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: addl $3, %eax
				; CHECK-NEXT: movl %eax, %edx
				; CHECK-NEXT: sarl $31, %edx
				; CHECK-NEXT: popl %ebx
				; CHECK-NEXT: retl
				entry:
				%0 = tail call i64 asm sideeffect "mov $1, $0", "=r,{ecx},~{dirflag},~{fpsr},~{flags}"(i64 81985529216486895)
				%conv = trunc i64 %0 to i32
				%add = add nsw i32 %conv, 3
				%conv1 = sext i32 %add to i64
				ret i64 %conv1
				}

				define dso_local i64 @test_ebx(i64 %in) local_unnamed_addr nounwind {
				; CHECK-LABEL: test_ebx:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: pushl %ebx
				; CHECK-NEXT: pushl %esi
				; CHECK-NEXT: movl $-1985229329, %ebx # imm = 0x89ABCDEF
				; CHECK-NEXT: movl $19088743, %esi # imm = 0x1234567
				; CHECK-NEXT: #APP
				; CHECK-NEXT: movl %ebx, %eax
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: addl $3, %eax
				; CHECK-NEXT: movl %eax, %edx
				; CHECK-NEXT: sarl $31, %edx
				; CHECK-NEXT: popl %esi
				; CHECK-NEXT: popl %ebx
				; CHECK-NEXT: retl
				entry:
				%0 = tail call i64 asm sideeffect "mov $1, $0", "=r,{ebx},~{dirflag},~{fpsr},~{flags}"(i64 81985529216486895)
				%conv = trunc i64 %0 to i32
				%add = add nsw i32 %conv, 3
				%conv1 = sext i32 %add to i64
				ret i64 %conv1
				}

				define dso_local i64 @test_esi(i64 %in) local_unnamed_addr nounwind {
				; CHECK-LABEL: test_esi:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: pushl %edi
				; CHECK-NEXT: pushl %esi
				; CHECK-NEXT: movl $-1985229329, %esi # imm = 0x89ABCDEF
				; CHECK-NEXT: movl $19088743, %edi # imm = 0x1234567
				; CHECK-NEXT: #APP
				; CHECK-NEXT: movl %esi, %eax
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: addl $3, %eax
				; CHECK-NEXT: movl %eax, %edx
				; CHECK-NEXT: sarl $31, %edx
				; CHECK-NEXT: popl %esi
				; CHECK-NEXT: popl %edi
				; CHECK-NEXT: retl
				entry:
				%0 = tail call i64 asm sideeffect "mov $1, $0", "=r,{esi},~{dirflag},~{fpsr},~{flags}"(i64 81985529216486895)
				%conv = trunc i64 %0 to i32
				%add = add nsw i32 %conv, 3
				%conv1 = sext i32 %add to i64
				ret i64 %conv1
				}

				define dso_local i64 @test_edi(i64 %in) local_unnamed_addr nounwind {
				; CHECK-LABEL: test_edi:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: pushl %ebp
				; CHECK-NEXT: pushl %edi
				; CHECK-NEXT: movl $-1985229329, %edi # imm = 0x89ABCDEF
				; CHECK-NEXT: movl $19088743, %ebp # imm = 0x1234567
				; CHECK-NEXT: #APP
				; CHECK-NEXT: movl %edi, %eax
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: addl $3, %eax
				; CHECK-NEXT: movl %eax, %edx
				; CHECK-NEXT: sarl $31, %edx
				; CHECK-NEXT: popl %edi
				; CHECK-NEXT: popl %ebp
				; CHECK-NEXT: retl
				entry:
				%0 = tail call i64 asm sideeffect "mov $1, $0", "=r,{edi},~{dirflag},~{fpsr},~{flags}"(i64 81985529216486895)
				%conv = trunc i64 %0 to i32
				%add = add nsw i32 %conv, 3
				%conv1 = sext i32 %add to i64
				ret i64 %conv1
				}

				define dso_local i64 @test_ebp(i64 %in) local_unnamed_addr nounwind {
				; CHECK-LABEL: test_ebp:
				; CHECK: # %bb.0: # %entry
				; CHECK-NEXT: pushl %ebp
				; CHECK-NEXT: movl $19088743, %esp # imm = 0x1234567
				; CHECK-NEXT: movl $-1985229329, %ebp # imm = 0x89ABCDEF
				; CHECK-NEXT: #APP
				; CHECK-NEXT: movl %ebp, %eax
				; CHECK-NEXT: #NO_APP
				; CHECK-NEXT: addl $3, %eax
				; CHECK-NEXT: movl %eax, %edx
				; CHECK-NEXT: sarl $31, %edx
				; CHECK-NEXT: popl %ebp
				; CHECK-NEXT: retl
				entry:
				%0 = tail call i64 asm sideeffect "mov $1, $0", "=r,{ebp},~{dirflag},~{fpsr},~{flags}"(i64 81985529216486895)
				%conv = trunc i64 %0 to i32
				%add = add nsw i32 %conv, 3
				%conv1 = sext i32 %add to i64
				ret i64 %conv1
				}

llvm/test/CodeGen/X86/unfold-masked-merge-vector-variablemask.ll

	Show First 20 Lines • Show All 1,342 Lines • ▼ Show 20 Lines
	; CHECK-BASELINE-NEXT: pushq %r15			; CHECK-BASELINE-NEXT: pushq %r15
	; CHECK-BASELINE-NEXT: pushq %r14			; CHECK-BASELINE-NEXT: pushq %r14
	; CHECK-BASELINE-NEXT: pushq %r13			; CHECK-BASELINE-NEXT: pushq %r13
	; CHECK-BASELINE-NEXT: pushq %r12			; CHECK-BASELINE-NEXT: pushq %r12
	; CHECK-BASELINE-NEXT: pushq %rbx			; CHECK-BASELINE-NEXT: pushq %rbx
	; CHECK-BASELINE-NEXT: movq %rcx, %r15			; CHECK-BASELINE-NEXT: movq %rcx, %r15
	; CHECK-BASELINE-NEXT: movq %rsi, %r14			; CHECK-BASELINE-NEXT: movq %rsi, %r14
	; CHECK-BASELINE-NEXT: movq %rdi, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill			; CHECK-BASELINE-NEXT: movq %rdi, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill
	; CHECK-BASELINE-NEXT: movb 15(%rcx), %al
	; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 16(%rcx), %al			; CHECK-BASELINE-NEXT: movb 16(%rcx), %al
	; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 17(%rcx), %al			; CHECK-BASELINE-NEXT: movb 17(%rcx), %al
	; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 18(%rcx), %al			; CHECK-BASELINE-NEXT: movb 18(%rcx), %al
	; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 19(%rcx), %al			; CHECK-BASELINE-NEXT: movb 19(%rcx), %al
	; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 20(%rcx), %al			; CHECK-BASELINE-NEXT: movb 20(%rcx), %al
	; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 21(%rcx), %r12b			; CHECK-BASELINE-NEXT: movb 21(%rcx), %r12b
	; CHECK-BASELINE-NEXT: movb 22(%rcx), %r10b			; CHECK-BASELINE-NEXT: movb 22(%rcx), %r9b
	; CHECK-BASELINE-NEXT: movb 23(%rcx), %r11b			; CHECK-BASELINE-NEXT: movb 23(%rcx), %r10b
	; CHECK-BASELINE-NEXT: movb 24(%rcx), %bpl			; CHECK-BASELINE-NEXT: movb 24(%rcx), %r11b
	; CHECK-BASELINE-NEXT: movb 25(%rcx), %r13b			; CHECK-BASELINE-NEXT: movb 25(%rcx), %bpl
	; CHECK-BASELINE-NEXT: movb 26(%rcx), %r9b			; CHECK-BASELINE-NEXT: movb 26(%rcx), %r13b
	; CHECK-BASELINE-NEXT: movb 27(%rcx), %r8b			; CHECK-BASELINE-NEXT: movb 27(%rcx), %r8b
	; CHECK-BASELINE-NEXT: movb 28(%rcx), %dil			; CHECK-BASELINE-NEXT: movb 28(%rcx), %dil
	; CHECK-BASELINE-NEXT: movb 29(%rcx), %sil			; CHECK-BASELINE-NEXT: movb 29(%rcx), %sil
	; CHECK-BASELINE-NEXT: movb 30(%rcx), %bl			; CHECK-BASELINE-NEXT: movb 30(%rcx), %bl
	; CHECK-BASELINE-NEXT: movb 31(%rcx), %al			; CHECK-BASELINE-NEXT: movb 31(%rcx), %al
	; CHECK-BASELINE-NEXT: movb 31(%r14), %cl			; CHECK-BASELINE-NEXT: movb 31(%r14), %cl
	; CHECK-BASELINE-NEXT: andb %al, %cl			; CHECK-BASELINE-NEXT: andb %al, %cl
	; CHECK-BASELINE-NEXT: notb %al			; CHECK-BASELINE-NEXT: notb %al
	Show All 20 Lines
	; CHECK-BASELINE-NEXT: movb %dil, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %dil, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 27(%r14), %al			; CHECK-BASELINE-NEXT: movb 27(%r14), %al
	; CHECK-BASELINE-NEXT: andb %r8b, %al			; CHECK-BASELINE-NEXT: andb %r8b, %al
	; CHECK-BASELINE-NEXT: notb %r8b			; CHECK-BASELINE-NEXT: notb %r8b
	; CHECK-BASELINE-NEXT: andb 27(%rdx), %r8b			; CHECK-BASELINE-NEXT: andb 27(%rdx), %r8b
	; CHECK-BASELINE-NEXT: orb %al, %r8b			; CHECK-BASELINE-NEXT: orb %al, %r8b
	; CHECK-BASELINE-NEXT: movb %r8b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %r8b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 26(%r14), %al			; CHECK-BASELINE-NEXT: movb 26(%r14), %al
	; CHECK-BASELINE-NEXT: andb %r9b, %al
	; CHECK-BASELINE-NEXT: notb %r9b
	; CHECK-BASELINE-NEXT: andb 26(%rdx), %r9b
	; CHECK-BASELINE-NEXT: orb %al, %r9b
	; CHECK-BASELINE-NEXT: movb %r9b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 25(%r14), %al
	; CHECK-BASELINE-NEXT: andb %r13b, %al			; CHECK-BASELINE-NEXT: andb %r13b, %al
	; CHECK-BASELINE-NEXT: notb %r13b			; CHECK-BASELINE-NEXT: notb %r13b
	; CHECK-BASELINE-NEXT: andb 25(%rdx), %r13b			; CHECK-BASELINE-NEXT: andb 26(%rdx), %r13b
	; CHECK-BASELINE-NEXT: orb %al, %r13b			; CHECK-BASELINE-NEXT: orb %al, %r13b
	; CHECK-BASELINE-NEXT: movb %r13b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %r13b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 24(%r14), %al			; CHECK-BASELINE-NEXT: movb 25(%r14), %al
	; CHECK-BASELINE-NEXT: andb %bpl, %al			; CHECK-BASELINE-NEXT: andb %bpl, %al
	; CHECK-BASELINE-NEXT: notb %bpl			; CHECK-BASELINE-NEXT: notb %bpl
	; CHECK-BASELINE-NEXT: andb 24(%rdx), %bpl			; CHECK-BASELINE-NEXT: andb 25(%rdx), %bpl
	; CHECK-BASELINE-NEXT: orb %al, %bpl			; CHECK-BASELINE-NEXT: orb %al, %bpl
	; CHECK-BASELINE-NEXT: movb %bpl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %bpl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 23(%r14), %al			; CHECK-BASELINE-NEXT: movb 24(%r14), %al
	; CHECK-BASELINE-NEXT: andb %r11b, %al			; CHECK-BASELINE-NEXT: andb %r11b, %al
	; CHECK-BASELINE-NEXT: notb %r11b			; CHECK-BASELINE-NEXT: notb %r11b
	; CHECK-BASELINE-NEXT: andb 23(%rdx), %r11b			; CHECK-BASELINE-NEXT: andb 24(%rdx), %r11b
	; CHECK-BASELINE-NEXT: orb %al, %r11b			; CHECK-BASELINE-NEXT: orb %al, %r11b
	; CHECK-BASELINE-NEXT: movb %r11b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %r11b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 22(%r14), %al			; CHECK-BASELINE-NEXT: movb 23(%r14), %al
	; CHECK-BASELINE-NEXT: andb %r10b, %al			; CHECK-BASELINE-NEXT: andb %r10b, %al
	; CHECK-BASELINE-NEXT: notb %r10b			; CHECK-BASELINE-NEXT: notb %r10b
	; CHECK-BASELINE-NEXT: andb 22(%rdx), %r10b			; CHECK-BASELINE-NEXT: andb 23(%rdx), %r10b
	; CHECK-BASELINE-NEXT: orb %al, %r10b			; CHECK-BASELINE-NEXT: orb %al, %r10b
	; CHECK-BASELINE-NEXT: movb %r10b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %r10b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
				; CHECK-BASELINE-NEXT: movb 22(%r14), %al
				; CHECK-BASELINE-NEXT: andb %r9b, %al
				; CHECK-BASELINE-NEXT: notb %r9b
				; CHECK-BASELINE-NEXT: andb 22(%rdx), %r9b
				; CHECK-BASELINE-NEXT: orb %al, %r9b
				; CHECK-BASELINE-NEXT: movb %r9b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 21(%r14), %al			; CHECK-BASELINE-NEXT: movb 21(%r14), %al
	; CHECK-BASELINE-NEXT: andb %r12b, %al			; CHECK-BASELINE-NEXT: andb %r12b, %al
	; CHECK-BASELINE-NEXT: notb %r12b			; CHECK-BASELINE-NEXT: notb %r12b
	; CHECK-BASELINE-NEXT: andb 21(%rdx), %r12b			; CHECK-BASELINE-NEXT: andb 21(%rdx), %r12b
	; CHECK-BASELINE-NEXT: orb %al, %r12b			; CHECK-BASELINE-NEXT: orb %al, %r12b
	; CHECK-BASELINE-NEXT: movb %r12b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %r12b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 20(%r14), %al			; CHECK-BASELINE-NEXT: movb 20(%r14), %al
	; CHECK-BASELINE-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %cl # 1-byte Reload			; CHECK-BASELINE-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %cl # 1-byte Reload
	Show All 15 Lines
	; CHECK-BASELINE-NEXT: notb %cl			; CHECK-BASELINE-NEXT: notb %cl
	; CHECK-BASELINE-NEXT: andb 18(%rdx), %cl			; CHECK-BASELINE-NEXT: andb 18(%rdx), %cl
	; CHECK-BASELINE-NEXT: orb %al, %cl			; CHECK-BASELINE-NEXT: orb %al, %cl
	; CHECK-BASELINE-NEXT: movb %cl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %cl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 17(%r14), %al			; CHECK-BASELINE-NEXT: movb 17(%r14), %al
	; CHECK-BASELINE-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %cl # 1-byte Reload			; CHECK-BASELINE-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %cl # 1-byte Reload
	; CHECK-BASELINE-NEXT: andb %cl, %al			; CHECK-BASELINE-NEXT: andb %cl, %al
	; CHECK-BASELINE-NEXT: notb %cl			; CHECK-BASELINE-NEXT: notb %cl
				; CHECK-BASELINE-NEXT: movq %rdx, %rbx
	; CHECK-BASELINE-NEXT: andb 17(%rdx), %cl			; CHECK-BASELINE-NEXT: andb 17(%rdx), %cl
	; CHECK-BASELINE-NEXT: orb %al, %cl			; CHECK-BASELINE-NEXT: orb %al, %cl
	; CHECK-BASELINE-NEXT: movb %cl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %cl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 16(%r14), %al			; CHECK-BASELINE-NEXT: movb 16(%r14), %al
	; CHECK-BASELINE-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %cl # 1-byte Reload			; CHECK-BASELINE-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %cl # 1-byte Reload
	; CHECK-BASELINE-NEXT: andb %cl, %al			; CHECK-BASELINE-NEXT: andb %cl, %al
	; CHECK-BASELINE-NEXT: notb %cl			; CHECK-BASELINE-NEXT: notb %cl
	; CHECK-BASELINE-NEXT: movq %rdx, %rbx
	; CHECK-BASELINE-NEXT: andb 16(%rdx), %cl			; CHECK-BASELINE-NEXT: andb 16(%rdx), %cl
	; CHECK-BASELINE-NEXT: orb %al, %cl			; CHECK-BASELINE-NEXT: orb %al, %cl
	; CHECK-BASELINE-NEXT: movb %cl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %cl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
				; CHECK-BASELINE-NEXT: movb 15(%r15), %cl
	; CHECK-BASELINE-NEXT: movb 15(%r14), %al			; CHECK-BASELINE-NEXT: movb 15(%r14), %al
	; CHECK-BASELINE-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %cl # 1-byte Reload
	; CHECK-BASELINE-NEXT: andb %cl, %al			; CHECK-BASELINE-NEXT: andb %cl, %al
	; CHECK-BASELINE-NEXT: notb %cl			; CHECK-BASELINE-NEXT: notb %cl
	; CHECK-BASELINE-NEXT: andb 15(%rdx), %cl			; CHECK-BASELINE-NEXT: andb 15(%rdx), %cl
	; CHECK-BASELINE-NEXT: orb %al, %cl			; CHECK-BASELINE-NEXT: orb %al, %cl
	; CHECK-BASELINE-NEXT: movb %cl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %cl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 14(%r15), %cl			; CHECK-BASELINE-NEXT: movb 14(%r15), %cl
	; CHECK-BASELINE-NEXT: movb 14(%r14), %al			; CHECK-BASELINE-NEXT: movb 14(%r14), %al
	; CHECK-BASELINE-NEXT: andb %cl, %al			; CHECK-BASELINE-NEXT: andb %cl, %al
	▲ Show 20 Lines • Show All 155 Lines • ▼ Show 20 Lines
	; CHECK-SSE1-NEXT: pushq %r15			; CHECK-SSE1-NEXT: pushq %r15
	; CHECK-SSE1-NEXT: pushq %r14			; CHECK-SSE1-NEXT: pushq %r14
	; CHECK-SSE1-NEXT: pushq %r13			; CHECK-SSE1-NEXT: pushq %r13
	; CHECK-SSE1-NEXT: pushq %r12			; CHECK-SSE1-NEXT: pushq %r12
	; CHECK-SSE1-NEXT: pushq %rbx			; CHECK-SSE1-NEXT: pushq %rbx
	; CHECK-SSE1-NEXT: movq %rcx, %r15			; CHECK-SSE1-NEXT: movq %rcx, %r15
	; CHECK-SSE1-NEXT: movq %rsi, %r14			; CHECK-SSE1-NEXT: movq %rsi, %r14
	; CHECK-SSE1-NEXT: movq %rdi, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill			; CHECK-SSE1-NEXT: movq %rdi, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill
	; CHECK-SSE1-NEXT: movb 15(%rcx), %al
	; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 16(%rcx), %al			; CHECK-SSE1-NEXT: movb 16(%rcx), %al
	; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 17(%rcx), %al			; CHECK-SSE1-NEXT: movb 17(%rcx), %al
	; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 18(%rcx), %al			; CHECK-SSE1-NEXT: movb 18(%rcx), %al
	; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 19(%rcx), %al			; CHECK-SSE1-NEXT: movb 19(%rcx), %al
	; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 20(%rcx), %al			; CHECK-SSE1-NEXT: movb 20(%rcx), %al
	; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 21(%rcx), %r12b			; CHECK-SSE1-NEXT: movb 21(%rcx), %r12b
	; CHECK-SSE1-NEXT: movb 22(%rcx), %r10b			; CHECK-SSE1-NEXT: movb 22(%rcx), %r9b
	; CHECK-SSE1-NEXT: movb 23(%rcx), %r11b			; CHECK-SSE1-NEXT: movb 23(%rcx), %r10b
	; CHECK-SSE1-NEXT: movb 24(%rcx), %bpl			; CHECK-SSE1-NEXT: movb 24(%rcx), %r11b
	; CHECK-SSE1-NEXT: movb 25(%rcx), %r13b			; CHECK-SSE1-NEXT: movb 25(%rcx), %bpl
	; CHECK-SSE1-NEXT: movb 26(%rcx), %r9b			; CHECK-SSE1-NEXT: movb 26(%rcx), %r13b
	; CHECK-SSE1-NEXT: movb 27(%rcx), %r8b			; CHECK-SSE1-NEXT: movb 27(%rcx), %r8b
	; CHECK-SSE1-NEXT: movb 28(%rcx), %dil			; CHECK-SSE1-NEXT: movb 28(%rcx), %dil
	; CHECK-SSE1-NEXT: movb 29(%rcx), %sil			; CHECK-SSE1-NEXT: movb 29(%rcx), %sil
	; CHECK-SSE1-NEXT: movb 30(%rcx), %bl			; CHECK-SSE1-NEXT: movb 30(%rcx), %bl
	; CHECK-SSE1-NEXT: movb 31(%rcx), %al			; CHECK-SSE1-NEXT: movb 31(%rcx), %al
	; CHECK-SSE1-NEXT: movb 31(%r14), %cl			; CHECK-SSE1-NEXT: movb 31(%r14), %cl
	; CHECK-SSE1-NEXT: andb %al, %cl			; CHECK-SSE1-NEXT: andb %al, %cl
	; CHECK-SSE1-NEXT: notb %al			; CHECK-SSE1-NEXT: notb %al
	Show All 20 Lines
	; CHECK-SSE1-NEXT: movb %dil, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %dil, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 27(%r14), %al			; CHECK-SSE1-NEXT: movb 27(%r14), %al
	; CHECK-SSE1-NEXT: andb %r8b, %al			; CHECK-SSE1-NEXT: andb %r8b, %al
	; CHECK-SSE1-NEXT: notb %r8b			; CHECK-SSE1-NEXT: notb %r8b
	; CHECK-SSE1-NEXT: andb 27(%rdx), %r8b			; CHECK-SSE1-NEXT: andb 27(%rdx), %r8b
	; CHECK-SSE1-NEXT: orb %al, %r8b			; CHECK-SSE1-NEXT: orb %al, %r8b
	; CHECK-SSE1-NEXT: movb %r8b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %r8b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 26(%r14), %al			; CHECK-SSE1-NEXT: movb 26(%r14), %al
	; CHECK-SSE1-NEXT: andb %r9b, %al
	; CHECK-SSE1-NEXT: notb %r9b
	; CHECK-SSE1-NEXT: andb 26(%rdx), %r9b
	; CHECK-SSE1-NEXT: orb %al, %r9b
	; CHECK-SSE1-NEXT: movb %r9b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 25(%r14), %al
	; CHECK-SSE1-NEXT: andb %r13b, %al			; CHECK-SSE1-NEXT: andb %r13b, %al
	; CHECK-SSE1-NEXT: notb %r13b			; CHECK-SSE1-NEXT: notb %r13b
	; CHECK-SSE1-NEXT: andb 25(%rdx), %r13b			; CHECK-SSE1-NEXT: andb 26(%rdx), %r13b
	; CHECK-SSE1-NEXT: orb %al, %r13b			; CHECK-SSE1-NEXT: orb %al, %r13b
	; CHECK-SSE1-NEXT: movb %r13b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %r13b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 24(%r14), %al			; CHECK-SSE1-NEXT: movb 25(%r14), %al
	; CHECK-SSE1-NEXT: andb %bpl, %al			; CHECK-SSE1-NEXT: andb %bpl, %al
	; CHECK-SSE1-NEXT: notb %bpl			; CHECK-SSE1-NEXT: notb %bpl
	; CHECK-SSE1-NEXT: andb 24(%rdx), %bpl			; CHECK-SSE1-NEXT: andb 25(%rdx), %bpl
	; CHECK-SSE1-NEXT: orb %al, %bpl			; CHECK-SSE1-NEXT: orb %al, %bpl
	; CHECK-SSE1-NEXT: movb %bpl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %bpl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 23(%r14), %al			; CHECK-SSE1-NEXT: movb 24(%r14), %al
	; CHECK-SSE1-NEXT: andb %r11b, %al			; CHECK-SSE1-NEXT: andb %r11b, %al
	; CHECK-SSE1-NEXT: notb %r11b			; CHECK-SSE1-NEXT: notb %r11b
	; CHECK-SSE1-NEXT: andb 23(%rdx), %r11b			; CHECK-SSE1-NEXT: andb 24(%rdx), %r11b
	; CHECK-SSE1-NEXT: orb %al, %r11b			; CHECK-SSE1-NEXT: orb %al, %r11b
	; CHECK-SSE1-NEXT: movb %r11b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %r11b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 22(%r14), %al			; CHECK-SSE1-NEXT: movb 23(%r14), %al
	; CHECK-SSE1-NEXT: andb %r10b, %al			; CHECK-SSE1-NEXT: andb %r10b, %al
	; CHECK-SSE1-NEXT: notb %r10b			; CHECK-SSE1-NEXT: notb %r10b
	; CHECK-SSE1-NEXT: andb 22(%rdx), %r10b			; CHECK-SSE1-NEXT: andb 23(%rdx), %r10b
	; CHECK-SSE1-NEXT: orb %al, %r10b			; CHECK-SSE1-NEXT: orb %al, %r10b
	; CHECK-SSE1-NEXT: movb %r10b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %r10b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
				; CHECK-SSE1-NEXT: movb 22(%r14), %al
				; CHECK-SSE1-NEXT: andb %r9b, %al
				; CHECK-SSE1-NEXT: notb %r9b
				; CHECK-SSE1-NEXT: andb 22(%rdx), %r9b
				; CHECK-SSE1-NEXT: orb %al, %r9b
				; CHECK-SSE1-NEXT: movb %r9b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 21(%r14), %al			; CHECK-SSE1-NEXT: movb 21(%r14), %al
	; CHECK-SSE1-NEXT: andb %r12b, %al			; CHECK-SSE1-NEXT: andb %r12b, %al
	; CHECK-SSE1-NEXT: notb %r12b			; CHECK-SSE1-NEXT: notb %r12b
	; CHECK-SSE1-NEXT: andb 21(%rdx), %r12b			; CHECK-SSE1-NEXT: andb 21(%rdx), %r12b
	; CHECK-SSE1-NEXT: orb %al, %r12b			; CHECK-SSE1-NEXT: orb %al, %r12b
	; CHECK-SSE1-NEXT: movb %r12b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %r12b, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 20(%r14), %al			; CHECK-SSE1-NEXT: movb 20(%r14), %al
	; CHECK-SSE1-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %cl # 1-byte Reload			; CHECK-SSE1-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %cl # 1-byte Reload
	Show All 15 Lines
	; CHECK-SSE1-NEXT: notb %cl			; CHECK-SSE1-NEXT: notb %cl
	; CHECK-SSE1-NEXT: andb 18(%rdx), %cl			; CHECK-SSE1-NEXT: andb 18(%rdx), %cl
	; CHECK-SSE1-NEXT: orb %al, %cl			; CHECK-SSE1-NEXT: orb %al, %cl
	; CHECK-SSE1-NEXT: movb %cl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %cl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 17(%r14), %al			; CHECK-SSE1-NEXT: movb 17(%r14), %al
	; CHECK-SSE1-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %cl # 1-byte Reload			; CHECK-SSE1-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %cl # 1-byte Reload
	; CHECK-SSE1-NEXT: andb %cl, %al			; CHECK-SSE1-NEXT: andb %cl, %al
	; CHECK-SSE1-NEXT: notb %cl			; CHECK-SSE1-NEXT: notb %cl
				; CHECK-SSE1-NEXT: movq %rdx, %rbx
	; CHECK-SSE1-NEXT: andb 17(%rdx), %cl			; CHECK-SSE1-NEXT: andb 17(%rdx), %cl
	; CHECK-SSE1-NEXT: orb %al, %cl			; CHECK-SSE1-NEXT: orb %al, %cl
	; CHECK-SSE1-NEXT: movb %cl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %cl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 16(%r14), %al			; CHECK-SSE1-NEXT: movb 16(%r14), %al
	; CHECK-SSE1-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %cl # 1-byte Reload			; CHECK-SSE1-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %cl # 1-byte Reload
	; CHECK-SSE1-NEXT: andb %cl, %al			; CHECK-SSE1-NEXT: andb %cl, %al
	; CHECK-SSE1-NEXT: notb %cl			; CHECK-SSE1-NEXT: notb %cl
	; CHECK-SSE1-NEXT: movq %rdx, %rbx
	; CHECK-SSE1-NEXT: andb 16(%rdx), %cl			; CHECK-SSE1-NEXT: andb 16(%rdx), %cl
	; CHECK-SSE1-NEXT: orb %al, %cl			; CHECK-SSE1-NEXT: orb %al, %cl
	; CHECK-SSE1-NEXT: movb %cl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %cl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
				; CHECK-SSE1-NEXT: movb 15(%r15), %cl
	; CHECK-SSE1-NEXT: movb 15(%r14), %al			; CHECK-SSE1-NEXT: movb 15(%r14), %al
	; CHECK-SSE1-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %cl # 1-byte Reload
	; CHECK-SSE1-NEXT: andb %cl, %al			; CHECK-SSE1-NEXT: andb %cl, %al
	; CHECK-SSE1-NEXT: notb %cl			; CHECK-SSE1-NEXT: notb %cl
	; CHECK-SSE1-NEXT: andb 15(%rdx), %cl			; CHECK-SSE1-NEXT: andb 15(%rdx), %cl
	; CHECK-SSE1-NEXT: orb %al, %cl			; CHECK-SSE1-NEXT: orb %al, %cl
	; CHECK-SSE1-NEXT: movb %cl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %cl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 14(%r15), %cl			; CHECK-SSE1-NEXT: movb 14(%r15), %cl
	; CHECK-SSE1-NEXT: movb 14(%r14), %al			; CHECK-SSE1-NEXT: movb 14(%r14), %al
	; CHECK-SSE1-NEXT: andb %cl, %al			; CHECK-SSE1-NEXT: andb %cl, %al
	▲ Show 20 Lines • Show All 1,738 Lines • ▼ Show 20 Lines
	; CHECK-BASELINE-NEXT: pushq %r15			; CHECK-BASELINE-NEXT: pushq %r15
	; CHECK-BASELINE-NEXT: pushq %r14			; CHECK-BASELINE-NEXT: pushq %r14
	; CHECK-BASELINE-NEXT: pushq %r13			; CHECK-BASELINE-NEXT: pushq %r13
	; CHECK-BASELINE-NEXT: pushq %r12			; CHECK-BASELINE-NEXT: pushq %r12
	; CHECK-BASELINE-NEXT: pushq %rbx			; CHECK-BASELINE-NEXT: pushq %rbx
	; CHECK-BASELINE-NEXT: movq %rdx, %r13			; CHECK-BASELINE-NEXT: movq %rdx, %r13
	; CHECK-BASELINE-NEXT: movq %rsi, %rbx			; CHECK-BASELINE-NEXT: movq %rsi, %rbx
	; CHECK-BASELINE-NEXT: movq %rdi, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill			; CHECK-BASELINE-NEXT: movq %rdi, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill
	; CHECK-BASELINE-NEXT: movb 16(%rdx), %r12b			; CHECK-BASELINE-NEXT: movb 15(%rdx), %r12b
	; CHECK-BASELINE-NEXT: movb 15(%rdx), %al
	; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 14(%rdx), %al			; CHECK-BASELINE-NEXT: movb 14(%rdx), %al
	; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 13(%rdx), %al			; CHECK-BASELINE-NEXT: movb 13(%rdx), %al
	; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 12(%rdx), %al			; CHECK-BASELINE-NEXT: movb 12(%rdx), %al
	; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 11(%rdx), %al			; CHECK-BASELINE-NEXT: movb 11(%rdx), %al
	; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 10(%rdx), %al			; CHECK-BASELINE-NEXT: movb 10(%rdx), %al
	; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 9(%rdx), %r10b			; CHECK-BASELINE-NEXT: movb 9(%rdx), %r9b
	; CHECK-BASELINE-NEXT: movb 8(%rdx), %r11b			; CHECK-BASELINE-NEXT: movb 8(%rdx), %r10b
	; CHECK-BASELINE-NEXT: movb 7(%rdx), %r9b			; CHECK-BASELINE-NEXT: movb 7(%rdx), %r11b
	; CHECK-BASELINE-NEXT: movb 6(%rdx), %r8b			; CHECK-BASELINE-NEXT: movb 6(%rdx), %r8b
	; CHECK-BASELINE-NEXT: movb 5(%rdx), %bpl			; CHECK-BASELINE-NEXT: movb 5(%rdx), %bpl
	; CHECK-BASELINE-NEXT: movb 4(%rdx), %dil			; CHECK-BASELINE-NEXT: movb 4(%rdx), %sil
	; CHECK-BASELINE-NEXT: movb 3(%rdx), %sil			; CHECK-BASELINE-NEXT: movb 3(%rdx), %dil
	; CHECK-BASELINE-NEXT: movb 2(%rdx), %r14b			; CHECK-BASELINE-NEXT: movb 2(%rdx), %r14b
	; CHECK-BASELINE-NEXT: movb (%rdx), %al			; CHECK-BASELINE-NEXT: movb (%rdx), %al
	; CHECK-BASELINE-NEXT: movb 1(%rdx), %r15b			; CHECK-BASELINE-NEXT: movb 1(%rdx), %r15b
	; CHECK-BASELINE-NEXT: movb (%rbx), %dl			; CHECK-BASELINE-NEXT: movb (%rbx), %dl
	; CHECK-BASELINE-NEXT: xorb %al, %dl			; CHECK-BASELINE-NEXT: xorb %al, %dl
	; CHECK-BASELINE-NEXT: andb (%rcx), %dl			; CHECK-BASELINE-NEXT: andb (%rcx), %dl
	; CHECK-BASELINE-NEXT: xorb %al, %dl			; CHECK-BASELINE-NEXT: xorb %al, %dl
	; CHECK-BASELINE-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 1(%rbx), %al			; CHECK-BASELINE-NEXT: movb 1(%rbx), %al
	; CHECK-BASELINE-NEXT: xorb %r15b, %al			; CHECK-BASELINE-NEXT: xorb %r15b, %al
	; CHECK-BASELINE-NEXT: andb 1(%rcx), %al			; CHECK-BASELINE-NEXT: andb 1(%rcx), %al
	; CHECK-BASELINE-NEXT: xorb %r15b, %al			; CHECK-BASELINE-NEXT: xorb %r15b, %al
	; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 2(%rbx), %al			; CHECK-BASELINE-NEXT: movb 2(%rbx), %al
	; CHECK-BASELINE-NEXT: xorb %r14b, %al			; CHECK-BASELINE-NEXT: xorb %r14b, %al
	; CHECK-BASELINE-NEXT: andb 2(%rcx), %al			; CHECK-BASELINE-NEXT: andb 2(%rcx), %al
	; CHECK-BASELINE-NEXT: xorb %r14b, %al			; CHECK-BASELINE-NEXT: xorb %r14b, %al
	; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 3(%rbx), %al			; CHECK-BASELINE-NEXT: movb 3(%rbx), %al
	; CHECK-BASELINE-NEXT: xorb %sil, %al			; CHECK-BASELINE-NEXT: xorb %dil, %al
	; CHECK-BASELINE-NEXT: andb 3(%rcx), %al			; CHECK-BASELINE-NEXT: andb 3(%rcx), %al
	; CHECK-BASELINE-NEXT: xorb %sil, %al			; CHECK-BASELINE-NEXT: xorb %dil, %al
	; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 4(%rbx), %al			; CHECK-BASELINE-NEXT: movb 4(%rbx), %al
	; CHECK-BASELINE-NEXT: xorb %dil, %al			; CHECK-BASELINE-NEXT: xorb %sil, %al
	; CHECK-BASELINE-NEXT: andb 4(%rcx), %al			; CHECK-BASELINE-NEXT: andb 4(%rcx), %al
	; CHECK-BASELINE-NEXT: xorb %dil, %al			; CHECK-BASELINE-NEXT: xorb %sil, %al
	; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 5(%rbx), %al			; CHECK-BASELINE-NEXT: movb 5(%rbx), %al
	; CHECK-BASELINE-NEXT: xorb %bpl, %al			; CHECK-BASELINE-NEXT: xorb %bpl, %al
	; CHECK-BASELINE-NEXT: andb 5(%rcx), %al			; CHECK-BASELINE-NEXT: andb 5(%rcx), %al
	; CHECK-BASELINE-NEXT: xorb %bpl, %al			; CHECK-BASELINE-NEXT: xorb %bpl, %al
	; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 6(%rbx), %al			; CHECK-BASELINE-NEXT: movb 6(%rbx), %al
	; CHECK-BASELINE-NEXT: xorb %r8b, %al			; CHECK-BASELINE-NEXT: xorb %r8b, %al
	; CHECK-BASELINE-NEXT: andb 6(%rcx), %al			; CHECK-BASELINE-NEXT: andb 6(%rcx), %al
	; CHECK-BASELINE-NEXT: xorb %r8b, %al			; CHECK-BASELINE-NEXT: xorb %r8b, %al
	; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 7(%rbx), %al			; CHECK-BASELINE-NEXT: movb 7(%rbx), %al
	; CHECK-BASELINE-NEXT: xorb %r9b, %al			; CHECK-BASELINE-NEXT: xorb %r11b, %al
	; CHECK-BASELINE-NEXT: andb 7(%rcx), %al			; CHECK-BASELINE-NEXT: andb 7(%rcx), %al
	; CHECK-BASELINE-NEXT: xorb %r9b, %al			; CHECK-BASELINE-NEXT: xorb %r11b, %al
	; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 8(%rbx), %al			; CHECK-BASELINE-NEXT: movb 8(%rbx), %al
	; CHECK-BASELINE-NEXT: xorb %r11b, %al			; CHECK-BASELINE-NEXT: xorb %r10b, %al
	; CHECK-BASELINE-NEXT: andb 8(%rcx), %al			; CHECK-BASELINE-NEXT: andb 8(%rcx), %al
	; CHECK-BASELINE-NEXT: xorb %r11b, %al			; CHECK-BASELINE-NEXT: xorb %r10b, %al
	; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 9(%rbx), %al			; CHECK-BASELINE-NEXT: movb 9(%rbx), %al
	; CHECK-BASELINE-NEXT: xorb %r10b, %al			; CHECK-BASELINE-NEXT: xorb %r9b, %al
	; CHECK-BASELINE-NEXT: andb 9(%rcx), %al			; CHECK-BASELINE-NEXT: andb 9(%rcx), %al
	; CHECK-BASELINE-NEXT: xorb %r10b, %al			; CHECK-BASELINE-NEXT: xorb %r9b, %al
	; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 10(%rbx), %dl			; CHECK-BASELINE-NEXT: movb 10(%rbx), %dl
	; CHECK-BASELINE-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload			; CHECK-BASELINE-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload
	; CHECK-BASELINE-NEXT: xorb %al, %dl			; CHECK-BASELINE-NEXT: xorb %al, %dl
	; CHECK-BASELINE-NEXT: andb 10(%rcx), %dl			; CHECK-BASELINE-NEXT: andb 10(%rcx), %dl
	; CHECK-BASELINE-NEXT: xorb %al, %dl			; CHECK-BASELINE-NEXT: xorb %al, %dl
	; CHECK-BASELINE-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 11(%rbx), %dl			; CHECK-BASELINE-NEXT: movb 11(%rbx), %dl
	Show All 15 Lines
	; CHECK-BASELINE-NEXT: xorb %al, %dl			; CHECK-BASELINE-NEXT: xorb %al, %dl
	; CHECK-BASELINE-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 14(%rbx), %dl			; CHECK-BASELINE-NEXT: movb 14(%rbx), %dl
	; CHECK-BASELINE-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload			; CHECK-BASELINE-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload
	; CHECK-BASELINE-NEXT: xorb %al, %dl			; CHECK-BASELINE-NEXT: xorb %al, %dl
	; CHECK-BASELINE-NEXT: andb 14(%rcx), %dl			; CHECK-BASELINE-NEXT: andb 14(%rcx), %dl
	; CHECK-BASELINE-NEXT: xorb %al, %dl			; CHECK-BASELINE-NEXT: xorb %al, %dl
	; CHECK-BASELINE-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 15(%rbx), %dl			; CHECK-BASELINE-NEXT: movb 15(%rbx), %al
	; CHECK-BASELINE-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload
	; CHECK-BASELINE-NEXT: xorb %al, %dl
	; CHECK-BASELINE-NEXT: andb 15(%rcx), %dl
	; CHECK-BASELINE-NEXT: xorb %al, %dl
	; CHECK-BASELINE-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 16(%rbx), %al
	; CHECK-BASELINE-NEXT: xorb %r12b, %al			; CHECK-BASELINE-NEXT: xorb %r12b, %al
	; CHECK-BASELINE-NEXT: andb 16(%rcx), %al			; CHECK-BASELINE-NEXT: andb 15(%rcx), %al
	; CHECK-BASELINE-NEXT: xorb %r12b, %al			; CHECK-BASELINE-NEXT: xorb %r12b, %al
	; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
				; CHECK-BASELINE-NEXT: movb 16(%r13), %al
				; CHECK-BASELINE-NEXT: movb 16(%rbx), %dl
				; CHECK-BASELINE-NEXT: xorb %al, %dl
				; CHECK-BASELINE-NEXT: andb 16(%rcx), %dl
				; CHECK-BASELINE-NEXT: xorb %al, %dl
				; CHECK-BASELINE-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 17(%r13), %al			; CHECK-BASELINE-NEXT: movb 17(%r13), %al
	; CHECK-BASELINE-NEXT: movb 17(%rbx), %dl			; CHECK-BASELINE-NEXT: movb 17(%rbx), %dl
	; CHECK-BASELINE-NEXT: xorb %al, %dl			; CHECK-BASELINE-NEXT: xorb %al, %dl
	; CHECK-BASELINE-NEXT: andb 17(%rcx), %dl			; CHECK-BASELINE-NEXT: andb 17(%rcx), %dl
	; CHECK-BASELINE-NEXT: xorb %al, %dl			; CHECK-BASELINE-NEXT: xorb %al, %dl
	; CHECK-BASELINE-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 18(%r13), %al			; CHECK-BASELINE-NEXT: movb 18(%r13), %al
	; CHECK-BASELINE-NEXT: movb 18(%rbx), %dl			; CHECK-BASELINE-NEXT: movb 18(%rbx), %dl
	; CHECK-BASELINE-NEXT: xorb %al, %dl			; CHECK-BASELINE-NEXT: xorb %al, %dl
	; CHECK-BASELINE-NEXT: andb 18(%rcx), %dl			; CHECK-BASELINE-NEXT: andb 18(%rcx), %dl
	; CHECK-BASELINE-NEXT: xorb %al, %dl			; CHECK-BASELINE-NEXT: xorb %al, %dl
	; CHECK-BASELINE-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 19(%r13), %al			; CHECK-BASELINE-NEXT: movb 19(%r13), %al
	; CHECK-BASELINE-NEXT: movb 19(%rbx), %r12b			; CHECK-BASELINE-NEXT: movb 19(%rbx), %r12b
	; CHECK-BASELINE-NEXT: xorb %al, %r12b			; CHECK-BASELINE-NEXT: xorb %al, %r12b
	; CHECK-BASELINE-NEXT: andb 19(%rcx), %r12b			; CHECK-BASELINE-NEXT: andb 19(%rcx), %r12b
	; CHECK-BASELINE-NEXT: movq %rcx, %rdx
	; CHECK-BASELINE-NEXT: xorb %al, %r12b			; CHECK-BASELINE-NEXT: xorb %al, %r12b
	; CHECK-BASELINE-NEXT: movb 20(%r13), %al			; CHECK-BASELINE-NEXT: movb 20(%r13), %al
	; CHECK-BASELINE-NEXT: movb 20(%rbx), %r14b			; CHECK-BASELINE-NEXT: movb 20(%rbx), %r15b
	; CHECK-BASELINE-NEXT: xorb %al, %r14b
	; CHECK-BASELINE-NEXT: andb 20(%rcx), %r14b
	; CHECK-BASELINE-NEXT: xorb %al, %r14b
	; CHECK-BASELINE-NEXT: movb 21(%r13), %al
	; CHECK-BASELINE-NEXT: movb 21(%rbx), %r15b
	; CHECK-BASELINE-NEXT: xorb %al, %r15b			; CHECK-BASELINE-NEXT: xorb %al, %r15b
	; CHECK-BASELINE-NEXT: andb 21(%rcx), %r15b			; CHECK-BASELINE-NEXT: andb 20(%rcx), %r15b
				; CHECK-BASELINE-NEXT: movq %rcx, %rsi
	; CHECK-BASELINE-NEXT: xorb %al, %r15b			; CHECK-BASELINE-NEXT: xorb %al, %r15b
				; CHECK-BASELINE-NEXT: movb 21(%r13), %al
				; CHECK-BASELINE-NEXT: movb 21(%rbx), %r14b
				; CHECK-BASELINE-NEXT: xorb %al, %r14b
				; CHECK-BASELINE-NEXT: andb 21(%rcx), %r14b
				; CHECK-BASELINE-NEXT: xorb %al, %r14b
	; CHECK-BASELINE-NEXT: movb 22(%r13), %al			; CHECK-BASELINE-NEXT: movb 22(%r13), %al
	; CHECK-BASELINE-NEXT: movb 22(%rbx), %bpl			; CHECK-BASELINE-NEXT: movb 22(%rbx), %bpl
	; CHECK-BASELINE-NEXT: xorb %al, %bpl			; CHECK-BASELINE-NEXT: xorb %al, %bpl
	; CHECK-BASELINE-NEXT: andb 22(%rcx), %bpl			; CHECK-BASELINE-NEXT: andb 22(%rcx), %bpl
	; CHECK-BASELINE-NEXT: xorb %al, %bpl			; CHECK-BASELINE-NEXT: xorb %al, %bpl
	; CHECK-BASELINE-NEXT: movb 23(%r13), %al			; CHECK-BASELINE-NEXT: movb 23(%r13), %al
	; CHECK-BASELINE-NEXT: movb 23(%rbx), %r11b			; CHECK-BASELINE-NEXT: movb 23(%rbx), %r11b
	; CHECK-BASELINE-NEXT: xorb %al, %r11b			; CHECK-BASELINE-NEXT: xorb %al, %r11b
	Show All 15 Lines
	; CHECK-BASELINE-NEXT: andb 26(%rcx), %r8b			; CHECK-BASELINE-NEXT: andb 26(%rcx), %r8b
	; CHECK-BASELINE-NEXT: xorb %al, %r8b			; CHECK-BASELINE-NEXT: xorb %al, %r8b
	; CHECK-BASELINE-NEXT: movb 27(%r13), %al			; CHECK-BASELINE-NEXT: movb 27(%r13), %al
	; CHECK-BASELINE-NEXT: movb 27(%rbx), %dil			; CHECK-BASELINE-NEXT: movb 27(%rbx), %dil
	; CHECK-BASELINE-NEXT: xorb %al, %dil			; CHECK-BASELINE-NEXT: xorb %al, %dil
	; CHECK-BASELINE-NEXT: andb 27(%rcx), %dil			; CHECK-BASELINE-NEXT: andb 27(%rcx), %dil
	; CHECK-BASELINE-NEXT: xorb %al, %dil			; CHECK-BASELINE-NEXT: xorb %al, %dil
	; CHECK-BASELINE-NEXT: movb 28(%r13), %al			; CHECK-BASELINE-NEXT: movb 28(%r13), %al
	; CHECK-BASELINE-NEXT: movb 28(%rbx), %sil			; CHECK-BASELINE-NEXT: movb 28(%rbx), %dl
	; CHECK-BASELINE-NEXT: xorb %al, %sil			; CHECK-BASELINE-NEXT: xorb %al, %dl
	; CHECK-BASELINE-NEXT: andb 28(%rcx), %sil			; CHECK-BASELINE-NEXT: andb 28(%rcx), %dl
	; CHECK-BASELINE-NEXT: xorb %al, %sil			; CHECK-BASELINE-NEXT: xorb %al, %dl
	; CHECK-BASELINE-NEXT: movb 29(%r13), %al			; CHECK-BASELINE-NEXT: movb 29(%r13), %al
	; CHECK-BASELINE-NEXT: movb 29(%rbx), %cl			; CHECK-BASELINE-NEXT: movb 29(%rbx), %cl
	; CHECK-BASELINE-NEXT: xorb %al, %cl			; CHECK-BASELINE-NEXT: xorb %al, %cl
	; CHECK-BASELINE-NEXT: andb 29(%rdx), %cl			; CHECK-BASELINE-NEXT: andb 29(%rsi), %cl
	; CHECK-BASELINE-NEXT: xorb %al, %cl			; CHECK-BASELINE-NEXT: xorb %al, %cl
	; CHECK-BASELINE-NEXT: movb 30(%r13), %al			; CHECK-BASELINE-NEXT: movb 30(%r13), %al
	; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-BASELINE-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-BASELINE-NEXT: movb 30(%rbx), %al			; CHECK-BASELINE-NEXT: movb 30(%rbx), %al
	; CHECK-BASELINE-NEXT: xorb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Folded Reload			; CHECK-BASELINE-NEXT: xorb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Folded Reload
	; CHECK-BASELINE-NEXT: andb 30(%rdx), %al			; CHECK-BASELINE-NEXT: andb 30(%rsi), %al
	; CHECK-BASELINE-NEXT: xorb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Folded Reload			; CHECK-BASELINE-NEXT: xorb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Folded Reload
	; CHECK-BASELINE-NEXT: movb 31(%r13), %r13b			; CHECK-BASELINE-NEXT: movb 31(%r13), %r13b
	; CHECK-BASELINE-NEXT: movb 31(%rbx), %bl			; CHECK-BASELINE-NEXT: movb 31(%rbx), %bl
	; CHECK-BASELINE-NEXT: xorb %r13b, %bl			; CHECK-BASELINE-NEXT: xorb %r13b, %bl
	; CHECK-BASELINE-NEXT: andb 31(%rdx), %bl			; CHECK-BASELINE-NEXT: andb 31(%rsi), %bl
	; CHECK-BASELINE-NEXT: xorb %r13b, %bl			; CHECK-BASELINE-NEXT: xorb %r13b, %bl
	; CHECK-BASELINE-NEXT: movq {{[-0-9]+}}(%r{{[sb]}}p), %r13 # 8-byte Reload			; CHECK-BASELINE-NEXT: movq {{[-0-9]+}}(%r{{[sb]}}p), %r13 # 8-byte Reload
	; CHECK-BASELINE-NEXT: movb %bl, 31(%r13)			; CHECK-BASELINE-NEXT: movb %bl, 31(%r13)
	; CHECK-BASELINE-NEXT: movb %al, 30(%r13)			; CHECK-BASELINE-NEXT: movb %al, 30(%r13)
	; CHECK-BASELINE-NEXT: movb %cl, 29(%r13)			; CHECK-BASELINE-NEXT: movb %cl, 29(%r13)
	; CHECK-BASELINE-NEXT: movb %sil, 28(%r13)			; CHECK-BASELINE-NEXT: movb %dl, 28(%r13)
	; CHECK-BASELINE-NEXT: movb %dil, 27(%r13)			; CHECK-BASELINE-NEXT: movb %dil, 27(%r13)
	; CHECK-BASELINE-NEXT: movb %r8b, 26(%r13)			; CHECK-BASELINE-NEXT: movb %r8b, 26(%r13)
	; CHECK-BASELINE-NEXT: movb %r9b, 25(%r13)			; CHECK-BASELINE-NEXT: movb %r9b, 25(%r13)
	; CHECK-BASELINE-NEXT: movb %r10b, 24(%r13)			; CHECK-BASELINE-NEXT: movb %r10b, 24(%r13)
	; CHECK-BASELINE-NEXT: movb %r11b, 23(%r13)			; CHECK-BASELINE-NEXT: movb %r11b, 23(%r13)
	; CHECK-BASELINE-NEXT: movb %bpl, 22(%r13)			; CHECK-BASELINE-NEXT: movb %bpl, 22(%r13)
	; CHECK-BASELINE-NEXT: movb %r15b, 21(%r13)			; CHECK-BASELINE-NEXT: movb %r14b, 21(%r13)
	; CHECK-BASELINE-NEXT: movb %r14b, 20(%r13)			; CHECK-BASELINE-NEXT: movb %r15b, 20(%r13)
	; CHECK-BASELINE-NEXT: movb %r12b, 19(%r13)			; CHECK-BASELINE-NEXT: movb %r12b, 19(%r13)
	; CHECK-BASELINE-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload			; CHECK-BASELINE-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload
	; CHECK-BASELINE-NEXT: movb %al, 18(%r13)			; CHECK-BASELINE-NEXT: movb %al, 18(%r13)
	; CHECK-BASELINE-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload			; CHECK-BASELINE-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload
	; CHECK-BASELINE-NEXT: movb %al, 17(%r13)			; CHECK-BASELINE-NEXT: movb %al, 17(%r13)
	; CHECK-BASELINE-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload			; CHECK-BASELINE-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload
	; CHECK-BASELINE-NEXT: movb %al, 16(%r13)			; CHECK-BASELINE-NEXT: movb %al, 16(%r13)
	; CHECK-BASELINE-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload			; CHECK-BASELINE-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; CHECK-SSE1-NEXT: pushq %r15			; CHECK-SSE1-NEXT: pushq %r15
	; CHECK-SSE1-NEXT: pushq %r14			; CHECK-SSE1-NEXT: pushq %r14
	; CHECK-SSE1-NEXT: pushq %r13			; CHECK-SSE1-NEXT: pushq %r13
	; CHECK-SSE1-NEXT: pushq %r12			; CHECK-SSE1-NEXT: pushq %r12
	; CHECK-SSE1-NEXT: pushq %rbx			; CHECK-SSE1-NEXT: pushq %rbx
	; CHECK-SSE1-NEXT: movq %rdx, %r13			; CHECK-SSE1-NEXT: movq %rdx, %r13
	; CHECK-SSE1-NEXT: movq %rsi, %rbx			; CHECK-SSE1-NEXT: movq %rsi, %rbx
	; CHECK-SSE1-NEXT: movq %rdi, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill			; CHECK-SSE1-NEXT: movq %rdi, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill
	; CHECK-SSE1-NEXT: movb 16(%rdx), %r12b			; CHECK-SSE1-NEXT: movb 15(%rdx), %r12b
	; CHECK-SSE1-NEXT: movb 15(%rdx), %al
	; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 14(%rdx), %al			; CHECK-SSE1-NEXT: movb 14(%rdx), %al
	; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 13(%rdx), %al			; CHECK-SSE1-NEXT: movb 13(%rdx), %al
	; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 12(%rdx), %al			; CHECK-SSE1-NEXT: movb 12(%rdx), %al
	; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 11(%rdx), %al			; CHECK-SSE1-NEXT: movb 11(%rdx), %al
	; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 10(%rdx), %al			; CHECK-SSE1-NEXT: movb 10(%rdx), %al
	; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 9(%rdx), %r10b			; CHECK-SSE1-NEXT: movb 9(%rdx), %r9b
	; CHECK-SSE1-NEXT: movb 8(%rdx), %r11b			; CHECK-SSE1-NEXT: movb 8(%rdx), %r10b
	; CHECK-SSE1-NEXT: movb 7(%rdx), %r9b			; CHECK-SSE1-NEXT: movb 7(%rdx), %r11b
	; CHECK-SSE1-NEXT: movb 6(%rdx), %r8b			; CHECK-SSE1-NEXT: movb 6(%rdx), %r8b
	; CHECK-SSE1-NEXT: movb 5(%rdx), %bpl			; CHECK-SSE1-NEXT: movb 5(%rdx), %bpl
	; CHECK-SSE1-NEXT: movb 4(%rdx), %dil			; CHECK-SSE1-NEXT: movb 4(%rdx), %sil
	; CHECK-SSE1-NEXT: movb 3(%rdx), %sil			; CHECK-SSE1-NEXT: movb 3(%rdx), %dil
	; CHECK-SSE1-NEXT: movb 2(%rdx), %r14b			; CHECK-SSE1-NEXT: movb 2(%rdx), %r14b
	; CHECK-SSE1-NEXT: movb (%rdx), %al			; CHECK-SSE1-NEXT: movb (%rdx), %al
	; CHECK-SSE1-NEXT: movb 1(%rdx), %r15b			; CHECK-SSE1-NEXT: movb 1(%rdx), %r15b
	; CHECK-SSE1-NEXT: movb (%rbx), %dl			; CHECK-SSE1-NEXT: movb (%rbx), %dl
	; CHECK-SSE1-NEXT: xorb %al, %dl			; CHECK-SSE1-NEXT: xorb %al, %dl
	; CHECK-SSE1-NEXT: andb (%rcx), %dl			; CHECK-SSE1-NEXT: andb (%rcx), %dl
	; CHECK-SSE1-NEXT: xorb %al, %dl			; CHECK-SSE1-NEXT: xorb %al, %dl
	; CHECK-SSE1-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 1(%rbx), %al			; CHECK-SSE1-NEXT: movb 1(%rbx), %al
	; CHECK-SSE1-NEXT: xorb %r15b, %al			; CHECK-SSE1-NEXT: xorb %r15b, %al
	; CHECK-SSE1-NEXT: andb 1(%rcx), %al			; CHECK-SSE1-NEXT: andb 1(%rcx), %al
	; CHECK-SSE1-NEXT: xorb %r15b, %al			; CHECK-SSE1-NEXT: xorb %r15b, %al
	; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 2(%rbx), %al			; CHECK-SSE1-NEXT: movb 2(%rbx), %al
	; CHECK-SSE1-NEXT: xorb %r14b, %al			; CHECK-SSE1-NEXT: xorb %r14b, %al
	; CHECK-SSE1-NEXT: andb 2(%rcx), %al			; CHECK-SSE1-NEXT: andb 2(%rcx), %al
	; CHECK-SSE1-NEXT: xorb %r14b, %al			; CHECK-SSE1-NEXT: xorb %r14b, %al
	; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 3(%rbx), %al			; CHECK-SSE1-NEXT: movb 3(%rbx), %al
	; CHECK-SSE1-NEXT: xorb %sil, %al			; CHECK-SSE1-NEXT: xorb %dil, %al
	; CHECK-SSE1-NEXT: andb 3(%rcx), %al			; CHECK-SSE1-NEXT: andb 3(%rcx), %al
	; CHECK-SSE1-NEXT: xorb %sil, %al			; CHECK-SSE1-NEXT: xorb %dil, %al
	; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 4(%rbx), %al			; CHECK-SSE1-NEXT: movb 4(%rbx), %al
	; CHECK-SSE1-NEXT: xorb %dil, %al			; CHECK-SSE1-NEXT: xorb %sil, %al
	; CHECK-SSE1-NEXT: andb 4(%rcx), %al			; CHECK-SSE1-NEXT: andb 4(%rcx), %al
	; CHECK-SSE1-NEXT: xorb %dil, %al			; CHECK-SSE1-NEXT: xorb %sil, %al
	; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 5(%rbx), %al			; CHECK-SSE1-NEXT: movb 5(%rbx), %al
	; CHECK-SSE1-NEXT: xorb %bpl, %al			; CHECK-SSE1-NEXT: xorb %bpl, %al
	; CHECK-SSE1-NEXT: andb 5(%rcx), %al			; CHECK-SSE1-NEXT: andb 5(%rcx), %al
	; CHECK-SSE1-NEXT: xorb %bpl, %al			; CHECK-SSE1-NEXT: xorb %bpl, %al
	; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 6(%rbx), %al			; CHECK-SSE1-NEXT: movb 6(%rbx), %al
	; CHECK-SSE1-NEXT: xorb %r8b, %al			; CHECK-SSE1-NEXT: xorb %r8b, %al
	; CHECK-SSE1-NEXT: andb 6(%rcx), %al			; CHECK-SSE1-NEXT: andb 6(%rcx), %al
	; CHECK-SSE1-NEXT: xorb %r8b, %al			; CHECK-SSE1-NEXT: xorb %r8b, %al
	; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 7(%rbx), %al			; CHECK-SSE1-NEXT: movb 7(%rbx), %al
	; CHECK-SSE1-NEXT: xorb %r9b, %al			; CHECK-SSE1-NEXT: xorb %r11b, %al
	; CHECK-SSE1-NEXT: andb 7(%rcx), %al			; CHECK-SSE1-NEXT: andb 7(%rcx), %al
	; CHECK-SSE1-NEXT: xorb %r9b, %al			; CHECK-SSE1-NEXT: xorb %r11b, %al
	; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 8(%rbx), %al			; CHECK-SSE1-NEXT: movb 8(%rbx), %al
	; CHECK-SSE1-NEXT: xorb %r11b, %al			; CHECK-SSE1-NEXT: xorb %r10b, %al
	; CHECK-SSE1-NEXT: andb 8(%rcx), %al			; CHECK-SSE1-NEXT: andb 8(%rcx), %al
	; CHECK-SSE1-NEXT: xorb %r11b, %al			; CHECK-SSE1-NEXT: xorb %r10b, %al
	; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 9(%rbx), %al			; CHECK-SSE1-NEXT: movb 9(%rbx), %al
	; CHECK-SSE1-NEXT: xorb %r10b, %al			; CHECK-SSE1-NEXT: xorb %r9b, %al
	; CHECK-SSE1-NEXT: andb 9(%rcx), %al			; CHECK-SSE1-NEXT: andb 9(%rcx), %al
	; CHECK-SSE1-NEXT: xorb %r10b, %al			; CHECK-SSE1-NEXT: xorb %r9b, %al
	; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 10(%rbx), %dl			; CHECK-SSE1-NEXT: movb 10(%rbx), %dl
	; CHECK-SSE1-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload			; CHECK-SSE1-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload
	; CHECK-SSE1-NEXT: xorb %al, %dl			; CHECK-SSE1-NEXT: xorb %al, %dl
	; CHECK-SSE1-NEXT: andb 10(%rcx), %dl			; CHECK-SSE1-NEXT: andb 10(%rcx), %dl
	; CHECK-SSE1-NEXT: xorb %al, %dl			; CHECK-SSE1-NEXT: xorb %al, %dl
	; CHECK-SSE1-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 11(%rbx), %dl			; CHECK-SSE1-NEXT: movb 11(%rbx), %dl
	Show All 15 Lines
	; CHECK-SSE1-NEXT: xorb %al, %dl			; CHECK-SSE1-NEXT: xorb %al, %dl
	; CHECK-SSE1-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 14(%rbx), %dl			; CHECK-SSE1-NEXT: movb 14(%rbx), %dl
	; CHECK-SSE1-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload			; CHECK-SSE1-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload
	; CHECK-SSE1-NEXT: xorb %al, %dl			; CHECK-SSE1-NEXT: xorb %al, %dl
	; CHECK-SSE1-NEXT: andb 14(%rcx), %dl			; CHECK-SSE1-NEXT: andb 14(%rcx), %dl
	; CHECK-SSE1-NEXT: xorb %al, %dl			; CHECK-SSE1-NEXT: xorb %al, %dl
	; CHECK-SSE1-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 15(%rbx), %dl			; CHECK-SSE1-NEXT: movb 15(%rbx), %al
	; CHECK-SSE1-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload
	; CHECK-SSE1-NEXT: xorb %al, %dl
	; CHECK-SSE1-NEXT: andb 15(%rcx), %dl
	; CHECK-SSE1-NEXT: xorb %al, %dl
	; CHECK-SSE1-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 16(%rbx), %al
	; CHECK-SSE1-NEXT: xorb %r12b, %al			; CHECK-SSE1-NEXT: xorb %r12b, %al
	; CHECK-SSE1-NEXT: andb 16(%rcx), %al			; CHECK-SSE1-NEXT: andb 15(%rcx), %al
	; CHECK-SSE1-NEXT: xorb %r12b, %al			; CHECK-SSE1-NEXT: xorb %r12b, %al
	; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
				; CHECK-SSE1-NEXT: movb 16(%r13), %al
				; CHECK-SSE1-NEXT: movb 16(%rbx), %dl
				; CHECK-SSE1-NEXT: xorb %al, %dl
				; CHECK-SSE1-NEXT: andb 16(%rcx), %dl
				; CHECK-SSE1-NEXT: xorb %al, %dl
				; CHECK-SSE1-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 17(%r13), %al			; CHECK-SSE1-NEXT: movb 17(%r13), %al
	; CHECK-SSE1-NEXT: movb 17(%rbx), %dl			; CHECK-SSE1-NEXT: movb 17(%rbx), %dl
	; CHECK-SSE1-NEXT: xorb %al, %dl			; CHECK-SSE1-NEXT: xorb %al, %dl
	; CHECK-SSE1-NEXT: andb 17(%rcx), %dl			; CHECK-SSE1-NEXT: andb 17(%rcx), %dl
	; CHECK-SSE1-NEXT: xorb %al, %dl			; CHECK-SSE1-NEXT: xorb %al, %dl
	; CHECK-SSE1-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 18(%r13), %al			; CHECK-SSE1-NEXT: movb 18(%r13), %al
	; CHECK-SSE1-NEXT: movb 18(%rbx), %dl			; CHECK-SSE1-NEXT: movb 18(%rbx), %dl
	; CHECK-SSE1-NEXT: xorb %al, %dl			; CHECK-SSE1-NEXT: xorb %al, %dl
	; CHECK-SSE1-NEXT: andb 18(%rcx), %dl			; CHECK-SSE1-NEXT: andb 18(%rcx), %dl
	; CHECK-SSE1-NEXT: xorb %al, %dl			; CHECK-SSE1-NEXT: xorb %al, %dl
	; CHECK-SSE1-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %dl, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 19(%r13), %al			; CHECK-SSE1-NEXT: movb 19(%r13), %al
	; CHECK-SSE1-NEXT: movb 19(%rbx), %r12b			; CHECK-SSE1-NEXT: movb 19(%rbx), %r12b
	; CHECK-SSE1-NEXT: xorb %al, %r12b			; CHECK-SSE1-NEXT: xorb %al, %r12b
	; CHECK-SSE1-NEXT: andb 19(%rcx), %r12b			; CHECK-SSE1-NEXT: andb 19(%rcx), %r12b
	; CHECK-SSE1-NEXT: movq %rcx, %rdx
	; CHECK-SSE1-NEXT: xorb %al, %r12b			; CHECK-SSE1-NEXT: xorb %al, %r12b
	; CHECK-SSE1-NEXT: movb 20(%r13), %al			; CHECK-SSE1-NEXT: movb 20(%r13), %al
	; CHECK-SSE1-NEXT: movb 20(%rbx), %r14b			; CHECK-SSE1-NEXT: movb 20(%rbx), %r15b
	; CHECK-SSE1-NEXT: xorb %al, %r14b
	; CHECK-SSE1-NEXT: andb 20(%rcx), %r14b
	; CHECK-SSE1-NEXT: xorb %al, %r14b
	; CHECK-SSE1-NEXT: movb 21(%r13), %al
	; CHECK-SSE1-NEXT: movb 21(%rbx), %r15b
	; CHECK-SSE1-NEXT: xorb %al, %r15b			; CHECK-SSE1-NEXT: xorb %al, %r15b
	; CHECK-SSE1-NEXT: andb 21(%rcx), %r15b			; CHECK-SSE1-NEXT: andb 20(%rcx), %r15b
				; CHECK-SSE1-NEXT: movq %rcx, %rsi
	; CHECK-SSE1-NEXT: xorb %al, %r15b			; CHECK-SSE1-NEXT: xorb %al, %r15b
				; CHECK-SSE1-NEXT: movb 21(%r13), %al
				; CHECK-SSE1-NEXT: movb 21(%rbx), %r14b
				; CHECK-SSE1-NEXT: xorb %al, %r14b
				; CHECK-SSE1-NEXT: andb 21(%rcx), %r14b
				; CHECK-SSE1-NEXT: xorb %al, %r14b
	; CHECK-SSE1-NEXT: movb 22(%r13), %al			; CHECK-SSE1-NEXT: movb 22(%r13), %al
	; CHECK-SSE1-NEXT: movb 22(%rbx), %bpl			; CHECK-SSE1-NEXT: movb 22(%rbx), %bpl
	; CHECK-SSE1-NEXT: xorb %al, %bpl			; CHECK-SSE1-NEXT: xorb %al, %bpl
	; CHECK-SSE1-NEXT: andb 22(%rcx), %bpl			; CHECK-SSE1-NEXT: andb 22(%rcx), %bpl
	; CHECK-SSE1-NEXT: xorb %al, %bpl			; CHECK-SSE1-NEXT: xorb %al, %bpl
	; CHECK-SSE1-NEXT: movb 23(%r13), %al			; CHECK-SSE1-NEXT: movb 23(%r13), %al
	; CHECK-SSE1-NEXT: movb 23(%rbx), %r11b			; CHECK-SSE1-NEXT: movb 23(%rbx), %r11b
	; CHECK-SSE1-NEXT: xorb %al, %r11b			; CHECK-SSE1-NEXT: xorb %al, %r11b
	Show All 15 Lines
	; CHECK-SSE1-NEXT: andb 26(%rcx), %r8b			; CHECK-SSE1-NEXT: andb 26(%rcx), %r8b
	; CHECK-SSE1-NEXT: xorb %al, %r8b			; CHECK-SSE1-NEXT: xorb %al, %r8b
	; CHECK-SSE1-NEXT: movb 27(%r13), %al			; CHECK-SSE1-NEXT: movb 27(%r13), %al
	; CHECK-SSE1-NEXT: movb 27(%rbx), %dil			; CHECK-SSE1-NEXT: movb 27(%rbx), %dil
	; CHECK-SSE1-NEXT: xorb %al, %dil			; CHECK-SSE1-NEXT: xorb %al, %dil
	; CHECK-SSE1-NEXT: andb 27(%rcx), %dil			; CHECK-SSE1-NEXT: andb 27(%rcx), %dil
	; CHECK-SSE1-NEXT: xorb %al, %dil			; CHECK-SSE1-NEXT: xorb %al, %dil
	; CHECK-SSE1-NEXT: movb 28(%r13), %al			; CHECK-SSE1-NEXT: movb 28(%r13), %al
	; CHECK-SSE1-NEXT: movb 28(%rbx), %sil			; CHECK-SSE1-NEXT: movb 28(%rbx), %dl
	; CHECK-SSE1-NEXT: xorb %al, %sil			; CHECK-SSE1-NEXT: xorb %al, %dl
	; CHECK-SSE1-NEXT: andb 28(%rcx), %sil			; CHECK-SSE1-NEXT: andb 28(%rcx), %dl
	; CHECK-SSE1-NEXT: xorb %al, %sil			; CHECK-SSE1-NEXT: xorb %al, %dl
	; CHECK-SSE1-NEXT: movb 29(%r13), %al			; CHECK-SSE1-NEXT: movb 29(%r13), %al
	; CHECK-SSE1-NEXT: movb 29(%rbx), %cl			; CHECK-SSE1-NEXT: movb 29(%rbx), %cl
	; CHECK-SSE1-NEXT: xorb %al, %cl			; CHECK-SSE1-NEXT: xorb %al, %cl
	; CHECK-SSE1-NEXT: andb 29(%rdx), %cl			; CHECK-SSE1-NEXT: andb 29(%rsi), %cl
	; CHECK-SSE1-NEXT: xorb %al, %cl			; CHECK-SSE1-NEXT: xorb %al, %cl
	; CHECK-SSE1-NEXT: movb 30(%r13), %al			; CHECK-SSE1-NEXT: movb 30(%r13), %al
	; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill			; CHECK-SSE1-NEXT: movb %al, {{[-0-9]+}}(%r{{[sb]}}p) # 1-byte Spill
	; CHECK-SSE1-NEXT: movb 30(%rbx), %al			; CHECK-SSE1-NEXT: movb 30(%rbx), %al
	; CHECK-SSE1-NEXT: xorb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Folded Reload			; CHECK-SSE1-NEXT: xorb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Folded Reload
	; CHECK-SSE1-NEXT: andb 30(%rdx), %al			; CHECK-SSE1-NEXT: andb 30(%rsi), %al
	; CHECK-SSE1-NEXT: xorb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Folded Reload			; CHECK-SSE1-NEXT: xorb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Folded Reload
	; CHECK-SSE1-NEXT: movb 31(%r13), %r13b			; CHECK-SSE1-NEXT: movb 31(%r13), %r13b
	; CHECK-SSE1-NEXT: movb 31(%rbx), %bl			; CHECK-SSE1-NEXT: movb 31(%rbx), %bl
	; CHECK-SSE1-NEXT: xorb %r13b, %bl			; CHECK-SSE1-NEXT: xorb %r13b, %bl
	; CHECK-SSE1-NEXT: andb 31(%rdx), %bl			; CHECK-SSE1-NEXT: andb 31(%rsi), %bl
	; CHECK-SSE1-NEXT: xorb %r13b, %bl			; CHECK-SSE1-NEXT: xorb %r13b, %bl
	; CHECK-SSE1-NEXT: movq {{[-0-9]+}}(%r{{[sb]}}p), %r13 # 8-byte Reload			; CHECK-SSE1-NEXT: movq {{[-0-9]+}}(%r{{[sb]}}p), %r13 # 8-byte Reload
	; CHECK-SSE1-NEXT: movb %bl, 31(%r13)			; CHECK-SSE1-NEXT: movb %bl, 31(%r13)
	; CHECK-SSE1-NEXT: movb %al, 30(%r13)			; CHECK-SSE1-NEXT: movb %al, 30(%r13)
	; CHECK-SSE1-NEXT: movb %cl, 29(%r13)			; CHECK-SSE1-NEXT: movb %cl, 29(%r13)
	; CHECK-SSE1-NEXT: movb %sil, 28(%r13)			; CHECK-SSE1-NEXT: movb %dl, 28(%r13)
	; CHECK-SSE1-NEXT: movb %dil, 27(%r13)			; CHECK-SSE1-NEXT: movb %dil, 27(%r13)
	; CHECK-SSE1-NEXT: movb %r8b, 26(%r13)			; CHECK-SSE1-NEXT: movb %r8b, 26(%r13)
	; CHECK-SSE1-NEXT: movb %r9b, 25(%r13)			; CHECK-SSE1-NEXT: movb %r9b, 25(%r13)
	; CHECK-SSE1-NEXT: movb %r10b, 24(%r13)			; CHECK-SSE1-NEXT: movb %r10b, 24(%r13)
	; CHECK-SSE1-NEXT: movb %r11b, 23(%r13)			; CHECK-SSE1-NEXT: movb %r11b, 23(%r13)
	; CHECK-SSE1-NEXT: movb %bpl, 22(%r13)			; CHECK-SSE1-NEXT: movb %bpl, 22(%r13)
	; CHECK-SSE1-NEXT: movb %r15b, 21(%r13)			; CHECK-SSE1-NEXT: movb %r14b, 21(%r13)
	; CHECK-SSE1-NEXT: movb %r14b, 20(%r13)			; CHECK-SSE1-NEXT: movb %r15b, 20(%r13)
	; CHECK-SSE1-NEXT: movb %r12b, 19(%r13)			; CHECK-SSE1-NEXT: movb %r12b, 19(%r13)
	; CHECK-SSE1-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload			; CHECK-SSE1-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload
	; CHECK-SSE1-NEXT: movb %al, 18(%r13)			; CHECK-SSE1-NEXT: movb %al, 18(%r13)
	; CHECK-SSE1-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload			; CHECK-SSE1-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload
	; CHECK-SSE1-NEXT: movb %al, 17(%r13)			; CHECK-SSE1-NEXT: movb %al, 17(%r13)
	; CHECK-SSE1-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload			; CHECK-SSE1-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload
	; CHECK-SSE1-NEXT: movb %al, 16(%r13)			; CHECK-SSE1-NEXT: movb %al, 16(%r13)
	; CHECK-SSE1-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload			; CHECK-SSE1-NEXT: movb {{[-0-9]+}}(%r{{[sb]}}p), %al # 1-byte Reload
	▲ Show 20 Lines • Show All 662 Lines • Show Last 20 Lines