This is an archive of the discontinued LLVM Phabricator instance.

Paths

Table of Contentst

-
llvm/
-
lib/Target/X86/
-
Target/
-
X86/
-
X86CallingConv.td
-
test/CodeGen/X86/
-
CodeGen/
-
X86/
-
pr11334.ll
-
vector-constrained-fp-intrinsics.ll
-
vectorcall.ll

Differential D72582

[X86] Don't inherit 32-bit calling conventions in 64-bit mode.
AbandonedPublic

Authored by craig.topper on Jan 12 2020, 11:17 PM.

Download Raw Diff

Details

Reviewers

spatel
RKSimon
rnk

Summary

Mainly this stops weird thing like v3f64 vectors getting split
into 3 pieces and then using XMM0/XMM1 for the first two, then
finding the f64 in the 32-bit mode and using FP0 next. Now we'll
fail CanLowerReturn and fall back to sret lowering instead.

I had to copy a few lines for mmx since we were dependent on
those being inherited. But I'm not sure tye make sense.
Clang doesn't generate x86_mmx type as a function argument or
return value. So it probably doesn't matter in practice.

Diff Detail

Repository

rG LLVM Github Monorepo

Build Status

Buildable 43794
Build 44793: arc lint + arc unit

Event Timeline

craig.topper created this revision.Jan 12 2020, 11:17 PM

Herald added a project: Restricted Project. · View Herald TranscriptJan 12 2020, 11:17 PM

Herald added a subscriber: hiraditya. · View Herald Transcript

Harbormaster completed remote builds in B43794: Diff 237579.Jan 12 2020, 11:20 PM

Is there a bz for this?

In D72582#1826859, @RKSimon wrote:

Is there a bz for this?

No I just noticed it while looking at the strictfp tests and saw that we were using xmm registers and x87 register for returns at the same time.

Hm, this will be an ABI compat issue that is relatively easy to run into:

typedef double __attribute__((vector_size(3*8))) MyVec;
MyVec f() { return {}; }

->
define dso_local <3 x double> @_Z1fv()
->

xorps   %xmm0, %xmm0
fldz

This function is already sensitive to -mavx, so maybe libraries that care don't expose functions like this. I think we want the new behavior in this patch: these things should be passed indirectly by address.

We should give people who care about a stable ABI a heads-up, though: +@dexonsmith @rjmccall @probinson

Otherwise, everything looks good to me, but please get some acknowledgement.

This revision is now accepted and ready to land.Jan 19 2020, 10:48 AM

Ping @dexonsmith @rjmccall @probinson

I don't think we can just break ABI for a type like <3 x double> that can currently be produced by frontends like Clang and Swift; being sensitive to -mavx doesn't mean we don't care about the ABI at all. CC'ing @scanon in case he has other thoughts.

craig.topper abandoned this revision.Feb 27 2020, 11:41 AM

Revision Contents

Path

Size

llvm/

lib/

Target/

X86/

X86CallingConv.td

19 lines

test/

CodeGen/

X86/

pr11334.ll

10 lines

vector-constrained-fp-intrinsics.ll

616 lines

vectorcall.ll

23 lines

Diff 237579

llvm/lib/Target/X86/X86CallingConv.td

Show First 20 Lines • Show All 480 Lines • ▼ Show 20 Lines
// This is the return-value convention used for the entire X86 backend.		// This is the return-value convention used for the entire X86 backend.
let Entry = 1 in		let Entry = 1 in
def RetCC_X86 : CallingConv<[		def RetCC_X86 : CallingConv<[

// Check if this is the Intel OpenCL built-ins calling convention		// Check if this is the Intel OpenCL built-ins calling convention
CCIfCC<"CallingConv::Intel_OCL_BI", CCDelegateTo<RetCC_Intel_OCL_BI>>,		CCIfCC<"CallingConv::Intel_OCL_BI", CCDelegateTo<RetCC_Intel_OCL_BI>>,

CCIfSubtarget<"is64Bit()", CCDelegateTo<RetCC_X86_64>>,		CCIfSubtarget<"is64Bit()", CCDelegateTo<RetCC_X86_64>>,
CCDelegateTo<RetCC_X86_32>		CCIfNotSubtarget<"is64Bit()", CCDelegateTo<RetCC_X86_32>>,
]>;		]>;

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// X86-64 Argument Calling Conventions		// X86-64 Argument Calling Conventions
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

def CC_X86_64_C : CallingConv<[		def CC_X86_64_C : CallingConv<[
// Handles byval parameters.		// Handles byval parameters.
Show All 21 Lines	def CC_X86_64_C : CallingConv<[
CCIfType<[i64], CCAssignToReg<[RDI, RSI, RDX, RCX, R8 , R9 ]>>,		CCIfType<[i64], CCAssignToReg<[RDI, RSI, RDX, RCX, R8 , R9 ]>>,

// The first 8 MMX vector arguments are passed in XMM registers on Darwin.		// The first 8 MMX vector arguments are passed in XMM registers on Darwin.
CCIfType<[x86mmx],		CCIfType<[x86mmx],
CCIfSubtarget<"isTargetDarwin()",		CCIfSubtarget<"isTargetDarwin()",
CCIfSubtarget<"hasSSE2()",		CCIfSubtarget<"hasSSE2()",
CCPromoteToType<v2i64>>>>,		CCPromoteToType<v2i64>>>>,

		// The first 3 __m64 vector arguments are passed in mmx registers if the
		// call is not a vararg call.
		// FIXME: This is what we used to inherit from CC_X86_32_Common, but might
		// not make sense.
		CCIfNotVarArg<CCIfType<[x86mmx],
		CCAssignToReg<[MM0, MM1, MM2]>>>,

		// __m64 vectors get 8-byte stack slots that are 4-byte aligned. They are
		// passed in the parameter area.
		// FIXME: This is what we used to inherit from CC_X86_32_Common, but might
		// not make sense.
		CCIfType<[x86mmx], CCAssignToStack<8, 4>>,

// Boolean vectors of AVX-512 are passed in SIMD registers.		// Boolean vectors of AVX-512 are passed in SIMD registers.
// The call from AVX to AVX-512 function should work,		// The call from AVX to AVX-512 function should work,
// since the boolean types in AVX/AVX2 are promoted by default.		// since the boolean types in AVX/AVX2 are promoted by default.
CCIfType<[v2i1], CCPromoteToType<v2i64>>,		CCIfType<[v2i1], CCPromoteToType<v2i64>>,
CCIfType<[v4i1], CCPromoteToType<v4i32>>,		CCIfType<[v4i1], CCPromoteToType<v4i32>>,
CCIfType<[v8i1], CCPromoteToType<v8i16>>,		CCIfType<[v8i1], CCPromoteToType<v8i16>>,
CCIfType<[v16i1], CCPromoteToType<v16i8>>,		CCIfType<[v16i1], CCPromoteToType<v16i8>>,
CCIfType<[v32i1], CCPromoteToType<v32i8>>,		CCIfType<[v32i1], CCPromoteToType<v32i8>>,
▲ Show 20 Lines • Show All 454 Lines • ▼ Show 20 Lines	def CC_Intel_OCL_BI : CallingConv<[
CCIfType<[v16f32, v8f64, v16i32, v8i64],		CCIfType<[v16f32, v8f64, v16i32, v8i64],
CCAssignToReg<[ZMM0, ZMM1, ZMM2, ZMM3]>>,		CCAssignToReg<[ZMM0, ZMM1, ZMM2, ZMM3]>>,

// Pass masks in mask registers		// Pass masks in mask registers
CCIfType<[v16i1, v8i1], CCAssignToReg<[K1]>>,		CCIfType<[v16i1, v8i1], CCAssignToReg<[K1]>>,

CCIfSubtarget<"isTargetWin64()", CCDelegateTo<CC_X86_Win64_C>>,		CCIfSubtarget<"isTargetWin64()", CCDelegateTo<CC_X86_Win64_C>>,
CCIfSubtarget<"is64Bit()", CCDelegateTo<CC_X86_64_C>>,		CCIfSubtarget<"is64Bit()", CCDelegateTo<CC_X86_64_C>>,
CCDelegateTo<CC_X86_32_C>		CCIfNotSubtarget<"is64Bit()", CCDelegateTo<CC_X86_32_C>>,
]>;		]>;

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// X86 Root Argument Calling Conventions		// X86 Root Argument Calling Conventions
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

// This is the root argument convention for the X86-32 backend.		// This is the root argument convention for the X86-32 backend.
def CC_X86_32 : CallingConv<[		def CC_X86_32 : CallingConv<[
Show All 38 Lines	def CC_X86_64 : CallingConv<[
CCDelegateTo<CC_X86_64_C>		CCDelegateTo<CC_X86_64_C>
]>;		]>;

// This is the argument convention used for the entire X86 backend.		// This is the argument convention used for the entire X86 backend.
let Entry = 1 in		let Entry = 1 in
def CC_X86 : CallingConv<[		def CC_X86 : CallingConv<[
CCIfCC<"CallingConv::Intel_OCL_BI", CCDelegateTo<CC_Intel_OCL_BI>>,		CCIfCC<"CallingConv::Intel_OCL_BI", CCDelegateTo<CC_Intel_OCL_BI>>,
CCIfSubtarget<"is64Bit()", CCDelegateTo<CC_X86_64>>,		CCIfSubtarget<"is64Bit()", CCDelegateTo<CC_X86_64>>,
CCDelegateTo<CC_X86_32>		CCIfNotSubtarget<"is64Bit()", CCDelegateTo<CC_X86_32>>,
]>;		]>;

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// Callee-saved Registers.		// Callee-saved Registers.
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

def CSR_NoRegs : CalleeSavedRegs<(add)>;		def CSR_NoRegs : CalleeSavedRegs<(add)>;

▲ Show 20 Lines • Show All 101 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/pr11334.ll

	Show All 14 Lines
	entry:			entry:
	%f1 = fpext <2 x float> %v1 to <2 x double>			%f1 = fpext <2 x float> %v1 to <2 x double>
	ret <2 x double> %f1			ret <2 x double> %f1
	}			}

	define <3 x double> @v3f2d_ext_vec(<3 x float> %v1) nounwind {			define <3 x double> @v3f2d_ext_vec(<3 x float> %v1) nounwind {
	; SSE-LABEL: v3f2d_ext_vec:			; SSE-LABEL: v3f2d_ext_vec:
	; SSE: # %bb.0: # %entry			; SSE: # %bb.0: # %entry
	; SSE-NEXT: cvtps2pd %xmm0, %xmm2			; SSE-NEXT: movq %rdi, %rax
				; SSE-NEXT: cvtps2pd %xmm0, %xmm1
	; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]			; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]
	; SSE-NEXT: cvtps2pd %xmm0, %xmm0			; SSE-NEXT: cvtps2pd %xmm0, %xmm0
	; SSE-NEXT: movlps %xmm0, -{{[0-9]+}}(%rsp)			; SSE-NEXT: movlps %xmm0, 16(%rdi)
	; SSE-NEXT: movaps %xmm2, %xmm1			; SSE-NEXT: movaps %xmm1, (%rdi)
	; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm2[1]
	; SSE-NEXT: fldl -{{[0-9]+}}(%rsp)
	; SSE-NEXT: movaps %xmm2, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: v3f2d_ext_vec:			; AVX-LABEL: v3f2d_ext_vec:
	; AVX: # %bb.0: # %entry			; AVX: # %bb.0: # %entry
	; AVX-NEXT: vcvtps2pd %xmm0, %ymm0			; AVX-NEXT: vcvtps2pd %xmm0, %ymm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	entry:			entry:
	%f1 = fpext <3 x float> %v1 to <3 x double>			%f1 = fpext <3 x float> %v1 to <3 x double>
	▲ Show 20 Lines • Show All 68 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vector-constrained-fp-intrinsics.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 78 Lines • ▼ Show 20 Lines	%div = call <3 x float> @llvm.experimental.constrained.fdiv.v3f32(
metadata !"round.dynamic",		metadata !"round.dynamic",
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %div		ret <3 x float> %div
}		}

define <3 x double> @constrained_vector_fdiv_v3f64() #0 {		define <3 x double> @constrained_vector_fdiv_v3f64() #0 {
; CHECK-LABEL: constrained_vector_fdiv_v3f64:		; CHECK-LABEL: constrained_vector_fdiv_v3f64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
		; CHECK-NEXT: movq %rdi, %rax
; CHECK-NEXT: movapd {{.*#+}} xmm0 = [1.0E+0,2.0E+0]		; CHECK-NEXT: movapd {{.*#+}} xmm0 = [1.0E+0,2.0E+0]
; CHECK-NEXT: divpd {{.*}}(%rip), %xmm0		; CHECK-NEXT: divpd {{.*}}(%rip), %xmm0
; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
; CHECK-NEXT: divsd {{.*}}(%rip), %xmm1		; CHECK-NEXT: divsd {{.*}}(%rip), %xmm1
; CHECK-NEXT: movsd %xmm1, -{{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm1, 16(%rdi)
; CHECK-NEXT: movapd %xmm0, %xmm1		; CHECK-NEXT: movapd %xmm0, (%rdi)
; CHECK-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; CHECK-NEXT: fldl -{{[0-9]+}}(%rsp)
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_fdiv_v3f64:		; AVX-LABEL: constrained_vector_fdiv_v3f64:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero		; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
; AVX-NEXT: vdivsd {{.*}}(%rip), %xmm0, %xmm0		; AVX-NEXT: vdivsd {{.*}}(%rip), %xmm0, %xmm0
; AVX-NEXT: vmovapd {{.*#+}} xmm1 = [1.0E+0,2.0E+0]		; AVX-NEXT: vmovapd {{.*#+}} xmm1 = [1.0E+0,2.0E+0]
; AVX-NEXT: vdivpd {{.*}}(%rip), %xmm1, %xmm1		; AVX-NEXT: vdivpd {{.*}}(%rip), %xmm1, %xmm1
▲ Show 20 Lines • Show All 169 Lines • ▼ Show 20 Lines	%rem = call <3 x float> @llvm.experimental.constrained.frem.v3f32(
metadata !"round.dynamic",		metadata !"round.dynamic",
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %rem		ret <3 x float> %rem
}		}

define <3 x double> @constrained_vector_frem_v3f64() #0 {		define <3 x double> @constrained_vector_frem_v3f64() #0 {
; CHECK-LABEL: constrained_vector_frem_v3f64:		; CHECK-LABEL: constrained_vector_frem_v3f64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: subq $24, %rsp		; CHECK-NEXT: pushq %rbx
		; CHECK-NEXT: .cfi_def_cfa_offset 16
		; CHECK-NEXT: subq $16, %rsp
; CHECK-NEXT: .cfi_def_cfa_offset 32		; CHECK-NEXT: .cfi_def_cfa_offset 32
		; CHECK-NEXT: .cfi_offset %rbx, -16
		; CHECK-NEXT: movq %rdi, %rbx
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
; CHECK-NEXT: callq fmod		; CHECK-NEXT: callq fmod
; CHECK-NEXT: movsd %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
; CHECK-NEXT: callq fmod		; CHECK-NEXT: callq fmod
; CHECK-NEXT: movsd %xmm0, (%rsp) # 8-byte Spill		; CHECK-NEXT: unpcklpd (%rsp), %xmm0 # 16-byte Folded Reload
		; CHECK-NEXT: # xmm0 = xmm0[0],mem[0]
		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
; CHECK-NEXT: callq fmod		; CHECK-NEXT: callq fmod
; CHECK-NEXT: movsd %xmm0, {{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm0, 16(%rbx)
; CHECK-NEXT: fldl {{[0-9]+}}(%rsp)		; CHECK-NEXT: movaps (%rsp), %xmm0 # 16-byte Reload
; CHECK-NEXT: movsd {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 8-byte Reload		; CHECK-NEXT: movaps %xmm0, (%rbx)
; CHECK-NEXT: # xmm0 = mem[0],zero		; CHECK-NEXT: movq %rbx, %rax
; CHECK-NEXT: movsd (%rsp), %xmm1 # 8-byte Reload		; CHECK-NEXT: addq $16, %rsp
; CHECK-NEXT: # xmm1 = mem[0],zero		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: addq $24, %rsp		; CHECK-NEXT: popq %rbx
; CHECK-NEXT: .cfi_def_cfa_offset 8		; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_frem_v3f64:		; AVX-LABEL: constrained_vector_frem_v3f64:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: subq $56, %rsp		; AVX-NEXT: subq $56, %rsp
; AVX-NEXT: .cfi_def_cfa_offset 64		; AVX-NEXT: .cfi_def_cfa_offset 64
; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero		; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
▲ Show 20 Lines • Show All 163 Lines • ▼ Show 20 Lines	%mul = call <3 x float> @llvm.experimental.constrained.fmul.v3f32(
metadata !"round.dynamic",		metadata !"round.dynamic",
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %mul		ret <3 x float> %mul
}		}

define <3 x double> @constrained_vector_fmul_v3f64() #0 {		define <3 x double> @constrained_vector_fmul_v3f64() #0 {
; CHECK-LABEL: constrained_vector_fmul_v3f64:		; CHECK-LABEL: constrained_vector_fmul_v3f64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
		; CHECK-NEXT: movq %rdi, %rax
; CHECK-NEXT: movapd {{.*#+}} xmm0 = [1.7976931348623157E+308,1.7976931348623157E+308]		; CHECK-NEXT: movapd {{.*#+}} xmm0 = [1.7976931348623157E+308,1.7976931348623157E+308]
; CHECK-NEXT: mulpd {{.*}}(%rip), %xmm0		; CHECK-NEXT: mulpd {{.*}}(%rip), %xmm0
; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
; CHECK-NEXT: mulsd {{.*}}(%rip), %xmm1		; CHECK-NEXT: mulsd {{.*}}(%rip), %xmm1
; CHECK-NEXT: movsd %xmm1, -{{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm1, 16(%rdi)
; CHECK-NEXT: movapd %xmm0, %xmm1		; CHECK-NEXT: movapd %xmm0, (%rdi)
; CHECK-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; CHECK-NEXT: fldl -{{[0-9]+}}(%rsp)
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_fmul_v3f64:		; AVX-LABEL: constrained_vector_fmul_v3f64:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero		; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
; AVX-NEXT: vmulsd {{.*}}(%rip), %xmm0, %xmm0		; AVX-NEXT: vmulsd {{.*}}(%rip), %xmm0, %xmm0
; AVX-NEXT: vmovapd {{.*#+}} xmm1 = [1.7976931348623157E+308,1.7976931348623157E+308]		; AVX-NEXT: vmovapd {{.*#+}} xmm1 = [1.7976931348623157E+308,1.7976931348623157E+308]
; AVX-NEXT: vmulpd {{.*}}(%rip), %xmm1, %xmm1		; AVX-NEXT: vmulpd {{.*}}(%rip), %xmm1, %xmm1
▲ Show 20 Lines • Show All 113 Lines • ▼ Show 20 Lines	%add = call <3 x float> @llvm.experimental.constrained.fadd.v3f32(
metadata !"round.dynamic",		metadata !"round.dynamic",
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %add		ret <3 x float> %add
}		}

define <3 x double> @constrained_vector_fadd_v3f64() #0 {		define <3 x double> @constrained_vector_fadd_v3f64() #0 {
; CHECK-LABEL: constrained_vector_fadd_v3f64:		; CHECK-LABEL: constrained_vector_fadd_v3f64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
		; CHECK-NEXT: movq %rdi, %rax
; CHECK-NEXT: movapd {{.*#+}} xmm0 = [1.7976931348623157E+308,1.7976931348623157E+308]		; CHECK-NEXT: movapd {{.*#+}} xmm0 = [1.7976931348623157E+308,1.7976931348623157E+308]
; CHECK-NEXT: addpd {{.*}}(%rip), %xmm0		; CHECK-NEXT: addpd {{.*}}(%rip), %xmm0
; CHECK-NEXT: xorpd %xmm1, %xmm1		; CHECK-NEXT: xorpd %xmm1, %xmm1
; CHECK-NEXT: addsd {{.*}}(%rip), %xmm1		; CHECK-NEXT: addsd {{.*}}(%rip), %xmm1
; CHECK-NEXT: movsd %xmm1, -{{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm1, 16(%rdi)
; CHECK-NEXT: movapd %xmm0, %xmm1		; CHECK-NEXT: movapd %xmm0, (%rdi)
; CHECK-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; CHECK-NEXT: fldl -{{[0-9]+}}(%rsp)
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_fadd_v3f64:		; AVX-LABEL: constrained_vector_fadd_v3f64:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vxorpd %xmm0, %xmm0, %xmm0		; AVX-NEXT: vxorpd %xmm0, %xmm0, %xmm0
; AVX-NEXT: vaddsd {{.*}}(%rip), %xmm0, %xmm0		; AVX-NEXT: vaddsd {{.*}}(%rip), %xmm0, %xmm0
; AVX-NEXT: vmovapd {{.*#+}} xmm1 = [1.7976931348623157E+308,1.7976931348623157E+308]		; AVX-NEXT: vmovapd {{.*#+}} xmm1 = [1.7976931348623157E+308,1.7976931348623157E+308]
; AVX-NEXT: vaddpd {{.*}}(%rip), %xmm1, %xmm1		; AVX-NEXT: vaddpd {{.*}}(%rip), %xmm1, %xmm1
▲ Show 20 Lines • Show All 114 Lines • ▼ Show 20 Lines	%sub = call <3 x float> @llvm.experimental.constrained.fsub.v3f32(
metadata !"round.dynamic",		metadata !"round.dynamic",
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %sub		ret <3 x float> %sub
}		}

define <3 x double> @constrained_vector_fsub_v3f64() #0 {		define <3 x double> @constrained_vector_fsub_v3f64() #0 {
; CHECK-LABEL: constrained_vector_fsub_v3f64:		; CHECK-LABEL: constrained_vector_fsub_v3f64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
		; CHECK-NEXT: movq %rdi, %rax
; CHECK-NEXT: xorpd %xmm0, %xmm0		; CHECK-NEXT: xorpd %xmm0, %xmm0
; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
; CHECK-NEXT: subsd %xmm0, %xmm1		; CHECK-NEXT: subsd %xmm0, %xmm1
; CHECK-NEXT: movapd {{.*#+}} xmm0 = [-1.7976931348623157E+308,-1.7976931348623157E+308]		; CHECK-NEXT: movapd {{.*#+}} xmm0 = [-1.7976931348623157E+308,-1.7976931348623157E+308]
; CHECK-NEXT: subpd {{.*}}(%rip), %xmm0		; CHECK-NEXT: subpd {{.*}}(%rip), %xmm0
; CHECK-NEXT: movsd %xmm1, -{{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm1, 16(%rdi)
; CHECK-NEXT: movapd %xmm0, %xmm1		; CHECK-NEXT: movapd %xmm0, (%rdi)
; CHECK-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; CHECK-NEXT: fldl -{{[0-9]+}}(%rsp)
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_fsub_v3f64:		; AVX-LABEL: constrained_vector_fsub_v3f64:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vxorpd %xmm0, %xmm0, %xmm0		; AVX-NEXT: vxorpd %xmm0, %xmm0, %xmm0
; AVX-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero		; AVX-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero
; AVX-NEXT: vsubsd %xmm0, %xmm1, %xmm0		; AVX-NEXT: vsubsd %xmm0, %xmm1, %xmm0
; AVX-NEXT: vmovapd {{.*#+}} xmm1 = [-1.7976931348623157E+308,-1.7976931348623157E+308]		; AVX-NEXT: vmovapd {{.*#+}} xmm1 = [-1.7976931348623157E+308,-1.7976931348623157E+308]
▲ Show 20 Lines • Show All 109 Lines • ▼ Show 20 Lines	%sqrt = call <3 x float> @llvm.experimental.constrained.sqrt.v3f32(
metadata !"round.dynamic",		metadata !"round.dynamic",
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %sqrt		ret <3 x float> %sqrt
}		}

define <3 x double> @constrained_vector_sqrt_v3f64() #0 {		define <3 x double> @constrained_vector_sqrt_v3f64() #0 {
; CHECK-LABEL: constrained_vector_sqrt_v3f64:		; CHECK-LABEL: constrained_vector_sqrt_v3f64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
		; CHECK-NEXT: movq %rdi, %rax
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: sqrtsd %xmm0, %xmm1		; CHECK-NEXT: sqrtsd %xmm0, %xmm0
; CHECK-NEXT: sqrtpd {{.*}}(%rip), %xmm0		; CHECK-NEXT: sqrtpd {{.*}}(%rip), %xmm1
; CHECK-NEXT: movsd %xmm1, -{{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm0, 16(%rdi)
; CHECK-NEXT: movapd %xmm0, %xmm1		; CHECK-NEXT: movapd %xmm1, (%rdi)
; CHECK-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; CHECK-NEXT: fldl -{{[0-9]+}}(%rsp)
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_sqrt_v3f64:		; AVX-LABEL: constrained_vector_sqrt_v3f64:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero		; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
; AVX-NEXT: vsqrtsd %xmm0, %xmm0, %xmm0		; AVX-NEXT: vsqrtsd %xmm0, %xmm0, %xmm0
; AVX-NEXT: vsqrtpd {{.*}}(%rip), %xmm1		; AVX-NEXT: vsqrtpd {{.*}}(%rip), %xmm1
; AVX-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0		; AVX-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
▲ Show 20 Lines • Show All 154 Lines • ▼ Show 20 Lines	%pow = call <3 x float> @llvm.experimental.constrained.pow.v3f32(
metadata !"round.dynamic",		metadata !"round.dynamic",
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %pow		ret <3 x float> %pow
}		}

define <3 x double> @constrained_vector_pow_v3f64() #0 {		define <3 x double> @constrained_vector_pow_v3f64() #0 {
; CHECK-LABEL: constrained_vector_pow_v3f64:		; CHECK-LABEL: constrained_vector_pow_v3f64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: subq $24, %rsp		; CHECK-NEXT: pushq %rbx
		; CHECK-NEXT: .cfi_def_cfa_offset 16
		; CHECK-NEXT: subq $16, %rsp
; CHECK-NEXT: .cfi_def_cfa_offset 32		; CHECK-NEXT: .cfi_def_cfa_offset 32
		; CHECK-NEXT: .cfi_offset %rbx, -16
		; CHECK-NEXT: movq %rdi, %rbx
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
; CHECK-NEXT: callq pow		; CHECK-NEXT: callq pow
; CHECK-NEXT: movsd %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
; CHECK-NEXT: callq pow		; CHECK-NEXT: callq pow
; CHECK-NEXT: movsd %xmm0, (%rsp) # 8-byte Spill		; CHECK-NEXT: unpcklpd (%rsp), %xmm0 # 16-byte Folded Reload
		; CHECK-NEXT: # xmm0 = xmm0[0],mem[0]
		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
; CHECK-NEXT: callq pow		; CHECK-NEXT: callq pow
; CHECK-NEXT: movsd %xmm0, {{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm0, 16(%rbx)
; CHECK-NEXT: fldl {{[0-9]+}}(%rsp)		; CHECK-NEXT: movaps (%rsp), %xmm0 # 16-byte Reload
; CHECK-NEXT: movsd {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 8-byte Reload		; CHECK-NEXT: movaps %xmm0, (%rbx)
; CHECK-NEXT: # xmm0 = mem[0],zero		; CHECK-NEXT: movq %rbx, %rax
; CHECK-NEXT: movsd (%rsp), %xmm1 # 8-byte Reload		; CHECK-NEXT: addq $16, %rsp
; CHECK-NEXT: # xmm1 = mem[0],zero		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: addq $24, %rsp		; CHECK-NEXT: popq %rbx
; CHECK-NEXT: .cfi_def_cfa_offset 8		; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_pow_v3f64:		; AVX-LABEL: constrained_vector_pow_v3f64:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: subq $56, %rsp		; AVX-NEXT: subq $56, %rsp
; AVX-NEXT: .cfi_def_cfa_offset 64		; AVX-NEXT: .cfi_def_cfa_offset 64
; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero		; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
▲ Show 20 Lines • Show All 220 Lines • ▼ Show 20 Lines	%powi = call <3 x float> @llvm.experimental.constrained.powi.v3f32(
metadata !"round.dynamic",		metadata !"round.dynamic",
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %powi		ret <3 x float> %powi
}		}

define <3 x double> @constrained_vector_powi_v3f64() #0 {		define <3 x double> @constrained_vector_powi_v3f64() #0 {
; CHECK-LABEL: constrained_vector_powi_v3f64:		; CHECK-LABEL: constrained_vector_powi_v3f64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: subq $24, %rsp		; CHECK-NEXT: pushq %rbx
		; CHECK-NEXT: .cfi_def_cfa_offset 16
		; CHECK-NEXT: subq $16, %rsp
; CHECK-NEXT: .cfi_def_cfa_offset 32		; CHECK-NEXT: .cfi_def_cfa_offset 32
		; CHECK-NEXT: .cfi_offset %rbx, -16
		; CHECK-NEXT: movq %rdi, %rbx
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: movl $3, %edi		; CHECK-NEXT: movl $3, %edi
; CHECK-NEXT: callq __powidf2		; CHECK-NEXT: callq __powidf2
; CHECK-NEXT: movsd %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: movl $3, %edi		; CHECK-NEXT: movl $3, %edi
; CHECK-NEXT: callq __powidf2		; CHECK-NEXT: callq __powidf2
; CHECK-NEXT: movsd %xmm0, (%rsp) # 8-byte Spill		; CHECK-NEXT: unpcklpd (%rsp), %xmm0 # 16-byte Folded Reload
		; CHECK-NEXT: # xmm0 = xmm0[0],mem[0]
		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: movl $3, %edi		; CHECK-NEXT: movl $3, %edi
; CHECK-NEXT: callq __powidf2		; CHECK-NEXT: callq __powidf2
; CHECK-NEXT: movsd %xmm0, {{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm0, 16(%rbx)
; CHECK-NEXT: fldl {{[0-9]+}}(%rsp)		; CHECK-NEXT: movaps (%rsp), %xmm0 # 16-byte Reload
; CHECK-NEXT: movsd {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 8-byte Reload		; CHECK-NEXT: movaps %xmm0, (%rbx)
; CHECK-NEXT: # xmm0 = mem[0],zero		; CHECK-NEXT: movq %rbx, %rax
; CHECK-NEXT: movsd (%rsp), %xmm1 # 8-byte Reload		; CHECK-NEXT: addq $16, %rsp
; CHECK-NEXT: # xmm1 = mem[0],zero		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: addq $24, %rsp		; CHECK-NEXT: popq %rbx
; CHECK-NEXT: .cfi_def_cfa_offset 8		; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_powi_v3f64:		; AVX-LABEL: constrained_vector_powi_v3f64:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: subq $56, %rsp		; AVX-NEXT: subq $56, %rsp
; AVX-NEXT: .cfi_def_cfa_offset 64		; AVX-NEXT: .cfi_def_cfa_offset 64
; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero		; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
▲ Show 20 Lines • Show All 204 Lines • ▼ Show 20 Lines	%sin = call <3 x float> @llvm.experimental.constrained.sin.v3f32(
metadata !"round.dynamic",		metadata !"round.dynamic",
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %sin		ret <3 x float> %sin
}		}

define <3 x double> @constrained_vector_sin_v3f64() #0 {		define <3 x double> @constrained_vector_sin_v3f64() #0 {
; CHECK-LABEL: constrained_vector_sin_v3f64:		; CHECK-LABEL: constrained_vector_sin_v3f64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: subq $24, %rsp		; CHECK-NEXT: pushq %rbx
		; CHECK-NEXT: .cfi_def_cfa_offset 16
		; CHECK-NEXT: subq $16, %rsp
; CHECK-NEXT: .cfi_def_cfa_offset 32		; CHECK-NEXT: .cfi_def_cfa_offset 32
		; CHECK-NEXT: .cfi_offset %rbx, -16
		; CHECK-NEXT: movq %rdi, %rbx
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq sin		; CHECK-NEXT: callq sin
; CHECK-NEXT: movsd %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq sin		; CHECK-NEXT: callq sin
; CHECK-NEXT: movsd %xmm0, (%rsp) # 8-byte Spill		; CHECK-NEXT: unpcklpd (%rsp), %xmm0 # 16-byte Folded Reload
		; CHECK-NEXT: # xmm0 = xmm0[0],mem[0]
		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq sin		; CHECK-NEXT: callq sin
; CHECK-NEXT: movsd %xmm0, {{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm0, 16(%rbx)
; CHECK-NEXT: fldl {{[0-9]+}}(%rsp)		; CHECK-NEXT: movaps (%rsp), %xmm0 # 16-byte Reload
; CHECK-NEXT: movsd {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 8-byte Reload		; CHECK-NEXT: movaps %xmm0, (%rbx)
; CHECK-NEXT: # xmm0 = mem[0],zero		; CHECK-NEXT: movq %rbx, %rax
; CHECK-NEXT: movsd (%rsp), %xmm1 # 8-byte Reload		; CHECK-NEXT: addq $16, %rsp
; CHECK-NEXT: # xmm1 = mem[0],zero		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: addq $24, %rsp		; CHECK-NEXT: popq %rbx
; CHECK-NEXT: .cfi_def_cfa_offset 8		; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_sin_v3f64:		; AVX-LABEL: constrained_vector_sin_v3f64:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: subq $56, %rsp		; AVX-NEXT: subq $56, %rsp
; AVX-NEXT: .cfi_def_cfa_offset 64		; AVX-NEXT: .cfi_def_cfa_offset 64
; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero		; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
▲ Show 20 Lines • Show All 191 Lines • ▼ Show 20 Lines	%cos = call <3 x float> @llvm.experimental.constrained.cos.v3f32(
metadata !"round.dynamic",		metadata !"round.dynamic",
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %cos		ret <3 x float> %cos
}		}

define <3 x double> @constrained_vector_cos_v3f64() #0 {		define <3 x double> @constrained_vector_cos_v3f64() #0 {
; CHECK-LABEL: constrained_vector_cos_v3f64:		; CHECK-LABEL: constrained_vector_cos_v3f64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: subq $24, %rsp		; CHECK-NEXT: pushq %rbx
		; CHECK-NEXT: .cfi_def_cfa_offset 16
		; CHECK-NEXT: subq $16, %rsp
; CHECK-NEXT: .cfi_def_cfa_offset 32		; CHECK-NEXT: .cfi_def_cfa_offset 32
		; CHECK-NEXT: .cfi_offset %rbx, -16
		; CHECK-NEXT: movq %rdi, %rbx
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq cos		; CHECK-NEXT: callq cos
; CHECK-NEXT: movsd %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq cos		; CHECK-NEXT: callq cos
; CHECK-NEXT: movsd %xmm0, (%rsp) # 8-byte Spill		; CHECK-NEXT: unpcklpd (%rsp), %xmm0 # 16-byte Folded Reload
		; CHECK-NEXT: # xmm0 = xmm0[0],mem[0]
		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq cos		; CHECK-NEXT: callq cos
; CHECK-NEXT: movsd %xmm0, {{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm0, 16(%rbx)
; CHECK-NEXT: fldl {{[0-9]+}}(%rsp)		; CHECK-NEXT: movaps (%rsp), %xmm0 # 16-byte Reload
; CHECK-NEXT: movsd {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 8-byte Reload		; CHECK-NEXT: movaps %xmm0, (%rbx)
; CHECK-NEXT: # xmm0 = mem[0],zero		; CHECK-NEXT: movq %rbx, %rax
; CHECK-NEXT: movsd (%rsp), %xmm1 # 8-byte Reload		; CHECK-NEXT: addq $16, %rsp
; CHECK-NEXT: # xmm1 = mem[0],zero		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: addq $24, %rsp		; CHECK-NEXT: popq %rbx
; CHECK-NEXT: .cfi_def_cfa_offset 8		; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_cos_v3f64:		; AVX-LABEL: constrained_vector_cos_v3f64:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: subq $56, %rsp		; AVX-NEXT: subq $56, %rsp
; AVX-NEXT: .cfi_def_cfa_offset 64		; AVX-NEXT: .cfi_def_cfa_offset 64
; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero		; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
▲ Show 20 Lines • Show All 191 Lines • ▼ Show 20 Lines	%exp = call <3 x float> @llvm.experimental.constrained.exp.v3f32(
metadata !"round.dynamic",		metadata !"round.dynamic",
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %exp		ret <3 x float> %exp
}		}

define <3 x double> @constrained_vector_exp_v3f64() #0 {		define <3 x double> @constrained_vector_exp_v3f64() #0 {
; CHECK-LABEL: constrained_vector_exp_v3f64:		; CHECK-LABEL: constrained_vector_exp_v3f64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: subq $24, %rsp		; CHECK-NEXT: pushq %rbx
		; CHECK-NEXT: .cfi_def_cfa_offset 16
		; CHECK-NEXT: subq $16, %rsp
; CHECK-NEXT: .cfi_def_cfa_offset 32		; CHECK-NEXT: .cfi_def_cfa_offset 32
		; CHECK-NEXT: .cfi_offset %rbx, -16
		; CHECK-NEXT: movq %rdi, %rbx
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq exp		; CHECK-NEXT: callq exp
; CHECK-NEXT: movsd %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq exp		; CHECK-NEXT: callq exp
; CHECK-NEXT: movsd %xmm0, (%rsp) # 8-byte Spill		; CHECK-NEXT: unpcklpd (%rsp), %xmm0 # 16-byte Folded Reload
		; CHECK-NEXT: # xmm0 = xmm0[0],mem[0]
		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq exp		; CHECK-NEXT: callq exp
; CHECK-NEXT: movsd %xmm0, {{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm0, 16(%rbx)
; CHECK-NEXT: fldl {{[0-9]+}}(%rsp)		; CHECK-NEXT: movaps (%rsp), %xmm0 # 16-byte Reload
; CHECK-NEXT: movsd {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 8-byte Reload		; CHECK-NEXT: movaps %xmm0, (%rbx)
; CHECK-NEXT: # xmm0 = mem[0],zero		; CHECK-NEXT: movq %rbx, %rax
; CHECK-NEXT: movsd (%rsp), %xmm1 # 8-byte Reload		; CHECK-NEXT: addq $16, %rsp
; CHECK-NEXT: # xmm1 = mem[0],zero		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: addq $24, %rsp		; CHECK-NEXT: popq %rbx
; CHECK-NEXT: .cfi_def_cfa_offset 8		; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_exp_v3f64:		; AVX-LABEL: constrained_vector_exp_v3f64:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: subq $56, %rsp		; AVX-NEXT: subq $56, %rsp
; AVX-NEXT: .cfi_def_cfa_offset 64		; AVX-NEXT: .cfi_def_cfa_offset 64
; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero		; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
▲ Show 20 Lines • Show All 191 Lines • ▼ Show 20 Lines	%exp2 = call <3 x float> @llvm.experimental.constrained.exp2.v3f32(
metadata !"round.dynamic",		metadata !"round.dynamic",
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %exp2		ret <3 x float> %exp2
}		}

define <3 x double> @constrained_vector_exp2_v3f64() #0 {		define <3 x double> @constrained_vector_exp2_v3f64() #0 {
; CHECK-LABEL: constrained_vector_exp2_v3f64:		; CHECK-LABEL: constrained_vector_exp2_v3f64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: subq $24, %rsp		; CHECK-NEXT: pushq %rbx
		; CHECK-NEXT: .cfi_def_cfa_offset 16
		; CHECK-NEXT: subq $16, %rsp
; CHECK-NEXT: .cfi_def_cfa_offset 32		; CHECK-NEXT: .cfi_def_cfa_offset 32
		; CHECK-NEXT: .cfi_offset %rbx, -16
		; CHECK-NEXT: movq %rdi, %rbx
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq exp2		; CHECK-NEXT: callq exp2
; CHECK-NEXT: movsd %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq exp2		; CHECK-NEXT: callq exp2
; CHECK-NEXT: movsd %xmm0, (%rsp) # 8-byte Spill		; CHECK-NEXT: unpcklpd (%rsp), %xmm0 # 16-byte Folded Reload
		; CHECK-NEXT: # xmm0 = xmm0[0],mem[0]
		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq exp2		; CHECK-NEXT: callq exp2
; CHECK-NEXT: movsd %xmm0, {{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm0, 16(%rbx)
; CHECK-NEXT: fldl {{[0-9]+}}(%rsp)		; CHECK-NEXT: movaps (%rsp), %xmm0 # 16-byte Reload
; CHECK-NEXT: movsd {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 8-byte Reload		; CHECK-NEXT: movaps %xmm0, (%rbx)
; CHECK-NEXT: # xmm0 = mem[0],zero		; CHECK-NEXT: movq %rbx, %rax
; CHECK-NEXT: movsd (%rsp), %xmm1 # 8-byte Reload		; CHECK-NEXT: addq $16, %rsp
; CHECK-NEXT: # xmm1 = mem[0],zero		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: addq $24, %rsp		; CHECK-NEXT: popq %rbx
; CHECK-NEXT: .cfi_def_cfa_offset 8		; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_exp2_v3f64:		; AVX-LABEL: constrained_vector_exp2_v3f64:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: subq $56, %rsp		; AVX-NEXT: subq $56, %rsp
; AVX-NEXT: .cfi_def_cfa_offset 64		; AVX-NEXT: .cfi_def_cfa_offset 64
; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero		; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
▲ Show 20 Lines • Show All 191 Lines • ▼ Show 20 Lines	%log = call <3 x float> @llvm.experimental.constrained.log.v3f32(
metadata !"round.dynamic",		metadata !"round.dynamic",
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %log		ret <3 x float> %log
}		}

define <3 x double> @constrained_vector_log_v3f64() #0 {		define <3 x double> @constrained_vector_log_v3f64() #0 {
; CHECK-LABEL: constrained_vector_log_v3f64:		; CHECK-LABEL: constrained_vector_log_v3f64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: subq $24, %rsp		; CHECK-NEXT: pushq %rbx
		; CHECK-NEXT: .cfi_def_cfa_offset 16
		; CHECK-NEXT: subq $16, %rsp
; CHECK-NEXT: .cfi_def_cfa_offset 32		; CHECK-NEXT: .cfi_def_cfa_offset 32
		; CHECK-NEXT: .cfi_offset %rbx, -16
		; CHECK-NEXT: movq %rdi, %rbx
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq log		; CHECK-NEXT: callq log
; CHECK-NEXT: movsd %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq log		; CHECK-NEXT: callq log
; CHECK-NEXT: movsd %xmm0, (%rsp) # 8-byte Spill		; CHECK-NEXT: unpcklpd (%rsp), %xmm0 # 16-byte Folded Reload
		; CHECK-NEXT: # xmm0 = xmm0[0],mem[0]
		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq log		; CHECK-NEXT: callq log
; CHECK-NEXT: movsd %xmm0, {{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm0, 16(%rbx)
; CHECK-NEXT: fldl {{[0-9]+}}(%rsp)		; CHECK-NEXT: movaps (%rsp), %xmm0 # 16-byte Reload
; CHECK-NEXT: movsd {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 8-byte Reload		; CHECK-NEXT: movaps %xmm0, (%rbx)
; CHECK-NEXT: # xmm0 = mem[0],zero		; CHECK-NEXT: movq %rbx, %rax
; CHECK-NEXT: movsd (%rsp), %xmm1 # 8-byte Reload		; CHECK-NEXT: addq $16, %rsp
; CHECK-NEXT: # xmm1 = mem[0],zero		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: addq $24, %rsp		; CHECK-NEXT: popq %rbx
; CHECK-NEXT: .cfi_def_cfa_offset 8		; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_log_v3f64:		; AVX-LABEL: constrained_vector_log_v3f64:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: subq $56, %rsp		; AVX-NEXT: subq $56, %rsp
; AVX-NEXT: .cfi_def_cfa_offset 64		; AVX-NEXT: .cfi_def_cfa_offset 64
; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero		; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
▲ Show 20 Lines • Show All 191 Lines • ▼ Show 20 Lines	%log10 = call <3 x float> @llvm.experimental.constrained.log10.v3f32(
metadata !"round.dynamic",		metadata !"round.dynamic",
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %log10		ret <3 x float> %log10
}		}

define <3 x double> @constrained_vector_log10_v3f64() #0 {		define <3 x double> @constrained_vector_log10_v3f64() #0 {
; CHECK-LABEL: constrained_vector_log10_v3f64:		; CHECK-LABEL: constrained_vector_log10_v3f64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: subq $24, %rsp		; CHECK-NEXT: pushq %rbx
		; CHECK-NEXT: .cfi_def_cfa_offset 16
		; CHECK-NEXT: subq $16, %rsp
; CHECK-NEXT: .cfi_def_cfa_offset 32		; CHECK-NEXT: .cfi_def_cfa_offset 32
		; CHECK-NEXT: .cfi_offset %rbx, -16
		; CHECK-NEXT: movq %rdi, %rbx
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq log10		; CHECK-NEXT: callq log10
; CHECK-NEXT: movsd %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq log10		; CHECK-NEXT: callq log10
; CHECK-NEXT: movsd %xmm0, (%rsp) # 8-byte Spill		; CHECK-NEXT: unpcklpd (%rsp), %xmm0 # 16-byte Folded Reload
		; CHECK-NEXT: # xmm0 = xmm0[0],mem[0]
		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq log10		; CHECK-NEXT: callq log10
; CHECK-NEXT: movsd %xmm0, {{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm0, 16(%rbx)
; CHECK-NEXT: fldl {{[0-9]+}}(%rsp)		; CHECK-NEXT: movaps (%rsp), %xmm0 # 16-byte Reload
; CHECK-NEXT: movsd {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 8-byte Reload		; CHECK-NEXT: movaps %xmm0, (%rbx)
; CHECK-NEXT: # xmm0 = mem[0],zero		; CHECK-NEXT: movq %rbx, %rax
; CHECK-NEXT: movsd (%rsp), %xmm1 # 8-byte Reload		; CHECK-NEXT: addq $16, %rsp
; CHECK-NEXT: # xmm1 = mem[0],zero		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: addq $24, %rsp		; CHECK-NEXT: popq %rbx
; CHECK-NEXT: .cfi_def_cfa_offset 8		; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_log10_v3f64:		; AVX-LABEL: constrained_vector_log10_v3f64:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: subq $56, %rsp		; AVX-NEXT: subq $56, %rsp
; AVX-NEXT: .cfi_def_cfa_offset 64		; AVX-NEXT: .cfi_def_cfa_offset 64
; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero		; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
▲ Show 20 Lines • Show All 191 Lines • ▼ Show 20 Lines	%log2 = call <3 x float> @llvm.experimental.constrained.log2.v3f32(
metadata !"round.dynamic",		metadata !"round.dynamic",
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %log2		ret <3 x float> %log2
}		}

define <3 x double> @constrained_vector_log2_v3f64() #0 {		define <3 x double> @constrained_vector_log2_v3f64() #0 {
; CHECK-LABEL: constrained_vector_log2_v3f64:		; CHECK-LABEL: constrained_vector_log2_v3f64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: subq $24, %rsp		; CHECK-NEXT: pushq %rbx
		; CHECK-NEXT: .cfi_def_cfa_offset 16
		; CHECK-NEXT: subq $16, %rsp
; CHECK-NEXT: .cfi_def_cfa_offset 32		; CHECK-NEXT: .cfi_def_cfa_offset 32
		; CHECK-NEXT: .cfi_offset %rbx, -16
		; CHECK-NEXT: movq %rdi, %rbx
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq log2		; CHECK-NEXT: callq log2
; CHECK-NEXT: movsd %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq log2		; CHECK-NEXT: callq log2
; CHECK-NEXT: movsd %xmm0, (%rsp) # 8-byte Spill		; CHECK-NEXT: unpcklpd (%rsp), %xmm0 # 16-byte Folded Reload
		; CHECK-NEXT: # xmm0 = xmm0[0],mem[0]
		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq log2		; CHECK-NEXT: callq log2
; CHECK-NEXT: movsd %xmm0, {{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm0, 16(%rbx)
; CHECK-NEXT: fldl {{[0-9]+}}(%rsp)		; CHECK-NEXT: movaps (%rsp), %xmm0 # 16-byte Reload
; CHECK-NEXT: movsd {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 8-byte Reload		; CHECK-NEXT: movaps %xmm0, (%rbx)
; CHECK-NEXT: # xmm0 = mem[0],zero		; CHECK-NEXT: movq %rbx, %rax
; CHECK-NEXT: movsd (%rsp), %xmm1 # 8-byte Reload		; CHECK-NEXT: addq $16, %rsp
; CHECK-NEXT: # xmm1 = mem[0],zero		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: addq $24, %rsp		; CHECK-NEXT: popq %rbx
; CHECK-NEXT: .cfi_def_cfa_offset 8		; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_log2_v3f64:		; AVX-LABEL: constrained_vector_log2_v3f64:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: subq $56, %rsp		; AVX-NEXT: subq $56, %rsp
; AVX-NEXT: .cfi_def_cfa_offset 64		; AVX-NEXT: .cfi_def_cfa_offset 64
; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero		; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
▲ Show 20 Lines • Show All 169 Lines • ▼ Show 20 Lines	%rint = call <3 x float> @llvm.experimental.constrained.rint.v3f32(
metadata !"round.dynamic",		metadata !"round.dynamic",
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %rint		ret <3 x float> %rint
}		}

define <3 x double> @constrained_vector_rint_v3f64() #0 {		define <3 x double> @constrained_vector_rint_v3f64() #0 {
; CHECK-LABEL: constrained_vector_rint_v3f64:		; CHECK-LABEL: constrained_vector_rint_v3f64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: subq $24, %rsp		; CHECK-NEXT: pushq %rbx
		; CHECK-NEXT: .cfi_def_cfa_offset 16
		; CHECK-NEXT: subq $16, %rsp
; CHECK-NEXT: .cfi_def_cfa_offset 32		; CHECK-NEXT: .cfi_def_cfa_offset 32
		; CHECK-NEXT: .cfi_offset %rbx, -16
		; CHECK-NEXT: movq %rdi, %rbx
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq rint		; CHECK-NEXT: callq rint
; CHECK-NEXT: movsd %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq rint		; CHECK-NEXT: callq rint
; CHECK-NEXT: movsd %xmm0, (%rsp) # 8-byte Spill		; CHECK-NEXT: unpcklpd (%rsp), %xmm0 # 16-byte Folded Reload
		; CHECK-NEXT: # xmm0 = xmm0[0],mem[0]
		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq rint		; CHECK-NEXT: callq rint
; CHECK-NEXT: movsd %xmm0, {{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm0, 16(%rbx)
; CHECK-NEXT: fldl {{[0-9]+}}(%rsp)		; CHECK-NEXT: movaps (%rsp), %xmm0 # 16-byte Reload
; CHECK-NEXT: movsd {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 8-byte Reload		; CHECK-NEXT: movaps %xmm0, (%rbx)
; CHECK-NEXT: # xmm0 = mem[0],zero		; CHECK-NEXT: movq %rbx, %rax
; CHECK-NEXT: movsd (%rsp), %xmm1 # 8-byte Reload		; CHECK-NEXT: addq $16, %rsp
; CHECK-NEXT: # xmm1 = mem[0],zero		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: addq $24, %rsp		; CHECK-NEXT: popq %rbx
; CHECK-NEXT: .cfi_def_cfa_offset 8		; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_rint_v3f64:		; AVX-LABEL: constrained_vector_rint_v3f64:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero		; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
; AVX-NEXT: vroundsd $4, %xmm0, %xmm0, %xmm0		; AVX-NEXT: vroundsd $4, %xmm0, %xmm0, %xmm0
; AVX-NEXT: vroundpd $4, {{.*}}(%rip), %xmm1		; AVX-NEXT: vroundpd $4, {{.*}}(%rip), %xmm1
▲ Show 20 Lines • Show All 137 Lines • ▼ Show 20 Lines	%nearby = call <3 x float> @llvm.experimental.constrained.nearbyint.v3f32(
metadata !"round.dynamic",		metadata !"round.dynamic",
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %nearby		ret <3 x float> %nearby
}		}

define <3 x double> @constrained_vector_nearby_v3f64() #0 {		define <3 x double> @constrained_vector_nearby_v3f64() #0 {
; CHECK-LABEL: constrained_vector_nearby_v3f64:		; CHECK-LABEL: constrained_vector_nearby_v3f64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: subq $24, %rsp		; CHECK-NEXT: pushq %rbx
		; CHECK-NEXT: .cfi_def_cfa_offset 16
		; CHECK-NEXT: subq $16, %rsp
; CHECK-NEXT: .cfi_def_cfa_offset 32		; CHECK-NEXT: .cfi_def_cfa_offset 32
		; CHECK-NEXT: .cfi_offset %rbx, -16
		; CHECK-NEXT: movq %rdi, %rbx
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq nearbyint		; CHECK-NEXT: callq nearbyint
; CHECK-NEXT: movsd %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq nearbyint		; CHECK-NEXT: callq nearbyint
; CHECK-NEXT: movsd %xmm0, (%rsp) # 8-byte Spill		; CHECK-NEXT: unpcklpd (%rsp), %xmm0 # 16-byte Folded Reload
		; CHECK-NEXT: # xmm0 = xmm0[0],mem[0]
		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq nearbyint		; CHECK-NEXT: callq nearbyint
; CHECK-NEXT: movsd %xmm0, {{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm0, 16(%rbx)
; CHECK-NEXT: fldl {{[0-9]+}}(%rsp)		; CHECK-NEXT: movaps (%rsp), %xmm0 # 16-byte Reload
; CHECK-NEXT: movsd {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 8-byte Reload		; CHECK-NEXT: movaps %xmm0, (%rbx)
; CHECK-NEXT: # xmm0 = mem[0],zero		; CHECK-NEXT: movq %rbx, %rax
; CHECK-NEXT: movsd (%rsp), %xmm1 # 8-byte Reload		; CHECK-NEXT: addq $16, %rsp
; CHECK-NEXT: # xmm1 = mem[0],zero		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: addq $24, %rsp		; CHECK-NEXT: popq %rbx
; CHECK-NEXT: .cfi_def_cfa_offset 8		; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_nearby_v3f64:		; AVX-LABEL: constrained_vector_nearby_v3f64:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero		; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
; AVX-NEXT: vroundsd $12, %xmm0, %xmm0, %xmm0		; AVX-NEXT: vroundsd $12, %xmm0, %xmm0, %xmm0
; AVX-NEXT: vroundpd $12, {{.*}}(%rip), %xmm1		; AVX-NEXT: vroundpd $12, {{.*}}(%rip), %xmm1
▲ Show 20 Lines • Show All 170 Lines • ▼ Show 20 Lines	%max = call <3 x float> @llvm.experimental.constrained.maxnum.v3f32(
<3 x float> <float 41.0, float 42.0, float 43.0>,		<3 x float> <float 41.0, float 42.0, float 43.0>,
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %max		ret <3 x float> %max
}		}

define <3 x double> @constrained_vector_max_v3f64() #0 {		define <3 x double> @constrained_vector_max_v3f64() #0 {
; CHECK-LABEL: constrained_vector_max_v3f64:		; CHECK-LABEL: constrained_vector_max_v3f64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: subq $24, %rsp		; CHECK-NEXT: pushq %rbx
		; CHECK-NEXT: .cfi_def_cfa_offset 16
		; CHECK-NEXT: subq $16, %rsp
; CHECK-NEXT: .cfi_def_cfa_offset 32		; CHECK-NEXT: .cfi_def_cfa_offset 32
		; CHECK-NEXT: .cfi_offset %rbx, -16
		; CHECK-NEXT: movq %rdi, %rbx
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
; CHECK-NEXT: callq fmax		; CHECK-NEXT: callq fmax
; CHECK-NEXT: movsd %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
; CHECK-NEXT: callq fmax		; CHECK-NEXT: callq fmax
; CHECK-NEXT: movsd %xmm0, (%rsp) # 8-byte Spill		; CHECK-NEXT: unpcklpd (%rsp), %xmm0 # 16-byte Folded Reload
		; CHECK-NEXT: # xmm0 = xmm0[0],mem[0]
		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
; CHECK-NEXT: callq fmax		; CHECK-NEXT: callq fmax
; CHECK-NEXT: movsd %xmm0, {{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm0, 16(%rbx)
; CHECK-NEXT: fldl {{[0-9]+}}(%rsp)		; CHECK-NEXT: movaps (%rsp), %xmm0 # 16-byte Reload
; CHECK-NEXT: movsd {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 8-byte Reload		; CHECK-NEXT: movaps %xmm0, (%rbx)
; CHECK-NEXT: # xmm0 = mem[0],zero		; CHECK-NEXT: movq %rbx, %rax
; CHECK-NEXT: movsd (%rsp), %xmm1 # 8-byte Reload		; CHECK-NEXT: addq $16, %rsp
; CHECK-NEXT: # xmm1 = mem[0],zero		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: addq $24, %rsp		; CHECK-NEXT: popq %rbx
; CHECK-NEXT: .cfi_def_cfa_offset 8		; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_max_v3f64:		; AVX-LABEL: constrained_vector_max_v3f64:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: subq $56, %rsp		; AVX-NEXT: subq $56, %rsp
; AVX-NEXT: .cfi_def_cfa_offset 64		; AVX-NEXT: .cfi_def_cfa_offset 64
; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero		; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
▲ Show 20 Lines • Show All 214 Lines • ▼ Show 20 Lines	%min = call <3 x float> @llvm.experimental.constrained.minnum.v3f32(
<3 x float> <float 41.0, float 42.0, float 43.0>,		<3 x float> <float 41.0, float 42.0, float 43.0>,
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %min		ret <3 x float> %min
}		}

define <3 x double> @constrained_vector_min_v3f64() #0 {		define <3 x double> @constrained_vector_min_v3f64() #0 {
; CHECK-LABEL: constrained_vector_min_v3f64:		; CHECK-LABEL: constrained_vector_min_v3f64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: subq $24, %rsp		; CHECK-NEXT: pushq %rbx
		; CHECK-NEXT: .cfi_def_cfa_offset 16
		; CHECK-NEXT: subq $16, %rsp
; CHECK-NEXT: .cfi_def_cfa_offset 32		; CHECK-NEXT: .cfi_def_cfa_offset 32
		; CHECK-NEXT: .cfi_offset %rbx, -16
		; CHECK-NEXT: movq %rdi, %rbx
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
; CHECK-NEXT: callq fmin		; CHECK-NEXT: callq fmin
; CHECK-NEXT: movsd %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
; CHECK-NEXT: callq fmin		; CHECK-NEXT: callq fmin
; CHECK-NEXT: movsd %xmm0, (%rsp) # 8-byte Spill		; CHECK-NEXT: unpcklpd (%rsp), %xmm0 # 16-byte Folded Reload
		; CHECK-NEXT: # xmm0 = xmm0[0],mem[0]
		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
; CHECK-NEXT: callq fmin		; CHECK-NEXT: callq fmin
; CHECK-NEXT: movsd %xmm0, {{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm0, 16(%rbx)
; CHECK-NEXT: fldl {{[0-9]+}}(%rsp)		; CHECK-NEXT: movaps (%rsp), %xmm0 # 16-byte Reload
; CHECK-NEXT: movsd {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 8-byte Reload		; CHECK-NEXT: movaps %xmm0, (%rbx)
; CHECK-NEXT: # xmm0 = mem[0],zero		; CHECK-NEXT: movq %rbx, %rax
; CHECK-NEXT: movsd (%rsp), %xmm1 # 8-byte Reload		; CHECK-NEXT: addq $16, %rsp
; CHECK-NEXT: # xmm1 = mem[0],zero		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: addq $24, %rsp		; CHECK-NEXT: popq %rbx
; CHECK-NEXT: .cfi_def_cfa_offset 8		; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_min_v3f64:		; AVX-LABEL: constrained_vector_min_v3f64:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: subq $56, %rsp		; AVX-NEXT: subq $56, %rsp
; AVX-NEXT: .cfi_def_cfa_offset 64		; AVX-NEXT: .cfi_def_cfa_offset 64
; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero		; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
▲ Show 20 Lines • Show All 1,778 Lines • ▼ Show 20 Lines	%result = call <2 x double> @llvm.experimental.constrained.fpext.v2f64.v2f32(
<2 x float><float 42.0, float 43.0>,		<2 x float><float 42.0, float 43.0>,
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <2 x double> %result		ret <2 x double> %result
}		}

define <3 x double> @constrained_vector_fpext_v3f32() #0 {		define <3 x double> @constrained_vector_fpext_v3f32() #0 {
; CHECK-LABEL: constrained_vector_fpext_v3f32:		; CHECK-LABEL: constrained_vector_fpext_v3f32:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
		; CHECK-NEXT: movq %rdi, %rax
; CHECK-NEXT: movss {{.*#+}} xmm0 = mem[0],zero,zero,zero		; CHECK-NEXT: movss {{.*#+}} xmm0 = mem[0],zero,zero,zero
; CHECK-NEXT: cvtss2sd %xmm0, %xmm0		; CHECK-NEXT: cvtss2sd %xmm0, %xmm0
; CHECK-NEXT: movss {{.*#+}} xmm1 = mem[0],zero,zero,zero		; CHECK-NEXT: movss {{.*#+}} xmm1 = mem[0],zero,zero,zero
; CHECK-NEXT: cvtss2sd %xmm1, %xmm1		; CHECK-NEXT: cvtss2sd %xmm1, %xmm1
; CHECK-NEXT: movss {{.*#+}} xmm2 = mem[0],zero,zero,zero		; CHECK-NEXT: movlhps {{.*#+}} xmm1 = xmm1[0],xmm0[0]
; CHECK-NEXT: cvtss2sd %xmm2, %xmm2		; CHECK-NEXT: movss {{.*#+}} xmm0 = mem[0],zero,zero,zero
; CHECK-NEXT: movsd %xmm2, -{{[0-9]+}}(%rsp)		; CHECK-NEXT: cvtss2sd %xmm0, %xmm0
; CHECK-NEXT: fldl -{{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm0, 16(%rdi)
		; CHECK-NEXT: movaps %xmm1, (%rdi)
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_fpext_v3f32:		; AVX-LABEL: constrained_vector_fpext_v3f32:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero		; AVX-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
; AVX-NEXT: vcvtss2sd %xmm0, %xmm0, %xmm0		; AVX-NEXT: vcvtss2sd %xmm0, %xmm0, %xmm0
; AVX-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero		; AVX-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero
; AVX-NEXT: vcvtss2sd %xmm1, %xmm1, %xmm1		; AVX-NEXT: vcvtss2sd %xmm1, %xmm1, %xmm1
▲ Show 20 Lines • Show All 117 Lines • ▼ Show 20 Lines	%ceil = call <3 x float> @llvm.experimental.constrained.ceil.v3f32(
<3 x float> <float 1.5, float 2.5, float 3.5>,		<3 x float> <float 1.5, float 2.5, float 3.5>,
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %ceil		ret <3 x float> %ceil
}		}

define <3 x double> @constrained_vector_ceil_v3f64() #0 {		define <3 x double> @constrained_vector_ceil_v3f64() #0 {
; CHECK-LABEL: constrained_vector_ceil_v3f64:		; CHECK-LABEL: constrained_vector_ceil_v3f64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: subq $24, %rsp		; CHECK-NEXT: pushq %rbx
		; CHECK-NEXT: .cfi_def_cfa_offset 16
		; CHECK-NEXT: subq $16, %rsp
; CHECK-NEXT: .cfi_def_cfa_offset 32		; CHECK-NEXT: .cfi_def_cfa_offset 32
		; CHECK-NEXT: .cfi_offset %rbx, -16
		; CHECK-NEXT: movq %rdi, %rbx
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq ceil		; CHECK-NEXT: callq ceil
; CHECK-NEXT: movsd %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq ceil		; CHECK-NEXT: callq ceil
; CHECK-NEXT: movsd %xmm0, (%rsp) # 8-byte Spill		; CHECK-NEXT: unpcklpd (%rsp), %xmm0 # 16-byte Folded Reload
		; CHECK-NEXT: # xmm0 = xmm0[0],mem[0]
		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq ceil		; CHECK-NEXT: callq ceil
; CHECK-NEXT: movsd %xmm0, {{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm0, 16(%rbx)
; CHECK-NEXT: fldl {{[0-9]+}}(%rsp)		; CHECK-NEXT: movaps (%rsp), %xmm0 # 16-byte Reload
; CHECK-NEXT: movsd {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 8-byte Reload		; CHECK-NEXT: movaps %xmm0, (%rbx)
; CHECK-NEXT: # xmm0 = mem[0],zero		; CHECK-NEXT: movq %rbx, %rax
; CHECK-NEXT: movsd (%rsp), %xmm1 # 8-byte Reload		; CHECK-NEXT: addq $16, %rsp
; CHECK-NEXT: # xmm1 = mem[0],zero		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: addq $24, %rsp		; CHECK-NEXT: popq %rbx
; CHECK-NEXT: .cfi_def_cfa_offset 8		; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_ceil_v3f64:		; AVX-LABEL: constrained_vector_ceil_v3f64:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero		; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
; AVX-NEXT: vroundsd $10, %xmm0, %xmm0, %xmm0		; AVX-NEXT: vroundsd $10, %xmm0, %xmm0, %xmm0
; AVX-NEXT: vroundpd $10, {{.*}}(%rip), %xmm1		; AVX-NEXT: vroundpd $10, {{.*}}(%rip), %xmm1
▲ Show 20 Lines • Show All 95 Lines • ▼ Show 20 Lines	%floor = call <3 x float> @llvm.experimental.constrained.floor.v3f32(
<3 x float> <float 1.5, float 2.5, float 3.5>,		<3 x float> <float 1.5, float 2.5, float 3.5>,
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %floor		ret <3 x float> %floor
}		}

define <3 x double> @constrained_vector_floor_v3f64() #0 {		define <3 x double> @constrained_vector_floor_v3f64() #0 {
; CHECK-LABEL: constrained_vector_floor_v3f64:		; CHECK-LABEL: constrained_vector_floor_v3f64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: subq $24, %rsp		; CHECK-NEXT: pushq %rbx
		; CHECK-NEXT: .cfi_def_cfa_offset 16
		; CHECK-NEXT: subq $16, %rsp
; CHECK-NEXT: .cfi_def_cfa_offset 32		; CHECK-NEXT: .cfi_def_cfa_offset 32
		; CHECK-NEXT: .cfi_offset %rbx, -16
		; CHECK-NEXT: movq %rdi, %rbx
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq floor		; CHECK-NEXT: callq floor
; CHECK-NEXT: movsd %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq floor		; CHECK-NEXT: callq floor
; CHECK-NEXT: movsd %xmm0, (%rsp) # 8-byte Spill		; CHECK-NEXT: unpcklpd (%rsp), %xmm0 # 16-byte Folded Reload
		; CHECK-NEXT: # xmm0 = xmm0[0],mem[0]
		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq floor		; CHECK-NEXT: callq floor
; CHECK-NEXT: movsd %xmm0, {{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm0, 16(%rbx)
; CHECK-NEXT: fldl {{[0-9]+}}(%rsp)		; CHECK-NEXT: movaps (%rsp), %xmm0 # 16-byte Reload
; CHECK-NEXT: movsd {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 8-byte Reload		; CHECK-NEXT: movaps %xmm0, (%rbx)
; CHECK-NEXT: # xmm0 = mem[0],zero		; CHECK-NEXT: movq %rbx, %rax
; CHECK-NEXT: movsd (%rsp), %xmm1 # 8-byte Reload		; CHECK-NEXT: addq $16, %rsp
; CHECK-NEXT: # xmm1 = mem[0],zero		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: addq $24, %rsp		; CHECK-NEXT: popq %rbx
; CHECK-NEXT: .cfi_def_cfa_offset 8		; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_floor_v3f64:		; AVX-LABEL: constrained_vector_floor_v3f64:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero		; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
; AVX-NEXT: vroundsd $9, %xmm0, %xmm0, %xmm0		; AVX-NEXT: vroundsd $9, %xmm0, %xmm0, %xmm0
; AVX-NEXT: vroundpd $9, {{.*}}(%rip), %xmm1		; AVX-NEXT: vroundpd $9, {{.*}}(%rip), %xmm1
▲ Show 20 Lines • Show All 117 Lines • ▼ Show 20 Lines	%round = call <3 x float> @llvm.experimental.constrained.round.v3f32(
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %round		ret <3 x float> %round
}		}


define <3 x double> @constrained_vector_round_v3f64() #0 {		define <3 x double> @constrained_vector_round_v3f64() #0 {
; CHECK-LABEL: constrained_vector_round_v3f64:		; CHECK-LABEL: constrained_vector_round_v3f64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: subq $24, %rsp		; CHECK-NEXT: pushq %rbx
		; CHECK-NEXT: .cfi_def_cfa_offset 16
		; CHECK-NEXT: subq $16, %rsp
; CHECK-NEXT: .cfi_def_cfa_offset 32		; CHECK-NEXT: .cfi_def_cfa_offset 32
		; CHECK-NEXT: .cfi_offset %rbx, -16
		; CHECK-NEXT: movq %rdi, %rbx
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq round		; CHECK-NEXT: callq round
; CHECK-NEXT: movsd %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq round		; CHECK-NEXT: callq round
; CHECK-NEXT: movsd %xmm0, (%rsp) # 8-byte Spill		; CHECK-NEXT: unpcklpd (%rsp), %xmm0 # 16-byte Folded Reload
		; CHECK-NEXT: # xmm0 = xmm0[0],mem[0]
		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq round		; CHECK-NEXT: callq round
; CHECK-NEXT: movsd %xmm0, {{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm0, 16(%rbx)
; CHECK-NEXT: fldl {{[0-9]+}}(%rsp)		; CHECK-NEXT: movaps (%rsp), %xmm0 # 16-byte Reload
; CHECK-NEXT: movsd {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 8-byte Reload		; CHECK-NEXT: movaps %xmm0, (%rbx)
; CHECK-NEXT: # xmm0 = mem[0],zero		; CHECK-NEXT: movq %rbx, %rax
; CHECK-NEXT: movsd (%rsp), %xmm1 # 8-byte Reload		; CHECK-NEXT: addq $16, %rsp
; CHECK-NEXT: # xmm1 = mem[0],zero		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: addq $24, %rsp		; CHECK-NEXT: popq %rbx
; CHECK-NEXT: .cfi_def_cfa_offset 8		; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_round_v3f64:		; AVX-LABEL: constrained_vector_round_v3f64:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: subq $56, %rsp		; AVX-NEXT: subq $56, %rsp
; AVX-NEXT: .cfi_def_cfa_offset 64		; AVX-NEXT: .cfi_def_cfa_offset 64
; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero		; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
▲ Show 20 Lines • Show All 107 Lines • ▼ Show 20 Lines	%trunc = call <3 x float> @llvm.experimental.constrained.trunc.v3f32(
<3 x float> <float 1.5, float 2.5, float 3.5>,		<3 x float> <float 1.5, float 2.5, float 3.5>,
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %trunc		ret <3 x float> %trunc
}		}

define <3 x double> @constrained_vector_trunc_v3f64() #0 {		define <3 x double> @constrained_vector_trunc_v3f64() #0 {
; CHECK-LABEL: constrained_vector_trunc_v3f64:		; CHECK-LABEL: constrained_vector_trunc_v3f64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: subq $24, %rsp		; CHECK-NEXT: pushq %rbx
		; CHECK-NEXT: .cfi_def_cfa_offset 16
		; CHECK-NEXT: subq $16, %rsp
; CHECK-NEXT: .cfi_def_cfa_offset 32		; CHECK-NEXT: .cfi_def_cfa_offset 32
		; CHECK-NEXT: .cfi_offset %rbx, -16
		; CHECK-NEXT: movq %rdi, %rbx
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq trunc		; CHECK-NEXT: callq trunc
; CHECK-NEXT: movsd %xmm0, {{[-0-9]+}}(%r{{[sb]}}p) # 8-byte Spill		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq trunc		; CHECK-NEXT: callq trunc
; CHECK-NEXT: movsd %xmm0, (%rsp) # 8-byte Spill		; CHECK-NEXT: unpcklpd (%rsp), %xmm0 # 16-byte Folded Reload
		; CHECK-NEXT: # xmm0 = xmm0[0],mem[0]
		; CHECK-NEXT: movaps %xmm0, (%rsp) # 16-byte Spill
; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero		; CHECK-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
; CHECK-NEXT: callq trunc		; CHECK-NEXT: callq trunc
; CHECK-NEXT: movsd %xmm0, {{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm0, 16(%rbx)
; CHECK-NEXT: fldl {{[0-9]+}}(%rsp)		; CHECK-NEXT: movaps (%rsp), %xmm0 # 16-byte Reload
; CHECK-NEXT: movsd {{[-0-9]+}}(%r{{[sb]}}p), %xmm0 # 8-byte Reload		; CHECK-NEXT: movaps %xmm0, (%rbx)
; CHECK-NEXT: # xmm0 = mem[0],zero		; CHECK-NEXT: movq %rbx, %rax
; CHECK-NEXT: movsd (%rsp), %xmm1 # 8-byte Reload		; CHECK-NEXT: addq $16, %rsp
; CHECK-NEXT: # xmm1 = mem[0],zero		; CHECK-NEXT: .cfi_def_cfa_offset 16
; CHECK-NEXT: addq $24, %rsp		; CHECK-NEXT: popq %rbx
; CHECK-NEXT: .cfi_def_cfa_offset 8		; CHECK-NEXT: .cfi_def_cfa_offset 8
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_trunc_v3f64:		; AVX-LABEL: constrained_vector_trunc_v3f64:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero		; AVX-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
; AVX-NEXT: vroundsd $11, %xmm0, %xmm0, %xmm0		; AVX-NEXT: vroundsd $11, %xmm0, %xmm0, %xmm0
; AVX-NEXT: vroundpd $11, {{.*}}(%rip), %xmm1		; AVX-NEXT: vroundpd $11, {{.*}}(%rip), %xmm1
▲ Show 20 Lines • Show All 189 Lines • ▼ Show 20 Lines	%result = call <2 x float>
metadata !"round.dynamic",		metadata !"round.dynamic",
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <2 x float> %result		ret <2 x float> %result
}		}

define <3 x double> @constrained_vector_sitofp_v3f64_v3i32(<3 x i32> %x) #0 {		define <3 x double> @constrained_vector_sitofp_v3f64_v3i32(<3 x i32> %x) #0 {
; CHECK-LABEL: constrained_vector_sitofp_v3f64_v3i32:		; CHECK-LABEL: constrained_vector_sitofp_v3f64_v3i32:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: movd %xmm0, %eax		; CHECK-NEXT: movq %rdi, %rax
; CHECK-NEXT: cvtsi2sd %eax, %xmm2
; CHECK-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]		; CHECK-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]
; CHECK-NEXT: movd %xmm1, %eax		; CHECK-NEXT: movd %xmm1, %ecx
; CHECK-NEXT: xorps %xmm1, %xmm1		; CHECK-NEXT: xorps %xmm1, %xmm1
; CHECK-NEXT: cvtsi2sd %eax, %xmm1		; CHECK-NEXT: cvtsi2sd %ecx, %xmm1
		; CHECK-NEXT: movd %xmm0, %ecx
		; CHECK-NEXT: cvtsi2sd %ecx, %xmm2
		; CHECK-NEXT: unpcklpd {{.*#+}} xmm2 = xmm2[0],xmm1[0]
; CHECK-NEXT: pshufd {{.*#+}} xmm0 = xmm0[2,3,0,1]		; CHECK-NEXT: pshufd {{.*#+}} xmm0 = xmm0[2,3,0,1]
; CHECK-NEXT: movd %xmm0, %eax		; CHECK-NEXT: movd %xmm0, %ecx
; CHECK-NEXT: xorps %xmm0, %xmm0		; CHECK-NEXT: xorps %xmm0, %xmm0
; CHECK-NEXT: cvtsi2sd %eax, %xmm0		; CHECK-NEXT: cvtsi2sd %ecx, %xmm0
; CHECK-NEXT: movsd %xmm0, -{{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm0, 16(%rdi)
; CHECK-NEXT: fldl -{{[0-9]+}}(%rsp)		; CHECK-NEXT: movapd %xmm2, (%rdi)
; CHECK-NEXT: movapd %xmm2, %xmm0
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX-LABEL: constrained_vector_sitofp_v3f64_v3i32:		; AVX-LABEL: constrained_vector_sitofp_v3f64_v3i32:
; AVX: # %bb.0: # %entry		; AVX: # %bb.0: # %entry
; AVX-NEXT: vextractps $1, %xmm0, %eax		; AVX-NEXT: vextractps $1, %xmm0, %eax
; AVX-NEXT: vcvtsi2sd %eax, %xmm1, %xmm1		; AVX-NEXT: vcvtsi2sd %eax, %xmm1, %xmm1
; AVX-NEXT: vmovd %xmm0, %eax		; AVX-NEXT: vmovd %xmm0, %eax
; AVX-NEXT: vcvtsi2sd %eax, %xmm2, %xmm2		; AVX-NEXT: vcvtsi2sd %eax, %xmm2, %xmm2
▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines	%result = call <3 x float>
metadata !"round.dynamic",		metadata !"round.dynamic",
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %result		ret <3 x float> %result
}		}

define <3 x double> @constrained_vector_sitofp_v3f64_v3i64(<3 x i64> %x) #0 {		define <3 x double> @constrained_vector_sitofp_v3f64_v3i64(<3 x i64> %x) #0 {
; CHECK-LABEL: constrained_vector_sitofp_v3f64_v3i64:		; CHECK-LABEL: constrained_vector_sitofp_v3f64_v3i64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: cvtsi2sd %rdi, %xmm0		; CHECK-NEXT: movq %rdi, %rax
		; CHECK-NEXT: cvtsi2sd %rdx, %xmm0
; CHECK-NEXT: cvtsi2sd %rsi, %xmm1		; CHECK-NEXT: cvtsi2sd %rsi, %xmm1
; CHECK-NEXT: cvtsi2sd %rdx, %xmm2		; CHECK-NEXT: unpcklpd {{.*#+}} xmm1 = xmm1[0],xmm0[0]
; CHECK-NEXT: movsd %xmm2, -{{[0-9]+}}(%rsp)		; CHECK-NEXT: xorps %xmm0, %xmm0
; CHECK-NEXT: fldl -{{[0-9]+}}(%rsp)		; CHECK-NEXT: cvtsi2sd %rcx, %xmm0
		; CHECK-NEXT: movsd %xmm0, 16(%rdi)
		; CHECK-NEXT: movapd %xmm1, (%rdi)
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX1-LABEL: constrained_vector_sitofp_v3f64_v3i64:		; AVX1-LABEL: constrained_vector_sitofp_v3f64_v3i64:
; AVX1: # %bb.0: # %entry		; AVX1: # %bb.0: # %entry
; AVX1-NEXT: vpextrq $1, %xmm0, %rax		; AVX1-NEXT: vpextrq $1, %xmm0, %rax
; AVX1-NEXT: vcvtsi2sd %rax, %xmm1, %xmm1		; AVX1-NEXT: vcvtsi2sd %rax, %xmm1, %xmm1
; AVX1-NEXT: vmovq %xmm0, %rax		; AVX1-NEXT: vmovq %xmm0, %rax
; AVX1-NEXT: vcvtsi2sd %rax, %xmm2, %xmm2		; AVX1-NEXT: vcvtsi2sd %rax, %xmm2, %xmm2
▲ Show 20 Lines • Show All 559 Lines • ▼ Show 20 Lines	%result = call <2 x float>
metadata !"round.dynamic",		metadata !"round.dynamic",
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <2 x float> %result		ret <2 x float> %result
}		}

define <3 x double> @constrained_vector_uitofp_v3f64_v3i32(<3 x i32> %x) #0 {		define <3 x double> @constrained_vector_uitofp_v3f64_v3i32(<3 x i32> %x) #0 {
; CHECK-LABEL: constrained_vector_uitofp_v3f64_v3i32:		; CHECK-LABEL: constrained_vector_uitofp_v3f64_v3i32:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: movd %xmm0, %eax		; CHECK-NEXT: movq %rdi, %rax
; CHECK-NEXT: cvtsi2sd %rax, %xmm2		; CHECK-NEXT: movd %xmm0, %ecx
; CHECK-NEXT: pshufd {{.*#+}} xmm1 = xmm0[1,1,2,3]		; CHECK-NEXT: cvtsi2sd %rcx, %xmm1
; CHECK-NEXT: movd %xmm1, %eax		; CHECK-NEXT: pshufd {{.*#+}} xmm2 = xmm0[1,1,2,3]
; CHECK-NEXT: xorps %xmm1, %xmm1		; CHECK-NEXT: movd %xmm2, %ecx
; CHECK-NEXT: cvtsi2sd %rax, %xmm1		; CHECK-NEXT: xorps %xmm2, %xmm2
		; CHECK-NEXT: cvtsi2sd %rcx, %xmm2
		; CHECK-NEXT: unpcklpd {{.*#+}} xmm1 = xmm1[0],xmm2[0]
; CHECK-NEXT: pshufd {{.*#+}} xmm0 = xmm0[2,3,0,1]		; CHECK-NEXT: pshufd {{.*#+}} xmm0 = xmm0[2,3,0,1]
; CHECK-NEXT: movd %xmm0, %eax		; CHECK-NEXT: movd %xmm0, %ecx
; CHECK-NEXT: xorps %xmm0, %xmm0		; CHECK-NEXT: xorps %xmm0, %xmm0
; CHECK-NEXT: cvtsi2sd %rax, %xmm0		; CHECK-NEXT: cvtsi2sd %rcx, %xmm0
; CHECK-NEXT: movsd %xmm0, -{{[0-9]+}}(%rsp)		; CHECK-NEXT: movsd %xmm0, 16(%rdi)
; CHECK-NEXT: fldl -{{[0-9]+}}(%rsp)		; CHECK-NEXT: movapd %xmm1, (%rdi)
; CHECK-NEXT: movapd %xmm2, %xmm0
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX1-LABEL: constrained_vector_uitofp_v3f64_v3i32:		; AVX1-LABEL: constrained_vector_uitofp_v3f64_v3i32:
; AVX1: # %bb.0: # %entry		; AVX1: # %bb.0: # %entry
; AVX1-NEXT: vextractps $1, %xmm0, %eax		; AVX1-NEXT: vextractps $1, %xmm0, %eax
; AVX1-NEXT: vcvtsi2sd %rax, %xmm1, %xmm1		; AVX1-NEXT: vcvtsi2sd %rax, %xmm1, %xmm1
; AVX1-NEXT: vmovd %xmm0, %eax		; AVX1-NEXT: vmovd %xmm0, %eax
; AVX1-NEXT: vcvtsi2sd %rax, %xmm2, %xmm2		; AVX1-NEXT: vcvtsi2sd %rax, %xmm2, %xmm2
▲ Show 20 Lines • Show All 69 Lines • ▼ Show 20 Lines	%result = call <3 x float>
metadata !"round.dynamic",		metadata !"round.dynamic",
metadata !"fpexcept.strict") #0		metadata !"fpexcept.strict") #0
ret <3 x float> %result		ret <3 x float> %result
}		}

define <3 x double> @constrained_vector_uitofp_v3f64_v3i64(<3 x i64> %x) #0 {		define <3 x double> @constrained_vector_uitofp_v3f64_v3i64(<3 x i64> %x) #0 {
; CHECK-LABEL: constrained_vector_uitofp_v3f64_v3i64:		; CHECK-LABEL: constrained_vector_uitofp_v3f64_v3i64:
; CHECK: # %bb.0: # %entry		; CHECK: # %bb.0: # %entry
; CHECK-NEXT: movq %rdi, %xmm1		; CHECK-NEXT: movq %rdi, %rax
; CHECK-NEXT: movdqa {{.*#+}} xmm2 = [1127219200,1160773632,0,0]		; CHECK-NEXT: movq %rdx, %xmm0
; CHECK-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm2[0],xmm1[1],xmm2[1]		; CHECK-NEXT: movdqa {{.*#+}} xmm1 = [1127219200,1160773632,0,0]
; CHECK-NEXT: movapd {{.*#+}} xmm3 = [4.503599627370496E+15,1.9342813113834067E+25]		; CHECK-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
; CHECK-NEXT: subpd %xmm3, %xmm1		; CHECK-NEXT: movapd {{.*#+}} xmm2 = [4.503599627370496E+15,1.9342813113834067E+25]
; CHECK-NEXT: movapd %xmm1, %xmm0		; CHECK-NEXT: subpd %xmm2, %xmm0
; CHECK-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1]		; CHECK-NEXT: movapd %xmm0, %xmm3
; CHECK-NEXT: addpd %xmm1, %xmm0		; CHECK-NEXT: unpckhpd {{.*#+}} xmm3 = xmm3[1],xmm0[1]
; CHECK-NEXT: movq %rsi, %xmm4		; CHECK-NEXT: addpd %xmm0, %xmm3
; CHECK-NEXT: punpckldq {{.*#+}} xmm4 = xmm4[0],xmm2[0],xmm4[1],xmm2[1]		; CHECK-NEXT: movq %rsi, %xmm0
; CHECK-NEXT: subpd %xmm3, %xmm4		; CHECK-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
; CHECK-NEXT: movapd %xmm4, %xmm1		; CHECK-NEXT: subpd %xmm2, %xmm0
; CHECK-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm4[1]		; CHECK-NEXT: movapd %xmm0, %xmm4
; CHECK-NEXT: addpd %xmm4, %xmm1		; CHECK-NEXT: unpckhpd {{.*#+}} xmm4 = xmm4[1],xmm0[1]
; CHECK-NEXT: movq %rdx, %xmm4		; CHECK-NEXT: addpd %xmm0, %xmm4
; CHECK-NEXT: punpckldq {{.*#+}} xmm4 = xmm4[0],xmm2[0],xmm4[1],xmm2[1]		; CHECK-NEXT: unpcklpd {{.*#+}} xmm4 = xmm4[0],xmm3[0]
; CHECK-NEXT: subpd %xmm3, %xmm4		; CHECK-NEXT: movq %rcx, %xmm0
; CHECK-NEXT: movapd %xmm4, %xmm2		; CHECK-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
; CHECK-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm4[1]		; CHECK-NEXT: subpd %xmm2, %xmm0
; CHECK-NEXT: addpd %xmm4, %xmm2		; CHECK-NEXT: movapd %xmm0, %xmm1
; CHECK-NEXT: movlpd %xmm2, -{{[0-9]+}}(%rsp)		; CHECK-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; CHECK-NEXT: fldl -{{[0-9]+}}(%rsp)		; CHECK-NEXT: addpd %xmm0, %xmm1
		; CHECK-NEXT: movlpd %xmm1, 16(%rdi)
		; CHECK-NEXT: movapd %xmm4, (%rdi)
; CHECK-NEXT: retq		; CHECK-NEXT: retq
;		;
; AVX1-LABEL: constrained_vector_uitofp_v3f64_v3i64:		; AVX1-LABEL: constrained_vector_uitofp_v3f64_v3i64:
; AVX1: # %bb.0: # %entry		; AVX1: # %bb.0: # %entry
; AVX1-NEXT: vmovapd {{.*#+}} xmm1 = [1127219200,1160773632,0,0]		; AVX1-NEXT: vmovapd {{.*#+}} xmm1 = [1127219200,1160773632,0,0]
; AVX1-NEXT: vunpcklps {{.*#+}} xmm2 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]		; AVX1-NEXT: vunpcklps {{.*#+}} xmm2 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
; AVX1-NEXT: vmovapd {{.*#+}} xmm3 = [4.503599627370496E+15,1.9342813113834067E+25]		; AVX1-NEXT: vmovapd {{.*#+}} xmm3 = [4.503599627370496E+15,1.9342813113834067E+25]
; AVX1-NEXT: vsubpd %xmm3, %xmm2, %xmm2		; AVX1-NEXT: vsubpd %xmm3, %xmm2, %xmm2
▲ Show 20 Lines • Show All 671 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/vectorcall.ll

Show First 20 Lines • Show All 56 Lines • ▼ Show 20 Lines	ret {double, double, double, double}
{ double 0.0, double 0.0, double 0.0, double 0.0 }		{ double 0.0, double 0.0, double 0.0, double 0.0 }
}		}
; CHECK-LABEL: {{^}}test_fp_3@@0:		; CHECK-LABEL: {{^}}test_fp_3@@0:
; CHECK: xorps %xmm0		; CHECK: xorps %xmm0
; CHECK: xorps %xmm1		; CHECK: xorps %xmm1
; CHECK: xorps %xmm2		; CHECK: xorps %xmm2
; CHECK: xorps %xmm3		; CHECK: xorps %xmm3

; FIXME: Returning via x87 isn't compatible, but its hard to structure the
; tablegen any other way.
define x86_vectorcallcc {double, double, double, double, double} @test_fp_4() {		define x86_vectorcallcc {double, double, double, double, double} @test_fp_4() {
ret {double, double, double, double, double}		ret {double, double, double, double, double}
{ double 0.0, double 0.0, double 0.0, double 0.0, double 0.0 }		{ double 0.0, double 0.0, double 0.0, double 0.0, double 0.0 }
}		}
; CHECK-LABEL: {{^}}test_fp_4@@0:		; X64-LABEL: {{^}}test_fp_4@@0:
; CHECK: fldz		; X64: movq $0, 32(%rcx)
; CHECK: xorps %xmm0		; X64: movq $0, 24(%rcx)
; CHECK: xorps %xmm1		; X64: movq $0, 16(%rcx)
; CHECK: xorps %xmm2		; X64: movq $0, 8(%rcx)
; CHECK: xorps %xmm3		; X64: movq $0, (%rcx)

		; FIXME: Returning via x87 isn't compatible, but its hard to structure the
		; tablegen any other way.
		; X86-LABEL: {{^}}test_fp_4@@0:
		; X86: fldz
		; X86: xorps %xmm0
		; X86: xorps %xmm1
		; X86: xorps %xmm2
		; X86: xorps %xmm3

define x86_vectorcallcc <16 x i8> @test_vec_1(<16 x i8> %a, <16 x i8> %b) {		define x86_vectorcallcc <16 x i8> @test_vec_1(<16 x i8> %a, <16 x i8> %b) {
ret <16 x i8> %b		ret <16 x i8> %b
}		}
; CHECK-LABEL: {{^}}test_vec_1@@32:		; CHECK-LABEL: {{^}}test_vec_1@@32:
; CHECK: movaps %xmm1, %xmm0		; CHECK: movaps %xmm1, %xmm0

define x86_vectorcallcc <16 x i8> @test_vec_2(		define x86_vectorcallcc <16 x i8> @test_vec_2(
▲ Show 20 Lines • Show All 140 Lines • Show Last 20 Lines