Diff 164934

llvm/trunk/lib/Target/X86/X86InstrSSE.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 814 Lines • ▼ Show 20 Lines	let Constraints = "$src1 = $dst" in {
def MOVHLPSrr : PSI<0x12, MRMSrcReg, (outs VR128:$dst),		def MOVHLPSrr : PSI<0x12, MRMSrcReg, (outs VR128:$dst),
(ins VR128:$src1, VR128:$src2),		(ins VR128:$src1, VR128:$src2),
"movhlps\t{$src2, $dst\|$dst, $src2}",		"movhlps\t{$src2, $dst\|$dst, $src2}",
[(set VR128:$dst,		[(set VR128:$dst,
(v4f32 (X86Movhlps VR128:$src1, VR128:$src2)))]>,		(v4f32 (X86Movhlps VR128:$src1, VR128:$src2)))]>,
Sched<[SchedWriteFShuffle.XMM]>, NotMemoryFoldable;		Sched<[SchedWriteFShuffle.XMM]>, NotMemoryFoldable;
}		}

// TODO: This is largely to trick fastisel into ignoring the pattern.
def UnpckhUnary : PatFrag<(ops node:$src1, node:$src2),
(X86Unpckh node:$src1, node:$src2), [{
return N->getOperand(0) == N->getOperand(1);
}]>;

let Predicates = [UseSSE2] in {
// TODO: This is a hack pattern to allow lowering to emit unpckh instead of
// movhlps for sse2 without changing a bunch of tests.
def : Pat<(v2f64 (UnpckhUnary VR128:$src, VR128:$src)),
(MOVHLPSrr VR128:$src, VR128:$src)>;
}

//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//
// SSE 1 & 2 - Conversion Instructions		// SSE 1 & 2 - Conversion Instructions
//===----------------------------------------------------------------------===//		//===----------------------------------------------------------------------===//

multiclass sse12_cvt_s<bits<8> opc, RegisterClass SrcRC, RegisterClass DstRC,		multiclass sse12_cvt_s<bits<8> opc, RegisterClass SrcRC, RegisterClass DstRC,
SDNode OpNode, X86MemOperand x86memop, PatFrag ld_frag,		SDNode OpNode, X86MemOperand x86memop, PatFrag ld_frag,
string asm, X86FoldableSchedWrite sched> {		string asm, X86FoldableSchedWrite sched> {
def rr : SI<opc, MRMSrcReg, (outs DstRC:$dst), (ins SrcRC:$src), asm,		def rr : SI<opc, MRMSrcReg, (outs DstRC:$dst), (ins SrcRC:$src), asm,
▲ Show 20 Lines • Show All 7,363 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/buildvec-insertvec.ll

	Show All 32 Lines

	; Verify that the DAGCombiner doesn't wrongly fold a build_vector into a			; Verify that the DAGCombiner doesn't wrongly fold a build_vector into a
	; blend with a zero vector if the build_vector contains negative zero.			; blend with a zero vector if the build_vector contains negative zero.

	define <4 x float> @test_negative_zero_1(<4 x float> %A) {			define <4 x float> @test_negative_zero_1(<4 x float> %A) {
	; SSE2-LABEL: test_negative_zero_1:			; SSE2-LABEL: test_negative_zero_1:
	; SSE2: # %bb.0: # %entry			; SSE2: # %bb.0: # %entry
	; SSE2-NEXT: movaps %xmm0, %xmm1			; SSE2-NEXT: movaps %xmm0, %xmm1
	; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE2-NEXT: xorps %xmm2, %xmm2			; SSE2-NEXT: xorps %xmm2, %xmm2
	; SSE2-NEXT: movss {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3]			; SSE2-NEXT: movss {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3]
	; SSE2-NEXT: movss {{.*#+}} xmm1 = mem[0],zero,zero,zero			; SSE2-NEXT: movss {{.*#+}} xmm1 = mem[0],zero,zero,zero
	; SSE2-NEXT: unpcklps {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]			; SSE2-NEXT: unpcklps {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
	; SSE2-NEXT: movlhps {{.*#+}} xmm0 = xmm0[0],xmm2[0]			; SSE2-NEXT: movlhps {{.*#+}} xmm0 = xmm0[0],xmm2[0]
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_negative_zero_1:			; SSE41-LABEL: test_negative_zero_1:
	▲ Show 20 Lines • Show All 524 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/combine-fcopysign.ll

	Show First 20 Lines • Show All 191 Lines • ▼ Show 20 Lines
	; copysign(x, fp_extend(y)) -> copysign(x, y)			; copysign(x, fp_extend(y)) -> copysign(x, y)
	define <4 x double> @combine_vec_fcopysign_fpext_sgn(<4 x double> %x, <4 x float> %y) {			define <4 x double> @combine_vec_fcopysign_fpext_sgn(<4 x double> %x, <4 x float> %y) {
	; SSE-LABEL: combine_vec_fcopysign_fpext_sgn:			; SSE-LABEL: combine_vec_fcopysign_fpext_sgn:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movaps %xmm2, %xmm3			; SSE-NEXT: movaps %xmm2, %xmm3
	; SSE-NEXT: cvtss2sd %xmm2, %xmm4			; SSE-NEXT: cvtss2sd %xmm2, %xmm4
	; SSE-NEXT: movshdup {{.*#+}} xmm5 = xmm2[1,1,3,3]			; SSE-NEXT: movshdup {{.*#+}} xmm5 = xmm2[1,1,3,3]
	; SSE-NEXT: movaps %xmm2, %xmm6			; SSE-NEXT: movaps %xmm2, %xmm6
	; SSE-NEXT: movhlps {{.*#+}} xmm6 = xmm2[1],xmm6[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm6 = xmm6[1],xmm2[1]
	; SSE-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1],xmm2[2,3]			; SSE-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1],xmm2[2,3]
	; SSE-NEXT: movaps {{.*#+}} xmm7			; SSE-NEXT: movaps {{.*#+}} xmm7
	; SSE-NEXT: movaps %xmm0, %xmm2			; SSE-NEXT: movaps %xmm0, %xmm2
	; SSE-NEXT: andps %xmm7, %xmm2			; SSE-NEXT: andps %xmm7, %xmm2
	; SSE-NEXT: movaps {{.*#+}} xmm8 = [-0.000000e+00,-0.000000e+00]			; SSE-NEXT: movaps {{.*#+}} xmm8 = [-0.000000e+00,-0.000000e+00]
	; SSE-NEXT: andps %xmm8, %xmm4			; SSE-NEXT: andps %xmm8, %xmm4
	; SSE-NEXT: orps %xmm4, %xmm2			; SSE-NEXT: orps %xmm4, %xmm2
	; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]			; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]
	; SSE-NEXT: andps %xmm7, %xmm0			; SSE-NEXT: andps %xmm7, %xmm0
	; SSE-NEXT: xorps %xmm4, %xmm4			; SSE-NEXT: xorps %xmm4, %xmm4
	; SSE-NEXT: cvtss2sd %xmm5, %xmm4			; SSE-NEXT: cvtss2sd %xmm5, %xmm4
	; SSE-NEXT: andps %xmm8, %xmm4			; SSE-NEXT: andps %xmm8, %xmm4
	; SSE-NEXT: orps %xmm0, %xmm4			; SSE-NEXT: orps %xmm0, %xmm4
	; SSE-NEXT: movlhps {{.*#+}} xmm2 = xmm2[0],xmm4[0]			; SSE-NEXT: movlhps {{.*#+}} xmm2 = xmm2[0],xmm4[0]
	; SSE-NEXT: movaps %xmm1, %xmm0			; SSE-NEXT: movaps %xmm1, %xmm0
	; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm1[1],xmm0[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1]
	; SSE-NEXT: andps %xmm7, %xmm0			; SSE-NEXT: andps %xmm7, %xmm0
	; SSE-NEXT: cvtss2sd %xmm3, %xmm3			; SSE-NEXT: cvtss2sd %xmm3, %xmm3
	; SSE-NEXT: andps %xmm8, %xmm3			; SSE-NEXT: andps %xmm8, %xmm3
	; SSE-NEXT: orps %xmm0, %xmm3			; SSE-NEXT: orps %xmm0, %xmm3
	; SSE-NEXT: andps %xmm7, %xmm1			; SSE-NEXT: andps %xmm7, %xmm1
	; SSE-NEXT: xorps %xmm0, %xmm0			; SSE-NEXT: xorps %xmm0, %xmm0
	; SSE-NEXT: cvtss2sd %xmm6, %xmm0			; SSE-NEXT: cvtss2sd %xmm6, %xmm0
	; SSE-NEXT: andps %xmm8, %xmm0			; SSE-NEXT: andps %xmm8, %xmm0
	Show All 30 Lines
	; SSE-NEXT: movshdup {{.*#+}} xmm6 = xmm3[1,1,3,3]			; SSE-NEXT: movshdup {{.*#+}} xmm6 = xmm3[1,1,3,3]
	; SSE-NEXT: andps %xmm5, %xmm6			; SSE-NEXT: andps %xmm5, %xmm6
	; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm1[1,1]			; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm1[1,1]
	; SSE-NEXT: cvtsd2ss %xmm1, %xmm1			; SSE-NEXT: cvtsd2ss %xmm1, %xmm1
	; SSE-NEXT: andps %xmm4, %xmm1			; SSE-NEXT: andps %xmm4, %xmm1
	; SSE-NEXT: orps %xmm6, %xmm1			; SSE-NEXT: orps %xmm6, %xmm1
	; SSE-NEXT: unpcklps {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]			; SSE-NEXT: unpcklps {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
	; SSE-NEXT: movaps %xmm3, %xmm1			; SSE-NEXT: movaps %xmm3, %xmm1
	; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm3[1],xmm1[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm3[1]
	; SSE-NEXT: andps %xmm5, %xmm1			; SSE-NEXT: andps %xmm5, %xmm1
	; SSE-NEXT: xorps %xmm6, %xmm6			; SSE-NEXT: xorps %xmm6, %xmm6
	; SSE-NEXT: cvtsd2ss %xmm2, %xmm6			; SSE-NEXT: cvtsd2ss %xmm2, %xmm6
	; SSE-NEXT: andps %xmm4, %xmm6			; SSE-NEXT: andps %xmm4, %xmm6
	; SSE-NEXT: orps %xmm1, %xmm6			; SSE-NEXT: orps %xmm1, %xmm6
	; SSE-NEXT: insertps {{.*#+}} xmm0 = xmm0[0,1],xmm6[0],xmm0[3]			; SSE-NEXT: insertps {{.*#+}} xmm0 = xmm0[0,1],xmm6[0],xmm0[3]
	; SSE-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]			; SSE-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]
	; SSE-NEXT: andps %xmm5, %xmm3			; SSE-NEXT: andps %xmm5, %xmm3
	Show All 26 Lines

llvm/trunk/test/CodeGen/X86/complex-fastmath.ll

Show First 20 Lines • Show All 51 Lines • ▼ Show 20 Lines	; FMA-NEXT: retq
%9 = insertelement <2 x float> undef, float %8, i32 0		%9 = insertelement <2 x float> undef, float %8, i32 0
%10 = insertelement <2 x float> %9, float %5, i32 1		%10 = insertelement <2 x float> %9, float %5, i32 1
ret <2 x float> %10		ret <2 x float> %10
}		}

define <2 x double> @complex_square_f64(<2 x double>) #0 {		define <2 x double> @complex_square_f64(<2 x double>) #0 {
; SSE-LABEL: complex_square_f64:		; SSE-LABEL: complex_square_f64:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movaps %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: movaps %xmm0, %xmm2		; SSE-NEXT: movapd %xmm0, %xmm2
; SSE-NEXT: addsd %xmm0, %xmm2		; SSE-NEXT: addsd %xmm0, %xmm2
; SSE-NEXT: mulsd %xmm1, %xmm2		; SSE-NEXT: mulsd %xmm1, %xmm2
; SSE-NEXT: mulsd %xmm0, %xmm0		; SSE-NEXT: mulsd %xmm0, %xmm0
; SSE-NEXT: mulsd %xmm1, %xmm1		; SSE-NEXT: mulsd %xmm1, %xmm1
; SSE-NEXT: subsd %xmm1, %xmm0		; SSE-NEXT: subsd %xmm1, %xmm0
; SSE-NEXT: unpcklpd {{.*#+}} xmm0 = xmm0[0],xmm2[0]		; SSE-NEXT: unpcklpd {{.*#+}} xmm0 = xmm0[0],xmm2[0]
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
▲ Show 20 Lines • Show All 84 Lines • ▼ Show 20 Lines	; FMA-NEXT: retq
%13 = insertelement <2 x float> undef, float %12, i32 0		%13 = insertelement <2 x float> undef, float %12, i32 0
%14 = insertelement <2 x float> %13, float %9, i32 1		%14 = insertelement <2 x float> %13, float %9, i32 1
ret <2 x float> %14		ret <2 x float> %14
}		}

define <2 x double> @complex_mul_f64(<2 x double>, <2 x double>) #0 {		define <2 x double> @complex_mul_f64(<2 x double>, <2 x double>) #0 {
; SSE-LABEL: complex_mul_f64:		; SSE-LABEL: complex_mul_f64:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movaps %xmm0, %xmm2		; SSE-NEXT: movapd %xmm0, %xmm2
; SSE-NEXT: movhlps {{.*#+}} xmm2 = xmm0[1],xmm2[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm0[1]
; SSE-NEXT: movaps %xmm1, %xmm3		; SSE-NEXT: movapd %xmm1, %xmm3
; SSE-NEXT: movhlps {{.*#+}} xmm3 = xmm1[1],xmm3[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm3 = xmm3[1],xmm1[1]
; SSE-NEXT: movaps %xmm3, %xmm4		; SSE-NEXT: movapd %xmm3, %xmm4
; SSE-NEXT: mulsd %xmm0, %xmm4		; SSE-NEXT: mulsd %xmm0, %xmm4
; SSE-NEXT: mulsd %xmm1, %xmm0		; SSE-NEXT: mulsd %xmm1, %xmm0
; SSE-NEXT: mulsd %xmm2, %xmm1		; SSE-NEXT: mulsd %xmm2, %xmm1
; SSE-NEXT: addsd %xmm4, %xmm1		; SSE-NEXT: addsd %xmm4, %xmm1
; SSE-NEXT: mulsd %xmm2, %xmm3		; SSE-NEXT: mulsd %xmm2, %xmm3
; SSE-NEXT: subsd %xmm3, %xmm0		; SSE-NEXT: subsd %xmm3, %xmm0
; SSE-NEXT: unpcklpd {{.*#+}} xmm0 = xmm0[0],xmm1[0]		; SSE-NEXT: unpcklpd {{.*#+}} xmm0 = xmm0[0],xmm1[0]
; SSE-NEXT: retq		; SSE-NEXT: retq
Show All 40 Lines

llvm/trunk/test/CodeGen/X86/ftrunc.ll

Show First 20 Lines • Show All 61 Lines • ▼ Show 20 Lines
define <4 x float> @trunc_unsigned_v4f32(<4 x float> %x) #0 {		define <4 x float> @trunc_unsigned_v4f32(<4 x float> %x) #0 {
; SSE2-LABEL: trunc_unsigned_v4f32:		; SSE2-LABEL: trunc_unsigned_v4f32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1],xmm0[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1],xmm0[2,3]
; SSE2-NEXT: cvttss2si %xmm1, %rax		; SSE2-NEXT: cvttss2si %xmm1, %rax
; SSE2-NEXT: movd %eax, %xmm1		; SSE2-NEXT: movd %eax, %xmm1
; SSE2-NEXT: movaps %xmm0, %xmm2		; SSE2-NEXT: movaps %xmm0, %xmm2
; SSE2-NEXT: movhlps {{.*#+}} xmm2 = xmm0[1],xmm2[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm0[1]
; SSE2-NEXT: cvttss2si %xmm2, %rax		; SSE2-NEXT: cvttss2si %xmm2, %rax
; SSE2-NEXT: movd %eax, %xmm2		; SSE2-NEXT: movd %eax, %xmm2
; SSE2-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1]		; SSE2-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1]
; SSE2-NEXT: cvttss2si %xmm0, %rax		; SSE2-NEXT: cvttss2si %xmm0, %rax
; SSE2-NEXT: movd %eax, %xmm1		; SSE2-NEXT: movd %eax, %xmm1
; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1,2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1,2,3]
; SSE2-NEXT: cvttss2si %xmm0, %rax		; SSE2-NEXT: cvttss2si %xmm0, %rax
; SSE2-NEXT: movd %eax, %xmm0		; SSE2-NEXT: movd %eax, %xmm0
Show All 21 Lines	; AVX1-NEXT: retq
%i = fptoui <4 x float> %x to <4 x i32>		%i = fptoui <4 x float> %x to <4 x i32>
%r = uitofp <4 x i32> %i to <4 x float>		%r = uitofp <4 x i32> %i to <4 x float>
ret <4 x float> %r		ret <4 x float> %r
}		}

define <2 x double> @trunc_unsigned_v2f64(<2 x double> %x) #0 {		define <2 x double> @trunc_unsigned_v2f64(<2 x double> %x) #0 {
; SSE2-LABEL: trunc_unsigned_v2f64:		; SSE2-LABEL: trunc_unsigned_v2f64:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movapd %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: movsd {{.*#+}} xmm2 = mem[0],zero		; SSE2-NEXT: movsd {{.*#+}} xmm2 = mem[0],zero
; SSE2-NEXT: movaps %xmm1, %xmm3		; SSE2-NEXT: movapd %xmm1, %xmm3
; SSE2-NEXT: subsd %xmm2, %xmm3		; SSE2-NEXT: subsd %xmm2, %xmm3
; SSE2-NEXT: cvttsd2si %xmm3, %rax		; SSE2-NEXT: cvttsd2si %xmm3, %rax
; SSE2-NEXT: movabsq $-9223372036854775808, %rcx # imm = 0x8000000000000000		; SSE2-NEXT: movabsq $-9223372036854775808, %rcx # imm = 0x8000000000000000
; SSE2-NEXT: xorq %rcx, %rax		; SSE2-NEXT: xorq %rcx, %rax
; SSE2-NEXT: cvttsd2si %xmm1, %rdx		; SSE2-NEXT: cvttsd2si %xmm1, %rdx
; SSE2-NEXT: ucomisd %xmm2, %xmm1		; SSE2-NEXT: ucomisd %xmm2, %xmm1
; SSE2-NEXT: cmovaeq %rax, %rdx		; SSE2-NEXT: cmovaeq %rax, %rdx
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movapd %xmm0, %xmm1
; SSE2-NEXT: subsd %xmm2, %xmm1		; SSE2-NEXT: subsd %xmm2, %xmm1
; SSE2-NEXT: cvttsd2si %xmm1, %rax		; SSE2-NEXT: cvttsd2si %xmm1, %rax
; SSE2-NEXT: xorq %rcx, %rax		; SSE2-NEXT: xorq %rcx, %rax
; SSE2-NEXT: cvttsd2si %xmm0, %rcx		; SSE2-NEXT: cvttsd2si %xmm0, %rcx
; SSE2-NEXT: ucomisd %xmm2, %xmm0		; SSE2-NEXT: ucomisd %xmm2, %xmm0
; SSE2-NEXT: cmovaeq %rax, %rcx		; SSE2-NEXT: cmovaeq %rax, %rcx
; SSE2-NEXT: movq %rcx, %xmm1		; SSE2-NEXT: movq %rcx, %xmm1
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [1127219200,1160773632,0,0]		; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [1127219200,1160773632,0,0]
Show All 22 Lines	; AVX1-NEXT: retq
%i = fptoui <2 x double> %x to <2 x i64>		%i = fptoui <2 x double> %x to <2 x i64>
%r = uitofp <2 x i64> %i to <2 x double>		%r = uitofp <2 x i64> %i to <2 x double>
ret <2 x double> %r		ret <2 x double> %r
}		}

define <4 x double> @trunc_unsigned_v4f64(<4 x double> %x) #0 {		define <4 x double> @trunc_unsigned_v4f64(<4 x double> %x) #0 {
; SSE2-LABEL: trunc_unsigned_v4f64:		; SSE2-LABEL: trunc_unsigned_v4f64:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movaps %xmm1, %xmm3		; SSE2-NEXT: movapd %xmm1, %xmm3
; SSE2-NEXT: movhlps {{.*#+}} xmm3 = xmm1[1],xmm3[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm3 = xmm3[1],xmm1[1]
; SSE2-NEXT: movsd {{.*#+}} xmm2 = mem[0],zero		; SSE2-NEXT: movsd {{.*#+}} xmm2 = mem[0],zero
; SSE2-NEXT: movaps %xmm3, %xmm4		; SSE2-NEXT: movapd %xmm3, %xmm4
; SSE2-NEXT: subsd %xmm2, %xmm4		; SSE2-NEXT: subsd %xmm2, %xmm4
; SSE2-NEXT: cvttsd2si %xmm4, %rcx		; SSE2-NEXT: cvttsd2si %xmm4, %rcx
; SSE2-NEXT: movabsq $-9223372036854775808, %rdx # imm = 0x8000000000000000		; SSE2-NEXT: movabsq $-9223372036854775808, %rdx # imm = 0x8000000000000000
; SSE2-NEXT: xorq %rdx, %rcx		; SSE2-NEXT: xorq %rdx, %rcx
; SSE2-NEXT: cvttsd2si %xmm3, %rax		; SSE2-NEXT: cvttsd2si %xmm3, %rax
; SSE2-NEXT: ucomisd %xmm2, %xmm3		; SSE2-NEXT: ucomisd %xmm2, %xmm3
; SSE2-NEXT: cmovaeq %rcx, %rax		; SSE2-NEXT: cmovaeq %rcx, %rax
; SSE2-NEXT: movaps %xmm1, %xmm3		; SSE2-NEXT: movapd %xmm1, %xmm3
; SSE2-NEXT: subsd %xmm2, %xmm3		; SSE2-NEXT: subsd %xmm2, %xmm3
; SSE2-NEXT: cvttsd2si %xmm3, %rsi		; SSE2-NEXT: cvttsd2si %xmm3, %rsi
; SSE2-NEXT: xorq %rdx, %rsi		; SSE2-NEXT: xorq %rdx, %rsi
; SSE2-NEXT: cvttsd2si %xmm1, %rcx		; SSE2-NEXT: cvttsd2si %xmm1, %rcx
; SSE2-NEXT: ucomisd %xmm2, %xmm1		; SSE2-NEXT: ucomisd %xmm2, %xmm1
; SSE2-NEXT: cmovaeq %rsi, %rcx		; SSE2-NEXT: cmovaeq %rsi, %rcx
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movapd %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: movaps %xmm1, %xmm3		; SSE2-NEXT: movapd %xmm1, %xmm3
; SSE2-NEXT: subsd %xmm2, %xmm3		; SSE2-NEXT: subsd %xmm2, %xmm3
; SSE2-NEXT: cvttsd2si %xmm3, %rsi		; SSE2-NEXT: cvttsd2si %xmm3, %rsi
; SSE2-NEXT: xorq %rdx, %rsi		; SSE2-NEXT: xorq %rdx, %rsi
; SSE2-NEXT: cvttsd2si %xmm1, %rdi		; SSE2-NEXT: cvttsd2si %xmm1, %rdi
; SSE2-NEXT: ucomisd %xmm2, %xmm1		; SSE2-NEXT: ucomisd %xmm2, %xmm1
; SSE2-NEXT: cmovaeq %rsi, %rdi		; SSE2-NEXT: cmovaeq %rsi, %rdi
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movapd %xmm0, %xmm1
; SSE2-NEXT: subsd %xmm2, %xmm1		; SSE2-NEXT: subsd %xmm2, %xmm1
; SSE2-NEXT: cvttsd2si %xmm1, %rsi		; SSE2-NEXT: cvttsd2si %xmm1, %rsi
; SSE2-NEXT: xorq %rdx, %rsi		; SSE2-NEXT: xorq %rdx, %rsi
; SSE2-NEXT: cvttsd2si %xmm0, %rdx		; SSE2-NEXT: cvttsd2si %xmm0, %rdx
; SSE2-NEXT: ucomisd %xmm2, %xmm0		; SSE2-NEXT: ucomisd %xmm2, %xmm0
; SSE2-NEXT: cmovaeq %rsi, %rdx		; SSE2-NEXT: cmovaeq %rsi, %rdx
; SSE2-NEXT: movq %rdx, %xmm1		; SSE2-NEXT: movq %rdx, %xmm1
; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [1127219200,1160773632,0,0]		; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [1127219200,1160773632,0,0]
▲ Show 20 Lines • Show All 224 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/haddsub-2.ll

Show First 20 Lines • Show All 896 Lines • ▼ Show 20 Lines	; AVX-NEXT: retq
%vecinit13 = insertelement <4 x i32> %vecinit9, i32 %sub12, i32 3		%vecinit13 = insertelement <4 x i32> %vecinit9, i32 %sub12, i32 3
ret <4 x i32> %vecinit13		ret <4 x i32> %vecinit13
}		}

define <4 x float> @not_a_hsub_2(<4 x float> %A, <4 x float> %B) {		define <4 x float> @not_a_hsub_2(<4 x float> %A, <4 x float> %B) {
; SSE-LABEL: not_a_hsub_2:		; SSE-LABEL: not_a_hsub_2:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movaps %xmm0, %xmm2		; SSE-NEXT: movaps %xmm0, %xmm2
; SSE-NEXT: movhlps {{.*#+}} xmm2 = xmm0[1],xmm2[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm0[1]
; SSE-NEXT: movaps %xmm0, %xmm3		; SSE-NEXT: movaps %xmm0, %xmm3
; SSE-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1],xmm0[2,3]		; SSE-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1],xmm0[2,3]
; SSE-NEXT: subss %xmm3, %xmm2		; SSE-NEXT: subss %xmm3, %xmm2
; SSE-NEXT: movshdup {{.*#+}} xmm3 = xmm0[1,1,3,3]		; SSE-NEXT: movshdup {{.*#+}} xmm3 = xmm0[1,1,3,3]
; SSE-NEXT: subss %xmm3, %xmm0		; SSE-NEXT: subss %xmm3, %xmm0
; SSE-NEXT: unpcklps {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]		; SSE-NEXT: unpcklps {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]
; SSE-NEXT: movaps %xmm1, %xmm2		; SSE-NEXT: movaps %xmm1, %xmm2
; SSE-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1],xmm1[2,3]		; SSE-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1],xmm1[2,3]
; SSE-NEXT: movaps %xmm1, %xmm3		; SSE-NEXT: movaps %xmm1, %xmm3
; SSE-NEXT: movhlps {{.*#+}} xmm3 = xmm1[1],xmm3[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm3 = xmm3[1],xmm1[1]
; SSE-NEXT: subss %xmm3, %xmm2		; SSE-NEXT: subss %xmm3, %xmm2
; SSE-NEXT: movshdup {{.*#+}} xmm3 = xmm1[1,1,3,3]		; SSE-NEXT: movshdup {{.*#+}} xmm3 = xmm1[1,1,3,3]
; SSE-NEXT: subss %xmm3, %xmm1		; SSE-NEXT: subss %xmm3, %xmm1
; SSE-NEXT: unpcklps {{.*#+}} xmm1 = xmm1[0],xmm2[0],xmm1[1],xmm2[1]		; SSE-NEXT: unpcklps {{.*#+}} xmm1 = xmm1[0],xmm2[0],xmm1[1],xmm2[1]
; SSE-NEXT: movlhps {{.*#+}} xmm0 = xmm0[0],xmm1[0]		; SSE-NEXT: movlhps {{.*#+}} xmm0 = xmm0[0],xmm1[0]
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: not_a_hsub_2:		; AVX-LABEL: not_a_hsub_2:
Show All 29 Lines	; AVX-NEXT: retq
%sub12 = fsub float %vecext10, %vecext11		%sub12 = fsub float %vecext10, %vecext11
%vecinit13 = insertelement <4 x float> %vecinit9, float %sub12, i32 2		%vecinit13 = insertelement <4 x float> %vecinit9, float %sub12, i32 2
ret <4 x float> %vecinit13		ret <4 x float> %vecinit13
}		}

define <2 x double> @not_a_hsub_3(<2 x double> %A, <2 x double> %B) {		define <2 x double> @not_a_hsub_3(<2 x double> %A, <2 x double> %B) {
; SSE-LABEL: not_a_hsub_3:		; SSE-LABEL: not_a_hsub_3:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movaps %xmm1, %xmm2		; SSE-NEXT: movapd %xmm1, %xmm2
; SSE-NEXT: movhlps {{.*#+}} xmm2 = xmm1[1],xmm2[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm1[1]
; SSE-NEXT: subsd %xmm2, %xmm1		; SSE-NEXT: subsd %xmm2, %xmm1
; SSE-NEXT: movaps %xmm0, %xmm2		; SSE-NEXT: movapd %xmm0, %xmm2
; SSE-NEXT: movhlps {{.*#+}} xmm2 = xmm0[1],xmm2[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm0[1]
; SSE-NEXT: subsd %xmm0, %xmm2		; SSE-NEXT: subsd %xmm0, %xmm2
; SSE-NEXT: unpcklpd {{.*#+}} xmm2 = xmm2[0],xmm1[0]		; SSE-NEXT: unpcklpd {{.*#+}} xmm2 = xmm2[0],xmm1[0]
; SSE-NEXT: movapd %xmm2, %xmm0		; SSE-NEXT: movapd %xmm2, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: not_a_hsub_3:		; AVX-LABEL: not_a_hsub_3:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpermilpd {{.*#+}} xmm2 = xmm1[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm2 = xmm1[1,0]
▲ Show 20 Lines • Show All 484 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/haddsub-3.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+sse2 \| FileCheck %s --check-prefixes=SSE,SSE2			; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+sse2 \| FileCheck %s --check-prefixes=SSE,SSE2
	; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+ssse3 \| FileCheck %s --check-prefixes=SSE,SSSE3			; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+ssse3 \| FileCheck %s --check-prefixes=SSE,SSSE3
	; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+avx \| FileCheck %s --check-prefixes=AVX			; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+avx \| FileCheck %s --check-prefixes=AVX

	define float @pr26491(<4 x float> %a0) {			define float @pr26491(<4 x float> %a0) {
	; SSE2-LABEL: pr26491:			; SSE2-LABEL: pr26491:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movaps %xmm0, %xmm1			; SSE2-NEXT: movaps %xmm0, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[3,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[3,3]
	; SSE2-NEXT: addps %xmm0, %xmm1			; SSE2-NEXT: addps %xmm0, %xmm1
	; SSE2-NEXT: movaps %xmm1, %xmm0			; SSE2-NEXT: movaps %xmm1, %xmm0
	; SSE2-NEXT: movhlps {{.*#+}} xmm0 = xmm1[1],xmm0[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSSE3-LABEL: pr26491:			; SSSE3-LABEL: pr26491:
	; SSSE3: # %bb.0:			; SSSE3: # %bb.0:
	; SSSE3-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]			; SSSE3-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
	; SSSE3-NEXT: addps %xmm0, %xmm1			; SSSE3-NEXT: addps %xmm0, %xmm1
	; SSSE3-NEXT: movaps %xmm1, %xmm0			; SSSE3-NEXT: movaps %xmm1, %xmm0
	; SSSE3-NEXT: movhlps {{.*#+}} xmm0 = xmm1[1],xmm0[1]			; SSSE3-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1]
	; SSSE3-NEXT: addss %xmm1, %xmm0			; SSSE3-NEXT: addss %xmm1, %xmm0
	; SSSE3-NEXT: retq			; SSSE3-NEXT: retq
	;			;
	; AVX-LABEL: pr26491:			; AVX-LABEL: pr26491:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]			; AVX-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
	; AVX-NEXT: vaddps %xmm0, %xmm1, %xmm0			; AVX-NEXT: vaddps %xmm0, %xmm1, %xmm0
	; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	Show All 9 Lines

llvm/trunk/test/CodeGen/X86/haddsub-undef.ll

Show First 20 Lines • Show All 96 Lines • ▼ Show 20 Lines	; AVX-NEXT: retq
%add = fadd float %vecext, %vecext1		%add = fadd float %vecext, %vecext1
%vecinit = insertelement <4 x float> undef, float %add, i32 0		%vecinit = insertelement <4 x float> undef, float %add, i32 0
ret <4 x float> %vecinit		ret <4 x float> %vecinit
}		}

define <2 x double> @test5_undef(<2 x double> %a, <2 x double> %b) {		define <2 x double> @test5_undef(<2 x double> %a, <2 x double> %b) {
; SSE-LABEL: test5_undef:		; SSE-LABEL: test5_undef:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movaps %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: addsd %xmm0, %xmm1		; SSE-NEXT: addsd %xmm0, %xmm1
; SSE-NEXT: movapd %xmm1, %xmm0		; SSE-NEXT: movapd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test5_undef:		; AVX-LABEL: test5_undef:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
; AVX-NEXT: vaddsd %xmm1, %xmm0, %xmm0		; AVX-NEXT: vaddsd %xmm1, %xmm0, %xmm0
▲ Show 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
}		}

define <4 x float> @test8_undef(<4 x float> %a, <4 x float> %b) {		define <4 x float> @test8_undef(<4 x float> %a, <4 x float> %b) {
; SSE-LABEL: test8_undef:		; SSE-LABEL: test8_undef:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]		; SSE-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
; SSE-NEXT: addss %xmm0, %xmm1		; SSE-NEXT: addss %xmm0, %xmm1
; SSE-NEXT: movaps %xmm0, %xmm2		; SSE-NEXT: movaps %xmm0, %xmm2
; SSE-NEXT: movhlps {{.*#+}} xmm2 = xmm0[1],xmm2[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm0[1]
; SSE-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]		; SSE-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
; SSE-NEXT: addss %xmm2, %xmm0		; SSE-NEXT: addss %xmm2, %xmm0
; SSE-NEXT: movlhps {{.*#+}} xmm1 = xmm1[0],xmm0[0]		; SSE-NEXT: movlhps {{.*#+}} xmm1 = xmm1[0],xmm0[0]
; SSE-NEXT: movaps %xmm1, %xmm0		; SSE-NEXT: movaps %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test8_undef:		; AVX-LABEL: test8_undef:
; AVX: # %bb.0:		; AVX: # %bb.0:
▲ Show 20 Lines • Show All 272 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/pr11334.ll

	Show All 19 Lines
	define <3 x double> @v3f2d_ext_vec(<3 x float> %v1) nounwind {			define <3 x double> @v3f2d_ext_vec(<3 x float> %v1) nounwind {
	; SSE-LABEL: v3f2d_ext_vec:			; SSE-LABEL: v3f2d_ext_vec:
	; SSE: # %bb.0: # %entry			; SSE: # %bb.0: # %entry
	; SSE-NEXT: cvtps2pd %xmm0, %xmm2			; SSE-NEXT: cvtps2pd %xmm0, %xmm2
	; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]			; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]
	; SSE-NEXT: cvtps2pd %xmm0, %xmm0			; SSE-NEXT: cvtps2pd %xmm0, %xmm0
	; SSE-NEXT: movlps %xmm0, -{{[0-9]+}}(%rsp)			; SSE-NEXT: movlps %xmm0, -{{[0-9]+}}(%rsp)
	; SSE-NEXT: movaps %xmm2, %xmm1			; SSE-NEXT: movaps %xmm2, %xmm1
	; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm2[1],xmm1[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm2[1]
	; SSE-NEXT: fldl -{{[0-9]+}}(%rsp)			; SSE-NEXT: fldl -{{[0-9]+}}(%rsp)
	; SSE-NEXT: movaps %xmm2, %xmm0			; SSE-NEXT: movaps %xmm2, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: v3f2d_ext_vec:			; AVX-LABEL: v3f2d_ext_vec:
	; AVX: # %bb.0: # %entry			; AVX: # %bb.0: # %entry
	; AVX-NEXT: vcvtps2pd %xmm0, %ymm0			; AVX-NEXT: vcvtps2pd %xmm0, %ymm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	▲ Show 20 Lines • Show All 70 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/sse3-avx-addsub-2.ll

	Show First 20 Lines • Show All 426 Lines • ▼ Show 20 Lines

	define <4 x float> @test16(<4 x float> %A, <4 x float> %B) {			define <4 x float> @test16(<4 x float> %A, <4 x float> %B) {
	; SSE-LABEL: test16:			; SSE-LABEL: test16:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movss {{.*#+}} xmm3 = mem[0],zero,zero,zero			; SSE-NEXT: movss {{.*#+}} xmm3 = mem[0],zero,zero,zero
	; SSE-NEXT: movaps %xmm0, %xmm2			; SSE-NEXT: movaps %xmm0, %xmm2
	; SSE-NEXT: subss %xmm3, %xmm2			; SSE-NEXT: subss %xmm3, %xmm2
	; SSE-NEXT: movaps %xmm0, %xmm4			; SSE-NEXT: movaps %xmm0, %xmm4
	; SSE-NEXT: movhlps {{.*#+}} xmm4 = xmm0[1],xmm4[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm4 = xmm4[1],xmm0[1]
	; SSE-NEXT: movaps %xmm1, %xmm5			; SSE-NEXT: movaps %xmm1, %xmm5
	; SSE-NEXT: movhlps {{.*#+}} xmm5 = xmm1[1],xmm5[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm5 = xmm5[1],xmm1[1]
	; SSE-NEXT: subss %xmm5, %xmm4			; SSE-NEXT: subss %xmm5, %xmm4
	; SSE-NEXT: movshdup {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE-NEXT: movshdup {{.*#+}} xmm5 = xmm0[1,1,3,3]
	; SSE-NEXT: addss %xmm3, %xmm5			; SSE-NEXT: addss %xmm3, %xmm5
	; SSE-NEXT: unpcklps {{.*#+}} xmm2 = xmm2[0],xmm5[0],xmm2[1],xmm5[1]			; SSE-NEXT: unpcklps {{.*#+}} xmm2 = xmm2[0],xmm5[0],xmm2[1],xmm5[1]
	; SSE-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE-NEXT: addss %xmm0, %xmm1			; SSE-NEXT: addss %xmm0, %xmm1
	; SSE-NEXT: unpcklps {{.*#+}} xmm4 = xmm4[0],xmm1[0],xmm4[1],xmm1[1]			; SSE-NEXT: unpcklps {{.*#+}} xmm4 = xmm4[0],xmm1[0],xmm4[1],xmm1[1]
	▲ Show 20 Lines • Show All 256 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vec_fp_to_int.ll

	Show First 20 Lines • Show All 1,569 Lines • ▼ Show 20 Lines
	define <4 x i32> @fptoui_4f32_to_4i32(<4 x float> %a) {			define <4 x i32> @fptoui_4f32_to_4i32(<4 x float> %a) {
	; SSE-LABEL: fptoui_4f32_to_4i32:			; SSE-LABEL: fptoui_4f32_to_4i32:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movaps %xmm0, %xmm1			; SSE-NEXT: movaps %xmm0, %xmm1
	; SSE-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1],xmm0[2,3]			; SSE-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1],xmm0[2,3]
	; SSE-NEXT: cvttss2si %xmm1, %rax			; SSE-NEXT: cvttss2si %xmm1, %rax
	; SSE-NEXT: movd %eax, %xmm1			; SSE-NEXT: movd %eax, %xmm1
	; SSE-NEXT: movaps %xmm0, %xmm2			; SSE-NEXT: movaps %xmm0, %xmm2
	; SSE-NEXT: movhlps {{.*#+}} xmm2 = xmm0[1],xmm2[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm0[1]
	; SSE-NEXT: cvttss2si %xmm2, %rax			; SSE-NEXT: cvttss2si %xmm2, %rax
	; SSE-NEXT: movd %eax, %xmm2			; SSE-NEXT: movd %eax, %xmm2
	; SSE-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1]			; SSE-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1]
	; SSE-NEXT: cvttss2si %xmm0, %rax			; SSE-NEXT: cvttss2si %xmm0, %rax
	; SSE-NEXT: movd %eax, %xmm1			; SSE-NEXT: movd %eax, %xmm1
	; SSE-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1,2,3]			; SSE-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1,2,3]
	; SSE-NEXT: cvttss2si %xmm0, %rax			; SSE-NEXT: cvttss2si %xmm0, %rax
	; SSE-NEXT: movd %eax, %xmm0			; SSE-NEXT: movd %eax, %xmm0
	▲ Show 20 Lines • Show All 266 Lines • ▼ Show 20 Lines
	define <8 x i32> @fptoui_8f32_to_8i32(<8 x float> %a) {			define <8 x i32> @fptoui_8f32_to_8i32(<8 x float> %a) {
	; SSE-LABEL: fptoui_8f32_to_8i32:			; SSE-LABEL: fptoui_8f32_to_8i32:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movaps %xmm0, %xmm2			; SSE-NEXT: movaps %xmm0, %xmm2
	; SSE-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE-NEXT: cvttss2si %xmm0, %rax			; SSE-NEXT: cvttss2si %xmm0, %rax
	; SSE-NEXT: movd %eax, %xmm0			; SSE-NEXT: movd %eax, %xmm0
	; SSE-NEXT: movaps %xmm2, %xmm3			; SSE-NEXT: movaps %xmm2, %xmm3
	; SSE-NEXT: movhlps {{.*#+}} xmm3 = xmm2[1],xmm3[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm3 = xmm3[1],xmm2[1]
	; SSE-NEXT: cvttss2si %xmm3, %rax			; SSE-NEXT: cvttss2si %xmm3, %rax
	; SSE-NEXT: movd %eax, %xmm3			; SSE-NEXT: movd %eax, %xmm3
	; SSE-NEXT: punpckldq {{.*#+}} xmm3 = xmm3[0],xmm0[0],xmm3[1],xmm0[1]			; SSE-NEXT: punpckldq {{.*#+}} xmm3 = xmm3[0],xmm0[0],xmm3[1],xmm0[1]
	; SSE-NEXT: cvttss2si %xmm2, %rax			; SSE-NEXT: cvttss2si %xmm2, %rax
	; SSE-NEXT: movd %eax, %xmm0			; SSE-NEXT: movd %eax, %xmm0
	; SSE-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1,2,3]			; SSE-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1,2,3]
	; SSE-NEXT: cvttss2si %xmm2, %rax			; SSE-NEXT: cvttss2si %xmm2, %rax
	; SSE-NEXT: movd %eax, %xmm2			; SSE-NEXT: movd %eax, %xmm2
	; SSE-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]			; SSE-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]
	; SSE-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm3[0]			; SSE-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm3[0]
	; SSE-NEXT: movaps %xmm1, %xmm2			; SSE-NEXT: movaps %xmm1, %xmm2
	; SSE-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1],xmm1[2,3]			; SSE-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1],xmm1[2,3]
	; SSE-NEXT: cvttss2si %xmm2, %rax			; SSE-NEXT: cvttss2si %xmm2, %rax
	; SSE-NEXT: movd %eax, %xmm2			; SSE-NEXT: movd %eax, %xmm2
	; SSE-NEXT: movaps %xmm1, %xmm3			; SSE-NEXT: movaps %xmm1, %xmm3
	; SSE-NEXT: movhlps {{.*#+}} xmm3 = xmm1[1],xmm3[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm3 = xmm3[1],xmm1[1]
	; SSE-NEXT: cvttss2si %xmm3, %rax			; SSE-NEXT: cvttss2si %xmm3, %rax
	; SSE-NEXT: movd %eax, %xmm3			; SSE-NEXT: movd %eax, %xmm3
	; SSE-NEXT: punpckldq {{.*#+}} xmm3 = xmm3[0],xmm2[0],xmm3[1],xmm2[1]			; SSE-NEXT: punpckldq {{.*#+}} xmm3 = xmm3[0],xmm2[0],xmm3[1],xmm2[1]
	; SSE-NEXT: cvttss2si %xmm1, %rax			; SSE-NEXT: cvttss2si %xmm1, %rax
	; SSE-NEXT: movd %eax, %xmm2			; SSE-NEXT: movd %eax, %xmm2
	; SSE-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1,2,3]			; SSE-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1,2,3]
	; SSE-NEXT: cvttss2si %xmm1, %rax			; SSE-NEXT: cvttss2si %xmm1, %rax
	; SSE-NEXT: movd %eax, %xmm1			; SSE-NEXT: movd %eax, %xmm1
	▲ Show 20 Lines • Show All 992 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vector-constrained-fp-intrinsics.ll

	Show First 20 Lines • Show All 82 Lines • ▼ Show 20 Lines
	; NO-FMA-LABEL: constrained_vector_fdiv_v3f64:			; NO-FMA-LABEL: constrained_vector_fdiv_v3f64:
	; NO-FMA: # %bb.0: # %entry			; NO-FMA: # %bb.0: # %entry
	; NO-FMA-NEXT: movapd {{.*#+}} xmm0 = [1.000000e+00,2.000000e+00]			; NO-FMA-NEXT: movapd {{.*#+}} xmm0 = [1.000000e+00,2.000000e+00]
	; NO-FMA-NEXT: divpd {{.*}}(%rip), %xmm0			; NO-FMA-NEXT: divpd {{.*}}(%rip), %xmm0
	; NO-FMA-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero			; NO-FMA-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
	; NO-FMA-NEXT: divsd {{.*}}(%rip), %xmm1			; NO-FMA-NEXT: divsd {{.*}}(%rip), %xmm1
	; NO-FMA-NEXT: movsd %xmm1, -{{[0-9]+}}(%rsp)			; NO-FMA-NEXT: movsd %xmm1, -{{[0-9]+}}(%rsp)
	; NO-FMA-NEXT: movapd %xmm0, %xmm1			; NO-FMA-NEXT: movapd %xmm0, %xmm1
	; NO-FMA-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]			; NO-FMA-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; NO-FMA-NEXT: fldl -{{[0-9]+}}(%rsp)			; NO-FMA-NEXT: fldl -{{[0-9]+}}(%rsp)
	; NO-FMA-NEXT: retq			; NO-FMA-NEXT: retq
	;			;
	; HAS-FMA-LABEL: constrained_vector_fdiv_v3f64:			; HAS-FMA-LABEL: constrained_vector_fdiv_v3f64:
	; HAS-FMA: # %bb.0: # %entry			; HAS-FMA: # %bb.0: # %entry
	; HAS-FMA-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero			; HAS-FMA-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
	; HAS-FMA-NEXT: vdivsd {{.*}}(%rip), %xmm0, %xmm0			; HAS-FMA-NEXT: vdivsd {{.*}}(%rip), %xmm0, %xmm0
	; HAS-FMA-NEXT: vmovapd {{.*#+}} xmm1 = [1.000000e+00,2.000000e+00]			; HAS-FMA-NEXT: vmovapd {{.*#+}} xmm1 = [1.000000e+00,2.000000e+00]
	▲ Show 20 Lines • Show All 368 Lines • ▼ Show 20 Lines
	; NO-FMA-LABEL: constrained_vector_fmul_v3f64:			; NO-FMA-LABEL: constrained_vector_fmul_v3f64:
	; NO-FMA: # %bb.0: # %entry			; NO-FMA: # %bb.0: # %entry
	; NO-FMA-NEXT: movapd {{.*#+}} xmm0 = [1.797693e+308,1.797693e+308]			; NO-FMA-NEXT: movapd {{.*#+}} xmm0 = [1.797693e+308,1.797693e+308]
	; NO-FMA-NEXT: mulpd {{.*}}(%rip), %xmm0			; NO-FMA-NEXT: mulpd {{.*}}(%rip), %xmm0
	; NO-FMA-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero			; NO-FMA-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
	; NO-FMA-NEXT: mulsd {{.*}}(%rip), %xmm1			; NO-FMA-NEXT: mulsd {{.*}}(%rip), %xmm1
	; NO-FMA-NEXT: movsd %xmm1, -{{[0-9]+}}(%rsp)			; NO-FMA-NEXT: movsd %xmm1, -{{[0-9]+}}(%rsp)
	; NO-FMA-NEXT: movapd %xmm0, %xmm1			; NO-FMA-NEXT: movapd %xmm0, %xmm1
	; NO-FMA-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]			; NO-FMA-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; NO-FMA-NEXT: fldl -{{[0-9]+}}(%rsp)			; NO-FMA-NEXT: fldl -{{[0-9]+}}(%rsp)
	; NO-FMA-NEXT: retq			; NO-FMA-NEXT: retq
	;			;
	; HAS-FMA-LABEL: constrained_vector_fmul_v3f64:			; HAS-FMA-LABEL: constrained_vector_fmul_v3f64:
	; HAS-FMA: # %bb.0: # %entry			; HAS-FMA: # %bb.0: # %entry
	; HAS-FMA-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero			; HAS-FMA-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
	; HAS-FMA-NEXT: vmulsd {{.*}}(%rip), %xmm0, %xmm0			; HAS-FMA-NEXT: vmulsd {{.*}}(%rip), %xmm0, %xmm0
	; HAS-FMA-NEXT: vmovapd {{.*#+}} xmm1 = [1.797693e+308,1.797693e+308]			; HAS-FMA-NEXT: vmovapd {{.*#+}} xmm1 = [1.797693e+308,1.797693e+308]
	▲ Show 20 Lines • Show All 114 Lines • ▼ Show 20 Lines
	; NO-FMA-LABEL: constrained_vector_fadd_v3f64:			; NO-FMA-LABEL: constrained_vector_fadd_v3f64:
	; NO-FMA: # %bb.0: # %entry			; NO-FMA: # %bb.0: # %entry
	; NO-FMA-NEXT: movapd {{.*#+}} xmm0 = [1.797693e+308,1.797693e+308]			; NO-FMA-NEXT: movapd {{.*#+}} xmm0 = [1.797693e+308,1.797693e+308]
	; NO-FMA-NEXT: addpd {{.*}}(%rip), %xmm0			; NO-FMA-NEXT: addpd {{.*}}(%rip), %xmm0
	; NO-FMA-NEXT: xorpd %xmm1, %xmm1			; NO-FMA-NEXT: xorpd %xmm1, %xmm1
	; NO-FMA-NEXT: addsd {{.*}}(%rip), %xmm1			; NO-FMA-NEXT: addsd {{.*}}(%rip), %xmm1
	; NO-FMA-NEXT: movsd %xmm1, -{{[0-9]+}}(%rsp)			; NO-FMA-NEXT: movsd %xmm1, -{{[0-9]+}}(%rsp)
	; NO-FMA-NEXT: movapd %xmm0, %xmm1			; NO-FMA-NEXT: movapd %xmm0, %xmm1
	; NO-FMA-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]			; NO-FMA-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; NO-FMA-NEXT: fldl -{{[0-9]+}}(%rsp)			; NO-FMA-NEXT: fldl -{{[0-9]+}}(%rsp)
	; NO-FMA-NEXT: retq			; NO-FMA-NEXT: retq
	;			;
	; HAS-FMA-LABEL: constrained_vector_fadd_v3f64:			; HAS-FMA-LABEL: constrained_vector_fadd_v3f64:
	; HAS-FMA: # %bb.0: # %entry			; HAS-FMA: # %bb.0: # %entry
	; HAS-FMA-NEXT: vxorpd %xmm0, %xmm0, %xmm0			; HAS-FMA-NEXT: vxorpd %xmm0, %xmm0, %xmm0
	; HAS-FMA-NEXT: vaddsd {{.*}}(%rip), %xmm0, %xmm0			; HAS-FMA-NEXT: vaddsd {{.*}}(%rip), %xmm0, %xmm0
	; HAS-FMA-NEXT: vmovapd {{.*#+}} xmm1 = [1.797693e+308,1.797693e+308]			; HAS-FMA-NEXT: vmovapd {{.*#+}} xmm1 = [1.797693e+308,1.797693e+308]
	▲ Show 20 Lines • Show All 116 Lines • ▼ Show 20 Lines
	; NO-FMA: # %bb.0: # %entry			; NO-FMA: # %bb.0: # %entry
	; NO-FMA-NEXT: xorpd %xmm0, %xmm0			; NO-FMA-NEXT: xorpd %xmm0, %xmm0
	; NO-FMA-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero			; NO-FMA-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
	; NO-FMA-NEXT: subsd %xmm0, %xmm1			; NO-FMA-NEXT: subsd %xmm0, %xmm1
	; NO-FMA-NEXT: movapd {{.*#+}} xmm0 = [-1.797693e+308,-1.797693e+308]			; NO-FMA-NEXT: movapd {{.*#+}} xmm0 = [-1.797693e+308,-1.797693e+308]
	; NO-FMA-NEXT: subpd {{.*}}(%rip), %xmm0			; NO-FMA-NEXT: subpd {{.*}}(%rip), %xmm0
	; NO-FMA-NEXT: movsd %xmm1, -{{[0-9]+}}(%rsp)			; NO-FMA-NEXT: movsd %xmm1, -{{[0-9]+}}(%rsp)
	; NO-FMA-NEXT: movapd %xmm0, %xmm1			; NO-FMA-NEXT: movapd %xmm0, %xmm1
	; NO-FMA-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]			; NO-FMA-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; NO-FMA-NEXT: fldl -{{[0-9]+}}(%rsp)			; NO-FMA-NEXT: fldl -{{[0-9]+}}(%rsp)
	; NO-FMA-NEXT: retq			; NO-FMA-NEXT: retq
	;			;
	; HAS-FMA-LABEL: constrained_vector_fsub_v3f64:			; HAS-FMA-LABEL: constrained_vector_fsub_v3f64:
	; HAS-FMA: # %bb.0: # %entry			; HAS-FMA: # %bb.0: # %entry
	; HAS-FMA-NEXT: vxorpd %xmm0, %xmm0, %xmm0			; HAS-FMA-NEXT: vxorpd %xmm0, %xmm0, %xmm0
	; HAS-FMA-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero			; HAS-FMA-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero
	; HAS-FMA-NEXT: vsubsd %xmm0, %xmm1, %xmm0			; HAS-FMA-NEXT: vsubsd %xmm0, %xmm1, %xmm0
	▲ Show 20 Lines • Show All 456 Lines • ▼ Show 20 Lines
	define <3 x double> @constrained_vector_sqrt_v3f64() {			define <3 x double> @constrained_vector_sqrt_v3f64() {
	; NO-FMA-LABEL: constrained_vector_sqrt_v3f64:			; NO-FMA-LABEL: constrained_vector_sqrt_v3f64:
	; NO-FMA: # %bb.0: # %entry			; NO-FMA: # %bb.0: # %entry
	; NO-FMA-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero			; NO-FMA-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
	; NO-FMA-NEXT: sqrtsd %xmm0, %xmm1			; NO-FMA-NEXT: sqrtsd %xmm0, %xmm1
	; NO-FMA-NEXT: sqrtpd {{.*}}(%rip), %xmm0			; NO-FMA-NEXT: sqrtpd {{.*}}(%rip), %xmm0
	; NO-FMA-NEXT: movsd %xmm1, -{{[0-9]+}}(%rsp)			; NO-FMA-NEXT: movsd %xmm1, -{{[0-9]+}}(%rsp)
	; NO-FMA-NEXT: movapd %xmm0, %xmm1			; NO-FMA-NEXT: movapd %xmm0, %xmm1
	; NO-FMA-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]			; NO-FMA-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; NO-FMA-NEXT: fldl -{{[0-9]+}}(%rsp)			; NO-FMA-NEXT: fldl -{{[0-9]+}}(%rsp)
	; NO-FMA-NEXT: retq			; NO-FMA-NEXT: retq
	;			;
	; HAS-FMA-LABEL: constrained_vector_sqrt_v3f64:			; HAS-FMA-LABEL: constrained_vector_sqrt_v3f64:
	; HAS-FMA: # %bb.0: # %entry			; HAS-FMA: # %bb.0: # %entry
	; HAS-FMA-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero			; HAS-FMA-NEXT: vmovsd {{.*#+}} xmm0 = mem[0],zero
	; HAS-FMA-NEXT: vsqrtsd %xmm0, %xmm0, %xmm0			; HAS-FMA-NEXT: vsqrtsd %xmm0, %xmm0, %xmm0
	; HAS-FMA-NEXT: vsqrtpd {{.*}}(%rip), %xmm1			; HAS-FMA-NEXT: vsqrtpd {{.*}}(%rip), %xmm1
	▲ Show 20 Lines • Show All 2,548 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vector-reduce-fadd-fast.ll

Show All 35 Lines	; AVX512-NEXT: retq
%1 = call fast float @llvm.experimental.vector.reduce.fadd.f32.f32.v2f32(float %a0, <2 x float> %a1)		%1 = call fast float @llvm.experimental.vector.reduce.fadd.f32.f32.v2f32(float %a0, <2 x float> %a1)
ret float %1		ret float %1
}		}

define float @test_v4f32(float %a0, <4 x float> %a1) {		define float @test_v4f32(float %a0, <4 x float> %a1) {
; SSE2-LABEL: test_v4f32:		; SSE2-LABEL: test_v4f32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movaps %xmm1, %xmm2		; SSE2-NEXT: movaps %xmm1, %xmm2
; SSE2-NEXT: movhlps {{.*#+}} xmm2 = xmm1[1],xmm2[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm1[1]
; SSE2-NEXT: addps %xmm1, %xmm2		; SSE2-NEXT: addps %xmm1, %xmm2
; SSE2-NEXT: movaps %xmm2, %xmm0		; SSE2-NEXT: movaps %xmm2, %xmm0
; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm2[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm2[2,3]
; SSE2-NEXT: addps %xmm2, %xmm0		; SSE2-NEXT: addps %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v4f32:		; SSE41-LABEL: test_v4f32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movaps %xmm1, %xmm0		; SSE41-NEXT: movaps %xmm1, %xmm0
; SSE41-NEXT: movhlps {{.*#+}} xmm0 = xmm1[1],xmm0[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1]
; SSE41-NEXT: addps %xmm1, %xmm0		; SSE41-NEXT: addps %xmm1, %xmm0
; SSE41-NEXT: haddps %xmm0, %xmm0		; SSE41-NEXT: haddps %xmm0, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v4f32:		; AVX-LABEL: test_v4f32:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpermilpd {{.*#+}} xmm0 = xmm1[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm0 = xmm1[1,0]
; AVX-NEXT: vaddps %xmm0, %xmm1, %xmm0		; AVX-NEXT: vaddps %xmm0, %xmm1, %xmm0
Show All 10 Lines	; AVX512-NEXT: retq
ret float %1		ret float %1
}		}

define float @test_v8f32(float %a0, <8 x float> %a1) {		define float @test_v8f32(float %a0, <8 x float> %a1) {
; SSE2-LABEL: test_v8f32:		; SSE2-LABEL: test_v8f32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: addps %xmm2, %xmm1		; SSE2-NEXT: addps %xmm2, %xmm1
; SSE2-NEXT: movaps %xmm1, %xmm2		; SSE2-NEXT: movaps %xmm1, %xmm2
; SSE2-NEXT: movhlps {{.*#+}} xmm2 = xmm1[1],xmm2[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm1[1]
; SSE2-NEXT: addps %xmm1, %xmm2		; SSE2-NEXT: addps %xmm1, %xmm2
; SSE2-NEXT: movaps %xmm2, %xmm0		; SSE2-NEXT: movaps %xmm2, %xmm0
; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm2[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm2[2,3]
; SSE2-NEXT: addps %xmm2, %xmm0		; SSE2-NEXT: addps %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v8f32:		; SSE41-LABEL: test_v8f32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: addps %xmm2, %xmm1		; SSE41-NEXT: addps %xmm2, %xmm1
; SSE41-NEXT: movaps %xmm1, %xmm0		; SSE41-NEXT: movaps %xmm1, %xmm0
; SSE41-NEXT: movhlps {{.*#+}} xmm0 = xmm1[1],xmm0[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1]
; SSE41-NEXT: addps %xmm1, %xmm0		; SSE41-NEXT: addps %xmm1, %xmm0
; SSE41-NEXT: haddps %xmm0, %xmm0		; SSE41-NEXT: haddps %xmm0, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v8f32:		; AVX-LABEL: test_v8f32:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vextractf128 $1, %ymm1, %xmm0		; AVX-NEXT: vextractf128 $1, %ymm1, %xmm0
; AVX-NEXT: vaddps %ymm0, %ymm1, %ymm0		; AVX-NEXT: vaddps %ymm0, %ymm1, %ymm0
Show All 20 Lines

define float @test_v16f32(float %a0, <16 x float> %a1) {		define float @test_v16f32(float %a0, <16 x float> %a1) {
; SSE2-LABEL: test_v16f32:		; SSE2-LABEL: test_v16f32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: addps %xmm4, %xmm2		; SSE2-NEXT: addps %xmm4, %xmm2
; SSE2-NEXT: addps %xmm3, %xmm1		; SSE2-NEXT: addps %xmm3, %xmm1
; SSE2-NEXT: addps %xmm2, %xmm1		; SSE2-NEXT: addps %xmm2, %xmm1
; SSE2-NEXT: movaps %xmm1, %xmm2		; SSE2-NEXT: movaps %xmm1, %xmm2
; SSE2-NEXT: movhlps {{.*#+}} xmm2 = xmm1[1],xmm2[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm1[1]
; SSE2-NEXT: addps %xmm1, %xmm2		; SSE2-NEXT: addps %xmm1, %xmm2
; SSE2-NEXT: movaps %xmm2, %xmm0		; SSE2-NEXT: movaps %xmm2, %xmm0
; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm2[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm2[2,3]
; SSE2-NEXT: addps %xmm2, %xmm0		; SSE2-NEXT: addps %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v16f32:		; SSE41-LABEL: test_v16f32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: addps %xmm4, %xmm2		; SSE41-NEXT: addps %xmm4, %xmm2
; SSE41-NEXT: addps %xmm3, %xmm1		; SSE41-NEXT: addps %xmm3, %xmm1
; SSE41-NEXT: addps %xmm2, %xmm1		; SSE41-NEXT: addps %xmm2, %xmm1
; SSE41-NEXT: movaps %xmm1, %xmm0		; SSE41-NEXT: movaps %xmm1, %xmm0
; SSE41-NEXT: movhlps {{.*#+}} xmm0 = xmm1[1],xmm0[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1]
; SSE41-NEXT: addps %xmm1, %xmm0		; SSE41-NEXT: addps %xmm1, %xmm0
; SSE41-NEXT: haddps %xmm0, %xmm0		; SSE41-NEXT: haddps %xmm0, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v16f32:		; AVX-LABEL: test_v16f32:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vaddps %ymm2, %ymm1, %ymm0		; AVX-NEXT: vaddps %ymm2, %ymm1, %ymm0
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
▲ Show 20 Lines • Show All 52 Lines • ▼ Show 20 Lines	; AVX512-NEXT: retq
%1 = call fast float @llvm.experimental.vector.reduce.fadd.f32.f32.v2f32(float 0.0, <2 x float> %a0)		%1 = call fast float @llvm.experimental.vector.reduce.fadd.f32.f32.v2f32(float 0.0, <2 x float> %a0)
ret float %1		ret float %1
}		}

define float @test_v4f32_zero(<4 x float> %a0) {		define float @test_v4f32_zero(<4 x float> %a0) {
; SSE2-LABEL: test_v4f32_zero:		; SSE2-LABEL: test_v4f32_zero:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: addps %xmm0, %xmm1		; SSE2-NEXT: addps %xmm0, %xmm1
; SSE2-NEXT: movaps %xmm1, %xmm0		; SSE2-NEXT: movaps %xmm1, %xmm0
; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]
; SSE2-NEXT: addps %xmm1, %xmm0		; SSE2-NEXT: addps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v4f32_zero:		; SSE41-LABEL: test_v4f32_zero:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: addps %xmm0, %xmm1		; SSE41-NEXT: addps %xmm0, %xmm1
; SSE41-NEXT: haddps %xmm1, %xmm1		; SSE41-NEXT: haddps %xmm1, %xmm1
; SSE41-NEXT: movaps %xmm1, %xmm0		; SSE41-NEXT: movaps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v4f32_zero:		; AVX-LABEL: test_v4f32_zero:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
Show All 11 Lines	; AVX512-NEXT: retq
ret float %1		ret float %1
}		}

define float @test_v8f32_zero(<8 x float> %a0) {		define float @test_v8f32_zero(<8 x float> %a0) {
; SSE2-LABEL: test_v8f32_zero:		; SSE2-LABEL: test_v8f32_zero:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: addps %xmm1, %xmm0		; SSE2-NEXT: addps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: addps %xmm0, %xmm1		; SSE2-NEXT: addps %xmm0, %xmm1
; SSE2-NEXT: movaps %xmm1, %xmm0		; SSE2-NEXT: movaps %xmm1, %xmm0
; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]
; SSE2-NEXT: addps %xmm1, %xmm0		; SSE2-NEXT: addps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v8f32_zero:		; SSE41-LABEL: test_v8f32_zero:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: addps %xmm1, %xmm0		; SSE41-NEXT: addps %xmm1, %xmm0
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: addps %xmm0, %xmm1		; SSE41-NEXT: addps %xmm0, %xmm1
; SSE41-NEXT: haddps %xmm1, %xmm1		; SSE41-NEXT: haddps %xmm1, %xmm1
; SSE41-NEXT: movaps %xmm1, %xmm0		; SSE41-NEXT: movaps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v8f32_zero:		; AVX-LABEL: test_v8f32_zero:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
Show All 21 Lines

define float @test_v16f32_zero(<16 x float> %a0) {		define float @test_v16f32_zero(<16 x float> %a0) {
; SSE2-LABEL: test_v16f32_zero:		; SSE2-LABEL: test_v16f32_zero:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: addps %xmm3, %xmm1		; SSE2-NEXT: addps %xmm3, %xmm1
; SSE2-NEXT: addps %xmm2, %xmm0		; SSE2-NEXT: addps %xmm2, %xmm0
; SSE2-NEXT: addps %xmm1, %xmm0		; SSE2-NEXT: addps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: addps %xmm0, %xmm1		; SSE2-NEXT: addps %xmm0, %xmm1
; SSE2-NEXT: movaps %xmm1, %xmm0		; SSE2-NEXT: movaps %xmm1, %xmm0
; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]
; SSE2-NEXT: addps %xmm1, %xmm0		; SSE2-NEXT: addps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v16f32_zero:		; SSE41-LABEL: test_v16f32_zero:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: addps %xmm3, %xmm1		; SSE41-NEXT: addps %xmm3, %xmm1
; SSE41-NEXT: addps %xmm2, %xmm0		; SSE41-NEXT: addps %xmm2, %xmm0
; SSE41-NEXT: addps %xmm1, %xmm0		; SSE41-NEXT: addps %xmm1, %xmm0
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: addps %xmm0, %xmm1		; SSE41-NEXT: addps %xmm0, %xmm1
; SSE41-NEXT: haddps %xmm1, %xmm1		; SSE41-NEXT: haddps %xmm1, %xmm1
; SSE41-NEXT: movaps %xmm1, %xmm0		; SSE41-NEXT: movaps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v16f32_zero:		; AVX-LABEL: test_v16f32_zero:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vaddps %ymm1, %ymm0, %ymm0		; AVX-NEXT: vaddps %ymm1, %ymm0, %ymm0
▲ Show 20 Lines • Show All 53 Lines • ▼ Show 20 Lines	; AVX512-NEXT: retq
%1 = call fast float @llvm.experimental.vector.reduce.fadd.f32.f32.v2f32(float undef, <2 x float> %a0)		%1 = call fast float @llvm.experimental.vector.reduce.fadd.f32.f32.v2f32(float undef, <2 x float> %a0)
ret float %1		ret float %1
}		}

define float @test_v4f32_undef(<4 x float> %a0) {		define float @test_v4f32_undef(<4 x float> %a0) {
; SSE2-LABEL: test_v4f32_undef:		; SSE2-LABEL: test_v4f32_undef:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: addps %xmm0, %xmm1		; SSE2-NEXT: addps %xmm0, %xmm1
; SSE2-NEXT: movaps %xmm1, %xmm0		; SSE2-NEXT: movaps %xmm1, %xmm0
; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]
; SSE2-NEXT: addps %xmm1, %xmm0		; SSE2-NEXT: addps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v4f32_undef:		; SSE41-LABEL: test_v4f32_undef:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: addps %xmm0, %xmm1		; SSE41-NEXT: addps %xmm0, %xmm1
; SSE41-NEXT: haddps %xmm1, %xmm1		; SSE41-NEXT: haddps %xmm1, %xmm1
; SSE41-NEXT: movaps %xmm1, %xmm0		; SSE41-NEXT: movaps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v4f32_undef:		; AVX-LABEL: test_v4f32_undef:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
Show All 11 Lines	; AVX512-NEXT: retq
ret float %1		ret float %1
}		}

define float @test_v8f32_undef(<8 x float> %a0) {		define float @test_v8f32_undef(<8 x float> %a0) {
; SSE2-LABEL: test_v8f32_undef:		; SSE2-LABEL: test_v8f32_undef:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: addps %xmm1, %xmm0		; SSE2-NEXT: addps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: addps %xmm0, %xmm1		; SSE2-NEXT: addps %xmm0, %xmm1
; SSE2-NEXT: movaps %xmm1, %xmm0		; SSE2-NEXT: movaps %xmm1, %xmm0
; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]
; SSE2-NEXT: addps %xmm1, %xmm0		; SSE2-NEXT: addps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v8f32_undef:		; SSE41-LABEL: test_v8f32_undef:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: addps %xmm1, %xmm0		; SSE41-NEXT: addps %xmm1, %xmm0
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: addps %xmm0, %xmm1		; SSE41-NEXT: addps %xmm0, %xmm1
; SSE41-NEXT: haddps %xmm1, %xmm1		; SSE41-NEXT: haddps %xmm1, %xmm1
; SSE41-NEXT: movaps %xmm1, %xmm0		; SSE41-NEXT: movaps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v8f32_undef:		; AVX-LABEL: test_v8f32_undef:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
Show All 21 Lines

define float @test_v16f32_undef(<16 x float> %a0) {		define float @test_v16f32_undef(<16 x float> %a0) {
; SSE2-LABEL: test_v16f32_undef:		; SSE2-LABEL: test_v16f32_undef:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: addps %xmm3, %xmm1		; SSE2-NEXT: addps %xmm3, %xmm1
; SSE2-NEXT: addps %xmm2, %xmm0		; SSE2-NEXT: addps %xmm2, %xmm0
; SSE2-NEXT: addps %xmm1, %xmm0		; SSE2-NEXT: addps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: addps %xmm0, %xmm1		; SSE2-NEXT: addps %xmm0, %xmm1
; SSE2-NEXT: movaps %xmm1, %xmm0		; SSE2-NEXT: movaps %xmm1, %xmm0
; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]
; SSE2-NEXT: addps %xmm1, %xmm0		; SSE2-NEXT: addps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v16f32_undef:		; SSE41-LABEL: test_v16f32_undef:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: addps %xmm3, %xmm1		; SSE41-NEXT: addps %xmm3, %xmm1
; SSE41-NEXT: addps %xmm2, %xmm0		; SSE41-NEXT: addps %xmm2, %xmm0
; SSE41-NEXT: addps %xmm1, %xmm0		; SSE41-NEXT: addps %xmm1, %xmm0
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: addps %xmm0, %xmm1		; SSE41-NEXT: addps %xmm0, %xmm1
; SSE41-NEXT: haddps %xmm1, %xmm1		; SSE41-NEXT: haddps %xmm1, %xmm1
; SSE41-NEXT: movaps %xmm1, %xmm0		; SSE41-NEXT: movaps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v16f32_undef:		; AVX-LABEL: test_v16f32_undef:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vaddps %ymm1, %ymm0, %ymm0		; AVX-NEXT: vaddps %ymm1, %ymm0, %ymm0
Show All 25 Lines

;		;
; vXf64 (accum)		; vXf64 (accum)
;		;

define double @test_v2f64(double %a0, <2 x double> %a1) {		define double @test_v2f64(double %a0, <2 x double> %a1) {
; SSE2-LABEL: test_v2f64:		; SSE2-LABEL: test_v2f64:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movaps %xmm1, %xmm0		; SSE2-NEXT: movapd %xmm1, %xmm0
; SSE2-NEXT: movhlps {{.*#+}} xmm0 = xmm1[1],xmm0[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1]
; SSE2-NEXT: addpd %xmm1, %xmm0		; SSE2-NEXT: addpd %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v2f64:		; SSE41-LABEL: test_v2f64:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: haddpd %xmm1, %xmm1		; SSE41-NEXT: haddpd %xmm1, %xmm1
; SSE41-NEXT: movapd %xmm1, %xmm0		; SSE41-NEXT: movapd %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
Show All 11 Lines	; AVX512-NEXT: retq
ret double %1		ret double %1
}		}

define double @test_v4f64(double %a0, <4 x double> %a1) {		define double @test_v4f64(double %a0, <4 x double> %a1) {
; SSE2-LABEL: test_v4f64:		; SSE2-LABEL: test_v4f64:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: addpd %xmm2, %xmm1		; SSE2-NEXT: addpd %xmm2, %xmm1
; SSE2-NEXT: movapd %xmm1, %xmm0		; SSE2-NEXT: movapd %xmm1, %xmm0
; SSE2-NEXT: movhlps {{.*#+}} xmm0 = xmm1[1],xmm0[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1]
; SSE2-NEXT: addpd %xmm1, %xmm0		; SSE2-NEXT: addpd %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v4f64:		; SSE41-LABEL: test_v4f64:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: addpd %xmm2, %xmm1		; SSE41-NEXT: addpd %xmm2, %xmm1
; SSE41-NEXT: haddpd %xmm1, %xmm1		; SSE41-NEXT: haddpd %xmm1, %xmm1
; SSE41-NEXT: movapd %xmm1, %xmm0		; SSE41-NEXT: movapd %xmm1, %xmm0
Show All 22 Lines

define double @test_v8f64(double %a0, <8 x double> %a1) {		define double @test_v8f64(double %a0, <8 x double> %a1) {
; SSE2-LABEL: test_v8f64:		; SSE2-LABEL: test_v8f64:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: addpd %xmm4, %xmm2		; SSE2-NEXT: addpd %xmm4, %xmm2
; SSE2-NEXT: addpd %xmm3, %xmm1		; SSE2-NEXT: addpd %xmm3, %xmm1
; SSE2-NEXT: addpd %xmm2, %xmm1		; SSE2-NEXT: addpd %xmm2, %xmm1
; SSE2-NEXT: movapd %xmm1, %xmm0		; SSE2-NEXT: movapd %xmm1, %xmm0
; SSE2-NEXT: movhlps {{.*#+}} xmm0 = xmm1[1],xmm0[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1]
; SSE2-NEXT: addpd %xmm1, %xmm0		; SSE2-NEXT: addpd %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v8f64:		; SSE41-LABEL: test_v8f64:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: addpd %xmm4, %xmm2		; SSE41-NEXT: addpd %xmm4, %xmm2
; SSE41-NEXT: addpd %xmm3, %xmm1		; SSE41-NEXT: addpd %xmm3, %xmm1
; SSE41-NEXT: addpd %xmm2, %xmm1		; SSE41-NEXT: addpd %xmm2, %xmm1
Show All 32 Lines
; SSE2-NEXT: addpd %xmm6, %xmm2		; SSE2-NEXT: addpd %xmm6, %xmm2
; SSE2-NEXT: addpd %xmm7, %xmm3		; SSE2-NEXT: addpd %xmm7, %xmm3
; SSE2-NEXT: addpd %xmm5, %xmm1		; SSE2-NEXT: addpd %xmm5, %xmm1
; SSE2-NEXT: addpd %xmm3, %xmm1		; SSE2-NEXT: addpd %xmm3, %xmm1
; SSE2-NEXT: addpd {{[0-9]+}}(%rsp), %xmm4		; SSE2-NEXT: addpd {{[0-9]+}}(%rsp), %xmm4
; SSE2-NEXT: addpd %xmm2, %xmm4		; SSE2-NEXT: addpd %xmm2, %xmm4
; SSE2-NEXT: addpd %xmm1, %xmm4		; SSE2-NEXT: addpd %xmm1, %xmm4
; SSE2-NEXT: movapd %xmm4, %xmm0		; SSE2-NEXT: movapd %xmm4, %xmm0
; SSE2-NEXT: movhlps {{.*#+}} xmm0 = xmm4[1],xmm0[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm4[1]
; SSE2-NEXT: addpd %xmm4, %xmm0		; SSE2-NEXT: addpd %xmm4, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v16f64:		; SSE41-LABEL: test_v16f64:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: addpd %xmm6, %xmm2		; SSE41-NEXT: addpd %xmm6, %xmm2
; SSE41-NEXT: addpd %xmm7, %xmm3		; SSE41-NEXT: addpd %xmm7, %xmm3
; SSE41-NEXT: addpd %xmm5, %xmm1		; SSE41-NEXT: addpd %xmm5, %xmm1
Show All 35 Lines

;		;
; vXf64 (zero)		; vXf64 (zero)
;		;

define double @test_v2f64_zero(<2 x double> %a0) {		define double @test_v2f64_zero(<2 x double> %a0) {
; SSE2-LABEL: test_v2f64_zero:		; SSE2-LABEL: test_v2f64_zero:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movapd %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: addpd %xmm0, %xmm1		; SSE2-NEXT: addpd %xmm0, %xmm1
; SSE2-NEXT: movapd %xmm1, %xmm0		; SSE2-NEXT: movapd %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v2f64_zero:		; SSE41-LABEL: test_v2f64_zero:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: haddpd %xmm0, %xmm0		; SSE41-NEXT: haddpd %xmm0, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
Show All 11 Lines	; AVX512-NEXT: retq
ret double %1		ret double %1
}		}

define double @test_v4f64_zero(<4 x double> %a0) {		define double @test_v4f64_zero(<4 x double> %a0) {
; SSE2-LABEL: test_v4f64_zero:		; SSE2-LABEL: test_v4f64_zero:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: addpd %xmm1, %xmm0		; SSE2-NEXT: addpd %xmm1, %xmm0
; SSE2-NEXT: movapd %xmm0, %xmm1		; SSE2-NEXT: movapd %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: addpd %xmm0, %xmm1		; SSE2-NEXT: addpd %xmm0, %xmm1
; SSE2-NEXT: movapd %xmm1, %xmm0		; SSE2-NEXT: movapd %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v4f64_zero:		; SSE41-LABEL: test_v4f64_zero:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: addpd %xmm1, %xmm0		; SSE41-NEXT: addpd %xmm1, %xmm0
; SSE41-NEXT: haddpd %xmm0, %xmm0		; SSE41-NEXT: haddpd %xmm0, %xmm0
Show All 22 Lines

define double @test_v8f64_zero(<8 x double> %a0) {		define double @test_v8f64_zero(<8 x double> %a0) {
; SSE2-LABEL: test_v8f64_zero:		; SSE2-LABEL: test_v8f64_zero:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: addpd %xmm3, %xmm1		; SSE2-NEXT: addpd %xmm3, %xmm1
; SSE2-NEXT: addpd %xmm2, %xmm0		; SSE2-NEXT: addpd %xmm2, %xmm0
; SSE2-NEXT: addpd %xmm1, %xmm0		; SSE2-NEXT: addpd %xmm1, %xmm0
; SSE2-NEXT: movapd %xmm0, %xmm1		; SSE2-NEXT: movapd %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: addpd %xmm0, %xmm1		; SSE2-NEXT: addpd %xmm0, %xmm1
; SSE2-NEXT: movapd %xmm1, %xmm0		; SSE2-NEXT: movapd %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v8f64_zero:		; SSE41-LABEL: test_v8f64_zero:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: addpd %xmm3, %xmm1		; SSE41-NEXT: addpd %xmm3, %xmm1
; SSE41-NEXT: addpd %xmm2, %xmm0		; SSE41-NEXT: addpd %xmm2, %xmm0
Show All 32 Lines
; SSE2-NEXT: addpd %xmm6, %xmm2		; SSE2-NEXT: addpd %xmm6, %xmm2
; SSE2-NEXT: addpd %xmm4, %xmm0		; SSE2-NEXT: addpd %xmm4, %xmm0
; SSE2-NEXT: addpd %xmm2, %xmm0		; SSE2-NEXT: addpd %xmm2, %xmm0
; SSE2-NEXT: addpd %xmm7, %xmm3		; SSE2-NEXT: addpd %xmm7, %xmm3
; SSE2-NEXT: addpd %xmm5, %xmm1		; SSE2-NEXT: addpd %xmm5, %xmm1
; SSE2-NEXT: addpd %xmm3, %xmm1		; SSE2-NEXT: addpd %xmm3, %xmm1
; SSE2-NEXT: addpd %xmm0, %xmm1		; SSE2-NEXT: addpd %xmm0, %xmm1
; SSE2-NEXT: movapd %xmm1, %xmm0		; SSE2-NEXT: movapd %xmm1, %xmm0
; SSE2-NEXT: movhlps {{.*#+}} xmm0 = xmm1[1],xmm0[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1]
; SSE2-NEXT: addpd %xmm1, %xmm0		; SSE2-NEXT: addpd %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v16f64_zero:		; SSE41-LABEL: test_v16f64_zero:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: addpd %xmm6, %xmm2		; SSE41-NEXT: addpd %xmm6, %xmm2
; SSE41-NEXT: addpd %xmm4, %xmm0		; SSE41-NEXT: addpd %xmm4, %xmm0
; SSE41-NEXT: addpd %xmm2, %xmm0		; SSE41-NEXT: addpd %xmm2, %xmm0
Show All 35 Lines

;		;
; vXf64 (undef)		; vXf64 (undef)
;		;

define double @test_v2f64_undef(<2 x double> %a0) {		define double @test_v2f64_undef(<2 x double> %a0) {
; SSE2-LABEL: test_v2f64_undef:		; SSE2-LABEL: test_v2f64_undef:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movapd %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: addpd %xmm0, %xmm1		; SSE2-NEXT: addpd %xmm0, %xmm1
; SSE2-NEXT: movapd %xmm1, %xmm0		; SSE2-NEXT: movapd %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v2f64_undef:		; SSE41-LABEL: test_v2f64_undef:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: haddpd %xmm0, %xmm0		; SSE41-NEXT: haddpd %xmm0, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
Show All 11 Lines	; AVX512-NEXT: retq
ret double %1		ret double %1
}		}

define double @test_v4f64_undef(<4 x double> %a0) {		define double @test_v4f64_undef(<4 x double> %a0) {
; SSE2-LABEL: test_v4f64_undef:		; SSE2-LABEL: test_v4f64_undef:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: addpd %xmm1, %xmm0		; SSE2-NEXT: addpd %xmm1, %xmm0
; SSE2-NEXT: movapd %xmm0, %xmm1		; SSE2-NEXT: movapd %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: addpd %xmm0, %xmm1		; SSE2-NEXT: addpd %xmm0, %xmm1
; SSE2-NEXT: movapd %xmm1, %xmm0		; SSE2-NEXT: movapd %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v4f64_undef:		; SSE41-LABEL: test_v4f64_undef:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: addpd %xmm1, %xmm0		; SSE41-NEXT: addpd %xmm1, %xmm0
; SSE41-NEXT: haddpd %xmm0, %xmm0		; SSE41-NEXT: haddpd %xmm0, %xmm0
Show All 22 Lines

define double @test_v8f64_undef(<8 x double> %a0) {		define double @test_v8f64_undef(<8 x double> %a0) {
; SSE2-LABEL: test_v8f64_undef:		; SSE2-LABEL: test_v8f64_undef:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: addpd %xmm3, %xmm1		; SSE2-NEXT: addpd %xmm3, %xmm1
; SSE2-NEXT: addpd %xmm2, %xmm0		; SSE2-NEXT: addpd %xmm2, %xmm0
; SSE2-NEXT: addpd %xmm1, %xmm0		; SSE2-NEXT: addpd %xmm1, %xmm0
; SSE2-NEXT: movapd %xmm0, %xmm1		; SSE2-NEXT: movapd %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: addpd %xmm0, %xmm1		; SSE2-NEXT: addpd %xmm0, %xmm1
; SSE2-NEXT: movapd %xmm1, %xmm0		; SSE2-NEXT: movapd %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v8f64_undef:		; SSE41-LABEL: test_v8f64_undef:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: addpd %xmm3, %xmm1		; SSE41-NEXT: addpd %xmm3, %xmm1
; SSE41-NEXT: addpd %xmm2, %xmm0		; SSE41-NEXT: addpd %xmm2, %xmm0
Show All 32 Lines
; SSE2-NEXT: addpd %xmm6, %xmm2		; SSE2-NEXT: addpd %xmm6, %xmm2
; SSE2-NEXT: addpd %xmm4, %xmm0		; SSE2-NEXT: addpd %xmm4, %xmm0
; SSE2-NEXT: addpd %xmm2, %xmm0		; SSE2-NEXT: addpd %xmm2, %xmm0
; SSE2-NEXT: addpd %xmm7, %xmm3		; SSE2-NEXT: addpd %xmm7, %xmm3
; SSE2-NEXT: addpd %xmm5, %xmm1		; SSE2-NEXT: addpd %xmm5, %xmm1
; SSE2-NEXT: addpd %xmm3, %xmm1		; SSE2-NEXT: addpd %xmm3, %xmm1
; SSE2-NEXT: addpd %xmm0, %xmm1		; SSE2-NEXT: addpd %xmm0, %xmm1
; SSE2-NEXT: movapd %xmm1, %xmm0		; SSE2-NEXT: movapd %xmm1, %xmm0
; SSE2-NEXT: movhlps {{.*#+}} xmm0 = xmm1[1],xmm0[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1]
; SSE2-NEXT: addpd %xmm1, %xmm0		; SSE2-NEXT: addpd %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v16f64_undef:		; SSE41-LABEL: test_v16f64_undef:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: addpd %xmm6, %xmm2		; SSE41-NEXT: addpd %xmm6, %xmm2
; SSE41-NEXT: addpd %xmm4, %xmm0		; SSE41-NEXT: addpd %xmm4, %xmm0
; SSE41-NEXT: addpd %xmm2, %xmm0		; SSE41-NEXT: addpd %xmm2, %xmm0
▲ Show 20 Lines • Show All 45 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vector-reduce-fadd.ll

	Show First 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	define float @test_v4f32(float %a0, <4 x float> %a1) {			define float @test_v4f32(float %a0, <4 x float> %a1) {
	; SSE2-LABEL: test_v4f32:			; SSE2-LABEL: test_v4f32:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm2			; SSE2-NEXT: movaps %xmm1, %xmm2
	; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1],xmm1[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1],xmm1[2,3]
	; SSE2-NEXT: addss %xmm2, %xmm0			; SSE2-NEXT: addss %xmm2, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm2			; SSE2-NEXT: movaps %xmm1, %xmm2
	; SSE2-NEXT: movhlps {{.*#+}} xmm2 = xmm1[1],xmm2[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm1[1]
	; SSE2-NEXT: addss %xmm2, %xmm0			; SSE2-NEXT: addss %xmm2, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v4f32:			; SSE41-LABEL: test_v4f32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm2 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm2 = xmm1[1,1,3,3]
	; SSE41-NEXT: addss %xmm2, %xmm0			; SSE41-NEXT: addss %xmm2, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm2			; SSE41-NEXT: movaps %xmm1, %xmm2
	; SSE41-NEXT: movhlps {{.*#+}} xmm2 = xmm1[1],xmm2[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm1[1]
	; SSE41-NEXT: addss %xmm2, %xmm0			; SSE41-NEXT: addss %xmm2, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v4f32:			; AVX-LABEL: test_v4f32:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vaddss %xmm1, %xmm0, %xmm0			; AVX-NEXT: vaddss %xmm1, %xmm0, %xmm0
	Show All 22 Lines
	define float @test_v8f32(float %a0, <8 x float> %a1) {			define float @test_v8f32(float %a0, <8 x float> %a1) {
	; SSE2-LABEL: test_v8f32:			; SSE2-LABEL: test_v8f32:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm3			; SSE2-NEXT: movaps %xmm1, %xmm3
	; SSE2-NEXT: shufps {{.*#+}} xmm3 = xmm3[1,1],xmm1[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm3 = xmm3[1,1],xmm1[2,3]
	; SSE2-NEXT: addss %xmm3, %xmm0			; SSE2-NEXT: addss %xmm3, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm3			; SSE2-NEXT: movaps %xmm1, %xmm3
	; SSE2-NEXT: movhlps {{.*#+}} xmm3 = xmm1[1],xmm3[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm3 = xmm3[1],xmm1[1]
	; SSE2-NEXT: addss %xmm3, %xmm0			; SSE2-NEXT: addss %xmm3, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: addss %xmm2, %xmm0			; SSE2-NEXT: addss %xmm2, %xmm0
	; SSE2-NEXT: movaps %xmm2, %xmm1			; SSE2-NEXT: movaps %xmm2, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm2[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm2[2,3]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm2, %xmm1			; SSE2-NEXT: movaps %xmm2, %xmm1
	; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm2[1],xmm1[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm2[1]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]
	; SSE2-NEXT: addss %xmm2, %xmm0			; SSE2-NEXT: addss %xmm2, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v8f32:			; SSE41-LABEL: test_v8f32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm3 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm3 = xmm1[1,1,3,3]
	; SSE41-NEXT: addss %xmm3, %xmm0			; SSE41-NEXT: addss %xmm3, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm3			; SSE41-NEXT: movaps %xmm1, %xmm3
	; SSE41-NEXT: movhlps {{.*#+}} xmm3 = xmm1[1],xmm3[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm3 = xmm3[1],xmm1[1]
	; SSE41-NEXT: addss %xmm3, %xmm0			; SSE41-NEXT: addss %xmm3, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: addss %xmm2, %xmm0			; SSE41-NEXT: addss %xmm2, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm2[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm2[1,1,3,3]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm2, %xmm1			; SSE41-NEXT: movaps %xmm2, %xmm1
	; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm2[1],xmm1[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm2[1]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]
	; SSE41-NEXT: addss %xmm2, %xmm0			; SSE41-NEXT: addss %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v8f32:			; AVX-LABEL: test_v8f32:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vaddss %xmm1, %xmm0, %xmm0			; AVX-NEXT: vaddss %xmm1, %xmm0, %xmm0
	Show All 40 Lines
	define float @test_v16f32(float %a0, <16 x float> %a1) {			define float @test_v16f32(float %a0, <16 x float> %a1) {
	; SSE2-LABEL: test_v16f32:			; SSE2-LABEL: test_v16f32:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm5			; SSE2-NEXT: movaps %xmm1, %xmm5
	; SSE2-NEXT: shufps {{.*#+}} xmm5 = xmm5[1,1],xmm1[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm5 = xmm5[1,1],xmm1[2,3]
	; SSE2-NEXT: addss %xmm5, %xmm0			; SSE2-NEXT: addss %xmm5, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm5			; SSE2-NEXT: movaps %xmm1, %xmm5
	; SSE2-NEXT: movhlps {{.*#+}} xmm5 = xmm1[1],xmm5[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm5 = xmm5[1],xmm1[1]
	; SSE2-NEXT: addss %xmm5, %xmm0			; SSE2-NEXT: addss %xmm5, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: addss %xmm2, %xmm0			; SSE2-NEXT: addss %xmm2, %xmm0
	; SSE2-NEXT: movaps %xmm2, %xmm1			; SSE2-NEXT: movaps %xmm2, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm2[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm2[2,3]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm2, %xmm1			; SSE2-NEXT: movaps %xmm2, %xmm1
	; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm2[1],xmm1[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm2[1]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]
	; SSE2-NEXT: addss %xmm2, %xmm0			; SSE2-NEXT: addss %xmm2, %xmm0
	; SSE2-NEXT: addss %xmm3, %xmm0			; SSE2-NEXT: addss %xmm3, %xmm0
	; SSE2-NEXT: movaps %xmm3, %xmm1			; SSE2-NEXT: movaps %xmm3, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm3[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm3[2,3]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm3, %xmm1			; SSE2-NEXT: movaps %xmm3, %xmm1
	; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm3[1],xmm1[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm3[1]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]
	; SSE2-NEXT: addss %xmm3, %xmm0			; SSE2-NEXT: addss %xmm3, %xmm0
	; SSE2-NEXT: addss %xmm4, %xmm0			; SSE2-NEXT: addss %xmm4, %xmm0
	; SSE2-NEXT: movaps %xmm4, %xmm1			; SSE2-NEXT: movaps %xmm4, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm4[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm4[2,3]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm4, %xmm1			; SSE2-NEXT: movaps %xmm4, %xmm1
	; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm4[1],xmm1[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm4[1]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm4 = xmm4[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm4 = xmm4[3,1,2,3]
	; SSE2-NEXT: addss %xmm4, %xmm0			; SSE2-NEXT: addss %xmm4, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v16f32:			; SSE41-LABEL: test_v16f32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm5 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm5 = xmm1[1,1,3,3]
	; SSE41-NEXT: addss %xmm5, %xmm0			; SSE41-NEXT: addss %xmm5, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm5			; SSE41-NEXT: movaps %xmm1, %xmm5
	; SSE41-NEXT: movhlps {{.*#+}} xmm5 = xmm1[1],xmm5[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm5 = xmm5[1],xmm1[1]
	; SSE41-NEXT: addss %xmm5, %xmm0			; SSE41-NEXT: addss %xmm5, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: addss %xmm2, %xmm0			; SSE41-NEXT: addss %xmm2, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm2[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm2[1,1,3,3]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm2, %xmm1			; SSE41-NEXT: movaps %xmm2, %xmm1
	; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm2[1],xmm1[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm2[1]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]
	; SSE41-NEXT: addss %xmm2, %xmm0			; SSE41-NEXT: addss %xmm2, %xmm0
	; SSE41-NEXT: addss %xmm3, %xmm0			; SSE41-NEXT: addss %xmm3, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm3[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm3[1,1,3,3]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm3, %xmm1			; SSE41-NEXT: movaps %xmm3, %xmm1
	; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm3[1],xmm1[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm3[1]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]
	; SSE41-NEXT: addss %xmm3, %xmm0			; SSE41-NEXT: addss %xmm3, %xmm0
	; SSE41-NEXT: addss %xmm4, %xmm0			; SSE41-NEXT: addss %xmm4, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm4[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm4[1,1,3,3]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm4, %xmm1			; SSE41-NEXT: movaps %xmm4, %xmm1
	; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm4[1],xmm1[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm4[1]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm4 = xmm4[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm4 = xmm4[3,1,2,3]
	; SSE41-NEXT: addss %xmm4, %xmm0			; SSE41-NEXT: addss %xmm4, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v16f32:			; AVX-LABEL: test_v16f32:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vaddss %xmm1, %xmm0, %xmm0			; AVX-NEXT: vaddss %xmm1, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 112 Lines • ▼ Show 20 Lines
	; SSE2-LABEL: test_v4f32_zero:			; SSE2-LABEL: test_v4f32_zero:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: xorps %xmm1, %xmm1			; SSE2-NEXT: xorps %xmm1, %xmm1
	; SSE2-NEXT: addss %xmm0, %xmm1			; SSE2-NEXT: addss %xmm0, %xmm1
	; SSE2-NEXT: movaps %xmm0, %xmm2			; SSE2-NEXT: movaps %xmm0, %xmm2
	; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1],xmm0[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1],xmm0[2,3]
	; SSE2-NEXT: addss %xmm1, %xmm2			; SSE2-NEXT: addss %xmm1, %xmm2
	; SSE2-NEXT: movaps %xmm0, %xmm1			; SSE2-NEXT: movaps %xmm0, %xmm1
	; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE2-NEXT: addss %xmm2, %xmm1			; SSE2-NEXT: addss %xmm2, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v4f32_zero:			; SSE41-LABEL: test_v4f32_zero:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: xorps %xmm1, %xmm1			; SSE41-NEXT: xorps %xmm1, %xmm1
	; SSE41-NEXT: addss %xmm0, %xmm1			; SSE41-NEXT: addss %xmm0, %xmm1
	; SSE41-NEXT: movshdup {{.*#+}} xmm2 = xmm0[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm2 = xmm0[1,1,3,3]
	; SSE41-NEXT: addss %xmm1, %xmm2			; SSE41-NEXT: addss %xmm1, %xmm2
	; SSE41-NEXT: movaps %xmm0, %xmm1			; SSE41-NEXT: movaps %xmm0, %xmm1
	; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE41-NEXT: addss %xmm2, %xmm1			; SSE41-NEXT: addss %xmm2, %xmm1
	; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v4f32_zero:			; AVX-LABEL: test_v4f32_zero:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vxorps %xmm1, %xmm1, %xmm1			; AVX-NEXT: vxorps %xmm1, %xmm1, %xmm1
	Show All 25 Lines
	; SSE2-LABEL: test_v8f32_zero:			; SSE2-LABEL: test_v8f32_zero:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: xorps %xmm2, %xmm2			; SSE2-NEXT: xorps %xmm2, %xmm2
	; SSE2-NEXT: addss %xmm0, %xmm2			; SSE2-NEXT: addss %xmm0, %xmm2
	; SSE2-NEXT: movaps %xmm0, %xmm3			; SSE2-NEXT: movaps %xmm0, %xmm3
	; SSE2-NEXT: shufps {{.*#+}} xmm3 = xmm3[1,1],xmm0[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm3 = xmm3[1,1],xmm0[2,3]
	; SSE2-NEXT: addss %xmm2, %xmm3			; SSE2-NEXT: addss %xmm2, %xmm3
	; SSE2-NEXT: movaps %xmm0, %xmm2			; SSE2-NEXT: movaps %xmm0, %xmm2
	; SSE2-NEXT: movhlps {{.*#+}} xmm2 = xmm0[1],xmm2[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm0[1]
	; SSE2-NEXT: addss %xmm3, %xmm2			; SSE2-NEXT: addss %xmm3, %xmm2
	; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE2-NEXT: addss %xmm2, %xmm0			; SSE2-NEXT: addss %xmm2, %xmm0
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm2			; SSE2-NEXT: movaps %xmm1, %xmm2
	; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1],xmm1[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1],xmm1[2,3]
	; SSE2-NEXT: addss %xmm2, %xmm0			; SSE2-NEXT: addss %xmm2, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm2			; SSE2-NEXT: movaps %xmm1, %xmm2
	; SSE2-NEXT: movhlps {{.*#+}} xmm2 = xmm1[1],xmm2[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm1[1]
	; SSE2-NEXT: addss %xmm2, %xmm0			; SSE2-NEXT: addss %xmm2, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v8f32_zero:			; SSE41-LABEL: test_v8f32_zero:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: xorps %xmm2, %xmm2			; SSE41-NEXT: xorps %xmm2, %xmm2
	; SSE41-NEXT: addss %xmm0, %xmm2			; SSE41-NEXT: addss %xmm0, %xmm2
	; SSE41-NEXT: movshdup {{.*#+}} xmm3 = xmm0[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm3 = xmm0[1,1,3,3]
	; SSE41-NEXT: addss %xmm2, %xmm3			; SSE41-NEXT: addss %xmm2, %xmm3
	; SSE41-NEXT: movaps %xmm0, %xmm2			; SSE41-NEXT: movaps %xmm0, %xmm2
	; SSE41-NEXT: movhlps {{.*#+}} xmm2 = xmm0[1],xmm2[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm0[1]
	; SSE41-NEXT: addss %xmm3, %xmm2			; SSE41-NEXT: addss %xmm3, %xmm2
	; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE41-NEXT: addss %xmm2, %xmm0			; SSE41-NEXT: addss %xmm2, %xmm0
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm2 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm2 = xmm1[1,1,3,3]
	; SSE41-NEXT: addss %xmm2, %xmm0			; SSE41-NEXT: addss %xmm2, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm2			; SSE41-NEXT: movaps %xmm1, %xmm2
	; SSE41-NEXT: movhlps {{.*#+}} xmm2 = xmm1[1],xmm2[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm1[1]
	; SSE41-NEXT: addss %xmm2, %xmm0			; SSE41-NEXT: addss %xmm2, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v8f32_zero:			; AVX-LABEL: test_v8f32_zero:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vxorps %xmm1, %xmm1, %xmm1			; AVX-NEXT: vxorps %xmm1, %xmm1, %xmm1
	▲ Show 20 Lines • Show All 43 Lines • ▼ Show 20 Lines
	; SSE2-LABEL: test_v16f32_zero:			; SSE2-LABEL: test_v16f32_zero:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: xorps %xmm4, %xmm4			; SSE2-NEXT: xorps %xmm4, %xmm4
	; SSE2-NEXT: addss %xmm0, %xmm4			; SSE2-NEXT: addss %xmm0, %xmm4
	; SSE2-NEXT: movaps %xmm0, %xmm5			; SSE2-NEXT: movaps %xmm0, %xmm5
	; SSE2-NEXT: shufps {{.*#+}} xmm5 = xmm5[1,1],xmm0[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm5 = xmm5[1,1],xmm0[2,3]
	; SSE2-NEXT: addss %xmm4, %xmm5			; SSE2-NEXT: addss %xmm4, %xmm5
	; SSE2-NEXT: movaps %xmm0, %xmm4			; SSE2-NEXT: movaps %xmm0, %xmm4
	; SSE2-NEXT: movhlps {{.*#+}} xmm4 = xmm0[1],xmm4[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm4 = xmm4[1],xmm0[1]
	; SSE2-NEXT: addss %xmm5, %xmm4			; SSE2-NEXT: addss %xmm5, %xmm4
	; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE2-NEXT: addss %xmm4, %xmm0			; SSE2-NEXT: addss %xmm4, %xmm0
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm4			; SSE2-NEXT: movaps %xmm1, %xmm4
	; SSE2-NEXT: shufps {{.*#+}} xmm4 = xmm4[1,1],xmm1[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm4 = xmm4[1,1],xmm1[2,3]
	; SSE2-NEXT: addss %xmm4, %xmm0			; SSE2-NEXT: addss %xmm4, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm4			; SSE2-NEXT: movaps %xmm1, %xmm4
	; SSE2-NEXT: movhlps {{.*#+}} xmm4 = xmm1[1],xmm4[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm4 = xmm4[1],xmm1[1]
	; SSE2-NEXT: addss %xmm4, %xmm0			; SSE2-NEXT: addss %xmm4, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: addss %xmm2, %xmm0			; SSE2-NEXT: addss %xmm2, %xmm0
	; SSE2-NEXT: movaps %xmm2, %xmm1			; SSE2-NEXT: movaps %xmm2, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm2[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm2[2,3]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm2, %xmm1			; SSE2-NEXT: movaps %xmm2, %xmm1
	; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm2[1],xmm1[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm2[1]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]
	; SSE2-NEXT: addss %xmm2, %xmm0			; SSE2-NEXT: addss %xmm2, %xmm0
	; SSE2-NEXT: addss %xmm3, %xmm0			; SSE2-NEXT: addss %xmm3, %xmm0
	; SSE2-NEXT: movaps %xmm3, %xmm1			; SSE2-NEXT: movaps %xmm3, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm3[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm3[2,3]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm3, %xmm1			; SSE2-NEXT: movaps %xmm3, %xmm1
	; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm3[1],xmm1[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm3[1]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]
	; SSE2-NEXT: addss %xmm3, %xmm0			; SSE2-NEXT: addss %xmm3, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v16f32_zero:			; SSE41-LABEL: test_v16f32_zero:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: xorps %xmm4, %xmm4			; SSE41-NEXT: xorps %xmm4, %xmm4
	; SSE41-NEXT: addss %xmm0, %xmm4			; SSE41-NEXT: addss %xmm0, %xmm4
	; SSE41-NEXT: movshdup {{.*#+}} xmm5 = xmm0[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm5 = xmm0[1,1,3,3]
	; SSE41-NEXT: addss %xmm4, %xmm5			; SSE41-NEXT: addss %xmm4, %xmm5
	; SSE41-NEXT: movaps %xmm0, %xmm4			; SSE41-NEXT: movaps %xmm0, %xmm4
	; SSE41-NEXT: movhlps {{.*#+}} xmm4 = xmm0[1],xmm4[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm4 = xmm4[1],xmm0[1]
	; SSE41-NEXT: addss %xmm5, %xmm4			; SSE41-NEXT: addss %xmm5, %xmm4
	; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE41-NEXT: addss %xmm4, %xmm0			; SSE41-NEXT: addss %xmm4, %xmm0
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm4 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm4 = xmm1[1,1,3,3]
	; SSE41-NEXT: addss %xmm4, %xmm0			; SSE41-NEXT: addss %xmm4, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm4			; SSE41-NEXT: movaps %xmm1, %xmm4
	; SSE41-NEXT: movhlps {{.*#+}} xmm4 = xmm1[1],xmm4[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm4 = xmm4[1],xmm1[1]
	; SSE41-NEXT: addss %xmm4, %xmm0			; SSE41-NEXT: addss %xmm4, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: addss %xmm2, %xmm0			; SSE41-NEXT: addss %xmm2, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm2[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm2[1,1,3,3]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm2, %xmm1			; SSE41-NEXT: movaps %xmm2, %xmm1
	; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm2[1],xmm1[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm2[1]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]
	; SSE41-NEXT: addss %xmm2, %xmm0			; SSE41-NEXT: addss %xmm2, %xmm0
	; SSE41-NEXT: addss %xmm3, %xmm0			; SSE41-NEXT: addss %xmm3, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm3[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm3[1,1,3,3]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm3, %xmm1			; SSE41-NEXT: movaps %xmm3, %xmm1
	; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm3[1],xmm1[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm3[1]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]
	; SSE41-NEXT: addss %xmm3, %xmm0			; SSE41-NEXT: addss %xmm3, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v16f32_zero:			; AVX-LABEL: test_v16f32_zero:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vxorps %xmm2, %xmm2, %xmm2			; AVX-NEXT: vxorps %xmm2, %xmm2, %xmm2
	▲ Show 20 Lines • Show All 104 Lines • ▼ Show 20 Lines

	define float @test_v4f32_undef(<4 x float> %a0) {			define float @test_v4f32_undef(<4 x float> %a0) {
	; SSE2-LABEL: test_v4f32_undef:			; SSE2-LABEL: test_v4f32_undef:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movaps %xmm0, %xmm1			; SSE2-NEXT: movaps %xmm0, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]
	; SSE2-NEXT: addss {{.*}}(%rip), %xmm1			; SSE2-NEXT: addss {{.*}}(%rip), %xmm1
	; SSE2-NEXT: movaps %xmm0, %xmm2			; SSE2-NEXT: movaps %xmm0, %xmm2
	; SSE2-NEXT: movhlps {{.*#+}} xmm2 = xmm0[1],xmm2[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm0[1]
	; SSE2-NEXT: addss %xmm1, %xmm2			; SSE2-NEXT: addss %xmm1, %xmm2
	; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE2-NEXT: addss %xmm2, %xmm0			; SSE2-NEXT: addss %xmm2, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v4f32_undef:			; SSE41-LABEL: test_v4f32_undef:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
	; SSE41-NEXT: addss {{.*}}(%rip), %xmm1			; SSE41-NEXT: addss {{.*}}(%rip), %xmm1
	; SSE41-NEXT: movaps %xmm0, %xmm2			; SSE41-NEXT: movaps %xmm0, %xmm2
	; SSE41-NEXT: movhlps {{.*#+}} xmm2 = xmm0[1],xmm2[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm0[1]
	; SSE41-NEXT: addss %xmm1, %xmm2			; SSE41-NEXT: addss %xmm1, %xmm2
	; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE41-NEXT: addss %xmm2, %xmm0			; SSE41-NEXT: addss %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v4f32_undef:			; AVX-LABEL: test_v4f32_undef:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]			; AVX-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
	Show All 19 Lines

	define float @test_v8f32_undef(<8 x float> %a0) {			define float @test_v8f32_undef(<8 x float> %a0) {
	; SSE2-LABEL: test_v8f32_undef:			; SSE2-LABEL: test_v8f32_undef:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movaps %xmm0, %xmm2			; SSE2-NEXT: movaps %xmm0, %xmm2
	; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1],xmm0[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1],xmm0[2,3]
	; SSE2-NEXT: addss {{.*}}(%rip), %xmm2			; SSE2-NEXT: addss {{.*}}(%rip), %xmm2
	; SSE2-NEXT: movaps %xmm0, %xmm3			; SSE2-NEXT: movaps %xmm0, %xmm3
	; SSE2-NEXT: movhlps {{.*#+}} xmm3 = xmm0[1],xmm3[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm3 = xmm3[1],xmm0[1]
	; SSE2-NEXT: addss %xmm2, %xmm3			; SSE2-NEXT: addss %xmm2, %xmm3
	; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE2-NEXT: addss %xmm3, %xmm0			; SSE2-NEXT: addss %xmm3, %xmm0
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm2			; SSE2-NEXT: movaps %xmm1, %xmm2
	; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1],xmm1[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1],xmm1[2,3]
	; SSE2-NEXT: addss %xmm2, %xmm0			; SSE2-NEXT: addss %xmm2, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm2			; SSE2-NEXT: movaps %xmm1, %xmm2
	; SSE2-NEXT: movhlps {{.*#+}} xmm2 = xmm1[1],xmm2[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm1[1]
	; SSE2-NEXT: addss %xmm2, %xmm0			; SSE2-NEXT: addss %xmm2, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v8f32_undef:			; SSE41-LABEL: test_v8f32_undef:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movshdup {{.*#+}} xmm2 = xmm0[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm2 = xmm0[1,1,3,3]
	; SSE41-NEXT: addss {{.*}}(%rip), %xmm2			; SSE41-NEXT: addss {{.*}}(%rip), %xmm2
	; SSE41-NEXT: movaps %xmm0, %xmm3			; SSE41-NEXT: movaps %xmm0, %xmm3
	; SSE41-NEXT: movhlps {{.*#+}} xmm3 = xmm0[1],xmm3[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm3 = xmm3[1],xmm0[1]
	; SSE41-NEXT: addss %xmm2, %xmm3			; SSE41-NEXT: addss %xmm2, %xmm3
	; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE41-NEXT: addss %xmm3, %xmm0			; SSE41-NEXT: addss %xmm3, %xmm0
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm2 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm2 = xmm1[1,1,3,3]
	; SSE41-NEXT: addss %xmm2, %xmm0			; SSE41-NEXT: addss %xmm2, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm2			; SSE41-NEXT: movaps %xmm1, %xmm2
	; SSE41-NEXT: movhlps {{.*#+}} xmm2 = xmm1[1],xmm2[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm1[1]
	; SSE41-NEXT: addss %xmm2, %xmm0			; SSE41-NEXT: addss %xmm2, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v8f32_undef:			; AVX-LABEL: test_v8f32_undef:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]			; AVX-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
	Show All 37 Lines

	define float @test_v16f32_undef(<16 x float> %a0) {			define float @test_v16f32_undef(<16 x float> %a0) {
	; SSE2-LABEL: test_v16f32_undef:			; SSE2-LABEL: test_v16f32_undef:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movaps %xmm0, %xmm4			; SSE2-NEXT: movaps %xmm0, %xmm4
	; SSE2-NEXT: shufps {{.*#+}} xmm4 = xmm4[1,1],xmm0[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm4 = xmm4[1,1],xmm0[2,3]
	; SSE2-NEXT: addss {{.*}}(%rip), %xmm4			; SSE2-NEXT: addss {{.*}}(%rip), %xmm4
	; SSE2-NEXT: movaps %xmm0, %xmm5			; SSE2-NEXT: movaps %xmm0, %xmm5
	; SSE2-NEXT: movhlps {{.*#+}} xmm5 = xmm0[1],xmm5[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm5 = xmm5[1],xmm0[1]
	; SSE2-NEXT: addss %xmm4, %xmm5			; SSE2-NEXT: addss %xmm4, %xmm5
	; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE2-NEXT: addss %xmm5, %xmm0			; SSE2-NEXT: addss %xmm5, %xmm0
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm4			; SSE2-NEXT: movaps %xmm1, %xmm4
	; SSE2-NEXT: shufps {{.*#+}} xmm4 = xmm4[1,1],xmm1[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm4 = xmm4[1,1],xmm1[2,3]
	; SSE2-NEXT: addss %xmm4, %xmm0			; SSE2-NEXT: addss %xmm4, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm4			; SSE2-NEXT: movaps %xmm1, %xmm4
	; SSE2-NEXT: movhlps {{.*#+}} xmm4 = xmm1[1],xmm4[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm4 = xmm4[1],xmm1[1]
	; SSE2-NEXT: addss %xmm4, %xmm0			; SSE2-NEXT: addss %xmm4, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: addss %xmm2, %xmm0			; SSE2-NEXT: addss %xmm2, %xmm0
	; SSE2-NEXT: movaps %xmm2, %xmm1			; SSE2-NEXT: movaps %xmm2, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm2[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm2[2,3]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm2, %xmm1			; SSE2-NEXT: movaps %xmm2, %xmm1
	; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm2[1],xmm1[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm2[1]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]
	; SSE2-NEXT: addss %xmm2, %xmm0			; SSE2-NEXT: addss %xmm2, %xmm0
	; SSE2-NEXT: addss %xmm3, %xmm0			; SSE2-NEXT: addss %xmm3, %xmm0
	; SSE2-NEXT: movaps %xmm3, %xmm1			; SSE2-NEXT: movaps %xmm3, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm3[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm3[2,3]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm3, %xmm1			; SSE2-NEXT: movaps %xmm3, %xmm1
	; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm3[1],xmm1[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm3[1]
	; SSE2-NEXT: addss %xmm1, %xmm0			; SSE2-NEXT: addss %xmm1, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]
	; SSE2-NEXT: addss %xmm3, %xmm0			; SSE2-NEXT: addss %xmm3, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v16f32_undef:			; SSE41-LABEL: test_v16f32_undef:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movshdup {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm4 = xmm0[1,1,3,3]
	; SSE41-NEXT: addss {{.*}}(%rip), %xmm4			; SSE41-NEXT: addss {{.*}}(%rip), %xmm4
	; SSE41-NEXT: movaps %xmm0, %xmm5			; SSE41-NEXT: movaps %xmm0, %xmm5
	; SSE41-NEXT: movhlps {{.*#+}} xmm5 = xmm0[1],xmm5[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm5 = xmm5[1],xmm0[1]
	; SSE41-NEXT: addss %xmm4, %xmm5			; SSE41-NEXT: addss %xmm4, %xmm5
	; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE41-NEXT: addss %xmm5, %xmm0			; SSE41-NEXT: addss %xmm5, %xmm0
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm4 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm4 = xmm1[1,1,3,3]
	; SSE41-NEXT: addss %xmm4, %xmm0			; SSE41-NEXT: addss %xmm4, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm4			; SSE41-NEXT: movaps %xmm1, %xmm4
	; SSE41-NEXT: movhlps {{.*#+}} xmm4 = xmm1[1],xmm4[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm4 = xmm4[1],xmm1[1]
	; SSE41-NEXT: addss %xmm4, %xmm0			; SSE41-NEXT: addss %xmm4, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: addss %xmm2, %xmm0			; SSE41-NEXT: addss %xmm2, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm2[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm2[1,1,3,3]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm2, %xmm1			; SSE41-NEXT: movaps %xmm2, %xmm1
	; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm2[1],xmm1[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm2[1]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]
	; SSE41-NEXT: addss %xmm2, %xmm0			; SSE41-NEXT: addss %xmm2, %xmm0
	; SSE41-NEXT: addss %xmm3, %xmm0			; SSE41-NEXT: addss %xmm3, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm3[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm3[1,1,3,3]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm3, %xmm1			; SSE41-NEXT: movaps %xmm3, %xmm1
	; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm3[1],xmm1[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm3[1]
	; SSE41-NEXT: addss %xmm1, %xmm0			; SSE41-NEXT: addss %xmm1, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]
	; SSE41-NEXT: addss %xmm3, %xmm0			; SSE41-NEXT: addss %xmm3, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v16f32_undef:			; AVX-LABEL: test_v16f32_undef:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmovshdup {{.*#+}} xmm2 = xmm0[1,1,3,3]			; AVX-NEXT: vmovshdup {{.*#+}} xmm2 = xmm0[1,1,3,3]
	▲ Show 20 Lines • Show All 757 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/vector-reduce-fmax-nnan.ll

Show All 37 Lines	; AVX512-NEXT: retq
%1 = call nnan float @llvm.experimental.vector.reduce.fmax.f32.v2f32(<2 x float> %a0)		%1 = call nnan float @llvm.experimental.vector.reduce.fmax.f32.v2f32(<2 x float> %a0)
ret float %1		ret float %1
}		}

define float @test_v4f32(<4 x float> %a0) {		define float @test_v4f32(<4 x float> %a0) {
; SSE2-LABEL: test_v4f32:		; SSE2-LABEL: test_v4f32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: maxps %xmm1, %xmm0		; SSE2-NEXT: maxps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]
; SSE2-NEXT: maxps %xmm1, %xmm0		; SSE2-NEXT: maxps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v4f32:		; SSE41-LABEL: test_v4f32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: maxps %xmm1, %xmm0		; SSE41-NEXT: maxps %xmm1, %xmm0
; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]		; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
; SSE41-NEXT: maxps %xmm1, %xmm0		; SSE41-NEXT: maxps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v4f32:		; AVX-LABEL: test_v4f32:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
Show All 13 Lines	; AVX512-NEXT: retq
ret float %1		ret float %1
}		}

define float @test_v8f32(<8 x float> %a0) {		define float @test_v8f32(<8 x float> %a0) {
; SSE2-LABEL: test_v8f32:		; SSE2-LABEL: test_v8f32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: maxps %xmm1, %xmm0		; SSE2-NEXT: maxps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: maxps %xmm1, %xmm0		; SSE2-NEXT: maxps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]
; SSE2-NEXT: maxps %xmm1, %xmm0		; SSE2-NEXT: maxps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v8f32:		; SSE41-LABEL: test_v8f32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: maxps %xmm1, %xmm0		; SSE41-NEXT: maxps %xmm1, %xmm0
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: maxps %xmm1, %xmm0		; SSE41-NEXT: maxps %xmm1, %xmm0
; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]		; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
; SSE41-NEXT: maxps %xmm1, %xmm0		; SSE41-NEXT: maxps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v8f32:		; AVX-LABEL: test_v8f32:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
Show All 23 Lines

define float @test_v16f32(<16 x float> %a0) {		define float @test_v16f32(<16 x float> %a0) {
; SSE2-LABEL: test_v16f32:		; SSE2-LABEL: test_v16f32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: maxps %xmm3, %xmm1		; SSE2-NEXT: maxps %xmm3, %xmm1
; SSE2-NEXT: maxps %xmm2, %xmm0		; SSE2-NEXT: maxps %xmm2, %xmm0
; SSE2-NEXT: maxps %xmm1, %xmm0		; SSE2-NEXT: maxps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: maxps %xmm1, %xmm0		; SSE2-NEXT: maxps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]
; SSE2-NEXT: maxps %xmm1, %xmm0		; SSE2-NEXT: maxps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v16f32:		; SSE41-LABEL: test_v16f32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: maxps %xmm3, %xmm1		; SSE41-NEXT: maxps %xmm3, %xmm1
; SSE41-NEXT: maxps %xmm2, %xmm0		; SSE41-NEXT: maxps %xmm2, %xmm0
; SSE41-NEXT: maxps %xmm1, %xmm0		; SSE41-NEXT: maxps %xmm1, %xmm0
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: maxps %xmm1, %xmm0		; SSE41-NEXT: maxps %xmm1, %xmm0
; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]		; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
; SSE41-NEXT: maxps %xmm1, %xmm0		; SSE41-NEXT: maxps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v16f32:		; AVX-LABEL: test_v16f32:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vmaxps %ymm1, %ymm0, %ymm0		; AVX-NEXT: vmaxps %ymm1, %ymm0, %ymm0
Show All 26 Lines

;		;
; vXf64		; vXf64
;		;

define double @test_v2f64(<2 x double> %a0) {		define double @test_v2f64(<2 x double> %a0) {
; SSE-LABEL: test_v2f64:		; SSE-LABEL: test_v2f64:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movaps %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: maxpd %xmm1, %xmm0		; SSE-NEXT: maxpd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v2f64:		; AVX-LABEL: test_v2f64:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
; AVX-NEXT: vmaxpd %xmm1, %xmm0, %xmm0		; AVX-NEXT: vmaxpd %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
;		;
; AVX512-LABEL: test_v2f64:		; AVX512-LABEL: test_v2f64:
; AVX512: # %bb.0:		; AVX512: # %bb.0:
; AVX512-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX512-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
; AVX512-NEXT: vmaxpd %xmm1, %xmm0, %xmm0		; AVX512-NEXT: vmaxpd %xmm1, %xmm0, %xmm0
; AVX512-NEXT: retq		; AVX512-NEXT: retq
%1 = call nnan double @llvm.experimental.vector.reduce.fmax.f64.v2f64(<2 x double> %a0)		%1 = call nnan double @llvm.experimental.vector.reduce.fmax.f64.v2f64(<2 x double> %a0)
ret double %1		ret double %1
}		}

define double @test_v4f64(<4 x double> %a0) {		define double @test_v4f64(<4 x double> %a0) {
; SSE-LABEL: test_v4f64:		; SSE-LABEL: test_v4f64:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: maxpd %xmm1, %xmm0		; SSE-NEXT: maxpd %xmm1, %xmm0
; SSE-NEXT: movapd %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: maxpd %xmm1, %xmm0		; SSE-NEXT: maxpd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v4f64:		; AVX-LABEL: test_v4f64:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
; AVX-NEXT: vmaxpd %ymm1, %ymm0, %ymm0		; AVX-NEXT: vmaxpd %ymm1, %ymm0, %ymm0
; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
Show All 17 Lines

define double @test_v8f64(<8 x double> %a0) {		define double @test_v8f64(<8 x double> %a0) {
; SSE-LABEL: test_v8f64:		; SSE-LABEL: test_v8f64:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: maxpd %xmm3, %xmm1		; SSE-NEXT: maxpd %xmm3, %xmm1
; SSE-NEXT: maxpd %xmm2, %xmm0		; SSE-NEXT: maxpd %xmm2, %xmm0
; SSE-NEXT: maxpd %xmm1, %xmm0		; SSE-NEXT: maxpd %xmm1, %xmm0
; SSE-NEXT: movapd %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: maxpd %xmm1, %xmm0		; SSE-NEXT: maxpd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v8f64:		; AVX-LABEL: test_v8f64:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vmaxpd %ymm1, %ymm0, %ymm0		; AVX-NEXT: vmaxpd %ymm1, %ymm0, %ymm0
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
; AVX-NEXT: vmaxpd %ymm1, %ymm0, %ymm0		; AVX-NEXT: vmaxpd %ymm1, %ymm0, %ymm0
Show All 24 Lines
; SSE-NEXT: maxpd %xmm6, %xmm2		; SSE-NEXT: maxpd %xmm6, %xmm2
; SSE-NEXT: maxpd %xmm4, %xmm0		; SSE-NEXT: maxpd %xmm4, %xmm0
; SSE-NEXT: maxpd %xmm2, %xmm0		; SSE-NEXT: maxpd %xmm2, %xmm0
; SSE-NEXT: maxpd %xmm7, %xmm3		; SSE-NEXT: maxpd %xmm7, %xmm3
; SSE-NEXT: maxpd %xmm5, %xmm1		; SSE-NEXT: maxpd %xmm5, %xmm1
; SSE-NEXT: maxpd %xmm3, %xmm1		; SSE-NEXT: maxpd %xmm3, %xmm1
; SSE-NEXT: maxpd %xmm1, %xmm0		; SSE-NEXT: maxpd %xmm1, %xmm0
; SSE-NEXT: movapd %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: maxpd %xmm1, %xmm0		; SSE-NEXT: maxpd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v16f64:		; AVX-LABEL: test_v16f64:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vmaxpd %ymm3, %ymm1, %ymm1		; AVX-NEXT: vmaxpd %ymm3, %ymm1, %ymm1
; AVX-NEXT: vmaxpd %ymm2, %ymm0, %ymm0		; AVX-NEXT: vmaxpd %ymm2, %ymm0, %ymm0
; AVX-NEXT: vmaxpd %ymm1, %ymm0, %ymm0		; AVX-NEXT: vmaxpd %ymm1, %ymm0, %ymm0
Show All 33 Lines

llvm/trunk/test/CodeGen/X86/vector-reduce-fmax.ll

Show All 37 Lines	; AVX512-NEXT: retq
%1 = call float @llvm.experimental.vector.reduce.fmax.f32.v2f32(<2 x float> %a0)		%1 = call float @llvm.experimental.vector.reduce.fmax.f32.v2f32(<2 x float> %a0)
ret float %1		ret float %1
}		}

define float @test_v4f32(<4 x float> %a0) {		define float @test_v4f32(<4 x float> %a0) {
; SSE2-LABEL: test_v4f32:		; SSE2-LABEL: test_v4f32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: maxps %xmm1, %xmm0		; SSE2-NEXT: maxps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]
; SSE2-NEXT: maxps %xmm1, %xmm0		; SSE2-NEXT: maxps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v4f32:		; SSE41-LABEL: test_v4f32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: maxps %xmm1, %xmm0		; SSE41-NEXT: maxps %xmm1, %xmm0
; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]		; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
; SSE41-NEXT: maxps %xmm1, %xmm0		; SSE41-NEXT: maxps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v4f32:		; AVX-LABEL: test_v4f32:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
Show All 13 Lines	; AVX512-NEXT: retq
ret float %1		ret float %1
}		}

define float @test_v8f32(<8 x float> %a0) {		define float @test_v8f32(<8 x float> %a0) {
; SSE2-LABEL: test_v8f32:		; SSE2-LABEL: test_v8f32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: maxps %xmm1, %xmm0		; SSE2-NEXT: maxps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: maxps %xmm1, %xmm0		; SSE2-NEXT: maxps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]
; SSE2-NEXT: maxps %xmm1, %xmm0		; SSE2-NEXT: maxps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v8f32:		; SSE41-LABEL: test_v8f32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: maxps %xmm1, %xmm0		; SSE41-NEXT: maxps %xmm1, %xmm0
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: maxps %xmm1, %xmm0		; SSE41-NEXT: maxps %xmm1, %xmm0
; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]		; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
; SSE41-NEXT: maxps %xmm1, %xmm0		; SSE41-NEXT: maxps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v8f32:		; AVX-LABEL: test_v8f32:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
Show All 23 Lines

define float @test_v16f32(<16 x float> %a0) {		define float @test_v16f32(<16 x float> %a0) {
; SSE2-LABEL: test_v16f32:		; SSE2-LABEL: test_v16f32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: maxps %xmm3, %xmm1		; SSE2-NEXT: maxps %xmm3, %xmm1
; SSE2-NEXT: maxps %xmm2, %xmm0		; SSE2-NEXT: maxps %xmm2, %xmm0
; SSE2-NEXT: maxps %xmm1, %xmm0		; SSE2-NEXT: maxps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: maxps %xmm1, %xmm0		; SSE2-NEXT: maxps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]
; SSE2-NEXT: maxps %xmm1, %xmm0		; SSE2-NEXT: maxps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v16f32:		; SSE41-LABEL: test_v16f32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: maxps %xmm3, %xmm1		; SSE41-NEXT: maxps %xmm3, %xmm1
; SSE41-NEXT: maxps %xmm2, %xmm0		; SSE41-NEXT: maxps %xmm2, %xmm0
; SSE41-NEXT: maxps %xmm1, %xmm0		; SSE41-NEXT: maxps %xmm1, %xmm0
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: maxps %xmm1, %xmm0		; SSE41-NEXT: maxps %xmm1, %xmm0
; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]		; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
; SSE41-NEXT: maxps %xmm1, %xmm0		; SSE41-NEXT: maxps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v16f32:		; AVX-LABEL: test_v16f32:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vmaxps %ymm1, %ymm0, %ymm0		; AVX-NEXT: vmaxps %ymm1, %ymm0, %ymm0
Show All 26 Lines

;		;
; vXf64		; vXf64
;		;

define double @test_v2f64(<2 x double> %a0) {		define double @test_v2f64(<2 x double> %a0) {
; SSE-LABEL: test_v2f64:		; SSE-LABEL: test_v2f64:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movaps %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: maxpd %xmm1, %xmm0		; SSE-NEXT: maxpd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v2f64:		; AVX-LABEL: test_v2f64:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
; AVX-NEXT: vmaxpd %xmm1, %xmm0, %xmm0		; AVX-NEXT: vmaxpd %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
;		;
; AVX512-LABEL: test_v2f64:		; AVX512-LABEL: test_v2f64:
; AVX512: # %bb.0:		; AVX512: # %bb.0:
; AVX512-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX512-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
; AVX512-NEXT: vmaxpd %xmm1, %xmm0, %xmm0		; AVX512-NEXT: vmaxpd %xmm1, %xmm0, %xmm0
; AVX512-NEXT: retq		; AVX512-NEXT: retq
%1 = call double @llvm.experimental.vector.reduce.fmax.f64.v2f64(<2 x double> %a0)		%1 = call double @llvm.experimental.vector.reduce.fmax.f64.v2f64(<2 x double> %a0)
ret double %1		ret double %1
}		}

define double @test_v4f64(<4 x double> %a0) {		define double @test_v4f64(<4 x double> %a0) {
; SSE-LABEL: test_v4f64:		; SSE-LABEL: test_v4f64:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: maxpd %xmm1, %xmm0		; SSE-NEXT: maxpd %xmm1, %xmm0
; SSE-NEXT: movapd %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: maxpd %xmm1, %xmm0		; SSE-NEXT: maxpd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v4f64:		; AVX-LABEL: test_v4f64:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
; AVX-NEXT: vmaxpd %ymm1, %ymm0, %ymm0		; AVX-NEXT: vmaxpd %ymm1, %ymm0, %ymm0
; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
Show All 17 Lines

define double @test_v8f64(<8 x double> %a0) {		define double @test_v8f64(<8 x double> %a0) {
; SSE-LABEL: test_v8f64:		; SSE-LABEL: test_v8f64:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: maxpd %xmm3, %xmm1		; SSE-NEXT: maxpd %xmm3, %xmm1
; SSE-NEXT: maxpd %xmm2, %xmm0		; SSE-NEXT: maxpd %xmm2, %xmm0
; SSE-NEXT: maxpd %xmm1, %xmm0		; SSE-NEXT: maxpd %xmm1, %xmm0
; SSE-NEXT: movapd %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: maxpd %xmm1, %xmm0		; SSE-NEXT: maxpd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v8f64:		; AVX-LABEL: test_v8f64:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vmaxpd %ymm1, %ymm0, %ymm0		; AVX-NEXT: vmaxpd %ymm1, %ymm0, %ymm0
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
; AVX-NEXT: vmaxpd %ymm1, %ymm0, %ymm0		; AVX-NEXT: vmaxpd %ymm1, %ymm0, %ymm0
Show All 24 Lines
; SSE-NEXT: maxpd %xmm6, %xmm2		; SSE-NEXT: maxpd %xmm6, %xmm2
; SSE-NEXT: maxpd %xmm4, %xmm0		; SSE-NEXT: maxpd %xmm4, %xmm0
; SSE-NEXT: maxpd %xmm2, %xmm0		; SSE-NEXT: maxpd %xmm2, %xmm0
; SSE-NEXT: maxpd %xmm7, %xmm3		; SSE-NEXT: maxpd %xmm7, %xmm3
; SSE-NEXT: maxpd %xmm5, %xmm1		; SSE-NEXT: maxpd %xmm5, %xmm1
; SSE-NEXT: maxpd %xmm3, %xmm1		; SSE-NEXT: maxpd %xmm3, %xmm1
; SSE-NEXT: maxpd %xmm1, %xmm0		; SSE-NEXT: maxpd %xmm1, %xmm0
; SSE-NEXT: movapd %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: maxpd %xmm1, %xmm0		; SSE-NEXT: maxpd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v16f64:		; AVX-LABEL: test_v16f64:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vmaxpd %ymm3, %ymm1, %ymm1		; AVX-NEXT: vmaxpd %ymm3, %ymm1, %ymm1
; AVX-NEXT: vmaxpd %ymm2, %ymm0, %ymm0		; AVX-NEXT: vmaxpd %ymm2, %ymm0, %ymm0
; AVX-NEXT: vmaxpd %ymm1, %ymm0, %ymm0		; AVX-NEXT: vmaxpd %ymm1, %ymm0, %ymm0
Show All 33 Lines

llvm/trunk/test/CodeGen/X86/vector-reduce-fmin-nnan.ll

Show All 37 Lines	; AVX512-NEXT: retq
%1 = call nnan float @llvm.experimental.vector.reduce.fmin.f32.v2f32(<2 x float> %a0)		%1 = call nnan float @llvm.experimental.vector.reduce.fmin.f32.v2f32(<2 x float> %a0)
ret float %1		ret float %1
}		}

define float @test_v4f32(<4 x float> %a0) {		define float @test_v4f32(<4 x float> %a0) {
; SSE2-LABEL: test_v4f32:		; SSE2-LABEL: test_v4f32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: minps %xmm1, %xmm0		; SSE2-NEXT: minps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]
; SSE2-NEXT: minps %xmm1, %xmm0		; SSE2-NEXT: minps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v4f32:		; SSE41-LABEL: test_v4f32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: minps %xmm1, %xmm0		; SSE41-NEXT: minps %xmm1, %xmm0
; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]		; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
; SSE41-NEXT: minps %xmm1, %xmm0		; SSE41-NEXT: minps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v4f32:		; AVX-LABEL: test_v4f32:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
Show All 13 Lines	; AVX512-NEXT: retq
ret float %1		ret float %1
}		}

define float @test_v8f32(<8 x float> %a0) {		define float @test_v8f32(<8 x float> %a0) {
; SSE2-LABEL: test_v8f32:		; SSE2-LABEL: test_v8f32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: minps %xmm1, %xmm0		; SSE2-NEXT: minps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: minps %xmm1, %xmm0		; SSE2-NEXT: minps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]
; SSE2-NEXT: minps %xmm1, %xmm0		; SSE2-NEXT: minps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v8f32:		; SSE41-LABEL: test_v8f32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: minps %xmm1, %xmm0		; SSE41-NEXT: minps %xmm1, %xmm0
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: minps %xmm1, %xmm0		; SSE41-NEXT: minps %xmm1, %xmm0
; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]		; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
; SSE41-NEXT: minps %xmm1, %xmm0		; SSE41-NEXT: minps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v8f32:		; AVX-LABEL: test_v8f32:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
Show All 23 Lines

define float @test_v16f32(<16 x float> %a0) {		define float @test_v16f32(<16 x float> %a0) {
; SSE2-LABEL: test_v16f32:		; SSE2-LABEL: test_v16f32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: minps %xmm3, %xmm1		; SSE2-NEXT: minps %xmm3, %xmm1
; SSE2-NEXT: minps %xmm2, %xmm0		; SSE2-NEXT: minps %xmm2, %xmm0
; SSE2-NEXT: minps %xmm1, %xmm0		; SSE2-NEXT: minps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: minps %xmm1, %xmm0		; SSE2-NEXT: minps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]
; SSE2-NEXT: minps %xmm1, %xmm0		; SSE2-NEXT: minps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v16f32:		; SSE41-LABEL: test_v16f32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: minps %xmm3, %xmm1		; SSE41-NEXT: minps %xmm3, %xmm1
; SSE41-NEXT: minps %xmm2, %xmm0		; SSE41-NEXT: minps %xmm2, %xmm0
; SSE41-NEXT: minps %xmm1, %xmm0		; SSE41-NEXT: minps %xmm1, %xmm0
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: minps %xmm1, %xmm0		; SSE41-NEXT: minps %xmm1, %xmm0
; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]		; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
; SSE41-NEXT: minps %xmm1, %xmm0		; SSE41-NEXT: minps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v16f32:		; AVX-LABEL: test_v16f32:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vminps %ymm1, %ymm0, %ymm0		; AVX-NEXT: vminps %ymm1, %ymm0, %ymm0
Show All 26 Lines

;		;
; vXf64		; vXf64
;		;

define double @test_v2f64(<2 x double> %a0) {		define double @test_v2f64(<2 x double> %a0) {
; SSE-LABEL: test_v2f64:		; SSE-LABEL: test_v2f64:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movaps %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: minpd %xmm1, %xmm0		; SSE-NEXT: minpd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v2f64:		; AVX-LABEL: test_v2f64:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
; AVX-NEXT: vminpd %xmm1, %xmm0, %xmm0		; AVX-NEXT: vminpd %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
;		;
; AVX512-LABEL: test_v2f64:		; AVX512-LABEL: test_v2f64:
; AVX512: # %bb.0:		; AVX512: # %bb.0:
; AVX512-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX512-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
; AVX512-NEXT: vminpd %xmm1, %xmm0, %xmm0		; AVX512-NEXT: vminpd %xmm1, %xmm0, %xmm0
; AVX512-NEXT: retq		; AVX512-NEXT: retq
%1 = call nnan double @llvm.experimental.vector.reduce.fmin.f64.v2f64(<2 x double> %a0)		%1 = call nnan double @llvm.experimental.vector.reduce.fmin.f64.v2f64(<2 x double> %a0)
ret double %1		ret double %1
}		}

define double @test_v4f64(<4 x double> %a0) {		define double @test_v4f64(<4 x double> %a0) {
; SSE-LABEL: test_v4f64:		; SSE-LABEL: test_v4f64:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: minpd %xmm1, %xmm0		; SSE-NEXT: minpd %xmm1, %xmm0
; SSE-NEXT: movapd %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: minpd %xmm1, %xmm0		; SSE-NEXT: minpd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v4f64:		; AVX-LABEL: test_v4f64:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
; AVX-NEXT: vminpd %ymm1, %ymm0, %ymm0		; AVX-NEXT: vminpd %ymm1, %ymm0, %ymm0
; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
Show All 17 Lines

define double @test_v8f64(<8 x double> %a0) {		define double @test_v8f64(<8 x double> %a0) {
; SSE-LABEL: test_v8f64:		; SSE-LABEL: test_v8f64:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: minpd %xmm3, %xmm1		; SSE-NEXT: minpd %xmm3, %xmm1
; SSE-NEXT: minpd %xmm2, %xmm0		; SSE-NEXT: minpd %xmm2, %xmm0
; SSE-NEXT: minpd %xmm1, %xmm0		; SSE-NEXT: minpd %xmm1, %xmm0
; SSE-NEXT: movapd %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: minpd %xmm1, %xmm0		; SSE-NEXT: minpd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v8f64:		; AVX-LABEL: test_v8f64:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vminpd %ymm1, %ymm0, %ymm0		; AVX-NEXT: vminpd %ymm1, %ymm0, %ymm0
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
; AVX-NEXT: vminpd %ymm1, %ymm0, %ymm0		; AVX-NEXT: vminpd %ymm1, %ymm0, %ymm0
Show All 24 Lines
; SSE-NEXT: minpd %xmm6, %xmm2		; SSE-NEXT: minpd %xmm6, %xmm2
; SSE-NEXT: minpd %xmm4, %xmm0		; SSE-NEXT: minpd %xmm4, %xmm0
; SSE-NEXT: minpd %xmm2, %xmm0		; SSE-NEXT: minpd %xmm2, %xmm0
; SSE-NEXT: minpd %xmm7, %xmm3		; SSE-NEXT: minpd %xmm7, %xmm3
; SSE-NEXT: minpd %xmm5, %xmm1		; SSE-NEXT: minpd %xmm5, %xmm1
; SSE-NEXT: minpd %xmm3, %xmm1		; SSE-NEXT: minpd %xmm3, %xmm1
; SSE-NEXT: minpd %xmm1, %xmm0		; SSE-NEXT: minpd %xmm1, %xmm0
; SSE-NEXT: movapd %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: minpd %xmm1, %xmm0		; SSE-NEXT: minpd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v16f64:		; AVX-LABEL: test_v16f64:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vminpd %ymm3, %ymm1, %ymm1		; AVX-NEXT: vminpd %ymm3, %ymm1, %ymm1
; AVX-NEXT: vminpd %ymm2, %ymm0, %ymm0		; AVX-NEXT: vminpd %ymm2, %ymm0, %ymm0
; AVX-NEXT: vminpd %ymm1, %ymm0, %ymm0		; AVX-NEXT: vminpd %ymm1, %ymm0, %ymm0
Show All 33 Lines

llvm/trunk/test/CodeGen/X86/vector-reduce-fmin.ll

Show All 37 Lines	; AVX512-NEXT: retq
%1 = call float @llvm.experimental.vector.reduce.fmin.f32.v2f32(<2 x float> %a0)		%1 = call float @llvm.experimental.vector.reduce.fmin.f32.v2f32(<2 x float> %a0)
ret float %1		ret float %1
}		}

define float @test_v4f32(<4 x float> %a0) {		define float @test_v4f32(<4 x float> %a0) {
; SSE2-LABEL: test_v4f32:		; SSE2-LABEL: test_v4f32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: minps %xmm1, %xmm0		; SSE2-NEXT: minps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]
; SSE2-NEXT: minps %xmm1, %xmm0		; SSE2-NEXT: minps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v4f32:		; SSE41-LABEL: test_v4f32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: minps %xmm1, %xmm0		; SSE41-NEXT: minps %xmm1, %xmm0
; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]		; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
; SSE41-NEXT: minps %xmm1, %xmm0		; SSE41-NEXT: minps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v4f32:		; AVX-LABEL: test_v4f32:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
Show All 13 Lines	; AVX512-NEXT: retq
ret float %1		ret float %1
}		}

define float @test_v8f32(<8 x float> %a0) {		define float @test_v8f32(<8 x float> %a0) {
; SSE2-LABEL: test_v8f32:		; SSE2-LABEL: test_v8f32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: minps %xmm1, %xmm0		; SSE2-NEXT: minps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: minps %xmm1, %xmm0		; SSE2-NEXT: minps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]
; SSE2-NEXT: minps %xmm1, %xmm0		; SSE2-NEXT: minps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v8f32:		; SSE41-LABEL: test_v8f32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: minps %xmm1, %xmm0		; SSE41-NEXT: minps %xmm1, %xmm0
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: minps %xmm1, %xmm0		; SSE41-NEXT: minps %xmm1, %xmm0
; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]		; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
; SSE41-NEXT: minps %xmm1, %xmm0		; SSE41-NEXT: minps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v8f32:		; AVX-LABEL: test_v8f32:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
Show All 23 Lines

define float @test_v16f32(<16 x float> %a0) {		define float @test_v16f32(<16 x float> %a0) {
; SSE2-LABEL: test_v16f32:		; SSE2-LABEL: test_v16f32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: minps %xmm3, %xmm1		; SSE2-NEXT: minps %xmm3, %xmm1
; SSE2-NEXT: minps %xmm2, %xmm0		; SSE2-NEXT: minps %xmm2, %xmm0
; SSE2-NEXT: minps %xmm1, %xmm0		; SSE2-NEXT: minps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: minps %xmm1, %xmm0		; SSE2-NEXT: minps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]
; SSE2-NEXT: minps %xmm1, %xmm0		; SSE2-NEXT: minps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v16f32:		; SSE41-LABEL: test_v16f32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: minps %xmm3, %xmm1		; SSE41-NEXT: minps %xmm3, %xmm1
; SSE41-NEXT: minps %xmm2, %xmm0		; SSE41-NEXT: minps %xmm2, %xmm0
; SSE41-NEXT: minps %xmm1, %xmm0		; SSE41-NEXT: minps %xmm1, %xmm0
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: minps %xmm1, %xmm0		; SSE41-NEXT: minps %xmm1, %xmm0
; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]		; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
; SSE41-NEXT: minps %xmm1, %xmm0		; SSE41-NEXT: minps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v16f32:		; AVX-LABEL: test_v16f32:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vminps %ymm1, %ymm0, %ymm0		; AVX-NEXT: vminps %ymm1, %ymm0, %ymm0
Show All 26 Lines

;		;
; vXf64		; vXf64
;		;

define double @test_v2f64(<2 x double> %a0) {		define double @test_v2f64(<2 x double> %a0) {
; SSE-LABEL: test_v2f64:		; SSE-LABEL: test_v2f64:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movaps %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: minpd %xmm1, %xmm0		; SSE-NEXT: minpd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v2f64:		; AVX-LABEL: test_v2f64:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
; AVX-NEXT: vminpd %xmm1, %xmm0, %xmm0		; AVX-NEXT: vminpd %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
;		;
; AVX512-LABEL: test_v2f64:		; AVX512-LABEL: test_v2f64:
; AVX512: # %bb.0:		; AVX512: # %bb.0:
; AVX512-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX512-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
; AVX512-NEXT: vminpd %xmm1, %xmm0, %xmm0		; AVX512-NEXT: vminpd %xmm1, %xmm0, %xmm0
; AVX512-NEXT: retq		; AVX512-NEXT: retq
%1 = call double @llvm.experimental.vector.reduce.fmin.f64.v2f64(<2 x double> %a0)		%1 = call double @llvm.experimental.vector.reduce.fmin.f64.v2f64(<2 x double> %a0)
ret double %1		ret double %1
}		}

define double @test_v4f64(<4 x double> %a0) {		define double @test_v4f64(<4 x double> %a0) {
; SSE-LABEL: test_v4f64:		; SSE-LABEL: test_v4f64:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: minpd %xmm1, %xmm0		; SSE-NEXT: minpd %xmm1, %xmm0
; SSE-NEXT: movapd %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: minpd %xmm1, %xmm0		; SSE-NEXT: minpd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v4f64:		; AVX-LABEL: test_v4f64:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
; AVX-NEXT: vminpd %ymm1, %ymm0, %ymm0		; AVX-NEXT: vminpd %ymm1, %ymm0, %ymm0
; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
Show All 17 Lines

define double @test_v8f64(<8 x double> %a0) {		define double @test_v8f64(<8 x double> %a0) {
; SSE-LABEL: test_v8f64:		; SSE-LABEL: test_v8f64:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: minpd %xmm3, %xmm1		; SSE-NEXT: minpd %xmm3, %xmm1
; SSE-NEXT: minpd %xmm2, %xmm0		; SSE-NEXT: minpd %xmm2, %xmm0
; SSE-NEXT: minpd %xmm1, %xmm0		; SSE-NEXT: minpd %xmm1, %xmm0
; SSE-NEXT: movapd %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: minpd %xmm1, %xmm0		; SSE-NEXT: minpd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v8f64:		; AVX-LABEL: test_v8f64:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vminpd %ymm1, %ymm0, %ymm0		; AVX-NEXT: vminpd %ymm1, %ymm0, %ymm0
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
; AVX-NEXT: vminpd %ymm1, %ymm0, %ymm0		; AVX-NEXT: vminpd %ymm1, %ymm0, %ymm0
Show All 24 Lines
; SSE-NEXT: minpd %xmm6, %xmm2		; SSE-NEXT: minpd %xmm6, %xmm2
; SSE-NEXT: minpd %xmm4, %xmm0		; SSE-NEXT: minpd %xmm4, %xmm0
; SSE-NEXT: minpd %xmm2, %xmm0		; SSE-NEXT: minpd %xmm2, %xmm0
; SSE-NEXT: minpd %xmm7, %xmm3		; SSE-NEXT: minpd %xmm7, %xmm3
; SSE-NEXT: minpd %xmm5, %xmm1		; SSE-NEXT: minpd %xmm5, %xmm1
; SSE-NEXT: minpd %xmm3, %xmm1		; SSE-NEXT: minpd %xmm3, %xmm1
; SSE-NEXT: minpd %xmm1, %xmm0		; SSE-NEXT: minpd %xmm1, %xmm0
; SSE-NEXT: movapd %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: minpd %xmm1, %xmm0		; SSE-NEXT: minpd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v16f64:		; AVX-LABEL: test_v16f64:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vminpd %ymm3, %ymm1, %ymm1		; AVX-NEXT: vminpd %ymm3, %ymm1, %ymm1
; AVX-NEXT: vminpd %ymm2, %ymm0, %ymm0		; AVX-NEXT: vminpd %ymm2, %ymm0, %ymm0
; AVX-NEXT: vminpd %ymm1, %ymm0, %ymm0		; AVX-NEXT: vminpd %ymm1, %ymm0, %ymm0
Show All 33 Lines

llvm/trunk/test/CodeGen/X86/vector-reduce-fmul-fast.ll

Show All 37 Lines	; AVX512-NEXT: retq
%1 = call fast float @llvm.experimental.vector.reduce.fmul.f32.f32.v2f32(float %a0, <2 x float> %a1)		%1 = call fast float @llvm.experimental.vector.reduce.fmul.f32.f32.v2f32(float %a0, <2 x float> %a1)
ret float %1		ret float %1
}		}

define float @test_v4f32(float %a0, <4 x float> %a1) {		define float @test_v4f32(float %a0, <4 x float> %a1) {
; SSE2-LABEL: test_v4f32:		; SSE2-LABEL: test_v4f32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movaps %xmm1, %xmm2		; SSE2-NEXT: movaps %xmm1, %xmm2
; SSE2-NEXT: movhlps {{.*#+}} xmm2 = xmm1[1],xmm2[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm1[1]
; SSE2-NEXT: mulps %xmm1, %xmm2		; SSE2-NEXT: mulps %xmm1, %xmm2
; SSE2-NEXT: movaps %xmm2, %xmm0		; SSE2-NEXT: movaps %xmm2, %xmm0
; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm2[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm2[2,3]
; SSE2-NEXT: mulps %xmm2, %xmm0		; SSE2-NEXT: mulps %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v4f32:		; SSE41-LABEL: test_v4f32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movaps %xmm1, %xmm2		; SSE41-NEXT: movaps %xmm1, %xmm2
; SSE41-NEXT: movhlps {{.*#+}} xmm2 = xmm1[1],xmm2[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm1[1]
; SSE41-NEXT: mulps %xmm1, %xmm2		; SSE41-NEXT: mulps %xmm1, %xmm2
; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm2[1,1,3,3]		; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm2[1,1,3,3]
; SSE41-NEXT: mulps %xmm2, %xmm0		; SSE41-NEXT: mulps %xmm2, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v4f32:		; AVX-LABEL: test_v4f32:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpermilpd {{.*#+}} xmm0 = xmm1[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm0 = xmm1[1,0]
Show All 13 Lines	; AVX512-NEXT: retq
ret float %1		ret float %1
}		}

define float @test_v8f32(float %a0, <8 x float> %a1) {		define float @test_v8f32(float %a0, <8 x float> %a1) {
; SSE2-LABEL: test_v8f32:		; SSE2-LABEL: test_v8f32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: mulps %xmm2, %xmm1		; SSE2-NEXT: mulps %xmm2, %xmm1
; SSE2-NEXT: movaps %xmm1, %xmm2		; SSE2-NEXT: movaps %xmm1, %xmm2
; SSE2-NEXT: movhlps {{.*#+}} xmm2 = xmm1[1],xmm2[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm1[1]
; SSE2-NEXT: mulps %xmm1, %xmm2		; SSE2-NEXT: mulps %xmm1, %xmm2
; SSE2-NEXT: movaps %xmm2, %xmm0		; SSE2-NEXT: movaps %xmm2, %xmm0
; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm2[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm2[2,3]
; SSE2-NEXT: mulps %xmm2, %xmm0		; SSE2-NEXT: mulps %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v8f32:		; SSE41-LABEL: test_v8f32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: mulps %xmm2, %xmm1		; SSE41-NEXT: mulps %xmm2, %xmm1
; SSE41-NEXT: movaps %xmm1, %xmm2		; SSE41-NEXT: movaps %xmm1, %xmm2
; SSE41-NEXT: movhlps {{.*#+}} xmm2 = xmm1[1],xmm2[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm1[1]
; SSE41-NEXT: mulps %xmm1, %xmm2		; SSE41-NEXT: mulps %xmm1, %xmm2
; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm2[1,1,3,3]		; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm2[1,1,3,3]
; SSE41-NEXT: mulps %xmm2, %xmm0		; SSE41-NEXT: mulps %xmm2, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v8f32:		; AVX-LABEL: test_v8f32:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vextractf128 $1, %ymm1, %xmm0		; AVX-NEXT: vextractf128 $1, %ymm1, %xmm0
Show All 23 Lines

define float @test_v16f32(float %a0, <16 x float> %a1) {		define float @test_v16f32(float %a0, <16 x float> %a1) {
; SSE2-LABEL: test_v16f32:		; SSE2-LABEL: test_v16f32:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: mulps %xmm4, %xmm2		; SSE2-NEXT: mulps %xmm4, %xmm2
; SSE2-NEXT: mulps %xmm3, %xmm1		; SSE2-NEXT: mulps %xmm3, %xmm1
; SSE2-NEXT: mulps %xmm2, %xmm1		; SSE2-NEXT: mulps %xmm2, %xmm1
; SSE2-NEXT: movaps %xmm1, %xmm2		; SSE2-NEXT: movaps %xmm1, %xmm2
; SSE2-NEXT: movhlps {{.*#+}} xmm2 = xmm1[1],xmm2[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm1[1]
; SSE2-NEXT: mulps %xmm1, %xmm2		; SSE2-NEXT: mulps %xmm1, %xmm2
; SSE2-NEXT: movaps %xmm2, %xmm0		; SSE2-NEXT: movaps %xmm2, %xmm0
; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm2[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm2[2,3]
; SSE2-NEXT: mulps %xmm2, %xmm0		; SSE2-NEXT: mulps %xmm2, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v16f32:		; SSE41-LABEL: test_v16f32:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: mulps %xmm4, %xmm2		; SSE41-NEXT: mulps %xmm4, %xmm2
; SSE41-NEXT: mulps %xmm3, %xmm1		; SSE41-NEXT: mulps %xmm3, %xmm1
; SSE41-NEXT: mulps %xmm2, %xmm1		; SSE41-NEXT: mulps %xmm2, %xmm1
; SSE41-NEXT: movaps %xmm1, %xmm2		; SSE41-NEXT: movaps %xmm1, %xmm2
; SSE41-NEXT: movhlps {{.*#+}} xmm2 = xmm1[1],xmm2[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm1[1]
; SSE41-NEXT: mulps %xmm1, %xmm2		; SSE41-NEXT: mulps %xmm1, %xmm2
; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm2[1,1,3,3]		; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm2[1,1,3,3]
; SSE41-NEXT: mulps %xmm2, %xmm0		; SSE41-NEXT: mulps %xmm2, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v16f32:		; AVX-LABEL: test_v16f32:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vmulps %ymm2, %ymm1, %ymm0		; AVX-NEXT: vmulps %ymm2, %ymm1, %ymm0
▲ Show 20 Lines • Show All 57 Lines • ▼ Show 20 Lines	; AVX512-NEXT: retq
%1 = call fast float @llvm.experimental.vector.reduce.fmul.f32.f32.v2f32(float 1.0, <2 x float> %a0)		%1 = call fast float @llvm.experimental.vector.reduce.fmul.f32.f32.v2f32(float 1.0, <2 x float> %a0)
ret float %1		ret float %1
}		}

define float @test_v4f32_zero(<4 x float> %a0) {		define float @test_v4f32_zero(<4 x float> %a0) {
; SSE2-LABEL: test_v4f32_zero:		; SSE2-LABEL: test_v4f32_zero:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: mulps %xmm0, %xmm1		; SSE2-NEXT: mulps %xmm0, %xmm1
; SSE2-NEXT: movaps %xmm1, %xmm0		; SSE2-NEXT: movaps %xmm1, %xmm0
; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]
; SSE2-NEXT: mulps %xmm1, %xmm0		; SSE2-NEXT: mulps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v4f32_zero:		; SSE41-LABEL: test_v4f32_zero:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: mulps %xmm0, %xmm1		; SSE41-NEXT: mulps %xmm0, %xmm1
; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]		; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
; SSE41-NEXT: mulps %xmm0, %xmm1		; SSE41-NEXT: mulps %xmm0, %xmm1
; SSE41-NEXT: movaps %xmm1, %xmm0		; SSE41-NEXT: movaps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v4f32_zero:		; AVX-LABEL: test_v4f32_zero:
; AVX: # %bb.0:		; AVX: # %bb.0:
Show All 14 Lines	; AVX512-NEXT: retq
ret float %1		ret float %1
}		}

define float @test_v8f32_zero(<8 x float> %a0) {		define float @test_v8f32_zero(<8 x float> %a0) {
; SSE2-LABEL: test_v8f32_zero:		; SSE2-LABEL: test_v8f32_zero:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: mulps %xmm1, %xmm0		; SSE2-NEXT: mulps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: mulps %xmm0, %xmm1		; SSE2-NEXT: mulps %xmm0, %xmm1
; SSE2-NEXT: movaps %xmm1, %xmm0		; SSE2-NEXT: movaps %xmm1, %xmm0
; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]
; SSE2-NEXT: mulps %xmm1, %xmm0		; SSE2-NEXT: mulps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v8f32_zero:		; SSE41-LABEL: test_v8f32_zero:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: mulps %xmm1, %xmm0		; SSE41-NEXT: mulps %xmm1, %xmm0
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: mulps %xmm0, %xmm1		; SSE41-NEXT: mulps %xmm0, %xmm1
; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]		; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
; SSE41-NEXT: mulps %xmm0, %xmm1		; SSE41-NEXT: mulps %xmm0, %xmm1
; SSE41-NEXT: movaps %xmm1, %xmm0		; SSE41-NEXT: movaps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v8f32_zero:		; AVX-LABEL: test_v8f32_zero:
; AVX: # %bb.0:		; AVX: # %bb.0:
Show All 24 Lines

define float @test_v16f32_zero(<16 x float> %a0) {		define float @test_v16f32_zero(<16 x float> %a0) {
; SSE2-LABEL: test_v16f32_zero:		; SSE2-LABEL: test_v16f32_zero:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: mulps %xmm3, %xmm1		; SSE2-NEXT: mulps %xmm3, %xmm1
; SSE2-NEXT: mulps %xmm2, %xmm0		; SSE2-NEXT: mulps %xmm2, %xmm0
; SSE2-NEXT: mulps %xmm1, %xmm0		; SSE2-NEXT: mulps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: mulps %xmm0, %xmm1		; SSE2-NEXT: mulps %xmm0, %xmm1
; SSE2-NEXT: movaps %xmm1, %xmm0		; SSE2-NEXT: movaps %xmm1, %xmm0
; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]
; SSE2-NEXT: mulps %xmm1, %xmm0		; SSE2-NEXT: mulps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v16f32_zero:		; SSE41-LABEL: test_v16f32_zero:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: mulps %xmm3, %xmm1		; SSE41-NEXT: mulps %xmm3, %xmm1
; SSE41-NEXT: mulps %xmm2, %xmm0		; SSE41-NEXT: mulps %xmm2, %xmm0
; SSE41-NEXT: mulps %xmm1, %xmm0		; SSE41-NEXT: mulps %xmm1, %xmm0
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: mulps %xmm0, %xmm1		; SSE41-NEXT: mulps %xmm0, %xmm1
; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]		; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
; SSE41-NEXT: mulps %xmm0, %xmm1		; SSE41-NEXT: mulps %xmm0, %xmm1
; SSE41-NEXT: movaps %xmm1, %xmm0		; SSE41-NEXT: movaps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v16f32_zero:		; AVX-LABEL: test_v16f32_zero:
; AVX: # %bb.0:		; AVX: # %bb.0:
▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines	; AVX512-NEXT: retq
%1 = call fast float @llvm.experimental.vector.reduce.fmul.f32.f32.v2f32(float undef, <2 x float> %a0)		%1 = call fast float @llvm.experimental.vector.reduce.fmul.f32.f32.v2f32(float undef, <2 x float> %a0)
ret float %1		ret float %1
}		}

define float @test_v4f32_undef(<4 x float> %a0) {		define float @test_v4f32_undef(<4 x float> %a0) {
; SSE2-LABEL: test_v4f32_undef:		; SSE2-LABEL: test_v4f32_undef:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: mulps %xmm0, %xmm1		; SSE2-NEXT: mulps %xmm0, %xmm1
; SSE2-NEXT: movaps %xmm1, %xmm0		; SSE2-NEXT: movaps %xmm1, %xmm0
; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]
; SSE2-NEXT: mulps %xmm1, %xmm0		; SSE2-NEXT: mulps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v4f32_undef:		; SSE41-LABEL: test_v4f32_undef:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: mulps %xmm0, %xmm1		; SSE41-NEXT: mulps %xmm0, %xmm1
; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]		; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
; SSE41-NEXT: mulps %xmm0, %xmm1		; SSE41-NEXT: mulps %xmm0, %xmm1
; SSE41-NEXT: movaps %xmm1, %xmm0		; SSE41-NEXT: movaps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v4f32_undef:		; AVX-LABEL: test_v4f32_undef:
; AVX: # %bb.0:		; AVX: # %bb.0:
Show All 14 Lines	; AVX512-NEXT: retq
ret float %1		ret float %1
}		}

define float @test_v8f32_undef(<8 x float> %a0) {		define float @test_v8f32_undef(<8 x float> %a0) {
; SSE2-LABEL: test_v8f32_undef:		; SSE2-LABEL: test_v8f32_undef:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: mulps %xmm1, %xmm0		; SSE2-NEXT: mulps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: mulps %xmm0, %xmm1		; SSE2-NEXT: mulps %xmm0, %xmm1
; SSE2-NEXT: movaps %xmm1, %xmm0		; SSE2-NEXT: movaps %xmm1, %xmm0
; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]
; SSE2-NEXT: mulps %xmm1, %xmm0		; SSE2-NEXT: mulps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v8f32_undef:		; SSE41-LABEL: test_v8f32_undef:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: mulps %xmm1, %xmm0		; SSE41-NEXT: mulps %xmm1, %xmm0
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: mulps %xmm0, %xmm1		; SSE41-NEXT: mulps %xmm0, %xmm1
; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]		; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
; SSE41-NEXT: mulps %xmm0, %xmm1		; SSE41-NEXT: mulps %xmm0, %xmm1
; SSE41-NEXT: movaps %xmm1, %xmm0		; SSE41-NEXT: movaps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v8f32_undef:		; AVX-LABEL: test_v8f32_undef:
; AVX: # %bb.0:		; AVX: # %bb.0:
Show All 24 Lines

define float @test_v16f32_undef(<16 x float> %a0) {		define float @test_v16f32_undef(<16 x float> %a0) {
; SSE2-LABEL: test_v16f32_undef:		; SSE2-LABEL: test_v16f32_undef:
; SSE2: # %bb.0:		; SSE2: # %bb.0:
; SSE2-NEXT: mulps %xmm3, %xmm1		; SSE2-NEXT: mulps %xmm3, %xmm1
; SSE2-NEXT: mulps %xmm2, %xmm0		; SSE2-NEXT: mulps %xmm2, %xmm0
; SSE2-NEXT: mulps %xmm1, %xmm0		; SSE2-NEXT: mulps %xmm1, %xmm0
; SSE2-NEXT: movaps %xmm0, %xmm1		; SSE2-NEXT: movaps %xmm0, %xmm1
; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE2-NEXT: mulps %xmm0, %xmm1		; SSE2-NEXT: mulps %xmm0, %xmm1
; SSE2-NEXT: movaps %xmm1, %xmm0		; SSE2-NEXT: movaps %xmm1, %xmm0
; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]		; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1],xmm1[2,3]
; SSE2-NEXT: mulps %xmm1, %xmm0		; SSE2-NEXT: mulps %xmm1, %xmm0
; SSE2-NEXT: retq		; SSE2-NEXT: retq
;		;
; SSE41-LABEL: test_v16f32_undef:		; SSE41-LABEL: test_v16f32_undef:
; SSE41: # %bb.0:		; SSE41: # %bb.0:
; SSE41-NEXT: mulps %xmm3, %xmm1		; SSE41-NEXT: mulps %xmm3, %xmm1
; SSE41-NEXT: mulps %xmm2, %xmm0		; SSE41-NEXT: mulps %xmm2, %xmm0
; SSE41-NEXT: mulps %xmm1, %xmm0		; SSE41-NEXT: mulps %xmm1, %xmm0
; SSE41-NEXT: movaps %xmm0, %xmm1		; SSE41-NEXT: movaps %xmm0, %xmm1
; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE41-NEXT: mulps %xmm0, %xmm1		; SSE41-NEXT: mulps %xmm0, %xmm1
; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]		; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm1[1,1,3,3]
; SSE41-NEXT: mulps %xmm0, %xmm1		; SSE41-NEXT: mulps %xmm0, %xmm1
; SSE41-NEXT: movaps %xmm1, %xmm0		; SSE41-NEXT: movaps %xmm1, %xmm0
; SSE41-NEXT: retq		; SSE41-NEXT: retq
;		;
; AVX-LABEL: test_v16f32_undef:		; AVX-LABEL: test_v16f32_undef:
; AVX: # %bb.0:		; AVX: # %bb.0:
Show All 27 Lines

;		;
; vXf64 (accum)		; vXf64 (accum)
;		;

define double @test_v2f64(double %a0, <2 x double> %a1) {		define double @test_v2f64(double %a0, <2 x double> %a1) {
; SSE-LABEL: test_v2f64:		; SSE-LABEL: test_v2f64:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movaps %xmm1, %xmm0		; SSE-NEXT: movapd %xmm1, %xmm0
; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm1[1],xmm0[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1]
; SSE-NEXT: mulpd %xmm1, %xmm0		; SSE-NEXT: mulpd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v2f64:		; AVX-LABEL: test_v2f64:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpermilpd {{.*#+}} xmm0 = xmm1[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm0 = xmm1[1,0]
; AVX-NEXT: vmulpd %xmm0, %xmm1, %xmm0		; AVX-NEXT: vmulpd %xmm0, %xmm1, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
;		;
; AVX512-LABEL: test_v2f64:		; AVX512-LABEL: test_v2f64:
; AVX512: # %bb.0:		; AVX512: # %bb.0:
; AVX512-NEXT: vpermilpd {{.*#+}} xmm0 = xmm1[1,0]		; AVX512-NEXT: vpermilpd {{.*#+}} xmm0 = xmm1[1,0]
; AVX512-NEXT: vmulpd %xmm0, %xmm1, %xmm0		; AVX512-NEXT: vmulpd %xmm0, %xmm1, %xmm0
; AVX512-NEXT: retq		; AVX512-NEXT: retq
%1 = call fast double @llvm.experimental.vector.reduce.fmul.f64.f64.v2f64(double %a0, <2 x double> %a1)		%1 = call fast double @llvm.experimental.vector.reduce.fmul.f64.f64.v2f64(double %a0, <2 x double> %a1)
ret double %1		ret double %1
}		}

define double @test_v4f64(double %a0, <4 x double> %a1) {		define double @test_v4f64(double %a0, <4 x double> %a1) {
; SSE-LABEL: test_v4f64:		; SSE-LABEL: test_v4f64:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: mulpd %xmm2, %xmm1		; SSE-NEXT: mulpd %xmm2, %xmm1
; SSE-NEXT: movapd %xmm1, %xmm0		; SSE-NEXT: movapd %xmm1, %xmm0
; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm1[1],xmm0[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1]
; SSE-NEXT: mulpd %xmm1, %xmm0		; SSE-NEXT: mulpd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v4f64:		; AVX-LABEL: test_v4f64:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vextractf128 $1, %ymm1, %xmm0		; AVX-NEXT: vextractf128 $1, %ymm1, %xmm0
; AVX-NEXT: vmulpd %ymm0, %ymm1, %ymm0		; AVX-NEXT: vmulpd %ymm0, %ymm1, %ymm0
; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
Show All 17 Lines

define double @test_v8f64(double %a0, <8 x double> %a1) {		define double @test_v8f64(double %a0, <8 x double> %a1) {
; SSE-LABEL: test_v8f64:		; SSE-LABEL: test_v8f64:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: mulpd %xmm4, %xmm2		; SSE-NEXT: mulpd %xmm4, %xmm2
; SSE-NEXT: mulpd %xmm3, %xmm1		; SSE-NEXT: mulpd %xmm3, %xmm1
; SSE-NEXT: mulpd %xmm2, %xmm1		; SSE-NEXT: mulpd %xmm2, %xmm1
; SSE-NEXT: movapd %xmm1, %xmm0		; SSE-NEXT: movapd %xmm1, %xmm0
; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm1[1],xmm0[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1]
; SSE-NEXT: mulpd %xmm1, %xmm0		; SSE-NEXT: mulpd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v8f64:		; AVX-LABEL: test_v8f64:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vmulpd %ymm2, %ymm1, %ymm0		; AVX-NEXT: vmulpd %ymm2, %ymm1, %ymm0
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
; AVX-NEXT: vmulpd %ymm1, %ymm0, %ymm0		; AVX-NEXT: vmulpd %ymm1, %ymm0, %ymm0
Show All 24 Lines
; SSE-NEXT: mulpd %xmm6, %xmm2		; SSE-NEXT: mulpd %xmm6, %xmm2
; SSE-NEXT: mulpd %xmm7, %xmm3		; SSE-NEXT: mulpd %xmm7, %xmm3
; SSE-NEXT: mulpd %xmm5, %xmm1		; SSE-NEXT: mulpd %xmm5, %xmm1
; SSE-NEXT: mulpd %xmm3, %xmm1		; SSE-NEXT: mulpd %xmm3, %xmm1
; SSE-NEXT: mulpd {{[0-9]+}}(%rsp), %xmm4		; SSE-NEXT: mulpd {{[0-9]+}}(%rsp), %xmm4
; SSE-NEXT: mulpd %xmm2, %xmm4		; SSE-NEXT: mulpd %xmm2, %xmm4
; SSE-NEXT: mulpd %xmm1, %xmm4		; SSE-NEXT: mulpd %xmm1, %xmm4
; SSE-NEXT: movapd %xmm4, %xmm0		; SSE-NEXT: movapd %xmm4, %xmm0
; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm4[1],xmm0[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm4[1]
; SSE-NEXT: mulpd %xmm4, %xmm0		; SSE-NEXT: mulpd %xmm4, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v16f64:		; AVX-LABEL: test_v16f64:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vmulpd %ymm4, %ymm2, %ymm0		; AVX-NEXT: vmulpd %ymm4, %ymm2, %ymm0
; AVX-NEXT: vmulpd %ymm3, %ymm1, %ymm1		; AVX-NEXT: vmulpd %ymm3, %ymm1, %ymm1
; AVX-NEXT: vmulpd %ymm0, %ymm1, %ymm0		; AVX-NEXT: vmulpd %ymm0, %ymm1, %ymm0
Show All 23 Lines

;		;
; vXf64 (one)		; vXf64 (one)
;		;

define double @test_v2f64_zero(<2 x double> %a0) {		define double @test_v2f64_zero(<2 x double> %a0) {
; SSE-LABEL: test_v2f64_zero:		; SSE-LABEL: test_v2f64_zero:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movaps %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: mulpd %xmm0, %xmm1		; SSE-NEXT: mulpd %xmm0, %xmm1
; SSE-NEXT: movapd %xmm1, %xmm0		; SSE-NEXT: movapd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v2f64_zero:		; AVX-LABEL: test_v2f64_zero:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
; AVX-NEXT: vmulpd %xmm1, %xmm0, %xmm0		; AVX-NEXT: vmulpd %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
;		;
; AVX512-LABEL: test_v2f64_zero:		; AVX512-LABEL: test_v2f64_zero:
; AVX512: # %bb.0:		; AVX512: # %bb.0:
; AVX512-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX512-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
; AVX512-NEXT: vmulpd %xmm1, %xmm0, %xmm0		; AVX512-NEXT: vmulpd %xmm1, %xmm0, %xmm0
; AVX512-NEXT: retq		; AVX512-NEXT: retq
%1 = call fast double @llvm.experimental.vector.reduce.fmul.f64.f64.v2f64(double 1.0, <2 x double> %a0)		%1 = call fast double @llvm.experimental.vector.reduce.fmul.f64.f64.v2f64(double 1.0, <2 x double> %a0)
ret double %1		ret double %1
}		}

define double @test_v4f64_zero(<4 x double> %a0) {		define double @test_v4f64_zero(<4 x double> %a0) {
; SSE-LABEL: test_v4f64_zero:		; SSE-LABEL: test_v4f64_zero:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: mulpd %xmm1, %xmm0		; SSE-NEXT: mulpd %xmm1, %xmm0
; SSE-NEXT: movapd %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: mulpd %xmm0, %xmm1		; SSE-NEXT: mulpd %xmm0, %xmm1
; SSE-NEXT: movapd %xmm1, %xmm0		; SSE-NEXT: movapd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v4f64_zero:		; AVX-LABEL: test_v4f64_zero:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
; AVX-NEXT: vmulpd %ymm1, %ymm0, %ymm0		; AVX-NEXT: vmulpd %ymm1, %ymm0, %ymm0
Show All 18 Lines

define double @test_v8f64_zero(<8 x double> %a0) {		define double @test_v8f64_zero(<8 x double> %a0) {
; SSE-LABEL: test_v8f64_zero:		; SSE-LABEL: test_v8f64_zero:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: mulpd %xmm3, %xmm1		; SSE-NEXT: mulpd %xmm3, %xmm1
; SSE-NEXT: mulpd %xmm2, %xmm0		; SSE-NEXT: mulpd %xmm2, %xmm0
; SSE-NEXT: mulpd %xmm1, %xmm0		; SSE-NEXT: mulpd %xmm1, %xmm0
; SSE-NEXT: movapd %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: mulpd %xmm0, %xmm1		; SSE-NEXT: mulpd %xmm0, %xmm1
; SSE-NEXT: movapd %xmm1, %xmm0		; SSE-NEXT: movapd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v8f64_zero:		; AVX-LABEL: test_v8f64_zero:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vmulpd %ymm1, %ymm0, %ymm0		; AVX-NEXT: vmulpd %ymm1, %ymm0, %ymm0
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
Show All 25 Lines
; SSE-NEXT: mulpd %xmm6, %xmm2		; SSE-NEXT: mulpd %xmm6, %xmm2
; SSE-NEXT: mulpd %xmm4, %xmm0		; SSE-NEXT: mulpd %xmm4, %xmm0
; SSE-NEXT: mulpd %xmm2, %xmm0		; SSE-NEXT: mulpd %xmm2, %xmm0
; SSE-NEXT: mulpd %xmm7, %xmm3		; SSE-NEXT: mulpd %xmm7, %xmm3
; SSE-NEXT: mulpd %xmm5, %xmm1		; SSE-NEXT: mulpd %xmm5, %xmm1
; SSE-NEXT: mulpd %xmm3, %xmm1		; SSE-NEXT: mulpd %xmm3, %xmm1
; SSE-NEXT: mulpd %xmm0, %xmm1		; SSE-NEXT: mulpd %xmm0, %xmm1
; SSE-NEXT: movapd %xmm1, %xmm0		; SSE-NEXT: movapd %xmm1, %xmm0
; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm1[1],xmm0[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1]
; SSE-NEXT: mulpd %xmm1, %xmm0		; SSE-NEXT: mulpd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v16f64_zero:		; AVX-LABEL: test_v16f64_zero:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vmulpd %ymm3, %ymm1, %ymm1		; AVX-NEXT: vmulpd %ymm3, %ymm1, %ymm1
; AVX-NEXT: vmulpd %ymm2, %ymm0, %ymm0		; AVX-NEXT: vmulpd %ymm2, %ymm0, %ymm0
; AVX-NEXT: vmulpd %ymm1, %ymm0, %ymm0		; AVX-NEXT: vmulpd %ymm1, %ymm0, %ymm0
Show All 23 Lines

;		;
; vXf64 (undef)		; vXf64 (undef)
;		;

define double @test_v2f64_undef(<2 x double> %a0) {		define double @test_v2f64_undef(<2 x double> %a0) {
; SSE-LABEL: test_v2f64_undef:		; SSE-LABEL: test_v2f64_undef:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: movaps %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: mulpd %xmm0, %xmm1		; SSE-NEXT: mulpd %xmm0, %xmm1
; SSE-NEXT: movapd %xmm1, %xmm0		; SSE-NEXT: movapd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v2f64_undef:		; AVX-LABEL: test_v2f64_undef:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
; AVX-NEXT: vmulpd %xmm1, %xmm0, %xmm0		; AVX-NEXT: vmulpd %xmm1, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
;		;
; AVX512-LABEL: test_v2f64_undef:		; AVX512-LABEL: test_v2f64_undef:
; AVX512: # %bb.0:		; AVX512: # %bb.0:
; AVX512-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]		; AVX512-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
; AVX512-NEXT: vmulpd %xmm1, %xmm0, %xmm0		; AVX512-NEXT: vmulpd %xmm1, %xmm0, %xmm0
; AVX512-NEXT: retq		; AVX512-NEXT: retq
%1 = call fast double @llvm.experimental.vector.reduce.fmul.f64.f64.v2f64(double undef, <2 x double> %a0)		%1 = call fast double @llvm.experimental.vector.reduce.fmul.f64.f64.v2f64(double undef, <2 x double> %a0)
ret double %1		ret double %1
}		}

define double @test_v4f64_undef(<4 x double> %a0) {		define double @test_v4f64_undef(<4 x double> %a0) {
; SSE-LABEL: test_v4f64_undef:		; SSE-LABEL: test_v4f64_undef:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: mulpd %xmm1, %xmm0		; SSE-NEXT: mulpd %xmm1, %xmm0
; SSE-NEXT: movapd %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: mulpd %xmm0, %xmm1		; SSE-NEXT: mulpd %xmm0, %xmm1
; SSE-NEXT: movapd %xmm1, %xmm0		; SSE-NEXT: movapd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v4f64_undef:		; AVX-LABEL: test_v4f64_undef:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
; AVX-NEXT: vmulpd %ymm1, %ymm0, %ymm0		; AVX-NEXT: vmulpd %ymm1, %ymm0, %ymm0
Show All 18 Lines

define double @test_v8f64_undef(<8 x double> %a0) {		define double @test_v8f64_undef(<8 x double> %a0) {
; SSE-LABEL: test_v8f64_undef:		; SSE-LABEL: test_v8f64_undef:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: mulpd %xmm3, %xmm1		; SSE-NEXT: mulpd %xmm3, %xmm1
; SSE-NEXT: mulpd %xmm2, %xmm0		; SSE-NEXT: mulpd %xmm2, %xmm0
; SSE-NEXT: mulpd %xmm1, %xmm0		; SSE-NEXT: mulpd %xmm1, %xmm0
; SSE-NEXT: movapd %xmm0, %xmm1		; SSE-NEXT: movapd %xmm0, %xmm1
; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
; SSE-NEXT: mulpd %xmm0, %xmm1		; SSE-NEXT: mulpd %xmm0, %xmm1
; SSE-NEXT: movapd %xmm1, %xmm0		; SSE-NEXT: movapd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v8f64_undef:		; AVX-LABEL: test_v8f64_undef:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vmulpd %ymm1, %ymm0, %ymm0		; AVX-NEXT: vmulpd %ymm1, %ymm0, %ymm0
; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1		; AVX-NEXT: vextractf128 $1, %ymm0, %xmm1
Show All 25 Lines
; SSE-NEXT: mulpd %xmm6, %xmm2		; SSE-NEXT: mulpd %xmm6, %xmm2
; SSE-NEXT: mulpd %xmm4, %xmm0		; SSE-NEXT: mulpd %xmm4, %xmm0
; SSE-NEXT: mulpd %xmm2, %xmm0		; SSE-NEXT: mulpd %xmm2, %xmm0
; SSE-NEXT: mulpd %xmm7, %xmm3		; SSE-NEXT: mulpd %xmm7, %xmm3
; SSE-NEXT: mulpd %xmm5, %xmm1		; SSE-NEXT: mulpd %xmm5, %xmm1
; SSE-NEXT: mulpd %xmm3, %xmm1		; SSE-NEXT: mulpd %xmm3, %xmm1
; SSE-NEXT: mulpd %xmm0, %xmm1		; SSE-NEXT: mulpd %xmm0, %xmm1
; SSE-NEXT: movapd %xmm1, %xmm0		; SSE-NEXT: movapd %xmm1, %xmm0
; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm1[1],xmm0[1]		; SSE-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1]
; SSE-NEXT: mulpd %xmm1, %xmm0		; SSE-NEXT: mulpd %xmm1, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX-LABEL: test_v16f64_undef:		; AVX-LABEL: test_v16f64_undef:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vmulpd %ymm3, %ymm1, %ymm1		; AVX-NEXT: vmulpd %ymm3, %ymm1, %ymm1
; AVX-NEXT: vmulpd %ymm2, %ymm0, %ymm0		; AVX-NEXT: vmulpd %ymm2, %ymm0, %ymm0
; AVX-NEXT: vmulpd %ymm1, %ymm0, %ymm0		; AVX-NEXT: vmulpd %ymm1, %ymm0, %ymm0
Show All 33 Lines

llvm/trunk/test/CodeGen/X86/vector-reduce-fmul.ll

	Show First 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	define float @test_v4f32(float %a0, <4 x float> %a1) {			define float @test_v4f32(float %a0, <4 x float> %a1) {
	; SSE2-LABEL: test_v4f32:			; SSE2-LABEL: test_v4f32:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm2			; SSE2-NEXT: movaps %xmm1, %xmm2
	; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1],xmm1[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1],xmm1[2,3]
	; SSE2-NEXT: mulss %xmm2, %xmm0			; SSE2-NEXT: mulss %xmm2, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm2			; SSE2-NEXT: movaps %xmm1, %xmm2
	; SSE2-NEXT: movhlps {{.*#+}} xmm2 = xmm1[1],xmm2[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm1[1]
	; SSE2-NEXT: mulss %xmm2, %xmm0			; SSE2-NEXT: mulss %xmm2, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v4f32:			; SSE41-LABEL: test_v4f32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm2 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm2 = xmm1[1,1,3,3]
	; SSE41-NEXT: mulss %xmm2, %xmm0			; SSE41-NEXT: mulss %xmm2, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm2			; SSE41-NEXT: movaps %xmm1, %xmm2
	; SSE41-NEXT: movhlps {{.*#+}} xmm2 = xmm1[1],xmm2[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm1[1]
	; SSE41-NEXT: mulss %xmm2, %xmm0			; SSE41-NEXT: mulss %xmm2, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v4f32:			; AVX-LABEL: test_v4f32:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmulss %xmm1, %xmm0, %xmm0			; AVX-NEXT: vmulss %xmm1, %xmm0, %xmm0
	Show All 22 Lines
	define float @test_v8f32(float %a0, <8 x float> %a1) {			define float @test_v8f32(float %a0, <8 x float> %a1) {
	; SSE2-LABEL: test_v8f32:			; SSE2-LABEL: test_v8f32:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm3			; SSE2-NEXT: movaps %xmm1, %xmm3
	; SSE2-NEXT: shufps {{.*#+}} xmm3 = xmm3[1,1],xmm1[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm3 = xmm3[1,1],xmm1[2,3]
	; SSE2-NEXT: mulss %xmm3, %xmm0			; SSE2-NEXT: mulss %xmm3, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm3			; SSE2-NEXT: movaps %xmm1, %xmm3
	; SSE2-NEXT: movhlps {{.*#+}} xmm3 = xmm1[1],xmm3[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm3 = xmm3[1],xmm1[1]
	; SSE2-NEXT: mulss %xmm3, %xmm0			; SSE2-NEXT: mulss %xmm3, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: mulss %xmm2, %xmm0			; SSE2-NEXT: mulss %xmm2, %xmm0
	; SSE2-NEXT: movaps %xmm2, %xmm1			; SSE2-NEXT: movaps %xmm2, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm2[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm2[2,3]
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm2, %xmm1			; SSE2-NEXT: movaps %xmm2, %xmm1
	; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm2[1],xmm1[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm2[1]
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]
	; SSE2-NEXT: mulss %xmm2, %xmm0			; SSE2-NEXT: mulss %xmm2, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v8f32:			; SSE41-LABEL: test_v8f32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm3 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm3 = xmm1[1,1,3,3]
	; SSE41-NEXT: mulss %xmm3, %xmm0			; SSE41-NEXT: mulss %xmm3, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm3			; SSE41-NEXT: movaps %xmm1, %xmm3
	; SSE41-NEXT: movhlps {{.*#+}} xmm3 = xmm1[1],xmm3[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm3 = xmm3[1],xmm1[1]
	; SSE41-NEXT: mulss %xmm3, %xmm0			; SSE41-NEXT: mulss %xmm3, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: mulss %xmm2, %xmm0			; SSE41-NEXT: mulss %xmm2, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm2[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm2[1,1,3,3]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm2, %xmm1			; SSE41-NEXT: movaps %xmm2, %xmm1
	; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm2[1],xmm1[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm2[1]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]
	; SSE41-NEXT: mulss %xmm2, %xmm0			; SSE41-NEXT: mulss %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v8f32:			; AVX-LABEL: test_v8f32:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmulss %xmm1, %xmm0, %xmm0			; AVX-NEXT: vmulss %xmm1, %xmm0, %xmm0
	Show All 40 Lines
	define float @test_v16f32(float %a0, <16 x float> %a1) {			define float @test_v16f32(float %a0, <16 x float> %a1) {
	; SSE2-LABEL: test_v16f32:			; SSE2-LABEL: test_v16f32:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm5			; SSE2-NEXT: movaps %xmm1, %xmm5
	; SSE2-NEXT: shufps {{.*#+}} xmm5 = xmm5[1,1],xmm1[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm5 = xmm5[1,1],xmm1[2,3]
	; SSE2-NEXT: mulss %xmm5, %xmm0			; SSE2-NEXT: mulss %xmm5, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm5			; SSE2-NEXT: movaps %xmm1, %xmm5
	; SSE2-NEXT: movhlps {{.*#+}} xmm5 = xmm1[1],xmm5[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm5 = xmm5[1],xmm1[1]
	; SSE2-NEXT: mulss %xmm5, %xmm0			; SSE2-NEXT: mulss %xmm5, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: mulss %xmm2, %xmm0			; SSE2-NEXT: mulss %xmm2, %xmm0
	; SSE2-NEXT: movaps %xmm2, %xmm1			; SSE2-NEXT: movaps %xmm2, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm2[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm2[2,3]
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm2, %xmm1			; SSE2-NEXT: movaps %xmm2, %xmm1
	; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm2[1],xmm1[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm2[1]
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]
	; SSE2-NEXT: mulss %xmm2, %xmm0			; SSE2-NEXT: mulss %xmm2, %xmm0
	; SSE2-NEXT: mulss %xmm3, %xmm0			; SSE2-NEXT: mulss %xmm3, %xmm0
	; SSE2-NEXT: movaps %xmm3, %xmm1			; SSE2-NEXT: movaps %xmm3, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm3[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm3[2,3]
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm3, %xmm1			; SSE2-NEXT: movaps %xmm3, %xmm1
	; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm3[1],xmm1[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm3[1]
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]
	; SSE2-NEXT: mulss %xmm3, %xmm0			; SSE2-NEXT: mulss %xmm3, %xmm0
	; SSE2-NEXT: mulss %xmm4, %xmm0			; SSE2-NEXT: mulss %xmm4, %xmm0
	; SSE2-NEXT: movaps %xmm4, %xmm1			; SSE2-NEXT: movaps %xmm4, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm4[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm4[2,3]
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm4, %xmm1			; SSE2-NEXT: movaps %xmm4, %xmm1
	; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm4[1],xmm1[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm4[1]
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm4 = xmm4[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm4 = xmm4[3,1,2,3]
	; SSE2-NEXT: mulss %xmm4, %xmm0			; SSE2-NEXT: mulss %xmm4, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v16f32:			; SSE41-LABEL: test_v16f32:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm5 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm5 = xmm1[1,1,3,3]
	; SSE41-NEXT: mulss %xmm5, %xmm0			; SSE41-NEXT: mulss %xmm5, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm5			; SSE41-NEXT: movaps %xmm1, %xmm5
	; SSE41-NEXT: movhlps {{.*#+}} xmm5 = xmm1[1],xmm5[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm5 = xmm5[1],xmm1[1]
	; SSE41-NEXT: mulss %xmm5, %xmm0			; SSE41-NEXT: mulss %xmm5, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: mulss %xmm2, %xmm0			; SSE41-NEXT: mulss %xmm2, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm2[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm2[1,1,3,3]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm2, %xmm1			; SSE41-NEXT: movaps %xmm2, %xmm1
	; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm2[1],xmm1[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm2[1]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]
	; SSE41-NEXT: mulss %xmm2, %xmm0			; SSE41-NEXT: mulss %xmm2, %xmm0
	; SSE41-NEXT: mulss %xmm3, %xmm0			; SSE41-NEXT: mulss %xmm3, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm3[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm3[1,1,3,3]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm3, %xmm1			; SSE41-NEXT: movaps %xmm3, %xmm1
	; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm3[1],xmm1[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm3[1]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]
	; SSE41-NEXT: mulss %xmm3, %xmm0			; SSE41-NEXT: mulss %xmm3, %xmm0
	; SSE41-NEXT: mulss %xmm4, %xmm0			; SSE41-NEXT: mulss %xmm4, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm4[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm4[1,1,3,3]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm4, %xmm1			; SSE41-NEXT: movaps %xmm4, %xmm1
	; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm4[1],xmm1[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm4[1]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm4 = xmm4[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm4 = xmm4[3,1,2,3]
	; SSE41-NEXT: mulss %xmm4, %xmm0			; SSE41-NEXT: mulss %xmm4, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v16f32:			; AVX-LABEL: test_v16f32:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmulss %xmm1, %xmm0, %xmm0			; AVX-NEXT: vmulss %xmm1, %xmm0, %xmm0
	▲ Show 20 Lines • Show All 104 Lines • ▼ Show 20 Lines

	define float @test_v4f32_one(<4 x float> %a0) {			define float @test_v4f32_one(<4 x float> %a0) {
	; SSE2-LABEL: test_v4f32_one:			; SSE2-LABEL: test_v4f32_one:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movaps %xmm0, %xmm1			; SSE2-NEXT: movaps %xmm0, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]
	; SSE2-NEXT: mulss %xmm0, %xmm1			; SSE2-NEXT: mulss %xmm0, %xmm1
	; SSE2-NEXT: movaps %xmm0, %xmm2			; SSE2-NEXT: movaps %xmm0, %xmm2
	; SSE2-NEXT: movhlps {{.*#+}} xmm2 = xmm0[1],xmm2[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm0[1]
	; SSE2-NEXT: mulss %xmm1, %xmm2			; SSE2-NEXT: mulss %xmm1, %xmm2
	; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE2-NEXT: mulss %xmm2, %xmm0			; SSE2-NEXT: mulss %xmm2, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v4f32_one:			; SSE41-LABEL: test_v4f32_one:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
	; SSE41-NEXT: mulss %xmm0, %xmm1			; SSE41-NEXT: mulss %xmm0, %xmm1
	; SSE41-NEXT: movaps %xmm0, %xmm2			; SSE41-NEXT: movaps %xmm0, %xmm2
	; SSE41-NEXT: movhlps {{.*#+}} xmm2 = xmm0[1],xmm2[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm0[1]
	; SSE41-NEXT: mulss %xmm1, %xmm2			; SSE41-NEXT: mulss %xmm1, %xmm2
	; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE41-NEXT: mulss %xmm2, %xmm0			; SSE41-NEXT: mulss %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v4f32_one:			; AVX-LABEL: test_v4f32_one:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]			; AVX-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
	Show All 19 Lines

	define float @test_v8f32_one(<8 x float> %a0) {			define float @test_v8f32_one(<8 x float> %a0) {
	; SSE2-LABEL: test_v8f32_one:			; SSE2-LABEL: test_v8f32_one:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movaps %xmm0, %xmm2			; SSE2-NEXT: movaps %xmm0, %xmm2
	; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1],xmm0[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1],xmm0[2,3]
	; SSE2-NEXT: mulss %xmm0, %xmm2			; SSE2-NEXT: mulss %xmm0, %xmm2
	; SSE2-NEXT: movaps %xmm0, %xmm3			; SSE2-NEXT: movaps %xmm0, %xmm3
	; SSE2-NEXT: movhlps {{.*#+}} xmm3 = xmm0[1],xmm3[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm3 = xmm3[1],xmm0[1]
	; SSE2-NEXT: mulss %xmm2, %xmm3			; SSE2-NEXT: mulss %xmm2, %xmm3
	; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE2-NEXT: mulss %xmm3, %xmm0			; SSE2-NEXT: mulss %xmm3, %xmm0
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm2			; SSE2-NEXT: movaps %xmm1, %xmm2
	; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1],xmm1[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1],xmm1[2,3]
	; SSE2-NEXT: mulss %xmm2, %xmm0			; SSE2-NEXT: mulss %xmm2, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm2			; SSE2-NEXT: movaps %xmm1, %xmm2
	; SSE2-NEXT: movhlps {{.*#+}} xmm2 = xmm1[1],xmm2[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm1[1]
	; SSE2-NEXT: mulss %xmm2, %xmm0			; SSE2-NEXT: mulss %xmm2, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v8f32_one:			; SSE41-LABEL: test_v8f32_one:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movshdup {{.*#+}} xmm2 = xmm0[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm2 = xmm0[1,1,3,3]
	; SSE41-NEXT: mulss %xmm0, %xmm2			; SSE41-NEXT: mulss %xmm0, %xmm2
	; SSE41-NEXT: movaps %xmm0, %xmm3			; SSE41-NEXT: movaps %xmm0, %xmm3
	; SSE41-NEXT: movhlps {{.*#+}} xmm3 = xmm0[1],xmm3[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm3 = xmm3[1],xmm0[1]
	; SSE41-NEXT: mulss %xmm2, %xmm3			; SSE41-NEXT: mulss %xmm2, %xmm3
	; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE41-NEXT: mulss %xmm3, %xmm0			; SSE41-NEXT: mulss %xmm3, %xmm0
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm2 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm2 = xmm1[1,1,3,3]
	; SSE41-NEXT: mulss %xmm2, %xmm0			; SSE41-NEXT: mulss %xmm2, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm2			; SSE41-NEXT: movaps %xmm1, %xmm2
	; SSE41-NEXT: movhlps {{.*#+}} xmm2 = xmm1[1],xmm2[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm1[1]
	; SSE41-NEXT: mulss %xmm2, %xmm0			; SSE41-NEXT: mulss %xmm2, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v8f32_one:			; AVX-LABEL: test_v8f32_one:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]			; AVX-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
	Show All 37 Lines

	define float @test_v16f32_one(<16 x float> %a0) {			define float @test_v16f32_one(<16 x float> %a0) {
	; SSE2-LABEL: test_v16f32_one:			; SSE2-LABEL: test_v16f32_one:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movaps %xmm0, %xmm4			; SSE2-NEXT: movaps %xmm0, %xmm4
	; SSE2-NEXT: shufps {{.*#+}} xmm4 = xmm4[1,1],xmm0[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm4 = xmm4[1,1],xmm0[2,3]
	; SSE2-NEXT: mulss %xmm0, %xmm4			; SSE2-NEXT: mulss %xmm0, %xmm4
	; SSE2-NEXT: movaps %xmm0, %xmm5			; SSE2-NEXT: movaps %xmm0, %xmm5
	; SSE2-NEXT: movhlps {{.*#+}} xmm5 = xmm0[1],xmm5[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm5 = xmm5[1],xmm0[1]
	; SSE2-NEXT: mulss %xmm4, %xmm5			; SSE2-NEXT: mulss %xmm4, %xmm5
	; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE2-NEXT: mulss %xmm5, %xmm0			; SSE2-NEXT: mulss %xmm5, %xmm0
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm4			; SSE2-NEXT: movaps %xmm1, %xmm4
	; SSE2-NEXT: shufps {{.*#+}} xmm4 = xmm4[1,1],xmm1[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm4 = xmm4[1,1],xmm1[2,3]
	; SSE2-NEXT: mulss %xmm4, %xmm0			; SSE2-NEXT: mulss %xmm4, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm4			; SSE2-NEXT: movaps %xmm1, %xmm4
	; SSE2-NEXT: movhlps {{.*#+}} xmm4 = xmm1[1],xmm4[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm4 = xmm4[1],xmm1[1]
	; SSE2-NEXT: mulss %xmm4, %xmm0			; SSE2-NEXT: mulss %xmm4, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: mulss %xmm2, %xmm0			; SSE2-NEXT: mulss %xmm2, %xmm0
	; SSE2-NEXT: movaps %xmm2, %xmm1			; SSE2-NEXT: movaps %xmm2, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm2[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm2[2,3]
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm2, %xmm1			; SSE2-NEXT: movaps %xmm2, %xmm1
	; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm2[1],xmm1[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm2[1]
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]
	; SSE2-NEXT: mulss %xmm2, %xmm0			; SSE2-NEXT: mulss %xmm2, %xmm0
	; SSE2-NEXT: mulss %xmm3, %xmm0			; SSE2-NEXT: mulss %xmm3, %xmm0
	; SSE2-NEXT: movaps %xmm3, %xmm1			; SSE2-NEXT: movaps %xmm3, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm3[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm3[2,3]
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm3, %xmm1			; SSE2-NEXT: movaps %xmm3, %xmm1
	; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm3[1],xmm1[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm3[1]
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]
	; SSE2-NEXT: mulss %xmm3, %xmm0			; SSE2-NEXT: mulss %xmm3, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v16f32_one:			; SSE41-LABEL: test_v16f32_one:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movshdup {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm4 = xmm0[1,1,3,3]
	; SSE41-NEXT: mulss %xmm0, %xmm4			; SSE41-NEXT: mulss %xmm0, %xmm4
	; SSE41-NEXT: movaps %xmm0, %xmm5			; SSE41-NEXT: movaps %xmm0, %xmm5
	; SSE41-NEXT: movhlps {{.*#+}} xmm5 = xmm0[1],xmm5[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm5 = xmm5[1],xmm0[1]
	; SSE41-NEXT: mulss %xmm4, %xmm5			; SSE41-NEXT: mulss %xmm4, %xmm5
	; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE41-NEXT: mulss %xmm5, %xmm0			; SSE41-NEXT: mulss %xmm5, %xmm0
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm4 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm4 = xmm1[1,1,3,3]
	; SSE41-NEXT: mulss %xmm4, %xmm0			; SSE41-NEXT: mulss %xmm4, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm4			; SSE41-NEXT: movaps %xmm1, %xmm4
	; SSE41-NEXT: movhlps {{.*#+}} xmm4 = xmm1[1],xmm4[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm4 = xmm4[1],xmm1[1]
	; SSE41-NEXT: mulss %xmm4, %xmm0			; SSE41-NEXT: mulss %xmm4, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: mulss %xmm2, %xmm0			; SSE41-NEXT: mulss %xmm2, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm2[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm2[1,1,3,3]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm2, %xmm1			; SSE41-NEXT: movaps %xmm2, %xmm1
	; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm2[1],xmm1[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm2[1]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]
	; SSE41-NEXT: mulss %xmm2, %xmm0			; SSE41-NEXT: mulss %xmm2, %xmm0
	; SSE41-NEXT: mulss %xmm3, %xmm0			; SSE41-NEXT: mulss %xmm3, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm3[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm3[1,1,3,3]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm3, %xmm1			; SSE41-NEXT: movaps %xmm3, %xmm1
	; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm3[1],xmm1[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm3[1]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]
	; SSE41-NEXT: mulss %xmm3, %xmm0			; SSE41-NEXT: mulss %xmm3, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v16f32_one:			; AVX-LABEL: test_v16f32_one:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmovshdup {{.*#+}} xmm2 = xmm0[1,1,3,3]			; AVX-NEXT: vmovshdup {{.*#+}} xmm2 = xmm0[1,1,3,3]
	▲ Show 20 Lines • Show All 100 Lines • ▼ Show 20 Lines

	define float @test_v4f32_undef(<4 x float> %a0) {			define float @test_v4f32_undef(<4 x float> %a0) {
	; SSE2-LABEL: test_v4f32_undef:			; SSE2-LABEL: test_v4f32_undef:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movaps %xmm0, %xmm1			; SSE2-NEXT: movaps %xmm0, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm0[2,3]
	; SSE2-NEXT: mulss {{.*}}(%rip), %xmm1			; SSE2-NEXT: mulss {{.*}}(%rip), %xmm1
	; SSE2-NEXT: movaps %xmm0, %xmm2			; SSE2-NEXT: movaps %xmm0, %xmm2
	; SSE2-NEXT: movhlps {{.*#+}} xmm2 = xmm0[1],xmm2[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm0[1]
	; SSE2-NEXT: mulss %xmm1, %xmm2			; SSE2-NEXT: mulss %xmm1, %xmm2
	; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE2-NEXT: mulss %xmm2, %xmm0			; SSE2-NEXT: mulss %xmm2, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v4f32_undef:			; SSE41-LABEL: test_v4f32_undef:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
	; SSE41-NEXT: mulss {{.*}}(%rip), %xmm1			; SSE41-NEXT: mulss {{.*}}(%rip), %xmm1
	; SSE41-NEXT: movaps %xmm0, %xmm2			; SSE41-NEXT: movaps %xmm0, %xmm2
	; SSE41-NEXT: movhlps {{.*#+}} xmm2 = xmm0[1],xmm2[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm0[1]
	; SSE41-NEXT: mulss %xmm1, %xmm2			; SSE41-NEXT: mulss %xmm1, %xmm2
	; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE41-NEXT: mulss %xmm2, %xmm0			; SSE41-NEXT: mulss %xmm2, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v4f32_undef:			; AVX-LABEL: test_v4f32_undef:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]			; AVX-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
	Show All 19 Lines

	define float @test_v8f32_undef(<8 x float> %a0) {			define float @test_v8f32_undef(<8 x float> %a0) {
	; SSE2-LABEL: test_v8f32_undef:			; SSE2-LABEL: test_v8f32_undef:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movaps %xmm0, %xmm2			; SSE2-NEXT: movaps %xmm0, %xmm2
	; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1],xmm0[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1],xmm0[2,3]
	; SSE2-NEXT: mulss {{.*}}(%rip), %xmm2			; SSE2-NEXT: mulss {{.*}}(%rip), %xmm2
	; SSE2-NEXT: movaps %xmm0, %xmm3			; SSE2-NEXT: movaps %xmm0, %xmm3
	; SSE2-NEXT: movhlps {{.*#+}} xmm3 = xmm0[1],xmm3[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm3 = xmm3[1],xmm0[1]
	; SSE2-NEXT: mulss %xmm2, %xmm3			; SSE2-NEXT: mulss %xmm2, %xmm3
	; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE2-NEXT: mulss %xmm3, %xmm0			; SSE2-NEXT: mulss %xmm3, %xmm0
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm2			; SSE2-NEXT: movaps %xmm1, %xmm2
	; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1],xmm1[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1],xmm1[2,3]
	; SSE2-NEXT: mulss %xmm2, %xmm0			; SSE2-NEXT: mulss %xmm2, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm2			; SSE2-NEXT: movaps %xmm1, %xmm2
	; SSE2-NEXT: movhlps {{.*#+}} xmm2 = xmm1[1],xmm2[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm1[1]
	; SSE2-NEXT: mulss %xmm2, %xmm0			; SSE2-NEXT: mulss %xmm2, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v8f32_undef:			; SSE41-LABEL: test_v8f32_undef:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movshdup {{.*#+}} xmm2 = xmm0[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm2 = xmm0[1,1,3,3]
	; SSE41-NEXT: mulss {{.*}}(%rip), %xmm2			; SSE41-NEXT: mulss {{.*}}(%rip), %xmm2
	; SSE41-NEXT: movaps %xmm0, %xmm3			; SSE41-NEXT: movaps %xmm0, %xmm3
	; SSE41-NEXT: movhlps {{.*#+}} xmm3 = xmm0[1],xmm3[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm3 = xmm3[1],xmm0[1]
	; SSE41-NEXT: mulss %xmm2, %xmm3			; SSE41-NEXT: mulss %xmm2, %xmm3
	; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE41-NEXT: mulss %xmm3, %xmm0			; SSE41-NEXT: mulss %xmm3, %xmm0
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm2 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm2 = xmm1[1,1,3,3]
	; SSE41-NEXT: mulss %xmm2, %xmm0			; SSE41-NEXT: mulss %xmm2, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm2			; SSE41-NEXT: movaps %xmm1, %xmm2
	; SSE41-NEXT: movhlps {{.*#+}} xmm2 = xmm1[1],xmm2[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm1[1]
	; SSE41-NEXT: mulss %xmm2, %xmm0			; SSE41-NEXT: mulss %xmm2, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v8f32_undef:			; AVX-LABEL: test_v8f32_undef:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]			; AVX-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
	Show All 37 Lines

	define float @test_v16f32_undef(<16 x float> %a0) {			define float @test_v16f32_undef(<16 x float> %a0) {
	; SSE2-LABEL: test_v16f32_undef:			; SSE2-LABEL: test_v16f32_undef:
	; SSE2: # %bb.0:			; SSE2: # %bb.0:
	; SSE2-NEXT: movaps %xmm0, %xmm4			; SSE2-NEXT: movaps %xmm0, %xmm4
	; SSE2-NEXT: shufps {{.*#+}} xmm4 = xmm4[1,1],xmm0[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm4 = xmm4[1,1],xmm0[2,3]
	; SSE2-NEXT: mulss {{.*}}(%rip), %xmm4			; SSE2-NEXT: mulss {{.*}}(%rip), %xmm4
	; SSE2-NEXT: movaps %xmm0, %xmm5			; SSE2-NEXT: movaps %xmm0, %xmm5
	; SSE2-NEXT: movhlps {{.*#+}} xmm5 = xmm0[1],xmm5[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm5 = xmm5[1],xmm0[1]
	; SSE2-NEXT: mulss %xmm4, %xmm5			; SSE2-NEXT: mulss %xmm4, %xmm5
	; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE2-NEXT: mulss %xmm5, %xmm0			; SSE2-NEXT: mulss %xmm5, %xmm0
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm4			; SSE2-NEXT: movaps %xmm1, %xmm4
	; SSE2-NEXT: shufps {{.*#+}} xmm4 = xmm4[1,1],xmm1[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm4 = xmm4[1,1],xmm1[2,3]
	; SSE2-NEXT: mulss %xmm4, %xmm0			; SSE2-NEXT: mulss %xmm4, %xmm0
	; SSE2-NEXT: movaps %xmm1, %xmm4			; SSE2-NEXT: movaps %xmm1, %xmm4
	; SSE2-NEXT: movhlps {{.*#+}} xmm4 = xmm1[1],xmm4[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm4 = xmm4[1],xmm1[1]
	; SSE2-NEXT: mulss %xmm4, %xmm0			; SSE2-NEXT: mulss %xmm4, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: mulss %xmm2, %xmm0			; SSE2-NEXT: mulss %xmm2, %xmm0
	; SSE2-NEXT: movaps %xmm2, %xmm1			; SSE2-NEXT: movaps %xmm2, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm2[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm2[2,3]
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm2, %xmm1			; SSE2-NEXT: movaps %xmm2, %xmm1
	; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm2[1],xmm1[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm2[1]
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]
	; SSE2-NEXT: mulss %xmm2, %xmm0			; SSE2-NEXT: mulss %xmm2, %xmm0
	; SSE2-NEXT: mulss %xmm3, %xmm0			; SSE2-NEXT: mulss %xmm3, %xmm0
	; SSE2-NEXT: movaps %xmm3, %xmm1			; SSE2-NEXT: movaps %xmm3, %xmm1
	; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm3[2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm1 = xmm1[1,1],xmm3[2,3]
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: movaps %xmm3, %xmm1			; SSE2-NEXT: movaps %xmm3, %xmm1
	; SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm3[1],xmm1[1]			; SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm3[1]
	; SSE2-NEXT: mulss %xmm1, %xmm0			; SSE2-NEXT: mulss %xmm1, %xmm0
	; SSE2-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]			; SSE2-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]
	; SSE2-NEXT: mulss %xmm3, %xmm0			; SSE2-NEXT: mulss %xmm3, %xmm0
	; SSE2-NEXT: retq			; SSE2-NEXT: retq
	;			;
	; SSE41-LABEL: test_v16f32_undef:			; SSE41-LABEL: test_v16f32_undef:
	; SSE41: # %bb.0:			; SSE41: # %bb.0:
	; SSE41-NEXT: movshdup {{.*#+}} xmm4 = xmm0[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm4 = xmm0[1,1,3,3]
	; SSE41-NEXT: mulss {{.*}}(%rip), %xmm4			; SSE41-NEXT: mulss {{.*}}(%rip), %xmm4
	; SSE41-NEXT: movaps %xmm0, %xmm5			; SSE41-NEXT: movaps %xmm0, %xmm5
	; SSE41-NEXT: movhlps {{.*#+}} xmm5 = xmm0[1],xmm5[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm5 = xmm5[1],xmm0[1]
	; SSE41-NEXT: mulss %xmm4, %xmm5			; SSE41-NEXT: mulss %xmm4, %xmm5
	; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
	; SSE41-NEXT: mulss %xmm5, %xmm0			; SSE41-NEXT: mulss %xmm5, %xmm0
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm4 = xmm1[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm4 = xmm1[1,1,3,3]
	; SSE41-NEXT: mulss %xmm4, %xmm0			; SSE41-NEXT: mulss %xmm4, %xmm0
	; SSE41-NEXT: movaps %xmm1, %xmm4			; SSE41-NEXT: movaps %xmm1, %xmm4
	; SSE41-NEXT: movhlps {{.*#+}} xmm4 = xmm1[1],xmm4[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm4 = xmm4[1],xmm1[1]
	; SSE41-NEXT: mulss %xmm4, %xmm0			; SSE41-NEXT: mulss %xmm4, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm1 = xmm1[3,1,2,3]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: mulss %xmm2, %xmm0			; SSE41-NEXT: mulss %xmm2, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm2[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm2[1,1,3,3]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm2, %xmm1			; SSE41-NEXT: movaps %xmm2, %xmm1
	; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm2[1],xmm1[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm2[1]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm2 = xmm2[3,1,2,3]
	; SSE41-NEXT: mulss %xmm2, %xmm0			; SSE41-NEXT: mulss %xmm2, %xmm0
	; SSE41-NEXT: mulss %xmm3, %xmm0			; SSE41-NEXT: mulss %xmm3, %xmm0
	; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm3[1,1,3,3]			; SSE41-NEXT: movshdup {{.*#+}} xmm1 = xmm3[1,1,3,3]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: movaps %xmm3, %xmm1			; SSE41-NEXT: movaps %xmm3, %xmm1
	; SSE41-NEXT: movhlps {{.*#+}} xmm1 = xmm3[1],xmm1[1]			; SSE41-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm3[1]
	; SSE41-NEXT: mulss %xmm1, %xmm0			; SSE41-NEXT: mulss %xmm1, %xmm0
	; SSE41-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]			; SSE41-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]
	; SSE41-NEXT: mulss %xmm3, %xmm0			; SSE41-NEXT: mulss %xmm3, %xmm0
	; SSE41-NEXT: retq			; SSE41-NEXT: retq
	;			;
	; AVX-LABEL: test_v16f32_undef:			; AVX-LABEL: test_v16f32_undef:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vmovshdup {{.*#+}} xmm2 = xmm0[1,1,3,3]			; AVX-NEXT: vmovshdup {{.*#+}} xmm2 = xmm0[1,1,3,3]
	▲ Show 20 Lines • Show All 295 Lines • ▼ Show 20 Lines

	;			;
	; vXf64 (one)			; vXf64 (one)
	;			;

	define double @test_v2f64_one(<2 x double> %a0) {			define double @test_v2f64_one(<2 x double> %a0) {
	; SSE-LABEL: test_v2f64_one:			; SSE-LABEL: test_v2f64_one:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movaps %xmm0, %xmm1			; SSE-NEXT: movapd %xmm0, %xmm1
	; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; SSE-NEXT: mulsd %xmm0, %xmm1			; SSE-NEXT: mulsd %xmm0, %xmm1
	; SSE-NEXT: movapd %xmm1, %xmm0			; SSE-NEXT: movapd %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v2f64_one:			; AVX-LABEL: test_v2f64_one:
	; AVX: # %bb.0:			; AVX: # %bb.0:
	; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	; AVX-NEXT: vmulsd %xmm1, %xmm0, %xmm0			; AVX-NEXT: vmulsd %xmm1, %xmm0, %xmm0
	; AVX-NEXT: retq			; AVX-NEXT: retq
	;			;
	; AVX512-LABEL: test_v2f64_one:			; AVX512-LABEL: test_v2f64_one:
	; AVX512: # %bb.0:			; AVX512: # %bb.0:
	; AVX512-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; AVX512-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	; AVX512-NEXT: vmulsd %xmm1, %xmm0, %xmm0			; AVX512-NEXT: vmulsd %xmm1, %xmm0, %xmm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call double @llvm.experimental.vector.reduce.fmul.f64.f64.v2f64(double 1.0, <2 x double> %a0)			%1 = call double @llvm.experimental.vector.reduce.fmul.f64.f64.v2f64(double 1.0, <2 x double> %a0)
	ret double %1			ret double %1
	}			}

	define double @test_v4f64_one(<4 x double> %a0) {			define double @test_v4f64_one(<4 x double> %a0) {
	; SSE-LABEL: test_v4f64_one:			; SSE-LABEL: test_v4f64_one:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movaps %xmm0, %xmm2			; SSE-NEXT: movapd %xmm0, %xmm2
	; SSE-NEXT: movhlps {{.*#+}} xmm2 = xmm0[1],xmm2[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1],xmm0[1]
	; SSE-NEXT: mulsd %xmm0, %xmm2			; SSE-NEXT: mulsd %xmm0, %xmm2
	; SSE-NEXT: mulsd %xmm1, %xmm2			; SSE-NEXT: mulsd %xmm1, %xmm2
	; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1,1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1,1]
	; SSE-NEXT: mulsd %xmm1, %xmm2			; SSE-NEXT: mulsd %xmm1, %xmm2
	; SSE-NEXT: movapd %xmm2, %xmm0			; SSE-NEXT: movapd %xmm2, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: test_v4f64_one:			; AVX-LABEL: test_v4f64_one:
	Show All 19 Lines
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	%1 = call double @llvm.experimental.vector.reduce.fmul.f64.f64.v4f64(double 1.0, <4 x double> %a0)			%1 = call double @llvm.experimental.vector.reduce.fmul.f64.f64.v4f64(double 1.0, <4 x double> %a0)
	ret double %1			ret double %1
	}			}

	define double @test_v8f64_one(<8 x double> %a0) {			define double @test_v8f64_one(<8 x double> %a0) {
	; SSE-LABEL: test_v8f64_one:			; SSE-LABEL: test_v8f64_one:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movaps %xmm0, %xmm4			; SSE-NEXT: movapd %xmm0, %xmm4
	; SSE-NEXT: movhlps {{.*#+}} xmm4 = xmm0[1],xmm4[1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm4 = xmm4[1],xmm0[1]
	; SSE-NEXT: mulsd %xmm0, %xmm4			; SSE-NEXT: mulsd %xmm0, %xmm4
	; SSE-NEXT: mulsd %xmm1, %xmm4			; SSE-NEXT: mulsd %xmm1, %xmm4
	; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1,1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1,1]
	; SSE-NEXT: mulsd %xmm1, %xmm4			; SSE-NEXT: mulsd %xmm1, %xmm4
	; SSE-NEXT: mulsd %xmm2, %xmm4			; SSE-NEXT: mulsd %xmm2, %xmm4
	; SSE-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1,1]			; SSE-NEXT: unpckhpd {{.*#+}} xmm2 = xmm2[1,1]
	; SSE-NEXT: mulsd %xmm2, %xmm4			; SSE-NEXT: mulsd %xmm2, %xmm4
	; SSE-NEXT: mulsd %xmm3, %xmm4			; SSE-NEXT: mulsd %xmm3, %xmm4
	▲ Show 20 Lines • Show All 366 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/widen_conv-3.ll

	Show First 20 Lines • Show All 68 Lines • ▼ Show 20 Lines
	; X86-SSE2-NEXT: movd %esi, %xmm0			; X86-SSE2-NEXT: movd %esi, %xmm0
	; X86-SSE2-NEXT: pinsrw $1, %ecx, %xmm0			; X86-SSE2-NEXT: pinsrw $1, %ecx, %xmm0
	; X86-SSE2-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]			; X86-SSE2-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
	; X86-SSE2-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0,0,1,1,2,2,3,3]			; X86-SSE2-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0,0,1,1,2,2,3,3]
	; X86-SSE2-NEXT: psrad $24, %xmm0			; X86-SSE2-NEXT: psrad $24, %xmm0
	; X86-SSE2-NEXT: cvtdq2ps %xmm0, %xmm0			; X86-SSE2-NEXT: cvtdq2ps %xmm0, %xmm0
	; X86-SSE2-NEXT: movss %xmm0, (%eax)			; X86-SSE2-NEXT: movss %xmm0, (%eax)
	; X86-SSE2-NEXT: movaps %xmm0, %xmm1			; X86-SSE2-NEXT: movaps %xmm0, %xmm1
	; X86-SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]			; X86-SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; X86-SSE2-NEXT: movss %xmm1, 8(%eax)			; X86-SSE2-NEXT: movss %xmm1, 8(%eax)
	; X86-SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1,2,3]			; X86-SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1,2,3]
	; X86-SSE2-NEXT: movss %xmm0, 4(%eax)			; X86-SSE2-NEXT: movss %xmm0, 4(%eax)
	; X86-SSE2-NEXT: leal -4(%ebp), %esp			; X86-SSE2-NEXT: leal -4(%ebp), %esp
	; X86-SSE2-NEXT: popl %esi			; X86-SSE2-NEXT: popl %esi
	; X86-SSE2-NEXT: popl %ebp			; X86-SSE2-NEXT: popl %ebp
	; X86-SSE2-NEXT: retl			; X86-SSE2-NEXT: retl
	;			;
	▲ Show 20 Lines • Show All 61 Lines • Show Last 20 Lines

llvm/trunk/test/CodeGen/X86/widen_conv-4.ll

	Show All 13 Lines
	; X86-SSE2-NEXT: movdqa %xmm0, %xmm2			; X86-SSE2-NEXT: movdqa %xmm0, %xmm2
	; X86-SSE2-NEXT: punpckhwd {{.*#+}} xmm2 = xmm2[4],xmm1[4],xmm2[5],xmm1[5],xmm2[6],xmm1[6],xmm2[7],xmm1[7]			; X86-SSE2-NEXT: punpckhwd {{.*#+}} xmm2 = xmm2[4],xmm1[4],xmm2[5],xmm1[5],xmm2[6],xmm1[6],xmm2[7],xmm1[7]
	; X86-SSE2-NEXT: cvtdq2ps %xmm2, %xmm2			; X86-SSE2-NEXT: cvtdq2ps %xmm2, %xmm2
	; X86-SSE2-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3]			; X86-SSE2-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3]
	; X86-SSE2-NEXT: cvtdq2ps %xmm0, %xmm0			; X86-SSE2-NEXT: cvtdq2ps %xmm0, %xmm0
	; X86-SSE2-NEXT: movups %xmm0, (%eax)			; X86-SSE2-NEXT: movups %xmm0, (%eax)
	; X86-SSE2-NEXT: movss %xmm2, 16(%eax)			; X86-SSE2-NEXT: movss %xmm2, 16(%eax)
	; X86-SSE2-NEXT: movaps %xmm2, %xmm0			; X86-SSE2-NEXT: movaps %xmm2, %xmm0
	; X86-SSE2-NEXT: movhlps {{.*#+}} xmm0 = xmm2[1],xmm0[1]			; X86-SSE2-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm2[1]
	; X86-SSE2-NEXT: movss %xmm0, 24(%eax)			; X86-SSE2-NEXT: movss %xmm0, 24(%eax)
	; X86-SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1,2,3]			; X86-SSE2-NEXT: shufps {{.*#+}} xmm2 = xmm2[1,1,2,3]
	; X86-SSE2-NEXT: movss %xmm2, 20(%eax)			; X86-SSE2-NEXT: movss %xmm2, 20(%eax)
	; X86-SSE2-NEXT: retl			; X86-SSE2-NEXT: retl
	;			;
	; X86-SSE42-LABEL: convert_v7i16_v7f32:			; X86-SSE42-LABEL: convert_v7i16_v7f32:
	; X86-SSE42: # %bb.0: # %entry			; X86-SSE42: # %bb.0: # %entry
	; X86-SSE42-NEXT: movl {{[0-9]+}}(%esp), %eax			; X86-SSE42-NEXT: movl {{[0-9]+}}(%esp), %eax
	▲ Show 20 Lines • Show All 64 Lines • ▼ Show 20 Lines
	; X86-SSE2-NEXT: movd %esi, %xmm0			; X86-SSE2-NEXT: movd %esi, %xmm0
	; X86-SSE2-NEXT: pinsrw $1, %ecx, %xmm0			; X86-SSE2-NEXT: pinsrw $1, %ecx, %xmm0
	; X86-SSE2-NEXT: pxor %xmm1, %xmm1			; X86-SSE2-NEXT: pxor %xmm1, %xmm1
	; X86-SSE2-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3],xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7]			; X86-SSE2-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3],xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7]
	; X86-SSE2-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3]			; X86-SSE2-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3]
	; X86-SSE2-NEXT: cvtdq2ps %xmm0, %xmm0			; X86-SSE2-NEXT: cvtdq2ps %xmm0, %xmm0
	; X86-SSE2-NEXT: movss %xmm0, (%eax)			; X86-SSE2-NEXT: movss %xmm0, (%eax)
	; X86-SSE2-NEXT: movaps %xmm0, %xmm1			; X86-SSE2-NEXT: movaps %xmm0, %xmm1
	; X86-SSE2-NEXT: movhlps {{.*#+}} xmm1 = xmm0[1],xmm1[1]			; X86-SSE2-NEXT: unpckhpd {{.*#+}} xmm1 = xmm1[1],xmm0[1]
	; X86-SSE2-NEXT: movss %xmm1, 8(%eax)			; X86-SSE2-NEXT: movss %xmm1, 8(%eax)
	; X86-SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1,2,3]			; X86-SSE2-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1,2,3]
	; X86-SSE2-NEXT: movss %xmm0, 4(%eax)			; X86-SSE2-NEXT: movss %xmm0, 4(%eax)
	; X86-SSE2-NEXT: leal -4(%ebp), %esp			; X86-SSE2-NEXT: leal -4(%ebp), %esp
	; X86-SSE2-NEXT: popl %esi			; X86-SSE2-NEXT: popl %esi
	; X86-SSE2-NEXT: popl %ebp			; X86-SSE2-NEXT: popl %ebp
	; X86-SSE2-NEXT: retl			; X86-SSE2-NEXT: retl
	;			;
	▲ Show 20 Lines • Show All 59 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Prefer unpckhpd over movhlps in isel for fake unary cases
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 164934

llvm/trunk/lib/Target/X86/X86InstrSSE.td

llvm/trunk/test/CodeGen/X86/buildvec-insertvec.ll

llvm/trunk/test/CodeGen/X86/combine-fcopysign.ll

llvm/trunk/test/CodeGen/X86/complex-fastmath.ll

llvm/trunk/test/CodeGen/X86/ftrunc.ll

llvm/trunk/test/CodeGen/X86/haddsub-2.ll

llvm/trunk/test/CodeGen/X86/haddsub-3.ll

llvm/trunk/test/CodeGen/X86/haddsub-undef.ll

llvm/trunk/test/CodeGen/X86/pr11334.ll

llvm/trunk/test/CodeGen/X86/sse3-avx-addsub-2.ll

llvm/trunk/test/CodeGen/X86/vec_fp_to_int.ll

llvm/trunk/test/CodeGen/X86/vector-constrained-fp-intrinsics.ll

llvm/trunk/test/CodeGen/X86/vector-reduce-fadd-fast.ll

llvm/trunk/test/CodeGen/X86/vector-reduce-fadd.ll

llvm/trunk/test/CodeGen/X86/vector-reduce-fmax-nnan.ll

llvm/trunk/test/CodeGen/X86/vector-reduce-fmax.ll

llvm/trunk/test/CodeGen/X86/vector-reduce-fmin-nnan.ll

llvm/trunk/test/CodeGen/X86/vector-reduce-fmin.ll

llvm/trunk/test/CodeGen/X86/vector-reduce-fmul-fast.ll

llvm/trunk/test/CodeGen/X86/vector-reduce-fmul.ll

llvm/trunk/test/CodeGen/X86/widen_conv-3.ll

llvm/trunk/test/CodeGen/X86/widen_conv-4.ll

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Prefer unpckhpd over movhlps in isel for fake unary casesClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 164934

llvm/trunk/lib/Target/X86/X86InstrSSE.td

llvm/trunk/test/CodeGen/X86/buildvec-insertvec.ll

llvm/trunk/test/CodeGen/X86/combine-fcopysign.ll

llvm/trunk/test/CodeGen/X86/complex-fastmath.ll

llvm/trunk/test/CodeGen/X86/ftrunc.ll

llvm/trunk/test/CodeGen/X86/haddsub-2.ll

llvm/trunk/test/CodeGen/X86/haddsub-3.ll

llvm/trunk/test/CodeGen/X86/haddsub-undef.ll

llvm/trunk/test/CodeGen/X86/pr11334.ll

llvm/trunk/test/CodeGen/X86/sse3-avx-addsub-2.ll

llvm/trunk/test/CodeGen/X86/vec_fp_to_int.ll

llvm/trunk/test/CodeGen/X86/vector-constrained-fp-intrinsics.ll

llvm/trunk/test/CodeGen/X86/vector-reduce-fadd-fast.ll

llvm/trunk/test/CodeGen/X86/vector-reduce-fadd.ll

llvm/trunk/test/CodeGen/X86/vector-reduce-fmax-nnan.ll

llvm/trunk/test/CodeGen/X86/vector-reduce-fmax.ll

llvm/trunk/test/CodeGen/X86/vector-reduce-fmin-nnan.ll

llvm/trunk/test/CodeGen/X86/vector-reduce-fmin.ll

llvm/trunk/test/CodeGen/X86/vector-reduce-fmul-fast.ll

llvm/trunk/test/CodeGen/X86/vector-reduce-fmul.ll

llvm/trunk/test/CodeGen/X86/widen_conv-3.ll

llvm/trunk/test/CodeGen/X86/widen_conv-4.ll

[X86] Prefer unpckhpd over movhlps in isel for fake unary cases
ClosedPublic