Diff 96347

lib/Target/X86/X86InstrSSE.td

This file is larger than 256 KB, so syntax highlighting is disabled by default.

	Show First 20 Lines • Show All 480 Lines • ▼ Show 20 Lines
	}			}

	// We set canFoldAsLoad because this can be converted to a constant-pool			// We set canFoldAsLoad because this can be converted to a constant-pool
	// load of an all-ones value if folding it would be beneficial.			// load of an all-ones value if folding it would be beneficial.
	let isReMaterializable = 1, isAsCheapAsAMove = 1, canFoldAsLoad = 1,			let isReMaterializable = 1, isAsCheapAsAMove = 1, canFoldAsLoad = 1,
	isPseudo = 1, SchedRW = [WriteZero] in {			isPseudo = 1, SchedRW = [WriteZero] in {
	def V_SETALLONES : I<0, Pseudo, (outs VR128:$dst), (ins), "",			def V_SETALLONES : I<0, Pseudo, (outs VR128:$dst), (ins), "",
	[(set VR128:$dst, (v4i32 immAllOnesV))]>;			[(set VR128:$dst, (v4i32 immAllOnesV))]>;
	let Predicates = [HasAVX2] in			let Predicates = [HasAVX2] in
				spatelUnsubmitted Not Done Reply Inline Actions Should this be "OptForMinSize"? Ie, I was just looking at some other code patterns, and we are inserting xorps/xorpd even at -Os. In fact, we're doing that even at -Oz which I think is a mistake. spatel: Should this be "OptForMinSize"? Ie, I was just looking at some other code patterns, and we are…
				spatelUnsubmitted Not Done Reply Inline Actions After thinking about this again, I'm now wondering why we would make the zero reg input a part of the patterns here. Are there any other td patterns that do this? For the most part, I think we handle the xor generation using ExecutionDepsFix. spatel: After thinking about this again, I'm now wondering why we would make the zero reg input a part…
	def AVX2_SETALLONES : I<0, Pseudo, (outs VR256:$dst), (ins), "",			def AVX2_SETALLONES : I<0, Pseudo, (outs VR256:$dst), (ins), "",
	[(set VR256:$dst, (v8i32 immAllOnesV))]>;			[(set VR256:$dst, (v8i32 immAllOnesV))]>;
	}			}

	//===----------------------------------------------------------------------===//			//===----------------------------------------------------------------------===//
	// SSE 1 & 2 - Move FP Scalar Instructions			// SSE 1 & 2 - Move FP Scalar Instructions
	//			//
	// Move Instructions. Register-to-register movss/movsd is not used for FR32/64			// Move Instructions. Register-to-register movss/movsd is not used for FR32/64
	▲ Show 20 Lines • Show All 7,248 Lines • ▼ Show 20 Lines
	let mayLoad = 1 in			let mayLoad = 1 in
	def VINSERTF128rm : AVXAIi8<0x18, MRMSrcMem, (outs VR256:$dst),			def VINSERTF128rm : AVXAIi8<0x18, MRMSrcMem, (outs VR256:$dst),
	(ins VR256:$src1, f128mem:$src2, u8imm:$src3),			(ins VR256:$src1, f128mem:$src2, u8imm:$src3),
	"vinsertf128\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",			"vinsertf128\t{$src3, $src2, $src1, $dst\|$dst, $src1, $src2, $src3}",
	[]>, Sched<[WriteFShuffleLd, ReadAfterLd]>, VEX_4V, VEX_L;			[]>, Sched<[WriteFShuffleLd, ReadAfterLd]>, VEX_4V, VEX_L;
	}			}


	// Without AVX2 we need to concat two v4i32 V_SETALLONES to create a 256-bit			// Without AVX2 we need to concat two v4i32 V_SETALLONES to create a 256-bit
	// all ones value.			// all ones value.
				spatelUnsubmitted Not Done Reply Inline Actions This comment should be updated to match the new code. Is it correct that this pattern won't apply to most integer code for an AVX target because that would already be legalized to v4i32/v2i64? If that's true, I think it's also worth mentioning here. I'm imagining cases like this: define <8 x i32> @cmpeq_v8i32(<8 x i32> %a) nounwind { %cmp = icmp eq <8 x i32> %a, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1> %res = sext <8 x i1> %cmp to <8 x i32> ret <8 x i32> %res } define <8 x i32> @cmpne_v8i32(<8 x i32> %a) nounwind { %cmp = icmp ne <8 x i32> %a, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1> %res = sext <8 x i1> %cmp to <8 x i32> ret <8 x i32> %res } define <8 x i32> @sub1_v8i32(<8 x i32> %a) nounwind { %add = add <8 x i32> %a, <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1> ret <8 x i32> %add } spatel: This comment should be updated to match the new code. Is it correct that this pattern won't…
				RKSimonUnsubmitted Not Done Reply Inline Actions This comment should be updated to match the new code. +1 RKSimon: > This comment should be updated to match the new code. +1
	let Predicates = [HasAVX1Only] in			let Predicates = [HasAVX1Only] in
				spatelUnsubmitted Not Done Reply Inline Actions I'd add a little more explanation here just to make it clearer: "To create a 256-bit all ones value, we use VCMPTRUEPS and zero out the fake register operand to avoid false dependencies." spatel: I'd add a little more explanation here just to make it clearer: "To create a 256-bit all ones…
	def : Pat<(v8i32 immAllOnesV),			def : Pat<(v8i32 immAllOnesV),
	(VINSERTF128rr			(VCMPPSYrri (AVX_SET0), (AVX_SET0), 15)>;
				spatelUnsubmitted Not Done Reply Inline Actions It's not clear why we require a zero operand. Would a dummy (undef) register also work? Should we allow that when optimizing for size so the vxorps is not needed? spatel: It's not clear why we require a zero operand. Would a dummy (undef) register also work? Should…
				RKSimonUnsubmitted Not Done Reply Inline Actions There isn't a fast path for vcmptrue (despite it ignoring the inputs) on Jaguar/SandyBridge - I mentioned in https://bugs.llvm.org/show_bug.cgi?id=28129#c8 that using undef vars causes dependency regressions. Zeroing the register breaks the dependency. RKSimon: There isn't a fast path for vcmptrue (despite it ignoring the inputs) on Jaguar/SandyBridge - I…
	(INSERT_SUBREG (v8i32 (IMPLICIT_DEF)), (V_SETALLONES), sub_xmm),
	(V_SETALLONES), 1)>;

	multiclass vinsert_lowering<string InstrStr, ValueType From, ValueType To,			multiclass vinsert_lowering<string InstrStr, ValueType From, ValueType To,
	PatFrag memop_frag> {			PatFrag memop_frag> {
	def : Pat<(vinsert128_insert:$ins (To VR256:$src1), (From VR128:$src2),			def : Pat<(vinsert128_insert:$ins (To VR256:$src1), (From VR128:$src2),
	(iPTR imm)),			(iPTR imm)),
	(!cast<Instruction>(InstrStr#rr) VR256:$src1, VR128:$src2,			(!cast<Instruction>(InstrStr#rr) VR256:$src1, VR128:$src2,
	(INSERT_get_vinsert128_imm VR256:$ins))>;			(INSERT_get_vinsert128_imm VR256:$ins))>;
	def : Pat<(vinsert128_insert:$ins (To VR256:$src1),			def : Pat<(vinsert128_insert:$ins (To VR256:$src1),
	▲ Show 20 Lines • Show All 922 Lines • Show Last 20 Lines

test/CodeGen/X86/all-ones-vector.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				spatelUnsubmitted Not Done Reply Inline Actions Many cosmetic diffs have been introduced because you used a different script. Please use "update_llc_test_checks.py" to regenerate these and upload the patch again. I need to "fix" the other script to not work with llc. :) spatel: Many cosmetic diffs have been introduced because you used a different script. Please use…
	; RUN: llc < %s -mtriple=i386-unknown -mattr=+sse2 \| FileCheck %s --check-prefix=X32-SSE			; RUN: llc < %s -mtriple=i386-unknown -mattr=+sse2 \| FileCheck %s --check-prefix=X32-SSE
	; RUN: llc < %s -mtriple=i386-unknown -mattr=+avx \| FileCheck %s --check-prefix=X32-AVX --check-prefix=X32-AVX1			; RUN: llc < %s -mtriple=i386-unknown -mattr=+avx \| FileCheck %s --check-prefix=X32-AVX --check-prefix=X32-AVX1
	; RUN: llc < %s -mtriple=i386-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=X32-AVX --check-prefix=X32-AVX256 --check-prefix=X32-AVX2			; RUN: llc < %s -mtriple=i386-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=X32-AVX --check-prefix=X32-AVX256 --check-prefix=X32-AVX2
	; RUN: llc < %s -mtriple=i386-unknown -mcpu=knl \| FileCheck %s --check-prefix=X32-AVX --check-prefix=X32-AVX256 --check-prefix=X32-AVX512 --check-prefix=X32-KNL			; RUN: llc < %s -mtriple=i386-unknown -mcpu=knl \| FileCheck %s --check-prefix=X32-AVX --check-prefix=X32-AVX256 --check-prefix=X32-AVX512 --check-prefix=X32-KNL
	; RUN: llc < %s -mtriple=i386-unknown -mcpu=skx \| FileCheck %s --check-prefix=X32-AVX --check-prefix=X32-AVX256 --check-prefix=X32-AVX512 --check-prefix=X32-SKX			; RUN: llc < %s -mtriple=i386-unknown -mcpu=skx \| FileCheck %s --check-prefix=X32-AVX --check-prefix=X32-AVX256 --check-prefix=X32-AVX512 --check-prefix=X32-SKX
	; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+sse2 \| FileCheck %s --check-prefix=X64-SSE			; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+sse2 \| FileCheck %s --check-prefix=X64-SSE
	; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+avx \| FileCheck %s --check-prefix=X64-AVX --check-prefix=X64-AVX1			; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+avx \| FileCheck %s --check-prefix=X64-AVX --check-prefix=X64-AVX1
	; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=X64-AVX --check-prefix=X64-AVX256 --check-prefix=X64-AVX2			; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=X64-AVX --check-prefix=X64-AVX256 --check-prefix=X64-AVX2
	▲ Show 20 Lines • Show All 142 Lines • ▼ Show 20 Lines
	; X32-SSE-LABEL: coo256:			; X32-SSE-LABEL: coo256:
	; X32-SSE: # BB#0:			; X32-SSE: # BB#0:
	; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X32-SSE-NEXT: retl			; X32-SSE-NEXT: retl
	;			;
	; X32-AVX1-LABEL: coo256:			; X32-AVX1-LABEL: coo256:
	; X32-AVX1: # BB#0:			; X32-AVX1: # BB#0:
	; X32-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X32-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X32-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: retl			; X32-AVX1-NEXT: retl
	;			;
	; X32-AVX256-LABEL: coo256:			; X32-AVX256-LABEL: coo256:
	; X32-AVX256: # BB#0:			; X32-AVX256: # BB#0:
	; X32-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X32-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X32-AVX256-NEXT: retl			; X32-AVX256-NEXT: retl
	;			;
	; X64-SSE-LABEL: coo256:			; X64-SSE-LABEL: coo256:
	; X64-SSE: # BB#0:			; X64-SSE: # BB#0:
	; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X64-SSE-NEXT: retq			; X64-SSE-NEXT: retq
	;			;
	; X64-AVX1-LABEL: coo256:			; X64-AVX1-LABEL: coo256:
	; X64-AVX1: # BB#0:			; X64-AVX1: # BB#0:
	; X64-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X64-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X64-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: retq			; X64-AVX1-NEXT: retq
	;			;
	; X64-AVX256-LABEL: coo256:			; X64-AVX256-LABEL: coo256:
	; X64-AVX256: # BB#0:			; X64-AVX256: # BB#0:
	; X64-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X64-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X64-AVX256-NEXT: retq			; X64-AVX256-NEXT: retq
	ret <32 x i8> <i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1>			ret <32 x i8> <i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1>
	}			}

	define <16 x i16> @soo256() nounwind {			define <16 x i16> @soo256() nounwind {
	; X32-SSE-LABEL: soo256:			; X32-SSE-LABEL: soo256:
	; X32-SSE: # BB#0:			; X32-SSE: # BB#0:
	; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X32-SSE-NEXT: retl			; X32-SSE-NEXT: retl
	;			;
	; X32-AVX1-LABEL: soo256:			; X32-AVX1-LABEL: soo256:
	; X32-AVX1: # BB#0:			; X32-AVX1: # BB#0:
	; X32-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X32-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X32-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: retl			; X32-AVX1-NEXT: retl
	;			;
	; X32-AVX256-LABEL: soo256:			; X32-AVX256-LABEL: soo256:
	; X32-AVX256: # BB#0:			; X32-AVX256: # BB#0:
	; X32-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X32-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X32-AVX256-NEXT: retl			; X32-AVX256-NEXT: retl
	;			;
	; X64-SSE-LABEL: soo256:			; X64-SSE-LABEL: soo256:
	; X64-SSE: # BB#0:			; X64-SSE: # BB#0:
	; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X64-SSE-NEXT: retq			; X64-SSE-NEXT: retq
	;			;
	; X64-AVX1-LABEL: soo256:			; X64-AVX1-LABEL: soo256:
	; X64-AVX1: # BB#0:			; X64-AVX1: # BB#0:
	; X64-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X64-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X64-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: retq			; X64-AVX1-NEXT: retq
	;			;
	; X64-AVX256-LABEL: soo256:			; X64-AVX256-LABEL: soo256:
	; X64-AVX256: # BB#0:			; X64-AVX256: # BB#0:
	; X64-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X64-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X64-AVX256-NEXT: retq			; X64-AVX256-NEXT: retq
	ret <16 x i16> <i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1>			ret <16 x i16> <i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1>
	}			}

	define <8 x i32> @ioo256() nounwind {			define <8 x i32> @ioo256() nounwind {
	; X32-SSE-LABEL: ioo256:			; X32-SSE-LABEL: ioo256:
	; X32-SSE: # BB#0:			; X32-SSE: # BB#0:
	; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X32-SSE-NEXT: retl			; X32-SSE-NEXT: retl
	;			;
	; X32-AVX1-LABEL: ioo256:			; X32-AVX1-LABEL: ioo256:
	; X32-AVX1: # BB#0:			; X32-AVX1: # BB#0:
	; X32-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X32-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X32-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: retl			; X32-AVX1-NEXT: retl
	;			;
	; X32-AVX256-LABEL: ioo256:			; X32-AVX256-LABEL: ioo256:
	; X32-AVX256: # BB#0:			; X32-AVX256: # BB#0:
	; X32-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X32-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X32-AVX256-NEXT: retl			; X32-AVX256-NEXT: retl
	;			;
	; X64-SSE-LABEL: ioo256:			; X64-SSE-LABEL: ioo256:
	; X64-SSE: # BB#0:			; X64-SSE: # BB#0:
	; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X64-SSE-NEXT: retq			; X64-SSE-NEXT: retq
	;			;
	; X64-AVX1-LABEL: ioo256:			; X64-AVX1-LABEL: ioo256:
	; X64-AVX1: # BB#0:			; X64-AVX1: # BB#0:
	; X64-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X64-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X64-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: retq			; X64-AVX1-NEXT: retq
	;			;
	; X64-AVX256-LABEL: ioo256:			; X64-AVX256-LABEL: ioo256:
	; X64-AVX256: # BB#0:			; X64-AVX256: # BB#0:
	; X64-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X64-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X64-AVX256-NEXT: retq			; X64-AVX256-NEXT: retq
	ret <8 x i32> <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>			ret <8 x i32> <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>
	}			}

	define <4 x i64> @loo256() nounwind {			define <4 x i64> @loo256() nounwind {
	; X32-SSE-LABEL: loo256:			; X32-SSE-LABEL: loo256:
	; X32-SSE: # BB#0:			; X32-SSE: # BB#0:
	; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X32-SSE-NEXT: retl			; X32-SSE-NEXT: retl
	;			;
	; X32-AVX1-LABEL: loo256:			; X32-AVX1-LABEL: loo256:
	; X32-AVX1: # BB#0:			; X32-AVX1: # BB#0:
	; X32-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X32-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X32-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: retl			; X32-AVX1-NEXT: retl
	;			;
	; X32-AVX256-LABEL: loo256:			; X32-AVX256-LABEL: loo256:
	; X32-AVX256: # BB#0:			; X32-AVX256: # BB#0:
	; X32-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X32-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X32-AVX256-NEXT: retl			; X32-AVX256-NEXT: retl
	;			;
	; X64-SSE-LABEL: loo256:			; X64-SSE-LABEL: loo256:
	; X64-SSE: # BB#0:			; X64-SSE: # BB#0:
	; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X64-SSE-NEXT: retq			; X64-SSE-NEXT: retq
	;			;
	; X64-AVX1-LABEL: loo256:			; X64-AVX1-LABEL: loo256:
	; X64-AVX1: # BB#0:			; X64-AVX1: # BB#0:
	; X64-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X64-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X64-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: retq			; X64-AVX1-NEXT: retq
	;			;
	; X64-AVX256-LABEL: loo256:			; X64-AVX256-LABEL: loo256:
	; X64-AVX256: # BB#0:			; X64-AVX256: # BB#0:
	; X64-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X64-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X64-AVX256-NEXT: retq			; X64-AVX256-NEXT: retq
	ret <4 x i64> <i64 -1, i64 -1, i64 -1, i64 -1>			ret <4 x i64> <i64 -1, i64 -1, i64 -1, i64 -1>
	}			}

	define <4 x double> @doo256() nounwind {			define <4 x double> @doo256() nounwind {
	; X32-SSE-LABEL: doo256:			; X32-SSE-LABEL: doo256:
	; X32-SSE: # BB#0:			; X32-SSE: # BB#0:
	; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X32-SSE-NEXT: retl			; X32-SSE-NEXT: retl
	;			;
	; X32-AVX1-LABEL: doo256:			; X32-AVX1-LABEL: doo256:
	; X32-AVX1: # BB#0:			; X32-AVX1: # BB#0:
	; X32-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X32-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X32-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: retl			; X32-AVX1-NEXT: retl
	;			;
	; X32-AVX256-LABEL: doo256:			; X32-AVX256-LABEL: doo256:
	; X32-AVX256: # BB#0:			; X32-AVX256: # BB#0:
	; X32-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X32-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X32-AVX256-NEXT: retl			; X32-AVX256-NEXT: retl
	;			;
	; X64-SSE-LABEL: doo256:			; X64-SSE-LABEL: doo256:
	; X64-SSE: # BB#0:			; X64-SSE: # BB#0:
	; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X64-SSE-NEXT: retq			; X64-SSE-NEXT: retq
	;			;
	; X64-AVX1-LABEL: doo256:			; X64-AVX1-LABEL: doo256:
	; X64-AVX1: # BB#0:			; X64-AVX1: # BB#0:
	; X64-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X64-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X64-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: retq			; X64-AVX1-NEXT: retq
	;			;
	; X64-AVX256-LABEL: doo256:			; X64-AVX256-LABEL: doo256:
	; X64-AVX256: # BB#0:			; X64-AVX256: # BB#0:
	; X64-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X64-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X64-AVX256-NEXT: retq			; X64-AVX256-NEXT: retq
	ret <4 x double> <double 0xffffffffffffffff, double 0xffffffffffffffff, double 0xffffffffffffffff, double 0xffffffffffffffff>			ret <4 x double> <double 0xffffffffffffffff, double 0xffffffffffffffff, double 0xffffffffffffffff, double 0xffffffffffffffff>
	}			}

	define <8 x float> @foo256() nounwind {			define <8 x float> @foo256() nounwind {
	; X32-SSE-LABEL: foo256:			; X32-SSE-LABEL: foo256:
	; X32-SSE: # BB#0:			; X32-SSE: # BB#0:
	; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X32-SSE-NEXT: retl			; X32-SSE-NEXT: retl
	;			;
	; X32-AVX1-LABEL: foo256:			; X32-AVX1-LABEL: foo256:
	; X32-AVX1: # BB#0:			; X32-AVX1: # BB#0:
	; X32-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X32-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X32-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: retl			; X32-AVX1-NEXT: retl
	;			;
	; X32-AVX256-LABEL: foo256:			; X32-AVX256-LABEL: foo256:
	; X32-AVX256: # BB#0:			; X32-AVX256: # BB#0:
	; X32-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X32-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X32-AVX256-NEXT: retl			; X32-AVX256-NEXT: retl
	;			;
	; X64-SSE-LABEL: foo256:			; X64-SSE-LABEL: foo256:
	; X64-SSE: # BB#0:			; X64-SSE: # BB#0:
	; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X64-SSE-NEXT: retq			; X64-SSE-NEXT: retq
	;			;
	; X64-AVX1-LABEL: foo256:			; X64-AVX1-LABEL: foo256:
	; X64-AVX1: # BB#0:			; X64-AVX1: # BB#0:
	; X64-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X64-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X64-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: retq			; X64-AVX1-NEXT: retq
	;			;
	; X64-AVX256-LABEL: foo256:			; X64-AVX256-LABEL: foo256:
	; X64-AVX256: # BB#0:			; X64-AVX256: # BB#0:
	; X64-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X64-AVX256-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X64-AVX256-NEXT: retq			; X64-AVX256-NEXT: retq
	ret <8 x float> <float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000>			ret <8 x float> <float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000>
	}			}

	define <64 x i8> @coo512() nounwind {			define <64 x i8> @coo512() nounwind {
	; X32-SSE-LABEL: coo512:			; X32-SSE-LABEL: coo512:
	; X32-SSE: # BB#0:			; X32-SSE: # BB#0:
	; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X32-SSE-NEXT: pcmpeqd %xmm2, %xmm2			; X32-SSE-NEXT: pcmpeqd %xmm2, %xmm2
	; X32-SSE-NEXT: pcmpeqd %xmm3, %xmm3			; X32-SSE-NEXT: pcmpeqd %xmm3, %xmm3
	; X32-SSE-NEXT: retl			; X32-SSE-NEXT: retl
	;			;
	; X32-AVX1-LABEL: coo512:			; X32-AVX1-LABEL: coo512:
	; X32-AVX1: # BB#0:			; X32-AVX1: # BB#0:
	; X32-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X32-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X32-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: vmovaps %ymm0, %ymm1			; X32-AVX1-NEXT: vmovaps %ymm0, %ymm1
	; X32-AVX1-NEXT: retl			; X32-AVX1-NEXT: retl
	;			;
	; X32-AVX2-LABEL: coo512:			; X32-AVX2-LABEL: coo512:
	; X32-AVX2: # BB#0:			; X32-AVX2: # BB#0:
	; X32-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X32-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X32-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; X32-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; X32-AVX2-NEXT: retl			; X32-AVX2-NEXT: retl
	Show All 14 Lines
	; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X64-SSE-NEXT: pcmpeqd %xmm2, %xmm2			; X64-SSE-NEXT: pcmpeqd %xmm2, %xmm2
	; X64-SSE-NEXT: pcmpeqd %xmm3, %xmm3			; X64-SSE-NEXT: pcmpeqd %xmm3, %xmm3
	; X64-SSE-NEXT: retq			; X64-SSE-NEXT: retq
	;			;
	; X64-AVX1-LABEL: coo512:			; X64-AVX1-LABEL: coo512:
	; X64-AVX1: # BB#0:			; X64-AVX1: # BB#0:
	; X64-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X64-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X64-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: vmovaps %ymm0, %ymm1			; X64-AVX1-NEXT: vmovaps %ymm0, %ymm1
	; X64-AVX1-NEXT: retq			; X64-AVX1-NEXT: retq
	;			;
	; X64-AVX2-LABEL: coo512:			; X64-AVX2-LABEL: coo512:
	; X64-AVX2: # BB#0:			; X64-AVX2: # BB#0:
	; X64-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X64-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X64-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; X64-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; X64-AVX2-NEXT: retq			; X64-AVX2-NEXT: retq
	Show All 17 Lines
	; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X32-SSE-NEXT: pcmpeqd %xmm2, %xmm2			; X32-SSE-NEXT: pcmpeqd %xmm2, %xmm2
	; X32-SSE-NEXT: pcmpeqd %xmm3, %xmm3			; X32-SSE-NEXT: pcmpeqd %xmm3, %xmm3
	; X32-SSE-NEXT: retl			; X32-SSE-NEXT: retl
	;			;
	; X32-AVX1-LABEL: soo512:			; X32-AVX1-LABEL: soo512:
	; X32-AVX1: # BB#0:			; X32-AVX1: # BB#0:
	; X32-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X32-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X32-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: vmovaps %ymm0, %ymm1			; X32-AVX1-NEXT: vmovaps %ymm0, %ymm1
	; X32-AVX1-NEXT: retl			; X32-AVX1-NEXT: retl
	;			;
	; X32-AVX2-LABEL: soo512:			; X32-AVX2-LABEL: soo512:
	; X32-AVX2: # BB#0:			; X32-AVX2: # BB#0:
	; X32-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X32-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X32-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; X32-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; X32-AVX2-NEXT: retl			; X32-AVX2-NEXT: retl
	Show All 14 Lines
	; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X64-SSE-NEXT: pcmpeqd %xmm2, %xmm2			; X64-SSE-NEXT: pcmpeqd %xmm2, %xmm2
	; X64-SSE-NEXT: pcmpeqd %xmm3, %xmm3			; X64-SSE-NEXT: pcmpeqd %xmm3, %xmm3
	; X64-SSE-NEXT: retq			; X64-SSE-NEXT: retq
	;			;
	; X64-AVX1-LABEL: soo512:			; X64-AVX1-LABEL: soo512:
	; X64-AVX1: # BB#0:			; X64-AVX1: # BB#0:
	; X64-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X64-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X64-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: vmovaps %ymm0, %ymm1			; X64-AVX1-NEXT: vmovaps %ymm0, %ymm1
	; X64-AVX1-NEXT: retq			; X64-AVX1-NEXT: retq
	;			;
	; X64-AVX2-LABEL: soo512:			; X64-AVX2-LABEL: soo512:
	; X64-AVX2: # BB#0:			; X64-AVX2: # BB#0:
	; X64-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X64-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X64-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; X64-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; X64-AVX2-NEXT: retq			; X64-AVX2-NEXT: retq
	Show All 17 Lines
	; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X32-SSE-NEXT: pcmpeqd %xmm2, %xmm2			; X32-SSE-NEXT: pcmpeqd %xmm2, %xmm2
	; X32-SSE-NEXT: pcmpeqd %xmm3, %xmm3			; X32-SSE-NEXT: pcmpeqd %xmm3, %xmm3
	; X32-SSE-NEXT: retl			; X32-SSE-NEXT: retl
	;			;
	; X32-AVX1-LABEL: ioo512:			; X32-AVX1-LABEL: ioo512:
	; X32-AVX1: # BB#0:			; X32-AVX1: # BB#0:
	; X32-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X32-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X32-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: vmovaps %ymm0, %ymm1			; X32-AVX1-NEXT: vmovaps %ymm0, %ymm1
	; X32-AVX1-NEXT: retl			; X32-AVX1-NEXT: retl
	;			;
	; X32-AVX2-LABEL: ioo512:			; X32-AVX2-LABEL: ioo512:
	; X32-AVX2: # BB#0:			; X32-AVX2: # BB#0:
	; X32-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X32-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X32-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; X32-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; X32-AVX2-NEXT: retl			; X32-AVX2-NEXT: retl
	;			;
	; X32-AVX512-LABEL: ioo512:			; X32-AVX512-LABEL: ioo512:
	; X32-AVX512: # BB#0:			; X32-AVX512: # BB#0:
	; X32-AVX512-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0			; X32-AVX512-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0
	; X32-AVX512-NEXT: retl			; X32-AVX512-NEXT: retl
	;			;
	; X64-SSE-LABEL: ioo512:			; X64-SSE-LABEL: ioo512:
	; X64-SSE: # BB#0:			; X64-SSE: # BB#0:
	; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X64-SSE-NEXT: pcmpeqd %xmm2, %xmm2			; X64-SSE-NEXT: pcmpeqd %xmm2, %xmm2
	; X64-SSE-NEXT: pcmpeqd %xmm3, %xmm3			; X64-SSE-NEXT: pcmpeqd %xmm3, %xmm3
	; X64-SSE-NEXT: retq			; X64-SSE-NEXT: retq
	;			;
	; X64-AVX1-LABEL: ioo512:			; X64-AVX1-LABEL: ioo512:
	; X64-AVX1: # BB#0:			; X64-AVX1: # BB#0:
	; X64-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X64-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X64-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: vmovaps %ymm0, %ymm1			; X64-AVX1-NEXT: vmovaps %ymm0, %ymm1
	; X64-AVX1-NEXT: retq			; X64-AVX1-NEXT: retq
	;			;
	; X64-AVX2-LABEL: ioo512:			; X64-AVX2-LABEL: ioo512:
	; X64-AVX2: # BB#0:			; X64-AVX2: # BB#0:
	; X64-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X64-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X64-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; X64-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; X64-AVX2-NEXT: retq			; X64-AVX2-NEXT: retq
	Show All 11 Lines
	; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X32-SSE-NEXT: pcmpeqd %xmm2, %xmm2			; X32-SSE-NEXT: pcmpeqd %xmm2, %xmm2
	; X32-SSE-NEXT: pcmpeqd %xmm3, %xmm3			; X32-SSE-NEXT: pcmpeqd %xmm3, %xmm3
	; X32-SSE-NEXT: retl			; X32-SSE-NEXT: retl
	;			;
	; X32-AVX1-LABEL: loo512:			; X32-AVX1-LABEL: loo512:
	; X32-AVX1: # BB#0:			; X32-AVX1: # BB#0:
	; X32-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X32-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X32-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: vmovaps %ymm0, %ymm1			; X32-AVX1-NEXT: vmovaps %ymm0, %ymm1
	; X32-AVX1-NEXT: retl			; X32-AVX1-NEXT: retl
	;			;
	; X32-AVX2-LABEL: loo512:			; X32-AVX2-LABEL: loo512:
	; X32-AVX2: # BB#0:			; X32-AVX2: # BB#0:
	; X32-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X32-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X32-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; X32-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; X32-AVX2-NEXT: retl			; X32-AVX2-NEXT: retl
	;			;
	; X32-AVX512-LABEL: loo512:			; X32-AVX512-LABEL: loo512:
	; X32-AVX512: # BB#0:			; X32-AVX512: # BB#0:
	; X32-AVX512-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0			; X32-AVX512-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0
	; X32-AVX512-NEXT: retl			; X32-AVX512-NEXT: retl
	;			;
	; X64-SSE-LABEL: loo512:			; X64-SSE-LABEL: loo512:
	; X64-SSE: # BB#0:			; X64-SSE: # BB#0:
	; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X64-SSE-NEXT: pcmpeqd %xmm2, %xmm2			; X64-SSE-NEXT: pcmpeqd %xmm2, %xmm2
	; X64-SSE-NEXT: pcmpeqd %xmm3, %xmm3			; X64-SSE-NEXT: pcmpeqd %xmm3, %xmm3
	; X64-SSE-NEXT: retq			; X64-SSE-NEXT: retq
	;			;
	; X64-AVX1-LABEL: loo512:			; X64-AVX1-LABEL: loo512:
	; X64-AVX1: # BB#0:			; X64-AVX1: # BB#0:
	; X64-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X64-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X64-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: vmovaps %ymm0, %ymm1			; X64-AVX1-NEXT: vmovaps %ymm0, %ymm1
	; X64-AVX1-NEXT: retq			; X64-AVX1-NEXT: retq
	;			;
	; X64-AVX2-LABEL: loo512:			; X64-AVX2-LABEL: loo512:
	; X64-AVX2: # BB#0:			; X64-AVX2: # BB#0:
	; X64-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X64-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X64-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; X64-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; X64-AVX2-NEXT: retq			; X64-AVX2-NEXT: retq
	Show All 11 Lines
	; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X32-SSE-NEXT: pcmpeqd %xmm2, %xmm2			; X32-SSE-NEXT: pcmpeqd %xmm2, %xmm2
	; X32-SSE-NEXT: pcmpeqd %xmm3, %xmm3			; X32-SSE-NEXT: pcmpeqd %xmm3, %xmm3
	; X32-SSE-NEXT: retl			; X32-SSE-NEXT: retl
	;			;
	; X32-AVX1-LABEL: doo512:			; X32-AVX1-LABEL: doo512:
	; X32-AVX1: # BB#0:			; X32-AVX1: # BB#0:
	; X32-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X32-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X32-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: vmovaps %ymm0, %ymm1			; X32-AVX1-NEXT: vmovaps %ymm0, %ymm1
	; X32-AVX1-NEXT: retl			; X32-AVX1-NEXT: retl
	;			;
	; X32-AVX2-LABEL: doo512:			; X32-AVX2-LABEL: doo512:
	; X32-AVX2: # BB#0:			; X32-AVX2: # BB#0:
	; X32-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X32-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X32-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; X32-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; X32-AVX2-NEXT: retl			; X32-AVX2-NEXT: retl
	;			;
	; X32-AVX512-LABEL: doo512:			; X32-AVX512-LABEL: doo512:
	; X32-AVX512: # BB#0:			; X32-AVX512: # BB#0:
	; X32-AVX512-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0			; X32-AVX512-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0
	; X32-AVX512-NEXT: retl			; X32-AVX512-NEXT: retl
	;			;
	; X64-SSE-LABEL: doo512:			; X64-SSE-LABEL: doo512:
	; X64-SSE: # BB#0:			; X64-SSE: # BB#0:
	; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X64-SSE-NEXT: pcmpeqd %xmm2, %xmm2			; X64-SSE-NEXT: pcmpeqd %xmm2, %xmm2
	; X64-SSE-NEXT: pcmpeqd %xmm3, %xmm3			; X64-SSE-NEXT: pcmpeqd %xmm3, %xmm3
	; X64-SSE-NEXT: retq			; X64-SSE-NEXT: retq
	;			;
	; X64-AVX1-LABEL: doo512:			; X64-AVX1-LABEL: doo512:
	; X64-AVX1: # BB#0:			; X64-AVX1: # BB#0:
	; X64-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X64-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X64-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: vmovaps %ymm0, %ymm1			; X64-AVX1-NEXT: vmovaps %ymm0, %ymm1
	; X64-AVX1-NEXT: retq			; X64-AVX1-NEXT: retq
	;			;
	; X64-AVX2-LABEL: doo512:			; X64-AVX2-LABEL: doo512:
	; X64-AVX2: # BB#0:			; X64-AVX2: # BB#0:
	; X64-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X64-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X64-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; X64-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; X64-AVX2-NEXT: retq			; X64-AVX2-NEXT: retq
	Show All 11 Lines
	; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X32-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X32-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X32-SSE-NEXT: pcmpeqd %xmm2, %xmm2			; X32-SSE-NEXT: pcmpeqd %xmm2, %xmm2
	; X32-SSE-NEXT: pcmpeqd %xmm3, %xmm3			; X32-SSE-NEXT: pcmpeqd %xmm3, %xmm3
	; X32-SSE-NEXT: retl			; X32-SSE-NEXT: retl
	;			;
	; X32-AVX1-LABEL: foo512:			; X32-AVX1-LABEL: foo512:
	; X32-AVX1: # BB#0:			; X32-AVX1: # BB#0:
	; X32-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X32-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X32-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X32-AVX1-NEXT: vmovaps %ymm0, %ymm1			; X32-AVX1-NEXT: vmovaps %ymm0, %ymm1
	; X32-AVX1-NEXT: retl			; X32-AVX1-NEXT: retl
	;			;
	; X32-AVX2-LABEL: foo512:			; X32-AVX2-LABEL: foo512:
	; X32-AVX2: # BB#0:			; X32-AVX2: # BB#0:
	; X32-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X32-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X32-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; X32-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; X32-AVX2-NEXT: retl			; X32-AVX2-NEXT: retl
	;			;
	; X32-AVX512-LABEL: foo512:			; X32-AVX512-LABEL: foo512:
	; X32-AVX512: # BB#0:			; X32-AVX512: # BB#0:
	; X32-AVX512-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0			; X32-AVX512-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0
	; X32-AVX512-NEXT: retl			; X32-AVX512-NEXT: retl
	;			;
	; X64-SSE-LABEL: foo512:			; X64-SSE-LABEL: foo512:
	; X64-SSE: # BB#0:			; X64-SSE: # BB#0:
	; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0			; X64-SSE-NEXT: pcmpeqd %xmm0, %xmm0
	; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1			; X64-SSE-NEXT: pcmpeqd %xmm1, %xmm1
	; X64-SSE-NEXT: pcmpeqd %xmm2, %xmm2			; X64-SSE-NEXT: pcmpeqd %xmm2, %xmm2
	; X64-SSE-NEXT: pcmpeqd %xmm3, %xmm3			; X64-SSE-NEXT: pcmpeqd %xmm3, %xmm3
	; X64-SSE-NEXT: retq			; X64-SSE-NEXT: retq
	;			;
	; X64-AVX1-LABEL: foo512:			; X64-AVX1-LABEL: foo512:
	; X64-AVX1: # BB#0:			; X64-AVX1: # BB#0:
	; X64-AVX1-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0			; X64-AVX1-NEXT: vxorps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0			; X64-AVX1-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
	; X64-AVX1-NEXT: vmovaps %ymm0, %ymm1			; X64-AVX1-NEXT: vmovaps %ymm0, %ymm1
	; X64-AVX1-NEXT: retq			; X64-AVX1-NEXT: retq
	;			;
	; X64-AVX2-LABEL: foo512:			; X64-AVX2-LABEL: foo512:
	; X64-AVX2: # BB#0:			; X64-AVX2: # BB#0:
	; X64-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0			; X64-AVX2-NEXT: vpcmpeqd %ymm0, %ymm0, %ymm0
	; X64-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; X64-AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; X64-AVX2-NEXT: retq			; X64-AVX2-NEXT: retq
	;			;
	; X64-AVX512-LABEL: foo512:			; X64-AVX512-LABEL: foo512:
	; X64-AVX512: # BB#0:			; X64-AVX512: # BB#0:
	; X64-AVX512-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0			; X64-AVX512-NEXT: vpternlogd $255, %zmm0, %zmm0, %zmm0
	; X64-AVX512-NEXT: retq			; X64-AVX512-NEXT: retq
	ret <16 x float> <float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000>			ret <16 x float> <float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000, float 0xffffffffe0000000>
	}			}

test/CodeGen/X86/avx-basic.ll

Show All 28 Lines	; CHECK-NEXT: retq
store <8 x float> zeroinitializer, <8 x float>* @x, align 32		store <8 x float> zeroinitializer, <8 x float>* @x, align 32
store <4 x double> zeroinitializer, <4 x double>* @y, align 32		store <4 x double> zeroinitializer, <4 x double>* @y, align 32
ret void		ret void
}		}

define void @ones([0 x float]* nocapture %RET, [0 x float]* nocapture %aFOO) nounwind {		define void @ones([0 x float]* nocapture %RET, [0 x float]* nocapture %aFOO) nounwind {
; CHECK-LABEL: ones:		; CHECK-LABEL: ones:
; CHECK: ## BB#0: ## %allocas		; CHECK: ## BB#0: ## %allocas
; CHECK-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0		; CHECK-NEXT: vxorps %ymm0, %ymm0, %ymm0
; CHECK-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0		; CHECK-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
; CHECK-NEXT: vmovaps %ymm0, (%rdi)		; CHECK-NEXT: vmovaps %ymm0, (%rdi)
; CHECK-NEXT: vzeroupper		; CHECK-NEXT: vzeroupper
; CHECK-NEXT: retq		; CHECK-NEXT: retq
allocas:		allocas:
%ptr2vec615 = bitcast [0 x float]* %RET to <8 x float>*		%ptr2vec615 = bitcast [0 x float]* %RET to <8 x float>*
store <8 x float> <float 0xFFFFFFFFE0000000, float 0xFFFFFFFFE0000000, float		store <8 x float> <float 0xFFFFFFFFE0000000, float 0xFFFFFFFFE0000000, float
0xFFFFFFFFE0000000, float 0xFFFFFFFFE0000000, float 0xFFFFFFFFE0000000, float		0xFFFFFFFFE0000000, float 0xFFFFFFFFE0000000, float 0xFFFFFFFFE0000000, float
0xFFFFFFFFE0000000, float 0xFFFFFFFFE0000000, float 0xFFFFFFFFE0000000>, <8 x		0xFFFFFFFFE0000000, float 0xFFFFFFFFE0000000, float 0xFFFFFFFFE0000000>, <8 x
float>* %ptr2vec615, align 32		float>* %ptr2vec615, align 32
ret void		ret void
}		}

define void @ones2([0 x i32]* nocapture %RET, [0 x i32]* nocapture %aFOO) nounwind {		define void @ones2([0 x i32]* nocapture %RET, [0 x i32]* nocapture %aFOO) nounwind {
; CHECK-LABEL: ones2:		; CHECK-LABEL: ones2:
; CHECK: ## BB#0: ## %allocas		; CHECK: ## BB#0: ## %allocas
; CHECK-NEXT: vpcmpeqd %xmm0, %xmm0, %xmm0		; CHECK-NEXT: vxorps %ymm0, %ymm0, %ymm0
; CHECK-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0		; CHECK-NEXT: vcmptrueps %ymm0, %ymm0, %ymm0
; CHECK-NEXT: vmovaps %ymm0, (%rdi)		; CHECK-NEXT: vmovaps %ymm0, (%rdi)
; CHECK-NEXT: vzeroupper		; CHECK-NEXT: vzeroupper
; CHECK-NEXT: retq		; CHECK-NEXT: retq
allocas:		allocas:
%ptr2vec615 = bitcast [0 x i32]* %RET to <8 x i32>*		%ptr2vec615 = bitcast [0 x i32]* %RET to <8 x i32>*
store <8 x i32> <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>, <8 x i32>* %ptr2vec615, align 32		store <8 x i32> <i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1>, <8 x i32>* %ptr2vec615, align 32
ret void		ret void
}		}
▲ Show 20 Lines • Show All 72 Lines • Show Last 20 Lines

test/CodeGen/X86/avx-cvt-3.ll

Show First 20 Lines • Show All 42 Lines • ▼ Show 20 Lines	; X64-NEXT: retq
%1 = shufflevector <8 x i32> %a0, <8 x i32> <i32 0, i32 undef, i32 0, i32 undef, i32 0, i32 undef, i32 0, i32 undef>, <8 x i32> <i32 8, i32 1, i32 10, i32 3, i32 12, i32 5, i32 14, i32 7>		%1 = shufflevector <8 x i32> %a0, <8 x i32> <i32 0, i32 undef, i32 0, i32 undef, i32 0, i32 undef, i32 0, i32 undef>, <8 x i32> <i32 8, i32 1, i32 10, i32 3, i32 12, i32 5, i32 14, i32 7>
%2 = sitofp <8 x i32> %1 to <8 x float>		%2 = sitofp <8 x i32> %1 to <8 x float>
ret <8 x float> %2		ret <8 x float> %2
}		}

define <8 x float> @sitofp_insert_allbits_v8i32(<8 x i32> %a0) {		define <8 x float> @sitofp_insert_allbits_v8i32(<8 x i32> %a0) {
; X86-LABEL: sitofp_insert_allbits_v8i32:		; X86-LABEL: sitofp_insert_allbits_v8i32:
; X86: # BB#0:		; X86: # BB#0:
; X86-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1		; X86-NEXT: vxorps %ymm1, %ymm1, %ymm1
; X86-NEXT: vinsertf128 $1, %xmm1, %ymm1, %ymm1		; X86-NEXT: vcmptrueps %ymm1, %ymm1, %ymm1
; X86-NEXT: vblendps {{.*#+}} ymm0 = ymm1[0],ymm0[1],ymm1[2],ymm0[3],ymm1[4,5],ymm0[6,7]		; X86-NEXT: vblendps {{.*#+}} ymm0 = ymm1[0],ymm0[1],ymm1[2],ymm0[3],ymm1[4,5],ymm0[6,7]
; X86-NEXT: vcvtdq2ps %ymm0, %ymm0		; X86-NEXT: vcvtdq2ps %ymm0, %ymm0
; X86-NEXT: retl		; X86-NEXT: retl
;		;
; X64-LABEL: sitofp_insert_allbits_v8i32:		; X64-LABEL: sitofp_insert_allbits_v8i32:
; X64: # BB#0:		; X64: # BB#0:
; X64-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1		; X64-NEXT: vxorps %ymm1, %ymm1, %ymm1
; X64-NEXT: vinsertf128 $1, %xmm1, %ymm1, %ymm1		; X64-NEXT: vcmptrueps %ymm1, %ymm1, %ymm1
; X64-NEXT: vblendps {{.*#+}} ymm0 = ymm1[0],ymm0[1],ymm1[2],ymm0[3],ymm1[4,5],ymm0[6,7]		; X64-NEXT: vblendps {{.*#+}} ymm0 = ymm1[0],ymm0[1],ymm1[2],ymm0[3],ymm1[4,5],ymm0[6,7]
; X64-NEXT: vcvtdq2ps %ymm0, %ymm0		; X64-NEXT: vcvtdq2ps %ymm0, %ymm0
; X64-NEXT: retq		; X64-NEXT: retq
%1 = insertelement <8 x i32> %a0, i32 -1, i32 0		%1 = insertelement <8 x i32> %a0, i32 -1, i32 0
%2 = insertelement <8 x i32> %1, i32 -1, i32 2		%2 = insertelement <8 x i32> %1, i32 -1, i32 2
%3 = insertelement <8 x i32> %2, i32 -1, i32 4		%3 = insertelement <8 x i32> %2, i32 -1, i32 4
%4 = insertelement <8 x i32> %3, i32 -1, i32 5		%4 = insertelement <8 x i32> %3, i32 -1, i32 5
%5 = sitofp <8 x i32> %4 to <8 x float>		%5 = sitofp <8 x i32> %4 to <8 x float>
ret <8 x float> %5		ret <8 x float> %5
}		}

define <8 x float> @sitofp_shuffle_allbits_v8i32(<8 x i32> %a0) {		define <8 x float> @sitofp_shuffle_allbits_v8i32(<8 x i32> %a0) {
; X86-LABEL: sitofp_shuffle_allbits_v8i32:		; X86-LABEL: sitofp_shuffle_allbits_v8i32:
; X86: # BB#0:		; X86: # BB#0:
; X86-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1		; X86-NEXT: vxorps %ymm1, %ymm1, %ymm1
; X86-NEXT: vinsertf128 $1, %xmm1, %ymm1, %ymm1		; X86-NEXT: vcmptrueps %ymm1, %ymm1, %ymm1
; X86-NEXT: vblendps {{.*#+}} ymm0 = ymm1[0],ymm0[1],ymm1[2],ymm0[3],ymm1[4],ymm0[5],ymm1[6],ymm0[7]		; X86-NEXT: vblendps {{.*#+}} ymm0 = ymm1[0],ymm0[1],ymm1[2],ymm0[3],ymm1[4],ymm0[5],ymm1[6],ymm0[7]
; X86-NEXT: vcvtdq2ps %ymm0, %ymm0		; X86-NEXT: vcvtdq2ps %ymm0, %ymm0
; X86-NEXT: retl		; X86-NEXT: retl
;		;
; X64-LABEL: sitofp_shuffle_allbits_v8i32:		; X64-LABEL: sitofp_shuffle_allbits_v8i32:
; X64: # BB#0:		; X64: # BB#0:
; X64-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1		; X64-NEXT: vxorps %ymm1, %ymm1, %ymm1
; X64-NEXT: vinsertf128 $1, %xmm1, %ymm1, %ymm1		; X64-NEXT: vcmptrueps %ymm1, %ymm1, %ymm1
; X64-NEXT: vblendps {{.*#+}} ymm0 = ymm1[0],ymm0[1],ymm1[2],ymm0[3],ymm1[4],ymm0[5],ymm1[6],ymm0[7]		; X64-NEXT: vblendps {{.*#+}} ymm0 = ymm1[0],ymm0[1],ymm1[2],ymm0[3],ymm1[4],ymm0[5],ymm1[6],ymm0[7]
; X64-NEXT: vcvtdq2ps %ymm0, %ymm0		; X64-NEXT: vcvtdq2ps %ymm0, %ymm0
; X64-NEXT: retq		; X64-NEXT: retq
%1 = shufflevector <8 x i32> %a0, <8 x i32> <i32 -1, i32 undef, i32 -1, i32 undef, i32 -1, i32 undef, i32 -1, i32 undef>, <8 x i32> <i32 8, i32 1, i32 10, i32 3, i32 12, i32 5, i32 14, i32 7>		%1 = shufflevector <8 x i32> %a0, <8 x i32> <i32 -1, i32 undef, i32 -1, i32 undef, i32 -1, i32 undef, i32 -1, i32 undef>, <8 x i32> <i32 8, i32 1, i32 10, i32 3, i32 12, i32 5, i32 14, i32 7>
%2 = sitofp <8 x i32> %1 to <8 x float>		%2 = sitofp <8 x i32> %1 to <8 x float>
ret <8 x float> %2		ret <8 x float> %2
}		}

define <8 x float> @sitofp_insert_constants_v8i32(<8 x i32> %a0) {		define <8 x float> @sitofp_insert_constants_v8i32(<8 x i32> %a0) {
; X86-LABEL: sitofp_insert_constants_v8i32:		; X86-LABEL: sitofp_insert_constants_v8i32:
; X86: # BB#0:		; X86: # BB#0:
; X86-NEXT: vxorps %ymm1, %ymm1, %ymm1		; X86-NEXT: vxorps %ymm1, %ymm1, %ymm1
; X86-NEXT: vblendps {{.*#+}} ymm0 = ymm1[0],ymm0[1,2,3,4,5,6,7]		; X86-NEXT: vblendps {{.*#+}} ymm0 = ymm1[0],ymm0[1,2,3,4,5,6,7]
; X86-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1		; X86-NEXT: vcmptrueps %ymm1, %ymm1, %ymm1
; X86-NEXT: vinsertf128 $1, %xmm1, %ymm1, %ymm1
; X86-NEXT: vblendps {{.*#+}} ymm0 = ymm0[0,1],ymm1[2],ymm0[3,4,5,6,7]		; X86-NEXT: vblendps {{.*#+}} ymm0 = ymm0[0,1],ymm1[2],ymm0[3,4,5,6,7]
; X86-NEXT: vextractf128 $1, %ymm0, %xmm1		; X86-NEXT: vextractf128 $1, %ymm0, %xmm1
; X86-NEXT: movl $2, %eax		; X86-NEXT: movl $2, %eax
; X86-NEXT: vpinsrd $0, %eax, %xmm1, %xmm1		; X86-NEXT: vpinsrd $0, %eax, %xmm1, %xmm1
; X86-NEXT: movl $-3, %eax		; X86-NEXT: movl $-3, %eax
; X86-NEXT: vpinsrd $1, %eax, %xmm1, %xmm1		; X86-NEXT: vpinsrd $1, %eax, %xmm1, %xmm1
; X86-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0		; X86-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
; X86-NEXT: vcvtdq2ps %ymm0, %ymm0		; X86-NEXT: vcvtdq2ps %ymm0, %ymm0
; X86-NEXT: retl		; X86-NEXT: retl
;		;
; X64-LABEL: sitofp_insert_constants_v8i32:		; X64-LABEL: sitofp_insert_constants_v8i32:
; X64: # BB#0:		; X64: # BB#0:
; X64-NEXT: vxorps %ymm1, %ymm1, %ymm1		; X64-NEXT: vxorps %ymm1, %ymm1, %ymm1
; X64-NEXT: vblendps {{.*#+}} ymm0 = ymm1[0],ymm0[1,2,3,4,5,6,7]		; X64-NEXT: vblendps {{.*#+}} ymm0 = ymm1[0],ymm0[1,2,3,4,5,6,7]
; X64-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1		; X64-NEXT: vcmptrueps %ymm1, %ymm1, %ymm1
; X64-NEXT: vinsertf128 $1, %xmm1, %ymm1, %ymm1
; X64-NEXT: vblendps {{.*#+}} ymm0 = ymm0[0,1],ymm1[2],ymm0[3,4,5,6,7]		; X64-NEXT: vblendps {{.*#+}} ymm0 = ymm0[0,1],ymm1[2],ymm0[3,4,5,6,7]
; X64-NEXT: vextractf128 $1, %ymm0, %xmm1		; X64-NEXT: vextractf128 $1, %ymm0, %xmm1
; X64-NEXT: movl $2, %eax		; X64-NEXT: movl $2, %eax
; X64-NEXT: vpinsrd $0, %eax, %xmm1, %xmm1		; X64-NEXT: vpinsrd $0, %eax, %xmm1, %xmm1
; X64-NEXT: movl $-3, %eax		; X64-NEXT: movl $-3, %eax
; X64-NEXT: vpinsrd $1, %eax, %xmm1, %xmm1		; X64-NEXT: vpinsrd $1, %eax, %xmm1, %xmm1
; X64-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0		; X64-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
; X64-NEXT: vcvtdq2ps %ymm0, %ymm0		; X64-NEXT: vcvtdq2ps %ymm0, %ymm0
Show All 25 Lines

test/CodeGen/X86/avx-intrinsics-fast-isel.ll

Show First 20 Lines • Show All 93 Lines • ▼ Show 20 Lines	; X64-NEXT: retq
%res = and <8 x i32> %1, %2		%res = and <8 x i32> %1, %2
%bc = bitcast <8 x i32> %res to <8 x float>		%bc = bitcast <8 x i32> %res to <8 x float>
ret <8 x float> %bc		ret <8 x float> %bc
}		}

define <4 x double> @test_mm256_andnot_pd(<4 x double> %a0, <4 x double> %a1) nounwind {		define <4 x double> @test_mm256_andnot_pd(<4 x double> %a0, <4 x double> %a1) nounwind {
; X32-LABEL: test_mm256_andnot_pd:		; X32-LABEL: test_mm256_andnot_pd:
; X32: # BB#0:		; X32: # BB#0:
; X32-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2		; X32-NEXT: vxorps %ymm2, %ymm2, %ymm2
; X32-NEXT: vinsertf128 $1, %xmm2, %ymm2, %ymm2		; X32-NEXT: vcmptrueps %ymm2, %ymm2, %ymm2
; X32-NEXT: vxorps %ymm2, %ymm0, %ymm0		; X32-NEXT: vxorps %ymm2, %ymm0, %ymm0
; X32-NEXT: vandps %ymm1, %ymm0, %ymm0		; X32-NEXT: vandps %ymm1, %ymm0, %ymm0
; X32-NEXT: retl		; X32-NEXT: retl
;		;
; X64-LABEL: test_mm256_andnot_pd:		; X64-LABEL: test_mm256_andnot_pd:
; X64: # BB#0:		; X64: # BB#0:
; X64-NEXT: vpcmpeqd %xmm2, %xmm2, %xmm2		; X64-NEXT: vxorps %ymm2, %ymm2, %ymm2
; X64-NEXT: vinsertf128 $1, %xmm2, %ymm2, %ymm2		; X64-NEXT: vcmptrueps %ymm2, %ymm2, %ymm2
; X64-NEXT: vxorps %ymm2, %ymm0, %ymm0		; X64-NEXT: vxorps %ymm2, %ymm0, %ymm0
; X64-NEXT: vandps %ymm1, %ymm0, %ymm0		; X64-NEXT: vandps %ymm1, %ymm0, %ymm0
; X64-NEXT: retq		; X64-NEXT: retq
%1 = bitcast <4 x double> %a0 to <4 x i64>		%1 = bitcast <4 x double> %a0 to <4 x i64>
%2 = bitcast <4 x double> %a1 to <4 x i64>		%2 = bitcast <4 x double> %a1 to <4 x i64>
%3 = xor <4 x i64> %1, <i64 -1, i64 -1, i64 -1, i64 -1>		%3 = xor <4 x i64> %1, <i64 -1, i64 -1, i64 -1, i64 -1>
%res = and <4 x i64> %3, %2		%res = and <4 x i64> %3, %2
%bc = bitcast <4 x i64> %res to <4 x double>		%bc = bitcast <4 x i64> %res to <4 x double>
▲ Show 20 Lines • Show All 3,658 Lines • Show Last 20 Lines

test/CodeGen/X86/pr28129.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=avx \| FileCheck %s --check-prefix=X86
				; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=avx \| FileCheck %s --check-prefix=X64

				define <4 x double> @cmp256_domain(<4 x double> %a) {
				; X86-LABEL: cmp256_domain:
				; X86: # BB#0:
				; X86-NEXT: vxorps %ymm1, %ymm1, %ymm1
				; X86-NEXT: vcmptrueps %ymm1, %ymm1, %ymm1
				; X86-NEXT: vaddpd %ymm1, %ymm0, %ymm0
				; X86-NEXT: retl
				;
				; X64-LABEL: cmp256_domain:
				; X64: # BB#0:
				; X64-NEXT: vxorps %ymm1, %ymm1, %ymm1
				; X64-NEXT: vcmptrueps %ymm1, %ymm1, %ymm1
				; X64-NEXT: vaddpd %ymm1, %ymm0, %ymm0
				; X64-NEXT: retq
				%cmp = fcmp oeq <4 x double> zeroinitializer, zeroinitializer
				%sext = sext <4 x i1> %cmp to <4 x i64>
				%mask = bitcast <4 x i64> %sext to <4 x double>
				%add = fadd <4 x double> %a, %mask
				ret <4 x double> %add
				}

test/CodeGen/X86/vector-pcmp.ll

	Show First 20 Lines • Show All 147 Lines • ▼ Show 20 Lines
	;			;
	; AVX1-LABEL: test_pcmpgtb_256:			; AVX1-LABEL: test_pcmpgtb_256:
	; AVX1: # BB#0:			; AVX1: # BB#0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
	; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2			; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
	; AVX1-NEXT: vpcmpgtb %xmm1, %xmm2, %xmm1			; AVX1-NEXT: vpcmpgtb %xmm1, %xmm2, %xmm1
	; AVX1-NEXT: vpcmpgtb %xmm0, %xmm2, %xmm0			; AVX1-NEXT: vpcmpgtb %xmm0, %xmm2, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vxorps %ymm1, %ymm1, %ymm1
	; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm1, %ymm1			; AVX1-NEXT: vcmptrueps %ymm1, %ymm1, %ymm1
	; AVX1-NEXT: vxorps %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vxorps %ymm1, %ymm0, %ymm0
				spatelUnsubmitted Not Done Reply Inline Actions That's an interesting case...that we probably can't answer at the DAG level. Would it be better to use two 128-bit vpxor instructions instead of incurring a potential domain-crossing penalty with the one 256-bit vxorps? spatel: That's an interesting case...that we probably can't answer at the DAG level. Would it be better…
				RKSimonUnsubmitted Not Done Reply Inline Actions Do you mean this? vextractf128 $1, %ymm0, %xmm1 vpxor %xmm2, %xmm2, %xmm2 vpcmpgtb %xmm1, %xmm2, %xmm1 vpcmpgtb %xmm0, %xmm2, %xmm0 vcmpeqd %xmm2, %xmm2, %xmm2 vpxor %xmm2, %xmm1, %xmm1 vpxor %xmm2, %xmm0, %xmm0 vinsertf128 $1, %xmm1, %ymm0, %ymm0 RKSimon: Do you mean this? ``` vextractf128 $1, %ymm0, %xmm1 vpxor %xmm2, %xmm2, %xmm2 vpcmpgtb %xmm1…
				spatelUnsubmitted Not Done Reply Inline Actions Yes - I remember reading somewhere (and not sure how widely this applies) that the 'insertX128' insts may not actually have domain-crossing penalties. The other variable in this mix (thinking about Jaguar here) is that the 256-bit ops may be cracked and double-pumped anyway, so if we have that + domain-crossing penalty, then the two 128-bit insts should be faster? spatel: Yes - I remember reading somewhere (and not sure how widely this applies) that the 'insertX128'…
				RKSimonUnsubmitted Not Done Reply Inline Actions A quick hot loop test suggests that the old vpcmpeqd+vinsertf128+xor approach takes 8cy, the 256-bit xor+vcmptrueps+xor approach takes 7cy and the 128-bit vpcmpeqd+2xor takes 6cy on Jaguar. It might be worth looking at splitting some 256-bit bitwise operations that take concatenated 128-bit operations, but I don't think it should get in the way of this patch. RKSimon:* A quick hot loop test suggests that the old vpcmpeqd+vinsertf128+xor approach takes 8cy, the…
				spatelUnsubmitted Not Done Reply Inline Actions Agreed - the splitting problem is separate: https://bugs.llvm.org/show_bug.cgi?id=32790 spatel: Agreed - the splitting problem is separate: https://bugs.llvm.org/show_bug.cgi?id=32790
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_pcmpgtb_256:			; AVX2-LABEL: test_pcmpgtb_256:
	; AVX2: # BB#0:			; AVX2: # BB#0:
	; AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; AVX2-NEXT: vpcmpgtb %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpcmpgtb %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	Show All 11 Lines
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-LABEL: test_pcmpgtw_256:			; AVX1-LABEL: test_pcmpgtw_256:
	; AVX1: # BB#0:			; AVX1: # BB#0:
	; AVX1-NEXT: vpsraw $15, %xmm0, %xmm1			; AVX1-NEXT: vpsraw $15, %xmm0, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: vpsraw $15, %xmm0, %xmm0			; AVX1-NEXT: vpsraw $15, %xmm0, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vxorps %ymm1, %ymm1, %ymm1
	; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm1, %ymm1			; AVX1-NEXT: vcmptrueps %ymm1, %ymm1, %ymm1
	; AVX1-NEXT: vxorps %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vxorps %ymm1, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_pcmpgtw_256:			; AVX2-LABEL: test_pcmpgtw_256:
	; AVX2: # BB#0:			; AVX2: # BB#0:
	; AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; AVX2-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpcmpgtw %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	Show All 12 Lines
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-LABEL: test_pcmpgtd_256:			; AVX1-LABEL: test_pcmpgtd_256:
	; AVX1: # BB#0:			; AVX1: # BB#0:
	; AVX1-NEXT: vpsrad $31, %xmm0, %xmm1			; AVX1-NEXT: vpsrad $31, %xmm0, %xmm1
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: vpsrad $31, %xmm0, %xmm0			; AVX1-NEXT: vpsrad $31, %xmm0, %xmm0
	; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vxorps %ymm1, %ymm1, %ymm1
	; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm1, %ymm1			; AVX1-NEXT: vcmptrueps %ymm1, %ymm1, %ymm1
	; AVX1-NEXT: vxorps %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vxorps %ymm1, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_pcmpgtd_256:			; AVX2-LABEL: test_pcmpgtd_256:
	; AVX2: # BB#0:			; AVX2: # BB#0:
	; AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; AVX2-NEXT: vpcmpgtd %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpcmpgtd %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	Show All 25 Lines
	; AVX1-LABEL: test_pcmpgtq_256:			; AVX1-LABEL: test_pcmpgtq_256:
	; AVX1: # BB#0:			; AVX1: # BB#0:
	; AVX1-NEXT: vpsrad $31, %xmm0, %xmm1			; AVX1-NEXT: vpsrad $31, %xmm0, %xmm1
	; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
	; AVX1-NEXT: vpsrad $31, %xmm0, %xmm0			; AVX1-NEXT: vpsrad $31, %xmm0, %xmm0
	; AVX1-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]			; AVX1-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
	; AVX1-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1			; AVX1-NEXT: vxorps %ymm1, %ymm1, %ymm1
	; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm1, %ymm1			; AVX1-NEXT: vcmptrueps %ymm1, %ymm1, %ymm1
	; AVX1-NEXT: vxorps %ymm1, %ymm0, %ymm0			; AVX1-NEXT: vxorps %ymm1, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: test_pcmpgtq_256:			; AVX2-LABEL: test_pcmpgtq_256:
	; AVX2: # BB#0:			; AVX2: # BB#0:
	; AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1			; AVX2-NEXT: vpcmpeqd %ymm1, %ymm1, %ymm1
	; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0			; AVX2-NEXT: vpcmpgtq %ymm1, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	▲ Show 20 Lines • Show All 227 Lines • Show Last 20 Lines

test/CodeGen/X86/xop-intrinsics-fast-isel.ll

Show First 20 Lines • Show All 493 Lines • ▼ Show 20 Lines	; X64-NEXT: retq
%res = call <2 x i64> @llvm.x86.xop.vpcmov(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2)		%res = call <2 x i64> @llvm.x86.xop.vpcmov(<2 x i64> %a0, <2 x i64> %a1, <2 x i64> %a2)
ret <2 x i64> %res		ret <2 x i64> %res
}		}
declare <2 x i64> @llvm.x86.xop.vpcmov(<2 x i64>, <2 x i64>, <2 x i64>) nounwind readnone		declare <2 x i64> @llvm.x86.xop.vpcmov(<2 x i64>, <2 x i64>, <2 x i64>) nounwind readnone

define <4 x i64> @test_mm256_cmov_si256(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> %a2) {		define <4 x i64> @test_mm256_cmov_si256(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> %a2) {
; X32-LABEL: test_mm256_cmov_si256:		; X32-LABEL: test_mm256_cmov_si256:
; X32: # BB#0:		; X32: # BB#0:
; X32-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3		; X32-NEXT: vxorps %ymm3, %ymm3, %ymm3
; X32-NEXT: vinsertf128 $1, %xmm3, %ymm3, %ymm3		; X32-NEXT: vcmptrueps %ymm3, %ymm3, %ymm3
; X32-NEXT: vxorps %ymm3, %ymm2, %ymm3		; X32-NEXT: vxorps %ymm3, %ymm2, %ymm3
; X32-NEXT: vandps %ymm2, %ymm0, %ymm0		; X32-NEXT: vandps %ymm2, %ymm0, %ymm0
; X32-NEXT: vandps %ymm3, %ymm1, %ymm1		; X32-NEXT: vandps %ymm3, %ymm1, %ymm1
; X32-NEXT: vorps %ymm1, %ymm0, %ymm0		; X32-NEXT: vorps %ymm1, %ymm0, %ymm0
; X32-NEXT: retl		; X32-NEXT: retl
;		;
; X64-LABEL: test_mm256_cmov_si256:		; X64-LABEL: test_mm256_cmov_si256:
; X64: # BB#0:		; X64: # BB#0:
; X64-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3		; X64-NEXT: vxorps %ymm3, %ymm3, %ymm3
; X64-NEXT: vinsertf128 $1, %xmm3, %ymm3, %ymm3		; X64-NEXT: vcmptrueps %ymm3, %ymm3, %ymm3
; X64-NEXT: vxorps %ymm3, %ymm2, %ymm3		; X64-NEXT: vxorps %ymm3, %ymm2, %ymm3
; X64-NEXT: vandps %ymm2, %ymm0, %ymm0		; X64-NEXT: vandps %ymm2, %ymm0, %ymm0
; X64-NEXT: vandps %ymm3, %ymm1, %ymm1		; X64-NEXT: vandps %ymm3, %ymm1, %ymm1
; X64-NEXT: vorps %ymm1, %ymm0, %ymm0		; X64-NEXT: vorps %ymm1, %ymm0, %ymm0
; X64-NEXT: retq		; X64-NEXT: retq
%res = call <4 x i64> @llvm.x86.xop.vpcmov.256(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> %a2)		%res = call <4 x i64> @llvm.x86.xop.vpcmov.256(<4 x i64> %a0, <4 x i64> %a1, <4 x i64> %a2)
ret <4 x i64> %res		ret <4 x i64> %res
}		}
▲ Show 20 Lines • Show All 600 Lines • Show Last 20 Lines

This is an archive of the discontinued LLVM Phabricator instance.

[x86, SSE] AVX1 PR28129
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 96347

lib/Target/X86/X86InstrSSE.td

test/CodeGen/X86/all-ones-vector.ll

test/CodeGen/X86/avx-basic.ll

test/CodeGen/X86/avx-cvt-3.ll

test/CodeGen/X86/avx-intrinsics-fast-isel.ll

test/CodeGen/X86/pr28129.ll

test/CodeGen/X86/vector-pcmp.ll

test/CodeGen/X86/xop-intrinsics-fast-isel.ll

This is an archive of the discontinued LLVM Phabricator instance.

[x86, SSE] AVX1 PR28129 ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 96347

lib/Target/X86/X86InstrSSE.td

test/CodeGen/X86/all-ones-vector.ll

test/CodeGen/X86/avx-basic.ll

test/CodeGen/X86/avx-cvt-3.ll

test/CodeGen/X86/avx-intrinsics-fast-isel.ll

test/CodeGen/X86/pr28129.ll

test/CodeGen/X86/vector-pcmp.ll

test/CodeGen/X86/xop-intrinsics-fast-isel.ll

[x86, SSE] AVX1 PR28129
ClosedPublic