Diff 129674

lib/Target/X86/X86ISelDAGToDAG.cpp

Show First 20 Lines • Show All 362 Lines • ▼ Show 20 Lines	inline SDValue getI8Imm(unsigned Imm, const SDLoc &DL) {
return CurDAG->getTargetConstant(Imm, DL, MVT::i8);		return CurDAG->getTargetConstant(Imm, DL, MVT::i8);
}		}

/// Return a target constant with the specified value, of type i32.		/// Return a target constant with the specified value, of type i32.
inline SDValue getI32Imm(unsigned Imm, const SDLoc &DL) {		inline SDValue getI32Imm(unsigned Imm, const SDLoc &DL) {
return CurDAG->getTargetConstant(Imm, DL, MVT::i32);		return CurDAG->getTargetConstant(Imm, DL, MVT::i32);
}		}

		/// Return a target constant with the specified value, of type i64.
		inline SDValue getI64Imm(uint64_t Imm, const SDLoc &DL) {
		return CurDAG->getTargetConstant(Imm, DL, MVT::i64);
		}

SDValue getExtractVEXTRACTImmediate(SDNode *N, unsigned VecWidth,		SDValue getExtractVEXTRACTImmediate(SDNode *N, unsigned VecWidth,
const SDLoc &DL) {		const SDLoc &DL) {
assert((VecWidth == 128 \|\| VecWidth == 256) && "Unexpected vector width");		assert((VecWidth == 128 \|\| VecWidth == 256) && "Unexpected vector width");
uint64_t Index = N->getConstantOperandVal(1);		uint64_t Index = N->getConstantOperandVal(1);
MVT VecVT = N->getOperand(0).getSimpleValueType();		MVT VecVT = N->getOperand(0).getSimpleValueType();
return getI8Imm((Index * VecVT.getScalarSizeInBits()) / VecWidth, DL);		return getI8Imm((Index * VecVT.getScalarSizeInBits()) / VecWidth, DL);
}		}

▲ Show 20 Lines • Show All 2,730 Lines • Show Last 20 Lines

lib/Target/X86/X86InstrCompiler.td

	Show First 20 Lines • Show All 1,457 Lines • ▼ Show 20 Lines
	// r & (2^8-1) ==> movz			// r & (2^8-1) ==> movz
	def : Pat<(and GR64:$src, 0xff),			def : Pat<(and GR64:$src, 0xff),
	(SUBREG_TO_REG (i64 0),			(SUBREG_TO_REG (i64 0),
	(MOVZX32rr8 (i8 (EXTRACT_SUBREG GR64:$src, sub_8bit))),			(MOVZX32rr8 (i8 (EXTRACT_SUBREG GR64:$src, sub_8bit))),
	sub_32bit)>;			sub_32bit)>;
	} // AddedComplexity = 1			} // AddedComplexity = 1


				// Try to use BTS/BTR/BTC for single bit operations on the upper 32-bits.

				def BTRXForm : SDNodeXForm<imm, [{
				// Transformation function: Find the lowest 0.
				return getI64Imm((uint8_t)N->getAPIntValue().countTrailingOnes(), SDLoc(N));
				}]>;

				def BTCBTSXForm : SDNodeXForm<imm, [{
				// Transformation function: Find the lowest 1.
				return getI64Imm((uint8_t)N->getAPIntValue().countTrailingZeros(), SDLoc(N));
				}]>;

				def BTRMask64 : ImmLeaf<i64, [{
				return !isUInt<32>(Imm) && !isInt<32>(Imm) && isPowerOf2_64(~Imm);
				}]>;

				def BTCBTSMask64 : ImmLeaf<i64, [{
				return !isInt<32>(Imm) && isPowerOf2_64(Imm);
				}]>;

				let AddedComplexity = 1 in {
				def : Pat<(and GR64:$src1, BTRMask64:$mask),
				(BTR64ri8 GR64:$src1, (BTRXForm imm:$mask))>;
				def : Pat<(or GR64:$src1, BTCBTSMask64:$mask),
				(BTS64ri8 GR64:$src1, (BTCBTSXForm imm:$mask))>;
				def : Pat<(xor GR64:$src1, BTCBTSMask64:$mask),
				(BTC64ri8 GR64:$src1, (BTCBTSXForm imm:$mask))>;
				}


	// sext_inreg patterns			// sext_inreg patterns
	def : Pat<(sext_inreg GR32:$src, i16),			def : Pat<(sext_inreg GR32:$src, i16),
	(MOVSX32rr16 (EXTRACT_SUBREG GR32:$src, sub_16bit))>;			(MOVSX32rr16 (EXTRACT_SUBREG GR32:$src, sub_16bit))>;
	def : Pat<(sext_inreg GR32:$src, i8),			def : Pat<(sext_inreg GR32:$src, i8),
	(MOVSX32rr8 (EXTRACT_SUBREG GR32:$src, sub_8bit))>;			(MOVSX32rr8 (EXTRACT_SUBREG GR32:$src, sub_8bit))>;

	def : Pat<(sext_inreg GR16:$src, i8),			def : Pat<(sext_inreg GR16:$src, i8),
	(EXTRACT_SUBREG (MOVSX32rr8 (EXTRACT_SUBREG GR16:$src, sub_8bit)),			(EXTRACT_SUBREG (MOVSX32rr8 (EXTRACT_SUBREG GR16:$src, sub_8bit)),
	▲ Show 20 Lines • Show All 528 Lines • Show Last 20 Lines

lib/Target/X86/X86InstrInfo.td

	Show First 20 Lines • Show All 2,391 Lines • ▼ Show 20 Lines
	}]>;			}]>;

	def BEXTRMaskXForm : SDNodeXForm<imm, [{			def BEXTRMaskXForm : SDNodeXForm<imm, [{
	unsigned Length = countTrailingOnes(N->getZExtValue());			unsigned Length = countTrailingOnes(N->getZExtValue());
	return getI32Imm(Length << 8, SDLoc(N));			return getI32Imm(Length << 8, SDLoc(N));
	}]>;			}]>;

	def AndMask64 : ImmLeaf<i64, [{			def AndMask64 : ImmLeaf<i64, [{
	return isMask_64(Imm) && Imm > UINT32_MAX;			return isMask_64(Imm) && !isUInt<32>(Imm);
	}]>;			}]>;

	// Use BEXTR for 64-bit 'and' with large immediate 'mask'.			// Use BEXTR for 64-bit 'and' with large immediate 'mask'.
	let Predicates = [HasBMI, NoBMI2, NoTBM] in {			let Predicates = [HasBMI, NoBMI2, NoTBM] in {
	def : Pat<(and GR64:$src, AndMask64:$mask),			def : Pat<(and GR64:$src, AndMask64:$mask),
	(BEXTR64rr GR64:$src,			(BEXTR64rr GR64:$src,
	(SUBREG_TO_REG (i64 0),			(SUBREG_TO_REG (i64 0),
	(MOV32ri (BEXTRMaskXForm imm:$mask)), sub_32bit))>;			(MOV32ri (BEXTRMaskXForm imm:$mask)), sub_32bit))>;
	▲ Show 20 Lines • Show All 934 Lines • Show Last 20 Lines

test/CodeGen/X86/half.ll

	Show First 20 Lines • Show All 268 Lines • ▼ Show 20 Lines
	; CHECK-LIBCALL-LABEL: test_fptoui_i64:			; CHECK-LIBCALL-LABEL: test_fptoui_i64:
	; CHECK-LIBCALL: # %bb.0:			; CHECK-LIBCALL: # %bb.0:
	; CHECK-LIBCALL-NEXT: pushq %rax			; CHECK-LIBCALL-NEXT: pushq %rax
	; CHECK-LIBCALL-NEXT: movzwl (%rdi), %edi			; CHECK-LIBCALL-NEXT: movzwl (%rdi), %edi
	; CHECK-LIBCALL-NEXT: callq __gnu_h2f_ieee			; CHECK-LIBCALL-NEXT: callq __gnu_h2f_ieee
	; CHECK-LIBCALL-NEXT: movss {{.*#+}} xmm1 = mem[0],zero,zero,zero			; CHECK-LIBCALL-NEXT: movss {{.*#+}} xmm1 = mem[0],zero,zero,zero
	; CHECK-LIBCALL-NEXT: movaps %xmm0, %xmm2			; CHECK-LIBCALL-NEXT: movaps %xmm0, %xmm2
	; CHECK-LIBCALL-NEXT: subss %xmm1, %xmm2			; CHECK-LIBCALL-NEXT: subss %xmm1, %xmm2
	; CHECK-LIBCALL-NEXT: cvttss2si %xmm2, %rax			; CHECK-LIBCALL-NEXT: cvttss2si %xmm2, %rcx
	; CHECK-LIBCALL-NEXT: movabsq $-9223372036854775808, %rcx # imm = 0x8000000000000000			; CHECK-LIBCALL-NEXT: btcq $63, %rcx
	; CHECK-LIBCALL-NEXT: xorq %rax, %rcx
	; CHECK-LIBCALL-NEXT: cvttss2si %xmm0, %rax			; CHECK-LIBCALL-NEXT: cvttss2si %xmm0, %rax
	; CHECK-LIBCALL-NEXT: ucomiss %xmm1, %xmm0			; CHECK-LIBCALL-NEXT: ucomiss %xmm1, %xmm0
	; CHECK-LIBCALL-NEXT: cmovaeq %rcx, %rax			; CHECK-LIBCALL-NEXT: cmovaeq %rcx, %rax
	; CHECK-LIBCALL-NEXT: popq %rcx			; CHECK-LIBCALL-NEXT: popq %rcx
	; CHECK-LIBCALL-NEXT: retq			; CHECK-LIBCALL-NEXT: retq
	;			;
	; BWON-F16C-LABEL: test_fptoui_i64:			; BWON-F16C-LABEL: test_fptoui_i64:
	; BWON-F16C: # %bb.0:			; BWON-F16C: # %bb.0:
	; BWON-F16C-NEXT: movswl (%rdi), %eax			; BWON-F16C-NEXT: movswl (%rdi), %eax
	; BWON-F16C-NEXT: vmovd %eax, %xmm0			; BWON-F16C-NEXT: vmovd %eax, %xmm0
	; BWON-F16C-NEXT: vcvtph2ps %xmm0, %xmm0			; BWON-F16C-NEXT: vcvtph2ps %xmm0, %xmm0
	; BWON-F16C-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero			; BWON-F16C-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero
	; BWON-F16C-NEXT: vsubss %xmm1, %xmm0, %xmm2			; BWON-F16C-NEXT: vsubss %xmm1, %xmm0, %xmm2
	; BWON-F16C-NEXT: vcvttss2si %xmm2, %rax			; BWON-F16C-NEXT: vcvttss2si %xmm2, %rcx
	; BWON-F16C-NEXT: movabsq $-9223372036854775808, %rcx # imm = 0x8000000000000000			; BWON-F16C-NEXT: btcq $63, %rcx
	; BWON-F16C-NEXT: xorq %rax, %rcx
	; BWON-F16C-NEXT: vcvttss2si %xmm0, %rax			; BWON-F16C-NEXT: vcvttss2si %xmm0, %rax
	; BWON-F16C-NEXT: vucomiss %xmm1, %xmm0			; BWON-F16C-NEXT: vucomiss %xmm1, %xmm0
	; BWON-F16C-NEXT: cmovaeq %rcx, %rax			; BWON-F16C-NEXT: cmovaeq %rcx, %rax
	; BWON-F16C-NEXT: retq			; BWON-F16C-NEXT: retq
	;			;
	; CHECK-I686-LABEL: test_fptoui_i64:			; CHECK-I686-LABEL: test_fptoui_i64:
	; CHECK-I686: # %bb.0:			; CHECK-I686: # %bb.0:
	; CHECK-I686-NEXT: subl $12, %esp			; CHECK-I686-NEXT: subl $12, %esp
	▲ Show 20 Lines • Show All 638 Lines • Show Last 20 Lines

test/CodeGen/X86/vec_fp_to_int.ll

	Show First 20 Lines • Show All 252 Lines • ▼ Show 20 Lines

	define <2 x i64> @fptoui_2f64_to_2i64(<2 x double> %a) {			define <2 x i64> @fptoui_2f64_to_2i64(<2 x double> %a) {
	; SSE-LABEL: fptoui_2f64_to_2i64:			; SSE-LABEL: fptoui_2f64_to_2i64:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movsd {{.*#+}} xmm2 = mem[0],zero			; SSE-NEXT: movsd {{.*#+}} xmm2 = mem[0],zero
	; SSE-NEXT: movapd %xmm0, %xmm1			; SSE-NEXT: movapd %xmm0, %xmm1
	; SSE-NEXT: subsd %xmm2, %xmm1			; SSE-NEXT: subsd %xmm2, %xmm1
	; SSE-NEXT: cvttsd2si %xmm1, %rax			; SSE-NEXT: cvttsd2si %xmm1, %rax
	; SSE-NEXT: movabsq $-9223372036854775808, %rcx # imm = 0x8000000000000000			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: xorq %rcx, %rax			; SSE-NEXT: cvttsd2si %xmm0, %rcx
	; SSE-NEXT: cvttsd2si %xmm0, %rdx
	; SSE-NEXT: ucomisd %xmm2, %xmm0			; SSE-NEXT: ucomisd %xmm2, %xmm0
	; SSE-NEXT: cmovaeq %rax, %rdx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rdx, %xmm1			; SSE-NEXT: movq %rcx, %xmm1
	; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]			; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]
	; SSE-NEXT: movaps %xmm0, %xmm3			; SSE-NEXT: movaps %xmm0, %xmm3
	; SSE-NEXT: subsd %xmm2, %xmm3			; SSE-NEXT: subsd %xmm2, %xmm3
	; SSE-NEXT: cvttsd2si %xmm3, %rax			; SSE-NEXT: cvttsd2si %xmm3, %rax
	; SSE-NEXT: xorq %rcx, %rax			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: cvttsd2si %xmm0, %rcx			; SSE-NEXT: cvttsd2si %xmm0, %rcx
	; SSE-NEXT: ucomisd %xmm2, %xmm0			; SSE-NEXT: ucomisd %xmm2, %xmm0
	; SSE-NEXT: cmovaeq %rax, %rcx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rcx, %xmm0			; SSE-NEXT: movq %rcx, %xmm0
	; SSE-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]			; SSE-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]
	; SSE-NEXT: movdqa %xmm1, %xmm0			; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; VEX-LABEL: fptoui_2f64_to_2i64:			; VEX-LABEL: fptoui_2f64_to_2i64:
	; VEX: # %bb.0:			; VEX: # %bb.0:
	; VEX-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero			; VEX-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero
	; VEX-NEXT: vsubsd %xmm1, %xmm0, %xmm2			; VEX-NEXT: vsubsd %xmm1, %xmm0, %xmm2
	; VEX-NEXT: vcvttsd2si %xmm2, %rax			; VEX-NEXT: vcvttsd2si %xmm2, %rax
	; VEX-NEXT: movabsq $-9223372036854775808, %rcx # imm = 0x8000000000000000			; VEX-NEXT: btcq $63, %rax
	; VEX-NEXT: xorq %rcx, %rax			; VEX-NEXT: vcvttsd2si %xmm0, %rcx
	; VEX-NEXT: vcvttsd2si %xmm0, %rdx
	; VEX-NEXT: vucomisd %xmm1, %xmm0			; VEX-NEXT: vucomisd %xmm1, %xmm0
	; VEX-NEXT: cmovaeq %rax, %rdx			; VEX-NEXT: cmovaeq %rax, %rcx
	; VEX-NEXT: vmovq %rdx, %xmm2			; VEX-NEXT: vmovq %rcx, %xmm2
	; VEX-NEXT: vpermilpd {{.*#+}} xmm0 = xmm0[1,0]			; VEX-NEXT: vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
	; VEX-NEXT: vsubsd %xmm1, %xmm0, %xmm3			; VEX-NEXT: vsubsd %xmm1, %xmm0, %xmm3
	; VEX-NEXT: vcvttsd2si %xmm3, %rax			; VEX-NEXT: vcvttsd2si %xmm3, %rax
	; VEX-NEXT: xorq %rcx, %rax			; VEX-NEXT: btcq $63, %rax
	; VEX-NEXT: vcvttsd2si %xmm0, %rcx			; VEX-NEXT: vcvttsd2si %xmm0, %rcx
	; VEX-NEXT: vucomisd %xmm1, %xmm0			; VEX-NEXT: vucomisd %xmm1, %xmm0
	; VEX-NEXT: cmovaeq %rax, %rcx			; VEX-NEXT: cmovaeq %rax, %rcx
	; VEX-NEXT: vmovq %rcx, %xmm0			; VEX-NEXT: vmovq %rcx, %xmm0
	; VEX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm2[0],xmm0[0]			; VEX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm2[0],xmm0[0]
	; VEX-NEXT: retq			; VEX-NEXT: retq
	;			;
	; AVX512F-LABEL: fptoui_2f64_to_2i64:			; AVX512F-LABEL: fptoui_2f64_to_2i64:
	Show All 34 Lines

	define <4 x i32> @fptoui_2f64_to_4i32(<2 x double> %a) {			define <4 x i32> @fptoui_2f64_to_4i32(<2 x double> %a) {
	; SSE-LABEL: fptoui_2f64_to_4i32:			; SSE-LABEL: fptoui_2f64_to_4i32:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movsd {{.*#+}} xmm2 = mem[0],zero			; SSE-NEXT: movsd {{.*#+}} xmm2 = mem[0],zero
	; SSE-NEXT: movapd %xmm0, %xmm1			; SSE-NEXT: movapd %xmm0, %xmm1
	; SSE-NEXT: subsd %xmm2, %xmm1			; SSE-NEXT: subsd %xmm2, %xmm1
	; SSE-NEXT: cvttsd2si %xmm1, %rax			; SSE-NEXT: cvttsd2si %xmm1, %rax
	; SSE-NEXT: movabsq $-9223372036854775808, %rcx # imm = 0x8000000000000000			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: xorq %rcx, %rax			; SSE-NEXT: cvttsd2si %xmm0, %rcx
	; SSE-NEXT: cvttsd2si %xmm0, %rdx
	; SSE-NEXT: ucomisd %xmm2, %xmm0			; SSE-NEXT: ucomisd %xmm2, %xmm0
	; SSE-NEXT: cmovaeq %rax, %rdx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rdx, %xmm1			; SSE-NEXT: movq %rcx, %xmm1
	; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]			; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]
	; SSE-NEXT: movaps %xmm0, %xmm3			; SSE-NEXT: movaps %xmm0, %xmm3
	; SSE-NEXT: subsd %xmm2, %xmm3			; SSE-NEXT: subsd %xmm2, %xmm3
	; SSE-NEXT: cvttsd2si %xmm3, %rax			; SSE-NEXT: cvttsd2si %xmm3, %rax
	; SSE-NEXT: xorq %rcx, %rax			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: cvttsd2si %xmm0, %rcx			; SSE-NEXT: cvttsd2si %xmm0, %rcx
	; SSE-NEXT: ucomisd %xmm2, %xmm0			; SSE-NEXT: ucomisd %xmm2, %xmm0
	; SSE-NEXT: cmovaeq %rax, %rcx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rcx, %xmm0			; SSE-NEXT: movq %rcx, %xmm0
	; SSE-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]			; SSE-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]
	; SSE-NEXT: pxor %xmm0, %xmm0			; SSE-NEXT: pxor %xmm0, %xmm0
	; SSE-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm0[2,3]			; SSE-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm0[2,3]
	; SSE-NEXT: movaps %xmm1, %xmm0			; SSE-NEXT: movaps %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; VEX-LABEL: fptoui_2f64_to_4i32:			; VEX-LABEL: fptoui_2f64_to_4i32:
	; VEX: # %bb.0:			; VEX: # %bb.0:
	; VEX-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero			; VEX-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero
	; VEX-NEXT: vsubsd %xmm1, %xmm0, %xmm2			; VEX-NEXT: vsubsd %xmm1, %xmm0, %xmm2
	; VEX-NEXT: vcvttsd2si %xmm2, %rax			; VEX-NEXT: vcvttsd2si %xmm2, %rax
	; VEX-NEXT: movabsq $-9223372036854775808, %rcx # imm = 0x8000000000000000			; VEX-NEXT: btcq $63, %rax
	; VEX-NEXT: xorq %rcx, %rax			; VEX-NEXT: vcvttsd2si %xmm0, %rcx
	; VEX-NEXT: vcvttsd2si %xmm0, %rdx
	; VEX-NEXT: vucomisd %xmm1, %xmm0			; VEX-NEXT: vucomisd %xmm1, %xmm0
	; VEX-NEXT: cmovaeq %rax, %rdx			; VEX-NEXT: cmovaeq %rax, %rcx
	; VEX-NEXT: vmovq %rdx, %xmm2			; VEX-NEXT: vmovq %rcx, %xmm2
	; VEX-NEXT: vpermilpd {{.*#+}} xmm0 = xmm0[1,0]			; VEX-NEXT: vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
	; VEX-NEXT: vsubsd %xmm1, %xmm0, %xmm3			; VEX-NEXT: vsubsd %xmm1, %xmm0, %xmm3
	; VEX-NEXT: vcvttsd2si %xmm3, %rax			; VEX-NEXT: vcvttsd2si %xmm3, %rax
	; VEX-NEXT: xorq %rcx, %rax			; VEX-NEXT: btcq $63, %rax
	; VEX-NEXT: vcvttsd2si %xmm0, %rcx			; VEX-NEXT: vcvttsd2si %xmm0, %rcx
	; VEX-NEXT: vucomisd %xmm1, %xmm0			; VEX-NEXT: vucomisd %xmm1, %xmm0
	; VEX-NEXT: cmovaeq %rax, %rcx			; VEX-NEXT: cmovaeq %rax, %rcx
	; VEX-NEXT: vmovq %rcx, %xmm0			; VEX-NEXT: vmovq %rcx, %xmm0
	; VEX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm2[0],xmm0[0]			; VEX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm2[0],xmm0[0]
	; VEX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero			; VEX-NEXT: vinsertps {{.*#+}} xmm0 = xmm0[0,2],zero,zero
	; VEX-NEXT: retq			; VEX-NEXT: retq
	;			;
	Show All 29 Lines

	define <4 x i32> @fptoui_2f64_to_2i32(<2 x double> %a) {			define <4 x i32> @fptoui_2f64_to_2i32(<2 x double> %a) {
	; SSE-LABEL: fptoui_2f64_to_2i32:			; SSE-LABEL: fptoui_2f64_to_2i32:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero			; SSE-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
	; SSE-NEXT: movapd %xmm0, %xmm2			; SSE-NEXT: movapd %xmm0, %xmm2
	; SSE-NEXT: subsd %xmm1, %xmm2			; SSE-NEXT: subsd %xmm1, %xmm2
	; SSE-NEXT: cvttsd2si %xmm2, %rax			; SSE-NEXT: cvttsd2si %xmm2, %rax
	; SSE-NEXT: movabsq $-9223372036854775808, %rcx # imm = 0x8000000000000000			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: xorq %rcx, %rax			; SSE-NEXT: cvttsd2si %xmm0, %rcx
	; SSE-NEXT: cvttsd2si %xmm0, %rdx
	; SSE-NEXT: ucomisd %xmm1, %xmm0			; SSE-NEXT: ucomisd %xmm1, %xmm0
	; SSE-NEXT: cmovaeq %rax, %rdx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rdx, %xmm2			; SSE-NEXT: movq %rcx, %xmm2
	; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]			; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]
	; SSE-NEXT: movaps %xmm0, %xmm3			; SSE-NEXT: movaps %xmm0, %xmm3
	; SSE-NEXT: subsd %xmm1, %xmm3			; SSE-NEXT: subsd %xmm1, %xmm3
	; SSE-NEXT: cvttsd2si %xmm3, %rax			; SSE-NEXT: cvttsd2si %xmm3, %rax
	; SSE-NEXT: xorq %rcx, %rax			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: cvttsd2si %xmm0, %rcx			; SSE-NEXT: cvttsd2si %xmm0, %rcx
	; SSE-NEXT: ucomisd %xmm1, %xmm0			; SSE-NEXT: ucomisd %xmm1, %xmm0
	; SSE-NEXT: cmovaeq %rax, %rcx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rcx, %xmm0			; SSE-NEXT: movq %rcx, %xmm0
	; SSE-NEXT: punpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm0[0]			; SSE-NEXT: punpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm0[0]
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm2[0,2,2,3]			; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm2[0,2,2,3]
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; VEX-LABEL: fptoui_2f64_to_2i32:			; VEX-LABEL: fptoui_2f64_to_2i32:
	; VEX: # %bb.0:			; VEX: # %bb.0:
	; VEX-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero			; VEX-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero
	; VEX-NEXT: vsubsd %xmm1, %xmm0, %xmm2			; VEX-NEXT: vsubsd %xmm1, %xmm0, %xmm2
	; VEX-NEXT: vcvttsd2si %xmm2, %rax			; VEX-NEXT: vcvttsd2si %xmm2, %rax
	; VEX-NEXT: movabsq $-9223372036854775808, %rcx # imm = 0x8000000000000000			; VEX-NEXT: btcq $63, %rax
	; VEX-NEXT: xorq %rcx, %rax			; VEX-NEXT: vcvttsd2si %xmm0, %rcx
	; VEX-NEXT: vcvttsd2si %xmm0, %rdx
	; VEX-NEXT: vucomisd %xmm1, %xmm0			; VEX-NEXT: vucomisd %xmm1, %xmm0
	; VEX-NEXT: cmovaeq %rax, %rdx			; VEX-NEXT: cmovaeq %rax, %rcx
	; VEX-NEXT: vmovq %rdx, %xmm2			; VEX-NEXT: vmovq %rcx, %xmm2
	; VEX-NEXT: vpermilpd {{.*#+}} xmm0 = xmm0[1,0]			; VEX-NEXT: vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
	; VEX-NEXT: vsubsd %xmm1, %xmm0, %xmm3			; VEX-NEXT: vsubsd %xmm1, %xmm0, %xmm3
	; VEX-NEXT: vcvttsd2si %xmm3, %rax			; VEX-NEXT: vcvttsd2si %xmm3, %rax
	; VEX-NEXT: xorq %rcx, %rax			; VEX-NEXT: btcq $63, %rax
	; VEX-NEXT: vcvttsd2si %xmm0, %rcx			; VEX-NEXT: vcvttsd2si %xmm0, %rcx
	; VEX-NEXT: vucomisd %xmm1, %xmm0			; VEX-NEXT: vucomisd %xmm1, %xmm0
	; VEX-NEXT: cmovaeq %rax, %rcx			; VEX-NEXT: cmovaeq %rax, %rcx
	; VEX-NEXT: vmovq %rcx, %xmm0			; VEX-NEXT: vmovq %rcx, %xmm0
	; VEX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm2[0],xmm0[0]			; VEX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm2[0],xmm0[0]
	; VEX-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]			; VEX-NEXT: vpshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
	; VEX-NEXT: retq			; VEX-NEXT: retq
	;			;
	Show All 29 Lines

	define <4 x i32> @fptoui_4f64_to_2i32(<2 x double> %a) {			define <4 x i32> @fptoui_4f64_to_2i32(<2 x double> %a) {
	; SSE-LABEL: fptoui_4f64_to_2i32:			; SSE-LABEL: fptoui_4f64_to_2i32:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movsd {{.*#+}} xmm2 = mem[0],zero			; SSE-NEXT: movsd {{.*#+}} xmm2 = mem[0],zero
	; SSE-NEXT: movapd %xmm0, %xmm1			; SSE-NEXT: movapd %xmm0, %xmm1
	; SSE-NEXT: subsd %xmm2, %xmm1			; SSE-NEXT: subsd %xmm2, %xmm1
	; SSE-NEXT: cvttsd2si %xmm1, %rax			; SSE-NEXT: cvttsd2si %xmm1, %rax
	; SSE-NEXT: movabsq $-9223372036854775808, %rcx # imm = 0x8000000000000000			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: xorq %rcx, %rax			; SSE-NEXT: cvttsd2si %xmm0, %rcx
	; SSE-NEXT: cvttsd2si %xmm0, %rdx
	; SSE-NEXT: ucomisd %xmm2, %xmm0			; SSE-NEXT: ucomisd %xmm2, %xmm0
	; SSE-NEXT: cmovaeq %rax, %rdx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rdx, %xmm1			; SSE-NEXT: movq %rcx, %xmm1
	; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]			; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]
	; SSE-NEXT: movaps %xmm0, %xmm3			; SSE-NEXT: movaps %xmm0, %xmm3
	; SSE-NEXT: subsd %xmm2, %xmm3			; SSE-NEXT: subsd %xmm2, %xmm3
	; SSE-NEXT: cvttsd2si %xmm3, %rax			; SSE-NEXT: cvttsd2si %xmm3, %rax
	; SSE-NEXT: xorq %rcx, %rax			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: cvttsd2si %xmm0, %rdx			; SSE-NEXT: cvttsd2si %xmm0, %rcx
	; SSE-NEXT: ucomisd %xmm2, %xmm0			; SSE-NEXT: ucomisd %xmm2, %xmm0
	; SSE-NEXT: cmovaeq %rax, %rdx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rdx, %xmm0			; SSE-NEXT: movq %rcx, %xmm0
	; SSE-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]			; SSE-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]
	; SSE-NEXT: cvttsd2si %xmm0, %rax			; SSE-NEXT: cvttsd2si %xmm0, %rax
	; SSE-NEXT: xorq %rax, %rcx			; SSE-NEXT: movq %rax, %rcx
				; SSE-NEXT: btcq $63, %rcx
	; SSE-NEXT: ucomisd %xmm2, %xmm0			; SSE-NEXT: ucomisd %xmm2, %xmm0
	; SSE-NEXT: cmovbq %rax, %rcx			; SSE-NEXT: cmovbq %rax, %rcx
	; SSE-NEXT: movq %rcx, %xmm0			; SSE-NEXT: movq %rcx, %xmm0
	; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,1,0,1]			; SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,1,0,1]
	; SSE-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm0[0,2]			; SSE-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm0[0,2]
	; SSE-NEXT: movaps %xmm1, %xmm0			; SSE-NEXT: movaps %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines
	}			}

	define <4 x i64> @fptoui_4f64_to_4i64(<4 x double> %a) {			define <4 x i64> @fptoui_4f64_to_4i64(<4 x double> %a) {
	; SSE-LABEL: fptoui_4f64_to_4i64:			; SSE-LABEL: fptoui_4f64_to_4i64:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movapd %xmm0, %xmm2			; SSE-NEXT: movapd %xmm0, %xmm2
	; SSE-NEXT: movsd {{.*#+}} xmm3 = mem[0],zero			; SSE-NEXT: movsd {{.*#+}} xmm3 = mem[0],zero
	; SSE-NEXT: subsd %xmm3, %xmm0			; SSE-NEXT: subsd %xmm3, %xmm0
	; SSE-NEXT: cvttsd2si %xmm0, %rcx			; SSE-NEXT: cvttsd2si %xmm0, %rax
	; SSE-NEXT: movabsq $-9223372036854775808, %rax # imm = 0x8000000000000000			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: xorq %rax, %rcx			; SSE-NEXT: cvttsd2si %xmm2, %rcx
	; SSE-NEXT: cvttsd2si %xmm2, %rdx
	; SSE-NEXT: ucomisd %xmm3, %xmm2			; SSE-NEXT: ucomisd %xmm3, %xmm2
	; SSE-NEXT: cmovaeq %rcx, %rdx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rdx, %xmm0			; SSE-NEXT: movq %rcx, %xmm0
	; SSE-NEXT: movhlps {{.*#+}} xmm2 = xmm2[1,1]			; SSE-NEXT: movhlps {{.*#+}} xmm2 = xmm2[1,1]
	; SSE-NEXT: movaps %xmm2, %xmm4			; SSE-NEXT: movaps %xmm2, %xmm4
	; SSE-NEXT: subsd %xmm3, %xmm4			; SSE-NEXT: subsd %xmm3, %xmm4
	; SSE-NEXT: cvttsd2si %xmm4, %rcx			; SSE-NEXT: cvttsd2si %xmm4, %rax
	; SSE-NEXT: xorq %rax, %rcx			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: cvttsd2si %xmm2, %rdx			; SSE-NEXT: cvttsd2si %xmm2, %rcx
	; SSE-NEXT: ucomisd %xmm3, %xmm2			; SSE-NEXT: ucomisd %xmm3, %xmm2
	; SSE-NEXT: cmovaeq %rcx, %rdx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rdx, %xmm2			; SSE-NEXT: movq %rcx, %xmm2
	; SSE-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm2[0]			; SSE-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm2[0]
	; SSE-NEXT: movapd %xmm1, %xmm2			; SSE-NEXT: movapd %xmm1, %xmm2
	; SSE-NEXT: subsd %xmm3, %xmm2			; SSE-NEXT: subsd %xmm3, %xmm2
	; SSE-NEXT: cvttsd2si %xmm2, %rcx			; SSE-NEXT: cvttsd2si %xmm2, %rax
	; SSE-NEXT: xorq %rax, %rcx			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: cvttsd2si %xmm1, %rdx			; SSE-NEXT: cvttsd2si %xmm1, %rcx
	; SSE-NEXT: ucomisd %xmm3, %xmm1			; SSE-NEXT: ucomisd %xmm3, %xmm1
	; SSE-NEXT: cmovaeq %rcx, %rdx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rdx, %xmm2			; SSE-NEXT: movq %rcx, %xmm2
	; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm1[1,1]			; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm1[1,1]
	; SSE-NEXT: movaps %xmm1, %xmm4			; SSE-NEXT: movaps %xmm1, %xmm4
	; SSE-NEXT: subsd %xmm3, %xmm4			; SSE-NEXT: subsd %xmm3, %xmm4
	; SSE-NEXT: cvttsd2si %xmm4, %rcx			; SSE-NEXT: cvttsd2si %xmm4, %rax
	; SSE-NEXT: xorq %rax, %rcx			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: cvttsd2si %xmm1, %rax			; SSE-NEXT: cvttsd2si %xmm1, %rcx
	; SSE-NEXT: ucomisd %xmm3, %xmm1			; SSE-NEXT: ucomisd %xmm3, %xmm1
	; SSE-NEXT: cmovaeq %rcx, %rax			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rax, %xmm1			; SSE-NEXT: movq %rcx, %xmm1
	; SSE-NEXT: punpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm1[0]			; SSE-NEXT: punpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm1[0]
	; SSE-NEXT: movdqa %xmm2, %xmm1			; SSE-NEXT: movdqa %xmm2, %xmm1
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-LABEL: fptoui_4f64_to_4i64:			; AVX1-LABEL: fptoui_4f64_to_4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
	; AVX1-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero			; AVX1-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero
	; AVX1-NEXT: vsubsd %xmm1, %xmm2, %xmm3			; AVX1-NEXT: vsubsd %xmm1, %xmm2, %xmm3
	; AVX1-NEXT: vcvttsd2si %xmm3, %rax			; AVX1-NEXT: vcvttsd2si %xmm3, %rax
	; AVX1-NEXT: movabsq $-9223372036854775808, %rcx # imm = 0x8000000000000000			; AVX1-NEXT: btcq $63, %rax
	; AVX1-NEXT: xorq %rcx, %rax			; AVX1-NEXT: vcvttsd2si %xmm2, %rcx
	; AVX1-NEXT: vcvttsd2si %xmm2, %rdx
	; AVX1-NEXT: vucomisd %xmm1, %xmm2			; AVX1-NEXT: vucomisd %xmm1, %xmm2
	; AVX1-NEXT: cmovaeq %rax, %rdx			; AVX1-NEXT: cmovaeq %rax, %rcx
	; AVX1-NEXT: vmovq %rdx, %xmm3			; AVX1-NEXT: vmovq %rcx, %xmm3
	; AVX1-NEXT: vpermilpd {{.*#+}} xmm2 = xmm2[1,0]			; AVX1-NEXT: vpermilpd {{.*#+}} xmm2 = xmm2[1,0]
	; AVX1-NEXT: vsubsd %xmm1, %xmm2, %xmm4			; AVX1-NEXT: vsubsd %xmm1, %xmm2, %xmm4
	; AVX1-NEXT: vcvttsd2si %xmm4, %rax			; AVX1-NEXT: vcvttsd2si %xmm4, %rax
	; AVX1-NEXT: xorq %rcx, %rax			; AVX1-NEXT: btcq $63, %rax
	; AVX1-NEXT: vcvttsd2si %xmm2, %rdx			; AVX1-NEXT: vcvttsd2si %xmm2, %rcx
	; AVX1-NEXT: vucomisd %xmm1, %xmm2			; AVX1-NEXT: vucomisd %xmm1, %xmm2
	; AVX1-NEXT: cmovaeq %rax, %rdx			; AVX1-NEXT: cmovaeq %rax, %rcx
	; AVX1-NEXT: vmovq %rdx, %xmm2			; AVX1-NEXT: vmovq %rcx, %xmm2
	; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm3[0],xmm2[0]			; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm3[0],xmm2[0]
	; AVX1-NEXT: vsubsd %xmm1, %xmm0, %xmm3			; AVX1-NEXT: vsubsd %xmm1, %xmm0, %xmm3
	; AVX1-NEXT: vcvttsd2si %xmm3, %rax			; AVX1-NEXT: vcvttsd2si %xmm3, %rax
	; AVX1-NEXT: xorq %rcx, %rax			; AVX1-NEXT: btcq $63, %rax
	; AVX1-NEXT: vcvttsd2si %xmm0, %rdx			; AVX1-NEXT: vcvttsd2si %xmm0, %rcx
	; AVX1-NEXT: vucomisd %xmm1, %xmm0			; AVX1-NEXT: vucomisd %xmm1, %xmm0
	; AVX1-NEXT: cmovaeq %rax, %rdx			; AVX1-NEXT: cmovaeq %rax, %rcx
	; AVX1-NEXT: vmovq %rdx, %xmm3			; AVX1-NEXT: vmovq %rcx, %xmm3
	; AVX1-NEXT: vpermilpd {{.*#+}} xmm0 = xmm0[1,0]			; AVX1-NEXT: vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
	; AVX1-NEXT: vsubsd %xmm1, %xmm0, %xmm4			; AVX1-NEXT: vsubsd %xmm1, %xmm0, %xmm4
	; AVX1-NEXT: vcvttsd2si %xmm4, %rax			; AVX1-NEXT: vcvttsd2si %xmm4, %rax
	; AVX1-NEXT: xorq %rcx, %rax			; AVX1-NEXT: btcq $63, %rax
	; AVX1-NEXT: vcvttsd2si %xmm0, %rcx			; AVX1-NEXT: vcvttsd2si %xmm0, %rcx
	; AVX1-NEXT: vucomisd %xmm1, %xmm0			; AVX1-NEXT: vucomisd %xmm1, %xmm0
	; AVX1-NEXT: cmovaeq %rax, %rcx			; AVX1-NEXT: cmovaeq %rax, %rcx
	; AVX1-NEXT: vmovq %rcx, %xmm0			; AVX1-NEXT: vmovq %rcx, %xmm0
	; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm3[0],xmm0[0]			; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm3[0],xmm0[0]
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: fptoui_4f64_to_4i64:			; AVX2-LABEL: fptoui_4f64_to_4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vextractf128 $1, %ymm0, %xmm2			; AVX2-NEXT: vextractf128 $1, %ymm0, %xmm2
	; AVX2-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero			; AVX2-NEXT: vmovsd {{.*#+}} xmm1 = mem[0],zero
	; AVX2-NEXT: vsubsd %xmm1, %xmm2, %xmm3			; AVX2-NEXT: vsubsd %xmm1, %xmm2, %xmm3
	; AVX2-NEXT: vcvttsd2si %xmm3, %rax			; AVX2-NEXT: vcvttsd2si %xmm3, %rax
	; AVX2-NEXT: movabsq $-9223372036854775808, %rcx # imm = 0x8000000000000000			; AVX2-NEXT: btcq $63, %rax
	; AVX2-NEXT: xorq %rcx, %rax			; AVX2-NEXT: vcvttsd2si %xmm2, %rcx
	; AVX2-NEXT: vcvttsd2si %xmm2, %rdx
	; AVX2-NEXT: vucomisd %xmm1, %xmm2			; AVX2-NEXT: vucomisd %xmm1, %xmm2
	; AVX2-NEXT: cmovaeq %rax, %rdx			; AVX2-NEXT: cmovaeq %rax, %rcx
	; AVX2-NEXT: vmovq %rdx, %xmm3			; AVX2-NEXT: vmovq %rcx, %xmm3
	; AVX2-NEXT: vpermilpd {{.*#+}} xmm2 = xmm2[1,0]			; AVX2-NEXT: vpermilpd {{.*#+}} xmm2 = xmm2[1,0]
	; AVX2-NEXT: vsubsd %xmm1, %xmm2, %xmm4			; AVX2-NEXT: vsubsd %xmm1, %xmm2, %xmm4
	; AVX2-NEXT: vcvttsd2si %xmm4, %rax			; AVX2-NEXT: vcvttsd2si %xmm4, %rax
	; AVX2-NEXT: xorq %rcx, %rax			; AVX2-NEXT: btcq $63, %rax
	; AVX2-NEXT: vcvttsd2si %xmm2, %rdx			; AVX2-NEXT: vcvttsd2si %xmm2, %rcx
	; AVX2-NEXT: vucomisd %xmm1, %xmm2			; AVX2-NEXT: vucomisd %xmm1, %xmm2
	; AVX2-NEXT: cmovaeq %rax, %rdx			; AVX2-NEXT: cmovaeq %rax, %rcx
	; AVX2-NEXT: vmovq %rdx, %xmm2			; AVX2-NEXT: vmovq %rcx, %xmm2
	; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm3[0],xmm2[0]			; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm3[0],xmm2[0]
	; AVX2-NEXT: vsubsd %xmm1, %xmm0, %xmm3			; AVX2-NEXT: vsubsd %xmm1, %xmm0, %xmm3
	; AVX2-NEXT: vcvttsd2si %xmm3, %rax			; AVX2-NEXT: vcvttsd2si %xmm3, %rax
	; AVX2-NEXT: xorq %rcx, %rax			; AVX2-NEXT: btcq $63, %rax
	; AVX2-NEXT: vcvttsd2si %xmm0, %rdx			; AVX2-NEXT: vcvttsd2si %xmm0, %rcx
	; AVX2-NEXT: vucomisd %xmm1, %xmm0			; AVX2-NEXT: vucomisd %xmm1, %xmm0
	; AVX2-NEXT: cmovaeq %rax, %rdx			; AVX2-NEXT: cmovaeq %rax, %rcx
	; AVX2-NEXT: vmovq %rdx, %xmm3			; AVX2-NEXT: vmovq %rcx, %xmm3
	; AVX2-NEXT: vpermilpd {{.*#+}} xmm0 = xmm0[1,0]			; AVX2-NEXT: vpermilpd {{.*#+}} xmm0 = xmm0[1,0]
	; AVX2-NEXT: vsubsd %xmm1, %xmm0, %xmm4			; AVX2-NEXT: vsubsd %xmm1, %xmm0, %xmm4
	; AVX2-NEXT: vcvttsd2si %xmm4, %rax			; AVX2-NEXT: vcvttsd2si %xmm4, %rax
	; AVX2-NEXT: xorq %rcx, %rax			; AVX2-NEXT: btcq $63, %rax
	; AVX2-NEXT: vcvttsd2si %xmm0, %rcx			; AVX2-NEXT: vcvttsd2si %xmm0, %rcx
	; AVX2-NEXT: vucomisd %xmm1, %xmm0			; AVX2-NEXT: vucomisd %xmm1, %xmm0
	; AVX2-NEXT: cmovaeq %rax, %rcx			; AVX2-NEXT: cmovaeq %rax, %rcx
	; AVX2-NEXT: vmovq %rcx, %xmm0			; AVX2-NEXT: vmovq %rcx, %xmm0
	; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm3[0],xmm0[0]			; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm3[0],xmm0[0]
	; AVX2-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0			; AVX2-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	}			}

	define <4 x i32> @fptoui_4f64_to_4i32(<4 x double> %a) {			define <4 x i32> @fptoui_4f64_to_4i32(<4 x double> %a) {
	; SSE-LABEL: fptoui_4f64_to_4i32:			; SSE-LABEL: fptoui_4f64_to_4i32:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movsd {{.*#+}} xmm2 = mem[0],zero			; SSE-NEXT: movsd {{.*#+}} xmm2 = mem[0],zero
	; SSE-NEXT: movapd %xmm1, %xmm3			; SSE-NEXT: movapd %xmm1, %xmm3
	; SSE-NEXT: subsd %xmm2, %xmm3			; SSE-NEXT: subsd %xmm2, %xmm3
	; SSE-NEXT: cvttsd2si %xmm3, %rcx			; SSE-NEXT: cvttsd2si %xmm3, %rax
	; SSE-NEXT: movabsq $-9223372036854775808, %rax # imm = 0x8000000000000000			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: xorq %rax, %rcx			; SSE-NEXT: cvttsd2si %xmm1, %rcx
	; SSE-NEXT: cvttsd2si %xmm1, %rdx
	; SSE-NEXT: ucomisd %xmm2, %xmm1			; SSE-NEXT: ucomisd %xmm2, %xmm1
	; SSE-NEXT: cmovaeq %rcx, %rdx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rdx, %xmm3			; SSE-NEXT: movq %rcx, %xmm3
	; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm1[1,1]			; SSE-NEXT: movhlps {{.*#+}} xmm1 = xmm1[1,1]
	; SSE-NEXT: movaps %xmm1, %xmm4			; SSE-NEXT: movaps %xmm1, %xmm4
	; SSE-NEXT: subsd %xmm2, %xmm4			; SSE-NEXT: subsd %xmm2, %xmm4
	; SSE-NEXT: cvttsd2si %xmm4, %rcx			; SSE-NEXT: cvttsd2si %xmm4, %rax
	; SSE-NEXT: xorq %rax, %rcx			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: cvttsd2si %xmm1, %rdx			; SSE-NEXT: cvttsd2si %xmm1, %rcx
	; SSE-NEXT: ucomisd %xmm2, %xmm1			; SSE-NEXT: ucomisd %xmm2, %xmm1
	; SSE-NEXT: cmovaeq %rcx, %rdx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rdx, %xmm1			; SSE-NEXT: movq %rcx, %xmm1
	; SSE-NEXT: punpcklqdq {{.*#+}} xmm3 = xmm3[0],xmm1[0]			; SSE-NEXT: punpcklqdq {{.*#+}} xmm3 = xmm3[0],xmm1[0]
	; SSE-NEXT: movapd %xmm0, %xmm1			; SSE-NEXT: movapd %xmm0, %xmm1
	; SSE-NEXT: subsd %xmm2, %xmm1			; SSE-NEXT: subsd %xmm2, %xmm1
	; SSE-NEXT: cvttsd2si %xmm1, %rcx			; SSE-NEXT: cvttsd2si %xmm1, %rax
	; SSE-NEXT: xorq %rax, %rcx			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: cvttsd2si %xmm0, %rdx			; SSE-NEXT: cvttsd2si %xmm0, %rcx
	; SSE-NEXT: ucomisd %xmm2, %xmm0			; SSE-NEXT: ucomisd %xmm2, %xmm0
	; SSE-NEXT: cmovaeq %rcx, %rdx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rdx, %xmm1			; SSE-NEXT: movq %rcx, %xmm1
	; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]			; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]
	; SSE-NEXT: movaps %xmm0, %xmm4			; SSE-NEXT: movaps %xmm0, %xmm4
	; SSE-NEXT: subsd %xmm2, %xmm4			; SSE-NEXT: subsd %xmm2, %xmm4
	; SSE-NEXT: cvttsd2si %xmm4, %rcx			; SSE-NEXT: cvttsd2si %xmm4, %rax
	; SSE-NEXT: xorq %rax, %rcx			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: cvttsd2si %xmm0, %rax			; SSE-NEXT: cvttsd2si %xmm0, %rcx
	; SSE-NEXT: ucomisd %xmm2, %xmm0			; SSE-NEXT: ucomisd %xmm2, %xmm0
	; SSE-NEXT: cmovaeq %rcx, %rax			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rax, %xmm0			; SSE-NEXT: movq %rcx, %xmm0
	; SSE-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]			; SSE-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]
	; SSE-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm3[0,2]			; SSE-NEXT: shufps {{.*#+}} xmm1 = xmm1[0,2],xmm3[0,2]
	; SSE-NEXT: movaps %xmm1, %xmm0			; SSE-NEXT: movaps %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; VEX-LABEL: fptoui_4f64_to_4i32:			; VEX-LABEL: fptoui_4f64_to_4i32:
	; VEX: # %bb.0:			; VEX: # %bb.0:
	; VEX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]			; VEX-NEXT: vpermilpd {{.*#+}} xmm1 = xmm0[1,0]
	▲ Show 20 Lines • Show All 433 Lines • ▼ Show 20 Lines

	define <2 x i32> @fptoui_2f32_to_2i32(<2 x float> %a) {			define <2 x i32> @fptoui_2f32_to_2i32(<2 x float> %a) {
	; SSE-LABEL: fptoui_2f32_to_2i32:			; SSE-LABEL: fptoui_2f32_to_2i32:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movss {{.*#+}} xmm2 = mem[0],zero,zero,zero			; SSE-NEXT: movss {{.*#+}} xmm2 = mem[0],zero,zero,zero
	; SSE-NEXT: movaps %xmm0, %xmm1			; SSE-NEXT: movaps %xmm0, %xmm1
	; SSE-NEXT: subss %xmm2, %xmm1			; SSE-NEXT: subss %xmm2, %xmm1
	; SSE-NEXT: cvttss2si %xmm1, %rax			; SSE-NEXT: cvttss2si %xmm1, %rax
	; SSE-NEXT: movabsq $-9223372036854775808, %rcx # imm = 0x8000000000000000			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: xorq %rcx, %rax			; SSE-NEXT: cvttss2si %xmm0, %rcx
	; SSE-NEXT: cvttss2si %xmm0, %rdx
	; SSE-NEXT: ucomiss %xmm2, %xmm0			; SSE-NEXT: ucomiss %xmm2, %xmm0
	; SSE-NEXT: cmovaeq %rax, %rdx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rdx, %xmm1			; SSE-NEXT: movq %rcx, %xmm1
	; SSE-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1,2,3]			; SSE-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1,2,3]
	; SSE-NEXT: movaps %xmm0, %xmm3			; SSE-NEXT: movaps %xmm0, %xmm3
	; SSE-NEXT: subss %xmm2, %xmm3			; SSE-NEXT: subss %xmm2, %xmm3
	; SSE-NEXT: cvttss2si %xmm3, %rax			; SSE-NEXT: cvttss2si %xmm3, %rax
	; SSE-NEXT: xorq %rcx, %rax			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: cvttss2si %xmm0, %rcx			; SSE-NEXT: cvttss2si %xmm0, %rcx
	; SSE-NEXT: ucomiss %xmm2, %xmm0			; SSE-NEXT: ucomiss %xmm2, %xmm0
	; SSE-NEXT: cmovaeq %rax, %rcx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rcx, %xmm0			; SSE-NEXT: movq %rcx, %xmm0
	; SSE-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]			; SSE-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]
	; SSE-NEXT: movdqa %xmm1, %xmm0			; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; VEX-LABEL: fptoui_2f32_to_2i32:			; VEX-LABEL: fptoui_2f32_to_2i32:
	; VEX: # %bb.0:			; VEX: # %bb.0:
	; VEX-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero			; VEX-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero
	; VEX-NEXT: vsubss %xmm1, %xmm0, %xmm2			; VEX-NEXT: vsubss %xmm1, %xmm0, %xmm2
	; VEX-NEXT: vcvttss2si %xmm2, %rax			; VEX-NEXT: vcvttss2si %xmm2, %rax
	; VEX-NEXT: movabsq $-9223372036854775808, %rcx # imm = 0x8000000000000000			; VEX-NEXT: btcq $63, %rax
	; VEX-NEXT: xorq %rcx, %rax			; VEX-NEXT: vcvttss2si %xmm0, %rcx
	; VEX-NEXT: vcvttss2si %xmm0, %rdx
	; VEX-NEXT: vucomiss %xmm1, %xmm0			; VEX-NEXT: vucomiss %xmm1, %xmm0
	; VEX-NEXT: cmovaeq %rax, %rdx			; VEX-NEXT: cmovaeq %rax, %rcx
	; VEX-NEXT: vmovq %rdx, %xmm2			; VEX-NEXT: vmovq %rcx, %xmm2
	; VEX-NEXT: vmovshdup {{.*#+}} xmm0 = xmm0[1,1,3,3]			; VEX-NEXT: vmovshdup {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; VEX-NEXT: vsubss %xmm1, %xmm0, %xmm3			; VEX-NEXT: vsubss %xmm1, %xmm0, %xmm3
	; VEX-NEXT: vcvttss2si %xmm3, %rax			; VEX-NEXT: vcvttss2si %xmm3, %rax
	; VEX-NEXT: xorq %rcx, %rax			; VEX-NEXT: btcq $63, %rax
	; VEX-NEXT: vcvttss2si %xmm0, %rcx			; VEX-NEXT: vcvttss2si %xmm0, %rcx
	; VEX-NEXT: vucomiss %xmm1, %xmm0			; VEX-NEXT: vucomiss %xmm1, %xmm0
	; VEX-NEXT: cmovaeq %rax, %rcx			; VEX-NEXT: cmovaeq %rax, %rcx
	; VEX-NEXT: vmovq %rcx, %xmm0			; VEX-NEXT: vmovq %rcx, %xmm0
	; VEX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm2[0],xmm0[0]			; VEX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm2[0],xmm0[0]
	; VEX-NEXT: retq			; VEX-NEXT: retq
	;			;
	; AVX512F-LABEL: fptoui_2f32_to_2i32:			; AVX512F-LABEL: fptoui_2f32_to_2i32:
	▲ Show 20 Lines • Show All 95 Lines • ▼ Show 20 Lines

	define <2 x i64> @fptoui_2f32_to_2i64(<4 x float> %a) {			define <2 x i64> @fptoui_2f32_to_2i64(<4 x float> %a) {
	; SSE-LABEL: fptoui_2f32_to_2i64:			; SSE-LABEL: fptoui_2f32_to_2i64:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movss {{.*#+}} xmm2 = mem[0],zero,zero,zero			; SSE-NEXT: movss {{.*#+}} xmm2 = mem[0],zero,zero,zero
	; SSE-NEXT: movaps %xmm0, %xmm1			; SSE-NEXT: movaps %xmm0, %xmm1
	; SSE-NEXT: subss %xmm2, %xmm1			; SSE-NEXT: subss %xmm2, %xmm1
	; SSE-NEXT: cvttss2si %xmm1, %rax			; SSE-NEXT: cvttss2si %xmm1, %rax
	; SSE-NEXT: movabsq $-9223372036854775808, %rcx # imm = 0x8000000000000000			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: xorq %rcx, %rax			; SSE-NEXT: cvttss2si %xmm0, %rcx
	; SSE-NEXT: cvttss2si %xmm0, %rdx
	; SSE-NEXT: ucomiss %xmm2, %xmm0			; SSE-NEXT: ucomiss %xmm2, %xmm0
	; SSE-NEXT: cmovaeq %rax, %rdx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rdx, %xmm1			; SSE-NEXT: movq %rcx, %xmm1
	; SSE-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1,2,3]			; SSE-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1,2,3]
	; SSE-NEXT: movaps %xmm0, %xmm3			; SSE-NEXT: movaps %xmm0, %xmm3
	; SSE-NEXT: subss %xmm2, %xmm3			; SSE-NEXT: subss %xmm2, %xmm3
	; SSE-NEXT: cvttss2si %xmm3, %rax			; SSE-NEXT: cvttss2si %xmm3, %rax
	; SSE-NEXT: xorq %rcx, %rax			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: cvttss2si %xmm0, %rcx			; SSE-NEXT: cvttss2si %xmm0, %rcx
	; SSE-NEXT: ucomiss %xmm2, %xmm0			; SSE-NEXT: ucomiss %xmm2, %xmm0
	; SSE-NEXT: cmovaeq %rax, %rcx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rcx, %xmm0			; SSE-NEXT: movq %rcx, %xmm0
	; SSE-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]			; SSE-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]
	; SSE-NEXT: movdqa %xmm1, %xmm0			; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; VEX-LABEL: fptoui_2f32_to_2i64:			; VEX-LABEL: fptoui_2f32_to_2i64:
	; VEX: # %bb.0:			; VEX: # %bb.0:
	; VEX-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero			; VEX-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero
	; VEX-NEXT: vsubss %xmm1, %xmm0, %xmm2			; VEX-NEXT: vsubss %xmm1, %xmm0, %xmm2
	; VEX-NEXT: vcvttss2si %xmm2, %rax			; VEX-NEXT: vcvttss2si %xmm2, %rax
	; VEX-NEXT: movabsq $-9223372036854775808, %rcx # imm = 0x8000000000000000			; VEX-NEXT: btcq $63, %rax
	; VEX-NEXT: xorq %rcx, %rax			; VEX-NEXT: vcvttss2si %xmm0, %rcx
	; VEX-NEXT: vcvttss2si %xmm0, %rdx
	; VEX-NEXT: vucomiss %xmm1, %xmm0			; VEX-NEXT: vucomiss %xmm1, %xmm0
	; VEX-NEXT: cmovaeq %rax, %rdx			; VEX-NEXT: cmovaeq %rax, %rcx
	; VEX-NEXT: vmovq %rdx, %xmm2			; VEX-NEXT: vmovq %rcx, %xmm2
	; VEX-NEXT: vmovshdup {{.*#+}} xmm0 = xmm0[1,1,3,3]			; VEX-NEXT: vmovshdup {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; VEX-NEXT: vsubss %xmm1, %xmm0, %xmm3			; VEX-NEXT: vsubss %xmm1, %xmm0, %xmm3
	; VEX-NEXT: vcvttss2si %xmm3, %rax			; VEX-NEXT: vcvttss2si %xmm3, %rax
	; VEX-NEXT: xorq %rcx, %rax			; VEX-NEXT: btcq $63, %rax
	; VEX-NEXT: vcvttss2si %xmm0, %rcx			; VEX-NEXT: vcvttss2si %xmm0, %rcx
	; VEX-NEXT: vucomiss %xmm1, %xmm0			; VEX-NEXT: vucomiss %xmm1, %xmm0
	; VEX-NEXT: cmovaeq %rax, %rcx			; VEX-NEXT: cmovaeq %rax, %rcx
	; VEX-NEXT: vmovq %rcx, %xmm0			; VEX-NEXT: vmovq %rcx, %xmm0
	; VEX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm2[0],xmm0[0]			; VEX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm2[0],xmm0[0]
	; VEX-NEXT: retq			; VEX-NEXT: retq
	;			;
	; AVX512F-LABEL: fptoui_2f32_to_2i64:			; AVX512F-LABEL: fptoui_2f32_to_2i64:
	Show All 35 Lines

	define <2 x i64> @fptoui_4f32_to_2i64(<4 x float> %a) {			define <2 x i64> @fptoui_4f32_to_2i64(<4 x float> %a) {
	; SSE-LABEL: fptoui_4f32_to_2i64:			; SSE-LABEL: fptoui_4f32_to_2i64:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movss {{.*#+}} xmm2 = mem[0],zero,zero,zero			; SSE-NEXT: movss {{.*#+}} xmm2 = mem[0],zero,zero,zero
	; SSE-NEXT: movaps %xmm0, %xmm1			; SSE-NEXT: movaps %xmm0, %xmm1
	; SSE-NEXT: subss %xmm2, %xmm1			; SSE-NEXT: subss %xmm2, %xmm1
	; SSE-NEXT: cvttss2si %xmm1, %rax			; SSE-NEXT: cvttss2si %xmm1, %rax
	; SSE-NEXT: movabsq $-9223372036854775808, %rcx # imm = 0x8000000000000000			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: xorq %rcx, %rax			; SSE-NEXT: cvttss2si %xmm0, %rcx
	; SSE-NEXT: cvttss2si %xmm0, %rdx
	; SSE-NEXT: ucomiss %xmm2, %xmm0			; SSE-NEXT: ucomiss %xmm2, %xmm0
	; SSE-NEXT: cmovaeq %rax, %rdx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rdx, %xmm1			; SSE-NEXT: movq %rcx, %xmm1
	; SSE-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1,2,3]			; SSE-NEXT: shufps {{.*#+}} xmm0 = xmm0[1,1,2,3]
	; SSE-NEXT: movaps %xmm0, %xmm3			; SSE-NEXT: movaps %xmm0, %xmm3
	; SSE-NEXT: subss %xmm2, %xmm3			; SSE-NEXT: subss %xmm2, %xmm3
	; SSE-NEXT: cvttss2si %xmm3, %rax			; SSE-NEXT: cvttss2si %xmm3, %rax
	; SSE-NEXT: xorq %rcx, %rax			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: cvttss2si %xmm0, %rcx			; SSE-NEXT: cvttss2si %xmm0, %rcx
	; SSE-NEXT: ucomiss %xmm2, %xmm0			; SSE-NEXT: ucomiss %xmm2, %xmm0
	; SSE-NEXT: cmovaeq %rax, %rcx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rcx, %xmm0			; SSE-NEXT: movq %rcx, %xmm0
	; SSE-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]			; SSE-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]
	; SSE-NEXT: movdqa %xmm1, %xmm0			; SSE-NEXT: movdqa %xmm1, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; VEX-LABEL: fptoui_4f32_to_2i64:			; VEX-LABEL: fptoui_4f32_to_2i64:
	; VEX: # %bb.0:			; VEX: # %bb.0:
	; VEX-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]			; VEX-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
	; VEX-NEXT: vmovss {{.*#+}} xmm2 = mem[0],zero,zero,zero			; VEX-NEXT: vmovss {{.*#+}} xmm2 = mem[0],zero,zero,zero
	; VEX-NEXT: vsubss %xmm2, %xmm1, %xmm3			; VEX-NEXT: vsubss %xmm2, %xmm1, %xmm3
	; VEX-NEXT: vcvttss2si %xmm3, %rax			; VEX-NEXT: vcvttss2si %xmm3, %rax
	; VEX-NEXT: movabsq $-9223372036854775808, %rcx # imm = 0x8000000000000000			; VEX-NEXT: btcq $63, %rax
	; VEX-NEXT: xorq %rcx, %rax			; VEX-NEXT: vcvttss2si %xmm1, %rcx
	; VEX-NEXT: vcvttss2si %xmm1, %rdx
	; VEX-NEXT: vucomiss %xmm2, %xmm1			; VEX-NEXT: vucomiss %xmm2, %xmm1
	; VEX-NEXT: cmovaeq %rax, %rdx			; VEX-NEXT: cmovaeq %rax, %rcx
	; VEX-NEXT: vsubss %xmm2, %xmm0, %xmm1			; VEX-NEXT: vsubss %xmm2, %xmm0, %xmm1
	; VEX-NEXT: vcvttss2si %xmm1, %rax			; VEX-NEXT: vcvttss2si %xmm1, %rax
	; VEX-NEXT: xorq %rcx, %rax			; VEX-NEXT: btcq $63, %rax
	; VEX-NEXT: vcvttss2si %xmm0, %rcx			; VEX-NEXT: vcvttss2si %xmm0, %rdx
	; VEX-NEXT: vucomiss %xmm2, %xmm0			; VEX-NEXT: vucomiss %xmm2, %xmm0
	; VEX-NEXT: cmovaeq %rax, %rcx			; VEX-NEXT: cmovaeq %rax, %rdx
	; VEX-NEXT: vmovq %rcx, %xmm0			; VEX-NEXT: vmovq %rdx, %xmm0
	; VEX-NEXT: vmovq %rdx, %xmm1			; VEX-NEXT: vmovq %rcx, %xmm1
	; VEX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]			; VEX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
	; VEX-NEXT: retq			; VEX-NEXT: retq
	;			;
	; AVX512F-LABEL: fptoui_4f32_to_2i64:			; AVX512F-LABEL: fptoui_4f32_to_2i64:
	; AVX512F: # %bb.0:			; AVX512F: # %bb.0:
	; AVX512F-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]			; AVX512F-NEXT: vmovshdup {{.*#+}} xmm1 = xmm0[1,1,3,3]
	; AVX512F-NEXT: vcvttss2usi %xmm1, %rax			; AVX512F-NEXT: vcvttss2usi %xmm1, %rax
	; AVX512F-NEXT: vcvttss2usi %xmm0, %rcx			; AVX512F-NEXT: vcvttss2usi %xmm0, %rcx
	▲ Show 20 Lines • Show All 153 Lines • ▼ Show 20 Lines
	}			}

	define <4 x i64> @fptoui_4f32_to_4i64(<8 x float> %a) {			define <4 x i64> @fptoui_4f32_to_4i64(<8 x float> %a) {
	; SSE-LABEL: fptoui_4f32_to_4i64:			; SSE-LABEL: fptoui_4f32_to_4i64:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movss {{.*#+}} xmm1 = mem[0],zero,zero,zero			; SSE-NEXT: movss {{.*#+}} xmm1 = mem[0],zero,zero,zero
	; SSE-NEXT: movaps %xmm0, %xmm2			; SSE-NEXT: movaps %xmm0, %xmm2
	; SSE-NEXT: subss %xmm1, %xmm2			; SSE-NEXT: subss %xmm1, %xmm2
	; SSE-NEXT: cvttss2si %xmm2, %rcx			; SSE-NEXT: cvttss2si %xmm2, %rax
	; SSE-NEXT: movabsq $-9223372036854775808, %rax # imm = 0x8000000000000000			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: xorq %rax, %rcx			; SSE-NEXT: cvttss2si %xmm0, %rcx
	; SSE-NEXT: cvttss2si %xmm0, %rdx
	; SSE-NEXT: ucomiss %xmm1, %xmm0			; SSE-NEXT: ucomiss %xmm1, %xmm0
	; SSE-NEXT: cmovaeq %rcx, %rdx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rdx, %xmm2			; SSE-NEXT: movq %rcx, %xmm2
	; SSE-NEXT: movaps %xmm0, %xmm3			; SSE-NEXT: movaps %xmm0, %xmm3
	; SSE-NEXT: shufps {{.*#+}} xmm3 = xmm3[1,1,2,3]			; SSE-NEXT: shufps {{.*#+}} xmm3 = xmm3[1,1,2,3]
	; SSE-NEXT: movaps %xmm3, %xmm4			; SSE-NEXT: movaps %xmm3, %xmm4
	; SSE-NEXT: subss %xmm1, %xmm4			; SSE-NEXT: subss %xmm1, %xmm4
	; SSE-NEXT: cvttss2si %xmm4, %rcx			; SSE-NEXT: cvttss2si %xmm4, %rax
	; SSE-NEXT: xorq %rax, %rcx			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: cvttss2si %xmm3, %rdx			; SSE-NEXT: cvttss2si %xmm3, %rcx
	; SSE-NEXT: ucomiss %xmm1, %xmm3			; SSE-NEXT: ucomiss %xmm1, %xmm3
	; SSE-NEXT: cmovaeq %rcx, %rdx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rdx, %xmm3			; SSE-NEXT: movq %rcx, %xmm3
	; SSE-NEXT: punpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm3[0]			; SSE-NEXT: punpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm3[0]
	; SSE-NEXT: movaps %xmm0, %xmm3			; SSE-NEXT: movaps %xmm0, %xmm3
	; SSE-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]			; SSE-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]
	; SSE-NEXT: movaps %xmm3, %xmm4			; SSE-NEXT: movaps %xmm3, %xmm4
	; SSE-NEXT: subss %xmm1, %xmm4			; SSE-NEXT: subss %xmm1, %xmm4
	; SSE-NEXT: cvttss2si %xmm4, %rcx			; SSE-NEXT: cvttss2si %xmm4, %rax
	; SSE-NEXT: xorq %rax, %rcx			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: cvttss2si %xmm3, %rdx			; SSE-NEXT: cvttss2si %xmm3, %rcx
	; SSE-NEXT: ucomiss %xmm1, %xmm3			; SSE-NEXT: ucomiss %xmm1, %xmm3
	; SSE-NEXT: cmovaeq %rcx, %rdx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rdx, %xmm3			; SSE-NEXT: movq %rcx, %xmm3
	; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]			; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]
	; SSE-NEXT: movaps %xmm0, %xmm4			; SSE-NEXT: movaps %xmm0, %xmm4
	; SSE-NEXT: subss %xmm1, %xmm4			; SSE-NEXT: subss %xmm1, %xmm4
	; SSE-NEXT: cvttss2si %xmm4, %rcx			; SSE-NEXT: cvttss2si %xmm4, %rax
	; SSE-NEXT: xorq %rax, %rcx			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: cvttss2si %xmm0, %rax			; SSE-NEXT: cvttss2si %xmm0, %rcx
	; SSE-NEXT: ucomiss %xmm1, %xmm0			; SSE-NEXT: ucomiss %xmm1, %xmm0
	; SSE-NEXT: cmovaeq %rcx, %rax			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rax, %xmm1			; SSE-NEXT: movq %rcx, %xmm1
	; SSE-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm3[0]			; SSE-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm3[0]
	; SSE-NEXT: movdqa %xmm2, %xmm0			; SSE-NEXT: movdqa %xmm2, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-LABEL: fptoui_4f32_to_4i64:			; AVX1-LABEL: fptoui_4f32_to_4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpermilps {{.*#+}} xmm2 = xmm0[3,1,2,3]			; AVX1-NEXT: vpermilps {{.*#+}} xmm2 = xmm0[3,1,2,3]
	; AVX1-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero			; AVX1-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero
	; AVX1-NEXT: vsubss %xmm1, %xmm2, %xmm3			; AVX1-NEXT: vsubss %xmm1, %xmm2, %xmm3
	; AVX1-NEXT: vcvttss2si %xmm3, %rax			; AVX1-NEXT: vcvttss2si %xmm3, %rax
	; AVX1-NEXT: movabsq $-9223372036854775808, %rcx # imm = 0x8000000000000000			; AVX1-NEXT: btcq $63, %rax
	; AVX1-NEXT: xorq %rcx, %rax			; AVX1-NEXT: vcvttss2si %xmm2, %rcx
	; AVX1-NEXT: vcvttss2si %xmm2, %rdx
	; AVX1-NEXT: vucomiss %xmm1, %xmm2			; AVX1-NEXT: vucomiss %xmm1, %xmm2
	; AVX1-NEXT: cmovaeq %rax, %rdx			; AVX1-NEXT: cmovaeq %rax, %rcx
	; AVX1-NEXT: vmovq %rdx, %xmm2			; AVX1-NEXT: vmovq %rcx, %xmm2
	; AVX1-NEXT: vpermilpd {{.*#+}} xmm3 = xmm0[1,0]			; AVX1-NEXT: vpermilpd {{.*#+}} xmm3 = xmm0[1,0]
	; AVX1-NEXT: vsubss %xmm1, %xmm3, %xmm4			; AVX1-NEXT: vsubss %xmm1, %xmm3, %xmm4
	; AVX1-NEXT: vcvttss2si %xmm4, %rax			; AVX1-NEXT: vcvttss2si %xmm4, %rax
	; AVX1-NEXT: xorq %rcx, %rax			; AVX1-NEXT: btcq $63, %rax
	; AVX1-NEXT: vcvttss2si %xmm3, %rdx			; AVX1-NEXT: vcvttss2si %xmm3, %rcx
	; AVX1-NEXT: vucomiss %xmm1, %xmm3			; AVX1-NEXT: vucomiss %xmm1, %xmm3
	; AVX1-NEXT: cmovaeq %rax, %rdx			; AVX1-NEXT: cmovaeq %rax, %rcx
	; AVX1-NEXT: vmovq %rdx, %xmm3			; AVX1-NEXT: vmovq %rcx, %xmm3
	; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm3[0],xmm2[0]			; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm3[0],xmm2[0]
	; AVX1-NEXT: vsubss %xmm1, %xmm0, %xmm3			; AVX1-NEXT: vsubss %xmm1, %xmm0, %xmm3
	; AVX1-NEXT: vcvttss2si %xmm3, %rax			; AVX1-NEXT: vcvttss2si %xmm3, %rax
	; AVX1-NEXT: xorq %rcx, %rax			; AVX1-NEXT: btcq $63, %rax
	; AVX1-NEXT: vcvttss2si %xmm0, %rdx			; AVX1-NEXT: vcvttss2si %xmm0, %rcx
	; AVX1-NEXT: vucomiss %xmm1, %xmm0			; AVX1-NEXT: vucomiss %xmm1, %xmm0
	; AVX1-NEXT: cmovaeq %rax, %rdx			; AVX1-NEXT: cmovaeq %rax, %rcx
	; AVX1-NEXT: vmovq %rdx, %xmm3			; AVX1-NEXT: vmovq %rcx, %xmm3
	; AVX1-NEXT: vmovshdup {{.*#+}} xmm0 = xmm0[1,1,3,3]			; AVX1-NEXT: vmovshdup {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; AVX1-NEXT: vsubss %xmm1, %xmm0, %xmm4			; AVX1-NEXT: vsubss %xmm1, %xmm0, %xmm4
	; AVX1-NEXT: vcvttss2si %xmm4, %rax			; AVX1-NEXT: vcvttss2si %xmm4, %rax
	; AVX1-NEXT: xorq %rcx, %rax			; AVX1-NEXT: btcq $63, %rax
	; AVX1-NEXT: vcvttss2si %xmm0, %rcx			; AVX1-NEXT: vcvttss2si %xmm0, %rcx
	; AVX1-NEXT: vucomiss %xmm1, %xmm0			; AVX1-NEXT: vucomiss %xmm1, %xmm0
	; AVX1-NEXT: cmovaeq %rax, %rcx			; AVX1-NEXT: cmovaeq %rax, %rcx
	; AVX1-NEXT: vmovq %rcx, %xmm0			; AVX1-NEXT: vmovq %rcx, %xmm0
	; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm3[0],xmm0[0]			; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm3[0],xmm0[0]
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: fptoui_4f32_to_4i64:			; AVX2-LABEL: fptoui_4f32_to_4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpermilps {{.*#+}} xmm2 = xmm0[3,1,2,3]			; AVX2-NEXT: vpermilps {{.*#+}} xmm2 = xmm0[3,1,2,3]
	; AVX2-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero			; AVX2-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero
	; AVX2-NEXT: vsubss %xmm1, %xmm2, %xmm3			; AVX2-NEXT: vsubss %xmm1, %xmm2, %xmm3
	; AVX2-NEXT: vcvttss2si %xmm3, %rax			; AVX2-NEXT: vcvttss2si %xmm3, %rax
	; AVX2-NEXT: movabsq $-9223372036854775808, %rcx # imm = 0x8000000000000000			; AVX2-NEXT: btcq $63, %rax
	; AVX2-NEXT: xorq %rcx, %rax			; AVX2-NEXT: vcvttss2si %xmm2, %rcx
	; AVX2-NEXT: vcvttss2si %xmm2, %rdx
	; AVX2-NEXT: vucomiss %xmm1, %xmm2			; AVX2-NEXT: vucomiss %xmm1, %xmm2
	; AVX2-NEXT: cmovaeq %rax, %rdx			; AVX2-NEXT: cmovaeq %rax, %rcx
	; AVX2-NEXT: vmovq %rdx, %xmm2			; AVX2-NEXT: vmovq %rcx, %xmm2
	; AVX2-NEXT: vpermilpd {{.*#+}} xmm3 = xmm0[1,0]			; AVX2-NEXT: vpermilpd {{.*#+}} xmm3 = xmm0[1,0]
	; AVX2-NEXT: vsubss %xmm1, %xmm3, %xmm4			; AVX2-NEXT: vsubss %xmm1, %xmm3, %xmm4
	; AVX2-NEXT: vcvttss2si %xmm4, %rax			; AVX2-NEXT: vcvttss2si %xmm4, %rax
	; AVX2-NEXT: xorq %rcx, %rax			; AVX2-NEXT: btcq $63, %rax
	; AVX2-NEXT: vcvttss2si %xmm3, %rdx			; AVX2-NEXT: vcvttss2si %xmm3, %rcx
	; AVX2-NEXT: vucomiss %xmm1, %xmm3			; AVX2-NEXT: vucomiss %xmm1, %xmm3
	; AVX2-NEXT: cmovaeq %rax, %rdx			; AVX2-NEXT: cmovaeq %rax, %rcx
	; AVX2-NEXT: vmovq %rdx, %xmm3			; AVX2-NEXT: vmovq %rcx, %xmm3
	; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm3[0],xmm2[0]			; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm3[0],xmm2[0]
	; AVX2-NEXT: vsubss %xmm1, %xmm0, %xmm3			; AVX2-NEXT: vsubss %xmm1, %xmm0, %xmm3
	; AVX2-NEXT: vcvttss2si %xmm3, %rax			; AVX2-NEXT: vcvttss2si %xmm3, %rax
	; AVX2-NEXT: xorq %rcx, %rax			; AVX2-NEXT: btcq $63, %rax
	; AVX2-NEXT: vcvttss2si %xmm0, %rdx			; AVX2-NEXT: vcvttss2si %xmm0, %rcx
	; AVX2-NEXT: vucomiss %xmm1, %xmm0			; AVX2-NEXT: vucomiss %xmm1, %xmm0
	; AVX2-NEXT: cmovaeq %rax, %rdx			; AVX2-NEXT: cmovaeq %rax, %rcx
	; AVX2-NEXT: vmovq %rdx, %xmm3			; AVX2-NEXT: vmovq %rcx, %xmm3
	; AVX2-NEXT: vmovshdup {{.*#+}} xmm0 = xmm0[1,1,3,3]			; AVX2-NEXT: vmovshdup {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; AVX2-NEXT: vsubss %xmm1, %xmm0, %xmm4			; AVX2-NEXT: vsubss %xmm1, %xmm0, %xmm4
	; AVX2-NEXT: vcvttss2si %xmm4, %rax			; AVX2-NEXT: vcvttss2si %xmm4, %rax
	; AVX2-NEXT: xorq %rcx, %rax			; AVX2-NEXT: btcq $63, %rax
	; AVX2-NEXT: vcvttss2si %xmm0, %rcx			; AVX2-NEXT: vcvttss2si %xmm0, %rcx
	; AVX2-NEXT: vucomiss %xmm1, %xmm0			; AVX2-NEXT: vucomiss %xmm1, %xmm0
	; AVX2-NEXT: cmovaeq %rax, %rcx			; AVX2-NEXT: cmovaeq %rax, %rcx
	; AVX2-NEXT: vmovq %rcx, %xmm0			; AVX2-NEXT: vmovq %rcx, %xmm0
	; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm3[0],xmm0[0]			; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm3[0],xmm0[0]
	; AVX2-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0			; AVX2-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 49 Lines • ▼ Show 20 Lines
	}			}

	define <4 x i64> @fptoui_8f32_to_4i64(<8 x float> %a) {			define <4 x i64> @fptoui_8f32_to_4i64(<8 x float> %a) {
	; SSE-LABEL: fptoui_8f32_to_4i64:			; SSE-LABEL: fptoui_8f32_to_4i64:
	; SSE: # %bb.0:			; SSE: # %bb.0:
	; SSE-NEXT: movss {{.*#+}} xmm1 = mem[0],zero,zero,zero			; SSE-NEXT: movss {{.*#+}} xmm1 = mem[0],zero,zero,zero
	; SSE-NEXT: movaps %xmm0, %xmm2			; SSE-NEXT: movaps %xmm0, %xmm2
	; SSE-NEXT: subss %xmm1, %xmm2			; SSE-NEXT: subss %xmm1, %xmm2
	; SSE-NEXT: cvttss2si %xmm2, %rcx			; SSE-NEXT: cvttss2si %xmm2, %rax
	; SSE-NEXT: movabsq $-9223372036854775808, %rax # imm = 0x8000000000000000			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: xorq %rax, %rcx			; SSE-NEXT: cvttss2si %xmm0, %rcx
	; SSE-NEXT: cvttss2si %xmm0, %rdx
	; SSE-NEXT: ucomiss %xmm1, %xmm0			; SSE-NEXT: ucomiss %xmm1, %xmm0
	; SSE-NEXT: cmovaeq %rcx, %rdx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rdx, %xmm2			; SSE-NEXT: movq %rcx, %xmm2
	; SSE-NEXT: movaps %xmm0, %xmm3			; SSE-NEXT: movaps %xmm0, %xmm3
	; SSE-NEXT: shufps {{.*#+}} xmm3 = xmm3[1,1,2,3]			; SSE-NEXT: shufps {{.*#+}} xmm3 = xmm3[1,1,2,3]
	; SSE-NEXT: movaps %xmm3, %xmm4			; SSE-NEXT: movaps %xmm3, %xmm4
	; SSE-NEXT: subss %xmm1, %xmm4			; SSE-NEXT: subss %xmm1, %xmm4
	; SSE-NEXT: cvttss2si %xmm4, %rcx			; SSE-NEXT: cvttss2si %xmm4, %rax
	; SSE-NEXT: xorq %rax, %rcx			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: cvttss2si %xmm3, %rdx			; SSE-NEXT: cvttss2si %xmm3, %rcx
	; SSE-NEXT: ucomiss %xmm1, %xmm3			; SSE-NEXT: ucomiss %xmm1, %xmm3
	; SSE-NEXT: cmovaeq %rcx, %rdx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rdx, %xmm3			; SSE-NEXT: movq %rcx, %xmm3
	; SSE-NEXT: punpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm3[0]			; SSE-NEXT: punpcklqdq {{.*#+}} xmm2 = xmm2[0],xmm3[0]
	; SSE-NEXT: movaps %xmm0, %xmm3			; SSE-NEXT: movaps %xmm0, %xmm3
	; SSE-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]			; SSE-NEXT: shufps {{.*#+}} xmm3 = xmm3[3,1,2,3]
	; SSE-NEXT: movaps %xmm3, %xmm4			; SSE-NEXT: movaps %xmm3, %xmm4
	; SSE-NEXT: subss %xmm1, %xmm4			; SSE-NEXT: subss %xmm1, %xmm4
	; SSE-NEXT: cvttss2si %xmm4, %rcx			; SSE-NEXT: cvttss2si %xmm4, %rax
	; SSE-NEXT: xorq %rax, %rcx			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: cvttss2si %xmm3, %rdx			; SSE-NEXT: cvttss2si %xmm3, %rcx
	; SSE-NEXT: ucomiss %xmm1, %xmm3			; SSE-NEXT: ucomiss %xmm1, %xmm3
	; SSE-NEXT: cmovaeq %rcx, %rdx			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rdx, %xmm3			; SSE-NEXT: movq %rcx, %xmm3
	; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]			; SSE-NEXT: movhlps {{.*#+}} xmm0 = xmm0[1,1]
	; SSE-NEXT: movaps %xmm0, %xmm4			; SSE-NEXT: movaps %xmm0, %xmm4
	; SSE-NEXT: subss %xmm1, %xmm4			; SSE-NEXT: subss %xmm1, %xmm4
	; SSE-NEXT: cvttss2si %xmm4, %rcx			; SSE-NEXT: cvttss2si %xmm4, %rax
	; SSE-NEXT: xorq %rax, %rcx			; SSE-NEXT: btcq $63, %rax
	; SSE-NEXT: cvttss2si %xmm0, %rax			; SSE-NEXT: cvttss2si %xmm0, %rcx
	; SSE-NEXT: ucomiss %xmm1, %xmm0			; SSE-NEXT: ucomiss %xmm1, %xmm0
	; SSE-NEXT: cmovaeq %rcx, %rax			; SSE-NEXT: cmovaeq %rax, %rcx
	; SSE-NEXT: movq %rax, %xmm1			; SSE-NEXT: movq %rcx, %xmm1
	; SSE-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm3[0]			; SSE-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm3[0]
	; SSE-NEXT: movdqa %xmm2, %xmm0			; SSE-NEXT: movdqa %xmm2, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-LABEL: fptoui_8f32_to_4i64:			; AVX1-LABEL: fptoui_8f32_to_4i64:
	; AVX1: # %bb.0:			; AVX1: # %bb.0:
	; AVX1-NEXT: vpermilps {{.*#+}} xmm2 = xmm0[3,1,2,3]			; AVX1-NEXT: vpermilps {{.*#+}} xmm2 = xmm0[3,1,2,3]
	; AVX1-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero			; AVX1-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero
	; AVX1-NEXT: vsubss %xmm1, %xmm2, %xmm3			; AVX1-NEXT: vsubss %xmm1, %xmm2, %xmm3
	; AVX1-NEXT: vcvttss2si %xmm3, %rax			; AVX1-NEXT: vcvttss2si %xmm3, %rax
	; AVX1-NEXT: movabsq $-9223372036854775808, %rcx # imm = 0x8000000000000000			; AVX1-NEXT: btcq $63, %rax
	; AVX1-NEXT: xorq %rcx, %rax			; AVX1-NEXT: vcvttss2si %xmm2, %rcx
	; AVX1-NEXT: vcvttss2si %xmm2, %rdx
	; AVX1-NEXT: vucomiss %xmm1, %xmm2			; AVX1-NEXT: vucomiss %xmm1, %xmm2
	; AVX1-NEXT: cmovaeq %rax, %rdx			; AVX1-NEXT: cmovaeq %rax, %rcx
	; AVX1-NEXT: vmovq %rdx, %xmm2			; AVX1-NEXT: vmovq %rcx, %xmm2
	; AVX1-NEXT: vpermilpd {{.*#+}} xmm3 = xmm0[1,0]			; AVX1-NEXT: vpermilpd {{.*#+}} xmm3 = xmm0[1,0]
	; AVX1-NEXT: vsubss %xmm1, %xmm3, %xmm4			; AVX1-NEXT: vsubss %xmm1, %xmm3, %xmm4
	; AVX1-NEXT: vcvttss2si %xmm4, %rax			; AVX1-NEXT: vcvttss2si %xmm4, %rax
	; AVX1-NEXT: xorq %rcx, %rax			; AVX1-NEXT: btcq $63, %rax
	; AVX1-NEXT: vcvttss2si %xmm3, %rdx			; AVX1-NEXT: vcvttss2si %xmm3, %rcx
	; AVX1-NEXT: vucomiss %xmm1, %xmm3			; AVX1-NEXT: vucomiss %xmm1, %xmm3
	; AVX1-NEXT: cmovaeq %rax, %rdx			; AVX1-NEXT: cmovaeq %rax, %rcx
	; AVX1-NEXT: vmovq %rdx, %xmm3			; AVX1-NEXT: vmovq %rcx, %xmm3
	; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm3[0],xmm2[0]			; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm3[0],xmm2[0]
	; AVX1-NEXT: vsubss %xmm1, %xmm0, %xmm3			; AVX1-NEXT: vsubss %xmm1, %xmm0, %xmm3
	; AVX1-NEXT: vcvttss2si %xmm3, %rax			; AVX1-NEXT: vcvttss2si %xmm3, %rax
	; AVX1-NEXT: xorq %rcx, %rax			; AVX1-NEXT: btcq $63, %rax
	; AVX1-NEXT: vcvttss2si %xmm0, %rdx			; AVX1-NEXT: vcvttss2si %xmm0, %rcx
	; AVX1-NEXT: vucomiss %xmm1, %xmm0			; AVX1-NEXT: vucomiss %xmm1, %xmm0
	; AVX1-NEXT: cmovaeq %rax, %rdx			; AVX1-NEXT: cmovaeq %rax, %rcx
	; AVX1-NEXT: vmovq %rdx, %xmm3			; AVX1-NEXT: vmovq %rcx, %xmm3
	; AVX1-NEXT: vmovshdup {{.*#+}} xmm0 = xmm0[1,1,3,3]			; AVX1-NEXT: vmovshdup {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; AVX1-NEXT: vsubss %xmm1, %xmm0, %xmm4			; AVX1-NEXT: vsubss %xmm1, %xmm0, %xmm4
	; AVX1-NEXT: vcvttss2si %xmm4, %rax			; AVX1-NEXT: vcvttss2si %xmm4, %rax
	; AVX1-NEXT: xorq %rcx, %rax			; AVX1-NEXT: btcq $63, %rax
	; AVX1-NEXT: vcvttss2si %xmm0, %rcx			; AVX1-NEXT: vcvttss2si %xmm0, %rcx
	; AVX1-NEXT: vucomiss %xmm1, %xmm0			; AVX1-NEXT: vucomiss %xmm1, %xmm0
	; AVX1-NEXT: cmovaeq %rax, %rcx			; AVX1-NEXT: cmovaeq %rax, %rcx
	; AVX1-NEXT: vmovq %rcx, %xmm0			; AVX1-NEXT: vmovq %rcx, %xmm0
	; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm3[0],xmm0[0]			; AVX1-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm3[0],xmm0[0]
	; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0			; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
	; AVX1-NEXT: retq			; AVX1-NEXT: retq
	;			;
	; AVX2-LABEL: fptoui_8f32_to_4i64:			; AVX2-LABEL: fptoui_8f32_to_4i64:
	; AVX2: # %bb.0:			; AVX2: # %bb.0:
	; AVX2-NEXT: vpermilps {{.*#+}} xmm2 = xmm0[3,1,2,3]			; AVX2-NEXT: vpermilps {{.*#+}} xmm2 = xmm0[3,1,2,3]
	; AVX2-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero			; AVX2-NEXT: vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero
	; AVX2-NEXT: vsubss %xmm1, %xmm2, %xmm3			; AVX2-NEXT: vsubss %xmm1, %xmm2, %xmm3
	; AVX2-NEXT: vcvttss2si %xmm3, %rax			; AVX2-NEXT: vcvttss2si %xmm3, %rax
	; AVX2-NEXT: movabsq $-9223372036854775808, %rcx # imm = 0x8000000000000000			; AVX2-NEXT: btcq $63, %rax
	; AVX2-NEXT: xorq %rcx, %rax			; AVX2-NEXT: vcvttss2si %xmm2, %rcx
	; AVX2-NEXT: vcvttss2si %xmm2, %rdx
	; AVX2-NEXT: vucomiss %xmm1, %xmm2			; AVX2-NEXT: vucomiss %xmm1, %xmm2
	; AVX2-NEXT: cmovaeq %rax, %rdx			; AVX2-NEXT: cmovaeq %rax, %rcx
	; AVX2-NEXT: vmovq %rdx, %xmm2			; AVX2-NEXT: vmovq %rcx, %xmm2
	; AVX2-NEXT: vpermilpd {{.*#+}} xmm3 = xmm0[1,0]			; AVX2-NEXT: vpermilpd {{.*#+}} xmm3 = xmm0[1,0]
	; AVX2-NEXT: vsubss %xmm1, %xmm3, %xmm4			; AVX2-NEXT: vsubss %xmm1, %xmm3, %xmm4
	; AVX2-NEXT: vcvttss2si %xmm4, %rax			; AVX2-NEXT: vcvttss2si %xmm4, %rax
	; AVX2-NEXT: xorq %rcx, %rax			; AVX2-NEXT: btcq $63, %rax
	; AVX2-NEXT: vcvttss2si %xmm3, %rdx			; AVX2-NEXT: vcvttss2si %xmm3, %rcx
	; AVX2-NEXT: vucomiss %xmm1, %xmm3			; AVX2-NEXT: vucomiss %xmm1, %xmm3
	; AVX2-NEXT: cmovaeq %rax, %rdx			; AVX2-NEXT: cmovaeq %rax, %rcx
	; AVX2-NEXT: vmovq %rdx, %xmm3			; AVX2-NEXT: vmovq %rcx, %xmm3
	; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm3[0],xmm2[0]			; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm2 = xmm3[0],xmm2[0]
	; AVX2-NEXT: vsubss %xmm1, %xmm0, %xmm3			; AVX2-NEXT: vsubss %xmm1, %xmm0, %xmm3
	; AVX2-NEXT: vcvttss2si %xmm3, %rax			; AVX2-NEXT: vcvttss2si %xmm3, %rax
	; AVX2-NEXT: xorq %rcx, %rax			; AVX2-NEXT: btcq $63, %rax
	; AVX2-NEXT: vcvttss2si %xmm0, %rdx			; AVX2-NEXT: vcvttss2si %xmm0, %rcx
	; AVX2-NEXT: vucomiss %xmm1, %xmm0			; AVX2-NEXT: vucomiss %xmm1, %xmm0
	; AVX2-NEXT: cmovaeq %rax, %rdx			; AVX2-NEXT: cmovaeq %rax, %rcx
	; AVX2-NEXT: vmovq %rdx, %xmm3			; AVX2-NEXT: vmovq %rcx, %xmm3
	; AVX2-NEXT: vmovshdup {{.*#+}} xmm0 = xmm0[1,1,3,3]			; AVX2-NEXT: vmovshdup {{.*#+}} xmm0 = xmm0[1,1,3,3]
	; AVX2-NEXT: vsubss %xmm1, %xmm0, %xmm4			; AVX2-NEXT: vsubss %xmm1, %xmm0, %xmm4
	; AVX2-NEXT: vcvttss2si %xmm4, %rax			; AVX2-NEXT: vcvttss2si %xmm4, %rax
	; AVX2-NEXT: xorq %rcx, %rax			; AVX2-NEXT: btcq $63, %rax
	; AVX2-NEXT: vcvttss2si %xmm0, %rcx			; AVX2-NEXT: vcvttss2si %xmm0, %rcx
	; AVX2-NEXT: vucomiss %xmm1, %xmm0			; AVX2-NEXT: vucomiss %xmm1, %xmm0
	; AVX2-NEXT: cmovaeq %rax, %rcx			; AVX2-NEXT: cmovaeq %rax, %rcx
	; AVX2-NEXT: vmovq %rcx, %xmm0			; AVX2-NEXT: vmovq %rcx, %xmm0
	; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm3[0],xmm0[0]			; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm3[0],xmm0[0]
	; AVX2-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0			; AVX2-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	▲ Show 20 Lines • Show All 423 Lines • Show Last 20 Lines

test/CodeGen/X86/x86-64-bittest-logic.ll

This file was added.

				; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				; RUN: llc < %s -mtriple=x86_64-pc-linux \| FileCheck %s

				define i64 @and1(i64 %x) {
				; CHECK-LABEL: and1:
				; CHECK: # %bb.0:
				; CHECK-NEXT: btrq $31, %rdi
				; CHECK-NEXT: movq %rdi, %rax
				; CHECK-NEXT: retq
				%a = and i64 %x, 18446744071562067967 ; clear bit 31
				ret i64 %a
				}

				define i64 @and2(i64 %x) {
				; CHECK-LABEL: and2:
				; CHECK: # %bb.0:
				; CHECK-NEXT: btrq $32, %rdi
				; CHECK-NEXT: movq %rdi, %rax
				; CHECK-NEXT: retq
				%a = and i64 %x, 18446744069414584319 ; clear bit 32
				ret i64 %a
				}

				define i64 @and3(i64 %x) {
				; CHECK-LABEL: and3:
				; CHECK: # %bb.0:
				; CHECK-NEXT: btrq $62, %rdi
				; CHECK-NEXT: movq %rdi, %rax
				; CHECK-NEXT: retq
				%a = and i64 %x, 13835058055282163711 ; clear bit 62
				ret i64 %a
				}

				define i64 @and4(i64 %x) {
				; CHECK-LABEL: and4:
				; CHECK: # %bb.0:
				; CHECK-NEXT: btrq $63, %rdi
				; CHECK-NEXT: movq %rdi, %rax
				; CHECK-NEXT: retq
				%a = and i64 %x, 9223372036854775807 ; clear bit 63
				ret i64 %a
				}

				define i64 @or1(i64 %x) {
				; CHECK-LABEL: or1:
				; CHECK: # %bb.0:
				; CHECK-NEXT: btsq $31, %rdi
				; CHECK-NEXT: movq %rdi, %rax
				; CHECK-NEXT: retq
				%a = or i64 %x, 2147483648 ; set bit 31
				ret i64 %a
				}

				define i64 @or2(i64 %x) {
				; CHECK-LABEL: or2:
				; CHECK: # %bb.0:
				; CHECK-NEXT: btsq $32, %rdi
				; CHECK-NEXT: movq %rdi, %rax
				; CHECK-NEXT: retq
				%a = or i64 %x, 4294967296 ; set bit 32
				ret i64 %a
				}

				define i64 @or3(i64 %x) {
				; CHECK-LABEL: or3:
				; CHECK: # %bb.0:
				; CHECK-NEXT: btsq $62, %rdi
				; CHECK-NEXT: movq %rdi, %rax
				; CHECK-NEXT: retq
				%a = or i64 %x, 4611686018427387904 ; set bit 62
				ret i64 %a
				}

				define i64 @or4(i64 %x) {
				; CHECK-LABEL: or4:
				; CHECK: # %bb.0:
				; CHECK-NEXT: btsq $63, %rdi
				; CHECK-NEXT: movq %rdi, %rax
				; CHECK-NEXT: retq
				%a = or i64 %x, 9223372036854775808 ; set bit 63
				ret i64 %a
				}

				define i64 @xor1(i64 %x) {
				; CHECK-LABEL: xor1:
				; CHECK: # %bb.0:
				; CHECK-NEXT: btcq $31, %rdi
				; CHECK-NEXT: movq %rdi, %rax
				; CHECK-NEXT: retq
				%a = xor i64 %x, 2147483648 ; toggle bit 31
				ret i64 %a
				}

				define i64 @xor2(i64 %x) {
				; CHECK-LABEL: xor2:
				; CHECK: # %bb.0:
				; CHECK-NEXT: btcq $32, %rdi
				; CHECK-NEXT: movq %rdi, %rax
				; CHECK-NEXT: retq
				%a = xor i64 %x, 4294967296 ; toggle bit 32
				ret i64 %a
				}

				define i64 @xor3(i64 %x) {
				; CHECK-LABEL: xor3:
				; CHECK: # %bb.0:
				; CHECK-NEXT: btcq $62, %rdi
				; CHECK-NEXT: movq %rdi, %rax
				; CHECK-NEXT: retq
				%a = xor i64 %x, 4611686018427387904 ; toggle bit 62
				ret i64 %a
				}

				define i64 @xor4(i64 %x) {
				; CHECK-LABEL: xor4:
				; CHECK: # %bb.0:
				; CHECK-NEXT: btcq $63, %rdi
				; CHECK-NEXT: movq %rdi, %rax
				; CHECK-NEXT: retq
				%a = xor i64 %x, 9223372036854775808 ; toggle bit 63
				ret i64 %a
				}

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Use btc/btr/bts to implement xor/and/or that affects a single bit in the upper 32-bits of a 64-bit operation.
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 129674

lib/Target/X86/X86ISelDAGToDAG.cpp

lib/Target/X86/X86InstrCompiler.td

lib/Target/X86/X86InstrInfo.td

test/CodeGen/X86/half.ll

test/CodeGen/X86/vec_fp_to_int.ll

test/CodeGen/X86/x86-64-bittest-logic.ll

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Use btc/btr/bts to implement xor/and/or that affects a single bit in the upper 32-bits of a 64-bit operation.ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 129674

lib/Target/X86/X86ISelDAGToDAG.cpp

lib/Target/X86/X86InstrCompiler.td

lib/Target/X86/X86InstrInfo.td

test/CodeGen/X86/half.ll

test/CodeGen/X86/vec_fp_to_int.ll

test/CodeGen/X86/x86-64-bittest-logic.ll

[X86] Use btc/btr/bts to implement xor/and/or that affects a single bit in the upper 32-bits of a 64-bit operation.
ClosedPublic