Diff 489543

llvm/lib/Target/X86/X86ISelLowering.h

Show First 20 Lines • Show All 1,085 Lines • ▼ Show 20 Lines	public:

bool hasBitTest(SDValue X, SDValue Y) const override;		bool hasBitTest(SDValue X, SDValue Y) const override;

bool shouldProduceAndByConstByHoistingConstFromShiftsLHSOfAnd(		bool shouldProduceAndByConstByHoistingConstFromShiftsLHSOfAnd(
SDValue X, ConstantSDNode XC, ConstantSDNode CC, SDValue Y,		SDValue X, ConstantSDNode XC, ConstantSDNode CC, SDValue Y,
unsigned OldShiftOpcode, unsigned NewShiftOpcode,		unsigned OldShiftOpcode, unsigned NewShiftOpcode,
SelectionDAG &DAG) const override;		SelectionDAG &DAG) const override;

		bool preferScalarizeSplat(unsigned Opc) const override;

bool shouldFoldConstantShiftPairToMask(const SDNode *N,		bool shouldFoldConstantShiftPairToMask(const SDNode *N,
CombineLevel Level) const override;		CombineLevel Level) const override;

bool shouldFoldMaskToVariableShiftPair(SDValue Y) const override;		bool shouldFoldMaskToVariableShiftPair(SDValue Y) const override;

bool		bool
shouldTransformSignedTruncationCheck(EVT XVT,		shouldTransformSignedTruncationCheck(EVT XVT,
unsigned KeptBits) const override {		unsigned KeptBits) const override {
▲ Show 20 Lines • Show All 730 Lines • Show Last 20 Lines

llvm/lib/Target/X86/X86ISelLowering.cpp

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 6,006 Lines • ▼ Show 20 Lines	if (DAG.isSplatValue(Y, /AllowUndefs=/true))
return true;		return true;
// If we have AVX2 with it's powerful shift operations, then it's also good.		// If we have AVX2 with it's powerful shift operations, then it's also good.
if (Subtarget.hasAVX2())		if (Subtarget.hasAVX2())
return true;		return true;
// Pre-AVX2 vector codegen for this pattern is best for variant with 'shl'.		// Pre-AVX2 vector codegen for this pattern is best for variant with 'shl'.
return NewShiftOpcode == ISD::SHL;		return NewShiftOpcode == ISD::SHL;
}		}

		bool X86TargetLowering::preferScalarizeSplat(unsigned Opc) const {
		return Opc != ISD::FP_EXTEND;
		}
		skanUnsubmitted Done Reply Inline Actions Why not `return Opc != ISD::FP_EXTEND`? skan: Why not `return Opc != ISD::FP_EXTEND`?

bool X86TargetLowering::shouldFoldConstantShiftPairToMask(		bool X86TargetLowering::shouldFoldConstantShiftPairToMask(
const SDNode *N, CombineLevel Level) const {		const SDNode *N, CombineLevel Level) const {
assert(((N->getOpcode() == ISD::SHL &&		assert(((N->getOpcode() == ISD::SHL &&
N->getOperand(0).getOpcode() == ISD::SRL) \|\|		N->getOperand(0).getOpcode() == ISD::SRL) \|\|
(N->getOpcode() == ISD::SRL &&		(N->getOpcode() == ISD::SRL &&
N->getOperand(0).getOpcode() == ISD::SHL)) &&		N->getOperand(0).getOpcode() == ISD::SHL)) &&
"Expected shift-shift mask");		"Expected shift-shift mask");
// TODO: Should we always create i64 masks? Or only folded immediates?		// TODO: Should we always create i64 masks? Or only folded immediates?
▲ Show 20 Lines • Show All 51,497 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/prefer-fpext-splat.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				pengfeiUnsubmitted Done Reply Inline Actions Pre-commit the test to show the problem? pengfei: Pre-commit the test to show the problem?
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown \| FileCheck %s --check-prefixes=SSE			; RUN: llc < %s -mtriple=x86_64-unknown-unknown \| FileCheck %s --check-prefixes=SSE
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefixes=AVX,AVX1			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefixes=AVX,AVX1
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefixes=AVX,AVX2			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefixes=AVX,AVX2
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f,+avx512vl \| FileCheck %s --check-prefixes=AVX,AVX512			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f,+avx512vl \| FileCheck %s --check-prefixes=AVX512,AVX512F
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512fp16,+avx512vl \| FileCheck %s --check-prefixes=AVX,AVX512FP16			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512fp16,+avx512vl \| FileCheck %s --check-prefixes=AVX512,AVX512FP16
				RKSimonUnsubmitted Done Reply Inline Actions remove the global constant and use a function argument: define <4 x double> @prefer(float* %p) { entry: %0 = load float, float* %p, align 4 RKSimon: remove the global constant and use a function argument: ``` define <4 x double> @prefer(float*…
				RKSimonUnsubmitted Done Reply Inline Actions Please can you add sse/avx1/avx2 test coverage as well just to ensure non-avx512 targets prefer this as well? RKSimon: Please can you add sse/avx1/avx2 test coverage as well just to ensure non-avx512 targets prefer…
				lebedev.riUnsubmitted Done Reply Inline Actions Precommit please lebedev.ri: Precommit please

	define <2 x double> @prefer_f32_v2f64(ptr %p) nounwind {			define <2 x double> @prefer_f32_v2f64(ptr %p) nounwind {
				lebedev.riUnsubmitted Not Done Reply Inline Actions While there, please add i8/i16/i32/i64/double/half tests lebedev.ri: While there, please add i8/i16/i32/i64/double/half tests
	; SSE-LABEL: prefer_f32_v2f64:			; SSE-LABEL: prefer_f32_v2f64:
	; SSE: # %bb.0: # %entry			; SSE: # %bb.0: # %entry
	; SSE-NEXT: movss {{.*#+}} xmm0 = mem[0],zero,zero,zero			; SSE-NEXT: movss {{.*#+}} xmm0 = mem[0],zero,zero,zero
	; SSE-NEXT: cvtss2sd %xmm0, %xmm0			; SSE-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,0,0,0]
	; SSE-NEXT: movlhps {{.*#+}} xmm0 = xmm0[0,0]			; SSE-NEXT: cvtps2pd %xmm0, %xmm0
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX-LABEL: prefer_f32_v2f64:			; AVX-LABEL: prefer_f32_v2f64:
	; AVX: # %bb.0: # %entry			; AVX: # %bb.0: # %entry
	; AVX-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero			; AVX-NEXT: vbroadcastss (%rdi), %xmm0
	; AVX-NEXT: vcvtss2sd %xmm0, %xmm0, %xmm0			; AVX-NEXT: vcvtps2pd %xmm0, %xmm0
	; AVX-NEXT: vmovddup {{.*#+}} xmm0 = xmm0[0,0]
	; AVX-NEXT: retq			; AVX-NEXT: retq
				;
				; AVX512-LABEL: prefer_f32_v2f64:
				; AVX512: # %bb.0: # %entry
				; AVX512-NEXT: vcvtps2pd (%rdi){1to2}, %xmm0
				; AVX512-NEXT: retq
	entry:			entry:
	%0 = load float, ptr %p, align 4			%0 = load float, ptr %p, align 4
	%vecinit.i = insertelement <2 x float> undef, float %0, i64 0			%vecinit.i = insertelement <2 x float> undef, float %0, i64 0
	%vecinit3.i = shufflevector <2 x float> %vecinit.i, <2 x float> poison, <2 x i32> zeroinitializer			%vecinit3.i = shufflevector <2 x float> %vecinit.i, <2 x float> poison, <2 x i32> zeroinitializer
	%conv.i = fpext <2 x float> %vecinit3.i to <2 x double>			%conv.i = fpext <2 x float> %vecinit3.i to <2 x double>
	ret <2 x double> %conv.i			ret <2 x double> %conv.i
	}			}

	define <4 x double> @prefer_f32_v4f64(ptr %p) nounwind {			define <4 x double> @prefer_f32_v4f64(ptr %p) nounwind {
	; SSE-LABEL: prefer_f32_v4f64:			; SSE-LABEL: prefer_f32_v4f64:
	; SSE: # %bb.0: # %entry			; SSE: # %bb.0: # %entry
	; SSE-NEXT: movss {{.*#+}} xmm0 = mem[0],zero,zero,zero			; SSE-NEXT: movss {{.*#+}} xmm0 = mem[0],zero,zero,zero
	; SSE-NEXT: cvtss2sd %xmm0, %xmm0			; SSE-NEXT: shufps {{.*#+}} xmm0 = xmm0[0,0,0,0]
	; SSE-NEXT: movlhps {{.*#+}} xmm0 = xmm0[0,0]			; SSE-NEXT: cvtps2pd %xmm0, %xmm0
	; SSE-NEXT: movaps %xmm0, %xmm1			; SSE-NEXT: movaps %xmm0, %xmm1
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-LABEL: prefer_f32_v4f64:			; AVX-LABEL: prefer_f32_v4f64:
	; AVX1: # %bb.0: # %entry			; AVX: # %bb.0: # %entry
	; AVX1-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero			; AVX-NEXT: vbroadcastss (%rdi), %xmm0
	; AVX1-NEXT: vcvtss2sd %xmm0, %xmm0, %xmm0			; AVX-NEXT: vcvtps2pd %xmm0, %ymm0
	; AVX1-NEXT: vmovddup {{.*#+}} xmm0 = xmm0[0,0]			; AVX-NEXT: retq
	; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm0, %ymm0
	; AVX1-NEXT: retq
	;
	; AVX2-LABEL: prefer_f32_v4f64:
	; AVX2: # %bb.0: # %entry
	; AVX2-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
	; AVX2-NEXT: vcvtss2sd %xmm0, %xmm0, %xmm0
	; AVX2-NEXT: vbroadcastsd %xmm0, %ymm0
	; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: prefer_f32_v4f64:			; AVX512-LABEL: prefer_f32_v4f64:
	; AVX512: # %bb.0: # %entry			; AVX512: # %bb.0: # %entry
	; AVX512-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero			; AVX512-NEXT: vcvtps2pd (%rdi){1to4}, %ymm0
	; AVX512-NEXT: vcvtss2sd %xmm0, %xmm0, %xmm0
	; AVX512-NEXT: vbroadcastsd %xmm0, %ymm0
	; AVX512-NEXT: retq			; AVX512-NEXT: retq
	;
	; AVX512FP16-LABEL: prefer_f32_v4f64:
	; AVX512FP16: # %bb.0: # %entry
	; AVX512FP16-NEXT: vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
	; AVX512FP16-NEXT: vcvtss2sd %xmm0, %xmm0, %xmm0
	; AVX512FP16-NEXT: vbroadcastsd %xmm0, %ymm0
	; AVX512FP16-NEXT: retq
	entry:			entry:
	%0 = load float, ptr %p, align 4			%0 = load float, ptr %p, align 4
				pengfeiUnsubmitted Done Reply Inline Actions Change to `ptr`. pengfei: Change to `ptr`.
	%vecinit.i = insertelement <4 x float> undef, float %0, i64 0			%vecinit.i = insertelement <4 x float> undef, float %0, i64 0
	%vecinit3.i = shufflevector <4 x float> %vecinit.i, <4 x float> poison, <4 x i32> zeroinitializer			%vecinit3.i = shufflevector <4 x float> %vecinit.i, <4 x float> poison, <4 x i32> zeroinitializer
	%conv.i = fpext <4 x float> %vecinit3.i to <4 x double>			%conv.i = fpext <4 x float> %vecinit3.i to <4 x double>
	ret <4 x double> %conv.i			ret <4 x double> %conv.i
	}			}

	define <4 x float> @prefer_f16_v4f32(ptr %p) nounwind {			define <4 x float> @prefer_f16_v4f32(ptr %p) nounwind {
	; SSE-LABEL: prefer_f16_v4f32:			; SSE-LABEL: prefer_f16_v4f32:
	Show All 18 Lines
	; AVX2: # %bb.0: # %entry			; AVX2: # %bb.0: # %entry
	; AVX2-NEXT: pushq %rax			; AVX2-NEXT: pushq %rax
	; AVX2-NEXT: vpinsrw $0, (%rdi), %xmm0, %xmm0			; AVX2-NEXT: vpinsrw $0, (%rdi), %xmm0, %xmm0
	; AVX2-NEXT: callq __extendhfsf2@PLT			; AVX2-NEXT: callq __extendhfsf2@PLT
	; AVX2-NEXT: vpbroadcastd %xmm0, %xmm0			; AVX2-NEXT: vpbroadcastd %xmm0, %xmm0
	; AVX2-NEXT: popq %rax			; AVX2-NEXT: popq %rax
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: prefer_f16_v4f32:			; AVX512F-LABEL: prefer_f16_v4f32:
	; AVX512: # %bb.0: # %entry			; AVX512F: # %bb.0: # %entry
	; AVX512-NEXT: movzwl (%rdi), %eax			; AVX512F-NEXT: vpbroadcastw (%rdi), %xmm0
	; AVX512-NEXT: vmovd %eax, %xmm0			; AVX512F-NEXT: vcvtph2ps %xmm0, %xmm0
	; AVX512-NEXT: vcvtph2ps %xmm0, %xmm0			; AVX512F-NEXT: retq
	; AVX512-NEXT: vbroadcastss %xmm0, %xmm0
	; AVX512-NEXT: retq
	;			;
	; AVX512FP16-LABEL: prefer_f16_v4f32:			; AVX512FP16-LABEL: prefer_f16_v4f32:
	; AVX512FP16: # %bb.0: # %entry			; AVX512FP16: # %bb.0: # %entry
	; AVX512FP16-NEXT: vmovsh (%rdi), %xmm0			; AVX512FP16-NEXT: vcvtph2psx (%rdi){1to4}, %xmm0
	; AVX512FP16-NEXT: vcvtsh2ss %xmm0, %xmm0, %xmm0
	; AVX512FP16-NEXT: vbroadcastss %xmm0, %xmm0
	; AVX512FP16-NEXT: retq			; AVX512FP16-NEXT: retq
	entry:			entry:
	%0 = load half, ptr %p, align 4			%0 = load half, ptr %p, align 4
	%vecinit.i = insertelement <4 x half> undef, half %0, i64 0			%vecinit.i = insertelement <4 x half> undef, half %0, i64 0
	%vecinit3.i = shufflevector <4 x half> %vecinit.i, <4 x half> poison, <4 x i32> zeroinitializer			%vecinit3.i = shufflevector <4 x half> %vecinit.i, <4 x half> poison, <4 x i32> zeroinitializer
	%conv.i = fpext <4 x half> %vecinit3.i to <4 x float>			%conv.i = fpext <4 x half> %vecinit3.i to <4 x float>
	ret <4 x float> %conv.i			ret <4 x float> %conv.i
	}			}
	Show All 23 Lines
	; AVX2: # %bb.0: # %entry			; AVX2: # %bb.0: # %entry
	; AVX2-NEXT: pushq %rax			; AVX2-NEXT: pushq %rax
	; AVX2-NEXT: vpinsrw $0, (%rdi), %xmm0, %xmm0			; AVX2-NEXT: vpinsrw $0, (%rdi), %xmm0, %xmm0
	; AVX2-NEXT: callq __extendhfsf2@PLT			; AVX2-NEXT: callq __extendhfsf2@PLT
	; AVX2-NEXT: vpbroadcastd %xmm0, %ymm0			; AVX2-NEXT: vpbroadcastd %xmm0, %ymm0
	; AVX2-NEXT: popq %rax			; AVX2-NEXT: popq %rax
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: prefer_f16_v8f32:			; AVX512F-LABEL: prefer_f16_v8f32:
	; AVX512: # %bb.0: # %entry			; AVX512F: # %bb.0: # %entry
	; AVX512-NEXT: movzwl (%rdi), %eax			; AVX512F-NEXT: vpbroadcastw (%rdi), %xmm0
	; AVX512-NEXT: vmovd %eax, %xmm0			; AVX512F-NEXT: vcvtph2ps %xmm0, %ymm0
	; AVX512-NEXT: vcvtph2ps %xmm0, %xmm0			; AVX512F-NEXT: retq
	; AVX512-NEXT: vbroadcastss %xmm0, %ymm0
	; AVX512-NEXT: retq
	;			;
	; AVX512FP16-LABEL: prefer_f16_v8f32:			; AVX512FP16-LABEL: prefer_f16_v8f32:
	; AVX512FP16: # %bb.0: # %entry			; AVX512FP16: # %bb.0: # %entry
	; AVX512FP16-NEXT: vmovsh (%rdi), %xmm0			; AVX512FP16-NEXT: vcvtph2psx (%rdi){1to8}, %ymm0
	; AVX512FP16-NEXT: vcvtsh2ss %xmm0, %xmm0, %xmm0
	; AVX512FP16-NEXT: vbroadcastss %xmm0, %ymm0
	; AVX512FP16-NEXT: retq			; AVX512FP16-NEXT: retq
	entry:			entry:
	%0 = load half, ptr %p, align 4			%0 = load half, ptr %p, align 4
	%vecinit.i = insertelement <8 x half> undef, half %0, i64 0			%vecinit.i = insertelement <8 x half> undef, half %0, i64 0
	%vecinit3.i = shufflevector <8 x half> %vecinit.i, <8 x half> poison, <8 x i32> zeroinitializer			%vecinit3.i = shufflevector <8 x half> %vecinit.i, <8 x half> poison, <8 x i32> zeroinitializer
	%conv.i = fpext <8 x half> %vecinit3.i to <8 x float>			%conv.i = fpext <8 x half> %vecinit3.i to <8 x float>
	ret <8 x float> %conv.i			ret <8 x float> %conv.i
	}			}

	define <2 x double> @prefer_f16_v2f64(ptr %p) nounwind {			define <2 x double> @prefer_f16_v2f64(ptr %p) nounwind {
	; SSE-LABEL: prefer_f16_v2f64:			; SSE-LABEL: prefer_f16_v2f64:
	; SSE: # %bb.0: # %entry			; SSE: # %bb.0: # %entry
	; SSE-NEXT: pushq %rax			; SSE-NEXT: pushq %rax
	; SSE-NEXT: pinsrw $0, (%rdi), %xmm0			; SSE-NEXT: pinsrw $0, (%rdi), %xmm0
	; SSE-NEXT: callq __extendhfsf2@PLT			; SSE-NEXT: callq __extendhfsf2@PLT
	; SSE-NEXT: cvtss2sd %xmm0, %xmm0			; SSE-NEXT: cvtss2sd %xmm0, %xmm0
	; SSE-NEXT: movlhps {{.*#+}} xmm0 = xmm0[0,0]			; SSE-NEXT: movlhps {{.*#+}} xmm0 = xmm0[0,0]
	; SSE-NEXT: popq %rax			; SSE-NEXT: popq %rax
	; SSE-NEXT: retq			; SSE-NEXT: retq
	;			;
	; AVX1-LABEL: prefer_f16_v2f64:			; AVX-LABEL: prefer_f16_v2f64:
	; AVX1: # %bb.0: # %entry			; AVX: # %bb.0: # %entry
	; AVX1-NEXT: pushq %rax			; AVX-NEXT: pushq %rax
	; AVX1-NEXT: vpinsrw $0, (%rdi), %xmm0, %xmm0			; AVX-NEXT: vpinsrw $0, (%rdi), %xmm0, %xmm0
	; AVX1-NEXT: callq __extendhfsf2@PLT			; AVX-NEXT: callq __extendhfsf2@PLT
	; AVX1-NEXT: vcvtss2sd %xmm0, %xmm0, %xmm0			; AVX-NEXT: vcvtss2sd %xmm0, %xmm0, %xmm0
	; AVX1-NEXT: vmovddup {{.*#+}} xmm0 = xmm0[0,0]			; AVX-NEXT: vmovddup {{.*#+}} xmm0 = xmm0[0,0]
	; AVX1-NEXT: popq %rax			; AVX-NEXT: popq %rax
	; AVX1-NEXT: retq			; AVX-NEXT: retq
	;
	; AVX2-LABEL: prefer_f16_v2f64:
	; AVX2: # %bb.0: # %entry
	; AVX2-NEXT: pushq %rax
	; AVX2-NEXT: vpinsrw $0, (%rdi), %xmm0, %xmm0
	; AVX2-NEXT: callq __extendhfsf2@PLT
	; AVX2-NEXT: vcvtss2sd %xmm0, %xmm0, %xmm0
	; AVX2-NEXT: vmovddup {{.*#+}} xmm0 = xmm0[0,0]
	; AVX2-NEXT: popq %rax
	; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: prefer_f16_v2f64:			; AVX512F-LABEL: prefer_f16_v2f64:
	; AVX512: # %bb.0: # %entry			; AVX512F: # %bb.0: # %entry
	; AVX512-NEXT: movzwl (%rdi), %eax			; AVX512F-NEXT: vpbroadcastw (%rdi), %xmm0
	; AVX512-NEXT: vmovd %eax, %xmm0			; AVX512F-NEXT: vpxor %xmm1, %xmm1, %xmm1
	; AVX512-NEXT: vcvtph2ps %xmm0, %xmm0			; AVX512F-NEXT: vpblendd {{.*#+}} xmm0 = xmm0[0],xmm1[1,2,3]
	; AVX512-NEXT: vcvtss2sd %xmm0, %xmm0, %xmm0			; AVX512F-NEXT: vcvtph2ps %xmm0, %xmm0
	; AVX512-NEXT: vmovddup {{.*#+}} xmm0 = xmm0[0,0]			; AVX512F-NEXT: vcvtps2pd %xmm0, %xmm0
	; AVX512-NEXT: retq			; AVX512F-NEXT: retq
	;			;
	; AVX512FP16-LABEL: prefer_f16_v2f64:			; AVX512FP16-LABEL: prefer_f16_v2f64:
	; AVX512FP16: # %bb.0: # %entry			; AVX512FP16: # %bb.0: # %entry
	; AVX512FP16-NEXT: vmovsh (%rdi), %xmm0			; AVX512FP16-NEXT: vcvtph2pd (%rdi){1to2}, %xmm0
	; AVX512FP16-NEXT: vcvtsh2sd %xmm0, %xmm0, %xmm0
	; AVX512FP16-NEXT: vmovddup {{.*#+}} xmm0 = xmm0[0,0]
	; AVX512FP16-NEXT: retq			; AVX512FP16-NEXT: retq
	entry:			entry:
	%0 = load half, ptr %p, align 4			%0 = load half, ptr %p, align 4
	%vecinit.i = insertelement <2 x half> undef, half %0, i64 0			%vecinit.i = insertelement <2 x half> undef, half %0, i64 0
	%vecinit3.i = shufflevector <2 x half> %vecinit.i, <2 x half> poison, <2 x i32> zeroinitializer			%vecinit3.i = shufflevector <2 x half> %vecinit.i, <2 x half> poison, <2 x i32> zeroinitializer
	%conv.i = fpext <2 x half> %vecinit3.i to <2 x double>			%conv.i = fpext <2 x half> %vecinit3.i to <2 x double>
	ret <2 x double> %conv.i			ret <2 x double> %conv.i
	}			}
	Show All 26 Lines
	; AVX2-NEXT: pushq %rax			; AVX2-NEXT: pushq %rax
	; AVX2-NEXT: vpinsrw $0, (%rdi), %xmm0, %xmm0			; AVX2-NEXT: vpinsrw $0, (%rdi), %xmm0, %xmm0
	; AVX2-NEXT: callq __extendhfsf2@PLT			; AVX2-NEXT: callq __extendhfsf2@PLT
	; AVX2-NEXT: vcvtss2sd %xmm0, %xmm0, %xmm0			; AVX2-NEXT: vcvtss2sd %xmm0, %xmm0, %xmm0
	; AVX2-NEXT: vbroadcastsd %xmm0, %ymm0			; AVX2-NEXT: vbroadcastsd %xmm0, %ymm0
	; AVX2-NEXT: popq %rax			; AVX2-NEXT: popq %rax
	; AVX2-NEXT: retq			; AVX2-NEXT: retq
	;			;
	; AVX512-LABEL: prefer_f16_v4f64:			; AVX512F-LABEL: prefer_f16_v4f64:
	; AVX512: # %bb.0: # %entry			; AVX512F: # %bb.0: # %entry
	; AVX512-NEXT: movzwl (%rdi), %eax			; AVX512F-NEXT: vpbroadcastw (%rdi), %xmm0
	; AVX512-NEXT: vmovd %eax, %xmm0			; AVX512F-NEXT: vcvtph2ps %xmm0, %xmm0
	; AVX512-NEXT: vcvtph2ps %xmm0, %xmm0			; AVX512F-NEXT: vcvtps2pd %xmm0, %ymm0
	; AVX512-NEXT: vcvtss2sd %xmm0, %xmm0, %xmm0			; AVX512F-NEXT: retq
	; AVX512-NEXT: vbroadcastsd %xmm0, %ymm0
	; AVX512-NEXT: retq
	;			;
	; AVX512FP16-LABEL: prefer_f16_v4f64:			; AVX512FP16-LABEL: prefer_f16_v4f64:
	; AVX512FP16: # %bb.0: # %entry			; AVX512FP16: # %bb.0: # %entry
	; AVX512FP16-NEXT: vmovsh (%rdi), %xmm0			; AVX512FP16-NEXT: vcvtph2pd (%rdi){1to4}, %ymm0
	; AVX512FP16-NEXT: vcvtsh2sd %xmm0, %xmm0, %xmm0
	; AVX512FP16-NEXT: vbroadcastsd %xmm0, %ymm0
	; AVX512FP16-NEXT: retq			; AVX512FP16-NEXT: retq
	entry:			entry:
	%0 = load half, ptr %p, align 4			%0 = load half, ptr %p, align 4
	%vecinit.i = insertelement <4 x half> undef, half %0, i64 0			%vecinit.i = insertelement <4 x half> undef, half %0, i64 0
	%vecinit3.i = shufflevector <4 x half> %vecinit.i, <4 x half> poison, <4 x i32> zeroinitializer			%vecinit3.i = shufflevector <4 x half> %vecinit.i, <4 x half> poison, <4 x i32> zeroinitializer
	%conv.i = fpext <4 x half> %vecinit3.i to <4 x double>			%conv.i = fpext <4 x half> %vecinit3.i to <4 x double>
	ret <4 x double> %conv.i			ret <4 x double> %conv.i
	}			}

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Prefer fpext(splat(X)) to splat(fpext(x)).
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 489543

llvm/lib/Target/X86/X86ISelLowering.h

llvm/lib/Target/X86/X86ISelLowering.cpp

llvm/test/CodeGen/X86/prefer-fpext-splat.ll

This is an archive of the discontinued LLVM Phabricator instance.

[X86] Prefer fpext(splat(X)) to splat(fpext(x)).ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 489543

llvm/lib/Target/X86/X86ISelLowering.h

llvm/lib/Target/X86/X86ISelLowering.cpp

llvm/test/CodeGen/X86/prefer-fpext-splat.ll

[X86] Prefer fpext(splat(X)) to splat(fpext(x)).
ClosedPublic