Diff 230255

llvm/lib/CodeGen/MachineFunction.cpp

Show First 20 Lines • Show All 278 Lines • ▼ Show 20 Lines	if (&FPType == &APFloat::IEEEsingle()) {

// If the f32 variant of the attribute isn't specified, try to use the		// If the f32 variant of the attribute isn't specified, try to use the
// generic one.		// generic one.
}		}

// TODO: Should probably avoid the connection to the IR and store directly		// TODO: Should probably avoid the connection to the IR and store directly
// in the MachineFunction.		// in the MachineFunction.
Attribute Attr = F.getFnAttribute("denormal-fp-math");		Attribute Attr = F.getFnAttribute("denormal-fp-math");
		return parseDenormalFPAttribute(Attr.getValueAsString());
// FIXME: This should assume IEEE behavior on an unspecified
// attribute. However, the one current user incorrectly assumes a non-IEEE
// target by default.
StringRef Val = Attr.getValueAsString();
if (Val.empty())
return DenormalMode::getInvalid();

return parseDenormalFPAttribute(Val);
}		}

/// Should we be emitting segmented stack stuff for the function		/// Should we be emitting segmented stack stuff for the function
bool MachineFunction::shouldSplitStack() const {		bool MachineFunction::shouldSplitStack() const {
return getFunction().hasFnAttribute("split-stack");		return getFunction().hasFnAttribute("split-stack");
}		}

LLVM_NODISCARD unsigned		LLVM_NODISCARD unsigned
▲ Show 20 Lines • Show All 853 Lines • Show Last 20 Lines

llvm/test/CodeGen/X86/pow.ll

	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py			; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-- \| FileCheck %s			; RUN: llc < %s -mtriple=x86_64-- \| FileCheck %s

	declare float @llvm.pow.f32(float, float)			declare float @llvm.pow.f32(float, float)
	declare <4 x float> @llvm.pow.v4f32(<4 x float>, <4 x float>)			declare <4 x float> @llvm.pow.v4f32(<4 x float>, <4 x float>)

	declare double @llvm.pow.f64(double, double)			declare double @llvm.pow.f64(double, double)
	declare <2 x double> @llvm.pow.v2f64(<2 x double>, <2 x double>)			declare <2 x double> @llvm.pow.v2f64(<2 x double>, <2 x double>)

	declare x86_fp80 @llvm.pow.f80(x86_fp80, x86_fp80)			declare x86_fp80 @llvm.pow.f80(x86_fp80, x86_fp80)

	define float @pow_f32_one_fourth_fmf(float %x) nounwind {			define float @pow_f32_one_fourth_fmf_ieee(float %x) nounwind {
	; CHECK-LABEL: pow_f32_one_fourth_fmf:			; CHECK-LABEL: pow_f32_one_fourth_fmf_ieee:
				; CHECK: # %bb.0:
				; CHECK-NEXT: rsqrtss %xmm0, %xmm1
				; CHECK-NEXT: movaps %xmm0, %xmm3
				; CHECK-NEXT: mulss %xmm1, %xmm3
				; CHECK-NEXT: movss {{.*#+}} xmm2 = mem[0],zero,zero,zero
				; CHECK-NEXT: movaps %xmm3, %xmm4
				; CHECK-NEXT: mulss %xmm2, %xmm4
				; CHECK-NEXT: mulss %xmm1, %xmm3
				; CHECK-NEXT: movss {{.*#+}} xmm5 = mem[0],zero,zero,zero
				; CHECK-NEXT: addss %xmm5, %xmm3
				; CHECK-NEXT: mulss %xmm4, %xmm3
				; CHECK-NEXT: movaps {{.*#+}} xmm1 = [NaN,NaN,NaN,NaN]
				; CHECK-NEXT: andps %xmm1, %xmm0
				; CHECK-NEXT: movss {{.*#+}} xmm4 = mem[0],zero,zero,zero
				; CHECK-NEXT: cmpltss %xmm4, %xmm0
				; CHECK-NEXT: andnps %xmm3, %xmm0
				; CHECK-NEXT: xorps %xmm3, %xmm3
				; CHECK-NEXT: rsqrtss %xmm0, %xmm3
				; CHECK-NEXT: andps %xmm0, %xmm1
				; CHECK-NEXT: mulss %xmm3, %xmm0
				; CHECK-NEXT: mulss %xmm0, %xmm2
				; CHECK-NEXT: mulss %xmm3, %xmm0
				; CHECK-NEXT: addss %xmm5, %xmm0
				; CHECK-NEXT: mulss %xmm2, %xmm0
				; CHECK-NEXT: cmpltss %xmm4, %xmm1
				; CHECK-NEXT: andnps %xmm0, %xmm1
				; CHECK-NEXT: movaps %xmm1, %xmm0
				; CHECK-NEXT: retq
				%r = call nsz ninf afn float @llvm.pow.f32(float %x, float 2.5e-01)
				ret float %r
				}

				define float @pow_f32_one_fourth_fmf_daz(float %x) #0 {
				; CHECK-LABEL: pow_f32_one_fourth_fmf_daz:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: rsqrtss %xmm0, %xmm1			; CHECK-NEXT: rsqrtss %xmm0, %xmm1
	; CHECK-NEXT: movaps %xmm0, %xmm2			; CHECK-NEXT: movaps %xmm0, %xmm2
	; CHECK-NEXT: mulss %xmm1, %xmm2			; CHECK-NEXT: mulss %xmm1, %xmm2
	; CHECK-NEXT: movss {{.*#+}} xmm3 = mem[0],zero,zero,zero			; CHECK-NEXT: movss {{.*#+}} xmm3 = mem[0],zero,zero,zero
	; CHECK-NEXT: movaps %xmm2, %xmm4			; CHECK-NEXT: movaps %xmm2, %xmm4
	; CHECK-NEXT: mulss %xmm3, %xmm4			; CHECK-NEXT: mulss %xmm3, %xmm4
	; CHECK-NEXT: mulss %xmm1, %xmm2			; CHECK-NEXT: mulss %xmm1, %xmm2
	Show All 33 Lines
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: rsqrtps %xmm0, %xmm1			; CHECK-NEXT: rsqrtps %xmm0, %xmm1
	; CHECK-NEXT: movaps %xmm0, %xmm2			; CHECK-NEXT: movaps %xmm0, %xmm2
	; CHECK-NEXT: mulps %xmm1, %xmm2			; CHECK-NEXT: mulps %xmm1, %xmm2
	; CHECK-NEXT: movaps {{.*#+}} xmm3 = [-5.0E-1,-5.0E-1,-5.0E-1,-5.0E-1]			; CHECK-NEXT: movaps {{.*#+}} xmm3 = [-5.0E-1,-5.0E-1,-5.0E-1,-5.0E-1]
	; CHECK-NEXT: movaps %xmm2, %xmm4			; CHECK-NEXT: movaps %xmm2, %xmm4
	; CHECK-NEXT: mulps %xmm3, %xmm4			; CHECK-NEXT: mulps %xmm3, %xmm4
	; CHECK-NEXT: mulps %xmm1, %xmm2			; CHECK-NEXT: mulps %xmm1, %xmm2
	; CHECK-NEXT: movaps {{.*#+}} xmm1 = [-3.0E+0,-3.0E+0,-3.0E+0,-3.0E+0]			; CHECK-NEXT: movaps {{.*#+}} xmm5 = [-3.0E+0,-3.0E+0,-3.0E+0,-3.0E+0]
	; CHECK-NEXT: addps %xmm1, %xmm2			; CHECK-NEXT: addps %xmm5, %xmm2
	; CHECK-NEXT: mulps %xmm4, %xmm2			; CHECK-NEXT: mulps %xmm4, %xmm2
	; CHECK-NEXT: xorps %xmm4, %xmm4			; CHECK-NEXT: movaps {{.*#+}} xmm4 = [NaN,NaN,NaN,NaN]
	; CHECK-NEXT: cmpneqps %xmm4, %xmm0			; CHECK-NEXT: andps %xmm4, %xmm0
	; CHECK-NEXT: andps %xmm2, %xmm0			; CHECK-NEXT: movaps {{.*#+}} xmm1 = [1.17549435E-38,1.17549435E-38,1.17549435E-38,1.17549435E-38]
	; CHECK-NEXT: rsqrtps %xmm0, %xmm2			; CHECK-NEXT: movaps %xmm1, %xmm6
	; CHECK-NEXT: movaps %xmm0, %xmm5			; CHECK-NEXT: cmpleps %xmm0, %xmm6
	; CHECK-NEXT: mulps %xmm2, %xmm5			; CHECK-NEXT: andps %xmm2, %xmm6
	; CHECK-NEXT: mulps %xmm5, %xmm3			; CHECK-NEXT: rsqrtps %xmm6, %xmm0
	; CHECK-NEXT: mulps %xmm2, %xmm5			; CHECK-NEXT: movaps %xmm6, %xmm2
	; CHECK-NEXT: addps %xmm1, %xmm5			; CHECK-NEXT: mulps %xmm0, %xmm2
	; CHECK-NEXT: mulps %xmm3, %xmm5			; CHECK-NEXT: mulps %xmm2, %xmm3
	; CHECK-NEXT: cmpneqps %xmm4, %xmm0			; CHECK-NEXT: mulps %xmm0, %xmm2
	; CHECK-NEXT: andps %xmm5, %xmm0			; CHECK-NEXT: addps %xmm5, %xmm2
				; CHECK-NEXT: mulps %xmm3, %xmm2
				; CHECK-NEXT: andps %xmm4, %xmm6
				; CHECK-NEXT: cmpleps %xmm6, %xmm1
				; CHECK-NEXT: andps %xmm2, %xmm1
				; CHECK-NEXT: movaps %xmm1, %xmm0
	; CHECK-NEXT: retq			; CHECK-NEXT: retq
	%r = call fast <4 x float> @llvm.pow.v4f32(<4 x float> %x, <4 x float> <float 2.5e-1, float 2.5e-1, float 2.5e-01, float 2.5e-01>)			%r = call fast <4 x float> @llvm.pow.v4f32(<4 x float> %x, <4 x float> <float 2.5e-1, float 2.5e-1, float 2.5e-01, float 2.5e-01>)
	ret <4 x float> %r			ret <4 x float> %r
	}			}

	define <2 x double> @pow_v2f64_one_fourth_fmf(<2 x double> %x) nounwind {			define <2 x double> @pow_v2f64_one_fourth_fmf(<2 x double> %x) nounwind {
	; CHECK-LABEL: pow_v2f64_one_fourth_fmf:			; CHECK-LABEL: pow_v2f64_one_fourth_fmf:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	▲ Show 20 Lines • Show All 137 Lines • ▼ Show 20 Lines
	; CHECK-LABEL: pow_f64_not_enough_fmf:			; CHECK-LABEL: pow_f64_not_enough_fmf:
	; CHECK: # %bb.0:			; CHECK: # %bb.0:
	; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero			; CHECK-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
	; CHECK-NEXT: jmp pow # TAILCALL			; CHECK-NEXT: jmp pow # TAILCALL
	%r = call nsz ninf afn double @llvm.pow.f64(double %x, double 0x3fd5555555555555)			%r = call nsz ninf afn double @llvm.pow.f64(double %x, double 0x3fd5555555555555)
	ret double %r			ret double %r
	}			}

				attributes #0 = { nounwind "denormal-fp-math"="ieee,preserve-sign" }

llvm/test/CodeGen/X86/sqrt-fastmath-mir.ll

				; NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=avx2,fma -stop-after=finalize-isel 2>&1 \| FileCheck %s			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=avx2,fma -stop-after=finalize-isel 2>&1 \| FileCheck %s

	declare float @llvm.sqrt.f32(float) #0			declare float @llvm.sqrt.f32(float) #2

	define float @foo(float %f) #0 {			define float @sqrt_ieee(float %f) #0 {
	; CHECK: {{name: *foo}}			; CHECK-LABEL: name: sqrt_ieee
	; CHECK: body:			; CHECK: bb.0 (%ir-block.0):
	; CHECK: %0:fr32 = COPY $xmm0			; CHECK: liveins: $xmm0
	; CHECK: %1:fr32 = VRSQRTSSr killed %2, %0			; CHECK: [[COPY:%[0-9]+]]:fr32 = COPY $xmm0
	; CHECK: %3:fr32 = VMULSSrr %0, %1			; CHECK: [[DEF:%[0-9]+]]:fr32 = IMPLICIT_DEF
	; CHECK: %4:fr32 = VMOVSSrm			; CHECK: [[VRSQRTSSr:%[0-9]+]]:fr32 = VRSQRTSSr killed [[DEF]], [[COPY]]
	; CHECK: %5:fr32 = VFMADD213SSr %1, killed %3, %4			; CHECK: [[VMULSSrr:%[0-9]+]]:fr32 = VMULSSrr [[COPY]], [[VRSQRTSSr]], implicit $mxcsr
	; CHECK: %6:fr32 = VMOVSSrm			; CHECK: [[VMOVSSrm_alt:%[0-9]+]]:fr32 = VMOVSSrm_alt $rip, 1, $noreg, %const.0, $noreg :: (load 4 from constant-pool)
	; CHECK: %7:fr32 = VMULSSrr %1, %6			; CHECK: [[VFMADD213SSr:%[0-9]+]]:fr32 = VFMADD213SSr [[VRSQRTSSr]], killed [[VMULSSrr]], [[VMOVSSrm_alt]]
	; CHECK: %8:fr32 = VMULSSrr killed %7, killed %5			; CHECK: [[VMOVSSrm_alt1:%[0-9]+]]:fr32 = VMOVSSrm_alt $rip, 1, $noreg, %const.1, $noreg :: (load 4 from constant-pool)
	; CHECK: %9:fr32 = VMULSSrr %0, %8			; CHECK: [[VMULSSrr1:%[0-9]+]]:fr32 = VMULSSrr [[VRSQRTSSr]], [[VMOVSSrm_alt1]], implicit $mxcsr
	; CHECK: %10:fr32 = VFMADD213SSr %8, %9, %4			; CHECK: [[VMULSSrr2:%[0-9]+]]:fr32 = VMULSSrr killed [[VMULSSrr1]], killed [[VFMADD213SSr]], implicit $mxcsr
	; CHECK: %11:fr32 = VMULSSrr %9, %6			; CHECK: [[VMULSSrr3:%[0-9]+]]:fr32 = VMULSSrr [[COPY]], [[VMULSSrr2]], implicit $mxcsr
	; CHECK: %12:fr32 = VMULSSrr killed %11, killed %10			; CHECK: [[VFMADD213SSr1:%[0-9]+]]:fr32 = VFMADD213SSr [[VMULSSrr2]], [[VMULSSrr3]], [[VMOVSSrm_alt]]
	; CHECK: %14:fr32 = FsFLD0SS			; CHECK: [[VMULSSrr4:%[0-9]+]]:fr32 = VMULSSrr [[VMULSSrr3]], [[VMOVSSrm_alt1]], implicit $mxcsr
	; CHECK: %15:fr32 = VCMPSSrr %0, killed %14, 0			; CHECK: [[VMULSSrr5:%[0-9]+]]:fr32 = VMULSSrr killed [[VMULSSrr4]], killed [[VFMADD213SSr1]], implicit $mxcsr
	; CHECK: %17:vr128 = VPANDNrr killed %16, killed %13			; CHECK: [[COPY1:%[0-9]+]]:vr128 = COPY [[VMULSSrr5]]
	; CHECK: $xmm0 = COPY %18			; CHECK: [[COPY2:%[0-9]+]]:vr128 = COPY [[COPY]]
				; CHECK: [[VPBROADCASTDrm:%[0-9]+]]:vr128 = VPBROADCASTDrm $rip, 1, $noreg, %const.2, $noreg :: (load 4 from constant-pool)
				; CHECK: [[VPANDrr:%[0-9]+]]:vr128 = VPANDrr killed [[COPY2]], killed [[VPBROADCASTDrm]]
				; CHECK: [[COPY3:%[0-9]+]]:fr32 = COPY [[VPANDrr]]
				; CHECK: [[VCMPSSrm:%[0-9]+]]:fr32 = VCMPSSrm killed [[COPY3]], $rip, 1, $noreg, %const.3, $noreg, 1, implicit $mxcsr :: (load 4 from constant-pool)
				; CHECK: [[COPY4:%[0-9]+]]:vr128 = COPY [[VCMPSSrm]]
				; CHECK: [[VPANDNrr:%[0-9]+]]:vr128 = VPANDNrr killed [[COPY4]], killed [[COPY1]]
				; CHECK: [[COPY5:%[0-9]+]]:fr32 = COPY [[VPANDNrr]]
				; CHECK: $xmm0 = COPY [[COPY5]]
	; CHECK: RET 0, $xmm0			; CHECK: RET 0, $xmm0
	%call = tail call float @llvm.sqrt.f32(float %f) #1			%call = tail call float @llvm.sqrt.f32(float %f)
	ret float %call			ret float %call
	}			}

	define float @rfoo(float %f) #0 {			define float @sqrt_daz(float %f) #2 {
	; CHECK: {{name: *rfoo}}			; CHECK-LABEL: name: sqrt_daz
	; CHECK: body: \|			; CHECK: bb.0 (%ir-block.0):
	; CHECK: %0:fr32 = COPY $xmm0			; CHECK: liveins: $xmm0
	; CHECK: %1:fr32 = VRSQRTSSr killed %2, %0			; CHECK: [[COPY:%[0-9]+]]:fr32 = COPY $xmm0
	; CHECK: %3:fr32 = nnan ninf nsz arcp contract afn reassoc VMULSSrr %0, %1			; CHECK: [[DEF:%[0-9]+]]:fr32 = IMPLICIT_DEF
	; CHECK: %4:fr32 = VMOVSSrm			; CHECK: [[VSQRTSSr:%[0-9]+]]:fr32 = VSQRTSSr killed [[DEF]], [[COPY]], implicit $mxcsr
	; CHECK: %5:fr32 = nnan ninf nsz arcp contract afn reassoc VFMADD213SSr %1, killed %3, %4			; CHECK: $xmm0 = COPY [[VSQRTSSr]]
	; CHECK: %6:fr32 = VMOVSSrm			; CHECK: RET 0, $xmm0
	; CHECK: %7:fr32 = nnan ninf nsz arcp contract afn reassoc VMULSSrr %1, %6			%call = tail call float @llvm.sqrt.f32(float %f)
	; CHECK: %8:fr32 = nnan ninf nsz arcp contract afn reassoc VMULSSrr killed %7, killed %5			ret float %call
	; CHECK: %9:fr32 = nnan ninf nsz arcp contract afn reassoc VMULSSrr %0, %8			}
	; CHECK: %10:fr32 = nnan ninf nsz arcp contract afn reassoc VFMADD213SSr %8, killed %9, %4
	; CHECK: %11:fr32 = nnan ninf nsz arcp contract afn reassoc VMULSSrr %8, %6			define float @rsqrt_ieee(float %f) #0 {
	; CHECK: %12:fr32 = nnan ninf nsz arcp contract afn reassoc VMULSSrr killed %11, killed %10			; CHECK-LABEL: name: rsqrt_ieee
	; CHECK: $xmm0 = COPY %12			; CHECK: bb.0 (%ir-block.0):
				; CHECK: liveins: $xmm0
				; CHECK: [[COPY:%[0-9]+]]:fr32 = COPY $xmm0
				; CHECK: [[DEF:%[0-9]+]]:fr32 = IMPLICIT_DEF
				; CHECK: [[VRSQRTSSr:%[0-9]+]]:fr32 = VRSQRTSSr killed [[DEF]], [[COPY]]
				; CHECK: [[VMULSSrr:%[0-9]+]]:fr32 = nnan ninf nsz arcp contract afn reassoc VMULSSrr [[COPY]], [[VRSQRTSSr]], implicit $mxcsr
				; CHECK: [[VMOVSSrm_alt:%[0-9]+]]:fr32 = VMOVSSrm_alt $rip, 1, $noreg, %const.0, $noreg :: (load 4 from constant-pool)
				; CHECK: [[VFMADD213SSr:%[0-9]+]]:fr32 = nnan ninf nsz arcp contract afn reassoc VFMADD213SSr [[VRSQRTSSr]], killed [[VMULSSrr]], [[VMOVSSrm_alt]]
				; CHECK: [[VMOVSSrm_alt1:%[0-9]+]]:fr32 = VMOVSSrm_alt $rip, 1, $noreg, %const.1, $noreg :: (load 4 from constant-pool)
				; CHECK: [[VMULSSrr1:%[0-9]+]]:fr32 = nnan ninf nsz arcp contract afn reassoc VMULSSrr [[VRSQRTSSr]], [[VMOVSSrm_alt1]], implicit $mxcsr
				; CHECK: [[VMULSSrr2:%[0-9]+]]:fr32 = nnan ninf nsz arcp contract afn reassoc VMULSSrr killed [[VMULSSrr1]], killed [[VFMADD213SSr]], implicit $mxcsr
				; CHECK: [[VMULSSrr3:%[0-9]+]]:fr32 = nnan ninf nsz arcp contract afn reassoc VMULSSrr [[COPY]], [[VMULSSrr2]], implicit $mxcsr
				; CHECK: [[VFMADD213SSr1:%[0-9]+]]:fr32 = nnan ninf nsz arcp contract afn reassoc VFMADD213SSr [[VMULSSrr2]], killed [[VMULSSrr3]], [[VMOVSSrm_alt]]
				; CHECK: [[VMULSSrr4:%[0-9]+]]:fr32 = nnan ninf nsz arcp contract afn reassoc VMULSSrr [[VMULSSrr2]], [[VMOVSSrm_alt1]], implicit $mxcsr
				; CHECK: [[VMULSSrr5:%[0-9]+]]:fr32 = nnan ninf nsz arcp contract afn reassoc VMULSSrr killed [[VMULSSrr4]], killed [[VFMADD213SSr1]], implicit $mxcsr
				; CHECK: $xmm0 = COPY [[VMULSSrr5]]
				; CHECK: RET 0, $xmm0
				%sqrt = tail call float @llvm.sqrt.f32(float %f)
				%div = fdiv fast float 1.0, %sqrt
				ret float %div
				}

				define float @rsqrt_daz(float %f) #1 {
				; CHECK-LABEL: name: rsqrt_daz
				; CHECK: bb.0 (%ir-block.0):
				; CHECK: liveins: $xmm0
				; CHECK: [[COPY:%[0-9]+]]:fr32 = COPY $xmm0
				; CHECK: [[DEF:%[0-9]+]]:fr32 = IMPLICIT_DEF
				; CHECK: [[VRSQRTSSr:%[0-9]+]]:fr32 = VRSQRTSSr killed [[DEF]], [[COPY]]
				; CHECK: [[VMULSSrr:%[0-9]+]]:fr32 = nnan ninf nsz arcp contract afn reassoc VMULSSrr [[COPY]], [[VRSQRTSSr]], implicit $mxcsr
				; CHECK: [[VMOVSSrm_alt:%[0-9]+]]:fr32 = VMOVSSrm_alt $rip, 1, $noreg, %const.0, $noreg :: (load 4 from constant-pool)
				; CHECK: [[VFMADD213SSr:%[0-9]+]]:fr32 = nnan ninf nsz arcp contract afn reassoc VFMADD213SSr [[VRSQRTSSr]], killed [[VMULSSrr]], [[VMOVSSrm_alt]]
				; CHECK: [[VMOVSSrm_alt1:%[0-9]+]]:fr32 = VMOVSSrm_alt $rip, 1, $noreg, %const.1, $noreg :: (load 4 from constant-pool)
				; CHECK: [[VMULSSrr1:%[0-9]+]]:fr32 = nnan ninf nsz arcp contract afn reassoc VMULSSrr [[VRSQRTSSr]], [[VMOVSSrm_alt1]], implicit $mxcsr
				; CHECK: [[VMULSSrr2:%[0-9]+]]:fr32 = nnan ninf nsz arcp contract afn reassoc VMULSSrr killed [[VMULSSrr1]], killed [[VFMADD213SSr]], implicit $mxcsr
				; CHECK: [[VMULSSrr3:%[0-9]+]]:fr32 = nnan ninf nsz arcp contract afn reassoc VMULSSrr [[COPY]], [[VMULSSrr2]], implicit $mxcsr
				; CHECK: [[VFMADD213SSr1:%[0-9]+]]:fr32 = nnan ninf nsz arcp contract afn reassoc VFMADD213SSr [[VMULSSrr2]], killed [[VMULSSrr3]], [[VMOVSSrm_alt]]
				; CHECK: [[VMULSSrr4:%[0-9]+]]:fr32 = nnan ninf nsz arcp contract afn reassoc VMULSSrr [[VMULSSrr2]], [[VMOVSSrm_alt1]], implicit $mxcsr
				; CHECK: [[VMULSSrr5:%[0-9]+]]:fr32 = nnan ninf nsz arcp contract afn reassoc VMULSSrr killed [[VMULSSrr4]], killed [[VFMADD213SSr1]], implicit $mxcsr
				; CHECK: $xmm0 = COPY [[VMULSSrr5]]
	; CHECK: RET 0, $xmm0			; CHECK: RET 0, $xmm0
	%sqrt = tail call float @llvm.sqrt.f32(float %f)			%sqrt = tail call float @llvm.sqrt.f32(float %f)
	%div = fdiv fast float 1.0, %sqrt			%div = fdiv fast float 1.0, %sqrt
	ret float %div			ret float %div
	}			}

	attributes #0 = { "unsafe-fp-math"="true" "reciprocal-estimates"="sqrt:2" }			attributes #0 = { "unsafe-fp-math"="true" "reciprocal-estimates"="sqrt:2" "denormal-fp-math"="ieee,ieee" }
	attributes #1 = { nounwind readnone }			attributes #1 = { "unsafe-fp-math"="true" "reciprocal-estimates"="sqrt:2" "denormal-fp-math"="ieee,preserve-sign" }
				attributes #2 = { nounwind readnone }
				spatelUnsubmitted Not Done Reply Inline Actions Double-check my understanding: we have the "ieee,ieee" attribute here, but we would never expect to see that in practice? spatel: Double-check my understanding: we have the "ieee,ieee" attribute here, but we would never…
				arsenmAuthorUnsubmitted Done Reply Inline Actions Yes, ieee,ieee is the default, but explicitly setting it is also valid. In the AMDGPU specific patches, I switched the default based on calling convention for graphics shaders (but I like this less over time, and may remove this detail) arsenm: Yes, ieee,ieee is the default, but explicitly setting it is also valid. In the AMDGPU specific…

llvm/test/CodeGen/X86/sqrt-fastmath-tune.ll

	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -O2 -mcpu=nehalem \| FileCheck %s --check-prefix=SCALAR-EST --check-prefix=VECTOR-EST			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -O2 -mcpu=nehalem \| FileCheck %s --check-prefix=SCALAR-EST --check-prefix=VECTOR-EST
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -O2 -mcpu=sandybridge \| FileCheck %s --check-prefix=SCALAR-ACC --check-prefix=VECTOR-EST			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -O2 -mcpu=sandybridge \| FileCheck %s --check-prefix=SCALAR-ACC --check-prefix=VECTOR-EST
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -O2 -mcpu=broadwell \| FileCheck %s --check-prefix=SCALAR-ACC --check-prefix=VECTOR-EST			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -O2 -mcpu=broadwell \| FileCheck %s --check-prefix=SCALAR-ACC --check-prefix=VECTOR-EST
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -O2 -mcpu=skylake \| FileCheck %s --check-prefix=SCALAR-ACC --check-prefix=VECTOR-ACC			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -O2 -mcpu=skylake \| FileCheck %s --check-prefix=SCALAR-ACC --check-prefix=VECTOR-ACC

	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -O2 -mattr=+fast-scalar-fsqrt,-fast-vector-fsqrt \| FileCheck %s --check-prefix=SCALAR-ACC --check-prefix=VECTOR-EST			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -O2 -mattr=+fast-scalar-fsqrt,-fast-vector-fsqrt \| FileCheck %s --check-prefix=SCALAR-ACC --check-prefix=VECTOR-EST
	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -O2 -mattr=-fast-scalar-fsqrt,+fast-vector-fsqrt \| FileCheck %s --check-prefix=SCALAR-EST --check-prefix=VECTOR-ACC			; RUN: llc < %s -mtriple=x86_64-unknown-unknown -O2 -mattr=-fast-scalar-fsqrt,+fast-vector-fsqrt \| FileCheck %s --check-prefix=SCALAR-EST --check-prefix=VECTOR-ACC

	declare float @llvm.sqrt.f32(float) #0			declare float @llvm.sqrt.f32(float) #0
	declare <4 x float> @llvm.sqrt.v4f32(<4 x float>) #0			declare <4 x float> @llvm.sqrt.v4f32(<4 x float>) #0
	declare <8 x float> @llvm.sqrt.v8f32(<8 x float>) #0			declare <8 x float> @llvm.sqrt.v8f32(<8 x float>) #0

	define float @foo_x1(float %f) #0 {			define float @foo_x1_ieee(float %f) #0 {
	; SCALAR-EST-LABEL: foo_x1:			; SCALAR-EST-LABEL: foo_x1_ieee:
	; SCALAR-EST: # %bb.0:			; SCALAR-EST: # %bb.0:
	; SCALAR-EST-NEXT: rsqrtss %xmm0			; SCALAR-EST-NEXT: rsqrtss %xmm0
	; SCALAR-EST: retq			; SCALAR-EST: retq
	;			;
	; SCALAR-ACC-LABEL: foo_x1:			; SCALAR-ACC-LABEL: foo_x1_ieee:
	; SCALAR-ACC: # %bb.0:			; SCALAR-ACC: # %bb.0:
	; SCALAR-ACC-NEXT: {{^ *v?sqrtss %xmm0}}			; SCALAR-ACC-NEXT: {{^ *v?sqrtss %xmm0}}
	; SCALAR-ACC-NEXT: retq			; SCALAR-ACC-NEXT: retq
	%call = tail call float @llvm.sqrt.f32(float %f) #1			%call = tail call float @llvm.sqrt.f32(float %f) #1
	ret float %call			ret float %call
	}			}

	define <4 x float> @foo_x4(<4 x float> %f) #0 {			define float @foo_x1_daz(float %f) #2 {
	; VECTOR-EST-LABEL: foo_x4:			; SCALAR-EST-LABEL: foo_x1_daz:
				; SCALAR-EST: # %bb.0:
				; SCALAR-EST-NEXT: rsqrtss %xmm0
				; SCALAR-EST: retq
				;
				; SCALAR-ACC-LABEL: foo_x1_daz:
				; SCALAR-ACC: # %bb.0:
				; SCALAR-ACC-NEXT: {{^ *v?sqrtss %xmm0}}
				; SCALAR-ACC-NEXT: retq
				%call = tail call float @llvm.sqrt.f32(float %f) #1
				ret float %call
				}

				define <4 x float> @foo_x4_ieee(<4 x float> %f) #0 {
				; VECTOR-EST-LABEL: foo_x4_ieee:
				; VECTOR-EST: # %bb.0:
				; VECTOR-EST-NEXT: rsqrtps %xmm0
				; VECTOR-EST: retq
				;
				; VECTOR-ACC-LABEL: foo_x4_ieee:
				; VECTOR-ACC: # %bb.0:
				; VECTOR-ACC-NEXT: {{^ *v?sqrtps %xmm0}}
				; VECTOR-ACC-NEXT: retq
				%call = tail call <4 x float> @llvm.sqrt.v4f32(<4 x float> %f) #1
				ret <4 x float> %call
				}

				define <4 x float> @foo_x4_daz(<4 x float> %f) #2 {
				; VECTOR-EST-LABEL: foo_x4_daz:
	; VECTOR-EST: # %bb.0:			; VECTOR-EST: # %bb.0:
	; VECTOR-EST-NEXT: rsqrtps %xmm0			; VECTOR-EST-NEXT: rsqrtps %xmm0
	; VECTOR-EST: retq			; VECTOR-EST: retq
	;			;
	; VECTOR-ACC-LABEL: foo_x4:			; VECTOR-ACC-LABEL: foo_x4_daz:
	; VECTOR-ACC: # %bb.0:			; VECTOR-ACC: # %bb.0:
	; VECTOR-ACC-NEXT: {{^ *v?sqrtps %xmm0}}			; VECTOR-ACC-NEXT: {{^ *v?sqrtps %xmm0}}
	; VECTOR-ACC-NEXT: retq			; VECTOR-ACC-NEXT: retq
	%call = tail call <4 x float> @llvm.sqrt.v4f32(<4 x float> %f) #1			%call = tail call <4 x float> @llvm.sqrt.v4f32(<4 x float> %f) #1
	ret <4 x float> %call			ret <4 x float> %call
	}			}

	define <8 x float> @foo_x8(<8 x float> %f) #0 {			define <8 x float> @foo_x8_ieee(<8 x float> %f) #0 {
	; VECTOR-EST-LABEL: foo_x8:			; VECTOR-EST-LABEL: foo_x8_ieee:
				; VECTOR-EST: # %bb.0:
				; VECTOR-EST: rsqrtps
				; VECTOR-EST: retq
				;
				; VECTOR-ACC-LABEL: foo_x8_ieee:
				; VECTOR-ACC: # %bb.0:
				; VECTOR-ACC: {{^ *v?sqrtps %[xy]mm0}}
				; VECTOR-ACC-NOT: rsqrt
				; VECTOR-ACC: retq
				%call = tail call <8 x float> @llvm.sqrt.v8f32(<8 x float> %f) #1
				ret <8 x float> %call
				}

				define <8 x float> @foo_x8_daz(<8 x float> %f) #2 {
				; VECTOR-EST-LABEL: foo_x8_daz:
	; VECTOR-EST: # %bb.0:			; VECTOR-EST: # %bb.0:
	; VECTOR-EST-NEXT: rsqrtps			; VECTOR-EST-NEXT: rsqrtps
	; VECTOR-EST: retq			; VECTOR-EST: retq
	;			;
	; VECTOR-ACC-LABEL: foo_x8:			; VECTOR-ACC-LABEL: foo_x8_daz:
	; VECTOR-ACC: # %bb.0:			; VECTOR-ACC: # %bb.0:
	; VECTOR-ACC-NEXT: {{^ *v?sqrtps %[xy]mm0}}			; VECTOR-ACC-NEXT: {{^ *v?sqrtps %[xy]mm0}}
	; VECTOR-ACC-NOT: rsqrt			; VECTOR-ACC-NOT: rsqrt
	; VECTOR-ACC: retq			; VECTOR-ACC: retq
	%call = tail call <8 x float> @llvm.sqrt.v8f32(<8 x float> %f) #1			%call = tail call <8 x float> @llvm.sqrt.v8f32(<8 x float> %f) #1
	ret <8 x float> %call			ret <8 x float> %call
	}			}

	attributes #0 = { "unsafe-fp-math"="true" }			attributes #0 = { "denormal-fp-math"="ieee,ieee" "unsafe-fp-math"="true" }
	attributes #1 = { nounwind readnone }			attributes #1 = { nounwind readnone }
				attributes #2 = { "denormal-fp-math"="ieee,preseve-sign" "unsafe-fp-math"="true" }
				spatelUnsubmitted Not Done Reply Inline Actions Does the "preseve" typo affect anything? spatel: Does the "preseve" typo affect anything?
				arsenmAuthorUnsubmitted Done Reply Inline Actions These aren't hitting the expansion, so I guess it doesn't. I assume this has something to do with not using reciprocal-estimates? arsenm: These aren't hitting the expansion, so I guess it doesn't. I assume this has something to do…
				spatelUnsubmitted Not Done Reply Inline Actions Yes, this file isn't well-specified about what it's trying to test for. I updated it here: rG6071fc57a45f That should remove it from this patch? Independent of that - should we have an assert or warning that would catch typos in the attribute string? spatel: Yes, this file isn't well-specified about what it's trying to test for. I updated it here…
				arsenmAuthorUnsubmitted Done Reply Inline Actions I remember implementing a verifier check for this before ,but I can't seem to find the patch arsenm: I remember implementing a verifier check for this before ,but I can't seem to find the patch
				spatelUnsubmitted Not Done Reply Inline Actions It would be good to revive that patch for safety. But this patch doesn't need to be gated by that improvement (IIUC, these diffs disappear if you rebase?). spatel: It would be good to revive that patch for safety. But this patch doesn't need to be gated by…

llvm/test/CodeGen/X86/sqrt-fastmath.ll

Show First 20 Lines • Show All 50 Lines • ▼ Show 20 Lines
; AVX-LABEL: finite_f32_no_estimate:		; AVX-LABEL: finite_f32_no_estimate:
; AVX: # %bb.0:		; AVX: # %bb.0:
; AVX-NEXT: vsqrtss %xmm0, %xmm0, %xmm0		; AVX-NEXT: vsqrtss %xmm0, %xmm0, %xmm0
; AVX-NEXT: retq		; AVX-NEXT: retq
%call = tail call float @__sqrtf_finite(float %f) #2		%call = tail call float @__sqrtf_finite(float %f) #2
ret float %call		ret float %call
}		}

define float @finite_f32_estimate(float %f) #1 {		define float @finite_f32_estimate_ieee(float %f) #1 {
; SSE-LABEL: finite_f32_estimate:		; SSE-LABEL: finite_f32_estimate_ieee:
		; SSE: # %bb.0:
		; SSE-NEXT: rsqrtss %xmm0, %xmm1
		; SSE-NEXT: movaps %xmm0, %xmm2
		; SSE-NEXT: mulss %xmm1, %xmm2
		; SSE-NEXT: movss {{.*#+}} xmm3 = mem[0],zero,zero,zero
		; SSE-NEXT: mulss %xmm2, %xmm3
		; SSE-NEXT: mulss %xmm1, %xmm2
		; SSE-NEXT: addss {{.*}}(%rip), %xmm2
		; SSE-NEXT: mulss %xmm3, %xmm2
		; SSE-NEXT: andps {{.*}}(%rip), %xmm0
		; SSE-NEXT: cmpltss {{.*}}(%rip), %xmm0
		; SSE-NEXT: andnps %xmm2, %xmm0
		; SSE-NEXT: retq
		;
		; AVX1-LABEL: finite_f32_estimate_ieee:
		; AVX1: # %bb.0:
		; AVX1-NEXT: vrsqrtss %xmm0, %xmm0, %xmm1
		; AVX1-NEXT: vmulss %xmm1, %xmm0, %xmm2
		; AVX1-NEXT: vmulss %xmm1, %xmm2, %xmm1
		; AVX1-NEXT: vaddss {{.*}}(%rip), %xmm1, %xmm1
		; AVX1-NEXT: vmulss {{.*}}(%rip), %xmm2, %xmm2
		; AVX1-NEXT: vmulss %xmm1, %xmm2, %xmm1
		; AVX1-NEXT: vandps {{.*}}(%rip), %xmm0, %xmm0
		; AVX1-NEXT: vcmpltss {{.*}}(%rip), %xmm0, %xmm0
		; AVX1-NEXT: vandnps %xmm1, %xmm0, %xmm0
		; AVX1-NEXT: retq
		;
		; AVX512-LABEL: finite_f32_estimate_ieee:
		; AVX512: # %bb.0:
		; AVX512-NEXT: vrsqrtss %xmm0, %xmm0, %xmm1
		; AVX512-NEXT: vmulss %xmm1, %xmm0, %xmm2
		; AVX512-NEXT: vfmadd213ss {{.#+}} xmm1 = (xmm2 xmm1) + mem
		; AVX512-NEXT: vmulss {{.*}}(%rip), %xmm2, %xmm2
		; AVX512-NEXT: vmulss %xmm1, %xmm2, %xmm1
		; AVX512-NEXT: vbroadcastss {{.*#+}} xmm2 = [NaN,NaN,NaN,NaN]
		; AVX512-NEXT: vandps %xmm2, %xmm0, %xmm0
		; AVX512-NEXT: vcmpltss {{.*}}(%rip), %xmm0, %k1
		; AVX512-NEXT: vxorps %xmm0, %xmm0, %xmm0
		; AVX512-NEXT: vmovss %xmm0, %xmm1, %xmm1 {%k1}
		; AVX512-NEXT: vmovaps %xmm1, %xmm0
		; AVX512-NEXT: retq
		%call = tail call float @__sqrtf_finite(float %f) #2
		ret float %call
		}

		define float @finite_f32_estimate_daz(float %f) #4 {
		; SSE-LABEL: finite_f32_estimate_daz:
; SSE: # %bb.0:		; SSE: # %bb.0:
; SSE-NEXT: rsqrtss %xmm0, %xmm1		; SSE-NEXT: rsqrtss %xmm0, %xmm1
; SSE-NEXT: movaps %xmm0, %xmm2		; SSE-NEXT: movaps %xmm0, %xmm2
; SSE-NEXT: mulss %xmm1, %xmm2		; SSE-NEXT: mulss %xmm1, %xmm2
; SSE-NEXT: movss {{.*#+}} xmm3 = mem[0],zero,zero,zero		; SSE-NEXT: movss {{.*#+}} xmm3 = mem[0],zero,zero,zero
; SSE-NEXT: mulss %xmm2, %xmm3		; SSE-NEXT: mulss %xmm2, %xmm3
; SSE-NEXT: mulss %xmm1, %xmm2		; SSE-NEXT: mulss %xmm1, %xmm2
; SSE-NEXT: addss {{.*}}(%rip), %xmm2		; SSE-NEXT: addss {{.*}}(%rip), %xmm2
; SSE-NEXT: mulss %xmm3, %xmm2		; SSE-NEXT: mulss %xmm3, %xmm2
; SSE-NEXT: xorps %xmm1, %xmm1		; SSE-NEXT: xorps %xmm1, %xmm1
; SSE-NEXT: cmpeqss %xmm1, %xmm0		; SSE-NEXT: cmpeqss %xmm1, %xmm0
; SSE-NEXT: andnps %xmm2, %xmm0		; SSE-NEXT: andnps %xmm2, %xmm0
; SSE-NEXT: retq		; SSE-NEXT: retq
;		;
; AVX1-LABEL: finite_f32_estimate:		; AVX1-LABEL: finite_f32_estimate_daz:
; AVX1: # %bb.0:		; AVX1: # %bb.0:
; AVX1-NEXT: vrsqrtss %xmm0, %xmm0, %xmm1		; AVX1-NEXT: vrsqrtss %xmm0, %xmm0, %xmm1
; AVX1-NEXT: vmulss %xmm1, %xmm0, %xmm2		; AVX1-NEXT: vmulss %xmm1, %xmm0, %xmm2
; AVX1-NEXT: vmulss %xmm1, %xmm2, %xmm1		; AVX1-NEXT: vmulss %xmm1, %xmm2, %xmm1
; AVX1-NEXT: vaddss {{.*}}(%rip), %xmm1, %xmm1		; AVX1-NEXT: vaddss {{.*}}(%rip), %xmm1, %xmm1
; AVX1-NEXT: vmulss {{.*}}(%rip), %xmm2, %xmm2		; AVX1-NEXT: vmulss {{.*}}(%rip), %xmm2, %xmm2
; AVX1-NEXT: vmulss %xmm1, %xmm2, %xmm1		; AVX1-NEXT: vmulss %xmm1, %xmm2, %xmm1
; AVX1-NEXT: vxorps %xmm2, %xmm2, %xmm2		; AVX1-NEXT: vxorps %xmm2, %xmm2, %xmm2
; AVX1-NEXT: vcmpeqss %xmm2, %xmm0, %xmm0		; AVX1-NEXT: vcmpeqss %xmm2, %xmm0, %xmm0
; AVX1-NEXT: vandnps %xmm1, %xmm0, %xmm0		; AVX1-NEXT: vandnps %xmm1, %xmm0, %xmm0
; AVX1-NEXT: retq		; AVX1-NEXT: retq
;		;
; AVX512-LABEL: finite_f32_estimate:		; AVX512-LABEL: finite_f32_estimate_daz:
; AVX512: # %bb.0:		; AVX512: # %bb.0:
; AVX512-NEXT: vrsqrtss %xmm0, %xmm0, %xmm1		; AVX512-NEXT: vrsqrtss %xmm0, %xmm0, %xmm1
; AVX512-NEXT: vmulss %xmm1, %xmm0, %xmm2		; AVX512-NEXT: vmulss %xmm1, %xmm0, %xmm2
; AVX512-NEXT: vfmadd213ss {{.#+}} xmm1 = (xmm2 xmm1) + mem		; AVX512-NEXT: vfmadd213ss {{.#+}} xmm1 = (xmm2 xmm1) + mem
; AVX512-NEXT: vmulss {{.*}}(%rip), %xmm2, %xmm2		; AVX512-NEXT: vmulss {{.*}}(%rip), %xmm2, %xmm2
; AVX512-NEXT: vmulss %xmm1, %xmm2, %xmm1		; AVX512-NEXT: vmulss %xmm1, %xmm2, %xmm1
; AVX512-NEXT: vxorps %xmm2, %xmm2, %xmm2		; AVX512-NEXT: vxorps %xmm2, %xmm2, %xmm2
; AVX512-NEXT: vcmpeqss %xmm2, %xmm0, %k1		; AVX512-NEXT: vcmpeqss %xmm2, %xmm0, %k1
▲ Show 20 Lines • Show All 429 Lines • ▼ Show 20 Lines	; AVX512-NEXT: retq
ret <16 x float> %div		ret <16 x float> %div
}		}


attributes #0 = { "unsafe-fp-math"="true" "reciprocal-estimates"="!sqrtf,!vec-sqrtf,!divf,!vec-divf" }		attributes #0 = { "unsafe-fp-math"="true" "reciprocal-estimates"="!sqrtf,!vec-sqrtf,!divf,!vec-divf" }
attributes #1 = { "unsafe-fp-math"="true" "reciprocal-estimates"="sqrt,vec-sqrt" }		attributes #1 = { "unsafe-fp-math"="true" "reciprocal-estimates"="sqrt,vec-sqrt" }
attributes #2 = { nounwind readnone }		attributes #2 = { nounwind readnone }
attributes #3 = { "unsafe-fp-math"="true" "reciprocal-estimates"="sqrt,vec-sqrt" "denormal-fp-math"="ieee" }		attributes #3 = { "unsafe-fp-math"="true" "reciprocal-estimates"="sqrt,vec-sqrt" "denormal-fp-math"="ieee" }
		attributes #4 = { "unsafe-fp-math"="true" "reciprocal-estimates"="sqrt,vec-sqrt" "denormal-fp-math"="ieee,preserve-sign" }

This is an archive of the discontinued LLVM Phabricator instance.

Assume ieee behavior without denormal-fp-math attribute
ClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 230255

llvm/lib/CodeGen/MachineFunction.cpp

llvm/test/CodeGen/X86/pow.ll

llvm/test/CodeGen/X86/sqrt-fastmath-mir.ll

llvm/test/CodeGen/X86/sqrt-fastmath-tune.ll

llvm/test/CodeGen/X86/sqrt-fastmath.ll

This is an archive of the discontinued LLVM Phabricator instance.

Assume ieee behavior without denormal-fp-math attributeClosedPublic

Details

Diff Detail

Event Timeline

Revision Contents

Diff 230255

llvm/lib/CodeGen/MachineFunction.cpp

llvm/test/CodeGen/X86/pow.ll

llvm/test/CodeGen/X86/sqrt-fastmath-mir.ll

llvm/test/CodeGen/X86/sqrt-fastmath-tune.ll

llvm/test/CodeGen/X86/sqrt-fastmath.ll

Assume ieee behavior without denormal-fp-math attribute
ClosedPublic