This is an archive of the discontinued LLVM Phabricator instance.

AMDGPU: Overhaul and improve rcp and rsq f32 formation
ClosedPublic

Authored by arsenm on Jul 18 2023, 6:09 AM.

Download Raw Diff

Details

Reviewers

foad
b-sumner
rampitec
Pierre-vh
jhuber6
yaxunl
jdoerfert

Group Reviewers

Restricted Project

Summary

The highlight change is a new denormal safe 1ulp lowering which uses
rcp after using frexp to perform input scaling. This saves 2
instructions compared to other implementations which performed an
explicit denormal range change. This improves the OpenCL default, and
requires a flag for HIP. I don't believe there's any flag wired up for
OpenMP to emit the necessary fpmath metadata.

This provides several improvements and changes that were hard to
separate without regressing one case or another. Disturbingly the
OpenCL conformance test seems to have the reciprocal test commented
out. I locally hacked it back in to test this.

Starts introducing f32 rsq intrinsics in AMDGPUCodeGenPrepare. Like
the rcp case, we could do this in codegen if !fpmath were preserved
(although we would lose some computeKnownFPClass tricks). Start
requiring contract flags to form rsq. The rsq fusion actually improves
the result from ~2ulp to ~1ulp. We have some older fusion in codegen
which only keys off unsafe math which should be refined.

Expand rsq patterns by checking for denormal inputs and pre/post
multiplying like the current library code does. We also take advantage
of computeKnownFPClass to avoid the scaling when we can statically
prove the input cannot be a denormal. We could do the same for the rcp
case, but unlike rsq a large input can underflow to denormal. We need
additional upper bound exponent checks on the input in order to do the
same for rcp.

This rsq handling also now starts handling the negated case. We
introduce rsq with an fneg. In the case the fneg doesn't fold into its
user, it's a neutral change but provides improvement if it is foldable
as a source modifier.

Also starts respecting the arcp attribute properly, and more strictly
interprets afn. We were previously interpreting afn as implying you
could do the reciprocal expansion of an fdiv. The codegen handling of
these also needs to be revisited.

This also effectively introduces the optimization
combineRepeatedFPDivisors enables, just done in the IR instead (and
only for f32).

This is almost across the board better. The one minor regression is
for gfx6/buggy frexp case where for multiple reciprocals, we could
previously reuse rematerialized constants per instance (it's neutral
for a single rcp).

The fdiv.fast and sqrt handling need to be revisited next.

Diff Detail

Event Timeline

arsenm created this revision.Jul 18 2023, 6:09 AM

Herald added a project: Restricted Project. · View Herald TranscriptJul 18 2023, 6:09 AM

Herald added subscribers: StephenFan, kerbowa, hiraditya and 5 others. · View Herald Transcript

arsenm requested review of this revision.Jul 18 2023, 6:09 AM

Herald added a reviewer: jdoerfert. · View Herald TranscriptJul 18 2023, 6:09 AM

Herald added a project: Restricted Project. · View Herald Transcript

Herald added subscribers: wangpc, jplehr, sstefan1, wdng. · View Herald Transcript

Harbormaster completed remote builds in B246192: Diff 541491.Jul 18 2023, 6:10 AM

Fix some test rebase diff errors

Harbormaster completed remote builds in B246200: Diff 541500.Jul 18 2023, 6:27 AM

arsenm added inline comments.Jul 18 2023, 12:47 PM

llvm/lib/Target/AMDGPU/AMDGPUCodeGenPrepare.cpp
900	I'm not really sure how to interpret arcp and afn. The backend interpretation continues to be aggressive with afn, so I don't know which is correct.

Defer the afn/unsafe-fp-math case to codegen for now, although it's really aggressive

Harbormaster completed remote builds in B246532: Diff 541988.Jul 19 2023, 6:25 AM

arsenm added a child revision: D155741: AMDGPU: Implement new 2ulp fdiv lowering.Jul 19 2023, 12:34 PM

ping, I want to get this in before the branch

rampitec accepted this revision.Jul 20 2023, 3:10 PM

This revision is now accepted and ready to land.Jul 20 2023, 3:10 PM

8287f3af9dd9ec2e8e6265721b866bba2585c375

arsenm mentioned this in rG8287f3af9dd9: AMDGPU: Overhaul and improve rcp and rsq f32 formation.Jul 21 2023, 1:36 PM

chapuni added a subscriber: chapuni.Jul 21 2023, 3:43 PM

chapuni added inline comments.

llvm/lib/Target/AMDGPU/AMDGPUCodeGenPrepare.cpp
829	Used only in +Asserts

Revision Contents

Path

Size

llvm/

docs/

ReleaseNotes.rst

4 lines

lib/

Target/

AMDGPU/

AMDGPUCodeGenPrepare.cpp

292 lines

test/

CodeGen/

AMDGPU/

GlobalISel/

fdiv.f32.ll

465 lines

amdgpu-codegenprepare-fdiv.ll

2867 lines

fdiv.ll

183 lines

fdiv32-to-rcp-folding.ll

332 lines

fdiv_flags.f32.ll

50 lines

rcp-pattern.ll

231 lines

rsq.f32.ll

1238 lines

Diff 541988

llvm/docs/ReleaseNotes.rst

	Show First 20 Lines • Show All 157 Lines • ▼ Show 20 Lines

	* llvm.log2.f32, llvm.log10.f32, and llvm.log.f32 are now lowered			* llvm.log2.f32, llvm.log10.f32, and llvm.log.f32 are now lowered
	accurately. Use llvm.amdgcn.log.f32 to access the old behavior for			accurately. Use llvm.amdgcn.log.f32 to access the old behavior for
	llvm.log2.f32.			llvm.log2.f32.

	* llvm.exp2.f32 and llvm.exp.f32 are now lowered accurately. Use			* llvm.exp2.f32 and llvm.exp.f32 are now lowered accurately. Use
	llvm.amdgcn.exp2.f32 to access the old behavior for llvm.exp2.f32.			llvm.amdgcn.exp2.f32 to access the old behavior for llvm.exp2.f32.

				* Implemented new 1ulp IEEE lowering strategy for float reciprocal
				which saves 2 instructions. This is used by default for OpenCL on
				gfx9+. With ``contract`` flags, this will fold into a 1 ulp rsqrt.

	Changes to the ARM Backend			Changes to the ARM Backend
	--------------------------			--------------------------

	- The hard-float ABI is now available in Armv8.1-M configurations that			- The hard-float ABI is now available in Armv8.1-M configurations that
	have integer MVE instructions (and therefore have FP registers) but			have integer MVE instructions (and therefore have FP registers) but
	no scalar or vector floating point computation.			no scalar or vector floating point computation.

	- The ``.arm`` directive now aligns code to the next 4-byte boundary, and			- The ``.arm`` directive now aligns code to the next 4-byte boundary, and
	▲ Show 20 Lines • Show All 244 Lines • Show Last 20 Lines

llvm/lib/Target/AMDGPU/AMDGPUCodeGenPrepare.cpp

Show First 20 Lines • Show All 134 Lines • ▼ Show 20 Lines	public:

/// \returns True if type \p T needs to be promoted to 32 bit integer type,		/// \returns True if type \p T needs to be promoted to 32 bit integer type,
/// false otherwise.		/// false otherwise.
bool needsPromotionToI32(const Type *T) const;		bool needsPromotionToI32(const Type *T) const;

/// Return true if \p T is a legal scalar floating point type.		/// Return true if \p T is a legal scalar floating point type.
bool isLegalFloatingTy(const Type *T) const;		bool isLegalFloatingTy(const Type *T) const;

		/// Wrapper to pass all the arguments to computeKnownFPClass
		KnownFPClass computeKnownFPClass(const Value *V, FPClassTest Interested,
		const Instruction *CtxI) const {
		return llvm::computeKnownFPClass(V, *DL, Interested, 0, TLInfo, AC, CtxI,
		DT);
		}

/// Promotes uniform binary operation \p I to equivalent 32 bit binary		/// Promotes uniform binary operation \p I to equivalent 32 bit binary
/// operation.		/// operation.
///		///
/// \details \p I's base element bit width must be greater than 1 and less		/// \details \p I's base element bit width must be greater than 1 and less
/// than or equal 16. Promotion is done by sign or zero extending operands to		/// than or equal 16. Promotion is done by sign or zero extending operands to
/// 32 bits, replacing \p I with equivalent 32 bit binary operation, and		/// 32 bits, replacing \p I with equivalent 32 bit binary operation, and
/// truncating the result of 32 bit binary operation back to \p I's original		/// truncating the result of 32 bit binary operation back to \p I's original
/// type. Division operation is not promoted.		/// type. Division operation is not promoted.
▲ Show 20 Lines • Show All 84 Lines • ▼ Show 20 Lines	public:
//		//
/// \returns True.		/// \returns True.

bool canWidenScalarExtLoad(LoadInst &I) const;		bool canWidenScalarExtLoad(LoadInst &I) const;

Value *matchFractPat(IntrinsicInst &I);		Value *matchFractPat(IntrinsicInst &I);
Value applyFractPat(IRBuilder<> &Builder, Value FractArg);		Value applyFractPat(IRBuilder<> &Builder, Value FractArg);

		Value optimizeWithRsq(IRBuilder<> &Builder, Value Num, Value *Den,
		FastMathFlags DivFMF, FastMathFlags SqrtFMF,
		const Instruction *CtxI, bool AllowApproxRsq) const;

		Value optimizeWithRcp(IRBuilder<> &Builder, Value Num, Value *Den,
		FastMathFlags FMF, const Instruction *CtxI,
		bool AllowInaccurateRcp, bool RcpIsAccurate) const;

public:		public:
bool visitFDiv(BinaryOperator &I);		bool visitFDiv(BinaryOperator &I);

bool visitInstruction(Instruction &I) { return false; }		bool visitInstruction(Instruction &I) { return false; }
bool visitBinaryOperator(BinaryOperator &I);		bool visitBinaryOperator(BinaryOperator &I);
bool visitLoadInst(LoadInst &I);		bool visitLoadInst(LoadInst &I);
bool visitICmpInst(ICmpInst &I);		bool visitICmpInst(ICmpInst &I);
bool visitSelectInst(SelectInst &I);		bool visitSelectInst(SelectInst &I);
▲ Show 20 Lines • Show All 478 Lines • ▼ Show 20 Lines	bool AMDGPUCodeGenPrepareImpl::foldBinOpIntoSelect(BinaryOperator &BO) const {
BO.replaceAllUsesWith(NewSelect);		BO.replaceAllUsesWith(NewSelect);
BO.eraseFromParent();		BO.eraseFromParent();
if (CastOp)		if (CastOp)
CastOp->eraseFromParent();		CastOp->eraseFromParent();
Sel->eraseFromParent();		Sel->eraseFromParent();
return true;		return true;
}		}

		/// Emit an expansion of 1.0 / Src good for 1ulp that supports denormals.
		static Value emitRcpIEEE1ULP(IRBuilder<> &Builder, Value Src, bool IsNegative,
		bool HasFractBug) {
		// Same as for 1.0, but expand the sign out of the constant.
		// -1.0 / x -> rcp (fneg x)
		if (IsNegative)
		Src = Builder.CreateFNeg(Src);

		// The rcp instruction doesn't support denormals, so scale the input
		// out of the denormal range and convert at the end.
		//
		// Expand as 2^-n * (1.0 / (x * 2^n))

		// TODO: Skip scaling if input is known never denormal and the input
		// range won't underflow to denormal. The hard part is knowing the
		// result. We need a range check, the result could be denormal for
		// 0x1p+126 < den <= 0x1p+127.

		Type *Ty = Src->getType();
		Value *Frexp = Builder.CreateIntrinsic(Intrinsic::frexp,
		{Ty, Builder.getInt32Ty()}, Src);
		Value *FrexpMant = Builder.CreateExtractValue(Frexp, {0});

		// Bypass the bug workaround for the exponent result since it doesn't matter.
		// TODO: Does the bug workaround even really need to consider the exponent
		// result? It's unspecified by the spec.

		Value *FrexpExp =
		HasFractBug ? Builder.CreateIntrinsic(Intrinsic::amdgcn_frexp_exp,
		{Builder.getInt32Ty(), Ty}, Src)
		: Builder.CreateExtractValue(Frexp, {1});

		Value *ScaleFactor = Builder.CreateNeg(FrexpExp);
		Value *Rcp = Builder.CreateUnaryIntrinsic(Intrinsic::amdgcn_rcp, FrexpMant);
		return Builder.CreateIntrinsic(Intrinsic::ldexp, {Ty, Builder.getInt32Ty()},
		{Rcp, ScaleFactor});
		}

		/// Emit an expansion of 1.0 / sqrt(Src) good for 1ulp that supports denormals.
		static Value emitRsqIEEE1ULP(IRBuilder<> &Builder, Value Src,
		bool IsNegative) {
		// bool need_scale = x < 0x1p-126f;
		// float input_scale = need_scale ? 0x1.0p+24f : 1.0f;
		// float output_scale = need_scale ? 0x1.0p+12f : 1.0f;
		// rsq(x * input_scale) * output_scale;

		Type *Ty = Src->getType();
		APFloat SmallestNormal =
		APFloat::getSmallestNormalized(Ty->getFltSemantics());
		Value *NeedScale =
		Builder.CreateFCmpOLT(Src, ConstantFP::get(Ty, SmallestNormal));
		Constant *One = ConstantFP::get(Ty, 1.0);
		Constant *InputScale = ConstantFP::get(Ty, 0x1.0p+24);
		Constant *OutputScale =
		ConstantFP::get(Ty, IsNegative ? -0x1.0p+12 : 0x1.0p+12);

		Value *InputScaleFactor = Builder.CreateSelect(NeedScale, InputScale, One);

		Value *ScaledInput = Builder.CreateFMul(Src, InputScaleFactor);
		Value *Rsq = Builder.CreateUnaryIntrinsic(Intrinsic::amdgcn_rsq, ScaledInput);
		Value *OutputScaleFactor = Builder.CreateSelect(
		NeedScale, OutputScale, IsNegative ? ConstantFP::get(Ty, -1.0) : One);

		return Builder.CreateFMul(Rsq, OutputScaleFactor);
		}

		Value *AMDGPUCodeGenPrepareImpl::optimizeWithRsq(
		IRBuilder<> &Builder, Value Num, Value Den, FastMathFlags DivFMF,
		FastMathFlags SqrtFMF, const Instruction *CtxI, bool AllowApproxRsq) const {
		// The rsqrt contraction increases accuracy from ~2ulp to ~1ulp.
		if (!DivFMF.allowContract() \|\| !SqrtFMF.allowContract())
		return nullptr;

		const ConstantFP *CLHS = dyn_cast<ConstantFP>(Num);
		if (!CLHS)
		return nullptr;

		Type *Ty = Den->getType();
		chapuniUnsubmitted Not Done Reply Inline Actions Used only in +Asserts chapuni: Used only in +Asserts
		assert(Ty->isFloatTy());

		bool IsNegative = false;
		if (CLHS->isExactlyValue(1.0) \|\| (IsNegative = CLHS->isExactlyValue(-1.0))) {
		// Add in the sqrt flags.
		IRBuilder<>::FastMathFlagGuard Guard(Builder);
		DivFMF \|= SqrtFMF;
		Builder.setFastMathFlags(DivFMF);

		if (HasFP32DenormalFlush \|\| AllowApproxRsq \|\|
		computeKnownFPClass(Den, fcSubnormal, CtxI).isKnownNeverSubnormal()) {
		Value *Result = Builder.CreateUnaryIntrinsic(Intrinsic::amdgcn_rsq, Den);
		// -1.0 / sqrt(x) -> fneg(rsq(x))
		return IsNegative ? Builder.CreateFNeg(Result) : Result;
		}

		return emitRsqIEEE1ULP(Builder, Den, IsNegative);
		}

		return nullptr;
		}

// Optimize fdiv with rcp:		// Optimize fdiv with rcp:
//		//
// 1/x -> rcp(x) when rcp is sufficiently accurate or inaccurate rcp is		// 1/x -> rcp(x) when rcp is sufficiently accurate or inaccurate rcp is
// allowed with unsafe-fp-math or afn.		// allowed with unsafe-fp-math or afn.
//		//
// a/b -> a*rcp(b) when inaccurate rcp is allowed with unsafe-fp-math or afn.		// a/b -> a*rcp(b) when arcp is allowed, and we only need provide ULP 1.0
static Value optimizeWithRcp(Value Num, Value *Den, bool AllowInaccurateRcp,		Value *AMDGPUCodeGenPrepareImpl::optimizeWithRcp(IRBuilder<> &Builder,
bool RcpIsAccurate, IRBuilder<> &Builder,		Value Num, Value Den,
Module *Mod) {		FastMathFlags FMF,
		const Instruction *CtxI,
if (!AllowInaccurateRcp && !RcpIsAccurate)		bool AllowInaccurateRcp,
return nullptr;		bool RcpIsAccurate) const {
		assert(AllowInaccurateRcp \|\| RcpIsAccurate);

Type *Ty = Den->getType();		Type *Ty = Den->getType();
		assert(Ty->isFloatTy());

if (const ConstantFP *CLHS = dyn_cast<ConstantFP>(Num)) {		if (const ConstantFP *CLHS = dyn_cast<ConstantFP>(Num)) {
if (AllowInaccurateRcp \|\| RcpIsAccurate) {		bool IsNegative = false;
if (CLHS->isExactlyValue(1.0)) {		if (CLHS->isExactlyValue(1.0) \|\|
Function *Decl = Intrinsic::getDeclaration(		(IsNegative = CLHS->isExactlyValue(-1.0))) {
Mod, Intrinsic::amdgcn_rcp, Ty);		Value *Src = Den;

		if (HasFP32DenormalFlush \|\| AllowInaccurateRcp) {
		// -1.0 / x -> 1.0 / fneg(x)
		if (IsNegative)
		Src = Builder.CreateFNeg(Src);

// v_rcp_f32 and v_rsq_f32 do not support denormals, and according to		// v_rcp_f32 and v_rsq_f32 do not support denormals, and according to
// the CI documentation has a worst case error of 1 ulp.		// the CI documentation has a worst case error of 1 ulp.
// OpenCL requires <= 2.5 ulp for 1.0 / x, so it should always be OK to		// OpenCL requires <= 2.5 ulp for 1.0 / x, so it should always be OK
// use it as long as we aren't trying to use denormals.		// to use it as long as we aren't trying to use denormals.
//		//
// v_rcp_f16 and v_rsq_f16 DO support denormals.		// v_rcp_f16 and v_rsq_f16 DO support denormals.

// NOTE: v_sqrt and v_rcp will be combined to v_rsq later. So we don't		// NOTE: v_sqrt and v_rcp will be combined to v_rsq later. So we don't
// insert rsq intrinsic here.		// insert rsq intrinsic here.

// 1.0 / x -> rcp(x)		// 1.0 / x -> rcp(x)
return Builder.CreateCall(Decl, { Den });		return Builder.CreateUnaryIntrinsic(Intrinsic::amdgcn_rcp, Src);
}		}

// Same as for 1.0, but expand the sign out of the constant.		// TODO: If the input isn't denormal, and we know the input exponent isn't
if (CLHS->isExactlyValue(-1.0)) {		// big enough to introduce a denormal we can avoid the scaling.
Function *Decl = Intrinsic::getDeclaration(		return emitRcpIEEE1ULP(Builder, Src, IsNegative, ST->hasFractBug());
Mod, Intrinsic::amdgcn_rcp, Ty);

// -1.0 / x -> rcp (fneg x)
Value *FNeg = Builder.CreateFNeg(Den);
return Builder.CreateCall(Decl, { FNeg });
}
}		}
}		}

if (AllowInaccurateRcp) {		if (FMF.allowReciprocal()) {
		arsenmAuthorUnsubmitted Done Reply Inline Actions I'm not really sure how to interpret arcp and afn. The backend interpretation continues to be aggressive with afn, so I don't know which is correct. arsenm: I'm not really sure how to interpret arcp and afn. The backend interpretation continues to be…
Function *Decl = Intrinsic::getDeclaration(
Mod, Intrinsic::amdgcn_rcp, Ty);

// Turn into multiply by the reciprocal.
// x / y -> x * (1.0 / y)		// x / y -> x * (1.0 / y)
Value *Recip = Builder.CreateCall(Decl, { Den });
		// TODO: Could avoid denormal scaling and use raw rcp if we knew the output
		// will never underflow.
		if (AllowInaccurateRcp \|\| HasFP32DenormalFlush) {
		Value *Recip = Builder.CreateUnaryIntrinsic(Intrinsic::amdgcn_rcp, Den);
		return Builder.CreateFMul(Num, Recip);
		}

		Value *Recip = emitRcpIEEE1ULP(Builder, Den, false, ST->hasFractBug());
return Builder.CreateFMul(Num, Recip);		return Builder.CreateFMul(Num, Recip);
}		}

return nullptr;		return nullptr;
}		}

// optimize with fdiv.fast:		// optimize with fdiv.fast:
//		//
// a/b -> fdiv.fast(a, b) when !fpmath >= 2.5ulp with denormals flushed.		// a/b -> fdiv.fast(a, b) when !fpmath >= 2.5ulp with denormals flushed.
//		//
// 1/x -> fdiv.fast(1,x) when !fpmath >= 2.5ulp.		// 1/x -> fdiv.fast(1,x) when !fpmath >= 2.5ulp.
▲ Show 20 Lines • Show All 47 Lines • ▼ Show 20 Lines	bool AMDGPUCodeGenPrepareImpl::visitFDiv(BinaryOperator &FDiv) {
Type *Ty = FDiv.getType()->getScalarType();		Type *Ty = FDiv.getType()->getScalarType();
if (!Ty->isFloatTy())		if (!Ty->isFloatTy())
return false;		return false;

// The f64 rcp/rsq approximations are pretty inaccurate. We can do an		// The f64 rcp/rsq approximations are pretty inaccurate. We can do an
// expansion around them in codegen. f16 is good enough to always use.		// expansion around them in codegen. f16 is good enough to always use.

const FPMathOperator *FPOp = cast<const FPMathOperator>(&FDiv);		const FPMathOperator *FPOp = cast<const FPMathOperator>(&FDiv);
		const FastMathFlags DivFMF = FPOp->getFastMathFlags();

const float ReqdAccuracy = FPOp->getFPAccuracy();		const float ReqdAccuracy = FPOp->getFPAccuracy();

// Inaccurate rcp is allowed with unsafe-fp-math or afn.		// Inaccurate rcp is allowed with unsafe-fp-math or afn.
FastMathFlags FMF = FPOp->getFastMathFlags();		//
const bool AllowInaccurateRcp = HasUnsafeFPMath \|\| FMF.approxFunc();		// Defer to codegen to handle this.
		//
		// TODO: Decide on an interpretation for interactions between afn + arcp +
		// !fpmath, and make it consistent between here and codegen. For now, defer
		// expansion of afn to codegen. The current interpretation is so aggressive we
		// don't need any pre-consideration here when we have better information. A
		// more conservative interpretation could use handling here.
		const bool AllowInaccurateRcp = HasUnsafeFPMath \|\| DivFMF.approxFunc();
		if (AllowInaccurateRcp)
		return false;

		bool AllowApproxRsq = false;

		FastMathFlags SqrtFMF;

// rcp_f16 is accurate to 0.51 ulp.		// rcp_f16 is accurate to 0.51 ulp.
// rcp_f32 is accurate for !fpmath >= 1.0ulp and denormals are flushed.		// rcp_f32 is accurate for !fpmath >= 1.0ulp and denormals are flushed.
// rcp_f64 is never accurate.		// rcp_f64 is never accurate.
const bool RcpIsAccurate = HasFP32DenormalFlush && ReqdAccuracy >= 1.0f;		const bool RcpIsAccurate = ReqdAccuracy >= 1.0f;
		Value *Num = FDiv.getOperand(0);
		Value *Den = FDiv.getOperand(1);

		Value *RsqOp = nullptr;
		auto *DenII = dyn_cast<IntrinsicInst>(Den);
		if (DenII && DenII->getIntrinsicID() == Intrinsic::sqrt &&
		DenII->hasOneUse() && (RcpIsAccurate \|\| AllowInaccurateRcp)) {
		const auto *SqrtOp = cast<FPMathOperator>(DenII);
		AllowApproxRsq = HasUnsafeFPMath \|\| SqrtOp->hasApproxFunc();

		if (AllowApproxRsq \|\| SqrtOp->getFPAccuracy() >= 1.0f) {
		SqrtFMF = SqrtOp->getFastMathFlags();
		RsqOp = SqrtOp->getOperand(0);
		}
		}

IRBuilder<> Builder(FDiv.getParent(), std::next(FDiv.getIterator()));		IRBuilder<> Builder(FDiv.getParent(), std::next(FDiv.getIterator()));
Builder.setFastMathFlags(FMF);		Builder.setFastMathFlags(DivFMF);
Builder.SetCurrentDebugLocation(FDiv.getDebugLoc());		Builder.SetCurrentDebugLocation(FDiv.getDebugLoc());

Value *Num = FDiv.getOperand(0);
Value *Den = FDiv.getOperand(1);

Value *NewFDiv = nullptr;		Value *NewFDiv = nullptr;
if (auto *VT = dyn_cast<FixedVectorType>(FDiv.getType())) {		if (auto *VT = dyn_cast<FixedVectorType>(FDiv.getType())) {
NewFDiv = PoisonValue::get(VT);		NewFDiv = PoisonValue::get(VT);

// FIXME: Doesn't do the right thing for cases where the vector is partially		// FIXME: Doesn't do the right thing for cases where the vector is partially
// constant. This works when the scalarizer pass is run first.		// constant. This works when the scalarizer pass is run first.
for (unsigned I = 0, E = VT->getNumElements(); I != E; ++I) {		for (unsigned I = 0, E = VT->getNumElements(); I != E; ++I) {
Value *NumEltI = Builder.CreateExtractElement(Num, I);		Value *NumEltI = Builder.CreateExtractElement(Num, I);
Value *DenEltI = Builder.CreateExtractElement(Den, I);
		Value *NewElt = nullptr;
		if (RsqOp) {
		Value *DenEltI = Builder.CreateExtractElement(RsqOp, I);
		NewElt = optimizeWithRsq(Builder, NumEltI, DenEltI, DivFMF, SqrtFMF,
		&FDiv, AllowApproxRsq);
		if (!NewElt) {
		// TODO: Avoid inserting dead extract in the first place
		if (Instruction *Extract = dyn_cast<Instruction>(DenEltI))
		Extract->eraseFromParent();
		}
		}

		Value *DenEltI = nullptr;

		if (!NewElt && (RcpIsAccurate \|\| AllowInaccurateRcp)) {
		DenEltI = Builder.CreateExtractElement(Den, I);

// Try rcp first.		// Try rcp first.
Value *NewElt = optimizeWithRcp(NumEltI, DenEltI, AllowInaccurateRcp,		NewElt = optimizeWithRcp(Builder, NumEltI, DenEltI, DivFMF,
RcpIsAccurate, Builder, Mod);		cast<Instruction>(FPOp), AllowInaccurateRcp,
		RcpIsAccurate);
if (!NewElt) // Try fdiv.fast.		if (!NewElt) // Try fdiv.fast.
NewElt = optimizeWithFDivFast(NumEltI, DenEltI, ReqdAccuracy,		NewElt = optimizeWithFDivFast(NumEltI, DenEltI, ReqdAccuracy,
HasFP32DenormalFlush, Builder, Mod);		HasFP32DenormalFlush, Builder, Mod);
if (!NewElt) // Keep the original.		}
NewElt = Builder.CreateFDiv(NumEltI, DenEltI);
		if (!NewElt) {
		if (!DenEltI)
		DenEltI = Builder.CreateExtractElement(Den, I);

		// Keep the original, but scalarized.
		Value *ScalarDiv = Builder.CreateFDiv(NumEltI, DenEltI);
		if (auto *ScalarDivInst = dyn_cast<Instruction>(ScalarDiv))
		ScalarDivInst->copyMetadata(FDiv);
		NewElt = ScalarDiv;
		}

NewFDiv = Builder.CreateInsertElement(NewFDiv, NewElt, I);		NewFDiv = Builder.CreateInsertElement(NewFDiv, NewElt, I);
}		}
} else { // Scalar FDiv.		} else { // Scalar FDiv.
		if (RsqOp) {
		NewFDiv = optimizeWithRsq(Builder, Num, RsqOp, DivFMF, SqrtFMF,
		cast<Instruction>(FPOp), AllowApproxRsq);
		}

		if (!NewFDiv) {
// Try rcp first.		// Try rcp first.
NewFDiv = optimizeWithRcp(Num, Den, AllowInaccurateRcp, RcpIsAccurate,		if (RcpIsAccurate \|\| AllowInaccurateRcp) {
Builder, Mod);		NewFDiv =
		optimizeWithRcp(Builder, Num, Den, DivFMF, cast<Instruction>(FPOp),
		AllowInaccurateRcp, RcpIsAccurate);
		}

if (!NewFDiv) { // Try fdiv.fast.		if (!NewFDiv) { // Try fdiv.fast.
NewFDiv = optimizeWithFDivFast(Num, Den, ReqdAccuracy,		NewFDiv = optimizeWithFDivFast(Num, Den, ReqdAccuracy,
HasFP32DenormalFlush, Builder, Mod);		HasFP32DenormalFlush, Builder, Mod);
}		}
}		}
		}

if (NewFDiv) {		if (NewFDiv) {
FDiv.replaceAllUsesWith(NewFDiv);		FDiv.replaceAllUsesWith(NewFDiv);
NewFDiv->takeName(&FDiv);		NewFDiv->takeName(&FDiv);
FDiv.eraseFromParent();		RecursivelyDeleteTriviallyDeadInstructions(&FDiv, TLInfo);
}		}

return !!NewFDiv;		return !!NewFDiv;
}		}

static bool hasUnsafeFPMath(const Function &F) {		static bool hasUnsafeFPMath(const Function &F) {
Attribute Attr = F.getFnAttribute("unsafe-fp-math");		Attribute Attr = F.getFnAttribute("unsafe-fp-math");
return Attr.getValueAsBool();		return Attr.getValueAsBool();
▲ Show 20 Lines • Show All 973 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/GlobalISel/fdiv.f32.ll

	Show First 20 Lines • Show All 739 Lines • ▼ Show 20 Lines
	; GFX11-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX11-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX11-NEXT: v_rcp_f32_e32 v0, v0			; GFX11-NEXT: v_rcp_f32_e32 v0, v0
	; GFX11-NEXT: s_setpc_b64 s[30:31]			; GFX11-NEXT: s_setpc_b64 s[30:31]
	%fdiv = fdiv arcp afn float 1.0, %x			%fdiv = fdiv arcp afn float 1.0, %x
	ret float %fdiv			ret float %fdiv
	}			}

	define float @v_rcp_f32_ulp25(float %x) {			define float @v_rcp_f32_ulp25(float %x) {
	; GCN-IEEE-LABEL: v_rcp_f32_ulp25:			; GFX6-IEEE-LABEL: v_rcp_f32_ulp25:
	; GCN-IEEE: ; %bb.0:			; GFX6-IEEE: ; %bb.0:
	; GCN-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX6-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GCN-IEEE-NEXT: v_mov_b32_e32 v1, 0x6f800000			; GFX6-IEEE-NEXT: v_mov_b32_e32 v2, 0x7f800000
	; GCN-IEEE-NEXT: v_mov_b32_e32 v2, 0x2f800000			; GFX6-IEEE-NEXT: v_frexp_mant_f32_e32 v1, v0
	; GCN-IEEE-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, v1			; GFX6-IEEE-NEXT: v_cmp_lt_f32_e64 vcc, \|v0\|, v2
	; GCN-IEEE-NEXT: v_cndmask_b32_e32 v1, 1.0, v2, vcc			; GFX6-IEEE-NEXT: v_cndmask_b32_e32 v1, v0, v1, vcc
	; GCN-IEEE-NEXT: v_mul_f32_e32 v0, v0, v1			; GFX6-IEEE-NEXT: v_rcp_f32_e32 v1, v1
	; GCN-IEEE-NEXT: v_rcp_f32_e32 v0, v0			; GFX6-IEEE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
	; GCN-IEEE-NEXT: v_mul_f32_e32 v0, 1.0, v0			; GFX6-IEEE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
	; GCN-IEEE-NEXT: v_mul_f32_e32 v0, v1, v0			; GFX6-IEEE-NEXT: v_ldexp_f32_e32 v0, v1, v0
	; GCN-IEEE-NEXT: s_setpc_b64 s[30:31]			; GFX6-IEEE-NEXT: s_setpc_b64 s[30:31]
	;			;
	; GCN-FLUSH-LABEL: v_rcp_f32_ulp25:			; GCN-FLUSH-LABEL: v_rcp_f32_ulp25:
	; GCN-FLUSH: ; %bb.0:			; GCN-FLUSH: ; %bb.0:
	; GCN-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GCN-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GCN-FLUSH-NEXT: v_rcp_f32_e32 v0, v0			; GCN-FLUSH-NEXT: v_rcp_f32_e32 v0, v0
	; GCN-FLUSH-NEXT: s_setpc_b64 s[30:31]			; GCN-FLUSH-NEXT: s_setpc_b64 s[30:31]
	;			;
	; GFX10-IEEE-LABEL: v_rcp_f32_ulp25:			; GFX10-IEEE-LABEL: v_rcp_f32_ulp25:
	; GFX10-IEEE: ; %bb.0:			; GFX10-IEEE: ; %bb.0:
	; GFX10-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX10-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX10-IEEE-NEXT: v_cmp_lt_f32_e64 s4, 0x6f800000, \|v0\|			; GFX10-IEEE-NEXT: v_frexp_mant_f32_e32 v1, v0
	; GFX10-IEEE-NEXT: v_cndmask_b32_e64 v1, 1.0, 0x2f800000, s4			; GFX10-IEEE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
	; GFX10-IEEE-NEXT: v_mul_f32_e32 v0, v0, v1			; GFX10-IEEE-NEXT: v_rcp_f32_e32 v1, v1
	; GFX10-IEEE-NEXT: v_rcp_f32_e32 v0, v0			; GFX10-IEEE-NEXT: v_sub_nc_u32_e32 v0, 0, v0
	; GFX10-IEEE-NEXT: v_mul_f32_e32 v0, 1.0, v0			; GFX10-IEEE-NEXT: v_ldexp_f32 v0, v1, v0
	; GFX10-IEEE-NEXT: v_mul_f32_e32 v0, v1, v0
	; GFX10-IEEE-NEXT: s_setpc_b64 s[30:31]			; GFX10-IEEE-NEXT: s_setpc_b64 s[30:31]
	;			;
	; GFX10-FLUSH-LABEL: v_rcp_f32_ulp25:			; GFX10-FLUSH-LABEL: v_rcp_f32_ulp25:
	; GFX10-FLUSH: ; %bb.0:			; GFX10-FLUSH: ; %bb.0:
	; GFX10-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX10-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX10-FLUSH-NEXT: v_rcp_f32_e32 v0, v0			; GFX10-FLUSH-NEXT: v_rcp_f32_e32 v0, v0
	; GFX10-FLUSH-NEXT: s_setpc_b64 s[30:31]			; GFX10-FLUSH-NEXT: s_setpc_b64 s[30:31]
	;			;
	; GFX11-IEEE-LABEL: v_rcp_f32_ulp25:			; GFX11-IEEE-LABEL: v_rcp_f32_ulp25:
	; GFX11-IEEE: ; %bb.0:			; GFX11-IEEE: ; %bb.0:
	; GFX11-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX11-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX11-IEEE-NEXT: v_cmp_lt_f32_e64 s0, 0x6f800000, \|v0\|			; GFX11-IEEE-NEXT: v_frexp_mant_f32_e32 v1, v0
	; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX11-IEEE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
	; GFX11-IEEE-NEXT: v_cndmask_b32_e64 v1, 1.0, 0x2f800000, s0			; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX11-IEEE-NEXT: v_mul_f32_e32 v0, v0, v1			; GFX11-IEEE-NEXT: v_rcp_f32_e32 v1, v1
	; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_2) \| instid1(VALU_DEP_1)			; GFX11-IEEE-NEXT: v_sub_nc_u32_e32 v0, 0, v0
	; GFX11-IEEE-NEXT: v_rcp_f32_e32 v0, v0
	; GFX11-IEEE-NEXT: s_waitcnt_depctr 0xfff			; GFX11-IEEE-NEXT: s_waitcnt_depctr 0xfff
	; GFX11-IEEE-NEXT: v_mul_f32_e32 v0, 1.0, v0			; GFX11-IEEE-NEXT: v_ldexp_f32 v0, v1, v0
	; GFX11-IEEE-NEXT: v_mul_f32_e32 v0, v1, v0
	; GFX11-IEEE-NEXT: s_setpc_b64 s[30:31]			; GFX11-IEEE-NEXT: s_setpc_b64 s[30:31]
	;			;
	; GFX11-FLUSH-LABEL: v_rcp_f32_ulp25:			; GFX11-FLUSH-LABEL: v_rcp_f32_ulp25:
	; GFX11-FLUSH: ; %bb.0:			; GFX11-FLUSH: ; %bb.0:
	; GFX11-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX11-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX11-FLUSH-NEXT: v_rcp_f32_e32 v0, v0			; GFX11-FLUSH-NEXT: v_rcp_f32_e32 v0, v0
	; GFX11-FLUSH-NEXT: s_setpc_b64 s[30:31]			; GFX11-FLUSH-NEXT: s_setpc_b64 s[30:31]
	%fdiv = fdiv float 1.0, %x, !fpmath !0			%fdiv = fdiv float 1.0, %x, !fpmath !0
	Show All 22 Lines
	; GFX11-NEXT: s_waitcnt_depctr 0xfff			; GFX11-NEXT: s_waitcnt_depctr 0xfff
	; GFX11-NEXT: v_mul_f32_e32 v0, v0, v1			; GFX11-NEXT: v_mul_f32_e32 v0, v0, v1
	; GFX11-NEXT: s_setpc_b64 s[30:31]			; GFX11-NEXT: s_setpc_b64 s[30:31]
	%fdiv = fdiv afn float %a, %b, !fpmath !0			%fdiv = fdiv afn float %a, %b, !fpmath !0
	ret float %fdiv			ret float %fdiv
	}			}

	define float @v_fdiv_f32_arcp_ulp25(float %a, float %b) {			define float @v_fdiv_f32_arcp_ulp25(float %a, float %b) {
	; GFX6-IEEE-FASTFMA-LABEL: v_fdiv_f32_arcp_ulp25:			; GFX6-IEEE-LABEL: v_fdiv_f32_arcp_ulp25:
	; GFX6-IEEE-FASTFMA: ; %bb.0:			; GFX6-IEEE: ; %bb.0:
	; GFX6-IEEE-FASTFMA-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX6-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX6-IEEE-FASTFMA-NEXT: v_div_scale_f32 v2, s[4:5], v1, v1, v0			; GFX6-IEEE-NEXT: v_mov_b32_e32 v3, 0x7f800000
	; GFX6-IEEE-FASTFMA-NEXT: v_rcp_f32_e32 v3, v2			; GFX6-IEEE-NEXT: v_frexp_mant_f32_e32 v2, v1
	; GFX6-IEEE-FASTFMA-NEXT: v_div_scale_f32 v4, vcc, v0, v1, v0			; GFX6-IEEE-NEXT: v_cmp_lt_f32_e64 vcc, \|v1\|, v3
	; GFX6-IEEE-FASTFMA-NEXT: v_fma_f32 v5, -v2, v3, 1.0			; GFX6-IEEE-NEXT: v_cndmask_b32_e32 v2, v1, v2, vcc
	; GFX6-IEEE-FASTFMA-NEXT: v_fma_f32 v3, v5, v3, v3			; GFX6-IEEE-NEXT: v_rcp_f32_e32 v2, v2
	; GFX6-IEEE-FASTFMA-NEXT: v_mul_f32_e32 v5, v4, v3			; GFX6-IEEE-NEXT: v_frexp_exp_i32_f32_e32 v1, v1
	; GFX6-IEEE-FASTFMA-NEXT: v_fma_f32 v6, -v2, v5, v4			; GFX6-IEEE-NEXT: v_sub_i32_e32 v1, vcc, 0, v1
	; GFX6-IEEE-FASTFMA-NEXT: v_fma_f32 v5, v6, v3, v5			; GFX6-IEEE-NEXT: v_ldexp_f32_e32 v1, v2, v1
	; GFX6-IEEE-FASTFMA-NEXT: v_fma_f32 v2, -v2, v5, v4			; GFX6-IEEE-NEXT: v_mul_f32_e32 v0, v0, v1
	; GFX6-IEEE-FASTFMA-NEXT: v_div_fmas_f32 v2, v2, v3, v5			; GFX6-IEEE-NEXT: s_setpc_b64 s[30:31]
	; GFX6-IEEE-FASTFMA-NEXT: v_div_fixup_f32 v0, v2, v1, v0
	; GFX6-IEEE-FASTFMA-NEXT: s_setpc_b64 s[30:31]
	;			;
	; GCN-FLUSH-LABEL: v_fdiv_f32_arcp_ulp25:			; GCN-FLUSH-LABEL: v_fdiv_f32_arcp_ulp25:
	; GCN-FLUSH: ; %bb.0:			; GCN-FLUSH: ; %bb.0:
	; GCN-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GCN-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GCN-FLUSH-NEXT: v_mov_b32_e32 v2, 0x6f800000
	; GCN-FLUSH-NEXT: v_mov_b32_e32 v3, 0x2f800000
	; GCN-FLUSH-NEXT: v_cmp_gt_f32_e64 vcc, \|v1\|, v2
	; GCN-FLUSH-NEXT: v_cndmask_b32_e32 v2, 1.0, v3, vcc
	; GCN-FLUSH-NEXT: v_mul_f32_e32 v1, v1, v2
	; GCN-FLUSH-NEXT: v_rcp_f32_e32 v1, v1			; GCN-FLUSH-NEXT: v_rcp_f32_e32 v1, v1
	; GCN-FLUSH-NEXT: v_mul_f32_e32 v0, v0, v1			; GCN-FLUSH-NEXT: v_mul_f32_e32 v0, v0, v1
	; GCN-FLUSH-NEXT: v_mul_f32_e32 v0, v2, v0
	; GCN-FLUSH-NEXT: s_setpc_b64 s[30:31]			; GCN-FLUSH-NEXT: s_setpc_b64 s[30:31]
	;			;
	; GFX6-IEEE-SLOWFMA-LABEL: v_fdiv_f32_arcp_ulp25:
	; GFX6-IEEE-SLOWFMA: ; %bb.0:
	; GFX6-IEEE-SLOWFMA-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX6-IEEE-SLOWFMA-NEXT: v_div_scale_f32 v2, s[4:5], v1, v1, v0
	; GFX6-IEEE-SLOWFMA-NEXT: v_div_scale_f32 v3, vcc, v0, v1, v0
	; GFX6-IEEE-SLOWFMA-NEXT: v_rcp_f32_e32 v4, v2
	; GFX6-IEEE-SLOWFMA-NEXT: v_fma_f32 v5, -v2, v4, 1.0
	; GFX6-IEEE-SLOWFMA-NEXT: v_fma_f32 v4, v5, v4, v4
	; GFX6-IEEE-SLOWFMA-NEXT: v_mul_f32_e32 v5, v3, v4
	; GFX6-IEEE-SLOWFMA-NEXT: v_fma_f32 v6, -v2, v5, v3
	; GFX6-IEEE-SLOWFMA-NEXT: v_fma_f32 v5, v6, v4, v5
	; GFX6-IEEE-SLOWFMA-NEXT: v_fma_f32 v2, -v2, v5, v3
	; GFX6-IEEE-SLOWFMA-NEXT: v_div_fmas_f32 v2, v2, v4, v5
	; GFX6-IEEE-SLOWFMA-NEXT: v_div_fixup_f32 v0, v2, v1, v0
	; GFX6-IEEE-SLOWFMA-NEXT: s_setpc_b64 s[30:31]
	;
	; GFX89-IEEE-LABEL: v_fdiv_f32_arcp_ulp25:
	; GFX89-IEEE: ; %bb.0:
	; GFX89-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX89-IEEE-NEXT: v_div_scale_f32 v2, s[4:5], v1, v1, v0
	; GFX89-IEEE-NEXT: v_div_scale_f32 v3, vcc, v0, v1, v0
	; GFX89-IEEE-NEXT: v_rcp_f32_e32 v4, v2
	; GFX89-IEEE-NEXT: v_fma_f32 v5, -v2, v4, 1.0
	; GFX89-IEEE-NEXT: v_fma_f32 v4, v5, v4, v4
	; GFX89-IEEE-NEXT: v_mul_f32_e32 v5, v3, v4
	; GFX89-IEEE-NEXT: v_fma_f32 v6, -v2, v5, v3
	; GFX89-IEEE-NEXT: v_fma_f32 v5, v6, v4, v5
	; GFX89-IEEE-NEXT: v_fma_f32 v2, -v2, v5, v3
	; GFX89-IEEE-NEXT: v_div_fmas_f32 v2, v2, v4, v5
	; GFX89-IEEE-NEXT: v_div_fixup_f32 v0, v2, v1, v0
	; GFX89-IEEE-NEXT: s_setpc_b64 s[30:31]
	;
	; GFX10-IEEE-LABEL: v_fdiv_f32_arcp_ulp25:			; GFX10-IEEE-LABEL: v_fdiv_f32_arcp_ulp25:
	; GFX10-IEEE: ; %bb.0:			; GFX10-IEEE: ; %bb.0:
	; GFX10-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX10-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX10-IEEE-NEXT: v_div_scale_f32 v2, s4, v1, v1, v0			; GFX10-IEEE-NEXT: v_frexp_mant_f32_e32 v2, v1
	; GFX10-IEEE-NEXT: v_div_scale_f32 v5, vcc_lo, v0, v1, v0			; GFX10-IEEE-NEXT: v_frexp_exp_i32_f32_e32 v1, v1
	; GFX10-IEEE-NEXT: v_rcp_f32_e32 v3, v2			; GFX10-IEEE-NEXT: v_rcp_f32_e32 v2, v2
	; GFX10-IEEE-NEXT: v_fma_f32 v4, -v2, v3, 1.0			; GFX10-IEEE-NEXT: v_sub_nc_u32_e32 v1, 0, v1
	; GFX10-IEEE-NEXT: v_fmac_f32_e32 v3, v4, v3			; GFX10-IEEE-NEXT: v_ldexp_f32 v1, v2, v1
	; GFX10-IEEE-NEXT: v_mul_f32_e32 v4, v5, v3			; GFX10-IEEE-NEXT: v_mul_f32_e32 v0, v0, v1
	; GFX10-IEEE-NEXT: v_fma_f32 v6, -v2, v4, v5
	; GFX10-IEEE-NEXT: v_fmac_f32_e32 v4, v6, v3
	; GFX10-IEEE-NEXT: v_fma_f32 v2, -v2, v4, v5
	; GFX10-IEEE-NEXT: v_div_fmas_f32 v2, v2, v3, v4
	; GFX10-IEEE-NEXT: v_div_fixup_f32 v0, v2, v1, v0
	; GFX10-IEEE-NEXT: s_setpc_b64 s[30:31]			; GFX10-IEEE-NEXT: s_setpc_b64 s[30:31]
	;			;
	; GFX10-FLUSH-LABEL: v_fdiv_f32_arcp_ulp25:			; GFX10-FLUSH-LABEL: v_fdiv_f32_arcp_ulp25:
	; GFX10-FLUSH: ; %bb.0:			; GFX10-FLUSH: ; %bb.0:
	; GFX10-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX10-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX10-FLUSH-NEXT: v_cmp_lt_f32_e64 s4, 0x6f800000, \|v1\|
	; GFX10-FLUSH-NEXT: v_cndmask_b32_e64 v2, 1.0, 0x2f800000, s4
	; GFX10-FLUSH-NEXT: v_mul_f32_e32 v1, v1, v2
	; GFX10-FLUSH-NEXT: v_rcp_f32_e32 v1, v1			; GFX10-FLUSH-NEXT: v_rcp_f32_e32 v1, v1
	; GFX10-FLUSH-NEXT: v_mul_f32_e32 v0, v0, v1			; GFX10-FLUSH-NEXT: v_mul_f32_e32 v0, v0, v1
	; GFX10-FLUSH-NEXT: v_mul_f32_e32 v0, v2, v0
	; GFX10-FLUSH-NEXT: s_setpc_b64 s[30:31]			; GFX10-FLUSH-NEXT: s_setpc_b64 s[30:31]
	;			;
	; GFX11-IEEE-LABEL: v_fdiv_f32_arcp_ulp25:			; GFX11-IEEE-LABEL: v_fdiv_f32_arcp_ulp25:
	; GFX11-IEEE: ; %bb.0:			; GFX11-IEEE: ; %bb.0:
	; GFX11-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX11-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX11-IEEE-NEXT: v_div_scale_f32 v2, null, v1, v1, v0			; GFX11-IEEE-NEXT: v_frexp_mant_f32_e32 v2, v1
	; GFX11-IEEE-NEXT: v_div_scale_f32 v5, vcc_lo, v0, v1, v0			; GFX11-IEEE-NEXT: v_frexp_exp_i32_f32_e32 v1, v1
	; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(SKIP_2) \| instid1(VALU_DEP_1)			; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX11-IEEE-NEXT: v_rcp_f32_e32 v3, v2			; GFX11-IEEE-NEXT: v_rcp_f32_e32 v2, v2
				; GFX11-IEEE-NEXT: v_sub_nc_u32_e32 v1, 0, v1
	; GFX11-IEEE-NEXT: s_waitcnt_depctr 0xfff			; GFX11-IEEE-NEXT: s_waitcnt_depctr 0xfff
	; GFX11-IEEE-NEXT: v_fma_f32 v4, -v2, v3, 1.0			; GFX11-IEEE-NEXT: v_ldexp_f32 v1, v2, v1
	; GFX11-IEEE-NEXT: v_fmac_f32_e32 v3, v4, v3			; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX11-IEEE-NEXT: v_mul_f32_e32 v0, v0, v1
	; GFX11-IEEE-NEXT: v_mul_f32_e32 v4, v5, v3
	; GFX11-IEEE-NEXT: v_fma_f32 v6, -v2, v4, v5
	; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX11-IEEE-NEXT: v_fmac_f32_e32 v4, v6, v3
	; GFX11-IEEE-NEXT: v_fma_f32 v2, -v2, v4, v5
	; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX11-IEEE-NEXT: v_div_fmas_f32 v2, v2, v3, v4
	; GFX11-IEEE-NEXT: v_div_fixup_f32 v0, v2, v1, v0
	; GFX11-IEEE-NEXT: s_setpc_b64 s[30:31]			; GFX11-IEEE-NEXT: s_setpc_b64 s[30:31]
	;			;
	; GFX11-FLUSH-LABEL: v_fdiv_f32_arcp_ulp25:			; GFX11-FLUSH-LABEL: v_fdiv_f32_arcp_ulp25:
	; GFX11-FLUSH: ; %bb.0:			; GFX11-FLUSH: ; %bb.0:
	; GFX11-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX11-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX11-FLUSH-NEXT: v_cmp_lt_f32_e64 s0, 0x6f800000, \|v1\|
	; GFX11-FLUSH-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX11-FLUSH-NEXT: v_cndmask_b32_e64 v2, 1.0, 0x2f800000, s0
	; GFX11-FLUSH-NEXT: v_mul_f32_e32 v1, v1, v2
	; GFX11-FLUSH-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_2) \| instid1(VALU_DEP_1)
	; GFX11-FLUSH-NEXT: v_rcp_f32_e32 v1, v1			; GFX11-FLUSH-NEXT: v_rcp_f32_e32 v1, v1
	; GFX11-FLUSH-NEXT: s_waitcnt_depctr 0xfff			; GFX11-FLUSH-NEXT: s_waitcnt_depctr 0xfff
	; GFX11-FLUSH-NEXT: v_mul_f32_e32 v0, v0, v1			; GFX11-FLUSH-NEXT: v_mul_f32_e32 v0, v0, v1
	; GFX11-FLUSH-NEXT: v_mul_f32_e32 v0, v2, v0
	; GFX11-FLUSH-NEXT: s_setpc_b64 s[30:31]			; GFX11-FLUSH-NEXT: s_setpc_b64 s[30:31]
	%fdiv = fdiv arcp float %a, %b, !fpmath !0			%fdiv = fdiv arcp float %a, %b, !fpmath !0
	ret float %fdiv			ret float %fdiv
	}			}

	define <2 x float> @v_fdiv_v2f32(<2 x float> %a, <2 x float> %b) {			define <2 x float> @v_fdiv_v2f32(<2 x float> %a, <2 x float> %b) {
	; GFX6-IEEE-FASTFMA-LABEL: v_fdiv_v2f32:			; GFX6-IEEE-FASTFMA-LABEL: v_fdiv_v2f32:
	; GFX6-IEEE-FASTFMA: ; %bb.0:			; GFX6-IEEE-FASTFMA: ; %bb.0:
	▲ Show 20 Lines • Show All 1,179 Lines • ▼ Show 20 Lines
	}			}

	define <2 x float> @v_rcp_v2f32_arcp_afn(<2 x float> %x) {			define <2 x float> @v_rcp_v2f32_arcp_afn(<2 x float> %x) {
	; GCN-LABEL: v_rcp_v2f32_arcp_afn:			; GCN-LABEL: v_rcp_v2f32_arcp_afn:
	; GCN: ; %bb.0:			; GCN: ; %bb.0:
	; GCN-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GCN-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GCN-NEXT: v_rcp_f32_e32 v0, v0			; GCN-NEXT: v_rcp_f32_e32 v0, v0
	; GCN-NEXT: v_rcp_f32_e32 v1, v1			; GCN-NEXT: v_rcp_f32_e32 v1, v1
				; GCN-NEXT: v_mul_f32_e32 v0, 1.0, v0
				; GCN-NEXT: v_mul_f32_e32 v1, 1.0, v1
	; GCN-NEXT: s_setpc_b64 s[30:31]			; GCN-NEXT: s_setpc_b64 s[30:31]
	;			;
	; GFX10-LABEL: v_rcp_v2f32_arcp_afn:			; GFX10-LABEL: v_rcp_v2f32_arcp_afn:
	; GFX10: ; %bb.0:			; GFX10: ; %bb.0:
	; GFX10-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX10-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX10-NEXT: v_rcp_f32_e32 v0, v0			; GFX10-NEXT: v_rcp_f32_e32 v0, v0
	; GFX10-NEXT: v_rcp_f32_e32 v1, v1			; GFX10-NEXT: v_rcp_f32_e32 v1, v1
				; GFX10-NEXT: v_mul_f32_e32 v0, 1.0, v0
				; GFX10-NEXT: v_mul_f32_e32 v1, 1.0, v1
	; GFX10-NEXT: s_setpc_b64 s[30:31]			; GFX10-NEXT: s_setpc_b64 s[30:31]
	;			;
	; GFX11-LABEL: v_rcp_v2f32_arcp_afn:			; GFX11-LABEL: v_rcp_v2f32_arcp_afn:
	; GFX11: ; %bb.0:			; GFX11: ; %bb.0:
	; GFX11-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX11-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX11-NEXT: v_rcp_f32_e32 v0, v0			; GFX11-NEXT: v_rcp_f32_e32 v0, v0
	; GFX11-NEXT: v_rcp_f32_e32 v1, v1			; GFX11-NEXT: v_rcp_f32_e32 v1, v1
				; GFX11-NEXT: s_waitcnt_depctr 0xfff
				; GFX11-NEXT: v_dual_mul_f32 v0, 1.0, v0 :: v_dual_mul_f32 v1, 1.0, v1
	; GFX11-NEXT: s_setpc_b64 s[30:31]			; GFX11-NEXT: s_setpc_b64 s[30:31]
	%fdiv = fdiv arcp afn <2 x float> <float 1.0, float 1.0>, %x			%fdiv = fdiv arcp afn <2 x float> <float 1.0, float 1.0>, %x
	ret <2 x float> %fdiv			ret <2 x float> %fdiv
	}			}

	define <2 x float> @v_rcp_v2f32_ulp25(<2 x float> %x) {			define <2 x float> @v_rcp_v2f32_ulp25(<2 x float> %x) {
	; GCN-IEEE-LABEL: v_rcp_v2f32_ulp25:			; GFX6-IEEE-LABEL: v_rcp_v2f32_ulp25:
	; GCN-IEEE: ; %bb.0:			; GFX6-IEEE: ; %bb.0:
	; GCN-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX6-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GCN-IEEE-NEXT: s_mov_b32 s4, 0x6f800000			; GFX6-IEEE-NEXT: s_mov_b32 s4, 0x7f800000
	; GCN-IEEE-NEXT: v_mov_b32_e32 v2, 0x2f800000			; GFX6-IEEE-NEXT: v_frexp_mant_f32_e32 v2, v0
	; GCN-IEEE-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, s4			; GFX6-IEEE-NEXT: v_cmp_lt_f32_e64 vcc, \|v0\|, s4
	; GCN-IEEE-NEXT: v_cndmask_b32_e32 v3, 1.0, v2, vcc			; GFX6-IEEE-NEXT: v_cndmask_b32_e32 v2, v0, v2, vcc
	; GCN-IEEE-NEXT: v_cmp_gt_f32_e64 vcc, \|v1\|, s4			; GFX6-IEEE-NEXT: v_rcp_f32_e32 v2, v2
	; GCN-IEEE-NEXT: v_cndmask_b32_e32 v2, 1.0, v2, vcc			; GFX6-IEEE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
	; GCN-IEEE-NEXT: v_mul_f32_e32 v0, v0, v3			; GFX6-IEEE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
	; GCN-IEEE-NEXT: v_mul_f32_e32 v1, v1, v2			; GFX6-IEEE-NEXT: v_ldexp_f32_e32 v0, v2, v0
	; GCN-IEEE-NEXT: v_rcp_f32_e32 v0, v0			; GFX6-IEEE-NEXT: v_frexp_mant_f32_e32 v2, v1
	; GCN-IEEE-NEXT: v_rcp_f32_e32 v1, v1			; GFX6-IEEE-NEXT: v_cmp_lt_f32_e64 vcc, \|v1\|, s4
	; GCN-IEEE-NEXT: v_mul_f32_e32 v0, 1.0, v0			; GFX6-IEEE-NEXT: v_cndmask_b32_e32 v2, v1, v2, vcc
	; GCN-IEEE-NEXT: v_mul_f32_e32 v1, 1.0, v1			; GFX6-IEEE-NEXT: v_rcp_f32_e32 v2, v2
	; GCN-IEEE-NEXT: v_mul_f32_e32 v0, v3, v0			; GFX6-IEEE-NEXT: v_frexp_exp_i32_f32_e32 v1, v1
	; GCN-IEEE-NEXT: v_mul_f32_e32 v1, v2, v1			; GFX6-IEEE-NEXT: v_sub_i32_e32 v1, vcc, 0, v1
	; GCN-IEEE-NEXT: s_setpc_b64 s[30:31]			; GFX6-IEEE-NEXT: v_ldexp_f32_e32 v1, v2, v1
				; GFX6-IEEE-NEXT: s_setpc_b64 s[30:31]
	;			;
	; GCN-FLUSH-LABEL: v_rcp_v2f32_ulp25:			; GCN-FLUSH-LABEL: v_rcp_v2f32_ulp25:
	; GCN-FLUSH: ; %bb.0:			; GCN-FLUSH: ; %bb.0:
	; GCN-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GCN-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GCN-FLUSH-NEXT: v_rcp_f32_e32 v0, v0			; GCN-FLUSH-NEXT: v_rcp_f32_e32 v0, v0
	; GCN-FLUSH-NEXT: v_rcp_f32_e32 v1, v1			; GCN-FLUSH-NEXT: v_rcp_f32_e32 v1, v1
	; GCN-FLUSH-NEXT: s_setpc_b64 s[30:31]			; GCN-FLUSH-NEXT: s_setpc_b64 s[30:31]
	;			;
	; GFX10-IEEE-LABEL: v_rcp_v2f32_ulp25:			; GFX10-IEEE-LABEL: v_rcp_v2f32_ulp25:
	; GFX10-IEEE: ; %bb.0:			; GFX10-IEEE: ; %bb.0:
	; GFX10-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX10-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX10-IEEE-NEXT: v_cmp_lt_f32_e64 s4, 0x6f800000, \|v0\|			; GFX10-IEEE-NEXT: v_frexp_mant_f32_e32 v2, v0
	; GFX10-IEEE-NEXT: v_cndmask_b32_e64 v2, 1.0, 0x2f800000, s4			; GFX10-IEEE-NEXT: v_frexp_mant_f32_e32 v3, v1
	; GFX10-IEEE-NEXT: v_cmp_lt_f32_e64 s4, 0x6f800000, \|v1\|			; GFX10-IEEE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
	; GFX10-IEEE-NEXT: v_mul_f32_e32 v0, v0, v2			; GFX10-IEEE-NEXT: v_frexp_exp_i32_f32_e32 v1, v1
	; GFX10-IEEE-NEXT: v_cndmask_b32_e64 v3, 1.0, 0x2f800000, s4			; GFX10-IEEE-NEXT: v_rcp_f32_e32 v2, v2
	; GFX10-IEEE-NEXT: v_rcp_f32_e32 v0, v0			; GFX10-IEEE-NEXT: v_rcp_f32_e32 v3, v3
	; GFX10-IEEE-NEXT: v_mul_f32_e32 v1, v1, v3			; GFX10-IEEE-NEXT: v_sub_nc_u32_e32 v0, 0, v0
	; GFX10-IEEE-NEXT: v_rcp_f32_e32 v1, v1			; GFX10-IEEE-NEXT: v_sub_nc_u32_e32 v1, 0, v1
	; GFX10-IEEE-NEXT: v_mul_f32_e32 v0, 1.0, v0			; GFX10-IEEE-NEXT: v_ldexp_f32 v0, v2, v0
	; GFX10-IEEE-NEXT: v_mul_f32_e32 v0, v2, v0			; GFX10-IEEE-NEXT: v_ldexp_f32 v1, v3, v1
	; GFX10-IEEE-NEXT: v_mul_f32_e32 v1, 1.0, v1
	; GFX10-IEEE-NEXT: v_mul_f32_e32 v1, v3, v1
	; GFX10-IEEE-NEXT: s_setpc_b64 s[30:31]			; GFX10-IEEE-NEXT: s_setpc_b64 s[30:31]
	;			;
	; GFX10-FLUSH-LABEL: v_rcp_v2f32_ulp25:			; GFX10-FLUSH-LABEL: v_rcp_v2f32_ulp25:
	; GFX10-FLUSH: ; %bb.0:			; GFX10-FLUSH: ; %bb.0:
	; GFX10-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX10-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX10-FLUSH-NEXT: v_rcp_f32_e32 v0, v0			; GFX10-FLUSH-NEXT: v_rcp_f32_e32 v0, v0
	; GFX10-FLUSH-NEXT: v_rcp_f32_e32 v1, v1			; GFX10-FLUSH-NEXT: v_rcp_f32_e32 v1, v1
	; GFX10-FLUSH-NEXT: s_setpc_b64 s[30:31]			; GFX10-FLUSH-NEXT: s_setpc_b64 s[30:31]
	;			;
	; GFX11-IEEE-LABEL: v_rcp_v2f32_ulp25:			; GFX11-IEEE-LABEL: v_rcp_v2f32_ulp25:
	; GFX11-IEEE: ; %bb.0:			; GFX11-IEEE: ; %bb.0:
	; GFX11-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX11-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX11-IEEE-NEXT: v_cmp_lt_f32_e64 s0, 0x6f800000, \|v0\|			; GFX11-IEEE-NEXT: v_frexp_mant_f32_e32 v2, v0
	; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(VALU_DEP_1)			; GFX11-IEEE-NEXT: v_frexp_mant_f32_e32 v3, v1
	; GFX11-IEEE-NEXT: v_cndmask_b32_e64 v2, 1.0, 0x2f800000, s0			; GFX11-IEEE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
	; GFX11-IEEE-NEXT: v_cmp_lt_f32_e64 s0, 0x6f800000, \|v1\|			; GFX11-IEEE-NEXT: v_frexp_exp_i32_f32_e32 v1, v1
	; GFX11-IEEE-NEXT: v_cndmask_b32_e64 v3, 1.0, 0x2f800000, s0			; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_4) \| instskip(NEXT) \| instid1(VALU_DEP_3)
	; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)			; GFX11-IEEE-NEXT: v_rcp_f32_e32 v2, v2
	; GFX11-IEEE-NEXT: v_dual_mul_f32 v0, v0, v2 :: v_dual_mul_f32 v1, v1, v3			; GFX11-IEEE-NEXT: v_rcp_f32_e32 v3, v3
	; GFX11-IEEE-NEXT: v_rcp_f32_e32 v0, v0			; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(NEXT) \| instid1(VALU_DEP_2)
	; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_2) \| instid1(VALU_DEP_1)			; GFX11-IEEE-NEXT: v_sub_nc_u32_e32 v0, 0, v0
	; GFX11-IEEE-NEXT: v_rcp_f32_e32 v1, v1			; GFX11-IEEE-NEXT: v_sub_nc_u32_e32 v1, 0, v1
	; GFX11-IEEE-NEXT: s_waitcnt_depctr 0xfff			; GFX11-IEEE-NEXT: s_waitcnt_depctr 0xfff
	; GFX11-IEEE-NEXT: v_dual_mul_f32 v0, 1.0, v0 :: v_dual_mul_f32 v1, 1.0, v1			; GFX11-IEEE-NEXT: v_ldexp_f32 v0, v2, v0
	; GFX11-IEEE-NEXT: v_dual_mul_f32 v0, v2, v0 :: v_dual_mul_f32 v1, v3, v1			; GFX11-IEEE-NEXT: v_ldexp_f32 v1, v3, v1
	; GFX11-IEEE-NEXT: s_setpc_b64 s[30:31]			; GFX11-IEEE-NEXT: s_setpc_b64 s[30:31]
	;			;
	; GFX11-FLUSH-LABEL: v_rcp_v2f32_ulp25:			; GFX11-FLUSH-LABEL: v_rcp_v2f32_ulp25:
	; GFX11-FLUSH: ; %bb.0:			; GFX11-FLUSH: ; %bb.0:
	; GFX11-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX11-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX11-FLUSH-NEXT: v_rcp_f32_e32 v0, v0			; GFX11-FLUSH-NEXT: v_rcp_f32_e32 v0, v0
	; GFX11-FLUSH-NEXT: v_rcp_f32_e32 v1, v1			; GFX11-FLUSH-NEXT: v_rcp_f32_e32 v1, v1
	; GFX11-FLUSH-NEXT: s_setpc_b64 s[30:31]			; GFX11-FLUSH-NEXT: s_setpc_b64 s[30:31]
	Show All 28 Lines
	; GFX11-NEXT: s_waitcnt_depctr 0xfff			; GFX11-NEXT: s_waitcnt_depctr 0xfff
	; GFX11-NEXT: v_dual_mul_f32 v0, v0, v2 :: v_dual_mul_f32 v1, v1, v3			; GFX11-NEXT: v_dual_mul_f32 v0, v0, v2 :: v_dual_mul_f32 v1, v1, v3
	; GFX11-NEXT: s_setpc_b64 s[30:31]			; GFX11-NEXT: s_setpc_b64 s[30:31]
	%fdiv = fdiv afn <2 x float> %a, %b, !fpmath !0			%fdiv = fdiv afn <2 x float> %a, %b, !fpmath !0
	ret <2 x float> %fdiv			ret <2 x float> %fdiv
	}			}

	define <2 x float> @v_fdiv_v2f32_arcp_ulp25(<2 x float> %a, <2 x float> %b) {			define <2 x float> @v_fdiv_v2f32_arcp_ulp25(<2 x float> %a, <2 x float> %b) {
	; GFX6-IEEE-FASTFMA-LABEL: v_fdiv_v2f32_arcp_ulp25:			; GFX6-IEEE-LABEL: v_fdiv_v2f32_arcp_ulp25:
	; GFX6-IEEE-FASTFMA: ; %bb.0:			; GFX6-IEEE: ; %bb.0:
	; GFX6-IEEE-FASTFMA-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX6-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX6-IEEE-FASTFMA-NEXT: v_div_scale_f32 v4, s[4:5], v2, v2, v0			; GFX6-IEEE-NEXT: s_mov_b32 s4, 0x7f800000
	; GFX6-IEEE-FASTFMA-NEXT: v_rcp_f32_e32 v5, v4			; GFX6-IEEE-NEXT: v_frexp_mant_f32_e32 v4, v2
	; GFX6-IEEE-FASTFMA-NEXT: v_div_scale_f32 v6, vcc, v0, v2, v0			; GFX6-IEEE-NEXT: v_cmp_lt_f32_e64 vcc, \|v2\|, s4
	; GFX6-IEEE-FASTFMA-NEXT: v_fma_f32 v7, -v4, v5, 1.0			; GFX6-IEEE-NEXT: v_cndmask_b32_e32 v4, v2, v4, vcc
	; GFX6-IEEE-FASTFMA-NEXT: v_fma_f32 v5, v7, v5, v5			; GFX6-IEEE-NEXT: v_rcp_f32_e32 v4, v4
	; GFX6-IEEE-FASTFMA-NEXT: v_mul_f32_e32 v7, v6, v5			; GFX6-IEEE-NEXT: v_frexp_exp_i32_f32_e32 v2, v2
	; GFX6-IEEE-FASTFMA-NEXT: v_fma_f32 v8, -v4, v7, v6			; GFX6-IEEE-NEXT: v_sub_i32_e32 v2, vcc, 0, v2
	; GFX6-IEEE-FASTFMA-NEXT: v_fma_f32 v7, v8, v5, v7			; GFX6-IEEE-NEXT: v_ldexp_f32_e32 v2, v4, v2
	; GFX6-IEEE-FASTFMA-NEXT: v_fma_f32 v4, -v4, v7, v6			; GFX6-IEEE-NEXT: v_mul_f32_e32 v0, v0, v2
	; GFX6-IEEE-FASTFMA-NEXT: v_div_fmas_f32 v4, v4, v5, v7			; GFX6-IEEE-NEXT: v_frexp_mant_f32_e32 v2, v3
	; GFX6-IEEE-FASTFMA-NEXT: v_div_scale_f32 v5, s[4:5], v3, v3, v1			; GFX6-IEEE-NEXT: v_cmp_lt_f32_e64 vcc, \|v3\|, s4
	; GFX6-IEEE-FASTFMA-NEXT: v_rcp_f32_e32 v6, v5			; GFX6-IEEE-NEXT: v_cndmask_b32_e32 v2, v3, v2, vcc
	; GFX6-IEEE-FASTFMA-NEXT: v_div_fixup_f32 v0, v4, v2, v0			; GFX6-IEEE-NEXT: v_rcp_f32_e32 v2, v2
	; GFX6-IEEE-FASTFMA-NEXT: v_div_scale_f32 v2, vcc, v1, v3, v1			; GFX6-IEEE-NEXT: v_frexp_exp_i32_f32_e32 v3, v3
	; GFX6-IEEE-FASTFMA-NEXT: v_fma_f32 v4, -v5, v6, 1.0			; GFX6-IEEE-NEXT: v_sub_i32_e32 v3, vcc, 0, v3
	; GFX6-IEEE-FASTFMA-NEXT: v_fma_f32 v4, v4, v6, v6			; GFX6-IEEE-NEXT: v_ldexp_f32_e32 v2, v2, v3
	; GFX6-IEEE-FASTFMA-NEXT: v_mul_f32_e32 v6, v2, v4			; GFX6-IEEE-NEXT: v_mul_f32_e32 v1, v1, v2
	; GFX6-IEEE-FASTFMA-NEXT: v_fma_f32 v7, -v5, v6, v2			; GFX6-IEEE-NEXT: s_setpc_b64 s[30:31]
	; GFX6-IEEE-FASTFMA-NEXT: v_fma_f32 v6, v7, v4, v6
	; GFX6-IEEE-FASTFMA-NEXT: v_fma_f32 v2, -v5, v6, v2
	; GFX6-IEEE-FASTFMA-NEXT: v_div_fmas_f32 v2, v2, v4, v6
	; GFX6-IEEE-FASTFMA-NEXT: v_div_fixup_f32 v1, v2, v3, v1
	; GFX6-IEEE-FASTFMA-NEXT: s_setpc_b64 s[30:31]
	;			;
	; GCN-FLUSH-LABEL: v_fdiv_v2f32_arcp_ulp25:			; GCN-FLUSH-LABEL: v_fdiv_v2f32_arcp_ulp25:
	; GCN-FLUSH: ; %bb.0:			; GCN-FLUSH: ; %bb.0:
	; GCN-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GCN-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GCN-FLUSH-NEXT: s_mov_b32 s4, 0x6f800000
	; GCN-FLUSH-NEXT: v_mov_b32_e32 v4, 0x2f800000
	; GCN-FLUSH-NEXT: v_cmp_gt_f32_e64 vcc, \|v2\|, s4
	; GCN-FLUSH-NEXT: v_cndmask_b32_e32 v5, 1.0, v4, vcc
	; GCN-FLUSH-NEXT: v_cmp_gt_f32_e64 vcc, \|v3\|, s4
	; GCN-FLUSH-NEXT: v_cndmask_b32_e32 v4, 1.0, v4, vcc
	; GCN-FLUSH-NEXT: v_mul_f32_e32 v2, v2, v5
	; GCN-FLUSH-NEXT: v_mul_f32_e32 v3, v3, v4
	; GCN-FLUSH-NEXT: v_rcp_f32_e32 v2, v2			; GCN-FLUSH-NEXT: v_rcp_f32_e32 v2, v2
	; GCN-FLUSH-NEXT: v_rcp_f32_e32 v3, v3			; GCN-FLUSH-NEXT: v_rcp_f32_e32 v3, v3
	; GCN-FLUSH-NEXT: v_mul_f32_e32 v0, v0, v2			; GCN-FLUSH-NEXT: v_mul_f32_e32 v0, v0, v2
	; GCN-FLUSH-NEXT: v_mul_f32_e32 v1, v1, v3			; GCN-FLUSH-NEXT: v_mul_f32_e32 v1, v1, v3
	; GCN-FLUSH-NEXT: v_mul_f32_e32 v0, v5, v0
	; GCN-FLUSH-NEXT: v_mul_f32_e32 v1, v4, v1
	; GCN-FLUSH-NEXT: s_setpc_b64 s[30:31]			; GCN-FLUSH-NEXT: s_setpc_b64 s[30:31]
	;			;
	; GFX6-IEEE-SLOWFMA-LABEL: v_fdiv_v2f32_arcp_ulp25:
	; GFX6-IEEE-SLOWFMA: ; %bb.0:
	; GFX6-IEEE-SLOWFMA-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX6-IEEE-SLOWFMA-NEXT: v_div_scale_f32 v4, s[4:5], v2, v2, v0
	; GFX6-IEEE-SLOWFMA-NEXT: v_div_scale_f32 v5, s[4:5], v3, v3, v1
	; GFX6-IEEE-SLOWFMA-NEXT: v_div_scale_f32 v6, vcc, v0, v2, v0
	; GFX6-IEEE-SLOWFMA-NEXT: v_div_scale_f32 v7, s[4:5], v1, v3, v1
	; GFX6-IEEE-SLOWFMA-NEXT: v_rcp_f32_e32 v8, v4
	; GFX6-IEEE-SLOWFMA-NEXT: v_rcp_f32_e32 v9, v5
	; GFX6-IEEE-SLOWFMA-NEXT: v_fma_f32 v10, -v4, v8, 1.0
	; GFX6-IEEE-SLOWFMA-NEXT: v_fma_f32 v8, v10, v8, v8
	; GFX6-IEEE-SLOWFMA-NEXT: v_fma_f32 v11, -v5, v9, 1.0
	; GFX6-IEEE-SLOWFMA-NEXT: v_fma_f32 v9, v11, v9, v9
	; GFX6-IEEE-SLOWFMA-NEXT: v_mul_f32_e32 v10, v6, v8
	; GFX6-IEEE-SLOWFMA-NEXT: v_mul_f32_e32 v11, v7, v9
	; GFX6-IEEE-SLOWFMA-NEXT: v_fma_f32 v12, -v4, v10, v6
	; GFX6-IEEE-SLOWFMA-NEXT: v_fma_f32 v13, -v5, v11, v7
	; GFX6-IEEE-SLOWFMA-NEXT: v_fma_f32 v10, v12, v8, v10
	; GFX6-IEEE-SLOWFMA-NEXT: v_fma_f32 v11, v13, v9, v11
	; GFX6-IEEE-SLOWFMA-NEXT: v_fma_f32 v4, -v4, v10, v6
	; GFX6-IEEE-SLOWFMA-NEXT: v_fma_f32 v5, -v5, v11, v7
	; GFX6-IEEE-SLOWFMA-NEXT: v_div_fmas_f32 v4, v4, v8, v10
	; GFX6-IEEE-SLOWFMA-NEXT: s_mov_b64 vcc, s[4:5]
	; GFX6-IEEE-SLOWFMA-NEXT: v_div_fmas_f32 v5, v5, v9, v11
	; GFX6-IEEE-SLOWFMA-NEXT: v_div_fixup_f32 v0, v4, v2, v0
	; GFX6-IEEE-SLOWFMA-NEXT: v_div_fixup_f32 v1, v5, v3, v1
	; GFX6-IEEE-SLOWFMA-NEXT: s_setpc_b64 s[30:31]
	;
	; GFX89-IEEE-LABEL: v_fdiv_v2f32_arcp_ulp25:
	; GFX89-IEEE: ; %bb.0:
	; GFX89-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX89-IEEE-NEXT: v_div_scale_f32 v4, s[4:5], v2, v2, v0
	; GFX89-IEEE-NEXT: v_div_scale_f32 v5, s[4:5], v3, v3, v1
	; GFX89-IEEE-NEXT: v_div_scale_f32 v6, vcc, v0, v2, v0
	; GFX89-IEEE-NEXT: v_div_scale_f32 v7, s[4:5], v1, v3, v1
	; GFX89-IEEE-NEXT: v_rcp_f32_e32 v8, v4
	; GFX89-IEEE-NEXT: v_rcp_f32_e32 v9, v5
	; GFX89-IEEE-NEXT: v_fma_f32 v10, -v4, v8, 1.0
	; GFX89-IEEE-NEXT: v_fma_f32 v8, v10, v8, v8
	; GFX89-IEEE-NEXT: v_fma_f32 v11, -v5, v9, 1.0
	; GFX89-IEEE-NEXT: v_fma_f32 v9, v11, v9, v9
	; GFX89-IEEE-NEXT: v_mul_f32_e32 v10, v6, v8
	; GFX89-IEEE-NEXT: v_mul_f32_e32 v11, v7, v9
	; GFX89-IEEE-NEXT: v_fma_f32 v12, -v4, v10, v6
	; GFX89-IEEE-NEXT: v_fma_f32 v13, -v5, v11, v7
	; GFX89-IEEE-NEXT: v_fma_f32 v10, v12, v8, v10
	; GFX89-IEEE-NEXT: v_fma_f32 v11, v13, v9, v11
	; GFX89-IEEE-NEXT: v_fma_f32 v4, -v4, v10, v6
	; GFX89-IEEE-NEXT: v_fma_f32 v5, -v5, v11, v7
	; GFX89-IEEE-NEXT: v_div_fmas_f32 v4, v4, v8, v10
	; GFX89-IEEE-NEXT: s_mov_b64 vcc, s[4:5]
	; GFX89-IEEE-NEXT: v_div_fmas_f32 v5, v5, v9, v11
	; GFX89-IEEE-NEXT: v_div_fixup_f32 v0, v4, v2, v0
	; GFX89-IEEE-NEXT: v_div_fixup_f32 v1, v5, v3, v1
	; GFX89-IEEE-NEXT: s_setpc_b64 s[30:31]
	;
	; GFX10-IEEE-LABEL: v_fdiv_v2f32_arcp_ulp25:			; GFX10-IEEE-LABEL: v_fdiv_v2f32_arcp_ulp25:
	; GFX10-IEEE: ; %bb.0:			; GFX10-IEEE: ; %bb.0:
	; GFX10-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX10-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX10-IEEE-NEXT: v_div_scale_f32 v4, s4, v2, v2, v0			; GFX10-IEEE-NEXT: v_frexp_mant_f32_e32 v4, v2
	; GFX10-IEEE-NEXT: v_div_scale_f32 v5, s4, v3, v3, v1			; GFX10-IEEE-NEXT: v_frexp_mant_f32_e32 v5, v3
	; GFX10-IEEE-NEXT: v_div_scale_f32 v10, vcc_lo, v0, v2, v0			; GFX10-IEEE-NEXT: v_frexp_exp_i32_f32_e32 v2, v2
	; GFX10-IEEE-NEXT: v_rcp_f32_e32 v6, v4			; GFX10-IEEE-NEXT: v_frexp_exp_i32_f32_e32 v3, v3
	; GFX10-IEEE-NEXT: v_rcp_f32_e32 v7, v5			; GFX10-IEEE-NEXT: v_rcp_f32_e32 v4, v4
	; GFX10-IEEE-NEXT: v_fma_f32 v8, -v4, v6, 1.0			; GFX10-IEEE-NEXT: v_rcp_f32_e32 v5, v5
	; GFX10-IEEE-NEXT: v_fma_f32 v9, -v5, v7, 1.0			; GFX10-IEEE-NEXT: v_sub_nc_u32_e32 v2, 0, v2
	; GFX10-IEEE-NEXT: v_fmac_f32_e32 v6, v8, v6			; GFX10-IEEE-NEXT: v_sub_nc_u32_e32 v3, 0, v3
	; GFX10-IEEE-NEXT: v_div_scale_f32 v8, s4, v1, v3, v1			; GFX10-IEEE-NEXT: v_ldexp_f32 v2, v4, v2
	; GFX10-IEEE-NEXT: v_fmac_f32_e32 v7, v9, v7			; GFX10-IEEE-NEXT: v_ldexp_f32 v3, v5, v3
	; GFX10-IEEE-NEXT: v_mul_f32_e32 v9, v10, v6			; GFX10-IEEE-NEXT: v_mul_f32_e32 v0, v0, v2
	; GFX10-IEEE-NEXT: v_mul_f32_e32 v11, v8, v7			; GFX10-IEEE-NEXT: v_mul_f32_e32 v1, v1, v3
	; GFX10-IEEE-NEXT: v_fma_f32 v12, -v4, v9, v10
	; GFX10-IEEE-NEXT: v_fma_f32 v13, -v5, v11, v8
	; GFX10-IEEE-NEXT: v_fmac_f32_e32 v9, v12, v6
	; GFX10-IEEE-NEXT: v_fmac_f32_e32 v11, v13, v7
	; GFX10-IEEE-NEXT: v_fma_f32 v4, -v4, v9, v10
	; GFX10-IEEE-NEXT: v_fma_f32 v5, -v5, v11, v8
	; GFX10-IEEE-NEXT: v_div_fmas_f32 v4, v4, v6, v9
	; GFX10-IEEE-NEXT: s_mov_b32 vcc_lo, s4
	; GFX10-IEEE-NEXT: v_div_fmas_f32 v5, v5, v7, v11
	; GFX10-IEEE-NEXT: v_div_fixup_f32 v0, v4, v2, v0
	; GFX10-IEEE-NEXT: v_div_fixup_f32 v1, v5, v3, v1
	; GFX10-IEEE-NEXT: s_setpc_b64 s[30:31]			; GFX10-IEEE-NEXT: s_setpc_b64 s[30:31]
	;			;
	; GFX10-FLUSH-LABEL: v_fdiv_v2f32_arcp_ulp25:			; GFX10-FLUSH-LABEL: v_fdiv_v2f32_arcp_ulp25:
	; GFX10-FLUSH: ; %bb.0:			; GFX10-FLUSH: ; %bb.0:
	; GFX10-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX10-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX10-FLUSH-NEXT: v_cmp_lt_f32_e64 s4, 0x6f800000, \|v2\|
	; GFX10-FLUSH-NEXT: v_cndmask_b32_e64 v4, 1.0, 0x2f800000, s4
	; GFX10-FLUSH-NEXT: v_cmp_lt_f32_e64 s4, 0x6f800000, \|v3\|
	; GFX10-FLUSH-NEXT: v_mul_f32_e32 v2, v2, v4
	; GFX10-FLUSH-NEXT: v_cndmask_b32_e64 v5, 1.0, 0x2f800000, s4
	; GFX10-FLUSH-NEXT: v_rcp_f32_e32 v2, v2			; GFX10-FLUSH-NEXT: v_rcp_f32_e32 v2, v2
	; GFX10-FLUSH-NEXT: v_mul_f32_e32 v3, v3, v5
	; GFX10-FLUSH-NEXT: v_rcp_f32_e32 v3, v3			; GFX10-FLUSH-NEXT: v_rcp_f32_e32 v3, v3
	; GFX10-FLUSH-NEXT: v_mul_f32_e32 v0, v0, v2			; GFX10-FLUSH-NEXT: v_mul_f32_e32 v0, v0, v2
	; GFX10-FLUSH-NEXT: v_mul_f32_e32 v0, v4, v0
	; GFX10-FLUSH-NEXT: v_mul_f32_e32 v1, v1, v3			; GFX10-FLUSH-NEXT: v_mul_f32_e32 v1, v1, v3
	; GFX10-FLUSH-NEXT: v_mul_f32_e32 v1, v5, v1
	; GFX10-FLUSH-NEXT: s_setpc_b64 s[30:31]			; GFX10-FLUSH-NEXT: s_setpc_b64 s[30:31]
	;			;
	; GFX11-IEEE-LABEL: v_fdiv_v2f32_arcp_ulp25:			; GFX11-IEEE-LABEL: v_fdiv_v2f32_arcp_ulp25:
	; GFX11-IEEE: ; %bb.0:			; GFX11-IEEE: ; %bb.0:
	; GFX11-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX11-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX11-IEEE-NEXT: v_div_scale_f32 v4, null, v2, v2, v0			; GFX11-IEEE-NEXT: v_frexp_mant_f32_e32 v4, v2
	; GFX11-IEEE-NEXT: v_div_scale_f32 v5, null, v3, v3, v1			; GFX11-IEEE-NEXT: v_frexp_mant_f32_e32 v5, v3
	; GFX11-IEEE-NEXT: v_div_scale_f32 v10, vcc_lo, v0, v2, v0			; GFX11-IEEE-NEXT: v_frexp_exp_i32_f32_e32 v2, v2
	; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_3) \| instskip(NEXT) \| instid1(VALU_DEP_2)			; GFX11-IEEE-NEXT: v_frexp_exp_i32_f32_e32 v3, v3
	; GFX11-IEEE-NEXT: v_rcp_f32_e32 v6, v4			; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_4) \| instskip(NEXT) \| instid1(VALU_DEP_3)
	; GFX11-IEEE-NEXT: v_rcp_f32_e32 v7, v5			; GFX11-IEEE-NEXT: v_rcp_f32_e32 v4, v4
	; GFX11-IEEE-NEXT: s_waitcnt_depctr 0xfff			; GFX11-IEEE-NEXT: v_rcp_f32_e32 v5, v5
	; GFX11-IEEE-NEXT: v_fma_f32 v8, -v4, v6, 1.0
	; GFX11-IEEE-NEXT: v_fma_f32 v9, -v5, v7, 1.0
	; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(VALU_DEP_2)
	; GFX11-IEEE-NEXT: v_dual_fmac_f32 v6, v8, v6 :: v_dual_fmac_f32 v7, v9, v7
	; GFX11-IEEE-NEXT: v_div_scale_f32 v8, s0, v1, v3, v1
	; GFX11-IEEE-NEXT: v_mul_f32_e32 v9, v10, v6
	; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(NEXT) \| instid1(VALU_DEP_2)			; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(NEXT) \| instid1(VALU_DEP_2)
	; GFX11-IEEE-NEXT: v_mul_f32_e32 v11, v8, v7			; GFX11-IEEE-NEXT: v_sub_nc_u32_e32 v2, 0, v2
	; GFX11-IEEE-NEXT: v_fma_f32 v12, -v4, v9, v10			; GFX11-IEEE-NEXT: v_sub_nc_u32_e32 v3, 0, v3
	; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(NEXT) \| instid1(VALU_DEP_2)			; GFX11-IEEE-NEXT: s_waitcnt_depctr 0xfff
	; GFX11-IEEE-NEXT: v_fma_f32 v13, -v5, v11, v8			; GFX11-IEEE-NEXT: v_ldexp_f32 v2, v4, v2
	; GFX11-IEEE-NEXT: v_fmac_f32_e32 v9, v12, v6			; GFX11-IEEE-NEXT: v_ldexp_f32 v3, v5, v3
	; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(NEXT) \| instid1(VALU_DEP_2)			; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_1)
	; GFX11-IEEE-NEXT: v_fmac_f32_e32 v11, v13, v7			; GFX11-IEEE-NEXT: v_dual_mul_f32 v0, v0, v2 :: v_dual_mul_f32 v1, v1, v3
	; GFX11-IEEE-NEXT: v_fma_f32 v4, -v4, v9, v10
	; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(NEXT) \| instid1(VALU_DEP_2)
	; GFX11-IEEE-NEXT: v_fma_f32 v5, -v5, v11, v8
	; GFX11-IEEE-NEXT: v_div_fmas_f32 v4, v4, v6, v9
	; GFX11-IEEE-NEXT: s_mov_b32 vcc_lo, s0
	; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_2) \| instskip(NEXT) \| instid1(VALU_DEP_2)
	; GFX11-IEEE-NEXT: v_div_fmas_f32 v5, v5, v7, v11
	; GFX11-IEEE-NEXT: v_div_fixup_f32 v0, v4, v2, v0
	; GFX11-IEEE-NEXT: s_delay_alu instid0(VALU_DEP_2)
	; GFX11-IEEE-NEXT: v_div_fixup_f32 v1, v5, v3, v1
	; GFX11-IEEE-NEXT: s_setpc_b64 s[30:31]			; GFX11-IEEE-NEXT: s_setpc_b64 s[30:31]
	;			;
	; GFX11-FLUSH-LABEL: v_fdiv_v2f32_arcp_ulp25:			; GFX11-FLUSH-LABEL: v_fdiv_v2f32_arcp_ulp25:
	; GFX11-FLUSH: ; %bb.0:			; GFX11-FLUSH: ; %bb.0:
	; GFX11-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; GFX11-FLUSH-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GFX11-FLUSH-NEXT: v_cmp_lt_f32_e64 s0, 0x6f800000, \|v2\|
	; GFX11-FLUSH-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_1) \| instid1(VALU_DEP_1)
	; GFX11-FLUSH-NEXT: v_cndmask_b32_e64 v4, 1.0, 0x2f800000, s0
	; GFX11-FLUSH-NEXT: v_cmp_lt_f32_e64 s0, 0x6f800000, \|v3\|
	; GFX11-FLUSH-NEXT: v_cndmask_b32_e64 v5, 1.0, 0x2f800000, s0
	; GFX11-FLUSH-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(NEXT) \| instid1(VALU_DEP_1)
	; GFX11-FLUSH-NEXT: v_dual_mul_f32 v2, v2, v4 :: v_dual_mul_f32 v3, v3, v5
	; GFX11-FLUSH-NEXT: v_rcp_f32_e32 v2, v2			; GFX11-FLUSH-NEXT: v_rcp_f32_e32 v2, v2
	; GFX11-FLUSH-NEXT: s_delay_alu instid0(VALU_DEP_1) \| instskip(SKIP_2) \| instid1(VALU_DEP_1)
	; GFX11-FLUSH-NEXT: v_rcp_f32_e32 v3, v3			; GFX11-FLUSH-NEXT: v_rcp_f32_e32 v3, v3
	; GFX11-FLUSH-NEXT: s_waitcnt_depctr 0xfff			; GFX11-FLUSH-NEXT: s_waitcnt_depctr 0xfff
	; GFX11-FLUSH-NEXT: v_dual_mul_f32 v0, v0, v2 :: v_dual_mul_f32 v1, v1, v3			; GFX11-FLUSH-NEXT: v_dual_mul_f32 v0, v0, v2 :: v_dual_mul_f32 v1, v1, v3
	; GFX11-FLUSH-NEXT: v_dual_mul_f32 v0, v4, v0 :: v_dual_mul_f32 v1, v5, v1
	; GFX11-FLUSH-NEXT: s_setpc_b64 s[30:31]			; GFX11-FLUSH-NEXT: s_setpc_b64 s[30:31]
	%fdiv = fdiv arcp <2 x float> %a, %b, !fpmath !0			%fdiv = fdiv arcp <2 x float> %a, %b, !fpmath !0
	ret <2 x float> %fdiv			ret <2 x float> %fdiv
	}			}

	define <2 x float> @v_fdiv_v2f32_arcp_afn_ulp25(<2 x float> %a, <2 x float> %b) {			define <2 x float> @v_fdiv_v2f32_arcp_afn_ulp25(<2 x float> %a, <2 x float> %b) {
	; GCN-LABEL: v_fdiv_v2f32_arcp_afn_ulp25:			; GCN-LABEL: v_fdiv_v2f32_arcp_afn_ulp25:
	; GCN: ; %bb.0:			; GCN: ; %bb.0:
	Show All 22 Lines
	; GFX11-NEXT: v_dual_mul_f32 v0, v0, v2 :: v_dual_mul_f32 v1, v1, v3			; GFX11-NEXT: v_dual_mul_f32 v0, v0, v2 :: v_dual_mul_f32 v1, v1, v3
	; GFX11-NEXT: s_setpc_b64 s[30:31]			; GFX11-NEXT: s_setpc_b64 s[30:31]
	%fdiv = fdiv afn arcp <2 x float> %a, %b, !fpmath !0			%fdiv = fdiv afn arcp <2 x float> %a, %b, !fpmath !0
	ret <2 x float> %fdiv			ret <2 x float> %fdiv
	}			}

	!0 = !{float 2.500000e+00}			!0 = !{float 2.500000e+00}
	;; NOTE: These prefixes are unused and the list is autogenerated. Do not add tests below this line:			;; NOTE: These prefixes are unused and the list is autogenerated. Do not add tests below this line:
				; GCN-IEEE: {{.*}}
	; GFX6-FLUSH: {{.*}}			; GFX6-FLUSH: {{.*}}
	; GFX6-IEEE: {{.*}}

llvm/test/CodeGen/AMDGPU/amdgpu-codegenprepare-fdiv.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show All 16 Lines
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
%md.25ulp = fdiv float %a, %b, !fpmath !0		%md.25ulp = fdiv float %a, %b, !fpmath !0
store volatile float %md.25ulp, ptr addrspace(1) %out, align 4		store volatile float %md.25ulp, ptr addrspace(1) %out, align 4
ret void		ret void
}		}

define amdgpu_kernel void @fdiv_fpmath_f32(ptr addrspace(1) %out, float %a, float %b) {		define amdgpu_kernel void @fdiv_fpmath_f32(ptr addrspace(1) %out, float %a, float %b) {
; IEEE-LABEL: define amdgpu_kernel void @fdiv_fpmath_f32		; IEEE-GOODFREXP-LABEL: define amdgpu_kernel void @fdiv_fpmath_f32
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float [[A:%.]], float [[B:%.*]]) #[[ATTR1:[0-9]+]] {		; IEEE-GOODFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[A:%.]], float [[B:%.*]]) #[[ATTR1:[0-9]+]] {
; IEEE-NEXT: [[NO_MD:%.*]] = fdiv float [[A]], [[B]]		; IEEE-GOODFREXP-NEXT: [[NO_MD:%.*]] = fdiv float [[A]], [[B]]
; IEEE-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[MD_HALF_ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !1		; IEEE-GOODFREXP-NEXT: [[MD_HALF_ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !1
; IEEE-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[MD_1ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[MD_1ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !2
; IEEE-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[MD_25ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !0		; IEEE-GOODFREXP-NEXT: [[MD_25ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !0
; IEEE-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[MD_3ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !3		; IEEE-GOODFREXP-NEXT: [[MD_3ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !3
; IEEE-NEXT: store volatile float [[MD_3ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_3ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[TMP1:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[B]])		; IEEE-GOODFREXP-NEXT: [[FAST_MD_25ULP:%.*]] = fdiv fast float [[A]], [[B]], !fpmath !0
; IEEE-NEXT: [[FAST_MD_25ULP:%.*]] = fmul fast float [[A]], [[TMP1]]		; IEEE-GOODFREXP-NEXT: store volatile float [[FAST_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: store volatile float [[FAST_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[AFN_MD_25ULP:%.*]] = fdiv afn float [[A]], [[B]], !fpmath !0
; IEEE-NEXT: [[TMP2:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[B]])		; IEEE-GOODFREXP-NEXT: store volatile float [[AFN_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[AFN_MD_25ULP:%.*]] = fmul afn float [[A]], [[TMP2]]		; IEEE-GOODFREXP-NEXT: [[NO_MD_ARCP:%.*]] = fdiv arcp float [[A]], [[B]]
; IEEE-NEXT: store volatile float [[AFN_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[NO_MD_ARCP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[NO_MD_ARCP:%.*]] = fdiv arcp float [[A]], [[B]]		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[B]])
; IEEE-NEXT: store volatile float [[NO_MD_ARCP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
; IEEE-NEXT: [[ARCP_MD_25ULP:%.*]] = fdiv arcp float [[A]], [[B]], !fpmath !0		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP1]], 1
; IEEE-NEXT: store volatile float [[ARCP_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
; IEEE-NEXT: [[ARCP_MD_1ULP:%.*]] = fdiv arcp float [[A]], [[B]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP2]])
; IEEE-NEXT: store volatile float [[ARCP_MD_1ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
; IEEE-NEXT: ret void		; IEEE-GOODFREXP-NEXT: [[ARCP_MD_25ULP:%.*]] = fmul arcp float [[A]], [[TMP6]]
		; IEEE-GOODFREXP-NEXT: store volatile float [[ARCP_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: [[TMP7:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[B]])
		; IEEE-GOODFREXP-NEXT: [[TMP8:%.*]] = extractvalue { float, i32 } [[TMP7]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP9:%.*]] = extractvalue { float, i32 } [[TMP7]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP10:%.*]] = sub i32 0, [[TMP9]]
		; IEEE-GOODFREXP-NEXT: [[TMP11:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP8]])
		; IEEE-GOODFREXP-NEXT: [[TMP12:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP11]], i32 [[TMP10]])
		; IEEE-GOODFREXP-NEXT: [[ARCP_MD_1ULP:%.*]] = fmul arcp float [[A]], [[TMP12]]
		; IEEE-GOODFREXP-NEXT: store volatile float [[ARCP_MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: ret void
		;
		; IEEE-BADFREXP-LABEL: define amdgpu_kernel void @fdiv_fpmath_f32
		; IEEE-BADFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[A:%.]], float [[B:%.*]]) #[[ATTR1:[0-9]+]] {
		; IEEE-BADFREXP-NEXT: [[NO_MD:%.*]] = fdiv float [[A]], [[B]]
		; IEEE-BADFREXP-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[MD_HALF_ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !1
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[MD_1ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !2
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[MD_25ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !0
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[MD_3ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !3
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_3ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[FAST_MD_25ULP:%.*]] = fdiv fast float [[A]], [[B]], !fpmath !0
		; IEEE-BADFREXP-NEXT: store volatile float [[FAST_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[AFN_MD_25ULP:%.*]] = fdiv afn float [[A]], [[B]], !fpmath !0
		; IEEE-BADFREXP-NEXT: store volatile float [[AFN_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[NO_MD_ARCP:%.*]] = fdiv arcp float [[A]], [[B]]
		; IEEE-BADFREXP-NEXT: store volatile float [[NO_MD_ARCP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[B]])
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[B]])
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-BADFREXP-NEXT: [[ARCP_MD_25ULP:%.*]] = fmul arcp float [[A]], [[TMP6]]
		; IEEE-BADFREXP-NEXT: store volatile float [[ARCP_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP7:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[B]])
		; IEEE-BADFREXP-NEXT: [[TMP8:%.*]] = extractvalue { float, i32 } [[TMP7]], 0
		; IEEE-BADFREXP-NEXT: [[TMP9:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[B]])
		; IEEE-BADFREXP-NEXT: [[TMP10:%.*]] = sub i32 0, [[TMP9]]
		; IEEE-BADFREXP-NEXT: [[TMP11:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP8]])
		; IEEE-BADFREXP-NEXT: [[TMP12:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP11]], i32 [[TMP10]])
		; IEEE-BADFREXP-NEXT: [[ARCP_MD_1ULP:%.*]] = fmul arcp float [[A]], [[TMP12]]
		; IEEE-BADFREXP-NEXT: store volatile float [[ARCP_MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @fdiv_fpmath_f32		; DAZ-LABEL: define amdgpu_kernel void @fdiv_fpmath_f32
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[A:%.]], float [[B:%.*]]) #[[ATTR1:[0-9]+]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[A:%.]], float [[B:%.*]]) #[[ATTR1:[0-9]+]] {
; DAZ-NEXT: [[NO_MD:%.*]] = fdiv float [[A]], [[B]]		; DAZ-NEXT: [[NO_MD:%.*]] = fdiv float [[A]], [[B]]
; DAZ-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[MD_HALF_ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !1		; DAZ-NEXT: [[MD_HALF_ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !1
; DAZ-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[MD_1ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !2		; DAZ-NEXT: [[MD_1ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !2
; DAZ-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[MD_25ULP:%.*]] = call float @llvm.amdgcn.fdiv.fast(float [[A]], float [[B]])		; DAZ-NEXT: [[MD_25ULP:%.*]] = call float @llvm.amdgcn.fdiv.fast(float [[A]], float [[B]])
; DAZ-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[MD_3ULP:%.*]] = call float @llvm.amdgcn.fdiv.fast(float [[A]], float [[B]])		; DAZ-NEXT: [[MD_3ULP:%.*]] = call float @llvm.amdgcn.fdiv.fast(float [[A]], float [[B]])
; DAZ-NEXT: store volatile float [[MD_3ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_3ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[TMP1:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[B]])		; DAZ-NEXT: [[FAST_MD_25ULP:%.*]] = fdiv fast float [[A]], [[B]], !fpmath !0
; DAZ-NEXT: [[FAST_MD_25ULP:%.*]] = fmul fast float [[A]], [[TMP1]]
; DAZ-NEXT: store volatile float [[FAST_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FAST_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[TMP2:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[B]])		; DAZ-NEXT: [[AFN_MD_25ULP:%.*]] = fdiv afn float [[A]], [[B]], !fpmath !0
; DAZ-NEXT: [[AFN_MD_25ULP:%.*]] = fmul afn float [[A]], [[TMP2]]
; DAZ-NEXT: store volatile float [[AFN_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[AFN_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[NO_MD_ARCP:%.*]] = fdiv arcp float [[A]], [[B]]		; DAZ-NEXT: [[NO_MD_ARCP:%.*]] = fdiv arcp float [[A]], [[B]]
; DAZ-NEXT: store volatile float [[NO_MD_ARCP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[NO_MD_ARCP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[ARCP_MD_25ULP:%.*]] = call arcp float @llvm.amdgcn.fdiv.fast(float [[A]], float [[B]])		; DAZ-NEXT: [[TMP1:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[B]])
		; DAZ-NEXT: [[ARCP_MD_25ULP:%.*]] = fmul arcp float [[A]], [[TMP1]]
; DAZ-NEXT: store volatile float [[ARCP_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[ARCP_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[ARCP_MD_1ULP:%.*]] = fdiv arcp float [[A]], [[B]], !fpmath !2		; DAZ-NEXT: [[TMP2:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[B]])
		; DAZ-NEXT: [[ARCP_MD_1ULP:%.*]] = fmul arcp float [[A]], [[TMP2]]
; DAZ-NEXT: store volatile float [[ARCP_MD_1ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[ARCP_MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: ret void		; DAZ-NEXT: ret void
;		;
%no.md = fdiv float %a, %b		%no.md = fdiv float %a, %b
store volatile float %no.md, ptr addrspace(1) %out, align 4		store volatile float %no.md, ptr addrspace(1) %out, align 4
%md.half.ulp = fdiv float %a, %b, !fpmath !1		%md.half.ulp = fdiv float %a, %b, !fpmath !1
store volatile float %md.half.ulp, ptr addrspace(1) %out, align 4		store volatile float %md.half.ulp, ptr addrspace(1) %out, align 4
%md.1ulp = fdiv float %a, %b, !fpmath !2		%md.1ulp = fdiv float %a, %b, !fpmath !2
Show All 12 Lines	;
store volatile float %arcp.md.25ulp, ptr addrspace(1) %out, align 4		store volatile float %arcp.md.25ulp, ptr addrspace(1) %out, align 4
%arcp.md.1ulp = fdiv arcp float %a, %b, !fpmath !2		%arcp.md.1ulp = fdiv arcp float %a, %b, !fpmath !2
store volatile float %arcp.md.1ulp, ptr addrspace(1) %out, align 4		store volatile float %arcp.md.1ulp, ptr addrspace(1) %out, align 4
ret void		ret void
}		}

define amdgpu_kernel void @fdiv_fpmath_f32_flags(ptr addrspace(1) %out, float %a, float %b) {		define amdgpu_kernel void @fdiv_fpmath_f32_flags(ptr addrspace(1) %out, float %a, float %b) {
; IEEE-LABEL: define amdgpu_kernel void @fdiv_fpmath_f32_flags		; IEEE-LABEL: define amdgpu_kernel void @fdiv_fpmath_f32_flags
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float [[A:%.]], float [[B:%.*]]) #[[ATTR1]] {		; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float [[A:%.]], float [[B:%.*]]) #[[ATTR1:[0-9]+]] {
; IEEE-NEXT: [[MD_1ULP_NINF_NNAN:%.*]] = fdiv nnan ninf float [[A]], [[B]], !fpmath !2		; IEEE-NEXT: [[MD_1ULP_NINF_NNAN:%.*]] = fdiv nnan ninf float [[A]], [[B]], !fpmath !2
; IEEE-NEXT: store volatile float [[MD_1ULP_NINF_NNAN]], ptr addrspace(1) [[OUT]], align 4		; IEEE-NEXT: store volatile float [[MD_1ULP_NINF_NNAN]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[MD_25ULP_NINF_NNAN:%.*]] = fdiv nnan ninf float [[A]], [[B]], !fpmath !0		; IEEE-NEXT: [[MD_25ULP_NINF_NNAN:%.*]] = fdiv nnan ninf float [[A]], [[B]], !fpmath !0
; IEEE-NEXT: store volatile float [[MD_25ULP_NINF_NNAN]], ptr addrspace(1) [[OUT]], align 4		; IEEE-NEXT: store volatile float [[MD_25ULP_NINF_NNAN]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[MD_1ULP_NINF:%.*]] = fdiv ninf float [[A]], [[B]], !fpmath !2		; IEEE-NEXT: [[MD_1ULP_NINF:%.*]] = fdiv ninf float [[A]], [[B]], !fpmath !2
; IEEE-NEXT: store volatile float [[MD_1ULP_NINF]], ptr addrspace(1) [[OUT]], align 4		; IEEE-NEXT: store volatile float [[MD_1ULP_NINF]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[MD_25ULP_NINF:%.*]] = fdiv ninf float [[A]], [[B]], !fpmath !0		; IEEE-NEXT: [[MD_25ULP_NINF:%.*]] = fdiv ninf float [[A]], [[B]], !fpmath !0
; IEEE-NEXT: store volatile float [[MD_25ULP_NINF]], ptr addrspace(1) [[OUT]], align 4		; IEEE-NEXT: store volatile float [[MD_25ULP_NINF]], ptr addrspace(1) [[OUT]], align 4
Show All 36 Lines	;

%md.25ulp.nnan = fdiv nnan float %a, %b, !fpmath !0		%md.25ulp.nnan = fdiv nnan float %a, %b, !fpmath !0
store volatile float %md.25ulp.nnan, ptr addrspace(1) %out, align 4		store volatile float %md.25ulp.nnan, ptr addrspace(1) %out, align 4

ret void		ret void
}		}

define amdgpu_kernel void @rcp_fdiv_f32_fpmath(ptr addrspace(1) %out, float %x) {		define amdgpu_kernel void @rcp_fdiv_f32_fpmath(ptr addrspace(1) %out, float %x) {
; IEEE-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_fpmath		; IEEE-GOODFREXP-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_fpmath
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {
; IEEE-NEXT: [[NO_MD:%.*]] = fdiv float 1.000000e+00, [[X]]		; IEEE-GOODFREXP-NEXT: [[NO_MD:%.*]] = fdiv float 1.000000e+00, [[X]]
; IEEE-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[MD_1ULP:%.*]] = fdiv float 1.000000e+00, [[X]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[X]])
; IEEE-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
; IEEE-NEXT: [[MD_25ULP:%.*]] = call float @llvm.amdgcn.fdiv.fast(float 1.000000e+00, float [[X]])		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP1]], 1
; IEEE-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
; IEEE-NEXT: [[MD_HALF_ULP:%.*]] = fdiv float 1.000000e+00, [[X]], !fpmath !1		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP2]])
; IEEE-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[MD_1ULP:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
; IEEE-NEXT: [[AFN_NO_MD:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[X]])		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: store volatile float [[AFN_NO_MD]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[X]])
; IEEE-NEXT: [[AFN_25ULP:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[X]])		; IEEE-GOODFREXP-NEXT: [[TMP7:%.*]] = extractvalue { float, i32 } [[TMP6]], 0
; IEEE-NEXT: store volatile float [[AFN_25ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP8:%.*]] = extractvalue { float, i32 } [[TMP6]], 1
; IEEE-NEXT: [[FAST_NO_MD:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[X]])		; IEEE-GOODFREXP-NEXT: [[TMP9:%.*]] = sub i32 0, [[TMP8]]
; IEEE-NEXT: store volatile float [[FAST_NO_MD]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP10:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP7]])
; IEEE-NEXT: [[FAST_25ULP:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[X]])		; IEEE-GOODFREXP-NEXT: [[MD_25ULP:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP10]], i32 [[TMP9]])
; IEEE-NEXT: store volatile float [[FAST_25ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[NEG_MD_1ULP:%.*]] = fdiv float -1.000000e+00, [[X]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[MD_HALF_ULP:%.*]] = fdiv float 1.000000e+00, [[X]], !fpmath !1
; IEEE-NEXT: store volatile float [[NEG_MD_1ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[NEG_MD_25ULP:%.*]] = call float @llvm.amdgcn.fdiv.fast(float -1.000000e+00, float [[X]])		; IEEE-GOODFREXP-NEXT: [[AFN_NO_MD:%.*]] = fdiv afn float 1.000000e+00, [[X]]
; IEEE-NEXT: store volatile float [[NEG_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[AFN_NO_MD]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[TMP1:%.*]] = fneg afn float [[X]]		; IEEE-GOODFREXP-NEXT: [[AFN_25ULP:%.*]] = fdiv afn float 1.000000e+00, [[X]], !fpmath !0
; IEEE-NEXT: [[NEG_AFN_NO_MD:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[TMP1]])		; IEEE-GOODFREXP-NEXT: store volatile float [[AFN_25ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: store volatile float [[NEG_AFN_NO_MD]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[FAST_NO_MD:%.*]] = fdiv fast float 1.000000e+00, [[X]]
; IEEE-NEXT: [[TMP2:%.*]] = fneg afn float [[X]]		; IEEE-GOODFREXP-NEXT: store volatile float [[FAST_NO_MD]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[NEG_AFN_25ULP:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[TMP2]])		; IEEE-GOODFREXP-NEXT: [[FAST_25ULP:%.*]] = fdiv fast float 1.000000e+00, [[X]], !fpmath !0
; IEEE-NEXT: store volatile float [[NEG_AFN_25ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[FAST_25ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[TMP3:%.*]] = fneg fast float [[X]]		; IEEE-GOODFREXP-NEXT: [[TMP11:%.*]] = fneg float [[X]]
; IEEE-NEXT: [[NEG_FAST_NO_MD:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[TMP3]])		; IEEE-GOODFREXP-NEXT: [[TMP12:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP11]])
; IEEE-NEXT: store volatile float [[NEG_FAST_NO_MD]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP13:%.*]] = extractvalue { float, i32 } [[TMP12]], 0
; IEEE-NEXT: ret void		; IEEE-GOODFREXP-NEXT: [[TMP14:%.*]] = extractvalue { float, i32 } [[TMP12]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP15:%.*]] = sub i32 0, [[TMP14]]
		; IEEE-GOODFREXP-NEXT: [[TMP16:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP13]])
		; IEEE-GOODFREXP-NEXT: [[NEG_MD_1ULP:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP16]], i32 [[TMP15]])
		; IEEE-GOODFREXP-NEXT: store volatile float [[NEG_MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: [[TMP17:%.*]] = fneg float [[X]]
		; IEEE-GOODFREXP-NEXT: [[TMP18:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP17]])
		; IEEE-GOODFREXP-NEXT: [[TMP19:%.*]] = extractvalue { float, i32 } [[TMP18]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP20:%.*]] = extractvalue { float, i32 } [[TMP18]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP21:%.*]] = sub i32 0, [[TMP20]]
		; IEEE-GOODFREXP-NEXT: [[TMP22:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP19]])
		; IEEE-GOODFREXP-NEXT: [[NEG_MD_25ULP:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP22]], i32 [[TMP21]])
		; IEEE-GOODFREXP-NEXT: store volatile float [[NEG_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: [[NEG_AFN_NO_MD:%.*]] = fdiv afn float -1.000000e+00, [[X]]
		; IEEE-GOODFREXP-NEXT: store volatile float [[NEG_AFN_NO_MD]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: [[NEG_AFN_25ULP:%.*]] = fdiv afn float -1.000000e+00, [[X]], !fpmath !0
		; IEEE-GOODFREXP-NEXT: store volatile float [[NEG_AFN_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: [[NEG_FAST_NO_MD:%.*]] = fdiv fast float -1.000000e+00, [[X]]
		; IEEE-GOODFREXP-NEXT: store volatile float [[NEG_FAST_NO_MD]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: ret void
		;
		; IEEE-BADFREXP-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_fpmath
		; IEEE-BADFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[NO_MD:%.*]] = fdiv float 1.000000e+00, [[X]]
		; IEEE-BADFREXP-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[X]])
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[X]])
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[MD_1ULP:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[X]])
		; IEEE-BADFREXP-NEXT: [[TMP7:%.*]] = extractvalue { float, i32 } [[TMP6]], 0
		; IEEE-BADFREXP-NEXT: [[TMP8:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[X]])
		; IEEE-BADFREXP-NEXT: [[TMP9:%.*]] = sub i32 0, [[TMP8]]
		; IEEE-BADFREXP-NEXT: [[TMP10:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP7]])
		; IEEE-BADFREXP-NEXT: [[MD_25ULP:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP10]], i32 [[TMP9]])
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[MD_HALF_ULP:%.*]] = fdiv float 1.000000e+00, [[X]], !fpmath !1
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[AFN_NO_MD:%.*]] = fdiv afn float 1.000000e+00, [[X]]
		; IEEE-BADFREXP-NEXT: store volatile float [[AFN_NO_MD]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[AFN_25ULP:%.*]] = fdiv afn float 1.000000e+00, [[X]], !fpmath !0
		; IEEE-BADFREXP-NEXT: store volatile float [[AFN_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[FAST_NO_MD:%.*]] = fdiv fast float 1.000000e+00, [[X]]
		; IEEE-BADFREXP-NEXT: store volatile float [[FAST_NO_MD]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[FAST_25ULP:%.*]] = fdiv fast float 1.000000e+00, [[X]], !fpmath !0
		; IEEE-BADFREXP-NEXT: store volatile float [[FAST_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP11:%.*]] = fneg float [[X]]
		; IEEE-BADFREXP-NEXT: [[TMP12:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP11]])
		; IEEE-BADFREXP-NEXT: [[TMP13:%.*]] = extractvalue { float, i32 } [[TMP12]], 0
		; IEEE-BADFREXP-NEXT: [[TMP14:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP11]])
		; IEEE-BADFREXP-NEXT: [[TMP15:%.*]] = sub i32 0, [[TMP14]]
		; IEEE-BADFREXP-NEXT: [[TMP16:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP13]])
		; IEEE-BADFREXP-NEXT: [[NEG_MD_1ULP:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP16]], i32 [[TMP15]])
		; IEEE-BADFREXP-NEXT: store volatile float [[NEG_MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP17:%.*]] = fneg float [[X]]
		; IEEE-BADFREXP-NEXT: [[TMP18:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP17]])
		; IEEE-BADFREXP-NEXT: [[TMP19:%.*]] = extractvalue { float, i32 } [[TMP18]], 0
		; IEEE-BADFREXP-NEXT: [[TMP20:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP17]])
		; IEEE-BADFREXP-NEXT: [[TMP21:%.*]] = sub i32 0, [[TMP20]]
		; IEEE-BADFREXP-NEXT: [[TMP22:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP19]])
		; IEEE-BADFREXP-NEXT: [[NEG_MD_25ULP:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP22]], i32 [[TMP21]])
		; IEEE-BADFREXP-NEXT: store volatile float [[NEG_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[NEG_AFN_NO_MD:%.*]] = fdiv afn float -1.000000e+00, [[X]]
		; IEEE-BADFREXP-NEXT: store volatile float [[NEG_AFN_NO_MD]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[NEG_AFN_25ULP:%.*]] = fdiv afn float -1.000000e+00, [[X]], !fpmath !0
		; IEEE-BADFREXP-NEXT: store volatile float [[NEG_AFN_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[NEG_FAST_NO_MD:%.*]] = fdiv fast float -1.000000e+00, [[X]]
		; IEEE-BADFREXP-NEXT: store volatile float [[NEG_FAST_NO_MD]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_fpmath		; DAZ-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_fpmath
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {
; DAZ-NEXT: [[NO_MD:%.*]] = fdiv float 1.000000e+00, [[X]]		; DAZ-NEXT: [[NO_MD:%.*]] = fdiv float 1.000000e+00, [[X]]
; DAZ-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[MD_1ULP:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[X]])		; DAZ-NEXT: [[MD_1ULP:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[X]])
; DAZ-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[MD_25ULP:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[X]])		; DAZ-NEXT: [[MD_25ULP:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[X]])
; DAZ-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[MD_HALF_ULP:%.*]] = fdiv float 1.000000e+00, [[X]], !fpmath !1		; DAZ-NEXT: [[MD_HALF_ULP:%.*]] = fdiv float 1.000000e+00, [[X]], !fpmath !1
; DAZ-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[AFN_NO_MD:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[X]])		; DAZ-NEXT: [[AFN_NO_MD:%.*]] = fdiv afn float 1.000000e+00, [[X]]
; DAZ-NEXT: store volatile float [[AFN_NO_MD]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[AFN_NO_MD]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[AFN_25ULP:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[X]])		; DAZ-NEXT: [[AFN_25ULP:%.*]] = fdiv afn float 1.000000e+00, [[X]], !fpmath !0
; DAZ-NEXT: store volatile float [[AFN_25ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[AFN_25ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[FAST_NO_MD:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[X]])		; DAZ-NEXT: [[FAST_NO_MD:%.*]] = fdiv fast float 1.000000e+00, [[X]]
; DAZ-NEXT: store volatile float [[FAST_NO_MD]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FAST_NO_MD]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[FAST_25ULP:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[X]])		; DAZ-NEXT: [[FAST_25ULP:%.*]] = fdiv fast float 1.000000e+00, [[X]], !fpmath !0
; DAZ-NEXT: store volatile float [[FAST_25ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FAST_25ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[TMP1:%.*]] = fneg float [[X]]		; DAZ-NEXT: [[TMP1:%.*]] = fneg float [[X]]
; DAZ-NEXT: [[NEG_MD_1ULP:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP1]])		; DAZ-NEXT: [[NEG_MD_1ULP:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP1]])
; DAZ-NEXT: store volatile float [[NEG_MD_1ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[NEG_MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[TMP2:%.*]] = fneg float [[X]]		; DAZ-NEXT: [[TMP2:%.*]] = fneg float [[X]]
; DAZ-NEXT: [[NEG_MD_25ULP:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP2]])		; DAZ-NEXT: [[NEG_MD_25ULP:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP2]])
; DAZ-NEXT: store volatile float [[NEG_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[NEG_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[TMP3:%.*]] = fneg afn float [[X]]		; DAZ-NEXT: [[NEG_AFN_NO_MD:%.*]] = fdiv afn float -1.000000e+00, [[X]]
; DAZ-NEXT: [[NEG_AFN_NO_MD:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[TMP3]])
; DAZ-NEXT: store volatile float [[NEG_AFN_NO_MD]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[NEG_AFN_NO_MD]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[TMP4:%.*]] = fneg afn float [[X]]		; DAZ-NEXT: [[NEG_AFN_25ULP:%.*]] = fdiv afn float -1.000000e+00, [[X]], !fpmath !0
; DAZ-NEXT: [[NEG_AFN_25ULP:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[TMP4]])
; DAZ-NEXT: store volatile float [[NEG_AFN_25ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[NEG_AFN_25ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[TMP5:%.*]] = fneg fast float [[X]]		; DAZ-NEXT: [[NEG_FAST_NO_MD:%.*]] = fdiv fast float -1.000000e+00, [[X]]
; DAZ-NEXT: [[NEG_FAST_NO_MD:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[TMP5]])
; DAZ-NEXT: store volatile float [[NEG_FAST_NO_MD]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[NEG_FAST_NO_MD]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: ret void		; DAZ-NEXT: ret void
;		;
%no.md = fdiv float 1.000000e+00, %x		%no.md = fdiv float 1.000000e+00, %x
store volatile float %no.md, ptr addrspace(1) %out, align 4		store volatile float %no.md, ptr addrspace(1) %out, align 4
%md.1ulp = fdiv float 1.000000e+00, %x, !fpmath !2		%md.1ulp = fdiv float 1.000000e+00, %x, !fpmath !2
store volatile float %md.1ulp, ptr addrspace(1) %out, align 4		store volatile float %md.1ulp, ptr addrspace(1) %out, align 4
%md.25ulp = fdiv float 1.000000e+00, %x, !fpmath !0		%md.25ulp = fdiv float 1.000000e+00, %x, !fpmath !0
Show All 17 Lines	;
%neg.afn.25ulp = fdiv afn float -1.000000e+00, %x, !fpmath !0		%neg.afn.25ulp = fdiv afn float -1.000000e+00, %x, !fpmath !0
store volatile float %neg.afn.25ulp, ptr addrspace(1) %out, align 4		store volatile float %neg.afn.25ulp, ptr addrspace(1) %out, align 4
%neg.fast.no.md = fdiv fast float -1.000000e+00, %x		%neg.fast.no.md = fdiv fast float -1.000000e+00, %x
store volatile float %neg.fast.no.md, ptr addrspace(1) %out, align 4		store volatile float %neg.fast.no.md, ptr addrspace(1) %out, align 4
ret void		ret void
}		}

define amdgpu_kernel void @rcp_fdiv_f32_fpmath_flags(ptr addrspace(1) %out, float %x) {		define amdgpu_kernel void @rcp_fdiv_f32_fpmath_flags(ptr addrspace(1) %out, float %x) {
; IEEE-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_fpmath_flags		; IEEE-GOODFREXP-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_fpmath_flags
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {
; IEEE-NEXT: [[MD_1ULP_NINF_NNAN:%.*]] = fdiv nnan ninf float 1.000000e+00, [[X]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[X]])
; IEEE-NEXT: store volatile float [[MD_1ULP_NINF_NNAN]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
; IEEE-NEXT: [[MD_1ULP_NINF:%.*]] = fdiv ninf float 1.000000e+00, [[X]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP1]], 1
; IEEE-NEXT: store volatile float [[MD_1ULP_NINF]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
; IEEE-NEXT: [[MD_1ULP_NNAN:%.*]] = fdiv nnan float 1.000000e+00, [[X]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = call nnan ninf float @llvm.amdgcn.rcp.f32(float [[TMP2]])
; IEEE-NEXT: store volatile float [[MD_1ULP_NNAN]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[MD_1ULP_NINF_NNAN:%.*]] = call nnan ninf float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
; IEEE-NEXT: [[MD_1ULP_NSZ:%.*]] = fdiv nsz float 1.000000e+00, [[X]], !fpmath !2		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_1ULP_NINF_NNAN]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: store volatile float [[MD_1ULP_NSZ]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[X]])
; IEEE-NEXT: ret void		; IEEE-GOODFREXP-NEXT: [[TMP7:%.*]] = extractvalue { float, i32 } [[TMP6]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP8:%.*]] = extractvalue { float, i32 } [[TMP6]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP9:%.*]] = sub i32 0, [[TMP8]]
		; IEEE-GOODFREXP-NEXT: [[TMP10:%.*]] = call ninf float @llvm.amdgcn.rcp.f32(float [[TMP7]])
		; IEEE-GOODFREXP-NEXT: [[MD_1ULP_NINF:%.*]] = call ninf float @llvm.ldexp.f32.i32(float [[TMP10]], i32 [[TMP9]])
		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_1ULP_NINF]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: [[TMP11:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[X]])
		; IEEE-GOODFREXP-NEXT: [[TMP12:%.*]] = extractvalue { float, i32 } [[TMP11]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP13:%.*]] = extractvalue { float, i32 } [[TMP11]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP14:%.*]] = sub i32 0, [[TMP13]]
		; IEEE-GOODFREXP-NEXT: [[TMP15:%.*]] = call nnan float @llvm.amdgcn.rcp.f32(float [[TMP12]])
		; IEEE-GOODFREXP-NEXT: [[MD_1ULP_NNAN:%.*]] = call nnan float @llvm.ldexp.f32.i32(float [[TMP15]], i32 [[TMP14]])
		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_1ULP_NNAN]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: [[TMP16:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[X]])
		; IEEE-GOODFREXP-NEXT: [[TMP17:%.*]] = extractvalue { float, i32 } [[TMP16]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP18:%.*]] = extractvalue { float, i32 } [[TMP16]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP19:%.*]] = sub i32 0, [[TMP18]]
		; IEEE-GOODFREXP-NEXT: [[TMP20:%.*]] = call nsz float @llvm.amdgcn.rcp.f32(float [[TMP17]])
		; IEEE-GOODFREXP-NEXT: [[MD_1ULP_NSZ:%.*]] = call nsz float @llvm.ldexp.f32.i32(float [[TMP20]], i32 [[TMP19]])
		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_1ULP_NSZ]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: ret void
		;
		; IEEE-BADFREXP-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_fpmath_flags
		; IEEE-BADFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[X]])
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[X]])
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call nnan ninf float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[MD_1ULP_NINF_NNAN:%.*]] = call nnan ninf float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_1ULP_NINF_NNAN]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[X]])
		; IEEE-BADFREXP-NEXT: [[TMP7:%.*]] = extractvalue { float, i32 } [[TMP6]], 0
		; IEEE-BADFREXP-NEXT: [[TMP8:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[X]])
		; IEEE-BADFREXP-NEXT: [[TMP9:%.*]] = sub i32 0, [[TMP8]]
		; IEEE-BADFREXP-NEXT: [[TMP10:%.*]] = call ninf float @llvm.amdgcn.rcp.f32(float [[TMP7]])
		; IEEE-BADFREXP-NEXT: [[MD_1ULP_NINF:%.*]] = call ninf float @llvm.ldexp.f32.i32(float [[TMP10]], i32 [[TMP9]])
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_1ULP_NINF]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP11:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[X]])
		; IEEE-BADFREXP-NEXT: [[TMP12:%.*]] = extractvalue { float, i32 } [[TMP11]], 0
		; IEEE-BADFREXP-NEXT: [[TMP13:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[X]])
		; IEEE-BADFREXP-NEXT: [[TMP14:%.*]] = sub i32 0, [[TMP13]]
		; IEEE-BADFREXP-NEXT: [[TMP15:%.*]] = call nnan float @llvm.amdgcn.rcp.f32(float [[TMP12]])
		; IEEE-BADFREXP-NEXT: [[MD_1ULP_NNAN:%.*]] = call nnan float @llvm.ldexp.f32.i32(float [[TMP15]], i32 [[TMP14]])
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_1ULP_NNAN]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP16:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[X]])
		; IEEE-BADFREXP-NEXT: [[TMP17:%.*]] = extractvalue { float, i32 } [[TMP16]], 0
		; IEEE-BADFREXP-NEXT: [[TMP18:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[X]])
		; IEEE-BADFREXP-NEXT: [[TMP19:%.*]] = sub i32 0, [[TMP18]]
		; IEEE-BADFREXP-NEXT: [[TMP20:%.*]] = call nsz float @llvm.amdgcn.rcp.f32(float [[TMP17]])
		; IEEE-BADFREXP-NEXT: [[MD_1ULP_NSZ:%.*]] = call nsz float @llvm.ldexp.f32.i32(float [[TMP20]], i32 [[TMP19]])
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_1ULP_NSZ]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_fpmath_flags		; DAZ-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_fpmath_flags
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {
; DAZ-NEXT: [[MD_1ULP_NINF_NNAN:%.*]] = call nnan ninf float @llvm.amdgcn.rcp.f32(float [[X]])		; DAZ-NEXT: [[MD_1ULP_NINF_NNAN:%.*]] = call nnan ninf float @llvm.amdgcn.rcp.f32(float [[X]])
; DAZ-NEXT: store volatile float [[MD_1ULP_NINF_NNAN]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_1ULP_NINF_NNAN]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[MD_1ULP_NINF:%.*]] = call ninf float @llvm.amdgcn.rcp.f32(float [[X]])		; DAZ-NEXT: [[MD_1ULP_NINF:%.*]] = call ninf float @llvm.amdgcn.rcp.f32(float [[X]])
; DAZ-NEXT: store volatile float [[MD_1ULP_NINF]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_1ULP_NINF]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[MD_1ULP_NNAN:%.*]] = call nnan float @llvm.amdgcn.rcp.f32(float [[X]])		; DAZ-NEXT: [[MD_1ULP_NNAN:%.*]] = call nnan float @llvm.amdgcn.rcp.f32(float [[X]])
Show All 13 Lines	;

%md.1ulp.nsz = fdiv nsz float 1.000000e+00, %x, !fpmath !2		%md.1ulp.nsz = fdiv nsz float 1.000000e+00, %x, !fpmath !2
store volatile float %md.1ulp.nsz, ptr addrspace(1) %out, align 4		store volatile float %md.1ulp.nsz, ptr addrspace(1) %out, align 4

ret void		ret void
}		}

define amdgpu_kernel void @rcp_fdiv_f32_knownfinite(ptr addrspace(1) %out,		define amdgpu_kernel void @rcp_fdiv_f32_knownfinite(ptr addrspace(1) %out,
; IEEE-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_knownfinite		; IEEE-GOODFREXP-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_knownfinite
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(nan) [[NO_NAN:%.]], float nofpclass(nan) [[NO_INF:%.]], float nofpclass(nan inf) [[NO_INF_NAN:%.]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(nan) [[NO_NAN:%.]], float nofpclass(nan) [[NO_INF:%.]], float nofpclass(nan inf) [[NO_INF_NAN:%.]]) #[[ATTR1]] {
; IEEE-NEXT: [[MD_1ULP_NO_NAN:%.*]] = fdiv float 1.000000e+00, [[NO_NAN]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[NO_NAN]])
; IEEE-NEXT: store volatile float [[MD_1ULP_NO_NAN]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
; IEEE-NEXT: [[MD_1ULP_NO_INF:%.*]] = fdiv float 1.000000e+00, [[NO_INF]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP1]], 1
; IEEE-NEXT: store volatile float [[MD_1ULP_NO_INF]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
; IEEE-NEXT: [[MD_1ULP_NO_INF_NAN:%.*]] = fdiv float 1.000000e+00, [[NO_INF_NAN]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP2]])
; IEEE-NEXT: store volatile float [[MD_1ULP_NO_INF_NAN]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[MD_1ULP_NO_NAN:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
; IEEE-NEXT: ret void		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_1ULP_NO_NAN]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[NO_INF]])
		; IEEE-GOODFREXP-NEXT: [[TMP7:%.*]] = extractvalue { float, i32 } [[TMP6]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP8:%.*]] = extractvalue { float, i32 } [[TMP6]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP9:%.*]] = sub i32 0, [[TMP8]]
		; IEEE-GOODFREXP-NEXT: [[TMP10:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP7]])
		; IEEE-GOODFREXP-NEXT: [[MD_1ULP_NO_INF:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP10]], i32 [[TMP9]])
		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_1ULP_NO_INF]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: [[TMP11:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[NO_INF_NAN]])
		; IEEE-GOODFREXP-NEXT: [[TMP12:%.*]] = extractvalue { float, i32 } [[TMP11]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP13:%.*]] = extractvalue { float, i32 } [[TMP11]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP14:%.*]] = sub i32 0, [[TMP13]]
		; IEEE-GOODFREXP-NEXT: [[TMP15:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP12]])
		; IEEE-GOODFREXP-NEXT: [[MD_1ULP_NO_INF_NAN:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP15]], i32 [[TMP14]])
		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_1ULP_NO_INF_NAN]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: ret void
		;
		; IEEE-BADFREXP-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_knownfinite
		; IEEE-BADFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(nan) [[NO_NAN:%.]], float nofpclass(nan) [[NO_INF:%.]], float nofpclass(nan inf) [[NO_INF_NAN:%.]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[NO_NAN]])
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[NO_NAN]])
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[MD_1ULP_NO_NAN:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_1ULP_NO_NAN]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[NO_INF]])
		; IEEE-BADFREXP-NEXT: [[TMP7:%.*]] = extractvalue { float, i32 } [[TMP6]], 0
		; IEEE-BADFREXP-NEXT: [[TMP8:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[NO_INF]])
		; IEEE-BADFREXP-NEXT: [[TMP9:%.*]] = sub i32 0, [[TMP8]]
		; IEEE-BADFREXP-NEXT: [[TMP10:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP7]])
		; IEEE-BADFREXP-NEXT: [[MD_1ULP_NO_INF:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP10]], i32 [[TMP9]])
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_1ULP_NO_INF]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP11:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[NO_INF_NAN]])
		; IEEE-BADFREXP-NEXT: [[TMP12:%.*]] = extractvalue { float, i32 } [[TMP11]], 0
		; IEEE-BADFREXP-NEXT: [[TMP13:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[NO_INF_NAN]])
		; IEEE-BADFREXP-NEXT: [[TMP14:%.*]] = sub i32 0, [[TMP13]]
		; IEEE-BADFREXP-NEXT: [[TMP15:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP12]])
		; IEEE-BADFREXP-NEXT: [[MD_1ULP_NO_INF_NAN:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP15]], i32 [[TMP14]])
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_1ULP_NO_INF_NAN]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_knownfinite		; DAZ-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_knownfinite
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(nan) [[NO_NAN:%.]], float nofpclass(nan) [[NO_INF:%.]], float nofpclass(nan inf) [[NO_INF_NAN:%.]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(nan) [[NO_NAN:%.]], float nofpclass(nan) [[NO_INF:%.]], float nofpclass(nan inf) [[NO_INF_NAN:%.]]) #[[ATTR1]] {
; DAZ-NEXT: [[MD_1ULP_NO_NAN:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[NO_NAN]])		; DAZ-NEXT: [[MD_1ULP_NO_NAN:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[NO_NAN]])
; DAZ-NEXT: store volatile float [[MD_1ULP_NO_NAN]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_1ULP_NO_NAN]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[MD_1ULP_NO_INF:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[NO_INF]])		; DAZ-NEXT: [[MD_1ULP_NO_INF:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[NO_INF]])
; DAZ-NEXT: store volatile float [[MD_1ULP_NO_INF]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_1ULP_NO_INF]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[MD_1ULP_NO_INF_NAN:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[NO_INF_NAN]])		; DAZ-NEXT: [[MD_1ULP_NO_INF_NAN:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[NO_INF_NAN]])
Show All 11 Lines	;

%md.1ulp.no.inf.nan = fdiv float 1.000000e+00, %no.inf.nan, !fpmath !2		%md.1ulp.no.inf.nan = fdiv float 1.000000e+00, %no.inf.nan, !fpmath !2
store volatile float %md.1ulp.no.inf.nan, ptr addrspace(1) %out, align 4		store volatile float %md.1ulp.no.inf.nan, ptr addrspace(1) %out, align 4

ret void		ret void
}		}

define amdgpu_kernel void @rcp_fdiv_f32_nozero(ptr addrspace(1) %out,		define amdgpu_kernel void @rcp_fdiv_f32_nozero(ptr addrspace(1) %out,
; IEEE-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_nozero		; IEEE-GOODFREXP-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_nozero
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(zero) [[NO_ZERO:%.]], float nofpclass(zero sub) [[NO_ZERO_SUB:%.*]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(zero) [[NO_ZERO:%.]], float nofpclass(zero sub) [[NO_ZERO_SUB:%.*]]) #[[ATTR1]] {
; IEEE-NEXT: [[MD_1ULP_NO_ZERO:%.*]] = fdiv float 1.000000e+00, [[NO_ZERO]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[NO_ZERO]])
; IEEE-NEXT: store volatile float [[MD_1ULP_NO_ZERO]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
; IEEE-NEXT: [[MD_1ULP_NO_ZERO_SUB:%.*]] = fdiv float 1.000000e+00, [[NO_ZERO_SUB]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP1]], 1
; IEEE-NEXT: store volatile float [[MD_1ULP_NO_ZERO_SUB]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
; IEEE-NEXT: ret void		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-GOODFREXP-NEXT: [[MD_1ULP_NO_ZERO:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_1ULP_NO_ZERO]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[NO_ZERO_SUB]])
		; IEEE-GOODFREXP-NEXT: [[TMP7:%.*]] = extractvalue { float, i32 } [[TMP6]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP8:%.*]] = extractvalue { float, i32 } [[TMP6]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP9:%.*]] = sub i32 0, [[TMP8]]
		; IEEE-GOODFREXP-NEXT: [[TMP10:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP7]])
		; IEEE-GOODFREXP-NEXT: [[MD_1ULP_NO_ZERO_SUB:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP10]], i32 [[TMP9]])
		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_1ULP_NO_ZERO_SUB]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: ret void
		;
		; IEEE-BADFREXP-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_nozero
		; IEEE-BADFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(zero) [[NO_ZERO:%.]], float nofpclass(zero sub) [[NO_ZERO_SUB:%.*]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[NO_ZERO]])
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[NO_ZERO]])
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[MD_1ULP_NO_ZERO:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_1ULP_NO_ZERO]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[NO_ZERO_SUB]])
		; IEEE-BADFREXP-NEXT: [[TMP7:%.*]] = extractvalue { float, i32 } [[TMP6]], 0
		; IEEE-BADFREXP-NEXT: [[TMP8:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[NO_ZERO_SUB]])
		; IEEE-BADFREXP-NEXT: [[TMP9:%.*]] = sub i32 0, [[TMP8]]
		; IEEE-BADFREXP-NEXT: [[TMP10:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP7]])
		; IEEE-BADFREXP-NEXT: [[MD_1ULP_NO_ZERO_SUB:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP10]], i32 [[TMP9]])
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_1ULP_NO_ZERO_SUB]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_nozero		; DAZ-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_nozero
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(zero) [[NO_ZERO:%.]], float nofpclass(zero sub) [[NO_ZERO_SUB:%.*]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(zero) [[NO_ZERO:%.]], float nofpclass(zero sub) [[NO_ZERO_SUB:%.*]]) #[[ATTR1]] {
; DAZ-NEXT: [[MD_1ULP_NO_ZERO:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[NO_ZERO]])		; DAZ-NEXT: [[MD_1ULP_NO_ZERO:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[NO_ZERO]])
; DAZ-NEXT: store volatile float [[MD_1ULP_NO_ZERO]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_1ULP_NO_ZERO]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[MD_1ULP_NO_ZERO_SUB:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[NO_ZERO_SUB]])		; DAZ-NEXT: [[MD_1ULP_NO_ZERO_SUB:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[NO_ZERO_SUB]])
; DAZ-NEXT: store volatile float [[MD_1ULP_NO_ZERO_SUB]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_1ULP_NO_ZERO_SUB]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: ret void		; DAZ-NEXT: ret void
;		;
float nofpclass(zero) %no.zero,		float nofpclass(zero) %no.zero,
float nofpclass(zero sub) %no.zero.sub) {		float nofpclass(zero sub) %no.zero.sub) {
%md.1ulp.no.zero = fdiv float 1.000000e+00, %no.zero, !fpmath !2		%md.1ulp.no.zero = fdiv float 1.000000e+00, %no.zero, !fpmath !2
store volatile float %md.1ulp.no.zero, ptr addrspace(1) %out, align 4		store volatile float %md.1ulp.no.zero, ptr addrspace(1) %out, align 4

%md.1ulp.no.zero.sub = fdiv float 1.000000e+00, %no.zero.sub, !fpmath !2		%md.1ulp.no.zero.sub = fdiv float 1.000000e+00, %no.zero.sub, !fpmath !2
store volatile float %md.1ulp.no.zero.sub, ptr addrspace(1) %out, align 4		store volatile float %md.1ulp.no.zero.sub, ptr addrspace(1) %out, align 4
ret void		ret void
}		}

define amdgpu_kernel void @rcp_fdiv_f32_nosub(ptr addrspace(1) %out,		define amdgpu_kernel void @rcp_fdiv_f32_nosub(ptr addrspace(1) %out,
; IEEE-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_nosub		; IEEE-GOODFREXP-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_nosub
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(sub) [[NO_SUB:%.]], float nofpclass(nsub) [[NO_NSUB:%.]], float nofpclass(psub) [[NO_PSUB:%.]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(sub) [[NO_SUB:%.]], float nofpclass(nsub) [[NO_NSUB:%.]], float nofpclass(psub) [[NO_PSUB:%.]]) #[[ATTR1]] {
; IEEE-NEXT: [[MD_1ULP_NO_SUB:%.*]] = fdiv float 1.000000e+00, [[NO_SUB]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[NO_SUB]])
; IEEE-NEXT: store volatile float [[MD_1ULP_NO_SUB]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
; IEEE-NEXT: [[MD_1ULP_NO_NSUB:%.*]] = fdiv float 1.000000e+00, [[NO_NSUB]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP1]], 1
; IEEE-NEXT: store volatile float [[MD_1ULP_NO_NSUB]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
; IEEE-NEXT: [[MD_1ULP_NO_PSUB:%.*]] = fdiv float 1.000000e+00, [[NO_PSUB]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP2]])
; IEEE-NEXT: store volatile float [[MD_1ULP_NO_PSUB]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[MD_1ULP_NO_SUB:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
; IEEE-NEXT: ret void		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_1ULP_NO_SUB]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[NO_NSUB]])
		; IEEE-GOODFREXP-NEXT: [[TMP7:%.*]] = extractvalue { float, i32 } [[TMP6]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP8:%.*]] = extractvalue { float, i32 } [[TMP6]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP9:%.*]] = sub i32 0, [[TMP8]]
		; IEEE-GOODFREXP-NEXT: [[TMP10:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP7]])
		; IEEE-GOODFREXP-NEXT: [[MD_1ULP_NO_NSUB:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP10]], i32 [[TMP9]])
		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_1ULP_NO_NSUB]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: [[TMP11:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[NO_PSUB]])
		; IEEE-GOODFREXP-NEXT: [[TMP12:%.*]] = extractvalue { float, i32 } [[TMP11]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP13:%.*]] = extractvalue { float, i32 } [[TMP11]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP14:%.*]] = sub i32 0, [[TMP13]]
		; IEEE-GOODFREXP-NEXT: [[TMP15:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP12]])
		; IEEE-GOODFREXP-NEXT: [[MD_1ULP_NO_PSUB:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP15]], i32 [[TMP14]])
		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_1ULP_NO_PSUB]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: ret void
		;
		; IEEE-BADFREXP-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_nosub
		; IEEE-BADFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(sub) [[NO_SUB:%.]], float nofpclass(nsub) [[NO_NSUB:%.]], float nofpclass(psub) [[NO_PSUB:%.]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[NO_SUB]])
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[NO_SUB]])
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[MD_1ULP_NO_SUB:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_1ULP_NO_SUB]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[NO_NSUB]])
		; IEEE-BADFREXP-NEXT: [[TMP7:%.*]] = extractvalue { float, i32 } [[TMP6]], 0
		; IEEE-BADFREXP-NEXT: [[TMP8:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[NO_NSUB]])
		; IEEE-BADFREXP-NEXT: [[TMP9:%.*]] = sub i32 0, [[TMP8]]
		; IEEE-BADFREXP-NEXT: [[TMP10:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP7]])
		; IEEE-BADFREXP-NEXT: [[MD_1ULP_NO_NSUB:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP10]], i32 [[TMP9]])
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_1ULP_NO_NSUB]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP11:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[NO_PSUB]])
		; IEEE-BADFREXP-NEXT: [[TMP12:%.*]] = extractvalue { float, i32 } [[TMP11]], 0
		; IEEE-BADFREXP-NEXT: [[TMP13:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[NO_PSUB]])
		; IEEE-BADFREXP-NEXT: [[TMP14:%.*]] = sub i32 0, [[TMP13]]
		; IEEE-BADFREXP-NEXT: [[TMP15:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP12]])
		; IEEE-BADFREXP-NEXT: [[MD_1ULP_NO_PSUB:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP15]], i32 [[TMP14]])
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_1ULP_NO_PSUB]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_nosub		; DAZ-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_nosub
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(sub) [[NO_SUB:%.]], float nofpclass(nsub) [[NO_NSUB:%.]], float nofpclass(psub) [[NO_PSUB:%.]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(sub) [[NO_SUB:%.]], float nofpclass(nsub) [[NO_NSUB:%.]], float nofpclass(psub) [[NO_PSUB:%.]]) #[[ATTR1]] {
; DAZ-NEXT: [[MD_1ULP_NO_SUB:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[NO_SUB]])		; DAZ-NEXT: [[MD_1ULP_NO_SUB:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[NO_SUB]])
; DAZ-NEXT: store volatile float [[MD_1ULP_NO_SUB]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_1ULP_NO_SUB]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[MD_1ULP_NO_NSUB:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[NO_NSUB]])		; DAZ-NEXT: [[MD_1ULP_NO_NSUB:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[NO_NSUB]])
; DAZ-NEXT: store volatile float [[MD_1ULP_NO_NSUB]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_1ULP_NO_NSUB]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[MD_1ULP_NO_PSUB:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[NO_PSUB]])		; DAZ-NEXT: [[MD_1ULP_NO_PSUB:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[NO_PSUB]])
Show All 11 Lines	;

%md.1ulp.no.psub = fdiv float 1.000000e+00, %no.psub, !fpmath !2		%md.1ulp.no.psub = fdiv float 1.000000e+00, %no.psub, !fpmath !2
store volatile float %md.1ulp.no.psub, ptr addrspace(1) %out, align 4		store volatile float %md.1ulp.no.psub, ptr addrspace(1) %out, align 4

ret void		ret void
}		}

define amdgpu_kernel void @rcp_fdiv_f32_assume_nosub(ptr addrspace(1) %out, float %x) {		define amdgpu_kernel void @rcp_fdiv_f32_assume_nosub(ptr addrspace(1) %out, float %x) {
; IEEE-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_assume_nosub		; IEEE-GOODFREXP-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_assume_nosub
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {
; IEEE-NEXT: [[FABS_X:%.*]] = call float @llvm.fabs.f32(float [[X]])		; IEEE-GOODFREXP-NEXT: [[FABS_X:%.*]] = call float @llvm.fabs.f32(float [[X]])
; IEEE-NEXT: [[IS_NOT_SUBNORMAL:%.*]] = fcmp oge float [[FABS_X]], 0x3810000000000000		; IEEE-GOODFREXP-NEXT: [[IS_NOT_SUBNORMAL:%.*]] = fcmp oge float [[FABS_X]], 0x3810000000000000
; IEEE-NEXT: call void @llvm.assume(i1 [[IS_NOT_SUBNORMAL]])		; IEEE-GOODFREXP-NEXT: call void @llvm.assume(i1 [[IS_NOT_SUBNORMAL]])
; IEEE-NEXT: [[MD_1ULP_NO_SUB:%.*]] = fdiv float 1.000000e+00, [[X]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[X]])
; IEEE-NEXT: store volatile float [[MD_1ULP_NO_SUB]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
; IEEE-NEXT: ret void		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP1]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-GOODFREXP-NEXT: [[MD_1ULP_NO_SUB:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_1ULP_NO_SUB]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: ret void
		;
		; IEEE-BADFREXP-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_assume_nosub
		; IEEE-BADFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[FABS_X:%.*]] = call float @llvm.fabs.f32(float [[X]])
		; IEEE-BADFREXP-NEXT: [[IS_NOT_SUBNORMAL:%.*]] = fcmp oge float [[FABS_X]], 0x3810000000000000
		; IEEE-BADFREXP-NEXT: call void @llvm.assume(i1 [[IS_NOT_SUBNORMAL]])
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[X]])
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[X]])
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[MD_1ULP_NO_SUB:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_1ULP_NO_SUB]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_assume_nosub		; DAZ-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_assume_nosub
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {
; DAZ-NEXT: [[FABS_X:%.*]] = call float @llvm.fabs.f32(float [[X]])		; DAZ-NEXT: [[FABS_X:%.*]] = call float @llvm.fabs.f32(float [[X]])
; DAZ-NEXT: [[IS_NOT_SUBNORMAL:%.*]] = fcmp oge float [[FABS_X]], 0x3810000000000000		; DAZ-NEXT: [[IS_NOT_SUBNORMAL:%.*]] = fcmp oge float [[FABS_X]], 0x3810000000000000
; DAZ-NEXT: call void @llvm.assume(i1 [[IS_NOT_SUBNORMAL]])		; DAZ-NEXT: call void @llvm.assume(i1 [[IS_NOT_SUBNORMAL]])
; DAZ-NEXT: [[MD_1ULP_NO_SUB:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[X]])		; DAZ-NEXT: [[MD_1ULP_NO_SUB:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[X]])
; DAZ-NEXT: store volatile float [[MD_1ULP_NO_SUB]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_1ULP_NO_SUB]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: ret void		; DAZ-NEXT: ret void
;		;
%fabs.x = call float @llvm.fabs.f32(float %x)		%fabs.x = call float @llvm.fabs.f32(float %x)
%is.not.subnormal = fcmp oge float %fabs.x, 0x3810000000000000		%is.not.subnormal = fcmp oge float %fabs.x, 0x3810000000000000
call void @llvm.assume(i1 %is.not.subnormal)		call void @llvm.assume(i1 %is.not.subnormal)
%md.1ulp.no.sub = fdiv float 1.000000e+00, %x, !fpmath !2		%md.1ulp.no.sub = fdiv float 1.000000e+00, %x, !fpmath !2
store volatile float %md.1ulp.no.sub, ptr addrspace(1) %out, align 4		store volatile float %md.1ulp.no.sub, ptr addrspace(1) %out, align 4
ret void		ret void
}		}

; Test if we have an assumption on the output that it's not denormal.		; Test if we have an assumption on the output that it's not denormal.
define amdgpu_kernel void @rcp_fdiv_f32_assume_nosub_assume_result_nosub(ptr addrspace(1) %out, float %x) {		define amdgpu_kernel void @rcp_fdiv_f32_assume_nosub_assume_result_nosub(ptr addrspace(1) %out, float %x) {
; IEEE-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_assume_nosub_assume_result_nosub		; IEEE-GOODFREXP-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_assume_nosub_assume_result_nosub
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {
; IEEE-NEXT: [[FABS_X:%.*]] = call float @llvm.fabs.f32(float [[X]])		; IEEE-GOODFREXP-NEXT: [[FABS_X:%.*]] = call float @llvm.fabs.f32(float [[X]])
; IEEE-NEXT: [[IS_NOT_SUBNORMAL:%.*]] = fcmp oge float [[FABS_X]], 0x3810000000000000		; IEEE-GOODFREXP-NEXT: [[IS_NOT_SUBNORMAL:%.*]] = fcmp oge float [[FABS_X]], 0x3810000000000000
; IEEE-NEXT: call void @llvm.assume(i1 [[IS_NOT_SUBNORMAL]])		; IEEE-GOODFREXP-NEXT: call void @llvm.assume(i1 [[IS_NOT_SUBNORMAL]])
; IEEE-NEXT: [[MD_1ULP_NO_SUB:%.*]] = fdiv float 1.000000e+00, [[X]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[X]])
; IEEE-NEXT: [[FABS_RESULT:%.*]] = call float @llvm.fabs.f32(float [[MD_1ULP_NO_SUB]])		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
; IEEE-NEXT: [[RESULT_IS_NOT_SUBNORMAL:%.*]] = fcmp oge float [[FABS_RESULT]], 0x3810000000000000		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP1]], 1
; IEEE-NEXT: call void @llvm.assume(i1 [[RESULT_IS_NOT_SUBNORMAL]])		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
; IEEE-NEXT: store volatile float [[MD_1ULP_NO_SUB]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP2]])
; IEEE-NEXT: ret void		; IEEE-GOODFREXP-NEXT: [[MD_1ULP_NO_SUB:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-GOODFREXP-NEXT: [[FABS_RESULT:%.*]] = call float @llvm.fabs.f32(float [[MD_1ULP_NO_SUB]])
		; IEEE-GOODFREXP-NEXT: [[RESULT_IS_NOT_SUBNORMAL:%.*]] = fcmp oge float [[FABS_RESULT]], 0x3810000000000000
		; IEEE-GOODFREXP-NEXT: call void @llvm.assume(i1 [[RESULT_IS_NOT_SUBNORMAL]])
		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_1ULP_NO_SUB]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: ret void
		;
		; IEEE-BADFREXP-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_assume_nosub_assume_result_nosub
		; IEEE-BADFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[FABS_X:%.*]] = call float @llvm.fabs.f32(float [[X]])
		; IEEE-BADFREXP-NEXT: [[IS_NOT_SUBNORMAL:%.*]] = fcmp oge float [[FABS_X]], 0x3810000000000000
		; IEEE-BADFREXP-NEXT: call void @llvm.assume(i1 [[IS_NOT_SUBNORMAL]])
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[X]])
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[X]])
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[MD_1ULP_NO_SUB:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-BADFREXP-NEXT: [[FABS_RESULT:%.*]] = call float @llvm.fabs.f32(float [[MD_1ULP_NO_SUB]])
		; IEEE-BADFREXP-NEXT: [[RESULT_IS_NOT_SUBNORMAL:%.*]] = fcmp oge float [[FABS_RESULT]], 0x3810000000000000
		; IEEE-BADFREXP-NEXT: call void @llvm.assume(i1 [[RESULT_IS_NOT_SUBNORMAL]])
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_1ULP_NO_SUB]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_assume_nosub_assume_result_nosub		; DAZ-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_assume_nosub_assume_result_nosub
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {
; DAZ-NEXT: [[FABS_X:%.*]] = call float @llvm.fabs.f32(float [[X]])		; DAZ-NEXT: [[FABS_X:%.*]] = call float @llvm.fabs.f32(float [[X]])
; DAZ-NEXT: [[IS_NOT_SUBNORMAL:%.*]] = fcmp oge float [[FABS_X]], 0x3810000000000000		; DAZ-NEXT: [[IS_NOT_SUBNORMAL:%.*]] = fcmp oge float [[FABS_X]], 0x3810000000000000
; DAZ-NEXT: call void @llvm.assume(i1 [[IS_NOT_SUBNORMAL]])		; DAZ-NEXT: call void @llvm.assume(i1 [[IS_NOT_SUBNORMAL]])
; DAZ-NEXT: [[MD_1ULP_NO_SUB:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[X]])		; DAZ-NEXT: [[MD_1ULP_NO_SUB:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[X]])
; DAZ-NEXT: [[FABS_RESULT:%.*]] = call float @llvm.fabs.f32(float [[MD_1ULP_NO_SUB]])		; DAZ-NEXT: [[FABS_RESULT:%.*]] = call float @llvm.fabs.f32(float [[MD_1ULP_NO_SUB]])
Show All 10 Lines	;
%fabs.result = call float @llvm.fabs.f32(float %md.1ulp.no.sub)		%fabs.result = call float @llvm.fabs.f32(float %md.1ulp.no.sub)
%result.is.not.subnormal = fcmp oge float %fabs.result, 0x3810000000000000		%result.is.not.subnormal = fcmp oge float %fabs.result, 0x3810000000000000
call void @llvm.assume(i1 %result.is.not.subnormal)		call void @llvm.assume(i1 %result.is.not.subnormal)
store volatile float %md.1ulp.no.sub, ptr addrspace(1) %out, align 4		store volatile float %md.1ulp.no.sub, ptr addrspace(1) %out, align 4
ret void		ret void
}		}

define amdgpu_kernel void @rcp_fdiv_f32_vector_fpmath_flags(ptr addrspace(1) %out, <2 x float> %x) {		define amdgpu_kernel void @rcp_fdiv_f32_vector_fpmath_flags(ptr addrspace(1) %out, <2 x float> %x) {
; IEEE-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_vector_fpmath_flags		; IEEE-GOODFREXP-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_vector_fpmath_flags
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]]) #[[ATTR1]] {
; IEEE-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X]], i64 0
; IEEE-NEXT: [[TMP2:%.*]] = fdiv nnan ninf float 1.000000e+00, [[TMP1]]		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP1]])
; IEEE-NEXT: [[TMP3:%.*]] = insertelement <2 x float> poison, float [[TMP2]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP2]], 0
; IEEE-NEXT: [[TMP4:%.*]] = extractelement <2 x float> [[X]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = extractvalue { float, i32 } [[TMP2]], 1
; IEEE-NEXT: [[TMP5:%.*]] = fdiv nnan ninf float 1.000000e+00, [[TMP4]]		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = sub i32 0, [[TMP4]]
; IEEE-NEXT: [[MD_1ULP_NINF_NNAN:%.*]] = insertelement <2 x float> [[TMP3]], float [[TMP5]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = call nnan ninf float @llvm.amdgcn.rcp.f32(float [[TMP3]])
; IEEE-NEXT: store volatile <2 x float> [[MD_1ULP_NINF_NNAN]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP7:%.*]] = call nnan ninf float @llvm.ldexp.f32.i32(float [[TMP6]], i32 [[TMP5]])
; IEEE-NEXT: [[TMP6:%.*]] = extractelement <2 x float> [[X]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP8:%.*]] = insertelement <2 x float> poison, float [[TMP7]], i64 0
; IEEE-NEXT: [[TMP7:%.*]] = fdiv ninf float 1.000000e+00, [[TMP6]]		; IEEE-GOODFREXP-NEXT: [[TMP9:%.*]] = extractelement <2 x float> [[X]], i64 1
; IEEE-NEXT: [[TMP8:%.*]] = insertelement <2 x float> poison, float [[TMP7]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP10:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP9]])
; IEEE-NEXT: [[TMP9:%.*]] = extractelement <2 x float> [[X]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP11:%.*]] = extractvalue { float, i32 } [[TMP10]], 0
; IEEE-NEXT: [[TMP10:%.*]] = fdiv ninf float 1.000000e+00, [[TMP9]]		; IEEE-GOODFREXP-NEXT: [[TMP12:%.*]] = extractvalue { float, i32 } [[TMP10]], 1
; IEEE-NEXT: [[MD_1ULP_NINF:%.*]] = insertelement <2 x float> [[TMP8]], float [[TMP10]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP13:%.*]] = sub i32 0, [[TMP12]]
; IEEE-NEXT: store volatile <2 x float> [[MD_1ULP_NINF]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP14:%.*]] = call nnan ninf float @llvm.amdgcn.rcp.f32(float [[TMP11]])
; IEEE-NEXT: [[TMP11:%.*]] = extractelement <2 x float> [[X]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP15:%.*]] = call nnan ninf float @llvm.ldexp.f32.i32(float [[TMP14]], i32 [[TMP13]])
; IEEE-NEXT: [[TMP12:%.*]] = fdiv nnan float 1.000000e+00, [[TMP11]]		; IEEE-GOODFREXP-NEXT: [[MD_1ULP_NINF_NNAN:%.*]] = insertelement <2 x float> [[TMP8]], float [[TMP15]], i64 1
; IEEE-NEXT: [[TMP13:%.*]] = insertelement <2 x float> poison, float [[TMP12]], i64 0		; IEEE-GOODFREXP-NEXT: store volatile <2 x float> [[MD_1ULP_NINF_NNAN]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[TMP14:%.*]] = extractelement <2 x float> [[X]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP16:%.*]] = extractelement <2 x float> [[X]], i64 0
; IEEE-NEXT: [[TMP15:%.*]] = fdiv nnan float 1.000000e+00, [[TMP14]]		; IEEE-GOODFREXP-NEXT: [[TMP17:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP16]])
; IEEE-NEXT: [[MD_1ULP_NNAN:%.*]] = insertelement <2 x float> [[TMP13]], float [[TMP15]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP18:%.*]] = extractvalue { float, i32 } [[TMP17]], 0
; IEEE-NEXT: store volatile <2 x float> [[MD_1ULP_NNAN]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP19:%.*]] = extractvalue { float, i32 } [[TMP17]], 1
; IEEE-NEXT: [[TMP16:%.*]] = extractelement <2 x float> [[X]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP20:%.*]] = sub i32 0, [[TMP19]]
; IEEE-NEXT: [[TMP17:%.*]] = fdiv nsz float 1.000000e+00, [[TMP16]]		; IEEE-GOODFREXP-NEXT: [[TMP21:%.*]] = call ninf float @llvm.amdgcn.rcp.f32(float [[TMP18]])
; IEEE-NEXT: [[TMP18:%.*]] = insertelement <2 x float> poison, float [[TMP17]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP22:%.*]] = call ninf float @llvm.ldexp.f32.i32(float [[TMP21]], i32 [[TMP20]])
; IEEE-NEXT: [[TMP19:%.*]] = extractelement <2 x float> [[X]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP23:%.*]] = insertelement <2 x float> poison, float [[TMP22]], i64 0
; IEEE-NEXT: [[TMP20:%.*]] = fdiv nsz float 1.000000e+00, [[TMP19]]		; IEEE-GOODFREXP-NEXT: [[TMP24:%.*]] = extractelement <2 x float> [[X]], i64 1
; IEEE-NEXT: [[MD_1ULP_NSZ:%.*]] = insertelement <2 x float> [[TMP18]], float [[TMP20]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP25:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP24]])
; IEEE-NEXT: store volatile <2 x float> [[MD_1ULP_NSZ]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP26:%.*]] = extractvalue { float, i32 } [[TMP25]], 0
; IEEE-NEXT: ret void		; IEEE-GOODFREXP-NEXT: [[TMP27:%.*]] = extractvalue { float, i32 } [[TMP25]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP28:%.*]] = sub i32 0, [[TMP27]]
		; IEEE-GOODFREXP-NEXT: [[TMP29:%.*]] = call ninf float @llvm.amdgcn.rcp.f32(float [[TMP26]])
		; IEEE-GOODFREXP-NEXT: [[TMP30:%.*]] = call ninf float @llvm.ldexp.f32.i32(float [[TMP29]], i32 [[TMP28]])
		; IEEE-GOODFREXP-NEXT: [[MD_1ULP_NINF:%.*]] = insertelement <2 x float> [[TMP23]], float [[TMP30]], i64 1
		; IEEE-GOODFREXP-NEXT: store volatile <2 x float> [[MD_1ULP_NINF]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: [[TMP31:%.*]] = extractelement <2 x float> [[X]], i64 0
		; IEEE-GOODFREXP-NEXT: [[TMP32:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP31]])
		; IEEE-GOODFREXP-NEXT: [[TMP33:%.*]] = extractvalue { float, i32 } [[TMP32]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP34:%.*]] = extractvalue { float, i32 } [[TMP32]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP35:%.*]] = sub i32 0, [[TMP34]]
		; IEEE-GOODFREXP-NEXT: [[TMP36:%.*]] = call nnan float @llvm.amdgcn.rcp.f32(float [[TMP33]])
		; IEEE-GOODFREXP-NEXT: [[TMP37:%.*]] = call nnan float @llvm.ldexp.f32.i32(float [[TMP36]], i32 [[TMP35]])
		; IEEE-GOODFREXP-NEXT: [[TMP38:%.*]] = insertelement <2 x float> poison, float [[TMP37]], i64 0
		; IEEE-GOODFREXP-NEXT: [[TMP39:%.*]] = extractelement <2 x float> [[X]], i64 1
		; IEEE-GOODFREXP-NEXT: [[TMP40:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP39]])
		; IEEE-GOODFREXP-NEXT: [[TMP41:%.*]] = extractvalue { float, i32 } [[TMP40]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP42:%.*]] = extractvalue { float, i32 } [[TMP40]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP43:%.*]] = sub i32 0, [[TMP42]]
		; IEEE-GOODFREXP-NEXT: [[TMP44:%.*]] = call nnan float @llvm.amdgcn.rcp.f32(float [[TMP41]])
		; IEEE-GOODFREXP-NEXT: [[TMP45:%.*]] = call nnan float @llvm.ldexp.f32.i32(float [[TMP44]], i32 [[TMP43]])
		; IEEE-GOODFREXP-NEXT: [[MD_1ULP_NNAN:%.*]] = insertelement <2 x float> [[TMP38]], float [[TMP45]], i64 1
		; IEEE-GOODFREXP-NEXT: store volatile <2 x float> [[MD_1ULP_NNAN]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: [[TMP46:%.*]] = extractelement <2 x float> [[X]], i64 0
		; IEEE-GOODFREXP-NEXT: [[TMP47:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP46]])
		; IEEE-GOODFREXP-NEXT: [[TMP48:%.*]] = extractvalue { float, i32 } [[TMP47]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP49:%.*]] = extractvalue { float, i32 } [[TMP47]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP50:%.*]] = sub i32 0, [[TMP49]]
		; IEEE-GOODFREXP-NEXT: [[TMP51:%.*]] = call nsz float @llvm.amdgcn.rcp.f32(float [[TMP48]])
		; IEEE-GOODFREXP-NEXT: [[TMP52:%.*]] = call nsz float @llvm.ldexp.f32.i32(float [[TMP51]], i32 [[TMP50]])
		; IEEE-GOODFREXP-NEXT: [[TMP53:%.*]] = insertelement <2 x float> poison, float [[TMP52]], i64 0
		; IEEE-GOODFREXP-NEXT: [[TMP54:%.*]] = extractelement <2 x float> [[X]], i64 1
		; IEEE-GOODFREXP-NEXT: [[TMP55:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP54]])
		; IEEE-GOODFREXP-NEXT: [[TMP56:%.*]] = extractvalue { float, i32 } [[TMP55]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP57:%.*]] = extractvalue { float, i32 } [[TMP55]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP58:%.*]] = sub i32 0, [[TMP57]]
		; IEEE-GOODFREXP-NEXT: [[TMP59:%.*]] = call nsz float @llvm.amdgcn.rcp.f32(float [[TMP56]])
		; IEEE-GOODFREXP-NEXT: [[TMP60:%.*]] = call nsz float @llvm.ldexp.f32.i32(float [[TMP59]], i32 [[TMP58]])
		; IEEE-GOODFREXP-NEXT: [[MD_1ULP_NSZ:%.*]] = insertelement <2 x float> [[TMP53]], float [[TMP60]], i64 1
		; IEEE-GOODFREXP-NEXT: store volatile <2 x float> [[MD_1ULP_NSZ]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: ret void
		;
		; IEEE-BADFREXP-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_vector_fpmath_flags
		; IEEE-BADFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP1]])
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP2]], 0
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP1]])
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = sub i32 0, [[TMP4]]
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = call nnan ninf float @llvm.amdgcn.rcp.f32(float [[TMP3]])
		; IEEE-BADFREXP-NEXT: [[TMP7:%.*]] = call nnan ninf float @llvm.ldexp.f32.i32(float [[TMP6]], i32 [[TMP5]])
		; IEEE-BADFREXP-NEXT: [[TMP8:%.*]] = insertelement <2 x float> poison, float [[TMP7]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP9:%.*]] = extractelement <2 x float> [[X]], i64 1
		; IEEE-BADFREXP-NEXT: [[TMP10:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP9]])
		; IEEE-BADFREXP-NEXT: [[TMP11:%.*]] = extractvalue { float, i32 } [[TMP10]], 0
		; IEEE-BADFREXP-NEXT: [[TMP12:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP9]])
		; IEEE-BADFREXP-NEXT: [[TMP13:%.*]] = sub i32 0, [[TMP12]]
		; IEEE-BADFREXP-NEXT: [[TMP14:%.*]] = call nnan ninf float @llvm.amdgcn.rcp.f32(float [[TMP11]])
		; IEEE-BADFREXP-NEXT: [[TMP15:%.*]] = call nnan ninf float @llvm.ldexp.f32.i32(float [[TMP14]], i32 [[TMP13]])
		; IEEE-BADFREXP-NEXT: [[MD_1ULP_NINF_NNAN:%.*]] = insertelement <2 x float> [[TMP8]], float [[TMP15]], i64 1
		; IEEE-BADFREXP-NEXT: store volatile <2 x float> [[MD_1ULP_NINF_NNAN]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP16:%.*]] = extractelement <2 x float> [[X]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP17:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP16]])
		; IEEE-BADFREXP-NEXT: [[TMP18:%.*]] = extractvalue { float, i32 } [[TMP17]], 0
		; IEEE-BADFREXP-NEXT: [[TMP19:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP16]])
		; IEEE-BADFREXP-NEXT: [[TMP20:%.*]] = sub i32 0, [[TMP19]]
		; IEEE-BADFREXP-NEXT: [[TMP21:%.*]] = call ninf float @llvm.amdgcn.rcp.f32(float [[TMP18]])
		; IEEE-BADFREXP-NEXT: [[TMP22:%.*]] = call ninf float @llvm.ldexp.f32.i32(float [[TMP21]], i32 [[TMP20]])
		; IEEE-BADFREXP-NEXT: [[TMP23:%.*]] = insertelement <2 x float> poison, float [[TMP22]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP24:%.*]] = extractelement <2 x float> [[X]], i64 1
		; IEEE-BADFREXP-NEXT: [[TMP25:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP24]])
		; IEEE-BADFREXP-NEXT: [[TMP26:%.*]] = extractvalue { float, i32 } [[TMP25]], 0
		; IEEE-BADFREXP-NEXT: [[TMP27:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP24]])
		; IEEE-BADFREXP-NEXT: [[TMP28:%.*]] = sub i32 0, [[TMP27]]
		; IEEE-BADFREXP-NEXT: [[TMP29:%.*]] = call ninf float @llvm.amdgcn.rcp.f32(float [[TMP26]])
		; IEEE-BADFREXP-NEXT: [[TMP30:%.*]] = call ninf float @llvm.ldexp.f32.i32(float [[TMP29]], i32 [[TMP28]])
		; IEEE-BADFREXP-NEXT: [[MD_1ULP_NINF:%.*]] = insertelement <2 x float> [[TMP23]], float [[TMP30]], i64 1
		; IEEE-BADFREXP-NEXT: store volatile <2 x float> [[MD_1ULP_NINF]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP31:%.*]] = extractelement <2 x float> [[X]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP32:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP31]])
		; IEEE-BADFREXP-NEXT: [[TMP33:%.*]] = extractvalue { float, i32 } [[TMP32]], 0
		; IEEE-BADFREXP-NEXT: [[TMP34:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP31]])
		; IEEE-BADFREXP-NEXT: [[TMP35:%.*]] = sub i32 0, [[TMP34]]
		; IEEE-BADFREXP-NEXT: [[TMP36:%.*]] = call nnan float @llvm.amdgcn.rcp.f32(float [[TMP33]])
		; IEEE-BADFREXP-NEXT: [[TMP37:%.*]] = call nnan float @llvm.ldexp.f32.i32(float [[TMP36]], i32 [[TMP35]])
		; IEEE-BADFREXP-NEXT: [[TMP38:%.*]] = insertelement <2 x float> poison, float [[TMP37]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP39:%.*]] = extractelement <2 x float> [[X]], i64 1
		; IEEE-BADFREXP-NEXT: [[TMP40:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP39]])
		; IEEE-BADFREXP-NEXT: [[TMP41:%.*]] = extractvalue { float, i32 } [[TMP40]], 0
		; IEEE-BADFREXP-NEXT: [[TMP42:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP39]])
		; IEEE-BADFREXP-NEXT: [[TMP43:%.*]] = sub i32 0, [[TMP42]]
		; IEEE-BADFREXP-NEXT: [[TMP44:%.*]] = call nnan float @llvm.amdgcn.rcp.f32(float [[TMP41]])
		; IEEE-BADFREXP-NEXT: [[TMP45:%.*]] = call nnan float @llvm.ldexp.f32.i32(float [[TMP44]], i32 [[TMP43]])
		; IEEE-BADFREXP-NEXT: [[MD_1ULP_NNAN:%.*]] = insertelement <2 x float> [[TMP38]], float [[TMP45]], i64 1
		; IEEE-BADFREXP-NEXT: store volatile <2 x float> [[MD_1ULP_NNAN]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP46:%.*]] = extractelement <2 x float> [[X]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP47:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP46]])
		; IEEE-BADFREXP-NEXT: [[TMP48:%.*]] = extractvalue { float, i32 } [[TMP47]], 0
		; IEEE-BADFREXP-NEXT: [[TMP49:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP46]])
		; IEEE-BADFREXP-NEXT: [[TMP50:%.*]] = sub i32 0, [[TMP49]]
		; IEEE-BADFREXP-NEXT: [[TMP51:%.*]] = call nsz float @llvm.amdgcn.rcp.f32(float [[TMP48]])
		; IEEE-BADFREXP-NEXT: [[TMP52:%.*]] = call nsz float @llvm.ldexp.f32.i32(float [[TMP51]], i32 [[TMP50]])
		; IEEE-BADFREXP-NEXT: [[TMP53:%.*]] = insertelement <2 x float> poison, float [[TMP52]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP54:%.*]] = extractelement <2 x float> [[X]], i64 1
		; IEEE-BADFREXP-NEXT: [[TMP55:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP54]])
		; IEEE-BADFREXP-NEXT: [[TMP56:%.*]] = extractvalue { float, i32 } [[TMP55]], 0
		; IEEE-BADFREXP-NEXT: [[TMP57:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP54]])
		; IEEE-BADFREXP-NEXT: [[TMP58:%.*]] = sub i32 0, [[TMP57]]
		; IEEE-BADFREXP-NEXT: [[TMP59:%.*]] = call nsz float @llvm.amdgcn.rcp.f32(float [[TMP56]])
		; IEEE-BADFREXP-NEXT: [[TMP60:%.*]] = call nsz float @llvm.ldexp.f32.i32(float [[TMP59]], i32 [[TMP58]])
		; IEEE-BADFREXP-NEXT: [[MD_1ULP_NSZ:%.*]] = insertelement <2 x float> [[TMP53]], float [[TMP60]], i64 1
		; IEEE-BADFREXP-NEXT: store volatile <2 x float> [[MD_1ULP_NSZ]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_vector_fpmath_flags		; DAZ-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_vector_fpmath_flags
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]]) #[[ATTR1]] {
; DAZ-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X]], i64 0		; DAZ-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X]], i64 0
; DAZ-NEXT: [[TMP2:%.*]] = call nnan ninf float @llvm.amdgcn.rcp.f32(float [[TMP1]])		; DAZ-NEXT: [[TMP2:%.*]] = call nnan ninf float @llvm.amdgcn.rcp.f32(float [[TMP1]])
; DAZ-NEXT: [[TMP3:%.*]] = insertelement <2 x float> poison, float [[TMP2]], i64 0		; DAZ-NEXT: [[TMP3:%.*]] = insertelement <2 x float> poison, float [[TMP2]], i64 0
; DAZ-NEXT: [[TMP4:%.*]] = extractelement <2 x float> [[X]], i64 1		; DAZ-NEXT: [[TMP4:%.*]] = extractelement <2 x float> [[X]], i64 1
; DAZ-NEXT: [[TMP5:%.*]] = call nnan ninf float @llvm.amdgcn.rcp.f32(float [[TMP4]])		; DAZ-NEXT: [[TMP5:%.*]] = call nnan ninf float @llvm.amdgcn.rcp.f32(float [[TMP4]])
▲ Show 20 Lines • Show All 46 Lines • ▼ Show 20 Lines
; IEEE-NEXT: [[TMP4:%.*]] = insertelement <2 x float> poison, float [[TMP3]], i64 0		; IEEE-NEXT: [[TMP4:%.*]] = insertelement <2 x float> poison, float [[TMP3]], i64 0
; IEEE-NEXT: [[TMP5:%.*]] = extractelement <2 x float> [[A]], i64 1		; IEEE-NEXT: [[TMP5:%.*]] = extractelement <2 x float> [[A]], i64 1
; IEEE-NEXT: [[TMP6:%.*]] = extractelement <2 x float> [[B]], i64 1		; IEEE-NEXT: [[TMP6:%.*]] = extractelement <2 x float> [[B]], i64 1
; IEEE-NEXT: [[TMP7:%.*]] = fdiv float [[TMP5]], [[TMP6]]		; IEEE-NEXT: [[TMP7:%.*]] = fdiv float [[TMP5]], [[TMP6]]
; IEEE-NEXT: [[NO_MD:%.*]] = insertelement <2 x float> [[TMP4]], float [[TMP7]], i64 1		; IEEE-NEXT: [[NO_MD:%.*]] = insertelement <2 x float> [[TMP4]], float [[TMP7]], i64 1
; IEEE-NEXT: store volatile <2 x float> [[NO_MD]], ptr addrspace(1) [[OUT]], align 8		; IEEE-NEXT: store volatile <2 x float> [[NO_MD]], ptr addrspace(1) [[OUT]], align 8
; IEEE-NEXT: [[TMP8:%.*]] = extractelement <2 x float> [[A]], i64 0		; IEEE-NEXT: [[TMP8:%.*]] = extractelement <2 x float> [[A]], i64 0
; IEEE-NEXT: [[TMP9:%.*]] = extractelement <2 x float> [[B]], i64 0		; IEEE-NEXT: [[TMP9:%.*]] = extractelement <2 x float> [[B]], i64 0
; IEEE-NEXT: [[TMP10:%.*]] = fdiv float [[TMP8]], [[TMP9]]		; IEEE-NEXT: [[TMP10:%.*]] = fdiv float [[TMP8]], [[TMP9]], !fpmath !1
; IEEE-NEXT: [[TMP11:%.*]] = insertelement <2 x float> poison, float [[TMP10]], i64 0		; IEEE-NEXT: [[TMP11:%.*]] = insertelement <2 x float> poison, float [[TMP10]], i64 0
; IEEE-NEXT: [[TMP12:%.*]] = extractelement <2 x float> [[A]], i64 1		; IEEE-NEXT: [[TMP12:%.*]] = extractelement <2 x float> [[A]], i64 1
; IEEE-NEXT: [[TMP13:%.*]] = extractelement <2 x float> [[B]], i64 1		; IEEE-NEXT: [[TMP13:%.*]] = extractelement <2 x float> [[B]], i64 1
; IEEE-NEXT: [[TMP14:%.*]] = fdiv float [[TMP12]], [[TMP13]]		; IEEE-NEXT: [[TMP14:%.*]] = fdiv float [[TMP12]], [[TMP13]], !fpmath !1
; IEEE-NEXT: [[MD_HALF_ULP:%.*]] = insertelement <2 x float> [[TMP11]], float [[TMP14]], i64 1		; IEEE-NEXT: [[MD_HALF_ULP:%.*]] = insertelement <2 x float> [[TMP11]], float [[TMP14]], i64 1
; IEEE-NEXT: store volatile <2 x float> [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 8		; IEEE-NEXT: store volatile <2 x float> [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 8
; IEEE-NEXT: [[TMP15:%.*]] = extractelement <2 x float> [[A]], i64 0		; IEEE-NEXT: [[TMP15:%.*]] = extractelement <2 x float> [[A]], i64 0
; IEEE-NEXT: [[TMP16:%.*]] = extractelement <2 x float> [[B]], i64 0		; IEEE-NEXT: [[TMP16:%.*]] = extractelement <2 x float> [[B]], i64 0
; IEEE-NEXT: [[TMP17:%.*]] = fdiv float [[TMP15]], [[TMP16]]		; IEEE-NEXT: [[TMP17:%.*]] = fdiv float [[TMP15]], [[TMP16]], !fpmath !2
; IEEE-NEXT: [[TMP18:%.*]] = insertelement <2 x float> poison, float [[TMP17]], i64 0		; IEEE-NEXT: [[TMP18:%.*]] = insertelement <2 x float> poison, float [[TMP17]], i64 0
; IEEE-NEXT: [[TMP19:%.*]] = extractelement <2 x float> [[A]], i64 1		; IEEE-NEXT: [[TMP19:%.*]] = extractelement <2 x float> [[A]], i64 1
; IEEE-NEXT: [[TMP20:%.*]] = extractelement <2 x float> [[B]], i64 1		; IEEE-NEXT: [[TMP20:%.*]] = extractelement <2 x float> [[B]], i64 1
; IEEE-NEXT: [[TMP21:%.*]] = fdiv float [[TMP19]], [[TMP20]]		; IEEE-NEXT: [[TMP21:%.*]] = fdiv float [[TMP19]], [[TMP20]], !fpmath !2
; IEEE-NEXT: [[MD_1ULP:%.*]] = insertelement <2 x float> [[TMP18]], float [[TMP21]], i64 1		; IEEE-NEXT: [[MD_1ULP:%.*]] = insertelement <2 x float> [[TMP18]], float [[TMP21]], i64 1
; IEEE-NEXT: store volatile <2 x float> [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 8		; IEEE-NEXT: store volatile <2 x float> [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 8
; IEEE-NEXT: [[TMP22:%.*]] = extractelement <2 x float> [[A]], i64 0		; IEEE-NEXT: [[TMP22:%.*]] = extractelement <2 x float> [[A]], i64 0
; IEEE-NEXT: [[TMP23:%.*]] = extractelement <2 x float> [[B]], i64 0		; IEEE-NEXT: [[TMP23:%.*]] = extractelement <2 x float> [[B]], i64 0
; IEEE-NEXT: [[TMP24:%.*]] = fdiv float [[TMP22]], [[TMP23]]		; IEEE-NEXT: [[TMP24:%.*]] = fdiv float [[TMP22]], [[TMP23]], !fpmath !0
; IEEE-NEXT: [[TMP25:%.*]] = insertelement <2 x float> poison, float [[TMP24]], i64 0		; IEEE-NEXT: [[TMP25:%.*]] = insertelement <2 x float> poison, float [[TMP24]], i64 0
; IEEE-NEXT: [[TMP26:%.*]] = extractelement <2 x float> [[A]], i64 1		; IEEE-NEXT: [[TMP26:%.*]] = extractelement <2 x float> [[A]], i64 1
; IEEE-NEXT: [[TMP27:%.*]] = extractelement <2 x float> [[B]], i64 1		; IEEE-NEXT: [[TMP27:%.*]] = extractelement <2 x float> [[B]], i64 1
; IEEE-NEXT: [[TMP28:%.*]] = fdiv float [[TMP26]], [[TMP27]]		; IEEE-NEXT: [[TMP28:%.*]] = fdiv float [[TMP26]], [[TMP27]], !fpmath !0
; IEEE-NEXT: [[MD_25ULP:%.*]] = insertelement <2 x float> [[TMP25]], float [[TMP28]], i64 1		; IEEE-NEXT: [[MD_25ULP:%.*]] = insertelement <2 x float> [[TMP25]], float [[TMP28]], i64 1
; IEEE-NEXT: store volatile <2 x float> [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 8		; IEEE-NEXT: store volatile <2 x float> [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 8
; IEEE-NEXT: ret void		; IEEE-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @fdiv_fpmath_f32_vector		; DAZ-LABEL: define amdgpu_kernel void @fdiv_fpmath_f32_vector
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[A:%.]], <2 x float> [[B:%.*]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[A:%.]], <2 x float> [[B:%.*]]) #[[ATTR1]] {
; DAZ-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[A]], i64 0		; DAZ-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[A]], i64 0
; DAZ-NEXT: [[TMP2:%.*]] = extractelement <2 x float> [[B]], i64 0		; DAZ-NEXT: [[TMP2:%.*]] = extractelement <2 x float> [[B]], i64 0
; DAZ-NEXT: [[TMP3:%.*]] = fdiv float [[TMP1]], [[TMP2]]		; DAZ-NEXT: [[TMP3:%.*]] = fdiv float [[TMP1]], [[TMP2]]
; DAZ-NEXT: [[TMP4:%.*]] = insertelement <2 x float> poison, float [[TMP3]], i64 0		; DAZ-NEXT: [[TMP4:%.*]] = insertelement <2 x float> poison, float [[TMP3]], i64 0
; DAZ-NEXT: [[TMP5:%.*]] = extractelement <2 x float> [[A]], i64 1		; DAZ-NEXT: [[TMP5:%.*]] = extractelement <2 x float> [[A]], i64 1
; DAZ-NEXT: [[TMP6:%.*]] = extractelement <2 x float> [[B]], i64 1		; DAZ-NEXT: [[TMP6:%.*]] = extractelement <2 x float> [[B]], i64 1
; DAZ-NEXT: [[TMP7:%.*]] = fdiv float [[TMP5]], [[TMP6]]		; DAZ-NEXT: [[TMP7:%.*]] = fdiv float [[TMP5]], [[TMP6]]
; DAZ-NEXT: [[NO_MD:%.*]] = insertelement <2 x float> [[TMP4]], float [[TMP7]], i64 1		; DAZ-NEXT: [[NO_MD:%.*]] = insertelement <2 x float> [[TMP4]], float [[TMP7]], i64 1
; DAZ-NEXT: store volatile <2 x float> [[NO_MD]], ptr addrspace(1) [[OUT]], align 8		; DAZ-NEXT: store volatile <2 x float> [[NO_MD]], ptr addrspace(1) [[OUT]], align 8
; DAZ-NEXT: [[TMP8:%.*]] = extractelement <2 x float> [[A]], i64 0		; DAZ-NEXT: [[TMP8:%.*]] = extractelement <2 x float> [[A]], i64 0
; DAZ-NEXT: [[TMP9:%.*]] = extractelement <2 x float> [[B]], i64 0		; DAZ-NEXT: [[TMP9:%.*]] = extractelement <2 x float> [[B]], i64 0
; DAZ-NEXT: [[TMP10:%.*]] = fdiv float [[TMP8]], [[TMP9]]		; DAZ-NEXT: [[TMP10:%.*]] = fdiv float [[TMP8]], [[TMP9]], !fpmath !1
; DAZ-NEXT: [[TMP11:%.*]] = insertelement <2 x float> poison, float [[TMP10]], i64 0		; DAZ-NEXT: [[TMP11:%.*]] = insertelement <2 x float> poison, float [[TMP10]], i64 0
; DAZ-NEXT: [[TMP12:%.*]] = extractelement <2 x float> [[A]], i64 1		; DAZ-NEXT: [[TMP12:%.*]] = extractelement <2 x float> [[A]], i64 1
; DAZ-NEXT: [[TMP13:%.*]] = extractelement <2 x float> [[B]], i64 1		; DAZ-NEXT: [[TMP13:%.*]] = extractelement <2 x float> [[B]], i64 1
; DAZ-NEXT: [[TMP14:%.*]] = fdiv float [[TMP12]], [[TMP13]]		; DAZ-NEXT: [[TMP14:%.*]] = fdiv float [[TMP12]], [[TMP13]], !fpmath !1
; DAZ-NEXT: [[MD_HALF_ULP:%.*]] = insertelement <2 x float> [[TMP11]], float [[TMP14]], i64 1		; DAZ-NEXT: [[MD_HALF_ULP:%.*]] = insertelement <2 x float> [[TMP11]], float [[TMP14]], i64 1
; DAZ-NEXT: store volatile <2 x float> [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 8		; DAZ-NEXT: store volatile <2 x float> [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 8
; DAZ-NEXT: [[TMP15:%.*]] = extractelement <2 x float> [[A]], i64 0		; DAZ-NEXT: [[TMP15:%.*]] = extractelement <2 x float> [[A]], i64 0
; DAZ-NEXT: [[TMP16:%.*]] = extractelement <2 x float> [[B]], i64 0		; DAZ-NEXT: [[TMP16:%.*]] = extractelement <2 x float> [[B]], i64 0
; DAZ-NEXT: [[TMP17:%.*]] = fdiv float [[TMP15]], [[TMP16]]		; DAZ-NEXT: [[TMP17:%.*]] = fdiv float [[TMP15]], [[TMP16]], !fpmath !2
; DAZ-NEXT: [[TMP18:%.*]] = insertelement <2 x float> poison, float [[TMP17]], i64 0		; DAZ-NEXT: [[TMP18:%.*]] = insertelement <2 x float> poison, float [[TMP17]], i64 0
; DAZ-NEXT: [[TMP19:%.*]] = extractelement <2 x float> [[A]], i64 1		; DAZ-NEXT: [[TMP19:%.*]] = extractelement <2 x float> [[A]], i64 1
; DAZ-NEXT: [[TMP20:%.*]] = extractelement <2 x float> [[B]], i64 1		; DAZ-NEXT: [[TMP20:%.*]] = extractelement <2 x float> [[B]], i64 1
; DAZ-NEXT: [[TMP21:%.*]] = fdiv float [[TMP19]], [[TMP20]]		; DAZ-NEXT: [[TMP21:%.*]] = fdiv float [[TMP19]], [[TMP20]], !fpmath !2
; DAZ-NEXT: [[MD_1ULP:%.*]] = insertelement <2 x float> [[TMP18]], float [[TMP21]], i64 1		; DAZ-NEXT: [[MD_1ULP:%.*]] = insertelement <2 x float> [[TMP18]], float [[TMP21]], i64 1
; DAZ-NEXT: store volatile <2 x float> [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 8		; DAZ-NEXT: store volatile <2 x float> [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 8
; DAZ-NEXT: [[TMP22:%.*]] = extractelement <2 x float> [[A]], i64 0		; DAZ-NEXT: [[TMP22:%.*]] = extractelement <2 x float> [[A]], i64 0
; DAZ-NEXT: [[TMP23:%.*]] = extractelement <2 x float> [[B]], i64 0		; DAZ-NEXT: [[TMP23:%.*]] = extractelement <2 x float> [[B]], i64 0
; DAZ-NEXT: [[TMP24:%.*]] = call float @llvm.amdgcn.fdiv.fast(float [[TMP22]], float [[TMP23]])		; DAZ-NEXT: [[TMP24:%.*]] = call float @llvm.amdgcn.fdiv.fast(float [[TMP22]], float [[TMP23]])
; DAZ-NEXT: [[TMP25:%.*]] = insertelement <2 x float> poison, float [[TMP24]], i64 0		; DAZ-NEXT: [[TMP25:%.*]] = insertelement <2 x float> poison, float [[TMP24]], i64 0
; DAZ-NEXT: [[TMP26:%.*]] = extractelement <2 x float> [[A]], i64 1		; DAZ-NEXT: [[TMP26:%.*]] = extractelement <2 x float> [[A]], i64 1
; DAZ-NEXT: [[TMP27:%.*]] = extractelement <2 x float> [[B]], i64 1		; DAZ-NEXT: [[TMP27:%.*]] = extractelement <2 x float> [[B]], i64 1
Show All 19 Lines
; CHECK-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X]], i64 0		; CHECK-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X]], i64 0
; CHECK-NEXT: [[TMP2:%.*]] = fdiv float 1.000000e+00, [[TMP1]]		; CHECK-NEXT: [[TMP2:%.*]] = fdiv float 1.000000e+00, [[TMP1]]
; CHECK-NEXT: [[TMP3:%.*]] = insertelement <2 x float> poison, float [[TMP2]], i64 0		; CHECK-NEXT: [[TMP3:%.*]] = insertelement <2 x float> poison, float [[TMP2]], i64 0
; CHECK-NEXT: [[TMP4:%.*]] = extractelement <2 x float> [[X]], i64 1		; CHECK-NEXT: [[TMP4:%.*]] = extractelement <2 x float> [[X]], i64 1
; CHECK-NEXT: [[TMP5:%.*]] = fdiv float 1.000000e+00, [[TMP4]]		; CHECK-NEXT: [[TMP5:%.*]] = fdiv float 1.000000e+00, [[TMP4]]
; CHECK-NEXT: [[NO_MD:%.*]] = insertelement <2 x float> [[TMP3]], float [[TMP5]], i64 1		; CHECK-NEXT: [[NO_MD:%.*]] = insertelement <2 x float> [[TMP3]], float [[TMP5]], i64 1
; CHECK-NEXT: store volatile <2 x float> [[NO_MD]], ptr addrspace(1) [[OUT]], align 8		; CHECK-NEXT: store volatile <2 x float> [[NO_MD]], ptr addrspace(1) [[OUT]], align 8
; CHECK-NEXT: [[TMP6:%.*]] = extractelement <2 x float> [[X]], i64 0		; CHECK-NEXT: [[TMP6:%.*]] = extractelement <2 x float> [[X]], i64 0
; CHECK-NEXT: [[TMP7:%.*]] = fdiv float 1.000000e+00, [[TMP6]]		; CHECK-NEXT: [[TMP7:%.*]] = fdiv float 1.000000e+00, [[TMP6]], !fpmath !1
; CHECK-NEXT: [[TMP8:%.*]] = insertelement <2 x float> poison, float [[TMP7]], i64 0		; CHECK-NEXT: [[TMP8:%.*]] = insertelement <2 x float> poison, float [[TMP7]], i64 0
; CHECK-NEXT: [[TMP9:%.*]] = extractelement <2 x float> [[X]], i64 1		; CHECK-NEXT: [[TMP9:%.*]] = extractelement <2 x float> [[X]], i64 1
; CHECK-NEXT: [[TMP10:%.*]] = fdiv float 1.000000e+00, [[TMP9]]		; CHECK-NEXT: [[TMP10:%.*]] = fdiv float 1.000000e+00, [[TMP9]], !fpmath !1
; CHECK-NEXT: [[MD_HALF_ULP:%.*]] = insertelement <2 x float> [[TMP8]], float [[TMP10]], i64 1		; CHECK-NEXT: [[MD_HALF_ULP:%.*]] = insertelement <2 x float> [[TMP8]], float [[TMP10]], i64 1
; CHECK-NEXT: store volatile <2 x float> [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 8		; CHECK-NEXT: store volatile <2 x float> [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 8
; CHECK-NEXT: [[TMP11:%.*]] = extractelement <2 x float> [[X]], i64 0		; CHECK-NEXT: [[AFN_NO_MD:%.*]] = fdiv afn <2 x float> <float 1.000000e+00, float 1.000000e+00>, [[X]]
; CHECK-NEXT: [[TMP12:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[TMP11]])
; CHECK-NEXT: [[TMP13:%.*]] = insertelement <2 x float> poison, float [[TMP12]], i64 0
; CHECK-NEXT: [[TMP14:%.*]] = extractelement <2 x float> [[X]], i64 1
; CHECK-NEXT: [[TMP15:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[TMP14]])
; CHECK-NEXT: [[AFN_NO_MD:%.*]] = insertelement <2 x float> [[TMP13]], float [[TMP15]], i64 1
; CHECK-NEXT: store volatile <2 x float> [[AFN_NO_MD]], ptr addrspace(1) [[OUT]], align 8		; CHECK-NEXT: store volatile <2 x float> [[AFN_NO_MD]], ptr addrspace(1) [[OUT]], align 8
; CHECK-NEXT: [[TMP16:%.*]] = extractelement <2 x float> [[X]], i64 0		; CHECK-NEXT: [[FAST_NO_MD:%.*]] = fdiv fast <2 x float> <float 1.000000e+00, float 1.000000e+00>, [[X]]
; CHECK-NEXT: [[TMP17:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[TMP16]])
; CHECK-NEXT: [[TMP18:%.*]] = insertelement <2 x float> poison, float [[TMP17]], i64 0
; CHECK-NEXT: [[TMP19:%.*]] = extractelement <2 x float> [[X]], i64 1
; CHECK-NEXT: [[TMP20:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[TMP19]])
; CHECK-NEXT: [[FAST_NO_MD:%.*]] = insertelement <2 x float> [[TMP18]], float [[TMP20]], i64 1
; CHECK-NEXT: store volatile <2 x float> [[FAST_NO_MD]], ptr addrspace(1) [[OUT]], align 8		; CHECK-NEXT: store volatile <2 x float> [[FAST_NO_MD]], ptr addrspace(1) [[OUT]], align 8
; CHECK-NEXT: [[TMP21:%.*]] = extractelement <2 x float> [[X]], i64 0		; CHECK-NEXT: [[AFN_25ULP:%.*]] = fdiv afn <2 x float> <float 1.000000e+00, float 1.000000e+00>, [[X]], !fpmath !0
; CHECK-NEXT: [[TMP22:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[TMP21]])
; CHECK-NEXT: [[TMP23:%.*]] = insertelement <2 x float> poison, float [[TMP22]], i64 0
; CHECK-NEXT: [[TMP24:%.*]] = extractelement <2 x float> [[X]], i64 1
; CHECK-NEXT: [[TMP25:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[TMP24]])
; CHECK-NEXT: [[AFN_25ULP:%.*]] = insertelement <2 x float> [[TMP23]], float [[TMP25]], i64 1
; CHECK-NEXT: store volatile <2 x float> [[AFN_25ULP]], ptr addrspace(1) [[OUT]], align 8		; CHECK-NEXT: store volatile <2 x float> [[AFN_25ULP]], ptr addrspace(1) [[OUT]], align 8
; CHECK-NEXT: [[TMP26:%.*]] = extractelement <2 x float> [[X]], i64 0		; CHECK-NEXT: [[FAST_25ULP:%.*]] = fdiv fast <2 x float> <float 1.000000e+00, float 1.000000e+00>, [[X]], !fpmath !0
; CHECK-NEXT: [[TMP27:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[TMP26]])
; CHECK-NEXT: [[TMP28:%.*]] = insertelement <2 x float> poison, float [[TMP27]], i64 0
; CHECK-NEXT: [[TMP29:%.*]] = extractelement <2 x float> [[X]], i64 1
; CHECK-NEXT: [[TMP30:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[TMP29]])
; CHECK-NEXT: [[FAST_25ULP:%.*]] = insertelement <2 x float> [[TMP28]], float [[TMP30]], i64 1
; CHECK-NEXT: store volatile <2 x float> [[FAST_25ULP]], ptr addrspace(1) [[OUT]], align 8		; CHECK-NEXT: store volatile <2 x float> [[FAST_25ULP]], ptr addrspace(1) [[OUT]], align 8
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
%no.md = fdiv <2 x float> <float 1.000000e+00, float 1.000000e+00>, %x		%no.md = fdiv <2 x float> <float 1.000000e+00, float 1.000000e+00>, %x
store volatile <2 x float> %no.md, ptr addrspace(1) %out, align 8		store volatile <2 x float> %no.md, ptr addrspace(1) %out, align 8
%md.half.ulp = fdiv <2 x float> <float 1.000000e+00, float 1.000000e+00>, %x, !fpmath !1		%md.half.ulp = fdiv <2 x float> <float 1.000000e+00, float 1.000000e+00>, %x, !fpmath !1
store volatile <2 x float> %md.half.ulp, ptr addrspace(1) %out, align 8		store volatile <2 x float> %md.half.ulp, ptr addrspace(1) %out, align 8
%afn.no.md = fdiv afn <2 x float> <float 1.000000e+00, float 1.000000e+00>, %x		%afn.no.md = fdiv afn <2 x float> <float 1.000000e+00, float 1.000000e+00>, %x
Show All 12 Lines
; CHECK-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]]) #[[ATTR1]] {		; CHECK-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]]) #[[ATTR1]] {
; CHECK-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X]], i64 0		; CHECK-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X]], i64 0
; CHECK-NEXT: [[TMP2:%.*]] = fdiv float 1.000000e+00, [[TMP1]]		; CHECK-NEXT: [[TMP2:%.*]] = fdiv float 1.000000e+00, [[TMP1]]
; CHECK-NEXT: [[TMP3:%.*]] = insertelement <2 x float> poison, float [[TMP2]], i64 0		; CHECK-NEXT: [[TMP3:%.*]] = insertelement <2 x float> poison, float [[TMP2]], i64 0
; CHECK-NEXT: [[TMP4:%.*]] = extractelement <2 x float> [[X]], i64 1		; CHECK-NEXT: [[TMP4:%.*]] = extractelement <2 x float> [[X]], i64 1
; CHECK-NEXT: [[TMP5:%.*]] = fdiv float 2.000000e+00, [[TMP4]]		; CHECK-NEXT: [[TMP5:%.*]] = fdiv float 2.000000e+00, [[TMP4]]
; CHECK-NEXT: [[NO_MD:%.*]] = insertelement <2 x float> [[TMP3]], float [[TMP5]], i64 1		; CHECK-NEXT: [[NO_MD:%.*]] = insertelement <2 x float> [[TMP3]], float [[TMP5]], i64 1
; CHECK-NEXT: store volatile <2 x float> [[NO_MD]], ptr addrspace(1) [[OUT]], align 8		; CHECK-NEXT: store volatile <2 x float> [[NO_MD]], ptr addrspace(1) [[OUT]], align 8
; CHECK-NEXT: [[TMP6:%.*]] = extractelement <2 x float> [[X]], i64 0		; CHECK-NEXT: [[AFN_NO_MD:%.*]] = fdiv afn <2 x float> <float 1.000000e+00, float 2.000000e+00>, [[X]]
; CHECK-NEXT: [[TMP7:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[TMP6]])
; CHECK-NEXT: [[TMP8:%.*]] = insertelement <2 x float> poison, float [[TMP7]], i64 0
; CHECK-NEXT: [[TMP9:%.*]] = extractelement <2 x float> [[X]], i64 1
; CHECK-NEXT: [[TMP10:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[TMP9]])
; CHECK-NEXT: [[TMP11:%.*]] = fmul afn float 2.000000e+00, [[TMP10]]
; CHECK-NEXT: [[AFN_NO_MD:%.*]] = insertelement <2 x float> [[TMP8]], float [[TMP11]], i64 1
; CHECK-NEXT: store volatile <2 x float> [[AFN_NO_MD]], ptr addrspace(1) [[OUT]], align 8		; CHECK-NEXT: store volatile <2 x float> [[AFN_NO_MD]], ptr addrspace(1) [[OUT]], align 8
; CHECK-NEXT: [[TMP12:%.*]] = extractelement <2 x float> [[X]], i64 0		; CHECK-NEXT: [[FAST_NO_MD:%.*]] = fdiv fast <2 x float> <float 1.000000e+00, float 2.000000e+00>, [[X]]
; CHECK-NEXT: [[TMP13:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[TMP12]])
; CHECK-NEXT: [[TMP14:%.*]] = insertelement <2 x float> poison, float [[TMP13]], i64 0
; CHECK-NEXT: [[TMP15:%.*]] = extractelement <2 x float> [[X]], i64 1
; CHECK-NEXT: [[TMP16:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[TMP15]])
; CHECK-NEXT: [[TMP17:%.*]] = fmul fast float 2.000000e+00, [[TMP16]]
; CHECK-NEXT: [[FAST_NO_MD:%.*]] = insertelement <2 x float> [[TMP14]], float [[TMP17]], i64 1
; CHECK-NEXT: store volatile <2 x float> [[FAST_NO_MD]], ptr addrspace(1) [[OUT]], align 8		; CHECK-NEXT: store volatile <2 x float> [[FAST_NO_MD]], ptr addrspace(1) [[OUT]], align 8
; CHECK-NEXT: [[TMP18:%.*]] = extractelement <2 x float> [[X]], i64 0		; CHECK-NEXT: [[AFN_25ULP:%.*]] = fdiv afn <2 x float> <float 1.000000e+00, float 2.000000e+00>, [[X]], !fpmath !0
; CHECK-NEXT: [[TMP19:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[TMP18]])
; CHECK-NEXT: [[TMP20:%.*]] = insertelement <2 x float> poison, float [[TMP19]], i64 0
; CHECK-NEXT: [[TMP21:%.*]] = extractelement <2 x float> [[X]], i64 1
; CHECK-NEXT: [[TMP22:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[TMP21]])
; CHECK-NEXT: [[TMP23:%.*]] = fmul afn float 2.000000e+00, [[TMP22]]
; CHECK-NEXT: [[AFN_25ULP:%.*]] = insertelement <2 x float> [[TMP20]], float [[TMP23]], i64 1
; CHECK-NEXT: store volatile <2 x float> [[AFN_25ULP]], ptr addrspace(1) [[OUT]], align 8		; CHECK-NEXT: store volatile <2 x float> [[AFN_25ULP]], ptr addrspace(1) [[OUT]], align 8
; CHECK-NEXT: [[TMP24:%.*]] = extractelement <2 x float> [[X]], i64 0		; CHECK-NEXT: [[FAST_25ULP:%.*]] = fdiv fast <2 x float> <float 1.000000e+00, float 2.000000e+00>, [[X]], !fpmath !0
; CHECK-NEXT: [[TMP25:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[TMP24]])
; CHECK-NEXT: [[TMP26:%.*]] = insertelement <2 x float> poison, float [[TMP25]], i64 0
; CHECK-NEXT: [[TMP27:%.*]] = extractelement <2 x float> [[X]], i64 1
; CHECK-NEXT: [[TMP28:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[TMP27]])
; CHECK-NEXT: [[TMP29:%.*]] = fmul fast float 2.000000e+00, [[TMP28]]
; CHECK-NEXT: [[FAST_25ULP:%.*]] = insertelement <2 x float> [[TMP26]], float [[TMP29]], i64 1
; CHECK-NEXT: store volatile <2 x float> [[FAST_25ULP]], ptr addrspace(1) [[OUT]], align 8		; CHECK-NEXT: store volatile <2 x float> [[FAST_25ULP]], ptr addrspace(1) [[OUT]], align 8
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
%no.md = fdiv <2 x float> <float 1.000000e+00, float 2.000000e+00>, %x		%no.md = fdiv <2 x float> <float 1.000000e+00, float 2.000000e+00>, %x
store volatile <2 x float> %no.md, ptr addrspace(1) %out, align 8		store volatile <2 x float> %no.md, ptr addrspace(1) %out, align 8
%afn.no.md = fdiv afn <2 x float> <float 1.000000e+00, float 2.000000e+00>, %x		%afn.no.md = fdiv afn <2 x float> <float 1.000000e+00, float 2.000000e+00>, %x
store volatile <2 x float> %afn.no.md, ptr addrspace(1) %out, align 8		store volatile <2 x float> %afn.no.md, ptr addrspace(1) %out, align 8
%fast.no.md = fdiv fast <2 x float> <float 1.000000e+00, float 2.000000e+00>, %x		%fast.no.md = fdiv fast <2 x float> <float 1.000000e+00, float 2.000000e+00>, %x
store volatile <2 x float> %fast.no.md, ptr addrspace(1) %out, align 8		store volatile <2 x float> %fast.no.md, ptr addrspace(1) %out, align 8
%afn.25ulp = fdiv afn <2 x float> <float 1.000000e+00, float 2.000000e+00>, %x, !fpmath !0		%afn.25ulp = fdiv afn <2 x float> <float 1.000000e+00, float 2.000000e+00>, %x, !fpmath !0
store volatile <2 x float> %afn.25ulp, ptr addrspace(1) %out, align 8		store volatile <2 x float> %afn.25ulp, ptr addrspace(1) %out, align 8
%fast.25ulp = fdiv fast <2 x float> <float 1.000000e+00, float 2.000000e+00>, %x, !fpmath !0		%fast.25ulp = fdiv fast <2 x float> <float 1.000000e+00, float 2.000000e+00>, %x, !fpmath !0
store volatile <2 x float> %fast.25ulp, ptr addrspace(1) %out, align 8		store volatile <2 x float> %fast.25ulp, ptr addrspace(1) %out, align 8
ret void		ret void
}		}

define amdgpu_kernel void @rcp_fdiv_f32_vector_fpmath_partial_constant(ptr addrspace(1) %out, <2 x float> %x, <2 x float> %y) {		define amdgpu_kernel void @rcp_fdiv_f32_vector_fpmath_partial_constant(ptr addrspace(1) %out, <2 x float> %x, <2 x float> %y) {
; CHECK-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_vector_fpmath_partial_constant		; CHECK-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_vector_fpmath_partial_constant
; CHECK-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]], <2 x float> [[Y:%.*]]) #[[ATTR1]] {		; CHECK-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]], <2 x float> [[Y:%.*]]) #[[ATTR1]] {
; CHECK-NEXT: [[X_INSERT:%.*]] = insertelement <2 x float> [[X]], float 1.000000e+00, i32 0		; CHECK-NEXT: [[X_INSERT:%.*]] = insertelement <2 x float> [[X]], float 1.000000e+00, i32 0
; CHECK-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X_INSERT]], i64 0		; CHECK-NEXT: [[AFN_25ULP:%.*]] = fdiv afn <2 x float> [[X_INSERT]], [[Y]], !fpmath !0
; CHECK-NEXT: [[TMP2:%.*]] = extractelement <2 x float> [[Y]], i64 0
; CHECK-NEXT: [[TMP3:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[TMP2]])
; CHECK-NEXT: [[TMP4:%.*]] = fmul afn float [[TMP1]], [[TMP3]]
; CHECK-NEXT: [[TMP5:%.*]] = insertelement <2 x float> poison, float [[TMP4]], i64 0
; CHECK-NEXT: [[TMP6:%.*]] = extractelement <2 x float> [[X_INSERT]], i64 1
; CHECK-NEXT: [[TMP7:%.*]] = extractelement <2 x float> [[Y]], i64 1
; CHECK-NEXT: [[TMP8:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[TMP7]])
; CHECK-NEXT: [[TMP9:%.*]] = fmul afn float [[TMP6]], [[TMP8]]
; CHECK-NEXT: [[AFN_25ULP:%.*]] = insertelement <2 x float> [[TMP5]], float [[TMP9]], i64 1
; CHECK-NEXT: store volatile <2 x float> [[AFN_25ULP]], ptr addrspace(1) [[OUT]], align 8		; CHECK-NEXT: store volatile <2 x float> [[AFN_25ULP]], ptr addrspace(1) [[OUT]], align 8
; CHECK-NEXT: [[TMP10:%.*]] = extractelement <2 x float> [[X_INSERT]], i64 0		; CHECK-NEXT: [[FAST_25ULP:%.*]] = fdiv fast <2 x float> [[X_INSERT]], [[Y]], !fpmath !0
; CHECK-NEXT: [[TMP11:%.*]] = extractelement <2 x float> [[Y]], i64 0
; CHECK-NEXT: [[TMP12:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[TMP11]])
; CHECK-NEXT: [[TMP13:%.*]] = fmul fast float [[TMP10]], [[TMP12]]
; CHECK-NEXT: [[TMP14:%.*]] = insertelement <2 x float> poison, float [[TMP13]], i64 0
; CHECK-NEXT: [[TMP15:%.*]] = extractelement <2 x float> [[X_INSERT]], i64 1
; CHECK-NEXT: [[TMP16:%.*]] = extractelement <2 x float> [[Y]], i64 1
; CHECK-NEXT: [[TMP17:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[TMP16]])
; CHECK-NEXT: [[TMP18:%.*]] = fmul fast float [[TMP15]], [[TMP17]]
; CHECK-NEXT: [[FAST_25ULP:%.*]] = insertelement <2 x float> [[TMP14]], float [[TMP18]], i64 1
; CHECK-NEXT: store volatile <2 x float> [[FAST_25ULP]], ptr addrspace(1) [[OUT]], align 8		; CHECK-NEXT: store volatile <2 x float> [[FAST_25ULP]], ptr addrspace(1) [[OUT]], align 8
; CHECK-NEXT: ret void		; CHECK-NEXT: ret void
;		;
%x.insert = insertelement <2 x float> %x, float 1.000000e+00, i32 0		%x.insert = insertelement <2 x float> %x, float 1.000000e+00, i32 0
%afn.25ulp = fdiv afn <2 x float> %x.insert, %y, !fpmath !0		%afn.25ulp = fdiv afn <2 x float> %x.insert, %y, !fpmath !0
store volatile <2 x float> %afn.25ulp, ptr addrspace(1) %out, align 8		store volatile <2 x float> %afn.25ulp, ptr addrspace(1) %out, align 8
%fast.25ulp = fdiv fast <2 x float> %x.insert, %y, !fpmath !0		%fast.25ulp = fdiv fast <2 x float> %x.insert, %y, !fpmath !0
store volatile <2 x float> %fast.25ulp, ptr addrspace(1) %out, align 8		store volatile <2 x float> %fast.25ulp, ptr addrspace(1) %out, align 8
ret void		ret void
}		}

define amdgpu_kernel void @rcp_fdiv_f32_vector_fpmath_partial_constant_arcp(ptr addrspace(1) %out, <2 x float> %x, <2 x float> %y) {		define amdgpu_kernel void @rcp_fdiv_f32_vector_fpmath_partial_constant_arcp(ptr addrspace(1) %out, <2 x float> %x, <2 x float> %y) {
; IEEE-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_vector_fpmath_partial_constant_arcp		; IEEE-GOODFREXP-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_vector_fpmath_partial_constant_arcp
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]], <2 x float> [[Y:%.*]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]], <2 x float> [[Y:%.*]]) #[[ATTR1]] {
; IEEE-NEXT: [[X_INSERT:%.*]] = insertelement <2 x float> [[X]], float 1.000000e+00, i32 0		; IEEE-GOODFREXP-NEXT: [[X_INSERT:%.*]] = insertelement <2 x float> [[X]], float 1.000000e+00, i32 0
; IEEE-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X_INSERT]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X_INSERT]], i64 0
; IEEE-NEXT: [[TMP2:%.*]] = extractelement <2 x float> [[Y]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = extractelement <2 x float> [[Y]], i64 0
; IEEE-NEXT: [[TMP3:%.*]] = fdiv arcp float [[TMP1]], [[TMP2]]		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP2]])
; IEEE-NEXT: [[TMP4:%.*]] = insertelement <2 x float> poison, float [[TMP3]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = extractvalue { float, i32 } [[TMP3]], 0
; IEEE-NEXT: [[TMP5:%.*]] = extractelement <2 x float> [[X_INSERT]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = extractvalue { float, i32 } [[TMP3]], 1
; IEEE-NEXT: [[TMP6:%.*]] = extractelement <2 x float> [[Y]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = sub i32 0, [[TMP5]]
; IEEE-NEXT: [[TMP7:%.*]] = fdiv arcp float [[TMP5]], [[TMP6]]		; IEEE-GOODFREXP-NEXT: [[TMP7:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP4]])
; IEEE-NEXT: [[ARCP_25ULP:%.*]] = insertelement <2 x float> [[TMP4]], float [[TMP7]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP8:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP7]], i32 [[TMP6]])
; IEEE-NEXT: store volatile <2 x float> [[ARCP_25ULP]], ptr addrspace(1) [[OUT]], align 8		; IEEE-GOODFREXP-NEXT: [[TMP9:%.*]] = fmul arcp float [[TMP1]], [[TMP8]]
; IEEE-NEXT: ret void		; IEEE-GOODFREXP-NEXT: [[TMP10:%.*]] = insertelement <2 x float> poison, float [[TMP9]], i64 0
		; IEEE-GOODFREXP-NEXT: [[TMP11:%.*]] = extractelement <2 x float> [[X_INSERT]], i64 1
		; IEEE-GOODFREXP-NEXT: [[TMP12:%.*]] = extractelement <2 x float> [[Y]], i64 1
		; IEEE-GOODFREXP-NEXT: [[TMP13:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP12]])
		; IEEE-GOODFREXP-NEXT: [[TMP14:%.*]] = extractvalue { float, i32 } [[TMP13]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP15:%.*]] = extractvalue { float, i32 } [[TMP13]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP16:%.*]] = sub i32 0, [[TMP15]]
		; IEEE-GOODFREXP-NEXT: [[TMP17:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP14]])
		; IEEE-GOODFREXP-NEXT: [[TMP18:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP17]], i32 [[TMP16]])
		; IEEE-GOODFREXP-NEXT: [[TMP19:%.*]] = fmul arcp float [[TMP11]], [[TMP18]]
		; IEEE-GOODFREXP-NEXT: [[ARCP_25ULP:%.*]] = insertelement <2 x float> [[TMP10]], float [[TMP19]], i64 1
		; IEEE-GOODFREXP-NEXT: store volatile <2 x float> [[ARCP_25ULP]], ptr addrspace(1) [[OUT]], align 8
		; IEEE-GOODFREXP-NEXT: ret void
		;
		; IEEE-BADFREXP-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_vector_fpmath_partial_constant_arcp
		; IEEE-BADFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]], <2 x float> [[Y:%.*]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[X_INSERT:%.*]] = insertelement <2 x float> [[X]], float 1.000000e+00, i32 0
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X_INSERT]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = extractelement <2 x float> [[Y]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = extractvalue { float, i32 } [[TMP3]], 0
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = sub i32 0, [[TMP5]]
		; IEEE-BADFREXP-NEXT: [[TMP7:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP4]])
		; IEEE-BADFREXP-NEXT: [[TMP8:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP7]], i32 [[TMP6]])
		; IEEE-BADFREXP-NEXT: [[TMP9:%.*]] = fmul arcp float [[TMP1]], [[TMP8]]
		; IEEE-BADFREXP-NEXT: [[TMP10:%.*]] = insertelement <2 x float> poison, float [[TMP9]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP11:%.*]] = extractelement <2 x float> [[X_INSERT]], i64 1
		; IEEE-BADFREXP-NEXT: [[TMP12:%.*]] = extractelement <2 x float> [[Y]], i64 1
		; IEEE-BADFREXP-NEXT: [[TMP13:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP12]])
		; IEEE-BADFREXP-NEXT: [[TMP14:%.*]] = extractvalue { float, i32 } [[TMP13]], 0
		; IEEE-BADFREXP-NEXT: [[TMP15:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP12]])
		; IEEE-BADFREXP-NEXT: [[TMP16:%.*]] = sub i32 0, [[TMP15]]
		; IEEE-BADFREXP-NEXT: [[TMP17:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP14]])
		; IEEE-BADFREXP-NEXT: [[TMP18:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP17]], i32 [[TMP16]])
		; IEEE-BADFREXP-NEXT: [[TMP19:%.*]] = fmul arcp float [[TMP11]], [[TMP18]]
		; IEEE-BADFREXP-NEXT: [[ARCP_25ULP:%.*]] = insertelement <2 x float> [[TMP10]], float [[TMP19]], i64 1
		; IEEE-BADFREXP-NEXT: store volatile <2 x float> [[ARCP_25ULP]], ptr addrspace(1) [[OUT]], align 8
		; IEEE-BADFREXP-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_vector_fpmath_partial_constant_arcp		; DAZ-LABEL: define amdgpu_kernel void @rcp_fdiv_f32_vector_fpmath_partial_constant_arcp
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]], <2 x float> [[Y:%.*]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]], <2 x float> [[Y:%.*]]) #[[ATTR1]] {
; DAZ-NEXT: [[X_INSERT:%.*]] = insertelement <2 x float> [[X]], float 1.000000e+00, i32 0		; DAZ-NEXT: [[X_INSERT:%.*]] = insertelement <2 x float> [[X]], float 1.000000e+00, i32 0
; DAZ-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X_INSERT]], i64 0		; DAZ-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X_INSERT]], i64 0
; DAZ-NEXT: [[TMP2:%.*]] = extractelement <2 x float> [[Y]], i64 0		; DAZ-NEXT: [[TMP2:%.*]] = extractelement <2 x float> [[Y]], i64 0
; DAZ-NEXT: [[TMP3:%.*]] = call arcp float @llvm.amdgcn.fdiv.fast(float [[TMP1]], float [[TMP2]])		; DAZ-NEXT: [[TMP3:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP2]])
; DAZ-NEXT: [[TMP4:%.*]] = insertelement <2 x float> poison, float [[TMP3]], i64 0		; DAZ-NEXT: [[TMP4:%.*]] = fmul arcp float [[TMP1]], [[TMP3]]
; DAZ-NEXT: [[TMP5:%.*]] = extractelement <2 x float> [[X_INSERT]], i64 1		; DAZ-NEXT: [[TMP5:%.*]] = insertelement <2 x float> poison, float [[TMP4]], i64 0
; DAZ-NEXT: [[TMP6:%.*]] = extractelement <2 x float> [[Y]], i64 1		; DAZ-NEXT: [[TMP6:%.*]] = extractelement <2 x float> [[X_INSERT]], i64 1
; DAZ-NEXT: [[TMP7:%.*]] = call arcp float @llvm.amdgcn.fdiv.fast(float [[TMP5]], float [[TMP6]])		; DAZ-NEXT: [[TMP7:%.*]] = extractelement <2 x float> [[Y]], i64 1
; DAZ-NEXT: [[ARCP_25ULP:%.*]] = insertelement <2 x float> [[TMP4]], float [[TMP7]], i64 1		; DAZ-NEXT: [[TMP8:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP7]])
		; DAZ-NEXT: [[TMP9:%.*]] = fmul arcp float [[TMP6]], [[TMP8]]
		; DAZ-NEXT: [[ARCP_25ULP:%.*]] = insertelement <2 x float> [[TMP5]], float [[TMP9]], i64 1
; DAZ-NEXT: store volatile <2 x float> [[ARCP_25ULP]], ptr addrspace(1) [[OUT]], align 8		; DAZ-NEXT: store volatile <2 x float> [[ARCP_25ULP]], ptr addrspace(1) [[OUT]], align 8
; DAZ-NEXT: ret void		; DAZ-NEXT: ret void
;		;
%x.insert = insertelement <2 x float> %x, float 1.000000e+00, i32 0		%x.insert = insertelement <2 x float> %x, float 1.000000e+00, i32 0
%arcp.25ulp = fdiv arcp <2 x float> %x.insert, %y, !fpmath !0		%arcp.25ulp = fdiv arcp <2 x float> %x.insert, %y, !fpmath !0
store volatile <2 x float> %arcp.25ulp, ptr addrspace(1) %out, align 8		store volatile <2 x float> %arcp.25ulp, ptr addrspace(1) %out, align 8
ret void		ret void
}		}

define amdgpu_kernel void @rsq_f32_fpmath(ptr addrspace(1) %out, float %x) {		define amdgpu_kernel void @rsq_f32_fpmath(ptr addrspace(1) %out, float %x) {
; IEEE-LABEL: define amdgpu_kernel void @rsq_f32_fpmath		; IEEE-GOODFREXP-LABEL: define amdgpu_kernel void @rsq_f32_fpmath
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {
; IEEE-NEXT: [[SQRT_X_NO_MD:%.*]] = call contract float @llvm.sqrt.f32(float [[X]])		; IEEE-GOODFREXP-NEXT: [[SQRT_X_NO_MD:%.*]] = call contract float @llvm.sqrt.f32(float [[X]])
; IEEE-NEXT: [[NO_MD:%.*]] = fdiv contract float 1.000000e+00, [[SQRT_X_NO_MD]]		; IEEE-GOODFREXP-NEXT: [[NO_MD:%.*]] = fdiv contract float 1.000000e+00, [[SQRT_X_NO_MD]]
; IEEE-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[SQRT_MD_1ULP:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = fcmp contract olt float [[X]], 0x3810000000000000
; IEEE-NEXT: [[MD_1ULP:%.*]] = fdiv contract float 1.000000e+00, [[SQRT_MD_1ULP]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = select contract i1 [[TMP1]], float 0x4170000000000000, float 1.000000e+00
; IEEE-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = fmul contract float [[X]], [[TMP2]]
; IEEE-NEXT: [[SQRT_MD_1ULP_MULTI_USE:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP3]])
; IEEE-NEXT: store volatile float [[SQRT_MD_1ULP_MULTI_USE]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = select contract i1 [[TMP1]], float 4.096000e+03, float 1.000000e+00
; IEEE-NEXT: [[MD_1ULP_MULTI_USE:%.*]] = fdiv contract float 1.000000e+00, [[SQRT_MD_1ULP_MULTI_USE]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[MD_1ULP:%.*]] = fmul contract float [[TMP4]], [[TMP5]]
; IEEE-NEXT: store volatile float [[MD_1ULP_MULTI_USE]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[SQRT_MD_25ULP:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !0		; IEEE-GOODFREXP-NEXT: [[SQRT_MD_1ULP_MULTI_USE:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !2
; IEEE-NEXT: [[MD_25ULP:%.*]] = call contract float @llvm.amdgcn.fdiv.fast(float 1.000000e+00, float [[SQRT_MD_25ULP]])		; IEEE-GOODFREXP-NEXT: store volatile float [[SQRT_MD_1ULP_MULTI_USE]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[SQRT_MD_1ULP_MULTI_USE]])
; IEEE-NEXT: [[SQRT_MD_HALF_ULP:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !1		; IEEE-GOODFREXP-NEXT: [[TMP7:%.*]] = extractvalue { float, i32 } [[TMP6]], 0
; IEEE-NEXT: [[MD_HALF_ULP:%.*]] = fdiv contract float 1.000000e+00, [[SQRT_MD_HALF_ULP]], !fpmath !1		; IEEE-GOODFREXP-NEXT: [[TMP8:%.*]] = extractvalue { float, i32 } [[TMP6]], 1
; IEEE-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP9:%.*]] = sub i32 0, [[TMP8]]
; IEEE-NEXT: [[SQRT_X_AFN_NO_MD:%.*]] = call contract afn float @llvm.sqrt.f32(float [[X]])		; IEEE-GOODFREXP-NEXT: [[TMP10:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP7]])
; IEEE-NEXT: [[AFN_NO_MD:%.*]] = call contract afn float @llvm.amdgcn.rcp.f32(float [[SQRT_X_AFN_NO_MD]])		; IEEE-GOODFREXP-NEXT: [[MD_1ULP_MULTI_USE:%.*]] = call contract float @llvm.ldexp.f32.i32(float [[TMP10]], i32 [[TMP9]])
; IEEE-NEXT: store volatile float [[AFN_NO_MD]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_1ULP_MULTI_USE]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[SQRT_X_AFN_25ULP:%.*]] = call contract afn float @llvm.sqrt.f32(float [[X]]), !fpmath !0		; IEEE-GOODFREXP-NEXT: [[TMP11:%.*]] = fcmp contract olt float [[X]], 0x3810000000000000
; IEEE-NEXT: [[AFN_25ULP:%.*]] = call contract afn float @llvm.amdgcn.rcp.f32(float [[SQRT_X_AFN_25ULP]])		; IEEE-GOODFREXP-NEXT: [[TMP12:%.*]] = select contract i1 [[TMP11]], float 0x4170000000000000, float 1.000000e+00
; IEEE-NEXT: store volatile float [[AFN_25ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP13:%.*]] = fmul contract float [[X]], [[TMP12]]
; IEEE-NEXT: [[SQRT_X_FAST_NO_MD:%.*]] = call fast float @llvm.sqrt.f32(float [[X]])		; IEEE-GOODFREXP-NEXT: [[TMP14:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP13]])
; IEEE-NEXT: [[FAST_NO_MD:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[SQRT_X_FAST_NO_MD]])		; IEEE-GOODFREXP-NEXT: [[TMP15:%.*]] = select contract i1 [[TMP11]], float 4.096000e+03, float 1.000000e+00
; IEEE-NEXT: store volatile float [[FAST_NO_MD]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[MD_25ULP:%.*]] = fmul contract float [[TMP14]], [[TMP15]]
; IEEE-NEXT: [[SQRT_X_FAST_25ULP:%.*]] = call fast float @llvm.sqrt.f32(float [[X]]), !fpmath !0		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[FAST_25ULP:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[SQRT_X_FAST_25ULP]])		; IEEE-GOODFREXP-NEXT: [[SQRT_MD_HALF_ULP:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !1
; IEEE-NEXT: store volatile float [[FAST_25ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[MD_HALF_ULP:%.*]] = fdiv contract float 1.000000e+00, [[SQRT_MD_HALF_ULP]], !fpmath !1
; IEEE-NEXT: [[SQRT_X_3ULP:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !3		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[FDIV_OPENCL:%.*]] = call contract float @llvm.amdgcn.fdiv.fast(float 1.000000e+00, float [[SQRT_X_3ULP]])		; IEEE-GOODFREXP-NEXT: [[SQRT_X_AFN_NO_MD:%.*]] = call contract afn float @llvm.sqrt.f32(float [[X]])
; IEEE-NEXT: store volatile float [[FDIV_OPENCL]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[AFN_NO_MD:%.*]] = fdiv contract afn float 1.000000e+00, [[SQRT_X_AFN_NO_MD]]
; IEEE-NEXT: [[NEG_SQRT_X_3ULP:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !3		; IEEE-GOODFREXP-NEXT: store volatile float [[AFN_NO_MD]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[NEG_FDIV_OPENCL:%.*]] = call contract float @llvm.amdgcn.fdiv.fast(float -1.000000e+00, float [[NEG_SQRT_X_3ULP]])		; IEEE-GOODFREXP-NEXT: [[SQRT_X_AFN_25ULP:%.*]] = call contract afn float @llvm.sqrt.f32(float [[X]]), !fpmath !0
; IEEE-NEXT: store volatile float [[NEG_FDIV_OPENCL]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[AFN_25ULP:%.*]] = fdiv contract afn float 1.000000e+00, [[SQRT_X_AFN_25ULP]], !fpmath !0
; IEEE-NEXT: [[SQRT_X_HALF_ULP:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !1		; IEEE-GOODFREXP-NEXT: store volatile float [[AFN_25ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[FDIV_SQRT_MISMATCH_MD0:%.*]] = call contract float @llvm.amdgcn.fdiv.fast(float 1.000000e+00, float [[SQRT_X_HALF_ULP]])		; IEEE-GOODFREXP-NEXT: [[SQRT_X_FAST_NO_MD:%.*]] = call fast float @llvm.sqrt.f32(float [[X]])
; IEEE-NEXT: store volatile float [[FDIV_SQRT_MISMATCH_MD0]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[FAST_NO_MD:%.*]] = fdiv fast float 1.000000e+00, [[SQRT_X_FAST_NO_MD]]
; IEEE-NEXT: [[SQRT_MISMATCH_MD1:%.*]] = call afn float @llvm.sqrt.f32(float [[X]])		; IEEE-GOODFREXP-NEXT: store volatile float [[FAST_NO_MD]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[FDIV_SQRT_MISMATCH_MD1:%.*]] = call contract float @llvm.amdgcn.fdiv.fast(float 1.000000e+00, float [[SQRT_MISMATCH_MD1]])		; IEEE-GOODFREXP-NEXT: [[SQRT_X_FAST_25ULP:%.*]] = call fast float @llvm.sqrt.f32(float [[X]]), !fpmath !0
; IEEE-NEXT: store volatile float [[FDIV_SQRT_MISMATCH_MD1]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[FAST_25ULP:%.*]] = fdiv fast float 1.000000e+00, [[SQRT_X_FAST_25ULP]], !fpmath !0
; IEEE-NEXT: [[SQRT_MISMATCH_MD2:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !3		; IEEE-GOODFREXP-NEXT: store volatile float [[FAST_25ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[FDIV_SQRT_MISMATCH_MD2:%.*]] = call contract afn float @llvm.amdgcn.rcp.f32(float [[SQRT_MISMATCH_MD2]])		; IEEE-GOODFREXP-NEXT: [[TMP16:%.*]] = fcmp contract olt float [[X]], 0x3810000000000000
; IEEE-NEXT: store volatile float [[FDIV_SQRT_MISMATCH_MD2]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP17:%.*]] = select contract i1 [[TMP16]], float 0x4170000000000000, float 1.000000e+00
; IEEE-NEXT: ret void		; IEEE-GOODFREXP-NEXT: [[TMP18:%.*]] = fmul contract float [[X]], [[TMP17]]
		; IEEE-GOODFREXP-NEXT: [[TMP19:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP18]])
		; IEEE-GOODFREXP-NEXT: [[TMP20:%.*]] = select contract i1 [[TMP16]], float 4.096000e+03, float 1.000000e+00
		; IEEE-GOODFREXP-NEXT: [[FDIV_OPENCL:%.*]] = fmul contract float [[TMP19]], [[TMP20]]
		; IEEE-GOODFREXP-NEXT: store volatile float [[FDIV_OPENCL]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: [[TMP21:%.*]] = fcmp contract olt float [[X]], 0x3810000000000000
		; IEEE-GOODFREXP-NEXT: [[TMP22:%.*]] = select contract i1 [[TMP21]], float 0x4170000000000000, float 1.000000e+00
		; IEEE-GOODFREXP-NEXT: [[TMP23:%.*]] = fmul contract float [[X]], [[TMP22]]
		; IEEE-GOODFREXP-NEXT: [[TMP24:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP23]])
		; IEEE-GOODFREXP-NEXT: [[TMP25:%.*]] = select contract i1 [[TMP21]], float -4.096000e+03, float -1.000000e+00
		; IEEE-GOODFREXP-NEXT: [[NEG_FDIV_OPENCL:%.*]] = fmul contract float [[TMP24]], [[TMP25]]
		; IEEE-GOODFREXP-NEXT: store volatile float [[NEG_FDIV_OPENCL]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: [[SQRT_X_HALF_ULP:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !1
		; IEEE-GOODFREXP-NEXT: [[TMP26:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[SQRT_X_HALF_ULP]])
		; IEEE-GOODFREXP-NEXT: [[TMP27:%.*]] = extractvalue { float, i32 } [[TMP26]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP28:%.*]] = extractvalue { float, i32 } [[TMP26]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP29:%.*]] = sub i32 0, [[TMP28]]
		; IEEE-GOODFREXP-NEXT: [[TMP30:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP27]])
		; IEEE-GOODFREXP-NEXT: [[FDIV_SQRT_MISMATCH_MD0:%.*]] = call contract float @llvm.ldexp.f32.i32(float [[TMP30]], i32 [[TMP29]])
		; IEEE-GOODFREXP-NEXT: store volatile float [[FDIV_SQRT_MISMATCH_MD0]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: [[SQRT_MISMATCH_MD1:%.*]] = call afn float @llvm.sqrt.f32(float [[X]])
		; IEEE-GOODFREXP-NEXT: [[TMP31:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[SQRT_MISMATCH_MD1]])
		; IEEE-GOODFREXP-NEXT: [[TMP32:%.*]] = extractvalue { float, i32 } [[TMP31]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP33:%.*]] = extractvalue { float, i32 } [[TMP31]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP34:%.*]] = sub i32 0, [[TMP33]]
		; IEEE-GOODFREXP-NEXT: [[TMP35:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP32]])
		; IEEE-GOODFREXP-NEXT: [[FDIV_SQRT_MISMATCH_MD1:%.*]] = call contract float @llvm.ldexp.f32.i32(float [[TMP35]], i32 [[TMP34]])
		; IEEE-GOODFREXP-NEXT: store volatile float [[FDIV_SQRT_MISMATCH_MD1]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: [[SQRT_MISMATCH_MD2:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !3
		; IEEE-GOODFREXP-NEXT: [[FDIV_SQRT_MISMATCH_MD2:%.*]] = fdiv contract afn float 1.000000e+00, [[SQRT_MISMATCH_MD2]]
		; IEEE-GOODFREXP-NEXT: store volatile float [[FDIV_SQRT_MISMATCH_MD2]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: ret void
		;
		; IEEE-BADFREXP-LABEL: define amdgpu_kernel void @rsq_f32_fpmath
		; IEEE-BADFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[SQRT_X_NO_MD:%.*]] = call contract float @llvm.sqrt.f32(float [[X]])
		; IEEE-BADFREXP-NEXT: [[NO_MD:%.*]] = fdiv contract float 1.000000e+00, [[SQRT_X_NO_MD]]
		; IEEE-BADFREXP-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = fcmp contract olt float [[X]], 0x3810000000000000
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = select contract i1 [[TMP1]], float 0x4170000000000000, float 1.000000e+00
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = fmul contract float [[X]], [[TMP2]]
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP3]])
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = select contract i1 [[TMP1]], float 4.096000e+03, float 1.000000e+00
		; IEEE-BADFREXP-NEXT: [[MD_1ULP:%.*]] = fmul contract float [[TMP4]], [[TMP5]]
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[SQRT_MD_1ULP_MULTI_USE:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !2
		; IEEE-BADFREXP-NEXT: store volatile float [[SQRT_MD_1ULP_MULTI_USE]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[SQRT_MD_1ULP_MULTI_USE]])
		; IEEE-BADFREXP-NEXT: [[TMP7:%.*]] = extractvalue { float, i32 } [[TMP6]], 0
		; IEEE-BADFREXP-NEXT: [[TMP8:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[SQRT_MD_1ULP_MULTI_USE]])
		; IEEE-BADFREXP-NEXT: [[TMP9:%.*]] = sub i32 0, [[TMP8]]
		; IEEE-BADFREXP-NEXT: [[TMP10:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP7]])
		; IEEE-BADFREXP-NEXT: [[MD_1ULP_MULTI_USE:%.*]] = call contract float @llvm.ldexp.f32.i32(float [[TMP10]], i32 [[TMP9]])
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_1ULP_MULTI_USE]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP11:%.*]] = fcmp contract olt float [[X]], 0x3810000000000000
		; IEEE-BADFREXP-NEXT: [[TMP12:%.*]] = select contract i1 [[TMP11]], float 0x4170000000000000, float 1.000000e+00
		; IEEE-BADFREXP-NEXT: [[TMP13:%.*]] = fmul contract float [[X]], [[TMP12]]
		; IEEE-BADFREXP-NEXT: [[TMP14:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP13]])
		; IEEE-BADFREXP-NEXT: [[TMP15:%.*]] = select contract i1 [[TMP11]], float 4.096000e+03, float 1.000000e+00
		; IEEE-BADFREXP-NEXT: [[MD_25ULP:%.*]] = fmul contract float [[TMP14]], [[TMP15]]
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[SQRT_MD_HALF_ULP:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !1
		; IEEE-BADFREXP-NEXT: [[MD_HALF_ULP:%.*]] = fdiv contract float 1.000000e+00, [[SQRT_MD_HALF_ULP]], !fpmath !1
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[SQRT_X_AFN_NO_MD:%.*]] = call contract afn float @llvm.sqrt.f32(float [[X]])
		; IEEE-BADFREXP-NEXT: [[AFN_NO_MD:%.*]] = fdiv contract afn float 1.000000e+00, [[SQRT_X_AFN_NO_MD]]
		; IEEE-BADFREXP-NEXT: store volatile float [[AFN_NO_MD]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[SQRT_X_AFN_25ULP:%.*]] = call contract afn float @llvm.sqrt.f32(float [[X]]), !fpmath !0
		; IEEE-BADFREXP-NEXT: [[AFN_25ULP:%.*]] = fdiv contract afn float 1.000000e+00, [[SQRT_X_AFN_25ULP]], !fpmath !0
		; IEEE-BADFREXP-NEXT: store volatile float [[AFN_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[SQRT_X_FAST_NO_MD:%.*]] = call fast float @llvm.sqrt.f32(float [[X]])
		; IEEE-BADFREXP-NEXT: [[FAST_NO_MD:%.*]] = fdiv fast float 1.000000e+00, [[SQRT_X_FAST_NO_MD]]
		; IEEE-BADFREXP-NEXT: store volatile float [[FAST_NO_MD]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[SQRT_X_FAST_25ULP:%.*]] = call fast float @llvm.sqrt.f32(float [[X]]), !fpmath !0
		; IEEE-BADFREXP-NEXT: [[FAST_25ULP:%.*]] = fdiv fast float 1.000000e+00, [[SQRT_X_FAST_25ULP]], !fpmath !0
		; IEEE-BADFREXP-NEXT: store volatile float [[FAST_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP16:%.*]] = fcmp contract olt float [[X]], 0x3810000000000000
		; IEEE-BADFREXP-NEXT: [[TMP17:%.*]] = select contract i1 [[TMP16]], float 0x4170000000000000, float 1.000000e+00
		; IEEE-BADFREXP-NEXT: [[TMP18:%.*]] = fmul contract float [[X]], [[TMP17]]
		; IEEE-BADFREXP-NEXT: [[TMP19:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP18]])
		; IEEE-BADFREXP-NEXT: [[TMP20:%.*]] = select contract i1 [[TMP16]], float 4.096000e+03, float 1.000000e+00
		; IEEE-BADFREXP-NEXT: [[FDIV_OPENCL:%.*]] = fmul contract float [[TMP19]], [[TMP20]]
		; IEEE-BADFREXP-NEXT: store volatile float [[FDIV_OPENCL]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP21:%.*]] = fcmp contract olt float [[X]], 0x3810000000000000
		; IEEE-BADFREXP-NEXT: [[TMP22:%.*]] = select contract i1 [[TMP21]], float 0x4170000000000000, float 1.000000e+00
		; IEEE-BADFREXP-NEXT: [[TMP23:%.*]] = fmul contract float [[X]], [[TMP22]]
		; IEEE-BADFREXP-NEXT: [[TMP24:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP23]])
		; IEEE-BADFREXP-NEXT: [[TMP25:%.*]] = select contract i1 [[TMP21]], float -4.096000e+03, float -1.000000e+00
		; IEEE-BADFREXP-NEXT: [[NEG_FDIV_OPENCL:%.*]] = fmul contract float [[TMP24]], [[TMP25]]
		; IEEE-BADFREXP-NEXT: store volatile float [[NEG_FDIV_OPENCL]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[SQRT_X_HALF_ULP:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !1
		; IEEE-BADFREXP-NEXT: [[TMP26:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[SQRT_X_HALF_ULP]])
		; IEEE-BADFREXP-NEXT: [[TMP27:%.*]] = extractvalue { float, i32 } [[TMP26]], 0
		; IEEE-BADFREXP-NEXT: [[TMP28:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[SQRT_X_HALF_ULP]])
		; IEEE-BADFREXP-NEXT: [[TMP29:%.*]] = sub i32 0, [[TMP28]]
		; IEEE-BADFREXP-NEXT: [[TMP30:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP27]])
		; IEEE-BADFREXP-NEXT: [[FDIV_SQRT_MISMATCH_MD0:%.*]] = call contract float @llvm.ldexp.f32.i32(float [[TMP30]], i32 [[TMP29]])
		; IEEE-BADFREXP-NEXT: store volatile float [[FDIV_SQRT_MISMATCH_MD0]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[SQRT_MISMATCH_MD1:%.*]] = call afn float @llvm.sqrt.f32(float [[X]])
		; IEEE-BADFREXP-NEXT: [[TMP31:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[SQRT_MISMATCH_MD1]])
		; IEEE-BADFREXP-NEXT: [[TMP32:%.*]] = extractvalue { float, i32 } [[TMP31]], 0
		; IEEE-BADFREXP-NEXT: [[TMP33:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[SQRT_MISMATCH_MD1]])
		; IEEE-BADFREXP-NEXT: [[TMP34:%.*]] = sub i32 0, [[TMP33]]
		; IEEE-BADFREXP-NEXT: [[TMP35:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP32]])
		; IEEE-BADFREXP-NEXT: [[FDIV_SQRT_MISMATCH_MD1:%.*]] = call contract float @llvm.ldexp.f32.i32(float [[TMP35]], i32 [[TMP34]])
		; IEEE-BADFREXP-NEXT: store volatile float [[FDIV_SQRT_MISMATCH_MD1]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[SQRT_MISMATCH_MD2:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !3
		; IEEE-BADFREXP-NEXT: [[FDIV_SQRT_MISMATCH_MD2:%.*]] = fdiv contract afn float 1.000000e+00, [[SQRT_MISMATCH_MD2]]
		; IEEE-BADFREXP-NEXT: store volatile float [[FDIV_SQRT_MISMATCH_MD2]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @rsq_f32_fpmath		; DAZ-LABEL: define amdgpu_kernel void @rsq_f32_fpmath
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {
; DAZ-NEXT: [[SQRT_X_NO_MD:%.*]] = call contract float @llvm.sqrt.f32(float [[X]])		; DAZ-NEXT: [[SQRT_X_NO_MD:%.*]] = call contract float @llvm.sqrt.f32(float [[X]])
; DAZ-NEXT: [[NO_MD:%.*]] = fdiv contract float 1.000000e+00, [[SQRT_X_NO_MD]]		; DAZ-NEXT: [[NO_MD:%.*]] = fdiv contract float 1.000000e+00, [[SQRT_X_NO_MD]]
; DAZ-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_MD_1ULP:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !2		; DAZ-NEXT: [[MD_1ULP:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[X]])
; DAZ-NEXT: [[MD_1ULP:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[SQRT_MD_1ULP]])
; DAZ-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_MD_1ULP_MULTI_USE:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !2		; DAZ-NEXT: [[SQRT_MD_1ULP_MULTI_USE:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !2
; DAZ-NEXT: store volatile float [[SQRT_MD_1ULP_MULTI_USE]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[SQRT_MD_1ULP_MULTI_USE]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[MD_1ULP_MULTI_USE:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[SQRT_MD_1ULP_MULTI_USE]])		; DAZ-NEXT: [[MD_1ULP_MULTI_USE:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[SQRT_MD_1ULP_MULTI_USE]])
; DAZ-NEXT: store volatile float [[MD_1ULP_MULTI_USE]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_1ULP_MULTI_USE]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_MD_25ULP:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !0		; DAZ-NEXT: [[MD_25ULP:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[X]])
; DAZ-NEXT: [[MD_25ULP:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[SQRT_MD_25ULP]])
; DAZ-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_MD_HALF_ULP:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !1		; DAZ-NEXT: [[SQRT_MD_HALF_ULP:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !1
; DAZ-NEXT: [[MD_HALF_ULP:%.*]] = fdiv contract float 1.000000e+00, [[SQRT_MD_HALF_ULP]], !fpmath !1		; DAZ-NEXT: [[MD_HALF_ULP:%.*]] = fdiv contract float 1.000000e+00, [[SQRT_MD_HALF_ULP]], !fpmath !1
; DAZ-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_X_AFN_NO_MD:%.*]] = call contract afn float @llvm.sqrt.f32(float [[X]])		; DAZ-NEXT: [[SQRT_X_AFN_NO_MD:%.*]] = call contract afn float @llvm.sqrt.f32(float [[X]])
; DAZ-NEXT: [[AFN_NO_MD:%.*]] = call contract afn float @llvm.amdgcn.rcp.f32(float [[SQRT_X_AFN_NO_MD]])		; DAZ-NEXT: [[AFN_NO_MD:%.*]] = fdiv contract afn float 1.000000e+00, [[SQRT_X_AFN_NO_MD]]
; DAZ-NEXT: store volatile float [[AFN_NO_MD]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[AFN_NO_MD]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_X_AFN_25ULP:%.*]] = call contract afn float @llvm.sqrt.f32(float [[X]]), !fpmath !0		; DAZ-NEXT: [[SQRT_X_AFN_25ULP:%.*]] = call contract afn float @llvm.sqrt.f32(float [[X]]), !fpmath !0
; DAZ-NEXT: [[AFN_25ULP:%.*]] = call contract afn float @llvm.amdgcn.rcp.f32(float [[SQRT_X_AFN_25ULP]])		; DAZ-NEXT: [[AFN_25ULP:%.*]] = fdiv contract afn float 1.000000e+00, [[SQRT_X_AFN_25ULP]], !fpmath !0
; DAZ-NEXT: store volatile float [[AFN_25ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[AFN_25ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_X_FAST_NO_MD:%.*]] = call fast float @llvm.sqrt.f32(float [[X]])		; DAZ-NEXT: [[SQRT_X_FAST_NO_MD:%.*]] = call fast float @llvm.sqrt.f32(float [[X]])
; DAZ-NEXT: [[FAST_NO_MD:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[SQRT_X_FAST_NO_MD]])		; DAZ-NEXT: [[FAST_NO_MD:%.*]] = fdiv fast float 1.000000e+00, [[SQRT_X_FAST_NO_MD]]
; DAZ-NEXT: store volatile float [[FAST_NO_MD]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FAST_NO_MD]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_X_FAST_25ULP:%.*]] = call fast float @llvm.sqrt.f32(float [[X]]), !fpmath !0		; DAZ-NEXT: [[SQRT_X_FAST_25ULP:%.*]] = call fast float @llvm.sqrt.f32(float [[X]]), !fpmath !0
; DAZ-NEXT: [[FAST_25ULP:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[SQRT_X_FAST_25ULP]])		; DAZ-NEXT: [[FAST_25ULP:%.*]] = fdiv fast float 1.000000e+00, [[SQRT_X_FAST_25ULP]], !fpmath !0
; DAZ-NEXT: store volatile float [[FAST_25ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FAST_25ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_X_3ULP:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !3		; DAZ-NEXT: [[FDIV_OPENCL:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[X]])
; DAZ-NEXT: [[FDIV_OPENCL:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[SQRT_X_3ULP]])
; DAZ-NEXT: store volatile float [[FDIV_OPENCL]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FDIV_OPENCL]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[NEG_SQRT_X_3ULP:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !3		; DAZ-NEXT: [[TMP1:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[X]])
; DAZ-NEXT: [[TMP1:%.*]] = fneg contract float [[NEG_SQRT_X_3ULP]]		; DAZ-NEXT: [[NEG_FDIV_OPENCL:%.*]] = fneg contract float [[TMP1]]
; DAZ-NEXT: [[NEG_FDIV_OPENCL:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP1]])
; DAZ-NEXT: store volatile float [[NEG_FDIV_OPENCL]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[NEG_FDIV_OPENCL]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_X_HALF_ULP:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !1		; DAZ-NEXT: [[SQRT_X_HALF_ULP:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !1
; DAZ-NEXT: [[FDIV_SQRT_MISMATCH_MD0:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[SQRT_X_HALF_ULP]])		; DAZ-NEXT: [[FDIV_SQRT_MISMATCH_MD0:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[SQRT_X_HALF_ULP]])
; DAZ-NEXT: store volatile float [[FDIV_SQRT_MISMATCH_MD0]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FDIV_SQRT_MISMATCH_MD0]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_MISMATCH_MD1:%.*]] = call afn float @llvm.sqrt.f32(float [[X]])		; DAZ-NEXT: [[SQRT_MISMATCH_MD1:%.*]] = call afn float @llvm.sqrt.f32(float [[X]])
; DAZ-NEXT: [[FDIV_SQRT_MISMATCH_MD1:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[SQRT_MISMATCH_MD1]])		; DAZ-NEXT: [[FDIV_SQRT_MISMATCH_MD1:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[SQRT_MISMATCH_MD1]])
; DAZ-NEXT: store volatile float [[FDIV_SQRT_MISMATCH_MD1]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FDIV_SQRT_MISMATCH_MD1]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_MISMATCH_MD2:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !3		; DAZ-NEXT: [[SQRT_MISMATCH_MD2:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !3
; DAZ-NEXT: [[FDIV_SQRT_MISMATCH_MD2:%.*]] = call contract afn float @llvm.amdgcn.rcp.f32(float [[SQRT_MISMATCH_MD2]])		; DAZ-NEXT: [[FDIV_SQRT_MISMATCH_MD2:%.*]] = fdiv contract afn float 1.000000e+00, [[SQRT_MISMATCH_MD2]]
; DAZ-NEXT: store volatile float [[FDIV_SQRT_MISMATCH_MD2]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FDIV_SQRT_MISMATCH_MD2]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: ret void		; DAZ-NEXT: ret void
;		;
%sqrt.x.no.md = call contract float @llvm.sqrt.f32(float %x)		%sqrt.x.no.md = call contract float @llvm.sqrt.f32(float %x)
%no.md = fdiv contract float 1.000000e+00, %sqrt.x.no.md		%no.md = fdiv contract float 1.000000e+00, %sqrt.x.no.md
store volatile float %no.md, ptr addrspace(1) %out, align 4		store volatile float %no.md, ptr addrspace(1) %out, align 4

; Matches the rsq instruction accuracy		; Matches the rsq instruction accuracy
▲ Show 20 Lines • Show All 58 Lines • ▼ Show 20 Lines	;
store volatile float %fdiv.sqrt.mismatch.md2, ptr addrspace(1) %out, align 4		store volatile float %fdiv.sqrt.mismatch.md2, ptr addrspace(1) %out, align 4

ret void		ret void
}		}

define amdgpu_kernel void @rsq_f32_fpmath_flags(ptr addrspace(1) %out, float %x) {		define amdgpu_kernel void @rsq_f32_fpmath_flags(ptr addrspace(1) %out, float %x) {
; IEEE-LABEL: define amdgpu_kernel void @rsq_f32_fpmath_flags		; IEEE-LABEL: define amdgpu_kernel void @rsq_f32_fpmath_flags
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {		; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {
; IEEE-NEXT: [[SQRT_X_3ULP_NINF_NNAN:%.*]] = call nnan ninf contract float @llvm.sqrt.f32(float [[X]]), !fpmath !3		; IEEE-NEXT: [[TMP1:%.*]] = fcmp nnan ninf contract olt float [[X]], 0x3810000000000000
; IEEE-NEXT: [[FDIV_OPENCL_NINF_NNAN:%.*]] = call nnan ninf contract float @llvm.amdgcn.fdiv.fast(float 1.000000e+00, float [[SQRT_X_3ULP_NINF_NNAN]])		; IEEE-NEXT: [[TMP2:%.*]] = select nnan ninf contract i1 [[TMP1]], float 0x4170000000000000, float 1.000000e+00
		; IEEE-NEXT: [[TMP3:%.*]] = fmul nnan ninf contract float [[X]], [[TMP2]]
		; IEEE-NEXT: [[TMP4:%.*]] = call nnan ninf contract float @llvm.amdgcn.rsq.f32(float [[TMP3]])
		; IEEE-NEXT: [[TMP5:%.*]] = select nnan ninf contract i1 [[TMP1]], float 4.096000e+03, float 1.000000e+00
		; IEEE-NEXT: [[FDIV_OPENCL_NINF_NNAN:%.*]] = fmul nnan ninf contract float [[TMP4]], [[TMP5]]
; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NINF_NNAN]], ptr addrspace(1) [[OUT]], align 4		; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NINF_NNAN]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[SQRT_X_3ULP_NINF:%.*]] = call ninf contract float @llvm.sqrt.f32(float [[X]]), !fpmath !3		; IEEE-NEXT: [[TMP6:%.*]] = fcmp ninf contract olt float [[X]], 0x3810000000000000
; IEEE-NEXT: [[FDIV_OPENCL_NINF:%.*]] = call ninf contract float @llvm.amdgcn.fdiv.fast(float 1.000000e+00, float [[SQRT_X_3ULP_NINF]])		; IEEE-NEXT: [[TMP7:%.*]] = select ninf contract i1 [[TMP6]], float 0x4170000000000000, float 1.000000e+00
		; IEEE-NEXT: [[TMP8:%.*]] = fmul ninf contract float [[X]], [[TMP7]]
		; IEEE-NEXT: [[TMP9:%.*]] = call ninf contract float @llvm.amdgcn.rsq.f32(float [[TMP8]])
		; IEEE-NEXT: [[TMP10:%.*]] = select ninf contract i1 [[TMP6]], float 4.096000e+03, float 1.000000e+00
		; IEEE-NEXT: [[FDIV_OPENCL_NINF:%.*]] = fmul ninf contract float [[TMP9]], [[TMP10]]
; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NINF]], ptr addrspace(1) [[OUT]], align 4		; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NINF]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[SQRT_X_3ULP_NNAN:%.*]] = call nnan contract float @llvm.sqrt.f32(float [[X]]), !fpmath !3		; IEEE-NEXT: [[TMP11:%.*]] = fcmp nnan contract olt float [[X]], 0x3810000000000000
; IEEE-NEXT: [[FDIV_OPENCL_NNAN:%.*]] = call nnan contract float @llvm.amdgcn.fdiv.fast(float 1.000000e+00, float [[SQRT_X_3ULP_NNAN]])		; IEEE-NEXT: [[TMP12:%.*]] = select nnan contract i1 [[TMP11]], float 0x4170000000000000, float 1.000000e+00
		; IEEE-NEXT: [[TMP13:%.*]] = fmul nnan contract float [[X]], [[TMP12]]
		; IEEE-NEXT: [[TMP14:%.*]] = call nnan contract float @llvm.amdgcn.rsq.f32(float [[TMP13]])
		; IEEE-NEXT: [[TMP15:%.*]] = select nnan contract i1 [[TMP11]], float 4.096000e+03, float 1.000000e+00
		; IEEE-NEXT: [[FDIV_OPENCL_NNAN:%.*]] = fmul nnan contract float [[TMP14]], [[TMP15]]
; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NNAN]], ptr addrspace(1) [[OUT]], align 4		; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NNAN]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[SQRT_X_3ULP_NSZ:%.*]] = call nsz contract float @llvm.sqrt.f32(float [[X]]), !fpmath !3		; IEEE-NEXT: [[TMP16:%.*]] = fcmp nsz contract olt float [[X]], 0x3810000000000000
; IEEE-NEXT: [[FDIV_OPENCL_NSZ:%.*]] = call nsz contract float @llvm.amdgcn.fdiv.fast(float 1.000000e+00, float [[SQRT_X_3ULP_NSZ]])		; IEEE-NEXT: [[TMP17:%.*]] = select nsz contract i1 [[TMP16]], float 0x4170000000000000, float 1.000000e+00
		; IEEE-NEXT: [[TMP18:%.*]] = fmul nsz contract float [[X]], [[TMP17]]
		; IEEE-NEXT: [[TMP19:%.*]] = call nsz contract float @llvm.amdgcn.rsq.f32(float [[TMP18]])
		; IEEE-NEXT: [[TMP20:%.*]] = select nsz contract i1 [[TMP16]], float 4.096000e+03, float 1.000000e+00
		; IEEE-NEXT: [[FDIV_OPENCL_NSZ:%.*]] = fmul nsz contract float [[TMP19]], [[TMP20]]
; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NSZ]], ptr addrspace(1) [[OUT]], align 4		; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NSZ]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[SQRT_X_3ULP_NINF_MIX0:%.*]] = call ninf contract float @llvm.sqrt.f32(float [[X]]), !fpmath !3		; IEEE-NEXT: [[TMP21:%.*]] = fcmp nnan ninf contract olt float [[X]], 0x3810000000000000
; IEEE-NEXT: [[FDIV_OPENCL_NNAN_MIX0:%.*]] = call nnan contract float @llvm.amdgcn.fdiv.fast(float 1.000000e+00, float [[SQRT_X_3ULP_NINF_MIX0]])		; IEEE-NEXT: [[TMP22:%.*]] = select nnan ninf contract i1 [[TMP21]], float 0x4170000000000000, float 1.000000e+00
		; IEEE-NEXT: [[TMP23:%.*]] = fmul nnan ninf contract float [[X]], [[TMP22]]
		; IEEE-NEXT: [[TMP24:%.*]] = call nnan ninf contract float @llvm.amdgcn.rsq.f32(float [[TMP23]])
		; IEEE-NEXT: [[TMP25:%.*]] = select nnan ninf contract i1 [[TMP21]], float 4.096000e+03, float 1.000000e+00
		; IEEE-NEXT: [[FDIV_OPENCL_NNAN_MIX0:%.*]] = fmul nnan ninf contract float [[TMP24]], [[TMP25]]
; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NNAN_MIX0]], ptr addrspace(1) [[OUT]], align 4		; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NNAN_MIX0]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[SQRT_X_3ULP_NINF_MIX1:%.*]] = call ninf contract float @llvm.sqrt.f32(float [[X]]), !fpmath !3		; IEEE-NEXT: [[TMP26:%.*]] = fcmp nnan ninf contract olt float [[X]], 0x3810000000000000
; IEEE-NEXT: [[FDIV_OPENCL_NNAN_MIX1:%.*]] = call nnan contract float @llvm.amdgcn.fdiv.fast(float 1.000000e+00, float [[SQRT_X_3ULP_NINF_MIX1]])		; IEEE-NEXT: [[TMP27:%.*]] = select nnan ninf contract i1 [[TMP26]], float 0x4170000000000000, float 1.000000e+00
		; IEEE-NEXT: [[TMP28:%.*]] = fmul nnan ninf contract float [[X]], [[TMP27]]
		; IEEE-NEXT: [[TMP29:%.*]] = call nnan ninf contract float @llvm.amdgcn.rsq.f32(float [[TMP28]])
		; IEEE-NEXT: [[TMP30:%.*]] = select nnan ninf contract i1 [[TMP26]], float 4.096000e+03, float 1.000000e+00
		; IEEE-NEXT: [[FDIV_OPENCL_NNAN_MIX1:%.*]] = fmul nnan ninf contract float [[TMP29]], [[TMP30]]
; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NNAN_MIX1]], ptr addrspace(1) [[OUT]], align 4		; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NNAN_MIX1]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: ret void		; IEEE-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @rsq_f32_fpmath_flags		; DAZ-LABEL: define amdgpu_kernel void @rsq_f32_fpmath_flags
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {
; DAZ-NEXT: [[SQRT_X_3ULP_NINF_NNAN:%.*]] = call nnan ninf contract float @llvm.sqrt.f32(float [[X]]), !fpmath !3		; DAZ-NEXT: [[FDIV_OPENCL_NINF_NNAN:%.*]] = call nnan ninf contract float @llvm.amdgcn.rsq.f32(float [[X]])
; DAZ-NEXT: [[FDIV_OPENCL_NINF_NNAN:%.*]] = call nnan ninf contract float @llvm.amdgcn.rcp.f32(float [[SQRT_X_3ULP_NINF_NNAN]])
; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NINF_NNAN]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NINF_NNAN]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_X_3ULP_NINF:%.*]] = call ninf contract float @llvm.sqrt.f32(float [[X]]), !fpmath !3		; DAZ-NEXT: [[FDIV_OPENCL_NINF:%.*]] = call ninf contract float @llvm.amdgcn.rsq.f32(float [[X]])
; DAZ-NEXT: [[FDIV_OPENCL_NINF:%.*]] = call ninf contract float @llvm.amdgcn.rcp.f32(float [[SQRT_X_3ULP_NINF]])
; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NINF]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NINF]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_X_3ULP_NNAN:%.*]] = call nnan contract float @llvm.sqrt.f32(float [[X]]), !fpmath !3		; DAZ-NEXT: [[FDIV_OPENCL_NNAN:%.*]] = call nnan contract float @llvm.amdgcn.rsq.f32(float [[X]])
; DAZ-NEXT: [[FDIV_OPENCL_NNAN:%.*]] = call nnan contract float @llvm.amdgcn.rcp.f32(float [[SQRT_X_3ULP_NNAN]])
; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NNAN]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NNAN]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_X_3ULP_NSZ:%.*]] = call nsz contract float @llvm.sqrt.f32(float [[X]]), !fpmath !3		; DAZ-NEXT: [[FDIV_OPENCL_NSZ:%.*]] = call nsz contract float @llvm.amdgcn.rsq.f32(float [[X]])
; DAZ-NEXT: [[FDIV_OPENCL_NSZ:%.*]] = call nsz contract float @llvm.amdgcn.rcp.f32(float [[SQRT_X_3ULP_NSZ]])
; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NSZ]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NSZ]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_X_3ULP_NINF_MIX0:%.*]] = call ninf contract float @llvm.sqrt.f32(float [[X]]), !fpmath !3		; DAZ-NEXT: [[FDIV_OPENCL_NNAN_MIX0:%.*]] = call nnan ninf contract float @llvm.amdgcn.rsq.f32(float [[X]])
; DAZ-NEXT: [[FDIV_OPENCL_NNAN_MIX0:%.*]] = call nnan contract float @llvm.amdgcn.rcp.f32(float [[SQRT_X_3ULP_NINF_MIX0]])
; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NNAN_MIX0]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NNAN_MIX0]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_X_3ULP_NINF_MIX1:%.*]] = call ninf contract float @llvm.sqrt.f32(float [[X]]), !fpmath !3		; DAZ-NEXT: [[FDIV_OPENCL_NNAN_MIX1:%.*]] = call nnan ninf contract float @llvm.amdgcn.rsq.f32(float [[X]])
; DAZ-NEXT: [[FDIV_OPENCL_NNAN_MIX1:%.*]] = call nnan contract float @llvm.amdgcn.rcp.f32(float [[SQRT_X_3ULP_NINF_MIX1]])
; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NNAN_MIX1]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NNAN_MIX1]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: ret void		; DAZ-NEXT: ret void
;		;
%sqrt.x.3ulp.ninf.nnan = call contract ninf nnan float @llvm.sqrt.f32(float %x), !fpmath !3 ; OpenCL default requires 3 for sqrt and 2.5 for fdiv		%sqrt.x.3ulp.ninf.nnan = call contract ninf nnan float @llvm.sqrt.f32(float %x), !fpmath !3 ; OpenCL default requires 3 for sqrt and 2.5 for fdiv
%fdiv.opencl.ninf.nnan = fdiv contract ninf nnan float 1.0, %sqrt.x.3ulp.ninf.nnan, !fpmath !0		%fdiv.opencl.ninf.nnan = fdiv contract ninf nnan float 1.0, %sqrt.x.3ulp.ninf.nnan, !fpmath !0
store volatile float %fdiv.opencl.ninf.nnan, ptr addrspace(1) %out, align 4		store volatile float %fdiv.opencl.ninf.nnan, ptr addrspace(1) %out, align 4

%sqrt.x.3ulp.ninf = call contract ninf float @llvm.sqrt.f32(float %x), !fpmath !3 ; OpenCL default requires 3 for sqrt and 2.5 for fdiv		%sqrt.x.3ulp.ninf = call contract ninf float @llvm.sqrt.f32(float %x), !fpmath !3 ; OpenCL default requires 3 for sqrt and 2.5 for fdiv
Show All 15 Lines	;
%sqrt.x.3ulp.ninf.mix1 = call contract ninf float @llvm.sqrt.f32(float %x), !fpmath !3		%sqrt.x.3ulp.ninf.mix1 = call contract ninf float @llvm.sqrt.f32(float %x), !fpmath !3
%fdiv.opencl.nnan.mix1 = fdiv contract nnan float 1.0, %sqrt.x.3ulp.ninf.mix1, !fpmath !0		%fdiv.opencl.nnan.mix1 = fdiv contract nnan float 1.0, %sqrt.x.3ulp.ninf.mix1, !fpmath !0
store volatile float %fdiv.opencl.nnan.mix1, ptr addrspace(1) %out, align 4		store volatile float %fdiv.opencl.nnan.mix1, ptr addrspace(1) %out, align 4

ret void		ret void
}		}

define float @rsq_f32_missing_contract0(float %x) {		define float @rsq_f32_missing_contract0(float %x) {
; IEEE-LABEL: define float @rsq_f32_missing_contract0		; IEEE-GOODFREXP-LABEL: define float @rsq_f32_missing_contract0
; IEEE-SAME: (float [[X:%.*]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (float [[X:%.*]]) #[[ATTR1]] {
; IEEE-NEXT: [[SQRT_X_3ULP:%.*]] = call float @llvm.sqrt.f32(float [[X]]), !fpmath !2		; IEEE-GOODFREXP-NEXT: [[SQRT_X_3ULP:%.*]] = call float @llvm.sqrt.f32(float [[X]]), !fpmath !2
; IEEE-NEXT: [[FDIV_OPENCL:%.*]] = fdiv contract float 1.000000e+00, [[SQRT_X_3ULP]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[SQRT_X_3ULP]])
; IEEE-NEXT: ret float [[FDIV_OPENCL]]		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP1]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-GOODFREXP-NEXT: [[FDIV_OPENCL:%.*]] = call contract float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-GOODFREXP-NEXT: ret float [[FDIV_OPENCL]]
		;
		; IEEE-BADFREXP-LABEL: define float @rsq_f32_missing_contract0
		; IEEE-BADFREXP-SAME: (float [[X:%.*]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[SQRT_X_3ULP:%.*]] = call float @llvm.sqrt.f32(float [[X]]), !fpmath !2
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[SQRT_X_3ULP]])
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[SQRT_X_3ULP]])
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[FDIV_OPENCL:%.*]] = call contract float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-BADFREXP-NEXT: ret float [[FDIV_OPENCL]]
;		;
; DAZ-LABEL: define float @rsq_f32_missing_contract0		; DAZ-LABEL: define float @rsq_f32_missing_contract0
; DAZ-SAME: (float [[X:%.*]]) #[[ATTR1]] {		; DAZ-SAME: (float [[X:%.*]]) #[[ATTR1]] {
; DAZ-NEXT: [[SQRT_X_3ULP:%.*]] = call float @llvm.sqrt.f32(float [[X]]), !fpmath !2		; DAZ-NEXT: [[SQRT_X_3ULP:%.*]] = call float @llvm.sqrt.f32(float [[X]]), !fpmath !2
; DAZ-NEXT: [[FDIV_OPENCL:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[SQRT_X_3ULP]])		; DAZ-NEXT: [[FDIV_OPENCL:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[SQRT_X_3ULP]])
; DAZ-NEXT: ret float [[FDIV_OPENCL]]		; DAZ-NEXT: ret float [[FDIV_OPENCL]]
;		;
%sqrt.x.3ulp = call float @llvm.sqrt.f32(float %x), !fpmath !2		%sqrt.x.3ulp = call float @llvm.sqrt.f32(float %x), !fpmath !2
%fdiv.opencl = fdiv contract float 1.0, %sqrt.x.3ulp, !fpmath !2		%fdiv.opencl = fdiv contract float 1.0, %sqrt.x.3ulp, !fpmath !2
ret float %fdiv.opencl		ret float %fdiv.opencl
}		}

define float @rsq_f32_missing_contract1(float %x) {		define float @rsq_f32_missing_contract1(float %x) {
; IEEE-LABEL: define float @rsq_f32_missing_contract1		; IEEE-GOODFREXP-LABEL: define float @rsq_f32_missing_contract1
; IEEE-SAME: (float [[X:%.*]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (float [[X:%.*]]) #[[ATTR1]] {
; IEEE-NEXT: [[SQRT_X_3ULP:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !2		; IEEE-GOODFREXP-NEXT: [[SQRT_X_3ULP:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !2
; IEEE-NEXT: [[FDIV_OPENCL:%.*]] = fdiv float 1.000000e+00, [[SQRT_X_3ULP]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[SQRT_X_3ULP]])
; IEEE-NEXT: ret float [[FDIV_OPENCL]]		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP1]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-GOODFREXP-NEXT: [[FDIV_OPENCL:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-GOODFREXP-NEXT: ret float [[FDIV_OPENCL]]
		;
		; IEEE-BADFREXP-LABEL: define float @rsq_f32_missing_contract1
		; IEEE-BADFREXP-SAME: (float [[X:%.*]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[SQRT_X_3ULP:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !2
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[SQRT_X_3ULP]])
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[SQRT_X_3ULP]])
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[FDIV_OPENCL:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-BADFREXP-NEXT: ret float [[FDIV_OPENCL]]
;		;
; DAZ-LABEL: define float @rsq_f32_missing_contract1		; DAZ-LABEL: define float @rsq_f32_missing_contract1
; DAZ-SAME: (float [[X:%.*]]) #[[ATTR1]] {		; DAZ-SAME: (float [[X:%.*]]) #[[ATTR1]] {
; DAZ-NEXT: [[SQRT_X_3ULP:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !2		; DAZ-NEXT: [[SQRT_X_3ULP:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !2
; DAZ-NEXT: [[FDIV_OPENCL:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[SQRT_X_3ULP]])		; DAZ-NEXT: [[FDIV_OPENCL:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[SQRT_X_3ULP]])
; DAZ-NEXT: ret float [[FDIV_OPENCL]]		; DAZ-NEXT: ret float [[FDIV_OPENCL]]
;		;
%sqrt.x.3ulp = call contract float @llvm.sqrt.f32(float %x), !fpmath !2		%sqrt.x.3ulp = call contract float @llvm.sqrt.f32(float %x), !fpmath !2
%fdiv.opencl = fdiv float 1.0, %sqrt.x.3ulp, !fpmath !2		%fdiv.opencl = fdiv float 1.0, %sqrt.x.3ulp, !fpmath !2
ret float %fdiv.opencl		ret float %fdiv.opencl
}		}

define float @rsq_f32_flag_merge(float %x) {		define float @rsq_f32_flag_merge(float %x) {
; IEEE-LABEL: define float @rsq_f32_flag_merge		; IEEE-LABEL: define float @rsq_f32_flag_merge
; IEEE-SAME: (float [[X:%.*]]) #[[ATTR1]] {		; IEEE-SAME: (float [[X:%.*]]) #[[ATTR1]] {
; IEEE-NEXT: [[SQRT_X_3ULP:%.*]] = call ninf contract float @llvm.sqrt.f32(float [[X]]), !fpmath !2		; IEEE-NEXT: [[TMP1:%.*]] = fcmp ninf nsz contract olt float [[X]], 0x3810000000000000
; IEEE-NEXT: [[FDIV_OPENCL:%.*]] = fdiv nsz contract float 1.000000e+00, [[SQRT_X_3ULP]], !fpmath !2		; IEEE-NEXT: [[TMP2:%.*]] = select ninf nsz contract i1 [[TMP1]], float 0x4170000000000000, float 1.000000e+00
		; IEEE-NEXT: [[TMP3:%.*]] = fmul ninf nsz contract float [[X]], [[TMP2]]
		; IEEE-NEXT: [[TMP4:%.*]] = call ninf nsz contract float @llvm.amdgcn.rsq.f32(float [[TMP3]])
		; IEEE-NEXT: [[TMP5:%.*]] = select ninf nsz contract i1 [[TMP1]], float 4.096000e+03, float 1.000000e+00
		; IEEE-NEXT: [[FDIV_OPENCL:%.*]] = fmul ninf nsz contract float [[TMP4]], [[TMP5]]
; IEEE-NEXT: ret float [[FDIV_OPENCL]]		; IEEE-NEXT: ret float [[FDIV_OPENCL]]
;		;
; DAZ-LABEL: define float @rsq_f32_flag_merge		; DAZ-LABEL: define float @rsq_f32_flag_merge
; DAZ-SAME: (float [[X:%.*]]) #[[ATTR1]] {		; DAZ-SAME: (float [[X:%.*]]) #[[ATTR1]] {
; DAZ-NEXT: [[SQRT_X_3ULP:%.*]] = call ninf contract float @llvm.sqrt.f32(float [[X]]), !fpmath !2		; DAZ-NEXT: [[FDIV_OPENCL:%.*]] = call ninf nsz contract float @llvm.amdgcn.rsq.f32(float [[X]])
; DAZ-NEXT: [[FDIV_OPENCL:%.*]] = call nsz contract float @llvm.amdgcn.rcp.f32(float [[SQRT_X_3ULP]])
; DAZ-NEXT: ret float [[FDIV_OPENCL]]		; DAZ-NEXT: ret float [[FDIV_OPENCL]]
;		;
%sqrt.x.3ulp = call contract ninf float @llvm.sqrt.f32(float %x), !fpmath !2		%sqrt.x.3ulp = call contract ninf float @llvm.sqrt.f32(float %x), !fpmath !2
%fdiv.opencl = fdiv contract nsz float 1.0, %sqrt.x.3ulp, !fpmath !2		%fdiv.opencl = fdiv contract nsz float 1.0, %sqrt.x.3ulp, !fpmath !2
ret float %fdiv.opencl		ret float %fdiv.opencl
}		}

define amdgpu_kernel void @rsq_f32_knownfinite(ptr addrspace(1) %out, float nofpclass(nan) %no.nan,		define amdgpu_kernel void @rsq_f32_knownfinite(ptr addrspace(1) %out, float nofpclass(nan) %no.nan,
; IEEE-LABEL: define amdgpu_kernel void @rsq_f32_knownfinite		; IEEE-LABEL: define amdgpu_kernel void @rsq_f32_knownfinite
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(nan) [[NO_NAN:%.]], float nofpclass(nan) [[NO_INF:%.]], float nofpclass(nan inf) [[NO_INF_NAN:%.]]) #[[ATTR1]] {		; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(nan) [[NO_NAN:%.]], float nofpclass(nan) [[NO_INF:%.]], float nofpclass(nan inf) [[NO_INF_NAN:%.]]) #[[ATTR1]] {
; IEEE-NEXT: [[SQRT_X_3ULP_NO_NAN:%.*]] = call contract float @llvm.sqrt.f32(float [[NO_NAN]]), !fpmath !3		; IEEE-NEXT: [[TMP1:%.*]] = fcmp contract olt float [[NO_NAN]], 0x3810000000000000
; IEEE-NEXT: [[FDIV_OPENCL_NO_NAN:%.*]] = call contract float @llvm.amdgcn.fdiv.fast(float 1.000000e+00, float [[SQRT_X_3ULP_NO_NAN]])		; IEEE-NEXT: [[TMP2:%.*]] = select contract i1 [[TMP1]], float 0x4170000000000000, float 1.000000e+00
		; IEEE-NEXT: [[TMP3:%.*]] = fmul contract float [[NO_NAN]], [[TMP2]]
		; IEEE-NEXT: [[TMP4:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP3]])
		; IEEE-NEXT: [[TMP5:%.*]] = select contract i1 [[TMP1]], float 4.096000e+03, float 1.000000e+00
		; IEEE-NEXT: [[FDIV_OPENCL_NO_NAN:%.*]] = fmul contract float [[TMP4]], [[TMP5]]
; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NO_NAN]], ptr addrspace(1) [[OUT]], align 4		; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NO_NAN]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[SQRT_X_3ULP_NO_INF:%.*]] = call contract float @llvm.sqrt.f32(float [[NO_INF]]), !fpmath !3		; IEEE-NEXT: [[TMP6:%.*]] = fcmp contract olt float [[NO_INF]], 0x3810000000000000
; IEEE-NEXT: [[FDIV_OPENCL_NO_INF:%.*]] = call contract float @llvm.amdgcn.fdiv.fast(float 1.000000e+00, float [[SQRT_X_3ULP_NO_INF]])		; IEEE-NEXT: [[TMP7:%.*]] = select contract i1 [[TMP6]], float 0x4170000000000000, float 1.000000e+00
		; IEEE-NEXT: [[TMP8:%.*]] = fmul contract float [[NO_INF]], [[TMP7]]
		; IEEE-NEXT: [[TMP9:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP8]])
		; IEEE-NEXT: [[TMP10:%.*]] = select contract i1 [[TMP6]], float 4.096000e+03, float 1.000000e+00
		; IEEE-NEXT: [[FDIV_OPENCL_NO_INF:%.*]] = fmul contract float [[TMP9]], [[TMP10]]
; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NO_INF]], ptr addrspace(1) [[OUT]], align 4		; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NO_INF]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[SQRT_X_3ULP_NO_INF_NAN:%.*]] = call contract float @llvm.sqrt.f32(float [[NO_INF_NAN]]), !fpmath !3		; IEEE-NEXT: [[TMP11:%.*]] = fcmp contract olt float [[NO_INF_NAN]], 0x3810000000000000
; IEEE-NEXT: [[FDIV_OPENCL_NO_INF_NAN:%.*]] = call contract float @llvm.amdgcn.fdiv.fast(float 1.000000e+00, float [[SQRT_X_3ULP_NO_INF_NAN]])		; IEEE-NEXT: [[TMP12:%.*]] = select contract i1 [[TMP11]], float 0x4170000000000000, float 1.000000e+00
		; IEEE-NEXT: [[TMP13:%.*]] = fmul contract float [[NO_INF_NAN]], [[TMP12]]
		; IEEE-NEXT: [[TMP14:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP13]])
		; IEEE-NEXT: [[TMP15:%.*]] = select contract i1 [[TMP11]], float 4.096000e+03, float 1.000000e+00
		; IEEE-NEXT: [[FDIV_OPENCL_NO_INF_NAN:%.*]] = fmul contract float [[TMP14]], [[TMP15]]
; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NO_INF_NAN]], ptr addrspace(1) [[OUT]], align 4		; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NO_INF_NAN]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: ret void		; IEEE-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @rsq_f32_knownfinite		; DAZ-LABEL: define amdgpu_kernel void @rsq_f32_knownfinite
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(nan) [[NO_NAN:%.]], float nofpclass(nan) [[NO_INF:%.]], float nofpclass(nan inf) [[NO_INF_NAN:%.]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(nan) [[NO_NAN:%.]], float nofpclass(nan) [[NO_INF:%.]], float nofpclass(nan inf) [[NO_INF_NAN:%.]]) #[[ATTR1]] {
; DAZ-NEXT: [[SQRT_X_3ULP_NO_NAN:%.*]] = call contract float @llvm.sqrt.f32(float [[NO_NAN]]), !fpmath !3		; DAZ-NEXT: [[FDIV_OPENCL_NO_NAN:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[NO_NAN]])
; DAZ-NEXT: [[FDIV_OPENCL_NO_NAN:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[SQRT_X_3ULP_NO_NAN]])
; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NO_NAN]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NO_NAN]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_X_3ULP_NO_INF:%.*]] = call contract float @llvm.sqrt.f32(float [[NO_INF]]), !fpmath !3		; DAZ-NEXT: [[FDIV_OPENCL_NO_INF:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[NO_INF]])
; DAZ-NEXT: [[FDIV_OPENCL_NO_INF:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[SQRT_X_3ULP_NO_INF]])
; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NO_INF]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NO_INF]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_X_3ULP_NO_INF_NAN:%.*]] = call contract float @llvm.sqrt.f32(float [[NO_INF_NAN]]), !fpmath !3		; DAZ-NEXT: [[FDIV_OPENCL_NO_INF_NAN:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[NO_INF_NAN]])
; DAZ-NEXT: [[FDIV_OPENCL_NO_INF_NAN:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[SQRT_X_3ULP_NO_INF_NAN]])
; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NO_INF_NAN]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NO_INF_NAN]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: ret void		; DAZ-NEXT: ret void
;		;
float nofpclass(nan) %no.inf,		float nofpclass(nan) %no.inf,
float nofpclass(inf nan) %no.inf.nan) {		float nofpclass(inf nan) %no.inf.nan) {
%sqrt.x.3ulp.no.nan = call contract float @llvm.sqrt.f32(float %no.nan), !fpmath !3		%sqrt.x.3ulp.no.nan = call contract float @llvm.sqrt.f32(float %no.nan), !fpmath !3
%fdiv.opencl.no.nan = fdiv contract float 1.0, %sqrt.x.3ulp.no.nan, !fpmath !0		%fdiv.opencl.no.nan = fdiv contract float 1.0, %sqrt.x.3ulp.no.nan, !fpmath !0
store volatile float %fdiv.opencl.no.nan, ptr addrspace(1) %out, align 4		store volatile float %fdiv.opencl.no.nan, ptr addrspace(1) %out, align 4

%sqrt.x.3ulp.no.inf = call contract float @llvm.sqrt.f32(float %no.inf), !fpmath !3		%sqrt.x.3ulp.no.inf = call contract float @llvm.sqrt.f32(float %no.inf), !fpmath !3
%fdiv.opencl.no.inf = fdiv contract float 1.0, %sqrt.x.3ulp.no.inf, !fpmath !0		%fdiv.opencl.no.inf = fdiv contract float 1.0, %sqrt.x.3ulp.no.inf, !fpmath !0
store volatile float %fdiv.opencl.no.inf, ptr addrspace(1) %out, align 4		store volatile float %fdiv.opencl.no.inf, ptr addrspace(1) %out, align 4

%sqrt.x.3ulp.no.inf.nan = call contract float @llvm.sqrt.f32(float %no.inf.nan), !fpmath !3		%sqrt.x.3ulp.no.inf.nan = call contract float @llvm.sqrt.f32(float %no.inf.nan), !fpmath !3
%fdiv.opencl.no.inf.nan = fdiv contract float 1.0, %sqrt.x.3ulp.no.inf.nan, !fpmath !0		%fdiv.opencl.no.inf.nan = fdiv contract float 1.0, %sqrt.x.3ulp.no.inf.nan, !fpmath !0
store volatile float %fdiv.opencl.no.inf.nan, ptr addrspace(1) %out, align 4		store volatile float %fdiv.opencl.no.inf.nan, ptr addrspace(1) %out, align 4

ret void		ret void
}		}

define amdgpu_kernel void @rsq_f32_known_nozero(ptr addrspace(1) %out, float nofpclass(zero) %no.zero, float nofpclass(zero sub) %no.zero.sub) {		define amdgpu_kernel void @rsq_f32_known_nozero(ptr addrspace(1) %out, float nofpclass(zero) %no.zero, float nofpclass(zero sub) %no.zero.sub) {
; IEEE-LABEL: define amdgpu_kernel void @rsq_f32_known_nozero		; IEEE-LABEL: define amdgpu_kernel void @rsq_f32_known_nozero
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(zero) [[NO_ZERO:%.]], float nofpclass(zero sub) [[NO_ZERO_SUB:%.*]]) #[[ATTR1]] {		; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(zero) [[NO_ZERO:%.]], float nofpclass(zero sub) [[NO_ZERO_SUB:%.*]]) #[[ATTR1]] {
; IEEE-NEXT: [[SQRT_X_3ULP_NO_ZERO:%.*]] = call contract float @llvm.sqrt.f32(float [[NO_ZERO]]), !fpmath !3		; IEEE-NEXT: [[TMP1:%.*]] = fcmp contract olt float [[NO_ZERO]], 0x3810000000000000
; IEEE-NEXT: [[FDIV_OPENCL_NO_ZERO:%.*]] = call contract float @llvm.amdgcn.fdiv.fast(float 1.000000e+00, float [[SQRT_X_3ULP_NO_ZERO]])		; IEEE-NEXT: [[TMP2:%.*]] = select contract i1 [[TMP1]], float 0x4170000000000000, float 1.000000e+00
		; IEEE-NEXT: [[TMP3:%.*]] = fmul contract float [[NO_ZERO]], [[TMP2]]
		; IEEE-NEXT: [[TMP4:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP3]])
		; IEEE-NEXT: [[TMP5:%.*]] = select contract i1 [[TMP1]], float 4.096000e+03, float 1.000000e+00
		; IEEE-NEXT: [[FDIV_OPENCL_NO_ZERO:%.*]] = fmul contract float [[TMP4]], [[TMP5]]
; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NO_ZERO]], ptr addrspace(1) [[OUT]], align 4		; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NO_ZERO]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[SQRT_X_3ULP_NO_ZERO_SUB:%.*]] = call contract float @llvm.sqrt.f32(float [[NO_ZERO_SUB]]), !fpmath !3		; IEEE-NEXT: [[FDIV_OPENCL_NO_ZERO_SUB:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[NO_ZERO_SUB]])
; IEEE-NEXT: [[FDIV_OPENCL_NO_ZERO_SUB:%.*]] = call contract float @llvm.amdgcn.fdiv.fast(float 1.000000e+00, float [[SQRT_X_3ULP_NO_ZERO_SUB]])
; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NO_ZERO_SUB]], ptr addrspace(1) [[OUT]], align 4		; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NO_ZERO_SUB]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: ret void		; IEEE-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @rsq_f32_known_nozero		; DAZ-LABEL: define amdgpu_kernel void @rsq_f32_known_nozero
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(zero) [[NO_ZERO:%.]], float nofpclass(zero sub) [[NO_ZERO_SUB:%.*]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(zero) [[NO_ZERO:%.]], float nofpclass(zero sub) [[NO_ZERO_SUB:%.*]]) #[[ATTR1]] {
; DAZ-NEXT: [[SQRT_X_3ULP_NO_ZERO:%.*]] = call contract float @llvm.sqrt.f32(float [[NO_ZERO]]), !fpmath !3		; DAZ-NEXT: [[FDIV_OPENCL_NO_ZERO:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[NO_ZERO]])
; DAZ-NEXT: [[FDIV_OPENCL_NO_ZERO:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[SQRT_X_3ULP_NO_ZERO]])
; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NO_ZERO]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NO_ZERO]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_X_3ULP_NO_ZERO_SUB:%.*]] = call contract float @llvm.sqrt.f32(float [[NO_ZERO_SUB]]), !fpmath !3		; DAZ-NEXT: [[FDIV_OPENCL_NO_ZERO_SUB:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[NO_ZERO_SUB]])
; DAZ-NEXT: [[FDIV_OPENCL_NO_ZERO_SUB:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[SQRT_X_3ULP_NO_ZERO_SUB]])
; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NO_ZERO_SUB]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NO_ZERO_SUB]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: ret void		; DAZ-NEXT: ret void
;		;
%sqrt.x.3ulp.no.zero = call contract float @llvm.sqrt.f32(float %no.zero), !fpmath !3		%sqrt.x.3ulp.no.zero = call contract float @llvm.sqrt.f32(float %no.zero), !fpmath !3
%fdiv.opencl.no.zero = fdiv contract float 1.0, %sqrt.x.3ulp.no.zero, !fpmath !0		%fdiv.opencl.no.zero = fdiv contract float 1.0, %sqrt.x.3ulp.no.zero, !fpmath !0
store volatile float %fdiv.opencl.no.zero, ptr addrspace(1) %out, align 4		store volatile float %fdiv.opencl.no.zero, ptr addrspace(1) %out, align 4

%sqrt.x.3ulp.no.zero.sub = call contract float @llvm.sqrt.f32(float %no.zero.sub), !fpmath !3		%sqrt.x.3ulp.no.zero.sub = call contract float @llvm.sqrt.f32(float %no.zero.sub), !fpmath !3
%fdiv.opencl.no.zero.sub = fdiv contract float 1.0, %sqrt.x.3ulp.no.zero.sub, !fpmath !0		%fdiv.opencl.no.zero.sub = fdiv contract float 1.0, %sqrt.x.3ulp.no.zero.sub, !fpmath !0
store volatile float %fdiv.opencl.no.zero.sub, ptr addrspace(1) %out, align 4		store volatile float %fdiv.opencl.no.zero.sub, ptr addrspace(1) %out, align 4

ret void		ret void
}		}

define amdgpu_kernel void @rsq_f32_known_nosub(ptr addrspace(1) %out, float nofpclass(sub) %no.sub, float nofpclass(psub) %no.psub, float nofpclass(nsub) %no.nsub) {		define amdgpu_kernel void @rsq_f32_known_nosub(ptr addrspace(1) %out, float nofpclass(sub) %no.sub, float nofpclass(psub) %no.psub, float nofpclass(nsub) %no.nsub) {
; IEEE-LABEL: define amdgpu_kernel void @rsq_f32_known_nosub		; IEEE-LABEL: define amdgpu_kernel void @rsq_f32_known_nosub
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(sub) [[NO_SUB:%.]], float nofpclass(psub) [[NO_PSUB:%.]], float nofpclass(nsub) [[NO_NSUB:%.]]) #[[ATTR1]] {		; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(sub) [[NO_SUB:%.]], float nofpclass(psub) [[NO_PSUB:%.]], float nofpclass(nsub) [[NO_NSUB:%.]]) #[[ATTR1]] {
; IEEE-NEXT: [[SQRT_X_3ULP_NO_SUB:%.*]] = call contract float @llvm.sqrt.f32(float [[NO_SUB]]), !fpmath !3		; IEEE-NEXT: [[FDIV_OPENCL_NO_SUB:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[NO_SUB]])
; IEEE-NEXT: [[FDIV_OPENCL_NO_SUB:%.*]] = call contract float @llvm.amdgcn.fdiv.fast(float 1.000000e+00, float [[SQRT_X_3ULP_NO_SUB]])
; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NO_SUB]], ptr addrspace(1) [[OUT]], align 4		; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NO_SUB]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[SQRT_X_3ULP_NO_PSUB:%.*]] = call contract float @llvm.sqrt.f32(float [[NO_PSUB]]), !fpmath !3		; IEEE-NEXT: [[TMP1:%.*]] = fcmp contract olt float [[NO_PSUB]], 0x3810000000000000
; IEEE-NEXT: [[FDIV_OPENCL_NO_PSUB:%.*]] = call contract float @llvm.amdgcn.fdiv.fast(float 1.000000e+00, float [[SQRT_X_3ULP_NO_PSUB]])		; IEEE-NEXT: [[TMP2:%.*]] = select contract i1 [[TMP1]], float 0x4170000000000000, float 1.000000e+00
		; IEEE-NEXT: [[TMP3:%.*]] = fmul contract float [[NO_PSUB]], [[TMP2]]
		; IEEE-NEXT: [[TMP4:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP3]])
		; IEEE-NEXT: [[TMP5:%.*]] = select contract i1 [[TMP1]], float 4.096000e+03, float 1.000000e+00
		; IEEE-NEXT: [[FDIV_OPENCL_NO_PSUB:%.*]] = fmul contract float [[TMP4]], [[TMP5]]
; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NO_PSUB]], ptr addrspace(1) [[OUT]], align 4		; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NO_PSUB]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[SQRT_X_3ULP_NO_NSUB:%.*]] = call contract float @llvm.sqrt.f32(float [[NO_NSUB]]), !fpmath !3		; IEEE-NEXT: [[TMP6:%.*]] = fcmp contract olt float [[NO_NSUB]], 0x3810000000000000
; IEEE-NEXT: [[FDIV_OPENCL_NO_NSUB:%.*]] = call contract float @llvm.amdgcn.fdiv.fast(float 1.000000e+00, float [[SQRT_X_3ULP_NO_NSUB]])		; IEEE-NEXT: [[TMP7:%.*]] = select contract i1 [[TMP6]], float 0x4170000000000000, float 1.000000e+00
		; IEEE-NEXT: [[TMP8:%.*]] = fmul contract float [[NO_NSUB]], [[TMP7]]
		; IEEE-NEXT: [[TMP9:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP8]])
		; IEEE-NEXT: [[TMP10:%.*]] = select contract i1 [[TMP6]], float 4.096000e+03, float 1.000000e+00
		; IEEE-NEXT: [[FDIV_OPENCL_NO_NSUB:%.*]] = fmul contract float [[TMP9]], [[TMP10]]
; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NO_NSUB]], ptr addrspace(1) [[OUT]], align 4		; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NO_NSUB]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: ret void		; IEEE-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @rsq_f32_known_nosub		; DAZ-LABEL: define amdgpu_kernel void @rsq_f32_known_nosub
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(sub) [[NO_SUB:%.]], float nofpclass(psub) [[NO_PSUB:%.]], float nofpclass(nsub) [[NO_NSUB:%.]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(sub) [[NO_SUB:%.]], float nofpclass(psub) [[NO_PSUB:%.]], float nofpclass(nsub) [[NO_NSUB:%.]]) #[[ATTR1]] {
; DAZ-NEXT: [[SQRT_X_3ULP_NO_SUB:%.*]] = call contract float @llvm.sqrt.f32(float [[NO_SUB]]), !fpmath !3		; DAZ-NEXT: [[FDIV_OPENCL_NO_SUB:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[NO_SUB]])
; DAZ-NEXT: [[FDIV_OPENCL_NO_SUB:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[SQRT_X_3ULP_NO_SUB]])
; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NO_SUB]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NO_SUB]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_X_3ULP_NO_PSUB:%.*]] = call contract float @llvm.sqrt.f32(float [[NO_PSUB]]), !fpmath !3		; DAZ-NEXT: [[FDIV_OPENCL_NO_PSUB:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[NO_PSUB]])
; DAZ-NEXT: [[FDIV_OPENCL_NO_PSUB:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[SQRT_X_3ULP_NO_PSUB]])
; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NO_PSUB]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NO_PSUB]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_X_3ULP_NO_NSUB:%.*]] = call contract float @llvm.sqrt.f32(float [[NO_NSUB]]), !fpmath !3		; DAZ-NEXT: [[FDIV_OPENCL_NO_NSUB:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[NO_NSUB]])
; DAZ-NEXT: [[FDIV_OPENCL_NO_NSUB:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[SQRT_X_3ULP_NO_NSUB]])
; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NO_NSUB]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NO_NSUB]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: ret void		; DAZ-NEXT: ret void
;		;
%sqrt.x.3ulp.no.sub = call contract float @llvm.sqrt.f32(float %no.sub), !fpmath !3		%sqrt.x.3ulp.no.sub = call contract float @llvm.sqrt.f32(float %no.sub), !fpmath !3
%fdiv.opencl.no.sub = fdiv contract float 1.0, %sqrt.x.3ulp.no.sub, !fpmath !0		%fdiv.opencl.no.sub = fdiv contract float 1.0, %sqrt.x.3ulp.no.sub, !fpmath !0
store volatile float %fdiv.opencl.no.sub, ptr addrspace(1) %out, align 4		store volatile float %fdiv.opencl.no.sub, ptr addrspace(1) %out, align 4

%sqrt.x.3ulp.no.psub = call contract float @llvm.sqrt.f32(float %no.psub), !fpmath !3		%sqrt.x.3ulp.no.psub = call contract float @llvm.sqrt.f32(float %no.psub), !fpmath !3
%fdiv.opencl.no.psub = fdiv contract float 1.0, %sqrt.x.3ulp.no.psub, !fpmath !0		%fdiv.opencl.no.psub = fdiv contract float 1.0, %sqrt.x.3ulp.no.psub, !fpmath !0
store volatile float %fdiv.opencl.no.psub, ptr addrspace(1) %out, align 4		store volatile float %fdiv.opencl.no.psub, ptr addrspace(1) %out, align 4

%sqrt.x.3ulp.no.nsub = call contract float @llvm.sqrt.f32(float %no.nsub), !fpmath !3		%sqrt.x.3ulp.no.nsub = call contract float @llvm.sqrt.f32(float %no.nsub), !fpmath !3
%fdiv.opencl.no.nsub = fdiv contract float 1.0, %sqrt.x.3ulp.no.nsub, !fpmath !0		%fdiv.opencl.no.nsub = fdiv contract float 1.0, %sqrt.x.3ulp.no.nsub, !fpmath !0
store volatile float %fdiv.opencl.no.nsub, ptr addrspace(1) %out, align 4		store volatile float %fdiv.opencl.no.nsub, ptr addrspace(1) %out, align 4

ret void		ret void
}		}

define amdgpu_kernel void @rsq_f32_assume_nosub(ptr addrspace(1) %out, float %x) {		define amdgpu_kernel void @rsq_f32_assume_nosub(ptr addrspace(1) %out, float %x) {
; IEEE-LABEL: define amdgpu_kernel void @rsq_f32_assume_nosub		; CHECK-LABEL: define amdgpu_kernel void @rsq_f32_assume_nosub
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {		; CHECK-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {
; IEEE-NEXT: [[FABS_X:%.*]] = call float @llvm.fabs.f32(float [[X]])		; CHECK-NEXT: [[FABS_X:%.*]] = call float @llvm.fabs.f32(float [[X]])
; IEEE-NEXT: [[IS_NOT_SUBNORMAL:%.*]] = fcmp oge float [[FABS_X]], 0x3810000000000000		; CHECK-NEXT: [[IS_NOT_SUBNORMAL:%.*]] = fcmp oge float [[FABS_X]], 0x3810000000000000
; IEEE-NEXT: call void @llvm.assume(i1 [[IS_NOT_SUBNORMAL]])		; CHECK-NEXT: call void @llvm.assume(i1 [[IS_NOT_SUBNORMAL]])
; IEEE-NEXT: [[SQRT_X_3ULP_NO_SUB:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !3		; CHECK-NEXT: [[FDIV_OPENCL_NO_SUB:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[X]])
; IEEE-NEXT: [[FDIV_OPENCL_NO_SUB:%.*]] = call contract float @llvm.amdgcn.fdiv.fast(float 1.000000e+00, float [[SQRT_X_3ULP_NO_SUB]])		; CHECK-NEXT: store volatile float [[FDIV_OPENCL_NO_SUB]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: store volatile float [[FDIV_OPENCL_NO_SUB]], ptr addrspace(1) [[OUT]], align 4		; CHECK-NEXT: ret void
; IEEE-NEXT: ret void
;
; DAZ-LABEL: define amdgpu_kernel void @rsq_f32_assume_nosub
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]]) #[[ATTR1]] {
; DAZ-NEXT: [[FABS_X:%.*]] = call float @llvm.fabs.f32(float [[X]])
; DAZ-NEXT: [[IS_NOT_SUBNORMAL:%.*]] = fcmp oge float [[FABS_X]], 0x3810000000000000
; DAZ-NEXT: call void @llvm.assume(i1 [[IS_NOT_SUBNORMAL]])
; DAZ-NEXT: [[SQRT_X_3ULP_NO_SUB:%.*]] = call contract float @llvm.sqrt.f32(float [[X]]), !fpmath !3
; DAZ-NEXT: [[FDIV_OPENCL_NO_SUB:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[SQRT_X_3ULP_NO_SUB]])
; DAZ-NEXT: store volatile float [[FDIV_OPENCL_NO_SUB]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: ret void
;		;
%fabs.x = call float @llvm.fabs.f32(float %x)		%fabs.x = call float @llvm.fabs.f32(float %x)
%is.not.subnormal = fcmp oge float %fabs.x, 0x3810000000000000		%is.not.subnormal = fcmp oge float %fabs.x, 0x3810000000000000
call void @llvm.assume(i1 %is.not.subnormal)		call void @llvm.assume(i1 %is.not.subnormal)
%sqrt.x.3ulp.no.sub = call contract float @llvm.sqrt.f32(float %x), !fpmath !3		%sqrt.x.3ulp.no.sub = call contract float @llvm.sqrt.f32(float %x), !fpmath !3
%fdiv.opencl.no.sub = fdiv contract float 1.0, %sqrt.x.3ulp.no.sub, !fpmath !0		%fdiv.opencl.no.sub = fdiv contract float 1.0, %sqrt.x.3ulp.no.sub, !fpmath !0
store volatile float %fdiv.opencl.no.sub, ptr addrspace(1) %out, align 4		store volatile float %fdiv.opencl.no.sub, ptr addrspace(1) %out, align 4
ret void		ret void
}		}

define amdgpu_kernel void @rsq_f32_vector_fpmath(ptr addrspace(1) %out, <2 x float> %x) {		define amdgpu_kernel void @rsq_f32_vector_fpmath(ptr addrspace(1) %out, <2 x float> %x) {
; IEEE-LABEL: define amdgpu_kernel void @rsq_f32_vector_fpmath		; IEEE-LABEL: define amdgpu_kernel void @rsq_f32_vector_fpmath
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]]) #[[ATTR1]] {		; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]]) #[[ATTR1]] {
; IEEE-NEXT: [[SQRT_X_NO_MD:%.*]] = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> [[X]])		; IEEE-NEXT: [[SQRT_X_NO_MD:%.*]] = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> [[X]])
; IEEE-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[SQRT_X_NO_MD]], i64 0		; IEEE-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[SQRT_X_NO_MD]], i64 0
; IEEE-NEXT: [[TMP2:%.*]] = fdiv contract float 1.000000e+00, [[TMP1]]		; IEEE-NEXT: [[TMP2:%.*]] = fdiv contract float 1.000000e+00, [[TMP1]]
; IEEE-NEXT: [[TMP3:%.*]] = insertelement <2 x float> poison, float [[TMP2]], i64 0		; IEEE-NEXT: [[TMP3:%.*]] = insertelement <2 x float> poison, float [[TMP2]], i64 0
; IEEE-NEXT: [[TMP4:%.*]] = extractelement <2 x float> [[SQRT_X_NO_MD]], i64 1		; IEEE-NEXT: [[TMP4:%.*]] = extractelement <2 x float> [[SQRT_X_NO_MD]], i64 1
; IEEE-NEXT: [[TMP5:%.*]] = fdiv contract float 1.000000e+00, [[TMP4]]		; IEEE-NEXT: [[TMP5:%.*]] = fdiv contract float 1.000000e+00, [[TMP4]]
; IEEE-NEXT: [[NO_MD:%.*]] = insertelement <2 x float> [[TMP3]], float [[TMP5]], i64 1		; IEEE-NEXT: [[NO_MD:%.*]] = insertelement <2 x float> [[TMP3]], float [[TMP5]], i64 1
; IEEE-NEXT: store volatile <2 x float> [[NO_MD]], ptr addrspace(1) [[OUT]], align 4		; IEEE-NEXT: store volatile <2 x float> [[NO_MD]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[SQRT_MD_1ULP:%.*]] = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> [[X]]), !fpmath !2		; IEEE-NEXT: [[TMP6:%.*]] = extractelement <2 x float> [[X]], i64 0
; IEEE-NEXT: [[TMP6:%.*]] = extractelement <2 x float> [[SQRT_MD_1ULP]], i64 0		; IEEE-NEXT: [[TMP7:%.*]] = fcmp contract olt float [[TMP6]], 0x3810000000000000
; IEEE-NEXT: [[TMP7:%.*]] = fdiv contract float 1.000000e+00, [[TMP6]]		; IEEE-NEXT: [[TMP8:%.*]] = select contract i1 [[TMP7]], float 0x4170000000000000, float 1.000000e+00
; IEEE-NEXT: [[TMP8:%.*]] = insertelement <2 x float> poison, float [[TMP7]], i64 0		; IEEE-NEXT: [[TMP9:%.*]] = fmul contract float [[TMP6]], [[TMP8]]
; IEEE-NEXT: [[TMP9:%.*]] = extractelement <2 x float> [[SQRT_MD_1ULP]], i64 1		; IEEE-NEXT: [[TMP10:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP9]])
; IEEE-NEXT: [[TMP10:%.*]] = fdiv contract float 1.000000e+00, [[TMP9]]		; IEEE-NEXT: [[TMP11:%.*]] = select contract i1 [[TMP7]], float 4.096000e+03, float 1.000000e+00
; IEEE-NEXT: [[MD_1ULP:%.*]] = insertelement <2 x float> [[TMP8]], float [[TMP10]], i64 1		; IEEE-NEXT: [[TMP12:%.*]] = fmul contract float [[TMP10]], [[TMP11]]
		; IEEE-NEXT: [[TMP13:%.*]] = insertelement <2 x float> poison, float [[TMP12]], i64 0
		; IEEE-NEXT: [[TMP14:%.*]] = extractelement <2 x float> [[X]], i64 1
		; IEEE-NEXT: [[TMP15:%.*]] = fcmp contract olt float [[TMP14]], 0x3810000000000000
		; IEEE-NEXT: [[TMP16:%.*]] = select contract i1 [[TMP15]], float 0x4170000000000000, float 1.000000e+00
		; IEEE-NEXT: [[TMP17:%.*]] = fmul contract float [[TMP14]], [[TMP16]]
		; IEEE-NEXT: [[TMP18:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP17]])
		; IEEE-NEXT: [[TMP19:%.*]] = select contract i1 [[TMP15]], float 4.096000e+03, float 1.000000e+00
		; IEEE-NEXT: [[TMP20:%.*]] = fmul contract float [[TMP18]], [[TMP19]]
		; IEEE-NEXT: [[MD_1ULP:%.*]] = insertelement <2 x float> [[TMP13]], float [[TMP20]], i64 1
; IEEE-NEXT: store volatile <2 x float> [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-NEXT: store volatile <2 x float> [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[SQRT_MD_1ULP_UNDEF:%.*]] = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> [[X]]), !fpmath !2		; IEEE-NEXT: [[SQRT_MD_1ULP_UNDEF:%.*]] = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> [[X]]), !fpmath !2
; IEEE-NEXT: [[TMP11:%.*]] = extractelement <2 x float> [[SQRT_MD_1ULP_UNDEF]], i64 0		; IEEE-NEXT: [[TMP21:%.*]] = extractelement <2 x float> [[X]], i64 0
; IEEE-NEXT: [[TMP12:%.*]] = fdiv contract float 1.000000e+00, [[TMP11]]		; IEEE-NEXT: [[TMP22:%.*]] = fcmp contract olt float [[TMP21]], 0x3810000000000000
; IEEE-NEXT: [[TMP13:%.*]] = insertelement <2 x float> poison, float [[TMP12]], i64 0		; IEEE-NEXT: [[TMP23:%.*]] = select contract i1 [[TMP22]], float 0x4170000000000000, float 1.000000e+00
; IEEE-NEXT: [[TMP14:%.*]] = extractelement <2 x float> [[SQRT_MD_1ULP_UNDEF]], i64 1		; IEEE-NEXT: [[TMP24:%.*]] = fmul contract float [[TMP21]], [[TMP23]]
; IEEE-NEXT: [[TMP15:%.*]] = fdiv contract float undef, [[TMP14]]		; IEEE-NEXT: [[TMP25:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP24]])
; IEEE-NEXT: [[MD_1ULP_UNDEF:%.*]] = insertelement <2 x float> [[TMP13]], float [[TMP15]], i64 1		; IEEE-NEXT: [[TMP26:%.*]] = select contract i1 [[TMP22]], float 4.096000e+03, float 1.000000e+00
		; IEEE-NEXT: [[TMP27:%.*]] = fmul contract float [[TMP25]], [[TMP26]]
		; IEEE-NEXT: [[TMP28:%.*]] = insertelement <2 x float> poison, float [[TMP27]], i64 0
		; IEEE-NEXT: [[TMP29:%.*]] = extractelement <2 x float> [[SQRT_MD_1ULP_UNDEF]], i64 1
		; IEEE-NEXT: [[TMP30:%.*]] = fdiv contract float undef, [[TMP29]], !fpmath !2
		; IEEE-NEXT: [[MD_1ULP_UNDEF:%.*]] = insertelement <2 x float> [[TMP28]], float [[TMP30]], i64 1
; IEEE-NEXT: store volatile <2 x float> [[MD_1ULP_UNDEF]], ptr addrspace(1) [[OUT]], align 4		; IEEE-NEXT: store volatile <2 x float> [[MD_1ULP_UNDEF]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[SQRT_X_3ULP:%.*]] = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> [[X]]), !fpmath !3		; IEEE-NEXT: [[TMP31:%.*]] = extractelement <2 x float> [[X]], i64 0
; IEEE-NEXT: [[TMP16:%.*]] = extractelement <2 x float> [[SQRT_X_3ULP]], i64 0		; IEEE-NEXT: [[TMP32:%.*]] = fcmp contract olt float [[TMP31]], 0x3810000000000000
; IEEE-NEXT: [[TMP17:%.*]] = call contract float @llvm.amdgcn.fdiv.fast(float 1.000000e+00, float [[TMP16]])		; IEEE-NEXT: [[TMP33:%.*]] = select contract i1 [[TMP32]], float 0x4170000000000000, float 1.000000e+00
; IEEE-NEXT: [[TMP18:%.*]] = insertelement <2 x float> poison, float [[TMP17]], i64 0		; IEEE-NEXT: [[TMP34:%.*]] = fmul contract float [[TMP31]], [[TMP33]]
; IEEE-NEXT: [[TMP19:%.*]] = extractelement <2 x float> [[SQRT_X_3ULP]], i64 1		; IEEE-NEXT: [[TMP35:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP34]])
; IEEE-NEXT: [[TMP20:%.*]] = call contract float @llvm.amdgcn.fdiv.fast(float 1.000000e+00, float [[TMP19]])		; IEEE-NEXT: [[TMP36:%.*]] = select contract i1 [[TMP32]], float 4.096000e+03, float 1.000000e+00
; IEEE-NEXT: [[FDIV_OPENCL:%.*]] = insertelement <2 x float> [[TMP18]], float [[TMP20]], i64 1		; IEEE-NEXT: [[TMP37:%.*]] = fmul contract float [[TMP35]], [[TMP36]]
		; IEEE-NEXT: [[TMP38:%.*]] = insertelement <2 x float> poison, float [[TMP37]], i64 0
		; IEEE-NEXT: [[TMP39:%.*]] = extractelement <2 x float> [[X]], i64 1
		; IEEE-NEXT: [[TMP40:%.*]] = fcmp contract olt float [[TMP39]], 0x3810000000000000
		; IEEE-NEXT: [[TMP41:%.*]] = select contract i1 [[TMP40]], float 0x4170000000000000, float 1.000000e+00
		; IEEE-NEXT: [[TMP42:%.*]] = fmul contract float [[TMP39]], [[TMP41]]
		; IEEE-NEXT: [[TMP43:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP42]])
		; IEEE-NEXT: [[TMP44:%.*]] = select contract i1 [[TMP40]], float 4.096000e+03, float 1.000000e+00
		; IEEE-NEXT: [[TMP45:%.*]] = fmul contract float [[TMP43]], [[TMP44]]
		; IEEE-NEXT: [[FDIV_OPENCL:%.*]] = insertelement <2 x float> [[TMP38]], float [[TMP45]], i64 1
; IEEE-NEXT: store volatile <2 x float> [[FDIV_OPENCL]], ptr addrspace(1) [[OUT]], align 4		; IEEE-NEXT: store volatile <2 x float> [[FDIV_OPENCL]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: ret void		; IEEE-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @rsq_f32_vector_fpmath		; DAZ-LABEL: define amdgpu_kernel void @rsq_f32_vector_fpmath
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]]) #[[ATTR1]] {
; DAZ-NEXT: [[SQRT_X_NO_MD:%.*]] = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> [[X]])		; DAZ-NEXT: [[SQRT_X_NO_MD:%.*]] = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> [[X]])
; DAZ-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[SQRT_X_NO_MD]], i64 0		; DAZ-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[SQRT_X_NO_MD]], i64 0
; DAZ-NEXT: [[TMP2:%.*]] = fdiv contract float 1.000000e+00, [[TMP1]]		; DAZ-NEXT: [[TMP2:%.*]] = fdiv contract float 1.000000e+00, [[TMP1]]
; DAZ-NEXT: [[TMP3:%.*]] = insertelement <2 x float> poison, float [[TMP2]], i64 0		; DAZ-NEXT: [[TMP3:%.*]] = insertelement <2 x float> poison, float [[TMP2]], i64 0
; DAZ-NEXT: [[TMP4:%.*]] = extractelement <2 x float> [[SQRT_X_NO_MD]], i64 1		; DAZ-NEXT: [[TMP4:%.*]] = extractelement <2 x float> [[SQRT_X_NO_MD]], i64 1
; DAZ-NEXT: [[TMP5:%.*]] = fdiv contract float 1.000000e+00, [[TMP4]]		; DAZ-NEXT: [[TMP5:%.*]] = fdiv contract float 1.000000e+00, [[TMP4]]
; DAZ-NEXT: [[NO_MD:%.*]] = insertelement <2 x float> [[TMP3]], float [[TMP5]], i64 1		; DAZ-NEXT: [[NO_MD:%.*]] = insertelement <2 x float> [[TMP3]], float [[TMP5]], i64 1
; DAZ-NEXT: store volatile <2 x float> [[NO_MD]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile <2 x float> [[NO_MD]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_MD_1ULP:%.*]] = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> [[X]]), !fpmath !2		; DAZ-NEXT: [[TMP6:%.*]] = extractelement <2 x float> [[X]], i64 0
; DAZ-NEXT: [[TMP6:%.*]] = extractelement <2 x float> [[SQRT_MD_1ULP]], i64 0		; DAZ-NEXT: [[TMP7:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP6]])
; DAZ-NEXT: [[TMP7:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP6]])
; DAZ-NEXT: [[TMP8:%.*]] = insertelement <2 x float> poison, float [[TMP7]], i64 0		; DAZ-NEXT: [[TMP8:%.*]] = insertelement <2 x float> poison, float [[TMP7]], i64 0
; DAZ-NEXT: [[TMP9:%.*]] = extractelement <2 x float> [[SQRT_MD_1ULP]], i64 1		; DAZ-NEXT: [[TMP9:%.*]] = extractelement <2 x float> [[X]], i64 1
; DAZ-NEXT: [[TMP10:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP9]])		; DAZ-NEXT: [[TMP10:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP9]])
; DAZ-NEXT: [[MD_1ULP:%.*]] = insertelement <2 x float> [[TMP8]], float [[TMP10]], i64 1		; DAZ-NEXT: [[MD_1ULP:%.*]] = insertelement <2 x float> [[TMP8]], float [[TMP10]], i64 1
; DAZ-NEXT: store volatile <2 x float> [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile <2 x float> [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_MD_1ULP_UNDEF:%.*]] = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> [[X]]), !fpmath !2		; DAZ-NEXT: [[SQRT_MD_1ULP_UNDEF:%.*]] = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> [[X]]), !fpmath !2
; DAZ-NEXT: [[TMP11:%.*]] = extractelement <2 x float> [[SQRT_MD_1ULP_UNDEF]], i64 0		; DAZ-NEXT: [[TMP11:%.*]] = extractelement <2 x float> [[X]], i64 0
; DAZ-NEXT: [[TMP12:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP11]])		; DAZ-NEXT: [[TMP12:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP11]])
; DAZ-NEXT: [[TMP13:%.*]] = insertelement <2 x float> poison, float [[TMP12]], i64 0		; DAZ-NEXT: [[TMP13:%.*]] = insertelement <2 x float> poison, float [[TMP12]], i64 0
; DAZ-NEXT: [[TMP14:%.*]] = extractelement <2 x float> [[SQRT_MD_1ULP_UNDEF]], i64 1		; DAZ-NEXT: [[TMP14:%.*]] = extractelement <2 x float> [[SQRT_MD_1ULP_UNDEF]], i64 1
; DAZ-NEXT: [[TMP15:%.*]] = fdiv contract float undef, [[TMP14]]		; DAZ-NEXT: [[TMP15:%.*]] = fdiv contract float undef, [[TMP14]], !fpmath !2
; DAZ-NEXT: [[MD_1ULP_UNDEF:%.*]] = insertelement <2 x float> [[TMP13]], float [[TMP15]], i64 1		; DAZ-NEXT: [[MD_1ULP_UNDEF:%.*]] = insertelement <2 x float> [[TMP13]], float [[TMP15]], i64 1
; DAZ-NEXT: store volatile <2 x float> [[MD_1ULP_UNDEF]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile <2 x float> [[MD_1ULP_UNDEF]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[SQRT_X_3ULP:%.*]] = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> [[X]]), !fpmath !3		; DAZ-NEXT: [[TMP16:%.*]] = extractelement <2 x float> [[X]], i64 0
; DAZ-NEXT: [[TMP16:%.*]] = extractelement <2 x float> [[SQRT_X_3ULP]], i64 0		; DAZ-NEXT: [[TMP17:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP16]])
; DAZ-NEXT: [[TMP17:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP16]])
; DAZ-NEXT: [[TMP18:%.*]] = insertelement <2 x float> poison, float [[TMP17]], i64 0		; DAZ-NEXT: [[TMP18:%.*]] = insertelement <2 x float> poison, float [[TMP17]], i64 0
; DAZ-NEXT: [[TMP19:%.*]] = extractelement <2 x float> [[SQRT_X_3ULP]], i64 1		; DAZ-NEXT: [[TMP19:%.*]] = extractelement <2 x float> [[X]], i64 1
; DAZ-NEXT: [[TMP20:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP19]])		; DAZ-NEXT: [[TMP20:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP19]])
; DAZ-NEXT: [[FDIV_OPENCL:%.*]] = insertelement <2 x float> [[TMP18]], float [[TMP20]], i64 1		; DAZ-NEXT: [[FDIV_OPENCL:%.*]] = insertelement <2 x float> [[TMP18]], float [[TMP20]], i64 1
; DAZ-NEXT: store volatile <2 x float> [[FDIV_OPENCL]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile <2 x float> [[FDIV_OPENCL]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: ret void		; DAZ-NEXT: ret void
;		;
%sqrt.x.no.md = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> %x)		%sqrt.x.no.md = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> %x)
%no.md = fdiv contract <2 x float> <float 1.0, float 1.0>, %sqrt.x.no.md		%no.md = fdiv contract <2 x float> <float 1.0, float 1.0>, %sqrt.x.no.md
store volatile <2 x float> %no.md, ptr addrspace(1) %out, align 4		store volatile <2 x float> %no.md, ptr addrspace(1) %out, align 4

Show All 29 Lines	;
%arcp0 = fdiv arcp float %x, %denom		%arcp0 = fdiv arcp float %x, %denom
%arcp1 = fdiv arcp float %y, %denom		%arcp1 = fdiv arcp float %y, %denom
store volatile float %arcp0, ptr addrspace(1) %out		store volatile float %arcp0, ptr addrspace(1) %out
store volatile float %arcp1, ptr addrspace(1) %out		store volatile float %arcp1, ptr addrspace(1) %out
ret void		ret void
}		}

define amdgpu_kernel void @multiple_arcp_fdiv_denom_25ulp(ptr addrspace(1) %out, float %x, float %y, float %denom) {		define amdgpu_kernel void @multiple_arcp_fdiv_denom_25ulp(ptr addrspace(1) %out, float %x, float %y, float %denom) {
; IEEE-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_25ulp		; IEEE-GOODFREXP-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_25ulp
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[DENOM:%.]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[DENOM:%.]]) #[[ATTR1]] {
; IEEE-NEXT: [[ARCP0:%.*]] = fdiv arcp float [[X]], [[DENOM]], !fpmath !0		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
; IEEE-NEXT: [[ARCP1:%.*]] = fdiv arcp float [[Y]], [[DENOM]], !fpmath !0		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
; IEEE-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP1]], 1
; IEEE-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
; IEEE-NEXT: ret void		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-GOODFREXP-NEXT: [[ARCP0:%.*]] = fmul arcp float [[X]], [[TMP6]]
		; IEEE-GOODFREXP-NEXT: [[TMP7:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
		; IEEE-GOODFREXP-NEXT: [[TMP8:%.*]] = extractvalue { float, i32 } [[TMP7]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP9:%.*]] = extractvalue { float, i32 } [[TMP7]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP10:%.*]] = sub i32 0, [[TMP9]]
		; IEEE-GOODFREXP-NEXT: [[TMP11:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP8]])
		; IEEE-GOODFREXP-NEXT: [[TMP12:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP11]], i32 [[TMP10]])
		; IEEE-GOODFREXP-NEXT: [[ARCP1:%.*]] = fmul arcp float [[Y]], [[TMP12]]
		; IEEE-GOODFREXP-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: ret void
		;
		; IEEE-BADFREXP-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_25ulp
		; IEEE-BADFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[DENOM:%.]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-BADFREXP-NEXT: [[ARCP0:%.*]] = fmul arcp float [[X]], [[TMP6]]
		; IEEE-BADFREXP-NEXT: [[TMP7:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP8:%.*]] = extractvalue { float, i32 } [[TMP7]], 0
		; IEEE-BADFREXP-NEXT: [[TMP9:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP10:%.*]] = sub i32 0, [[TMP9]]
		; IEEE-BADFREXP-NEXT: [[TMP11:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP8]])
		; IEEE-BADFREXP-NEXT: [[TMP12:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP11]], i32 [[TMP10]])
		; IEEE-BADFREXP-NEXT: [[ARCP1:%.*]] = fmul arcp float [[Y]], [[TMP12]]
		; IEEE-BADFREXP-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_25ulp		; DAZ-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_25ulp
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[DENOM:%.]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[DENOM:%.]]) #[[ATTR1]] {
; DAZ-NEXT: [[ARCP0:%.*]] = call arcp float @llvm.amdgcn.fdiv.fast(float [[X]], float [[DENOM]])		; DAZ-NEXT: [[TMP1:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[DENOM]])
; DAZ-NEXT: [[ARCP1:%.*]] = call arcp float @llvm.amdgcn.fdiv.fast(float [[Y]], float [[DENOM]])		; DAZ-NEXT: [[ARCP0:%.*]] = fmul arcp float [[X]], [[TMP1]]
		; DAZ-NEXT: [[TMP2:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[DENOM]])
		; DAZ-NEXT: [[ARCP1:%.*]] = fmul arcp float [[Y]], [[TMP2]]
; DAZ-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: ret void		; DAZ-NEXT: ret void
;		;
%arcp0 = fdiv arcp float %x, %denom, !fpmath !0		%arcp0 = fdiv arcp float %x, %denom, !fpmath !0
%arcp1 = fdiv arcp float %y, %denom, !fpmath !0		%arcp1 = fdiv arcp float %y, %denom, !fpmath !0
store volatile float %arcp0, ptr addrspace(1) %out		store volatile float %arcp0, ptr addrspace(1) %out
store volatile float %arcp1, ptr addrspace(1) %out		store volatile float %arcp1, ptr addrspace(1) %out
ret void		ret void
}		}

define amdgpu_kernel void @multiple_arcp_fdiv_denom_25ulp_x3(ptr addrspace(1) %out, float %x, float %y, float %z, float %denom) {		define amdgpu_kernel void @multiple_arcp_fdiv_denom_25ulp_x3(ptr addrspace(1) %out, float %x, float %y, float %z, float %denom) {
; IEEE-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_25ulp_x3		; IEEE-GOODFREXP-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_25ulp_x3
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[Z:%.]], float [[DENOM:%.*]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[Z:%.]], float [[DENOM:%.*]]) #[[ATTR1]] {
; IEEE-NEXT: [[ARCP0:%.*]] = fdiv arcp float [[X]], [[DENOM]], !fpmath !0		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
; IEEE-NEXT: [[ARCP1:%.*]] = fdiv arcp float [[Y]], [[DENOM]], !fpmath !0		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
; IEEE-NEXT: [[ARCP2:%.*]] = fdiv arcp float [[Z]], [[DENOM]], !fpmath !0		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP1]], 1
; IEEE-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
; IEEE-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP2]])
; IEEE-NEXT: store volatile float [[ARCP2]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
; IEEE-NEXT: ret void		; IEEE-GOODFREXP-NEXT: [[ARCP0:%.*]] = fmul arcp float [[X]], [[TMP6]]
		; IEEE-GOODFREXP-NEXT: [[TMP7:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
		; IEEE-GOODFREXP-NEXT: [[TMP8:%.*]] = extractvalue { float, i32 } [[TMP7]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP9:%.*]] = extractvalue { float, i32 } [[TMP7]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP10:%.*]] = sub i32 0, [[TMP9]]
		; IEEE-GOODFREXP-NEXT: [[TMP11:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP8]])
		; IEEE-GOODFREXP-NEXT: [[TMP12:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP11]], i32 [[TMP10]])
		; IEEE-GOODFREXP-NEXT: [[ARCP1:%.*]] = fmul arcp float [[Y]], [[TMP12]]
		; IEEE-GOODFREXP-NEXT: [[TMP13:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
		; IEEE-GOODFREXP-NEXT: [[TMP14:%.*]] = extractvalue { float, i32 } [[TMP13]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP15:%.*]] = extractvalue { float, i32 } [[TMP13]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP16:%.*]] = sub i32 0, [[TMP15]]
		; IEEE-GOODFREXP-NEXT: [[TMP17:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP14]])
		; IEEE-GOODFREXP-NEXT: [[TMP18:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP17]], i32 [[TMP16]])
		; IEEE-GOODFREXP-NEXT: [[ARCP2:%.*]] = fmul arcp float [[Z]], [[TMP18]]
		; IEEE-GOODFREXP-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: store volatile float [[ARCP2]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: ret void
		;
		; IEEE-BADFREXP-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_25ulp_x3
		; IEEE-BADFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[Z:%.]], float [[DENOM:%.*]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-BADFREXP-NEXT: [[ARCP0:%.*]] = fmul arcp float [[X]], [[TMP6]]
		; IEEE-BADFREXP-NEXT: [[TMP7:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP8:%.*]] = extractvalue { float, i32 } [[TMP7]], 0
		; IEEE-BADFREXP-NEXT: [[TMP9:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP10:%.*]] = sub i32 0, [[TMP9]]
		; IEEE-BADFREXP-NEXT: [[TMP11:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP8]])
		; IEEE-BADFREXP-NEXT: [[TMP12:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP11]], i32 [[TMP10]])
		; IEEE-BADFREXP-NEXT: [[ARCP1:%.*]] = fmul arcp float [[Y]], [[TMP12]]
		; IEEE-BADFREXP-NEXT: [[TMP13:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP14:%.*]] = extractvalue { float, i32 } [[TMP13]], 0
		; IEEE-BADFREXP-NEXT: [[TMP15:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP16:%.*]] = sub i32 0, [[TMP15]]
		; IEEE-BADFREXP-NEXT: [[TMP17:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP14]])
		; IEEE-BADFREXP-NEXT: [[TMP18:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP17]], i32 [[TMP16]])
		; IEEE-BADFREXP-NEXT: [[ARCP2:%.*]] = fmul arcp float [[Z]], [[TMP18]]
		; IEEE-BADFREXP-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: store volatile float [[ARCP2]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_25ulp_x3		; DAZ-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_25ulp_x3
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[Z:%.]], float [[DENOM:%.*]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[Z:%.]], float [[DENOM:%.*]]) #[[ATTR1]] {
; DAZ-NEXT: [[ARCP0:%.*]] = call arcp float @llvm.amdgcn.fdiv.fast(float [[X]], float [[DENOM]])		; DAZ-NEXT: [[TMP1:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[DENOM]])
; DAZ-NEXT: [[ARCP1:%.*]] = call arcp float @llvm.amdgcn.fdiv.fast(float [[Y]], float [[DENOM]])		; DAZ-NEXT: [[ARCP0:%.*]] = fmul arcp float [[X]], [[TMP1]]
; DAZ-NEXT: [[ARCP2:%.*]] = call arcp float @llvm.amdgcn.fdiv.fast(float [[Z]], float [[DENOM]])		; DAZ-NEXT: [[TMP2:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[DENOM]])
		; DAZ-NEXT: [[ARCP1:%.*]] = fmul arcp float [[Y]], [[TMP2]]
		; DAZ-NEXT: [[TMP3:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[DENOM]])
		; DAZ-NEXT: [[ARCP2:%.*]] = fmul arcp float [[Z]], [[TMP3]]
; DAZ-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: store volatile float [[ARCP2]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[ARCP2]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: ret void		; DAZ-NEXT: ret void
;		;
%arcp0 = fdiv arcp float %x, %denom, !fpmath !0		%arcp0 = fdiv arcp float %x, %denom, !fpmath !0
%arcp1 = fdiv arcp float %y, %denom, !fpmath !0		%arcp1 = fdiv arcp float %y, %denom, !fpmath !0
%arcp2 = fdiv arcp float %z, %denom, !fpmath !0		%arcp2 = fdiv arcp float %z, %denom, !fpmath !0
store volatile float %arcp0, ptr addrspace(1) %out		store volatile float %arcp0, ptr addrspace(1) %out
store volatile float %arcp1, ptr addrspace(1) %out		store volatile float %arcp1, ptr addrspace(1) %out
store volatile float %arcp2, ptr addrspace(1) %out		store volatile float %arcp2, ptr addrspace(1) %out
ret void		ret void
}		}

define amdgpu_kernel void @multiple_arcp_fdiv_denom_25ulp_nomd(ptr addrspace(1) %out, float %x, float %y, float %denom) {		define amdgpu_kernel void @multiple_arcp_fdiv_denom_25ulp_nomd(ptr addrspace(1) %out, float %x, float %y, float %denom) {
; IEEE-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_25ulp_nomd		; IEEE-GOODFREXP-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_25ulp_nomd
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[DENOM:%.]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[DENOM:%.]]) #[[ATTR1]] {
; IEEE-NEXT: [[ARCP0:%.*]] = fdiv arcp float [[X]], [[DENOM]], !fpmath !0		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
; IEEE-NEXT: [[ARCP1:%.*]] = fdiv arcp float [[Y]], [[DENOM]]		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
; IEEE-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP1]], 1
; IEEE-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
; IEEE-NEXT: ret void		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-GOODFREXP-NEXT: [[ARCP0:%.*]] = fmul arcp float [[X]], [[TMP6]]
		; IEEE-GOODFREXP-NEXT: [[ARCP1:%.*]] = fdiv arcp float [[Y]], [[DENOM]]
		; IEEE-GOODFREXP-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: ret void
		;
		; IEEE-BADFREXP-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_25ulp_nomd
		; IEEE-BADFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[DENOM:%.]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-BADFREXP-NEXT: [[ARCP0:%.*]] = fmul arcp float [[X]], [[TMP6]]
		; IEEE-BADFREXP-NEXT: [[ARCP1:%.*]] = fdiv arcp float [[Y]], [[DENOM]]
		; IEEE-BADFREXP-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_25ulp_nomd		; DAZ-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_25ulp_nomd
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[DENOM:%.]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[DENOM:%.]]) #[[ATTR1]] {
; DAZ-NEXT: [[ARCP0:%.*]] = call arcp float @llvm.amdgcn.fdiv.fast(float [[X]], float [[DENOM]])		; DAZ-NEXT: [[TMP1:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[DENOM]])
		; DAZ-NEXT: [[ARCP0:%.*]] = fmul arcp float [[X]], [[TMP1]]
; DAZ-NEXT: [[ARCP1:%.*]] = fdiv arcp float [[Y]], [[DENOM]]		; DAZ-NEXT: [[ARCP1:%.*]] = fdiv arcp float [[Y]], [[DENOM]]
; DAZ-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: ret void		; DAZ-NEXT: ret void
;		;
%arcp0 = fdiv arcp float %x, %denom, !fpmath !0		%arcp0 = fdiv arcp float %x, %denom, !fpmath !0
%arcp1 = fdiv arcp float %y, %denom		%arcp1 = fdiv arcp float %y, %denom
store volatile float %arcp0, ptr addrspace(1) %out		store volatile float %arcp0, ptr addrspace(1) %out
store volatile float %arcp1, ptr addrspace(1) %out		store volatile float %arcp1, ptr addrspace(1) %out
ret void		ret void
}		}

define amdgpu_kernel void @multiple_arcp_fdiv_denom_nomd_25ulp(ptr addrspace(1) %out, float %x, float %y, float %denom) {		define amdgpu_kernel void @multiple_arcp_fdiv_denom_nomd_25ulp(ptr addrspace(1) %out, float %x, float %y, float %denom) {
; IEEE-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_nomd_25ulp		; IEEE-GOODFREXP-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_nomd_25ulp
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[DENOM:%.]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[DENOM:%.]]) #[[ATTR1]] {
; IEEE-NEXT: [[ARCP0:%.*]] = fdiv arcp float [[X]], [[DENOM]]		; IEEE-GOODFREXP-NEXT: [[ARCP0:%.*]] = fdiv arcp float [[X]], [[DENOM]]
; IEEE-NEXT: [[ARCP1:%.*]] = fdiv arcp float [[Y]], [[DENOM]], !fpmath !0		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
; IEEE-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
; IEEE-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP1]], 1
; IEEE-NEXT: ret void		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-GOODFREXP-NEXT: [[ARCP1:%.*]] = fmul arcp float [[Y]], [[TMP6]]
		; IEEE-GOODFREXP-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: ret void
		;
		; IEEE-BADFREXP-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_nomd_25ulp
		; IEEE-BADFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[DENOM:%.]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[ARCP0:%.*]] = fdiv arcp float [[X]], [[DENOM]]
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-BADFREXP-NEXT: [[ARCP1:%.*]] = fmul arcp float [[Y]], [[TMP6]]
		; IEEE-BADFREXP-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_nomd_25ulp		; DAZ-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_nomd_25ulp
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[DENOM:%.]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[DENOM:%.]]) #[[ATTR1]] {
; DAZ-NEXT: [[ARCP0:%.*]] = fdiv arcp float [[X]], [[DENOM]]		; DAZ-NEXT: [[ARCP0:%.*]] = fdiv arcp float [[X]], [[DENOM]]
; DAZ-NEXT: [[ARCP1:%.*]] = call arcp float @llvm.amdgcn.fdiv.fast(float [[Y]], float [[DENOM]])		; DAZ-NEXT: [[TMP1:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[DENOM]])
		; DAZ-NEXT: [[ARCP1:%.*]] = fmul arcp float [[Y]], [[TMP1]]
; DAZ-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: ret void		; DAZ-NEXT: ret void
;		;
%arcp0 = fdiv arcp float %x, %denom		%arcp0 = fdiv arcp float %x, %denom
%arcp1 = fdiv arcp float %y, %denom, !fpmath !0		%arcp1 = fdiv arcp float %y, %denom, !fpmath !0
store volatile float %arcp0, ptr addrspace(1) %out		store volatile float %arcp0, ptr addrspace(1) %out
store volatile float %arcp1, ptr addrspace(1) %out		store volatile float %arcp1, ptr addrspace(1) %out
ret void		ret void
}		}

define amdgpu_kernel void @multiple_arcp_fdiv_denom_1ulp(ptr addrspace(1) %out, float %x, float %y, float %denom) {		define amdgpu_kernel void @multiple_arcp_fdiv_denom_1ulp(ptr addrspace(1) %out, float %x, float %y, float %denom) {
; CHECK-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_1ulp		; IEEE-GOODFREXP-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_1ulp
; CHECK-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[DENOM:%.]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[DENOM:%.]]) #[[ATTR1]] {
; CHECK-NEXT: [[ARCP0:%.*]] = fdiv arcp float [[X]], [[DENOM]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
; CHECK-NEXT: [[ARCP1:%.*]] = fdiv arcp float [[Y]], [[DENOM]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
; CHECK-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP1]], 1
; CHECK-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
; CHECK-NEXT: ret void		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-GOODFREXP-NEXT: [[ARCP0:%.*]] = fmul arcp float [[X]], [[TMP6]]
		; IEEE-GOODFREXP-NEXT: [[TMP7:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
		; IEEE-GOODFREXP-NEXT: [[TMP8:%.*]] = extractvalue { float, i32 } [[TMP7]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP9:%.*]] = extractvalue { float, i32 } [[TMP7]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP10:%.*]] = sub i32 0, [[TMP9]]
		; IEEE-GOODFREXP-NEXT: [[TMP11:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP8]])
		; IEEE-GOODFREXP-NEXT: [[TMP12:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP11]], i32 [[TMP10]])
		; IEEE-GOODFREXP-NEXT: [[ARCP1:%.*]] = fmul arcp float [[Y]], [[TMP12]]
		; IEEE-GOODFREXP-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: ret void
		;
		; IEEE-BADFREXP-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_1ulp
		; IEEE-BADFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[DENOM:%.]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-BADFREXP-NEXT: [[ARCP0:%.*]] = fmul arcp float [[X]], [[TMP6]]
		; IEEE-BADFREXP-NEXT: [[TMP7:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP8:%.*]] = extractvalue { float, i32 } [[TMP7]], 0
		; IEEE-BADFREXP-NEXT: [[TMP9:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP10:%.*]] = sub i32 0, [[TMP9]]
		; IEEE-BADFREXP-NEXT: [[TMP11:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP8]])
		; IEEE-BADFREXP-NEXT: [[TMP12:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP11]], i32 [[TMP10]])
		; IEEE-BADFREXP-NEXT: [[ARCP1:%.*]] = fmul arcp float [[Y]], [[TMP12]]
		; IEEE-BADFREXP-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: ret void
		;
		; DAZ-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_1ulp
		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[DENOM:%.]]) #[[ATTR1]] {
		; DAZ-NEXT: [[TMP1:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[DENOM]])
		; DAZ-NEXT: [[ARCP0:%.*]] = fmul arcp float [[X]], [[TMP1]]
		; DAZ-NEXT: [[TMP2:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[DENOM]])
		; DAZ-NEXT: [[ARCP1:%.*]] = fmul arcp float [[Y]], [[TMP2]]
		; DAZ-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4
		; DAZ-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4
		; DAZ-NEXT: ret void
;		;
%arcp0 = fdiv arcp float %x, %denom, !fpmath !2		%arcp0 = fdiv arcp float %x, %denom, !fpmath !2
%arcp1 = fdiv arcp float %y, %denom, !fpmath !2		%arcp1 = fdiv arcp float %y, %denom, !fpmath !2
store volatile float %arcp0, ptr addrspace(1) %out		store volatile float %arcp0, ptr addrspace(1) %out
store volatile float %arcp1, ptr addrspace(1) %out		store volatile float %arcp1, ptr addrspace(1) %out
ret void		ret void
}		}

define amdgpu_kernel void @multiple_arcp_fdiv_denom_1ulp_vector(ptr addrspace(1) %out, <2 x float> %x, <2 x float> %y, <2 x float> %denom) {		define amdgpu_kernel void @multiple_arcp_fdiv_denom_1ulp_vector(ptr addrspace(1) %out, <2 x float> %x, <2 x float> %y, <2 x float> %denom) {
; CHECK-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_1ulp_vector		; IEEE-GOODFREXP-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_1ulp_vector
; CHECK-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]], <2 x float> [[Y:%.]], <2 x float> [[DENOM:%.]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]], <2 x float> [[Y:%.]], <2 x float> [[DENOM:%.]]) #[[ATTR1]] {
; CHECK-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X]], i64 0
; CHECK-NEXT: [[TMP2:%.*]] = extractelement <2 x float> [[DENOM]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = extractelement <2 x float> [[DENOM]], i64 0
; CHECK-NEXT: [[TMP3:%.*]] = fdiv arcp float [[TMP1]], [[TMP2]]		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP2]])
; CHECK-NEXT: [[TMP4:%.*]] = insertelement <2 x float> poison, float [[TMP3]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = extractvalue { float, i32 } [[TMP3]], 0
; CHECK-NEXT: [[TMP5:%.*]] = extractelement <2 x float> [[X]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = extractvalue { float, i32 } [[TMP3]], 1
; CHECK-NEXT: [[TMP6:%.*]] = extractelement <2 x float> [[DENOM]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = sub i32 0, [[TMP5]]
; CHECK-NEXT: [[TMP7:%.*]] = fdiv arcp float [[TMP5]], [[TMP6]]		; IEEE-GOODFREXP-NEXT: [[TMP7:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP4]])
; CHECK-NEXT: [[ARCP0:%.*]] = insertelement <2 x float> [[TMP4]], float [[TMP7]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP8:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP7]], i32 [[TMP6]])
; CHECK-NEXT: [[TMP8:%.*]] = extractelement <2 x float> [[Y]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP9:%.*]] = fmul arcp float [[TMP1]], [[TMP8]]
; CHECK-NEXT: [[TMP9:%.*]] = extractelement <2 x float> [[DENOM]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP10:%.*]] = insertelement <2 x float> poison, float [[TMP9]], i64 0
; CHECK-NEXT: [[TMP10:%.*]] = fdiv arcp float [[TMP8]], [[TMP9]]		; IEEE-GOODFREXP-NEXT: [[TMP11:%.*]] = extractelement <2 x float> [[X]], i64 1
; CHECK-NEXT: [[TMP11:%.*]] = insertelement <2 x float> poison, float [[TMP10]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP12:%.*]] = extractelement <2 x float> [[DENOM]], i64 1
; CHECK-NEXT: [[TMP12:%.*]] = extractelement <2 x float> [[Y]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP13:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP12]])
; CHECK-NEXT: [[TMP13:%.*]] = extractelement <2 x float> [[DENOM]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP14:%.*]] = extractvalue { float, i32 } [[TMP13]], 0
; CHECK-NEXT: [[TMP14:%.*]] = fdiv arcp float [[TMP12]], [[TMP13]]		; IEEE-GOODFREXP-NEXT: [[TMP15:%.*]] = extractvalue { float, i32 } [[TMP13]], 1
; CHECK-NEXT: [[ARCP1:%.*]] = insertelement <2 x float> [[TMP11]], float [[TMP14]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP16:%.*]] = sub i32 0, [[TMP15]]
; CHECK-NEXT: store volatile <2 x float> [[ARCP0]], ptr addrspace(1) [[OUT]], align 8		; IEEE-GOODFREXP-NEXT: [[TMP17:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP14]])
; CHECK-NEXT: store volatile <2 x float> [[ARCP1]], ptr addrspace(1) [[OUT]], align 8		; IEEE-GOODFREXP-NEXT: [[TMP18:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP17]], i32 [[TMP16]])
; CHECK-NEXT: ret void		; IEEE-GOODFREXP-NEXT: [[TMP19:%.*]] = fmul arcp float [[TMP11]], [[TMP18]]
		; IEEE-GOODFREXP-NEXT: [[ARCP0:%.*]] = insertelement <2 x float> [[TMP10]], float [[TMP19]], i64 1
		; IEEE-GOODFREXP-NEXT: [[TMP20:%.*]] = extractelement <2 x float> [[Y]], i64 0
		; IEEE-GOODFREXP-NEXT: [[TMP21:%.*]] = extractelement <2 x float> [[DENOM]], i64 0
		; IEEE-GOODFREXP-NEXT: [[TMP22:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP21]])
		; IEEE-GOODFREXP-NEXT: [[TMP23:%.*]] = extractvalue { float, i32 } [[TMP22]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP24:%.*]] = extractvalue { float, i32 } [[TMP22]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP25:%.*]] = sub i32 0, [[TMP24]]
		; IEEE-GOODFREXP-NEXT: [[TMP26:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP23]])
		; IEEE-GOODFREXP-NEXT: [[TMP27:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP26]], i32 [[TMP25]])
		; IEEE-GOODFREXP-NEXT: [[TMP28:%.*]] = fmul arcp float [[TMP20]], [[TMP27]]
		; IEEE-GOODFREXP-NEXT: [[TMP29:%.*]] = insertelement <2 x float> poison, float [[TMP28]], i64 0
		; IEEE-GOODFREXP-NEXT: [[TMP30:%.*]] = extractelement <2 x float> [[Y]], i64 1
		; IEEE-GOODFREXP-NEXT: [[TMP31:%.*]] = extractelement <2 x float> [[DENOM]], i64 1
		; IEEE-GOODFREXP-NEXT: [[TMP32:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP31]])
		; IEEE-GOODFREXP-NEXT: [[TMP33:%.*]] = extractvalue { float, i32 } [[TMP32]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP34:%.*]] = extractvalue { float, i32 } [[TMP32]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP35:%.*]] = sub i32 0, [[TMP34]]
		; IEEE-GOODFREXP-NEXT: [[TMP36:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP33]])
		; IEEE-GOODFREXP-NEXT: [[TMP37:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP36]], i32 [[TMP35]])
		; IEEE-GOODFREXP-NEXT: [[TMP38:%.*]] = fmul arcp float [[TMP30]], [[TMP37]]
		; IEEE-GOODFREXP-NEXT: [[ARCP1:%.*]] = insertelement <2 x float> [[TMP29]], float [[TMP38]], i64 1
		; IEEE-GOODFREXP-NEXT: store volatile <2 x float> [[ARCP0]], ptr addrspace(1) [[OUT]], align 8
		; IEEE-GOODFREXP-NEXT: store volatile <2 x float> [[ARCP1]], ptr addrspace(1) [[OUT]], align 8
		; IEEE-GOODFREXP-NEXT: ret void
		;
		; IEEE-BADFREXP-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_1ulp_vector
		; IEEE-BADFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]], <2 x float> [[Y:%.]], <2 x float> [[DENOM:%.]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = extractelement <2 x float> [[DENOM]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = extractvalue { float, i32 } [[TMP3]], 0
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = sub i32 0, [[TMP5]]
		; IEEE-BADFREXP-NEXT: [[TMP7:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP4]])
		; IEEE-BADFREXP-NEXT: [[TMP8:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP7]], i32 [[TMP6]])
		; IEEE-BADFREXP-NEXT: [[TMP9:%.*]] = fmul arcp float [[TMP1]], [[TMP8]]
		; IEEE-BADFREXP-NEXT: [[TMP10:%.*]] = insertelement <2 x float> poison, float [[TMP9]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP11:%.*]] = extractelement <2 x float> [[X]], i64 1
		; IEEE-BADFREXP-NEXT: [[TMP12:%.*]] = extractelement <2 x float> [[DENOM]], i64 1
		; IEEE-BADFREXP-NEXT: [[TMP13:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP12]])
		; IEEE-BADFREXP-NEXT: [[TMP14:%.*]] = extractvalue { float, i32 } [[TMP13]], 0
		; IEEE-BADFREXP-NEXT: [[TMP15:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP12]])
		; IEEE-BADFREXP-NEXT: [[TMP16:%.*]] = sub i32 0, [[TMP15]]
		; IEEE-BADFREXP-NEXT: [[TMP17:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP14]])
		; IEEE-BADFREXP-NEXT: [[TMP18:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP17]], i32 [[TMP16]])
		; IEEE-BADFREXP-NEXT: [[TMP19:%.*]] = fmul arcp float [[TMP11]], [[TMP18]]
		; IEEE-BADFREXP-NEXT: [[ARCP0:%.*]] = insertelement <2 x float> [[TMP10]], float [[TMP19]], i64 1
		; IEEE-BADFREXP-NEXT: [[TMP20:%.*]] = extractelement <2 x float> [[Y]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP21:%.*]] = extractelement <2 x float> [[DENOM]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP22:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP21]])
		; IEEE-BADFREXP-NEXT: [[TMP23:%.*]] = extractvalue { float, i32 } [[TMP22]], 0
		; IEEE-BADFREXP-NEXT: [[TMP24:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP21]])
		; IEEE-BADFREXP-NEXT: [[TMP25:%.*]] = sub i32 0, [[TMP24]]
		; IEEE-BADFREXP-NEXT: [[TMP26:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP23]])
		; IEEE-BADFREXP-NEXT: [[TMP27:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP26]], i32 [[TMP25]])
		; IEEE-BADFREXP-NEXT: [[TMP28:%.*]] = fmul arcp float [[TMP20]], [[TMP27]]
		; IEEE-BADFREXP-NEXT: [[TMP29:%.*]] = insertelement <2 x float> poison, float [[TMP28]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP30:%.*]] = extractelement <2 x float> [[Y]], i64 1
		; IEEE-BADFREXP-NEXT: [[TMP31:%.*]] = extractelement <2 x float> [[DENOM]], i64 1
		; IEEE-BADFREXP-NEXT: [[TMP32:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP31]])
		; IEEE-BADFREXP-NEXT: [[TMP33:%.*]] = extractvalue { float, i32 } [[TMP32]], 0
		; IEEE-BADFREXP-NEXT: [[TMP34:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP31]])
		; IEEE-BADFREXP-NEXT: [[TMP35:%.*]] = sub i32 0, [[TMP34]]
		; IEEE-BADFREXP-NEXT: [[TMP36:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP33]])
		; IEEE-BADFREXP-NEXT: [[TMP37:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP36]], i32 [[TMP35]])
		; IEEE-BADFREXP-NEXT: [[TMP38:%.*]] = fmul arcp float [[TMP30]], [[TMP37]]
		; IEEE-BADFREXP-NEXT: [[ARCP1:%.*]] = insertelement <2 x float> [[TMP29]], float [[TMP38]], i64 1
		; IEEE-BADFREXP-NEXT: store volatile <2 x float> [[ARCP0]], ptr addrspace(1) [[OUT]], align 8
		; IEEE-BADFREXP-NEXT: store volatile <2 x float> [[ARCP1]], ptr addrspace(1) [[OUT]], align 8
		; IEEE-BADFREXP-NEXT: ret void
		;
		; DAZ-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_denom_1ulp_vector
		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]], <2 x float> [[Y:%.]], <2 x float> [[DENOM:%.]]) #[[ATTR1]] {
		; DAZ-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X]], i64 0
		; DAZ-NEXT: [[TMP2:%.*]] = extractelement <2 x float> [[DENOM]], i64 0
		; DAZ-NEXT: [[TMP3:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; DAZ-NEXT: [[TMP4:%.*]] = fmul arcp float [[TMP1]], [[TMP3]]
		; DAZ-NEXT: [[TMP5:%.*]] = insertelement <2 x float> poison, float [[TMP4]], i64 0
		; DAZ-NEXT: [[TMP6:%.*]] = extractelement <2 x float> [[X]], i64 1
		; DAZ-NEXT: [[TMP7:%.*]] = extractelement <2 x float> [[DENOM]], i64 1
		; DAZ-NEXT: [[TMP8:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP7]])
		; DAZ-NEXT: [[TMP9:%.*]] = fmul arcp float [[TMP6]], [[TMP8]]
		; DAZ-NEXT: [[ARCP0:%.*]] = insertelement <2 x float> [[TMP5]], float [[TMP9]], i64 1
		; DAZ-NEXT: [[TMP10:%.*]] = extractelement <2 x float> [[Y]], i64 0
		; DAZ-NEXT: [[TMP11:%.*]] = extractelement <2 x float> [[DENOM]], i64 0
		; DAZ-NEXT: [[TMP12:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP11]])
		; DAZ-NEXT: [[TMP13:%.*]] = fmul arcp float [[TMP10]], [[TMP12]]
		; DAZ-NEXT: [[TMP14:%.*]] = insertelement <2 x float> poison, float [[TMP13]], i64 0
		; DAZ-NEXT: [[TMP15:%.*]] = extractelement <2 x float> [[Y]], i64 1
		; DAZ-NEXT: [[TMP16:%.*]] = extractelement <2 x float> [[DENOM]], i64 1
		; DAZ-NEXT: [[TMP17:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP16]])
		; DAZ-NEXT: [[TMP18:%.*]] = fmul arcp float [[TMP15]], [[TMP17]]
		; DAZ-NEXT: [[ARCP1:%.*]] = insertelement <2 x float> [[TMP14]], float [[TMP18]], i64 1
		; DAZ-NEXT: store volatile <2 x float> [[ARCP0]], ptr addrspace(1) [[OUT]], align 8
		; DAZ-NEXT: store volatile <2 x float> [[ARCP1]], ptr addrspace(1) [[OUT]], align 8
		; DAZ-NEXT: ret void
;		;
%arcp0 = fdiv arcp <2 x float> %x, %denom, !fpmath !2		%arcp0 = fdiv arcp <2 x float> %x, %denom, !fpmath !2
%arcp1 = fdiv arcp <2 x float> %y, %denom, !fpmath !2		%arcp1 = fdiv arcp <2 x float> %y, %denom, !fpmath !2
store volatile <2 x float> %arcp0, ptr addrspace(1) %out		store volatile <2 x float> %arcp0, ptr addrspace(1) %out
store volatile <2 x float> %arcp1, ptr addrspace(1) %out		store volatile <2 x float> %arcp1, ptr addrspace(1) %out
ret void		ret void
}		}

define amdgpu_kernel void @multiple_arcp_fdiv_sqrt_denom_25ulp(ptr addrspace(1) %out, float %x, float %y, float %sqr.denom) {		define amdgpu_kernel void @multiple_arcp_fdiv_sqrt_denom_25ulp(ptr addrspace(1) %out, float %x, float %y, float %sqr.denom) {
; IEEE-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_sqrt_denom_25ulp		; IEEE-GOODFREXP-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_sqrt_denom_25ulp
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[SQR_DENOM:%.]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[SQR_DENOM:%.]]) #[[ATTR1]] {
; IEEE-NEXT: [[DENOM:%.*]] = call contract float @llvm.sqrt.f32(float [[SQR_DENOM]]), !fpmath !3		; IEEE-GOODFREXP-NEXT: [[DENOM:%.*]] = call contract float @llvm.sqrt.f32(float [[SQR_DENOM]]), !fpmath !3
; IEEE-NEXT: [[ARCP0:%.*]] = fdiv arcp contract float [[X]], [[DENOM]], !fpmath !0		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
; IEEE-NEXT: [[ARCP1:%.*]] = fdiv arcp contract float [[Y]], [[DENOM]], !fpmath !0		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
; IEEE-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP1]], 1
; IEEE-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
; IEEE-NEXT: ret void		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = call arcp contract float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-GOODFREXP-NEXT: [[ARCP0:%.*]] = fmul arcp contract float [[X]], [[TMP6]]
		; IEEE-GOODFREXP-NEXT: [[TMP7:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
		; IEEE-GOODFREXP-NEXT: [[TMP8:%.*]] = extractvalue { float, i32 } [[TMP7]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP9:%.*]] = extractvalue { float, i32 } [[TMP7]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP10:%.*]] = sub i32 0, [[TMP9]]
		; IEEE-GOODFREXP-NEXT: [[TMP11:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP8]])
		; IEEE-GOODFREXP-NEXT: [[TMP12:%.*]] = call arcp contract float @llvm.ldexp.f32.i32(float [[TMP11]], i32 [[TMP10]])
		; IEEE-GOODFREXP-NEXT: [[ARCP1:%.*]] = fmul arcp contract float [[Y]], [[TMP12]]
		; IEEE-GOODFREXP-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: ret void
		;
		; IEEE-BADFREXP-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_sqrt_denom_25ulp
		; IEEE-BADFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[SQR_DENOM:%.]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[DENOM:%.*]] = call contract float @llvm.sqrt.f32(float [[SQR_DENOM]]), !fpmath !3
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = call arcp contract float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-BADFREXP-NEXT: [[ARCP0:%.*]] = fmul arcp contract float [[X]], [[TMP6]]
		; IEEE-BADFREXP-NEXT: [[TMP7:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP8:%.*]] = extractvalue { float, i32 } [[TMP7]], 0
		; IEEE-BADFREXP-NEXT: [[TMP9:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP10:%.*]] = sub i32 0, [[TMP9]]
		; IEEE-BADFREXP-NEXT: [[TMP11:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP8]])
		; IEEE-BADFREXP-NEXT: [[TMP12:%.*]] = call arcp contract float @llvm.ldexp.f32.i32(float [[TMP11]], i32 [[TMP10]])
		; IEEE-BADFREXP-NEXT: [[ARCP1:%.*]] = fmul arcp contract float [[Y]], [[TMP12]]
		; IEEE-BADFREXP-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_sqrt_denom_25ulp		; DAZ-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_sqrt_denom_25ulp
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[SQR_DENOM:%.]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[SQR_DENOM:%.]]) #[[ATTR1]] {
; DAZ-NEXT: [[DENOM:%.*]] = call contract float @llvm.sqrt.f32(float [[SQR_DENOM]]), !fpmath !3		; DAZ-NEXT: [[DENOM:%.*]] = call contract float @llvm.sqrt.f32(float [[SQR_DENOM]]), !fpmath !3
; DAZ-NEXT: [[ARCP0:%.*]] = call arcp contract float @llvm.amdgcn.fdiv.fast(float [[X]], float [[DENOM]])		; DAZ-NEXT: [[TMP1:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[DENOM]])
; DAZ-NEXT: [[ARCP1:%.*]] = call arcp contract float @llvm.amdgcn.fdiv.fast(float [[Y]], float [[DENOM]])		; DAZ-NEXT: [[ARCP0:%.*]] = fmul arcp contract float [[X]], [[TMP1]]
		; DAZ-NEXT: [[TMP2:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[DENOM]])
		; DAZ-NEXT: [[ARCP1:%.*]] = fmul arcp contract float [[Y]], [[TMP2]]
; DAZ-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: ret void		; DAZ-NEXT: ret void
;		;
%denom = call contract float @llvm.sqrt.f32(float %sqr.denom), !fpmath !3		%denom = call contract float @llvm.sqrt.f32(float %sqr.denom), !fpmath !3
%arcp0 = fdiv contract arcp float %x, %denom, !fpmath !0		%arcp0 = fdiv contract arcp float %x, %denom, !fpmath !0
%arcp1 = fdiv contract arcp float %y, %denom, !fpmath !0		%arcp1 = fdiv contract arcp float %y, %denom, !fpmath !0
store volatile float %arcp0, ptr addrspace(1) %out		store volatile float %arcp0, ptr addrspace(1) %out
store volatile float %arcp1, ptr addrspace(1) %out		store volatile float %arcp1, ptr addrspace(1) %out
ret void		ret void
}		}

define amdgpu_kernel void @multiple_arcp_fdiv_sqrt_denom_vector_25ulp(ptr addrspace(1) %out, <2 x float> %x, <2 x float> %y, <2 x float> %sqr.denom) {		define amdgpu_kernel void @multiple_arcp_fdiv_sqrt_denom_vector_25ulp(ptr addrspace(1) %out, <2 x float> %x, <2 x float> %y, <2 x float> %sqr.denom) {
; IEEE-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_sqrt_denom_vector_25ulp		; IEEE-GOODFREXP-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_sqrt_denom_vector_25ulp
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]], <2 x float> [[Y:%.]], <2 x float> [[SQR_DENOM:%.]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]], <2 x float> [[Y:%.]], <2 x float> [[SQR_DENOM:%.]]) #[[ATTR1]] {
; IEEE-NEXT: [[DENOM:%.*]] = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> [[SQR_DENOM]]), !fpmath !3		; IEEE-GOODFREXP-NEXT: [[DENOM:%.*]] = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> [[SQR_DENOM]]), !fpmath !3
; IEEE-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X]], i64 0
; IEEE-NEXT: [[TMP2:%.*]] = extractelement <2 x float> [[DENOM]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = extractelement <2 x float> [[DENOM]], i64 0
; IEEE-NEXT: [[TMP3:%.*]] = fdiv arcp contract float [[TMP1]], [[TMP2]]		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP2]])
; IEEE-NEXT: [[TMP4:%.*]] = insertelement <2 x float> poison, float [[TMP3]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = extractvalue { float, i32 } [[TMP3]], 0
; IEEE-NEXT: [[TMP5:%.*]] = extractelement <2 x float> [[X]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = extractvalue { float, i32 } [[TMP3]], 1
; IEEE-NEXT: [[TMP6:%.*]] = extractelement <2 x float> [[DENOM]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = sub i32 0, [[TMP5]]
; IEEE-NEXT: [[TMP7:%.*]] = fdiv arcp contract float [[TMP5]], [[TMP6]]		; IEEE-GOODFREXP-NEXT: [[TMP7:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP4]])
; IEEE-NEXT: [[ARCP0:%.*]] = insertelement <2 x float> [[TMP4]], float [[TMP7]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP8:%.*]] = call arcp contract float @llvm.ldexp.f32.i32(float [[TMP7]], i32 [[TMP6]])
; IEEE-NEXT: [[TMP8:%.*]] = extractelement <2 x float> [[Y]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP9:%.*]] = fmul arcp contract float [[TMP1]], [[TMP8]]
; IEEE-NEXT: [[TMP9:%.*]] = extractelement <2 x float> [[DENOM]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP10:%.*]] = insertelement <2 x float> poison, float [[TMP9]], i64 0
; IEEE-NEXT: [[TMP10:%.*]] = fdiv arcp contract float [[TMP8]], [[TMP9]]		; IEEE-GOODFREXP-NEXT: [[TMP11:%.*]] = extractelement <2 x float> [[X]], i64 1
; IEEE-NEXT: [[TMP11:%.*]] = insertelement <2 x float> poison, float [[TMP10]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP12:%.*]] = extractelement <2 x float> [[DENOM]], i64 1
; IEEE-NEXT: [[TMP12:%.*]] = extractelement <2 x float> [[Y]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP13:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP12]])
; IEEE-NEXT: [[TMP13:%.*]] = extractelement <2 x float> [[DENOM]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP14:%.*]] = extractvalue { float, i32 } [[TMP13]], 0
; IEEE-NEXT: [[TMP14:%.*]] = fdiv arcp contract float [[TMP12]], [[TMP13]]		; IEEE-GOODFREXP-NEXT: [[TMP15:%.*]] = extractvalue { float, i32 } [[TMP13]], 1
; IEEE-NEXT: [[ARCP1:%.*]] = insertelement <2 x float> [[TMP11]], float [[TMP14]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP16:%.*]] = sub i32 0, [[TMP15]]
; IEEE-NEXT: store volatile <2 x float> [[ARCP0]], ptr addrspace(1) [[OUT]], align 8		; IEEE-GOODFREXP-NEXT: [[TMP17:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP14]])
; IEEE-NEXT: store volatile <2 x float> [[ARCP1]], ptr addrspace(1) [[OUT]], align 8		; IEEE-GOODFREXP-NEXT: [[TMP18:%.*]] = call arcp contract float @llvm.ldexp.f32.i32(float [[TMP17]], i32 [[TMP16]])
; IEEE-NEXT: ret void		; IEEE-GOODFREXP-NEXT: [[TMP19:%.*]] = fmul arcp contract float [[TMP11]], [[TMP18]]
		; IEEE-GOODFREXP-NEXT: [[ARCP0:%.*]] = insertelement <2 x float> [[TMP10]], float [[TMP19]], i64 1
		; IEEE-GOODFREXP-NEXT: [[TMP20:%.*]] = extractelement <2 x float> [[Y]], i64 0
		; IEEE-GOODFREXP-NEXT: [[TMP21:%.*]] = extractelement <2 x float> [[DENOM]], i64 0
		; IEEE-GOODFREXP-NEXT: [[TMP22:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP21]])
		; IEEE-GOODFREXP-NEXT: [[TMP23:%.*]] = extractvalue { float, i32 } [[TMP22]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP24:%.*]] = extractvalue { float, i32 } [[TMP22]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP25:%.*]] = sub i32 0, [[TMP24]]
		; IEEE-GOODFREXP-NEXT: [[TMP26:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP23]])
		; IEEE-GOODFREXP-NEXT: [[TMP27:%.*]] = call arcp contract float @llvm.ldexp.f32.i32(float [[TMP26]], i32 [[TMP25]])
		; IEEE-GOODFREXP-NEXT: [[TMP28:%.*]] = fmul arcp contract float [[TMP20]], [[TMP27]]
		; IEEE-GOODFREXP-NEXT: [[TMP29:%.*]] = insertelement <2 x float> poison, float [[TMP28]], i64 0
		; IEEE-GOODFREXP-NEXT: [[TMP30:%.*]] = extractelement <2 x float> [[Y]], i64 1
		; IEEE-GOODFREXP-NEXT: [[TMP31:%.*]] = extractelement <2 x float> [[DENOM]], i64 1
		; IEEE-GOODFREXP-NEXT: [[TMP32:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP31]])
		; IEEE-GOODFREXP-NEXT: [[TMP33:%.*]] = extractvalue { float, i32 } [[TMP32]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP34:%.*]] = extractvalue { float, i32 } [[TMP32]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP35:%.*]] = sub i32 0, [[TMP34]]
		; IEEE-GOODFREXP-NEXT: [[TMP36:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP33]])
		; IEEE-GOODFREXP-NEXT: [[TMP37:%.*]] = call arcp contract float @llvm.ldexp.f32.i32(float [[TMP36]], i32 [[TMP35]])
		; IEEE-GOODFREXP-NEXT: [[TMP38:%.*]] = fmul arcp contract float [[TMP30]], [[TMP37]]
		; IEEE-GOODFREXP-NEXT: [[ARCP1:%.*]] = insertelement <2 x float> [[TMP29]], float [[TMP38]], i64 1
		; IEEE-GOODFREXP-NEXT: store volatile <2 x float> [[ARCP0]], ptr addrspace(1) [[OUT]], align 8
		; IEEE-GOODFREXP-NEXT: store volatile <2 x float> [[ARCP1]], ptr addrspace(1) [[OUT]], align 8
		; IEEE-GOODFREXP-NEXT: ret void
		;
		; IEEE-BADFREXP-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_sqrt_denom_vector_25ulp
		; IEEE-BADFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]], <2 x float> [[Y:%.]], <2 x float> [[SQR_DENOM:%.]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[DENOM:%.*]] = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> [[SQR_DENOM]]), !fpmath !3
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = extractelement <2 x float> [[DENOM]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = extractvalue { float, i32 } [[TMP3]], 0
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = sub i32 0, [[TMP5]]
		; IEEE-BADFREXP-NEXT: [[TMP7:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP4]])
		; IEEE-BADFREXP-NEXT: [[TMP8:%.*]] = call arcp contract float @llvm.ldexp.f32.i32(float [[TMP7]], i32 [[TMP6]])
		; IEEE-BADFREXP-NEXT: [[TMP9:%.*]] = fmul arcp contract float [[TMP1]], [[TMP8]]
		; IEEE-BADFREXP-NEXT: [[TMP10:%.*]] = insertelement <2 x float> poison, float [[TMP9]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP11:%.*]] = extractelement <2 x float> [[X]], i64 1
		; IEEE-BADFREXP-NEXT: [[TMP12:%.*]] = extractelement <2 x float> [[DENOM]], i64 1
		; IEEE-BADFREXP-NEXT: [[TMP13:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP12]])
		; IEEE-BADFREXP-NEXT: [[TMP14:%.*]] = extractvalue { float, i32 } [[TMP13]], 0
		; IEEE-BADFREXP-NEXT: [[TMP15:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP12]])
		; IEEE-BADFREXP-NEXT: [[TMP16:%.*]] = sub i32 0, [[TMP15]]
		; IEEE-BADFREXP-NEXT: [[TMP17:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP14]])
		; IEEE-BADFREXP-NEXT: [[TMP18:%.*]] = call arcp contract float @llvm.ldexp.f32.i32(float [[TMP17]], i32 [[TMP16]])
		; IEEE-BADFREXP-NEXT: [[TMP19:%.*]] = fmul arcp contract float [[TMP11]], [[TMP18]]
		; IEEE-BADFREXP-NEXT: [[ARCP0:%.*]] = insertelement <2 x float> [[TMP10]], float [[TMP19]], i64 1
		; IEEE-BADFREXP-NEXT: [[TMP20:%.*]] = extractelement <2 x float> [[Y]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP21:%.*]] = extractelement <2 x float> [[DENOM]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP22:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP21]])
		; IEEE-BADFREXP-NEXT: [[TMP23:%.*]] = extractvalue { float, i32 } [[TMP22]], 0
		; IEEE-BADFREXP-NEXT: [[TMP24:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP21]])
		; IEEE-BADFREXP-NEXT: [[TMP25:%.*]] = sub i32 0, [[TMP24]]
		; IEEE-BADFREXP-NEXT: [[TMP26:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP23]])
		; IEEE-BADFREXP-NEXT: [[TMP27:%.*]] = call arcp contract float @llvm.ldexp.f32.i32(float [[TMP26]], i32 [[TMP25]])
		; IEEE-BADFREXP-NEXT: [[TMP28:%.*]] = fmul arcp contract float [[TMP20]], [[TMP27]]
		; IEEE-BADFREXP-NEXT: [[TMP29:%.*]] = insertelement <2 x float> poison, float [[TMP28]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP30:%.*]] = extractelement <2 x float> [[Y]], i64 1
		; IEEE-BADFREXP-NEXT: [[TMP31:%.*]] = extractelement <2 x float> [[DENOM]], i64 1
		; IEEE-BADFREXP-NEXT: [[TMP32:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP31]])
		; IEEE-BADFREXP-NEXT: [[TMP33:%.*]] = extractvalue { float, i32 } [[TMP32]], 0
		; IEEE-BADFREXP-NEXT: [[TMP34:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP31]])
		; IEEE-BADFREXP-NEXT: [[TMP35:%.*]] = sub i32 0, [[TMP34]]
		; IEEE-BADFREXP-NEXT: [[TMP36:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP33]])
		; IEEE-BADFREXP-NEXT: [[TMP37:%.*]] = call arcp contract float @llvm.ldexp.f32.i32(float [[TMP36]], i32 [[TMP35]])
		; IEEE-BADFREXP-NEXT: [[TMP38:%.*]] = fmul arcp contract float [[TMP30]], [[TMP37]]
		; IEEE-BADFREXP-NEXT: [[ARCP1:%.*]] = insertelement <2 x float> [[TMP29]], float [[TMP38]], i64 1
		; IEEE-BADFREXP-NEXT: store volatile <2 x float> [[ARCP0]], ptr addrspace(1) [[OUT]], align 8
		; IEEE-BADFREXP-NEXT: store volatile <2 x float> [[ARCP1]], ptr addrspace(1) [[OUT]], align 8
		; IEEE-BADFREXP-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_sqrt_denom_vector_25ulp		; DAZ-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_sqrt_denom_vector_25ulp
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]], <2 x float> [[Y:%.]], <2 x float> [[SQR_DENOM:%.]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]], <2 x float> [[Y:%.]], <2 x float> [[SQR_DENOM:%.]]) #[[ATTR1]] {
; DAZ-NEXT: [[DENOM:%.*]] = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> [[SQR_DENOM]]), !fpmath !3		; DAZ-NEXT: [[DENOM:%.*]] = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> [[SQR_DENOM]]), !fpmath !3
; DAZ-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X]], i64 0		; DAZ-NEXT: [[TMP1:%.*]] = extractelement <2 x float> [[X]], i64 0
; DAZ-NEXT: [[TMP2:%.*]] = extractelement <2 x float> [[DENOM]], i64 0		; DAZ-NEXT: [[TMP2:%.*]] = extractelement <2 x float> [[DENOM]], i64 0
; DAZ-NEXT: [[TMP3:%.*]] = call arcp contract float @llvm.amdgcn.fdiv.fast(float [[TMP1]], float [[TMP2]])		; DAZ-NEXT: [[TMP3:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP2]])
; DAZ-NEXT: [[TMP4:%.*]] = insertelement <2 x float> poison, float [[TMP3]], i64 0		; DAZ-NEXT: [[TMP4:%.*]] = fmul arcp contract float [[TMP1]], [[TMP3]]
; DAZ-NEXT: [[TMP5:%.*]] = extractelement <2 x float> [[X]], i64 1		; DAZ-NEXT: [[TMP5:%.*]] = insertelement <2 x float> poison, float [[TMP4]], i64 0
; DAZ-NEXT: [[TMP6:%.*]] = extractelement <2 x float> [[DENOM]], i64 1		; DAZ-NEXT: [[TMP6:%.*]] = extractelement <2 x float> [[X]], i64 1
; DAZ-NEXT: [[TMP7:%.*]] = call arcp contract float @llvm.amdgcn.fdiv.fast(float [[TMP5]], float [[TMP6]])		; DAZ-NEXT: [[TMP7:%.*]] = extractelement <2 x float> [[DENOM]], i64 1
; DAZ-NEXT: [[ARCP0:%.*]] = insertelement <2 x float> [[TMP4]], float [[TMP7]], i64 1		; DAZ-NEXT: [[TMP8:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP7]])
; DAZ-NEXT: [[TMP8:%.*]] = extractelement <2 x float> [[Y]], i64 0		; DAZ-NEXT: [[TMP9:%.*]] = fmul arcp contract float [[TMP6]], [[TMP8]]
; DAZ-NEXT: [[TMP9:%.*]] = extractelement <2 x float> [[DENOM]], i64 0		; DAZ-NEXT: [[ARCP0:%.*]] = insertelement <2 x float> [[TMP5]], float [[TMP9]], i64 1
; DAZ-NEXT: [[TMP10:%.*]] = call arcp contract float @llvm.amdgcn.fdiv.fast(float [[TMP8]], float [[TMP9]])		; DAZ-NEXT: [[TMP10:%.*]] = extractelement <2 x float> [[Y]], i64 0
; DAZ-NEXT: [[TMP11:%.*]] = insertelement <2 x float> poison, float [[TMP10]], i64 0		; DAZ-NEXT: [[TMP11:%.*]] = extractelement <2 x float> [[DENOM]], i64 0
; DAZ-NEXT: [[TMP12:%.*]] = extractelement <2 x float> [[Y]], i64 1		; DAZ-NEXT: [[TMP12:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP11]])
; DAZ-NEXT: [[TMP13:%.*]] = extractelement <2 x float> [[DENOM]], i64 1		; DAZ-NEXT: [[TMP13:%.*]] = fmul arcp contract float [[TMP10]], [[TMP12]]
; DAZ-NEXT: [[TMP14:%.*]] = call arcp contract float @llvm.amdgcn.fdiv.fast(float [[TMP12]], float [[TMP13]])		; DAZ-NEXT: [[TMP14:%.*]] = insertelement <2 x float> poison, float [[TMP13]], i64 0
; DAZ-NEXT: [[ARCP1:%.*]] = insertelement <2 x float> [[TMP11]], float [[TMP14]], i64 1		; DAZ-NEXT: [[TMP15:%.*]] = extractelement <2 x float> [[Y]], i64 1
		; DAZ-NEXT: [[TMP16:%.*]] = extractelement <2 x float> [[DENOM]], i64 1
		; DAZ-NEXT: [[TMP17:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP16]])
		; DAZ-NEXT: [[TMP18:%.*]] = fmul arcp contract float [[TMP15]], [[TMP17]]
		; DAZ-NEXT: [[ARCP1:%.*]] = insertelement <2 x float> [[TMP14]], float [[TMP18]], i64 1
; DAZ-NEXT: store volatile <2 x float> [[ARCP0]], ptr addrspace(1) [[OUT]], align 8		; DAZ-NEXT: store volatile <2 x float> [[ARCP0]], ptr addrspace(1) [[OUT]], align 8
; DAZ-NEXT: store volatile <2 x float> [[ARCP1]], ptr addrspace(1) [[OUT]], align 8		; DAZ-NEXT: store volatile <2 x float> [[ARCP1]], ptr addrspace(1) [[OUT]], align 8
; DAZ-NEXT: ret void		; DAZ-NEXT: ret void
;		;
%denom = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> %sqr.denom), !fpmath !3		%denom = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> %sqr.denom), !fpmath !3
%arcp0 = fdiv contract arcp <2 x float> %x, %denom, !fpmath !0		%arcp0 = fdiv contract arcp <2 x float> %x, %denom, !fpmath !0
%arcp1 = fdiv contract arcp <2 x float> %y, %denom, !fpmath !0		%arcp1 = fdiv contract arcp <2 x float> %y, %denom, !fpmath !0
store volatile <2 x float> %arcp0, ptr addrspace(1) %out		store volatile <2 x float> %arcp0, ptr addrspace(1) %out
store volatile <2 x float> %arcp1, ptr addrspace(1) %out		store volatile <2 x float> %arcp1, ptr addrspace(1) %out
ret void		ret void
}		}

define amdgpu_kernel void @multiple_arcp_fdiv_sqrt_denom_25ulp_x3(ptr addrspace(1) %out, float %x, float %y, float %z, float %sqr.denom) {		define amdgpu_kernel void @multiple_arcp_fdiv_sqrt_denom_25ulp_x3(ptr addrspace(1) %out, float %x, float %y, float %z, float %sqr.denom) {
; IEEE-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_sqrt_denom_25ulp_x3		; IEEE-GOODFREXP-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_sqrt_denom_25ulp_x3
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[Z:%.]], float [[SQR_DENOM:%.*]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[Z:%.]], float [[SQR_DENOM:%.*]]) #[[ATTR1]] {
; IEEE-NEXT: [[DENOM:%.*]] = call contract float @llvm.sqrt.f32(float [[SQR_DENOM]]), !fpmath !3		; IEEE-GOODFREXP-NEXT: [[DENOM:%.*]] = call contract float @llvm.sqrt.f32(float [[SQR_DENOM]]), !fpmath !3
; IEEE-NEXT: [[ARCP0:%.*]] = fdiv arcp contract float [[X]], [[DENOM]], !fpmath !0		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
; IEEE-NEXT: [[ARCP1:%.*]] = fdiv arcp contract float [[Y]], [[DENOM]], !fpmath !0		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
; IEEE-NEXT: [[ARCP2:%.*]] = fdiv arcp contract float [[Z]], [[DENOM]], !fpmath !0		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP1]], 1
; IEEE-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
; IEEE-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP2]])
; IEEE-NEXT: store volatile float [[ARCP2]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = call arcp contract float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
; IEEE-NEXT: ret void		; IEEE-GOODFREXP-NEXT: [[ARCP0:%.*]] = fmul arcp contract float [[X]], [[TMP6]]
		; IEEE-GOODFREXP-NEXT: [[TMP7:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
		; IEEE-GOODFREXP-NEXT: [[TMP8:%.*]] = extractvalue { float, i32 } [[TMP7]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP9:%.*]] = extractvalue { float, i32 } [[TMP7]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP10:%.*]] = sub i32 0, [[TMP9]]
		; IEEE-GOODFREXP-NEXT: [[TMP11:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP8]])
		; IEEE-GOODFREXP-NEXT: [[TMP12:%.*]] = call arcp contract float @llvm.ldexp.f32.i32(float [[TMP11]], i32 [[TMP10]])
		; IEEE-GOODFREXP-NEXT: [[ARCP1:%.*]] = fmul arcp contract float [[Y]], [[TMP12]]
		; IEEE-GOODFREXP-NEXT: [[TMP13:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
		; IEEE-GOODFREXP-NEXT: [[TMP14:%.*]] = extractvalue { float, i32 } [[TMP13]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP15:%.*]] = extractvalue { float, i32 } [[TMP13]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP16:%.*]] = sub i32 0, [[TMP15]]
		; IEEE-GOODFREXP-NEXT: [[TMP17:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP14]])
		; IEEE-GOODFREXP-NEXT: [[TMP18:%.*]] = call arcp contract float @llvm.ldexp.f32.i32(float [[TMP17]], i32 [[TMP16]])
		; IEEE-GOODFREXP-NEXT: [[ARCP2:%.*]] = fmul arcp contract float [[Z]], [[TMP18]]
		; IEEE-GOODFREXP-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: store volatile float [[ARCP2]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: ret void
		;
		; IEEE-BADFREXP-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_sqrt_denom_25ulp_x3
		; IEEE-BADFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[Z:%.]], float [[SQR_DENOM:%.*]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[DENOM:%.*]] = call contract float @llvm.sqrt.f32(float [[SQR_DENOM]]), !fpmath !3
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = call arcp contract float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-BADFREXP-NEXT: [[ARCP0:%.*]] = fmul arcp contract float [[X]], [[TMP6]]
		; IEEE-BADFREXP-NEXT: [[TMP7:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP8:%.*]] = extractvalue { float, i32 } [[TMP7]], 0
		; IEEE-BADFREXP-NEXT: [[TMP9:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP10:%.*]] = sub i32 0, [[TMP9]]
		; IEEE-BADFREXP-NEXT: [[TMP11:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP8]])
		; IEEE-BADFREXP-NEXT: [[TMP12:%.*]] = call arcp contract float @llvm.ldexp.f32.i32(float [[TMP11]], i32 [[TMP10]])
		; IEEE-BADFREXP-NEXT: [[ARCP1:%.*]] = fmul arcp contract float [[Y]], [[TMP12]]
		; IEEE-BADFREXP-NEXT: [[TMP13:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP14:%.*]] = extractvalue { float, i32 } [[TMP13]], 0
		; IEEE-BADFREXP-NEXT: [[TMP15:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[DENOM]])
		; IEEE-BADFREXP-NEXT: [[TMP16:%.*]] = sub i32 0, [[TMP15]]
		; IEEE-BADFREXP-NEXT: [[TMP17:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP14]])
		; IEEE-BADFREXP-NEXT: [[TMP18:%.*]] = call arcp contract float @llvm.ldexp.f32.i32(float [[TMP17]], i32 [[TMP16]])
		; IEEE-BADFREXP-NEXT: [[ARCP2:%.*]] = fmul arcp contract float [[Z]], [[TMP18]]
		; IEEE-BADFREXP-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: store volatile float [[ARCP2]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_sqrt_denom_25ulp_x3		; DAZ-LABEL: define amdgpu_kernel void @multiple_arcp_fdiv_sqrt_denom_25ulp_x3
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[Z:%.]], float [[SQR_DENOM:%.*]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[X:%.]], float [[Y:%.]], float [[Z:%.]], float [[SQR_DENOM:%.*]]) #[[ATTR1]] {
; DAZ-NEXT: [[DENOM:%.*]] = call contract float @llvm.sqrt.f32(float [[SQR_DENOM]]), !fpmath !3		; DAZ-NEXT: [[DENOM:%.*]] = call contract float @llvm.sqrt.f32(float [[SQR_DENOM]]), !fpmath !3
; DAZ-NEXT: [[ARCP0:%.*]] = call arcp contract float @llvm.amdgcn.fdiv.fast(float [[X]], float [[DENOM]])		; DAZ-NEXT: [[TMP1:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[DENOM]])
; DAZ-NEXT: [[ARCP1:%.*]] = call arcp contract float @llvm.amdgcn.fdiv.fast(float [[Y]], float [[DENOM]])		; DAZ-NEXT: [[ARCP0:%.*]] = fmul arcp contract float [[X]], [[TMP1]]
; DAZ-NEXT: [[ARCP2:%.*]] = call arcp contract float @llvm.amdgcn.fdiv.fast(float [[Z]], float [[DENOM]])		; DAZ-NEXT: [[TMP2:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[DENOM]])
		; DAZ-NEXT: [[ARCP1:%.*]] = fmul arcp contract float [[Y]], [[TMP2]]
		; DAZ-NEXT: [[TMP3:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[DENOM]])
		; DAZ-NEXT: [[ARCP2:%.*]] = fmul arcp contract float [[Z]], [[TMP3]]
; DAZ-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[ARCP0]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[ARCP1]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: store volatile float [[ARCP2]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[ARCP2]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: ret void		; DAZ-NEXT: ret void
;		;
%denom = call contract float @llvm.sqrt.f32(float %sqr.denom), !fpmath !3		%denom = call contract float @llvm.sqrt.f32(float %sqr.denom), !fpmath !3
%arcp0 = fdiv contract arcp float %x, %denom, !fpmath !0		%arcp0 = fdiv contract arcp float %x, %denom, !fpmath !0
%arcp1 = fdiv contract arcp float %y, %denom, !fpmath !0		%arcp1 = fdiv contract arcp float %y, %denom, !fpmath !0
%arcp2 = fdiv contract arcp float %z, %denom, !fpmath !0		%arcp2 = fdiv contract arcp float %z, %denom, !fpmath !0
store volatile float %arcp0, ptr addrspace(1) %out		store volatile float %arcp0, ptr addrspace(1) %out
store volatile float %arcp1, ptr addrspace(1) %out		store volatile float %arcp1, ptr addrspace(1) %out
store volatile float %arcp2, ptr addrspace(1) %out		store volatile float %arcp2, ptr addrspace(1) %out
ret void		ret void
}		}

define <4 x float> @rsq_f32_vector_mixed_constant_numerator(<4 x float> %arg) {		define <4 x float> @rsq_f32_vector_mixed_constant_numerator(<4 x float> %arg) {
; IEEE-LABEL: define <4 x float> @rsq_f32_vector_mixed_constant_numerator		; IEEE-LABEL: define <4 x float> @rsq_f32_vector_mixed_constant_numerator
; IEEE-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {		; IEEE-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {
; IEEE-NEXT: [[DENOM:%.*]] = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> [[ARG]]), !fpmath !2		; IEEE-NEXT: [[DENOM:%.*]] = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> [[ARG]]), !fpmath !2
; IEEE-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[DENOM]], i64 0		; IEEE-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[ARG]], i64 0
; IEEE-NEXT: [[TMP2:%.*]] = fdiv contract float 1.000000e+00, [[TMP1]]		; IEEE-NEXT: [[TMP2:%.*]] = fcmp contract olt float [[TMP1]], 0x3810000000000000
; IEEE-NEXT: [[TMP3:%.*]] = insertelement <4 x float> poison, float [[TMP2]], i64 0		; IEEE-NEXT: [[TMP3:%.*]] = select contract i1 [[TMP2]], float 0x4170000000000000, float 1.000000e+00
; IEEE-NEXT: [[TMP4:%.*]] = extractelement <4 x float> [[DENOM]], i64 1		; IEEE-NEXT: [[TMP4:%.*]] = fmul contract float [[TMP1]], [[TMP3]]
; IEEE-NEXT: [[TMP5:%.*]] = fdiv contract float -1.000000e+00, [[TMP4]]		; IEEE-NEXT: [[TMP5:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP4]])
; IEEE-NEXT: [[TMP6:%.*]] = insertelement <4 x float> [[TMP3]], float [[TMP5]], i64 1		; IEEE-NEXT: [[TMP6:%.*]] = select contract i1 [[TMP2]], float 4.096000e+03, float 1.000000e+00
; IEEE-NEXT: [[TMP7:%.*]] = extractelement <4 x float> [[DENOM]], i64 2		; IEEE-NEXT: [[TMP7:%.*]] = fmul contract float [[TMP5]], [[TMP6]]
; IEEE-NEXT: [[TMP8:%.*]] = fdiv contract float 4.000000e+00, [[TMP7]]		; IEEE-NEXT: [[TMP8:%.*]] = insertelement <4 x float> poison, float [[TMP7]], i64 0
; IEEE-NEXT: [[TMP9:%.*]] = insertelement <4 x float> [[TMP6]], float [[TMP8]], i64 2		; IEEE-NEXT: [[TMP9:%.*]] = extractelement <4 x float> [[ARG]], i64 1
; IEEE-NEXT: [[TMP10:%.*]] = extractelement <4 x float> [[DENOM]], i64 3		; IEEE-NEXT: [[TMP10:%.*]] = fcmp contract olt float [[TMP9]], 0x3810000000000000
; IEEE-NEXT: [[TMP11:%.*]] = fdiv contract float undef, [[TMP10]]		; IEEE-NEXT: [[TMP11:%.*]] = select contract i1 [[TMP10]], float 0x4170000000000000, float 1.000000e+00
; IEEE-NEXT: [[PARTIAL_RSQ:%.*]] = insertelement <4 x float> [[TMP9]], float [[TMP11]], i64 3		; IEEE-NEXT: [[TMP12:%.*]] = fmul contract float [[TMP9]], [[TMP11]]
		; IEEE-NEXT: [[TMP13:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP12]])
		; IEEE-NEXT: [[TMP14:%.*]] = select contract i1 [[TMP10]], float -4.096000e+03, float -1.000000e+00
		; IEEE-NEXT: [[TMP15:%.*]] = fmul contract float [[TMP13]], [[TMP14]]
		; IEEE-NEXT: [[TMP16:%.*]] = insertelement <4 x float> [[TMP8]], float [[TMP15]], i64 1
		; IEEE-NEXT: [[TMP17:%.*]] = extractelement <4 x float> [[DENOM]], i64 2
		; IEEE-NEXT: [[TMP18:%.*]] = fdiv contract float 4.000000e+00, [[TMP17]], !fpmath !2
		; IEEE-NEXT: [[TMP19:%.*]] = insertelement <4 x float> [[TMP16]], float [[TMP18]], i64 2
		; IEEE-NEXT: [[TMP20:%.*]] = extractelement <4 x float> [[DENOM]], i64 3
		; IEEE-NEXT: [[TMP21:%.*]] = fdiv contract float undef, [[TMP20]], !fpmath !2
		; IEEE-NEXT: [[PARTIAL_RSQ:%.*]] = insertelement <4 x float> [[TMP19]], float [[TMP21]], i64 3
; IEEE-NEXT: ret <4 x float> [[PARTIAL_RSQ]]		; IEEE-NEXT: ret <4 x float> [[PARTIAL_RSQ]]
;		;
; DAZ-LABEL: define <4 x float> @rsq_f32_vector_mixed_constant_numerator		; DAZ-LABEL: define <4 x float> @rsq_f32_vector_mixed_constant_numerator
; DAZ-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {		; DAZ-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {
; DAZ-NEXT: [[DENOM:%.*]] = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> [[ARG]]), !fpmath !2		; DAZ-NEXT: [[DENOM:%.*]] = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> [[ARG]]), !fpmath !2
; DAZ-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[DENOM]], i64 0		; DAZ-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[ARG]], i64 0
; DAZ-NEXT: [[TMP2:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP1]])		; DAZ-NEXT: [[TMP2:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP1]])
; DAZ-NEXT: [[TMP3:%.*]] = insertelement <4 x float> poison, float [[TMP2]], i64 0		; DAZ-NEXT: [[TMP3:%.*]] = insertelement <4 x float> poison, float [[TMP2]], i64 0
; DAZ-NEXT: [[TMP4:%.*]] = extractelement <4 x float> [[DENOM]], i64 1		; DAZ-NEXT: [[TMP4:%.*]] = extractelement <4 x float> [[ARG]], i64 1
; DAZ-NEXT: [[TMP5:%.*]] = fneg contract float [[TMP4]]		; DAZ-NEXT: [[TMP5:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float [[TMP4]])
; DAZ-NEXT: [[TMP6:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP5]])		; DAZ-NEXT: [[TMP6:%.*]] = fneg contract float [[TMP5]]
; DAZ-NEXT: [[TMP7:%.*]] = insertelement <4 x float> [[TMP3]], float [[TMP6]], i64 1		; DAZ-NEXT: [[TMP7:%.*]] = insertelement <4 x float> [[TMP3]], float [[TMP6]], i64 1
; DAZ-NEXT: [[TMP8:%.*]] = extractelement <4 x float> [[DENOM]], i64 2		; DAZ-NEXT: [[TMP8:%.*]] = extractelement <4 x float> [[DENOM]], i64 2
; DAZ-NEXT: [[TMP9:%.*]] = fdiv contract float 4.000000e+00, [[TMP8]]		; DAZ-NEXT: [[TMP9:%.*]] = fdiv contract float 4.000000e+00, [[TMP8]], !fpmath !2
; DAZ-NEXT: [[TMP10:%.*]] = insertelement <4 x float> [[TMP7]], float [[TMP9]], i64 2		; DAZ-NEXT: [[TMP10:%.*]] = insertelement <4 x float> [[TMP7]], float [[TMP9]], i64 2
; DAZ-NEXT: [[TMP11:%.*]] = extractelement <4 x float> [[DENOM]], i64 3		; DAZ-NEXT: [[TMP11:%.*]] = extractelement <4 x float> [[DENOM]], i64 3
; DAZ-NEXT: [[TMP12:%.*]] = fdiv contract float undef, [[TMP11]]		; DAZ-NEXT: [[TMP12:%.*]] = fdiv contract float undef, [[TMP11]], !fpmath !2
; DAZ-NEXT: [[PARTIAL_RSQ:%.*]] = insertelement <4 x float> [[TMP10]], float [[TMP12]], i64 3		; DAZ-NEXT: [[PARTIAL_RSQ:%.*]] = insertelement <4 x float> [[TMP10]], float [[TMP12]], i64 3
; DAZ-NEXT: ret <4 x float> [[PARTIAL_RSQ]]		; DAZ-NEXT: ret <4 x float> [[PARTIAL_RSQ]]
;		;
%denom = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> %arg), !fpmath !2		%denom = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> %arg), !fpmath !2
%partial.rsq = fdiv contract <4 x float> <float 1.0, float -1.0, float 4.0, float undef>, %denom, !fpmath !2		%partial.rsq = fdiv contract <4 x float> <float 1.0, float -1.0, float 4.0, float undef>, %denom, !fpmath !2
ret <4 x float> %partial.rsq		ret <4 x float> %partial.rsq
}		}

define <4 x float> @rsq_f32_vector_mixed_constant_numerator_afn_sqrt(<4 x float> %arg) {		define <4 x float> @rsq_f32_vector_mixed_constant_numerator_afn_sqrt(<4 x float> %arg) {
; IEEE-LABEL: define <4 x float> @rsq_f32_vector_mixed_constant_numerator_afn_sqrt		; CHECK-LABEL: define <4 x float> @rsq_f32_vector_mixed_constant_numerator_afn_sqrt
; IEEE-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {		; CHECK-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {
; IEEE-NEXT: [[DENOM:%.*]] = call contract afn <4 x float> @llvm.sqrt.v4f32(<4 x float> [[ARG]])		; CHECK-NEXT: [[DENOM:%.*]] = call contract afn <4 x float> @llvm.sqrt.v4f32(<4 x float> [[ARG]])
; IEEE-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[DENOM]], i64 0		; CHECK-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[ARG]], i64 0
; IEEE-NEXT: [[TMP2:%.*]] = fdiv contract float 1.000000e+00, [[TMP1]]		; CHECK-NEXT: [[TMP2:%.*]] = call contract afn float @llvm.amdgcn.rsq.f32(float [[TMP1]])
; IEEE-NEXT: [[TMP3:%.*]] = insertelement <4 x float> poison, float [[TMP2]], i64 0		; CHECK-NEXT: [[TMP3:%.*]] = insertelement <4 x float> poison, float [[TMP2]], i64 0
; IEEE-NEXT: [[TMP4:%.*]] = extractelement <4 x float> [[DENOM]], i64 1		; CHECK-NEXT: [[TMP4:%.*]] = extractelement <4 x float> [[ARG]], i64 1
; IEEE-NEXT: [[TMP5:%.*]] = fdiv contract float -1.000000e+00, [[TMP4]]		; CHECK-NEXT: [[TMP5:%.*]] = call contract afn float @llvm.amdgcn.rsq.f32(float [[TMP4]])
; IEEE-NEXT: [[TMP6:%.*]] = insertelement <4 x float> [[TMP3]], float [[TMP5]], i64 1		; CHECK-NEXT: [[TMP6:%.*]] = fneg contract afn float [[TMP5]]
; IEEE-NEXT: [[TMP7:%.*]] = extractelement <4 x float> [[DENOM]], i64 2		; CHECK-NEXT: [[TMP7:%.*]] = insertelement <4 x float> [[TMP3]], float [[TMP6]], i64 1
; IEEE-NEXT: [[TMP8:%.*]] = fdiv contract float 4.000000e+00, [[TMP7]]		; CHECK-NEXT: [[TMP8:%.*]] = extractelement <4 x float> [[DENOM]], i64 2
; IEEE-NEXT: [[TMP9:%.*]] = insertelement <4 x float> [[TMP6]], float [[TMP8]], i64 2		; CHECK-NEXT: [[TMP9:%.*]] = fdiv contract float 4.000000e+00, [[TMP8]], !fpmath !2
; IEEE-NEXT: [[TMP10:%.*]] = extractelement <4 x float> [[DENOM]], i64 3		; CHECK-NEXT: [[TMP10:%.*]] = insertelement <4 x float> [[TMP7]], float [[TMP9]], i64 2
; IEEE-NEXT: [[TMP11:%.*]] = fdiv contract float undef, [[TMP10]]		; CHECK-NEXT: [[TMP11:%.*]] = extractelement <4 x float> [[DENOM]], i64 3
; IEEE-NEXT: [[PARTIAL_RSQ:%.*]] = insertelement <4 x float> [[TMP9]], float [[TMP11]], i64 3		; CHECK-NEXT: [[TMP12:%.*]] = fdiv contract float undef, [[TMP11]], !fpmath !2
; IEEE-NEXT: ret <4 x float> [[PARTIAL_RSQ]]		; CHECK-NEXT: [[PARTIAL_RSQ:%.*]] = insertelement <4 x float> [[TMP10]], float [[TMP12]], i64 3
;		; CHECK-NEXT: ret <4 x float> [[PARTIAL_RSQ]]
; DAZ-LABEL: define <4 x float> @rsq_f32_vector_mixed_constant_numerator_afn_sqrt
; DAZ-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {
; DAZ-NEXT: [[DENOM:%.*]] = call contract afn <4 x float> @llvm.sqrt.v4f32(<4 x float> [[ARG]])
; DAZ-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[DENOM]], i64 0
; DAZ-NEXT: [[TMP2:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP1]])
; DAZ-NEXT: [[TMP3:%.*]] = insertelement <4 x float> poison, float [[TMP2]], i64 0
; DAZ-NEXT: [[TMP4:%.*]] = extractelement <4 x float> [[DENOM]], i64 1
; DAZ-NEXT: [[TMP5:%.*]] = fneg contract float [[TMP4]]
; DAZ-NEXT: [[TMP6:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP5]])
; DAZ-NEXT: [[TMP7:%.*]] = insertelement <4 x float> [[TMP3]], float [[TMP6]], i64 1
; DAZ-NEXT: [[TMP8:%.*]] = extractelement <4 x float> [[DENOM]], i64 2
; DAZ-NEXT: [[TMP9:%.*]] = fdiv contract float 4.000000e+00, [[TMP8]]
; DAZ-NEXT: [[TMP10:%.*]] = insertelement <4 x float> [[TMP7]], float [[TMP9]], i64 2
; DAZ-NEXT: [[TMP11:%.*]] = extractelement <4 x float> [[DENOM]], i64 3
; DAZ-NEXT: [[TMP12:%.*]] = fdiv contract float undef, [[TMP11]]
; DAZ-NEXT: [[PARTIAL_RSQ:%.*]] = insertelement <4 x float> [[TMP10]], float [[TMP12]], i64 3
; DAZ-NEXT: ret <4 x float> [[PARTIAL_RSQ]]
;		;
%denom = call contract afn <4 x float> @llvm.sqrt.v4f32(<4 x float> %arg)		%denom = call contract afn <4 x float> @llvm.sqrt.v4f32(<4 x float> %arg)
%partial.rsq = fdiv contract <4 x float> <float 1.0, float -1.0, float 4.0, float undef>, %denom, !fpmath !2		%partial.rsq = fdiv contract <4 x float> <float 1.0, float -1.0, float 4.0, float undef>, %denom, !fpmath !2
ret <4 x float> %partial.rsq		ret <4 x float> %partial.rsq
}		}

define <4 x float> @rsq_f32_vector_mixed_constant_numerator_afn_div(<4 x float> %arg) {		define <4 x float> @rsq_f32_vector_mixed_constant_numerator_afn_div(<4 x float> %arg) {
; CHECK-LABEL: define <4 x float> @rsq_f32_vector_mixed_constant_numerator_afn_div		; CHECK-LABEL: define <4 x float> @rsq_f32_vector_mixed_constant_numerator_afn_div
; CHECK-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {		; CHECK-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {
; CHECK-NEXT: [[DENOM:%.*]] = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> [[ARG]]), !fpmath !2		; CHECK-NEXT: [[DENOM:%.*]] = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> [[ARG]]), !fpmath !2
; CHECK-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[DENOM]], i64 0		; CHECK-NEXT: [[PARTIAL_RSQ:%.*]] = fdiv contract afn <4 x float> <float 1.000000e+00, float -1.000000e+00, float 4.000000e+00, float undef>, [[DENOM]]
; CHECK-NEXT: [[TMP2:%.*]] = call contract afn float @llvm.amdgcn.rcp.f32(float [[TMP1]])
; CHECK-NEXT: [[TMP3:%.*]] = insertelement <4 x float> poison, float [[TMP2]], i64 0
; CHECK-NEXT: [[TMP4:%.*]] = extractelement <4 x float> [[DENOM]], i64 1
; CHECK-NEXT: [[TMP5:%.*]] = fneg contract afn float [[TMP4]]
; CHECK-NEXT: [[TMP6:%.*]] = call contract afn float @llvm.amdgcn.rcp.f32(float [[TMP5]])
; CHECK-NEXT: [[TMP7:%.*]] = insertelement <4 x float> [[TMP3]], float [[TMP6]], i64 1
; CHECK-NEXT: [[TMP8:%.*]] = extractelement <4 x float> [[DENOM]], i64 2
; CHECK-NEXT: [[TMP9:%.*]] = call contract afn float @llvm.amdgcn.rcp.f32(float [[TMP8]])
; CHECK-NEXT: [[TMP10:%.*]] = fmul contract afn float 4.000000e+00, [[TMP9]]
; CHECK-NEXT: [[TMP11:%.*]] = insertelement <4 x float> [[TMP7]], float [[TMP10]], i64 2
; CHECK-NEXT: [[TMP12:%.*]] = extractelement <4 x float> [[DENOM]], i64 3
; CHECK-NEXT: [[TMP13:%.*]] = call contract afn float @llvm.amdgcn.rcp.f32(float [[TMP12]])
; CHECK-NEXT: [[TMP14:%.*]] = fmul contract afn float undef, [[TMP13]]
; CHECK-NEXT: [[PARTIAL_RSQ:%.*]] = insertelement <4 x float> [[TMP11]], float [[TMP14]], i64 3
; CHECK-NEXT: ret <4 x float> [[PARTIAL_RSQ]]		; CHECK-NEXT: ret <4 x float> [[PARTIAL_RSQ]]
;		;
%denom = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> %arg), !fpmath !2		%denom = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> %arg), !fpmath !2
%partial.rsq = fdiv contract afn <4 x float> <float 1.0, float -1.0, float 4.0, float undef>, %denom		%partial.rsq = fdiv contract afn <4 x float> <float 1.0, float -1.0, float 4.0, float undef>, %denom
ret <4 x float> %partial.rsq		ret <4 x float> %partial.rsq
}		}

define <4 x float> @rsq_f32_vector_mixed_constant_numerator_correct_fdiv(<4 x float> %arg) {		define <4 x float> @rsq_f32_vector_mixed_constant_numerator_correct_fdiv(<4 x float> %arg) {
Show All 15 Lines
; CHECK-NEXT: ret <4 x float> [[PARTIAL_RSQ]]		; CHECK-NEXT: ret <4 x float> [[PARTIAL_RSQ]]
;		;
%denom = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> %arg), !fpmath !2		%denom = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> %arg), !fpmath !2
%partial.rsq = fdiv contract <4 x float> <float 1.0, float -1.0, float 4.0, float undef>, %denom		%partial.rsq = fdiv contract <4 x float> <float 1.0, float -1.0, float 4.0, float undef>, %denom
ret <4 x float> %partial.rsq		ret <4 x float> %partial.rsq
}		}

define <4 x float> @rsq_f32_vector_mixed_constant_numerator_correct_sqrt(<4 x float> %arg) {		define <4 x float> @rsq_f32_vector_mixed_constant_numerator_correct_sqrt(<4 x float> %arg) {
; IEEE-LABEL: define <4 x float> @rsq_f32_vector_mixed_constant_numerator_correct_sqrt		; IEEE-GOODFREXP-LABEL: define <4 x float> @rsq_f32_vector_mixed_constant_numerator_correct_sqrt
; IEEE-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {
; IEEE-NEXT: [[DENOM:%.*]] = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> [[ARG]])		; IEEE-GOODFREXP-NEXT: [[DENOM:%.*]] = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> [[ARG]])
; IEEE-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[DENOM]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[DENOM]], i64 0
; IEEE-NEXT: [[TMP2:%.*]] = fdiv contract float 1.000000e+00, [[TMP1]]		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP1]])
; IEEE-NEXT: [[TMP3:%.*]] = insertelement <4 x float> poison, float [[TMP2]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP2]], 0
; IEEE-NEXT: [[TMP4:%.*]] = extractelement <4 x float> [[DENOM]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = extractvalue { float, i32 } [[TMP2]], 1
; IEEE-NEXT: [[TMP5:%.*]] = fdiv contract float -1.000000e+00, [[TMP4]]		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = sub i32 0, [[TMP4]]
; IEEE-NEXT: [[TMP6:%.*]] = insertelement <4 x float> [[TMP3]], float [[TMP5]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP3]])
; IEEE-NEXT: [[TMP7:%.*]] = extractelement <4 x float> [[DENOM]], i64 2		; IEEE-GOODFREXP-NEXT: [[TMP7:%.*]] = call contract float @llvm.ldexp.f32.i32(float [[TMP6]], i32 [[TMP5]])
; IEEE-NEXT: [[TMP8:%.*]] = fdiv contract float 4.000000e+00, [[TMP7]]		; IEEE-GOODFREXP-NEXT: [[TMP8:%.*]] = insertelement <4 x float> poison, float [[TMP7]], i64 0
; IEEE-NEXT: [[TMP9:%.*]] = insertelement <4 x float> [[TMP6]], float [[TMP8]], i64 2		; IEEE-GOODFREXP-NEXT: [[TMP9:%.*]] = extractelement <4 x float> [[DENOM]], i64 1
; IEEE-NEXT: [[TMP10:%.*]] = extractelement <4 x float> [[DENOM]], i64 3		; IEEE-GOODFREXP-NEXT: [[TMP10:%.*]] = fneg contract float [[TMP9]]
; IEEE-NEXT: [[TMP11:%.*]] = fdiv contract float undef, [[TMP10]]		; IEEE-GOODFREXP-NEXT: [[TMP11:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP10]])
; IEEE-NEXT: [[PARTIAL_RSQ:%.*]] = insertelement <4 x float> [[TMP9]], float [[TMP11]], i64 3		; IEEE-GOODFREXP-NEXT: [[TMP12:%.*]] = extractvalue { float, i32 } [[TMP11]], 0
; IEEE-NEXT: ret <4 x float> [[PARTIAL_RSQ]]		; IEEE-GOODFREXP-NEXT: [[TMP13:%.*]] = extractvalue { float, i32 } [[TMP11]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP14:%.*]] = sub i32 0, [[TMP13]]
		; IEEE-GOODFREXP-NEXT: [[TMP15:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP12]])
		; IEEE-GOODFREXP-NEXT: [[TMP16:%.*]] = call contract float @llvm.ldexp.f32.i32(float [[TMP15]], i32 [[TMP14]])
		; IEEE-GOODFREXP-NEXT: [[TMP17:%.*]] = insertelement <4 x float> [[TMP8]], float [[TMP16]], i64 1
		; IEEE-GOODFREXP-NEXT: [[TMP18:%.*]] = extractelement <4 x float> [[DENOM]], i64 2
		; IEEE-GOODFREXP-NEXT: [[TMP19:%.*]] = fdiv contract float 4.000000e+00, [[TMP18]], !fpmath !2
		; IEEE-GOODFREXP-NEXT: [[TMP20:%.*]] = insertelement <4 x float> [[TMP17]], float [[TMP19]], i64 2
		; IEEE-GOODFREXP-NEXT: [[TMP21:%.*]] = extractelement <4 x float> [[DENOM]], i64 3
		; IEEE-GOODFREXP-NEXT: [[TMP22:%.*]] = fdiv contract float undef, [[TMP21]], !fpmath !2
		; IEEE-GOODFREXP-NEXT: [[PARTIAL_RSQ:%.*]] = insertelement <4 x float> [[TMP20]], float [[TMP22]], i64 3
		; IEEE-GOODFREXP-NEXT: ret <4 x float> [[PARTIAL_RSQ]]
		;
		; IEEE-BADFREXP-LABEL: define <4 x float> @rsq_f32_vector_mixed_constant_numerator_correct_sqrt
		; IEEE-BADFREXP-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[DENOM:%.*]] = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> [[ARG]])
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[DENOM]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP1]])
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP2]], 0
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP1]])
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = sub i32 0, [[TMP4]]
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP3]])
		; IEEE-BADFREXP-NEXT: [[TMP7:%.*]] = call contract float @llvm.ldexp.f32.i32(float [[TMP6]], i32 [[TMP5]])
		; IEEE-BADFREXP-NEXT: [[TMP8:%.*]] = insertelement <4 x float> poison, float [[TMP7]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP9:%.*]] = extractelement <4 x float> [[DENOM]], i64 1
		; IEEE-BADFREXP-NEXT: [[TMP10:%.*]] = fneg contract float [[TMP9]]
		; IEEE-BADFREXP-NEXT: [[TMP11:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP10]])
		; IEEE-BADFREXP-NEXT: [[TMP12:%.*]] = extractvalue { float, i32 } [[TMP11]], 0
		; IEEE-BADFREXP-NEXT: [[TMP13:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP10]])
		; IEEE-BADFREXP-NEXT: [[TMP14:%.*]] = sub i32 0, [[TMP13]]
		; IEEE-BADFREXP-NEXT: [[TMP15:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP12]])
		; IEEE-BADFREXP-NEXT: [[TMP16:%.*]] = call contract float @llvm.ldexp.f32.i32(float [[TMP15]], i32 [[TMP14]])
		; IEEE-BADFREXP-NEXT: [[TMP17:%.*]] = insertelement <4 x float> [[TMP8]], float [[TMP16]], i64 1
		; IEEE-BADFREXP-NEXT: [[TMP18:%.*]] = extractelement <4 x float> [[DENOM]], i64 2
		; IEEE-BADFREXP-NEXT: [[TMP19:%.*]] = fdiv contract float 4.000000e+00, [[TMP18]], !fpmath !2
		; IEEE-BADFREXP-NEXT: [[TMP20:%.*]] = insertelement <4 x float> [[TMP17]], float [[TMP19]], i64 2
		; IEEE-BADFREXP-NEXT: [[TMP21:%.*]] = extractelement <4 x float> [[DENOM]], i64 3
		; IEEE-BADFREXP-NEXT: [[TMP22:%.*]] = fdiv contract float undef, [[TMP21]], !fpmath !2
		; IEEE-BADFREXP-NEXT: [[PARTIAL_RSQ:%.*]] = insertelement <4 x float> [[TMP20]], float [[TMP22]], i64 3
		; IEEE-BADFREXP-NEXT: ret <4 x float> [[PARTIAL_RSQ]]
;		;
; DAZ-LABEL: define <4 x float> @rsq_f32_vector_mixed_constant_numerator_correct_sqrt		; DAZ-LABEL: define <4 x float> @rsq_f32_vector_mixed_constant_numerator_correct_sqrt
; DAZ-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {		; DAZ-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {
; DAZ-NEXT: [[DENOM:%.*]] = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> [[ARG]])		; DAZ-NEXT: [[DENOM:%.*]] = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> [[ARG]])
; DAZ-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[DENOM]], i64 0		; DAZ-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[DENOM]], i64 0
; DAZ-NEXT: [[TMP2:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP1]])		; DAZ-NEXT: [[TMP2:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP1]])
; DAZ-NEXT: [[TMP3:%.*]] = insertelement <4 x float> poison, float [[TMP2]], i64 0		; DAZ-NEXT: [[TMP3:%.*]] = insertelement <4 x float> poison, float [[TMP2]], i64 0
; DAZ-NEXT: [[TMP4:%.*]] = extractelement <4 x float> [[DENOM]], i64 1		; DAZ-NEXT: [[TMP4:%.*]] = extractelement <4 x float> [[DENOM]], i64 1
; DAZ-NEXT: [[TMP5:%.*]] = fneg contract float [[TMP4]]		; DAZ-NEXT: [[TMP5:%.*]] = fneg contract float [[TMP4]]
; DAZ-NEXT: [[TMP6:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP5]])		; DAZ-NEXT: [[TMP6:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP5]])
; DAZ-NEXT: [[TMP7:%.*]] = insertelement <4 x float> [[TMP3]], float [[TMP6]], i64 1		; DAZ-NEXT: [[TMP7:%.*]] = insertelement <4 x float> [[TMP3]], float [[TMP6]], i64 1
; DAZ-NEXT: [[TMP8:%.*]] = extractelement <4 x float> [[DENOM]], i64 2		; DAZ-NEXT: [[TMP8:%.*]] = extractelement <4 x float> [[DENOM]], i64 2
; DAZ-NEXT: [[TMP9:%.*]] = fdiv contract float 4.000000e+00, [[TMP8]]		; DAZ-NEXT: [[TMP9:%.*]] = fdiv contract float 4.000000e+00, [[TMP8]], !fpmath !2
; DAZ-NEXT: [[TMP10:%.*]] = insertelement <4 x float> [[TMP7]], float [[TMP9]], i64 2		; DAZ-NEXT: [[TMP10:%.*]] = insertelement <4 x float> [[TMP7]], float [[TMP9]], i64 2
; DAZ-NEXT: [[TMP11:%.*]] = extractelement <4 x float> [[DENOM]], i64 3		; DAZ-NEXT: [[TMP11:%.*]] = extractelement <4 x float> [[DENOM]], i64 3
; DAZ-NEXT: [[TMP12:%.*]] = fdiv contract float undef, [[TMP11]]		; DAZ-NEXT: [[TMP12:%.*]] = fdiv contract float undef, [[TMP11]], !fpmath !2
; DAZ-NEXT: [[PARTIAL_RSQ:%.*]] = insertelement <4 x float> [[TMP10]], float [[TMP12]], i64 3		; DAZ-NEXT: [[PARTIAL_RSQ:%.*]] = insertelement <4 x float> [[TMP10]], float [[TMP12]], i64 3
; DAZ-NEXT: ret <4 x float> [[PARTIAL_RSQ]]		; DAZ-NEXT: ret <4 x float> [[PARTIAL_RSQ]]
;		;
%denom = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> %arg)		%denom = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> %arg)
%partial.rsq = fdiv contract <4 x float> <float 1.0, float -1.0, float 4.0, float undef>, %denom, !fpmath !2		%partial.rsq = fdiv contract <4 x float> <float 1.0, float -1.0, float 4.0, float undef>, %denom, !fpmath !2
ret <4 x float> %partial.rsq		ret <4 x float> %partial.rsq
}		}

define <4 x float> @rsq_f32_vector_mixed_constant_numerator_arcp(<4 x float> %arg) {		define <4 x float> @rsq_f32_vector_mixed_constant_numerator_arcp(<4 x float> %arg) {
; IEEE-LABEL: define <4 x float> @rsq_f32_vector_mixed_constant_numerator_arcp		; IEEE-GOODFREXP-LABEL: define <4 x float> @rsq_f32_vector_mixed_constant_numerator_arcp
; IEEE-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {
; IEEE-NEXT: [[DENOM:%.*]] = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> [[ARG]]), !fpmath !2		; IEEE-GOODFREXP-NEXT: [[DENOM:%.*]] = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> [[ARG]]), !fpmath !2
; IEEE-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[DENOM]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[ARG]], i64 0
; IEEE-NEXT: [[TMP2:%.*]] = fdiv arcp contract float 1.000000e+00, [[TMP1]]		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = fcmp arcp contract olt float [[TMP1]], 0x3810000000000000
; IEEE-NEXT: [[TMP3:%.*]] = insertelement <4 x float> poison, float [[TMP2]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = select arcp contract i1 [[TMP2]], float 0x4170000000000000, float 1.000000e+00
; IEEE-NEXT: [[TMP4:%.*]] = extractelement <4 x float> [[DENOM]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = fmul arcp contract float [[TMP1]], [[TMP3]]
; IEEE-NEXT: [[TMP5:%.*]] = fdiv arcp contract float -1.000000e+00, [[TMP4]]		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = call arcp contract float @llvm.amdgcn.rsq.f32(float [[TMP4]])
; IEEE-NEXT: [[TMP6:%.*]] = insertelement <4 x float> [[TMP3]], float [[TMP5]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = select arcp contract i1 [[TMP2]], float 4.096000e+03, float 1.000000e+00
; IEEE-NEXT: [[TMP7:%.*]] = extractelement <4 x float> [[DENOM]], i64 2		; IEEE-GOODFREXP-NEXT: [[TMP7:%.*]] = fmul arcp contract float [[TMP5]], [[TMP6]]
; IEEE-NEXT: [[TMP8:%.*]] = fdiv arcp contract float 4.000000e+00, [[TMP7]]		; IEEE-GOODFREXP-NEXT: [[TMP8:%.*]] = insertelement <4 x float> poison, float [[TMP7]], i64 0
; IEEE-NEXT: [[TMP9:%.*]] = insertelement <4 x float> [[TMP6]], float [[TMP8]], i64 2		; IEEE-GOODFREXP-NEXT: [[TMP9:%.*]] = extractelement <4 x float> [[ARG]], i64 1
; IEEE-NEXT: [[TMP10:%.*]] = extractelement <4 x float> [[DENOM]], i64 3		; IEEE-GOODFREXP-NEXT: [[TMP10:%.*]] = fcmp arcp contract olt float [[TMP9]], 0x3810000000000000
; IEEE-NEXT: [[TMP11:%.*]] = fdiv arcp contract float undef, [[TMP10]]		; IEEE-GOODFREXP-NEXT: [[TMP11:%.*]] = select arcp contract i1 [[TMP10]], float 0x4170000000000000, float 1.000000e+00
; IEEE-NEXT: [[PARTIAL_RSQ:%.*]] = insertelement <4 x float> [[TMP9]], float [[TMP11]], i64 3		; IEEE-GOODFREXP-NEXT: [[TMP12:%.*]] = fmul arcp contract float [[TMP9]], [[TMP11]]
; IEEE-NEXT: ret <4 x float> [[PARTIAL_RSQ]]		; IEEE-GOODFREXP-NEXT: [[TMP13:%.*]] = call arcp contract float @llvm.amdgcn.rsq.f32(float [[TMP12]])
		; IEEE-GOODFREXP-NEXT: [[TMP14:%.*]] = select arcp contract i1 [[TMP10]], float -4.096000e+03, float -1.000000e+00
		; IEEE-GOODFREXP-NEXT: [[TMP15:%.*]] = fmul arcp contract float [[TMP13]], [[TMP14]]
		; IEEE-GOODFREXP-NEXT: [[TMP16:%.*]] = insertelement <4 x float> [[TMP8]], float [[TMP15]], i64 1
		; IEEE-GOODFREXP-NEXT: [[TMP17:%.*]] = extractelement <4 x float> [[DENOM]], i64 2
		; IEEE-GOODFREXP-NEXT: [[TMP18:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP17]])
		; IEEE-GOODFREXP-NEXT: [[TMP19:%.*]] = extractvalue { float, i32 } [[TMP18]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP20:%.*]] = extractvalue { float, i32 } [[TMP18]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP21:%.*]] = sub i32 0, [[TMP20]]
		; IEEE-GOODFREXP-NEXT: [[TMP22:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP19]])
		; IEEE-GOODFREXP-NEXT: [[TMP23:%.*]] = call arcp contract float @llvm.ldexp.f32.i32(float [[TMP22]], i32 [[TMP21]])
		; IEEE-GOODFREXP-NEXT: [[TMP24:%.*]] = fmul arcp contract float 4.000000e+00, [[TMP23]]
		; IEEE-GOODFREXP-NEXT: [[TMP25:%.*]] = insertelement <4 x float> [[TMP16]], float [[TMP24]], i64 2
		; IEEE-GOODFREXP-NEXT: [[TMP26:%.*]] = extractelement <4 x float> [[DENOM]], i64 3
		; IEEE-GOODFREXP-NEXT: [[TMP27:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP26]])
		; IEEE-GOODFREXP-NEXT: [[TMP28:%.*]] = extractvalue { float, i32 } [[TMP27]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP29:%.*]] = extractvalue { float, i32 } [[TMP27]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP30:%.*]] = sub i32 0, [[TMP29]]
		; IEEE-GOODFREXP-NEXT: [[TMP31:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP28]])
		; IEEE-GOODFREXP-NEXT: [[TMP32:%.*]] = call arcp contract float @llvm.ldexp.f32.i32(float [[TMP31]], i32 [[TMP30]])
		; IEEE-GOODFREXP-NEXT: [[TMP33:%.*]] = fmul arcp contract float undef, [[TMP32]]
		; IEEE-GOODFREXP-NEXT: [[PARTIAL_RSQ:%.*]] = insertelement <4 x float> [[TMP25]], float [[TMP33]], i64 3
		; IEEE-GOODFREXP-NEXT: ret <4 x float> [[PARTIAL_RSQ]]
		;
		; IEEE-BADFREXP-LABEL: define <4 x float> @rsq_f32_vector_mixed_constant_numerator_arcp
		; IEEE-BADFREXP-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[DENOM:%.*]] = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> [[ARG]]), !fpmath !2
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[ARG]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = fcmp arcp contract olt float [[TMP1]], 0x3810000000000000
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = select arcp contract i1 [[TMP2]], float 0x4170000000000000, float 1.000000e+00
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = fmul arcp contract float [[TMP1]], [[TMP3]]
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call arcp contract float @llvm.amdgcn.rsq.f32(float [[TMP4]])
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = select arcp contract i1 [[TMP2]], float 4.096000e+03, float 1.000000e+00
		; IEEE-BADFREXP-NEXT: [[TMP7:%.*]] = fmul arcp contract float [[TMP5]], [[TMP6]]
		; IEEE-BADFREXP-NEXT: [[TMP8:%.*]] = insertelement <4 x float> poison, float [[TMP7]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP9:%.*]] = extractelement <4 x float> [[ARG]], i64 1
		; IEEE-BADFREXP-NEXT: [[TMP10:%.*]] = fcmp arcp contract olt float [[TMP9]], 0x3810000000000000
		; IEEE-BADFREXP-NEXT: [[TMP11:%.*]] = select arcp contract i1 [[TMP10]], float 0x4170000000000000, float 1.000000e+00
		; IEEE-BADFREXP-NEXT: [[TMP12:%.*]] = fmul arcp contract float [[TMP9]], [[TMP11]]
		; IEEE-BADFREXP-NEXT: [[TMP13:%.*]] = call arcp contract float @llvm.amdgcn.rsq.f32(float [[TMP12]])
		; IEEE-BADFREXP-NEXT: [[TMP14:%.*]] = select arcp contract i1 [[TMP10]], float -4.096000e+03, float -1.000000e+00
		; IEEE-BADFREXP-NEXT: [[TMP15:%.*]] = fmul arcp contract float [[TMP13]], [[TMP14]]
		; IEEE-BADFREXP-NEXT: [[TMP16:%.*]] = insertelement <4 x float> [[TMP8]], float [[TMP15]], i64 1
		; IEEE-BADFREXP-NEXT: [[TMP17:%.*]] = extractelement <4 x float> [[DENOM]], i64 2
		; IEEE-BADFREXP-NEXT: [[TMP18:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP17]])
		; IEEE-BADFREXP-NEXT: [[TMP19:%.*]] = extractvalue { float, i32 } [[TMP18]], 0
		; IEEE-BADFREXP-NEXT: [[TMP20:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP17]])
		; IEEE-BADFREXP-NEXT: [[TMP21:%.*]] = sub i32 0, [[TMP20]]
		; IEEE-BADFREXP-NEXT: [[TMP22:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP19]])
		; IEEE-BADFREXP-NEXT: [[TMP23:%.*]] = call arcp contract float @llvm.ldexp.f32.i32(float [[TMP22]], i32 [[TMP21]])
		; IEEE-BADFREXP-NEXT: [[TMP24:%.*]] = fmul arcp contract float 4.000000e+00, [[TMP23]]
		; IEEE-BADFREXP-NEXT: [[TMP25:%.*]] = insertelement <4 x float> [[TMP16]], float [[TMP24]], i64 2
		; IEEE-BADFREXP-NEXT: [[TMP26:%.*]] = extractelement <4 x float> [[DENOM]], i64 3
		; IEEE-BADFREXP-NEXT: [[TMP27:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP26]])
		; IEEE-BADFREXP-NEXT: [[TMP28:%.*]] = extractvalue { float, i32 } [[TMP27]], 0
		; IEEE-BADFREXP-NEXT: [[TMP29:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP26]])
		; IEEE-BADFREXP-NEXT: [[TMP30:%.*]] = sub i32 0, [[TMP29]]
		; IEEE-BADFREXP-NEXT: [[TMP31:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP28]])
		; IEEE-BADFREXP-NEXT: [[TMP32:%.*]] = call arcp contract float @llvm.ldexp.f32.i32(float [[TMP31]], i32 [[TMP30]])
		; IEEE-BADFREXP-NEXT: [[TMP33:%.*]] = fmul arcp contract float undef, [[TMP32]]
		; IEEE-BADFREXP-NEXT: [[PARTIAL_RSQ:%.*]] = insertelement <4 x float> [[TMP25]], float [[TMP33]], i64 3
		; IEEE-BADFREXP-NEXT: ret <4 x float> [[PARTIAL_RSQ]]
;		;
; DAZ-LABEL: define <4 x float> @rsq_f32_vector_mixed_constant_numerator_arcp		; DAZ-LABEL: define <4 x float> @rsq_f32_vector_mixed_constant_numerator_arcp
; DAZ-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {		; DAZ-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {
; DAZ-NEXT: [[DENOM:%.*]] = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> [[ARG]]), !fpmath !2		; DAZ-NEXT: [[DENOM:%.*]] = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> [[ARG]]), !fpmath !2
; DAZ-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[DENOM]], i64 0		; DAZ-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[ARG]], i64 0
; DAZ-NEXT: [[TMP2:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP1]])		; DAZ-NEXT: [[TMP2:%.*]] = call arcp contract float @llvm.amdgcn.rsq.f32(float [[TMP1]])
; DAZ-NEXT: [[TMP3:%.*]] = insertelement <4 x float> poison, float [[TMP2]], i64 0		; DAZ-NEXT: [[TMP3:%.*]] = insertelement <4 x float> poison, float [[TMP2]], i64 0
; DAZ-NEXT: [[TMP4:%.*]] = extractelement <4 x float> [[DENOM]], i64 1		; DAZ-NEXT: [[TMP4:%.*]] = extractelement <4 x float> [[ARG]], i64 1
; DAZ-NEXT: [[TMP5:%.*]] = fneg arcp contract float [[TMP4]]		; DAZ-NEXT: [[TMP5:%.*]] = call arcp contract float @llvm.amdgcn.rsq.f32(float [[TMP4]])
; DAZ-NEXT: [[TMP6:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP5]])		; DAZ-NEXT: [[TMP6:%.*]] = fneg arcp contract float [[TMP5]]
; DAZ-NEXT: [[TMP7:%.*]] = insertelement <4 x float> [[TMP3]], float [[TMP6]], i64 1		; DAZ-NEXT: [[TMP7:%.*]] = insertelement <4 x float> [[TMP3]], float [[TMP6]], i64 1
; DAZ-NEXT: [[TMP8:%.*]] = extractelement <4 x float> [[DENOM]], i64 2		; DAZ-NEXT: [[TMP8:%.*]] = extractelement <4 x float> [[DENOM]], i64 2
; DAZ-NEXT: [[TMP9:%.*]] = fdiv arcp contract float 4.000000e+00, [[TMP8]]		; DAZ-NEXT: [[TMP9:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP8]])
; DAZ-NEXT: [[TMP10:%.*]] = insertelement <4 x float> [[TMP7]], float [[TMP9]], i64 2		; DAZ-NEXT: [[TMP10:%.*]] = fmul arcp contract float 4.000000e+00, [[TMP9]]
; DAZ-NEXT: [[TMP11:%.*]] = extractelement <4 x float> [[DENOM]], i64 3		; DAZ-NEXT: [[TMP11:%.*]] = insertelement <4 x float> [[TMP7]], float [[TMP10]], i64 2
; DAZ-NEXT: [[TMP12:%.*]] = fdiv arcp contract float undef, [[TMP11]]		; DAZ-NEXT: [[TMP12:%.*]] = extractelement <4 x float> [[DENOM]], i64 3
; DAZ-NEXT: [[PARTIAL_RSQ:%.*]] = insertelement <4 x float> [[TMP10]], float [[TMP12]], i64 3		; DAZ-NEXT: [[TMP13:%.*]] = call arcp contract float @llvm.amdgcn.rcp.f32(float [[TMP12]])
		; DAZ-NEXT: [[TMP14:%.*]] = fmul arcp contract float undef, [[TMP13]]
		; DAZ-NEXT: [[PARTIAL_RSQ:%.*]] = insertelement <4 x float> [[TMP11]], float [[TMP14]], i64 3
; DAZ-NEXT: ret <4 x float> [[PARTIAL_RSQ]]		; DAZ-NEXT: ret <4 x float> [[PARTIAL_RSQ]]
;		;
%denom = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> %arg), !fpmath !2		%denom = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> %arg), !fpmath !2
%partial.rsq = fdiv contract arcp <4 x float> <float 1.0, float -1.0, float 4.0, float undef>, %denom, !fpmath !2		%partial.rsq = fdiv contract arcp <4 x float> <float 1.0, float -1.0, float 4.0, float undef>, %denom, !fpmath !2
ret <4 x float> %partial.rsq		ret <4 x float> %partial.rsq
}		}

define <4 x float> @rsq_f32_vector_mixed_constant_numerator_arcp_correct(<4 x float> %arg) {		define <4 x float> @rsq_f32_vector_mixed_constant_numerator_arcp_correct(<4 x float> %arg) {
Show All 15 Lines
; CHECK-NEXT: ret <4 x float> [[PARTIAL_RSQ]]		; CHECK-NEXT: ret <4 x float> [[PARTIAL_RSQ]]
;		;
%denom = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> %arg), !fpmath !2		%denom = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> %arg), !fpmath !2
%partial.rsq = fdiv contract arcp <4 x float> <float 1.0, float -1.0, float 4.0, float undef>, %denom		%partial.rsq = fdiv contract arcp <4 x float> <float 1.0, float -1.0, float 4.0, float undef>, %denom
ret <4 x float> %partial.rsq		ret <4 x float> %partial.rsq
}		}

define <4 x float> @rcp_f32_vector_mixed_constant_numerator_arcp(<4 x float> %arg) {		define <4 x float> @rcp_f32_vector_mixed_constant_numerator_arcp(<4 x float> %arg) {
; IEEE-LABEL: define <4 x float> @rcp_f32_vector_mixed_constant_numerator_arcp		; IEEE-GOODFREXP-LABEL: define <4 x float> @rcp_f32_vector_mixed_constant_numerator_arcp
; IEEE-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {
; IEEE-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[ARG]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[ARG]], i64 0
; IEEE-NEXT: [[TMP2:%.*]] = fdiv arcp float 1.000000e+00, [[TMP1]]		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP1]])
; IEEE-NEXT: [[TMP3:%.*]] = insertelement <4 x float> poison, float [[TMP2]], i64 0		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP2]], 0
; IEEE-NEXT: [[TMP4:%.*]] = extractelement <4 x float> [[ARG]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = extractvalue { float, i32 } [[TMP2]], 1
; IEEE-NEXT: [[TMP5:%.*]] = fdiv arcp float -1.000000e+00, [[TMP4]]		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = sub i32 0, [[TMP4]]
; IEEE-NEXT: [[TMP6:%.*]] = insertelement <4 x float> [[TMP3]], float [[TMP5]], i64 1		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP3]])
; IEEE-NEXT: [[TMP7:%.*]] = extractelement <4 x float> [[ARG]], i64 2		; IEEE-GOODFREXP-NEXT: [[TMP7:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP6]], i32 [[TMP5]])
; IEEE-NEXT: [[TMP8:%.*]] = fdiv arcp float 4.000000e+00, [[TMP7]]		; IEEE-GOODFREXP-NEXT: [[TMP8:%.*]] = insertelement <4 x float> poison, float [[TMP7]], i64 0
; IEEE-NEXT: [[TMP9:%.*]] = insertelement <4 x float> [[TMP6]], float [[TMP8]], i64 2		; IEEE-GOODFREXP-NEXT: [[TMP9:%.*]] = extractelement <4 x float> [[ARG]], i64 1
; IEEE-NEXT: [[TMP10:%.*]] = extractelement <4 x float> [[ARG]], i64 3		; IEEE-GOODFREXP-NEXT: [[TMP10:%.*]] = fneg arcp float [[TMP9]]
; IEEE-NEXT: [[TMP11:%.*]] = fdiv arcp float undef, [[TMP10]]		; IEEE-GOODFREXP-NEXT: [[TMP11:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP10]])
; IEEE-NEXT: [[PARTIAL_RCP:%.*]] = insertelement <4 x float> [[TMP9]], float [[TMP11]], i64 3		; IEEE-GOODFREXP-NEXT: [[TMP12:%.*]] = extractvalue { float, i32 } [[TMP11]], 0
; IEEE-NEXT: ret <4 x float> [[PARTIAL_RCP]]		; IEEE-GOODFREXP-NEXT: [[TMP13:%.*]] = extractvalue { float, i32 } [[TMP11]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP14:%.*]] = sub i32 0, [[TMP13]]
		; IEEE-GOODFREXP-NEXT: [[TMP15:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP12]])
		; IEEE-GOODFREXP-NEXT: [[TMP16:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP15]], i32 [[TMP14]])
		; IEEE-GOODFREXP-NEXT: [[TMP17:%.*]] = insertelement <4 x float> [[TMP8]], float [[TMP16]], i64 1
		; IEEE-GOODFREXP-NEXT: [[TMP18:%.*]] = extractelement <4 x float> [[ARG]], i64 2
		; IEEE-GOODFREXP-NEXT: [[TMP19:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP18]])
		; IEEE-GOODFREXP-NEXT: [[TMP20:%.*]] = extractvalue { float, i32 } [[TMP19]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP21:%.*]] = extractvalue { float, i32 } [[TMP19]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP22:%.*]] = sub i32 0, [[TMP21]]
		; IEEE-GOODFREXP-NEXT: [[TMP23:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP20]])
		; IEEE-GOODFREXP-NEXT: [[TMP24:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP23]], i32 [[TMP22]])
		; IEEE-GOODFREXP-NEXT: [[TMP25:%.*]] = fmul arcp float 4.000000e+00, [[TMP24]]
		; IEEE-GOODFREXP-NEXT: [[TMP26:%.*]] = insertelement <4 x float> [[TMP17]], float [[TMP25]], i64 2
		; IEEE-GOODFREXP-NEXT: [[TMP27:%.*]] = extractelement <4 x float> [[ARG]], i64 3
		; IEEE-GOODFREXP-NEXT: [[TMP28:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP27]])
		; IEEE-GOODFREXP-NEXT: [[TMP29:%.*]] = extractvalue { float, i32 } [[TMP28]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP30:%.*]] = extractvalue { float, i32 } [[TMP28]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP31:%.*]] = sub i32 0, [[TMP30]]
		; IEEE-GOODFREXP-NEXT: [[TMP32:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP29]])
		; IEEE-GOODFREXP-NEXT: [[TMP33:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP32]], i32 [[TMP31]])
		; IEEE-GOODFREXP-NEXT: [[TMP34:%.*]] = fmul arcp float undef, [[TMP33]]
		; IEEE-GOODFREXP-NEXT: [[PARTIAL_RCP:%.*]] = insertelement <4 x float> [[TMP26]], float [[TMP34]], i64 3
		; IEEE-GOODFREXP-NEXT: ret <4 x float> [[PARTIAL_RCP]]
		;
		; IEEE-BADFREXP-LABEL: define <4 x float> @rcp_f32_vector_mixed_constant_numerator_arcp
		; IEEE-BADFREXP-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[ARG]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP1]])
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP2]], 0
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP1]])
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = sub i32 0, [[TMP4]]
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP3]])
		; IEEE-BADFREXP-NEXT: [[TMP7:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP6]], i32 [[TMP5]])
		; IEEE-BADFREXP-NEXT: [[TMP8:%.*]] = insertelement <4 x float> poison, float [[TMP7]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP9:%.*]] = extractelement <4 x float> [[ARG]], i64 1
		; IEEE-BADFREXP-NEXT: [[TMP10:%.*]] = fneg arcp float [[TMP9]]
		; IEEE-BADFREXP-NEXT: [[TMP11:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP10]])
		; IEEE-BADFREXP-NEXT: [[TMP12:%.*]] = extractvalue { float, i32 } [[TMP11]], 0
		; IEEE-BADFREXP-NEXT: [[TMP13:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP10]])
		; IEEE-BADFREXP-NEXT: [[TMP14:%.*]] = sub i32 0, [[TMP13]]
		; IEEE-BADFREXP-NEXT: [[TMP15:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP12]])
		; IEEE-BADFREXP-NEXT: [[TMP16:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP15]], i32 [[TMP14]])
		; IEEE-BADFREXP-NEXT: [[TMP17:%.*]] = insertelement <4 x float> [[TMP8]], float [[TMP16]], i64 1
		; IEEE-BADFREXP-NEXT: [[TMP18:%.*]] = extractelement <4 x float> [[ARG]], i64 2
		; IEEE-BADFREXP-NEXT: [[TMP19:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP18]])
		; IEEE-BADFREXP-NEXT: [[TMP20:%.*]] = extractvalue { float, i32 } [[TMP19]], 0
		; IEEE-BADFREXP-NEXT: [[TMP21:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP18]])
		; IEEE-BADFREXP-NEXT: [[TMP22:%.*]] = sub i32 0, [[TMP21]]
		; IEEE-BADFREXP-NEXT: [[TMP23:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP20]])
		; IEEE-BADFREXP-NEXT: [[TMP24:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP23]], i32 [[TMP22]])
		; IEEE-BADFREXP-NEXT: [[TMP25:%.*]] = fmul arcp float 4.000000e+00, [[TMP24]]
		; IEEE-BADFREXP-NEXT: [[TMP26:%.*]] = insertelement <4 x float> [[TMP17]], float [[TMP25]], i64 2
		; IEEE-BADFREXP-NEXT: [[TMP27:%.*]] = extractelement <4 x float> [[ARG]], i64 3
		; IEEE-BADFREXP-NEXT: [[TMP28:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[TMP27]])
		; IEEE-BADFREXP-NEXT: [[TMP29:%.*]] = extractvalue { float, i32 } [[TMP28]], 0
		; IEEE-BADFREXP-NEXT: [[TMP30:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[TMP27]])
		; IEEE-BADFREXP-NEXT: [[TMP31:%.*]] = sub i32 0, [[TMP30]]
		; IEEE-BADFREXP-NEXT: [[TMP32:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP29]])
		; IEEE-BADFREXP-NEXT: [[TMP33:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP32]], i32 [[TMP31]])
		; IEEE-BADFREXP-NEXT: [[TMP34:%.*]] = fmul arcp float undef, [[TMP33]]
		; IEEE-BADFREXP-NEXT: [[PARTIAL_RCP:%.*]] = insertelement <4 x float> [[TMP26]], float [[TMP34]], i64 3
		; IEEE-BADFREXP-NEXT: ret <4 x float> [[PARTIAL_RCP]]
;		;
; DAZ-LABEL: define <4 x float> @rcp_f32_vector_mixed_constant_numerator_arcp		; DAZ-LABEL: define <4 x float> @rcp_f32_vector_mixed_constant_numerator_arcp
; DAZ-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {		; DAZ-SAME: (<4 x float> [[ARG:%.*]]) #[[ATTR1]] {
; DAZ-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[ARG]], i64 0		; DAZ-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[ARG]], i64 0
; DAZ-NEXT: [[TMP2:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP1]])		; DAZ-NEXT: [[TMP2:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP1]])
; DAZ-NEXT: [[TMP3:%.*]] = insertelement <4 x float> poison, float [[TMP2]], i64 0		; DAZ-NEXT: [[TMP3:%.*]] = insertelement <4 x float> poison, float [[TMP2]], i64 0
; DAZ-NEXT: [[TMP4:%.*]] = extractelement <4 x float> [[ARG]], i64 1		; DAZ-NEXT: [[TMP4:%.*]] = extractelement <4 x float> [[ARG]], i64 1
; DAZ-NEXT: [[TMP5:%.*]] = fneg arcp float [[TMP4]]		; DAZ-NEXT: [[TMP5:%.*]] = fneg arcp float [[TMP4]]
; DAZ-NEXT: [[TMP6:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP5]])		; DAZ-NEXT: [[TMP6:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP5]])
; DAZ-NEXT: [[TMP7:%.*]] = insertelement <4 x float> [[TMP3]], float [[TMP6]], i64 1		; DAZ-NEXT: [[TMP7:%.*]] = insertelement <4 x float> [[TMP3]], float [[TMP6]], i64 1
; DAZ-NEXT: [[TMP8:%.*]] = extractelement <4 x float> [[ARG]], i64 2		; DAZ-NEXT: [[TMP8:%.*]] = extractelement <4 x float> [[ARG]], i64 2
; DAZ-NEXT: [[TMP9:%.*]] = fdiv arcp float 4.000000e+00, [[TMP8]]		; DAZ-NEXT: [[TMP9:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP8]])
; DAZ-NEXT: [[TMP10:%.*]] = insertelement <4 x float> [[TMP7]], float [[TMP9]], i64 2		; DAZ-NEXT: [[TMP10:%.*]] = fmul arcp float 4.000000e+00, [[TMP9]]
; DAZ-NEXT: [[TMP11:%.*]] = extractelement <4 x float> [[ARG]], i64 3		; DAZ-NEXT: [[TMP11:%.*]] = insertelement <4 x float> [[TMP7]], float [[TMP10]], i64 2
; DAZ-NEXT: [[TMP12:%.*]] = fdiv arcp float undef, [[TMP11]]		; DAZ-NEXT: [[TMP12:%.*]] = extractelement <4 x float> [[ARG]], i64 3
; DAZ-NEXT: [[PARTIAL_RCP:%.*]] = insertelement <4 x float> [[TMP10]], float [[TMP12]], i64 3		; DAZ-NEXT: [[TMP13:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP12]])
		; DAZ-NEXT: [[TMP14:%.*]] = fmul arcp float undef, [[TMP13]]
		; DAZ-NEXT: [[PARTIAL_RCP:%.*]] = insertelement <4 x float> [[TMP11]], float [[TMP14]], i64 3
; DAZ-NEXT: ret <4 x float> [[PARTIAL_RCP]]		; DAZ-NEXT: ret <4 x float> [[PARTIAL_RCP]]
;		;
%partial.rcp = fdiv arcp <4 x float> <float 1.0, float -1.0, float 4.0, float undef>, %arg, !fpmath !2		%partial.rcp = fdiv arcp <4 x float> <float 1.0, float -1.0, float 4.0, float undef>, %arg, !fpmath !2
ret <4 x float> %partial.rcp		ret <4 x float> %partial.rcp
}		}

define <4 x float> @rcp_f32_vector_mixed_constant_numerator_arcp_correct(<4 x float> %arg) {		define <4 x float> @rcp_f32_vector_mixed_constant_numerator_arcp_correct(<4 x float> %arg) {
; CHECK-LABEL: define <4 x float> @rcp_f32_vector_mixed_constant_numerator_arcp_correct		; CHECK-LABEL: define <4 x float> @rcp_f32_vector_mixed_constant_numerator_arcp_correct
Show All 13 Lines
; CHECK-NEXT: ret <4 x float> [[PARTIAL_RCP]]		; CHECK-NEXT: ret <4 x float> [[PARTIAL_RCP]]
;		;
%partial.rcp = fdiv arcp <4 x float> <float 1.0, float -1.0, float 4.0, float undef>, %arg		%partial.rcp = fdiv arcp <4 x float> <float 1.0, float -1.0, float 4.0, float undef>, %arg
ret <4 x float> %partial.rcp		ret <4 x float> %partial.rcp
}		}

; Make sure we don't crash if a vector square root has a constant vecctor input		; Make sure we don't crash if a vector square root has a constant vecctor input
define <4 x float> @rsq_f32_vector_const_denom(ptr addrspace(1) %out, <2 x float> %x) {		define <4 x float> @rsq_f32_vector_const_denom(ptr addrspace(1) %out, <2 x float> %x) {
; IEEE-LABEL: define <4 x float> @rsq_f32_vector_const_denom		; CHECK-LABEL: define <4 x float> @rsq_f32_vector_const_denom
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]]) #[[ATTR1]] {		; CHECK-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]]) #[[ATTR1]] {
; IEEE-NEXT: [[SQRT:%.*]] = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> <float 4.000000e+00, float 2.000000e+00, float 8.000000e+00, float undef>), !fpmath !2		; CHECK-NEXT: [[SQRT:%.*]] = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> <float 4.000000e+00, float 2.000000e+00, float 8.000000e+00, float undef>), !fpmath !2
; IEEE-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[SQRT]], i64 0		; CHECK-NEXT: [[TMP1:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float 4.000000e+00)
; IEEE-NEXT: [[TMP2:%.*]] = fdiv contract float 1.000000e+00, [[TMP1]]		; CHECK-NEXT: [[TMP2:%.*]] = insertelement <4 x float> poison, float [[TMP1]], i64 0
; IEEE-NEXT: [[TMP3:%.*]] = insertelement <4 x float> poison, float [[TMP2]], i64 0		; CHECK-NEXT: [[TMP3:%.*]] = call contract float @llvm.amdgcn.rsq.f32(float 2.000000e+00)
; IEEE-NEXT: [[TMP4:%.*]] = extractelement <4 x float> [[SQRT]], i64 1		; CHECK-NEXT: [[TMP4:%.*]] = fneg contract float [[TMP3]]
; IEEE-NEXT: [[TMP5:%.*]] = fdiv contract float -1.000000e+00, [[TMP4]]		; CHECK-NEXT: [[TMP5:%.*]] = insertelement <4 x float> [[TMP2]], float [[TMP4]], i64 1
; IEEE-NEXT: [[TMP6:%.*]] = insertelement <4 x float> [[TMP3]], float [[TMP5]], i64 1		; CHECK-NEXT: [[TMP6:%.*]] = extractelement <4 x float> [[SQRT]], i64 2
; IEEE-NEXT: [[TMP7:%.*]] = extractelement <4 x float> [[SQRT]], i64 2		; CHECK-NEXT: [[TMP7:%.*]] = fdiv contract float undef, [[TMP6]], !fpmath !2
; IEEE-NEXT: [[TMP8:%.*]] = fdiv contract float undef, [[TMP7]]		; CHECK-NEXT: [[TMP8:%.*]] = insertelement <4 x float> [[TMP5]], float [[TMP7]], i64 2
; IEEE-NEXT: [[TMP9:%.*]] = insertelement <4 x float> [[TMP6]], float [[TMP8]], i64 2		; CHECK-NEXT: [[TMP9:%.*]] = extractelement <4 x float> [[SQRT]], i64 3
; IEEE-NEXT: [[TMP10:%.*]] = extractelement <4 x float> [[SQRT]], i64 3		; CHECK-NEXT: [[TMP10:%.*]] = fdiv contract float 2.000000e+00, [[TMP9]], !fpmath !2
; IEEE-NEXT: [[TMP11:%.*]] = fdiv contract float 2.000000e+00, [[TMP10]]		; CHECK-NEXT: [[PARTIAL_RSQ:%.*]] = insertelement <4 x float> [[TMP8]], float [[TMP10]], i64 3
; IEEE-NEXT: [[PARTIAL_RSQ:%.*]] = insertelement <4 x float> [[TMP9]], float [[TMP11]], i64 3		; CHECK-NEXT: ret <4 x float> [[PARTIAL_RSQ]]
; IEEE-NEXT: ret <4 x float> [[PARTIAL_RSQ]]
;
; DAZ-LABEL: define <4 x float> @rsq_f32_vector_const_denom
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]]) #[[ATTR1]] {
; DAZ-NEXT: [[SQRT:%.*]] = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> <float 4.000000e+00, float 2.000000e+00, float 8.000000e+00, float undef>), !fpmath !2
; DAZ-NEXT: [[TMP1:%.*]] = extractelement <4 x float> [[SQRT]], i64 0
; DAZ-NEXT: [[TMP2:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP1]])
; DAZ-NEXT: [[TMP3:%.*]] = insertelement <4 x float> poison, float [[TMP2]], i64 0
; DAZ-NEXT: [[TMP4:%.*]] = extractelement <4 x float> [[SQRT]], i64 1
; DAZ-NEXT: [[TMP5:%.*]] = fneg contract float [[TMP4]]
; DAZ-NEXT: [[TMP6:%.*]] = call contract float @llvm.amdgcn.rcp.f32(float [[TMP5]])
; DAZ-NEXT: [[TMP7:%.*]] = insertelement <4 x float> [[TMP3]], float [[TMP6]], i64 1
; DAZ-NEXT: [[TMP8:%.*]] = extractelement <4 x float> [[SQRT]], i64 2
; DAZ-NEXT: [[TMP9:%.*]] = fdiv contract float undef, [[TMP8]]
; DAZ-NEXT: [[TMP10:%.*]] = insertelement <4 x float> [[TMP7]], float [[TMP9]], i64 2
; DAZ-NEXT: [[TMP11:%.*]] = extractelement <4 x float> [[SQRT]], i64 3
; DAZ-NEXT: [[TMP12:%.*]] = fdiv contract float 2.000000e+00, [[TMP11]]
; DAZ-NEXT: [[PARTIAL_RSQ:%.*]] = insertelement <4 x float> [[TMP10]], float [[TMP12]], i64 3
; DAZ-NEXT: ret <4 x float> [[PARTIAL_RSQ]]
;		;
%sqrt = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> <float 4.0, float 2.0, float 8.0, float undef>), !fpmath !2		%sqrt = call contract <4 x float> @llvm.sqrt.v4f32(<4 x float> <float 4.0, float 2.0, float 8.0, float undef>), !fpmath !2
%partial.rsq = fdiv contract <4 x float> <float 1.0, float -1.0, float undef, float 2.0>, %sqrt, !fpmath !2		%partial.rsq = fdiv contract <4 x float> <float 1.0, float -1.0, float undef, float 2.0>, %sqrt, !fpmath !2
ret <4 x float> %partial.rsq		ret <4 x float> %partial.rsq
}		}

define <4 x float> @fdiv_constant_f32_vector(ptr addrspace(1) %out, <2 x float> %x) {		define <4 x float> @fdiv_constant_f32_vector(ptr addrspace(1) %out, <2 x float> %x) {
; IEEE-LABEL: define <4 x float> @fdiv_constant_f32_vector		; IEEE-GOODFREXP-LABEL: define <4 x float> @fdiv_constant_f32_vector
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]]) #[[ATTR1]] {
; IEEE-NEXT: ret <4 x float> <float 2.000000e+00, float -5.000000e-01, float 0x7FF8000000000000, float 0x3FC99999A0000000>		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float 5.000000e-01)
		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP1]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-GOODFREXP-NEXT: [[TMP7:%.*]] = insertelement <4 x float> poison, float [[TMP6]], i64 0
		; IEEE-GOODFREXP-NEXT: [[TMP8:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float -2.000000e+00)
		; IEEE-GOODFREXP-NEXT: [[TMP9:%.*]] = extractvalue { float, i32 } [[TMP8]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP10:%.*]] = extractvalue { float, i32 } [[TMP8]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP11:%.*]] = sub i32 0, [[TMP10]]
		; IEEE-GOODFREXP-NEXT: [[TMP12:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP9]])
		; IEEE-GOODFREXP-NEXT: [[TMP13:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP12]], i32 [[TMP11]])
		; IEEE-GOODFREXP-NEXT: [[TMP14:%.*]] = insertelement <4 x float> [[TMP7]], float [[TMP13]], i64 1
		; IEEE-GOODFREXP-NEXT: [[TMP15:%.*]] = insertelement <4 x float> [[TMP14]], float 0x7FF8000000000000, i64 2
		; IEEE-GOODFREXP-NEXT: [[CONST_PARTIAL_RCP:%.*]] = insertelement <4 x float> [[TMP15]], float 0x3FC99999A0000000, i64 3
		; IEEE-GOODFREXP-NEXT: ret <4 x float> [[CONST_PARTIAL_RCP]]
		;
		; IEEE-BADFREXP-LABEL: define <4 x float> @fdiv_constant_f32_vector
		; IEEE-BADFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float 5.000000e-01)
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float 5.000000e-01)
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-BADFREXP-NEXT: [[TMP7:%.*]] = insertelement <4 x float> poison, float [[TMP6]], i64 0
		; IEEE-BADFREXP-NEXT: [[TMP8:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float -2.000000e+00)
		; IEEE-BADFREXP-NEXT: [[TMP9:%.*]] = extractvalue { float, i32 } [[TMP8]], 0
		; IEEE-BADFREXP-NEXT: [[TMP10:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float -2.000000e+00)
		; IEEE-BADFREXP-NEXT: [[TMP11:%.*]] = sub i32 0, [[TMP10]]
		; IEEE-BADFREXP-NEXT: [[TMP12:%.*]] = call float @llvm.amdgcn.rcp.f32(float [[TMP9]])
		; IEEE-BADFREXP-NEXT: [[TMP13:%.*]] = call float @llvm.ldexp.f32.i32(float [[TMP12]], i32 [[TMP11]])
		; IEEE-BADFREXP-NEXT: [[TMP14:%.*]] = insertelement <4 x float> [[TMP7]], float [[TMP13]], i64 1
		; IEEE-BADFREXP-NEXT: [[TMP15:%.*]] = insertelement <4 x float> [[TMP14]], float 0x7FF8000000000000, i64 2
		; IEEE-BADFREXP-NEXT: [[CONST_PARTIAL_RCP:%.*]] = insertelement <4 x float> [[TMP15]], float 0x3FC99999A0000000, i64 3
		; IEEE-BADFREXP-NEXT: ret <4 x float> [[CONST_PARTIAL_RCP]]
;		;
; DAZ-LABEL: define <4 x float> @fdiv_constant_f32_vector		; DAZ-LABEL: define <4 x float> @fdiv_constant_f32_vector
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], <2 x float> [[X:%.]]) #[[ATTR1]] {
; DAZ-NEXT: [[TMP1:%.*]] = call float @llvm.amdgcn.rcp.f32(float 5.000000e-01)		; DAZ-NEXT: [[TMP1:%.*]] = call float @llvm.amdgcn.rcp.f32(float 5.000000e-01)
; DAZ-NEXT: [[TMP2:%.*]] = insertelement <4 x float> poison, float [[TMP1]], i64 0		; DAZ-NEXT: [[TMP2:%.*]] = insertelement <4 x float> poison, float [[TMP1]], i64 0
; DAZ-NEXT: [[TMP3:%.*]] = call float @llvm.amdgcn.rcp.f32(float -2.000000e+00)		; DAZ-NEXT: [[TMP3:%.*]] = call float @llvm.amdgcn.rcp.f32(float -2.000000e+00)
; DAZ-NEXT: [[TMP4:%.*]] = insertelement <4 x float> [[TMP2]], float [[TMP3]], i64 1		; DAZ-NEXT: [[TMP4:%.*]] = insertelement <4 x float> [[TMP2]], float [[TMP3]], i64 1
; DAZ-NEXT: [[TMP5:%.*]] = insertelement <4 x float> [[TMP4]], float 0x7FF8000000000000, i64 2		; DAZ-NEXT: [[TMP5:%.*]] = insertelement <4 x float> [[TMP4]], float 0x7FF8000000000000, i64 2
; DAZ-NEXT: [[CONST_PARTIAL_RCP:%.*]] = insertelement <4 x float> [[TMP5]], float 0x3FC99999A0000000, i64 3		; DAZ-NEXT: [[CONST_PARTIAL_RCP:%.*]] = insertelement <4 x float> [[TMP5]], float 0x3FC99999A0000000, i64 3
; DAZ-NEXT: ret <4 x float> [[CONST_PARTIAL_RCP]]		; DAZ-NEXT: ret <4 x float> [[CONST_PARTIAL_RCP]]
;		;
%const.partial.rcp = fdiv <4 x float> <float 1.0, float -1.0, float undef, float 2.0>, <float 0.5, float 2.0, float 32.0, float 10.0>, !fpmath !2		%const.partial.rcp = fdiv <4 x float> <float 1.0, float -1.0, float undef, float 2.0>, <float 0.5, float 2.0, float 32.0, float 10.0>, !fpmath !2
ret <4 x float> %const.partial.rcp		ret <4 x float> %const.partial.rcp
}		}

define amdgpu_kernel void @fdiv_fpmath_f32_nosub_lhs(ptr addrspace(1) %out, float nofpclass(sub) %a, float %b) {		define amdgpu_kernel void @fdiv_fpmath_f32_nosub_lhs(ptr addrspace(1) %out, float nofpclass(sub) %a, float %b) {
; IEEE-LABEL: define amdgpu_kernel void @fdiv_fpmath_f32_nosub_lhs		; IEEE-GOODFREXP-LABEL: define amdgpu_kernel void @fdiv_fpmath_f32_nosub_lhs
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(sub) [[A:%.]], float [[B:%.*]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(sub) [[A:%.]], float [[B:%.*]]) #[[ATTR1]] {
; IEEE-NEXT: [[NO_MD:%.*]] = fdiv float [[A]], [[B]]		; IEEE-GOODFREXP-NEXT: [[NO_MD:%.*]] = fdiv float [[A]], [[B]]
; IEEE-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[MD_HALF_ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !1		; IEEE-GOODFREXP-NEXT: [[MD_HALF_ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !1
; IEEE-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[MD_1ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[MD_1ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !2
; IEEE-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[MD_25ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !0		; IEEE-GOODFREXP-NEXT: [[MD_25ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !0
; IEEE-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[MD_3ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !3		; IEEE-GOODFREXP-NEXT: [[MD_3ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !3
; IEEE-NEXT: store volatile float [[MD_3ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_3ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[TMP1:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[B]])		; IEEE-GOODFREXP-NEXT: [[FAST_MD_25ULP:%.*]] = fdiv fast float [[A]], [[B]], !fpmath !0
; IEEE-NEXT: [[FAST_MD_25ULP:%.*]] = fmul fast float [[A]], [[TMP1]]		; IEEE-GOODFREXP-NEXT: store volatile float [[FAST_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: store volatile float [[FAST_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[AFN_MD_25ULP:%.*]] = fdiv afn float [[A]], [[B]], !fpmath !0
; IEEE-NEXT: [[TMP2:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[B]])		; IEEE-GOODFREXP-NEXT: store volatile float [[AFN_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[AFN_MD_25ULP:%.*]] = fmul afn float [[A]], [[TMP2]]		; IEEE-GOODFREXP-NEXT: [[NO_MD_ARCP:%.*]] = fdiv arcp float [[A]], [[B]]
; IEEE-NEXT: store volatile float [[AFN_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[NO_MD_ARCP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[NO_MD_ARCP:%.*]] = fdiv arcp float [[A]], [[B]]		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[B]])
; IEEE-NEXT: store volatile float [[NO_MD_ARCP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
; IEEE-NEXT: [[ARCP_MD_25ULP:%.*]] = fdiv arcp float [[A]], [[B]], !fpmath !0		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP1]], 1
; IEEE-NEXT: store volatile float [[ARCP_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
; IEEE-NEXT: [[ARCP_MD_1ULP:%.*]] = fdiv arcp float [[A]], [[B]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP2]])
; IEEE-NEXT: store volatile float [[ARCP_MD_1ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
; IEEE-NEXT: ret void		; IEEE-GOODFREXP-NEXT: [[ARCP_MD_25ULP:%.*]] = fmul arcp float [[A]], [[TMP6]]
		; IEEE-GOODFREXP-NEXT: store volatile float [[ARCP_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: [[TMP7:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[B]])
		; IEEE-GOODFREXP-NEXT: [[TMP8:%.*]] = extractvalue { float, i32 } [[TMP7]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP9:%.*]] = extractvalue { float, i32 } [[TMP7]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP10:%.*]] = sub i32 0, [[TMP9]]
		; IEEE-GOODFREXP-NEXT: [[TMP11:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP8]])
		; IEEE-GOODFREXP-NEXT: [[TMP12:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP11]], i32 [[TMP10]])
		; IEEE-GOODFREXP-NEXT: [[ARCP_MD_1ULP:%.*]] = fmul arcp float [[A]], [[TMP12]]
		; IEEE-GOODFREXP-NEXT: store volatile float [[ARCP_MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: ret void
		;
		; IEEE-BADFREXP-LABEL: define amdgpu_kernel void @fdiv_fpmath_f32_nosub_lhs
		; IEEE-BADFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(sub) [[A:%.]], float [[B:%.*]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[NO_MD:%.*]] = fdiv float [[A]], [[B]]
		; IEEE-BADFREXP-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[MD_HALF_ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !1
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[MD_1ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !2
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[MD_25ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !0
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[MD_3ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !3
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_3ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[FAST_MD_25ULP:%.*]] = fdiv fast float [[A]], [[B]], !fpmath !0
		; IEEE-BADFREXP-NEXT: store volatile float [[FAST_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[AFN_MD_25ULP:%.*]] = fdiv afn float [[A]], [[B]], !fpmath !0
		; IEEE-BADFREXP-NEXT: store volatile float [[AFN_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[NO_MD_ARCP:%.*]] = fdiv arcp float [[A]], [[B]]
		; IEEE-BADFREXP-NEXT: store volatile float [[NO_MD_ARCP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[B]])
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[B]])
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-BADFREXP-NEXT: [[ARCP_MD_25ULP:%.*]] = fmul arcp float [[A]], [[TMP6]]
		; IEEE-BADFREXP-NEXT: store volatile float [[ARCP_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP7:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[B]])
		; IEEE-BADFREXP-NEXT: [[TMP8:%.*]] = extractvalue { float, i32 } [[TMP7]], 0
		; IEEE-BADFREXP-NEXT: [[TMP9:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[B]])
		; IEEE-BADFREXP-NEXT: [[TMP10:%.*]] = sub i32 0, [[TMP9]]
		; IEEE-BADFREXP-NEXT: [[TMP11:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP8]])
		; IEEE-BADFREXP-NEXT: [[TMP12:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP11]], i32 [[TMP10]])
		; IEEE-BADFREXP-NEXT: [[ARCP_MD_1ULP:%.*]] = fmul arcp float [[A]], [[TMP12]]
		; IEEE-BADFREXP-NEXT: store volatile float [[ARCP_MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @fdiv_fpmath_f32_nosub_lhs		; DAZ-LABEL: define amdgpu_kernel void @fdiv_fpmath_f32_nosub_lhs
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(sub) [[A:%.]], float [[B:%.*]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float nofpclass(sub) [[A:%.]], float [[B:%.*]]) #[[ATTR1]] {
; DAZ-NEXT: [[NO_MD:%.*]] = fdiv float [[A]], [[B]]		; DAZ-NEXT: [[NO_MD:%.*]] = fdiv float [[A]], [[B]]
; DAZ-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[MD_HALF_ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !1		; DAZ-NEXT: [[MD_HALF_ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !1
; DAZ-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[MD_1ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !2		; DAZ-NEXT: [[MD_1ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !2
; DAZ-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[MD_25ULP:%.*]] = call float @llvm.amdgcn.fdiv.fast(float [[A]], float [[B]])		; DAZ-NEXT: [[MD_25ULP:%.*]] = call float @llvm.amdgcn.fdiv.fast(float [[A]], float [[B]])
; DAZ-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[MD_3ULP:%.*]] = call float @llvm.amdgcn.fdiv.fast(float [[A]], float [[B]])		; DAZ-NEXT: [[MD_3ULP:%.*]] = call float @llvm.amdgcn.fdiv.fast(float [[A]], float [[B]])
; DAZ-NEXT: store volatile float [[MD_3ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_3ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[TMP1:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[B]])		; DAZ-NEXT: [[FAST_MD_25ULP:%.*]] = fdiv fast float [[A]], [[B]], !fpmath !0
; DAZ-NEXT: [[FAST_MD_25ULP:%.*]] = fmul fast float [[A]], [[TMP1]]
; DAZ-NEXT: store volatile float [[FAST_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FAST_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[TMP2:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[B]])		; DAZ-NEXT: [[AFN_MD_25ULP:%.*]] = fdiv afn float [[A]], [[B]], !fpmath !0
; DAZ-NEXT: [[AFN_MD_25ULP:%.*]] = fmul afn float [[A]], [[TMP2]]
; DAZ-NEXT: store volatile float [[AFN_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[AFN_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[NO_MD_ARCP:%.*]] = fdiv arcp float [[A]], [[B]]		; DAZ-NEXT: [[NO_MD_ARCP:%.*]] = fdiv arcp float [[A]], [[B]]
; DAZ-NEXT: store volatile float [[NO_MD_ARCP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[NO_MD_ARCP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[ARCP_MD_25ULP:%.*]] = call arcp float @llvm.amdgcn.fdiv.fast(float [[A]], float [[B]])		; DAZ-NEXT: [[TMP1:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[B]])
		; DAZ-NEXT: [[ARCP_MD_25ULP:%.*]] = fmul arcp float [[A]], [[TMP1]]
; DAZ-NEXT: store volatile float [[ARCP_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[ARCP_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[ARCP_MD_1ULP:%.*]] = fdiv arcp float [[A]], [[B]], !fpmath !2		; DAZ-NEXT: [[TMP2:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[B]])
		; DAZ-NEXT: [[ARCP_MD_1ULP:%.*]] = fmul arcp float [[A]], [[TMP2]]
; DAZ-NEXT: store volatile float [[ARCP_MD_1ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[ARCP_MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: ret void		; DAZ-NEXT: ret void
;		;
%no.md = fdiv float %a, %b		%no.md = fdiv float %a, %b
store volatile float %no.md, ptr addrspace(1) %out, align 4		store volatile float %no.md, ptr addrspace(1) %out, align 4
%md.half.ulp = fdiv float %a, %b, !fpmath !1		%md.half.ulp = fdiv float %a, %b, !fpmath !1
store volatile float %md.half.ulp, ptr addrspace(1) %out, align 4		store volatile float %md.half.ulp, ptr addrspace(1) %out, align 4
%md.1ulp = fdiv float %a, %b, !fpmath !2		%md.1ulp = fdiv float %a, %b, !fpmath !2
Show All 11 Lines	;
%arcp.md.25ulp = fdiv arcp float %a, %b, !fpmath !0		%arcp.md.25ulp = fdiv arcp float %a, %b, !fpmath !0
store volatile float %arcp.md.25ulp, ptr addrspace(1) %out, align 4		store volatile float %arcp.md.25ulp, ptr addrspace(1) %out, align 4
%arcp.md.1ulp = fdiv arcp float %a, %b, !fpmath !2		%arcp.md.1ulp = fdiv arcp float %a, %b, !fpmath !2
store volatile float %arcp.md.1ulp, ptr addrspace(1) %out, align 4		store volatile float %arcp.md.1ulp, ptr addrspace(1) %out, align 4
ret void		ret void
}		}

define amdgpu_kernel void @fdiv_fpmath_f32_nosub_rhs(ptr addrspace(1) %out, float %a, float nofpclass(sub) %b) {		define amdgpu_kernel void @fdiv_fpmath_f32_nosub_rhs(ptr addrspace(1) %out, float %a, float nofpclass(sub) %b) {
; IEEE-LABEL: define amdgpu_kernel void @fdiv_fpmath_f32_nosub_rhs		; IEEE-GOODFREXP-LABEL: define amdgpu_kernel void @fdiv_fpmath_f32_nosub_rhs
; IEEE-SAME: (ptr addrspace(1) [[OUT:%.]], float [[A:%.]], float nofpclass(sub) [[B:%.*]]) #[[ATTR1]] {		; IEEE-GOODFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[A:%.]], float nofpclass(sub) [[B:%.*]]) #[[ATTR1]] {
; IEEE-NEXT: [[NO_MD:%.*]] = fdiv float [[A]], [[B]]		; IEEE-GOODFREXP-NEXT: [[NO_MD:%.*]] = fdiv float [[A]], [[B]]
; IEEE-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[MD_HALF_ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !1		; IEEE-GOODFREXP-NEXT: [[MD_HALF_ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !1
; IEEE-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[MD_1ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[MD_1ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !2
; IEEE-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[MD_25ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !0		; IEEE-GOODFREXP-NEXT: [[MD_25ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !0
; IEEE-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[MD_3ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !3		; IEEE-GOODFREXP-NEXT: [[MD_3ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !3
; IEEE-NEXT: store volatile float [[MD_3ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[MD_3ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[TMP1:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[B]])		; IEEE-GOODFREXP-NEXT: [[FAST_MD_25ULP:%.*]] = fdiv fast float [[A]], [[B]], !fpmath !0
; IEEE-NEXT: [[FAST_MD_25ULP:%.*]] = fmul fast float [[A]], [[TMP1]]		; IEEE-GOODFREXP-NEXT: store volatile float [[FAST_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: store volatile float [[FAST_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[AFN_MD_25ULP:%.*]] = fdiv afn float [[A]], [[B]], !fpmath !0
; IEEE-NEXT: [[TMP2:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[B]])		; IEEE-GOODFREXP-NEXT: store volatile float [[AFN_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[AFN_MD_25ULP:%.*]] = fmul afn float [[A]], [[TMP2]]		; IEEE-GOODFREXP-NEXT: [[NO_MD_ARCP:%.*]] = fdiv arcp float [[A]], [[B]]
; IEEE-NEXT: store volatile float [[AFN_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: store volatile float [[NO_MD_ARCP]], ptr addrspace(1) [[OUT]], align 4
; IEEE-NEXT: [[NO_MD_ARCP:%.*]] = fdiv arcp float [[A]], [[B]]		; IEEE-GOODFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[B]])
; IEEE-NEXT: store volatile float [[NO_MD_ARCP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
; IEEE-NEXT: [[ARCP_MD_25ULP:%.*]] = fdiv arcp float [[A]], [[B]], !fpmath !0		; IEEE-GOODFREXP-NEXT: [[TMP3:%.*]] = extractvalue { float, i32 } [[TMP1]], 1
; IEEE-NEXT: store volatile float [[ARCP_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
; IEEE-NEXT: [[ARCP_MD_1ULP:%.*]] = fdiv arcp float [[A]], [[B]], !fpmath !2		; IEEE-GOODFREXP-NEXT: [[TMP5:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP2]])
; IEEE-NEXT: store volatile float [[ARCP_MD_1ULP]], ptr addrspace(1) [[OUT]], align 4		; IEEE-GOODFREXP-NEXT: [[TMP6:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
; IEEE-NEXT: ret void		; IEEE-GOODFREXP-NEXT: [[ARCP_MD_25ULP:%.*]] = fmul arcp float [[A]], [[TMP6]]
		; IEEE-GOODFREXP-NEXT: store volatile float [[ARCP_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: [[TMP7:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[B]])
		; IEEE-GOODFREXP-NEXT: [[TMP8:%.*]] = extractvalue { float, i32 } [[TMP7]], 0
		; IEEE-GOODFREXP-NEXT: [[TMP9:%.*]] = extractvalue { float, i32 } [[TMP7]], 1
		; IEEE-GOODFREXP-NEXT: [[TMP10:%.*]] = sub i32 0, [[TMP9]]
		; IEEE-GOODFREXP-NEXT: [[TMP11:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP8]])
		; IEEE-GOODFREXP-NEXT: [[TMP12:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP11]], i32 [[TMP10]])
		; IEEE-GOODFREXP-NEXT: [[ARCP_MD_1ULP:%.*]] = fmul arcp float [[A]], [[TMP12]]
		; IEEE-GOODFREXP-NEXT: store volatile float [[ARCP_MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-GOODFREXP-NEXT: ret void
		;
		; IEEE-BADFREXP-LABEL: define amdgpu_kernel void @fdiv_fpmath_f32_nosub_rhs
		; IEEE-BADFREXP-SAME: (ptr addrspace(1) [[OUT:%.]], float [[A:%.]], float nofpclass(sub) [[B:%.*]]) #[[ATTR1]] {
		; IEEE-BADFREXP-NEXT: [[NO_MD:%.*]] = fdiv float [[A]], [[B]]
		; IEEE-BADFREXP-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[MD_HALF_ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !1
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[MD_1ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !2
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[MD_25ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !0
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[MD_3ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !3
		; IEEE-BADFREXP-NEXT: store volatile float [[MD_3ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[FAST_MD_25ULP:%.*]] = fdiv fast float [[A]], [[B]], !fpmath !0
		; IEEE-BADFREXP-NEXT: store volatile float [[FAST_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[AFN_MD_25ULP:%.*]] = fdiv afn float [[A]], [[B]], !fpmath !0
		; IEEE-BADFREXP-NEXT: store volatile float [[AFN_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[NO_MD_ARCP:%.*]] = fdiv arcp float [[A]], [[B]]
		; IEEE-BADFREXP-NEXT: store volatile float [[NO_MD_ARCP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP1:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[B]])
		; IEEE-BADFREXP-NEXT: [[TMP2:%.*]] = extractvalue { float, i32 } [[TMP1]], 0
		; IEEE-BADFREXP-NEXT: [[TMP3:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[B]])
		; IEEE-BADFREXP-NEXT: [[TMP4:%.*]] = sub i32 0, [[TMP3]]
		; IEEE-BADFREXP-NEXT: [[TMP5:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP2]])
		; IEEE-BADFREXP-NEXT: [[TMP6:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP5]], i32 [[TMP4]])
		; IEEE-BADFREXP-NEXT: [[ARCP_MD_25ULP:%.*]] = fmul arcp float [[A]], [[TMP6]]
		; IEEE-BADFREXP-NEXT: store volatile float [[ARCP_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: [[TMP7:%.*]] = call { float, i32 } @llvm.frexp.f32.i32(float [[B]])
		; IEEE-BADFREXP-NEXT: [[TMP8:%.*]] = extractvalue { float, i32 } [[TMP7]], 0
		; IEEE-BADFREXP-NEXT: [[TMP9:%.*]] = call i32 @llvm.amdgcn.frexp.exp.i32.f32(float [[B]])
		; IEEE-BADFREXP-NEXT: [[TMP10:%.*]] = sub i32 0, [[TMP9]]
		; IEEE-BADFREXP-NEXT: [[TMP11:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[TMP8]])
		; IEEE-BADFREXP-NEXT: [[TMP12:%.*]] = call arcp float @llvm.ldexp.f32.i32(float [[TMP11]], i32 [[TMP10]])
		; IEEE-BADFREXP-NEXT: [[ARCP_MD_1ULP:%.*]] = fmul arcp float [[A]], [[TMP12]]
		; IEEE-BADFREXP-NEXT: store volatile float [[ARCP_MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
		; IEEE-BADFREXP-NEXT: ret void
;		;
; DAZ-LABEL: define amdgpu_kernel void @fdiv_fpmath_f32_nosub_rhs		; DAZ-LABEL: define amdgpu_kernel void @fdiv_fpmath_f32_nosub_rhs
; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[A:%.]], float nofpclass(sub) [[B:%.*]]) #[[ATTR1]] {		; DAZ-SAME: (ptr addrspace(1) [[OUT:%.]], float [[A:%.]], float nofpclass(sub) [[B:%.*]]) #[[ATTR1]] {
; DAZ-NEXT: [[NO_MD:%.*]] = fdiv float [[A]], [[B]]		; DAZ-NEXT: [[NO_MD:%.*]] = fdiv float [[A]], [[B]]
; DAZ-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[NO_MD]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[MD_HALF_ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !1		; DAZ-NEXT: [[MD_HALF_ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !1
; DAZ-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_HALF_ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[MD_1ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !2		; DAZ-NEXT: [[MD_1ULP:%.*]] = fdiv float [[A]], [[B]], !fpmath !2
; DAZ-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[MD_25ULP:%.*]] = call float @llvm.amdgcn.fdiv.fast(float [[A]], float [[B]])		; DAZ-NEXT: [[MD_25ULP:%.*]] = call float @llvm.amdgcn.fdiv.fast(float [[A]], float [[B]])
; DAZ-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[MD_3ULP:%.*]] = call float @llvm.amdgcn.fdiv.fast(float [[A]], float [[B]])		; DAZ-NEXT: [[MD_3ULP:%.*]] = call float @llvm.amdgcn.fdiv.fast(float [[A]], float [[B]])
; DAZ-NEXT: store volatile float [[MD_3ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[MD_3ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[TMP1:%.*]] = call fast float @llvm.amdgcn.rcp.f32(float [[B]])		; DAZ-NEXT: [[FAST_MD_25ULP:%.*]] = fdiv fast float [[A]], [[B]], !fpmath !0
; DAZ-NEXT: [[FAST_MD_25ULP:%.*]] = fmul fast float [[A]], [[TMP1]]
; DAZ-NEXT: store volatile float [[FAST_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[FAST_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[TMP2:%.*]] = call afn float @llvm.amdgcn.rcp.f32(float [[B]])		; DAZ-NEXT: [[AFN_MD_25ULP:%.*]] = fdiv afn float [[A]], [[B]], !fpmath !0
; DAZ-NEXT: [[AFN_MD_25ULP:%.*]] = fmul afn float [[A]], [[TMP2]]
; DAZ-NEXT: store volatile float [[AFN_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[AFN_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[NO_MD_ARCP:%.*]] = fdiv arcp float [[A]], [[B]]		; DAZ-NEXT: [[NO_MD_ARCP:%.*]] = fdiv arcp float [[A]], [[B]]
; DAZ-NEXT: store volatile float [[NO_MD_ARCP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[NO_MD_ARCP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[ARCP_MD_25ULP:%.*]] = call arcp float @llvm.amdgcn.fdiv.fast(float [[A]], float [[B]])		; DAZ-NEXT: [[TMP1:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[B]])
		; DAZ-NEXT: [[ARCP_MD_25ULP:%.*]] = fmul arcp float [[A]], [[TMP1]]
; DAZ-NEXT: store volatile float [[ARCP_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[ARCP_MD_25ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: [[ARCP_MD_1ULP:%.*]] = fdiv arcp float [[A]], [[B]], !fpmath !2		; DAZ-NEXT: [[TMP2:%.*]] = call arcp float @llvm.amdgcn.rcp.f32(float [[B]])
		; DAZ-NEXT: [[ARCP_MD_1ULP:%.*]] = fmul arcp float [[A]], [[TMP2]]
; DAZ-NEXT: store volatile float [[ARCP_MD_1ULP]], ptr addrspace(1) [[OUT]], align 4		; DAZ-NEXT: store volatile float [[ARCP_MD_1ULP]], ptr addrspace(1) [[OUT]], align 4
; DAZ-NEXT: ret void		; DAZ-NEXT: ret void
;		;
%no.md = fdiv float %a, %b		%no.md = fdiv float %a, %b
store volatile float %no.md, ptr addrspace(1) %out, align 4		store volatile float %no.md, ptr addrspace(1) %out, align 4
%md.half.ulp = fdiv float %a, %b, !fpmath !1		%md.half.ulp = fdiv float %a, %b, !fpmath !1
store volatile float %md.half.ulp, ptr addrspace(1) %out, align 4		store volatile float %md.half.ulp, ptr addrspace(1) %out, align 4
%md.1ulp = fdiv float %a, %b, !fpmath !2		%md.1ulp = fdiv float %a, %b, !fpmath !2
Show All 22 Lines
declare void @llvm.assume(i1 noundef)		declare void @llvm.assume(i1 noundef)

attributes #0 = { optnone noinline }		attributes #0 = { optnone noinline }

!0 = !{float 2.500000e+00}		!0 = !{float 2.500000e+00}
!1 = !{float 5.000000e-01}		!1 = !{float 5.000000e-01}
!2 = !{float 1.000000e+00}		!2 = !{float 1.000000e+00}
!3 = !{float 3.000000e+00}		!3 = !{float 3.000000e+00}
;; NOTE: These prefixes are unused and the list is autogenerated. Do not add tests below this line:
; IEEE-BADFREXP: {{.*}}
; IEEE-GOODFREXP: {{.*}}

llvm/test/CodeGen/AMDGPU/fdiv.ll

This file is larger than 256 KB, so syntax highlighting is disabled by default.

Show First 20 Lines • Show All 1,246 Lines • ▼ Show 20 Lines	entry:
ret void		ret void
}		}

define amdgpu_kernel void @s_fdiv_ulp25_v2f32(ptr addrspace(1) %out, <2 x float> %a, <2 x float> %b) #0 {		define amdgpu_kernel void @s_fdiv_ulp25_v2f32(ptr addrspace(1) %out, <2 x float> %a, <2 x float> %b) #0 {
; GFX67-LABEL: s_fdiv_ulp25_v2f32:		; GFX67-LABEL: s_fdiv_ulp25_v2f32:
; GFX67: ; %bb.0: ; %entry		; GFX67: ; %bb.0: ; %entry
; GFX67-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0xb		; GFX67-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0xb
; GFX67-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9		; GFX67-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9
; GFX67-NEXT: v_mov_b32_e32 v0, 0x6f800000
; GFX67-NEXT: v_mov_b32_e32 v1, 0x2f800000
; GFX67-NEXT: s_mov_b32 s3, 0xf000		; GFX67-NEXT: s_mov_b32 s3, 0xf000
; GFX67-NEXT: s_waitcnt lgkmcnt(0)
; GFX67-NEXT: v_cmp_gt_f32_e64 vcc, \|s6\|, v0
; GFX67-NEXT: v_cndmask_b32_e32 v2, 1.0, v1, vcc
; GFX67-NEXT: v_cmp_gt_f32_e64 vcc, \|s7\|, v0
; GFX67-NEXT: v_mul_f32_e32 v3, s6, v2
; GFX67-NEXT: v_cndmask_b32_e32 v1, 1.0, v1, vcc
; GFX67-NEXT: v_rcp_f32_e32 v3, v3
; GFX67-NEXT: v_mul_f32_e32 v0, s7, v1
; GFX67-NEXT: v_rcp_f32_e32 v4, v0
; GFX67-NEXT: s_mov_b32 s2, -1		; GFX67-NEXT: s_mov_b32 s2, -1
; GFX67-NEXT: v_mul_f32_e32 v0, s4, v3		; GFX67-NEXT: s_waitcnt lgkmcnt(0)
; GFX67-NEXT: v_mul_f32_e32 v0, v2, v0		; GFX67-NEXT: v_rcp_f32_e32 v0, s6
; GFX67-NEXT: v_mul_f32_e32 v2, s5, v4		; GFX67-NEXT: v_rcp_f32_e32 v1, s7
; GFX67-NEXT: v_mul_f32_e32 v1, v1, v2		; GFX67-NEXT: v_mul_f32_e32 v0, s4, v0
		; GFX67-NEXT: v_mul_f32_e32 v1, s5, v1
; GFX67-NEXT: buffer_store_dwordx2 v[0:1], off, s[0:3], 0		; GFX67-NEXT: buffer_store_dwordx2 v[0:1], off, s[0:3], 0
; GFX67-NEXT: s_endpgm		; GFX67-NEXT: s_endpgm
;		;
; GFX8-LABEL: s_fdiv_ulp25_v2f32:		; GFX8-LABEL: s_fdiv_ulp25_v2f32:
; GFX8: ; %bb.0: ; %entry		; GFX8: ; %bb.0: ; %entry
; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x2c		; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x2c
; GFX8-NEXT: v_mov_b32_e32 v0, 0x6f800000
; GFX8-NEXT: v_mov_b32_e32 v1, 0x2f800000
; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24		; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
; GFX8-NEXT: s_waitcnt lgkmcnt(0)		; GFX8-NEXT: s_waitcnt lgkmcnt(0)
; GFX8-NEXT: v_cmp_gt_f32_e64 vcc, \|s6\|, v0		; GFX8-NEXT: v_rcp_f32_e32 v0, s6
; GFX8-NEXT: v_cndmask_b32_e32 v2, 1.0, v1, vcc		; GFX8-NEXT: v_rcp_f32_e32 v1, s7
; GFX8-NEXT: v_cmp_gt_f32_e64 vcc, \|s7\|, v0
; GFX8-NEXT: v_mul_f32_e32 v3, s6, v2
; GFX8-NEXT: v_cndmask_b32_e32 v1, 1.0, v1, vcc
; GFX8-NEXT: v_rcp_f32_e32 v3, v3
; GFX8-NEXT: v_mul_f32_e32 v0, s7, v1
; GFX8-NEXT: v_rcp_f32_e32 v4, v0
; GFX8-NEXT: v_mul_f32_e32 v0, s4, v3
; GFX8-NEXT: v_mul_f32_e32 v0, v2, v0
; GFX8-NEXT: v_mul_f32_e32 v2, s5, v4
; GFX8-NEXT: v_mul_f32_e32 v1, v1, v2
; GFX8-NEXT: v_mov_b32_e32 v3, s1		; GFX8-NEXT: v_mov_b32_e32 v3, s1
; GFX8-NEXT: v_mov_b32_e32 v2, s0		; GFX8-NEXT: v_mov_b32_e32 v2, s0
		; GFX8-NEXT: v_mul_f32_e32 v0, s4, v0
		; GFX8-NEXT: v_mul_f32_e32 v1, s5, v1
; GFX8-NEXT: flat_store_dwordx2 v[2:3], v[0:1]		; GFX8-NEXT: flat_store_dwordx2 v[2:3], v[0:1]
; GFX8-NEXT: s_endpgm		; GFX8-NEXT: s_endpgm
;		;
; GFX10-LABEL: s_fdiv_ulp25_v2f32:		; GFX10-LABEL: s_fdiv_ulp25_v2f32:
; GFX10: ; %bb.0: ; %entry		; GFX10: ; %bb.0: ; %entry
		; GFX10-NEXT: s_clause 0x1
; GFX10-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x2c		; GFX10-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x2c
; GFX10-NEXT: v_mov_b32_e32 v4, 0		; GFX10-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x24
; GFX10-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24		; GFX10-NEXT: v_mov_b32_e32 v2, 0
; GFX10-NEXT: s_waitcnt lgkmcnt(0)		; GFX10-NEXT: s_waitcnt lgkmcnt(0)
; GFX10-NEXT: v_cmp_lt_f32_e64 s2, 0x6f800000, \|s6\|		; GFX10-NEXT: v_rcp_f32_e32 v0, s6
; GFX10-NEXT: v_cndmask_b32_e64 v0, 1.0, 0x2f800000, s2		; GFX10-NEXT: v_rcp_f32_e32 v1, s7
; GFX10-NEXT: v_cmp_lt_f32_e64 s2, 0x6f800000, \|s7\|		; GFX10-NEXT: v_mul_f32_e32 v0, s4, v0
; GFX10-NEXT: v_mul_f32_e32 v2, s6, v0		; GFX10-NEXT: v_mul_f32_e32 v1, s5, v1
; GFX10-NEXT: v_cndmask_b32_e64 v1, 1.0, 0x2f800000, s2		; GFX10-NEXT: global_store_dwordx2 v2, v[0:1], s[2:3]
; GFX10-NEXT: v_rcp_f32_e32 v2, v2
; GFX10-NEXT: v_mul_f32_e32 v3, s7, v1
; GFX10-NEXT: v_rcp_f32_e32 v3, v3
; GFX10-NEXT: v_mul_f32_e32 v2, s4, v2
; GFX10-NEXT: v_mul_f32_e32 v0, v0, v2
; GFX10-NEXT: v_mul_f32_e32 v3, s5, v3
; GFX10-NEXT: v_mul_f32_e32 v1, v1, v3
; GFX10-NEXT: global_store_dwordx2 v4, v[0:1], s[0:1]
; GFX10-NEXT: s_endpgm		; GFX10-NEXT: s_endpgm
;		;
; GFX11-LABEL: s_fdiv_ulp25_v2f32:		; GFX11-LABEL: s_fdiv_ulp25_v2f32:
; GFX11: ; %bb.0: ; %entry		; GFX11: ; %bb.0: ; %entry
; GFX11-NEXT: s_clause 0x1		; GFX11-NEXT: s_clause 0x1
; GFX11-NEXT: s_load_b128 s[4:7], s[0:1], 0x2c		; GFX11-NEXT: s_load_b128 s[4:7], s[0:1], 0x2c
; GFX11-NEXT: s_load_b64 s[0:1], s[0:1], 0x24		; GFX11-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
; GFX11-NEXT: s_waitcnt lgkmcnt(0)		; GFX11-NEXT: s_waitcnt lgkmcnt(0)
; GFX11-NEXT: v_cmp_lt_f32_e64 s2, 0x6f800000, \|s6\|		; GFX11-NEXT: v_rcp_f32_e32 v0, s6
; GFX11-NEXT: v_cndmask_b32_e64 v0, 1.0, 0x2f800000, s2		; GFX11-NEXT: v_rcp_f32_e32 v1, s7
; GFX11-NEXT: v_cmp_lt_f32_e64 s2, 0x6f800000, \|s7\|		; GFX11-NEXT: v_mov_b32_e32 v2, 0
; GFX11-NEXT: v_cndmask_b32_e64 v1, 1.0, 0x2f800000, s2
; GFX11-NEXT: v_dual_mul_f32 v2, s6, v0 :: v_dual_mul_f32 v3, s7, v1
; GFX11-NEXT: v_rcp_f32_e32 v2, v2
; GFX11-NEXT: v_rcp_f32_e32 v3, v3
; GFX11-NEXT: s_waitcnt_depctr 0xfff		; GFX11-NEXT: s_waitcnt_depctr 0xfff
; GFX11-NEXT: v_dual_mul_f32 v2, s4, v2 :: v_dual_mul_f32 v3, s5, v3		; GFX11-NEXT: v_dual_mul_f32 v0, s4, v0 :: v_dual_mul_f32 v1, s5, v1
; GFX11-NEXT: v_mov_b32_e32 v4, 0		; GFX11-NEXT: global_store_b64 v2, v[0:1], s[0:1]
; GFX11-NEXT: v_dual_mul_f32 v0, v0, v2 :: v_dual_mul_f32 v1, v1, v3
; GFX11-NEXT: global_store_b64 v4, v[0:1], s[0:1]
; GFX11-NEXT: s_nop 0		; GFX11-NEXT: s_nop 0
; GFX11-NEXT: s_sendmsg sendmsg(MSG_DEALLOC_VGPRS)		; GFX11-NEXT: s_sendmsg sendmsg(MSG_DEALLOC_VGPRS)
; GFX11-NEXT: s_endpgm		; GFX11-NEXT: s_endpgm
;		;
; EG-LABEL: s_fdiv_ulp25_v2f32:		; EG-LABEL: s_fdiv_ulp25_v2f32:
; EG: ; %bb.0: ; %entry		; EG: ; %bb.0: ; %entry
; EG-NEXT: ALU 5, @4, KC0[CB0:0-32], KC1[]		; EG-NEXT: ALU 5, @4, KC0[CB0:0-32], KC1[]
; EG-NEXT: MEM_RAT_CACHELESS STORE_RAW T0.XY, T1.X, 1		; EG-NEXT: MEM_RAT_CACHELESS STORE_RAW T0.XY, T1.X, 1
Show All 15 Lines
define amdgpu_kernel void @s_fdiv_v2f32_fast_math(ptr addrspace(1) %out, <2 x float> %a, <2 x float> %b) #0 {		define amdgpu_kernel void @s_fdiv_v2f32_fast_math(ptr addrspace(1) %out, <2 x float> %a, <2 x float> %b) #0 {
; GFX67-LABEL: s_fdiv_v2f32_fast_math:		; GFX67-LABEL: s_fdiv_v2f32_fast_math:
; GFX67: ; %bb.0: ; %entry		; GFX67: ; %bb.0: ; %entry
; GFX67-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0xb		; GFX67-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0xb
; GFX67-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9		; GFX67-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9
; GFX67-NEXT: s_mov_b32 s3, 0xf000		; GFX67-NEXT: s_mov_b32 s3, 0xf000
; GFX67-NEXT: s_mov_b32 s2, -1		; GFX67-NEXT: s_mov_b32 s2, -1
; GFX67-NEXT: s_waitcnt lgkmcnt(0)		; GFX67-NEXT: s_waitcnt lgkmcnt(0)
; GFX67-NEXT: v_rcp_f32_e32 v0, s6		; GFX67-NEXT: v_rcp_f32_e32 v0, s7
; GFX67-NEXT: v_rcp_f32_e32 v1, s7		; GFX67-NEXT: v_rcp_f32_e32 v2, s6
; GFX67-NEXT: v_mul_f32_e32 v0, s4, v0		; GFX67-NEXT: v_mul_f32_e32 v1, s5, v0
; GFX67-NEXT: v_mul_f32_e32 v1, s5, v1		; GFX67-NEXT: v_mul_f32_e32 v0, s4, v2
; GFX67-NEXT: buffer_store_dwordx2 v[0:1], off, s[0:3], 0		; GFX67-NEXT: buffer_store_dwordx2 v[0:1], off, s[0:3], 0
; GFX67-NEXT: s_endpgm		; GFX67-NEXT: s_endpgm
;		;
; GFX8-LABEL: s_fdiv_v2f32_fast_math:		; GFX8-LABEL: s_fdiv_v2f32_fast_math:
; GFX8: ; %bb.0: ; %entry		; GFX8: ; %bb.0: ; %entry
; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x2c		; GFX8-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x2c
; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24		; GFX8-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
; GFX8-NEXT: s_waitcnt lgkmcnt(0)		; GFX8-NEXT: s_waitcnt lgkmcnt(0)
; GFX8-NEXT: v_rcp_f32_e32 v0, s6		; GFX8-NEXT: v_rcp_f32_e32 v0, s7
; GFX8-NEXT: v_rcp_f32_e32 v1, s7		; GFX8-NEXT: v_rcp_f32_e32 v2, s6
		; GFX8-NEXT: v_mul_f32_e32 v1, s5, v0
		; GFX8-NEXT: v_mul_f32_e32 v0, s4, v2
; GFX8-NEXT: v_mov_b32_e32 v3, s1		; GFX8-NEXT: v_mov_b32_e32 v3, s1
; GFX8-NEXT: v_mov_b32_e32 v2, s0		; GFX8-NEXT: v_mov_b32_e32 v2, s0
; GFX8-NEXT: v_mul_f32_e32 v0, s4, v0
; GFX8-NEXT: v_mul_f32_e32 v1, s5, v1
; GFX8-NEXT: flat_store_dwordx2 v[2:3], v[0:1]		; GFX8-NEXT: flat_store_dwordx2 v[2:3], v[0:1]
; GFX8-NEXT: s_endpgm		; GFX8-NEXT: s_endpgm
;		;
; GFX10-LABEL: s_fdiv_v2f32_fast_math:		; GFX10-LABEL: s_fdiv_v2f32_fast_math:
; GFX10: ; %bb.0: ; %entry		; GFX10: ; %bb.0: ; %entry
; GFX10-NEXT: s_clause 0x1		; GFX10-NEXT: s_clause 0x1
; GFX10-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x2c		; GFX10-NEXT: s_load_dwordx4 s[4:7], s[0:1], 0x2c
; GFX10-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x24		; GFX10-NEXT: s_load_dwordx2 s[2:3], s[0:1], 0x24
; GFX10-NEXT: v_mov_b32_e32 v2, 0		; GFX10-NEXT: v_mov_b32_e32 v3, 0
; GFX10-NEXT: s_waitcnt lgkmcnt(0)		; GFX10-NEXT: s_waitcnt lgkmcnt(0)
; GFX10-NEXT: v_rcp_f32_e32 v0, s6		; GFX10-NEXT: v_rcp_f32_e32 v0, s7
; GFX10-NEXT: v_rcp_f32_e32 v1, s7		; GFX10-NEXT: v_rcp_f32_e32 v2, s6
; GFX10-NEXT: v_mul_f32_e32 v0, s4, v0		; GFX10-NEXT: v_mul_f32_e32 v1, s5, v0
; GFX10-NEXT: v_mul_f32_e32 v1, s5, v1		; GFX10-NEXT: v_mul_f32_e32 v0, s4, v2
; GFX10-NEXT: global_store_dwordx2 v2, v[0:1], s[2:3]		; GFX10-NEXT: global_store_dwordx2 v3, v[0:1], s[2:3]
; GFX10-NEXT: s_endpgm		; GFX10-NEXT: s_endpgm
;		;
; GFX11-LABEL: s_fdiv_v2f32_fast_math:		; GFX11-LABEL: s_fdiv_v2f32_fast_math:
; GFX11: ; %bb.0: ; %entry		; GFX11: ; %bb.0: ; %entry
; GFX11-NEXT: s_clause 0x1		; GFX11-NEXT: s_clause 0x1
; GFX11-NEXT: s_load_b128 s[4:7], s[0:1], 0x2c		; GFX11-NEXT: s_load_b128 s[4:7], s[0:1], 0x2c
; GFX11-NEXT: s_load_b64 s[0:1], s[0:1], 0x24		; GFX11-NEXT: s_load_b64 s[0:1], s[0:1], 0x24
; GFX11-NEXT: s_waitcnt lgkmcnt(0)		; GFX11-NEXT: s_waitcnt lgkmcnt(0)
; GFX11-NEXT: v_rcp_f32_e32 v0, s6		; GFX11-NEXT: v_rcp_f32_e32 v0, s7
; GFX11-NEXT: v_rcp_f32_e32 v1, s7		; GFX11-NEXT: v_rcp_f32_e32 v2, s6
; GFX11-NEXT: v_mov_b32_e32 v2, 0		; GFX11-NEXT: v_mov_b32_e32 v3, 0
; GFX11-NEXT: s_waitcnt_depctr 0xfff		; GFX11-NEXT: s_waitcnt_depctr 0xfff
; GFX11-NEXT: v_dual_mul_f32 v0, s4, v0 :: v_dual_mul_f32 v1, s5, v1		; GFX11-NEXT: v_dual_mul_f32 v1, s5, v0 :: v_dual_mul_f32 v0, s4, v2
; GFX11-NEXT: global_store_b64 v2, v[0:1], s[0:1]		; GFX11-NEXT: global_store_b64 v3, v[0:1], s[0:1]
; GFX11-NEXT: s_nop 0		; GFX11-NEXT: s_nop 0
; GFX11-NEXT: s_sendmsg sendmsg(MSG_DEALLOC_VGPRS)		; GFX11-NEXT: s_sendmsg sendmsg(MSG_DEALLOC_VGPRS)
; GFX11-NEXT: s_endpgm		; GFX11-NEXT: s_endpgm
;		;
; EG-LABEL: s_fdiv_v2f32_fast_math:		; EG-LABEL: s_fdiv_v2f32_fast_math:
; EG: ; %bb.0: ; %entry		; EG: ; %bb.0: ; %entry
; EG-NEXT: ALU 5, @4, KC0[CB0:0-32], KC1[]		; EG-NEXT: ALU 5, @4, KC0[CB0:0-32], KC1[]
; EG-NEXT: MEM_RAT_CACHELESS STORE_RAW T0.XY, T1.X, 1		; EG-NEXT: MEM_RAT_CACHELESS STORE_RAW T0.XY, T1.X, 1
▲ Show 20 Lines • Show All 541 Lines • ▼ Show 20 Lines
; GFX67-LABEL: s_fdiv_v4f32_fast_math:		; GFX67-LABEL: s_fdiv_v4f32_fast_math:
; GFX67: ; %bb.0:		; GFX67: ; %bb.0:
; GFX67-NEXT: s_load_dwordx4 s[8:11], s[0:1], 0x9		; GFX67-NEXT: s_load_dwordx4 s[8:11], s[0:1], 0x9
; GFX67-NEXT: s_waitcnt lgkmcnt(0)		; GFX67-NEXT: s_waitcnt lgkmcnt(0)
; GFX67-NEXT: s_load_dwordx8 s[0:7], s[10:11], 0x0		; GFX67-NEXT: s_load_dwordx8 s[0:7], s[10:11], 0x0
; GFX67-NEXT: s_mov_b32 s11, 0xf000		; GFX67-NEXT: s_mov_b32 s11, 0xf000
; GFX67-NEXT: s_mov_b32 s10, -1		; GFX67-NEXT: s_mov_b32 s10, -1
; GFX67-NEXT: s_waitcnt lgkmcnt(0)		; GFX67-NEXT: s_waitcnt lgkmcnt(0)
; GFX67-NEXT: v_rcp_f32_e32 v0, s4		; GFX67-NEXT: v_rcp_f32_e32 v0, s7
; GFX67-NEXT: v_rcp_f32_e32 v1, s5		; GFX67-NEXT: v_rcp_f32_e32 v1, s6
; GFX67-NEXT: v_rcp_f32_e32 v2, s6		; GFX67-NEXT: v_rcp_f32_e32 v4, s5
; GFX67-NEXT: v_rcp_f32_e32 v3, s7		; GFX67-NEXT: v_rcp_f32_e32 v5, s4
; GFX67-NEXT: v_mul_f32_e32 v0, s0, v0		; GFX67-NEXT: v_mul_f32_e32 v3, s3, v0
; GFX67-NEXT: v_mul_f32_e32 v1, s1, v1		; GFX67-NEXT: v_mul_f32_e32 v2, s2, v1
; GFX67-NEXT: v_mul_f32_e32 v2, s2, v2		; GFX67-NEXT: v_mul_f32_e32 v1, s1, v4
; GFX67-NEXT: v_mul_f32_e32 v3, s3, v3		; GFX67-NEXT: v_mul_f32_e32 v0, s0, v5
; GFX67-NEXT: buffer_store_dwordx4 v[0:3], off, s[8:11], 0		; GFX67-NEXT: buffer_store_dwordx4 v[0:3], off, s[8:11], 0
; GFX67-NEXT: s_endpgm		; GFX67-NEXT: s_endpgm
;		;
; GFX8-LABEL: s_fdiv_v4f32_fast_math:		; GFX8-LABEL: s_fdiv_v4f32_fast_math:
; GFX8: ; %bb.0:		; GFX8: ; %bb.0:
; GFX8-NEXT: s_load_dwordx4 s[8:11], s[0:1], 0x24		; GFX8-NEXT: s_load_dwordx4 s[8:11], s[0:1], 0x24
; GFX8-NEXT: s_waitcnt lgkmcnt(0)		; GFX8-NEXT: s_waitcnt lgkmcnt(0)
; GFX8-NEXT: s_load_dwordx8 s[0:7], s[10:11], 0x0		; GFX8-NEXT: s_load_dwordx8 s[0:7], s[10:11], 0x0
; GFX8-NEXT: v_mov_b32_e32 v4, s8		; GFX8-NEXT: v_mov_b32_e32 v4, s8
; GFX8-NEXT: v_mov_b32_e32 v5, s9		; GFX8-NEXT: v_mov_b32_e32 v5, s9
; GFX8-NEXT: s_waitcnt lgkmcnt(0)		; GFX8-NEXT: s_waitcnt lgkmcnt(0)
; GFX8-NEXT: v_rcp_f32_e32 v0, s4		; GFX8-NEXT: v_rcp_f32_e32 v0, s7
; GFX8-NEXT: v_rcp_f32_e32 v1, s5		; GFX8-NEXT: v_rcp_f32_e32 v1, s6
; GFX8-NEXT: v_rcp_f32_e32 v2, s6		; GFX8-NEXT: v_rcp_f32_e32 v6, s5
; GFX8-NEXT: v_rcp_f32_e32 v3, s7		; GFX8-NEXT: v_rcp_f32_e32 v7, s4
; GFX8-NEXT: v_mul_f32_e32 v0, s0, v0		; GFX8-NEXT: v_mul_f32_e32 v3, s3, v0
; GFX8-NEXT: v_mul_f32_e32 v1, s1, v1		; GFX8-NEXT: v_mul_f32_e32 v2, s2, v1
; GFX8-NEXT: v_mul_f32_e32 v2, s2, v2		; GFX8-NEXT: v_mul_f32_e32 v1, s1, v6
; GFX8-NEXT: v_mul_f32_e32 v3, s3, v3		; GFX8-NEXT: v_mul_f32_e32 v0, s0, v7
; GFX8-NEXT: flat_store_dwordx4 v[4:5], v[0:3]		; GFX8-NEXT: flat_store_dwordx4 v[4:5], v[0:3]
; GFX8-NEXT: s_endpgm		; GFX8-NEXT: s_endpgm
;		;
; GFX10-LABEL: s_fdiv_v4f32_fast_math:		; GFX10-LABEL: s_fdiv_v4f32_fast_math:
; GFX10: ; %bb.0:		; GFX10: ; %bb.0:
; GFX10-NEXT: s_load_dwordx4 s[8:11], s[0:1], 0x24		; GFX10-NEXT: s_load_dwordx4 s[8:11], s[0:1], 0x24
; GFX10-NEXT: v_mov_b32_e32 v4, 0		; GFX10-NEXT: v_mov_b32_e32 v6, 0
; GFX10-NEXT: s_waitcnt lgkmcnt(0)		; GFX10-NEXT: s_waitcnt lgkmcnt(0)
; GFX10-NEXT: s_load_dwordx8 s[0:7], s[10:11], 0x0		; GFX10-NEXT: s_load_dwordx8 s[0:7], s[10:11], 0x0
; GFX10-NEXT: s_waitcnt lgkmcnt(0)		; GFX10-NEXT: s_waitcnt lgkmcnt(0)
; GFX10-NEXT: v_rcp_f32_e32 v0, s4		; GFX10-NEXT: v_rcp_f32_e32 v0, s7
; GFX10-NEXT: v_rcp_f32_e32 v1, s5		; GFX10-NEXT: v_rcp_f32_e32 v1, s6
; GFX10-NEXT: v_rcp_f32_e32 v2, s6		; GFX10-NEXT: v_rcp_f32_e32 v4, s5
; GFX10-NEXT: v_rcp_f32_e32 v3, s7		; GFX10-NEXT: v_rcp_f32_e32 v5, s4
; GFX10-NEXT: v_mul_f32_e32 v0, s0, v0		; GFX10-NEXT: v_mul_f32_e32 v3, s3, v0
; GFX10-NEXT: v_mul_f32_e32 v1, s1, v1		; GFX10-NEXT: v_mul_f32_e32 v2, s2, v1
; GFX10-NEXT: v_mul_f32_e32 v2, s2, v2		; GFX10-NEXT: v_mul_f32_e32 v1, s1, v4
; GFX10-NEXT: v_mul_f32_e32 v3, s3, v3		; GFX10-NEXT: v_mul_f32_e32 v0, s0, v5
; GFX10-NEXT: global_store_dwordx4 v4, v[0:3], s[8:9]		; GFX10-NEXT: global_store_dwordx4 v6, v[0:3], s[8:9]
; GFX10-NEXT: s_endpgm		; GFX10-NEXT: s_endpgm
;		;
; GFX11-LABEL: s_fdiv_v4f32_fast_math:		; GFX11-LABEL: s_fdiv_v4f32_fast_math:
; GFX11: ; %bb.0:		; GFX11: ; %bb.0:
; GFX11-NEXT: s_load_b128 s[8:11], s[0:1], 0x24		; GFX11-NEXT: s_load_b128 s[8:11], s[0:1], 0x24
; GFX11-NEXT: s_waitcnt lgkmcnt(0)		; GFX11-NEXT: s_waitcnt lgkmcnt(0)
; GFX11-NEXT: s_load_b256 s[0:7], s[10:11], 0x0		; GFX11-NEXT: s_load_b256 s[0:7], s[10:11], 0x0
; GFX11-NEXT: s_waitcnt lgkmcnt(0)		; GFX11-NEXT: s_waitcnt lgkmcnt(0)
; GFX11-NEXT: v_rcp_f32_e32 v0, s4		; GFX11-NEXT: v_rcp_f32_e32 v0, s7
; GFX11-NEXT: v_rcp_f32_e32 v1, s5		; GFX11-NEXT: v_rcp_f32_e32 v1, s6
; GFX11-NEXT: v_rcp_f32_e32 v2, s6		; GFX11-NEXT: v_rcp_f32_e32 v4, s5
; GFX11-NEXT: v_rcp_f32_e32 v3, s7		; GFX11-NEXT: v_rcp_f32_e32 v5, s4
; GFX11-NEXT: v_mov_b32_e32 v4, 0		; GFX11-NEXT: v_dual_mov_b32 v6, 0 :: v_dual_mul_f32 v3, s3, v0
; GFX11-NEXT: v_dual_mul_f32 v0, s0, v0 :: v_dual_mul_f32 v1, s1, v1		; GFX11-NEXT: s_waitcnt_depctr 0xfff
; GFX11-NEXT: s_waitcnt_depctr 0xfff		; GFX11-NEXT: v_dual_mul_f32 v2, s2, v1 :: v_dual_mul_f32 v1, s1, v4
; GFX11-NEXT: v_dual_mul_f32 v2, s2, v2 :: v_dual_mul_f32 v3, s3, v3		; GFX11-NEXT: v_mul_f32_e32 v0, s0, v5
; GFX11-NEXT: global_store_b128 v4, v[0:3], s[8:9]		; GFX11-NEXT: global_store_b128 v6, v[0:3], s[8:9]
; GFX11-NEXT: s_nop 0		; GFX11-NEXT: s_nop 0
; GFX11-NEXT: s_sendmsg sendmsg(MSG_DEALLOC_VGPRS)		; GFX11-NEXT: s_sendmsg sendmsg(MSG_DEALLOC_VGPRS)
; GFX11-NEXT: s_endpgm		; GFX11-NEXT: s_endpgm
;		;
; EG-LABEL: s_fdiv_v4f32_fast_math:		; EG-LABEL: s_fdiv_v4f32_fast_math:
; EG: ; %bb.0:		; EG: ; %bb.0:
; EG-NEXT: ALU 0, @10, KC0[CB0:0-32], KC1[]		; EG-NEXT: ALU 0, @10, KC0[CB0:0-32], KC1[]
; EG-NEXT: TEX 1 @6		; EG-NEXT: TEX 1 @6
▲ Show 20 Lines • Show All 6,770 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/fdiv32-to-rcp-folding.ll

; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2		; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
; RUN: llc -march=amdgcn -mcpu=gfx900 -denormal-fp-math-f32=ieee < %s \| FileCheck -enable-var-scope -check-prefixes=GCN,GCN-DENORM %s		; RUN: llc -march=amdgcn -mcpu=gfx900 -denormal-fp-math-f32=ieee < %s \| FileCheck -enable-var-scope -check-prefixes=GCN,GCN-DENORM %s
; RUN: llc -march=amdgcn -mcpu=gfx900 -denormal-fp-math-f32=preserve-sign < %s \| FileCheck -enable-var-scope -check-prefixes=GCN,GCN-FLUSH %s		; RUN: llc -march=amdgcn -mcpu=gfx900 -denormal-fp-math-f32=preserve-sign < %s \| FileCheck -enable-var-scope -check-prefixes=GCN,GCN-FLUSH %s

define amdgpu_kernel void @div_1_by_x_25ulp(ptr addrspace(1) %arg) {		define amdgpu_kernel void @div_1_by_x_25ulp(ptr addrspace(1) %arg) {
; GCN-DENORM-LABEL: div_1_by_x_25ulp:		; GCN-DENORM-LABEL: div_1_by_x_25ulp:
; GCN-DENORM: ; %bb.0:		; GCN-DENORM: ; %bb.0:
; GCN-DENORM-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24		; GCN-DENORM-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
; GCN-DENORM-NEXT: v_mov_b32_e32 v0, 0x6f800000		; GCN-DENORM-NEXT: v_mov_b32_e32 v1, 0
; GCN-DENORM-NEXT: v_mov_b32_e32 v1, 0x2f800000
; GCN-DENORM-NEXT: v_mov_b32_e32 v2, 0
; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)
; GCN-DENORM-NEXT: s_load_dword s2, s[0:1], 0x0		; GCN-DENORM-NEXT: s_load_dword s2, s[0:1], 0x0
; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s2\|, v0		; GCN-DENORM-NEXT: v_frexp_mant_f32_e32 v0, s2
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v0, 1.0, v1, vcc		; GCN-DENORM-NEXT: v_rcp_f32_e32 v0, v0
; GCN-DENORM-NEXT: v_mul_f32_e32 v1, s2, v0		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v2, s2
; GCN-DENORM-NEXT: v_rcp_f32_e32 v1, v1		; GCN-DENORM-NEXT: v_sub_u32_e32 v2, 0, v2
; GCN-DENORM-NEXT: v_mul_f32_e32 v0, v0, v1		; GCN-DENORM-NEXT: v_ldexp_f32 v0, v0, v2
; GCN-DENORM-NEXT: global_store_dword v2, v0, s[0:1]		; GCN-DENORM-NEXT: global_store_dword v1, v0, s[0:1]
; GCN-DENORM-NEXT: s_endpgm		; GCN-DENORM-NEXT: s_endpgm
;		;
; GCN-FLUSH-LABEL: div_1_by_x_25ulp:		; GCN-FLUSH-LABEL: div_1_by_x_25ulp:
; GCN-FLUSH: ; %bb.0:		; GCN-FLUSH: ; %bb.0:
; GCN-FLUSH-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24		; GCN-FLUSH-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
; GCN-FLUSH-NEXT: v_mov_b32_e32 v1, 0		; GCN-FLUSH-NEXT: v_mov_b32_e32 v1, 0
; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)		; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)
; GCN-FLUSH-NEXT: s_load_dword s2, s[0:1], 0x0		; GCN-FLUSH-NEXT: s_load_dword s2, s[0:1], 0x0
; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)		; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)
; GCN-FLUSH-NEXT: v_rcp_f32_e32 v0, s2		; GCN-FLUSH-NEXT: v_rcp_f32_e32 v0, s2
; GCN-FLUSH-NEXT: global_store_dword v1, v0, s[0:1]		; GCN-FLUSH-NEXT: global_store_dword v1, v0, s[0:1]
; GCN-FLUSH-NEXT: s_endpgm		; GCN-FLUSH-NEXT: s_endpgm
%load = load float, ptr addrspace(1) %arg, align 4		%load = load float, ptr addrspace(1) %arg, align 4
%div = fdiv float 1.000000e+00, %load, !fpmath !0		%div = fdiv float 1.000000e+00, %load, !fpmath !0
store float %div, ptr addrspace(1) %arg, align 4		store float %div, ptr addrspace(1) %arg, align 4
ret void		ret void
}		}

define amdgpu_kernel void @div_minus_1_by_x_25ulp(ptr addrspace(1) %arg) {		define amdgpu_kernel void @div_minus_1_by_x_25ulp(ptr addrspace(1) %arg) {
; GCN-DENORM-LABEL: div_minus_1_by_x_25ulp:		; GCN-DENORM-LABEL: div_minus_1_by_x_25ulp:
; GCN-DENORM: ; %bb.0:		; GCN-DENORM: ; %bb.0:
; GCN-DENORM-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24		; GCN-DENORM-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
; GCN-DENORM-NEXT: v_mov_b32_e32 v0, 0x6f800000		; GCN-DENORM-NEXT: v_mov_b32_e32 v1, 0
; GCN-DENORM-NEXT: v_mov_b32_e32 v1, 0x2f800000
; GCN-DENORM-NEXT: v_mov_b32_e32 v2, 0
; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)
; GCN-DENORM-NEXT: s_load_dword s2, s[0:1], 0x0		; GCN-DENORM-NEXT: s_load_dword s2, s[0:1], 0x0
; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s2\|, v0		; GCN-DENORM-NEXT: v_frexp_mant_f32_e64 v0, -s2
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v0, 1.0, v1, vcc		; GCN-DENORM-NEXT: v_rcp_f32_e32 v0, v0
; GCN-DENORM-NEXT: v_mul_f32_e64 v1, s2, -v0		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v2, s2
; GCN-DENORM-NEXT: v_rcp_f32_e32 v1, v1		; GCN-DENORM-NEXT: v_sub_u32_e32 v2, 0, v2
; GCN-DENORM-NEXT: v_mul_f32_e32 v0, v0, v1		; GCN-DENORM-NEXT: v_ldexp_f32 v0, v0, v2
; GCN-DENORM-NEXT: global_store_dword v2, v0, s[0:1]		; GCN-DENORM-NEXT: global_store_dword v1, v0, s[0:1]
; GCN-DENORM-NEXT: s_endpgm		; GCN-DENORM-NEXT: s_endpgm
;		;
; GCN-FLUSH-LABEL: div_minus_1_by_x_25ulp:		; GCN-FLUSH-LABEL: div_minus_1_by_x_25ulp:
; GCN-FLUSH: ; %bb.0:		; GCN-FLUSH: ; %bb.0:
; GCN-FLUSH-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24		; GCN-FLUSH-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
; GCN-FLUSH-NEXT: v_mov_b32_e32 v1, 0		; GCN-FLUSH-NEXT: v_mov_b32_e32 v1, 0
; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)		; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)
; GCN-FLUSH-NEXT: s_load_dword s2, s[0:1], 0x0		; GCN-FLUSH-NEXT: s_load_dword s2, s[0:1], 0x0
; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)		; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)
; GCN-FLUSH-NEXT: v_rcp_f32_e64 v0, -s2		; GCN-FLUSH-NEXT: v_rcp_f32_e64 v0, -s2
; GCN-FLUSH-NEXT: global_store_dword v1, v0, s[0:1]		; GCN-FLUSH-NEXT: global_store_dword v1, v0, s[0:1]
; GCN-FLUSH-NEXT: s_endpgm		; GCN-FLUSH-NEXT: s_endpgm
%load = load float, ptr addrspace(1) %arg, align 4		%load = load float, ptr addrspace(1) %arg, align 4
%div = fdiv float -1.000000e+00, %load, !fpmath !0		%div = fdiv float -1.000000e+00, %load, !fpmath !0
store float %div, ptr addrspace(1) %arg, align 4		store float %div, ptr addrspace(1) %arg, align 4
ret void		ret void
}		}

define amdgpu_kernel void @div_1_by_minus_x_25ulp(ptr addrspace(1) %arg) {		define amdgpu_kernel void @div_1_by_minus_x_25ulp(ptr addrspace(1) %arg) {
; GCN-DENORM-LABEL: div_1_by_minus_x_25ulp:		; GCN-DENORM-LABEL: div_1_by_minus_x_25ulp:
; GCN-DENORM: ; %bb.0:		; GCN-DENORM: ; %bb.0:
; GCN-DENORM-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24		; GCN-DENORM-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
; GCN-DENORM-NEXT: v_mov_b32_e32 v0, 0x6f800000		; GCN-DENORM-NEXT: v_mov_b32_e32 v1, 0
; GCN-DENORM-NEXT: v_mov_b32_e32 v1, 0x2f800000
; GCN-DENORM-NEXT: v_mov_b32_e32 v2, 0
; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)
; GCN-DENORM-NEXT: s_load_dword s2, s[0:1], 0x0		; GCN-DENORM-NEXT: s_load_dword s2, s[0:1], 0x0
; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s2\|, v0		; GCN-DENORM-NEXT: v_frexp_mant_f32_e64 v0, -s2
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v0, 1.0, v1, vcc		; GCN-DENORM-NEXT: v_rcp_f32_e32 v0, v0
; GCN-DENORM-NEXT: v_mul_f32_e64 v1, -s2, v0		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v2, s2
; GCN-DENORM-NEXT: v_rcp_f32_e32 v1, v1		; GCN-DENORM-NEXT: v_sub_u32_e32 v2, 0, v2
; GCN-DENORM-NEXT: v_mul_f32_e32 v0, v0, v1		; GCN-DENORM-NEXT: v_ldexp_f32 v0, v0, v2
; GCN-DENORM-NEXT: global_store_dword v2, v0, s[0:1]		; GCN-DENORM-NEXT: global_store_dword v1, v0, s[0:1]
; GCN-DENORM-NEXT: s_endpgm		; GCN-DENORM-NEXT: s_endpgm
;		;
; GCN-FLUSH-LABEL: div_1_by_minus_x_25ulp:		; GCN-FLUSH-LABEL: div_1_by_minus_x_25ulp:
; GCN-FLUSH: ; %bb.0:		; GCN-FLUSH: ; %bb.0:
; GCN-FLUSH-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24		; GCN-FLUSH-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
; GCN-FLUSH-NEXT: v_mov_b32_e32 v1, 0		; GCN-FLUSH-NEXT: v_mov_b32_e32 v1, 0
; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)		; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)
; GCN-FLUSH-NEXT: s_load_dword s2, s[0:1], 0x0		; GCN-FLUSH-NEXT: s_load_dword s2, s[0:1], 0x0
; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)		; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)
; GCN-FLUSH-NEXT: v_rcp_f32_e64 v0, -s2		; GCN-FLUSH-NEXT: v_rcp_f32_e64 v0, -s2
; GCN-FLUSH-NEXT: global_store_dword v1, v0, s[0:1]		; GCN-FLUSH-NEXT: global_store_dword v1, v0, s[0:1]
; GCN-FLUSH-NEXT: s_endpgm		; GCN-FLUSH-NEXT: s_endpgm
%load = load float, ptr addrspace(1) %arg, align 4		%load = load float, ptr addrspace(1) %arg, align 4
%neg = fneg float %load		%neg = fneg float %load
%div = fdiv float 1.000000e+00, %neg, !fpmath !0		%div = fdiv float 1.000000e+00, %neg, !fpmath !0
store float %div, ptr addrspace(1) %arg, align 4		store float %div, ptr addrspace(1) %arg, align 4
ret void		ret void
}		}

define amdgpu_kernel void @div_minus_1_by_minus_x_25ulp(ptr addrspace(1) %arg) {		define amdgpu_kernel void @div_minus_1_by_minus_x_25ulp(ptr addrspace(1) %arg) {
; GCN-DENORM-LABEL: div_minus_1_by_minus_x_25ulp:		; GCN-DENORM-LABEL: div_minus_1_by_minus_x_25ulp:
; GCN-DENORM: ; %bb.0:		; GCN-DENORM: ; %bb.0:
; GCN-DENORM-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24		; GCN-DENORM-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
; GCN-DENORM-NEXT: v_mov_b32_e32 v0, 0x6f800000		; GCN-DENORM-NEXT: v_mov_b32_e32 v1, 0
; GCN-DENORM-NEXT: v_mov_b32_e32 v1, 0x2f800000
; GCN-DENORM-NEXT: v_mov_b32_e32 v2, 0
; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)
; GCN-DENORM-NEXT: s_load_dword s2, s[0:1], 0x0		; GCN-DENORM-NEXT: s_load_dword s2, s[0:1], 0x0
; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s2\|, v0		; GCN-DENORM-NEXT: v_frexp_mant_f32_e32 v0, s2
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v0, 1.0, v1, vcc		; GCN-DENORM-NEXT: v_rcp_f32_e32 v0, v0
; GCN-DENORM-NEXT: v_mul_f32_e32 v1, s2, v0		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v2, s2
; GCN-DENORM-NEXT: v_rcp_f32_e32 v1, v1		; GCN-DENORM-NEXT: v_sub_u32_e32 v2, 0, v2
; GCN-DENORM-NEXT: v_mul_f32_e32 v0, v0, v1		; GCN-DENORM-NEXT: v_ldexp_f32 v0, v0, v2
; GCN-DENORM-NEXT: global_store_dword v2, v0, s[0:1]		; GCN-DENORM-NEXT: global_store_dword v1, v0, s[0:1]
; GCN-DENORM-NEXT: s_endpgm		; GCN-DENORM-NEXT: s_endpgm
;		;
; GCN-FLUSH-LABEL: div_minus_1_by_minus_x_25ulp:		; GCN-FLUSH-LABEL: div_minus_1_by_minus_x_25ulp:
; GCN-FLUSH: ; %bb.0:		; GCN-FLUSH: ; %bb.0:
; GCN-FLUSH-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24		; GCN-FLUSH-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
; GCN-FLUSH-NEXT: v_mov_b32_e32 v1, 0		; GCN-FLUSH-NEXT: v_mov_b32_e32 v1, 0
; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)		; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)
; GCN-FLUSH-NEXT: s_load_dword s2, s[0:1], 0x0		; GCN-FLUSH-NEXT: s_load_dword s2, s[0:1], 0x0
; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)		; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)
; GCN-FLUSH-NEXT: v_rcp_f32_e32 v0, s2		; GCN-FLUSH-NEXT: v_rcp_f32_e32 v0, s2
; GCN-FLUSH-NEXT: global_store_dword v1, v0, s[0:1]		; GCN-FLUSH-NEXT: global_store_dword v1, v0, s[0:1]
; GCN-FLUSH-NEXT: s_endpgm		; GCN-FLUSH-NEXT: s_endpgm
%load = load float, ptr addrspace(1) %arg, align 4		%load = load float, ptr addrspace(1) %arg, align 4
%neg = fsub float -0.000000e+00, %load		%neg = fsub float -0.000000e+00, %load
%div = fdiv float -1.000000e+00, %neg, !fpmath !0		%div = fdiv float -1.000000e+00, %neg, !fpmath !0
store float %div, ptr addrspace(1) %arg, align 4		store float %div, ptr addrspace(1) %arg, align 4
ret void		ret void
}		}

define amdgpu_kernel void @div_v4_1_by_x_25ulp(ptr addrspace(1) %arg) {		define amdgpu_kernel void @div_v4_1_by_x_25ulp(ptr addrspace(1) %arg) {
; GCN-DENORM-LABEL: div_v4_1_by_x_25ulp:		; GCN-DENORM-LABEL: div_v4_1_by_x_25ulp:
; GCN-DENORM: ; %bb.0:		; GCN-DENORM: ; %bb.0:
; GCN-DENORM-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24		; GCN-DENORM-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24
; GCN-DENORM-NEXT: v_mov_b32_e32 v0, 0x6f800000
; GCN-DENORM-NEXT: v_mov_b32_e32 v1, 0x2f800000
; GCN-DENORM-NEXT: v_mov_b32_e32 v4, 0		; GCN-DENORM-NEXT: v_mov_b32_e32 v4, 0
; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)
; GCN-DENORM-NEXT: s_load_dwordx4 s[0:3], s[4:5], 0x0		; GCN-DENORM-NEXT: s_load_dwordx4 s[0:3], s[4:5], 0x0
; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s0\|, v0		; GCN-DENORM-NEXT: v_frexp_mant_f32_e32 v0, s0
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v2, 1.0, v1, vcc		; GCN-DENORM-NEXT: v_frexp_mant_f32_e32 v2, s1
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s1\|, v0		; GCN-DENORM-NEXT: v_rcp_f32_e32 v0, v0
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v3, 1.0, v1, vcc		; GCN-DENORM-NEXT: v_rcp_f32_e32 v2, v2
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s2\|, v0		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v1, s0
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v7, 1.0, v1, vcc		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v3, s1
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s3\|, v0		; GCN-DENORM-NEXT: v_frexp_mant_f32_e32 v5, s2
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v9, 1.0, v1, vcc		; GCN-DENORM-NEXT: v_sub_u32_e32 v1, 0, v1
; GCN-DENORM-NEXT: v_mul_f32_e32 v5, s0, v2		; GCN-DENORM-NEXT: v_sub_u32_e32 v3, 0, v3
; GCN-DENORM-NEXT: v_mul_f32_e32 v6, s1, v3
; GCN-DENORM-NEXT: v_mul_f32_e32 v8, s2, v7
; GCN-DENORM-NEXT: v_mul_f32_e32 v0, s3, v9
; GCN-DENORM-NEXT: v_rcp_f32_e32 v5, v5		; GCN-DENORM-NEXT: v_rcp_f32_e32 v5, v5
; GCN-DENORM-NEXT: v_rcp_f32_e32 v6, v6		; GCN-DENORM-NEXT: v_ldexp_f32 v0, v0, v1
; GCN-DENORM-NEXT: v_rcp_f32_e32 v8, v8		; GCN-DENORM-NEXT: v_ldexp_f32 v1, v2, v3
; GCN-DENORM-NEXT: v_rcp_f32_e32 v10, v0		; GCN-DENORM-NEXT: v_frexp_mant_f32_e32 v3, s3
; GCN-DENORM-NEXT: v_mul_f32_e32 v0, v2, v5		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v6, s2
; GCN-DENORM-NEXT: v_mul_f32_e32 v1, v3, v6		; GCN-DENORM-NEXT: v_rcp_f32_e32 v3, v3
; GCN-DENORM-NEXT: v_mul_f32_e32 v2, v7, v8		; GCN-DENORM-NEXT: v_sub_u32_e32 v2, 0, v6
; GCN-DENORM-NEXT: v_mul_f32_e32 v3, v9, v10		; GCN-DENORM-NEXT: v_ldexp_f32 v2, v5, v2
		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v5, s3
		; GCN-DENORM-NEXT: v_sub_u32_e32 v5, 0, v5
		; GCN-DENORM-NEXT: v_ldexp_f32 v3, v3, v5
; GCN-DENORM-NEXT: global_store_dwordx4 v4, v[0:3], s[4:5]		; GCN-DENORM-NEXT: global_store_dwordx4 v4, v[0:3], s[4:5]
; GCN-DENORM-NEXT: s_endpgm		; GCN-DENORM-NEXT: s_endpgm
;		;
; GCN-FLUSH-LABEL: div_v4_1_by_x_25ulp:		; GCN-FLUSH-LABEL: div_v4_1_by_x_25ulp:
; GCN-FLUSH: ; %bb.0:		; GCN-FLUSH: ; %bb.0:
; GCN-FLUSH-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24		; GCN-FLUSH-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24
; GCN-FLUSH-NEXT: v_mov_b32_e32 v4, 0		; GCN-FLUSH-NEXT: v_mov_b32_e32 v4, 0
; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)		; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)
Show All 10 Lines	; GCN-FLUSH-NEXT: s_endpgm
store <4 x float> %div, ptr addrspace(1) %arg, align 16		store <4 x float> %div, ptr addrspace(1) %arg, align 16
ret void		ret void
}		}

define amdgpu_kernel void @div_v4_minus_1_by_x_25ulp(ptr addrspace(1) %arg) {		define amdgpu_kernel void @div_v4_minus_1_by_x_25ulp(ptr addrspace(1) %arg) {
; GCN-DENORM-LABEL: div_v4_minus_1_by_x_25ulp:		; GCN-DENORM-LABEL: div_v4_minus_1_by_x_25ulp:
; GCN-DENORM: ; %bb.0:		; GCN-DENORM: ; %bb.0:
; GCN-DENORM-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24		; GCN-DENORM-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24
; GCN-DENORM-NEXT: v_mov_b32_e32 v0, 0x6f800000
; GCN-DENORM-NEXT: v_mov_b32_e32 v1, 0x2f800000
; GCN-DENORM-NEXT: v_mov_b32_e32 v4, 0		; GCN-DENORM-NEXT: v_mov_b32_e32 v4, 0
; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)
; GCN-DENORM-NEXT: s_load_dwordx4 s[0:3], s[4:5], 0x0		; GCN-DENORM-NEXT: s_load_dwordx4 s[0:3], s[4:5], 0x0
; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s0\|, v0		; GCN-DENORM-NEXT: v_frexp_mant_f32_e64 v0, -s0
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v2, 1.0, v1, vcc		; GCN-DENORM-NEXT: v_frexp_mant_f32_e64 v2, -s1
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s1\|, v0		; GCN-DENORM-NEXT: v_rcp_f32_e32 v0, v0
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v3, 1.0, v1, vcc		; GCN-DENORM-NEXT: v_rcp_f32_e32 v2, v2
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s2\|, v0		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v1, s0
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v7, 1.0, v1, vcc		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v3, s1
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s3\|, v0		; GCN-DENORM-NEXT: v_frexp_mant_f32_e64 v5, -s2
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v9, 1.0, v1, vcc		; GCN-DENORM-NEXT: v_sub_u32_e32 v1, 0, v1
; GCN-DENORM-NEXT: v_mul_f32_e64 v5, s0, -v2		; GCN-DENORM-NEXT: v_sub_u32_e32 v3, 0, v3
; GCN-DENORM-NEXT: v_mul_f32_e64 v6, s1, -v3
; GCN-DENORM-NEXT: v_mul_f32_e64 v8, s2, -v7
; GCN-DENORM-NEXT: v_mul_f32_e64 v0, s3, -v9
; GCN-DENORM-NEXT: v_rcp_f32_e32 v5, v5		; GCN-DENORM-NEXT: v_rcp_f32_e32 v5, v5
; GCN-DENORM-NEXT: v_rcp_f32_e32 v6, v6		; GCN-DENORM-NEXT: v_ldexp_f32 v0, v0, v1
; GCN-DENORM-NEXT: v_rcp_f32_e32 v8, v8		; GCN-DENORM-NEXT: v_ldexp_f32 v1, v2, v3
; GCN-DENORM-NEXT: v_rcp_f32_e32 v10, v0		; GCN-DENORM-NEXT: v_frexp_mant_f32_e64 v3, -s3
; GCN-DENORM-NEXT: v_mul_f32_e32 v0, v2, v5		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v6, s2
; GCN-DENORM-NEXT: v_mul_f32_e32 v1, v3, v6		; GCN-DENORM-NEXT: v_rcp_f32_e32 v3, v3
; GCN-DENORM-NEXT: v_mul_f32_e32 v2, v7, v8		; GCN-DENORM-NEXT: v_sub_u32_e32 v2, 0, v6
; GCN-DENORM-NEXT: v_mul_f32_e32 v3, v9, v10		; GCN-DENORM-NEXT: v_ldexp_f32 v2, v5, v2
		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v5, s3
		; GCN-DENORM-NEXT: v_sub_u32_e32 v5, 0, v5
		; GCN-DENORM-NEXT: v_ldexp_f32 v3, v3, v5
; GCN-DENORM-NEXT: global_store_dwordx4 v4, v[0:3], s[4:5]		; GCN-DENORM-NEXT: global_store_dwordx4 v4, v[0:3], s[4:5]
; GCN-DENORM-NEXT: s_endpgm		; GCN-DENORM-NEXT: s_endpgm
;		;
; GCN-FLUSH-LABEL: div_v4_minus_1_by_x_25ulp:		; GCN-FLUSH-LABEL: div_v4_minus_1_by_x_25ulp:
; GCN-FLUSH: ; %bb.0:		; GCN-FLUSH: ; %bb.0:
; GCN-FLUSH-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24		; GCN-FLUSH-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24
; GCN-FLUSH-NEXT: v_mov_b32_e32 v4, 0		; GCN-FLUSH-NEXT: v_mov_b32_e32 v4, 0
; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)		; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)
Show All 10 Lines	; GCN-FLUSH-NEXT: s_endpgm
store <4 x float> %div, ptr addrspace(1) %arg, align 16		store <4 x float> %div, ptr addrspace(1) %arg, align 16
ret void		ret void
}		}

define amdgpu_kernel void @div_v4_1_by_minus_x_25ulp(ptr addrspace(1) %arg) {		define amdgpu_kernel void @div_v4_1_by_minus_x_25ulp(ptr addrspace(1) %arg) {
; GCN-DENORM-LABEL: div_v4_1_by_minus_x_25ulp:		; GCN-DENORM-LABEL: div_v4_1_by_minus_x_25ulp:
; GCN-DENORM: ; %bb.0:		; GCN-DENORM: ; %bb.0:
; GCN-DENORM-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24		; GCN-DENORM-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24
; GCN-DENORM-NEXT: v_mov_b32_e32 v0, 0x6f800000
; GCN-DENORM-NEXT: v_mov_b32_e32 v1, 0x2f800000
; GCN-DENORM-NEXT: v_mov_b32_e32 v4, 0		; GCN-DENORM-NEXT: v_mov_b32_e32 v4, 0
; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)
; GCN-DENORM-NEXT: s_load_dwordx4 s[0:3], s[4:5], 0x0		; GCN-DENORM-NEXT: s_load_dwordx4 s[0:3], s[4:5], 0x0
; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s0\|, v0		; GCN-DENORM-NEXT: v_frexp_mant_f32_e64 v0, -s0
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v2, 1.0, v1, vcc		; GCN-DENORM-NEXT: v_frexp_mant_f32_e64 v2, -s1
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s1\|, v0		; GCN-DENORM-NEXT: v_rcp_f32_e32 v0, v0
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v3, 1.0, v1, vcc		; GCN-DENORM-NEXT: v_rcp_f32_e32 v2, v2
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s2\|, v0		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v1, s0
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v7, 1.0, v1, vcc		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v3, s1
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s3\|, v0		; GCN-DENORM-NEXT: v_frexp_mant_f32_e64 v5, -s2
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v9, 1.0, v1, vcc		; GCN-DENORM-NEXT: v_sub_u32_e32 v1, 0, v1
; GCN-DENORM-NEXT: v_mul_f32_e64 v5, -s0, v2		; GCN-DENORM-NEXT: v_sub_u32_e32 v3, 0, v3
; GCN-DENORM-NEXT: v_mul_f32_e64 v6, -s1, v3
; GCN-DENORM-NEXT: v_mul_f32_e64 v8, -s2, v7
; GCN-DENORM-NEXT: v_mul_f32_e64 v0, -s3, v9
; GCN-DENORM-NEXT: v_rcp_f32_e32 v5, v5		; GCN-DENORM-NEXT: v_rcp_f32_e32 v5, v5
; GCN-DENORM-NEXT: v_rcp_f32_e32 v6, v6		; GCN-DENORM-NEXT: v_ldexp_f32 v0, v0, v1
; GCN-DENORM-NEXT: v_rcp_f32_e32 v8, v8		; GCN-DENORM-NEXT: v_ldexp_f32 v1, v2, v3
; GCN-DENORM-NEXT: v_rcp_f32_e32 v10, v0		; GCN-DENORM-NEXT: v_frexp_mant_f32_e64 v3, -s3
; GCN-DENORM-NEXT: v_mul_f32_e32 v0, v2, v5		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v6, s2
; GCN-DENORM-NEXT: v_mul_f32_e32 v1, v3, v6		; GCN-DENORM-NEXT: v_rcp_f32_e32 v3, v3
; GCN-DENORM-NEXT: v_mul_f32_e32 v2, v7, v8		; GCN-DENORM-NEXT: v_sub_u32_e32 v2, 0, v6
; GCN-DENORM-NEXT: v_mul_f32_e32 v3, v9, v10		; GCN-DENORM-NEXT: v_ldexp_f32 v2, v5, v2
		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v5, s3
		; GCN-DENORM-NEXT: v_sub_u32_e32 v5, 0, v5
		; GCN-DENORM-NEXT: v_ldexp_f32 v3, v3, v5
; GCN-DENORM-NEXT: global_store_dwordx4 v4, v[0:3], s[4:5]		; GCN-DENORM-NEXT: global_store_dwordx4 v4, v[0:3], s[4:5]
; GCN-DENORM-NEXT: s_endpgm		; GCN-DENORM-NEXT: s_endpgm
;		;
; GCN-FLUSH-LABEL: div_v4_1_by_minus_x_25ulp:		; GCN-FLUSH-LABEL: div_v4_1_by_minus_x_25ulp:
; GCN-FLUSH: ; %bb.0:		; GCN-FLUSH: ; %bb.0:
; GCN-FLUSH-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24		; GCN-FLUSH-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24
; GCN-FLUSH-NEXT: v_mov_b32_e32 v4, 0		; GCN-FLUSH-NEXT: v_mov_b32_e32 v4, 0
; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)		; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)
Show All 11 Lines	; GCN-FLUSH-NEXT: s_endpgm
store <4 x float> %div, ptr addrspace(1) %arg, align 16		store <4 x float> %div, ptr addrspace(1) %arg, align 16
ret void		ret void
}		}

define amdgpu_kernel void @div_v4_minus_1_by_minus_x_25ulp(ptr addrspace(1) %arg) {		define amdgpu_kernel void @div_v4_minus_1_by_minus_x_25ulp(ptr addrspace(1) %arg) {
; GCN-DENORM-LABEL: div_v4_minus_1_by_minus_x_25ulp:		; GCN-DENORM-LABEL: div_v4_minus_1_by_minus_x_25ulp:
; GCN-DENORM: ; %bb.0:		; GCN-DENORM: ; %bb.0:
; GCN-DENORM-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24		; GCN-DENORM-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24
; GCN-DENORM-NEXT: v_mov_b32_e32 v0, 0x6f800000
; GCN-DENORM-NEXT: v_mov_b32_e32 v1, 0x2f800000
; GCN-DENORM-NEXT: v_mov_b32_e32 v4, 0		; GCN-DENORM-NEXT: v_mov_b32_e32 v4, 0
; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)
; GCN-DENORM-NEXT: s_load_dwordx4 s[0:3], s[4:5], 0x0		; GCN-DENORM-NEXT: s_load_dwordx4 s[0:3], s[4:5], 0x0
; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s0\|, v0		; GCN-DENORM-NEXT: v_frexp_mant_f32_e32 v0, s0
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v2, 1.0, v1, vcc		; GCN-DENORM-NEXT: v_frexp_mant_f32_e32 v2, s1
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s1\|, v0		; GCN-DENORM-NEXT: v_rcp_f32_e32 v0, v0
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v3, 1.0, v1, vcc		; GCN-DENORM-NEXT: v_rcp_f32_e32 v2, v2
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s2\|, v0		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v1, s0
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v7, 1.0, v1, vcc		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v3, s1
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s3\|, v0		; GCN-DENORM-NEXT: v_frexp_mant_f32_e32 v5, s2
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v9, 1.0, v1, vcc		; GCN-DENORM-NEXT: v_sub_u32_e32 v1, 0, v1
; GCN-DENORM-NEXT: v_mul_f32_e32 v5, s0, v2		; GCN-DENORM-NEXT: v_sub_u32_e32 v3, 0, v3
; GCN-DENORM-NEXT: v_mul_f32_e32 v6, s1, v3
; GCN-DENORM-NEXT: v_mul_f32_e32 v8, s2, v7
; GCN-DENORM-NEXT: v_mul_f32_e32 v0, s3, v9
; GCN-DENORM-NEXT: v_rcp_f32_e32 v5, v5		; GCN-DENORM-NEXT: v_rcp_f32_e32 v5, v5
; GCN-DENORM-NEXT: v_rcp_f32_e32 v6, v6		; GCN-DENORM-NEXT: v_ldexp_f32 v0, v0, v1
; GCN-DENORM-NEXT: v_rcp_f32_e32 v8, v8		; GCN-DENORM-NEXT: v_ldexp_f32 v1, v2, v3
; GCN-DENORM-NEXT: v_rcp_f32_e32 v10, v0		; GCN-DENORM-NEXT: v_frexp_mant_f32_e32 v3, s3
; GCN-DENORM-NEXT: v_mul_f32_e32 v0, v2, v5		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v6, s2
; GCN-DENORM-NEXT: v_mul_f32_e32 v1, v3, v6		; GCN-DENORM-NEXT: v_rcp_f32_e32 v3, v3
; GCN-DENORM-NEXT: v_mul_f32_e32 v2, v7, v8		; GCN-DENORM-NEXT: v_sub_u32_e32 v2, 0, v6
; GCN-DENORM-NEXT: v_mul_f32_e32 v3, v9, v10		; GCN-DENORM-NEXT: v_ldexp_f32 v2, v5, v2
		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v5, s3
		; GCN-DENORM-NEXT: v_sub_u32_e32 v5, 0, v5
		; GCN-DENORM-NEXT: v_ldexp_f32 v3, v3, v5
; GCN-DENORM-NEXT: global_store_dwordx4 v4, v[0:3], s[4:5]		; GCN-DENORM-NEXT: global_store_dwordx4 v4, v[0:3], s[4:5]
; GCN-DENORM-NEXT: s_endpgm		; GCN-DENORM-NEXT: s_endpgm
;		;
; GCN-FLUSH-LABEL: div_v4_minus_1_by_minus_x_25ulp:		; GCN-FLUSH-LABEL: div_v4_minus_1_by_minus_x_25ulp:
; GCN-FLUSH: ; %bb.0:		; GCN-FLUSH: ; %bb.0:
; GCN-FLUSH-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24		; GCN-FLUSH-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24
; GCN-FLUSH-NEXT: v_mov_b32_e32 v4, 0		; GCN-FLUSH-NEXT: v_mov_b32_e32 v4, 0
; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)		; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)
Show All 35 Lines
; GCN-DENORM-NEXT: v_fma_f32 v9, -v1, v7, v3		; GCN-DENORM-NEXT: v_fma_f32 v9, -v1, v7, v3
; GCN-DENORM-NEXT: v_fma_f32 v6, v8, v4, v6		; GCN-DENORM-NEXT: v_fma_f32 v6, v8, v4, v6
; GCN-DENORM-NEXT: v_fma_f32 v7, v9, v5, v7		; GCN-DENORM-NEXT: v_fma_f32 v7, v9, v5, v7
; GCN-DENORM-NEXT: v_fma_f32 v0, -v0, v6, v2		; GCN-DENORM-NEXT: v_fma_f32 v0, -v0, v6, v2
; GCN-DENORM-NEXT: v_fma_f32 v1, -v1, v7, v3		; GCN-DENORM-NEXT: v_fma_f32 v1, -v1, v7, v3
; GCN-DENORM-NEXT: v_div_fmas_f32 v0, v0, v4, v6		; GCN-DENORM-NEXT: v_div_fmas_f32 v0, v0, v4, v6
; GCN-DENORM-NEXT: s_mov_b64 vcc, s[0:1]		; GCN-DENORM-NEXT: s_mov_b64 vcc, s[0:1]
; GCN-DENORM-NEXT: v_div_fmas_f32 v3, v1, v5, v7		; GCN-DENORM-NEXT: v_div_fmas_f32 v3, v1, v5, v7
; GCN-DENORM-NEXT: v_mov_b32_e32 v1, 0x6f800000		; GCN-DENORM-NEXT: v_frexp_mant_f32_e32 v1, s5
; GCN-DENORM-NEXT: v_mov_b32_e32 v2, 0x2f800000		; GCN-DENORM-NEXT: v_frexp_mant_f32_e64 v5, -s6
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s5\|, v1
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v4, 1.0, v2, vcc
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s6\|, v1
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v2, 1.0, v2, vcc
; GCN-DENORM-NEXT: v_mul_f32_e32 v1, s5, v4
; GCN-DENORM-NEXT: v_mul_f32_e64 v5, s6, -v2
; GCN-DENORM-NEXT: v_rcp_f32_e32 v1, v1		; GCN-DENORM-NEXT: v_rcp_f32_e32 v1, v1
; GCN-DENORM-NEXT: v_rcp_f32_e32 v5, v5		; GCN-DENORM-NEXT: v_rcp_f32_e32 v5, v5
; GCN-DENORM-NEXT: v_mov_b32_e32 v6, 0		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v2, s5
; GCN-DENORM-NEXT: v_mul_f32_e32 v1, v4, v1		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v6, s6
		; GCN-DENORM-NEXT: v_sub_u32_e32 v2, 0, v2
		; GCN-DENORM-NEXT: v_sub_u32_e32 v6, 0, v6
		; GCN-DENORM-NEXT: v_mov_b32_e32 v4, 0
		; GCN-DENORM-NEXT: v_ldexp_f32 v1, v1, v2
		; GCN-DENORM-NEXT: v_ldexp_f32 v2, v5, v6
; GCN-DENORM-NEXT: v_div_fixup_f32 v0, v0, s4, 2.0		; GCN-DENORM-NEXT: v_div_fixup_f32 v0, v0, s4, 2.0
; GCN-DENORM-NEXT: v_mul_f32_e32 v2, v2, v5
; GCN-DENORM-NEXT: v_div_fixup_f32 v3, v3, s7, -2.0		; GCN-DENORM-NEXT: v_div_fixup_f32 v3, v3, s7, -2.0
; GCN-DENORM-NEXT: global_store_dwordx4 v6, v[0:3], s[2:3]		; GCN-DENORM-NEXT: global_store_dwordx4 v4, v[0:3], s[2:3]
; GCN-DENORM-NEXT: s_endpgm		; GCN-DENORM-NEXT: s_endpgm
;		;
; GCN-FLUSH-LABEL: div_v4_c_by_x_25ulp:		; GCN-FLUSH-LABEL: div_v4_c_by_x_25ulp:
; GCN-FLUSH: ; %bb.0:		; GCN-FLUSH: ; %bb.0:
; GCN-FLUSH-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24		; GCN-FLUSH-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24
; GCN-FLUSH-NEXT: v_mov_b32_e32 v0, 0x6f800000		; GCN-FLUSH-NEXT: v_mov_b32_e32 v0, 0x6f800000
; GCN-FLUSH-NEXT: v_mov_b32_e32 v1, 0x2f800000		; GCN-FLUSH-NEXT: v_mov_b32_e32 v1, 0x2f800000
; GCN-FLUSH-NEXT: v_mov_b32_e32 v4, 0		; GCN-FLUSH-NEXT: v_mov_b32_e32 v4, 0
▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
; GCN-DENORM-NEXT: v_fma_f32 v9, -v1, v7, v3		; GCN-DENORM-NEXT: v_fma_f32 v9, -v1, v7, v3
; GCN-DENORM-NEXT: v_fma_f32 v6, v8, v4, v6		; GCN-DENORM-NEXT: v_fma_f32 v6, v8, v4, v6
; GCN-DENORM-NEXT: v_fma_f32 v7, v9, v5, v7		; GCN-DENORM-NEXT: v_fma_f32 v7, v9, v5, v7
; GCN-DENORM-NEXT: v_fma_f32 v0, -v0, v6, v2		; GCN-DENORM-NEXT: v_fma_f32 v0, -v0, v6, v2
; GCN-DENORM-NEXT: v_fma_f32 v1, -v1, v7, v3		; GCN-DENORM-NEXT: v_fma_f32 v1, -v1, v7, v3
; GCN-DENORM-NEXT: v_div_fmas_f32 v0, v0, v4, v6		; GCN-DENORM-NEXT: v_div_fmas_f32 v0, v0, v4, v6
; GCN-DENORM-NEXT: s_mov_b64 vcc, s[0:1]		; GCN-DENORM-NEXT: s_mov_b64 vcc, s[0:1]
; GCN-DENORM-NEXT: v_div_fmas_f32 v3, v1, v5, v7		; GCN-DENORM-NEXT: v_div_fmas_f32 v3, v1, v5, v7
; GCN-DENORM-NEXT: v_mov_b32_e32 v1, 0x6f800000		; GCN-DENORM-NEXT: v_frexp_mant_f32_e64 v1, -s5
; GCN-DENORM-NEXT: v_mov_b32_e32 v2, 0x2f800000		; GCN-DENORM-NEXT: v_frexp_mant_f32_e32 v5, s6
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s5\|, v1
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v4, 1.0, v2, vcc
; GCN-DENORM-NEXT: v_cmp_gt_f32_e64 vcc, \|s6\|, v1
; GCN-DENORM-NEXT: v_cndmask_b32_e32 v2, 1.0, v2, vcc
; GCN-DENORM-NEXT: v_mul_f32_e64 v1, -s5, v4
; GCN-DENORM-NEXT: v_mul_f32_e32 v5, s6, v2
; GCN-DENORM-NEXT: v_rcp_f32_e32 v1, v1		; GCN-DENORM-NEXT: v_rcp_f32_e32 v1, v1
; GCN-DENORM-NEXT: v_rcp_f32_e32 v5, v5		; GCN-DENORM-NEXT: v_rcp_f32_e32 v5, v5
; GCN-DENORM-NEXT: v_mov_b32_e32 v6, 0		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v2, s5
; GCN-DENORM-NEXT: v_mul_f32_e32 v1, v4, v1		; GCN-DENORM-NEXT: v_frexp_exp_i32_f32_e32 v6, s6
		; GCN-DENORM-NEXT: v_sub_u32_e32 v2, 0, v2
		; GCN-DENORM-NEXT: v_sub_u32_e32 v6, 0, v6
		; GCN-DENORM-NEXT: v_mov_b32_e32 v4, 0
		; GCN-DENORM-NEXT: v_ldexp_f32 v1, v1, v2
		; GCN-DENORM-NEXT: v_ldexp_f32 v2, v5, v6
; GCN-DENORM-NEXT: v_div_fixup_f32 v0, v0, s4, -2.0		; GCN-DENORM-NEXT: v_div_fixup_f32 v0, v0, s4, -2.0
; GCN-DENORM-NEXT: v_mul_f32_e32 v2, v2, v5
; GCN-DENORM-NEXT: v_div_fixup_f32 v3, v3, -s7, -2.0		; GCN-DENORM-NEXT: v_div_fixup_f32 v3, v3, -s7, -2.0
; GCN-DENORM-NEXT: global_store_dwordx4 v6, v[0:3], s[2:3]		; GCN-DENORM-NEXT: global_store_dwordx4 v4, v[0:3], s[2:3]
; GCN-DENORM-NEXT: s_endpgm		; GCN-DENORM-NEXT: s_endpgm
;		;
; GCN-FLUSH-LABEL: div_v4_c_by_minus_x_25ulp:		; GCN-FLUSH-LABEL: div_v4_c_by_minus_x_25ulp:
; GCN-FLUSH: ; %bb.0:		; GCN-FLUSH: ; %bb.0:
; GCN-FLUSH-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24		; GCN-FLUSH-NEXT: s_load_dwordx2 s[4:5], s[0:1], 0x24
; GCN-FLUSH-NEXT: v_mov_b32_e32 v0, 0x6f800000		; GCN-FLUSH-NEXT: v_mov_b32_e32 v0, 0x6f800000
; GCN-FLUSH-NEXT: v_mov_b32_e32 v2, 0x2f800000		; GCN-FLUSH-NEXT: v_mov_b32_e32 v2, 0x2f800000
; GCN-FLUSH-NEXT: v_mov_b32_e32 v4, 0		; GCN-FLUSH-NEXT: v_mov_b32_e32 v4, 0
▲ Show 20 Lines • Show All 87 Lines • ▼ Show 20 Lines
; GCN-NEXT: s_endpgm		; GCN-NEXT: s_endpgm
%load = load float, ptr addrspace(1) %arg, align 4		%load = load float, ptr addrspace(1) %arg, align 4
%div = fdiv fast float 1.000000e+00, %load, !fpmath !0		%div = fdiv fast float 1.000000e+00, %load, !fpmath !0
store float %div, ptr addrspace(1) %arg, align 4		store float %div, ptr addrspace(1) %arg, align 4
ret void		ret void
}		}

define amdgpu_kernel void @div_minus_1_by_x_fast(ptr addrspace(1) %arg) {		define amdgpu_kernel void @div_minus_1_by_x_fast(ptr addrspace(1) %arg) {
; GCN-LABEL: div_minus_1_by_x_fast:		; GCN-DENORM-LABEL: div_minus_1_by_x_fast:
; GCN: ; %bb.0:		; GCN-DENORM: ; %bb.0:
; GCN-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24		; GCN-DENORM-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
; GCN-NEXT: v_mov_b32_e32 v1, 0		; GCN-DENORM-NEXT: v_mov_b32_e32 v1, 0
; GCN-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)
; GCN-NEXT: s_load_dword s2, s[0:1], 0x0		; GCN-DENORM-NEXT: s_load_dword s2, s[0:1], 0x0
; GCN-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)
; GCN-NEXT: v_rcp_f32_e64 v0, -s2		; GCN-DENORM-NEXT: v_rcp_f32_e64 v0, -s2
; GCN-NEXT: global_store_dword v1, v0, s[0:1]		; GCN-DENORM-NEXT: global_store_dword v1, v0, s[0:1]
; GCN-NEXT: s_endpgm		; GCN-DENORM-NEXT: s_endpgm
		;
		; GCN-FLUSH-LABEL: div_minus_1_by_x_fast:
		; GCN-FLUSH: ; %bb.0:
		; GCN-FLUSH-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
		; GCN-FLUSH-NEXT: v_mov_b32_e32 v1, 0
		; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)
		; GCN-FLUSH-NEXT: s_load_dword s2, s[0:1], 0x0
		; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)
		; GCN-FLUSH-NEXT: v_rcp_f32_e32 v0, s2
		; GCN-FLUSH-NEXT: v_sub_f32_e32 v0, 0x80000000, v0
		; GCN-FLUSH-NEXT: global_store_dword v1, v0, s[0:1]
		; GCN-FLUSH-NEXT: s_endpgm
%load = load float, ptr addrspace(1) %arg, align 4		%load = load float, ptr addrspace(1) %arg, align 4
%div = fdiv fast float -1.000000e+00, %load, !fpmath !0		%div = fdiv fast float -1.000000e+00, %load, !fpmath !0
store float %div, ptr addrspace(1) %arg, align 4		store float %div, ptr addrspace(1) %arg, align 4
ret void		ret void
}		}

define amdgpu_kernel void @div_1_by_minus_x_fast(ptr addrspace(1) %arg) {		define amdgpu_kernel void @div_1_by_minus_x_fast(ptr addrspace(1) %arg) {
; GCN-LABEL: div_1_by_minus_x_fast:		; GCN-LABEL: div_1_by_minus_x_fast:
Show All 9 Lines	; GCN-NEXT: s_endpgm
%load = load float, ptr addrspace(1) %arg, align 4		%load = load float, ptr addrspace(1) %arg, align 4
%neg = fneg float %load, !fpmath !0		%neg = fneg float %load, !fpmath !0
%div = fdiv fast float 1.000000e+00, %neg		%div = fdiv fast float 1.000000e+00, %neg
store float %div, ptr addrspace(1) %arg, align 4		store float %div, ptr addrspace(1) %arg, align 4
ret void		ret void
}		}

define amdgpu_kernel void @div_minus_1_by_minus_x_fast(ptr addrspace(1) %arg) {		define amdgpu_kernel void @div_minus_1_by_minus_x_fast(ptr addrspace(1) %arg) {
; GCN-LABEL: div_minus_1_by_minus_x_fast:		; GCN-DENORM-LABEL: div_minus_1_by_minus_x_fast:
; GCN: ; %bb.0:		; GCN-DENORM: ; %bb.0:
; GCN-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24		; GCN-DENORM-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
; GCN-NEXT: v_mov_b32_e32 v1, 0		; GCN-DENORM-NEXT: v_mov_b32_e32 v1, 0
; GCN-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)
; GCN-NEXT: s_load_dword s2, s[0:1], 0x0		; GCN-DENORM-NEXT: s_load_dword s2, s[0:1], 0x0
; GCN-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DENORM-NEXT: s_waitcnt lgkmcnt(0)
; GCN-NEXT: v_rcp_f32_e32 v0, s2		; GCN-DENORM-NEXT: v_rcp_f32_e32 v0, s2
; GCN-NEXT: global_store_dword v1, v0, s[0:1]		; GCN-DENORM-NEXT: global_store_dword v1, v0, s[0:1]
; GCN-NEXT: s_endpgm		; GCN-DENORM-NEXT: s_endpgm
		;
		; GCN-FLUSH-LABEL: div_minus_1_by_minus_x_fast:
		; GCN-FLUSH: ; %bb.0:
		; GCN-FLUSH-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x24
		; GCN-FLUSH-NEXT: v_mov_b32_e32 v1, 0
		; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)
		; GCN-FLUSH-NEXT: s_load_dword s2, s[0:1], 0x0
		; GCN-FLUSH-NEXT: s_waitcnt lgkmcnt(0)
		; GCN-FLUSH-NEXT: v_rcp_f32_e64 v0, -s2
		; GCN-FLUSH-NEXT: v_sub_f32_e32 v0, 0x80000000, v0
		; GCN-FLUSH-NEXT: global_store_dword v1, v0, s[0:1]
		; GCN-FLUSH-NEXT: s_endpgm
%load = load float, ptr addrspace(1) %arg, align 4		%load = load float, ptr addrspace(1) %arg, align 4
%neg = fsub float -0.000000e+00, %load, !fpmath !0		%neg = fsub float -0.000000e+00, %load, !fpmath !0
%div = fdiv fast float -1.000000e+00, %neg		%div = fdiv fast float -1.000000e+00, %neg
store float %div, ptr addrspace(1) %arg, align 4		store float %div, ptr addrspace(1) %arg, align 4
ret void		ret void
}		}

define amdgpu_kernel void @div_1_by_x_correctly_rounded(ptr addrspace(1) %arg) {		define amdgpu_kernel void @div_1_by_x_correctly_rounded(ptr addrspace(1) %arg) {
▲ Show 20 Lines • Show All 202 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/fdiv_flags.f32.ll

Show First 20 Lines • Show All 710 Lines • ▼ Show 20 Lines	; CHECK-NEXT: s_setpc_b64 s[30:31]
%fdiv = fdiv afn float %x, %y, !fpmath !0		%fdiv = fdiv afn float %x, %y, !fpmath !0
ret float %fdiv		ret float %fdiv
}		}

define float @v_recip_f32_ulp25(float %x) {		define float @v_recip_f32_ulp25(float %x) {
; CODEGEN-IEEE-SDAG-LABEL: v_recip_f32_ulp25:		; CODEGEN-IEEE-SDAG-LABEL: v_recip_f32_ulp25:
; CODEGEN-IEEE-SDAG: ; %bb.0:		; CODEGEN-IEEE-SDAG: ; %bb.0:
; CODEGEN-IEEE-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; CODEGEN-IEEE-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; CODEGEN-IEEE-SDAG-NEXT: s_mov_b32 s4, 0x6f800000		; CODEGEN-IEEE-SDAG-NEXT: v_frexp_mant_f32_e32 v1, v0
; CODEGEN-IEEE-SDAG-NEXT: v_mov_b32_e32 v1, 0x2f800000		; CODEGEN-IEEE-SDAG-NEXT: v_rcp_f32_e32 v1, v1
; CODEGEN-IEEE-SDAG-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, s4		; CODEGEN-IEEE-SDAG-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
; CODEGEN-IEEE-SDAG-NEXT: v_cndmask_b32_e32 v1, 1.0, v1, vcc		; CODEGEN-IEEE-SDAG-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
; CODEGEN-IEEE-SDAG-NEXT: v_mul_f32_e32 v0, v0, v1		; CODEGEN-IEEE-SDAG-NEXT: v_ldexp_f32_e32 v0, v1, v0
; CODEGEN-IEEE-SDAG-NEXT: v_rcp_f32_e32 v0, v0
; CODEGEN-IEEE-SDAG-NEXT: v_mul_f32_e32 v0, v1, v0
; CODEGEN-IEEE-SDAG-NEXT: s_setpc_b64 s[30:31]		; CODEGEN-IEEE-SDAG-NEXT: s_setpc_b64 s[30:31]
;		;
; CODEGEN-IEEE-GISEL-LABEL: v_recip_f32_ulp25:		; CODEGEN-IEEE-GISEL-LABEL: v_recip_f32_ulp25:
; CODEGEN-IEEE-GISEL: ; %bb.0:		; CODEGEN-IEEE-GISEL: ; %bb.0:
; CODEGEN-IEEE-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; CODEGEN-IEEE-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; CODEGEN-IEEE-GISEL-NEXT: v_mov_b32_e32 v1, 0x6f800000		; CODEGEN-IEEE-GISEL-NEXT: v_frexp_mant_f32_e32 v1, v0
; CODEGEN-IEEE-GISEL-NEXT: v_mov_b32_e32 v2, 0x2f800000		; CODEGEN-IEEE-GISEL-NEXT: v_rcp_f32_e32 v1, v1
; CODEGEN-IEEE-GISEL-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, v1		; CODEGEN-IEEE-GISEL-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
; CODEGEN-IEEE-GISEL-NEXT: v_cndmask_b32_e32 v1, 1.0, v2, vcc		; CODEGEN-IEEE-GISEL-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
; CODEGEN-IEEE-GISEL-NEXT: v_mul_f32_e32 v0, v0, v1		; CODEGEN-IEEE-GISEL-NEXT: v_ldexp_f32_e32 v0, v1, v0
; CODEGEN-IEEE-GISEL-NEXT: v_rcp_f32_e32 v0, v0
; CODEGEN-IEEE-GISEL-NEXT: v_mul_f32_e32 v0, 1.0, v0
; CODEGEN-IEEE-GISEL-NEXT: v_mul_f32_e32 v0, v1, v0
; CODEGEN-IEEE-GISEL-NEXT: s_setpc_b64 s[30:31]		; CODEGEN-IEEE-GISEL-NEXT: s_setpc_b64 s[30:31]
;		;
; IR-IEEE-LABEL: v_recip_f32_ulp25:		; IR-IEEE-LABEL: v_recip_f32_ulp25:
; IR-IEEE: ; %bb.0:		; IR-IEEE: ; %bb.0:
; IR-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; IR-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; IR-IEEE-NEXT: v_div_scale_f32 v1, s[4:5], v0, v0, 1.0		; IR-IEEE-NEXT: v_div_scale_f32 v1, s[4:5], v0, v0, 1.0
; IR-IEEE-NEXT: v_rcp_f32_e32 v2, v1		; IR-IEEE-NEXT: v_rcp_f32_e32 v2, v1
; IR-IEEE-NEXT: v_div_scale_f32 v3, vcc, 1.0, v0, 1.0		; IR-IEEE-NEXT: v_div_scale_f32 v3, vcc, 1.0, v0, 1.0
▲ Show 20 Lines • Show All 44 Lines • ▼ Show 20 Lines	; CHECK-NEXT: s_setpc_b64 s[30:31]
ret float %fdiv		ret float %fdiv
}		}

define float @v_recip_sqrt_f32_ulp25(float %x) {		define float @v_recip_sqrt_f32_ulp25(float %x) {
; CODEGEN-IEEE-SDAG-LABEL: v_recip_sqrt_f32_ulp25:		; CODEGEN-IEEE-SDAG-LABEL: v_recip_sqrt_f32_ulp25:
; CODEGEN-IEEE-SDAG: ; %bb.0:		; CODEGEN-IEEE-SDAG: ; %bb.0:
; CODEGEN-IEEE-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; CODEGEN-IEEE-SDAG-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; CODEGEN-IEEE-SDAG-NEXT: v_sqrt_f32_e32 v0, v0		; CODEGEN-IEEE-SDAG-NEXT: v_sqrt_f32_e32 v0, v0
; CODEGEN-IEEE-SDAG-NEXT: s_mov_b32 s4, 0x6f800000		; CODEGEN-IEEE-SDAG-NEXT: v_frexp_mant_f32_e32 v1, v0
; CODEGEN-IEEE-SDAG-NEXT: v_mov_b32_e32 v1, 0x2f800000		; CODEGEN-IEEE-SDAG-NEXT: v_rcp_f32_e32 v1, v1
; CODEGEN-IEEE-SDAG-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, s4		; CODEGEN-IEEE-SDAG-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
; CODEGEN-IEEE-SDAG-NEXT: v_cndmask_b32_e32 v1, 1.0, v1, vcc		; CODEGEN-IEEE-SDAG-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
; CODEGEN-IEEE-SDAG-NEXT: v_mul_f32_e32 v0, v0, v1		; CODEGEN-IEEE-SDAG-NEXT: v_ldexp_f32_e32 v0, v1, v0
; CODEGEN-IEEE-SDAG-NEXT: v_rcp_f32_e32 v0, v0
; CODEGEN-IEEE-SDAG-NEXT: v_mul_f32_e32 v0, v1, v0
; CODEGEN-IEEE-SDAG-NEXT: s_setpc_b64 s[30:31]		; CODEGEN-IEEE-SDAG-NEXT: s_setpc_b64 s[30:31]
;		;
; CODEGEN-IEEE-GISEL-LABEL: v_recip_sqrt_f32_ulp25:		; CODEGEN-IEEE-GISEL-LABEL: v_recip_sqrt_f32_ulp25:
; CODEGEN-IEEE-GISEL: ; %bb.0:		; CODEGEN-IEEE-GISEL: ; %bb.0:
; CODEGEN-IEEE-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; CODEGEN-IEEE-GISEL-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; CODEGEN-IEEE-GISEL-NEXT: v_sqrt_f32_e32 v0, v0		; CODEGEN-IEEE-GISEL-NEXT: v_sqrt_f32_e32 v0, v0
; CODEGEN-IEEE-GISEL-NEXT: v_mov_b32_e32 v1, 0x6f800000		; CODEGEN-IEEE-GISEL-NEXT: v_frexp_mant_f32_e32 v1, v0
; CODEGEN-IEEE-GISEL-NEXT: v_mov_b32_e32 v2, 0x2f800000		; CODEGEN-IEEE-GISEL-NEXT: v_rcp_f32_e32 v1, v1
; CODEGEN-IEEE-GISEL-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, v1		; CODEGEN-IEEE-GISEL-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
; CODEGEN-IEEE-GISEL-NEXT: v_cndmask_b32_e32 v1, 1.0, v2, vcc		; CODEGEN-IEEE-GISEL-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
; CODEGEN-IEEE-GISEL-NEXT: v_mul_f32_e32 v0, v0, v1		; CODEGEN-IEEE-GISEL-NEXT: v_ldexp_f32_e32 v0, v1, v0
; CODEGEN-IEEE-GISEL-NEXT: v_rcp_f32_e32 v0, v0
; CODEGEN-IEEE-GISEL-NEXT: v_mul_f32_e32 v0, 1.0, v0
; CODEGEN-IEEE-GISEL-NEXT: v_mul_f32_e32 v0, v1, v0
; CODEGEN-IEEE-GISEL-NEXT: s_setpc_b64 s[30:31]		; CODEGEN-IEEE-GISEL-NEXT: s_setpc_b64 s[30:31]
;		;
; IR-IEEE-LABEL: v_recip_sqrt_f32_ulp25:		; IR-IEEE-LABEL: v_recip_sqrt_f32_ulp25:
; IR-IEEE: ; %bb.0:		; IR-IEEE: ; %bb.0:
; IR-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; IR-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; IR-IEEE-NEXT: v_sqrt_f32_e32 v0, v0		; IR-IEEE-NEXT: v_sqrt_f32_e32 v0, v0
; IR-IEEE-NEXT: v_div_scale_f32 v1, s[4:5], v0, v0, 1.0		; IR-IEEE-NEXT: v_div_scale_f32 v1, s[4:5], v0, v0, 1.0
; IR-IEEE-NEXT: v_rcp_f32_e32 v2, v1		; IR-IEEE-NEXT: v_rcp_f32_e32 v2, v1
▲ Show 20 Lines • Show All 54 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/rcp-pattern.ll

	Show First 20 Lines • Show All 268 Lines • ▼ Show 20 Lines
	; R600: ; %bb.0:			; R600: ; %bb.0:
	; R600-NEXT: CF_END			; R600-NEXT: CF_END
	; R600-NEXT: PAD			; R600-NEXT: PAD
	%rcp = fdiv float -1.0, %x			%rcp = fdiv float -1.0, %x
	ret float %rcp			ret float %rcp
	}			}

	define float @v_rcp_f32_ieee_ulp25(float %x) #3 {			define float @v_rcp_f32_ieee_ulp25(float %x) #3 {
	; GCN-LABEL: v_rcp_f32_ieee_ulp25:			; SI-LABEL: v_rcp_f32_ieee_ulp25:
	; GCN: ; %bb.0:			; SI: ; %bb.0:
	; GCN-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; SI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GCN-NEXT: s_mov_b32 s4, 0x6f800000			; SI-NEXT: s_mov_b32 s4, 0x7f800000
	; GCN-NEXT: v_mov_b32_e32 v1, 0x2f800000			; SI-NEXT: v_frexp_mant_f32_e32 v1, v0
	; GCN-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, s4			; SI-NEXT: v_cmp_lt_f32_e64 vcc, \|v0\|, s4
	; GCN-NEXT: v_cndmask_b32_e32 v1, 1.0, v1, vcc			; SI-NEXT: v_cndmask_b32_e32 v1, v0, v1, vcc
	; GCN-NEXT: v_mul_f32_e32 v0, v0, v1			; SI-NEXT: v_rcp_f32_e32 v1, v1
	; GCN-NEXT: v_rcp_f32_e32 v0, v0			; SI-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
	; GCN-NEXT: v_mul_f32_e32 v0, v1, v0			; SI-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
	; GCN-NEXT: s_setpc_b64 s[30:31]			; SI-NEXT: v_ldexp_f32_e32 v0, v1, v0
				; SI-NEXT: s_setpc_b64 s[30:31]
				;
				; VI-LABEL: v_rcp_f32_ieee_ulp25:
				; VI: ; %bb.0:
				; VI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; VI-NEXT: v_frexp_mant_f32_e32 v1, v0
				; VI-NEXT: v_rcp_f32_e32 v1, v1
				; VI-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
				; VI-NEXT: v_sub_u32_e32 v0, vcc, 0, v0
				; VI-NEXT: v_ldexp_f32 v0, v1, v0
				; VI-NEXT: s_setpc_b64 s[30:31]
	;			;
	; R600-LABEL: v_rcp_f32_ieee_ulp25:			; R600-LABEL: v_rcp_f32_ieee_ulp25:
	; R600: ; %bb.0:			; R600: ; %bb.0:
	; R600-NEXT: CF_END			; R600-NEXT: CF_END
	; R600-NEXT: PAD			; R600-NEXT: PAD
	%rcp = fdiv float 1.0, %x, !fpmath !0			%rcp = fdiv float 1.0, %x, !fpmath !0
	ret float %rcp			ret float %rcp
	}			}

	define float @v_rcp_f32_ieee_ulp25_known_not_denormal(float nofpclass(sub) %x) #3 {			define float @v_rcp_f32_ieee_ulp25_known_not_denormal(float nofpclass(sub) %x) #3 {
	; GCN-LABEL: v_rcp_f32_ieee_ulp25_known_not_denormal:			; SI-LABEL: v_rcp_f32_ieee_ulp25_known_not_denormal:
	; GCN: ; %bb.0:			; SI: ; %bb.0:
	; GCN-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; SI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GCN-NEXT: s_mov_b32 s4, 0x6f800000			; SI-NEXT: s_mov_b32 s4, 0x7f800000
	; GCN-NEXT: v_mov_b32_e32 v1, 0x2f800000			; SI-NEXT: v_frexp_mant_f32_e32 v1, v0
	; GCN-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, s4			; SI-NEXT: v_cmp_lt_f32_e64 vcc, \|v0\|, s4
	; GCN-NEXT: v_cndmask_b32_e32 v1, 1.0, v1, vcc			; SI-NEXT: v_cndmask_b32_e32 v1, v0, v1, vcc
	; GCN-NEXT: v_mul_f32_e32 v0, v0, v1			; SI-NEXT: v_rcp_f32_e32 v1, v1
	; GCN-NEXT: v_rcp_f32_e32 v0, v0			; SI-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
	; GCN-NEXT: v_mul_f32_e32 v0, v1, v0			; SI-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
	; GCN-NEXT: s_setpc_b64 s[30:31]			; SI-NEXT: v_ldexp_f32_e32 v0, v1, v0
				; SI-NEXT: s_setpc_b64 s[30:31]
				;
				; VI-LABEL: v_rcp_f32_ieee_ulp25_known_not_denormal:
				; VI: ; %bb.0:
				; VI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; VI-NEXT: v_frexp_mant_f32_e32 v1, v0
				; VI-NEXT: v_rcp_f32_e32 v1, v1
				; VI-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
				; VI-NEXT: v_sub_u32_e32 v0, vcc, 0, v0
				; VI-NEXT: v_ldexp_f32 v0, v1, v0
				; VI-NEXT: s_setpc_b64 s[30:31]
	;			;
	; R600-LABEL: v_rcp_f32_ieee_ulp25_known_not_denormal:			; R600-LABEL: v_rcp_f32_ieee_ulp25_known_not_denormal:
	; R600: ; %bb.0:			; R600: ; %bb.0:
	; R600-NEXT: CF_END			; R600-NEXT: CF_END
	; R600-NEXT: PAD			; R600-NEXT: PAD
	%rcp = fdiv float 1.0, %x, !fpmath !0			%rcp = fdiv float 1.0, %x, !fpmath !0
	ret float %rcp			ret float %rcp
	}			}

	define float @v_neg_rcp_f32_ieee_ulp25_known_not_denormal(float nofpclass(sub) %x) #3 {			define float @v_neg_rcp_f32_ieee_ulp25_known_not_denormal(float nofpclass(sub) %x) #3 {
	; GCN-LABEL: v_neg_rcp_f32_ieee_ulp25_known_not_denormal:			; SI-LABEL: v_neg_rcp_f32_ieee_ulp25_known_not_denormal:
	; GCN: ; %bb.0:			; SI: ; %bb.0:
	; GCN-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; SI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GCN-NEXT: s_mov_b32 s4, 0x6f800000			; SI-NEXT: s_mov_b32 s4, 0x7f800000
	; GCN-NEXT: v_mov_b32_e32 v1, 0x2f800000			; SI-NEXT: v_frexp_mant_f32_e64 v1, -v0
	; GCN-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, s4			; SI-NEXT: v_cmp_lt_f32_e64 s[4:5], \|v0\|, s4
	; GCN-NEXT: v_cndmask_b32_e32 v1, 1.0, v1, vcc			; SI-NEXT: v_cndmask_b32_e64 v1, -v0, v1, s[4:5]
	; GCN-NEXT: v_mul_f32_e64 v0, v0, -v1			; SI-NEXT: v_rcp_f32_e32 v1, v1
	; GCN-NEXT: v_rcp_f32_e32 v0, v0			; SI-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
	; GCN-NEXT: v_mul_f32_e32 v0, v1, v0			; SI-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
	; GCN-NEXT: s_setpc_b64 s[30:31]			; SI-NEXT: v_ldexp_f32_e32 v0, v1, v0
				; SI-NEXT: s_setpc_b64 s[30:31]
				;
				; VI-LABEL: v_neg_rcp_f32_ieee_ulp25_known_not_denormal:
				; VI: ; %bb.0:
				; VI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; VI-NEXT: v_frexp_mant_f32_e64 v1, -v0
				; VI-NEXT: v_rcp_f32_e32 v1, v1
				; VI-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
				; VI-NEXT: v_sub_u32_e32 v0, vcc, 0, v0
				; VI-NEXT: v_ldexp_f32 v0, v1, v0
				; VI-NEXT: s_setpc_b64 s[30:31]
	;			;
	; R600-LABEL: v_neg_rcp_f32_ieee_ulp25_known_not_denormal:			; R600-LABEL: v_neg_rcp_f32_ieee_ulp25_known_not_denormal:
	; R600: ; %bb.0:			; R600: ; %bb.0:
	; R600-NEXT: CF_END			; R600-NEXT: CF_END
	; R600-NEXT: PAD			; R600-NEXT: PAD
	%rcp = fdiv float -1.0, %x, !fpmath !0			%rcp = fdiv float -1.0, %x, !fpmath !0
	ret float %rcp			ret float %rcp
	}			}

	define float @v_rcp_f32_ieee_ulp25_ninf_nnan(float %x) #3 {			define float @v_rcp_f32_ieee_ulp25_ninf_nnan(float %x) #3 {
	; GCN-LABEL: v_rcp_f32_ieee_ulp25_ninf_nnan:			; SI-LABEL: v_rcp_f32_ieee_ulp25_ninf_nnan:
	; GCN: ; %bb.0:			; SI: ; %bb.0:
	; GCN-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; SI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GCN-NEXT: s_mov_b32 s4, 0x6f800000			; SI-NEXT: s_mov_b32 s4, 0x7f800000
	; GCN-NEXT: v_mov_b32_e32 v1, 0x2f800000			; SI-NEXT: v_frexp_mant_f32_e32 v1, v0
	; GCN-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, s4			; SI-NEXT: v_cmp_lt_f32_e64 vcc, \|v0\|, s4
	; GCN-NEXT: v_cndmask_b32_e32 v1, 1.0, v1, vcc			; SI-NEXT: v_cndmask_b32_e32 v1, v0, v1, vcc
	; GCN-NEXT: v_mul_f32_e32 v0, v0, v1			; SI-NEXT: v_rcp_f32_e32 v1, v1
	; GCN-NEXT: v_rcp_f32_e32 v0, v0			; SI-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
	; GCN-NEXT: v_mul_f32_e32 v0, v1, v0			; SI-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
	; GCN-NEXT: s_setpc_b64 s[30:31]			; SI-NEXT: v_ldexp_f32_e32 v0, v1, v0
				; SI-NEXT: s_setpc_b64 s[30:31]
				;
				; VI-LABEL: v_rcp_f32_ieee_ulp25_ninf_nnan:
				; VI: ; %bb.0:
				; VI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; VI-NEXT: v_frexp_mant_f32_e32 v1, v0
				; VI-NEXT: v_rcp_f32_e32 v1, v1
				; VI-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
				; VI-NEXT: v_sub_u32_e32 v0, vcc, 0, v0
				; VI-NEXT: v_ldexp_f32 v0, v1, v0
				; VI-NEXT: s_setpc_b64 s[30:31]
	;			;
	; R600-LABEL: v_rcp_f32_ieee_ulp25_ninf_nnan:			; R600-LABEL: v_rcp_f32_ieee_ulp25_ninf_nnan:
	; R600: ; %bb.0:			; R600: ; %bb.0:
	; R600-NEXT: CF_END			; R600-NEXT: CF_END
	; R600-NEXT: PAD			; R600-NEXT: PAD
	%rcp = fdiv ninf nnan float 1.0, %x, !fpmath !0			%rcp = fdiv ninf nnan float 1.0, %x, !fpmath !0
	ret float %rcp			ret float %rcp
	}			}
	Show All 9 Lines
	; R600: ; %bb.0:			; R600: ; %bb.0:
	; R600-NEXT: CF_END			; R600-NEXT: CF_END
	; R600-NEXT: PAD			; R600-NEXT: PAD
	%rcp = fdiv float 1.0, %x, !fpmath !0			%rcp = fdiv float 1.0, %x, !fpmath !0
	ret float %rcp			ret float %rcp
	}			}

	define float @v_neg_rcp_f32_ieee_ulp25(float %x) #3 {			define float @v_neg_rcp_f32_ieee_ulp25(float %x) #3 {
	; GCN-LABEL: v_neg_rcp_f32_ieee_ulp25:			; SI-LABEL: v_neg_rcp_f32_ieee_ulp25:
	; GCN: ; %bb.0:			; SI: ; %bb.0:
	; GCN-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; SI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GCN-NEXT: s_mov_b32 s4, 0x6f800000			; SI-NEXT: s_mov_b32 s4, 0x7f800000
	; GCN-NEXT: v_mov_b32_e32 v1, 0x2f800000			; SI-NEXT: v_frexp_mant_f32_e64 v1, -v0
	; GCN-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, s4			; SI-NEXT: v_cmp_lt_f32_e64 s[4:5], \|v0\|, s4
	; GCN-NEXT: v_cndmask_b32_e32 v1, 1.0, v1, vcc			; SI-NEXT: v_cndmask_b32_e64 v1, -v0, v1, s[4:5]
	; GCN-NEXT: v_mul_f32_e64 v0, v0, -v1			; SI-NEXT: v_rcp_f32_e32 v1, v1
	; GCN-NEXT: v_rcp_f32_e32 v0, v0			; SI-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
	; GCN-NEXT: v_mul_f32_e32 v0, v1, v0			; SI-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
	; GCN-NEXT: s_setpc_b64 s[30:31]			; SI-NEXT: v_ldexp_f32_e32 v0, v1, v0
				; SI-NEXT: s_setpc_b64 s[30:31]
				;
				; VI-LABEL: v_neg_rcp_f32_ieee_ulp25:
				; VI: ; %bb.0:
				; VI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; VI-NEXT: v_frexp_mant_f32_e64 v1, -v0
				; VI-NEXT: v_rcp_f32_e32 v1, v1
				; VI-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
				; VI-NEXT: v_sub_u32_e32 v0, vcc, 0, v0
				; VI-NEXT: v_ldexp_f32 v0, v1, v0
				; VI-NEXT: s_setpc_b64 s[30:31]
	;			;
	; R600-LABEL: v_neg_rcp_f32_ieee_ulp25:			; R600-LABEL: v_neg_rcp_f32_ieee_ulp25:
	; R600: ; %bb.0:			; R600: ; %bb.0:
	; R600-NEXT: CF_END			; R600-NEXT: CF_END
	; R600-NEXT: PAD			; R600-NEXT: PAD
	%rcp = fdiv float -1.0, %x, !fpmath !0			%rcp = fdiv float -1.0, %x, !fpmath !0
	ret float %rcp			ret float %rcp
	}			}
	▲ Show 20 Lines • Show All 101 Lines • ▼ Show 20 Lines
	; R600-NEXT: CF_END			; R600-NEXT: CF_END
	; R600-NEXT: PAD			; R600-NEXT: PAD
	%fabs.x = call float @llvm.fabs.f32(float %x)			%fabs.x = call float @llvm.fabs.f32(float %x)
	%rcp = fdiv float 1.0, %fabs.x			%rcp = fdiv float 1.0, %fabs.x
	ret float %rcp			ret float %rcp
	}			}

	define float @v_rcp_fabs_f32_ieee_ulp25(float %x) #3 {			define float @v_rcp_fabs_f32_ieee_ulp25(float %x) #3 {
	; GCN-LABEL: v_rcp_fabs_f32_ieee_ulp25:			; SI-LABEL: v_rcp_fabs_f32_ieee_ulp25:
	; GCN: ; %bb.0:			; SI: ; %bb.0:
	; GCN-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; SI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GCN-NEXT: s_mov_b32 s4, 0x6f800000			; SI-NEXT: s_mov_b32 s4, 0x7f800000
	; GCN-NEXT: v_mov_b32_e32 v1, 0x2f800000			; SI-NEXT: v_frexp_mant_f32_e64 v1, \|v0\|
	; GCN-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, s4			; SI-NEXT: v_cmp_lt_f32_e64 s[4:5], \|v0\|, s4
	; GCN-NEXT: v_cndmask_b32_e32 v1, 1.0, v1, vcc			; SI-NEXT: v_cndmask_b32_e64 v1, \|v0\|, v1, s[4:5]
	; GCN-NEXT: v_mul_f32_e64 v0, \|v0\|, v1			; SI-NEXT: v_rcp_f32_e32 v1, v1
	; GCN-NEXT: v_rcp_f32_e32 v0, v0			; SI-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
	; GCN-NEXT: v_mul_f32_e32 v0, v1, v0			; SI-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
	; GCN-NEXT: s_setpc_b64 s[30:31]			; SI-NEXT: v_ldexp_f32_e32 v0, v1, v0
				; SI-NEXT: s_setpc_b64 s[30:31]
				;
				; VI-LABEL: v_rcp_fabs_f32_ieee_ulp25:
				; VI: ; %bb.0:
				; VI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; VI-NEXT: v_frexp_mant_f32_e64 v1, \|v0\|
				; VI-NEXT: v_rcp_f32_e32 v1, v1
				; VI-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
				; VI-NEXT: v_sub_u32_e32 v0, vcc, 0, v0
				; VI-NEXT: v_ldexp_f32 v0, v1, v0
				; VI-NEXT: s_setpc_b64 s[30:31]
	;			;
	; R600-LABEL: v_rcp_fabs_f32_ieee_ulp25:			; R600-LABEL: v_rcp_fabs_f32_ieee_ulp25:
	; R600: ; %bb.0:			; R600: ; %bb.0:
	; R600-NEXT: CF_END			; R600-NEXT: CF_END
	; R600-NEXT: PAD			; R600-NEXT: PAD
	%fabs.x = call float @llvm.fabs.f32(float %x)			%fabs.x = call float @llvm.fabs.f32(float %x)
	%rcp = fdiv float 1.0, %fabs.x, !fpmath !0			%rcp = fdiv float 1.0, %fabs.x, !fpmath !0
	ret float %rcp			ret float %rcp
	▲ Show 20 Lines • Show All 103 Lines • ▼ Show 20 Lines
	; R600-NEXT: CF_END			; R600-NEXT: CF_END
	; R600-NEXT: PAD			; R600-NEXT: PAD
	%fabs.x = call float @llvm.fabs.f32(float %x)			%fabs.x = call float @llvm.fabs.f32(float %x)
	%rcp = fdiv float -1.0, %fabs.x			%rcp = fdiv float -1.0, %fabs.x
	ret float %rcp			ret float %rcp
	}			}

	define float @v_rcp_neg_fabs_f32_ieee_ulp25(float %x) #3 {			define float @v_rcp_neg_fabs_f32_ieee_ulp25(float %x) #3 {
	; GCN-LABEL: v_rcp_neg_fabs_f32_ieee_ulp25:			; SI-LABEL: v_rcp_neg_fabs_f32_ieee_ulp25:
	; GCN: ; %bb.0:			; SI: ; %bb.0:
	; GCN-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)			; SI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
	; GCN-NEXT: s_mov_b32 s4, 0x6f800000			; SI-NEXT: s_mov_b32 s4, 0x7f800000
	; GCN-NEXT: v_mov_b32_e32 v1, 0x2f800000			; SI-NEXT: v_frexp_mant_f32_e64 v1, -\|v0\|
	; GCN-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, s4			; SI-NEXT: v_cmp_lt_f32_e64 s[4:5], \|v0\|, s4
	; GCN-NEXT: v_cndmask_b32_e32 v1, 1.0, v1, vcc			; SI-NEXT: v_cndmask_b32_e64 v1, -\|v0\|, v1, s[4:5]
	; GCN-NEXT: v_mul_f32_e64 v0, \|v0\|, -v1			; SI-NEXT: v_rcp_f32_e32 v1, v1
	; GCN-NEXT: v_rcp_f32_e32 v0, v0			; SI-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
	; GCN-NEXT: v_mul_f32_e32 v0, v1, v0			; SI-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
	; GCN-NEXT: s_setpc_b64 s[30:31]			; SI-NEXT: v_ldexp_f32_e32 v0, v1, v0
				; SI-NEXT: s_setpc_b64 s[30:31]
				;
				; VI-LABEL: v_rcp_neg_fabs_f32_ieee_ulp25:
				; VI: ; %bb.0:
				; VI-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
				; VI-NEXT: v_frexp_mant_f32_e64 v1, -\|v0\|
				; VI-NEXT: v_rcp_f32_e32 v1, v1
				; VI-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
				; VI-NEXT: v_sub_u32_e32 v0, vcc, 0, v0
				; VI-NEXT: v_ldexp_f32 v0, v1, v0
				; VI-NEXT: s_setpc_b64 s[30:31]
	;			;
	; R600-LABEL: v_rcp_neg_fabs_f32_ieee_ulp25:			; R600-LABEL: v_rcp_neg_fabs_f32_ieee_ulp25:
	; R600: ; %bb.0:			; R600: ; %bb.0:
	; R600-NEXT: CF_END			; R600-NEXT: CF_END
	; R600-NEXT: PAD			; R600-NEXT: PAD
	%fabs.x = call float @llvm.fabs.f32(float %x)			%fabs.x = call float @llvm.fabs.f32(float %x)
	%rcp = fdiv float -1.0, %fabs.x, !fpmath !0			%rcp = fdiv float -1.0, %fabs.x, !fpmath !0
	ret float %rcp			ret float %rcp
	▲ Show 20 Lines • Show All 691 Lines • Show Last 20 Lines

llvm/test/CodeGen/AMDGPU/rsq.f32.ll

Show First 20 Lines • Show All 48 Lines • ▼ Show 20 Lines
; GCN-IEEE-UNSAFE-NEXT: buffer_load_dword v0, off, s[8:11], 0		; GCN-IEEE-UNSAFE-NEXT: buffer_load_dword v0, off, s[8:11], 0
; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s4, s0		; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s4, s0
; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s5, s1		; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s5, s1
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-IEEE-UNSAFE-NEXT: buffer_store_dword v0, off, s[4:7], 0		; GCN-IEEE-UNSAFE-NEXT: buffer_store_dword v0, off, s[4:7], 0
; GCN-IEEE-UNSAFE-NEXT: s_endpgm		; GCN-IEEE-UNSAFE-NEXT: s_endpgm
;		;
; GCN-IEEE-SAFE-LABEL: rsq_f32:		; SI-IEEE-SAFE-LABEL: rsq_f32:
; GCN-IEEE-SAFE: ; %bb.0:		; SI-IEEE-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9		; SI-IEEE-SAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s7, 0xf000		; SI-IEEE-SAFE-NEXT: s_mov_b32 s7, 0xf000
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s6, -1		; SI-IEEE-SAFE-NEXT: s_mov_b32 s6, -1
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s10, s6		; SI-IEEE-SAFE-NEXT: s_mov_b32 s10, s6
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s11, s7		; SI-IEEE-SAFE-NEXT: s_mov_b32 s11, s7
; GCN-IEEE-SAFE-NEXT: s_waitcnt lgkmcnt(0)		; SI-IEEE-SAFE-NEXT: s_waitcnt lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s8, s2		; SI-IEEE-SAFE-NEXT: s_mov_b32 s8, s2
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s9, s3		; SI-IEEE-SAFE-NEXT: s_mov_b32 s9, s3
; GCN-IEEE-SAFE-NEXT: buffer_load_dword v0, off, s[8:11], 0		; SI-IEEE-SAFE-NEXT: buffer_load_dword v0, off, s[8:11], 0
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s2, 0x6f800000		; SI-IEEE-SAFE-NEXT: s_mov_b32 s2, 0x7f800000
; GCN-IEEE-SAFE-NEXT: v_mov_b32_e32 v1, 0x2f800000		; SI-IEEE-SAFE-NEXT: s_mov_b32 s4, s0
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s4, s0		; SI-IEEE-SAFE-NEXT: s_mov_b32 s5, s1
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s5, s1		; SI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0)
; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0)		; SI-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0		; SI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e32 v1, v0
; GCN-IEEE-SAFE-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, s2		; SI-IEEE-SAFE-NEXT: v_cmp_lt_f32_e64 vcc, \|v0\|, s2
; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v1, 1.0, v1, vcc		; SI-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v1, v0, v1, vcc
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v0, v1		; SI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v1, v1
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v0, v0		; SI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v1, v0		; SI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
; GCN-IEEE-SAFE-NEXT: buffer_store_dword v0, off, s[4:7], 0		; SI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v1, v0
; GCN-IEEE-SAFE-NEXT: s_endpgm		; SI-IEEE-SAFE-NEXT: buffer_store_dword v0, off, s[4:7], 0
		; SI-IEEE-SAFE-NEXT: s_endpgm
		;
		; CI-IEEE-SAFE-LABEL: rsq_f32:
		; CI-IEEE-SAFE: ; %bb.0:
		; CI-IEEE-SAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s7, 0xf000
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s6, -1
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s10, s6
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s11, s7
		; CI-IEEE-SAFE-NEXT: s_waitcnt lgkmcnt(0)
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s8, s2
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s9, s3
		; CI-IEEE-SAFE-NEXT: buffer_load_dword v0, off, s[8:11], 0
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s4, s0
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s5, s1
		; CI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0)
		; CI-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0
		; CI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e32 v1, v0
		; CI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v1, v1
		; CI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; CI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; CI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v1, v0
		; CI-IEEE-SAFE-NEXT: buffer_store_dword v0, off, s[4:7], 0
		; CI-IEEE-SAFE-NEXT: s_endpgm
; GCN-UNSAFE-LABEL: rsq_f32:		; GCN-UNSAFE-LABEL: rsq_f32:
; GCN-UNSAFE: ; %bb.0:		; GCN-UNSAFE: ; %bb.0:
; GCN-UNSAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9		; GCN-UNSAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9
; GCN-UNSAFE-NEXT: s_mov_b32 s7, 0xf000		; GCN-UNSAFE-NEXT: s_mov_b32 s7, 0xf000
; GCN-UNSAFE-NEXT: s_mov_b32 s6, -1		; GCN-UNSAFE-NEXT: s_mov_b32 s6, -1
; GCN-UNSAFE-NEXT: s_mov_b32 s10, s6		; GCN-UNSAFE-NEXT: s_mov_b32 s10, s6
; GCN-UNSAFE-NEXT: s_mov_b32 s11, s7		; GCN-UNSAFE-NEXT: s_mov_b32 s11, s7
; GCN-UNSAFE-NEXT: s_waitcnt lgkmcnt(0)		; GCN-UNSAFE-NEXT: s_waitcnt lgkmcnt(0)
Show All 31 Lines
; GCN-IEEE-UNSAFE-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9		; GCN-IEEE-UNSAFE-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9
; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s3, 0xf000		; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s3, 0xf000
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt lgkmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt lgkmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, s2		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, s2
; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s2, -1		; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s2, -1
; GCN-IEEE-UNSAFE-NEXT: buffer_store_dword v0, off, s[0:3], 0		; GCN-IEEE-UNSAFE-NEXT: buffer_store_dword v0, off, s[0:3], 0
; GCN-IEEE-UNSAFE-NEXT: s_endpgm		; GCN-IEEE-UNSAFE-NEXT: s_endpgm
;		;
; GCN-IEEE-SAFE-LABEL: rsq_f32_sgpr:		; SI-IEEE-SAFE-LABEL: rsq_f32_sgpr:
; GCN-IEEE-SAFE: ; %bb.0:		; SI-IEEE-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: s_load_dword s2, s[0:1], 0xb		; SI-IEEE-SAFE-NEXT: s_load_dword s2, s[0:1], 0xb
; GCN-IEEE-SAFE-NEXT: v_mov_b32_e32 v1, 0x2f800000		; SI-IEEE-SAFE-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9
; GCN-IEEE-SAFE-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9		; SI-IEEE-SAFE-NEXT: s_mov_b32 s4, 0x7f800000
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s3, 0xf000		; SI-IEEE-SAFE-NEXT: s_mov_b32 s3, 0xf000
; GCN-IEEE-SAFE-NEXT: s_waitcnt lgkmcnt(0)		; SI-IEEE-SAFE-NEXT: s_waitcnt lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, s2		; SI-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, s2
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s2, 0x6f800000		; SI-IEEE-SAFE-NEXT: s_mov_b32 s2, -1
; GCN-IEEE-SAFE-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, s2		; SI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e32 v1, v0
; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v1, 1.0, v1, vcc		; SI-IEEE-SAFE-NEXT: v_cmp_lt_f32_e64 vcc, \|v0\|, s4
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v0, v1		; SI-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v1, v0, v1, vcc
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v0, v0		; SI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v1, v1
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s2, -1		; SI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v1, v0		; SI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
; GCN-IEEE-SAFE-NEXT: buffer_store_dword v0, off, s[0:3], 0		; SI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v1, v0
; GCN-IEEE-SAFE-NEXT: s_endpgm		; SI-IEEE-SAFE-NEXT: buffer_store_dword v0, off, s[0:3], 0
		; SI-IEEE-SAFE-NEXT: s_endpgm
		;
		; CI-IEEE-SAFE-LABEL: rsq_f32_sgpr:
		; CI-IEEE-SAFE: ; %bb.0:
		; CI-IEEE-SAFE-NEXT: s_load_dword s2, s[0:1], 0xb
		; CI-IEEE-SAFE-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s3, 0xf000
		; CI-IEEE-SAFE-NEXT: s_waitcnt lgkmcnt(0)
		; CI-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, s2
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s2, -1
		; CI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e32 v1, v0
		; CI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v1, v1
		; CI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; CI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; CI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v1, v0
		; CI-IEEE-SAFE-NEXT: buffer_store_dword v0, off, s[0:3], 0
		; CI-IEEE-SAFE-NEXT: s_endpgm
; GCN-UNSAFE-LABEL: rsq_f32_sgpr:		; GCN-UNSAFE-LABEL: rsq_f32_sgpr:
; GCN-UNSAFE: ; %bb.0:		; GCN-UNSAFE: ; %bb.0:
; GCN-UNSAFE-NEXT: s_load_dword s2, s[0:1], 0xb		; GCN-UNSAFE-NEXT: s_load_dword s2, s[0:1], 0xb
; GCN-UNSAFE-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9		; GCN-UNSAFE-NEXT: s_load_dwordx2 s[0:1], s[0:1], 0x9
; GCN-UNSAFE-NEXT: s_mov_b32 s3, 0xf000		; GCN-UNSAFE-NEXT: s_mov_b32 s3, 0xf000
; GCN-UNSAFE-NEXT: s_waitcnt lgkmcnt(0)		; GCN-UNSAFE-NEXT: s_waitcnt lgkmcnt(0)
; GCN-UNSAFE-NEXT: v_rsq_f32_e32 v0, s2		; GCN-UNSAFE-NEXT: v_rsq_f32_e32 v0, s2
; GCN-UNSAFE-NEXT: s_mov_b32 s2, -1		; GCN-UNSAFE-NEXT: s_mov_b32 s2, -1
▲ Show 20 Lines • Show All 45 Lines • ▼ Show 20 Lines
; GCN-DAZ-UNSAFE-NEXT: s_mov_b64 s[10:11], s[6:7]		; GCN-DAZ-UNSAFE-NEXT: s_mov_b64 s[10:11], s[6:7]
; GCN-DAZ-UNSAFE-NEXT: buffer_load_dword v2, v[0:1], s[8:11], 0 addr64 glc		; GCN-DAZ-UNSAFE-NEXT: buffer_load_dword v2, v[0:1], s[8:11], 0 addr64 glc
; GCN-DAZ-UNSAFE-NEXT: s_waitcnt vmcnt(0)		; GCN-DAZ-UNSAFE-NEXT: s_waitcnt vmcnt(0)
; GCN-DAZ-UNSAFE-NEXT: buffer_load_dword v3, v[0:1], s[8:11], 0 addr64 offset:4 glc		; GCN-DAZ-UNSAFE-NEXT: buffer_load_dword v3, v[0:1], s[8:11], 0 addr64 offset:4 glc
; GCN-DAZ-UNSAFE-NEXT: s_waitcnt vmcnt(0)		; GCN-DAZ-UNSAFE-NEXT: s_waitcnt vmcnt(0)
; GCN-DAZ-UNSAFE-NEXT: buffer_load_dword v4, v[0:1], s[8:11], 0 addr64 offset:8 glc		; GCN-DAZ-UNSAFE-NEXT: buffer_load_dword v4, v[0:1], s[8:11], 0 addr64 offset:8 glc
; GCN-DAZ-UNSAFE-NEXT: s_waitcnt vmcnt(0)		; GCN-DAZ-UNSAFE-NEXT: s_waitcnt vmcnt(0)
; GCN-DAZ-UNSAFE-NEXT: s_mov_b64 s[4:5], s[0:1]		; GCN-DAZ-UNSAFE-NEXT: s_mov_b64 s[4:5], s[0:1]
; GCN-DAZ-UNSAFE-NEXT: v_sqrt_f32_e32 v2, v2		; GCN-DAZ-UNSAFE-NEXT: v_rsq_f32_e32 v2, v2
		; GCN-DAZ-UNSAFE-NEXT: v_rcp_f32_e32 v3, v3
; GCN-DAZ-UNSAFE-NEXT: v_mul_f32_e32 v2, v2, v3		; GCN-DAZ-UNSAFE-NEXT: v_mul_f32_e32 v2, v2, v3
; GCN-DAZ-UNSAFE-NEXT: v_rcp_f32_e32 v2, v2
; GCN-DAZ-UNSAFE-NEXT: v_mul_f32_e32 v2, v4, v2		; GCN-DAZ-UNSAFE-NEXT: v_mul_f32_e32 v2, v4, v2
; GCN-DAZ-UNSAFE-NEXT: buffer_store_dword v2, v[0:1], s[4:7], 0 addr64		; GCN-DAZ-UNSAFE-NEXT: buffer_store_dword v2, v[0:1], s[4:7], 0 addr64
; GCN-DAZ-UNSAFE-NEXT: s_endpgm		; GCN-DAZ-UNSAFE-NEXT: s_endpgm
;		;
; GCN-IEEE-UNSAFE-LABEL: rsqrt_fmul:		; GCN-IEEE-UNSAFE-LABEL: rsqrt_fmul:
; GCN-IEEE-UNSAFE: ; %bb.0:		; GCN-IEEE-UNSAFE: ; %bb.0:
; GCN-IEEE-UNSAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9		; GCN-IEEE-UNSAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9
; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s7, 0xf000		; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s7, 0xf000
; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s6, 0		; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s6, 0
; GCN-IEEE-UNSAFE-NEXT: v_lshlrev_b32_e32 v0, 2, v0		; GCN-IEEE-UNSAFE-NEXT: v_lshlrev_b32_e32 v0, 2, v0
; GCN-IEEE-UNSAFE-NEXT: v_mov_b32_e32 v1, 0		; GCN-IEEE-UNSAFE-NEXT: v_mov_b32_e32 v1, 0
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt lgkmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt lgkmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: s_mov_b64 s[8:9], s[2:3]		; GCN-IEEE-UNSAFE-NEXT: s_mov_b64 s[8:9], s[2:3]
; GCN-IEEE-UNSAFE-NEXT: s_mov_b64 s[10:11], s[6:7]		; GCN-IEEE-UNSAFE-NEXT: s_mov_b64 s[10:11], s[6:7]
; GCN-IEEE-UNSAFE-NEXT: buffer_load_dword v2, v[0:1], s[8:11], 0 addr64 glc		; GCN-IEEE-UNSAFE-NEXT: buffer_load_dword v2, v[0:1], s[8:11], 0 addr64 glc
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: buffer_load_dword v3, v[0:1], s[8:11], 0 addr64 offset:4 glc		; GCN-IEEE-UNSAFE-NEXT: buffer_load_dword v3, v[0:1], s[8:11], 0 addr64 offset:4 glc
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: buffer_load_dword v4, v[0:1], s[8:11], 0 addr64 offset:8 glc		; GCN-IEEE-UNSAFE-NEXT: buffer_load_dword v4, v[0:1], s[8:11], 0 addr64 offset:8 glc
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: s_mov_b64 s[4:5], s[0:1]		; GCN-IEEE-UNSAFE-NEXT: s_mov_b64 s[4:5], s[0:1]
; GCN-IEEE-UNSAFE-NEXT: v_sqrt_f32_e32 v2, v2		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v2, v2
		; GCN-IEEE-UNSAFE-NEXT: v_rcp_f32_e32 v3, v3
; GCN-IEEE-UNSAFE-NEXT: v_mul_f32_e32 v2, v2, v3		; GCN-IEEE-UNSAFE-NEXT: v_mul_f32_e32 v2, v2, v3
; GCN-IEEE-UNSAFE-NEXT: v_rcp_f32_e32 v2, v2
; GCN-IEEE-UNSAFE-NEXT: v_mul_f32_e32 v2, v4, v2		; GCN-IEEE-UNSAFE-NEXT: v_mul_f32_e32 v2, v4, v2
; GCN-IEEE-UNSAFE-NEXT: buffer_store_dword v2, v[0:1], s[4:7], 0 addr64		; GCN-IEEE-UNSAFE-NEXT: buffer_store_dword v2, v[0:1], s[4:7], 0 addr64
; GCN-IEEE-UNSAFE-NEXT: s_endpgm		; GCN-IEEE-UNSAFE-NEXT: s_endpgm
;		;
; GCN-DAZ-SAFE-LABEL: rsqrt_fmul:		; GCN-DAZ-SAFE-LABEL: rsqrt_fmul:
; GCN-DAZ-SAFE: ; %bb.0:		; GCN-DAZ-SAFE: ; %bb.0:
; GCN-DAZ-SAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9		; GCN-DAZ-SAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9
; GCN-DAZ-SAFE-NEXT: s_mov_b32 s7, 0xf000		; GCN-DAZ-SAFE-NEXT: s_mov_b32 s7, 0xf000
▲ Show 20 Lines • Show All 73 Lines • ▼ Show 20 Lines	; GCN-IEEE-SAFE-NEXT: s_endpgm
%x = call contract float @llvm.sqrt.f32(float %a)		%x = call contract float @llvm.sqrt.f32(float %a)
%y = fmul contract float %x, %b		%y = fmul contract float %x, %b
%z = fdiv contract float %c, %y		%z = fdiv contract float %c, %y
store float %z, ptr addrspace(1) %out.gep		store float %z, ptr addrspace(1) %out.gep
ret void		ret void
}		}

define amdgpu_kernel void @neg_rsq_f32(ptr addrspace(1) noalias %out, ptr addrspace(1) noalias %in) {		define amdgpu_kernel void @neg_rsq_f32(ptr addrspace(1) noalias %out, ptr addrspace(1) noalias %in) {
; GCN-DAZ-LABEL: neg_rsq_f32:		; GCN-DAZ-UNSAFE-LABEL: neg_rsq_f32:
; GCN-DAZ: ; %bb.0:		; GCN-DAZ-UNSAFE: ; %bb.0:
; GCN-DAZ-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9		; GCN-DAZ-UNSAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9
; GCN-DAZ-NEXT: s_mov_b32 s7, 0xf000		; GCN-DAZ-UNSAFE-NEXT: s_mov_b32 s7, 0xf000
; GCN-DAZ-NEXT: s_mov_b32 s6, -1		; GCN-DAZ-UNSAFE-NEXT: s_mov_b32 s6, -1
; GCN-DAZ-NEXT: s_mov_b32 s10, s6		; GCN-DAZ-UNSAFE-NEXT: s_mov_b32 s10, s6
; GCN-DAZ-NEXT: s_mov_b32 s11, s7		; GCN-DAZ-UNSAFE-NEXT: s_mov_b32 s11, s7
; GCN-DAZ-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DAZ-UNSAFE-NEXT: s_waitcnt lgkmcnt(0)
; GCN-DAZ-NEXT: s_mov_b32 s8, s2		; GCN-DAZ-UNSAFE-NEXT: s_mov_b32 s8, s2
; GCN-DAZ-NEXT: s_mov_b32 s9, s3		; GCN-DAZ-UNSAFE-NEXT: s_mov_b32 s9, s3
; GCN-DAZ-NEXT: buffer_load_dword v0, off, s[8:11], 0		; GCN-DAZ-UNSAFE-NEXT: buffer_load_dword v0, off, s[8:11], 0
; GCN-DAZ-NEXT: s_mov_b32 s4, s0		; GCN-DAZ-UNSAFE-NEXT: s_mov_b32 s4, s0
; GCN-DAZ-NEXT: s_mov_b32 s5, s1		; GCN-DAZ-UNSAFE-NEXT: s_mov_b32 s5, s1
; GCN-DAZ-NEXT: s_waitcnt vmcnt(0)		; GCN-DAZ-UNSAFE-NEXT: s_waitcnt vmcnt(0)
; GCN-DAZ-NEXT: v_sqrt_f32_e32 v0, v0		; GCN-DAZ-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-DAZ-NEXT: v_rcp_f32_e64 v0, -v0		; GCN-DAZ-UNSAFE-NEXT: v_sub_f32_e32 v0, 0x80000000, v0
; GCN-DAZ-NEXT: buffer_store_dword v0, off, s[4:7], 0		; GCN-DAZ-UNSAFE-NEXT: buffer_store_dword v0, off, s[4:7], 0
; GCN-DAZ-NEXT: s_endpgm		; GCN-DAZ-UNSAFE-NEXT: s_endpgm
;		;
; GCN-IEEE-UNSAFE-LABEL: neg_rsq_f32:		; GCN-IEEE-UNSAFE-LABEL: neg_rsq_f32:
; GCN-IEEE-UNSAFE: ; %bb.0:		; GCN-IEEE-UNSAFE: ; %bb.0:
; GCN-IEEE-UNSAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9		; GCN-IEEE-UNSAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9
; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s7, 0xf000		; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s7, 0xf000
; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s6, -1		; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s6, -1
; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s10, s6		; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s10, s6
; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s11, s7		; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s11, s7
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt lgkmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt lgkmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s8, s2		; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s8, s2
; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s9, s3		; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s9, s3
; GCN-IEEE-UNSAFE-NEXT: buffer_load_dword v0, off, s[8:11], 0		; GCN-IEEE-UNSAFE-NEXT: buffer_load_dword v0, off, s[8:11], 0
; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s4, s0		; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s4, s0
; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s5, s1		; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s5, s1
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: v_sqrt_f32_e32 v0, v0		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-IEEE-UNSAFE-NEXT: v_rcp_f32_e64 v0, -v0		; GCN-IEEE-UNSAFE-NEXT: v_xor_b32_e32 v0, 0x80000000, v0
; GCN-IEEE-UNSAFE-NEXT: buffer_store_dword v0, off, s[4:7], 0		; GCN-IEEE-UNSAFE-NEXT: buffer_store_dword v0, off, s[4:7], 0
; GCN-IEEE-UNSAFE-NEXT: s_endpgm		; GCN-IEEE-UNSAFE-NEXT: s_endpgm
;		;
; GCN-IEEE-SAFE-LABEL: neg_rsq_f32:		; GCN-DAZ-SAFE-LABEL: neg_rsq_f32:
; GCN-IEEE-SAFE: ; %bb.0:		; GCN-DAZ-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9		; GCN-DAZ-SAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s7, 0xf000		; GCN-DAZ-SAFE-NEXT: s_mov_b32 s7, 0xf000
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s6, -1		; GCN-DAZ-SAFE-NEXT: s_mov_b32 s6, -1
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s10, s6		; GCN-DAZ-SAFE-NEXT: s_mov_b32 s10, s6
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s11, s7		; GCN-DAZ-SAFE-NEXT: s_mov_b32 s11, s7
; GCN-IEEE-SAFE-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DAZ-SAFE-NEXT: s_waitcnt lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s8, s2		; GCN-DAZ-SAFE-NEXT: s_mov_b32 s8, s2
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s9, s3		; GCN-DAZ-SAFE-NEXT: s_mov_b32 s9, s3
; GCN-IEEE-SAFE-NEXT: buffer_load_dword v0, off, s[8:11], 0		; GCN-DAZ-SAFE-NEXT: buffer_load_dword v0, off, s[8:11], 0
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s2, 0x6f800000		; GCN-DAZ-SAFE-NEXT: s_mov_b32 s4, s0
; GCN-IEEE-SAFE-NEXT: v_mov_b32_e32 v1, 0x2f800000		; GCN-DAZ-SAFE-NEXT: s_mov_b32 s5, s1
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s4, s0		; GCN-DAZ-SAFE-NEXT: s_waitcnt vmcnt(0)
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s5, s1		; GCN-DAZ-SAFE-NEXT: v_sqrt_f32_e32 v0, v0
; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0)		; GCN-DAZ-SAFE-NEXT: v_rcp_f32_e64 v0, -v0
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0		; GCN-DAZ-SAFE-NEXT: buffer_store_dword v0, off, s[4:7], 0
; GCN-IEEE-SAFE-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, s2		; GCN-DAZ-SAFE-NEXT: s_endpgm
; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v1, 1.0, v1, vcc		;
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e64 v0, v0, -v1		; SI-IEEE-SAFE-LABEL: neg_rsq_f32:
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v0, v0		; SI-IEEE-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v1, v0		; SI-IEEE-SAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9
; GCN-IEEE-SAFE-NEXT: buffer_store_dword v0, off, s[4:7], 0		; SI-IEEE-SAFE-NEXT: s_mov_b32 s7, 0xf000
; GCN-IEEE-SAFE-NEXT: s_endpgm		; SI-IEEE-SAFE-NEXT: s_mov_b32 s6, -1
		; SI-IEEE-SAFE-NEXT: s_mov_b32 s10, s6
		; SI-IEEE-SAFE-NEXT: s_mov_b32 s11, s7
		; SI-IEEE-SAFE-NEXT: s_waitcnt lgkmcnt(0)
		; SI-IEEE-SAFE-NEXT: s_mov_b32 s8, s2
		; SI-IEEE-SAFE-NEXT: s_mov_b32 s9, s3
		; SI-IEEE-SAFE-NEXT: buffer_load_dword v0, off, s[8:11], 0
		; SI-IEEE-SAFE-NEXT: s_mov_b32 s2, 0x7f800000
		; SI-IEEE-SAFE-NEXT: s_mov_b32 s4, s0
		; SI-IEEE-SAFE-NEXT: s_mov_b32 s5, s1
		; SI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0)
		; SI-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0
		; SI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v1, -v0
		; SI-IEEE-SAFE-NEXT: v_cmp_lt_f32_e64 s[0:1], \|v0\|, s2
		; SI-IEEE-SAFE-NEXT: v_cndmask_b32_e64 v1, -v0, v1, s[0:1]
		; SI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v1, v1
		; SI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; SI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; SI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v1, v0
		; SI-IEEE-SAFE-NEXT: buffer_store_dword v0, off, s[4:7], 0
		; SI-IEEE-SAFE-NEXT: s_endpgm
		;
		; CI-IEEE-SAFE-LABEL: neg_rsq_f32:
		; CI-IEEE-SAFE: ; %bb.0:
		; CI-IEEE-SAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s7, 0xf000
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s6, -1
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s10, s6
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s11, s7
		; CI-IEEE-SAFE-NEXT: s_waitcnt lgkmcnt(0)
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s8, s2
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s9, s3
		; CI-IEEE-SAFE-NEXT: buffer_load_dword v0, off, s[8:11], 0
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s4, s0
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s5, s1
		; CI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0)
		; CI-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0
		; CI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v1, -v0
		; CI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v1, v1
		; CI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; CI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; CI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v1, v0
		; CI-IEEE-SAFE-NEXT: buffer_store_dword v0, off, s[4:7], 0
		; CI-IEEE-SAFE-NEXT: s_endpgm
; GCN-UNSAFE-LABEL: neg_rsq_f32:		; GCN-UNSAFE-LABEL: neg_rsq_f32:
; GCN-UNSAFE: ; %bb.0:		; GCN-UNSAFE: ; %bb.0:
; GCN-UNSAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9		; GCN-UNSAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9
; GCN-UNSAFE-NEXT: s_mov_b32 s7, 0xf000		; GCN-UNSAFE-NEXT: s_mov_b32 s7, 0xf000
; GCN-UNSAFE-NEXT: s_mov_b32 s6, -1		; GCN-UNSAFE-NEXT: s_mov_b32 s6, -1
; GCN-UNSAFE-NEXT: s_mov_b32 s10, s6		; GCN-UNSAFE-NEXT: s_mov_b32 s10, s6
; GCN-UNSAFE-NEXT: s_mov_b32 s11, s7		; GCN-UNSAFE-NEXT: s_mov_b32 s11, s7
; GCN-UNSAFE-NEXT: s_waitcnt lgkmcnt(0)		; GCN-UNSAFE-NEXT: s_waitcnt lgkmcnt(0)
Show All 10 Lines	; GCN-UNSAFE-NEXT: s_endpgm
%val = load float, ptr addrspace(1) %in, align 4		%val = load float, ptr addrspace(1) %in, align 4
%sqrt = call contract float @llvm.sqrt.f32(float %val)		%sqrt = call contract float @llvm.sqrt.f32(float %val)
%div = fdiv contract float -1.0, %sqrt, !fpmath !0		%div = fdiv contract float -1.0, %sqrt, !fpmath !0
store float %div, ptr addrspace(1) %out, align 4		store float %div, ptr addrspace(1) %out, align 4
ret void		ret void
}		}

define amdgpu_kernel void @neg_rsq_neg_f32(ptr addrspace(1) noalias %out, ptr addrspace(1) noalias %in) {		define amdgpu_kernel void @neg_rsq_neg_f32(ptr addrspace(1) noalias %out, ptr addrspace(1) noalias %in) {
; GCN-DAZ-LABEL: neg_rsq_neg_f32:		; GCN-DAZ-UNSAFE-LABEL: neg_rsq_neg_f32:
; GCN-DAZ: ; %bb.0:		; GCN-DAZ-UNSAFE: ; %bb.0:
; GCN-DAZ-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9		; GCN-DAZ-UNSAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9
; GCN-DAZ-NEXT: s_mov_b32 s7, 0xf000		; GCN-DAZ-UNSAFE-NEXT: s_mov_b32 s7, 0xf000
; GCN-DAZ-NEXT: s_mov_b32 s6, -1		; GCN-DAZ-UNSAFE-NEXT: s_mov_b32 s6, -1
; GCN-DAZ-NEXT: s_mov_b32 s10, s6		; GCN-DAZ-UNSAFE-NEXT: s_mov_b32 s10, s6
; GCN-DAZ-NEXT: s_mov_b32 s11, s7		; GCN-DAZ-UNSAFE-NEXT: s_mov_b32 s11, s7
; GCN-DAZ-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DAZ-UNSAFE-NEXT: s_waitcnt lgkmcnt(0)
; GCN-DAZ-NEXT: s_mov_b32 s8, s2		; GCN-DAZ-UNSAFE-NEXT: s_mov_b32 s8, s2
; GCN-DAZ-NEXT: s_mov_b32 s9, s3		; GCN-DAZ-UNSAFE-NEXT: s_mov_b32 s9, s3
; GCN-DAZ-NEXT: buffer_load_dword v0, off, s[8:11], 0		; GCN-DAZ-UNSAFE-NEXT: buffer_load_dword v0, off, s[8:11], 0
; GCN-DAZ-NEXT: s_mov_b32 s4, s0		; GCN-DAZ-UNSAFE-NEXT: s_mov_b32 s4, s0
; GCN-DAZ-NEXT: s_mov_b32 s5, s1		; GCN-DAZ-UNSAFE-NEXT: s_mov_b32 s5, s1
; GCN-DAZ-NEXT: s_waitcnt vmcnt(0)		; GCN-DAZ-UNSAFE-NEXT: s_waitcnt vmcnt(0)
; GCN-DAZ-NEXT: v_sqrt_f32_e64 v0, -v0		; GCN-DAZ-UNSAFE-NEXT: v_rsq_f32_e64 v0, -v0
; GCN-DAZ-NEXT: v_rcp_f32_e64 v0, -v0		; GCN-DAZ-UNSAFE-NEXT: v_sub_f32_e32 v0, 0x80000000, v0
; GCN-DAZ-NEXT: buffer_store_dword v0, off, s[4:7], 0		; GCN-DAZ-UNSAFE-NEXT: buffer_store_dword v0, off, s[4:7], 0
; GCN-DAZ-NEXT: s_endpgm		; GCN-DAZ-UNSAFE-NEXT: s_endpgm
;		;
; GCN-IEEE-UNSAFE-LABEL: neg_rsq_neg_f32:		; GCN-IEEE-UNSAFE-LABEL: neg_rsq_neg_f32:
; GCN-IEEE-UNSAFE: ; %bb.0:		; GCN-IEEE-UNSAFE: ; %bb.0:
; GCN-IEEE-UNSAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9		; GCN-IEEE-UNSAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9
; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s7, 0xf000		; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s7, 0xf000
; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s6, -1		; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s6, -1
; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s10, s6		; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s10, s6
; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s11, s7		; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s11, s7
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt lgkmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt lgkmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s8, s2		; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s8, s2
; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s9, s3		; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s9, s3
; GCN-IEEE-UNSAFE-NEXT: buffer_load_dword v0, off, s[8:11], 0		; GCN-IEEE-UNSAFE-NEXT: buffer_load_dword v0, off, s[8:11], 0
; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s4, s0		; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s4, s0
; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s5, s1		; GCN-IEEE-UNSAFE-NEXT: s_mov_b32 s5, s1
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: v_sqrt_f32_e64 v0, -v0		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e64 v0, -v0
; GCN-IEEE-UNSAFE-NEXT: v_rcp_f32_e64 v0, -v0		; GCN-IEEE-UNSAFE-NEXT: v_xor_b32_e32 v0, 0x80000000, v0
; GCN-IEEE-UNSAFE-NEXT: buffer_store_dword v0, off, s[4:7], 0		; GCN-IEEE-UNSAFE-NEXT: buffer_store_dword v0, off, s[4:7], 0
; GCN-IEEE-UNSAFE-NEXT: s_endpgm		; GCN-IEEE-UNSAFE-NEXT: s_endpgm
;		;
; GCN-IEEE-SAFE-LABEL: neg_rsq_neg_f32:		; GCN-DAZ-SAFE-LABEL: neg_rsq_neg_f32:
; GCN-IEEE-SAFE: ; %bb.0:		; GCN-DAZ-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9		; GCN-DAZ-SAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s7, 0xf000		; GCN-DAZ-SAFE-NEXT: s_mov_b32 s7, 0xf000
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s6, -1		; GCN-DAZ-SAFE-NEXT: s_mov_b32 s6, -1
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s10, s6		; GCN-DAZ-SAFE-NEXT: s_mov_b32 s10, s6
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s11, s7		; GCN-DAZ-SAFE-NEXT: s_mov_b32 s11, s7
; GCN-IEEE-SAFE-NEXT: s_waitcnt lgkmcnt(0)		; GCN-DAZ-SAFE-NEXT: s_waitcnt lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s8, s2		; GCN-DAZ-SAFE-NEXT: s_mov_b32 s8, s2
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s9, s3		; GCN-DAZ-SAFE-NEXT: s_mov_b32 s9, s3
; GCN-IEEE-SAFE-NEXT: buffer_load_dword v0, off, s[8:11], 0		; GCN-DAZ-SAFE-NEXT: buffer_load_dword v0, off, s[8:11], 0
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s2, 0x6f800000		; GCN-DAZ-SAFE-NEXT: s_mov_b32 s4, s0
; GCN-IEEE-SAFE-NEXT: v_mov_b32_e32 v1, 0x2f800000		; GCN-DAZ-SAFE-NEXT: s_mov_b32 s5, s1
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s4, s0		; GCN-DAZ-SAFE-NEXT: s_waitcnt vmcnt(0)
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s5, s1		; GCN-DAZ-SAFE-NEXT: v_sqrt_f32_e64 v0, -v0
; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0)		; GCN-DAZ-SAFE-NEXT: v_rcp_f32_e64 v0, -v0
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e64 v0, -v0		; GCN-DAZ-SAFE-NEXT: buffer_store_dword v0, off, s[4:7], 0
; GCN-IEEE-SAFE-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, s2		; GCN-DAZ-SAFE-NEXT: s_endpgm
; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v1, 1.0, v1, vcc		;
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e64 v0, v0, -v1		; SI-IEEE-SAFE-LABEL: neg_rsq_neg_f32:
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v0, v0		; SI-IEEE-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v1, v0		; SI-IEEE-SAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9
; GCN-IEEE-SAFE-NEXT: buffer_store_dword v0, off, s[4:7], 0		; SI-IEEE-SAFE-NEXT: s_mov_b32 s7, 0xf000
; GCN-IEEE-SAFE-NEXT: s_endpgm		; SI-IEEE-SAFE-NEXT: s_mov_b32 s6, -1
		; SI-IEEE-SAFE-NEXT: s_mov_b32 s10, s6
		; SI-IEEE-SAFE-NEXT: s_mov_b32 s11, s7
		; SI-IEEE-SAFE-NEXT: s_waitcnt lgkmcnt(0)
		; SI-IEEE-SAFE-NEXT: s_mov_b32 s8, s2
		; SI-IEEE-SAFE-NEXT: s_mov_b32 s9, s3
		; SI-IEEE-SAFE-NEXT: buffer_load_dword v0, off, s[8:11], 0
		; SI-IEEE-SAFE-NEXT: s_mov_b32 s2, 0x7f800000
		; SI-IEEE-SAFE-NEXT: s_mov_b32 s4, s0
		; SI-IEEE-SAFE-NEXT: s_mov_b32 s5, s1
		; SI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0)
		; SI-IEEE-SAFE-NEXT: v_sqrt_f32_e64 v0, -v0
		; SI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v1, -v0
		; SI-IEEE-SAFE-NEXT: v_cmp_lt_f32_e64 s[0:1], \|v0\|, s2
		; SI-IEEE-SAFE-NEXT: v_cndmask_b32_e64 v1, -v0, v1, s[0:1]
		; SI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v1, v1
		; SI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; SI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; SI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v1, v0
		; SI-IEEE-SAFE-NEXT: buffer_store_dword v0, off, s[4:7], 0
		; SI-IEEE-SAFE-NEXT: s_endpgm
		;
		; CI-IEEE-SAFE-LABEL: neg_rsq_neg_f32:
		; CI-IEEE-SAFE: ; %bb.0:
		; CI-IEEE-SAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s7, 0xf000
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s6, -1
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s10, s6
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s11, s7
		; CI-IEEE-SAFE-NEXT: s_waitcnt lgkmcnt(0)
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s8, s2
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s9, s3
		; CI-IEEE-SAFE-NEXT: buffer_load_dword v0, off, s[8:11], 0
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s4, s0
		; CI-IEEE-SAFE-NEXT: s_mov_b32 s5, s1
		; CI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0)
		; CI-IEEE-SAFE-NEXT: v_sqrt_f32_e64 v0, -v0
		; CI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v1, -v0
		; CI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v1, v1
		; CI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; CI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; CI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v1, v0
		; CI-IEEE-SAFE-NEXT: buffer_store_dword v0, off, s[4:7], 0
		; CI-IEEE-SAFE-NEXT: s_endpgm
; GCN-UNSAFE-LABEL: neg_rsq_neg_f32:		; GCN-UNSAFE-LABEL: neg_rsq_neg_f32:
; GCN-UNSAFE: ; %bb.0:		; GCN-UNSAFE: ; %bb.0:
; GCN-UNSAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9		; GCN-UNSAFE-NEXT: s_load_dwordx4 s[0:3], s[0:1], 0x9
; GCN-UNSAFE-NEXT: s_mov_b32 s7, 0xf000		; GCN-UNSAFE-NEXT: s_mov_b32 s7, 0xf000
; GCN-UNSAFE-NEXT: s_mov_b32 s6, -1		; GCN-UNSAFE-NEXT: s_mov_b32 s6, -1
; GCN-UNSAFE-NEXT: s_mov_b32 s10, s6		; GCN-UNSAFE-NEXT: s_mov_b32 s10, s6
; GCN-UNSAFE-NEXT: s_mov_b32 s11, s7		; GCN-UNSAFE-NEXT: s_mov_b32 s11, s7
; GCN-UNSAFE-NEXT: s_waitcnt lgkmcnt(0)		; GCN-UNSAFE-NEXT: s_waitcnt lgkmcnt(0)
Show All 11 Lines	; GCN-UNSAFE-NEXT: s_endpgm
%val.fneg = fneg float %val		%val.fneg = fneg float %val
%sqrt = call contract float @llvm.sqrt.f32(float %val.fneg)		%sqrt = call contract float @llvm.sqrt.f32(float %val.fneg)
%div = fdiv contract float -1.0, %sqrt, !fpmath !0		%div = fdiv contract float -1.0, %sqrt, !fpmath !0
store float %div, ptr addrspace(1) %out, align 4		store float %div, ptr addrspace(1) %out, align 4
ret void		ret void
}		}

define float @v_neg_rsq_neg_f32(float %val) {		define float @v_neg_rsq_neg_f32(float %val) {
; GCN-DAZ-LABEL: v_neg_rsq_neg_f32:		; GCN-DAZ-UNSAFE-LABEL: v_neg_rsq_neg_f32:
; GCN-DAZ: ; %bb.0:		; GCN-DAZ-UNSAFE: ; %bb.0:
; GCN-DAZ-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-DAZ-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-DAZ-NEXT: v_sqrt_f32_e64 v0, -v0		; GCN-DAZ-UNSAFE-NEXT: v_rsq_f32_e64 v0, -v0
; GCN-DAZ-NEXT: v_rcp_f32_e64 v0, -v0		; GCN-DAZ-UNSAFE-NEXT: v_sub_f32_e32 v0, 0x80000000, v0
; GCN-DAZ-NEXT: s_setpc_b64 s[30:31]		; GCN-DAZ-UNSAFE-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-UNSAFE-LABEL: v_neg_rsq_neg_f32:		; GCN-IEEE-UNSAFE-LABEL: v_neg_rsq_neg_f32:
; GCN-IEEE-UNSAFE: ; %bb.0:		; GCN-IEEE-UNSAFE: ; %bb.0:
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: v_sqrt_f32_e64 v0, -v0		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e64 v0, -v0
; GCN-IEEE-UNSAFE-NEXT: v_rcp_f32_e64 v0, -v0		; GCN-IEEE-UNSAFE-NEXT: v_xor_b32_e32 v0, 0x80000000, v0
; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]		; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-SAFE-LABEL: v_neg_rsq_neg_f32:		; GCN-DAZ-SAFE-LABEL: v_neg_rsq_neg_f32:
; GCN-IEEE-SAFE: ; %bb.0:		; GCN-DAZ-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-DAZ-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e64 v0, -v0		; GCN-DAZ-SAFE-NEXT: v_sqrt_f32_e64 v0, -v0
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s4, 0x6f800000		; GCN-DAZ-SAFE-NEXT: v_rcp_f32_e64 v0, -v0
; GCN-IEEE-SAFE-NEXT: v_mov_b32_e32 v1, 0x2f800000		; GCN-DAZ-SAFE-NEXT: s_setpc_b64 s[30:31]
; GCN-IEEE-SAFE-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, s4		;
; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v1, 1.0, v1, vcc		; SI-IEEE-SAFE-LABEL: v_neg_rsq_neg_f32:
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e64 v0, v0, -v1		; SI-IEEE-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v0, v0		; SI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v1, v0		; SI-IEEE-SAFE-NEXT: v_sqrt_f32_e64 v0, -v0
; GCN-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]		; SI-IEEE-SAFE-NEXT: s_mov_b32 s4, 0x7f800000
		; SI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v1, -v0
		; SI-IEEE-SAFE-NEXT: v_cmp_lt_f32_e64 s[4:5], \|v0\|, s4
		; SI-IEEE-SAFE-NEXT: v_cndmask_b32_e64 v1, -v0, v1, s[4:5]
		; SI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v1, v1
		; SI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; SI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; SI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v1, v0
		; SI-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
		;
		; CI-IEEE-SAFE-LABEL: v_neg_rsq_neg_f32:
		; CI-IEEE-SAFE: ; %bb.0:
		; CI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
		; CI-IEEE-SAFE-NEXT: v_sqrt_f32_e64 v0, -v0
		; CI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v1, -v0
		; CI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v1, v1
		; CI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; CI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; CI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v1, v0
		; CI-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
%val.fneg = fneg float %val		%val.fneg = fneg float %val
%sqrt = call contract float @llvm.sqrt.f32(float %val.fneg)		%sqrt = call contract float @llvm.sqrt.f32(float %val.fneg)
%div = fdiv contract float -1.0, %sqrt, !fpmath !0		%div = fdiv contract float -1.0, %sqrt, !fpmath !0
ret float %div		ret float %div
}		}

define <2 x float> @v_neg_rsq_neg_v2f32(<2 x float> %val) {		define <2 x float> @v_neg_rsq_neg_v2f32(<2 x float> %val) {
; GCN-DAZ-LABEL: v_neg_rsq_neg_v2f32:		; GCN-DAZ-UNSAFE-LABEL: v_neg_rsq_neg_v2f32:
; GCN-DAZ: ; %bb.0:		; GCN-DAZ-UNSAFE: ; %bb.0:
; GCN-DAZ-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-DAZ-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-DAZ-NEXT: v_sqrt_f32_e64 v0, -v0		; GCN-DAZ-UNSAFE-NEXT: v_rsq_f32_e64 v0, -v0
; GCN-DAZ-NEXT: v_sqrt_f32_e64 v1, -v1		; GCN-DAZ-UNSAFE-NEXT: v_rsq_f32_e64 v1, -v1
; GCN-DAZ-NEXT: v_rcp_f32_e64 v0, -v0		; GCN-DAZ-UNSAFE-NEXT: v_sub_f32_e32 v0, 0x80000000, v0
; GCN-DAZ-NEXT: v_rcp_f32_e64 v1, -v1		; GCN-DAZ-UNSAFE-NEXT: v_sub_f32_e32 v1, 0x80000000, v1
; GCN-DAZ-NEXT: s_setpc_b64 s[30:31]		; GCN-DAZ-UNSAFE-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-UNSAFE-LABEL: v_neg_rsq_neg_v2f32:		; GCN-IEEE-UNSAFE-LABEL: v_neg_rsq_neg_v2f32:
; GCN-IEEE-UNSAFE: ; %bb.0:		; GCN-IEEE-UNSAFE: ; %bb.0:
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: v_sqrt_f32_e64 v0, -v0		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e64 v0, -v0
; GCN-IEEE-UNSAFE-NEXT: v_sqrt_f32_e64 v1, -v1		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e64 v1, -v1
; GCN-IEEE-UNSAFE-NEXT: v_rcp_f32_e64 v0, -v0		; GCN-IEEE-UNSAFE-NEXT: v_xor_b32_e32 v0, 0x80000000, v0
; GCN-IEEE-UNSAFE-NEXT: v_rcp_f32_e64 v1, -v1		; GCN-IEEE-UNSAFE-NEXT: v_xor_b32_e32 v1, 0x80000000, v1
; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]		; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-SAFE-LABEL: v_neg_rsq_neg_v2f32:		; GCN-DAZ-SAFE-LABEL: v_neg_rsq_neg_v2f32:
; GCN-IEEE-SAFE: ; %bb.0:		; GCN-DAZ-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-DAZ-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e64 v0, -v0		; GCN-DAZ-SAFE-NEXT: v_sqrt_f32_e64 v0, -v0
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e64 v1, -v1		; GCN-DAZ-SAFE-NEXT: v_sqrt_f32_e64 v1, -v1
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s4, 0x6f800000		; GCN-DAZ-SAFE-NEXT: v_rcp_f32_e64 v0, -v0
; GCN-IEEE-SAFE-NEXT: v_mov_b32_e32 v2, 0x2f800000		; GCN-DAZ-SAFE-NEXT: v_rcp_f32_e64 v1, -v1
; GCN-IEEE-SAFE-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, s4		; GCN-DAZ-SAFE-NEXT: s_setpc_b64 s[30:31]
; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v3, 1.0, v2, vcc		;
; GCN-IEEE-SAFE-NEXT: v_cmp_gt_f32_e64 vcc, \|v1\|, s4		; SI-IEEE-SAFE-LABEL: v_neg_rsq_neg_v2f32:
; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v2, 1.0, v2, vcc		; SI-IEEE-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e64 v0, v0, -v3		; SI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e64 v1, v1, -v2		; SI-IEEE-SAFE-NEXT: v_sqrt_f32_e64 v0, -v0
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v0, v0		; SI-IEEE-SAFE-NEXT: s_mov_b32 s6, 0x7f800000
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v1, v1		; SI-IEEE-SAFE-NEXT: v_sqrt_f32_e64 v1, -v1
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v3, v0		; SI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v2, -v0
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v1, v2, v1		; SI-IEEE-SAFE-NEXT: v_cmp_lt_f32_e64 s[4:5], \|v0\|, s6
; GCN-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]		; SI-IEEE-SAFE-NEXT: v_cndmask_b32_e64 v2, -v0, v2, s[4:5]
		; SI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v2, v2
		; SI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; SI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; SI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v2, v0
		; SI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v2, -v1
		; SI-IEEE-SAFE-NEXT: v_cmp_lt_f32_e64 s[4:5], \|v1\|, s6
		; SI-IEEE-SAFE-NEXT: v_cndmask_b32_e64 v2, -v1, v2, s[4:5]
		; SI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v2, v2
		; SI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v1, v1
		; SI-IEEE-SAFE-NEXT: v_sub_i32_e32 v1, vcc, 0, v1
		; SI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v1, v2, v1
		; SI-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
		;
		; CI-IEEE-SAFE-LABEL: v_neg_rsq_neg_v2f32:
		; CI-IEEE-SAFE: ; %bb.0:
		; CI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
		; CI-IEEE-SAFE-NEXT: v_sqrt_f32_e64 v0, -v0
		; CI-IEEE-SAFE-NEXT: v_sqrt_f32_e64 v1, -v1
		; CI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v2, -v0
		; CI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v2, v2
		; CI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; CI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v3, -v1
		; CI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; CI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v2, v0
		; CI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v2, v3
		; CI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v1, v1
		; CI-IEEE-SAFE-NEXT: v_sub_i32_e32 v1, vcc, 0, v1
		; CI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v1, v2, v1
		; CI-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
%val.fneg = fneg <2 x float> %val		%val.fneg = fneg <2 x float> %val
%sqrt = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> %val.fneg)		%sqrt = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> %val.fneg)
%div = fdiv contract <2 x float> <float -1.0, float -1.0>, %sqrt, !fpmath !0		%div = fdiv contract <2 x float> <float -1.0, float -1.0>, %sqrt, !fpmath !0
ret <2 x float> %div		ret <2 x float> %div
}		}

define float @v_neg_rsq_neg_f32_foldable_user(float %val0, float %val1) {		define float @v_neg_rsq_neg_f32_foldable_user(float %val0, float %val1) {
; GCN-DAZ-LABEL: v_neg_rsq_neg_f32_foldable_user:		; GCN-DAZ-UNSAFE-LABEL: v_neg_rsq_neg_f32_foldable_user:
; GCN-DAZ: ; %bb.0:		; GCN-DAZ-UNSAFE: ; %bb.0:
; GCN-DAZ-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-DAZ-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-DAZ-NEXT: v_sqrt_f32_e64 v0, -v0		; GCN-DAZ-UNSAFE-NEXT: v_rsq_f32_e64 v0, -v0
; GCN-DAZ-NEXT: v_rcp_f32_e64 v0, -v0		; GCN-DAZ-UNSAFE-NEXT: v_mul_f32_e64 v0, -v0, v1
; GCN-DAZ-NEXT: v_mul_f32_e32 v0, v0, v1		; GCN-DAZ-UNSAFE-NEXT: s_setpc_b64 s[30:31]
; GCN-DAZ-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-UNSAFE-LABEL: v_neg_rsq_neg_f32_foldable_user:		; GCN-IEEE-UNSAFE-LABEL: v_neg_rsq_neg_f32_foldable_user:
; GCN-IEEE-UNSAFE: ; %bb.0:		; GCN-IEEE-UNSAFE: ; %bb.0:
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: v_sqrt_f32_e64 v0, -v0		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e64 v0, -v0
; GCN-IEEE-UNSAFE-NEXT: v_rcp_f32_e64 v0, -v0		; GCN-IEEE-UNSAFE-NEXT: v_mul_f32_e64 v0, -v0, v1
; GCN-IEEE-UNSAFE-NEXT: v_mul_f32_e32 v0, v0, v1
; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]		; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-SAFE-LABEL: v_neg_rsq_neg_f32_foldable_user:		; GCN-DAZ-SAFE-LABEL: v_neg_rsq_neg_f32_foldable_user:
; GCN-IEEE-SAFE: ; %bb.0:		; GCN-DAZ-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-DAZ-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e64 v0, -v0		; GCN-DAZ-SAFE-NEXT: v_sqrt_f32_e64 v0, -v0
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s4, 0x6f800000		; GCN-DAZ-SAFE-NEXT: v_rcp_f32_e64 v0, -v0
; GCN-IEEE-SAFE-NEXT: v_mov_b32_e32 v2, 0x2f800000		; GCN-DAZ-SAFE-NEXT: v_mul_f32_e32 v0, v0, v1
; GCN-IEEE-SAFE-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, s4		; GCN-DAZ-SAFE-NEXT: s_setpc_b64 s[30:31]
; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v2, 1.0, v2, vcc		;
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e64 v0, v0, -v2		; SI-IEEE-SAFE-LABEL: v_neg_rsq_neg_f32_foldable_user:
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v0, v0		; SI-IEEE-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v2, v0		; SI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v0, v1		; SI-IEEE-SAFE-NEXT: v_sqrt_f32_e64 v0, -v0
; GCN-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]		; SI-IEEE-SAFE-NEXT: s_mov_b32 s4, 0x7f800000
		; SI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v2, -v0
		; SI-IEEE-SAFE-NEXT: v_cmp_lt_f32_e64 s[4:5], \|v0\|, s4
		; SI-IEEE-SAFE-NEXT: v_cndmask_b32_e64 v2, -v0, v2, s[4:5]
		; SI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v2, v2
		; SI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; SI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; SI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v2, v0
		; SI-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v0, v1
		; SI-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
		;
		; CI-IEEE-SAFE-LABEL: v_neg_rsq_neg_f32_foldable_user:
		; CI-IEEE-SAFE: ; %bb.0:
		; CI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
		; CI-IEEE-SAFE-NEXT: v_sqrt_f32_e64 v0, -v0
		; CI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v2, -v0
		; CI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v2, v2
		; CI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; CI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; CI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v2, v0
		; CI-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v0, v1
		; CI-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
%val0.neg = fneg float %val0		%val0.neg = fneg float %val0
%sqrt = call contract float @llvm.sqrt.f32(float %val0.neg)		%sqrt = call contract float @llvm.sqrt.f32(float %val0.neg)
%div = fdiv contract float -1.0, %sqrt, !fpmath !0		%div = fdiv contract float -1.0, %sqrt, !fpmath !0
%user = fmul contract float %div, %val1		%user = fmul contract float %div, %val1
ret float %user		ret float %user
}		}

define <2 x float> @v_neg_rsq_neg_v2f32_foldable_user(<2 x float> %val0, <2 x float> %val1) {		define <2 x float> @v_neg_rsq_neg_v2f32_foldable_user(<2 x float> %val0, <2 x float> %val1) {
; GCN-DAZ-LABEL: v_neg_rsq_neg_v2f32_foldable_user:		; GCN-DAZ-UNSAFE-LABEL: v_neg_rsq_neg_v2f32_foldable_user:
; GCN-DAZ: ; %bb.0:		; GCN-DAZ-UNSAFE: ; %bb.0:
; GCN-DAZ-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-DAZ-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-DAZ-NEXT: v_sqrt_f32_e64 v0, -v0		; GCN-DAZ-UNSAFE-NEXT: v_rsq_f32_e64 v0, -v0
; GCN-DAZ-NEXT: v_sqrt_f32_e64 v1, -v1		; GCN-DAZ-UNSAFE-NEXT: v_rsq_f32_e64 v1, -v1
; GCN-DAZ-NEXT: v_rcp_f32_e64 v0, -v0		; GCN-DAZ-UNSAFE-NEXT: v_mul_f32_e64 v0, -v0, v2
; GCN-DAZ-NEXT: v_rcp_f32_e64 v1, -v1		; GCN-DAZ-UNSAFE-NEXT: v_mul_f32_e64 v1, -v1, v3
; GCN-DAZ-NEXT: v_mul_f32_e32 v0, v0, v2		; GCN-DAZ-UNSAFE-NEXT: s_setpc_b64 s[30:31]
; GCN-DAZ-NEXT: v_mul_f32_e32 v1, v1, v3
; GCN-DAZ-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-UNSAFE-LABEL: v_neg_rsq_neg_v2f32_foldable_user:		; GCN-IEEE-UNSAFE-LABEL: v_neg_rsq_neg_v2f32_foldable_user:
; GCN-IEEE-UNSAFE: ; %bb.0:		; GCN-IEEE-UNSAFE: ; %bb.0:
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: v_sqrt_f32_e64 v0, -v0		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e64 v0, -v0
; GCN-IEEE-UNSAFE-NEXT: v_sqrt_f32_e64 v1, -v1		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e64 v1, -v1
; GCN-IEEE-UNSAFE-NEXT: v_rcp_f32_e64 v0, -v0		; GCN-IEEE-UNSAFE-NEXT: v_mul_f32_e64 v0, -v0, v2
; GCN-IEEE-UNSAFE-NEXT: v_rcp_f32_e64 v1, -v1		; GCN-IEEE-UNSAFE-NEXT: v_mul_f32_e64 v1, -v1, v3
; GCN-IEEE-UNSAFE-NEXT: v_mul_f32_e32 v0, v0, v2
; GCN-IEEE-UNSAFE-NEXT: v_mul_f32_e32 v1, v1, v3
; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]		; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-SAFE-LABEL: v_neg_rsq_neg_v2f32_foldable_user:		; GCN-DAZ-SAFE-LABEL: v_neg_rsq_neg_v2f32_foldable_user:
; GCN-IEEE-SAFE: ; %bb.0:		; GCN-DAZ-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-DAZ-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e64 v0, -v0		; GCN-DAZ-SAFE-NEXT: v_sqrt_f32_e64 v0, -v0
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e64 v1, -v1		; GCN-DAZ-SAFE-NEXT: v_sqrt_f32_e64 v1, -v1
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s4, 0x6f800000		; GCN-DAZ-SAFE-NEXT: v_rcp_f32_e64 v0, -v0
; GCN-IEEE-SAFE-NEXT: v_mov_b32_e32 v4, 0x2f800000		; GCN-DAZ-SAFE-NEXT: v_rcp_f32_e64 v1, -v1
; GCN-IEEE-SAFE-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, s4		; GCN-DAZ-SAFE-NEXT: v_mul_f32_e32 v0, v0, v2
; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v5, 1.0, v4, vcc		; GCN-DAZ-SAFE-NEXT: v_mul_f32_e32 v1, v1, v3
; GCN-IEEE-SAFE-NEXT: v_cmp_gt_f32_e64 vcc, \|v1\|, s4		; GCN-DAZ-SAFE-NEXT: s_setpc_b64 s[30:31]
; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v4, 1.0, v4, vcc		;
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e64 v0, v0, -v5		; SI-IEEE-SAFE-LABEL: v_neg_rsq_neg_v2f32_foldable_user:
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e64 v1, v1, -v4		; SI-IEEE-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v0, v0		; SI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v1, v1		; SI-IEEE-SAFE-NEXT: v_sqrt_f32_e64 v0, -v0
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v5, v0		; SI-IEEE-SAFE-NEXT: s_mov_b32 s6, 0x7f800000
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v1, v4, v1		; SI-IEEE-SAFE-NEXT: v_sqrt_f32_e64 v1, -v1
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v0, v2		; SI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v4, -v0
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v1, v1, v3		; SI-IEEE-SAFE-NEXT: v_cmp_lt_f32_e64 s[4:5], \|v0\|, s6
; GCN-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]		; SI-IEEE-SAFE-NEXT: v_cndmask_b32_e64 v4, -v0, v4, s[4:5]
		; SI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v4, v4
		; SI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; SI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; SI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v4, v0
		; SI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v4, -v1
		; SI-IEEE-SAFE-NEXT: v_cmp_lt_f32_e64 s[4:5], \|v1\|, s6
		; SI-IEEE-SAFE-NEXT: v_cndmask_b32_e64 v4, -v1, v4, s[4:5]
		; SI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v4, v4
		; SI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v1, v1
		; SI-IEEE-SAFE-NEXT: v_sub_i32_e32 v1, vcc, 0, v1
		; SI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v1, v4, v1
		; SI-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v0, v2
		; SI-IEEE-SAFE-NEXT: v_mul_f32_e32 v1, v1, v3
		; SI-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
		;
		; CI-IEEE-SAFE-LABEL: v_neg_rsq_neg_v2f32_foldable_user:
		; CI-IEEE-SAFE: ; %bb.0:
		; CI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
		; CI-IEEE-SAFE-NEXT: v_sqrt_f32_e64 v0, -v0
		; CI-IEEE-SAFE-NEXT: v_sqrt_f32_e64 v1, -v1
		; CI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v4, -v0
		; CI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v4, v4
		; CI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; CI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; CI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v4, v0
		; CI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v4, -v1
		; CI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v4, v4
		; CI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v1, v1
		; CI-IEEE-SAFE-NEXT: v_sub_i32_e32 v1, vcc, 0, v1
		; CI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v1, v4, v1
		; CI-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v0, v2
		; CI-IEEE-SAFE-NEXT: v_mul_f32_e32 v1, v1, v3
		; CI-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
%val0.fneg = fneg <2 x float> %val0		%val0.fneg = fneg <2 x float> %val0
%sqrt = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> %val0.fneg)		%sqrt = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> %val0.fneg)
%div = fdiv contract <2 x float> <float -1.0, float -1.0>, %sqrt, !fpmath !0		%div = fdiv contract <2 x float> <float -1.0, float -1.0>, %sqrt, !fpmath !0
%user = fmul contract <2 x float> %div, %val1		%user = fmul contract <2 x float> %div, %val1
ret <2 x float> %user		ret <2 x float> %user
}		}

define float @v_neg_rsq_f32(float %val) {		define float @v_neg_rsq_f32(float %val) {
; GCN-DAZ-LABEL: v_neg_rsq_f32:		; GCN-DAZ-UNSAFE-LABEL: v_neg_rsq_f32:
; GCN-DAZ: ; %bb.0:		; GCN-DAZ-UNSAFE: ; %bb.0:
; GCN-DAZ-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-DAZ-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-DAZ-NEXT: v_sqrt_f32_e32 v0, v0		; GCN-DAZ-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-DAZ-NEXT: v_rcp_f32_e64 v0, -v0		; GCN-DAZ-UNSAFE-NEXT: v_sub_f32_e32 v0, 0x80000000, v0
; GCN-DAZ-NEXT: s_setpc_b64 s[30:31]		; GCN-DAZ-UNSAFE-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-UNSAFE-LABEL: v_neg_rsq_f32:		; GCN-IEEE-UNSAFE-LABEL: v_neg_rsq_f32:
; GCN-IEEE-UNSAFE: ; %bb.0:		; GCN-IEEE-UNSAFE: ; %bb.0:
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: v_sqrt_f32_e32 v0, v0		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-IEEE-UNSAFE-NEXT: v_rcp_f32_e64 v0, -v0		; GCN-IEEE-UNSAFE-NEXT: v_xor_b32_e32 v0, 0x80000000, v0
; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]		; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-SAFE-LABEL: v_neg_rsq_f32:		; GCN-DAZ-SAFE-LABEL: v_neg_rsq_f32:
; GCN-IEEE-SAFE: ; %bb.0:		; GCN-DAZ-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-DAZ-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0		; GCN-DAZ-SAFE-NEXT: v_sqrt_f32_e32 v0, v0
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s4, 0x6f800000		; GCN-DAZ-SAFE-NEXT: v_rcp_f32_e64 v0, -v0
; GCN-IEEE-SAFE-NEXT: v_mov_b32_e32 v1, 0x2f800000		; GCN-DAZ-SAFE-NEXT: s_setpc_b64 s[30:31]
; GCN-IEEE-SAFE-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, s4		;
; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v1, 1.0, v1, vcc		; SI-IEEE-SAFE-LABEL: v_neg_rsq_f32:
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e64 v0, v0, -v1		; SI-IEEE-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v0, v0		; SI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v1, v0		; SI-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0
; GCN-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]		; SI-IEEE-SAFE-NEXT: s_mov_b32 s4, 0x7f800000
		; SI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v1, -v0
		; SI-IEEE-SAFE-NEXT: v_cmp_lt_f32_e64 s[4:5], \|v0\|, s4
		; SI-IEEE-SAFE-NEXT: v_cndmask_b32_e64 v1, -v0, v1, s[4:5]
		; SI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v1, v1
		; SI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; SI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; SI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v1, v0
		; SI-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
		;
		; CI-IEEE-SAFE-LABEL: v_neg_rsq_f32:
		; CI-IEEE-SAFE: ; %bb.0:
		; CI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
		; CI-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0
		; CI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v1, -v0
		; CI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v1, v1
		; CI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; CI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; CI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v1, v0
		; CI-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
%sqrt = call contract float @llvm.sqrt.f32(float %val)		%sqrt = call contract float @llvm.sqrt.f32(float %val)
%div = fdiv contract float -1.0, %sqrt, !fpmath !0		%div = fdiv contract float -1.0, %sqrt, !fpmath !0
ret float %div		ret float %div
}		}

define <2 x float> @v_neg_rsq_v2f32(<2 x float> %val) {		define <2 x float> @v_neg_rsq_v2f32(<2 x float> %val) {
; GCN-DAZ-LABEL: v_neg_rsq_v2f32:		; GCN-DAZ-UNSAFE-LABEL: v_neg_rsq_v2f32:
; GCN-DAZ: ; %bb.0:		; GCN-DAZ-UNSAFE: ; %bb.0:
; GCN-DAZ-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-DAZ-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-DAZ-NEXT: v_sqrt_f32_e32 v0, v0		; GCN-DAZ-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-DAZ-NEXT: v_sqrt_f32_e32 v1, v1		; GCN-DAZ-UNSAFE-NEXT: v_rsq_f32_e32 v1, v1
; GCN-DAZ-NEXT: v_rcp_f32_e64 v0, -v0		; GCN-DAZ-UNSAFE-NEXT: v_sub_f32_e32 v0, 0x80000000, v0
; GCN-DAZ-NEXT: v_rcp_f32_e64 v1, -v1		; GCN-DAZ-UNSAFE-NEXT: v_sub_f32_e32 v1, 0x80000000, v1
; GCN-DAZ-NEXT: s_setpc_b64 s[30:31]		; GCN-DAZ-UNSAFE-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-UNSAFE-LABEL: v_neg_rsq_v2f32:		; GCN-IEEE-UNSAFE-LABEL: v_neg_rsq_v2f32:
; GCN-IEEE-UNSAFE: ; %bb.0:		; GCN-IEEE-UNSAFE: ; %bb.0:
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: v_sqrt_f32_e32 v0, v0		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-IEEE-UNSAFE-NEXT: v_sqrt_f32_e32 v1, v1		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v1, v1
; GCN-IEEE-UNSAFE-NEXT: v_rcp_f32_e64 v0, -v0		; GCN-IEEE-UNSAFE-NEXT: v_xor_b32_e32 v0, 0x80000000, v0
; GCN-IEEE-UNSAFE-NEXT: v_rcp_f32_e64 v1, -v1		; GCN-IEEE-UNSAFE-NEXT: v_xor_b32_e32 v1, 0x80000000, v1
; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]		; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-SAFE-LABEL: v_neg_rsq_v2f32:		; GCN-DAZ-SAFE-LABEL: v_neg_rsq_v2f32:
; GCN-IEEE-SAFE: ; %bb.0:		; GCN-DAZ-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-DAZ-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0		; GCN-DAZ-SAFE-NEXT: v_sqrt_f32_e32 v0, v0
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v1, v1		; GCN-DAZ-SAFE-NEXT: v_sqrt_f32_e32 v1, v1
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s4, 0x6f800000		; GCN-DAZ-SAFE-NEXT: v_rcp_f32_e64 v0, -v0
; GCN-IEEE-SAFE-NEXT: v_mov_b32_e32 v2, 0x2f800000		; GCN-DAZ-SAFE-NEXT: v_rcp_f32_e64 v1, -v1
; GCN-IEEE-SAFE-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, s4		; GCN-DAZ-SAFE-NEXT: s_setpc_b64 s[30:31]
; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v3, 1.0, v2, vcc		;
; GCN-IEEE-SAFE-NEXT: v_cmp_gt_f32_e64 vcc, \|v1\|, s4		; SI-IEEE-SAFE-LABEL: v_neg_rsq_v2f32:
; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v2, 1.0, v2, vcc		; SI-IEEE-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e64 v0, v0, -v3		; SI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e64 v1, v1, -v2		; SI-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v0, v0		; SI-IEEE-SAFE-NEXT: s_mov_b32 s6, 0x7f800000
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v1, v1		; SI-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v1, v1
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v3, v0		; SI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v2, -v0
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v1, v2, v1		; SI-IEEE-SAFE-NEXT: v_cmp_lt_f32_e64 s[4:5], \|v0\|, s6
; GCN-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]		; SI-IEEE-SAFE-NEXT: v_cndmask_b32_e64 v2, -v0, v2, s[4:5]
		; SI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v2, v2
		; SI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; SI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; SI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v2, v0
		; SI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v2, -v1
		; SI-IEEE-SAFE-NEXT: v_cmp_lt_f32_e64 s[4:5], \|v1\|, s6
		; SI-IEEE-SAFE-NEXT: v_cndmask_b32_e64 v2, -v1, v2, s[4:5]
		; SI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v2, v2
		; SI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v1, v1
		; SI-IEEE-SAFE-NEXT: v_sub_i32_e32 v1, vcc, 0, v1
		; SI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v1, v2, v1
		; SI-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
		;
		; CI-IEEE-SAFE-LABEL: v_neg_rsq_v2f32:
		; CI-IEEE-SAFE: ; %bb.0:
		; CI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
		; CI-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0
		; CI-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v1, v1
		; CI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v2, -v0
		; CI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v2, v2
		; CI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; CI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v3, -v1
		; CI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; CI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v2, v0
		; CI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v2, v3
		; CI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v1, v1
		; CI-IEEE-SAFE-NEXT: v_sub_i32_e32 v1, vcc, 0, v1
		; CI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v1, v2, v1
		; CI-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
%sqrt = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> %val)		%sqrt = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> %val)
%div = fdiv contract <2 x float> <float -1.0, float -1.0>, %sqrt, !fpmath !0		%div = fdiv contract <2 x float> <float -1.0, float -1.0>, %sqrt, !fpmath !0
ret <2 x float> %div		ret <2 x float> %div
}		}

define float @v_neg_rsq_f32_foldable_user(float %val0, float %val1) {		define float @v_neg_rsq_f32_foldable_user(float %val0, float %val1) {
; GCN-DAZ-LABEL: v_neg_rsq_f32_foldable_user:		; GCN-DAZ-UNSAFE-LABEL: v_neg_rsq_f32_foldable_user:
; GCN-DAZ: ; %bb.0:		; GCN-DAZ-UNSAFE: ; %bb.0:
; GCN-DAZ-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-DAZ-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-DAZ-NEXT: v_sqrt_f32_e32 v0, v0		; GCN-DAZ-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-DAZ-NEXT: v_rcp_f32_e64 v0, -v0		; GCN-DAZ-UNSAFE-NEXT: v_mul_f32_e64 v0, -v0, v1
; GCN-DAZ-NEXT: v_mul_f32_e32 v0, v0, v1		; GCN-DAZ-UNSAFE-NEXT: s_setpc_b64 s[30:31]
; GCN-DAZ-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-UNSAFE-LABEL: v_neg_rsq_f32_foldable_user:		; GCN-IEEE-UNSAFE-LABEL: v_neg_rsq_f32_foldable_user:
; GCN-IEEE-UNSAFE: ; %bb.0:		; GCN-IEEE-UNSAFE: ; %bb.0:
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: v_sqrt_f32_e32 v0, v0		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-IEEE-UNSAFE-NEXT: v_rcp_f32_e64 v0, -v0		; GCN-IEEE-UNSAFE-NEXT: v_mul_f32_e64 v0, -v0, v1
; GCN-IEEE-UNSAFE-NEXT: v_mul_f32_e32 v0, v0, v1
; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]		; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-SAFE-LABEL: v_neg_rsq_f32_foldable_user:		; GCN-DAZ-SAFE-LABEL: v_neg_rsq_f32_foldable_user:
; GCN-IEEE-SAFE: ; %bb.0:		; GCN-DAZ-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-DAZ-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0		; GCN-DAZ-SAFE-NEXT: v_sqrt_f32_e32 v0, v0
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s4, 0x6f800000		; GCN-DAZ-SAFE-NEXT: v_rcp_f32_e64 v0, -v0
; GCN-IEEE-SAFE-NEXT: v_mov_b32_e32 v2, 0x2f800000		; GCN-DAZ-SAFE-NEXT: v_mul_f32_e32 v0, v0, v1
; GCN-IEEE-SAFE-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, s4		; GCN-DAZ-SAFE-NEXT: s_setpc_b64 s[30:31]
; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v2, 1.0, v2, vcc		;
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e64 v0, v0, -v2		; SI-IEEE-SAFE-LABEL: v_neg_rsq_f32_foldable_user:
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v0, v0		; SI-IEEE-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v2, v0		; SI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v0, v1		; SI-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0
; GCN-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]		; SI-IEEE-SAFE-NEXT: s_mov_b32 s4, 0x7f800000
		; SI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v2, -v0
		; SI-IEEE-SAFE-NEXT: v_cmp_lt_f32_e64 s[4:5], \|v0\|, s4
		; SI-IEEE-SAFE-NEXT: v_cndmask_b32_e64 v2, -v0, v2, s[4:5]
		; SI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v2, v2
		; SI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; SI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; SI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v2, v0
		; SI-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v0, v1
		; SI-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
		;
		; CI-IEEE-SAFE-LABEL: v_neg_rsq_f32_foldable_user:
		; CI-IEEE-SAFE: ; %bb.0:
		; CI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
		; CI-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0
		; CI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v2, -v0
		; CI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v2, v2
		; CI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; CI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; CI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v2, v0
		; CI-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v0, v1
		; CI-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
%sqrt = call contract float @llvm.sqrt.f32(float %val0)		%sqrt = call contract float @llvm.sqrt.f32(float %val0)
%div = fdiv contract float -1.0, %sqrt, !fpmath !0		%div = fdiv contract float -1.0, %sqrt, !fpmath !0
%user = fmul contract float %div, %val1		%user = fmul contract float %div, %val1
ret float %user		ret float %user
}		}

define <2 x float> @v_neg_rsq_v2f32_foldable_user(<2 x float> %val0, <2 x float> %val1) {		define <2 x float> @v_neg_rsq_v2f32_foldable_user(<2 x float> %val0, <2 x float> %val1) {
; GCN-DAZ-LABEL: v_neg_rsq_v2f32_foldable_user:		; GCN-DAZ-UNSAFE-LABEL: v_neg_rsq_v2f32_foldable_user:
; GCN-DAZ: ; %bb.0:		; GCN-DAZ-UNSAFE: ; %bb.0:
; GCN-DAZ-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-DAZ-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-DAZ-NEXT: v_sqrt_f32_e32 v0, v0		; GCN-DAZ-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-DAZ-NEXT: v_sqrt_f32_e32 v1, v1		; GCN-DAZ-UNSAFE-NEXT: v_rsq_f32_e32 v1, v1
; GCN-DAZ-NEXT: v_rcp_f32_e64 v0, -v0		; GCN-DAZ-UNSAFE-NEXT: v_mul_f32_e64 v0, -v0, v2
; GCN-DAZ-NEXT: v_rcp_f32_e64 v1, -v1		; GCN-DAZ-UNSAFE-NEXT: v_mul_f32_e64 v1, -v1, v3
; GCN-DAZ-NEXT: v_mul_f32_e32 v0, v0, v2		; GCN-DAZ-UNSAFE-NEXT: s_setpc_b64 s[30:31]
; GCN-DAZ-NEXT: v_mul_f32_e32 v1, v1, v3
; GCN-DAZ-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-UNSAFE-LABEL: v_neg_rsq_v2f32_foldable_user:		; GCN-IEEE-UNSAFE-LABEL: v_neg_rsq_v2f32_foldable_user:
; GCN-IEEE-UNSAFE: ; %bb.0:		; GCN-IEEE-UNSAFE: ; %bb.0:
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: v_sqrt_f32_e32 v0, v0		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-IEEE-UNSAFE-NEXT: v_sqrt_f32_e32 v1, v1		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v1, v1
; GCN-IEEE-UNSAFE-NEXT: v_rcp_f32_e64 v0, -v0		; GCN-IEEE-UNSAFE-NEXT: v_mul_f32_e64 v0, -v0, v2
; GCN-IEEE-UNSAFE-NEXT: v_rcp_f32_e64 v1, -v1		; GCN-IEEE-UNSAFE-NEXT: v_mul_f32_e64 v1, -v1, v3
; GCN-IEEE-UNSAFE-NEXT: v_mul_f32_e32 v0, v0, v2
; GCN-IEEE-UNSAFE-NEXT: v_mul_f32_e32 v1, v1, v3
; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]		; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-SAFE-LABEL: v_neg_rsq_v2f32_foldable_user:		; GCN-DAZ-SAFE-LABEL: v_neg_rsq_v2f32_foldable_user:
; GCN-IEEE-SAFE: ; %bb.0:		; GCN-DAZ-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-DAZ-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0		; GCN-DAZ-SAFE-NEXT: v_sqrt_f32_e32 v0, v0
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v1, v1		; GCN-DAZ-SAFE-NEXT: v_sqrt_f32_e32 v1, v1
; GCN-IEEE-SAFE-NEXT: s_mov_b32 s4, 0x6f800000		; GCN-DAZ-SAFE-NEXT: v_rcp_f32_e64 v0, -v0
; GCN-IEEE-SAFE-NEXT: v_mov_b32_e32 v4, 0x2f800000		; GCN-DAZ-SAFE-NEXT: v_rcp_f32_e64 v1, -v1
; GCN-IEEE-SAFE-NEXT: v_cmp_gt_f32_e64 vcc, \|v0\|, s4		; GCN-DAZ-SAFE-NEXT: v_mul_f32_e32 v0, v0, v2
; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v5, 1.0, v4, vcc		; GCN-DAZ-SAFE-NEXT: v_mul_f32_e32 v1, v1, v3
; GCN-IEEE-SAFE-NEXT: v_cmp_gt_f32_e64 vcc, \|v1\|, s4		; GCN-DAZ-SAFE-NEXT: s_setpc_b64 s[30:31]
; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v4, 1.0, v4, vcc		;
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e64 v0, v0, -v5		; SI-IEEE-SAFE-LABEL: v_neg_rsq_v2f32_foldable_user:
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e64 v1, v1, -v4		; SI-IEEE-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v0, v0		; SI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v1, v1		; SI-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v5, v0		; SI-IEEE-SAFE-NEXT: s_mov_b32 s6, 0x7f800000
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v1, v4, v1		; SI-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v1, v1
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v0, v2		; SI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v4, -v0
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v1, v1, v3		; SI-IEEE-SAFE-NEXT: v_cmp_lt_f32_e64 s[4:5], \|v0\|, s6
; GCN-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]		; SI-IEEE-SAFE-NEXT: v_cndmask_b32_e64 v4, -v0, v4, s[4:5]
		; SI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v4, v4
		; SI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; SI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; SI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v4, v0
		; SI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v4, -v1
		; SI-IEEE-SAFE-NEXT: v_cmp_lt_f32_e64 s[4:5], \|v1\|, s6
		; SI-IEEE-SAFE-NEXT: v_cndmask_b32_e64 v4, -v1, v4, s[4:5]
		; SI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v4, v4
		; SI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v1, v1
		; SI-IEEE-SAFE-NEXT: v_sub_i32_e32 v1, vcc, 0, v1
		; SI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v1, v4, v1
		; SI-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v0, v2
		; SI-IEEE-SAFE-NEXT: v_mul_f32_e32 v1, v1, v3
		; SI-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
		;
		; CI-IEEE-SAFE-LABEL: v_neg_rsq_v2f32_foldable_user:
		; CI-IEEE-SAFE: ; %bb.0:
		; CI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
		; CI-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0
		; CI-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v1, v1
		; CI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v4, -v0
		; CI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v4, v4
		; CI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; CI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; CI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v4, v0
		; CI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e64 v4, -v1
		; CI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v4, v4
		; CI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v1, v1
		; CI-IEEE-SAFE-NEXT: v_sub_i32_e32 v1, vcc, 0, v1
		; CI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v1, v4, v1
		; CI-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v0, v2
		; CI-IEEE-SAFE-NEXT: v_mul_f32_e32 v1, v1, v3
		; CI-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
%sqrt = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> %val0)		%sqrt = call contract <2 x float> @llvm.sqrt.v2f32(<2 x float> %val0)
%div = fdiv contract <2 x float> <float -1.0, float -1.0>, %sqrt, !fpmath !0		%div = fdiv contract <2 x float> <float -1.0, float -1.0>, %sqrt, !fpmath !0
%user = fmul contract <2 x float> %div, %val1		%user = fmul contract <2 x float> %div, %val1
ret <2 x float> %user		ret <2 x float> %user
}		}

define float @v_rsq_f32(float %val) {		define float @v_rsq_f32(float %val) {
; GCN-DAZ-LABEL: v_rsq_f32:		; GCN-DAZ-LABEL: v_rsq_f32:
; GCN-DAZ: ; %bb.0:		; GCN-DAZ: ; %bb.0:
; GCN-DAZ-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-DAZ-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-DAZ-NEXT: v_rsq_f32_e32 v0, v0		; GCN-DAZ-NEXT: v_rsq_f32_e32 v0, v0
; GCN-DAZ-NEXT: s_setpc_b64 s[30:31]		; GCN-DAZ-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-UNSAFE-LABEL: v_rsq_f32:		; GCN-IEEE-UNSAFE-LABEL: v_rsq_f32:
; GCN-IEEE-UNSAFE: ; %bb.0:		; GCN-IEEE-UNSAFE: ; %bb.0:
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]		; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-SAFE-LABEL: v_rsq_f32:		; GCN-IEEE-SAFE-LABEL: v_rsq_f32:
; GCN-IEEE-SAFE: ; %bb.0:		; GCN-IEEE-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0		; GCN-IEEE-SAFE-NEXT: s_mov_b32 s4, 0x800000
; GCN-IEEE-SAFE-NEXT: v_div_scale_f32 v1, s[4:5], v0, v0, 1.0		; GCN-IEEE-SAFE-NEXT: v_mov_b32_e32 v1, 0x4b800000
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v2, v1		; GCN-IEEE-SAFE-NEXT: v_cmp_gt_f32_e32 vcc, s4, v0
; GCN-IEEE-SAFE-NEXT: v_div_scale_f32 v3, vcc, 1.0, v0, 1.0		; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v1, 1.0, v1, vcc
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v4, -v1, v2, 1.0		; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v0, v1
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v2, v4, v2, v2		; GCN-IEEE-SAFE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v4, v3, v2		; GCN-IEEE-SAFE-NEXT: v_mov_b32_e32 v1, 0x45800000
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v5, -v1, v4, v3		; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v1, 1.0, v1, vcc
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v4, v5, v2, v4		; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v0, v1
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v1, -v1, v4, v3
; GCN-IEEE-SAFE-NEXT: v_div_fmas_f32 v1, v1, v2, v4
; GCN-IEEE-SAFE-NEXT: v_div_fixup_f32 v0, v1, v0, 1.0
; GCN-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]		; GCN-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
%sqrt = call contract float @llvm.sqrt.f32(float %val), !fpmath !1		%sqrt = call contract float @llvm.sqrt.f32(float %val), !fpmath !1
%div = fdiv contract float 1.0, %sqrt, !fpmath !1		%div = fdiv contract float 1.0, %sqrt, !fpmath !1
ret float %div		ret float %div
}		}

define float @v_rsq_f32_missing_contract0(float %val) {		define float @v_rsq_f32_missing_contract0(float %val) {
; GCN-DAZ-LABEL: v_rsq_f32_missing_contract0:		; GCN-DAZ-LABEL: v_rsq_f32_missing_contract0:
; GCN-DAZ: ; %bb.0:		; GCN-DAZ: ; %bb.0:
; GCN-DAZ-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-DAZ-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-DAZ-NEXT: v_rsq_f32_e32 v0, v0		; GCN-DAZ-NEXT: v_rsq_f32_e32 v0, v0
; GCN-DAZ-NEXT: s_setpc_b64 s[30:31]		; GCN-DAZ-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-UNSAFE-LABEL: v_rsq_f32_missing_contract0:		; GCN-IEEE-UNSAFE-LABEL: v_rsq_f32_missing_contract0:
; GCN-IEEE-UNSAFE: ; %bb.0:		; GCN-IEEE-UNSAFE: ; %bb.0:
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]		; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-SAFE-LABEL: v_rsq_f32_missing_contract0:		; SI-IEEE-SAFE-LABEL: v_rsq_f32_missing_contract0:
; GCN-IEEE-SAFE: ; %bb.0:		; SI-IEEE-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; SI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0		; SI-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0
; GCN-IEEE-SAFE-NEXT: v_div_scale_f32 v1, s[4:5], v0, v0, 1.0		; SI-IEEE-SAFE-NEXT: s_mov_b32 s4, 0x7f800000
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v2, v1		; SI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e32 v1, v0
; GCN-IEEE-SAFE-NEXT: v_div_scale_f32 v3, vcc, 1.0, v0, 1.0		; SI-IEEE-SAFE-NEXT: v_cmp_lt_f32_e64 vcc, \|v0\|, s4
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v4, -v1, v2, 1.0		; SI-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v1, v0, v1, vcc
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v2, v4, v2, v2		; SI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v1, v1
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v4, v3, v2		; SI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v5, -v1, v4, v3		; SI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v4, v5, v2, v4		; SI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v1, v0
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v1, -v1, v4, v3		; SI-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
; GCN-IEEE-SAFE-NEXT: v_div_fmas_f32 v1, v1, v2, v4		;
; GCN-IEEE-SAFE-NEXT: v_div_fixup_f32 v0, v1, v0, 1.0		; CI-IEEE-SAFE-LABEL: v_rsq_f32_missing_contract0:
; GCN-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]		; CI-IEEE-SAFE: ; %bb.0:
		; CI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
		; CI-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0
		; CI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e32 v1, v0
		; CI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v1, v1
		; CI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; CI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; CI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v1, v0
		; CI-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
%sqrt = call float @llvm.sqrt.f32(float %val), !fpmath !1		%sqrt = call float @llvm.sqrt.f32(float %val), !fpmath !1
%div = fdiv contract float 1.0, %sqrt, !fpmath !1		%div = fdiv contract float 1.0, %sqrt, !fpmath !1
ret float %div		ret float %div
}		}

define float @v_rsq_f32_missing_contract1(float %val) {		define float @v_rsq_f32_missing_contract1(float %val) {
; GCN-DAZ-LABEL: v_rsq_f32_missing_contract1:		; GCN-DAZ-LABEL: v_rsq_f32_missing_contract1:
; GCN-DAZ: ; %bb.0:		; GCN-DAZ: ; %bb.0:
; GCN-DAZ-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-DAZ-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-DAZ-NEXT: v_rsq_f32_e32 v0, v0		; GCN-DAZ-NEXT: v_rsq_f32_e32 v0, v0
; GCN-DAZ-NEXT: s_setpc_b64 s[30:31]		; GCN-DAZ-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-UNSAFE-LABEL: v_rsq_f32_missing_contract1:		; GCN-IEEE-UNSAFE-LABEL: v_rsq_f32_missing_contract1:
; GCN-IEEE-UNSAFE: ; %bb.0:		; GCN-IEEE-UNSAFE: ; %bb.0:
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]		; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-SAFE-LABEL: v_rsq_f32_missing_contract1:		; SI-IEEE-SAFE-LABEL: v_rsq_f32_missing_contract1:
; GCN-IEEE-SAFE: ; %bb.0:		; SI-IEEE-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; SI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0		; SI-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0
; GCN-IEEE-SAFE-NEXT: v_div_scale_f32 v1, s[4:5], v0, v0, 1.0		; SI-IEEE-SAFE-NEXT: s_mov_b32 s4, 0x7f800000
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v2, v1		; SI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e32 v1, v0
; GCN-IEEE-SAFE-NEXT: v_div_scale_f32 v3, vcc, 1.0, v0, 1.0		; SI-IEEE-SAFE-NEXT: v_cmp_lt_f32_e64 vcc, \|v0\|, s4
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v4, -v1, v2, 1.0		; SI-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v1, v0, v1, vcc
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v2, v4, v2, v2		; SI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v1, v1
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v4, v3, v2		; SI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v5, -v1, v4, v3		; SI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v4, v5, v2, v4		; SI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v1, v0
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v1, -v1, v4, v3		; SI-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
; GCN-IEEE-SAFE-NEXT: v_div_fmas_f32 v1, v1, v2, v4		;
; GCN-IEEE-SAFE-NEXT: v_div_fixup_f32 v0, v1, v0, 1.0		; CI-IEEE-SAFE-LABEL: v_rsq_f32_missing_contract1:
; GCN-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]		; CI-IEEE-SAFE: ; %bb.0:
		; CI-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
		; CI-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0
		; CI-IEEE-SAFE-NEXT: v_frexp_mant_f32_e32 v1, v0
		; CI-IEEE-SAFE-NEXT: v_rcp_f32_e32 v1, v1
		; CI-IEEE-SAFE-NEXT: v_frexp_exp_i32_f32_e32 v0, v0
		; CI-IEEE-SAFE-NEXT: v_sub_i32_e32 v0, vcc, 0, v0
		; CI-IEEE-SAFE-NEXT: v_ldexp_f32_e32 v0, v1, v0
		; CI-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
%sqrt = call contract float @llvm.sqrt.f32(float %val), !fpmath !1		%sqrt = call contract float @llvm.sqrt.f32(float %val), !fpmath !1
%div = fdiv float 1.0, %sqrt, !fpmath !1		%div = fdiv float 1.0, %sqrt, !fpmath !1
ret float %div		ret float %div
}		}

; Test that we contract into FMA for an fadd user after introducing		; Test that we contract into FMA for an fadd user after introducing
; the fmul.		; the fmul.
define float @v_rsq_f32_contractable_user(float %val0, float %val1) {		define float @v_rsq_f32_contractable_user(float %val0, float %val1) {
Show All 9 Lines
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-IEEE-UNSAFE-NEXT: v_add_f32_e32 v0, v0, v1		; GCN-IEEE-UNSAFE-NEXT: v_add_f32_e32 v0, v0, v1
; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]		; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-SAFE-LABEL: v_rsq_f32_contractable_user:		; GCN-IEEE-SAFE-LABEL: v_rsq_f32_contractable_user:
; GCN-IEEE-SAFE: ; %bb.0:		; GCN-IEEE-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0		; GCN-IEEE-SAFE-NEXT: s_mov_b32 s4, 0x800000
; GCN-IEEE-SAFE-NEXT: v_div_scale_f32 v2, s[4:5], v0, v0, 1.0		; GCN-IEEE-SAFE-NEXT: v_mov_b32_e32 v2, 0x4b800000
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v3, v2		; GCN-IEEE-SAFE-NEXT: v_cmp_gt_f32_e32 vcc, s4, v0
; GCN-IEEE-SAFE-NEXT: v_div_scale_f32 v4, vcc, 1.0, v0, 1.0		; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v2, 1.0, v2, vcc
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v5, -v2, v3, 1.0		; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v0, v2
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v3, v5, v3, v3		; GCN-IEEE-SAFE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v5, v4, v3		; GCN-IEEE-SAFE-NEXT: v_mov_b32_e32 v2, 0x45800000
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v6, -v2, v5, v4		; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v2, 1.0, v2, vcc
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v5, v6, v3, v5		; GCN-IEEE-SAFE-NEXT: v_fma_f32 v0, v0, v2, v1
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v2, -v2, v5, v4
; GCN-IEEE-SAFE-NEXT: v_div_fmas_f32 v2, v2, v3, v5
; GCN-IEEE-SAFE-NEXT: v_div_fixup_f32 v0, v2, v0, 1.0
; GCN-IEEE-SAFE-NEXT: v_add_f32_e32 v0, v0, v1
; GCN-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]		; GCN-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
%sqrt = call contract float @llvm.sqrt.f32(float %val0), !fpmath !1		%sqrt = call contract float @llvm.sqrt.f32(float %val0), !fpmath !1
%div = fdiv contract float 1.0, %sqrt, !fpmath !1		%div = fdiv contract float 1.0, %sqrt, !fpmath !1
%add = fadd contract float %div, %val1		%add = fadd contract float %div, %val1
ret float %add		ret float %add
}		}

; Missing contract on the fdiv		; Missing contract on the fdiv
Show All 10 Lines
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-IEEE-UNSAFE-NEXT: v_add_f32_e32 v0, v0, v1		; GCN-IEEE-UNSAFE-NEXT: v_add_f32_e32 v0, v0, v1
; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]		; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-SAFE-LABEL: v_rsq_f32_contractable_user_missing_contract0:		; GCN-IEEE-SAFE-LABEL: v_rsq_f32_contractable_user_missing_contract0:
; GCN-IEEE-SAFE: ; %bb.0:		; GCN-IEEE-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0		; GCN-IEEE-SAFE-NEXT: s_mov_b32 s4, 0x800000
; GCN-IEEE-SAFE-NEXT: v_div_scale_f32 v2, s[4:5], v0, v0, 1.0		; GCN-IEEE-SAFE-NEXT: v_mov_b32_e32 v2, 0x4b800000
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v3, v2		; GCN-IEEE-SAFE-NEXT: v_cmp_gt_f32_e32 vcc, s4, v0
; GCN-IEEE-SAFE-NEXT: v_div_scale_f32 v4, vcc, 1.0, v0, 1.0		; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v2, 1.0, v2, vcc
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v5, -v2, v3, 1.0		; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v0, v2
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v3, v5, v3, v3		; GCN-IEEE-SAFE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v5, v4, v3		; GCN-IEEE-SAFE-NEXT: v_mov_b32_e32 v2, 0x45800000
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v6, -v2, v5, v4		; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v2, 1.0, v2, vcc
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v5, v6, v3, v5		; GCN-IEEE-SAFE-NEXT: v_fma_f32 v0, v0, v2, v1
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v2, -v2, v5, v4
; GCN-IEEE-SAFE-NEXT: v_div_fmas_f32 v2, v2, v3, v5
; GCN-IEEE-SAFE-NEXT: v_div_fixup_f32 v0, v2, v0, 1.0
; GCN-IEEE-SAFE-NEXT: v_add_f32_e32 v0, v0, v1
; GCN-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]		; GCN-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
%sqrt = call contract float @llvm.sqrt.f32(float %val0), !fpmath !1		%sqrt = call contract float @llvm.sqrt.f32(float %val0), !fpmath !1
%div = fdiv contract float 1.0, %sqrt, !fpmath !1		%div = fdiv contract float 1.0, %sqrt, !fpmath !1
%add = fadd contract float %div, %val1		%add = fadd contract float %div, %val1
ret float %add		ret float %add
}		}

; Missing contract on the fadd		; Missing contract on the fadd
Show All 10 Lines
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-IEEE-UNSAFE-NEXT: v_add_f32_e32 v0, v0, v1		; GCN-IEEE-UNSAFE-NEXT: v_add_f32_e32 v0, v0, v1
; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]		; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-SAFE-LABEL: v_rsq_f32_contractable_user_missing_contract1:		; GCN-IEEE-SAFE-LABEL: v_rsq_f32_contractable_user_missing_contract1:
; GCN-IEEE-SAFE: ; %bb.0:		; GCN-IEEE-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0		; GCN-IEEE-SAFE-NEXT: s_mov_b32 s4, 0x800000
; GCN-IEEE-SAFE-NEXT: v_div_scale_f32 v2, s[4:5], v0, v0, 1.0		; GCN-IEEE-SAFE-NEXT: v_mov_b32_e32 v2, 0x4b800000
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v3, v2		; GCN-IEEE-SAFE-NEXT: v_cmp_gt_f32_e32 vcc, s4, v0
; GCN-IEEE-SAFE-NEXT: v_div_scale_f32 v4, vcc, 1.0, v0, 1.0		; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v2, 1.0, v2, vcc
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v5, -v2, v3, 1.0		; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v0, v2
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v3, v5, v3, v3		; GCN-IEEE-SAFE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v5, v4, v3		; GCN-IEEE-SAFE-NEXT: v_mov_b32_e32 v2, 0x45800000
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v6, -v2, v5, v4		; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v2, 1.0, v2, vcc
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v5, v6, v3, v5		; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v0, v2
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v2, -v2, v5, v4
; GCN-IEEE-SAFE-NEXT: v_div_fmas_f32 v2, v2, v3, v5
; GCN-IEEE-SAFE-NEXT: v_div_fixup_f32 v0, v2, v0, 1.0
; GCN-IEEE-SAFE-NEXT: v_add_f32_e32 v0, v0, v1		; GCN-IEEE-SAFE-NEXT: v_add_f32_e32 v0, v0, v1
; GCN-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]		; GCN-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
%sqrt = call contract float @llvm.sqrt.f32(float %val0), !fpmath !1		%sqrt = call contract float @llvm.sqrt.f32(float %val0), !fpmath !1
%div = fdiv contract float 1.0, %sqrt, !fpmath !1		%div = fdiv contract float 1.0, %sqrt, !fpmath !1
%add = fadd float %div, %val1		%add = fadd float %div, %val1
ret float %add		ret float %add
}		}

define float @v_rsq_f32_known_never_denormal(float nofpclass(sub) %val) {		define float @v_rsq_f32_known_never_denormal(float nofpclass(sub) %val) {
; GCN-DAZ-LABEL: v_rsq_f32_known_never_denormal:		; GCN-DAZ-LABEL: v_rsq_f32_known_never_denormal:
; GCN-DAZ: ; %bb.0:		; GCN-DAZ: ; %bb.0:
; GCN-DAZ-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-DAZ-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-DAZ-NEXT: v_rsq_f32_e32 v0, v0		; GCN-DAZ-NEXT: v_rsq_f32_e32 v0, v0
; GCN-DAZ-NEXT: s_setpc_b64 s[30:31]		; GCN-DAZ-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-UNSAFE-LABEL: v_rsq_f32_known_never_denormal:		; GCN-IEEE-LABEL: v_rsq_f32_known_never_denormal:
; GCN-IEEE-UNSAFE: ; %bb.0:		; GCN-IEEE: ; %bb.0:
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-IEEE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0		; GCN-IEEE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]		; GCN-IEEE-NEXT: s_setpc_b64 s[30:31]
;
; GCN-IEEE-SAFE-LABEL: v_rsq_f32_known_never_denormal:
; GCN-IEEE-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0
; GCN-IEEE-SAFE-NEXT: v_div_scale_f32 v1, s[4:5], v0, v0, 1.0
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v2, v1
; GCN-IEEE-SAFE-NEXT: v_div_scale_f32 v3, vcc, 1.0, v0, 1.0
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v4, -v1, v2, 1.0
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v2, v4, v2, v2
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v4, v3, v2
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v5, -v1, v4, v3
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v4, v5, v2, v4
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v1, -v1, v4, v3
; GCN-IEEE-SAFE-NEXT: v_div_fmas_f32 v1, v1, v2, v4
; GCN-IEEE-SAFE-NEXT: v_div_fixup_f32 v0, v1, v0, 1.0
; GCN-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
%sqrt = call contract float @llvm.sqrt.f32(float %val), !fpmath !1		%sqrt = call contract float @llvm.sqrt.f32(float %val), !fpmath !1
%div = fdiv contract float 1.0, %sqrt, !fpmath !1		%div = fdiv contract float 1.0, %sqrt, !fpmath !1
ret float %div		ret float %div
}		}

define float @v_rsq_f32_known_never_posdenormal(float nofpclass(psub) %val) {		define float @v_rsq_f32_known_never_posdenormal(float nofpclass(psub) %val) {
; GCN-DAZ-LABEL: v_rsq_f32_known_never_posdenormal:		; GCN-DAZ-LABEL: v_rsq_f32_known_never_posdenormal:
; GCN-DAZ: ; %bb.0:		; GCN-DAZ: ; %bb.0:
; GCN-DAZ-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-DAZ-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-DAZ-NEXT: v_rsq_f32_e32 v0, v0		; GCN-DAZ-NEXT: v_rsq_f32_e32 v0, v0
; GCN-DAZ-NEXT: s_setpc_b64 s[30:31]		; GCN-DAZ-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-UNSAFE-LABEL: v_rsq_f32_known_never_posdenormal:		; GCN-IEEE-UNSAFE-LABEL: v_rsq_f32_known_never_posdenormal:
; GCN-IEEE-UNSAFE: ; %bb.0:		; GCN-IEEE-UNSAFE: ; %bb.0:
; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-IEEE-UNSAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0		; GCN-IEEE-UNSAFE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]		; GCN-IEEE-UNSAFE-NEXT: s_setpc_b64 s[30:31]
;		;
; GCN-IEEE-SAFE-LABEL: v_rsq_f32_known_never_posdenormal:		; GCN-IEEE-SAFE-LABEL: v_rsq_f32_known_never_posdenormal:
; GCN-IEEE-SAFE: ; %bb.0:		; GCN-IEEE-SAFE: ; %bb.0:
; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)		; GCN-IEEE-SAFE-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
; GCN-IEEE-SAFE-NEXT: v_sqrt_f32_e32 v0, v0		; GCN-IEEE-SAFE-NEXT: s_mov_b32 s4, 0x800000
; GCN-IEEE-SAFE-NEXT: v_div_scale_f32 v1, s[4:5], v0, v0, 1.0		; GCN-IEEE-SAFE-NEXT: v_mov_b32_e32 v1, 0x4b800000
; GCN-IEEE-SAFE-NEXT: v_rcp_f32_e32 v2, v1		; GCN-IEEE-SAFE-NEXT: v_cmp_gt_f32_e32 vcc, s4, v0
; GCN-IEEE-SAFE-NEXT: v_div_scale_f32 v3, vcc, 1.0, v0, 1.0		; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v1, 1.0, v1, vcc
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v4, -v1, v2, 1.0		; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v0, v1
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v2, v4, v2, v2		; GCN-IEEE-SAFE-NEXT: v_rsq_f32_e32 v0, v0
; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v4, v3, v2		; GCN-IEEE-SAFE-NEXT: v_mov_b32_e32 v1, 0x45800000
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v5, -v1, v4, v3		; GCN-IEEE-SAFE-NEXT: v_cndmask_b32_e32 v1, 1.0, v1, vcc
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v4, v5, v2, v4		; GCN-IEEE-SAFE-NEXT: v_mul_f32_e32 v0, v0, v1
; GCN-IEEE-SAFE-NEXT: v_fma_f32 v1, -v1, v4, v3
; GCN-IEEE-SAFE-NEXT: v_div_fmas_f32 v1, v1, v2, v4
; GCN-IEEE-SAFE-NEXT: v_div_fixup_f32 v0, v1, v0, 1.0
; GCN-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]		; GCN-IEEE-SAFE-NEXT: s_setpc_b64 s[30:31]
%sqrt = call contract float @llvm.sqrt.f32(float %val), !fpmath !1		%sqrt = call contract float @llvm.sqrt.f32(float %val), !fpmath !1
%div = fdiv contract float 1.0, %sqrt, !fpmath !1		%div = fdiv contract float 1.0, %sqrt, !fpmath !1
ret float %div		ret float %div
}		}

!0 = !{float 2.500000e+00}		!0 = !{float 2.500000e+00}
!1 = !{float 1.000000e+00}		!1 = !{float 1.000000e+00}

attributes #0 = { nounwind "denormal-fp-math-f32"="preserve-sign,preserve-sign" }		attributes #0 = { nounwind "denormal-fp-math-f32"="preserve-sign,preserve-sign" }
;; NOTE: These prefixes are unused and the list is autogenerated. Do not add tests below this line:		;; NOTE: These prefixes are unused and the list is autogenerated. Do not add tests below this line:
; CI-DAZ-SAFE: {{.*}}		; CI-DAZ-SAFE: {{.*}}
; CI-DAZ-UNSAFE: {{.*}}		; CI-DAZ-UNSAFE: {{.*}}
; CI-IEEE-SAFE: {{.*}}
; CI-IEEE-UNSAFE: {{.*}}		; CI-IEEE-UNSAFE: {{.*}}
; GCN-IEEE: {{.*}}
; SI-DAZ-SAFE: {{.*}}		; SI-DAZ-SAFE: {{.*}}
; SI-DAZ-UNSAFE: {{.*}}		; SI-DAZ-UNSAFE: {{.*}}
; SI-IEEE-SAFE: {{.*}}
; SI-IEEE-UNSAFE: {{.*}}		; SI-IEEE-UNSAFE: {{.*}}